2013年5月
试验
值得追求的。了解如何建立这种能力是很重要的。企业应该在能够处理风险的项目上尝试这种技术。
Hadoop仍然是开发分布式数据处理应用程序最流行的框架。虽然用Java编程Hadoop应用程序不是特别困难,但设计高效的MapReduce管道确实需要大量的经验。Apache Pig通过提供一种叫做Pig Latin的高级语言和一个执行运行时简化了Hadoop开发。Pig Latin是程序化的,提供了一个类似sql的接口来处理大型数据集。执行基础架构将Pig Latin编译成在集群上运行的优化的MapReduce程序序列。Pig Latin可通过不同语言(如Ruby、JavaScript、Python和Java)的用户定义函数进行扩展。