2014年7月
采用
我们强烈认为,行业应该采用这些项目。我们在项目中适当的时候使用它们。
Hadoop的初始架构是基于水平扩展数据和垂直扩展元数据的范例。当数据存储和处理被从节点处理的相当好,管理元数据的主节点是一个单点故障和限制网络规模的使用。Hadoop 2.0已经对HDFS和Map Reduce框架进行了重大的重新架构,以解决这些问题。现在可以使用同一个集群上的多个名称节点联合HDFS命名空间,并以HA模式部署。MapReduce已经被YARN所取代,YARN将集群资源管理从作业状态管理中分离出来,并且消除了JobTracker的规模/性能问题。最重要的是,这种变化鼓励在Hadoop集群上除了MapReduce外,还部署新的分布式编程范例。