2014年7月
采用
我们强烈认为业界应该采纳这些条款。我们在项目中适当使用它们。
Hadoop最初的架构是基于水平扩展数据和垂直扩展元数据的范例。虽然数据存储和处理由从属节点处理得相当好,但管理元数据的主节点是一个单点故障,限制了web规模的使用。Hadoop 2.0为了解决这些问题,我们对HDFS和Map Reduce框架进行了重大的重新架构。HDFS的命名空间现在可以使用同一个集群上的多个名称节点进行联合,并以HA模式部署。YARN取代了MapReduce,它将集群资源管理与作业状态管理解耦,并消除了JobTracker的规模/性能问题。最重要的是,除了在Hadoop集群上部署MapReduce之外,这种变化鼓励部署新的分布式编程范式。