只适合离线计算任务
一、框架
- 高性能并行计算平台(Cluster Infrastructure)
- 并行程序开发与运行框架(Software Framework)
- 并行程序射设计模型与方法(Pragramming Model & Methodology)
二、Hadoop1.0集群架构
2.1 Hadoop1.0
- NameNode
- DataNode
- Secondary NameNode
- Job Tracker
- Task Tracker
2.2 Hadoop2.0 YARN
- RM:Resource Manager
- AM: Application Master
- NM:Node Manager
三、Hadoop版本框架
四、大数据任务划分和并行计算模型
五、基于Map和Reduce的并行计算模型
- 进行Reduce之前,map必须做完。