皆非的万事屋

【大数据】Hadoop学习总结

本博客将总结记录博主学习大数据的相关知识

Hadoop框架是用来解决数据离线批处理问题的框架,其中最核心的是HDFSMapReduce,HDFS是架构在Hadoop之上的分布式文件系统,MapReduce是架构在Hadoop之上用来做计算的框架。

hadoop两个核心:HDFS和MapReduce

用途:解决分布式存储分布式计算

特点:高可靠性、高效性、可扩展性、成本低(普通PC机都能构建集群)

应用:Google、Facebook等,用于日志处理、批处理、离线处理

HDFS架构

架构说明

[scode type="share"]热备份:b是a的热备份,如果a坏掉。那么b马上运行代替a的工作。
冷备份:b是a的冷备份,如果a坏掉。那么b不能马上代替a工作。但是b上存储a的一些信息,减少a坏掉之后的损失。[/scode]

架构原则

当前页面是本站的「Google AMP」版。查看和发表评论请点击:完整版 »