学习一门新知识的时候,首先我们要了解他的全貌,接下来和我一起了解:
Hadoop是什么?它是由Apache软件基金会下的顶级开源项目所支持的分布式软件框架,旨在提供一体的整体解决方案。可部署在1台乃至成千上万台服务器节点上协同工作,个人或企业可以借助Hadoop构建大规模服务器集群,完成海量数据的存储和计算。
为什么学习Hadoop?近10年来,大数据技术体系和Hadoop始终划上等号,随着新框架的出现,大数据技术生态变得丰富,但Hadoop依然重要。学习Hadoop不仅适合入门,还能为大数据学习打下坚实基础。
Hadoop的功能包括存储、计算与资源调度,是一个集成了大数据分布式框架的集合体。
Hadoop的发展始于Doug Cutting的Nutch项目,该设计目标是为了构建一个大型的全网搜索引擎,但面临数十亿网页的存储和索引问题。为解决此问题,谷歌提出并发表了《The Google file system》、《MapReduce: Simplified Data Processing on Large Clusters》与《Bigtable: A Distributed Storage System for Structured Data》三篇论文。Hadoop的发行版本包括开源社区版与商业发行版,如Apache开源社区版本(hadoop.apache.org/)、CDH(Cloudera's Distribution, including Apache Hadoop)、HDP(Hortonworks Data Platform)以及国产商业版星环。
本文如未解决您的问题请添加抖音号:51dongshi(抖音搜索懂视),直接咨询即可。