快捷搜索:  汽车  科技

hadoop简单入门(Hadoop学习笔记之Hadoop入门)

hadoop简单入门(Hadoop学习笔记之Hadoop入门)主要有HDFS、ETL、kafka、hive、redis、impala、hbase、zookeeper、sqoop、pig、mahout、flume、spark等等等等,这些组件,在未来的学习中我们会一一进行学习!Hadoop是项目的总称。主要是由HDFS和MapReduce组成。HDFS是Google File System(GFS)的开源实现。MapReduce是Google MapReduce的开源实现。

从今天开始,笔者和大家一起学习、分享、交流hadoop的相关知识,形成一个系列,大家一起学习,一起进步!我们在学习一个系统之前,一定要先了解这个系统的背景、架构、原理及历史版本等相关知识,循序渐进才能吃透并掌握一个系统。

hadoop简单入门(Hadoop学习笔记之Hadoop入门)(1)

一、什么是Hadoop?

Hadoop是2002年由Apache基金会所开发的分布式系统基础架构,是一套行业大数据标准开源软件,可以说,Hadoop的诞生,主要是为了解决日益增加的海量数据处理的需求,可以说,Hadoop已经成了主流架构,几乎主流厂商都在围绕Hadoop开发工具、开源软件、商业化工具和技术服务。

二、Hadoop有什么功能?

zookeeper设计初衷,就是为了高效的、快速的处理海量数据中,并可以在这些数据中快速查询想要的结果。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。

Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算。

Hadoop是项目的总称。主要是由HDFS和MapReduce组成。

HDFS是Google File System(GFS)的开源实现。

MapReduce是Google MapReduce的开源实现。

三、Hadoop系统有哪些组件?

主要有HDFS、ETL、kafka、hive、redis、impala、hbase、zookeeper、sqoop、pig、mahout、flume、spark等等等等,这些组件,在未来的学习中我们会一一进行学习!

hadoop简单入门(Hadoop学习笔记之Hadoop入门)(2)

猜您喜欢: