在CGFT特許全球金融科技師科目中,《大數(shù)據(jù)原理及應用》作為基礎學科中的一門關鍵學科,學員們要充分理解其中的內容,這樣才能夠更深刻的進行學習。那么,大數(shù)據(jù)處理架構Hadoop是什么?

Hadoop是什么?

Hadoop是Apache軟件基金會旗下的一個開源分布式計算平臺,為用戶提供了系統(tǒng)底層細節(jié)透明的分布式基礎架構。Hadoop是基于Java語言開發(fā)的,具有很好的跨平臺特性,并可以部署在廉價的計算機集群中。Hadoop的核心是分布式文件系統(tǒng)和MapRaduce。

CGFT

Hadoop的特點有哪些?

Hadoop是一個能夠對大量數(shù)據(jù)進行分布式處理的軟件框架,并且是以一種可靠、高效、可伸縮的方式進行處理的,具有高可靠性、高效性、高擴展性、高容錯性、成本低、運行在Linux平臺上,同時具有支持多種編程語言的特點。

Hadoop的項目結構是怎樣的?

Hadoop 的項目結構經(jīng)過多年的發(fā)展,Hadoop項目不斷完善和成熟,目前已經(jīng)包含多個子項目。除核心的HDFS和MapReduce以外,Hadoop項目還包括Common、Avro、Zookeeper,HBase、E Chukwa、Pig等子項目,它們提供了互補性服務或在核心層上提供了更高層的服務。