CGFT:大數(shù)據(jù)處理框架Hadoop介紹!

CGFT中,大數(shù)據(jù)處理框架Hadoop是重要知識(shí)點(diǎn)。具體什么是Hadoop,下文作詳細(xì)介紹!

Hadoop是Apache軟件基金會(huì)旗下一個(gè)開源分布式計(jì)算平臺(tái),為用戶提供了系統(tǒng)底層細(xì)節(jié)透明的分布式基礎(chǔ)機(jī)構(gòu)。

Hadoop是基于Java語言開發(fā)的,具有很好的跨平臺(tái)特性,并且可以部署在廉價(jià)的計(jì)算機(jī)集群中。Hadoop的核心是分布式文件系統(tǒng)和MapReduce。

特許全球金融科技師CGFT一級(jí)

HAFS是對(duì)谷歌文件系統(tǒng)的開源實(shí)現(xiàn),是面向普通硬件環(huán)境的分布式文件系統(tǒng),具有較高的讀寫速度、很好的容錯(cuò)性和可伸縮性,支持大規(guī)模數(shù)據(jù)的分布式存儲(chǔ),其冗余數(shù)據(jù)存儲(chǔ)的方式很好地保zheng了數(shù)據(jù)的安全性。MapReduce是針對(duì)古河MapReduce來整合分布式文件系統(tǒng)上的數(shù)據(jù),可以保zheng分析和處理數(shù)據(jù)的高效性。

借助于Hadoop,程序員可以輕松地編寫分布式并行程序,將其運(yùn)行于廉價(jià)計(jì)算機(jī)集群上,完成海量數(shù)據(jù)的存儲(chǔ)與計(jì)算。

Hadoop被公認(rèn)為行業(yè)大數(shù)據(jù)標(biāo)準(zhǔn)開源軟件,在分布式環(huán)境下提供了海量數(shù)據(jù)的處理能力。幾乎所有主流廠商圍繞Hadoop提供開發(fā)工具、開源軟件、商業(yè)化工具和技術(shù)服務(wù),如谷歌、雅虎、微軟、思科、淘寶等,都支持Hadoop。