CGFT考試科技模塊中是要考《大數(shù)據(jù)技術原理及應用》和《Python語言基礎》,今天我們說說《大數(shù)據(jù)技術原理及應用》。
大數(shù)據(jù)是金融科技之源與基介紹數(shù)據(jù)庫和Hadoop大數(shù)據(jù)生態(tài)基本理論,包括設計、存儲、查詢、管理、挖掘、應用等,初步介紹知識圖譜基本概念和應用,掌握SQL語言和正則表達式技能,熟悉常用金融數(shù)據(jù)庫,熟悉金融大數(shù)據(jù)場景應用。
主服務器Master主要負責表和Region的管理工作。
·管理用戶對表的增加、刪除、修改、查詢等操作。
·實現(xiàn)不同Region服務器之間的負載均衡。
·在Region分裂或合并后,負責重新調(diào)整Region的分布。
對發(fā)生故障失效的Region服務器上的Region進行遷移。
客戶端訪問HBase上數(shù)據(jù)的過程并不需要Master的參與,客戶端可以訪問Zookeeper獲取
-ROOT-表的地址,并*終到達相應的Region服務器進行數(shù)據(jù)讀寫,Master僅僅維護著表和Region的元數(shù)據(jù)信息,因此,負載很低
任何時刻,一個Region只能分配給一個Region服務器。Master維護了當前可用的Region服務器列表,以及當前哪些Region分配給了哪些Region服務器,哪些Region還未被分配。當存在未被分配的Region,并且有一個Region服務器上有可用空間時,Master就給這個Region服務器發(fā)送一個請求,把該Region分配給它。Region服務器接受請求并完成數(shù)據(jù)加載后,就開始負責管理該Region對象,并對外提供服務。