數(shù)據(jù)挖掘是什么?在CMA考試中需要考生掌握的知識有哪些呢?同時在學(xué)習(xí)中數(shù)據(jù)挖掘只有簡簡單單的定義嗎?其實不是的,需要考生掌握的知識挺多的。小編給你講一下!
(一)數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘包括對大型數(shù)據(jù)集使用分析工具。從本質(zhì)上講,數(shù)據(jù)挖掘涉及大量數(shù)據(jù)的查詢。其思 想是在組織常規(guī)收集,但在大多數(shù)操作設(shè)置中不使用的數(shù)據(jù)中查找模式、關(guān)系和見解。
(二)數(shù)據(jù)挖掘的挑戰(zhàn)
數(shù)據(jù)挖掘通常使用來自組織外部的數(shù)據(jù)。公司尋找有用的信息,并確定能夠提高銷售、降低成 本和更有效的客戶服務(wù)的趨勢。
(三)數(shù)據(jù)挖掘可以分為五個步驟:
第1步是發(fā)現(xiàn)異常
第2步是找到變量之間的關(guān)系,然后以某種方式將這些關(guān)系聚類(分組)。
第3步,一旦數(shù)據(jù)被聚類,下一步就是概括這些關(guān)系,以使所展示的結(jié)構(gòu)適用于新數(shù)據(jù)以及原始數(shù)據(jù)庫。
第4步,回歸分析(包括線性回歸和多元回歸)試圖找到量化函數(shù)或方程,以*小的誤差對 數(shù)據(jù)進(jìn)行建模,即估計數(shù)據(jù)或數(shù)據(jù)集之間的關(guān)系。
第5步,數(shù)據(jù)挖掘的zui后一步提供了數(shù)據(jù)集的表示形式,包括可視化和報告。
(四)使用查詢工具來檢索信息
結(jié)構(gòu)化查詢語言( SQL)是一種用于挖掘大型數(shù)據(jù)集的成熟工具,是用于在關(guān)系數(shù)據(jù)庫管理系統(tǒng) ( RDBMSs)中訪問和操縱數(shù)據(jù)的語言,通過使用一組用于創(chuàng)建、更新和檢索信息的命令來構(gòu)造和執(zhí) 行查詢。SQL支持包含結(jié)構(gòu)化數(shù)據(jù)的大數(shù)據(jù)。
好了,考生需要掌握的數(shù)據(jù)挖掘就是這么多,小編給你準(zhǔn)備了一些資料,有需要可點(diǎn)擊下方鏈接獲取!
找組織
-
微信掃碼關(guān)注公眾號
CMA學(xué)習(xí)交流群