古詩詞大全網 - 四字成語 - 什麽是數據挖掘

什麽是數據挖掘

1、什麽是數據挖掘?

數據挖掘(Data Mining)是采用數學的、統計的、人工智能和神經網絡等領域的科學方法,如記憶推理、聚類分析、關聯分析、決策樹、神經網絡、基因算法等技術,從大量數據中挖掘出隱含的、先前未知的、對決策有潛在價值的關系、模式和趨勢,並用這些知識和規則建立用於決策支持的模型,提供預測性決策支持的方法、工具和過程。

數據挖掘綜合了各個學科技術,有很多的功能,當前的主要功能如下:

(1)、分類:按照分析對象的屬性、特征,建立不同的組類來描述事物。例如:銀行部門根據以前的數據將客戶分成了不同的類別,現在就可以根據這些來區分新申請貸款的客戶,以采取相應的貸款方案。

(2)、聚類:識別出分析對內在的規則,按照這些規則把對象分成若幹類。例如:將申請人分為高度風險申請者,中度風險申請者,低度風險申請者。

(3)、關聯規則:關聯是某種事物發生時其他事物會發生的這樣壹種聯系。例如:每天購買啤酒的人也有可能購買香煙,比重有多大,可以通過關聯的支持度和可信度來描述。

(4)、預測:把握分析對象發展的規律,對未來的趨勢做出預見。例如:對未來經濟發展的判斷。

(5)、偏差的檢測:對分析對象的少數的、極端的特例的描述,揭示內在的原因。例如:在銀行的100萬筆交易中有500例的欺詐行為,銀行為了穩健經營,就要發現這500例的內在因素,減小以後經營的風險。

當然除了以上所列出的還有時間序列分析等壹些其他的功能,需要註意的是:數據挖掘的各項功能不是獨立存在的,在數據挖掘中互相聯系,發揮作用。