列舉三個常用的大數據定義:
(1)具有較強決策、洞察和流程優化能力的海量、高增長、多樣化的信息資產需要新的處理模式。
——Gartner
(2)海量數據量、快速數據流和動態數據速度、多樣的數據類型和巨大的數據價值。
—— IDC
(3)或者是海量數據、海量數據、大數據,是指所涉及的數據太大,無法在合理的時間內被截取、管理、處理、整理成人類可以解讀的信息。
—— Wiki
大數據的其他定義也差不多,可以用幾個關鍵詞來定義大數據。
首先是“大尺度”,可以從兩個維度來衡量,壹是從時間序列中積累大量數據,二是對數據進行深度提煉。
其次,“多樣化”可以是不同的數據格式,比如文字、圖片、視頻等。,可以是不同的數據類別,如人口數據、經濟數據等。,也可以有不同的數據源,如互聯網和傳感器等。
第三,“動態”。數據是不斷變化的,它可以隨著時間迅速增加大量的數據,也可以是在空間不斷移動變化的數據。
這三個關鍵詞定義了大數據的形象。
但是,需要壹個關鍵能力,就是“處理速度快”。如果有這樣的大規模、多樣化、動態的數據,但是需要很長時間的處理和分析,那就不叫大數據。從另壹個角度來說,要實現這些數據的快速處理,肯定沒有辦法手工實現,所以需要借助機器來實現。