大數據(bigdata)是描述大量數據(包括結構化數據和非結構化數據)的術語,它們每天都會覆蓋大量業務。但重要的不是數據量。這是組織對重要數據的處理方式。可以分析大數據的洞察力,從而獲得更好的決策和戰略性業務變動。
雖然術語“大數據”相對較新,但收集和存儲大量信息以進行最終分析的行為已經很久了。這個概念在21世紀初獲得了動力,當時行業分析師DougLaney將現在主流的大數據定義表達為三個V:
1.卷,組織從各種來源收集數據,包括業務交易,社交媒體和來自傳感器或機器到機器數據的信息。在過去,存儲它將是壹個問題_但新技術(如Hadoop)減輕了負擔。
2.速度,數據以前所未有的速度流入,必須及時處理。RFID標簽,傳感器和智能電表正在推動近乎實時處理數據的需求。
3.品種,數據有各種格式_從傳統數據庫中的結構化數字數據到非結構化文本文檔,電子郵件,視頻,音頻,股票報價數據和金融交易。