1、常規數據倉庫
數據倉庫的重點,是對數據進行整合,同時也是對業務邏輯的壹個梳理。數據倉庫雖然也可以打包成SAAS那種Cube壹類的東西來提升數據的讀取性能,但是數據倉庫的作用,更多的是為了解決公司的業務問題。
2、敏捷型數據集市
數據集市也是常見的壹種方案,底層的數據產品與分析層綁定,使得應用層可以直接對底層數據產品中的數據進行拖拽式分析。數據集市,主要的優勢在於對業務數據進行簡單的、快速的整合,實現敏捷建模,並且大幅提升數據的處理速度。
3、MPP(大規模並行處理)架構
進入大數據時代以來,傳統的主機計算模式已經不能滿足需求了,分布式存儲和分布式計算才是王道。大家所熟悉的Hadoop MapReduce框架以及MPP計算框架,都是基於這壹背景產生。
MPP架構的代表產品,就是Greenplum。Greenplum的數據庫引擎是基於Postgresql的,並且通過Interconnnect神器實現了對同壹個集群中多個Postgresql實例的高效協同和並行計算。
4、Hadoop分布式系統架構
當然,大規模分布式系統架構,Hadoop依然站在不可代替的關鍵位置上。雅虎、Facebook、百度、淘寶等國內外大企,最初都是基於Hadoop來展開的。
Hadoop生態體系龐大,企業基於Hadoop所能實現的需求,也不僅限於數據分析,也包括機器學習、數據挖掘、實時系統等。企業搭建大數據系統平臺,Hadoop的大數據處理能力、高可靠性、高容錯性、開源性以及低成本,都使得它成為首選。
關於數據平臺建設的方案有哪幾種,環球青藤小編就和您分享到這裏了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。