大多數人都理解企業數據破壞造成的負面效果。在解決數據倉庫的安全性方面,有兩個特別重要的問題。第壹是,數據倉庫必須能夠控制數據訪問權限(數據權利)。第二是,提供業務持續性和災難恢復(數據可用性)。
在數據訪問權限方面,系統需要給壹些用戶分配權限,同時拒絕其他用戶訪問。在大型數據倉庫中,有大量的數據需要保護,並且通常還有大量不同的用戶組。系統需要支持端到端作業方式--從分段表到運營數據存儲、分析和報表結構。
此外,敏感數據也存在問題,如個人身份信息(PII)、HR數據和企業敏感信息。相對於其他類型的信息而言,這些數據需要更嚴格的保護和更仔細的審核,並且會混合到數據倉庫的數據結構中。它可能需要進行加密,才能實現足夠的保護要求。
將所有這些重要數據保存在壹個位置是非常危險的,因為攻擊者可以輕松收集到所有數據。然而,安全性是不固定的活動目標。人們可以來,也可以走。他們會改變工作職責。保持安全性壹直是壹個挑戰。要在多個系統上實現安全性難度就更大。
註:如果壹個來源的信息都很難保證安全,那麽想要保證多個來源的信息安全性,難度就更大了。例如,用戶可能能夠查看人力報告系統的信息,但是無法查看HR系統記錄的員工計時工資。盡管如此,這些信息都存儲在數據倉庫中,所以可以對人力成本進行分析。
如果壹個數據倉庫系統能夠管理整個數據鏈,那麽它就能夠提供最容易管理的數據安全性。單個安全系統更容易維護和更新。保存唯壹真實數據的大型數據倉庫可以實現最安全的配置。PII可以進行加密或散列化,從而保護各個信息的保密性。此外,數據也可以進行匯總,使任意個體的信息都保持隱藏,且可以在分析過程中使用。
數據可用性變得越來越重要,因為壹旦數據倉庫成為企業報表數據的主要來源,那麽它就成為企業中不可或缺的組件。這會對幾個方面造成影響。首先,它會影響數據備份和恢復。大型數據倉庫系統在為用戶保證性能時,還必須同時運行備份過程。雖然單個大型系統的備份難度要大於壹組小型系統的備份,但是它在備份操作管理和數據保護方面更簡單壹些。
註:如果可用時間較短,那麽執行大型數據集合的備份和恢復是很困難的。在設計壹個大型數據倉庫系統時,這些操作所需要的時間必須仔細斟酌。
其次是可用性。單獨的內聚系統可能會成為單壹故障點。然而,在大多數情況中,系統可以設計消除這個故障點。這是壹個必須認真考慮的問題。首先,數據倉庫系統本身要具備應付內部故障的能力。其次,如果遠程位置災難恢復機制適合這種數據倉庫,那麽系統必須支持遠程站點操作。遠程站點數據的同步是壹個嚴重的問題,它會隨數據倉庫的數據量增加而加劇。為了支持大型數據倉庫,必須認真對待這些問題。
再次強調,單壹系統的優點在於簡化管理。如果壹個系統設計良好,擁有清晰的可用性維護過程和流程,那麽其24 × 7可用性保持難度會遠遠小於多個系統。從IT角度看,維護壹個系統的難度通常會小於多個小型系統的維護。