數據倉庫體系結構是一種封裝企業環境中數據倉庫所有方面的設計。數據倉庫是創建一個中心域,將復雜的、分散的企業數據存儲在一個邏輯單元中,從而實現數據挖掘、商業智能、,以及對組織內所有相關數據的全面訪問。數據倉庫...
數據倉庫體系結構是一種封裝企業環境中數據倉庫所有方面的設計。數據倉庫是創建一個中心域,將復雜的、分散的企業數據存儲在一個邏輯單元中,從而實現數據挖掘、商業智能、,以及對組織內所有相關數據的全面訪問。數據倉庫體系結構包括所有報告要求、數據管理、安全要求、帶寬要求,以及存儲要求。

結構良好的數據倉庫可以是';挖掘和#039;
在創建數據倉庫體系結構時,重要的是將體系結構分解為特定的域,這些域被連接到一個整體的最終設計中。該設計應被視為企業數據體系結構的藍圖。尤其是,幾個主要領域應在考慮數據倉庫體系結構時開發。這些領域包括源系統訪問、暫存區過程、數據充實過程、數據體系結構、商業智能過程,以及存儲需求。

數據倉庫是創建一個中心域,在邏輯單元中存儲復雜的、分散的企業數據,從而實現數據挖掘、商業智能和整體對組織內所有相關數據的訪問。
數據倉庫要求將源數據從事務或記錄數據庫傳輸到數據倉庫中。此過程被簡化為術語提取、轉換和加載(ETL),它基本上封裝了源系統訪問的區域,數據充實和數據體系結構為了清晰起見,最好詳細設計這些體系結構區域,其中概述了如何實現ETL過程。雖然需要從源系統獲取一些數據,但并非所有數據都是理想的,因為這會使企業倉庫負擔過重。在處理源系統層時,主要關注的是數據訪問方法、源系統所需的數據以及刷新要求。
要考慮的下一個數據倉庫體系結構層是暫存區過程。由于源系統的大多數數據都需要驗證和數據清理,在加載到數據倉庫的業務規則層之前,必須為源數據創建一個駐留區域。臨時區域維護來自源系統的原始數據饋送,這些原始數據源通常帶有時間戳,以確保數據的最新性。
數據充實或業務規則過程是將數據清理到滿足數據倉庫的預期結果。這種清理方法的一個很好的例子是使用地址清理工具;如果源系統有不正確的數據,數據擴充過程將從原始數據集中運行地址到業務規則系統中,該系統將更正無效地址。這也是刪除或修改不準確數據以確保數據倉庫內完整性的時間。
要考慮的下一層是數據體系結構層。此區域是企業數據倉庫的真正設計或架構已經完成。數據倉庫不是企業內所有數據集的組合,相反,它是一個新定義的數據庫,用于對企業內所有業務實體進行概述。
這需要數據體系結構來回答企業在商業智能和數據挖掘領域提出的問題通過以這種方式創建數據架構,原始數據集將被轉換為事實表,允許用戶對整個企業視圖執行即席報告,而不是對特定數據庫執行報告。這也是維護原始系統數據元數據的區域,它可能包括源系統名稱或主鍵。
下一個要考慮的區域是商業智能和報告要求。這一層可以被認為是面向用戶的數據倉庫需求。通常,該區域包含固定報告、特殊報告功能,業務智能層通常是最需要考慮的,因為它是數據倉庫中唯一面向外部的組件。
最后一層需要考慮的是總體數據存儲需求和維護。隨著數據倉庫的不斷增長和擴展,基于用戶的數據存儲必須嚴格管理和維護。此外,在創建數據倉庫架構時,設計應該對數據存儲容量以及具有數據訪問能力的頻帶所需的內容做出現實的估計。隨著數據倉庫在整個企業中的廣泛應用,這些要求將是至關重要的。