數據倉庫存儲了大量的數據,供不同領域使用。數據倉庫的設計主要有兩種:自頂向下和自下而上。這兩種設計各有優缺點。自下而上實現起來更容易,成本更低,但不太完整,在自上而下的設計中,數據之間的連接是顯而易見的,而且已經很...
數據倉庫存儲了大量的數據,供不同領域使用。數據倉庫的設計主要有兩種:自頂向下和自下而上。這兩種設計各有優缺點。自下而上實現起來更容易,成本更低,但不太完整,在自上而下的設計中,數據之間的連接是顯而易見的,而且已經很好地建立起來了,但是數據可能已經過時,系統的實現成本很高。

結構良好的數據倉庫可以在以后挖掘并獲得有價值的見解。數據集市是數據倉庫設計的中心人物。數據集市是基于單個概念的數據集合。每個數據集市都是一個獨特且完整的數據集市數據子集。這些集合中的每一個都在內部完全相關,通常與外部數據集市有連接。

數據倉庫設計有兩種主要類型:自頂向下和自下而上。數據集市的處理方式是這兩種數據倉庫設計風格的主要區別,數據集市是在數據被放入系統時自然產生的。在自下而上的設計中,數據集市是直接建立并連接在一起形成倉庫的。雖然這看起來是一個微小的區別,但卻有著截然不同的設計自頂向下的方法是原始的數據倉庫設計,通過這種方法,組織所掌握的所有信息都被放入系統中,每個大的主題在數據庫中都有自己的通用區域,當數據被使用時,相關數據點之間會出現連接,數據集市也會出現,系統中的任何數據都將永遠保留在那里,即使這些數據被后來的信息所取代或忽略,它將作為過去事件的記錄留在系統中。自下而上的數據倉庫設計方法與此相反。一家公司將信息作為一個獨立的數據集市。隨著時間的推移,其他數據集被添加到系統中,要么作為它們自己的數據集市,要么作為已經存在的數據集市的一部分,它們合并成一個單元。兩個數據倉庫的設計各有優缺點。自頂向下的方法對于更小的數據集是一個巨大的項目。因為大項目的成本也更高,從資金和人力而言,這是最昂貴的。如果完成并維護數據倉庫,它將是一個龐大的集合,包含公司所知道的一切。自下而上的過程更快、更便宜,但由于數據如果按需輸入,則數據庫將永遠不會完整。此外,數據集市之間的關聯性只有在使用時才足夠強。如果存在強相關性,但沒有用戶看到,則該關聯將斷開。