結構良好的數據倉庫可以在以后挖掘并獲得有價值的見解。數據集市是數據倉庫設計的中心人物。數據集市是基于單個概念的數據集合。每個數據集市都是一個獨特且完整的數據集市數據子集。這些集合中的每一個都在內部完全相關,通常與外部數據集市有連接。
數據倉庫設計有兩種主要類型:自頂向下和自下而上。數據集市的處理方式是這兩種數據倉庫設計風格的主要區別,數據集市是在數據被放入系統時自然產生的。在自下而上的設計中,數據集市是直接建立并連接在一起形成倉庫的。雖然這看起來是一個微小的區別,但卻有著截然不同的設計自頂向下的方法是原始的數據倉庫設計,通過這種方法,組織所掌握的所有信息都被放入系統中,每個大的主題在數據庫中都有自己的通用區域,當數據被使用時,相關數據點之間會出現連接,數據集市也會出現,系統中的任何數據都將永遠保留在那里,即使這些數據被后來的信息所取代或忽略,它將作為過去事件的記錄留在系統中。自下而上的數據倉庫設計方法與此相反。一家公司將信息作為一個獨立的數據集市。隨著時間的推移,其他數據集被添加到系統中,要么作為它們自己的數據集市,要么作為已經存在的數據集市的一部分,它們合并成一個單元。兩個數據倉庫的設計各有優缺點。自頂向下的方法對于更小的數據集是一個巨大的項目。因為大項目的成本也更高,從資金和人力而言,這是最昂貴的。如果完成并維護數據倉庫,它將是一個龐大的集合,包含公司所知道的一切。自下而上的過程更快、更便宜,但由于數據如果按需輸入,則數據庫將永遠不會完整。此外,數據集市之間的關聯性只有在使用時才足夠強。如果存在強相關性,但沒有用戶看到,則該關聯將斷開。
                    0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!