數據冗余是發生在數據庫系統中的一種情況,包括無意中創建數據庫功能所不需要的重復數據。雖然在某些情況下,冗余通常是一種理想的特性,但當涉及到數據庫的功能時,這是不正確的。重復數據的存在可以經常對系統的功能產生不...
數據冗余是發生在數據庫系統中的一種情況,包括無意中創建數據庫功能所不需要的重復數據。雖然在某些情況下,冗余通常是一種理想的特性,但當涉及到數據庫的功能時,這是不正確的。重復數據的存在可以經常對系統的功能產生不利影響,數據管理的關鍵功能之一是識別重復數據并刪除這些重復數據。

有些系統會標記重復數據的輸入,這樣就可以很容易地檢查感知到的重復并決定是刪除還是允許它。
幾乎所有類型的數據庫程序都存在數據冗余的可能性。被認為是平面的程序,如電子表格,而且依靠人工輸入數據特別容易出現重復信息,這可能導致在檢索所需信息時出現復雜情況。關系型數據庫,如銷售聯系人數據庫,通常包括有助于將無意重復的機會降至最低的過程,例如,在同一公司的同一聯系人上創建兩個不同的聯系人文件。即使使用系統檢查來幫助減少數據冗余的發生率,仍然有可能發生問題,因此有必要定期在數據庫中執行數據清理任務。
充其量,數據冗余意味著數據庫中充斥著不必要的信息,但對在需要時查找數據的能力沒有真正的威脅最壞的情況是,重復數據的存在會減慢數據庫的基本功能,并可能使使用數據庫管理某些任務的過程復雜化。例如,使用一個被冗余信息阻塞的客戶數據庫來生成郵件標簽,將導致創建多個重復級別,在使用標簽之前必須對重復項進行排序和處理,或者在嘗試生成標簽之前花時間清理數據庫。
幸運的是,監控和糾正數據冗余是許多數據管理系統可以相對輕松地完成的工作。有些系統會標記重復數據的輸入,從而便于檢查感知到的重復,并決定是刪除還是允許它保留。甚至還有一些軟件程序可用于掃描一個用于復制的現有數據庫,并相對容易地自動刪除那些多余的條目。