"數據擴散"是指政府和企業等實體存儲的大量文件和數據量的總稱,每天大量的數據流入意味著這些實體需要更多的空間和硬件,但截至2011年,數據激增的速度超過了計算機的發展速度。存儲何種類型的信息并不重要,不管是結構化還...
"數據擴散"是指政府和企業等實體存儲的大量文件和數據量的總稱,每天大量的數據流入意味著這些實體需要更多的空間和硬件,但截至2011年,數據激增的速度超過了計算機的發展速度。存儲何種類型的信息并不重要,不管是結構化還是非結構化的;重要的是計算機內存被占用。存儲所有這些數據可能會很困難,導致額外的成本。數據激增的另一個問題是當一個大的實體需要更多的內存時,

,一般來說,它必須擁有更多的服務器。
數據激增的問題并不是消費者和普通計算機用戶所關心的問題。雖然隨著時間的推移,普通計算機用戶需要更多的內存,但計算機能夠以一定的速度發展,以滿足這些需求然而,如果一個普通的計算機用戶需要更多的計算機內存,他通常只會得到一個更大的硬盤。當一個大型實體需要更多的內存時,通常情況下,it部門必須獲得更多的服務器。按照正常的速度,這不應該帶來任何問題,但2011年許多大型實體的數據存儲量正在以超過技術的速度增長,可能需要大量的服務器來存儲實體需要存儲的所有內容,這是因為計算機技術還不能使一個設備能夠保存所有的信息,這意味著一個大型實體必須繼續購買和使用越來越多的硬件
有些數據術語或問題只涉及一種類型的信息,但當涉及到數據的激增時,涉及到哪種類型的數據并不重要,只要計算機內存被快速占用,數據擴散就成了一個問題。
數據激增的許多問題之一就是成本。除了額外的存儲硬件成本外,還有物理存儲和人力資源成本。服務器必須放在某個地方,并且必須雇傭人員來運行服務器,這會導致理論上成本過高,使實體難以維持,并導致利潤大幅下降。另一個問題是網絡速度,因為數據堵塞可能導致程序運行速度慢得多,這意味著員工在一個工作日內可以做更少的工作。