大數據是對數據的度量,這些數據已經增長到普通數據庫無法容納和處理大量的信息。數據有三種大小:小、中、大;這些度量都不是嚴格的;相反,每種類型的數據更多地取決于易用性和哪種機器可以處理信息。大數據需要特殊機器,比普...
大數據是對數據的度量,這些數據已經增長到普通數據庫無法容納和處理大量的信息。數據有三種大小:小、中、大;這些度量都不是嚴格的;相反,每種類型的數據更多地取決于易用性和哪種機器可以處理信息。大數據需要特殊機器,比普通數據庫的機器大得多,復雜得多。這些類型的數據通常在政府和科學機構中找到,但是一些非常大的網站也包含了大量的信息。大數據是一個經常與云計算聯系在一起的熱門詞匯。數據有三種標準尺寸,但并不嚴格。小數據可以放在一臺計算機或機器上,例如筆記本電腦。中型數據可以放在磁盤陣列上,最好由數據庫管理。數據庫,無論多大,都不能處理大數據,而必須使用特殊的系統。雖然對什么是大數據沒有嚴格的指導方針,它通常從TB級開始,一直到PB級。試圖在一個不專門處理這些數據量的數據庫上處理大數據會導致幾個實質性的問題。數據庫無法處理大量的信息,所以有些數據必須被刪除。這就像試圖在一臺只有50GB硬盤空間的計算機上安裝100GB的內存;這是不可能的。剩下的數據將難以控制和管理,因為任何功能都需要很長時間才能完成,而且數據庫必須關閉,不允許新的提交。雖然可以繼續購買機器并向數據庫中添加新數據,但這造成了難以處理的問題。這是因為數據庫軟件只用于處理中量數據較大的數據集會導致錯誤和管理問題,因為軟件根本無法移動或處理大數據而不會遇到問題。大多數組織或網站都不會遇到大數據。國防和軍事機構使用這些信息來創建模型和存儲測試結果,許多大型科學機構也出于類似的原因需要這些專門的機器。一些非常大的網站需要大型的數據機器,但在這個市場上,網站并不像機構那么普遍。這些機構需要保留所有的數據,因為這有助于更好地分析未來的數據并作出預測
-
發表于 2020-08-07 07:25
- 閱讀 ( 579 )
- 分類:電腦網絡