計算機文件會占用硬盤上的大量空間,同時也會占用大量的傳輸帶寬。為了節省空間,特別是對于不常訪問的文件,以及傳輸文件的帶寬,人們開發了一些存儲方法,通過某種方式壓縮數據,將數據保存在一個較小的包中。在每種情況下,使用...
計算機文件會占用硬盤上的大量空間,同時也會占用大量的傳輸帶寬。為了節省空間,特別是對于不常訪問的文件,以及傳輸文件的帶寬,人們開發了一些存儲方法,通過某種方式壓縮數據,將數據保存在一個較小的包中。在每種情況下,使用壓縮算法-一種減小數據大小的方法。有幾種流行的壓縮算法類別和類型,每種算法的工作方式都不同,有些算法的結果在重要方面有所不同。使用不同的壓縮算法,通常可以將文本文件壓縮到小于原始大小的一半;對于圖形文件,結果差別很大。壓縮后的文件可能是不同格式的文件,也可能是用于存儲、傳輸的存檔文件,以及分布。

,通常可以將文本文件壓縮到小于其原始大小的一半。
對壓縮算法進行分類的一種方法是根據它們是使用詞典還是統計方法來壓縮數據。dictionary方法側重于可重復的短語,并用于GIF圖像和JAR和ZIP存檔文件中統計方法依賴于使用頻率來進行轉換,這種轉換分兩次完成。例如,在某些傳真機中使用的改良霍夫曼(mh)就是一個例子。
對壓縮算法進行分類的第二種方法,非專業程序員最常遇到的是無損的或有損的。無損數據壓縮算法是一種壓縮數據的方法,當數據被解壓縮時,它與原始文件完全相同無損數據壓縮算法的一個例子是lzw(Lempel-Ziv-Welch算法),由Lempel和Ziv于1977年開發,1984年由Welch改進,用于GIF、TIF和PDF等文件中,以及某些調制解調器。
有損數據壓縮算法具有將數據縮小到比無損壓縮更小的大小的能力,但會以一些原始數據為代價。換句話說,有損數據壓縮后的恢復不會提供原始文件的完全相同副本。壓縮算法是,然而,它的設計目的是限制損耗,使其對耳朵或眼睛不明顯。有損壓縮用于文件格式,如AAC、JPEG、MPEG和MP3。