在計算機程序設計中,字符編碼是一種方法或算法,用于尋找字符、字形或符號的通常數字表示形式。在計算機中使用字符編碼是必要的,因為計算機內存中和計算機可讀媒體上的信息是以位或數字序列的形式存儲的。這就要求使用一...
在計算機程序設計中,字符編碼是一種方法或算法,用于尋找字符、字形或符號的通常數字表示形式。在計算機中使用字符編碼是必要的,因為計算機內存中和計算機可讀媒體上的信息是以位或數字序列的形式存儲的。這就要求使用一種編碼方法,將用于顯示或人類可讀輸出的非數字字符轉換成計算機可以操作的形式。在更具體的應用程序中,由web瀏覽器讀取的超文本標記語言(HTML)文檔可以定義它們使用的字符編碼類型,以便讓瀏覽器知道哪些特定的字符在文檔中顯示信息時要使用的字符集。有幾種編碼方案正在使用中,盡管其中許多專有和傳統集正在慢慢被Unicode?編碼標準所取代。在計算機出現的早期,當內存空間有限時,英語字母表的基本字符(包括標點符號和數字)存儲在7位序列中,可以容納128個不同的字符。在最初的方案中,每個7位字節代表英語字母表中的一個字符,按順序編號。這種字符編碼是高效的,最終被標準化和用于生產的大多數計算機中。雖然編碼系統演變成Unicode?編碼標準,但概念保持不變。即語言中的每一個字符都與一個大的標準字符集中的一個數字直接相關,而這個數字是計算機用來存儲、處理和索引的其他類型的字符編碼是基于不同的原因而開發的有些是專門針對英文字母表設計的,只用于文本的,只將字符映射到7位序列上,然后將它們分散到8位字節(或八位字節)上。這樣可以使每個八位字節節省1位,有效地將字符編碼用作一種壓縮類型。其他編碼方案試圖提供有關字符的基本信息,然后提供附加字符來表示在用不同語言編寫時可以使用的特殊重音符號,盡管這些字符在很大程度上被更簡單的一對一編碼方法所拋棄HTML文檔中,字符編碼與更廣泛的概念大致相同,只是定義的編碼包含了整個字符集。這不僅對外語很重要,而且對于使用科學或數學的特定符號(并非所有字符集都存在)的文檔都很重要。它也很有用用于使用標點符號和其他符號,這些符號可能不存在或在不同的編碼方案中映射。未正確定義非標準字符編碼的文檔可能顯示不正確,或填充了無意義的字符和占位符,而不是可讀信息
-
發表于 2020-08-07 01:53
- 閱讀 ( 733 )
- 分類:電腦網絡