文本文件是一種計算機文件,它將鍵入的文檔存儲為一系列字母數字字符,通常沒有視覺格式信息。內容可以是個人筆記或列表、日記或報紙文章、書籍,文本文件與文字處理文件相似,兩者的內容主要是文本;它們的不同之處在于文本文...
文本文件是一種計算機文件,它將鍵入的文檔存儲為一系列字母數字字符,通常沒有視覺格式信息。內容可以是個人筆記或列表、日記或報紙文章、書籍,文本文件與文字處理文件相似,兩者的內容主要是文本;它們的不同之處在于文本文件通常不記錄諸如字符樣式、大小、頁碼等信息,一些計算機操作系統在文本文件和二進制文件之間作了基本的區分,它由計算機直接解釋。

ASCII編碼系統以其適應性和簡單性而聞名。
在大多數用于文本編碼的方案中,每個字符都被分配一個數值,然后文本被寫成二進制數的字符串。有一種編碼模式,稱為美國信息交換標準碼(ASCII),在計算機歷史的早期就成為一種廣泛使用的標準,盡管它對英語以外的語言的支持很差,但ISO 8859代碼系列為基于拉丁字母和類似字母的語言提供了更好的支持,但無法對來自東亞語言(如日語)的字符進行編碼,從而導致不兼容標準的激增。
最近,Unicode?聯盟一直在開發一種編碼系統,名為
Unicode?,其目標是為地球上每種語言中使用的每個字符分配一個唯一的數字這將允許每種語言使用一個代碼,并允許多種語言的文本出現在一個文件中。Unicode的第一部分基于ISO 8859,而ISO 8859本身就是基于ASCII的。使用Unicode?甚至在英語國家也有優勢,由于使用舊模式編碼的文本在從一個系統移動到另一個系統時可能會顯示出輕微的不一致性。
文本文件的優點包括小尺寸和多功能性。比以其他格式存儲的相同數據小千字節或兆字節,它們可以通過電子郵件或磁盤進行快速和大規模的交換。大多數文件可以在運行不同操作系統的計算機上打開,使用非常基本的軟件。主要的缺點是缺乏格式。對于表示包含圖像或依賴設計元素來傳達其信息的文檔,文本文件可能不是一個很好的選擇意思——例如,包含表格數據、數學公式或具體詩歌的文件。
文本文件通常是供人類閱讀和編輯的,但并非所有的文件都包含主要供人類使用的內容。大多數編程代碼在編譯之前都存儲在文本文件中,即翻譯文件還可能包含機器可讀的文本標記,這些標記除了提供純文本外,還可以提供格式信息。例如,超文本標記語言(HTML)文件可以在文本編輯器中作為純文本文件打開,或者在被web瀏覽器解釋后顯示為格式化的網頁。類似的方案包括用于布局科學論文的LaTeX和用于結構化數據的可擴展標記語言(XML)。