光學字符識別(OCR)軟件,是一種將文本圖像轉換成計算機可以讀取的實際文本的軟件。通常,它是在圖像掃描到計算機后使用的,盡管也可以使用其他形式的輸入。OCR軟件對已輸入的文本最有效,無論是在原始打印件丟失的情況下,還是在...
光學字符識別(OCR)軟件,是一種將文本圖像轉換成計算機可以讀取的實際文本的軟件。通常,它是在圖像掃描到計算機后使用的,盡管也可以使用其他形式的輸入。OCR軟件對已輸入的文本最有效,無論是在原始打印件丟失的情況下,還是在掃描打字機上打印的紙張時,好的軟件也可以翻譯手寫文本,雖然這種轉換的錯誤率往往要高得多。手寫識別系統允許計算機學習不同風格的人類筆跡。OCR軟件的實際術語有點誤導,因為大多數現代版本實際上不使用光學字符識別,但實際上使用的是數字字符識別,這是因為幾年前這兩個領域有效地合并了,兩個領域都采用了更具吸引力的術語光學字符識別,OCR軟件近年來有了很大的進步,現代的程序在識別文本方面比以前的程序要好得多。最好的OCR軟件可以將手寫體抄寫成計算機文本。事實上,早期的OCR軟件要求在程序能夠準確輸入之前,對程序進行特定字體的訓練。類似地,當輸入手寫體時,程序必須經過訓練,這是一個非常耗時的過程。然而,方法已經得到改進,智能化程度更高的系統已成為標準。所使用的方法現在相對靜態,只有一小部分的研究用于開發全新的方法,而大多數研究則致力于改進現有的程序使它們更加精確早期版本的軟件被廣泛應用于各種應用中,20世紀50年代的大公司都用它來讀取信用卡的印記,而美國郵政從20世紀60年代中期開始就用它來分類郵件。10年前,選擇一個OCR軟件是很困難的,因為許多程序在某些任務上相當糟糕,而且相當擅長其他人。然而,如今,這個領域已經基本上趨于平衡。任何一個好的軟件翻譯拉丁文字的準確率都在99%以上。然而,當涉及到手寫輸入或更復雜的字體時,OCR軟件的范圍仍然相對較高。OCR軟件的成本也很高波動很大,通常與它所擁有的準確率有關。可以找到相當數量的適合輸入印刷品的免費軟件,也可以找到一些比較擅長檢測手寫體的軟件,特別是經過一些培訓。更昂貴的軟件套件,如OmniPage suite,其成本約為家庭版100美元(USD),專業版450美元左右,擁有令人印象深刻的功能陣列,通常成功率更高。不幸的是,仍然沒有完美的OCR軟件,因此,選擇購買程序在很大程度上仍然是一個令人沮喪的過程。即使是最好的程序也可能在書寫方面遇到困難,錯誤也會不可避免地蔓延,即使是在較低的水平上也是如此。大多數情況下,選擇購買的程序可以歸結為額外的功能:多語言支持、一鍵掃描和轉換集成,自動PDF轉換,以及跨專業學科(如法律和醫學領域)的全字識別
-
發表于 2020-08-06 06:48
- 閱讀 ( 745 )
- 分類:電腦網絡