python如何一行代碼實現圖片文字識別

圖文識別是現階段很常見的手藝之一，以前自學python寫爬蟲的時辰老是彈出需要輸入驗證碼的環境。其實實現識別驗證碼并不是很難。就需要兩個庫PIL和pytesseract庫就可以了。接下來給大師介紹若何一行代碼實現圖片文字識別。

東西/原料

1
起首需要安裝pytesseract
直接打開windows dos號令行窗口執行以下號令即可
pip install pytesseract
2
安裝完當作界面如下圖所示，一般不會報錯的
3
別的還需要安裝PIL，若是安裝掉敗可以直接安裝pillow取代pil哦
執行以下號令即可安裝
pip install pillow
4
另還需要安裝【tesseract-ocr】，可以參考以下經驗
直接百度搜刮，下載進行安裝，中心的選擇都選擇默認即可
可是安裝完當作后，需要點竄pytesseract.py文件
18驗證碼識別安裝報錯解決
5
新建一個graphicIdent.py文件，如下圖所示
6
編寫代碼如下：
from PIL import Imageimport pytesseract
text = pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\test.png'), lang='chi_sim', config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')print(text)
有必定會問，你這并不是一行代碼啊，其實否則真正的實現確實只有以下的哪一行代碼的
text = pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\test.png'), , config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')
是也不是
7
執行成果如下圖所示
固然不是100%識別精確，可是最起碼實現了，若是想要識別精確，需要進行練習。