圖文識別是現階段很常見的手藝之一,以前自學python寫爬蟲的時辰老是彈出需要輸入驗證碼的環境。其實實現識別驗證碼并不是很難。就需要兩個庫PIL和pytesseract庫就可以了。接下來給大師介紹若何一行代碼實現圖片文字識別。
起首需要安裝pytesseract
直接打開windows dos號令行窗口執行以下號令即可
pip install pytesseract
 安裝完當作界面如下圖所示,一般不會報錯的
 別的還需要安裝PIL,若是安裝掉敗可以直接安裝pillow取代pil哦
執行以下號令即可安裝
pip install pillow
 另還需要安裝【tesseract-ocr】,可以參考以下經驗
直接百度搜刮,下載進行安裝,中心的選擇都選擇默認即可
可是安裝完當作后,需要點竄pytesseract.py文件
18驗證碼識別安裝報錯解決
 新建一個graphicIdent.py文件,如下圖所示
 編寫代碼如下:
from PIL import Imageimport pytesseract
text = pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\test.png'), lang='chi_sim', config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')print(text)
有必定會問,你這并不是一行代碼啊,其實否則真正的實現確實只有以下的哪一行代碼的
text = pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\test.png'), , config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')
是也不是
 執行成果如下圖所示
固然不是100%識別精確,可是最起碼實現了,若是想要識別精確,需要進行練習。
 0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!