Tesseract-OCR是一條目關于中文的識別,而且是開源的,識別結果比力好的軟件包。
接下來給大師介紹Python驗證碼識別tesseract-ocr安裝,報錯解決。
起首需要下載tesseract-ocr
以下是下載地址
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe
下載好后,雙擊tesseract-ocr-setup-4.00.00dev.exe安裝,彈出接待界面,如下圖所示
第二步,勾選【贊成和談】,點擊【next】即可
選擇安裝用戶,選擇勾選【全數用戶】
選擇安裝功能,其他的默認即可,可是必然要選擇這個說話包哦,這個說話包就是簡體中文
選好安裝目次后,點擊【next】下一步
默認的點擊下一步【next】,下一步【next】進行安裝即可
安裝完當作后,點擊下一步【next】即可,點擊【finish】完當作即可
最后一步,若是報錯信息如下圖所示,怎么辦?
其實百度搜刮有良多的解決方案,小編想說的是,小編親自實踐解決的一種方式,但愿能有所幫忙。
text = pytesseract.image_to_string(Image.open('C:\\Users\\123.png'), lang='chi_sim', config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')
在利用的時辰,加上以下這段即可
config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!