资源下载
tesseract-ocr-setup-3.05.01.exe
注: 安装的时候选好要识别的语言
tesseract-4.0-with-LSTM#400-alpha-for-windows
Windows中运行tesseract
1. 是一个命令行OCR程序,打开一个终端(组合键Win +R),输入:
2.举个栗子:识别 图像,将识别结果存入,命令行:
3.指定特定语言,指定识别简体中文和英文,命令行:
4.指定输出文件格式,在命令行最后加上文件格式即可,可以指定Hocr和pdf格式,hOCR是
是一种HTML文件,它对每个识别的字词会后一些参数的说明。tesseract 3.03及以上的版本才
支持pdf格式,命令行为:
hOCR:
pdf:
Github 参考文件
运行tesseract
参数说明
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!