OCR 开源软件 Tesseract 的下载和入门使用

资源下载

tesseract-ocr-setup-3.05.01.exe
注: 安装的时候选好要识别的语言

tesseract-4.0-with-LSTM#400-alpha-for-windows

Windows中运行tesseract

1. 是一个命令行OCR程序,打开一个终端(组合键Win +R),输入:

2.举个栗子:识别 图像,将识别结果存入,命令行:

3.指定特定语言,指定识别简体中文和英文,命令行:

4.指定输出文件格式,在命令行最后加上文件格式即可,可以指定Hocr和pdf格式,hOCR是
是一种HTML文件,它对每个识别的字词会后一些参数的说明。tesseract 3.03及以上的版本才
支持pdf格式,命令行为:

hOCR:
pdf:

Github 参考文件

运行tesseract
参数说明

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2017年11月7日
下一篇 2017年11月7日

相关推荐