把扫描文件转变为word文档的最实用的四款OCR识别软件

　　TH-OCR是清华大学自1985年就开始研发的，TH是TsingHua（清华）的缩写，TH-OCR代表北京清华紫光文通信息技术有限公司开发的OCR软件。在国家“863”计划支持下，持续了十多年的科研成果，从1.0版本开始已经升级到现在的9.0版本。独家真正实现了汉英混排同时识别，在国际上首次突破了OCR产品只能处理汉字或英文单一文字的局限性，新增了东方文字（简繁汉、日文、韩文）识别功能，对日文和韩文与英文混排文档的识别水平甚至超过日本和韩国对本国文字的识别水平，在国内、外产生了重大的影响，并连续3年被中国软件行业协会评为优秀软件产品，成为汉字输入技术的一座里程碑。TH-OCR9.0版本已应用到了包括电子政务、电子出版物、、银行、邮政、税务、图书馆等多个领域，成为国内OCR市场的先锋。

　　本届两会代表的所有提案全部采用了我国自主知识产权的世界识别领域领先产品——清华紫光文通的TH-OCR9.0进行录入识别，它以准确的识别率、优异的识别速度博得了两会工作人员的交口称赞。而清华TH-OCR技术在两会上的成功应用更论证了我国也完全有实力拥有自己的卓越技术。

TH-OCR的突出特点：
◇ 汉英双语同时混排，识别率最高，居世界领先水平。　　
◇ 可以识别黑白、灰度、彩色图像，可以读取多种图像格式。
◇ 首创对识别结果进行电子文档版面复原功能，所见即所得。
◇ 首创日文、韩文、日英混排、韩英混排识别功能，识别率98%以上。

TH-OCR的六大优势：

1. 是唯一可以识别２万多汉字的多体文字识别系统，汉字识别国内最优。

2. 汉字和英文混排、日文和英文混排、韩文和英文混排同时识别。

3. 汉字识别率最高。清华紫光文通TH-OCR经过”863″智能专家组对数十万字的指标评测和中国软件评测中心对产品的严格测试，识别正确率超过99.5％，代表了目前印刷体文字识别的最高水平。

4. 支持多种环境接口。清华紫光文通TH-OCR支持WINDOWS环境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多种内码，可以用于 WINDOWS NT和WINDOWS 98/2000/XP，适合全球各个地区使用。TH-OCR还具有自学习功能，不论什么生僻字，都可以通过键盘输入进行学习，大大拓宽了OCR系统的识别字符集。

5. 历次国内鉴定均被中国科学院院土和中国工程院院土等专家组成的鉴定委员会评定为“具有世界领先水平”。

广泛的会认可：

1、多年来为众多著名的扫描仪厂商HP、UNISCAN、EPSON、CANON、 LENOVO等提供TH－OCR普及版作为其扫描仪的捆绑软件。

2、美国MICROSOFT公司将TH-OCR作为东方文字识别捆绑到WINXP 操作系统中。

3、美国MOTOROLA公司确定TH-OCR的部分技术使用权。

4、美国INTEL公司确定TH-OCR为最新的MMX技术支持项目。

5、《计算机世界》市场调查结果，清华紫光文通TH-OCR市场占有率达65％以上。

6、《中国计算机》 CIWLAB组织的用户调查认为， TH-OCR是一个性能极好的系统，是一个值得用户信赖的系统（对其他品牌OCR评价为：“是值得用户选择的产品”）。
http://down.x6x8.com/soft/6/64/247.html

QUOTE:
尚书7 OCR文字识别系统完全版 Shocr7.0
把扫描文件转变为word文档的最实用的四款OCR识别软件
本软件系统是应用OCR（Optical Character Recognition）技术，为满足书籍、刊杂志、

表票据、公文档案等录入需求而设计的软件系统。目前，许多信息资料需要转化成电子文档以

便于各种应用及管理，但因信息数字化处理的方式落后，不但费时费力，而且资金耗费巨大，

造成了大量文档资料的积压，因此急需一种快速高效的软件系统来满足这种海量录入需求。本

软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻

印、大量资料电子化的软件系统。
●识别字符
简体字符集：国标GB2312-80的全部一、二级汉字6800多个。
纯英文字符集。
简繁字集：除了简体汉字外，还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
●识别字体种类
能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体，并支持多种字体混排

。
● 识别字
初小六字体。
●表格识别
可以自动判断、拆分、识别和还原各种通用型印刷体表格。
●可支持繁体WINDOWS系统
首先，尚书七开始将整个OCR的过程，明确化了，通过程序的菜单，我们就能够知道整个OCR

斜校正（提供自动和手动实现方法），旋转等功能。
处理完毕后，就可以进入“识别过程”，该过程关键的是“版面分析”，现在尚书七的自动

版面分析功能很强，面对纸杂志等复杂情况的版面，也是分析的正确率很高。不再需要我们

在尚书六里面那样的建议手工划识别范围。也正是这点，大大降低了使用者的工作量。为了

方便，“识别”菜单下，也提供了用户自己在自动版面分析后，通过修改识别范围框的属性，

来决定需要识别否的功能（默认的情况下，图象属性的栏目是不用识别的。当然，如果用户还

是习惯原来尚书六那样，自己来设定识别区域，只要直接用鼠标划框就可以了。接下来，用

户就可以直接选择“开始识别”的按钮了，等待识别的结果。
http://down.x6x8.com/soft/6/64/246.html

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

把扫描文件转变为word文档的最实用的四款OCR识别软件

相关推荐