从广义上说,OCR文字识别也算是人工智能技术,随处可见的人脸识别、OCR识别、指纹识别和虹膜识别技术等人工智能,错落应用在各大领域之中,促进当代企业服务向智能化、自动化转型。云脉OCR开发者平台开放人工智能识别技术接口与SDK下载,降低中小企业应用人工智能识别技术的门槛和研发成本,缩短研发周期。
简单来说,就是一种便捷的图像转文字的技术。
传统的OCR技术流程比较复杂,需要先对通过扫描仪上传的图像进行预处理,包括灰度化、二值化、去黑边、区域定位、行切分、字切分等一系列操作。对图像质量要求高,识别率低,识别速度慢,效果差。
目前我国的语音识别技术也已经从进场发展到远场,如果要实现人工智能,OCR技术则是必不可少的基石,智能文字识别的主要依据就是OCR技术识别原理,现在也有许多智能产品加入了人脸识别的项目。
OCR概念的产生是在1929年,德国的科学家Tausheck首先提出了OCR的概念,并且申请了专利。几年后,美国科学家Handel也提出了利用技术对文字进行识别的想法。但这种梦想直到计算机的诞生才变成了现实。现在这一技术已经由计算机来实现,OCR的意思就演变成为利用光学技术对文字和字符进行扫描识别,转化成计算机内码。
我国在OCR技术方面的研究工作起步较晚,在70年代才开始对数字、英文字母及符 的识别进行研究,70年代末开始进行汉字识别的研究,到1986年汉字识别的研究进入一个实质性的阶段,取得了较大的成果,不少研究单位相继推出了中文OCR产品。我国OCR都是有 OMR演变过来的,我国的一些研究部门在 80年代初就开始对OCR识别进行研究,如:清华的吴估寿教授、丁晓青教授、夏莹教授、北大的顾小凤教授、北信的张昕中教授、中科院的刘品平博士、李明敬博士可以称作我国OCR研究开发队伍中的导航人,为此付出了不懈努力。二十多年的研究开发积累了大量人才,专家就有上百人。
在中关村的硅谷地带,我国的OCR专家多达20多位,他们也为我国的信息领域留下了自己奋斗的足迹。我国目前使用的文本型OCR软件主要有清华文通TH-OCR、北信BI-OCR、中自ICR、沈阳自动化所SY-OCR、北京曙光公司NI-OCR(已被中自汉王并购)等,匹配的扫描仪则使用市面上的平板扫描仪。中文OCR即采用扫描仪、数码相机等输入设备,把中文印刷体的文稿送入计算机并以计算机文档表示出来的高新技术。中文印刷体识别技术(OCR)主要用于文字和表格输入,可以用扫描仪将整页的印刷文稿或者表格输入计算机,由计算机上的识别系统自动生成汉字文件,替代人工键入汉字和表格的工作。中文OCR有普及版和专业版之分,现在市场上扫描仪捆绑的OCR软件均为普及版。
目前印刷体OCR的识别技术已经达到可以实用的程度,即使对印刷质量较差的文字的识别率也达到95%以上。由于手写体OCR技术的限制,专业型OCR系统的产品多是面向特定的行业,即适用于每天需处理大量表格信息录入的部门,如邮政、税务、海关、统计等等。这种面向特定行业的专业型OCR系统信息格式较为固定,识别的字符集相对小,经常与专用的输入设备结合使用,因此具有速度快、效率高等特点。在国外已经被广泛地应用,充分发挥着作用。
在我国随着计算机应用的深入,这方面的需求已经出现。专业版 OCR有批处理功能,性能更加优化,识别率也不同于普通版OCR。国家的”863计划”对OCR技术的研究给予了很大的资助,促进了OCR的重大成果的取得。如”863″项目的启用者汉王最新推出的专业版”新世纪OCR”,将我国当今的OCR技术推进了新的巅峰。它的特点主要是:识别率大幅度提高,尤其是对中英文混排文稿,识别率为99%。可识别宋、仿宋、楷、隶、行等八种印刷字体,对数字、标点符 的识别也可点可圈;对表格识别也有了一定的突破,无论横版、竖版、中文表格、图文混排文件都能识别,自动版面分析和识别功能也大大加强。从80年代开始,OCR的研究开发就一直受到国家”863″计划的资助,我国在信息技术领域付出的努力,已经有了初步的回 。
目前我们正在实现将OCR软件针对表格形式的特征设计了大量的优化功能,使得识别精度更高、识别速度更快,并且为适应不同环境的使用提供了多种识别方式选项,支持单机和 络操作,极大地方便了使用,使应用范围更加广泛,能达到各种不同用户的应用要求。我们相信经过众多专家或专业人士的努力,及国家在信息产业领域的大力资助,使OCR进入到 络的各个领域,会有更多的新品种奉献给我们的用户,OCR技术将会有一个质的飞跃。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!