【本周学习】光学字符识别(OCR)

原图(左)和识别结果可视化(右)

        1.国内公司开发的项目,提供了大量的中文操作和学习文档,方便使用与学习,属于小白友好型项目;

        2.可拓展性良好,接口均已预留可直接调用,提供了适用于各种部署场景的轻量级 络和开发模组,属于开发者友好型项目。

         paddleocr.py是主模块,–image_dir 是待识别图片地址 –type、–table与–layout共同控制识别模式选择。

 我通过调用接口编写了一个简单地识别模块predict.py

输入

输入地址:Input/emotion/ocr13.jpg

原始输出

重点在result = table_engine(img),输入图片地址img,返回结果result

1.result为长度为1的列表(list)变量

2.result[0]为长度为4的字典(dict)变量

 3.result[0][‘res’]为长度为2(即识别到的字符块个数)的列表(list)变量

 4.result[0][‘res’][0]为长度为3的字典(dict)变量,包含了识别到的第一个代码块的所有信息

4.1 result[0][‘res’][0][‘text’]:第一个字符块的文本识别结果

4.2 result[0][‘res’][0][‘confidence’]: 第一个字符块的文本识别置信度

4.3 result[0][‘res’][0][‘text_region’]: 第一个字符块的旋转矩形检测框四个边界点坐标

4.3.1  可通过result[0][‘res’][0][‘text_region’][0][0]和result[0][‘res’][0][‘text_region’][0][1]来调用检测框边界点坐标

终端输出

文件夹输出

输出地址:Output/ocr13

输出的内容

(1) 原始与预测结果对比图

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年5月15日
下一篇 2022年5月15日

相关推荐