【本周学习】光学字符识别（OCR）

2022年5月15日上午11:15 • 行业观察

原图（左）和识别结果可视化（右）

1.国内公司开发的项目，提供了大量的中文操作和学习文档，方便使用与学习，属于小白友好型项目；

2.可拓展性良好，接口均已预留可直接调用，提供了适用于各种部署场景的轻量级络和开发模组，属于开发者友好型项目。

paddleocr.py是主模块，–image_dir 是待识别图片地址 –type、–table与–layout共同控制识别模式选择。

我通过调用接口编写了一个简单地识别模块predict.py

输入

输入地址：Input/emotion/ocr13.jpg

原始输出

重点在result = table_engine(img)，输入图片地址img，返回结果result

1.result为长度为1的列表（list）变量

2.result[0]为长度为4的字典（dict）变量

3.result[0][‘res’]为长度为2（即识别到的字符块个数）的列表（list）变量

4.result[0][‘res’][0]为长度为3的字典（dict）变量，包含了识别到的第一个代码块的所有信息

4.1 result[0][‘res’][0][‘text’]：第一个字符块的文本识别结果

4.2 result[0][‘res’][0][‘confidence’]：第一个字符块的文本识别置信度

4.3 result[0][‘res’][0][‘text_region’]：第一个字符块的旋转矩形检测框四个边界点坐标

4.3.1 可通过result[0][‘res’][0][‘text_region’][0][0]和result[0][‘res’][0][‘text_region’][0][1]来调用检测框边界点坐标

终端输出

文件夹输出

输出地址：Output/ocr13

输出的内容

（1）原始与预测结果对比图

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

【本周学习】光学字符识别（OCR）

相关推荐