原图(左)和识别结果可视化(右)
1.国内公司开发的项目,提供了大量的中文操作和学习文档,方便使用与学习,属于小白友好型项目;
2.可拓展性良好,接口均已预留可直接调用,提供了适用于各种部署场景的轻量级 络和开发模组,属于开发者友好型项目。
paddleocr.py是主模块,–image_dir 是待识别图片地址 –type、–table与–layout共同控制识别模式选择。
我通过调用接口编写了一个简单地识别模块predict.py
输入
输入地址:Input/emotion/ocr13.jpg
原始输出
重点在result = table_engine(img),输入图片地址img,返回结果result
1.result为长度为1的列表(list)变量
2.result[0]为长度为4的字典(dict)变量
3.result[0][‘res’]为长度为2(即识别到的字符块个数)的列表(list)变量
4.result[0][‘res’][0]为长度为3的字典(dict)变量,包含了识别到的第一个代码块的所有信息
4.1 result[0][‘res’][0][‘text’]:第一个字符块的文本识别结果
4.2 result[0][‘res’][0][‘confidence’]: 第一个字符块的文本识别置信度
4.3 result[0][‘res’][0][‘text_region’]: 第一个字符块的旋转矩形检测框四个边界点坐标
4.3.1 可通过result[0][‘res’][0][‘text_region’][0][0]和result[0][‘res’][0][‘text_region’][0][1]来调用检测框边界点坐标
终端输出
文件夹输出
输出地址:Output/ocr13
输出的内容
(1) 原始与预测结果对比图
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!