拍照搜题

?? 从技术上来说，这类软件主要有两种方案：“以图搜图”和“OCR+文字搜索”

经过二值化之后，整个图像会呈现出明显的黑白效果，这样一来，图像就变得简单了，而且数据量也减小了，还能凸显出感兴趣的目标的轮廓。接着自然也就可以把单个字符切分出来了。把字符切分出来之后，软件还是“认不出”这个字符是什么的，所以接下来还要识别这些字符。这时就需要光学字符识别技术（OCR）和深度学习技术上场了。在识别这个过程中，PhotoMath主要使用了OCR技术，而小猿搜题则主要使用了深度学习技术。不过，由于这两种方法都不能保证100%识别正确，所以中间可能还需要插入一个纠错过程，像“1和l”、“好图所示和如图所示”、“入和人”这些形式非常相近的字符机器也很容易读错。这时候利用语言模型进行纠错就显得比较有必要了。在做完识别之后，它还要去题库里搜索对应的题目。在这个过程中，计算机又要用到分词、排序等搜索过程中需要用到的技术。

OCR（Optical Character Recognition，光学字符识别），自动研究光学设备产生的图片检查纸上的字符，通过检测暗、亮的模式确定其形状，实现计算机对文字的阅读。

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

相关推荐