1.引言:
上有很多的ocr识别图片转文字再翻译的软件。但是没有翻译日语的。于是想自己做一个对含有日语的图片进行识别并翻译为中文的小工具。这里提一下,如果看这篇文章的人只是希望找个选中文本并翻译的软件程序,那推荐看此链接程序。
https://github.com/copytranslator/CopyTranslator/wiki/Downloads-%E4%B8%8B%E8%BD%BD%E4%B8%8E%E5%AE%89%E8%A3%85
这个软件功能是复制文本然后自动翻译,支持日语、英语等多种语言。
如果还是希望实现截图翻译,请继续看,下文娓娓道来。
2.思路:
基本动作流程:
截图 ->对剪切板中图片的文字进行识别->翻译。
3.具体实现:
1).对需要翻译的内容截图。
截图可通过搭配其他软件来实现。使用QQ或者微信等截图工具截图到剪切板也行。或者自己开发也行。
这里,我用的是 上流行的微信的dll库来实现截图的。名字:PrScrn.dll。 上有下载,但好像都是32位的,看 上是用下面的代码来使用这个截图dll的。我运行的时候出错了。这里也贴一下,或许对于制作的人有参考。估计python 是32位的应该可以使用。或许有了解确切原因的请留言。
因为电脑python是64的。后来改成python代码中运行,出现截图框了,截图反正是好用了。
另外是监视剪贴板内容,参照这个
2).图片转文本(日语),OCR。
依靠百度开发平台的OCR来实现。具体注册过程就不写了, 上会找到。终点是要得到三个值。appID,API key, secret Key。下面程序要用。
另外,还要安装百度的sdk.
我用的是pycharm,如下安装即可。很方便。
对于OCR调试的话,百度开发平台官 有例子程序。如下,先运行看看。先确保自己目前申请和搭建的环境是可用的。
详细参数设置请参照下面官 链接:比如设置其他语言的识别等等。
https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E6.96.B0.E5.BB.BAAipOcr
3).日语翻译为中文。
本来想用百度翻译的。但是下面这个提交参数sig和token不知道怎么生成的。于是就放弃这个途径了。
还有一种方式是申请百度翻译的api.申请的时候看到需要填写公司。于是就没有申请了。
目前是用有道翻译的demo接口实现翻译的。
下面是用有道翻译的代码。
4.完成代码:
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!