51
一个可进行大量图片转文字的软件。
一、简介
最近从很多图片中提取文字,本来一字一字的敲,几次后确实太累了。
传图识字是个好方法,微信小程序“传图识字”就很好,我以前经常用,此外,微信、QQ上的图片也能提取文字。
但是,基本上是一张一张提取,数量多了就烦。而且复制到微信或QQ的时候,字数容易超标。
我就自己根据知乎、百度、CSDN等 上资料,东拼拼西凑凑整合出小段代码,实现对批量图片进行文字提取,并把结果写入文档。
使用的是Python,Python很容易看懂,而且拥有实现各种功能的“包”,你将相关模块导入就能使用。
所以不需要你知道如何编写各种功能的代码,你只需要对各种功能的包进行整合、组装,就能实现自己的目标。
就是因为Python调用各种包,所以打包封装的软件就很大。
就这样一个从批量图片中提取文字的.py代码文件只有2kB大小,但是打包封装成.exe软件就有50多MB大,就是因为把各种调用的包也装进去了。
上也有其他方法将封装得更小。
二、软件下载
ptt2.py文件下载:
ptt2.py
ptt2.exe文件下载:
百度 盘链接:
https://pan.baidu.com/s/1pW1_43WoHHInMPDAwFMOVg
提取码:6666
三、使用方法
ptt2.exe的使用:
使用过程很简单,就是将待识别从微信上保存到电脑的一个文件夹,然后双击运行软件,经过三次弹窗就运行结束,结果自动保存到结果文件夹里。
以这4张图片为例,详细说说用法。
1从微信保存图片到文件夹。比如,将4张图片保存在“新建文件夹”这个文件夹里。
文件夹里只能含有待识别的图片,不能存在其他任何东西,否则 错。
最好采用微信保存的图片,因为里面用了微信图片命名格式“微信图片_”几个字,且后面必须带有数字。
当然也可以从其他地方下载图片,但是必须手动将图片名称命名为“微信图片_XXX”的格式,XXX必须为数字,主要是为了进行排序,将图片内容按照文件夹里的图片顺序写入文档。如果手动命名图片名称,也就不需要从微信下载图片,可以是任何地方下载的图片。
2双击运行“ptt2.exe”,运行过程会有3次弹窗。
3运行便产生第一次弹窗,选择第1步保存图片的文件夹,选择之后点击右下角“选择文件夹”便进行下一次弹窗。
4第2次弹窗,选择结果文件夹,此次选择的是结果文件保存的文件夹。
最好不要选择第1步中保存待识别图片的文件夹,否则下次再运行就出错了,之前说过保存图片的文件夹不能有其他文件。(也可选择,下次运行之前把文件夹清理干净)
选择文件夹之后点击右下角“选择文件夹”几个字,否则一直停留在这一步不会继续运行下去。
然后就等程序运行,直到下次弹窗出现。
5第3次弹窗出现,随便选择一个文件夹,选好了点击右下角“选择文件夹”。
这次弹窗表示程序运行结束,之后就可以查看结果文件了。
6找到第2步选择的目标文件夹,打开看到新生成两个文件,一个“结果文件.docx”,一个“结果文件.txt”。
7打开看看效果,还不错。每张图片内容开始前会有一行提示字。
Word文档内容
记事本内容
本来识别出的内容行数跟图片上的一样,每行字数也一样。人为将换行去掉,将每张图片内容写成一个段落。
当然也可以在源代码上简单更改一下,结果跟图片一样了。
ptt2.py的使用:
使用Python3.9,进行运行即可,处理相同4张图片过程:
编码过程中会遇到各种各样的问题,下面列出了几篇参考文章,其他的还有很多很多,都是有问题马上搜解决方案。
从前天晚上想法的产生,着手进行操作,到昨天晚上成功打包封装,耗时1天。
很多知识我也不知道,还好得到“景神”的大力指导,表示万分感谢。
主要参考资料:
https://www.zhihu.com/tardis/sogou/art/376083407
https://jingyan.baidu.com/article/295430f11d12394c7e005084.html
https://www.cnblogs.com/risunlee/p/11915334.html
https://jingyan.baidu.com/article/4b52d702c7fb86fc5d774b61.html(这是另一种方法,使用baidu-aip模块,没用到,但值得提一下)
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!