基于Python的大量图片转文字软件

51

一个可进行大量图片转文字的软件。

一、简介

最近从很多图片中提取文字,本来一字一字的敲,几次后确实太累了。

传图识字是个好方法,微信小程序“传图识字”就很好,我以前经常用,此外,微信、QQ上的图片也能提取文字。

但是,基本上是一张一张提取,数量多了就烦。而且复制到微信或QQ的时候,字数容易超标。

我就自己根据知乎、百度、CSDN等 上资料,东拼拼西凑凑整合出小段代码,实现对批量图片进行文字提取,并把结果写入文档。

使用的是Python,Python很容易看懂,而且拥有实现各种功能的“包”,你将相关模块导入就能使用。

所以不需要你知道如何编写各种功能的代码,你只需要对各种功能的包进行整合、组装,就能实现自己的目标。

就是因为Python调用各种包,所以打包封装的软件就很大。

就这样一个从批量图片中提取文字的.py代码文件只有2kB大小,但是打包封装成.exe软件就有50多MB大,就是因为把各种调用的包也装进去了。

上也有其他方法将封装得更小。

二、软件下载

ptt2.py文件下载:

ptt2.py

ptt2.exe文件下载:

百度 盘链接:

https://pan.baidu.com/s/1pW1_43WoHHInMPDAwFMOVg

提取码:6666

三、使用方法

ptt2.exe的使用:

使用过程很简单,就是将待识别从微信上保存到电脑的一个文件夹,然后双击运行软件,经过三次弹窗就运行结束,结果自动保存到结果文件夹里。

以这4张图片为例,详细说说用法。

1从微信保存图片到文件夹。比如,将4张图片保存在“新建文件夹”这个文件夹里。

文件夹里只能含有待识别的图片,不能存在其他任何东西,否则 错。

最好采用微信保存的图片,因为里面用了微信图片命名格式“微信图片_”几个字,且后面必须带有数字。

当然也可以从其他地方下载图片,但是必须手动将图片名称命名为“微信图片_XXX”的格式,XXX必须为数字,主要是为了进行排序,将图片内容按照文件夹里的图片顺序写入文档。如果手动命名图片名称,也就不需要从微信下载图片,可以是任何地方下载的图片。

2双击运行“ptt2.exe”,运行过程会有3次弹窗。

3运行便产生第一次弹窗,选择第1步保存图片的文件夹,选择之后点击右下角“选择文件夹”便进行下一次弹窗。

4第2次弹窗,选择结果文件夹,此次选择的是结果文件保存的文件夹。

最好不要选择第1步中保存待识别图片的文件夹,否则下次再运行就出错了,之前说过保存图片的文件夹不能有其他文件。(也可选择,下次运行之前把文件夹清理干净)

选择文件夹之后点击右下角“选择文件夹”几个字,否则一直停留在这一步不会继续运行下去。

然后就等程序运行,直到下次弹窗出现。

5第3次弹窗出现,随便选择一个文件夹,选好了点击右下角“选择文件夹”。

这次弹窗表示程序运行结束,之后就可以查看结果文件了。

6找到第2步选择的目标文件夹,打开看到新生成两个文件,一个“结果文件.docx”,一个“结果文件.txt”。

7打开看看效果,还不错。每张图片内容开始前会有一行提示字。

Word文档内容

记事本内容

本来识别出的内容行数跟图片上的一样,每行字数也一样。人为将换行去掉,将每张图片内容写成一个段落。

当然也可以在源代码上简单更改一下,结果跟图片一样了。

ptt2.py的使用:

使用Python3.9,进行运行即可,处理相同4张图片过程:

编码过程中会遇到各种各样的问题,下面列出了几篇参考文章,其他的还有很多很多,都是有问题马上搜解决方案。

从前天晚上想法的产生,着手进行操作,到昨天晚上成功打包封装,耗时1天。

很多知识我也不知道,还好得到“景神”的大力指导,表示万分感谢。

主要参考资料:

https://www.zhihu.com/tardis/sogou/art/376083407

https://jingyan.baidu.com/article/295430f11d12394c7e005084.html

https://www.cnblogs.com/risunlee/p/11915334.html

https://jingyan.baidu.com/article/4b52d702c7fb86fc5d774b61.html(这是另一种方法,使用baidu-aip模块,没用到,但值得提一下)

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年4月26日
下一篇 2022年4月26日

相关推荐