PDF Element 是综合表现是最好的一款专业强大的 PDF 全能软件。
速度方面,比 Acrobat 快很多。
体积方面,比 Acrobat 也要小很多。
最最最重要的一点是,这款软件是由A股上市公司万兴科技研发,不了解的同学会以为这家公司非常低调,其实仔细看看,人家是根本不在乎国内市场的收入。因为它几乎全部的收入都来自欧美地区。
我最喜欢的是它的批量转换功能,最近在思考如果工作中给我1000个格式类似的PDF。
PDF中有如下表格,是否可以用Python批量提取表格中相应位置的对应数据,如下图中的股票数据。我尝试了Python处理PDF的诸多模块,pdfminer.six,pdfplumber,tabula-py,PDFQuery以及PyPDF2。但并没有一个模块能方便地提取出下图中的对应数据。我想主要的原因是,下图并不是标准的格子表,而是横线表。
在我苦思冥想一天之后,我终于顿悟,并不一定要从头到尾用Python嘛,其实我缺的只是一款批量将PDF转为Excel的工具,因为Python和Excel的交互是无比流畅和高精度的。就是它,一键转换1000个PDF为Excel,随后轻松用Python操作获取PDF数据。
怎么样,看到1000个下面这种Excel,是不是小心脏一阵激动呢?循环+pandas即可搞定,Too Easy!
如此神器,欢迎私信“pdf”免费获取。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!