标签:pypdf2
-
如何在Python中将提取的文本从PDF转换为JSON或XML格式? - python
我正在使用PyPDF2从PDF文件中提取数据,然后转换为文本格式吗? 文件的PDF格式如下: Name : John Address: 123street , USA Phone No: 123456 Gender: Male Name : Jim Address: 456street , USA Phone No: 456899 Gender: Male […]
-
如何在python中将从PDF提取的文本格式化为json - python
我已经使用pyPDF2提取了一些文本格式的发票PDF。我想将此文本文件转换为仅包含重要关键字和令牌的json文件。 输出应该是这样的: #PurchaseOrder { "doctype":"PO", "orderingcompany":"Demo Company", " […]