如何使用Python 操作PDF?总结用Python操作PDF的几种方法( 二 )

  • 读取器读取 PDF 文档
  • 读取器一页一页交给写入器
  • 写入器每获取一页就立即输出
  • 通过这个代码逻辑我们也可以明白,写入器初始化和输出的位置一定都在读取 PDF 循环每一页的循环体内,而不是在循环体外
    代码很简单:
    from PyPDF2 import PdfFileReader, PdfFileWriterpath = r'C:Usersxxx'pdf_reader = PdfFileReader(path + 'INV1.pdf')for page in range(pdf_reader.getNumPages()):    # 遍历到每一页挨个生成写入器    pdf_writer = PdfFileWriter()    pdf_writer.addPage(pdf_reader.getPage(page))    # 写入器被添加一页后立即输出产生pdf    with open(path + 'INV1-{}.pdf'.format(page + 1), 'wb') as out:        pdf_writer.write(out)复制代码(4)水印
    本次的工作是将下图作为水印添加到 INV1.pdf 中
    首先是准备工作,将需要作为水印的图片插入 word 中调整合适位置后保存为PDF文件 。然后就可以码代码了,需要额外用到 copy 模块,具体解释见下图:
    就是把读取器和写入器初始化,并且把水印 PDF 页先读取好备用,核心代码稍微比较难理解:
    加水印本质上就是把水印 PDF 页和需要加水印的每一页都合并一遍
    【如何使用Python 操作PDF?总结用Python操作PDF的几种方法】由于需要加水印的 PDF 可能有很多页,而水印 PDF 只有一页,因此如果直接把水印 PDF 拿来合并,可以抽象理解成加完第一页,水印 PDF 页就没有了 。
    以上就是小编给大家带来的Python操作PDF的几种方法,希望大家通过阅读小编的文章之后能够有所收获!如果大家觉得小编的文章不错的话,可以多多分享给有需要的人 。 

    猜你喜欢