使用 Python 3 合并 PDF 文件的代码

使用 Python 3 合并 PDF 文件的代码可以使用 Pypdf2 库。PyPDF2 是一个 python 库,用于处理 PDF 文件的内容和格式。要使用此库,请确保已安装:


```bash

Pip install PyPDF2

```


以下是一个使用 PyPDF2 合并 PDF 文件的简单示例:


```python

from PyPDF2 import PdfFileReader, PdfFileWriter


# 读取要合并的所有 PDF 文件

input_pdfs = []

with open('input_files.txt', 'r') as f:

    for line in f.readlines():

        file_path, _ = line.strip().split('\t')

        input_pdfs.APpend(os.path.join('input_files', file_path))


# 合并 PDF 文件

output_pdf = PdfFileWriter()

for pdf in input_pdfs:

    with open(pdf, 'rb') as f:

        reader = PdfFileReader(f)

        output_pdf.addPage(reader.getPage(0))


# 写入 PDF 文件

with open('output.pdf', 'wb') as f:

    output_pdf.write(f)

```


在这个示例中,我们首先读取要合并的 PDF 文件的路径。然后,我们创建一个 PdfFileWriter 对象,用于写入合并后的 PDF 文件。我们使用 for 循环遍历每个 PDF 文件,并将其转换为 PdfFileReader 对象。最后,我们将每个 PdfFileReader 对象添加到 PdfFileWriter 对象中,并将合并后的 PDF 文件写入指定的输出文件。


请注意,此示例仅适用于简单的合并。如果您需要处理更复杂的场景,例如加密或设置元数据,请查阅 PyPDF2 文档以了解更多信息。


相关阅读

  • emeditor 配置 可以编辑 hex 16进制文件

    emeditor 配置 可以编辑 hex 16进制文件

    EmEditor 本身支持通过插件/功能配置实现 Hex 编辑功能。 实现方法:使用 EmEditor 的 Hex 模式EmEditor 内置了 Hex 编辑功能,无需安装第三方插件,只需简单配置即可启用,以下是完整的操作步骤: 步骤...

    2026.02.03 20:59:22作者:wintopTags:emeditorhex
  • RTX 3060(12GB显存)总结 PDF内容的智能大模型架构方案

    RTX 3060(12GB显存)总结 PDF内容的智能大模型架构方案

    显卡:RTX 3060(12GB显存)功能需求:“PDF文本总结”。下面是最优、效率最高的模型,同时明确部署方式和调优技巧,让总结速度和效果达到最佳平衡。 核心结论:最优模型选择对你的场景来说,Qwen2.5-7B-Instruct(通义...

    2026.01.22 20:04:09作者:wintop
  • python 多线程任务(下载)水平扩展线程

    python 多线程任务(下载)水平扩展线程

    方案架构说明这个方案由两个主要组件构成:任务分发器 (TaskDistributor)从 MySQL 数据库中获取待下载的文件将下载任务放入 Redis 队列标记文件状态为 "处理中"工作节点 (DownloadWork...

    2025.06.08 22:01:56作者:wintopTags:python
  • Python库实现PDF转HTML方法,可以提取目录TOC

    Python库实现PDF转HTML方法,可以提取目录TOC

    在Python中,要识别PDF中的目录(Table of Contents, TOC),通常有两种场景:直接提取PDF内置的书签(Bookmarks):如果PDF本身带有目录书签(例如电子书、技术文档),可以直接提取。自动分析文本结构推断目...

    2025.03.31 22:14:54作者:wintopTags:pythonpdf
  • grok beta 模型转发php版本,测试通过

    grok beta 模型转发php版本,测试通过

    <?php // 禁用输出缓冲 while (ob_get_level()) {     ob_end_clean(); } ob_implicit_fl...

    2024.11.26 20:32:33作者:wintop
  • FastAdmin如何在表单提交验证时不验证隐藏的元素

    FastAdmin如何在表单提交验证时不验证隐藏的元素

    在FastAdmin中使用的是nice-validator验证器,默认是验证表单中所有添加有验证规则的元素。如何在表单提交时不验证隐藏的元素呢?在nice-validator的选项中有一个ignore的选项。我们配置该值即可。首先打开控制器...

    2024.03.13 13:50:21作者:wintopTags:FastAdmin表单
  • php远程开机,远程唤醒(Wake-on-LAN)局域网电脑代码

    php远程开机,远程唤醒(Wake-on-LAN)局域网电脑代码

    首先要局域网电脑IP为固定IP,这样可以减少获取IP地址的步骤。要使用 PHP 来实现局域网中的远程唤醒(Wake-on-LAN),您可以通过以下步骤来完成:首先,确保您的服务器上已安装 PHP,并且具备发送网络数据包的权限。获取目标计算机...

    2024.03.10 11:33:33作者:wintopTags:php远程唤醒Wake-on-LAN局域网
  • Mysql 联合查询 主表和详细表查询方案

    Mysql 联合查询 主表和详细表查询方案

    mysql 多表联合查询示例:表aindex 为主表:CREATE TABLE `aindex` (  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,  `name` cha...

    2024.02.02 17:41:12作者:wintop

添加新评论