Python实现Excel到PDF的完美转换：从入门到精通

发布时间：2026-06-20 作者：宋佳阅读量：14

Python实现Excel到PDF的完美转换

在日常办公中，我们经常需要将Excel文件转换为PDF格式，以便于分享、存档或打印。手动转换虽然简单，但在处理大量文件时效率低下。Python作为一门强大的编程语言，提供了多种库和工具来实现Excel到PDF的自动化转换，大大提升工作效率。

为什么选择Python？

Python具有以下优势：

跨平台性：Python程序可以在Windows、macOS和Linux系统上运行
丰富的库支持：拥有众多处理Excel和PDF的成熟库
易于学习和使用：语法简洁清晰，适合快速开发
自动化能力：可以轻松实现批量处理和工作流自动化

常用库介绍

1. Excel处理库

openpyxl：适用于处理.xlsx格式的Excel文件，支持读取和写入

pandas：强大的数据分析库，可以轻松读取、处理和转换Excel数据

xlrd：用于读取.xls格式的Excel文件（传统格式）

2. PDF生成库

reportlab：功能强大的PDF生成库，支持复杂的布局和样式

fpdf：简单轻量级的PDF生成库，易于上手

pymupdf（也称为fitz）：高性能的PDF处理库，支持高质量渲染

实现方法详解

方法一：使用pandas和reportlab

这是最常用的方法之一，适合处理结构化的Excel数据。

import pandas as pd
from reportlab.lib import colors
from reportlab.lib.pagesizes import A4
from reportlab.platypus import SimpleDocTemplate, Table, TableStyle

def excel_to_pdf(excel_file, pdf_file):
    # 读取Excel文件
    df = pd.read_excel(excel_file)
    
    # 创建PDF文档
    doc = SimpleDocTemplate(pdf_file, pagesize=A4)
    elements = []
    
    # 将DataFrame转换为列表
    data = [df.columns.tolist()] + df.values.tolist()
    
    # 创建表格
    table = Table(data)
    
    # 设置表格样式
    style = TableStyle([
        ('BACKGROUND', (0, 0), (-1, 0), colors.grey),
        ('TEXTCOLOR', (0, 0), (-1, 0), colors.whitesmoke),
        ('ALIGN', (0, 0), (-1, -1), 'CENTER'),
        ('FONTNAME', (0, 0), (-1, 0), 'Helvetica-Bold'),
        ('FONTSIZE', (0, 0), (-1, 0), 12),
        ('BOTTOMPADDING', (0, 0), (-1, 0), 12),
        ('BACKGROUND', (0, 1), (-1, -1), colors.beige),
        ('GRID', (0, 0), (-1, -1), 1, colors.black)
    ])
    
    table.setStyle(style)
    elements.append(table)
    
    # 生成PDF
    doc.build(elements)
    print(f'PDF文件已生成: {pdf_file}')

# 使用示例
excel_to_pdf('data.xlsx', 'output.pdf')

方法二：使用openpyxl和pymupdf

这种方法更适合需要保持Excel原有格式和样式的场景。

import openpyxl
from openpyxl.styles import Font, Alignment
import fitz  # pymupdf

def excel_to_pdf_with_formatting(excel_file, pdf_file):
    # 打开Excel文件
    wb = openpyxl.load_workbook(excel_file)
    ws = wb.active
    
    # 创建PDF文档
    doc = fitz.open()
    
    # 创建页面
    page_width = 595  # A4宽度（点）
    page_height = 842  # A4高度（点）
    page = doc.new_page(width=page_width, height=page_height)
    
    # 定义字体
    font = fitz.Font("helv")
    
    # 写入数据
    y_position = 50
    for row in ws.iter_rows(values_only=True):
        x_position = 50
        for cell in row:
            if cell is not None:
                text = str(cell)
                # 写入文本
                page.insert_text((x_position, y_position), text, fontname="helv", fontsize=10)
            x_position += 100
        y_position += 20
    
    # 保存PDF
    doc.save(pdf_file)
    doc.close()
    print(f'格式化PDF已生成: {pdf_file}')

# 使用示例
excel_to_pdf_with_formatting('data.xlsx', 'formatted_output.pdf')

高级技巧和优化

1. 批量处理多个Excel文件

import os
import glob

def batch_convert(excel_dir, output_dir):
    # 创建输出目录
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
    
    # 获取所有Excel文件
    excel_files = glob.glob(os.path.join(excel_dir, '*.xlsx'))
    
    for excel_file in excel_files:
        # 生成输出文件名
        base_name = os.path.basename(excel_file)
        pdf_name = os.path.splitext(base_name)[0] + '.pdf'
        pdf_path = os.path.join(output_dir, pdf_name)
        
        # 转换文件
        excel_to_pdf(excel_file, pdf_path)
        print(f'已转换: {excel_file} -> {pdf_path}')

# 使用示例
batch_convert('./excel_files', './pdf_files')

2. 处理大型Excel文件

对于大型Excel文件，建议使用分页处理：

使用pandas的chunksize参数分块读取
实现分页PDF生成
添加内存管理机制

3. 保持Excel样式

要保留Excel的原始样式（如字体、颜色、边框等），需要：

读取openpyxl中的样式信息
在PDF生成时应用对应的样式
处理合并单元格等复杂结构

常见问题和解决方案

1. 中文显示问题

解决方案：使用支持中文的字体文件

# 在reportlab中使用中文字体
from reportlab.pdfbase import pdfmetrics
from reportlab.pdfbase.ttfonts import TTFont

# 注册中文字体
pdfmetrics.registerFont(TTFont('SimSun', 'SimSun.ttf'))

# 在样式中使用
style = TableStyle([
    ('FONTNAME', (0, 0), (-1, -1), 'SimSun'),
    # 其他样式...
])

2. 大表格分页问题

解决方案：实现自动分页逻辑，当表格超过页面高度时自动创建新页面。

3. 图片和图表处理

对于包含图片或图表的Excel文件，需要：

提取图片对象
调整图片尺寸适应PDF页面
在正确的位置插入图片

性能对比和选择建议

方法	优点	缺点	适用场景
pandas + reportlab	简单易用，适合数据表格	格式保持一般	数据报表转换
openpyxl + pymupdf	格式保持较好，性能高	代码相对复杂	需要保持原格式的文件
LibreOffice + Python	完全保持格式，支持复杂文件	依赖外部软件	复杂Excel文件转换

实际应用案例

案例1：财务报表自动生成

某公司使用Python脚本每天自动生成PDF格式的财务报表，包括：

从多个Excel数据源合并数据
添加公司Logo和水印
生成带页眉页脚的专业PDF
自动发送到指定邮箱

案例2：销售数据可视化报告

将包含图表的Excel销售数据转换为PDF报告：

提取Excel中的图表对象
将图表转换为图片格式
在PDF中重新排版
添加分析和总结文字

未来发展趋势

随着Python生态的发展，Excel到PDF的转换工具将更加智能化：

AI辅助布局优化：自动识别最佳PDF布局
实时协作转换：支持云端实时转换和协作
更丰富的格式支持：支持更多Excel特性和PDF功能
性能进一步提升：处理更大文件和更快速度

总结

使用Python实现Excel到PDF的转换是一个实用且高效的解决方案。通过选择合适的库和方法，可以满足从简单数据表格到复杂格式文件的各种需求。关键要点：

根据具体需求选择合适的方法
注意处理中文等特殊字符
优化性能以处理大型文件
考虑扩展性以适应未来需求

随着办公自动化需求的不断增长，掌握Python Excel到PDF转换技能将成为开发者和办公人员的重要竞争力。通过本文的介绍和示例代码，相信读者能够快速上手并应用到实际工作中。