Python实现Excel到PDF的高效转换：完整指南与代码示例

发布时间：2026-06-21 作者：邹海阅读量：15

引言

在数据分析和办公自动化中，将Excel报表转换为PDF格式是一种常见需求。PDF文件便于分享、打印，且能保持格式统一。Python凭借其丰富的库和灵活性，成为实现这一转换的理想工具。本文将逐步指导您如何使用Python完成Excel到PDF的转换。

准备工作

在开始之前，请确保已安装Python环境。您需要安装以下库：

openpyxl：用于读取和操作Excel文件（.xlsx格式）。
pandas：提供数据处理和分析功能。
pdfkit：将HTML内容转换为PDF，常与Excel数据结合使用。
reportlab：直接生成PDF文件，适合复杂布局。

安装命令：

pip install openpyxl pandas pdfkit reportlab

方法一：使用openpyxl和reportlab

这种方法直接操作Excel数据并生成PDF，适用于需要精细控制布局的场景。

步骤1：读取Excel文件

使用openpyxl加载Excel工作簿，并提取数据。

import openpyxl

wb = openpyxl.load_workbook('data.xlsx')
ws = wb.active

data = []
for row in ws.iter_rows(values_only=True):
    data.append(row)

步骤2：生成PDF文件

使用reportlab创建PDF，并写入数据。

from reportlab.lib import colors
from reportlab.lib.pagesizes import letter
from reportlab.lib.units import inch
from reportlab.platypus import SimpleDocTemplate, Table, TableStyle

doc = SimpleDocTemplate('output.pdf', pagesize=letter)
elements = []

# 创建表格
table = Table(data)
table.setStyle(TableStyle([
    ('BACKGROUND', (0, 0), (-1, 0), colors.grey),
    ('TEXTCOLOR', (0, 0), (-1, 0), colors.whitesmoke),
    ('ALIGN', (0, 0), (-1, -1), 'CENTER'),
    ('FONTNAME', (0, 0), (-1, 0), 'Helvetica-Bold'),
    ('FONTSIZE', (0, 0), (-1, 0), 14),
    ('BOTTOMPADDING', (0, 0), (-1, 0), 12),
    ('BACKGROUND', (0, 1), (-1, -1), colors.beige),
    ('GRID', (0, 0), (-1, -1), 1, colors.black),
]))

elements.append(table)
doc.build(elements)

方法二：使用pandas和pdfkit

这种方法将Excel数据转换为HTML，再通过pdfkit转为PDF，适合快速生成简单报告。

步骤1：用pandas读取Excel

import pandas as pd

df = pd.read_excel('data.xlsx')

步骤2：转换为HTML并生成PDF

import pdfkit

html = df.to_html()
with open('temp.html', 'w') as f:
    f.write(html)

pdfkit.from_file('temp.html', 'output.pdf')

优化与注意事项

在实际应用中，您可能遇到一些问题，以下是一些优化建议：

性能优化：对于大型Excel文件，建议使用分块处理或异步读取，避免内存溢出。
格式保留：如果Excel包含图表或复杂格式，可以考虑使用xlrd库结合matplotlib生成图表，再嵌入PDF。
跨平台兼容：pdfkit依赖wkhtmltopdf工具，请确保系统已安装。可从官网下载。

总结

Python提供了多种将Excel转换为PDF的方法，开发者可以根据需求选择合适方案。通过自动化转换，您可以节省时间，减少手动操作错误，并生成专业美观的报告。随着Python生态的发展，更多高效工具将持续涌现，助力数据工作流的优化。