Linux下Word转PDF乱码问题分析与解决方案

发布时间：2026-06-18 作者：周强阅读量：24

一、问题背景与常见场景

在Linux服务器或桌面环境中，用户经常需要将Word文档（.doc或.docx格式）转换为PDF格式以便于分发或归档。然而，这一过程中容易遇到中文字符显示为乱码、符号缺失或排版错乱等问题，严重影响文档的可读性和专业性。

首先确保系统安装了必要的中文字体。可以通过以下命令安装常用字体包：

sudo apt-get install fonts-wqy-microhei fonts-wqy-zenhei  # Debian/Ubuntu
sudo yum install wqy-microhei-fonts wqy-zenhei-fonts  # CentOS/RHEL

对于特定字体（如微软字体），可手动下载并放入/usr/share/fonts目录，然后运行fc-cache -fv刷新字体缓存。

LibreOffice提供强大的命令行转换功能，推荐使用以下命令：

libreoffice --headless --convert-to pdf --outdir /输出目录 /输入文件.docx

如遇乱码，可尝试在转换前设置语言环境：

export LANG=zh_CN.UTF-8
libreoffice --headless --convert-to pdf --outdir /output /input.docx

对于基于CUPS的打印系统，可修改/etc/cups/printers.conf或用户级配置，确保默认使用支持中文的字体。同时检查/etc/fonts/fonts.conf中的字体渲染设置。

若问题依旧，可尝试：

使用file命令检查Word文件编码，若非UTF-8，可使用iconv转换：

file -i input.docx
iconv -f GBK -t UTF-8 input.docx > input_utf8.docx

Linux下Word转PDF乱码问题主要源于字体与编码兼容性，通过系统字体配置、优化转换命令、多工具对比使用等方法可有效解决。掌握这些技巧能大幅提升Linux环境下文档处理的效率与质量。