Linux环境下安装将html转化为pdf的工具wkhtmltopdf,并使用Java调用。
为什么使用WKHtmlToPdf:
https://blog.csdn.net/qq_34190023/article/details/82999702
这篇文章有详细的介绍。
技术特点:
Wkhtmltopdf可直接把浏览器中浏览的网页转换成一个pdf,他是一个把html页面转换成pdf的软件(需要安装在服务器上)。使用时可通过java代码调用cmd指令完成网页转换为pdf的功能。
优点:
支持中文、图片、CSS等
缺点:
有时对于html文件的转化可能比较慢,对于url的转化速度较快。存在失真情况。
安装:
一、下载
打开官网:https://github.com/wkhtmltopdf/packaging/releases/0.12.1.4-2/
根据Comments的提示,选择适合自己的版本。
二、Linux下的使用
无需任何安装,现在可以开始直接使用了。
1、先将刚才下载的包解压:tar -xvf wkhtmltox-0.12.4_linux-generic-amd64.tar.xz
2、然后运行/data/wkhtmltox/bin/wkhtmltopdf www.baidu.com pdf.pdf
(前面的目录/data,大家根据自己的解压路径定)
运行成功!
3、将wkhtmltopdf拷入执行目录下:cp /data/wkhtmltox/bin/wkhtmltopdf /usr/local/bin/wkhtmltopdf
这样就不用敲一长串路径了,比如:wkhtmltopdf www.baidu.com pdf.pdf
提示:这个工具包中有两个组件,还有一个wkhtmltoimage可以把HTML转成IMG。
wkhtmltoimage下载:
wget https://github.com/wkhtmltopdf/wkhtmltopdf/releases/download/0.12.4/wkhtmltox-0.12.4_linux-generic-amd64.tar.xz
三、解决中文乱码问题
1、创建字库目录,把相应字库文件复制到该目录
[root@updev1 ~]# cd /usr/share/fonts
[root@updev1 fonts]# mkdir chinese
把 将 windows下的字体,例如 c:\WINDOWS\Fonts\simsun.ttf 文件复制到该目录
2、生成字库索引信息
[root@updev1 fonts]# cd chinese
[root@updev1 chinese]# mkfontscale
[root@updev1 chinese]# mkfontdir
[root@updev1 chinese]# ll
total 10264
-rw-r–r-- 1 root root 189 Sep 6 17:46 fonts.dir
-rw-r–r-- 1 root root 189 Sep 6 17:46 fonts.scale
-rw-r–r-- 1 root root 10499104 Sep 6 17:46 simsun.ttf
注:生成相应的 fonts.scale 和 fonts.dir 文件
3、查看是否已经安装成功
[root@updev1 chinese]# fc-list :lang=zh
AR PL UMing TW:style=Light
AR PL UMing HK:style=Light
AR PL UMing CN:style=Light
SimSun,宋体:style=Regular
AR PL UKai TW MBE:style=Book
AR PL UKai CN:style=Book
AR PL UKai HK:style=Book
AR PL UKai TW:style=Book
WenQuanYi Zen Hei,文泉驛正黑,文泉驿正黑:style=Regular
WenQuanYi Zen Hei Mono,文泉驛等寬正黑,文泉驿等宽正黑:style=Regular
AR PL UMing TW MBE:style=Light
WenQuanYi Zen Hei Sharp,文泉驛點陣正黑,文泉驿点阵正黑:style=Regular
注:结果列表可见(红色字体),宋体字库已经安装成功
四、开发调用
程序中如何使用wkhtmltopdf呢?
package com.hessianhealth.system.utils.wkhtmltopdfUtils;
import java.io.File;
/**
* 目前只支持 Linux上测试
* Created by root on 2020/11/12.
*/
public class HtmlToPdf {
// wkhtmltopdf在系统中的路径
private static String toPdfcmd = "wkhtmltopdf-amd64";
/**
* html转pdf
*
* @param srcPath
* html路径,可以是硬盘上的路径,也可以是网络路径
* @param destPath
* pdf保存路径
* @return 转换成功返回true
*/
public static boolean convert(String srcPath, String destPath) {
System.out.println("--------html转pdf start----------");
File file = new File(destPath);
File parent = file.getParentFile();
// 如果pdf保存路径不存在,则创建路径
if (!parent.exists()) {
parent.mkdirs();
}
StringBuilder cmd = new StringBuilder();
cmd.append(toPdfcmd);
cmd.append(" ");
cmd.append(" --page-size A3 ");//默认的页面尺寸是 A4 指定你想要的页面尺寸,如:A3,Letter 和 Legal等
// wkhtmltopdf-amd64 --page-size A3 iversion.html iversion.pdf
/* cmd.append(" --header-line");// 页眉下面的线
cmd.append(" --header-center 这里是页眉这里是页眉这里是页眉这里是页眉 ");//页眉中间内容
cmd.append(" --margin-top 3cm ");// 设置页面上边距 (default 10mm)
//cmd.append(" --header-html file:///" + "https://blog.csdn.net/x6582026/article/details/53835835");// (添加一个HTML页眉,后面是网址)
cmd.append(" --header-spacing 5 ");// (设置页眉和内容的距离,默认0)
cmd.append(" --footer-center 第[page]页/共[topage]页");//设置在中心位置的页脚内容
//cmd.append(" --footer-html file:///" + "https://blog.csdn.net/x6582026/article/details/53835835");// (添加一个HTML页脚,后面是网址)
cmd.append(" --footer-line");// * 显示一条线在页脚内容上)
cmd.append(" --footer-spacing 5 ");// (设置页脚和内容的距离)*/
cmd.append(srcPath);
cmd.append(" ");
cmd.append(destPath);
System.out.println("--------html转pdf cmd----------"+cmd.toString());
boolean result = true;
try {
Process proc = Runtime.getRuntime().exec(cmd.toString());
HtmlToPdfInterceptor error = new HtmlToPdfInterceptor(proc.getErrorStream());
HtmlToPdfInterceptor output = new HtmlToPdfInterceptor(proc.getInputStream());
error.start();
output.start();
proc.waitFor();
} catch (Exception e) {
result = false;
e.printStackTrace();
}
return result;
}
public static void main(String[] args) {
}
}