PDF 转 HTML
概述
ComPDF Conversion SDK 提供了 PDF 转 HTML 的功能,可以将 PDF 文件转换为 HTML 文件,同时保持原始文档的内容布局和格式,可供用户在浏览器中对文档进行搜索和浏览。
注意
当将 PDF 转换为 HTML 格式时,ComPDF Conversion SDK 提供以下四种选项来生成 HTML 文件:
| 选项 | 描述 |
|---|---|
HtmlPageOption.SINGLE_PAGE | 将整个 PDF 文件转换为单个 HTML 文件,所有 PDF 页面按页码先后顺序首尾相连,展示在同一 HTML 页面中。 |
HtmlPageOption.SINGLE_PAGE_WITH_BOOKMARK | 将 PDF 文件转换为单个 HTML 文件,所有 PDF 页面内容均在同一页面,且页面内容连续。同时,该选项会在 HTML 页面中添加一个书签导航栏,用于快速定位到指定页面。 |
HtmlPageOption.MULTIPLE_PAGE | 将 PDF 文件转换为多个 HTML 文件。每个 HTML 文件对应一个 PDF 页面,可通过页面下方链接跳转到下一页面。 |
HtmlPageOption.MULTIPLE_PAGE_WITH_BOOKMARK | 将 PDF 文件转换为多个 HTML 文件,每个 HTML 文件对应一个 PDF 页面。所有 HTML 页面会有一个大纲 HTML 页面进行导航,点击大纲可跳转到对应的 HTML 页面。 |
示例
以下是完整的示例代码,演示了如何将 PDF 文档转换为 HTML 文档。
java
HtmlOptions opt = new HtmlOptions();
CPDFConversion.startPDFToHtml("html.pdf", "password", "path/output.html", opt);