Skip to content

PDF 转 HTML

概述

ComPDF Conversion SDK 提供了 PDF 转 HTML 的功能,可以将 PDF 文件转换为 HTML 文件,同时保持原始文档的内容布局和格式,可供用户在浏览器中对文档进行搜索和浏览。

注意

当将 PDF 转换为 HTML 格式时,ComPDF Conversion SDK 提供以下四种选项来生成 HTML 文件:

选项描述
HtmlSinglePage将整个 PDF 文件转换为单个 HTML 文件,所有 PDF 页面按页码先后顺序首尾相连,展示在同一 HTML 页面中。
HtmlSinglePageWithBookmark将 PDF 文件转换为单个 HTML 文件,所有 PDF 页面内容均在同一页面,且页面内容连续。同时,该选项会在 HTML 页面中添加一个书签导航栏,用于快速定位到指定页面。
HtmlMultiPage将 PDF 文件转换为多个 HTML 文件。每个 HTML 文件对应一个 PDF 页面,可通过页面下方链接跳转到下一页面。
HtmlMultiPageWithBookmark将 PDF 文件转换为多个 HTML 文件,每个 HTML 文件对应一个 PDF 页面。所有 HTML 页面会有一个大纲 HTML 页面进行导航,点击大纲可跳转到对应的 HTML 页面。

示例

以下是完整的示例代码,演示了如何将 PDF 文档转换为 HTML 文档。

go
inputFilePath := "***"
password := "***"
outputFileName := "***"

htmlOptions := compdf.NewHtmlOptions()
err := compdf.StartPDFToHtml(inputFilePath, password, outputFileName, htmlOptions, nil)