Skip to content

PDF 转可搜索PDF

概述

通过使用 OCR 向基于图像的 PDF(例如扫描的文档)添加文本和图片来制作可搜索的 PDF。

设置透明文本层

当输出可搜索 PDF 时,可以通过以下选项控制隐藏文本层:

  • transparent_text:是否输出透明文本层。

示例

以下是完整的示例代码,演示了如何将 PDF 文档转换为可搜索 PDF 文件。

c++
LibraryManager::SetDocumentAIModel("path/documentai_v4.model");

ConvertOptions opt;
opt.enable_ocr = true;
opt.languages = {OCRLanguage::e_Chinese};
opt.transparent_text = true;
CPDFConversion::StartPDFToSearchablePdf("scan.pdf", "password", "path/output.pdf", opt);