PDF 转可搜索PDF
概述
通过使用 OCR 向基于图像的 PDF(例如扫描的文档)添加文本和图片来制作可搜索的 PDF。
设置透明文本层
当输出可搜索 PDF 时,可以通过以下选项控制隐藏文本层:
transparent_text:是否输出透明文本层。
示例
以下是完整的示例代码,演示了如何将 PDF 文档转换为可搜索 PDF 文件。
c++
LibraryManager::SetDocumentAIModel("path/documentai_v4.model");
ConvertOptions opt;
opt.enable_ocr = true;
opt.languages = {OCRLanguage::e_Chinese};
opt.transparent_text = true;
CPDFConversion::StartPDFToSearchablePdf("scan.pdf", "password", "path/output.pdf", opt);