PDF 转可搜索PDF
概述
通过使用 OCR 向基于图像的 PDF(例如扫描的文档)添加文本和图片来制作可搜索的 PDF。
设置透明文本层
当输出可搜索 PDF 时,可以通过以下选项控制隐藏文本层:
transparentText:是否输出透明文本层。
示例
以下是完整的示例代码,演示了如何将 PDF 文档转换为可搜索 PDF 文件。
java
LibraryManager.setDocumentAIModel("path/model");
SearchablePdfOptions opt = new SearchablePdfOptions();
opt.setEnableOcr(true);
opt.setOcrLanguages(Arrays.asList(
OCRLanguage.ENGLISH
));
CPDFConversion.startPDFToSearchablePdf("scan.pdf", "password", "path/output.pdf", opt);