PDF 转可搜索 PDF
概述
可搜索 PDF 转换会通过 OCR 为扫描件等基于图片的 PDF 添加隐藏文本层,使文档内容可以搜索和复制。
设置透明文本层
使用 transparent_text 控制文本层是否透明。
示例
ruby
ComPDFConversion::LibraryManager.set_document_ai_model("/path/to/documentai.model", -1)
options = ComPDFConversion::ConvertOptions.new
options.enable_ocr = true
options.transparent_text = true
options.languages = [ComPDFConversion::OCRLanguage::ENGLISH]
result = ComPDFConversion::Conversion.start_pdf_to_searchable_pdf(
input_file_path,
"",
output_file_path,
options
)