Skip to content

PDF 转可搜索 PDF

概述

可搜索 PDF 转换会通过 OCR 为扫描件等基于图片的 PDF 添加隐藏文本层,使文档内容可以搜索和复制。

设置透明文本层

使用 transparent_text 控制文本层是否透明。

示例

ruby
ComPDFConversion::LibraryManager.set_document_ai_model("/path/to/documentai.model", -1)

options = ComPDFConversion::ConvertOptions.new
options.enable_ocr = true
options.transparent_text = true
options.languages = [ComPDFConversion::OCRLanguage::ENGLISH]

result = ComPDFConversion::Conversion.start_pdf_to_searchable_pdf(
  input_file_path,
  "",
  output_file_path,
  options
)