Skip to content

PDF 转 TXT

概述

当需要从 PDF 文件中提取文本内容用于数据分析、文本挖掘或信息检索时,可以使用 PDF 转 TXT。

保留表格格式

使用 txt_table_format 可以在写入 TXT 文件时保留表格格式。

示例

ruby
options = ComPDFConversion::ConvertOptions.new
options.txt_table_format = true

result = ComPDFConversion::Conversion.start_pdf_to_txt(
  input_file_path,
  "",
  output_file_path,
  options
)