Skip to content

PDF 转 TXT

概述

当需要将 PDF 文件中的文本内容提取出来,以便进行后续的数据分析、文本挖掘、信息检索等应用。使用 ComPDFKit Conversion SDK 可以轻松将 PDF 中的文本内容提取到 .txt 文件中。

设置保留表格样式

在 ComPDFKit Conversion SDK 中,支持保留表格样式txt_table_format,即在写入 Txt 文件时会按照原始的表格结构顺序写入。通常情况下我们都建议开启该选项,这对于数据提取的场景特别有用。

示例

以下是完整的示例代码,演示了如何将 PDF 文档转换为 .txt 文件。

c++
ConvertOptions opt;
CPDFConversion::StartPDFToTxt("txt.pdf", "password", "path/output.txt", opt);