Skip to content

PDF 转 TXT

概述

当需要将 PDF 文件中的文本内容提取出来,以便进行后续的数据分析、文本挖掘、信息检索等应用。使用 ComPDFKit Conversion SDK 可以轻松将 PDF 中的文本内容提取到 .txt 文件中。

注意事项

  • PDF 中旋转的文字会被忽略。

示例

以下是完整的示例代码,演示了如何将 PDF 文档转换为 .txt 文件。

objective-c
// 获取 PDF 文件的路径。
NSString *pdfPath = @"...";
// 获取 TXT 文件的路径。
NSString *outputPath = @"...";

CPDFConvertTxtOptions * options = [[CPDFConvertTxtOptions alloc] init];
[options setIsAllowOCR:YES];
[options setLanguage:COCRLanguageEnglish];

CPDFConverterTxt *converter = [[CPDFConverterTxt alloc] initWithURL:[NSURL fileURLWithPath:pdfPath] password:nil];
[converter convertToFilePath:outputPath pageIndexs:nil options:options];