Skip to content

PDF 转 Word

概述

PDF 转 Word 是一种将 PDF 格式文件转换为可编辑的 Word 格式文件的操作。通过将 PDF 转换为 Word 文件,您可以轻松地编辑、修改文本、添加、删除文字或图片,轻松调整布局和格式等。

版面布局差异:

  • Word 文档的流式布局特性使得内容编辑变得灵活便捷,可以根据需要自由地在文档中流动和重新排列。然而,这种布局方式可能导致在不同设备或不同版本的 Word 程序中显示不一致,造成排版偏差。因此,流式布局特别适合于需要频繁更新内容的文件。
  • PDF 文件则以其固定的页面布局而著称,确保在任何设备上或打印时都能呈现一致且精确的外观。文件创建后,文字、图片和版面布局便被锁定,难以进行大规模编辑,从而保证了文件内容的稳定性。这使得 PDF 格式非常适合用于更正式的场合,如商务报告、电子官文、电子票据和电子证件等领域。

示例

以下是完整的示例代码,演示了将 PDF 文档转换为 docx 文档。

objective-c
// 获取 PDF 文件的路径。
NSString *pdfPath = @"...";
// 获取 Word 文件的路径。
NSString *outputPath = @"...";
CPDFConvertWordOptions *options = [[CPDFConvertWordOptions alloc] init];
// 设置 OCR 语言,只有当 IsAllowOCR 为 true 时才会生效。
[options setIsAllowOCR:YES];
// 转换时是否包含图像,只有当 IsAllowOCR 为 false 时才会生效。
[options setIsContainImages:NO];
// 设置是否包含背景图片,只有当 IsAllowOCR 为 true 时才会生效。
[options setIsContainOCRBgImage:NO];
// 转档时是否包含注释。
[options setIsContainAnnotations:NO];
// PDF 转 Word 的参数对象(CPDFConvertOptions 的派生类)布局选项:CPDFConvertRetainPageLayout(该布局选项可根据布局将文本拆分为多个文本框,以保持与原始文件相同的布局)。
[options setLayoutOptions:CPDFConvertRetainPageLayout];
// OCR 语言为英语。
[options setLanguage:COCRLanguageEnglish];
CPDFConverterWord *converter = [[CPDFConverterWord alloc] initWithURL:[NSURL fileURLWithPath:pdfPath] password:nil];
[converter convertToFilePath:outputPath pageIndexs:nil options:options];