PDF 转 TXT:
概述
当需要将 PDF 文件中的文本内容提取出来,以便进行后续的数据分析、文本挖掘、信息检索等应用。使用 ComPDF Conversion SDK 可以轻松将 PDF 中的文本内容提取到 .txt 文件中。
设置保留表格样式
在 ComPDF Conversion SDK 中,支持保留表格样式 TxtTableFormat,即在写入 TXT 文件时会按照原始的表格结构顺序写入。通常情况下我们都建议开启该选项,这对于数据提取的场景特别有用。
示例
以下是完整的示例代码,演示了如何将 PDF 文档转换为 .txt 文件。
go
inputFilePath := "***"
password := "***"
outputFileName := "***"
txtOptions := compdf.NewTxtOptions()
err := compdf.StartPDFToTxt(inputFilePath, password, outputFileName, txtOptions, nil)