支持的文件格式
ComPDF AI 文档解析与抽取接口支持以下文件格式:
Office 文档
| 格式 | 扩展名 |
|---|---|
| Word | .doc, .docx |
| Excel | .xls, .xlsx |
| PowerPoint | .ppt, .pptx |
图片
| 格式 | 扩展名 |
|---|---|
| PNG | .png |
| JPEG | .jpg, .jpeg |
| GIF | .gif |
| BMP | .bmp |
| TIFF | .tiff, .tif |
| WebP | .webp |
文本与标记
| 格式 | 扩展名 |
|---|---|
| CSV | .csv |
| 纯文本 | .txt |
| RTF | .rtf |
| HTML | .html, .htm |
| MHTML | .mhtml, .mht |
建议
- 扫描件或图片建议开启 OCR 相关参数。
- 如果文档页数多、结构固定,优先使用
mode=layout。 - 如果包含手写内容或自由布局页面,可尝试
mode=vision。 - 如果文件较大,优先选择异步或预签名请求方式。
- 如果 API 返回
06001错误,说明页数额度已用完,需要购买页数套餐包。