ComPDF AI 概览
ComPDF AI 是一组面向智能文档处理(IDP) 的能力,统一通过 /v2/process/idp/* 系列接口对外提供。本指南覆盖 AI 部分的概念、调用方式以及常用配置;如果你正在寻找完整的请求 / 响应字段说明,请直接查看每个接口对应的 API Reference。
能力矩阵
| 能力 | 路径 | 用途 |
|---|---|---|
| 智能文档解析 | server/v2/process/idp/documentParsing | 解析文档版面、生成带 bbox 引用的 tagged Markdown / JSON 结果 |
| 智能文档抽取 | server/v2/process/idp/documentExtract | 从文档中抽取关键字段与表格信息,支持 layout / vision 两种模式 |
核心概念
- 任务(Task):每次调用
documentExtract或documentParsing都会创建一个 task,并返回taskId。同步模式直接返回结果;异步与预签名模式需要轮询任务状态获取结果。 - 抽取 schema:描述你想抽取的字段与表格结构。
layout与vision模式均通过extract_fields传入单个固定 schema。详见 文档抽取指南。 - bbox grounding:可以返回每个结果在原文中的位置(page + bbox),便于结果溯源与高亮回显。适用于解析功能和抽取功能的
layout模式。