Skip to content

ComPDF AI 概览

ComPDF AI 是一组面向智能文档处理(IDP) 的能力,统一通过 /v2/process/idp/* 系列接口对外提供。本指南覆盖 AI 部分的概念、调用方式以及常用配置;如果你正在寻找完整的请求 / 响应字段说明,请直接查看每个接口对应的 API Reference

能力矩阵

能力路径用途
智能文档解析server/v2/process/idp/documentParsing解析文档版面、生成带 bbox 引用的 tagged Markdown / JSON 结果
智能文档抽取server/v2/process/idp/documentExtract从文档中抽取关键字段与表格信息,支持 layout / vision 两种模式

核心概念

  • 任务(Task):每次调用 documentExtractdocumentParsing 都会创建一个 task,并返回 taskId。同步模式直接返回结果;异步与预签名模式需要轮询任务状态获取结果。
  • 抽取 schema:描述你想抽取的字段与表格结构。layoutvision 模式均通过 extract_fields 传入单个固定 schema。详见 文档抽取指南
  • bbox grounding:可以返回每个结果在原文中的位置(page + bbox),便于结果溯源与高亮回显。适用于解析功能和抽取功能的 layout 模式。

推荐学习路径

  1. 准备工作 — 拿到 API Key 并完成认证。
  2. 第一个请求 — 用同步抽取跑通最小可用流程。
  3. 请求方式 — 根据文件大小、安全性需求选择同步 / 异步 / 预签名。
  4. 文档解析指南 — 调优解析行为,掌握返回 JSON 的结构。
  5. 文档抽取指南 — 选择 layout / vision 模式,编写并导出抽取 schema。
  6. 常见问题与计费 — 错误码、配额与计费规则。