第一个请求:同步抽取
本示例使用同步接口 /v2/process/idp/documentExtract,上传一份文件并通过 mode=vision 执行字段抽取。vision 是默认抽取模式,适合手写表单、扫描件和自由布局页面。vision 与 layout 模式都使用 extract_fields 传入单个固定 schema;如需版面抽取,只需显式传 mode=layout。
请求示例
bash
curl --location --request POST 'https://api-server.compdf.com/server/v2/process/idp/documentExtract' \
--header 'x-api-key: <your-public-key>' \
--form 'file=@/path/to/handwriting.pdf' \
--form 'mode=vision' \
--form 'extract_fields={"name":"Form","keys":{"姓名":{"prompt":"申请人姓名","mapping":null}},"tableHeaders":{}}'参数说明
| 参数 | 必填 | 说明 |
|---|---|---|
file | 是 | 上传的 PDF、图片或 Office 文档 |
mode | 否 | layout 或 vision,不传默认 vision |
extract_fields | 是 | 单个 schema 的 JSON 字符串;vision 与 layout 模式均使用此字段,为空 schema 时触发 AI 字段自动抽取 |
enable_grounding | 否 | 是否返回 bbox 溯源信息,默认 true,只有 layout 模式才需要传入该字段 |
响应结果
同步接口成功后返回结果文件信息,核心字段包括:
| 字段 | 说明 |
|---|---|
code / msg | 业务状态码与消息 |
data.taskId | 本次任务 ID |
data.downloadUrl | 结果文件下载地址 |
data.fileParameter | 本次提交的参数快照 |
如需处理大文件或批量任务,建议改用 异步请求方式。