Skip to content

第一个请求:同步抽取

本示例使用同步接口 /v2/process/idp/documentExtract,上传一份文件并通过 mode=vision 执行字段抽取。vision 是默认抽取模式,适合手写表单、扫描件和自由布局页面。visionlayout 模式都使用 extract_fields 传入单个固定 schema;如需版面抽取,只需显式传 mode=layout

请求示例

bash
curl --location --request POST 'https://api-server.compdf.com/server/v2/process/idp/documentExtract' \
  --header 'x-api-key: <your-public-key>' \
  --form 'file=@/path/to/handwriting.pdf' \
  --form 'mode=vision' \
  --form 'extract_fields={"name":"Form","keys":{"姓名":{"prompt":"申请人姓名","mapping":null}},"tableHeaders":{}}'

参数说明

参数必填说明
file上传的 PDF、图片或 Office 文档
modelayoutvision,不传默认 vision
extract_fields单个 schema 的 JSON 字符串;visionlayout 模式均使用此字段,为空 schema 时触发 AI 字段自动抽取
enable_grounding是否返回 bbox 溯源信息,默认 true,只有 layout 模式才需要传入该字段

响应结果

同步接口成功后返回结果文件信息,核心字段包括:

字段说明
code / msg业务状态码与消息
data.taskId本次任务 ID
data.downloadUrl结果文件下载地址
data.fileParameter本次提交的参数快照

如需处理大文件或批量任务,建议改用 异步请求方式