Skip to content
ComPDF

介绍

本章节介绍目前 ComPDF AI 相关功能接口的介绍

ComPDF AI的优势

  • 24个标签检测: 基于AI训练,我们的算法能够使用24个标签识别和分类页面元素。
  • 保留原始逻辑: 我们强大的排序算法可以保留原始的阅读结构和逻辑。
  • 分析和解析数据: 智能解析和分析数据供下游应用,如自动生成报告或接入问答系统。
  • 支持GPU和CPU: 支持私有化部署ComPDF AI,并利用GPU和CPU加速文档处理。

智能文档抽取 - sync

提取文档中关键信息字段和表格信息。支持的文件格式:PDF,JPG,JPEG,PNG。

请求方式:

  • 请求方式:POST。
  • 传参方式:Body (form-data)。

请求地址:

js
http://lcoalhost:7000/api/idp/data-extract-api

请求头参数:

参数名数据类型描述是否必填
API_KEYStringLicense Key

请求Body参数:

参数名数据类型描述是否必填
fileFile源文档。
keysarray[string]关键信息字段。
tableHandlesarray[string]表头字段。
keysDescribearray[string]关键信息字段附加描述,和keys中元素下标一一对应,没有的描述填充""空字符串。
tableHandlesDescribearray[string]表头字段附加描述,和tableHandles中元素下标一一对应,没有的描述填充""空字符串。

keystableHandles 都不存在时,提取文件中所有关键信息。

JSON内容解释

返回参数数据类型描述
codeInt错误码,200 代表成功
messageString错误信息
dataObject返回结果
+detailsObject关键信息提取结果
++pagesObject当前页码,Page-Index
+++keyString关键信息字段提取结果,key:value
+++tablesArray关键信息表格提取结果,tables:[ [table1], [table2] ]

JSON结构示例:

json
{
    "code": 200,
    "msg": "success",
    "data": {
        "details": {
            "Page-1": {
                "Invoice Number": "202401291234567890",
                "Invoice Date": "01/29/2024",
                "Zip Code": "92868",
                "Company Name": "PDF Technologies, Inc.",
                "Tax": "5%",
                "Total Excluding Tax": "$ 20.40",
                "Total": "$ 428.40",
                "tables": [
                    [
                        {
                            "Num": "1",
                            "Products": "ComPDFKit API",
                            "Payment Cycle": "Package Payments",
                            "Gear Level": "5000",
                            "Price": "$ 408.00"
                        }
                    ]
                ]
            }
        }
    }
}

智能文档解析 - sync

解析文档结构,输出结构化Json数据。支持的文件格式:PDF,JPG,JPEG,PNG。

请求方式:

  • 请求方式:POST。
  • 传参方式:Body (form-data)。

请求地址:

js
http://lcoalhost:7000/api/idp/api-file-resolve-api

请求头参数:

参数名数据类型描述是否必填
API_KEYStringLicense Key

请求Body参数:

参数名数据类型描述是否必填
fileFile源文档。

JSON内容解释

返回参数数据类型描述
codeInt错误码,200 代表成功
messageString错误信息
dataObject返回结果
+fileIdStringFile ID
+downFileUrlString文档解析结果URL。

响应结果结构示例:

json
{
    "code": 200,
    "message": "success",
    "data": {
        "fileId": "42b3f995dd890ba9533d1bdcbb4c7246",
        "downFileUrl": "http://localhost:7000/api/idp/get-file?path=%2FComPDF AI%2Fserver%2Fout_tmp%2F979796629%2FTEST%282%29_ComPDF AI_batch_parse.zip"
    }
}

文件解析标签详情见: ComPDF AI智能文档解析字段介绍