处理指标说明
metrics 主要用于解释“这一页是怎样被处理出来的”。它对线上排障、质量监控和性能分析都很有帮助。
常见指标
不同文档和处理链路返回的指标可能略有差异,但常见字段通常包括:
| 字段 | 说明 |
|---|---|
page | 页码 |
dpi | 处理时使用或识别出的分辨率 |
angle | 页面倾斜或校正角度 |
duration / cost_time | 该页处理耗时 |
width / height | 页面图像尺寸 |
status | 当前页处理状态 |
这些指标有什么用
dpi太低时,OCR 质量通常会下降angle不为0时,说明页面发生了旋转校正duration偏高时,通常意味着该页内容复杂、图片多或表格密集status异常时,可快速定位具体失败页
建议如何使用
- 做质量分析时,把
metrics与result.pages一起看 - 做性能监控时,按页聚合
duration - 做失败重试时,优先记录异常页码和对应
x_request_id
排障建议
- 若个别页文本质量明显差,先看
dpi和angle - 若整份文档处理慢,检查是否存在超大图片页或复杂表格页
- 若只在某几页失败,可结合 页级结构说明 查看对应页面内容类型