Skip to content

处理指标说明

metrics 主要用于解释“这一页是怎样被处理出来的”。它对线上排障、质量监控和性能分析都很有帮助。

常见指标

不同文档和处理链路返回的指标可能略有差异,但常见字段通常包括:

字段说明
page页码
dpi处理时使用或识别出的分辨率
angle页面倾斜或校正角度
duration / cost_time该页处理耗时
width / height页面图像尺寸
status当前页处理状态

这些指标有什么用

  • dpi 太低时,OCR 质量通常会下降
  • angle 不为 0 时,说明页面发生了旋转校正
  • duration 偏高时,通常意味着该页内容复杂、图片多或表格密集
  • status 异常时,可快速定位具体失败页

建议如何使用

  • 做质量分析时,把 metricsresult.pages 一起看
  • 做性能监控时,按页聚合 duration
  • 做失败重试时,优先记录异常页码和对应 x_request_id

排障建议

  • 若个别页文本质量明显差,先看 dpiangle
  • 若整份文档处理慢,检查是否存在超大图片页或复杂表格页
  • 若只在某几页失败,可结合 页级结构说明 查看对应页面内容类型