benchmark-report-template.md 697 Bytes

Benchmark Report Template

用于每次模型版本评测输出

一页结论

  • 模型版本:
  • 数据版本:
  • 核心结论:
  • 是否通过上线门禁:

1. 评测范围图

flowchart LR
    A[Model Version] --> B[Datasets]
    A --> C[Scenario Buckets]
    A --> D[Latency / Ops]

2. 指标表

Bucket top1 top5 MRR FAR Notes
clean
humming_like
confused

3. 文字分析

  • 最强项:
  • 最弱项:
  • 与上一版本对比:

4. 细节附录

  • 评测命令
  • 数据清单
  • 原始 JSON 报告路径

Sources

  • docs/industrial-benchmark-spec.md