benchmark-report-template.md
697 Bytes
Benchmark Report Template
用于每次模型版本评测输出
一页结论
- 模型版本:
- 数据版本:
- 核心结论:
- 是否通过上线门禁:
1. 评测范围图
flowchart LR
A[Model Version] --> B[Datasets]
A --> C[Scenario Buckets]
A --> D[Latency / Ops]
2. 指标表
| Bucket | top1 | top5 | MRR | FAR | Notes |
|---|---|---|---|---|---|
| clean | |||||
| humming_like | |||||
| confused |
3. 文字分析
- 最强项:
- 最弱项:
- 与上一版本对比:
4. 细节附录
- 评测命令
- 数据清单
- 原始 JSON 报告路径
Sources
docs/industrial-benchmark-spec.md