current-capability-map.md
2.59 KB
Current Capability Map / 当前能力地图
更新:2026-06-02
一页结论
当前项目有三类能力:
- 已完整闭环
- 已打通但仍是 smoke 级
- 仍待真实数据/更大规模验证
1. 能力状态表
| 能力 | 当前状态 | 说明 |
|---|---|---|
| synthetic 数据生成 | 已完成 | 可稳定生成合成训练/评测数据 |
| synthetic 训练 | 已完成 |
train.py 可跑通 |
| synthetic 建索引 | 已完成 |
run_demo.py build-index 可跑通 |
| synthetic 评测 | 已完成 |
evaluate.py 可输出 JSON |
| synthetic 发布制品 | 已完成 | 可生成 benchmark/model-card/checklist |
| 开放数据 inspect | 已完成 |
inspect-local / inspect-batch
|
| 开放数据 prepare | 已完成 | prepare-local |
| 开放数据 validate | 已完成 | validate-local |
| 开放数据训练 smoke | 已完成 | 已在 stand-in 数据上验证 |
| 开放数据索引 smoke | 已完成 | 已在 stand-in 数据上验证 |
| 开放数据评测 smoke | 已完成 | 已在 stand-in 数据上验证 |
| 开放数据发布制品 smoke | 已完成 | 已在 stand-in 数据上验证 |
| 一键 smoke-local | 已完成 | inspect→prepare→validate→train→index→eval→artifacts |
| 真实 FMA 本地目录 smoke | 待外部数据 | 代码已就绪,缺真实音频目录 |
| 真实 MTG-Jamendo 本地目录 smoke | 待外部数据 | 代码已就绪,缺真实音频目录 |
| hard-case 精度优化 | 进行中 | confused / humming_like 仍需持续优化 |
| foundation model baseline | 未完成 | 仅完成文档研究与路线规划 |
| 工业级生产部署 | 未完成 | 服务骨架已在,生产治理未完成 |
2. 最短路径图
flowchart LR
A[Local Audio Dir] --> B[inspect-local]
B --> C[prepare-local]
C --> D[validate-local]
D --> E[train]
E --> F[build-index]
F --> G[evaluate]
G --> H[generate_artifacts]
3. 当前最可靠入口
- docs/open-dataset-workflow.md
- docs/session-handoff.md
- acr-engine/FIRST_RUN_CHECKLIST.md
- acr-engine/scripts/status_snapshot.py
4. 当前最重要缺口
- 真实 FMA 本地音频未落地
- 真实 MTG-Jamendo 本地音频未落地
- hard-case 在真实数据上的表现未知
- foundation model baseline 还未开始实现
- 服务与部署仍偏原型级