Commit 18ba8663 18ba8663fc9c2d5e8b96e97a658ddd8e55db2d85 by cnb.bofCdSsphPA

Clarify the project's true readiness before new development

Constraint: Ongoing Ralph-style handoff requires new sessions to distinguish finished capability from smoke-only scaffolding quickly
Rejected: Leave capability status implicit in scattered docs | Increases onboarding ambiguity and status misreads
Confidence: high
Scope-risk: narrow
Directive: Update this map whenever a smoke path becomes real-data validated or a regression invalidates a claimed capability
Tested: Verified docs/current-capability-map.md exists and is linked from docs/README.md and docs/session-handoff.md
Not-tested: Semantic accuracy against future real-dataset runs remains pending
1 parent ce726bf1
......@@ -221,6 +221,25 @@
- 新 session 现在可以直接读取最近一次状态快照文件
- 交接信息更适合自动化和长期持续开发
### Stage: 当前能力地图
完成项:
- 新增 [docs/current-capability-map.md](./current-capability-map.md)
- 明确区分:
- 已完整闭环
- 已打通但仍是 smoke 级
- 仍待真实数据/更大规模验证
- 将能力地图接入 docs 总入口与交接文档
验证结果:
- `docs/current-capability-map.md` 已创建
- `docs/README.md` 已挂接
- `docs/session-handoff.md` 已挂接
结论:
- 新 session 现在更容易快速判断“什么是真的完成了,什么还只是 smoke 级能力”
- 能显著减少误判项目状态的风险
### Stage: confused 定向优化 v6(sample-level weighting)
完成项:
......
......@@ -70,6 +70,7 @@ flowchart TD
### C. 服务与工程
- [服务接口](./service-api.md)
- [持续开发交接文档](./session-handoff.md)
- [当前能力地图](./current-capability-map.md)
- [首次启动检查清单](../acr-engine/FIRST_RUN_CHECKLIST.md)
- [更新记录](./CHANGELOG.md)
......
# Current Capability Map / 当前能力地图
> 更新:2026-06-02
## 一页结论
当前项目有三类能力:
1. **已完整闭环**
2. **已打通但仍是 smoke 级**
3. **仍待真实数据/更大规模验证**
---
## 1. 能力状态表
| 能力 | 当前状态 | 说明 |
|---|---|---|
| synthetic 数据生成 | 已完成 | 可稳定生成合成训练/评测数据 |
| synthetic 训练 | 已完成 | `train.py` 可跑通 |
| synthetic 建索引 | 已完成 | `run_demo.py build-index` 可跑通 |
| synthetic 评测 | 已完成 | `evaluate.py` 可输出 JSON |
| synthetic 发布制品 | 已完成 | 可生成 benchmark/model-card/checklist |
| 开放数据 inspect | 已完成 | `inspect-local` / `inspect-batch` |
| 开放数据 prepare | 已完成 | `prepare-local` |
| 开放数据 validate | 已完成 | `validate-local` |
| 开放数据训练 smoke | 已完成 | 已在 stand-in 数据上验证 |
| 开放数据索引 smoke | 已完成 | 已在 stand-in 数据上验证 |
| 开放数据评测 smoke | 已完成 | 已在 stand-in 数据上验证 |
| 开放数据发布制品 smoke | 已完成 | 已在 stand-in 数据上验证 |
| 一键 smoke-local | 已完成 | inspect→prepare→validate→train→index→eval→artifacts |
| 真实 FMA 本地目录 smoke | 待外部数据 | 代码已就绪,缺真实音频目录 |
| 真实 MTG-Jamendo 本地目录 smoke | 待外部数据 | 代码已就绪,缺真实音频目录 |
| hard-case 精度优化 | 进行中 | confused / humming_like 仍需持续优化 |
| foundation model baseline | 未完成 | 仅完成文档研究与路线规划 |
| 工业级生产部署 | 未完成 | 服务骨架已在,生产治理未完成 |
---
## 2. 最短路径图
```mermaid
flowchart LR
A[Local Audio Dir] --> B[inspect-local]
B --> C[prepare-local]
C --> D[validate-local]
D --> E[train]
E --> F[build-index]
F --> G[evaluate]
G --> H[generate_artifacts]
```
---
## 3. 当前最可靠入口
- [docs/open-dataset-workflow.md](./open-dataset-workflow.md)
- [docs/session-handoff.md](./session-handoff.md)
- [acr-engine/FIRST_RUN_CHECKLIST.md](../acr-engine/FIRST_RUN_CHECKLIST.md)
- [acr-engine/scripts/status_snapshot.py](../acr-engine/scripts/status_snapshot.py)
---
## 4. 当前最重要缺口
1. 真实 FMA 本地音频未落地
2. 真实 MTG-Jamendo 本地音频未落地
3. hard-case 在真实数据上的表现未知
4. foundation model baseline 还未开始实现
5. 服务与部署仍偏原型级
---
## Sources
- [session-handoff.md](./session-handoff.md)
- [open-dataset-workflow.md](./open-dataset-workflow.md)
- [CHANGELOG.md](./CHANGELOG.md)
......@@ -274,6 +274,7 @@
- [docs/README.md](./README.md)
- [docs/open-dataset-workflow.md](./open-dataset-workflow.md)
- [docs/session-handoff.md](./session-handoff.md)
- [docs/current-capability-map.md](./current-capability-map.md)
- [acr-engine/FIRST_RUN_CHECKLIST.md](../acr-engine/FIRST_RUN_CHECKLIST.md)
- 运行 [acr-engine/scripts/status_snapshot.py](../acr-engine/scripts/status_snapshot.py)
- 或直接查看最新落盘快照:`acr-engine/.omx/latest_status_snapshot.json`
......