current-capability-map.md 2.59 KB

Current Capability Map / 当前能力地图

更新:2026-06-02

一页结论

当前项目有三类能力:

  1. 已完整闭环
  2. 已打通但仍是 smoke 级
  3. 仍待真实数据/更大规模验证

1. 能力状态表

能力 当前状态 说明
synthetic 数据生成 已完成 可稳定生成合成训练/评测数据
synthetic 训练 已完成 train.py 可跑通
synthetic 建索引 已完成 run_demo.py build-index 可跑通
synthetic 评测 已完成 evaluate.py 可输出 JSON
synthetic 发布制品 已完成 可生成 benchmark/model-card/checklist
开放数据 inspect 已完成 inspect-local / inspect-batch
开放数据 prepare 已完成 prepare-local
开放数据 validate 已完成 validate-local
开放数据训练 smoke 已完成 已在 stand-in 数据上验证
开放数据索引 smoke 已完成 已在 stand-in 数据上验证
开放数据评测 smoke 已完成 已在 stand-in 数据上验证
开放数据发布制品 smoke 已完成 已在 stand-in 数据上验证
一键 smoke-local 已完成 inspect→prepare→validate→train→index→eval→artifacts
真实 FMA 本地目录 smoke 待外部数据 代码已就绪,缺真实音频目录
真实 MTG-Jamendo 本地目录 smoke 待外部数据 代码已就绪,缺真实音频目录
hard-case 精度优化 进行中 confused / humming_like 仍需持续优化
foundation model baseline 未完成 仅完成文档研究与路线规划
工业级生产部署 未完成 服务骨架已在,生产治理未完成

2. 最短路径图

flowchart LR
    A[Local Audio Dir] --> B[inspect-local]
    B --> C[prepare-local]
    C --> D[validate-local]
    D --> E[train]
    E --> F[build-index]
    F --> G[evaluate]
    G --> H[generate_artifacts]

3. 当前最可靠入口


4. 当前最重要缺口

  1. 真实 FMA 本地音频未落地
  2. 真实 MTG-Jamendo 本地音频未落地
  3. hard-case 在真实数据上的表现未知
  4. foundation model baseline 还未开始实现
  5. 服务与部署仍偏原型级

Sources