CHANGELOG.md
4.26 KB
Changelog
2026-06-02
Stage: 文档补全 + ACR 最小可运行链路
完成项:
- 补充项目职责图:
docs/project-responsibility-map.md - 补充系统架构图:
docs/acr-architecture.md - 补充阶段路线图:
docs/roadmap.md - 补充运行手册:
docs/runbook.md - 补充引擎说明:
acr-engine/README.md - 新增依赖清单:
acr-engine/requirements.txt - 新增 demo CLI:
acr-engine/run_demo.py - 修复数据集读取路径问题:
acr-engine/src/data/dataset.py - 修复首次训练不落 best checkpoint 的问题:
acr-engine/train.py
验证结果:
- 已生成 synthetic dataset
- 已通过
train.py --dry-run - 已完成 1 epoch CPU 训练并生成
best_model.pt - 已完成指纹索引与 embedding 索引构建
- 已完成识别命令并输出 JSON 候选结果
2026-06-02
Stage: 准确率优化 v2(128 Mel / band-split / retrieval 评测 / dataset 规范 / SOTA 调研)
完成项:
- 补充 dataset / 输入输出规范:
docs/dataset-spec.md - 补充开源数据集接入计划:
docs/open-dataset-plan.md - 补充 2026 SOTA 研究说明:
docs/sota-research-2026.md - 输入特征从低维说话人风格配置改为
128 Mel - 新增频带分割模块
BandSplitBlock - 引入 pro-WGAN 风格工程近似平衡策略(针对困难样本的更强增广)
- 合成数据新增
confused/humming_like样本类型 - 引入
catalog.json作为可搜索 reference 清单 - 索引从整曲单向量改为 window-level embedding index
- 新增
evaluate.py做 retrieval 评测 - 训练逻辑改为更 retrieval-oriented 的 song-pair 训练输入
验证结果:
- synthetic_v2 端到端重新跑通
- build-index 成功
- evaluate 成功
- test split 指标:top1=0.65, top5=0.95
- 分类型指标:
- clean top1=1.00
- augmented top1=0.75
- humming_like top1=0.25
- confused top1=0.25
结论:
- 结构性错误(catalog/index/fusion/评测缺失)已明显改善
- 当前主要剩余短板是 humming_like / confused 的鲁棒识别
2026-06-02
Stage: 工业化服务骨架 + 外部 manifest 转换模板
完成项:
- 新增 FastAPI 服务骨架:
acr-engine/src/service/app.py - 新增 manifest 转换工具:
acr-engine/src/data/manifest_tools.py - 新增工业 benchmark 文档:
docs/industrial-benchmark-spec.md - 扩展外部 dataset adapter CLI:
acr-engine/src/data/external_adapters.py - 新增服务 API 文档:
docs/service-api.md - requirements 增加 FastAPI / uvicorn / pydantic
验证结果:
-
external_adapters.py registry成功 -
external_adapters.py describe ccmusic成功 -
external_adapters.py init modelscope_music成功 -
manifest_tools.py csv-to-catalog成功生成 catalog -
service.app health()返回{"status":"ok"} - API
build_index(...)成功返回 reference window 数量 - API
recognize(...)成功返回候选结果 -
train.py --dry-run成功
2026-06-02
Stage: 文档治理闭环(导航 / 引用 / 模板)
完成项:
- 新增
docs/README.md作为文档总入口 - 新增
docs/references-and-sources.md作为引用来源总图 - 新增
docs/benchmark-report-template.md - 新增
docs/model-card-template.md - 新增
docs/release-checklist.md - 核心文档统一补充
Sources小节 - 核心文档统一补齐 executive summary / mermaid / table / appendix 风格
验证结果:
- docs 总入口结构检查通过
- references map 结构检查通过
- 核心 docs 存在性检查通过
- benchmark/model/release 模板结构检查通过
- 所有核心文档均具备 Sources;SOTA 文档已补齐 Mermaid 图
2026-06-02
Stage: 真实评测到发布产物链路打通
完成项:
-
evaluate.py支持--output-json - 新增
docs/report-layout.md - 新增
scripts/generate_artifacts.py - 打通
eval.json -> benchmark-report.md / model-card.md / release-checklist.md / artifact-manifest.json - 为快速发布链路新增
--fast-eval(关闭 melody 重排以加快报告生成)
验证结果:
- synthetic_v2 重建、训练、建索引成功
-
evaluate.py --fast-eval --output-json ...成功输出 JSON - artifact generator 成功输出 4 类发布产物
-
reports/smoke-v2/synthetic_v2/目录产物存在性检查通过 - 当前 fast-eval 指标:top1=0.60, top5=0.75,hard-case 仍需继续优化