changelist-2026-06-02.md
2.17 KB
Changelist / 2026-06-02
本次交付目标
在不等待长时间 benchmark 完成的前提下,交付一套足够完整的续跑文档,让新 session 能立刻知道:
- 已完成什么
- 正在卡在哪里
- 下一步跑什么
- 哪些文件能提,哪些不能提
文件级变更
| 文件 | 变更说明 |
|---|---|
| ../AGENT.md | 新增开发偏好与续跑记忆 |
| ./session-handoff.md | 增补当前卡点、待办与续跑命令 |
| ./delivery-handoff-2026-06-02.md | 新增快速接管摘要 |
| ./CHANGELOG.md | 记录本次交付检查点 |
不在本次提交中的内容
- FMA / MTG-Jamendo 原始数据
-
data/external_smoke中的音频与模型产物 -
/tmpbenchmark 输出 __pycache__- checkpoint / index 目录
当前运行中的任务
cap48 top2 seed=999- 启动命令:
cd /workspace/acr-engine
/usr/local/miniconda3/bin/python scripts/ab_smoke_segmentation.py \
--dataset fma \
--input-dir data/raw/fma_small_audio \
--work-root /tmp/ab_smoke_seg_cap48_top2_seed999 \
--subset-size 48 \
--query-duration 8 \
--train-epochs 1 \
--batch-size 2 \
--device cpu \
--strategies hybrid high_energy \
--max-test-queries 24 \
--seed 999 \
--output-json /tmp/ab_smoke_seg_cap48_top2_seed999/report.json
下一步建议
- 检查
seed=999是否完成。 - 生成 3-seed aggregate。
- 回写 workflow / handoff / changelog。
- 提交推送。
- 再开启 cap64 或 bucket benchmark。
本次追加证据
- 已确认
cap48 top2 seed=999未卡在 build-index。 -
hybrid已完成 reference index,随后进入evaluate.py。 本次提交用于沉淀这份 fresh verification evidence,方便下个 session 不必重复排查。
已补记
hybridseed=999 的中间结果:top1=0.875 / topk=1.0 / num_queries=24。已补齐
seed=999最终结果,并完成 cap48 三 seed aggregate 归纳。已记录 cap64 benchmark 已启动,并确认进入
high_energy训练阶段。已补充 cap64 新鲜证据:
high_energy索引完成(64 refs / 657 windows / 192-d)并进入evaluate.py。