delivery-handoff-2026-06-02.md 3.24 KB

Delivery Handoff / 2026-06-02

本次交付包(2026-06-02 14:25 UTC)

交付结论

这次应交付的是一套可直接续跑的工程包,而不是最终评测分数:

  • 远程基线已同步到:bc6d07afbd1e31d3956d20e35c20c424bc21ba99
  • chromaprint 热点优化与可观测性增强已提交并推送
  • 当前最重要的真实运行证据来自 可观测 FMA build-index smoke
  • 还没有进入 evaluate.py,因此暂不输出最终准确率结论

当前最新事实

已交付代码能力

  • acr-engine/src/engines/chromaprint_matcher.py
    • _find_peaks() 改为 sliding_window_view 等价实现
    • 保持 hash 输出一致的前提下,单样本约 2.02x 加速
  • acr-engine/run_demo.py
    • 支持 --chromaprint-checkpoint-every-refs
  • chromaprint 建索引阶段新增:
    • chromaprint_progress.json
    • 周期性 chromaprint.pkl partial cache 持久化

当前最可信 live evidence

  • 可观测进程:PID=431703
  • 命令:
cd /workspace/acr-engine
/usr/local/miniconda3/bin/python run_demo.py build-index \
  --data data/external_smoke/fma/manifests \
  --model data/external_smoke/fma_models_smoke/best_model.pt \
  --output /tmp/chroma_index_observable_smoke \
  --device cpu \
  --checkpoint-every-refs 10 \
  --chromaprint-checkpoint-every-refs 10 \
  --resume
  • 2026-06-02 14:25:32 UTC 最新状态:
    • status=building
    • refs_done=1740 / 8000
    • elapsed_sec=1385.4
    • eta_sec=4984.254
    • hashes=229127
    • postings=1510952
    • chromaprint.pkl=16787221 bytes
    • chromaprint_progress.json=230 bytes
  • 当前尚未出现
    • reference_progress.json
    • reference_embs.partial.npy
    • reference_ids.partial.npy
    • reference_embs.npy
    • reference_ids.npy
    • evaluate.py

旧真实 FMA 全量进程如何看待

  • 旧进程 PID=424691 仍在跑 build-index
  • 但它启动于本次 observability 改动之前
  • 不要把它当作新可观测代码路径的验证来源

新 session 接管顺序

  1. 先看 ./session-handoff.md
  2. 再看 ./changelist-2026-06-02.md
  3. 然后只盯住以下 4 个事件:
    1. chromaprint_progress.json 变成 status=complete
    2. 任一 reference_* 文件出现
    3. evaluate.py 启动
    4. 进程报错退出

当前卡点

  1. 当前环境仍是 CPU-only,建索引耗时长。
  2. 当前还处于 chromaprint 阶段,尚未进入 embedding / evaluate。
  3. 工作树含大量数据噪音,提交时必须只显式暂存文档/代码文件。

重启后最短检查命令

date -u '+%Y-%m-%d %H:%M:%S UTC'
cat /tmp/chroma_index_observable_smoke/chromaprint_progress.json
find /tmp/chroma_index_observable_smoke -maxdepth 1 -type f -printf '%f %s bytes\n' | sort
ps -p 431703 -o pid,etimes,time,%cpu,%mem,stat,command
pgrep -af 'evaluate.py --data data/external_smoke/fma/manifests'

本次交付包含的关键文档

本次明确不提交

  • acr-engine/data/raw/*
  • acr-engine/data/external_smoke/*
  • /tmp/*
  • checkpoint / index artifacts
  • __pycache__