delivery-onepager.md 2.73 KB

ACR 交付一页纸

给新接手同事的最短摘要:先看这页,再决定要不要展开到完整 runbook。


1. 现在已经交付了什么

当前已经有两条可用主线:

  1. PostgreSQL song-centric 主链
    • 歌曲目录 -> manifest -> window -> fingerprint/embedding -> PostgreSQL
  2. selected20 小样本评测主线
    • 20 首歌专题 -> exact / semantic / fused song-level 命中率评测

一句话:

数据库宿主链已经打通,20 首歌回归基线已经固定;下一步重点不是重做方案,而是在当前基线上继续补 semantic challenger。


2. 当前默认模型

逻辑语义:

song -> asset -> window -> fingerprint / embedding

物理落表:

media_entity -> audio_object -> feature_fact -> set_membership

3. 最短启动命令

cd /workspace
/usr/local/miniconda3/bin/python acr-engine/scripts/run_songcentric_directory_pipeline_live.py \
  --dsn 'postgres://d2:d2pass@127.0.0.1:5432/d2' \
  --schema acr_songcentric_test \
  --input-root acr-engine/data/songcentric_builder_smoke \
  --output-dir acr-engine/data/pgvector_eval/music20

4. 当前 fresh evidence

主链当前结果:

  • song_count = 2
  • asset_count = 2
  • window_count = 5
  • matcher_fingerprint_count = 5
  • semantic_runtime_ready_count = 5
  • import_counts = media_entity:9 / audio_object:22 / feature_fact:34 / set_membership:9

说明:

  • exact lane 已接 chromaprint_matcher
  • semantic lane 已接 mert-v1-95m
  • 当前 5 个 window 没走 fallback

5. selected20 当前结论

  • query 总数:123
  • exact:top1=0.6016 / top3=0.8130
  • semantic:top1=0.4715 / top3=0.6016
  • fused:top1=0.6341 / top3=0.8537

关键判断:

  • type_1 已打满
  • type_12 很强
  • 主要短板仍是 type_7 / type_16

6. 你应该先看哪份文档

如果你只想快速接手

  1. start-here.md
  2. delivery-onepager.md
  3. session-handoff.md

如果你要看完整操作链路

如果你要看专题评测


7. 现在最重要的下一步

  1. 保住当前 4 表主链不回退
  2. 接入 MuQ challenger
  3. 每次变更后复跑 selected20
  4. 重点盯 type_7 / type_16

8. 相关文档