delivery-onepager.md
2.73 KB
ACR 交付一页纸
给新接手同事的最短摘要:先看这页,再决定要不要展开到完整 runbook。
1. 现在已经交付了什么
当前已经有两条可用主线:
-
PostgreSQL song-centric 主链
- 歌曲目录 -> manifest -> window -> fingerprint/embedding -> PostgreSQL
-
selected20 小样本评测主线
- 20 首歌专题 -> exact / semantic / fused song-level 命中率评测
一句话:
数据库宿主链已经打通,20 首歌回归基线已经固定;下一步重点不是重做方案,而是在当前基线上继续补 semantic challenger。
2. 当前默认模型
逻辑语义:
song -> asset -> window -> fingerprint / embedding
物理落表:
media_entity -> audio_object -> feature_fact -> set_membership
3. 最短启动命令
cd /workspace
/usr/local/miniconda3/bin/python acr-engine/scripts/run_songcentric_directory_pipeline_live.py \
--dsn 'postgres://d2:d2pass@127.0.0.1:5432/d2' \
--schema acr_songcentric_test \
--input-root acr-engine/data/songcentric_builder_smoke \
--output-dir acr-engine/data/pgvector_eval/music20
4. 当前 fresh evidence
主链当前结果:
song_count = 2asset_count = 2window_count = 5matcher_fingerprint_count = 5semantic_runtime_ready_count = 5import_counts = media_entity:9 / audio_object:22 / feature_fact:34 / set_membership:9
说明:
- exact lane 已接
chromaprint_matcher - semantic lane 已接
mert-v1-95m - 当前 5 个 window 没走 fallback
5. selected20 当前结论
- query 总数:
123 - exact:
top1=0.6016 / top3=0.8130 - semantic:
top1=0.4715 / top3=0.6016 - fused:
top1=0.6341 / top3=0.8537
关键判断:
-
type_1已打满 -
type_12很强 - 主要短板仍是
type_7 / type_16
6. 你应该先看哪份文档
如果你只想快速接手
如果你要看完整操作链路
如果你要看专题评测
7. 现在最重要的下一步
- 保住当前 4 表主链不回退
- 接入 MuQ challenger
- 每次变更后复跑 selected20
- 重点盯
type_7 / type_16