Commit 8d6e4b29 8d6e4b293117457e8a1758cf59863ad0b8ed2a65 by cnb.bofCdSsphPA

Put the shortest verified startup path at the docs entrypoint

Constraint: The README remained a reading-first surface while the handoff had already converged on a faster validated startup command, so the docs entrypoint needed to match the actual recovery workflow.
Rejected: Keep the shortest path only in session-handoff | That would still force many sessions to open the wrong document first.
Confidence: high
Scope-risk: narrow
Directive: Treat docs/README.md and docs/session-handoff.md as aligned startup surfaces; keep the runner command identical in both places.
Tested: git diff --check; /usr/local/miniconda3/bin/python scripts/run_planner_validation_commands_live.py --dsn 'postgres://d2:d2pass@127.0.0.1:5432/d2' --output data/pgvector_eval/music20/planner_validation_commands_runner_report.json
Not-tested: This commit reshapes documentation only; it does not change worker behavior.
1 parent 061dd5e7
1 ## 2026-06-04 1 ## 2026-06-04
2 2
3 - 更新 `docs/README.md` 顶部为与 `session-handoff` 一致的“最短启动路径”,并再次用该入口命令重跑 `run_planner_validation_commands_live.py`,确认 fresh 结果仍为 `executed_count=4``all_passed=true`
3 - 重构 `docs/session-handoff.md` 顶部为“首选启动流程(最短路径)”,直接给出 `run_planner_validation_commands_live.py` 的一条启动命令,以及基于 fresh runner 报告(`executed_count=4`, `all_passed=true`)的结果判断逻辑,减少下次 session 的恢复成本。 4 - 重构 `docs/session-handoff.md` 顶部为“首选启动流程(最短路径)”,直接给出 `run_planner_validation_commands_live.py` 的一条启动命令,以及基于 fresh runner 报告(`executed_count=4`, `all_passed=true`)的结果判断逻辑,减少下次 session 的恢复成本。
4 - 新增 `scripts/run_planner_validation_commands_live.py``planner_validation_commands_runner_report.json`,可直接读取 `phase1_extraction_plan_report.json` 中的 `validation_commands` 并批量执行;当前 4 条 entrypoints 已全部执行成功,`executed_count=4``all_passed=true` 5 - 新增 `scripts/run_planner_validation_commands_live.py``planner_validation_commands_runner_report.json`,可直接读取 `phase1_extraction_plan_report.json` 中的 `validation_commands` 并批量执行;当前 4 条 entrypoints 已全部执行成功,`executed_count=4``all_passed=true`
5 - 更新 `phase1_validation_commands_execution_report.json`,补齐 planner 中剩余两条 validation commands 的直接执行证据:`semantic_vector_negative_matrix``asset_level_upsert_validation` 也已 `returncode=0`,当前 4 条 validation entrypoints 已全部验证可被脚本直接消费。 6 - 更新 `phase1_validation_commands_execution_report.json`,补齐 planner 中剩余两条 validation commands 的直接执行证据:`semantic_vector_negative_matrix``asset_level_upsert_validation` 也已 `returncode=0`,当前 4 条 validation entrypoints 已全部验证可被脚本直接消费。
......
...@@ -2,6 +2,40 @@ ...@@ -2,6 +2,40 @@
2 2
3 > 面向“版权保护 / 听歌识曲 / 版本归属”的音乐 ACR 文档入口。默认先看主路径,历史细节文档作为补充材料保留。 3 > 面向“版权保护 / 听歌识曲 / 版本归属”的音乐 ACR 文档入口。默认先看主路径,历史细节文档作为补充材料保留。
4 4
5 ## 最短启动路径(推荐)
6
7 如果下次启动的目标是:**先判断当前 host 能不能继续推进 Phase-1**,不要先手工翻很多文档,先直接跑:
8
9 ```bash
10 cd /workspace/acr-engine
11 /usr/local/miniconda3/bin/python scripts/run_planner_validation_commands_live.py --dsn 'postgres://d2:d2pass@127.0.0.1:5432/d2' --output data/pgvector_eval/music20/planner_validation_commands_runner_report.json
12 ```
13
14 当前这条命令的 fresh evidence 已有:
15
16 - `executed_count = 4`
17 - `all_passed = true`
18
19 它会一次性执行:
20
21 1. `prereq_audit`
22 2. `worker_contract_smoke`
23 3. `semantic_vector_negative_matrix`
24 4. `asset_level_upsert_validation`
25
26 如果结果仍是:
27 - `downloads_root_exists = false`
28 - `ready_jobs = 0`
29 - exact = `failed/unreadable_audio_assets`
30 - semantic = `4/4 failed`
31
32 那么说明当前优先级应该是:
33
34 1. 解决 `/workspace/downloads` 挂载
35 2. 安装语义模型 runtime 依赖
36
37 而不是继续怀疑 PostgreSQL contract。
38
5 ## 一页结论 39 ## 一页结论
6 40
7 当前项目已经从“原型是否能跑通”转向“**如何把 100w 音频 / 30w 歌曲做成可演进的版权检索系统**”。 41 当前项目已经从“原型是否能跑通”转向“**如何把 100w 音频 / 30w 歌曲做成可演进的版权检索系统**”。
......