Commit 9371e944 9371e944ce496b616603099b94cc906fcdef0244 by cnb.bofCdSsphPA

record the first completed real-path reference index milestone\n\nConstraint: De…

…livery docs must reflect fresh post-fix completion evidence and exclude data/index artifacts\nRejected: Delay until evaluate evidence exists | Completed reference index is already a distinct stage milestone the user asked us to checkpoint\nConfidence: high\nScope-risk: narrow\nDirective: Use /tmp/fma_realpath_small_rerun_index2 as the primary handoff artifact and validate evaluate or identify next before expanding sample size\nTested: Verified reference_progress.json complete at 200/200, reference_embs.npy and reference_ids.npy present, embedding_shape [2068, 192], and handoff/changelog docs updated\nNot-tested: Automatic evaluate chaining and retrieval quality on the completed 200-ref index
1 parent 41c4d7cc
...@@ -74,11 +74,10 @@ ...@@ -74,11 +74,10 @@
74 74
75 ## 5.5 最新真实 FMA / chromaprint 运行态(2026-06-02) 75 ## 5.5 最新真实 FMA / chromaprint 运行态(2026-06-02)
76 76
77 ### 当前最新快照(15:29 UTC) 77 ### 当前最新快照(15:35 UTC)
78 78
79 - 远程同步基线:`707449b` 79 - 远程同步基线:`41c4d7c`(更新前)
80 - 当前最重要的新证据,不再是旧 observable 异常退出,而是:**fixed real-path 200-ref rerun 已进入 reference 阶段** 80 - 当前最重要的新证据:**fixed real-path 200-ref rerun 已完整产出最终 reference index**
81 - 前台运行 session:`19709`
82 - 输出目录:`/tmp/fma_realpath_small_rerun_index2` 81 - 输出目录:`/tmp/fma_realpath_small_rerun_index2`
83 - chromaprint 已完成: 82 - chromaprint 已完成:
84 - `status=complete` 83 - `status=complete`
...@@ -86,20 +85,20 @@ ...@@ -86,20 +85,20 @@
86 - `skipped_refs=0` 85 - `skipped_refs=0`
87 - `hashes=57577` 86 - `hashes=57577`
88 - `postings=187446` 87 - `postings=187446`
89 - reference 已开始并完成首个 checkpoint: 88 - reference 已完成:
90 - `status=building` 89 - `status=complete`
91 - `refs_done=25/200` 90 - `refs_done=200/200`
92 - `windows_done=256` 91 - `windows_done=2068`
92 - `embedding_shape=[2068, 192]`
93 - `skipped_refs=0` 93 - `skipped_refs=0`
94 - 当前已出现: 94 - 当前已出现最终产物:
95 - `reference_progress.json` 95 - `reference_embs.npy`
96 - `reference_embs.partial.npy` 96 - `reference_ids.npy`
97 - `reference_ids.partial.npy` 97 - 这说明:`flush=True` + 坏音频 skip tolerance 修复后,真实路径 rerun 已完整穿过两段核心建索引流程。
98 - 这说明:`flush=True` + 坏音频 skip tolerance 修复后,真实路径 rerun 已跨过 `chromaprint -> reference` 边界。
99 - 下一次值得提交的事件: 98 - 下一次值得提交的事件:
100 1. `reference_embs.npy` / `reference_ids.npy` 完整产出 99 1. `evaluate.py` 启动或显式 evaluate smoke 完成
101 2. `evaluate.py` 启动或完整评测开始 100 2. identify / 检索指标产出
102 3.出现新的明确 traceback / failure evidence 101 3.新的更大样本/全量 rerun 结果
103 102
104 103
105 ## 6. 高风险注意事项 104 ## 6. 高风险注意事项
......
1 ## 2026-06-02 15:35 UTC / real-path 200-ref rerun finished reference index
2
3 - fixed real-path 200 reference rerun:`/tmp/fma_realpath_small_rerun_index2` 已完成 reference/embedding 阶段
4 - fresh evidence(`2026-06-02 15:35:19 UTC`):
5 - `chromaprint_progress.json` => `status=complete`, `refs_done=200/200`, `skipped_refs=0`
6 - `reference_progress.json` => `status=complete`, `refs_done=200/200`, `windows_done=2068`, `embedding_shape=[2068, 192]`, `skipped_refs=0`
7 - 最终产物已落盘:
8 - `reference_embs.npy``1588352 bytes`
9 - `reference_ids.npy``74576 bytes`
10 - 前台 stdout 明确可见:
11 - `[build-reference-index] progress: refs=200/200 ...`
12 - `Built reference index: 2068 windows, embeddings shape (2068, 192)`
13 - `[done] embedding index built: 2068 refs`
14 - 结论:修复后的真实路径 rerun 已完整跨过 `chromaprint -> reference` 两个核心建索引阶段
15 - 下一关键里程碑:确认后续是否自动进入评测/识别链,或补一轮显式 evaluate smoke
16
1 ## 2026-06-02 15:29 UTC / real-path 200-ref rerun crossed into reference stage 17 ## 2026-06-02 15:29 UTC / real-path 200-ref rerun crossed into reference stage
2 18
3 - 基于已修复代码继续跟进真实路径 200 reference rerun:`/tmp/fma_realpath_small_rerun_index2` 19 - 基于已修复代码继续跟进真实路径 200 reference rerun:`/tmp/fma_realpath_small_rerun_index2`
......
...@@ -129,3 +129,36 @@ ...@@ -129,3 +129,36 @@
129 129
130 - 这次 fixed rerun 已经证明:修复后的真实路径样本不再卡死在 chromaprint 阶段。 130 - 这次 fixed rerun 已经证明:修复后的真实路径样本不再卡死在 chromaprint 阶段。
131 - 当前最有价值的下一步,变为继续盯 `reference_*` 完成或捕获新的明确失败证据。 131 - 当前最有价值的下一步,变为继续盯 `reference_*` 完成或捕获新的明确失败证据。
132
133 ## 本次追加交付(2026-06-02 15:35 UTC)
134
135 ### 新增运行证据
136
137 | 类别 | 内容 |
138 |---|---|
139 | chromaprint | `200/200` 完成,`skipped_refs=0` |
140 | reference | `200/200` 完成,`windows_done=2068` |
141 | 产物 | `reference_embs.npy``reference_ids.npy` 已完整落盘 |
142 | shape | `embedding_shape=[2068, 192]` |
143
144 ### 当前最重要的 fresh evidence
145
146 - 观测时间:`2026-06-02 15:35:19 UTC`
147 - 输出目录:`/tmp/fma_realpath_small_rerun_index2`
148 - `reference_progress.json`
149 - `status=complete`
150 - `refs_done=200/200`
151 - `windows_done=2068`
152 - `embedding_shape=[2068, 192]`
153 - `skipped_refs=0`
154 - 最终产物:
155 - `reference_embs.npy``1588352 bytes`
156 - `reference_ids.npy``74576 bytes`
157 - stdout 明确出现:
158 - `Built reference index: 2068 windows, embeddings shape (2068, 192)`
159 - `[done] embedding index built: 2068 refs`
160
161 ### 结论
162
163 - 当前已确认:修复后的真实路径 rerun 不仅能进入 reference 阶段,而且能完整产出最终 embedding index。
164 - 下一轮最高价值工作应切到:评测链是否自动衔接,以及必要时补显式 evaluate smoke。
......
1 ## 本次交付包追加更新(2026-06-02 15:35 UTC)
2
3 ### 交付结论
4
5 当前最新里程碑已经从“进入 reference 阶段”推进到 **fixed real-path 200-ref rerun 已完整产出最终 embedding/reference index**
6 - 远程基线当前为:`41c4d7c`(更新前)
7 - chromaprint 已完整完成:`200/200`
8 - reference 已完整完成:`200/200`
9 - 最终产物 `reference_embs.npy` / `reference_ids.npy` 已落盘
10 - 因此主问题已从“能否穿过建索引核心阶段”转向“后续 evaluate / identify 链如何衔接验证”
11
12 ### 当前最新事实
13
14 #### fixed real-path rerun 路径
15 - 观测时间:`2026-06-02 15:35:19 UTC`
16 - 输出目录:`/tmp/fma_realpath_small_rerun_index2`
17 - `chromaprint_progress.json`
18 - `status=complete`
19 - `refs_done=200 / 200`
20 - `hashes=57577`
21 - `postings=187446`
22 - `skipped_refs=0`
23 - `reference_progress.json`
24 - `status=complete`
25 - `refs_done=200 / 200`
26 - `windows_done=2068`
27 - `elapsed_sec=410.046`
28 - `embedding_shape=[2068, 192]`
29 - `skipped_refs=0`
30 - 当前已出现最终产物:
31 - `reference_embs.npy`
32 - `reference_ids.npy`
33
34 ### 当前判断
35
36 - 这条 fixed rerun 已经给出强证据:`flush=True` 与坏音频 skip tolerance 修复后,真实路径样本可以完整跑完两段核心建索引流程。
37 - 下一阶段应集中验证:
38 1. 是否自动衔接到 evaluate / identify;
39 2. 若没有,补一轮显式 evaluate smoke。
40
41 ---
42
1 ## 本次交付包追加更新(2026-06-02 15:29 UTC) 43 ## 本次交付包追加更新(2026-06-02 15:29 UTC)
2 44
3 ### 交付结论 45 ### 交付结论
......
...@@ -5,31 +5,29 @@ ...@@ -5,31 +5,29 @@
5 5
6 ## 一页结论 6 ## 一页结论
7 7
8 ### 最新交付快照(2026-06-02 15:29 UTC) 8 ### 最新交付快照(2026-06-02 15:35 UTC)
9 9
10 - 当前远程同步基线:`707449b` 10 - 当前远程同步基线:`41c4d7c`(更新前)
11 - 当前最重要的新事实:**fixed real-path 200-ref rerun 已明确进入 reference/embedding 阶段** 11 - 当前最重要的新事实:**fixed real-path 200-ref rerun 已完整产出最终 reference index**
12 - 前台 session:`19709`
13 - 输出目录:`/tmp/fma_realpath_small_rerun_index2` 12 - 输出目录:`/tmp/fma_realpath_small_rerun_index2`
14 - chromaprint 阶段: 13 - chromaprint 阶段:
15 - `status=complete` 14 - `status=complete`
16 - `refs_done=200/200` 15 - `refs_done=200/200`
17 - `skipped_refs=0` 16 - `skipped_refs=0`
18 - `chromaprint.pkl=2266212 bytes`
19 - reference 阶段: 17 - reference 阶段:
20 - `reference_progress.json` 已出现 18 - `status=complete`
21 - `status=building` 19 - `refs_done=200/200`
22 - `refs_done=25/200` 20 - `windows_done=2068`
23 - `windows_done=256` 21 - `embedding_shape=[2068, 192]`
24 - `skipped_refs=0` 22 - `skipped_refs=0`
25 - 当前已出现: 23 - 当前已出现最终产物
26 - `reference_embs.partial.npy` 24 - `reference_embs.npy`
27 - `reference_ids.partial.npy` 25 - `reference_ids.npy`
28 - 结论:修复后的真实路径 rerun 已跨过 `chromaprint -> reference` 边界;下一关键里程碑是 final `reference_*` 产物或新的明确失败证据 26 - 结论:修复后的真实路径 rerun 已完整跨过 `chromaprint -> reference` 两个核心阶段;当前下一优先级是评测链衔接验证
29 - 新 session 第一优先级: 27 - 新 session 第一优先级:
30 1. 继续读取 `session 19709` 最新输出 28 1. 检查是否已有 evaluate / identify 后续证据
31 2. 检查 partial 是否转成 `reference_embs.npy` / `reference_ids.npy` 29 2. 若无,基于这套已完成 index 补一轮显式 evaluate smoke
32 3. 如失败,记录 traceback 并进入下一轮修复 30 3. 再决定是否继续扩到更大样本 / 全量 FMA
33 31
34 ### 最新可观测性修复(2026-06-02 15:18 UTC) 32 ### 最新可观测性修复(2026-06-02 15:18 UTC)
35 33
......