Commit 9371e944 9371e944ce496b616603099b94cc906fcdef0244 by cnb.bofCdSsphPA

record the first completed real-path reference index milestone\n\nConstraint: De…

…livery docs must reflect fresh post-fix completion evidence and exclude data/index artifacts\nRejected: Delay until evaluate evidence exists | Completed reference index is already a distinct stage milestone the user asked us to checkpoint\nConfidence: high\nScope-risk: narrow\nDirective: Use /tmp/fma_realpath_small_rerun_index2 as the primary handoff artifact and validate evaluate or identify next before expanding sample size\nTested: Verified reference_progress.json complete at 200/200, reference_embs.npy and reference_ids.npy present, embedding_shape [2068, 192], and handoff/changelog docs updated\nNot-tested: Automatic evaluate chaining and retrieval quality on the completed 200-ref index
1 parent 41c4d7cc
......@@ -74,11 +74,10 @@
## 5.5 最新真实 FMA / chromaprint 运行态(2026-06-02)
### 当前最新快照(15:29 UTC)
### 当前最新快照(15:35 UTC)
- 远程同步基线:`707449b`
- 当前最重要的新证据,不再是旧 observable 异常退出,而是:**fixed real-path 200-ref rerun 已进入 reference 阶段**
- 前台运行 session:`19709`
- 远程同步基线:`41c4d7c`(更新前)
- 当前最重要的新证据:**fixed real-path 200-ref rerun 已完整产出最终 reference index**
- 输出目录:`/tmp/fma_realpath_small_rerun_index2`
- chromaprint 已完成:
- `status=complete`
......@@ -86,20 +85,20 @@
- `skipped_refs=0`
- `hashes=57577`
- `postings=187446`
- reference 已开始并完成首个 checkpoint:
- `status=building`
- `refs_done=25/200`
- `windows_done=256`
- reference 已完成:
- `status=complete`
- `refs_done=200/200`
- `windows_done=2068`
- `embedding_shape=[2068, 192]`
- `skipped_refs=0`
- 当前已出现:
- `reference_progress.json`
- `reference_embs.partial.npy`
- `reference_ids.partial.npy`
- 这说明:`flush=True` + 坏音频 skip tolerance 修复后,真实路径 rerun 已跨过 `chromaprint -> reference` 边界。
- 当前已出现最终产物:
- `reference_embs.npy`
- `reference_ids.npy`
- 这说明:`flush=True` + 坏音频 skip tolerance 修复后,真实路径 rerun 已完整穿过两段核心建索引流程。
- 下一次值得提交的事件:
1. `reference_embs.npy` / `reference_ids.npy` 完整产出
2. `evaluate.py` 启动或完整评测开始
3.出现新的明确 traceback / failure evidence
1. `evaluate.py` 启动或显式 evaluate smoke 完成
2. identify / 检索指标产出
3.新的更大样本/全量 rerun 结果
## 6. 高风险注意事项
......
## 2026-06-02 15:35 UTC / real-path 200-ref rerun finished reference index
- fixed real-path 200 reference rerun:`/tmp/fma_realpath_small_rerun_index2` 已完成 reference/embedding 阶段
- fresh evidence(`2026-06-02 15:35:19 UTC`):
- `chromaprint_progress.json` => `status=complete`, `refs_done=200/200`, `skipped_refs=0`
- `reference_progress.json` => `status=complete`, `refs_done=200/200`, `windows_done=2068`, `embedding_shape=[2068, 192]`, `skipped_refs=0`
- 最终产物已落盘:
- `reference_embs.npy``1588352 bytes`
- `reference_ids.npy``74576 bytes`
- 前台 stdout 明确可见:
- `[build-reference-index] progress: refs=200/200 ...`
- `Built reference index: 2068 windows, embeddings shape (2068, 192)`
- `[done] embedding index built: 2068 refs`
- 结论:修复后的真实路径 rerun 已完整跨过 `chromaprint -> reference` 两个核心建索引阶段
- 下一关键里程碑:确认后续是否自动进入评测/识别链,或补一轮显式 evaluate smoke
## 2026-06-02 15:29 UTC / real-path 200-ref rerun crossed into reference stage
- 基于已修复代码继续跟进真实路径 200 reference rerun:`/tmp/fma_realpath_small_rerun_index2`
......
......@@ -129,3 +129,36 @@
- 这次 fixed rerun 已经证明:修复后的真实路径样本不再卡死在 chromaprint 阶段。
- 当前最有价值的下一步,变为继续盯 `reference_*` 完成或捕获新的明确失败证据。
## 本次追加交付(2026-06-02 15:35 UTC)
### 新增运行证据
| 类别 | 内容 |
|---|---|
| chromaprint | `200/200` 完成,`skipped_refs=0` |
| reference | `200/200` 完成,`windows_done=2068` |
| 产物 | `reference_embs.npy``reference_ids.npy` 已完整落盘 |
| shape | `embedding_shape=[2068, 192]` |
### 当前最重要的 fresh evidence
- 观测时间:`2026-06-02 15:35:19 UTC`
- 输出目录:`/tmp/fma_realpath_small_rerun_index2`
- `reference_progress.json`
- `status=complete`
- `refs_done=200/200`
- `windows_done=2068`
- `embedding_shape=[2068, 192]`
- `skipped_refs=0`
- 最终产物:
- `reference_embs.npy``1588352 bytes`
- `reference_ids.npy``74576 bytes`
- stdout 明确出现:
- `Built reference index: 2068 windows, embeddings shape (2068, 192)`
- `[done] embedding index built: 2068 refs`
### 结论
- 当前已确认:修复后的真实路径 rerun 不仅能进入 reference 阶段,而且能完整产出最终 embedding index。
- 下一轮最高价值工作应切到:评测链是否自动衔接,以及必要时补显式 evaluate smoke。
......
## 本次交付包追加更新(2026-06-02 15:35 UTC)
### 交付结论
当前最新里程碑已经从“进入 reference 阶段”推进到 **fixed real-path 200-ref rerun 已完整产出最终 embedding/reference index**
- 远程基线当前为:`41c4d7c`(更新前)
- chromaprint 已完整完成:`200/200`
- reference 已完整完成:`200/200`
- 最终产物 `reference_embs.npy` / `reference_ids.npy` 已落盘
- 因此主问题已从“能否穿过建索引核心阶段”转向“后续 evaluate / identify 链如何衔接验证”
### 当前最新事实
#### fixed real-path rerun 路径
- 观测时间:`2026-06-02 15:35:19 UTC`
- 输出目录:`/tmp/fma_realpath_small_rerun_index2`
- `chromaprint_progress.json`
- `status=complete`
- `refs_done=200 / 200`
- `hashes=57577`
- `postings=187446`
- `skipped_refs=0`
- `reference_progress.json`
- `status=complete`
- `refs_done=200 / 200`
- `windows_done=2068`
- `elapsed_sec=410.046`
- `embedding_shape=[2068, 192]`
- `skipped_refs=0`
- 当前已出现最终产物:
- `reference_embs.npy`
- `reference_ids.npy`
### 当前判断
- 这条 fixed rerun 已经给出强证据:`flush=True` 与坏音频 skip tolerance 修复后,真实路径样本可以完整跑完两段核心建索引流程。
- 下一阶段应集中验证:
1. 是否自动衔接到 evaluate / identify;
2. 若没有,补一轮显式 evaluate smoke。
---
## 本次交付包追加更新(2026-06-02 15:29 UTC)
### 交付结论
......
......@@ -5,31 +5,29 @@
## 一页结论
### 最新交付快照(2026-06-02 15:29 UTC)
### 最新交付快照(2026-06-02 15:35 UTC)
- 当前远程同步基线:`707449b`
- 当前最重要的新事实:**fixed real-path 200-ref rerun 已明确进入 reference/embedding 阶段**
- 前台 session:`19709`
- 当前远程同步基线:`41c4d7c`(更新前)
- 当前最重要的新事实:**fixed real-path 200-ref rerun 已完整产出最终 reference index**
- 输出目录:`/tmp/fma_realpath_small_rerun_index2`
- chromaprint 阶段:
- `status=complete`
- `refs_done=200/200`
- `skipped_refs=0`
- `chromaprint.pkl=2266212 bytes`
- reference 阶段:
- `reference_progress.json` 已出现
- `status=building`
- `refs_done=25/200`
- `windows_done=256`
- `status=complete`
- `refs_done=200/200`
- `windows_done=2068`
- `embedding_shape=[2068, 192]`
- `skipped_refs=0`
- 当前已出现:
- `reference_embs.partial.npy`
- `reference_ids.partial.npy`
- 结论:修复后的真实路径 rerun 已跨过 `chromaprint -> reference` 边界;下一关键里程碑是 final `reference_*` 产物或新的明确失败证据
- 当前已出现最终产物
- `reference_embs.npy`
- `reference_ids.npy`
- 结论:修复后的真实路径 rerun 已完整跨过 `chromaprint -> reference` 两个核心阶段;当前下一优先级是评测链衔接验证
- 新 session 第一优先级:
1. 继续读取 `session 19709` 最新输出
2. 检查 partial 是否转成 `reference_embs.npy` / `reference_ids.npy`
3. 如失败,记录 traceback 并进入下一轮修复
1. 检查是否已有 evaluate / identify 后续证据
2. 若无,基于这套已完成 index 补一轮显式 evaluate smoke
3. 再决定是否继续扩到更大样本 / 全量 FMA
### 最新可观测性修复(2026-06-02 15:18 UTC)
......