Commit 847ac44d 847ac44dcece4416e19cf8faa2dab8e99632a29e by cnb.bofCdSsphPA

Record that the durable waiter still needs another stability pass

Constraint: The real-data lane still needs a reliable unattended handoff process, and fresh evidence now shows the first durability fix was incomplete.
Rejected: Treating the restarted waiter as fully solved | The second drop proves more diagnosis is required.
Confidence: medium
Scope-risk: narrow
Directive: Investigate why the waiter exits after the first logged poll instead of assuming the infinite-loop change alone solved stability.
Tested: Re-checked archive progress, confirmed the waiter process was absent, inspected the single-entry log file, and restarted the waiter successfully.
Not-tested: Root-cause isolation for the second waiter drop remains pending.
1 parent 31194789
......@@ -2,6 +2,28 @@
## 2026-06-02
### Stage: 真实 FMA 长时等待器二次掉线复验
完成项:
- 复检长期等待器与日志输出状态
- 确认下载继续前进,但长期等待器再次退出
- 重新拉起等待器,恢复“下载完成后自动后处理”能力
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=4102045696`
- `archive_progress_percent=53.4149`
- 进程侧未发现 `wait_for_fma_and_prepare.py`
- 日志文件只保留首轮输出:
- `cycle=1`
- `archive_progress_percent=52.5032`
- 重新启动后,进程再次恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30`
结论:
- 下载本身没有停,问题集中在长期等待器稳定性仍不足
- 下一步需要继续定位其二次退出原因,避免只靠重启维持自动承接链路
### Stage: 真实 FMA 等待器寿命缺陷修复
完成项:
......@@ -994,6 +1016,28 @@
## 2026-06-02
### Stage: 真实 FMA 长时等待器二次掉线复验
完成项:
- 复检长期等待器与日志输出状态
- 确认下载继续前进,但长期等待器再次退出
- 重新拉起等待器,恢复“下载完成后自动后处理”能力
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=4102045696`
- `archive_progress_percent=53.4149`
- 进程侧未发现 `wait_for_fma_and_prepare.py`
- 日志文件只保留首轮输出:
- `cycle=1`
- `archive_progress_percent=52.5032`
- 重新启动后,进程再次恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30`
结论:
- 下载本身没有停,问题集中在长期等待器稳定性仍不足
- 下一步需要继续定位其二次退出原因,避免只靠重启维持自动承接链路
### Stage: 真实 FMA 等待器寿命缺陷修复
完成项:
......@@ -1196,6 +1240,28 @@
## 2026-06-02
### Stage: 真实 FMA 长时等待器二次掉线复验
完成项:
- 复检长期等待器与日志输出状态
- 确认下载继续前进,但长期等待器再次退出
- 重新拉起等待器,恢复“下载完成后自动后处理”能力
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=4102045696`
- `archive_progress_percent=53.4149`
- 进程侧未发现 `wait_for_fma_and_prepare.py`
- 日志文件只保留首轮输出:
- `cycle=1`
- `archive_progress_percent=52.5032`
- 重新启动后,进程再次恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30`
结论:
- 下载本身没有停,问题集中在长期等待器稳定性仍不足
- 下一步需要继续定位其二次退出原因,避免只靠重启维持自动承接链路
### Stage: 真实 FMA 等待器寿命缺陷修复
完成项:
......@@ -1408,6 +1474,28 @@
## 2026-06-02
### Stage: 真实 FMA 长时等待器二次掉线复验
完成项:
- 复检长期等待器与日志输出状态
- 确认下载继续前进,但长期等待器再次退出
- 重新拉起等待器,恢复“下载完成后自动后处理”能力
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=4102045696`
- `archive_progress_percent=53.4149`
- 进程侧未发现 `wait_for_fma_and_prepare.py`
- 日志文件只保留首轮输出:
- `cycle=1`
- `archive_progress_percent=52.5032`
- 重新启动后,进程再次恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30`
结论:
- 下载本身没有停,问题集中在长期等待器稳定性仍不足
- 下一步需要继续定位其二次退出原因,避免只靠重启维持自动承接链路
### Stage: 真实 FMA 等待器寿命缺陷修复
完成项:
......@@ -1610,6 +1698,28 @@
## 2026-06-02
### Stage: 真实 FMA 长时等待器二次掉线复验
完成项:
- 复检长期等待器与日志输出状态
- 确认下载继续前进,但长期等待器再次退出
- 重新拉起等待器,恢复“下载完成后自动后处理”能力
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=4102045696`
- `archive_progress_percent=53.4149`
- 进程侧未发现 `wait_for_fma_and_prepare.py`
- 日志文件只保留首轮输出:
- `cycle=1`
- `archive_progress_percent=52.5032`
- 重新启动后,进程再次恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30`
结论:
- 下载本身没有停,问题集中在长期等待器稳定性仍不足
- 下一步需要继续定位其二次退出原因,避免只靠重启维持自动承接链路
### Stage: 真实 FMA 等待器寿命缺陷修复
完成项:
......@@ -1810,6 +1920,28 @@
## 2026-06-02
### Stage: 真实 FMA 长时等待器二次掉线复验
完成项:
- 复检长期等待器与日志输出状态
- 确认下载继续前进,但长期等待器再次退出
- 重新拉起等待器,恢复“下载完成后自动后处理”能力
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=4102045696`
- `archive_progress_percent=53.4149`
- 进程侧未发现 `wait_for_fma_and_prepare.py`
- 日志文件只保留首轮输出:
- `cycle=1`
- `archive_progress_percent=52.5032`
- 重新启动后,进程再次恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30`
结论:
- 下载本身没有停,问题集中在长期等待器稳定性仍不足
- 下一步需要继续定位其二次退出原因,避免只靠重启维持自动承接链路
### Stage: 真实 FMA 等待器寿命缺陷修复
完成项:
......@@ -2008,6 +2140,28 @@
## 2026-06-02
### Stage: 真实 FMA 长时等待器二次掉线复验
完成项:
- 复检长期等待器与日志输出状态
- 确认下载继续前进,但长期等待器再次退出
- 重新拉起等待器,恢复“下载完成后自动后处理”能力
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=4102045696`
- `archive_progress_percent=53.4149`
- 进程侧未发现 `wait_for_fma_and_prepare.py`
- 日志文件只保留首轮输出:
- `cycle=1`
- `archive_progress_percent=52.5032`
- 重新启动后,进程再次恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30`
结论:
- 下载本身没有停,问题集中在长期等待器稳定性仍不足
- 下一步需要继续定位其二次退出原因,避免只靠重启维持自动承接链路
### Stage: 真实 FMA 等待器寿命缺陷修复
完成项:
......@@ -2211,6 +2365,28 @@
## 2026-06-02
### Stage: 真实 FMA 长时等待器二次掉线复验
完成项:
- 复检长期等待器与日志输出状态
- 确认下载继续前进,但长期等待器再次退出
- 重新拉起等待器,恢复“下载完成后自动后处理”能力
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=4102045696`
- `archive_progress_percent=53.4149`
- 进程侧未发现 `wait_for_fma_and_prepare.py`
- 日志文件只保留首轮输出:
- `cycle=1`
- `archive_progress_percent=52.5032`
- 重新启动后,进程再次恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30`
结论:
- 下载本身没有停,问题集中在长期等待器稳定性仍不足
- 下一步需要继续定位其二次退出原因,避免只靠重启维持自动承接链路
### Stage: 真实 FMA 等待器寿命缺陷修复
完成项:
......