Commit be2b3326 be2b33265ac383ff5e8ede93e661c6738ddab52f by cnb.bofCdSsphPA

Recover the FMA post-download waiter after detecting it had dropped

Constraint: The real-data lane should not rely on a dead background handoff process while a long download is still in flight.
Rejected: Assuming the prior waiter was still alive | A direct process check showed it was gone.
Confidence: high
Scope-risk: narrow
Directive: Re-check waiter liveness during subsequent progress audits and restart it whenever it drops before archive completion.
Tested: Re-ran archive inspect, verified the waiter was absent, confirmed the empty log file, restarted the waiter, and validated the new live process.
Not-tested: The restarted waiter has not yet handed off to extraction because the archive remains incomplete.
1 parent ec7a8bd7
......@@ -2,6 +2,28 @@
## 2026-06-02
### Stage: 真实 FMA 守护链路掉线恢复
完成项:
- 再次复检 FMA 下载进度
- 复检后台等待器是否仍存活
- 发现等待器已退出后,重新拉起自动等待与后处理守护链路
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=3650322432`
- `archive_progress_percent=47.5327`
- 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
- 等待器日志文件存在但为空:
- `acr-engine/.omx_wait_for_fma.log`
- 重新启动后,进程确认恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
- 新守护进程 pid:`51526`
结论:
- 真实 FMA 下载仍在持续推进
- 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
### Stage: 真实 FMA 自动等待与后处理守护启动
完成项:
......@@ -947,6 +969,28 @@
## 2026-06-02
### Stage: 真实 FMA 守护链路掉线恢复
完成项:
- 再次复检 FMA 下载进度
- 复检后台等待器是否仍存活
- 发现等待器已退出后,重新拉起自动等待与后处理守护链路
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=3650322432`
- `archive_progress_percent=47.5327`
- 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
- 等待器日志文件存在但为空:
- `acr-engine/.omx_wait_for_fma.log`
- 重新启动后,进程确认恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
- 新守护进程 pid:`51526`
结论:
- 真实 FMA 下载仍在持续推进
- 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
### Stage: 真实 FMA 自动等待与后处理守护启动
完成项:
......@@ -1102,6 +1146,28 @@
## 2026-06-02
### Stage: 真实 FMA 守护链路掉线恢复
完成项:
- 再次复检 FMA 下载进度
- 复检后台等待器是否仍存活
- 发现等待器已退出后,重新拉起自动等待与后处理守护链路
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=3650322432`
- `archive_progress_percent=47.5327`
- 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
- 等待器日志文件存在但为空:
- `acr-engine/.omx_wait_for_fma.log`
- 重新启动后,进程确认恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
- 新守护进程 pid:`51526`
结论:
- 真实 FMA 下载仍在持续推进
- 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
### Stage: 真实 FMA 自动等待与后处理守护启动
完成项:
......@@ -1267,6 +1333,28 @@
## 2026-06-02
### Stage: 真实 FMA 守护链路掉线恢复
完成项:
- 再次复检 FMA 下载进度
- 复检后台等待器是否仍存活
- 发现等待器已退出后,重新拉起自动等待与后处理守护链路
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=3650322432`
- `archive_progress_percent=47.5327`
- 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
- 等待器日志文件存在但为空:
- `acr-engine/.omx_wait_for_fma.log`
- 重新启动后,进程确认恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
- 新守护进程 pid:`51526`
结论:
- 真实 FMA 下载仍在持续推进
- 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
### Stage: 真实 FMA 自动等待与后处理守护启动
完成项:
......@@ -1422,6 +1510,28 @@
## 2026-06-02
### Stage: 真实 FMA 守护链路掉线恢复
完成项:
- 再次复检 FMA 下载进度
- 复检后台等待器是否仍存活
- 发现等待器已退出后,重新拉起自动等待与后处理守护链路
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=3650322432`
- `archive_progress_percent=47.5327`
- 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
- 等待器日志文件存在但为空:
- `acr-engine/.omx_wait_for_fma.log`
- 重新启动后,进程确认恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
- 新守护进程 pid:`51526`
结论:
- 真实 FMA 下载仍在持续推进
- 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
### Stage: 真实 FMA 自动等待与后处理守护启动
完成项:
......@@ -1575,6 +1685,28 @@
## 2026-06-02
### Stage: 真实 FMA 守护链路掉线恢复
完成项:
- 再次复检 FMA 下载进度
- 复检后台等待器是否仍存活
- 发现等待器已退出后,重新拉起自动等待与后处理守护链路
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=3650322432`
- `archive_progress_percent=47.5327`
- 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
- 等待器日志文件存在但为空:
- `acr-engine/.omx_wait_for_fma.log`
- 重新启动后,进程确认恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
- 新守护进程 pid:`51526`
结论:
- 真实 FMA 下载仍在持续推进
- 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
### Stage: 真实 FMA 自动等待与后处理守护启动
完成项:
......@@ -1726,6 +1858,28 @@
## 2026-06-02
### Stage: 真实 FMA 守护链路掉线恢复
完成项:
- 再次复检 FMA 下载进度
- 复检后台等待器是否仍存活
- 发现等待器已退出后,重新拉起自动等待与后处理守护链路
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=3650322432`
- `archive_progress_percent=47.5327`
- 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
- 等待器日志文件存在但为空:
- `acr-engine/.omx_wait_for_fma.log`
- 重新启动后,进程确认恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
- 新守护进程 pid:`51526`
结论:
- 真实 FMA 下载仍在持续推进
- 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
### Stage: 真实 FMA 自动等待与后处理守护启动
完成项:
......@@ -1882,6 +2036,28 @@
## 2026-06-02
### Stage: 真实 FMA 守护链路掉线恢复
完成项:
- 再次复检 FMA 下载进度
- 复检后台等待器是否仍存活
- 发现等待器已退出后,重新拉起自动等待与后处理守护链路
验证结果:
- `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
- `archive_size=3650322432`
- `archive_progress_percent=47.5327`
- 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
- 等待器日志文件存在但为空:
- `acr-engine/.omx_wait_for_fma.log`
- 重新启动后,进程确认恢复:
- `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
- 新守护进程 pid:`51526`
结论:
- 真实 FMA 下载仍在持续推进
- 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
### Stage: 真实 FMA 自动等待与后处理守护启动
完成项:
......