Commit be2b3326 be2b33265ac383ff5e8ede93e661c6738ddab52f by cnb.bofCdSsphPA

Recover the FMA post-download waiter after detecting it had dropped

Constraint: The real-data lane should not rely on a dead background handoff process while a long download is still in flight.
Rejected: Assuming the prior waiter was still alive | A direct process check showed it was gone.
Confidence: high
Scope-risk: narrow
Directive: Re-check waiter liveness during subsequent progress audits and restart it whenever it drops before archive completion.
Tested: Re-ran archive inspect, verified the waiter was absent, confirmed the empty log file, restarted the waiter, and validated the new live process.
Not-tested: The restarted waiter has not yet handed off to extraction because the archive remains incomplete.
1 parent ec7a8bd7
...@@ -2,6 +2,28 @@ ...@@ -2,6 +2,28 @@
2 2
3 ## 2026-06-02 3 ## 2026-06-02
4 4
5 ### Stage: 真实 FMA 守护链路掉线恢复
6
7 完成项:
8 - 再次复检 FMA 下载进度
9 - 复检后台等待器是否仍存活
10 - 发现等待器已退出后,重新拉起自动等待与后处理守护链路
11
12 验证结果:
13 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
14 - `archive_size=3650322432`
15 - `archive_progress_percent=47.5327`
16 - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
17 - 等待器日志文件存在但为空:
18 - `acr-engine/.omx_wait_for_fma.log`
19 - 重新启动后,进程确认恢复:
20 - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
21 - 新守护进程 pid:`51526`
22
23 结论:
24 - 真实 FMA 下载仍在持续推进
25 - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
26
5 ### Stage: 真实 FMA 自动等待与后处理守护启动 27 ### Stage: 真实 FMA 自动等待与后处理守护启动
6 28
7 完成项: 29 完成项:
...@@ -947,6 +969,28 @@ ...@@ -947,6 +969,28 @@
947 969
948 ## 2026-06-02 970 ## 2026-06-02
949 971
972 ### Stage: 真实 FMA 守护链路掉线恢复
973
974 完成项:
975 - 再次复检 FMA 下载进度
976 - 复检后台等待器是否仍存活
977 - 发现等待器已退出后,重新拉起自动等待与后处理守护链路
978
979 验证结果:
980 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
981 - `archive_size=3650322432`
982 - `archive_progress_percent=47.5327`
983 - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
984 - 等待器日志文件存在但为空:
985 - `acr-engine/.omx_wait_for_fma.log`
986 - 重新启动后,进程确认恢复:
987 - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
988 - 新守护进程 pid:`51526`
989
990 结论:
991 - 真实 FMA 下载仍在持续推进
992 - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
993
950 ### Stage: 真实 FMA 自动等待与后处理守护启动 994 ### Stage: 真实 FMA 自动等待与后处理守护启动
951 995
952 完成项: 996 完成项:
...@@ -1102,6 +1146,28 @@ ...@@ -1102,6 +1146,28 @@
1102 1146
1103 ## 2026-06-02 1147 ## 2026-06-02
1104 1148
1149 ### Stage: 真实 FMA 守护链路掉线恢复
1150
1151 完成项:
1152 - 再次复检 FMA 下载进度
1153 - 复检后台等待器是否仍存活
1154 - 发现等待器已退出后,重新拉起自动等待与后处理守护链路
1155
1156 验证结果:
1157 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
1158 - `archive_size=3650322432`
1159 - `archive_progress_percent=47.5327`
1160 - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
1161 - 等待器日志文件存在但为空:
1162 - `acr-engine/.omx_wait_for_fma.log`
1163 - 重新启动后,进程确认恢复:
1164 - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
1165 - 新守护进程 pid:`51526`
1166
1167 结论:
1168 - 真实 FMA 下载仍在持续推进
1169 - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
1170
1105 ### Stage: 真实 FMA 自动等待与后处理守护启动 1171 ### Stage: 真实 FMA 自动等待与后处理守护启动
1106 1172
1107 完成项: 1173 完成项:
...@@ -1267,6 +1333,28 @@ ...@@ -1267,6 +1333,28 @@
1267 1333
1268 ## 2026-06-02 1334 ## 2026-06-02
1269 1335
1336 ### Stage: 真实 FMA 守护链路掉线恢复
1337
1338 完成项:
1339 - 再次复检 FMA 下载进度
1340 - 复检后台等待器是否仍存活
1341 - 发现等待器已退出后,重新拉起自动等待与后处理守护链路
1342
1343 验证结果:
1344 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
1345 - `archive_size=3650322432`
1346 - `archive_progress_percent=47.5327`
1347 - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
1348 - 等待器日志文件存在但为空:
1349 - `acr-engine/.omx_wait_for_fma.log`
1350 - 重新启动后,进程确认恢复:
1351 - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
1352 - 新守护进程 pid:`51526`
1353
1354 结论:
1355 - 真实 FMA 下载仍在持续推进
1356 - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
1357
1270 ### Stage: 真实 FMA 自动等待与后处理守护启动 1358 ### Stage: 真实 FMA 自动等待与后处理守护启动
1271 1359
1272 完成项: 1360 完成项:
...@@ -1422,6 +1510,28 @@ ...@@ -1422,6 +1510,28 @@
1422 1510
1423 ## 2026-06-02 1511 ## 2026-06-02
1424 1512
1513 ### Stage: 真实 FMA 守护链路掉线恢复
1514
1515 完成项:
1516 - 再次复检 FMA 下载进度
1517 - 复检后台等待器是否仍存活
1518 - 发现等待器已退出后,重新拉起自动等待与后处理守护链路
1519
1520 验证结果:
1521 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
1522 - `archive_size=3650322432`
1523 - `archive_progress_percent=47.5327`
1524 - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
1525 - 等待器日志文件存在但为空:
1526 - `acr-engine/.omx_wait_for_fma.log`
1527 - 重新启动后,进程确认恢复:
1528 - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
1529 - 新守护进程 pid:`51526`
1530
1531 结论:
1532 - 真实 FMA 下载仍在持续推进
1533 - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
1534
1425 ### Stage: 真实 FMA 自动等待与后处理守护启动 1535 ### Stage: 真实 FMA 自动等待与后处理守护启动
1426 1536
1427 完成项: 1537 完成项:
...@@ -1575,6 +1685,28 @@ ...@@ -1575,6 +1685,28 @@
1575 1685
1576 ## 2026-06-02 1686 ## 2026-06-02
1577 1687
1688 ### Stage: 真实 FMA 守护链路掉线恢复
1689
1690 完成项:
1691 - 再次复检 FMA 下载进度
1692 - 复检后台等待器是否仍存活
1693 - 发现等待器已退出后,重新拉起自动等待与后处理守护链路
1694
1695 验证结果:
1696 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
1697 - `archive_size=3650322432`
1698 - `archive_progress_percent=47.5327`
1699 - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
1700 - 等待器日志文件存在但为空:
1701 - `acr-engine/.omx_wait_for_fma.log`
1702 - 重新启动后,进程确认恢复:
1703 - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
1704 - 新守护进程 pid:`51526`
1705
1706 结论:
1707 - 真实 FMA 下载仍在持续推进
1708 - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
1709
1578 ### Stage: 真实 FMA 自动等待与后处理守护启动 1710 ### Stage: 真实 FMA 自动等待与后处理守护启动
1579 1711
1580 完成项: 1712 完成项:
...@@ -1726,6 +1858,28 @@ ...@@ -1726,6 +1858,28 @@
1726 1858
1727 ## 2026-06-02 1859 ## 2026-06-02
1728 1860
1861 ### Stage: 真实 FMA 守护链路掉线恢复
1862
1863 完成项:
1864 - 再次复检 FMA 下载进度
1865 - 复检后台等待器是否仍存活
1866 - 发现等待器已退出后,重新拉起自动等待与后处理守护链路
1867
1868 验证结果:
1869 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
1870 - `archive_size=3650322432`
1871 - `archive_progress_percent=47.5327`
1872 - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
1873 - 等待器日志文件存在但为空:
1874 - `acr-engine/.omx_wait_for_fma.log`
1875 - 重新启动后,进程确认恢复:
1876 - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
1877 - 新守护进程 pid:`51526`
1878
1879 结论:
1880 - 真实 FMA 下载仍在持续推进
1881 - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
1882
1729 ### Stage: 真实 FMA 自动等待与后处理守护启动 1883 ### Stage: 真实 FMA 自动等待与后处理守护启动
1730 1884
1731 完成项: 1885 完成项:
...@@ -1882,6 +2036,28 @@ ...@@ -1882,6 +2036,28 @@
1882 2036
1883 ## 2026-06-02 2037 ## 2026-06-02
1884 2038
2039 ### Stage: 真实 FMA 守护链路掉线恢复
2040
2041 完成项:
2042 - 再次复检 FMA 下载进度
2043 - 复检后台等待器是否仍存活
2044 - 发现等待器已退出后,重新拉起自动等待与后处理守护链路
2045
2046 验证结果:
2047 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
2048 - `archive_size=3650322432`
2049 - `archive_progress_percent=47.5327`
2050 - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行
2051 - 等待器日志文件存在但为空:
2052 - `acr-engine/.omx_wait_for_fma.log`
2053 - 重新启动后,进程确认恢复:
2054 - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400`
2055 - 新守护进程 pid:`51526`
2056
2057 结论:
2058 - 真实 FMA 下载仍在持续推进
2059 - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态
2060
1885 ### Stage: 真实 FMA 自动等待与后处理守护启动 2061 ### Stage: 真实 FMA 自动等待与后处理守护启动
1886 2062
1887 完成项: 2063 完成项:
......