Recover the FMA post-download waiter after detecting it had dropped
Constraint: The real-data lane should not rely on a dead background handoff process while a long download is still in flight. Rejected: Assuming the prior waiter was still alive | A direct process check showed it was gone. Confidence: high Scope-risk: narrow Directive: Re-check waiter liveness during subsequent progress audits and restart it whenever it drops before archive completion. Tested: Re-ran archive inspect, verified the waiter was absent, confirmed the empty log file, restarted the waiter, and validated the new live process. Not-tested: The restarted waiter has not yet handed off to extraction because the archive remains incomplete.
Showing
1 changed file
with
176 additions
and
0 deletions
| ... | @@ -2,6 +2,28 @@ | ... | @@ -2,6 +2,28 @@ |
| 2 | 2 | ||
| 3 | ## 2026-06-02 | 3 | ## 2026-06-02 |
| 4 | 4 | ||
| 5 | ### Stage: 真实 FMA 守护链路掉线恢复 | ||
| 6 | |||
| 7 | 完成项: | ||
| 8 | - 再次复检 FMA 下载进度 | ||
| 9 | - 复检后台等待器是否仍存活 | ||
| 10 | - 发现等待器已退出后,重新拉起自动等待与后处理守护链路 | ||
| 11 | |||
| 12 | 验证结果: | ||
| 13 | - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回: | ||
| 14 | - `archive_size=3650322432` | ||
| 15 | - `archive_progress_percent=47.5327` | ||
| 16 | - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行 | ||
| 17 | - 等待器日志文件存在但为空: | ||
| 18 | - `acr-engine/.omx_wait_for_fma.log` | ||
| 19 | - 重新启动后,进程确认恢复: | ||
| 20 | - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` | ||
| 21 | - 新守护进程 pid:`51526` | ||
| 22 | |||
| 23 | 结论: | ||
| 24 | - 真实 FMA 下载仍在持续推进 | ||
| 25 | - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态 | ||
| 26 | |||
| 5 | ### Stage: 真实 FMA 自动等待与后处理守护启动 | 27 | ### Stage: 真实 FMA 自动等待与后处理守护启动 |
| 6 | 28 | ||
| 7 | 完成项: | 29 | 完成项: |
| ... | @@ -947,6 +969,28 @@ | ... | @@ -947,6 +969,28 @@ |
| 947 | 969 | ||
| 948 | ## 2026-06-02 | 970 | ## 2026-06-02 |
| 949 | 971 | ||
| 972 | ### Stage: 真实 FMA 守护链路掉线恢复 | ||
| 973 | |||
| 974 | 完成项: | ||
| 975 | - 再次复检 FMA 下载进度 | ||
| 976 | - 复检后台等待器是否仍存活 | ||
| 977 | - 发现等待器已退出后,重新拉起自动等待与后处理守护链路 | ||
| 978 | |||
| 979 | 验证结果: | ||
| 980 | - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回: | ||
| 981 | - `archive_size=3650322432` | ||
| 982 | - `archive_progress_percent=47.5327` | ||
| 983 | - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行 | ||
| 984 | - 等待器日志文件存在但为空: | ||
| 985 | - `acr-engine/.omx_wait_for_fma.log` | ||
| 986 | - 重新启动后,进程确认恢复: | ||
| 987 | - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` | ||
| 988 | - 新守护进程 pid:`51526` | ||
| 989 | |||
| 990 | 结论: | ||
| 991 | - 真实 FMA 下载仍在持续推进 | ||
| 992 | - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态 | ||
| 993 | |||
| 950 | ### Stage: 真实 FMA 自动等待与后处理守护启动 | 994 | ### Stage: 真实 FMA 自动等待与后处理守护启动 |
| 951 | 995 | ||
| 952 | 完成项: | 996 | 完成项: |
| ... | @@ -1102,6 +1146,28 @@ | ... | @@ -1102,6 +1146,28 @@ |
| 1102 | 1146 | ||
| 1103 | ## 2026-06-02 | 1147 | ## 2026-06-02 |
| 1104 | 1148 | ||
| 1149 | ### Stage: 真实 FMA 守护链路掉线恢复 | ||
| 1150 | |||
| 1151 | 完成项: | ||
| 1152 | - 再次复检 FMA 下载进度 | ||
| 1153 | - 复检后台等待器是否仍存活 | ||
| 1154 | - 发现等待器已退出后,重新拉起自动等待与后处理守护链路 | ||
| 1155 | |||
| 1156 | 验证结果: | ||
| 1157 | - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回: | ||
| 1158 | - `archive_size=3650322432` | ||
| 1159 | - `archive_progress_percent=47.5327` | ||
| 1160 | - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行 | ||
| 1161 | - 等待器日志文件存在但为空: | ||
| 1162 | - `acr-engine/.omx_wait_for_fma.log` | ||
| 1163 | - 重新启动后,进程确认恢复: | ||
| 1164 | - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` | ||
| 1165 | - 新守护进程 pid:`51526` | ||
| 1166 | |||
| 1167 | 结论: | ||
| 1168 | - 真实 FMA 下载仍在持续推进 | ||
| 1169 | - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态 | ||
| 1170 | |||
| 1105 | ### Stage: 真实 FMA 自动等待与后处理守护启动 | 1171 | ### Stage: 真实 FMA 自动等待与后处理守护启动 |
| 1106 | 1172 | ||
| 1107 | 完成项: | 1173 | 完成项: |
| ... | @@ -1267,6 +1333,28 @@ | ... | @@ -1267,6 +1333,28 @@ |
| 1267 | 1333 | ||
| 1268 | ## 2026-06-02 | 1334 | ## 2026-06-02 |
| 1269 | 1335 | ||
| 1336 | ### Stage: 真实 FMA 守护链路掉线恢复 | ||
| 1337 | |||
| 1338 | 完成项: | ||
| 1339 | - 再次复检 FMA 下载进度 | ||
| 1340 | - 复检后台等待器是否仍存活 | ||
| 1341 | - 发现等待器已退出后,重新拉起自动等待与后处理守护链路 | ||
| 1342 | |||
| 1343 | 验证结果: | ||
| 1344 | - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回: | ||
| 1345 | - `archive_size=3650322432` | ||
| 1346 | - `archive_progress_percent=47.5327` | ||
| 1347 | - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行 | ||
| 1348 | - 等待器日志文件存在但为空: | ||
| 1349 | - `acr-engine/.omx_wait_for_fma.log` | ||
| 1350 | - 重新启动后,进程确认恢复: | ||
| 1351 | - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` | ||
| 1352 | - 新守护进程 pid:`51526` | ||
| 1353 | |||
| 1354 | 结论: | ||
| 1355 | - 真实 FMA 下载仍在持续推进 | ||
| 1356 | - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态 | ||
| 1357 | |||
| 1270 | ### Stage: 真实 FMA 自动等待与后处理守护启动 | 1358 | ### Stage: 真实 FMA 自动等待与后处理守护启动 |
| 1271 | 1359 | ||
| 1272 | 完成项: | 1360 | 完成项: |
| ... | @@ -1422,6 +1510,28 @@ | ... | @@ -1422,6 +1510,28 @@ |
| 1422 | 1510 | ||
| 1423 | ## 2026-06-02 | 1511 | ## 2026-06-02 |
| 1424 | 1512 | ||
| 1513 | ### Stage: 真实 FMA 守护链路掉线恢复 | ||
| 1514 | |||
| 1515 | 完成项: | ||
| 1516 | - 再次复检 FMA 下载进度 | ||
| 1517 | - 复检后台等待器是否仍存活 | ||
| 1518 | - 发现等待器已退出后,重新拉起自动等待与后处理守护链路 | ||
| 1519 | |||
| 1520 | 验证结果: | ||
| 1521 | - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回: | ||
| 1522 | - `archive_size=3650322432` | ||
| 1523 | - `archive_progress_percent=47.5327` | ||
| 1524 | - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行 | ||
| 1525 | - 等待器日志文件存在但为空: | ||
| 1526 | - `acr-engine/.omx_wait_for_fma.log` | ||
| 1527 | - 重新启动后,进程确认恢复: | ||
| 1528 | - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` | ||
| 1529 | - 新守护进程 pid:`51526` | ||
| 1530 | |||
| 1531 | 结论: | ||
| 1532 | - 真实 FMA 下载仍在持续推进 | ||
| 1533 | - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态 | ||
| 1534 | |||
| 1425 | ### Stage: 真实 FMA 自动等待与后处理守护启动 | 1535 | ### Stage: 真实 FMA 自动等待与后处理守护启动 |
| 1426 | 1536 | ||
| 1427 | 完成项: | 1537 | 完成项: |
| ... | @@ -1575,6 +1685,28 @@ | ... | @@ -1575,6 +1685,28 @@ |
| 1575 | 1685 | ||
| 1576 | ## 2026-06-02 | 1686 | ## 2026-06-02 |
| 1577 | 1687 | ||
| 1688 | ### Stage: 真实 FMA 守护链路掉线恢复 | ||
| 1689 | |||
| 1690 | 完成项: | ||
| 1691 | - 再次复检 FMA 下载进度 | ||
| 1692 | - 复检后台等待器是否仍存活 | ||
| 1693 | - 发现等待器已退出后,重新拉起自动等待与后处理守护链路 | ||
| 1694 | |||
| 1695 | 验证结果: | ||
| 1696 | - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回: | ||
| 1697 | - `archive_size=3650322432` | ||
| 1698 | - `archive_progress_percent=47.5327` | ||
| 1699 | - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行 | ||
| 1700 | - 等待器日志文件存在但为空: | ||
| 1701 | - `acr-engine/.omx_wait_for_fma.log` | ||
| 1702 | - 重新启动后,进程确认恢复: | ||
| 1703 | - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` | ||
| 1704 | - 新守护进程 pid:`51526` | ||
| 1705 | |||
| 1706 | 结论: | ||
| 1707 | - 真实 FMA 下载仍在持续推进 | ||
| 1708 | - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态 | ||
| 1709 | |||
| 1578 | ### Stage: 真实 FMA 自动等待与后处理守护启动 | 1710 | ### Stage: 真实 FMA 自动等待与后处理守护启动 |
| 1579 | 1711 | ||
| 1580 | 完成项: | 1712 | 完成项: |
| ... | @@ -1726,6 +1858,28 @@ | ... | @@ -1726,6 +1858,28 @@ |
| 1726 | 1858 | ||
| 1727 | ## 2026-06-02 | 1859 | ## 2026-06-02 |
| 1728 | 1860 | ||
| 1861 | ### Stage: 真实 FMA 守护链路掉线恢复 | ||
| 1862 | |||
| 1863 | 完成项: | ||
| 1864 | - 再次复检 FMA 下载进度 | ||
| 1865 | - 复检后台等待器是否仍存活 | ||
| 1866 | - 发现等待器已退出后,重新拉起自动等待与后处理守护链路 | ||
| 1867 | |||
| 1868 | 验证结果: | ||
| 1869 | - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回: | ||
| 1870 | - `archive_size=3650322432` | ||
| 1871 | - `archive_progress_percent=47.5327` | ||
| 1872 | - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行 | ||
| 1873 | - 等待器日志文件存在但为空: | ||
| 1874 | - `acr-engine/.omx_wait_for_fma.log` | ||
| 1875 | - 重新启动后,进程确认恢复: | ||
| 1876 | - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` | ||
| 1877 | - 新守护进程 pid:`51526` | ||
| 1878 | |||
| 1879 | 结论: | ||
| 1880 | - 真实 FMA 下载仍在持续推进 | ||
| 1881 | - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态 | ||
| 1882 | |||
| 1729 | ### Stage: 真实 FMA 自动等待与后处理守护启动 | 1883 | ### Stage: 真实 FMA 自动等待与后处理守护启动 |
| 1730 | 1884 | ||
| 1731 | 完成项: | 1885 | 完成项: |
| ... | @@ -1882,6 +2036,28 @@ | ... | @@ -1882,6 +2036,28 @@ |
| 1882 | 2036 | ||
| 1883 | ## 2026-06-02 | 2037 | ## 2026-06-02 |
| 1884 | 2038 | ||
| 2039 | ### Stage: 真实 FMA 守护链路掉线恢复 | ||
| 2040 | |||
| 2041 | 完成项: | ||
| 2042 | - 再次复检 FMA 下载进度 | ||
| 2043 | - 复检后台等待器是否仍存活 | ||
| 2044 | - 发现等待器已退出后,重新拉起自动等待与后处理守护链路 | ||
| 2045 | |||
| 2046 | 验证结果: | ||
| 2047 | - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回: | ||
| 2048 | - `archive_size=3650322432` | ||
| 2049 | - `archive_progress_percent=47.5327` | ||
| 2050 | - 复检时未发现 `wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` 仍在运行 | ||
| 2051 | - 等待器日志文件存在但为空: | ||
| 2052 | - `acr-engine/.omx_wait_for_fma.log` | ||
| 2053 | - 重新启动后,进程确认恢复: | ||
| 2054 | - `/usr/local/miniconda3/bin/python scripts/wait_for_fma_and_prepare.py --interval 30 --max-cycles 400` | ||
| 2055 | - 新守护进程 pid:`51526` | ||
| 2056 | |||
| 2057 | 结论: | ||
| 2058 | - 真实 FMA 下载仍在持续推进 | ||
| 2059 | - 自动承接链路曾短暂掉线,但现在已恢复到“下载完成后自动后处理”的可继续状态 | ||
| 2060 | |||
| 1885 | ### Stage: 真实 FMA 自动等待与后处理守护启动 | 2061 | ### Stage: 真实 FMA 自动等待与后处理守护启动 |
| 1886 | 2062 | ||
| 1887 | 完成项: | 2063 | 完成项: | ... | ... |
-
Please register or sign in to post a comment