Commit 55dea0c9 55dea0c93f070946b0199e21b55680c88f59ba2e by cnb.bofCdSsphPA

Record the live FMA download gate before real-data validation

Constraint: Real-data smoke cannot be claimed before the user-provided archive is fully downloaded and locally inspectable.
Rejected: Pretending readiness from partial bytes | That would create false verification evidence for the dataset lane.
Confidence: high
Scope-risk: narrow
Directive: Do not run real FMA extraction or smoke until inspect reports the full expected archive size.
Tested: Re-ran the archive inspect command and confirmed the active background curl process plus current local file size.
Not-tested: Extraction, local preparation, and real FMA smoke remain pending until the archive completes.
1 parent a4c891da
...@@ -2,6 +2,28 @@ ...@@ -2,6 +2,28 @@
2 2
3 ## 2026-06-02 3 ## 2026-06-02
4 4
5 ### Stage: 真实 FMA 下载状态续验
6
7 完成项:
8 - 复检用户指定 FMA 源下载状态:`https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
9 - 复检后台下载进程与本地归档体积
10 - 确认当前仍未达到可解压/可真实 smoke 的完成门槛
11
12 验证结果:
13 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
14 - `archive_bytes_expected=7679594875`
15 - `archive_size=3117514752`
16 - `archive_progress_percent=40.5948`
17 - `num_audio_files=0`
18 - 后台下载进程仍存活:
19 - `curl -L --continue-at - --output data/raw/fma_small.zip https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
20 - 当前本地归档文件:
21 - `data/raw/fma_small.zip = 3.0G`
22
23 结论:
24 - 当前主卡点仍是 FMA 归档未完整下载
25 - 真实 FMA 的解压、prepare、smoke-local 需要等待归档达到完整体积后继续
26
5 ### Stage: 训练数据与 pgvector 专项说明补强 27 ### Stage: 训练数据与 pgvector 专项说明补强
6 28
7 完成项: 29 完成项:
...@@ -841,6 +863,28 @@ ...@@ -841,6 +863,28 @@
841 863
842 ## 2026-06-02 864 ## 2026-06-02
843 865
866 ### Stage: 真实 FMA 下载状态续验
867
868 完成项:
869 - 复检用户指定 FMA 源下载状态:`https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
870 - 复检后台下载进程与本地归档体积
871 - 确认当前仍未达到可解压/可真实 smoke 的完成门槛
872
873 验证结果:
874 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
875 - `archive_bytes_expected=7679594875`
876 - `archive_size=3117514752`
877 - `archive_progress_percent=40.5948`
878 - `num_audio_files=0`
879 - 后台下载进程仍存活:
880 - `curl -L --continue-at - --output data/raw/fma_small.zip https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
881 - 当前本地归档文件:
882 - `data/raw/fma_small.zip = 3.0G`
883
884 结论:
885 - 当前主卡点仍是 FMA 归档未完整下载
886 - 真实 FMA 的解压、prepare、smoke-local 需要等待归档达到完整体积后继续
887
844 ### Stage: 训练数据与 pgvector 专项说明补强 888 ### Stage: 训练数据与 pgvector 专项说明补强
845 889
846 完成项: 890 完成项:
...@@ -890,6 +934,28 @@ ...@@ -890,6 +934,28 @@
890 934
891 ## 2026-06-02 935 ## 2026-06-02
892 936
937 ### Stage: 真实 FMA 下载状态续验
938
939 完成项:
940 - 复检用户指定 FMA 源下载状态:`https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
941 - 复检后台下载进程与本地归档体积
942 - 确认当前仍未达到可解压/可真实 smoke 的完成门槛
943
944 验证结果:
945 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
946 - `archive_bytes_expected=7679594875`
947 - `archive_size=3117514752`
948 - `archive_progress_percent=40.5948`
949 - `num_audio_files=0`
950 - 后台下载进程仍存活:
951 - `curl -L --continue-at - --output data/raw/fma_small.zip https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
952 - 当前本地归档文件:
953 - `data/raw/fma_small.zip = 3.0G`
954
955 结论:
956 - 当前主卡点仍是 FMA 归档未完整下载
957 - 真实 FMA 的解压、prepare、smoke-local 需要等待归档达到完整体积后继续
958
893 ### Stage: 训练数据与 pgvector 专项说明补强 959 ### Stage: 训练数据与 pgvector 专项说明补强
894 960
895 完成项: 961 完成项:
...@@ -949,6 +1015,28 @@ ...@@ -949,6 +1015,28 @@
949 1015
950 ## 2026-06-02 1016 ## 2026-06-02
951 1017
1018 ### Stage: 真实 FMA 下载状态续验
1019
1020 完成项:
1021 - 复检用户指定 FMA 源下载状态:`https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
1022 - 复检后台下载进程与本地归档体积
1023 - 确认当前仍未达到可解压/可真实 smoke 的完成门槛
1024
1025 验证结果:
1026 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
1027 - `archive_bytes_expected=7679594875`
1028 - `archive_size=3117514752`
1029 - `archive_progress_percent=40.5948`
1030 - `num_audio_files=0`
1031 - 后台下载进程仍存活:
1032 - `curl -L --continue-at - --output data/raw/fma_small.zip https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
1033 - 当前本地归档文件:
1034 - `data/raw/fma_small.zip = 3.0G`
1035
1036 结论:
1037 - 当前主卡点仍是 FMA 归档未完整下载
1038 - 真实 FMA 的解压、prepare、smoke-local 需要等待归档达到完整体积后继续
1039
952 ### Stage: 训练数据与 pgvector 专项说明补强 1040 ### Stage: 训练数据与 pgvector 专项说明补强
953 1041
954 完成项: 1042 完成项:
...@@ -998,6 +1086,28 @@ ...@@ -998,6 +1086,28 @@
998 1086
999 ## 2026-06-02 1087 ## 2026-06-02
1000 1088
1089 ### Stage: 真实 FMA 下载状态续验
1090
1091 完成项:
1092 - 复检用户指定 FMA 源下载状态:`https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
1093 - 复检后台下载进程与本地归档体积
1094 - 确认当前仍未达到可解压/可真实 smoke 的完成门槛
1095
1096 验证结果:
1097 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
1098 - `archive_bytes_expected=7679594875`
1099 - `archive_size=3117514752`
1100 - `archive_progress_percent=40.5948`
1101 - `num_audio_files=0`
1102 - 后台下载进程仍存活:
1103 - `curl -L --continue-at - --output data/raw/fma_small.zip https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
1104 - 当前本地归档文件:
1105 - `data/raw/fma_small.zip = 3.0G`
1106
1107 结论:
1108 - 当前主卡点仍是 FMA 归档未完整下载
1109 - 真实 FMA 的解压、prepare、smoke-local 需要等待归档达到完整体积后继续
1110
1001 ### Stage: 训练数据与 pgvector 专项说明补强 1111 ### Stage: 训练数据与 pgvector 专项说明补强
1002 1112
1003 完成项: 1113 完成项:
...@@ -1045,6 +1155,28 @@ ...@@ -1045,6 +1155,28 @@
1045 1155
1046 ## 2026-06-02 1156 ## 2026-06-02
1047 1157
1158 ### Stage: 真实 FMA 下载状态续验
1159
1160 完成项:
1161 - 复检用户指定 FMA 源下载状态:`https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
1162 - 复检后台下载进程与本地归档体积
1163 - 确认当前仍未达到可解压/可真实 smoke 的完成门槛
1164
1165 验证结果:
1166 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
1167 - `archive_bytes_expected=7679594875`
1168 - `archive_size=3117514752`
1169 - `archive_progress_percent=40.5948`
1170 - `num_audio_files=0`
1171 - 后台下载进程仍存活:
1172 - `curl -L --continue-at - --output data/raw/fma_small.zip https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
1173 - 当前本地归档文件:
1174 - `data/raw/fma_small.zip = 3.0G`
1175
1176 结论:
1177 - 当前主卡点仍是 FMA 归档未完整下载
1178 - 真实 FMA 的解压、prepare、smoke-local 需要等待归档达到完整体积后继续
1179
1048 ### Stage: 训练数据与 pgvector 专项说明补强 1180 ### Stage: 训练数据与 pgvector 专项说明补强
1049 1181
1050 完成项: 1182 完成项:
...@@ -1090,6 +1222,28 @@ ...@@ -1090,6 +1222,28 @@
1090 1222
1091 ## 2026-06-02 1223 ## 2026-06-02
1092 1224
1225 ### Stage: 真实 FMA 下载状态续验
1226
1227 完成项:
1228 - 复检用户指定 FMA 源下载状态:`https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
1229 - 复检后台下载进程与本地归档体积
1230 - 确认当前仍未达到可解压/可真实 smoke 的完成门槛
1231
1232 验证结果:
1233 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
1234 - `archive_bytes_expected=7679594875`
1235 - `archive_size=3117514752`
1236 - `archive_progress_percent=40.5948`
1237 - `num_audio_files=0`
1238 - 后台下载进程仍存活:
1239 - `curl -L --continue-at - --output data/raw/fma_small.zip https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
1240 - 当前本地归档文件:
1241 - `data/raw/fma_small.zip = 3.0G`
1242
1243 结论:
1244 - 当前主卡点仍是 FMA 归档未完整下载
1245 - 真实 FMA 的解压、prepare、smoke-local 需要等待归档达到完整体积后继续
1246
1093 ### Stage: 训练数据与 pgvector 专项说明补强 1247 ### Stage: 训练数据与 pgvector 专项说明补强
1094 1248
1095 完成项: 1249 完成项:
...@@ -1140,6 +1294,28 @@ ...@@ -1140,6 +1294,28 @@
1140 1294
1141 ## 2026-06-02 1295 ## 2026-06-02
1142 1296
1297 ### Stage: 真实 FMA 下载状态续验
1298
1299 完成项:
1300 - 复检用户指定 FMA 源下载状态:`https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
1301 - 复检后台下载进程与本地归档体积
1302 - 确认当前仍未达到可解压/可真实 smoke 的完成门槛
1303
1304 验证结果:
1305 - `/usr/local/miniconda3/bin/python scripts/prepare_fma_archive.py inspect` 返回:
1306 - `archive_bytes_expected=7679594875`
1307 - `archive_size=3117514752`
1308 - `archive_progress_percent=40.5948`
1309 - `num_audio_files=0`
1310 - 后台下载进程仍存活:
1311 - `curl -L --continue-at - --output data/raw/fma_small.zip https://modelscope.cn/datasets/pengzhendong/fma/resolve/master/fma_small.zip`
1312 - 当前本地归档文件:
1313 - `data/raw/fma_small.zip = 3.0G`
1314
1315 结论:
1316 - 当前主卡点仍是 FMA 归档未完整下载
1317 - 真实 FMA 的解压、prepare、smoke-local 需要等待归档达到完整体积后继续
1318
1143 ### Stage: 训练数据与 pgvector 专项说明补强 1319 ### Stage: 训练数据与 pgvector 专项说明补强
1144 1320
1145 完成项: 1321 完成项:
......