coverhunter_env_setup.md
2.68 KB
CoverHunter 环境安装与验证
1. 目标解释器
本专题统一使用:
/usr/local/miniconda3/bin/python
2. 自动化脚本
已新增环境安装与验证脚本:
acr-engine/scripts/setup_coverhunter_env.py
执行方式:
/usr/local/miniconda3/bin/python acr-engine/scripts/setup_coverhunter_env.py
它会自动:
- 安装
requirements.txt - 补充训练依赖:
torchtorchaudiotransformershuggingface_hublibrosasoundfileaudiomentations
- 进行环境验证
- 生成报告:
acr-engine/reports/coverhunter_env_setup_report.json
3. 当前自动化执行结果
本次已经自动执行完成。
报告文件:
acr-engine/reports/coverhunter_env_setup_report.json
当前结论:
- Python 包安装:成功
-
torch/transformers/librosa/soundfile/audiomentations:已安装 - 但
torch.cuda.is_available()当前返回:False
4. 当前 GPU 阻塞点
虽然系统存在 NVIDIA GPU,且 nvidia-smi 可见设备,但当前 PyTorch CUDA 初始化失败。
报告中的核心告警是:
- The NVIDIA driver on your system is too old
这说明:
- 当前安装到环境里的
torch 2.12.0+cu130 - 与当前系统驱动版本不兼容
也就是说:
- 环境依赖已经安装好了
- 但当前 GPU 训练还不能真正启用
- 原因不是代码问题,而是 PyTorch CUDA 版本与驱动版本不匹配
5. 当前状态怎么理解
现在的环境状态可以分成两部分:
已经完成的
- 训练依赖已安装
- 训练脚本可执行
- MERT / ECAPA 双流代码可 import
- 文档和配置已准备好
仍未完成的
- CUDA 版 torch 与当前 NVIDIA driver 的匹配
6. 下一步建议
要让 GPU 真正可用,需要二选一:
方案 A:升级 NVIDIA 驱动
优点:
- 可以保留当前较新的 torch/cu130 组合
- 后续兼容性更好
方案 B:安装与当前驱动兼容的更低 CUDA 版本 torch
优点:
- 不改系统驱动
- 更适合当前机器直接落地
对当前项目而言,我更建议:
- 优先采用方案 B
- 安装与当前驱动兼容的 torch 版本
7. 当前专题与环境文档关系
配套文件如下:
- 训练专题:
docs/coverhunter_finetune_topic.md - 训练流程:
docs/coverhunter_training_process.md - 环境文档:
docs/coverhunter_env_setup.md - 环境报告:
acr-engine/reports/coverhunter_env_setup_report.json
8. 当前结论
当前已经自动完成:
- 环境依赖安装
- 环境验证
- 结果记录
目前唯一阻塞 GPU 训练的点是:
- CUDA / 驱动 / torch 版本不匹配