coverhunter_env_setup.md 2.68 KB

CoverHunter 环境安装与验证

1. 目标解释器

本专题统一使用:

/usr/local/miniconda3/bin/python

2. 自动化脚本

已新增环境安装与验证脚本:

acr-engine/scripts/setup_coverhunter_env.py

执行方式:

/usr/local/miniconda3/bin/python acr-engine/scripts/setup_coverhunter_env.py

它会自动:

  1. 安装 requirements.txt
  2. 补充训练依赖:
    • torch
    • torchaudio
    • transformers
    • huggingface_hub
    • librosa
    • soundfile
    • audiomentations
  3. 进行环境验证
  4. 生成报告:
acr-engine/reports/coverhunter_env_setup_report.json

3. 当前自动化执行结果

本次已经自动执行完成。

报告文件:

acr-engine/reports/coverhunter_env_setup_report.json

当前结论:

  • Python 包安装:成功
  • torch / transformers / librosa / soundfile / audiomentations已安装
  • torch.cuda.is_available() 当前返回:False

4. 当前 GPU 阻塞点

虽然系统存在 NVIDIA GPU,且 nvidia-smi 可见设备,但当前 PyTorch CUDA 初始化失败。

报告中的核心告警是:

  • The NVIDIA driver on your system is too old

这说明:

  • 当前安装到环境里的 torch 2.12.0+cu130
  • 与当前系统驱动版本不兼容

也就是说:

  • 环境依赖已经安装好了
  • 但当前 GPU 训练还不能真正启用
  • 原因不是代码问题,而是 PyTorch CUDA 版本与驱动版本不匹配

5. 当前状态怎么理解

现在的环境状态可以分成两部分:

已经完成的

  • 训练依赖已安装
  • 训练脚本可执行
  • MERT / ECAPA 双流代码可 import
  • 文档和配置已准备好

仍未完成的

  • CUDA 版 torch 与当前 NVIDIA driver 的匹配

6. 下一步建议

要让 GPU 真正可用,需要二选一:

方案 A:升级 NVIDIA 驱动

优点:

  • 可以保留当前较新的 torch/cu130 组合
  • 后续兼容性更好

方案 B:安装与当前驱动兼容的更低 CUDA 版本 torch

优点:

  • 不改系统驱动
  • 更适合当前机器直接落地

对当前项目而言,我更建议:

  • 优先采用方案 B
  • 安装与当前驱动兼容的 torch 版本

7. 当前专题与环境文档关系

配套文件如下:

  • 训练专题:docs/coverhunter_finetune_topic.md
  • 训练流程:docs/coverhunter_training_process.md
  • 环境文档:docs/coverhunter_env_setup.md
  • 环境报告:acr-engine/reports/coverhunter_env_setup_report.json

8. 当前结论

当前已经自动完成:

  • 环境依赖安装
  • 环境验证
  • 结果记录

目前唯一阻塞 GPU 训练的点是:

  • CUDA / 驱动 / torch 版本不匹配