在Ubuntu下安装PyTorch时可能会遇到各种问题,以下是一些常见的排查步骤和解决方案:
常见问题及解决方案
-
CUDA未安装或版本不匹配
- 检查CUDA是否安装:运行
nvcc --version
,如果显示"command not found",说明CUDA没有安装或者环境变量没有配置好。 - 安装合适版本的CUDA:使用以下命令安装CUDA Toolkit:
sudo apt update sudo apt install nvidia-cuda-toolkit
- 配置环境变量:在~/.bashrc文件末尾添加:
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
然后执行:source ~/.bashrc
- 检查CUDA是否安装:运行
-
PyTorch版本不正确
- 卸载当前PyTorch并安装支持CUDA的版本:
pip uninstall torch torchvision torchaudio pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
- 卸载当前PyTorch并安装支持CUDA的版本:
-
GPU太旧不被支持
- 使用旧版PyTorch:安装支持你GPU的旧版PyTorch。
- 使用CPU模式:虽然速度慢,但可以运行。
- 升级硬件。
-
网络问题导致安装失败
- 使用清华镜像源加速安装:
pip3 --default-timeout 1000 install --index-url https://mirrors.aliyun.com/pypi/simple torch torchvision torchaudio
- 使用清华镜像源加速安装:
-
依赖库缺失
- 安装缺失的依赖库:例如,如果提示缺少
pandas
,可以使用以下命令安装:conda install pandas
- 安装缺失的依赖库:例如,如果提示缺少
-
使用Anaconda安装
- 安装Anaconda或Miniconda:
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh
- 创建虚拟环境并激活:
conda create -n your-virtualenv-name python=3.8 conda activate your-virtualenv-name
- 使用Conda安装PyTorch:
conda install pytorch torchvision torchaudio cudatoolkit=11.7 -c pytorch
- 安装Anaconda或Miniconda:
-
验证安装
- 安装成功后,运行以下命令验证PyTorch是否成功安装:
import torch print(torch.__version__) print(torch.cuda.is_available())
- 安装成功后,运行以下命令验证PyTorch是否成功安装: