服务器配置深度学习环境
准备材料
Anaconda3-2021.05-Linux-x86_64.sh -- 含python 3.8.8
cuda_11.1.1_455.32.00_linux.run -- CUDA toolkit
cudnn-11.1-linux-x64-v8.0.5.39.tgz -- cuDNN
安装Anaconda
进入安装包所在文件夹,执行: sh Anaconda3-2021.05-Linux-x86_64.sh
按提示安装,确保安装路径开头是/data01/home/用户名/
安装完后会有一些说明,按照说明执行相应命令初始化conda环境即可。
完成后重新登录,执行conda –V可以看到如下结果:
最后配置conda源为清华源,这样安装python扩展包速度很快
打开网址:https://mirror.tuna.tsinghua.edu.cn/help/anaconda/
编辑文件:vim ~/.condarc
输入网址中的如下内容,保存:
pypi源也配置一下:
pip3 install pip -U
pip3 config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
安装PyTorch
登录到工作节点1,执行nvidia-smi,看到cuda版本是11.1:
到pytorch官网https://pytorch.org/get-started/locally/,选好配置后复制红框中的命令,并将113改为111,确保版本和cuda版本一致,修改后的命令如下:
pip3 install torch==1.10.0+cu111 torchvision==0.11.1+cu111 torchaudio==0.10.0+cu111 -f https://download.pytorch.org/whl/cu111/torch_stable.html
执行该命令会下载2G+的数据,等待安装完成即可。
安装TensorFlow依赖包、TensorFlow
以安装到/data01/home/zhanghuike/nvidia/toolkit为例:
安装cuda toolkit,执行:sh cuda_11.1.1_455.32.00_linux.run --silent --toolkit --toolkitpath=/data01/home/zhanghuike/nvidia/toolkit --defaultroot=/data01/home/zhanghuike/nvidia/toolkit
安装cuDNN:将cudnn-11.1-linux-x64-v8.0.5.39.tgz解压到/data01/home/zhanghuike/nvidia/toolkit即可:
执行 tar -xf cudnn-11.1-linux-x64-v8.0.5.39.tgz -C /data01/home/zhanghuike/nvidia/toolkit/
安装TensorFlow: pip3 install tensorflow
注:Tensorflow2.6需要适配cuda11.2 cuDNN 8.1.0
tensordlow官网,可以查看版本依赖表
故此安装安装内容版本可自行更改,或安装之后进行升级更新
配置jupyter notebook
生成配置文件:
jupyter notebook --generate-config
打开配置文件:
vim ~/.jupyter/jupyter_notebook_config.py 修改如下几处:
c.NotebookApp.allow_remote_access = True
c.NotebookApp.ip = '*'
c.NotebookApp.notebook_dir = '/data01/home/zhanghuike/workspace'
c.NotebookApp.port = 45678
c.NotebookApp.quit_button = False
安装jupyter扩展,实现代码自动提示
pip3 install jupyter_contrib_nbextensions
jupyter contrib nbextension install –user
pip3 install --user jupyter_nbextensions_configurator
jupyter nbextensions_configurator enable –user
执行jupyter notebook,启动jupyter,登录jupyter网页端,启用Hinterland扩展
评论
发表评论