2023/01/25 12:01
昨天搞完了本地的Docker环境,本地的服务器环境就主要丢在X220的机器上,虚拟机以及虚拟机上的Docker也方便迁移,平时注意做好备份就可以了。
接下来准备折腾一下,天衍平台上的环境。由于没有root权限,只能动动jupyter以及python环境的主意。看看有没有希望把notebook升级成jupyter-lab,哪怕可以加载插件也是好的。看了一下环境,pid=1的进程并不是python,应该还是可以重启然后再处理的。
做的虚拟机放在SumsungX900L上面。
下面具体记录下:
Cuda
原环境是10.2的Cuda环境,Cuda10.2的安装方法如下:
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804-10-2-local-10.2.89-440.33.01_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-10-2-local-10.2.89-440.33.01/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda
至于目前最新的Cuda12:
## 没有root权限,无法安装
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.0.0/local_installers/cuda-repo-ubuntu2004-12-0-local_12.0.0-525.60.13-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-12-0-local_12.0.0-525.60.13-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-12-0-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda
Pytorch
10.2版本Cuda配合下的Pytorch安装方法如下:https://pytorch.org/get-started/previous-versions/
结果新建在线编码的容器的时候,卡在了在线编码的环节。等节后再折腾吧……
另外,原有完整的环境应该在此目录下:960000001104
,新生成的备份文件在/nfsai
目录下,网络测试工具在/nfsnai/branchNT/notebook/322/960000000704/usr/bin
目录下。
最终一个比较好的解决方案,是重新编译了Python3.8,然后用virtualenv
做一个虚拟环境,接着就是看能不能杀完进程之后再顺利的启动jupyter-lab
。但是目前这个仅剩的容器有点不敢折腾,等节后所有的都能正常的启动起来再说吧……
2023年01月25日