CentOS下Nvidia docker 2.0之安裝教程&踩坑實錄
发布日期:2021-05-06 19:48:56 浏览次数:8 分类:技术文章

本文共 3008 字,大约阅读时间需要 10 分钟。

CentOS下Nvidia docker 2.0之安裝教程&踩坑實錄

前言

本篇參考,並記錄安裝過程所踩過的坑坑洞洞。

要求

官網裡列出了四個要求:

1. GNU/Linux x86_64 with kernel version > 3.10

使用uname -r查詢,筆者機器的結果為:

3.10.0-514.6.2.el7.x86_64

2. Docker >= 1.12

使用docker -v查詢,筆者機器的結果為:

Docker version 18.09.0, build 4d60db4

如果對Docker的版本有疑惑,或者是Docker版本太低,可以參考。

3. NVIDIA GPU with Architecture > Fermi (2.1)

關於查詢NVIDIA GPU architecture的方法,筆者試過到Nvidia的官網查,或是看有沒有linux指令可以查詢,但是都沒有找到。最後才在維基百科上看到一個完整列出各architecture下的GPU GeForce型號的表格。

先使用nvidia-smi -L這個指令找到顯卡的GeForce版本,結果如下:

GPU 0: GeForce GTX 1080 (UUID: GPU-5ee9e385-7299-d14b-e94c-288298ae5234)

GPU 1: GeForce GTX 1080 (UUID: GPU-2d0c6c1e-0b17-3428-f42b-7ef5ffab32e8)

然後再去中的GPUs supported這個表格查詢。

table
表格中的四個欄位分別是Compute capability(version),Micro-architecture,GPUs及GeForce。
可以從GeForce這個欄位(第四欄)找出自己的GPU,然後再回頭看它的Micro-architecture。
筆者GPU的GeForce版本是GTX 1080,所以它的micro-architecture是Pascal。
而Compute capability的順序是Turing > Volta > Pascal > Maxwell > Kepler > Fermi > Tesla。
所以筆者的GPU符合要求。

4. NVIDIA drivers ~= 361.93 (untested on older versions)

使用nvidia-smi查詢,筆者機器的結果為:

nvidia-smi
如果達不到這個要求,則需要更新顯卡驅動程式,具體步驟可以參考:

步驟

如果確認了系統、Docker版本、顯卡Architecture及顯卡驅動程式都滿足要求,就可以進入以下步驟:

1. 移除nvidia-docker 1.0

docker volume ls -q -f driver=nvidia-docker | xargs -r -I{   } -n1 docker ps -q -a -f volume={   } | xargs -r docker rm -fsudo yum remove nvidia-docker

2. 設定repository

distribution=$(. /etc/os-release;echo $ID$VERSION_ID)curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | \  sudo tee /etc/yum.repos.d/nvidia-docker.repo

3. 更新repository的key

DIST=$(sed -n 's/releasever=//p' /etc/yum.conf)DIST=${   DIST:-$(. /etc/os-release; echo $VERSION_ID)}sudo rpm -e gpg-pubkey-f796ecb0sudo gpg --homedir /var/lib/yum/repos/$(uname -m)/$DIST/nvidia-docker/gpgdir --delete-key f796ecb0sudo yum makecache

4. 安裝nvidia-docker 2.0

sudo yum install nvidia-docker2

5. 重新載入Docker daemon的設定

sudo pkill -SIGHUP dockerd

6. 測試安裝是否成功

docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi

踩坑實錄

  1. 筆者在第三步碰到了以下錯誤:

[Errno 14] HTTPS Error 404 - Not Found

如果碰到同樣的錯誤,可以前往查看。

  1. 在第六步的時候又碰到了另一個錯誤:

docker: Error response from daemon: Unknown runtime specified nvidia.

See ‘docker run --help’.

如果碰到同樣的錯誤,可以前往查看。

  1. 在第六步還有可能碰到另一個錯誤:

docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused “process_linux.go:402: container init caused “process_linux.go:385: running prestart hook 1 caused \“error running hook: exit status 1, stdout: , stderr: exec command: [/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig --device=0,1 --compute --utility --require=cuda>=8.0 --pid=4693 /var/lib/docker/overlay/e70cf536e76f503847825ad1bb8cbfca5a03466bf36be4148e9fe6659e85c2b9/merged]\\nnvidia-container-cli: initialization error: cuda error: no cuda-capable device is detected\\n\”””: unknown.

nvidia-smi,出現:

NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

這代表需要安裝Nvidia driver,有詳細的教學。

參考連結

上一篇:如何在30秒內建構Spark環境--使用docker-compose 踩坑實錄
下一篇:CentOS 7下最新版Docker CE之無腦安裝教程&踩坑實錄

发表评论

最新留言

关注你微信了!
[***.104.42.241]2025年04月01日 03时17分18秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

计算机专业【本科生】毕业还不如【专科生】? 2019-03-03
考研408联盟新添一所985!某知名大学专业课改用408! 2019-03-03
最有钱的大学是哪个?教育部直属高校公布2018年决算 2019-03-03
408的逆袭!武汉大学所有计算机/软件专业都改为408! 2019-03-03
408又多一所学校!广东某大学专业课改为408! 2019-03-03
【报名问题】考研现场确认时发现报考点选错了怎么办? 2019-03-03
提醒 | 未下载打印准考证的考生,不能参加2020年考研初试 2019-03-03
【调剂】其它计算机/软件调剂信息 20.4.21 2019-03-03
【调剂】华侨大学媒体分析与数据挖掘小组招收学硕调剂生 2019-03-03
分数线385!平均分399!985大学计算机的真正“实力”! 2019-03-03
【调剂】211云南大学2020年硕士研究生招生调剂通知 2019-03-03
【调剂】985复旦大学类脑智能科学与技术研究院硕士研究生招生接收校内调剂考生工作细则... 2019-03-03
【调剂】沈阳航空航天大学2020年硕士研究生调剂信息 2019-03-03
最新!薪酬最高的大学本科专业公布! 2019-03-03
2021考研数学,如何利用错题高效拿分? 2019-03-03
【调剂】上海应用技术大学2021年硕士研究生招生考试调剂信息 2019-03-03
【调剂】沈阳理工大学 环境科学与工程,材料与化工、化学工程与技术,有调剂名额,相关专业可跨专业... 2019-03-03
2021QS计算机专业排名发布:MIT斯坦福霸榜,清华北大进入前20 2019-03-03
wxpython配合MySQL数据库完成用户登录页面的设计 2019-03-03
JavaScript学习手册(45) 2019-03-03