TeslaT4算力
『壹』 哪些主板兼容nvidia tesla T4 顯卡
華擎X99 Taichi
『貳』 騰訊雲 tesla顯卡 1/4核 怎麼用的
何選購騰訊雲GPU實例?如何優雅地安裝驅動等底層開發工具庫?這些問題給深度學習等領域研究/開發人員帶來了不少困惑。本篇教程將從實踐出發,給出基於騰訊雲GPU實例的Best Practice,徹底解決以上問題。
0x00 環境&目標
我們選擇騰訊雲目前的主流機型GPU計算機型GN7,其中搭載一顆Tesla T4 GPU。本教程採用的具體規格為GN7.5XLARGE80。這款機型有著不錯的綜合性能,20核心+80G內存,比較適合常規的深度神經網路訓練等各種應用場景。而且,它還是全球市面上同級別GPU機型中(T4)性價比最高的產品。
選購傳送門,按量計費的機型做實驗更靈活哦~
本教程中的實例機型:GN7(推薦)、GN10X等GPU機型均可以。
推薦選擇的系統鏡像:Ubuntu 18.04 (注意無需勾選「後台自動安裝GPU驅動」)
其他信息:北京五區,1M公網帶寬,系統盤大小100G。根據實際情況選擇即可。
創建實例完成後,控制檯面板可以查看實例信息:
我們將安裝目前最新的CUDA Toolkit 10.2版本、CUDNN 7.6.5版本。
讓我們這就開始吧!
0x01 CUDA Driver/Toolkit 安裝
官網網路Deb包安裝
我們去Nvidia官網下載最新的CUDA Toolkit 10.2
https://developer.nvidia.com/cuda-downloads
根據我們的環境選擇安裝下載方式,這里我們選擇網路安裝deb包的方式,如圖:
然後按照下面的提示執行命令即可
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"sudo apt-get update
sudo apt-get -y install cuda
可以看到其實就是在系統中安裝了nvidia的官方apt倉庫源,並執行了apt install cuda,很方便。只有最後一步的安裝過程稍微耗時一些,需要5分鍾左右,而且這一步有可能中間因為網路等原因中斷,重試1~2次即可。
注意:此處需要重啟伺服器。
那麼究竟安裝了什麼,以及如何驗證安裝成功呢?
驗證GPU驅動安裝 —— 設備信息查看
Nvidia GPU驅動是支持CUDA編程的內核模塊。通過上述方法安裝的驅動是以動態內核模塊(DKMS)的形式安裝的,這種內核模塊不在內核source tree中,但是可以在每次內核更新升級時自動地進行重新編譯,生成新的initramfs,並後續隨著系統啟動動態載入。總之就是,驅動只需安裝一次,非常方便。
重啟後登陸,我們來驗證驅動模塊已動態載入
可以看到,nouveau等社區驅動已經不會被載入,而是載入了nvidia的官方驅動。
驅動對應的四個內核模塊在這個目錄下:/lib/moles/4.15.0-88-generic/updates/dkms/ 。
nvidia-smi命令查看GPU設備狀態,如驅動版本(440.64.00)、CUDA版本(10.2)、型號(Tesla T4)、顯存(15109MiB)以及溫度功耗等各種信息,如圖:
驗證CUDA Toolkit安裝 —— 示例代碼編譯
CUDA Toolkit,即開發工具包,其中包括構建命令、頭文件、動態庫、文檔、代碼示例等等,安裝在/usr/local/cuda目錄。
注意:使用CUDA Toolkit,必須要設置系統的PATH,以找到nvcc等命令。
全局PATH可以很多地方設置,以/etc/profile.d修改為例 :
echo 'export PATH=/usr/local/cuda/bin:$PATH' | sudo tee /etc/profile.d/cuda.sh
source /etc/profile
官方代碼示例編譯運行
cp -r /usr/local/cuda/samples/ cuda_samples
cd cuda_samples
make -j16 -k
官方示例170個左右,注意不是都能編譯(所以加了-k 選項),編譯完大致也就小幾分鍾而已。
然後我們運行示例了,簡單的如deviceQuery、bandwidthTest、simpleCUBLAS、simpleCUFFT等等。
『叄』 Nvidia GPU的TCC模式與WDDM模式有何區別
NVIDIA 高性能 GPU(如Tesla, Quadro)可以配置為 TCC(Tesla Compute Cluster)模式或 WDDM(Windows Display Driver Model)模式。
二者區別在於,TCC 模式下,GPU完全用於計算,並不需要本地顯示功能;而 WDDM 模式下,GPU 同時扮演計算卡 + 顯卡的角色。
用途:
1. Windows系統下遠程桌面cuda程序的運行
2. Windows系統下GPU集群環境cuda集群程序的運行
TCC全名Tesla Compute Cluster是Nvidia顯卡的兩種驅動模式之一,另一種模式是WDDM(默認模式,全名Windows Display Driver Model)。
使用nvidia-smi工具可打開TCC模式,nvidia-smi是Nvidia提供的顯卡管理介面(System Management Interface),位於驅動安裝根目錄的NVSMI文件夾中,全名nvidia-smi.exe。當然,該工具的主要作用不單是用來開啟TCC,而是用來管理顯卡,有關此工具的其他功能可直接輸入-h進行查看。通常還需要c++編譯器,把cl.exe添加到路徑
支持該工具的的顯卡:
Tesla: S1070, S2050, C1060, C2050/70/75, M2050/70/90, X2070/90
Quadro: 4000, 5000, 6000, 7000 and M2070-Q
開啟命令:nvidia-smi –dm 1,倘若不存在這樣的內部命令,在環境變數中添加nvidia-smi.exe的路徑path
『肆』 自動駕駛晶元哪家強,這家中國創業公司竟然說自己超越了特斯拉
文/田忠朝
在自動駕駛量產應用上,特斯拉為何能遙遙領先?很多人認為是其強大的軟體演算法,其實軟體演算法固然重要,但擁有強大計算能力的感知和決策晶元也必不可少。
可以預見,未來自動駕駛技術必然是各國競爭的高地,而自主可控的晶元技術對於增強我國自動駕駛行業整體實力來說將會有很大的幫助。
本文來源於汽車之家車家號作者,不代表汽車之家的觀點立場。
『伍』 window10電腦為什麼升級不了TeslaT4顯卡驅動
你是N卡嗎?如果是的話去網頁鏈接下載Nvidia GeForce Experience,裡面有驅動