TeslaT4算力
『壹』 哪些主板兼容nvidia tesla T4 显卡
华擎X99 Taichi
『贰』 腾讯云 tesla显卡 1/4核 怎么用的
何选购腾讯云GPU实例?如何优雅地安装驱动等底层开发工具库?这些问题给深度学习等领域研究/开发人员带来了不少困惑。本篇教程将从实践出发,给出基于腾讯云GPU实例的Best Practice,彻底解决以上问题。
0x00 环境&目标
我们选择腾讯云目前的主流机型GPU计算机型GN7,其中搭载一颗Tesla T4 GPU。本教程采用的具体规格为GN7.5XLARGE80。这款机型有着不错的综合性能,20核心+80G内存,比较适合常规的深度神经网络训练等各种应用场景。而且,它还是全球市面上同级别GPU机型中(T4)性价比最高的产品。
选购传送门,按量计费的机型做实验更灵活哦~
本教程中的实例机型:GN7(推荐)、GN10X等GPU机型均可以。
推荐选择的系统镜像:Ubuntu 18.04 (注意无需勾选“后台自动安装GPU驱动”)
其他信息:北京五区,1M公网带宽,系统盘大小100G。根据实际情况选择即可。
创建实例完成后,控制台面板可以查看实例信息:
我们将安装目前最新的CUDA Toolkit 10.2版本、CUDNN 7.6.5版本。
让我们这就开始吧!
0x01 CUDA Driver/Toolkit 安装
官网网络Deb包安装
我们去Nvidia官网下载最新的CUDA Toolkit 10.2
https://developer.nvidia.com/cuda-downloads
根据我们的环境选择安装下载方式,这里我们选择网络安装deb包的方式,如图:
然后按照下面的提示执行命令即可
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"sudo apt-get update
sudo apt-get -y install cuda
可以看到其实就是在系统中安装了nvidia的官方apt仓库源,并执行了apt install cuda,很方便。只有最后一步的安装过程稍微耗时一些,需要5分钟左右,而且这一步有可能中间因为网络等原因中断,重试1~2次即可。
注意:此处需要重启服务器。
那么究竟安装了什么,以及如何验证安装成功呢?
验证GPU驱动安装 —— 设备信息查看
Nvidia GPU驱动是支持CUDA编程的内核模块。通过上述方法安装的驱动是以动态内核模块(DKMS)的形式安装的,这种内核模块不在内核source tree中,但是可以在每次内核更新升级时自动地进行重新编译,生成新的initramfs,并后续随着系统启动动态加载。总之就是,驱动只需安装一次,非常方便。
重启后登陆,我们来验证驱动模块已动态加载
可以看到,nouveau等社区驱动已经不会被加载,而是加载了nvidia的官方驱动。
驱动对应的四个内核模块在这个目录下:/lib/moles/4.15.0-88-generic/updates/dkms/ 。
nvidia-smi命令查看GPU设备状态,如驱动版本(440.64.00)、CUDA版本(10.2)、型号(Tesla T4)、显存(15109MiB)以及温度功耗等各种信息,如图:
验证CUDA Toolkit安装 —— 示例代码编译
CUDA Toolkit,即开发工具包,其中包括构建命令、头文件、动态库、文档、代码示例等等,安装在/usr/local/cuda目录。
注意:使用CUDA Toolkit,必须要设置系统的PATH,以找到nvcc等命令。
全局PATH可以很多地方设置,以/etc/profile.d修改为例 :
echo 'export PATH=/usr/local/cuda/bin:$PATH' | sudo tee /etc/profile.d/cuda.sh
source /etc/profile
官方代码示例编译运行
cp -r /usr/local/cuda/samples/ cuda_samples
cd cuda_samples
make -j16 -k
官方示例170个左右,注意不是都能编译(所以加了-k 选项),编译完大致也就小几分钟而已。
然后我们运行示例了,简单的如deviceQuery、bandwidthTest、simpleCUBLAS、simpleCUFFT等等。
『叁』 Nvidia GPU的TCC模式与WDDM模式有何区别
NVIDIA 高性能 GPU(如Tesla, Quadro)可以配置为 TCC(Tesla Compute Cluster)模式或 WDDM(Windows Display Driver Model)模式。
二者区别在于,TCC 模式下,GPU完全用于计算,并不需要本地显示功能;而 WDDM 模式下,GPU 同时扮演计算卡 + 显卡的角色。
用途:
1. Windows系统下远程桌面cuda程序的运行
2. Windows系统下GPU集群环境cuda集群程序的运行
TCC全名Tesla Compute Cluster是Nvidia显卡的两种驱动模式之一,另一种模式是WDDM(默认模式,全名Windows Display Driver Model)。
使用nvidia-smi工具可打开TCC模式,nvidia-smi是Nvidia提供的显卡管理接口(System Management Interface),位于驱动安装根目录的NVSMI文件夹中,全名nvidia-smi.exe。当然,该工具的主要作用不单是用来开启TCC,而是用来管理显卡,有关此工具的其他功能可直接输入-h进行查看。通常还需要c++编译器,把cl.exe添加到路径
支持该工具的的显卡:
Tesla: S1070, S2050, C1060, C2050/70/75, M2050/70/90, X2070/90
Quadro: 4000, 5000, 6000, 7000 and M2070-Q
开启命令:nvidia-smi –dm 1,倘若不存在这样的内部命令,在环境变量中添加nvidia-smi.exe的路径path
『肆』 自动驾驶芯片哪家强,这家中国创业公司竟然说自己超越了特斯拉
文/田忠朝
在自动驾驶量产应用上,特斯拉为何能遥遥领先?很多人认为是其强大的软件算法,其实软件算法固然重要,但拥有强大计算能力的感知和决策芯片也必不可少。
可以预见,未来自动驾驶技术必然是各国竞争的高地,而自主可控的芯片技术对于增强我国自动驾驶行业整体实力来说将会有很大的帮助。
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。
『伍』 window10电脑为什么升级不了TeslaT4显卡驱动
你是N卡吗?如果是的话去网页链接下载Nvidia GeForce Experience,里面有驱动