显卡算力与显存
⑴ 显卡的算力和张数有关吗
1、SP总数=TPC&GPC数量*每个TPC中SM数量*每个SM中的SP数量;
TPC和GPC是介于整个GPU和流处理器簇之间的硬件单元,用于执行CUDA计算。特斯拉架构硬件将SM组合成TPC(纹理处理集群),其中,TPC包含有纹理硬件支持(特别包含一个纹理缓存)和2个或3个SM,后面会有详细描述。费米架构硬件组则将SM组合为GPC(图形处理器集群),其中,每个GPU包含有一个光栅单元和4个SM。
2、单精度浮点处理能力=SP总数*SP运行频率*每条执行流水线每周期能执行的单精度浮点操作数;
该公式实质上是3部分相乘得到的,分别为计算单元数量、计算单元频率和指令吞吐量。
前两者很好理解,指令吞吐量这里是按照FMA(融合乘法和增加)算的,也就是每个SP,每周期可以有一条FMA指令的吞吐量,并且同时FMA因为同时计算了乘加,所以是两条浮点计算指令。
以及需要说明的是,并不是所有的单精度浮点计算都有这个峰值吞吐量,只有全部为FMA的情况,并且没有其他访存等方面的限制的情况下,并且在不考虑调度效率的情况下,才是这个峰值吞吐量。如果是其他吞吐量低的计算指令,自然达不到这个理论峰值。
3、双精度浮点处理能力=双精度计算单元总数*SP运行频率*每个双精度计算单元每周期能进行的双精度浮点操作数。
目前对于N卡来说,双精度浮点计算的单元是独立于单精度单元之外的,每个SP都有单精度的浮点计算单元,但并不是每个SP都有双精度的浮点单元。对于有双精度单元的SP而言,最大双精度指令吞吐量一样是在实现FMA的时候的每周期2条(指每周期一条双精度的FMA指令的吞吐量,FMA算作两条浮点操作)。
而具备双精度单元的SP数量(或者可用数量)与GPU架构以及产品线定位有关,具体为:
计算能力为1.3的GT200核心,第一次硬件支持双精度浮点计算,双精度峰值为单精度峰值的1/8,该核心目前已经基本退出使用。
GF100/GF110核心,有一半的SP具备双精度浮点单元,但是在geforce产品线中屏蔽了大部分的双精度单元而仅在tesla产品线中全部打开。代表产品有:tesla C2050,2075等,其双精度浮点峰值为单精度浮点峰值的一半;
geforce GTX 480,580,其双精度浮点峰值为单精度浮点峰值的大约1/8左右。
其他计算能力为2.1的Fermi核心,原生设计中双精度单元数量较少,双精度计算峰值为单精度的1/12。
kepler GK110核心,原生的双精度浮点峰值为单精度的1/3。而tesla系列的K20,K20X,K40他们都具备完整的双精度浮点峰值;geforce系列的geforce TITAN,此卡较为特殊,和tesla系列一样具备完整的双精度浮点峰值,geforce GTX780/780Ti,双精度浮点峰值受到屏蔽,具体情况不详,估计为单精度峰值的1/10左右。
其他计算能力为3.0的kepler核心,原生具备较少的双精度计算单元,双精度峰值为单精度峰值的1/24。
计算能力3.5的GK208核心,该卡的双精度效能不明,但是考虑到该核心定位于入门级别,大规模双精度计算无需考虑使用。
所以不同核心的N卡的双精度计算能力有显著区别,不过目前基本上除了geforce TITAN以外,其他所有geforce卡都不具备良好的双精度浮点的吞吐量,而本代的tesla K20/K20X/K40以及上一代的fermi核心的tesla卡是较好的选择。
⑵ NVIDIA和AMD各型号显卡ETH算力功率一览表最新版
随着ETH价格的上涨,显卡的功耗和算力成为了许多人关注的焦点。尽管网络上能找到相关数据,但时效性是个问题。因此,本文特别整理了NVIDIA和AMD各型号显卡在以太坊(ETH)挖矿中的算力以及功耗情况,并将持续更新。
NVIDIA显卡的ETH算力和功耗如下:大部分支持的6GB以上显存型号包括1060/1060Ti/1070系列、1080系列、1660/1660Ti/1660Super等,以及20系列、30系列的部分型号,如2060/2080Ti/3060LHR等,这些都是目前还能参与挖矿的选项。需要注意的是,部分有锁版本的显卡在NBMiner v39.6的解锁下,算力有所不同。
而对于AMD显卡,支持6GB以上挖矿的型号包括478/488/578系列、588/598系列、5500XT/5600XT/5700XT等,以及6600系列、6700XT/6800系列、6900XT等型号。同样,数据来源于网络,如有任何错误,欢迎指正。
以上数据将持续更新,为您的显卡选择提供最新的参考信息。
⑶ 显卡锁算力到底对本身性能有什么影响
没什么影响 ,显卡锁算力是不会影响性能游戏方面的,只要不用于挖矿就可以,如果需要挖矿的小伙伴建议使用未锁算力的显卡,显卡性能有没有问题可以先看显存,显存没有问题基本都ok的。
显卡锁算力,是当显卡开始运行挖矿软件,进行哈希算法的时候(以太坊算法)显卡就会自动降低显存频率来锁住算力。
显存就好像cpu的运行内存一样是非常重要的,显示画面中的各种图形都会在这里短暂的储存并交由显卡芯片进行处理,所以通常来说确实是越大越好,大的显存可以存储更多的数据供显卡芯片处理,你所看到的画面也会更加的流畅。
对于游戏玩家来说,平时不运行挖矿软件是不会对于显卡性能有影响的。
硬件驱动双锁算力是基于监测虚拟货币的算力砍半,并非日常使用也无脑砍半,所以玩家日常使用的话完全不用担心性能损失。全新的 LHR 核心仅仅是针对虚拟货币进行了哈希率限制,日常使用以及打游戏则完全不受影响。
⑷ 2023骞存樉鍗$畻鍔涙帓琛
2023鏄惧崱绠楀姏鎺掕屼负锛氱涓RTX 4090銆佺浜孯adeon RX 7900 XTX銆
1銆丷TX 4090
RTX 4090鍏锋湁760浜夸釜鏅朵綋绠°16384涓狢UDA鏍稿績鍜24GB楂橀熼晛鍏塆DDR6X鏄惧瓨锛屽湪4K鍒嗚鲸鐜囩殑娓告垙涓鎸佺画浠ヨ秴杩100FPS杩愯屻
RTX 4090閲囩敤鍏ㄦ柊DLSS3鎶鏈锛岀浉姣3090TI锛屾ц兘鎻愬崌鍙杈2-4鍊嶏紝鍚屾椂淇濇寔浜嗙浉鍚岀殑450W鍔熻椼2022骞10鏈15鏃ワ紝GeForce RTX 4090绯诲垪鏄惧崱姝e紡寮鍞銆
鏄惧崱鐨勯夎喘娉ㄦ剰浜嬮」锛
1銆侀夋嫨閫傚悎鑷宸遍渶姹傜殑鏄惧崱
鍦ㄨ喘涔版樉鍗″墠锛岄栧厛瑕佺‘瀹氳嚜宸辩殑闇姹傦紝姣斿傜數鑴戜娇鐢ㄥ満鏅銆佹墍闇娓告垙鍒嗚鲸鐜囥佹父鎴忕被鍨嬬瓑锛岃繖浜涘洜绱犻兘浼氬规樉鍗$殑鎬ц兘鏈夋墍瑕佹眰銆傚洜姝わ紝閫夋嫨閫傚悎鑷宸遍渶姹傜殑鏄惧崱闈炲父閲嶈併
2銆佹牴鎹鐢佃剳鐨勯厤缃閫夋嫨鏄惧崱
鏄惧崱鐨勬ц兘涓庣數鑴戠殑閰嶅楀叧绯诲瘑鍒囷紝濡傛灉鐢佃剳鐨勫叾浠栫‖浠朵笉瓒充互鏀鎸佹樉鍗$殑鎬ц兘锛岄偅涔堟樉鍗$殑鎬ц兘灏变細鍙楀埌闄愬埗銆傚洜姝わ紝鍦ㄨ喘涔版樉鍗℃椂闇瑕佹牴鎹鐢佃剳鐨凜PU銆佸唴瀛樸佷富鏉跨瓑纭浠堕厤缃閫夋嫨閫傚悎鐨勬樉鍗°
3銆佽冭檻鏄惧崱鐨勫姛鑰楀拰鏁g儹
鏄惧崱鍦ㄥ伐浣滄椂浼氫骇鐢熷ぇ閲忕殑鐑閲忥紝鍥犳ら渶瑕佽緝濂界殑鏁g儹鎬ц兘锛屽惁鍒欎細褰卞搷鏄惧崱鐨勬ц兘鍜屽垮懡銆傛ゅ栵紝鏄惧崱鐨勫姛鑰椾篃闇瑕佽冭檻锛屽傛灉鏄惧崱鍔熻楄繃楂橈紝鍙鑳戒細瀵艰嚧鐢垫簮涓嶈冻鎴栬呭彂鐑杩囧氾紝褰卞搷鐢佃剳鐨勬e父宸ヤ綔銆傚洜姝わ紝鍦ㄨ喘涔版樉鍗℃椂闇瑕佹敞鎰忓叾鍔熻楀拰鏁g儹鎬ц兘銆
浠ヤ笂鍐呭瑰弬鑰冿細鐧惧害鐧剧-AMDRadeonRX7900XTX
⑸ 全30系显卡哈西算力 & 超频参数一览
在目前的哈西算力解锁中,大约有74%的30系显卡已经释放出潜力,尽管还未达到满载,但以Eth收益来看,它仍然领先于Rvn和ergo等其他币种。对于显卡超频的探讨,我将分享30系显卡的优化算力与超频策略,建议大家先收藏以便参考,以免错过关键信息。
以下是一些具体型号的建议:
- 3080Ti LHR:73 MH/s到89 MH/s,核心频率1100,显存+1300。微星超龙和七彩虹AD OC型号由于功耗限制,可能最高可达89 MH/s,部分低配型号可能在73-76 MH/s左右。
- 3080 LHR:72 MH/s,提供多种方案供调整。具体数值根据型号自定。
- 3070Ti LHR:56-59 MH/s,功耗66%,显存+1600,风扇80-90,微星卡数据下,显存可逐步调整,先保持功耗稳定。
- 其他型号如3070LHR、3060Ti LHR、3060v2 LHR、3090、3080、3070、3060Ti和3060等,都有各自的超频参数,见下表。
推荐的超频设置通常为:80%-85%的功耗,显存提升至900到1200,风扇保持在80-90,功耗大约在295W。具体调整时,根据每个卡的特性来操作。
关于3060Ti无锁版本,由于供应紧张,核心频率和显存设置需特别注意。下一篇文章将更新20系N卡的超频指南。