顯卡算力與顯存
⑴ 顯卡的算力和張數有關嗎
1、SP總數=TPC&GPC數量*每個TPC中SM數量*每個SM中的SP數量;
TPC和GPC是介於整個GPU和流處理器簇之間的硬體單元,用於執行CUDA計算。特斯拉架構硬體將SM組合成TPC(紋理處理集群),其中,TPC包含有紋理硬體支持(特別包含一個紋理緩存)和2個或3個SM,後面會有詳細描述。費米架構硬體組則將SM組合為GPC(圖形處理器集群),其中,每個GPU包含有一個光柵單元和4個SM。
2、單精度浮點處理能力=SP總數*SP運行頻率*每條執行流水線每周期能執行的單精度浮點操作數;
該公式實質上是3部分相乘得到的,分別為計算單元數量、計算單元頻率和指令吞吐量。
前兩者很好理解,指令吞吐量這里是按照FMA(融合乘法和增加)算的,也就是每個SP,每周期可以有一條FMA指令的吞吐量,並且同時FMA因為同時計算了乘加,所以是兩條浮點計算指令。
以及需要說明的是,並不是所有的單精度浮點計算都有這個峰值吞吐量,只有全部為FMA的情況,並且沒有其他訪存等方面的限制的情況下,並且在不考慮調度效率的情況下,才是這個峰值吞吐量。如果是其他吞吐量低的計算指令,自然達不到這個理論峰值。
3、雙精度浮點處理能力=雙精度計算單元總數*SP運行頻率*每個雙精度計算單元每周期能進行的雙精度浮點操作數。
目前對於N卡來說,雙精度浮點計算的單元是獨立於單精度單元之外的,每個SP都有單精度的浮點計算單元,但並不是每個SP都有雙精度的浮點單元。對於有雙精度單元的SP而言,最大雙精度指令吞吐量一樣是在實現FMA的時候的每周期2條(指每周期一條雙精度的FMA指令的吞吐量,FMA算作兩條浮點操作)。
而具備雙精度單元的SP數量(或者可用數量)與GPU架構以及產品線定位有關,具體為:
計算能力為1.3的GT200核心,第一次硬體支持雙精度浮點計算,雙精度峰值為單精度峰值的1/8,該核心目前已經基本退出使用。
GF100/GF110核心,有一半的SP具備雙精度浮點單元,但是在geforce產品線中屏蔽了大部分的雙精度單元而僅在tesla產品線中全部打開。代表產品有:tesla C2050,2075等,其雙精度浮點峰值為單精度浮點峰值的一半;
geforce GTX 480,580,其雙精度浮點峰值為單精度浮點峰值的大約1/8左右。
其他計算能力為2.1的Fermi核心,原生設計中雙精度單元數量較少,雙精度計算峰值為單精度的1/12。
kepler GK110核心,原生的雙精度浮點峰值為單精度的1/3。而tesla系列的K20,K20X,K40他們都具備完整的雙精度浮點峰值;geforce系列的geforce TITAN,此卡較為特殊,和tesla系列一樣具備完整的雙精度浮點峰值,geforce GTX780/780Ti,雙精度浮點峰值受到屏蔽,具體情況不詳,估計為單精度峰值的1/10左右。
其他計算能力為3.0的kepler核心,原生具備較少的雙精度計算單元,雙精度峰值為單精度峰值的1/24。
計算能力3.5的GK208核心,該卡的雙精度效能不明,但是考慮到該核心定位於入門級別,大規模雙精度計算無需考慮使用。
所以不同核心的N卡的雙精度計算能力有顯著區別,不過目前基本上除了geforce TITAN以外,其他所有geforce卡都不具備良好的雙精度浮點的吞吐量,而本代的tesla K20/K20X/K40以及上一代的fermi核心的tesla卡是較好的選擇。
⑵ NVIDIA和AMD各型號顯卡ETH算力功率一覽表最新版
隨著ETH價格的上漲,顯卡的功耗和算力成為了許多人關注的焦點。盡管網路上能找到相關數據,但時效性是個問題。因此,本文特別整理了NVIDIA和AMD各型號顯卡在以太坊(ETH)挖礦中的算力以及功耗情況,並將持續更新。
NVIDIA顯卡的ETH算力和功耗如下:大部分支持的6GB以上顯存型號包括1060/1060Ti/1070系列、1080系列、1660/1660Ti/1660Super等,以及20系列、30系列的部分型號,如2060/2080Ti/3060LHR等,這些都是目前還能參與挖礦的選項。需要注意的是,部分有鎖版本的顯卡在NBMiner v39.6的解鎖下,算力有所不同。
而對於AMD顯卡,支持6GB以上挖礦的型號包括478/488/578系列、588/598系列、5500XT/5600XT/5700XT等,以及6600系列、6700XT/6800系列、6900XT等型號。同樣,數據來源於網路,如有任何錯誤,歡迎指正。
以上數據將持續更新,為您的顯卡選擇提供最新的參考信息。
⑶ 顯卡鎖算力到底對本身性能有什麼影響
沒什麼影響 ,顯卡鎖算力是不會影響性能游戲方面的,只要不用於挖礦就可以,如果需要挖礦的小夥伴建議使用未鎖算力的顯卡,顯卡性能有沒有問題可以先看顯存,顯存沒有問題基本都ok的。
顯卡鎖算力,是當顯卡開始運行挖礦軟體,進行哈希演算法的時候(以太坊演算法)顯卡就會自動降低顯存頻率來鎖住算力。
顯存就好像cpu的運行內存一樣是非常重要的,顯示畫面中的各種圖形都會在這里短暫的儲存並交由顯卡晶元進行處理,所以通常來說確實是越大越好,大的顯存可以存儲更多的數據供顯卡晶元處理,你所看到的畫面也會更加的流暢。
對於游戲玩家來說,平時不運行挖礦軟體是不會對於顯卡性能有影響的。
硬體驅動雙鎖算力是基於監測虛擬貨幣的算力砍半,並非日常使用也無腦砍半,所以玩家日常使用的話完全不用擔心性能損失。全新的 LHR 核心僅僅是針對虛擬貨幣進行了哈希率限制,日常使用以及打游戲則完全不受影響。
⑷ 2023騫存樉鍗$畻鍔涙帓琛
2023鏄懼崱綆楀姏鎺掕屼負錛氱涓RTX 4090銆佺浜孯adeon RX 7900 XTX銆
1銆丷TX 4090
RTX 4090鍏鋒湁760浜誇釜鏅朵綋綆°16384涓狢UDA鏍稿績鍜24GB楂橀熼晛鍏塆DDR6X鏄懼瓨錛屽湪4K鍒嗚鯨鐜囩殑娓告垙涓鎸佺畫浠ヨ秴榪100FPS榪愯屻
RTX 4090閲囩敤鍏ㄦ柊DLSS3鎶鏈錛岀浉姣3090TI錛屾ц兘鎻愬崌鍙杈2-4鍊嶏紝鍚屾椂淇濇寔浜嗙浉鍚岀殑450W鍔熻椼2022騫10鏈15鏃ワ紝GeForce RTX 4090緋誨垪鏄懼崱姝e紡寮鍞銆
鏄懼崱鐨勯夎喘娉ㄦ剰浜嬮」錛
1銆侀夋嫨閫傚悎鑷宸遍渶奼傜殑鏄懼崱
鍦ㄨ喘涔版樉鍗″墠錛岄栧厛瑕佺『瀹氳嚜宸辯殑闇奼傦紝姣斿傜數鑴戜嬌鐢ㄥ満鏅銆佹墍闇娓告垙鍒嗚鯨鐜囥佹父鎴忕被鍨嬬瓑錛岃繖浜涘洜緔犻兘浼氬規樉鍗$殑鎬ц兘鏈夋墍瑕佹眰銆傚洜姝わ紝閫夋嫨閫傚悎鑷宸遍渶奼傜殑鏄懼崱闈炲父閲嶈併
2銆佹牴鎹鐢佃剳鐨勯厤緗閫夋嫨鏄懼崱
鏄懼崱鐨勬ц兘涓庣數鑴戠殑閰嶅楀叧緋誨瘑鍒囷紝濡傛灉鐢佃剳鐨勫叾浠栫‖浠朵笉瓚充互鏀鎸佹樉鍗$殑鎬ц兘錛岄偅涔堟樉鍗$殑鎬ц兘灝變細鍙楀埌闄愬埗銆傚洜姝わ紝鍦ㄨ喘涔版樉鍗℃椂闇瑕佹牴鎹鐢佃剳鐨凜PU銆佸唴瀛樸佷富鏉跨瓑紜浠墮厤緗閫夋嫨閫傚悎鐨勬樉鍗°
3銆佽冭檻鏄懼崱鐨勫姛鑰楀拰鏁g儹
鏄懼崱鍦ㄥ伐浣滄椂浼氫駭鐢熷ぇ閲忕殑鐑閲忥紝鍥犳ら渶瑕佽緝濂界殑鏁g儹鎬ц兘錛屽惁鍒欎細褰卞搷鏄懼崱鐨勬ц兘鍜屽垮懡銆傛ゅ栵紝鏄懼崱鐨勫姛鑰椾篃闇瑕佽冭檻錛屽傛灉鏄懼崱鍔熻楄繃楂橈紝鍙鑳戒細瀵艱嚧鐢墊簮涓嶈凍鎴栬呭彂鐑榪囧氾紝褰卞搷鐢佃剳鐨勬e父宸ヤ綔銆傚洜姝わ紝鍦ㄨ喘涔版樉鍗℃椂闇瑕佹敞鎰忓叾鍔熻楀拰鏁g儹鎬ц兘銆
浠ヤ笂鍐呭瑰弬鑰冿細鐧懼害鐧劇-AMDRadeonRX7900XTX
⑸ 全30系顯卡哈西算力 & 超頻參數一覽
在目前的哈西算力解鎖中,大約有74%的30系顯卡已經釋放出潛力,盡管還未達到滿載,但以Eth收益來看,它仍然領先於Rvn和ergo等其他幣種。對於顯卡超頻的探討,我將分享30系顯卡的優化算力與超頻策略,建議大家先收藏以便參考,以免錯過關鍵信息。
以下是一些具體型號的建議:
- 3080Ti LHR:73 MH/s到89 MH/s,核心頻率1100,顯存+1300。微星超龍和七彩虹AD OC型號由於功耗限制,可能最高可達89 MH/s,部分低配型號可能在73-76 MH/s左右。
- 3080 LHR:72 MH/s,提供多種方案供調整。具體數值根據型號自定。
- 3070Ti LHR:56-59 MH/s,功耗66%,顯存+1600,風扇80-90,微星卡數據下,顯存可逐步調整,先保持功耗穩定。
- 其他型號如3070LHR、3060Ti LHR、3060v2 LHR、3090、3080、3070、3060Ti和3060等,都有各自的超頻參數,見下表。
推薦的超頻設置通常為:80%-85%的功耗,顯存提升至900到1200,風扇保持在80-90,功耗大約在295W。具體調整時,根據每個卡的特性來操作。
關於3060Ti無鎖版本,由於供應緊張,核心頻率和顯存設置需特別注意。下一篇文章將更新20系N卡的超頻指南。