英偉達發布新卡皇--RTX4090,較上一代3090Ti性能巨大飛躍!

2022-09-21 12:24:04 來源:EETOP
920晚,NVIDIA(英偉達)推出新一代GeForce RTX 40系列顯卡。作為全球款基于全新NVIDIA Ada Lovelace架構GPU,采用臺積電4納米工藝的RTX 40系列在性能和效率上都實現了大的飛躍。

圖片

以下是與上一代卡皇 Ampere架構的3090Ti的參數比較:

圖片

RTX 4090 采用了臺積電4納米工藝,集成76億個晶體管。由于采用了更先進的工藝,與上一代僅28億晶體管的3090芯片裸片尺寸大體相等。

RTX 4090有 128 個 SM 和 2,520 MHz 升壓時鐘,再加上 24GB GDDR6X 內存,運行速度為 21 Gbps,具有 384 位接口。內存配置與RTX 3090 Ti相比基本沒有變化,然而,就像 AMD 對 RDNA 2 的 Infinity Cache 所做的一樣,Nvidia 顯然會在 AD102 中打包 96MB 的 L2 緩存,而 GA102 中只有 6MB 的 L2 緩存——這還沒有得到官方證實,但我們認為沒有理由懷疑這一點階段。

與 Ampere 相比,核心數量增加了 50% 以上。僅核心數量就可以大幅提升性能,但Nvidia 還調整了 Ada 以達到更高的時鐘頻率,預期提升時鐘為 2.5-2.6 GHz。這比 RTX 3090 的 1,695 MHz 升壓時鐘高出近 50%,比 RTX 3090 Ti 的 1,860 MHz 高出 35%,

結合起來,GPU 著色器計數和時鐘速度產生了理論上的最大性能數據。RTX 3090 的額定值為 35.6 teraflops,RTX 3090 Ti 將其提升至 40 teraflops,而現在 RTX 4090 將指針推高至 82.6 teraflops — 換句話說,是計算能力的兩倍多。雖然僅 teraflops 可能是一個毫無意義的數字,但它在類似的架構中仍然有用。

核心數量和時鐘速度有所提高,但更重要的是,架構更新可以進一步提升性能。在 GPU 著色器上,Nvidia 表示 Ada 內核的功率效率高達兩倍。著色器還支持稱為 SER 的新功能,即著色器執行重新排序,這似乎主要有助于提高光線追蹤性能,但在傳統渲染模式中也可能有用。

  1. EETOP 官方微信

  2. 創芯大講堂 在線教育

  3. 創芯老字號 半導體快訊

相關文章

全部評論

  • 最新資訊
  • 最熱資訊
@2003-2022 EETOP

京ICP備10050787號   京公網安備:11010502037710

成Av人片在线观看无码t