英伟达发布新卡皇--RTX4090，较上一代3090Ti性能巨大飞跃！

2022-09-21 12:24:04 EETOP

点击关注->创芯网公众号，后台告知EETOP论坛用户名，奖励200信元

9月20晚，NVIDIA（英伟达）推出新一代GeForce RTX 40系列显卡。作为全球首款基于全新NVIDIA Ada Lovelace架构的GPU，采用台积电4纳米工艺的RTX 40系列在性能和效率上都实现了巨大的飞跃。

以下是与上一代卡皇 Ampere架构的3090Ti的参数比较：

RTX 4090 采用了台积电4纳米工艺，集成76亿个晶体管。由于采用了更先进的工艺，与上一代仅28亿晶体管的3090芯片裸片尺寸大体相等。

RTX 4090有 128 个 SM 和 2,520 MHz 升压时钟，再加上 24GB GDDR6X 内存，运行速度为 21 Gbps，具有 384 位接口。内存配置与RTX 3090 Ti相比基本没有变化，然而，就像 AMD 对 RDNA 2 的 Infinity Cache 所做的一样，Nvidia 显然会在 AD102 中打包 96MB 的 L2 缓存，而 GA102 中只有 6MB 的 L2 缓存——这还没有得到官方证实，但我们认为没有理由怀疑这一点阶段。

与 Ampere 相比，核心数量增加了 50% 以上。仅核心数量就可以大幅提升性能，但Nvidia 还调整了 Ada 以达到更高的时钟频率，预期提升时钟为 2.5-2.6 GHz。这比 RTX 3090 的 1,695 MHz 升压时钟高出近 50%，比 RTX 3090 Ti 的 1,860 MHz 高出 35%，

结合起来，GPU 着色器计数和时钟速度产生了理论上的最大性能数据。RTX 3090 的额定值为 35.6 teraflops，RTX 3090 Ti 将其提升至 40 teraflops，而现在 RTX 4090 将指针推高至 82.6 teraflops — 换句话说，是计算能力的两倍多。虽然仅 teraflops 可能是一个毫无意义的数字，但它在类似的架构中仍然有用。

核心数量和时钟速度有所提高，但更重要的是，架构更新可以进一步提升性能。在 GPU 着色器上，Nvidia 表示 Ada 内核的功率效率高达两倍。着色器还支持称为 SER 的新功能，即着色器执行重新排序，这似乎主要有助于提高光线追踪性能，但在传统渲染模式中也可能有用。

关键词：英伟达 RTX4090 3090Ti