老黄：摩尔定律已死，涨价身不由己！晶圆级&裸片分析：为什么英伟达RTX4090卖这么贵？

2022-09-25 12:20:20 来源：EETOP

NVIDIA这两天发布了RTX 40系列三块显卡，升级4nm工艺及Ada Lovelace架构，10月12日上市，价格分别是12999、9499元及7199元。

对于RTX 40系列三款显卡，性能提升很猛，但是这两天大家讨论最多的就是显卡价格，RTX 4090显卡达到了12999元，RTX 4080 12GB甚至还是192bit位宽，价格从上代的5499元起步涨到了7199元，这样的定价被网友吐槽太贵。

不过黄仁勋表示表示摩尔定律已死，涨价也是身不由己。

以下内容为tomshardware通过晶圆价格以及裸片渲染图做出的成本分析，文章基本上认可了老黄关于涨价的说辞，但同时也认为AMD可以推出更具有性价比的显卡，会对RTX 40带来较大冲击。

以下是正文：

原文链接：

https://www.tomshardware.com/news/why-nvidias-4080-4090-cost-so-damn-much

英伟达 RTX 40 系列和 Ada Lovelace GPU的推出受到了一系列的欢迎。在构建一个有望超越最好的显卡的 GPU 时，英伟达(Nvidia) 已经做得很大——又大又贵。另一方面，AMD 正在使用一种更具成本效益的技术，可以使其即将推出的 RDNA 卡更具吸引力、更实惠的选择。

虽然我们不了解英伟达的材料清单 (BOM)，但英伟达 GPU 的高价格很大程度上是由于该公司拒绝接受“摩尔定律 2.0”并寻求小芯片之类的东西。当 AMD 转向小芯片时，AMD 开始在 CPU 上击败英特尔，尤其是在成本方面，现在他们将在 GPU 上做同样的事情。使用 RDNA 3 将模拟存储器接口放在较旧的工艺上是一种绝妙的方法，因为模拟在较新的工艺节点上的扩展性很差。缓存也是如此。

查看英伟达迄今为止发布的 AD102（RTX4090）芯片照片，我们知道芯片尺寸为 608mm²。这仅比 628mm² 的 GA102(RTX3090Ti)略小，但现在英伟达采用了最先进的 TSMC 4N 工艺节点，而不是三星 8N。晶圆的价格肯定上涨了，而且台积电在2023年还要将价格上涨 6%。下图所示的 AD102渲染图，显示了一些清晰的细节，说明了英伟达最新的显卡芯片为什么会比上一代芯片的成本更高。

12 个图形处理集群 (GPC) 很容易与芯片的其余部分区分开来，每个都有 12 个流式多处理器 (SM)。所有的 GPC 和 SM 加起来约占总芯片面积的 45%。剩下的去哪儿了？十二个 32 位 GDDR6X 内存控制器占用了芯片的大部分外围边缘，而 PCIe x16 连接器使用了大约三分之一的底部边缘。内存控制器和相关电路占据了 17% 的芯片面积，不管多大，但这并不是内存子系统的唯一部分，因为英伟达的二级缓存比以前的设计大得多。您可以在芯片的中心部分看到六个 16MB 的 L3 块，周围有一些相关的布线和其他电路 (ROP？)。L2 缓存块至少占芯片总面积的 15%，而芯片的整个中心部分（L2 加上其他逻辑）占总面积的 25%。底部芯片的其余部分专用于双 NVENC 编码器、PCIe 接口和物理显示接口等。它大约占总数的 7%，然后还有一些其他杂项分散在周围，占据了芯片裸片的最后约 6%。

讨论这些裸片区域的目的是帮助正确看待事物。英伟达在 AD102 芯片上采用单片方法，将大约 33% 的总裸片区域专门用于内存接口和 L2 缓存。

AMD 的 MCD（Memory Chiplet Die）方法与Radeon RX 7000 系列和 RDNA 3 GPU一起使用，显然将几乎所有这些都从主芯片上移开，据报道它将使用 TSMC N6 代替 TSMC N5，从而降低价格并提高产量同时。台积电没有透露其与苹果、AMD、英特尔或英伟达等大型合作伙伴的合同谈判情况。然而，有报道称台积电 N5（以及因此或多或少只是“精制”N5 的 4N）成本至少是台积电 N7/N6 的两倍。AD102 的裸片尺寸为 608mm²，英伟达每个晶圆只能获得大约 90 个完整裸片——作为参考，每个晶圆仅比 GA102 多两个芯片。

如果台积电 4N 的每个晶圆成本是三星 8N 的两倍以上，这意味着 AD102 每个芯片的成本是上一代 GA102 和 RTX 3090 的两倍多。PC World 的 Gordon Mah Ung 在问答环节中向英伟达首席执行官黄仁勋提问关于定价的会议：

Gordon：[RTX] 4000 终于来了，我敢肯定这对你来说是一次巨大的发布。我看到的普遍反应是，“哦，我的上帝。它要花这么多钱。” 关于新一代零件的定价，您有什么想对大家说的吗？此外，他们能否期望在某个时候看到更好的定价，并基本上解决我在各处看到的所有大声尖叫？”

黄仁勋： “首先，今天的 12 英寸晶圆比昨天贵很多，而且它不是贵一点。摩尔定律已死。而摩尔定律提供相同性能，每年半成本一半的能力已经结束。完全结束了。因此，不幸的是，芯片成本会随着时间的推移而下降的想法已成为过去。”

当然，构建显卡不仅仅是 GPU。内存，涉及PCB、VRM、PMIC、电容器和其他各种位，其中许多产品的价格在过去两年中也有所上涨。英伟达也不得不在GPU和相关产品的研发上投入大量精力。

关于 RTX 40 系列公告的另一件有趣的事情是，英伟达公布了三种不同的显卡型号，每一种都使用不同的 GPU。同样，这种方法必须增加成本，这意味着英伟达还需要弄清楚如何最好地分配其晶圆订单。RTX 4090 中的 AD102 芯片是新的光环部件。AD103（RTX4080 16G）减少了内存接口和内核数量，然后在 AD104（RTX4080 12G）进一步减少了它们。

英伟达尚未发布AD103和AD104的芯片或效果图，但我们确实有完整的规格。它们要小得多，其中大部分来自减少内核数量，内存接口和L2缓存大小。4080型号自然会比4090大批量产品，但值得指出的是，4090的计算能力可能增加70%，内存带宽和容量增加50%，功耗增加41%，而成本“仅”高出33%。换句话说，RTX 4080 16GB的定价比RTX 4090差。我们可以对RTX 4080 12GB执行相同的分析。4080 16GB 的计算能力提高了 21%，内存容量增加了 33%，内存带宽增加了 42%，但功耗仅增加了 12%。它的成本也高出33%。与我们在以前的英伟达架构中看到的相比，这两种RTX 4080型号看起来价格过高且功率不足，其中halo卡的成本要高得多，，而性能只能适度提高。

当RTX 30系列推出时，英伟达从RTX 3090和3080开始。两者都使用GA102芯片，只是在3080上启用的内核更少。接下来是RTX 3070和3060 Ti，两者都使用GA104芯片。最终，英伟达将GA106添加到该系列中，用于RTX 3060和3050 - 移动RTX 3050 Ti和3050也有GA107，但这从未出现在台式机上。最终，仅查看台式机显卡，英伟达拥有三种不同的 GPU，为十种不同的显卡提供动力。现在，英伟达公布了三款卡，使用三块GPU，它必须弄清楚如何平衡每个芯片的数量。

相比之下，AMD似乎将在11月3日宣布可能使用单核GPU，它将使用小芯片技术。目前的信息显示，GCD（GPU Chiplet Die）的尺寸仅为308mm²，约为AD102尺寸的一半，并且它将与多达六个相对较小（38mm²）的MCD（内存芯片芯片）连接。这与AD104（294.5mm²）的尺寸大致相同，如果传言是正确的，AMD的Navi 31将配备多达12，288个GPU着色器内核 - 比英伟达的RTX 4080 12GB高出60%。

AMD可以使用相同的GCD推出RX 7900 XT，RX 7800 XT，甚至可能推出RX 7800，只是启用了不同数量的GPU内核以及6，5或4个MCD。AMD甚至可能在定价上与AD104竞争，同时提供明显更高的性能，至少在没有利用DLSS 3和/或极端光线追踪效果的游戏中是这样。优势：AMD。

5GlibciaLJbkQ4g/640?wx_fmt=png" data-index="11" style="margin: 0px; padding: 0px; outline: 0px; display: inline-flex; align-items: center; justify-content: center; background: var(--weui-BG-3); border-radius: 8px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important; width: 677px !important; height: 380.812px !important;">

还有一个问题是为什么 RTX 4080 12GB 不只是被称为 RTX 4070。在简报中与英伟达交谈时，这个确切的问题出现了：将 12GB 芯片称为 4080 而不是 4070 背后的思考过程是什么，尤其是因为它是一个不同的芯片？英伟达的产品管理高级总监 Justin Walker 说：“4080 12GB 是一款非常高性能的 GPU。它提供的性能比 3080 12GB 快得多……它比 3090 Ti 快，我们真的认为它值得是80级产品。”

坦率地说，这是一个蹩脚的答案。当然更快！这是一个新的芯片和一个新的架构;它应该更快。还记得GTX 1070问世时，它比980 Ti更快吗？我想这不是“值得”的80级产品名称。RTX 2070在与1080 Ti匹配时也不是3070，也不是与2080 Ti匹配时的3070。这就是你必须开始思考的地方，因为很明显，在重光线追踪游戏中，DLSS 3就是这样。当您不玩符合这些条件的游戏时会发生什么？

根据英伟达的基准，这将好坏参半。左图中的前三个游戏不使用 DLSS 或 DLSS 3。RTX 4080 12GB通常与RTX 3090 Ti捆绑在一起或略慢，而DLSS 3和光线追踪不是等式的一部分。在未来的比赛中，这种情况会持续多久一次，这要难以预测。在很多方面，迄今为止发布的 RTX 40 系列让人想起 RTX 20 系列的发布。英伟达再次大肆宣传光线追踪和DLSS，只是我们现在正处于这个故事的第三轮。RT硬件的功能要强大得多，DLSS 3也应该好得多，但是所有大型游戏都会将这两种技术都支持到足够的水平吗？毫无疑问，答案是否定的。有些会，有些不会。与此同时，代际定价（再次）有所增加，一些型号的规格肯定看起来值得怀疑。RTX 4080 12GB感觉太像现在应该真的是RTX 4070了，英伟达本可以开始使用Ti和Super或其他任何东西来创建其他型号。

RTX 3080 10GB显然仍将停留在699美元的建议零售价暂时。这当然不会长久，因为最终的RTX 4070将不可避免地在性能和功能上取代它。但英伟达和它的合作伙伴需要不知情的人买下现有的RTX 30系列卡的库存，以他们仍然可以得到的最高价格，然后他们准备下栈到其余的Ada Lovelace阵容。

我们还在等待AMD RDNA 3产品线的详细信息，正如上面所讨论的，AMD做出的设计决定——特别是GPU 芯片——应该会导致英伟达无法匹敌的更低价格。AMD可能不会在性能上独占鳌头，但如果它能在价格低于英伟达的情况下与之接近，那可能就没什么关系了。此外，英特尔的Arc A770和A750也可能在不久的将来推出。在接下来的几个月里，我们将看到谁会成为GPU市场的胜利者。

关键词：英伟达 RTX4090 3090Ti 摩尔定律

EETOP 官方微信
创芯大讲堂在线教育
创芯老字号半导体快讯

上一篇：Vicor 公司荣获“2022 马萨诸塞州年
下一篇：投资数十亿欧元，消息称英特尔意大利芯

老黄：摩尔定律已死，涨价身不由己！晶圆级&裸片分析：为什么英伟达RTX4090卖这么贵？

相关文章

延伸阅读

全部评论