新架构、新技术英伟正式发布 RTX 40系列显卡

9月20日23点，英伟达GTC 2022 主题演讲如期举行。老黄这次没有在厨房招待各位观众，但他仍然端出了颇受关注的RTX 4090显卡。

据介绍，RTX 4090 具有 760 亿个晶体管、16384 个 CUDA 核心和 24 GB 高速美光 GDDR6X 显存，在 4K 分辨率的游戏中持续以超过 100 FPS 运行。 RTX 4090 采用全新的 DLSS 3 技术，相比3090 TI，性能提升可达2-4倍，同时保持了相同的 450W 功耗。

英伟达还发布了 RTX 4080 显卡，氛围12GB 和 16GB 两个版本。其中12GB 拥有 7680 个 CUDA 核心和 12GB 美光 GDDR6X 显存。而16GB 拥有 9728 个 CUDA 核心和 16 GB 高速美光 GDDR6X 显存，性能可达 GeForce RTX 3080 Ti 的 2 倍。

三款显卡全部基于全新的 Ada Lovelace 架构，该架构 GPU 采用 TSMC 4N 定制工艺技术，性能功耗提高两倍。其着色器能力高达83TFlops，有效光线追踪计算能力达到 191 TFLOPS，是上一代产品 2.8 倍。GPU另有第四代 Tensor Cores ，FP8张量处理性能高达1.32PFlops，是上一代的5倍。

通过即时重新安排着色器负载，采用该架构的显卡可以更好地利用GPU资源，为光追带来最高3倍的性能提升，整体游戏性能提升也可达25％。此外，Ada 光流加速器带来 2 倍的性能提升，使 DLSS 3 能够预测场景中的运动，使神经网络能够在保持图像质量的同时提高帧率。编码器方面，Ada Lovelace 架构 GPU 采用双 NVIDIA 编码器，将输出时间至多缩短一半，并支持 AV1。

光追方面，第三代 RT Cores 可以为显卡提供 2 倍的光线与三角形求交性能。另有两个全新的重要硬件单元，Opacity Micromap 引擎将光线追踪的 Alpha-Test 几何性能提升 2 倍，而 Micro-Mesh 引擎可动态生成微网格，产生额外的几何图形，它可在提升几何图形丰富度的同时，不以传统复杂几何图形处理的性能和存储成本为代价。

此外，英伟达还推出了全新的 DLSS 3 技术，这是一款由 AI 驱动的性能倍增器，由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动，拥有光学多帧生成功能。

光学多帧生成技术可生成全新帧，从而带来惊人的性能提升。基于 NVIDIA Ada Lovelace 架构的新光流加速器可分析两帧连续的游戏图像，并计算帧到帧中物体和元素的运动矢量数据，而不使用传统游戏引擎的运动矢量进行建模。这极大地减少了 AI 在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。 DLSS 3 能用 AI 重建八分之七的显示像素，与没有 DLSS 相比，游戏性能提升了 4 倍。由于 DLSS 生成帧在 GPU 上作为后处理执行，即使游戏受到 CPU 性能限制，也能从中获得游戏性能提升。

据英伟达透露，已有超过 35 款游戏和应用宣布即将支持该技术，其中包括《黑神话：悟空》《赛博朋克2077》《霍格沃茨遗产》《暗影火炬城》《微软模拟飞行》《逆水寒》等。此外该技术即将支持全球最热门的游戏引擎，如 Unity 和虚幻引擎。

最后，RTX 4090显卡售价1299元起，将在10月12日上市。RTX 4080 12GB 售价7199元起，而RTX 4080 16GB 售价9499元起，均将在今年11月上市。