9月20日23点,英伟达GTC 2022 主题演讲如期举行。老黄这次没有在厨房招待各位观众,但他仍然端出了颇受关注的RTX 4090显卡。
据介绍,RTX 4090 具有 760 亿个晶体管、16384 个 CUDA 核心和 24 GB 高速美光 GDDR6X 显存,在 4K 分辨率的游戏中持续以超过 100 FPS 运行。 RTX 4090 采用全新的 DLSS 3 技术,相比3090 TI,性能提升可达2-4倍,同时保持了相同的 450W 功耗。
英伟达还发布了 RTX 4080 显卡,氛围12GB 和 16GB 两个版本。其中12GB 拥有 7680 个 CUDA 核心和 12GB 美光 GDDR6X 显存。而16GB 拥有 9728 个 CUDA 核心和 16 GB 高速美光 GDDR6X 显存,性能可达 GeForce RTX 3080 Ti 的 2 倍。
三款显卡全部基于全新的 Ada Lovelace 架构,该架构 GPU 采用 TSMC 4N 定制工艺技术,性能功耗提高两倍。其着色器能力高达83TFlops,有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。GPU另有第四代 Tensor Cores ,FP8张量处理性能高达1.32PFlops,是上一代的5倍。
通过即时重新安排着色器负载,采用该架构的显卡可以更好地利用GPU资源,为光追带来最高3倍的性能提升,整体游戏性能提升也可达25%。此外,Ada 光流加速器带来 2 倍的性能提升,使 DLSS 3 能够预测场景中的运动,使神经网络能够在保持图像质量的同时提高帧率。编码器方面,Ada Lovelace 架构 GPU 采用双 NVIDIA 编码器,将输出时间至多缩短一半,并支持 AV1。
光追方面,第三代 RT Cores 可以为显卡提供 2 倍的光线与三角形求交性能。另有两个全新的重要硬件单元,Opacity Micromap 引擎将光线追踪的 Alpha-Test 几何性能提升 2 倍,而 Micro-Mesh 引擎可动态生成微网格,产生额外的几何图形,它可在提升几何图形丰富度的同时,不以传统复杂几何图形处理的性能和存储成本为代价。
此外,英伟达还推出了全新的 DLSS 3 技术,这是一款由 AI 驱动的性能倍增器,由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驱动,拥有光学多帧生成功能。
光学多帧生成技术可生成全新帧,从而带来惊人的性能提升。基于 NVIDIA Ada Lovelace 架构的新光流加速器可分析两帧连续的游戏图像,并计算帧到帧中物体和元素的运动矢量数据,而不使用传统游戏引擎的运动矢量进行建模。这极大地减少了 AI 在渲染诸如粒子、反射、阴影和光照等元素时的视觉异常。 DLSS 3 能用 AI 重建八分之七的显示像素,与没有 DLSS 相比,游戏性能提升了 4 倍。由于 DLSS 生成帧在 GPU 上作为后处理执行,即使游戏受到 CPU 性能限制,也能从中获得游戏性能提升。
据英伟达透露,已有超过 35 款游戏和应用宣布即将支持该技术,其中包括《黑神话:悟空》《赛博朋克2077》《霍格沃茨遗产》《暗影火炬城》《微软模拟飞行》《逆水寒》等。此外该技术即将支持全球最热门的游戏引擎,如 Unity 和虚幻引擎。
最后,RTX 4090显卡售价1299元起,将在10月12日上市。RTX 4080 12GB 售价7199元起,而RTX 4080 16GB 售价9499元起,均将在今年11月上市。