2

40系显卡首批7199元起!赛博朋克2077帧数x4,老黄:大部分像素都是AI预测而非计算

 1 year ago
source link: https://www.qbitai.com/2022/09/38014.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

40系显卡首批7199元起!赛博朋克2077帧数x4,老黄:大部分像素都是AI预测而非计算

head.jpgPine 2022-09-21 12:48:30 来源:量子位

老黄再现精准刀法为30系清库存保驾护航

梦晨 Pine 发自 凹非寺

量子位 | 公众号 QbitAI

矿难来袭、玩家盘算何时下山之际,老黄带着他的40系显卡来了!

a214d670ca904bf683e270660910d021~tplv-tt-shrink:640:0.image

首发三款高端型号,RTX4090 24GB、RTX4080 16GB和12GB显存两版。

话不多说,直接上规格:

ab97b748220242238f51e9ff6525ab21~tplv-tt-shrink:640:0.image

三款游戏帧数测试,在4K分辨率、全高设置、开启光追与DLSS情况下,4090提高到上代旗舰3090Ti的2-4倍,4080与3080Ti对比也提高到原来的2-3倍

d7f244eff9874cb7802336569d1b5df3~tplv-tt-shrink:640:0.image
95448c3eb73f4e848e2a3ca5bb8cee15~tplv-tt-shrink:640:0.image

来看一组实机画面对比,来自《微软模拟飞行》

a808100430554966bb29283e9ff74e9e~tplv-tt-shrink:640:0.image

另外英伟达还与波兰蠢驴合作,给《赛博朋克2077》开发了“全极致光线追踪模式”,软硬协作榨干所有性能,帧数直接x4

28589594d78441818e2a2bf98f7702a9~tplv-tt-shrink:640:0.image

要达成这些效果,靠的是全新GPU在制程工艺、硬件架构、软件算法上的一系列改进。

台积电工艺、DLSS3放大招

全新架构Ada Lovelace,切换到台积电4N定制工艺(5nm),专为生产GPU优化的那种,而Ampere时代用的还是三星8nm。

新工艺加持下,RTX4090塞进了760亿个晶体管、1.8万个CUDA核心,比上一代增加70%。

同时与上一代架构Ampere对比,能效比也有较大提升。

d49a48c184af49f1b723c8e59c9fc5dc~tplv-tt-shrink:640:0.image

一个重头戏是DLSS3,这一次AI能力不仅用于超分辨率,还会用于插帧。

老黄说,以后你看到的游戏画面中大部分像素都不是直接渲染出来的,而是AI预测的。

aa93c96f814b43acb1f67713710da941~tplv-tt-shrink:640:0.image

接下来,英伟达把新架构下的SM多单元流处理器、负责AI计算的Tensor Core与负责光追的RT Core都升级至新一代。

26aaf79a863c47ffa04e5a6a9fe33ddf~tplv-tt-shrink:640:0.image

SM多单元流处理器方面,最大的更新是“Shader执行重排列”技术(Shader Execution Reordering)。

老黄讲到,光追吃性能的主要原因是GPU内部高度并行化、擅长做大量重复性高的工作。而光追场合下光线不断反射与全场景内不同材质交互并不能发挥GPU优势。

这项技术负责动态调度工作负载、合理安排计算资源,能给光追带来2-3倍性能提升,光追之外的综合游戏性能也提升25%左右。

这是与CPU乱序执行同等重要的计算革新。

张量核心Tensor Core,用了数据中心GPU H100的同款,新增FP8精度数据格式支持,吞吐量增加5倍。

光线追踪核心RT Core方面, ray-triangle交叉吞吐量提高两倍以上,还新增了Opacity Micromap引擎专攻树叶、粒子和栅栏这种光线通过缝隙的场景。

c71d3581f0e245139ba0b211d165ff2c~tplv-tt-shrink:640:0.image

总的看下来,新显卡架构主要性能提升都是围绕光追,还有那么多不支持光追的老游戏怎么办?

为解决这个问题,英伟达推出游戏MOD开发工具RTX Remix

一边玩游戏一边打开它,就能直接从GPU渲染指令里拦截游戏的图形资产,包括几何建模、材质、灯光、摄像机位置等。

bd4545a7c4984ab490da23d2a5b3d9d2~tplv-tt-shrink:640:0.image

在AI辅助下给这些资产增加细节、超分辨率、增加物理性质、添加光追和DLSS支持都不在话下。

还能一键打包成MOD发布,让老游戏也能焕发第二春,比如让20年前的《上古卷轴·晨风》画质超过最新的《上古卷轴·天际》。

23484923a4984b11b55b2cf53902c833~tplv-tt-shrink:640:0.image

英伟达官方为经典解谜游戏《传送门》制作了光追MOD,将以免费DLC的形式稍后发布。

4b89a0b1193c4d30a53e9e168844539a~tplv-tt-shrink:640:0.image

全在讨好玩家,除了价格

相较于RTX30系列,40系列显卡的性能增强够有诚意了,那么价格如何呢?

直接来看黄老板给出的价格:

RTX 4090定价1599美元
RTX 4080(16GB)定价1199美元
RTX 4080(12GB)定价899美元。

在国内,目前给出的售价是:

RTX 4090 12999元起
RTX 4080(16GB)9499元
RTX 4080(12GB)7199元。

为了方便比较,也顺便把之前国内RTX30系列的官方售价摆上来:

RTX 3090 11999元
RTX 3080 5499元
RTX 3070 3799元

从给出的定价来看,90系列的变化幅度并不是很大,国内售价在原来的基础上涨了一点,算得上是“高性价比”(但这价格依旧是普通网友可望不可及)。

对比之下,80系列新出的两款显卡涨价就比较明显,RTX 4080(16GB)相较于3080涨价近50%,被外界认为是对标RTX 3070的RTX 4080(12GB)也涨了近50%。

网友直呼:这根本没想让我们买40啊。

dac22c13fe6d44d7a2ec2888be57fff0~tplv-tt-shrink:640:0.image

(看来黄老板饱受矿难其害,不知道手里还有多少30系显卡)

不过游戏发烧友们也可以再等等。

在得知英伟达要发布40系列显卡后,AMD也坐不住了,后脚就透露消息称:11月3日会发布RX 7000系列显卡。

并且还放出了一张性能对比图,称其性价比高,能效好。

3153ac77ae3749299847dcc5ea5e29ca~tplv-tt-shrink:640:0.image

值得一提的是,虽然这次RTX40系列相较于30系列性能翻倍,但功耗方面却没有很大的涨幅。

RTX 4090功耗正如之前传言一样为450W与3090Ti持平,RTX 4080(16GB)为340W,RTX 4080(12GB)为285W.

对于RTX4090,英伟达建议使用850W的电源,12GB的RTX 4080需要700W的电源,16GB需要750W的电源。

不仅如此,英伟达此次还升级了散热系统,进一步优化了双轴流通系统,将风扇尺寸和翅片体积增加了10% ,并升级为23相电源。

(这尺寸倒是越来越大了)

甚至有网友调侃称:

24019d304e0c4bbb869a26f1fc464189~tplv-tt-shrink:640:0.image

除此之外,大家的AI导师李沐也第一时间给出了自己的看法。

4090相比3090Ti,AI训练来说重要的参数都没增强,增强多卡并行的NVlink还给砍了,不如再等等4090Ti。

5a43042c2a844782a9cf32141772ddad~tplv-tt-shrink:640:0.image

这次的40系新卡,你冲吗?

参考链接:
[1]https://www.nvidia.cn/geforce/graphics-cards/40-series/
[2]https://www.youtube.com/watch?v=Uo8rs5YfIYY

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK