AMD显卡VEGA64游民首发评测(AMD显卡VEGA64游民首发评测)
AMD显卡VEGA64游民首发评测(AMD显卡VEGA64游民首发评测)一开始小编捕风捉影得到消息称RADEON RX VEGA 64分为许多版本,有液冷版、限量版,还有什么套装不单卖等等,确实容易把将人搞晕,下面向大家阐述明确信息。VEGA 64有哪几款型号早在今年五月份AMD就公布了VEGA的技术规格,但当时描述的产品是RADEON VEGA Frontier专业绘图卡,对RX VEGA 64游戏卡的信息AMD一言未发,但我们还是能从中窥得一二。RADEON VEGA Frontier拥有64组NCU单元,每个单元又包含64个ALU,显卡SP总数是4096个。显存采用意料之中的HBM2,容量16GB,位宽2048bit。如果不出意外的话,RX VEGA 64会保留上述完整的核心规格。因为AMD上一代旗舰Fury X无力挑战GeForce 10,AMD需要性能完整的旗舰来对抗,显存是唯一能动刀子的部分。随着RX VEGA 64实物到手,一切都已明朗。
问2017年PC硬件最活跃明星是谁?答案非AMD莫属。为了一举扭转在CPU和GPU行业的双重不利局面,AMD多年来一直呕心沥血,潜心铸剑,如今厚积薄发的时刻终于到了。
于是2017年的PC硬件市场犹如被注射了一针肾上腺素,从持续了五六年的沉闷中活跃了起来——先是由AMD锐龙重新定义了CPU产品从低端到高端的规格和性能,惊的"牙膏厂"Intel再也不敢怠慢,为迎敌竟一股脑儿挤出来个i9全家。紧接着就是继R9 Fury X之后AMD最新一代旗舰显卡RX VEGA 64横空出世,向GeForce 10吹响了反攻的号角。
几天前游民星空评测室直接从AMD那里得到了期待已久的VEGA 64显卡,藉由本文为大家介绍这款新品的来龙去脉,芯片架构,及性能测试结果。2017年AMD能否双喜临门,就看它的表现了。
RADEON RX VEGA 64游戏显卡的原型——RADEON VEGA Frontier
早在今年五月份AMD就公布了VEGA的技术规格,但当时描述的产品是RADEON VEGA Frontier专业绘图卡,对RX VEGA 64游戏卡的信息AMD一言未发,但我们还是能从中窥得一二。RADEON VEGA Frontier拥有64组NCU单元,每个单元又包含64个ALU,显卡SP总数是4096个。显存采用意料之中的HBM2,容量16GB,位宽2048bit。
如果不出意外的话,RX VEGA 64会保留上述完整的核心规格。因为AMD上一代旗舰Fury X无力挑战GeForce 10,AMD需要性能完整的旗舰来对抗,显存是唯一能动刀子的部分。
随着RX VEGA 64实物到手,一切都已明朗。
VEGA 64有哪几款型号
一开始小编捕风捉影得到消息称RADEON RX VEGA 64分为许多版本,有液冷版、限量版,还有什么套装不单卖等等,确实容易把将人搞晕,下面向大家阐述明确信息。
RADEON RX VEGA 64 Liquid Cooled,出厂性能最强的型号
AMD官方设计的RADEON RX VEGA 64显卡,也就是公版,分为三个版本。性能最强的版本采用液冷散热器,Liquid Cooled版也简称作LC版,Boost核心频率设置在1677MHz,为所有型号中最高的。
注意AMD在VEGA上开始效仿NVIDIA加入基础频率和Boost频率概念,但机制与后者比还是有所不同。AMD的基础频率和Boost频率的关系相当于后者是正常负载频率,前者则是过热过载下的安全频率。只要温度和功耗没有超过限定的阈值,显卡都会以Boost频率运行。
RADEON RX VEGA 64 Limited Edition"金属拉丝限量版",频率稍低一些
所谓限量版,就是采用与液冷版相似外观的风冷版,采用公版最常用的离心式散热器。浑然一体,有棱有角的铝合金外壳上保留了"RADEON"Logo信仰灯与"R"字的3D角灯。既然是风冷,散热会弱一些,频率设置就不如液冷版那么激进,它的Boost频率为1546MHz。
RADEON RX VEGA 64普通版,传统外观,频率与上一款相同
RADEON VEGA 64普通版采用黑底配红的A卡公版传统风格,表面贴有网点状类肤材质,乍一看还以为是RX 480。普通版的出厂频率与风冷限量版相同,估计日后玩家们接触最多VEGA 64也是这款型号,假如AMD允许合作伙伴出品非公版,也应该是以普通版为参照。
下面小编将RADEON RX VEGA 64与上一代旗舰型号FURY X以及最近发布的14nm中高端游戏显卡RX 580的规格参数汇总对比。
每次显卡新品首发,最期待的就是这张图了吧
若仔细看这幅对比表,在座的各位定会心生疑问:从FURY发布到VEGA发布时隔两年半之久,制造工艺从28nm升级到14nmFFT,晶体管数从89亿增加到125亿,为何流处理器仍是4096个?为何纹理单元与ROPs这些性能攸关组件也与前作如出一辙?除了频率提升之外,VEGA相比FURY究竟有何进步?
要解答上述问题,还得最根溯源,从AMD GCN架构说起。
如何突破已成瓶颈的架构
GCN全称为Graphics Core Next,AMD早在RADEON HD7000系列显卡就开始采用这一架构,它也是世界上第一款围绕28nm制程设计的GPU架构。
AMD GCN架构的基础模块Compute Unit
GCN在诞生伊始就让晶体管密度提高了60%,用Compute Unit(CU)的区块形式重新构建了整个图形渲染系统。每个CU内整合了多达64个矢量逻辑ALU,超量计算可在寄存器的支持下由其中2个ALU或4个ALU合并完成。无论性能密度还是资源利用的灵活度,CU都是此前蓬松而僵化的1D 4D SIMD流处理器簇无法比拟的。自那时起,将指令缓冲、任务指派等组件与64个ALU打包在一起的CU便成为AMD图形计算架构的基础模块,一直沿用至今。
以芯片全局角度又是如何管理利用这些CU的?从第二代GCN开始,AMD将所有CU划归到4个Shader Engine里,每个Shader Engine都有一个Geometry单元负责为下辖CU装载几何计算指令。注意这里面包含的组件,控制ALU进行顶点计算、曲面细分的指令汇编都在此完成。
是不是觉得这一整套的形式与某物很像?没错,确实很像NVIDIA架构中的SM单元,PolyMorph、光栅化引擎都其并列其中,不同的是它比SM下辖了多得多的逻辑ALU。从计算规模上衡量,AMD GCN架构中的每个Shader Engine对应的是NVIDIA CUDA架构里的GPC,或者说比GPC更大,但每个Shader Engine只有一台几何引擎,而每个GPC却有若干个Polymorph加持,导致前者几何绘图能力常年弱于后者,这是AMD显卡从RV870时代一路带来的顽症。
从夏威夷到北极星的三代GCN构成
这些年来,AMD芯片架构从夏威夷到北极星,无论CU增多还是减少,Shader Engine一直都是四个。其实一开始Hawaii(R9 290X)的结构还算平衡,可是到了Fiji,ALU数量猛涨到4096个,Shader Engine却依然是四个,每个下辖CU达16个,却只有一个几何引擎和光栅引擎。 因此前端管线无法充分调动ALU进行顶点渲染、曲面细分等几何计算,产生的瓶颈严重制约了整体游戏帧数的输出。
如此这般,使FURY X更像是计算卡,而非游戏卡,很多时候空有强悍的浮点性能,实际游戏表现却不如浮点性能低得多的N卡,大量的计算资源没有用上,处于闲置状态。
关于GCN就说到这里,往远咱就不扯了,说回这次发布的RX VEGA 64显卡,既然SP单元是4096个没变,难道Shader Engine还要继续重蹈覆辙吗?
VEGA重新划分了Shader Engine?
AMD从VEGA消息泄露直至今日都没有提供官方架构图,使我们不能明确这次4096个SP是如何规划的,但仍可以通过Die Shot获取一些线索。
VEGA 10核心摄影
照片上可以清晰看到核心主要部分成了8块,而不是以前的4块。这意味着Shader Engine很可能由4个变成了8个,果真如此,那么几何引擎也会增加到8个。相比Fiji核心,每个Shader Engine内的CU减半,前段管线瓶颈显著降低,计算性能利用更充分。
当然还有一种可能,就是Shader Engine依然保持4个,但CU的结构重新排布,用增加并联的方式,缩短单一管线长度,同样能起到充分利用计算性能的作用。
无论如何,VEGA 10的CU构成一定与先前分四块的Fiji有所不同,前后端性能会平衡许多。
新一代的Compute Unit——NCU
VEGA 10相比以往的改变不仅仅是在CU的布局上,CU本身也发生了巨变。事实上用CU来称呼VEGA的Compute Unit是不准确的,应该改口叫NCU(Next-Generation Compute Engine)。 它不仅优化了IPC性能,还提高了运算单元的灵活性。
一般来说我们玩游戏、3D渲染对于单精度FP32、双精度FP64要求比较高,而在大规模深度计算中却对半精度FP16有非常高的需求。在深度计算领域先行一步的NVIDIA早就意识到这个问题,率先加入了对FP16半精度支持,半精度性能几乎是双精度的两倍,在深度计算上性能优势十分明显。而AMD无论在Fiji还是Polaris架构上都慢半拍,导致其专业卡在市场没有Quadro那么受人青睐。
但不利的局面从此成为历史,VEGA中首度引入了紧缩的半精度计算支持,尽管每个NCU中的ALU数量依然是64个,但它可以灵活地执行紧缩数学操作指令。如每个周期可以进行512个8位数学计算,或者256个16位计算,或者128个32位计算。这不仅充分利用了硬件资源,也大幅度提升VEGA在深度学习计算的性能。之前公布的VEGA FRONTIER专业卡的单精度浮点性能为13TFLOPS,而半精度直接翻倍到26TFLOPS。
AMD与NVIDIA在单精度与半精度采用相同的ALU管理办法,都是将两个16bit计算整合成一个32bit计算进行操作。
从HBM2显存看显卡未来
FURY X显卡上第一代HBM物理频率最高只有500MHz,等效速率1000Mbps,每堆HBM显存位宽有1024Bit,四堆的总位宽就高达4096Bit,总带宽超过512GB/s。但4GB的容量对这个级别的显卡而言实在嫌少,同时期N卡的980Ti都有6GB显存。
VEGA 64显卡使用的HBM2显存频率提升到了945MHz,等效速率则为1890Mbps,只需2096bit就能达到483.8GB/s。受GPU效能限制,显存带宽过大无意义,所以AMD果断将位宽砍掉一半,将容量提升到8GB。削减显存接口和内存堆栈数量能提升芯片良率,减少封装工序,从而提升了GPU成品率。预计RX VEGA 64显卡的产能会比FURY X有明显改观。
HBM2显存比GDDR5节省了大量的PCB空间,但细分出不同定位的产品线有困难
HBM首个完整规范就是AMD联手SK海力士研发的,因此初期只有AMD显卡专用,HBM说到底就是一种拥有超高位宽同时超功耗低内存芯片。与目前的闪存颗粒一样,也是由若干层高带宽内存Die垂直堆栈,每一层内存与底层的逻辑控制电路通过TSV硅穿孔、微凸点技术直接互连,再通过同样的技术,经中介层与GPU直接通信。
HBM2显存单堆的接入位宽依然是1024bit,实现2048bit只需两堆,芯片面积大幅缩小
经过一年的发展,HBM 2显存相关技术规范已经趋于成熟,同时成为JEDEC的标准之一。HBM2显存的最大提升在于实现了8-hi堆栈,容量可以由每颗粒1GB提升至8GB,物理工作频率由500MHz提升至945MHz(预期为1000MMHz),逐渐摆脱了对位宽的依赖。事实上Fiji之所以要安装四堆HBM显存,除了容量问题以外,显存频率不足也是相当大的因素。现在有了HBM2,仅需两堆显存,就能令VEGA 64显存容量比FURY X翻倍,其实一颗就能做到8GB容量,保留两颗只是为了实现2048bit位宽。
HBM2的进步让我们看到了采用这种显存的同时向下细分产品线的广阔前景,试想未来的主流游戏显卡只需根据定位安装一颗1024bit位宽,不同频率不同容量的显存即可,主流游戏显卡的体积势必大幅缩小,看来大部分显卡都做成刀卡的时代离我们不远了。
VEGA 64液冷版实物赏析
关于AMD RADEON RX VEGA 64显卡的技术解析告一段落,下图为游民硬件评测室收到的产品实物——最高阶的RX VEGA 64 Liquid Cooled。多角度大图与细节奉上共读者鉴赏。
测试平台软硬件配置构成
小编知道可能游民上大部分玩家都没有兴趣看那些长篇大论的技术解析,没有什么比实测数据更能说明问题了,你们想要的测试马上就到。
本次测试小编选择了三款基准测试软件和八款单机游戏大作考验RADEON RX VEGA 64液冷版的性能。为了让数据详实,具有更多参考意义,小编不厌其烦地重复测试,献上三种分辨率下的成绩。分别是1920×1080、2560×1440、3840×2160,游戏画质全开最高,抗锯齿视实际情况使用适当级别。
VEGA 64显卡上的RADEON Logo信仰灯为樱桃红,色泽十分纯净
3D的角灯设计颇具创意,实际装饰效果也十分理想
测试平台软硬件配置列表:
为了促使显卡性能发挥充分,尽可能消除系统瓶颈,向读者展示贴合理论的测试数据,测试平台CPU i7 7700K手动超频至4.7GHz,内存运行于X.M.P模式下的DDR-3400。
测试平台主板选用AORUS Z270X GAMING 7
测试平台电源选用长城极致火力G-750,通过80plus铂牌认证,轻载散热零噪音
注:一方面因为小编第一时间只从官方得到Win7下显卡驱动,另一方面考虑到Win7用户保有量仍多余Win10,本次测试仍将采用Win7系统。不过有传言VEGA 64显卡的Win7下优化尚未完善,本次测试结果可能与网络上其它Win10下评测有所出入,仅供参考
三项基准跑分测试
首先是三款基准测试,分别为3DMARK、Unigine Heaven 4.0、Unigine Valley 1.0。
Win7下最新版GPU-Z尚不能完整识别
GPU-Z显示液冷版VEGA 64的核心频率高达1750Mhz,但官方数据为1677MHz,不知是不是软件尚未识别完整,显示有误。
3DMARK Fire Strike Extreme测试得分10301,显卡单项得分11483
3DMARK Fire Strik Ultra测试得分5698,显卡单项得分5822
Unigine Heaven 4.0 1920×1080 4×AA测试得分2801
Unigine Valley 1.0 1920×1080 4×AA测试得分5027
仅从基准测试结果看,之前从网络上泄出的消息基本靠谱。RADEON RX VEGA 64的理论测试性能比GTX 1080高10%左右。
《战地1》游戏实测
《战地1》由EA DICE开发,寒霜3引擎打造,背景设定在了一战的战场,将为玩家们带来具有冒险感的战役剧情,以及极具史诗感的多人体验。官方表示,《战地1》当中会有一些FPS历史上游戏规模最大,充满变化的战斗。游戏中包含武器的自定义,各种宏大的破坏场面,还会提供刺激的骑马战,坦克战,空战等等。除此之外,《战地1》近战也非常刺激,游戏加入了铁铲,钉头锤等。
《使命召唤13:无限战争》游戏实测
《使命召唤:无限战争》 是由动视暴雪旗下工作室Infinity Ward于2016年发行的一款第一人称射击游戏。玩家将扮演一名叫Reyes的队长,也是一名Tier 1特殊行动的飞行员,玩家将驾驶地球上最后一个仅存的战舰"惩罚者"号。
《毁灭战士4》游戏实测
《毁灭战士4》由id Tech 6引擎制作,游戏的世界更加庞大,敌人将更加难应付,游戏场面更为血腥,同时射击感也更加优秀。
多人模式可以自建游戏元素,包括装甲、建筑及怪物等,将带给玩家高度定制玩的游戏体验。还加入了名为Snapmap的地图自定义模式,允许自定义多人对战地图。
《杀出重围:人类分裂》游戏实测
《杀出重围:人类分裂》的故事发生在前作《杀出重围3:人类革命》的两年后,即2029年。主角仍然是Adam Jensen,他将重新加入到一支由Interpol出力组建的队伍中,意在彻底解决恐怖分子问题,不过整个世界在此时对于机械人也更为忌惮。在本作中Adam Jensen将会拥有更多的能力,无论是潜行,战斗还是交流,至于结局导向还是取决于玩家自己的选择。
《孤岛惊魂:原始杀戮》游戏实测
《孤岛惊魂:原始杀戮(Far Cry:Primal)》的游戏背景设定在石器时代,主要武器为弓箭和石器。本作主打"不间断的生存战斗",即大量连续的战斗,人类各部落的对决,野兽,比如长毛象,剑齿虎,系列传统的锻造武器也将加入,不过武器种类可能不及现代社会。
《生化危机7》游戏实测
《生化危机7》是卡普空制作的动作游戏《生化危机》系列的第七部。本作的故事主要发生在美国南部的一间被废置的农舍,这里腐烂的墙身渗透着一股恐怖及孤独的氛围。《生化危机7》的到来标志着全新的恐怖求生体验,玩家的视觉切换为更骇人的虚拟实境"隔离视觉"模式。有赖RE工程部的努力,恐怖的写实感提升至一个全新的境界,玩家并没有任何退路可选,这一切让会你进入恐怖求生的新世界。
《生化危机:保护伞小队》游戏实测
《生化危机:保护伞小队》是由Capcom制作并发行的一款第三人称视角射击游戏,属于著名游戏《生化危机》系列的衍生作品,游戏的故事剧情围绕着保护伞小队展开,玩家将以队员的身份执行各种各样的任务。
《黑暗之魂3》游戏实测
《黑暗之魂3》是硬核动作角色扮演游戏系列《黑暗之魂》的正统作品,也有说法这将是《黑暗之魂》系列的收官之作,系列的最后作品。《黑暗之魂3》算是系列集大成者,继承了系列前作的所有优点,借鉴了《血源》的成功经验,游戏战斗更加顺畅,人物培养方案和玩法多样,收集元素依然丰富,BOSS富有挑战性,游戏关卡设计非常优秀。
游戏测试成绩汇总
散热与功耗测试
烧机测试说明AMD找酷冷至尊定制的液冷解决方案效果是相当出色的,TDP高达345W的显卡跑甜甜圈核心温度竟不到65℃。小编用手触摸感觉热量能有效输送到液冷排,冷排吹出的热风温度高,进出水管温差大。唯一的瑕疵的是噪音控制稍欠佳,满载时水泵偶尔啸叫。
甜甜圈烧机半小时后核心温度64℃
显卡满载时整机功耗451W
RADEON RX VEGA 64液冷版的官方TDP是345W,小编测试使用的电源转换效率为铂牌认证,中等负载下效率最高,故而功耗读数与实际功耗相差不大。i7 7700K运行Furmark测试会占满一条单线程,超频4.7GHz后单平台功耗大约120~130W,因而显卡此时功耗应在320~330W左右,与官方数据基本吻合。
全文总结与产品上市价格
大家翘首以盼的织女星显卡,RADEON RX VEGA 64的首发评测到此就全部结束了。如果从芯片架构计算单元的规模上来比较,VEGA 64相比FURY X其实并没有什么变化,依然是64个Compute Unite,每个里面依然是64个逻辑流处理器。这款GPU的全部设计重心显然集中在提升工艺制程和改进现有架构上。
如果按照以往的套路走到黑,只能疲于奔命,并不能在竞争劣势中寻得转机。而这次织女星仅以架构的改进就让相同计算规模的GPU性能脱胎换骨,从原本性能只能勉强对抗GTX 980的显卡,一下子从GTX 1080头飞身而过。工欲善其事,必先利其器,AMD的决策无疑是明智的,虽然VEGA 64仍无法与对手旗舰分庭抗礼,但只要套路走对,再加以时日继续提升芯片规格,逆袭绝非遥不可及。
迪兰与蓝宝石作为AMD首席合作伙伴,与首发同一时间推出自家RADEON VEGA 64显卡,产品与价格如下:
蓝宝石RADEON RX VEGA 8G HBM2液冷版5699元
蓝宝石RADEON RX VEGA 8G HBM2限量版5299元
蓝宝石RADEON RX VEGA 8G HBM2 4899元
迪兰RADEON RX VEGA 8G HBM2 4899元
迪兰 RADEON RX VEGA 8G HBM2液冷版5699元