快捷搜索:  汽车  科技

amd zen5最后一代(详解长文)

amd zen5最后一代(详解长文)上图:Zen 4 的部分性能提升来自于每核二级缓存翻倍,从 512 KB 增加到 1 MB。Zen 4 的大部分IPC改进来自于改进的前端设计,具有更快的分支预测器,每个时钟周期可以预测两个分支,而不是一个,以及更大的L1和L2分支目标缓冲区缓存和操作缓存。Zen 4还改进了加载/存储单元,它的加载队列增加了22%,二级缓存也更大。CCX内部的每个单独的CPU内核也有自己的1MB内存块 —— 是每个Zen 3内核的两倍。AMD承诺 Zen 4 的单核CPU性能比 Zen 3 快大约29%,目前很多评测中的测试,或多或少也都支持这一点。其中,略低于一半的增长来自于架构的改进,提高了 Zen 4 的每时钟指令数(IPC),而其余的则来自于时钟速度的提高。锐龙5000处理器的峰值时钟速度都接近5Ghz,而锐龙7000的CPU峰值时钟速度都远高于5Ghz。上图:高级 Zen 4 架构概述。 Zen

锐龙(Ryzen)7000 CPU使用了一个新的平台 —— 有很多变化。

amd zen5最后一代(详解长文)(1)

AMD发布的锐龙7000不仅仅是处理器。处理器架构正在发生变化,但同时也伴随着从芯片组到芯片所插入的物理插座的一切变化。上一次这么多东西同时发生变化要追溯到2017年,当时第一代锐龙芯片首次发布。

所以我们今天关于 Ryzen 的文章主要是看看芯片的实际性能和功率效率。我们将把这篇文章分成四个部分,涵盖锐龙7000发布的四个主要组件:1)Zen 4 CPU核心,2)支持CPU的非CPU功能并处理内部连接的片上I/O芯片,3)处理大部分外部连接的600系列芯片组,4)将比所有其他组件寿命更长几年的物理AM5插座。

简而言之,Zen 4 CPU

AMD承诺 Zen 4 的单核CPU性能比 Zen 3 快大约29%,目前很多评测中的测试,或多或少也都支持这一点。其中,略低于一半的增长来自于架构的改进,提高了 Zen 4 的每时钟指令数(IPC),而其余的则来自于时钟速度的提高。锐龙5000处理器的峰值时钟速度都接近5Ghz,而锐龙7000的CPU峰值时钟速度都远高于5Ghz。

amd zen5最后一代(详解长文)(2)

上图:高级 Zen 4 架构概述。 Zen 4 是 Zen 3 的修订版,其中 AMD 将 Zen 3 称为“全新”重新设计。

在架构方面,AMD表示Zen 4是对Zen 3的改进,而不是基础上的重新设计。Zen 3的许多构建模块仍然存在:由一个八核复合体(CCX)制成的八核复合体(CCD),它在所有八个CPU核心(或7600X和7900X中的六个)之间共享一个大型32MB高速缓存。Ryzen CPU由一个或两个CCD和一个I/O芯片(IOD)组成,与AMD的 Infinity 交换矩阵互连相连。

Zen 4 的大部分IPC改进来自于改进的前端设计,具有更快的分支预测器,每个时钟周期可以预测两个分支,而不是一个,以及更大的L1和L2分支目标缓冲区缓存和操作缓存。Zen 4还改进了加载/存储单元,它的加载队列增加了22%,二级缓存也更大。CCX内部的每个单独的CPU内核也有自己的1MB内存块 —— 是每个Zen 3内核的两倍。

amd zen5最后一代(详解长文)(3)

上图:Zen 4 的部分性能提升来自于每核二级缓存翻倍,从 512 KB 增加到 1 MB。

为了在不增加功耗的情况下进行这些添加和改进,Zen 4 CCD采用台积电的5 nm工艺制造,这是对Zen 2和Zen 3使用的7 nm工艺的升级。这使得Zen 4 CCD使用的晶体管比Zen 3多使用近57%的晶体管(从41.5亿增加到65亿),同时使芯片总体尺寸更小(70 mm的平方,低于80.7 mm;它也比Zen 2的74 mm平方的CCD小)。

由于CCX和CCD内核计数与Zen 3中的相同,这意味着内核计数在下一代中保持不变 —— 您可以在Ryzen 9 5950X CPU中获得多达16个内核,分布在两个完全启用的CCD上。粗略的传言暗示,Zen 5可能会改用混合架构,分为大性能内核和较小效率内核,就像苹果和英特尔所做的那样,但就目前而言,Zen 4 CCD中的每个内核都是相同的大小,具有相同的性能和能力。

amd zen5最后一代(详解长文)(4)

上图:Zen 4 IPC 改进的粗略细分,结合时钟速度提升,平均超过 Zen 3 29%。

除了一般的性能改进之外,Zen 4还增加了对 AVX-512 处理器扩展的支持,包括AVX512F的基本指令和其他一些处理器。但与英特尔所做的构建一个512位的大型SIMD块不同,Zen 4将通过运行256位的SIMD来处理AVX-512指令。但这是有代价的 —— Zen 4将需要两个时钟周期来处理AVX-512指令,而不是一个,但与支持AVX-512的英特尔CPU不同,AMD的设计也不会使用那么多的电力,或产生那么多的热量,这使得它可以保持更高的时钟速度。(它也不会占用太多的芯片空间。)

AMD 承认,它的 AVX-512 实施不会像英特尔那样快,但感觉 AMD 做出了正确的权衡,因为它首先支持 AVX-512 的利基性。尽管创建和推送指令,英特尔的第 12 代和第 13 代 CPU 官方根本不支持 AVX-512,因此即使 AMD 的速度较慢的实施,也比英特尔目前在台式机上提供的要好。

amd zen5最后一代(详解长文)(5)

上图:AMD 的 AVX-512 实现使用 256 位宽的 SIMD,这意味着它需要两个时钟周期来执行它们,但与英特尔的实现相比,它可以以更高的时钟速度、更低的功耗和更低的温度运行; 它还节省了模具空间。

至于Zen 4的下一步是什么,AMD的路线图列出了Ryzen 7000的3D V-Cache版本,我们知道移动处理器将以“Phoenix”和“Dragon Range”芯片的形式出现。更便宜的 Ryzen 7000 CPU 版本有望在某个时候出现 —— 我们不得不等待将近一年半的时间才能在台式机上购买 200 美元及以下的 Ryzen 5000 CPU,但希望制造和供应链压力做出必要的决定已经足够清楚,我们可以更快地看到更便宜的 Zen 4 芯片。

I/O 芯片

Zen 4在Zen 3的基础上有了令人印象深刻的飞跃,但如果有什么区别的话,I/O 芯片(IOD)与之前的芯片有了更大的不同。

在AMD的处理器中,IOD是CPU包上的一块单独的硅,它是用比CPU芯片更成熟、更不先进的工艺制造的。缩小这些芯片组功能的好处不像CPU核心本身那么明显或重要,所以AMD将它们物理上分开,通过 Infinity Fabric 互连连接在一起。Zen 2和Zen 3桌面处理器都使用了相同的12纳米I/O芯片,这意味着我们已经经历了好几代的重大改进。

amd zen5最后一代(详解长文)(6)

上图:新的 Zen 4 I/O 芯片 (IOD) 是其自锐龙 3000 系列以来的首次升级。 它采用全新的 6 纳米工艺,并集成了 DDR5 内存控制器和集成的 RDNA 2 GPU。

Ryzen 7000 IOD 有一个新的DDR5内存控制器,支持主板上的ECC RAM,也支持ECC RAM(但是,不像英特尔,没有DDR4控制器 —— 它是DDR5或bust)。处理器可以提供多达28个通道的PCIe 5.0带宽,尽管带有非“Extreme”芯片组的主板仍将使用PCIe 4.0作为GPU插槽。有一个新的集成图形处理器,这是第一个非APU Ryzen处理器。IOD还包括自己的USB控制器,支持多达四个10Gbps USB 3.2第二代,部分原因是支持通过USB-C连接到集成GPU的DisplayPort和内置USB闪回功能。

选择最佳 RAM 速度

只要是官方认可的JEDEC内存标准,DDR5内存控制器就支持DDR5-5200。但就像如今大多数主板一样,支持和鼓励一键RAM超频。AMD建议使用DDR5-6000作为最佳选择,以获得锐龙 7000的最佳性能。

解释原因有点复杂。简而言之,内存速度(MCLK)、内存控制器速度(UCLK)和无限交换矩阵互连(FCLK)的速度都是捆绑在一起的,这也是为什么锐龙的性能历来比 Intel 对内存带宽更敏感的部分原因。

在Ryzen 3000和5000 CPU中,推荐的策略通常是尽量保持MCLK、UCLK和FCLK以相同的速度运行(也称为1:1:1的比例)。如果您将内存时钟速度设置得过高,以至于 Infinity Fabric 无法跟上,那么 Infinity Fabric 时钟速度实际上可能会回落到较低的速度,引入延迟,从而抵消更快内存的性能优势(并且浪费您在超高速RAM上花费的额外资金)。对于这些CPU AMD通常推荐DDR4-3600作为最佳选择,因为RAM、内存控制器和 Infinity Fabric 都可以轻松处理1800 MHz的时钟速度,而且DDR4-3600通常比更快的RAM套件便宜很多,而只比较慢的RAM套件略贵。

对于锐龙 7000来说,DDR5更高的RAM速度使得1:1的比例很难实现,因此AMD建议将内存时钟和内存控制器时钟(MCLK和UCLK)保持1:1同步,而无限结构(FCLK)则以略高的2000 MHz的速度运行(默认范围在1600和1800 MHz之间)。对于DDR5-6000以上的RAM速度,AMD表示内存控制器的时钟无法再跟上,因此它的比例下降到2:1。在DDR5-8000套件上花钱(目前是虚构的),你最终会得到一个4000 MHz的内存时钟,但内存控制器时钟只有2000 MHz,而不是DDR5-6000所获得的3000 MHz的控制器时钟,这减少或消除了你想通过使用更快的RAM实现的任何性能优势。

集成的GPU:两个RDNA GPU核心,主要是USB-C输出

有史以来第一次,所有AMD的CPU都包含一个基本的集成GPU。今天介绍的所有四款CPU都包括一个GPU,在I/O芯片中内置了两个计算单元(CUs),基于与Radeon RX 6000专用GPU和Ryzen 6000系列集成GPU相同的RDNA2架构。

amd zen5最后一代(详解长文)(7)

上图:IOD 中的 RDNA2 GPU 针对原始性能(主要是显示输出和视频编码和解码)以外的所有内容进行了优化。 IOD 的 USB 支持意味着您主板的 USB-C 端口应该能够处理显示信号和数据,而如今许多主板 USB-C 端口只能处理数据。

这些GPU主要是针对以CPU为中心的工作站和商用台式机而制造的,在这些系统中,图形性能不是关键的,但能够在小功率范围内驱动几个显示器是很方便的。对于任何将专用GPU添加到系统中的人,您可以完全忽略集成的GPU,也可以将其保持打开状态,以便您可以使用其视频编解码块或其显示输出功能。与英特尔的集成图形处理器一样,AMD可以在混合模式下运行,使用专用图形处理器来渲染内容,然后在通过集成图形处理器连接的显示器上显示内容。

AMD一再强调,这些不是游戏图形处理器,也不是AMD发布的G系列APU的替代品。这些APU通常包含6到12个GPU核心,虽然远不及专用GPU,但比锐龙 7000 I/O芯片要多得多。我们发现新的锐龙图形处理器和英特尔目前的UHD 770图形处理器的表现非常相似。作为一款游戏图形处理器,2D性能很好,在老游戏中的性能还可以,对《我的世界》也很好 —— 但在更现代的游戏中,预计会有720p和低设置。

amd zen5最后一代(详解长文)(8)

但这些仍然是基于RDNA的GPU内核,即使是对于配备专用GPU的游戏系统来说,它们也确实带来了好处。集成的GPU将支持最多四个独立的显示输出,一个通过HDMI 2.1,另外三个通过使用DisplayPort Alt模式的USB-C。与现状相比,这是一个很好的改变。在现状中,台式USB-C端口通常只能处理数据,而不是像大多数笔记本电脑那样兼任显示输出。AMD表示,集成的GPU可以同时驱动多达三个60赫兹的4K显示器,但它没有明确表示是否会输出高于60赫兹的显示器。在我们的测试中,GPU通过HDMI同时驱动一个60赫兹的4K显示器和通过DisplayPort-over-USB-C同时驱动一个144赫兹的4K显示器没有问题,所以,他们显然可以做得比AMD说的要好一点。

新的GPU还与其他RDNA2 GPU共享其他共同功能。它们通过 FreeSync 支持可变刷新率。他们的视频编码和解码块支持AV1(和VP9)视频流的解码,但您仍然需要Intel Arc或Nvidia RTX 4000系列GPU来支持AV1的硬件加速编码;编码块支持8位和10位H.265和H.264视频。他们甚至可以进行硬件加速的光线跟踪,尽管他们速度太慢,没有实际的好处。

内置 USB 闪回支持

I/O 芯片的另一个方便、常识性的补充是内置 USB 闪回支持 —— 即使当前版本不支持您安装的 CPU,也可以将您的 BIOS 刷新到更新版本。当新的 AM4 处理器推出时,没有这个功能可能会让人头疼。如果您想购买带有稍旧主板的现代 CPU 以节省一些钱,您永远不能假设主板实际上会附带支持该 CPU 的 BIOS,即使主板制造商已经发布了更新的 BIOS。

AMD 在 AM4 主板上解决此问题的唯一官方解决方案是笨拙的,并且涉及对您的新处理器提出保修索赔,要求将旧的低端 CPU 借用作为“引导套件”。中高端主板最终通过 USB 实现了无 CPU 的 BIOS 闪存来解决这个问题,但这是 AMD 第一次直接在平台中实现它。

AMD告诉我们,它预计一些制造商将坚持他们自己的USB闪回实现,它也不要求主板真正启用内置版本;主板制造商将需要实现某种类型的物理开关,或跳线来启用这一功能,而AMD并没有要求任何人这样做。我们可能仍然会看到一些经济型主板出厂时没有USB闪回版本,无论是启用AMD还是其他版本。但该公司希望,内置这一功能将最终推动大多数主板加入这一功能。

AM5 插槽:更强大的功能,支持到2025年

芯片组和处理器将发生变化,但锐龙 7000将迎来2017年 AM4 处理器插槽的继任者。AM5 插槽是一个1718针的栅格阵列(LGA)插槽,这意味着它的引脚在主板上,而不是在CPU上。额外的引脚允许提供更多的功率 —— 从AM4的额定最大142W到AM5的最大242W。这也让AMD将较新的锐龙 CPU的TDP评级从105W提高到170W。

amd zen5最后一代(详解长文)(9)

上图:AMD 希望 Socket AM5 能够将其带到 2025 年,甚至可能更久。

这些功率上限远远超过了从Zen 4获得良好性能所需的功率;在我们的评估中,Ryzen 7950X即使在设置为105 W或65 W TDP,而不是正常的170 W时也表现良好,7600X的性能几乎相同,设置为65 W或其默认的105 W。但如果AMD打算这个插槽至少持续到2025年,它可能有一天也会看到锐龙 8000或锐龙 9000处理器;如果AMD想要在没有新的制造工艺的情况下提高性能,或者如果它想要将CPU核心的最大数量从16个增加到更高的数量,或者如果3D V-Cache芯片继续比无V-Cache芯片运行得更热、更耗电,AM5将给AMD提供相当大的未来空间。

与英特尔的LGA 1700插槽不同,AMD在从AM4迁移到AM5的过程中能够保持其CPU封装的尺寸不变,这意味着几乎所有现有的带有AM4安装硬件的CPU散热器,都应该能够安装到AM5处理器和主板上。在我们的测试中,廉价的Vetroo V5空气冷却器和Corsair Icue H115i一体机泵在AM5 CPU上都工作得很好。

AMD已经承诺至少在2025年之前支持Socket AM5,这意味着它可能会看到至少两次主要的Ryzen CPU更新(加上其间的一系列小版本)。与AM4相比,三年的时间听起来微不足道,AM4有坚实的5年支持,但AMD在2017年发布AM4时只承诺支持到2020年。在CPU支持方面有承诺不足和交付过多的先例。

四个芯片组实际上是两个芯片组(这实际上是一个芯片组)

处理器的内置I/O芯片不能处理的所有系统I/O,仍由芯片组处理,芯片组是通过PCI Express总线连接到CPU的外部芯片。AMD只为这一代制造了一款物理芯片,总共有四种配置。

amd zen5最后一代(详解长文)(10)

上图:AMD 的基准 B650 芯片组是 B650E、X670 和 X670E 主板中使用的基本构建块。

让我们从低端芯片组开始,因为它是AMD的基本构建块。B650芯片组通过四个PCIe 4.0通道连接到CPU。它可以在IOD支持的基础上支持多达12个额外的USB端口,外加8个通用PCIe 4.0通道,可用于支持额外的M.2插槽、Wi-Fi模块、局域网端口或其他内部附件。另外四个PCIe 3.0通道可用于支持另一个NVMe插槽、6Gbps SATA端口或两者的某种组合。

Ryzen CPU的24个PCIe 5.0通道中有8个用于支持PCIe 5.0固态硬盘,另外16个通道连接到用于GPU的主PCIe插槽。在标准的B650主板上,GPU插槽只能以PCIe 4.0速度运行。下一个芯片组B650E与B650相同,但主板制造商将确保该系统的主PCI Express x16插槽也可以处理PCIe 5.0增加的信号要求。这是B650和B650E之间唯一的区别。

X670芯片组使用了与B650完全相同的芯片 —— 只有两个芯片,一个被称为“上游芯片组”,另一个被指定为“下游芯片组”。与B650相比,X670板的所有I/O都是原来的两倍,除了你只能获得12个通用PCIe 4.0通道,而你期望得到16个。这是因为芯片组的PCIe 4.0通道中有4个用来连接上下游芯片组,另外4个用来连接芯片组和CPU。

amd zen5最后一代(详解长文)(11)

上图:所有 AMD X670 和 X670E 主板都使用一对相同的芯片组芯片,通过四通道 PCIe 4.0 接口连接。 只有 X670E 芯片组将支持 GPU 插槽中的 PCIe 5.0。 X670 主板仅支持用于 M.2 SSD 的 PCIe 5.0。

与B650E一样,X670E主板与X670主板相同,但它们支持GPU插槽的PCIe 5.0速度,而不是PCIe 4.0。

AMD 重申,所有这四个芯片组都将能够超频,一如既往 —— 没有人为的对高端芯片组和主板的超频限制。但X670芯片组仍然更有可能被包括在具有更强大的功率传输和更好的电压调节器模块的主板中,如果最大化超频对您来说真的很重要,那么这些东西将是您想要的。

EXPO 内存超频配置文件

在过去的几年中,自动内存超频已经成为从桌面系统中获得更高性能的一种流行方法,特别是对于AMD系统,提高 RAM 速度还可以提高 Infinity Fabric 互连的速度,从而允许不同的CPU芯片和I/O芯片进行通信。

大多数内存制造商和主板制造商统一的主要标准是,英特尔的 Extreme Memory Profile 规范,RAM制造商确保他们的芯片将以标准的DDR4或DDR5开箱即用速度运行,但 XMP 芯片也具有更快的速度和更严格的编程定时。用户可以进入他们的BIOS,一键加载这些配置文件,“超频”他们的内存,而不必担心崩溃或不稳定(至少在理论上)。

在锐龙7000中,AMD推出了自己的内存配置文件,称为超频扩展配置文件(或EXPO)。AMD表示,与依赖XMP不同的是,EXPO认证的RAM,已经专门在AMD的处理器上进行了测试,如果制造商发现某些设置在AMD的处理器上比英特尔的更好,他们可以进行额外的速度和时序调整。对于用户来说,最终结果是相同的 —— 通过BIOS的一键式内存超频。

Ryzen 7000 CPU 和 AM5 主板也将能够使用常规 XMP 配置文件。 没有什么能阻止 RAM 制造商在同一套件中同时支持 XMP 和 EXPO 配置文件,但英特尔主板同样可能会支持 EXPO 配置文件和 XMP。 技嘉和微星已经宣布他们的 Z690 和 B660 主板将增加对 EXPO 的支持,我们怀疑其他制造商也会加入。 目前,在尝试在英特尔主板上使用 EXPO 套件时要小心 —— AMD 与我们的 Ryzen 评测硬件一起发送的 G.Skill Trident Z5 Neo EXPO RAM 套件确实向我们展示了我们测试过的技嘉 Z690 主板中的 XMP 配置文件, 但是直到我们将 RAM 速度从 DDR5-6000 降低到 DDR5-5800(它在我们的 AM5 系统上以额定速度运行良好)之前,系统才会真正启动。


如果朋友们喜欢,敬请关注“知新了了”!

猜您喜欢: