快捷搜索:  汽车  科技

英特尔神经计算引擎:英特尔人工智能光子加速处理器微架构首次曝光

英特尔神经计算引擎:英特尔人工智能光子加速处理器微架构首次曝光该专利提到了使用 Mach-Zehnder 干涉仪(MZI)对编码在激光脉冲和光衰减器中的数据进行线性变换,缩放波导中的数据值,从而实现完整的乘法累加操作。透过这种方法,可以将任何 NxN 矩阵分解为一系列二维分束器的变换。第一份专利是这个 2x2 光子乘法矩阵,该专利是英特尔光学神经网络光子加速器的构建模块基础单元。举个栗子,Lightmatter 推出的 Envise 在对 SQUAD 数据集的 BERT 推理性能可以达到英伟达 DGX-A100 的 3 倍,每瓦性能可以达到 7 倍,它长这个样子:Lightmatter 的 Envisr可以说,光子计算加速器正逐渐走向成熟,作为全球最大的处理器厂商,英特尔这边也有自己的光子计算项目,最新曝光的诸多人工智能光子加速器专利就是明证。

在过去 10 年里,半导体工业为了克服后摩尔定律时代的限制可谓是用尽了诸般技能,例如 GPGPU、ASIC、FPGA 等等异构技术纷纷引入到主流计算市场中。

相对于单纯追求绝对性能,现在每瓦性能的改进意味着竞争力的提升已经是业界的广泛共识,光子学解决方案正在成为克服这些挑战最有希望的解决方案之一。

硅光子学的出现允许在 CMOS 制造的基础上经济高效地集成光学组件,无论是在互连还是在加速器中,硅光子学一直是芯片级光子解决方案的主要催化剂之一。

特别是在过去的30年中,陆续出现了一些针对深度学习的光子加速器的提案,这些提案提供了前所未有的能源效率和并行度,在某些情况下,其性能要比当今最节能的电子加速器好几个数量级。

举个栗子,Lightmatter 推出的 Envise 在对 SQUAD 数据集的 BERT 推理性能可以达到英伟达 DGX-A100 的 3 倍,每瓦性能可以达到 7 倍,它长这个样子:

英特尔神经计算引擎:英特尔人工智能光子加速处理器微架构首次曝光(1)

Lightmatter 的 Envisr

可以说,光子计算加速器正逐渐走向成熟,作为全球最大的处理器厂商,英特尔这边也有自己的光子计算项目,最新曝光的诸多人工智能光子加速器专利就是明证。

第一份专利是这个 2x2 光子乘法矩阵,该专利是英特尔光学神经网络光子加速器的构建模块基础单元。

英特尔神经计算引擎:英特尔人工智能光子加速处理器微架构首次曝光(2)

该专利提到了使用 Mach-Zehnder 干涉仪(MZI)对编码在激光脉冲和光衰减器中的数据进行线性变换,缩放波导中的数据值,从而实现完整的乘法累加操作。透过这种方法,可以将任何 NxN 矩阵分解为一系列二维分束器的变换。

英特尔神经计算引擎:英特尔人工智能光子加速处理器微架构首次曝光(3)

英特尔的光子加速器和 Lightmatter 的光子处理器都是基于该技术,然后它们的光子元件都以执行 MAC 操作的方式被组织于高度可编程的 Mesh(网格)中。

另一个专利则揭示了英特尔打算如何使用这个人工智能光子加速器,其中最值得关注的就是集成到大家熟悉的志强(Xeon)处理器里。

在这份专利中,英特尔提及的异构加速器由光子 IC(PIC,负责计算)和 ASIC(EIC,负责计算步骤之前和之后的打杂类工作)构成:

英特尔神经计算引擎:英特尔人工智能光子加速处理器微架构首次曝光(4)

相信大家都很想了解英特尔提出的 AI 光子加速器有多强大,以及NVIDIA、AMD 方面将如何与之抗衡。

英特尔在其专利中提出的建议是一个完整的解决方案,是 AI 加速器开发中前所未有的突破。即使目前尚未确认此加速器的具体物理实现指标,我们依然可以根据专利提及的原理预期至少具有与 Lightmatter 光子加速器相同的性能。

实际上,如果将这种光子加速器集成到 Xeon 平台上并且与英特尔整个 AI 软件生态结合起来的话,我们肯定可以期待比 Lightmatter 解决方案能够提供更好的性能和软件生态。

最后,通过对多个专利数据库的研究,我们认为无论是 NVIDIA 还是 AMD,目前都没有任何可以直接和该光子加速器的大芯片版本抗衡的解决方案。

To 老黄/苏博士:收购 Lightmatter 也许是现在最应该考虑的并购案。

猜您喜欢: