快捷搜索:  汽车  科技

英特尔发布适用于现代CPU的快速AV1编解码器(英特尔发布适用于现代CPU的快速AV1编解码器)

英特尔发布适用于现代CPU的快速AV1编解码器(英特尔发布适用于现代CPU的快速AV1编解码器)现在,随着 SVT-AV1 1.0 版 CPU 编解码库的发布,意味着 AV1 生态又跨越了一个重要的里程碑。2020 年 8 月,SVT-AV1 编 / 解码库正式被 AOMedia 旗下的软件实施工作组(SIWG)所采纳,对其后续流行起到了极大的助推作用。此外 Phoronix 指出,SVT-A11 提供了针对 AVX2 的进一步优化,可带来性能和图像质量改进、更多预设级别的快速解码、以及 S 帧支持。无论你的现代 x86 计算机运行的是苹果macOS、微软Windows、还是开源的 Linux 操作系统,新编解码器都可以在英特尔 5 代酷睿(Broadwell 及以上)处理器上良好支持。起初英特尔与流媒体平台 Netflix 启动了 SVT-AV1 项目,验证了 AV1 编解码器能够适用于从优质视频点播、到实时编 / 转码的各种应用场景。

作为开放媒体联盟(AOMedia)的创始成员之一,英特尔在推广 AV1 编解码器、并使其更容易被内容创作者 / 提供商和最终用户访问方面,开展了相当多的工作。早在 2020 年,该公司就已通过 Xe-LP GPU 引入对 AV1 硬件编码的支持。本周,这家芯片巨头又发布了适用于所有现代 CPU 的 1.0 版 SVT-AV1 编解码器。

英特尔发布适用于现代CPU的快速AV1编解码器(英特尔发布适用于现代CPU的快速AV1编解码器)(1)

据悉,AV1 开源视频编解码器专为超高清分辨率、宽色域和高动态范围的增强体验而设计。早在 2018 年,AOMedia 就宣称 AV1 效率较现有编解码器提升 30%(尤其针对 H.265 / HEVC 的类似 4K 内容设计)。

不过高效编解码器的一个问题,就是相当高的资源开销、且通常需要依赖于硬件加速才能正常工作。与此同时,现代 CPU 拥有大量资源和可用于编解码的新指令集,这正是英特尔 SVT-AV1 可以派上用场的地方。

英特尔指出,SVT-AV1 是一个可扩展的、且与标准无关的编解码器库,可充分发挥现代 CPU / AVX2 指令的多线程性能。

英特尔发布适用于现代CPU的快速AV1编解码器(英特尔发布适用于现代CPU的快速AV1编解码器)(2)

此外 Phoronix 指出,SVT-A11 提供了针对 AVX2 的进一步优化,可带来性能和图像质量改进、更多预设级别的快速解码、以及 S 帧支持。

无论你的现代 x86 计算机运行的是苹果macOS、微软Windows、还是开源的 Linux 操作系统,新编解码器都可以在英特尔 5 代酷睿(Broadwell 及以上)处理器上良好支持。

起初英特尔与流媒体平台 Netflix 启动了 SVT-AV1 项目,验证了 AV1 编解码器能够适用于从优质视频点播、到实时编 / 转码的各种应用场景。

英特尔发布适用于现代CPU的快速AV1编解码器(英特尔发布适用于现代CPU的快速AV1编解码器)(3)

2020 年 8 月,SVT-AV1 编 / 解码库正式被 AOMedia 旗下的软件实施工作组(SIWG)所采纳,对其后续流行起到了极大的助推作用。

现在,随着 SVT-AV1 1.0 版 CPU 编解码库的发布,意味着 AV1 生态又跨越了一个重要的里程碑。

值得一提的是,英特尔正在为 Netflix 之类的合作伙伴提供基于 DG2 GPU 的 Arctic Sound-M 加速器,支持同时对 8 路 4K 视频流进行 AV1 硬件加速处理。

英特尔发布适用于现代CPU的快速AV1编解码器(英特尔发布适用于现代CPU的快速AV1编解码器)(4)

Intel Arctic Sound 1T 加速卡采用了单槽全高设计,热设计功耗(TDP)150W 。Arctic Sound 2T 则是双贴芯片,功耗达到了 300W(需要 8-pin 外接供电)。

前者采用的 Xe-HP GPU 具有 384 个执行单元(EU) 16GB 板载 HBM2E 高带宽显存,峰值带宽高达 716 GB/s(或为 HBM2E 堆栈 @ 2048-bit 位宽)。

后者采用全长全高(FLFH)外形,具有 960 EU 32GB HBM2E 高带宽显存。

英特尔发布适用于现代CPU的快速AV1编解码器(英特尔发布适用于现代CPU的快速AV1编解码器)(5)

(图自:Igor's Lab)

与 Iris Xe 消费级 GPU 使用的 Xe-LP 相比,英特尔 Xe-HP 架构支持更多浮点格式(包括通用的 FP16 / FP32 / FP64 和用于 AI / ML 计算的 bfloat16 格式)、更多计算机专用指令、用于深度学习的 DP4A 卷积指令、以及英特尔的 XMX 扩展。

此外面向数据中心的 Xe-HPG GPU 使用了具有各种 IPC 改进的全新执行单元(EU)、支持 HBM2E 高带宽显存、并通过 Intel 性能优化的 10nm SuperFin 工艺来制造。简而言之,Xe-HP 与 Xe-LP / Xe-HPG 完全不是同类产品。

目前英特尔已向部分客户提供 1T / 2T 的 Xe-HP 计算加速卡,且去年宣布的 4T 方案甚至可提供超过 42 TFLOPs 的 FP32 性能(暂无具体出样计划)。

猜您喜欢: