华为的鸿蒙麒麟系统有何区别：这就是华为速度 2.69分完成BERT训练新发CANN

逗爷 2022-11-12 01:03:40 209

华为的鸿蒙麒麟系统有何区别：这就是华为速度 2.69分完成BERT训练新发CANN在便捷性上，5.0版本又进一步降低了开发者的使用门槛。此外，推理引擎还包括Ascend CL（Ascend Computing Language，昇腾统一编程接口）全栈能力调用，即使是多路复杂的音视频处理等特殊场景也能轻松应对，以及ACE（Ascend Computing Execution，昇腾计算执行引擎）运行管理等功能；至于在线/离线切换的推理模式，也让部署场景更加灵活。在功能上，CANN 5.0首次发布了昇腾推理引擎软件包ATC Suite1.0（ATC，Ascend Tensor Compiler，昇腾张量编译器），包括模型压缩、张量编译、智能优化和媒体预处理硬加速等能力。模型压缩，包括量化、稀疏、张量分解等工具。像其中的AMCT模型压缩工具，就能对浮点数据进行压缩处理，来降低模型大小，加速推理速度；智能优化，能为用户提供在线调优能力，包括图解析、子图/算子自动调优、模型编译优化

△数据来源：昇腾

训练以外，5.0版本的推理性能，在不同场景（分类、翻译、检测）下提升效果也非常不错：

华为的鸿蒙麒麟系统有何区别：这就是华为速度 2.69分完成BERT训练新发CANN(1)

△数据来源：昇腾

显然，无论是训练还是推理，CANN 5.0都实现了更高效的任务调度和更好的性能提升。

在功能上，CANN 5.0首次发布了昇腾推理引擎软件包ATC Suite1.0（ATC，Ascend Tensor Compiler，昇腾张量编译器），包括模型压缩、张量编译、智能优化和媒体预处理硬加速等能力。

模型压缩，包括量化、稀疏、张量分解等工具。像其中的AMCT模型压缩工具，就能对浮点数据进行压缩处理，来降低模型大小，加速推理速度；

智能优化，能为用户提供在线调优能力，包括图解析、子图/算子自动调优、模型编译优化等功能，进一步加速ATC的计算速度。

此外，推理引擎还包括Ascend CL（Ascend Computing Language，昇腾统一编程接口）全栈能力调用，即使是多路复杂的音视频处理等特殊场景也能轻松应对，以及ACE（Ascend Computing Execution，昇腾计算执行引擎）运行管理等功能；至于在线/离线切换的推理模式，也让部署场景更加灵活。

在便捷性上，5.0版本又进一步降低了开发者的使用门槛。

例如，无需开发者手工修改代码，5.0版本支持模型自动迁移。

又例如，进一步支持混合编程。相比于3.0的手动加载模型，5.0版本在APP中可以直接调用算子函数，自动完成编译加载并执行：

华为的鸿蒙麒麟系统有何区别：这就是华为速度 2.69分完成BERT训练新发CANN(2)