人工智能技术
上QQ阅读APP看书,第一时间看更新

1.4 华为AI发展战略

1.4.1 全栈全场景AI解决方案

华为于2020年第一季度开源了MindSpore全场景AI计算框架,2020年6月开源了GaussDB OLTP单机版数据库,2020年12月31日开源服务器操作系统。

全栈,是包括芯片、芯片使能、训练和推理框架、应用使能在内的全堆栈方案。

全场景,是包括公有云、私有云、各种边缘计算、物联网终端以及消费类终端在内的全场景的部署环境。

其中,Atlas人工智能计算解决方案作为华为全栈全场景AI解决方案的基石,基于昇腾AI处理器提供模块、板卡、服务器等不同形态的产品,满足客户全场景的算力需求。

1.4.2 华为AI全栈方向

1.华为一站式AI开发平台——ModelArts

ModelArts是华为提供的面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端、边、云模型按需部署能力,帮助开发者快速创建和部署模型,管理全周期AI工作流。ModelArts具有以下特点。

(1)自动学习:自动学习功能可以根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模型,不需要代码编写和模型开发经验。

Model Arts的自动学习主要通过ModelArts Pro来实现,它是为企业级AI应用打造的专业开发套件。它基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。它支持客户自主进行工作流编排,可快速实现应用的开发、共享和发布,有助于共建开放生态,实现普惠行业AI落地。ModelArts Pro套件包括自然语言处理套件、文字识别套件、视觉套件等,能够快速响应不同行业、不同场景的AI落地需求。

(2)端-边-云:端、边、云分别指端侧设备、华为智能边缘设备、华为云。

(3)支持在线推理:在线推理是对每个推理请求同步给出推理结果的在线服务(Web Service)。

(4)支持批量推理:批量推理是对批量数据进行推理的批量作业。

(5)昇腾AI处理器:昇腾AI处理器是华为设计的高算力低功耗的AI芯片。

(6)数据准备效率高:ModelArts内置AI数据框架,通过自动预标注和难例集标注相结合,提升数据准备效率。

(7)训练耗时短:ModelArts提供华为自研MoXing高性能分布式框架,采用级联式混合并行、梯度压缩、卷积加速等核心技术,大幅度降低模型训练耗时。

(8)ModelArts支持模型一键部署:ModelArts支持将模型一键部署到端、边、云各种设备和场景下,可以同时满足高并发、端边轻量化等多种需求。

(9)全流程管理:ModelArts提供数据、训练、模型、推理(整个AI开发周期)全流程可视化管理,并且支持训练断点重启、训练结果比对和模型溯源管理。

(10)活跃的AI市场:ModelArts支持数据和模型共享,可帮助企业提升团队内AI开发效率,也可帮助开发者实现知识到价值的变现。

2.全场景AI计算框架MindSpore

在当今智能化时代,端、边、云场景的各种AI应用蓬勃发展。但AI技术仍然面临巨大的挑战:高技术门槛、高开发成本、长部署周期,这些问题阻碍了全产业AI开发者生态的发展。全场景AI计算框架MindSpore应运而生,它主要基于3个理念来设计:开发友好、运行高效、部署灵活。

在深度学习框架的世界中,谷歌的TensorFlow、亚马逊的MXNet、Facebook的PyTorch,以及微软的CNTK被列为当今“4大门派”,那么华为MindSpore就是最强的挑战者。

MindSpore提供自动化的并行能力,专注于数据建模和问题解决的资深数据科学家和算法工程师只需简单几行代码就可以让算法跑到几十乃至上千AI运算节点上。

MindSpore支持可大可小多种架构,适应全场景独立部署,支持昇腾AI处理器,也支持GPU、CPU等其他处理器。

3.CANN

CANN是华为面向深度神经网络和昇腾AI处理器打造的芯片使能层,它主要包括以下4大功能模块。

(1)FusionEngine,算子级融合引擎,主要作用是进行算子融合,减少算子间内存的搬移,可提升性能50%。

(2)CCE算子库,华为公司提供的深度优化后的通用算子库,可以满足绝大部分主流计算机视觉和NLP的神经网络的需求。

当然客户和伙伴出于时效性、隐私、研究等需求,不可避免地会有自定义算子的需求。这时就会用到CANN的第3个功能模块。

(3)TensorBoost Engine(TBE),高效、高性能的自定义算子开发工具,该工具将硬件资源抽象为API接口,客户可以快速构建所需的算子。

(4)最后一个模块是最底层的编译器,它实现极致性能优化,支持昇腾AI处理器的全场景应用。

4.昇腾AI处理器

面对汹涌而至的AI需求,AI处理器目前被少数公司垄断,价格昂贵,供货周期长,本地服务支持能力弱,很多行业的AI需求无法得到有效满足。

华为在2018年10月的全联接大会上发布了针对AI推理与训练场景的处理器昇腾310与昇腾910。昇腾AI处理器独特的达芬奇3D Cube架构,使其具有高算力、高能效、可扩展的优点。

昇腾310是用于推理的边缘智能场景的极致高能效AI系统级芯片(System on Chip,SoC),使用12nm制作工艺,可提供16TOPS的算力,且功耗只有8W,非常适合低功耗要求的边缘智能场景。

昇腾910是当前计算密度最大的单芯片,适用于AI训练,采用7nm制作工艺,可提供512TOPS的算力,最大功耗为350W。

5.Atlas人工智能计算解决方案

华为Atlas人工智能计算解决方案基于华为昇腾AI处理器,通过模块、板卡、小站、服务器、集群等丰富的产品形态,打造面向端、边、云的全场景AI基础设施方案,如图1-23所示。作为华为全栈全场景AI解决方案的重要组成部分,Atlas在2019年推出推理产品的基础上,2020年补齐训练产品,给业界呈现了完整的人工智能计算解决方案。同时,华为还通过全场景部署,打通端-边-云协同,让AI赋能各环节。

图1-23 Atlas人工智能计算平台全景图