人工智能与数据挖掘(人工智能与数据挖掘的就业方向和前景)

Mark wiens

发布时间:2022-09-04

人工智能与数据挖掘(人工智能与数据挖掘的就业方向和前景)

 

(报告出品方/作者:广发证券,刘雪峰、李傲远、吴祖鹏)

一、AI 应用场景广阔,AI 公司规模持续扩大

(一)人工智能产业链梳理

人工智能行业是对算力、算法和数据等数字资源进行创造、加工、整合,最终实现用 机器替代人,为传统行业智慧赋能。完整的人工智能产业链是在上游厂商提供专有 算力和开发环境支持下,中游通过自研核心AI算法,搭载在硬件设备上,开发出行业 级解决方案,再销售给下游各行业客户。具体包括: (1)上游基础层:主要提供AI专有算力支持和开发环境的设备和服务,包括AI芯片、 系统开发框架、AI服务器等基础设施等; (2)中游技术层:在AI算力的支持下,通过系统开发框架进行各场景数据的训练和 学习,开发出计算机视觉、语音语义、知识图谱等AI算法,并将其搭载于硬件设备上 形成行业级解决方案; (3)下游应用层:针对不同的行业和场景,进行人工智能技术的商业化落地。

AI产业上游产品标准化程度较高,市场集中度高;中下游定制化开发占比较大,市 场分散。以AI芯片和系统开发框架为主的AI上游的产品提供的算力算法支持具有通 用性特征,容易形成标准化产品;此外,其技术壁垒高,掌握关键技术的英伟达、谷 歌等海外科技公司持续提升产品性能、培育软件开发生态,已有较高市占率。

行业中下游由于场景碎片化,软硬件产品定制化开发占比较大,商业模式以提供整 体解决方案的项目制为主。商汤、科大讯飞等独立AI公司以AI算法起家在行业中市 占率较高,但其面临两方面挑战:(1)以百度和阿里为代表的大型科技公司对AI持 续投入,并推出基于公有云的AI服务;(2)在部分垂直领域,人脸识别和更早投入 应用的语音语义等智能感知技术进入门槛降低,初创型AI企业纷纷入局。因此,中游市场格局呈现出逐渐分散的趋势,2017-2020H1,AI软件市场CR5分别为51%、49%、 41%和38%。

AI硬件在各场景快速渗透,软件功能不断丰富持续升级,价值量持续提升。在城市 管理、企业管理、人居生活等各场景中,智能化改造和升级的需求旺盛,智能硬件设 备快速渗透,软件的功能不断丰富。在摄像头、录音笔等前端设备中,AI算法和设备 耦合程度较高,固定设备上搭载的软件功能和接口相对固定。我们判断前端设备预 计将呈现出软硬件融合发展的趋势。在服务器和数据中心等后台设备中,如城市大 脑的大型行业级平台所需处理的数据类型多样,算法更加综合,包含数字孪生、计 算机视觉、自然语言处理等,开发难度更高;且AI模型的训练需要专用的AI芯片的支 持,硬件的专用化程度也较高。后台设备中的软件和硬件预计将向更加专业化的方 向发展。

AI芯片和服务器等后台设备技术壁垒高,由专业的硬件设备商提供。在后台硬件领 域,AI芯片技术开发难度较高,技术迭代周期短,具有较高的技术壁垒。以英伟达、 寒武纪为代表的专业AI芯片公司技术积淀深厚,产品持续迭代,已成为服务器和数 据中心等后台设备中AI算力的主要提供商。商汤2020年自研AI芯片STPU流片成功, 截止2021年底已产出1.6万个STPU芯片。商汤开发的STPU芯片定制化程度高,针 对其城市管理和商业场景业务中的智能视频分析量身定做,目前仅用于内部赋能, 并未对外销售。此外,商汤在通用型的深度神经网络的训练和推理任务中,仍需要 外购芯片来满足AI运算的需求。因此,独立AI公司造芯对于英伟达、寒武纪等专业AI 芯片公司的影响较为有限。

(二)AI 软件公司快速成长,产品商业化落地仍在探索

1. AI技术快速落地,独立AI公司规模持续扩大

人工智能技术种类较多,计算机视觉和广义的自然语言处理占比较大。按类型来分, 人工智能技术具体包括计算机视觉、机器学习、智能语音、自然语言处理、知识图谱 等。根据亿欧智库的数据,2020年,我国人工智能各项技术中计算机视觉占比29%, 排名第一。计算机视觉技术对于海量图像和视频数据识别处理并提取出有价值的信 息,已在各行业广泛应用。围绕决策智能环节的数据挖掘、机器学习等技术已在智能推荐、人机交互等领域应用。2020年,数据挖掘占比14%;机器学习占比12%。 智能语音和自然语言处理等技术以语音转文字、智能搜索、智能翻译等形式落地。 2020年,智能语音占比11%,自然语言处理占比6%。

2. AI应用的商业模式仍在探索中

软硬件一体化解决方案需要采购的设备和人力成本较高。独立AI公司通常本身不生 产硬件,因此需要采取外购材料和服务的形式生产出适合公司AI算法的软硬件设备。 其中外购材料包括主机、服务器、摄像设备等;外购服务包括安装调试、定制开发 等。2021年,商汤和云从外购硬件和项目外包成本占总成本的比例分别为89.0%和 95.3%。旷视科技2021年上半年硬件成本和工程交付成本占总成本比例为80.2%。

安防公司大力提升AI技术水平,AI初创公司被迫提升研发费用率。2020年,商汤、 旷视和云从的研发费用率分别为71%、64%和77%,远高于海康的10%和大华的11%。 但从绝对金额来看,一体化设备公司的研发费用远超AI初创公司。一体化设备公司 依靠其渠道和资本优势,AI算法技术水平逐渐与AI初创公司缩小差距,从而不断扩大 行业市场份额。随着前端设备AI技术红利逐步削弱,独立AI公司一方面需要提升研发 费用率保持既有产品的竞争力;另一方面则要寻找新的技术制高点,打造新的技术 壁垒。

3. 人工智能软件行业的市场格局比较分散

以商汤、科大讯飞为代表的独立AI公司在技术积累、场景下沉、渠道开拓方面已经走 在了行业前列,市场份额较为领先,但其面临大型科技公司、一体化设备公司和新 兴AI公司的追赶。随着百度、阿里为代表的大型科技公司和海康、大华为代表的一体 化设备公司在AI技术的研发持续投入,前端设备的AI算法和独立AI公司的技术差距 快速缩小。一体化设备公司在城市运营管理领域深耕多年,已形成全国性的销售网 络,品牌和渠道优势明显,议价能力较独立AI公司更强。此外,在部分垂直领域,人 脸识别等智能感知技术门槛降低,初创型AI企业纷纷入局,相应市场份额有所提升。 我们认为,未来人工智能行业竞争将会进一步加剧,各家公司在前沿技术的开发进 度、产品的商业化落地、市场开拓以及产业链布局是竞争的关键因素。

(三)AI 应用随着下沉扩散而更加碎片化

1. AI应用场景广阔

人工智能已在多个场景应用,城市管理场景占比较高。基于前端感知设备获取的海 量数据,AI算法在边缘端和后端实时运算,识别并提取有价值的信息,为城市管理部 门、互联网公司、金融机构、商业及汽车场景等提供智能化服务。具体包括:

(1)城市管理:主要为公安、政法、交通、应急、文教卫等政府和大型企事业客户 提供综合管理平台、态势预测、全息档案等服务。根据艾瑞咨询的数据,城市治理与 运营占AI市场份额较大,2020年占比为49%,排名第一;

(2)互联网场景:为互联网公司提供智能推荐、智能搜索、精准营销等服务;

(3)金融行业:为金融机构客户提供数字化身份认证、刷脸支付、网点数字化、风 险管理等服务;

(4)商业场景:为购物中心、百货商超、汽车4S店等消费场景提供销售人员管理、 消费者洞察、智能停车、商户业态调整等服务;

(5)汽车场景:为自动辅助驾驶提供感知、决策和执行等行为提供广泛技术支撑。 由于各家统计口径不同,当前数据参考有限。根据沙利文的数据, 2018-2020年, 汽车视觉AI市场CAGR为54.9%,高于计算机视觉市场的CGAR 45.4%。2018-2020 年,汽车场景的视觉AI应用占计算机视觉软件市场的比例分别为6.3%、7.2%和7.2%, 逐年提升(数据来源:商汤招股说明书)。除了基于视觉的DMS(驾驶监控系统)、 PAS(倒车辅助系统)等AI应用外,基于智能语音的人机交互系统、基于多源数据融 合的车路协同系统以及后台决策和执行系统等AI应用正在汽车场景快速渗透。未来 随着高等级自动驾驶车辆渗透率的提升,我们预计汽车场景的AI市场将呈现高速增 长的趋势。

银行业通过科技提升竞争力,金融行业智能化转型趋势明确。利率市场化之后,存 贷利差收窄,导致银行业利润率普遍下降,人力和资本对于边际效益改善效果不佳。 此外,商业银行的产品同质化严重,以及互联网厂商的跨界竞争迫使银行业急需寻 找其他途径提升竞争力。近年来,以银行、证券公司为代表的金融公司正加速进行 智能化转型。从服务对象角度,智慧金融主要包括两大部分:(1)对外提升客户线 上、线下办事体验的网点智能化改造、线上远程服务等;(2)对内利用智能化手段 提升日常工作效率、减少经营开支的手段。金融正在经历从网点前台、服务中台、业 务后台,全方位的智能化转型。2021年,我国金融机构网点数量为25万个,智能化 市场潜力较大。

汽车智能化趋势清晰,AI模型广泛应用于座舱域和驾驶域。自动驾驶汽车渗透率不 断提升,汽车驾驶控制系统正向感知-识别-交互等智能功能发展。汽车智能化需 要对行驶过程中各种信息正确理解。基于图像、视频等非结构化数据训练得到的AI 模型对于开发DMS(驾驶监控系统)、DAS(驾驶辅助系统)、AEB(自动紧急制 动)等具有重要作用。例如:在座舱域,摄像头采集的驾驶员面部表情、驾驶员行为 等图像和视频数据,通过机器学习训练成AI模型,可用于监测驾驶员的疲劳状态和 驾驶舱危险动作等,减少车辆驾驶事故率。在驾驶域,通过对行驶过程中的行人、车 辆、标志标线等物体进行框选标注,训练神经网络识别场景中的障碍物、理解各种 信息的含义,并在此基础上做出智能决策,将有效提升汽车的安全性和驾驶体验。(报告来源:未来智库)

2. AI应用场景呈现碎片化特征

软硬件一体的解决方案是市场普遍的接受形态,不同场景对AI技术智慧化赋能的需 求差异较大。AI技术在商业化落地过程中,面临了通用型的深度学习算法难以解决特定场景的个性化需求的问题。大部分的AI算法需要搭载于特定硬件上才能实现在 应用场景的商业化落地。因此,独立AI公司需要对各应用场景开发多款软硬一体化 产品。此外,不同场景中,AI算法所需要的功能也不同。以人脸识别技术为例,城市 管理场景需要人脸数据的大范围搜索、匹配和实时反馈的能力;而金融场景更注重 人脸识别的高精准性和反欺诈能力。随着AI技术在各场景应用的深化,根据碎片化 需求开发的AI应用逐渐成为主流的商业化模式。

总体而言,AI公司在商业化探索过程中机遇与挑战并存。在各场景商业化落地过程 中,AI算法被开发成品类丰富的AI软硬一体化产品,越来越多与行业应用结合。独立 AI公司面临应用场景碎片化的挑战。在不同项目中,客户的需求不同,需要实现的功 能不同,算法需要持续更新、产品的复用性较低。为应对碎片化的挑战,各公司进行 了不同路线的探索: (1)部分AI公司选择加强AI技术的应用深度(如科大讯飞对于智能语音技术的应用), 通过将软件算法和硬件终端模块化结合,灵活开发出更符合市场需求的产品; (2)部分AI公司选择扩大下游覆盖面(如商汤的AI赋能百业战略),利用高效研发 的技术优势,针对不同硬件设备和场景需求快速开发AI模型; (3)部分公司尝试将AI技术与自身其他产品平台相结合(如中科创达将图像AI和操 作系统平台技术结合)来筑高壁垒。 未来,各AI公司在商业化落地上的探索仍有待观察。同时需明确一点,即商业化自 驱动市场的持续性及空间更值得期待。

二、AI 平台化基础设施通用性强,算力需求旺盛

AI平台化基础设施为各场景广泛赋能。以AI芯片和开发环境与框架为基础的算力基 础平台具有各场景通用的属性,标准化程度较高,搭载在数据中心服务器、边缘计 算和终端设备中,已实现规模化应用。具体来看,AI平台化基础设施市场呈现出以下 特点:

(1)市场快速增长:随着AI应用在智慧城市、智慧金融、智能汽车等场景使用量和 开发量的提升,AI算力市场快速增长。根据Stratview的数据,2020年,全球AI芯片 市场规模为76亿美元,预计到2026年将增长到709亿美元,CAGR为45.1%。

(2)行业集中度高:AI基础平台技术壁垒高,掌握关键技术的英伟达持续提升产品 性能,培育软件开发生态,已有较高市占率。英特尔、AMD等海外芯片公司积极布 局AI芯片产品;以华为海思、寒武纪为代表的国产厂商持续追赶,产品性能快速提 升,与头部厂商差距逐渐缩小。

(3)生态建设是关键:AI基础平台不仅包含AI芯片,还包括系统级软件。系统级软 件集成了开发库、运行环境和工具链等,通过与AI芯片的优化和适配,提升底层硬件 资源使用效率。此外,下游行业在熟悉了特定软件的开发环境和开发库后,较难切 换到其他阵营的产品。系统级软件有效提升了用户粘性,有利于AI芯片公司打造生 态壁垒。目前,英伟达的CUDA系统已形成较强的生态壁垒,对其他厂商的系统软件 的推广形成一定压力。

我们认为,在AI芯片市场快速成长的过程中,国产AI基础平台公司的市场前景较为广 阔,但同时也面临来自英伟达及国内外各科技厂商智能算力产品性能持续提升的挑 战。未来,智能算力产品性能、商业化能力以及市场推广策略将是各公司扩大市场 份额的关键。

(一)AI 芯片专用化程度较高

AI计算专用性较高,AI芯片驱动能力更佳。在AI计算中,涉及较多的矩阵或向量的 乘法和加法。通用型的CPU用于AI计算时,存在耗时长、功耗高等问题,具有较低 的性价比。而具有并行计算、大规模数据训练能力的AI芯片是目前大规模商用的主 要产品,其具体包括3种类型: (1)GPU:即图形处理器,它是显卡的核心单元,是单指令、多数据处理器。GPU 采用数量众多的计算单元和超长的流水线,在图像领域的运算加速方面具有技术优 势; (2)FPGA:即现场可编程门阵列,其集成了大量的基本门电路以及存储器,利用 门电路直接运算、速度较快。用户可以自由定义这些门电路和存储器之间的布线, 改变执行方案,从而调整到最佳运行效果。与GPU相比,FPGA灵活度更高,功耗更 低; (3)ASIC:即专用集成电路,是一种为特定目的、面向特定用户需求设计的定制芯 片,具备体积小、功耗低、可靠性更高等优点。在大规模量产的情况下,还具备成本 低的特点。

1. GPU在AI计算的性能表现优异,英伟达在该领域市场领先

GPU更适合计算密集型、高度并行化的计算任务。从内部结构上比较,CPU的逻辑 运算单元(ALU单元)、控制单元和存储单元都较为均衡,适合运行具有分支密集型, 逻辑更加灵活复杂等特点的串行程序。而GPU核(ALU计算单元)的数量远超CPU, 适合把同样的指令流并行发送到众核上,采用不同的输入数据执行,从而完成图形 处理或大数据处理中的海量简单操作。因此,GPU更合适处理计算密集型、高度并 行化的计算任务。

在GPU领域,英特尔、AMD和我国的璧仞科技等公司也有开发用于服务器端的产 品: (1)AMD自2016年起开始开发用于AI计算的Instinct系列GPU。截止2021年11 月,AMD已推出9款产品。2021年11月,最新一代的Instinct MI250采用6nm制 程,可提供362TOPS的算力。 (2)2022年5月,英特尔推出的数据中心端GPU产品ATS-M,可提供150TOPS的 算力,将应用于面向云游戏、媒体处理和传输、虚拟桌面基础设施和AI视觉推理四 个场景。 (3)2022年3月,璧仞科技推出首款通用GPU BR100,采用7nm制程,以及芯粒 等技术。 除璧仞科技的产品性能未披露外,我们认为英特尔、AMD的产品性能以及生态建设 仍与英伟达的GPU产品有一定差距,但未来随着后续产品的推陈出新,其未来产品 仍值得期待。

2. AMD、英特尔和百度昆仑芯积极布局FPGA赛道

FPGA应用于数据中心及AI计算的比例较小。工业和通信是FPGA应用较为广泛的领 域。在工业领域,FPGA大量应用于视频处理、图像处理、数控机床等领域实现信号 控制和运算加速功能;在通信领域,FPGA在无线通信和有线通信设备中,实现接口 扩展、逻辑控制、数据处理、单芯片系统等各种功能。根据安路科技招股说明书引用 的Frost&Sullivan的数据,2021年,FPGA应用于工业和通信占比分别为31.3%和 41.6%。数据中心和人工智能是FPGA的新兴应用领域。在数据中心场景,其主要用 于实现对大数据处理和并行计算的硬件加速功能。在AI应用中,其可编程性可实现 灵活搭建数据处理流水线,适合各项AI任务。根据Frost&Sullivan的数据,2021年, FPGA应用于数据中心和AI应用占比分别为10.6%和3.8%。

人工智能是FPGA芯片的新兴应用领域,其在AI领域主要用于矩阵运算、图像处理、 非对称加密、搜索排序等,在数据中心等核心场景中的渗透率低于GPU。根据 Frost&Sullivan的数据,2021-2025年,我国FPGA在AI领域的市场规模的CAGR为 16.9%,低于2021-2025年中国AI芯片市场规模的CAGR 29.4%(数据来源:头豹研 究院)。FPGA硬件编程的特性使得基于上层应用的开发难度更高。英伟达从2007年 开发基于GPU的系统软件CUDA,已形成完整的函数库,开发环境对软件开发人员 友好。未来我国FPGA在AI芯片领域的市场份额将呈现逐渐下降的趋势。

3. 谷歌、英特尔和寒武纪针对AI算法设计专用芯片ASIC

近年来,针对于特定深度学习算法设计的专用芯片ASIC已成为众多科技公司采用的 技术路线。 (1) 在ASIC领域,谷歌起步早,产品持续迭代。2016年5月,谷歌推出针对自身 的深度学习框架TensorFlow而打造的AI芯片TPU。截止2021年,谷歌共推出 了4代TPU芯片。 (2) 英特尔自2019年收购了以色列AI芯片公司Habana布局ASIC芯片,当年推出 了第一代AI训练芯片Gaudi和推理芯片Goya。2022年5月,英特尔推出第二 代AI芯片产品,训练芯片Gaudi 2和推理芯片Greco,相较上一代产品,在内 核数量、内存容量、数据吞吐量等性能指标都有较大提升。 (3) 寒武纪的思元系列芯片也属于ASIC类型。2018-2021年,寒武纪针对推理、 训练、边缘计算各种应用,陆续推出了思元100、270、290、370云端大算 力AI芯片,其性能与主流AI芯片差距逐渐缩小。

4. GPU是主流AI芯片

(1) GPU凭借其强大的计算能力、较高的通用性,将继续占AI芯片的主要市场份 额。而且,以英伟达为代表的主流GPU设计公司不断升级架构并持续推出新品,其 对于深度学习加速的性能仍在持续提升中。AMD和英特尔也开发多款用于AI计算的 GPU。此外,英伟达的CUDA系统软件内含丰富的函数库、API指令和工具链,并吸 引了大量开发人员,形成广泛的生态圈。2017-2021年,英伟达以AI为主要产品构成 的数据中心业务营收CAGR为53.1%。 (2)与GPU相比,FPGA的硬件编程的特性使得上层应用的开发难度更高,生态建 设不如GPU。根据Frost&Sullivan的数据,2021-2025年,我国FPGA在AI领域的市 场规模的CAGR为16.9%。 (3)ASIC目前处于技术发展初期,以谷歌、英特尔、寒武纪等公司结合神经网络算 法开发的ASIC芯片已表现出较好的性能,对于AI算法加速效果优异。结合ASIC低功 耗、量产后低成本的特点,我们认为,未来其份额存在上升的潜力;但在GPU是主 流AI芯片且具有成熟生态的市场环境下,其份额上升的节奏预计不会很快。

ASIC和FPGA在部分场景中的性能有望超过GPU。在数据中心,针对神经网络训练 特定设计的ASIC类芯片专用性更强,对于部分算法的加速效果有望超过GPU。在边 缘端,ASIC具有低功耗和低成本的优势,在推理任务中性价比较高。FPGA的优势 在于可编程带来的配置灵活性,在应用和算法变化较多的场景中其优势明显。此外, FPGA较GPU具有更高的功效能耗比。在FPGA兼顾效率和灵活性的优势的前提下, 因此更适用于各种细分行业。

(二)AI 算力已成为数据中心算力的主要需求之一

1. 数据中心算力结构正在改变,AI算力快速渗透

中国市场的AI服务器出货量和渗透率都有提升。根据IDC的数据,2019年中国市场 的服务器出货量为319万台,其中AI服务器出货量为7.9万台,渗透率为2.5%,较2018 年提升0.9pct。未来,随着AI模型训练和应用的兴起,需要支持AI功能的服务器和芯 片预计将持续增加。

英伟达数据中心业务快速增长,22Q1占营收比重超过游戏业务。2022年Q1,英伟 达数据中心业务营收37.5亿美元,同比增长83.1%,占营收比重达到45.2%,超过游 戏业务营收36.2亿美元。2016-2021年,英伟达的数据中心业务营收快速增长,CAGR 为66.5%,占营收比重由12.0%提升至2021年的39.4%。英伟达的数据中心业务已成 为驱动公司快速成长的主要动力。

英特尔重视数据中心智能算力建设,开发了多款AI芯片。在智能算力需求快速增长 的背景下,英特尔加快布局AI芯片产品。2015年,英特尔收购Altera公司布局FPGA 芯片;2019年,英特尔收购以色列AI芯片公司Habana布局ASIC芯片。目前,英特尔 已开发多款AI芯片,积极向智能化算力转型,其产品具体包括:(1)数据中心GPU: 2022年5月,英特尔推出的数据中心端GPU产品ATS-M,将应用于面向云游戏、媒 体处理和传输、虚拟桌面基础设施和AI视觉推理四个场景;(2)FPGA产品:2020 年6月,英特尔发布Statix 10 NX产品,针对于文本语音转换、模型训练批处理等功 能进行了优化;(3)ASIC产品:2022年5月,英特尔推出专用于AI训练任务的芯片 Gaudi 2,相较上一代产品,在内核数量、内存容量、数据吞吐量等性能指标都有较 大提升。

互联网小常识:服务器的性能主要表现在:运算处理能力、磁盘访问能力、高可用性、数据吞吐能力、可管理性与可扩展性。

2. 各地政府正积极开展智能计算中心(AIDC)的建设

各地AIDC正在快速建设过程中,已建成的AIDC的算力利用率快速饱和。AIDC是以 AI芯片提供模型训练和推理的专用算力为主,配合少量的通用算力进行数据预处理 和其他任务的数据中心。在新基建等政策的鼓励和支持下,各地方政府正在积极开 展AIDC的建设。据智东西统计,2021年1月到2022年2月之间,全国规划、在建和投 入运营的人工智能计算中心超过20个,其中8个城市的AIDC是已建成并投入运营的。 各地的AIDC可提供或规划的算力规模一般为100PFLOPS,相当于5万台高性能电脑 的算力。已建成的AIDC未来也有扩容的需求。例如,武汉AIDC一期可提供 100PFLOPS的算力,从2021年5月投入运营至12月,吸引了超过100多家企业入驻, 已孵化出超过50多类场景化解决方案,日均算力使用超过90%。在武汉AIDC的算力 使用接近饱和的状态下,其在2021年底完成了二期扩容工程,可提供总算力 200PFLOPS,正在规划三期扩容工程。

(三)各场景 AI 应用多样化推动智能算力需求快速增长

AI芯片作为算力基础平台不受限于场景,具有广泛应用的属性。相较于下游碎片化 的特点,产业的上游AI芯片标准化程度较高,已实现规模化应用。以AI芯片为代表的 基础算力具有各场景通用的特性。在云、边、端各场景下,AI技术的大规模应用带来 算力需求快速增长,其应用的具体场景包括: (1)云端AI模型正向着大型化的方向发展:基于海量数据的通用特征训练出大规模 预训练模型已经成为云厂商提高AI模型生产效率的有效手段; (2)通信和计算架构的改变:自动驾驶、云游戏等新场景下对于计算实时性的要求 带动了边缘计算市场快速发展,边缘计算已成为拉动AI算力需求新的增长点; (3)智能网联汽车的兴起:随着自动驾驶汽车渗透率的不断上升,汽车厂商在搜集 了大量行驶数据的条件下,需要不断优化智能驾驶仿真模型,对于智能算力的需求 将有望提升; (4)VR/AR场景存在大量智慧化赋能需求:AI技术可为虚拟对象的行为、交互方式 智能化赋能,提升用户在虚拟世界中的沉浸感。

1. 云端AI模型正向着大型化的方向发展:

AI预训练大模型的规模在持续增加,算力基础设施建设是竞争的关键要素。2019年 谷歌推出的BERT大模型拥有3.4亿个参数,使用了64个TPU,训练到目标精度的花 费为1.5万美元。2020,OpenAI推出的GPT-3大模型拥有1750亿参数,训练成本达 到了1200万美元。2021年,微软和英伟达使用了4480个GPU训练出的拥有5300亿参数的MT-NLG大模型,其训练成本更是高达8500万美元。我们认为以AI芯片为主 的大规模智能算力基础设施是各科技公司训练AI大模型的前提。(报告来源:未来智库)

2. 边缘端对AI算力需求快速增加

新应用带来通信架构的改变,边缘端是AI芯片新的增长点。云游戏、自动驾驶等新 兴应用场景对于数据传输的速度和量级都提出了更高要求,传统的云端直连模式已 较难满足大数据量的实时通信的要求。在终端和云端间布设边缘端,形成云-边-端 的通信架构已经成为未来技术发展的主要方向。在靠近用户侧的边缘端布设服务器 提供中等算力的服务,一方面数据分析在边缘端完成并传输给终端用户,提高分析 传输速度,满足AI应用场景实时性的要求;另一方面边缘端仅将精简的数据流传向云端,缓解带宽压力,减少运维成本。边缘计算的需求增长将有效带动边缘端AI芯片 的出货量。

3. AI算力为智能网联汽车赋能感知、交互、决策等功能

汽车智能化趋势清晰,智能驾驶AI模型需要算力支持。自动驾驶汽车渗透率不断提 升,汽车驾驶控制系统正向感知-识别-交互等智能功能发展。汽车智能化需要对 行驶过程中各种信息正确理解。因此,汽车厂商需要通过数据中心训练前端搜集的 各种数据,不断优化智能驾驶仿真模型。智能驾驶AI模型对于汽车从L1/L2辅助驾驶 阶段走向L3/L4自动驾驶阶段,并最终实现智能决策、实时控制的功能具有重要 作用。未来,随着需要训练的各类行驶数据量的增加,以及开发智能驾驶AI模型需求 的增加,汽车厂商未来对于AI算力的需求将有望提升。

4. 虚拟现实世界的构建需要AI算力支持

VR/AR场景存在大量智慧化赋能需求。在VR/AR场景中,虚拟对象的打造需要通过 大量真实世界中形状、颜色、人类行为、交互数据的训练与推理来实现。AI技术为虚 拟现实世界提供建模自动化、交互方式智能化等智慧化赋能,有望提高VR内容生产 效率和用户的沉浸式体验。英伟达在2021年11月的GTC大会中展示了Omniverse产 品利用数字孪生、人脸表情模拟和自然语言训练等技术生成的虚拟人与人类实时交 互的过程。英伟达已将Omniverse定位为创建元宇宙数字化虚拟空间的技术平台底 座。VR内容提供商对于快速打造虚拟场景、提高用户感官体验的追求,激发了其对 于AI算力的需求。

三、重点公司分析

(一)寒武纪

1. 公司已构建完整的AI产品矩阵,新品性能接近主流芯片

稀缺的AI计算平台公司,产品和技术具备较强竞争力。公司是市场上稀缺的既拥有 AI芯片架构、指令集等底层芯片设计能力,又掌握编程语言、基础系统软件开发能力 的综合性AI计算平台公司。公司已经形成云边端一体、软硬件协同、训练推理融合的 完整产品生态: (1)云端芯片及加速卡产品:针对云计算、数据中心场景设计的提供高性能、高计 算密度算力的AI芯片和加速卡; (2)边缘芯片及加速卡产品:针对边缘计算场景,设计的用于处理图像视频、语音、 自然语言等相关智能应用的芯片和加速卡; (3)基础系统软件Neuware:用于支撑AI应用跨平台开发、便捷高效运行基础系统 软件,可实现云边端异构硬件资源的统一管理、调度和协同。

公司推出的芯片性能指标接近主流芯片,预计2022年量产,有望扩大客户覆盖面。 2021年11月公司推出思元370芯片及加速卡,在能耗都在150W的水平下,其整数算 力(INT8)为256TOPS左右,与同期竞品英伟达的A10在同一水平;浮点数算力(FP32) 为24TFLOPS,略低于A10。总体来说,寒武纪思元370已经具备和英伟达A10直接 竞争的技术基础。思元370已陆续送测客户,部分客户已完成测试、导入,其中包括 阿里云基础设施异构计算团队等。根据产业周期,我们预计公司思元370在2022年将 实现量产,有望扩大云计算、车联网与自动驾驶、物联网、边缘计算等下游领域覆盖 面,推动商业化落地规模上一个新台阶。

根据公开的产品性能数据,寒武纪思元370可提供256 TOPS的算力,与百度的昆仑 二代芯片在同一水平,但功耗为150W高于昆仑二代。对比算力功耗比这一指标,思 元370与昇腾910性能相当。阿里平头哥采取错位竞争的策略,进军AI推理市场,其 推出的含光800芯片推理算力性能优异。与其他科技厂商相比,寒武纪每年都有新的 AI芯片产品推出。我们认为寒武纪拥有指令集、芯片设计框架和基础系统软件等底 层能力,这是其产品快速迭代、性能持续提升的主要原因。

2. 公司的中立属性在行业格局中具有独特价值

互联网公司的AI业务发展各有侧重: (1)百度更注重自动驾驶和语音交互领域的发展,因此其算力需求在于对人机交互 和大型神经网络算法的支持。 (2)阿里强调将AI应用于电商、物流等商业场景,为消费全流程提供技术支持。此 外,阿里对于城市大脑产品的开发也存在对于大量图像数据训练和推理的需求。(3)腾讯在拥有大量用户数据的基础上,需要赋能内容、社交、游戏、平台工具四 大业务。因此,其需要支持运算多来源、多格式的用户数据。 (4)字节跳动深入挖掘用户搜索的文字、图像和视频数据,分析出客户潜在感兴趣 的咨询,进行精准推荐。其AI算力需求更加侧重于对于智能推荐系统的支持。 总而言之,互联网公司上层AI应用发展重点的差异使其底层算力需求类型不同,进 而导致其开发AI芯片的差异性。

华为提供全栈AI解决方案,在部分场景与AI应用公司构成竞争关系。华为于2019年 推出云端AI芯片昇腾910和边缘端AI芯片昇腾310。华为基于这两款芯片推出AI模块、 加速卡、服务器等AI算力产品。以这两款芯片作为AI算力底座,华为为其在各场景提 供的AI解决方案赋能。以自动驾驶领域为例,华为提供了涵盖底层算力(昇腾和鲲 鹏芯片)、系统平台(智能驾驶操作系统)以及应用软件(集成开发环境和工具链) 的完整产品生态。这与部分自动驾驶产品提供商构成同业竞争的关系,其发展会受 到一定限制。我们认为,华为在各场景中提供全栈AI解决方案的战略会影响其基础 AI算力产品的商业拓展。

3. 公司持续迭代软件系统,打造生态壁垒

公司的Neuware软件系统,提升用户粘性,构筑生态壁垒。公司为云边端智能芯片 打造了基础系统软件Cambricon Neuware,打破了不同场景之间的软件开发壁垒, 兼具高性能、灵活性和可扩展性的优势。2021年,公司对Neuware进行了升级,新 增MagicMind推理加速引擎,支持跨框架的模型解析、自动后端代码生成及优化,提 升算力利用率,降低用户的研发成本。我们认为,公司打造的Neuware系统软件,不 仅通过对于底层硬件资源的优化加强了软硬件的协同效应,还提升了用户粘性,打 造产品的生态圈,相较于仅开发AI芯片的公司具有生态优势。

4. 公司保持快速增长态势,下游需求旺盛

2018-2021年,公司营收CAGR为83.3%,过去三年营收增速较快。2022Q1,寒武纪 营收6299万元,同比增长74.3%,其主因是云端产品线销售增加所致。我们在《寒 武纪-U(688256.SH):专"芯"深耕AI计算,商业化有望上新台阶》深度报告中,曾判 断公司云端产品思元370在2022年将实现量产,有望扩大下游领域覆盖面,推动商业 化落地规模上一个新台阶。2022Q1公司营收的高增长,验证了我们对于公司云端产 品线增长趋势的判断。

互联网小常识:SNMP有三个基本组成部分:管理站、代理和MIB,其管理模块是一个Manager/Agent模型。Manager通过SNMP定义的PDU向Agent发出请求,而Agent将得到MIB值通过SNMP协议传送给Manager。与OSI的定义不同之处是,SNMP模型的定义比较简单,并不在每层都定义有管理实体,只在TCP/IP协议层上进行定义。

就数据中心业务的营收规模而言,寒武纪与英伟达有较大差距。英伟达数据中心业 务涉及的场景覆盖云计算和边缘计算两个场景。因此,我们将寒武纪云端产品线、 边缘端产品线和智能计算集群三项业务加总后,与英伟达的数据中心业务相对比。 2019-2021,寒武纪这三项业务营收相当于英伟达数据中心业务营收的1.9%、1%和 1.1%。其主要原因为: (1)英伟达的数据中心业务中不仅包含用于AI计算的芯片,其应用范围还包括并行 计算、云计算、大数据处理等。 (2)寒武纪作为AI芯片初创公司,产品矩阵仍在建设过程中。2019年,寒武纪推出 第一代边缘端芯片思元220;2020年,公司推出第一代专用于训练任务的云端芯片思 元290。相较于英伟达,寒武纪实现营收的产品品类较少。 (3)寒武纪早期的AI芯片产品性能与英伟达产品性能有差距。

公司产品在下游各行业快速渗透。 (1)英伟达的AI芯片和计算平台等产品广泛应用于下游领域,包括主流云计算厂商, 比如:阿里云、腾讯云、百度云、亚马逊AWS、谷歌云、IBM云、微软Azure和Oracle 云。寒武纪类似也包括智能计算中心和云计算厂商等各行业客户。 (2)2019-2021年,寒武纪陆续拿下珠海横琴先进智能计算平台(二期)项目、南 京智能计算中心(一期)项目、江苏昆山智能计算基础设施建设项目,已在国内智能 计算中心占有一定份额。此外,公司与百度、阿里、中国电信、中兴通讯、一汽集团 等各行业客户形成全方位的合作关系,智能算力产品在行业客户中快速渗透。 (3)未来,随着寒武纪AI算力产品性能与英伟达等公司的差距逐渐缩小,其下游客 户面有望进一步扩大,推动商业化落地上新台阶。

(二)商汤

1. 高效研发驱动AI应用在各场景快速渗透

商汤以通用AI能力为基础,打造行业级软件平台,产品在各场景广泛落地。公司的 业务主要在商业、城市管理、人居生活、汽车等多个场景提供全栈AI应用服务。为支 持各场景产品的快速开发,公司从算力、算法和数据三方面,打造人工智能基础设 施SenseCore。截止2021年6月,SenseCore可提供算力为每秒1.17百亿亿次浮点运 算。截止2021年底,公司的SenseCore平台累计生产商用AI模型数量为3.4万个AI模 型。公司基于SenseCore的基础算力和算法能力,针对各场景打造了行业级软件平 台,实现了根据客户个性化需求快速开发定制化应用。公司的AI基础设施和前端应 用形成了正向加强的良性循环,前者为各场景应用产品提供了快速开发的技术基础, 后者为前者提供了丰富的数据反哺算法。

商汤市场份额领先。2021年,商汤和云从科技的营收分别为47.0亿元、10.8亿元, 分别同比增长36.4%和42.5%。2021年上半年,旷视科技的营收为6.7亿元。从绝对 规模来看,商汤集团的营收显著高于其他三家。与其他AI初创公司相比,商汤集团开 发的产品覆盖的应用场景最为广阔,这是造成其营收规模较高的主要原因。2020年, 中国计算机视觉行业中,商汤的市场份额领先,这反映了商汤基础AI产品竞争力的 提升,以及视觉AI技术在城市管理、商业管理等领域商业化落地提速。

2. 2022年1月,公司上海临港AIDC建成并启用

2022年1月,公司的人工智能计算中心(AIDC)在上海临港建成并启用。公司的AIDC 设计的峰值算力是3740 PFLOPS(每秒百亿亿次浮点运算),是公司既有算力1170 PFLOPS的3倍之多。我们认为,AIDC的投入运营后会给公司带来三大优势:

(1) 研发效率有望进一步提升: 在AIDC提供的强大算力的支持下,公司有望缩短 AI模型训练的时间,提升开发效率,从而进一步提高AI模型的量产速度。此外, AIDC还可提供大规模弹性算力,可完成1万亿参数的AI大模型的完整训练。因此, AIDC也有望促进公司在AI大模型上的研发进度。

(2) 算力成本有望降低:公司已采用了能源、技术和管理等多方面措施为AIDC供 能进行优化,年均PUE已优化至1.28,其功耗比国内其他数据中心平均水平低 10%。公司自研的SenseParrots框架可将模型训练任务扩展至数千个GPU,在 1024个GPU上实现91.5%的并行效率,相较于主流训练框架的25%的效率,提升 效果显著。我们认为,公司的AIDC在SenseParrots的赋能下,其算力成本有望 下降,算力利用率有望提升。

(3) SenseCore有望扩大对外服务范围:在满足公司日常研发工作的条件下, AIDC的部分算力预计以AIaaS的形式对外服务,为产业、科研以及城市管理等提 供智能算力支持。公司已基于SenseCore的模型库,为部分城市和车企客户以 AIaaS的形式提供服务。我们认为,公司未来提供的AIaaS服务不仅局限于算力 租用,其基于SenseCore的全栈AI能力,将提供模型训练、模型调用以及模型部 署等广泛的AI服务。(报告来源:未来智库)

(三)科大讯飞

1. 2019年推进战略聚焦,教育、消费者业务成为主要赛道

2018年之前公司在诸多赛道尝试AI技术的商业化落地,逐步完善软硬件产品矩阵。 经过长期研讨与试错,公司于2019年启动战略聚焦,将资源集中于8条核心产品线(C8),其中以教育、消费者智能硬件、智慧医疗赛道为核心。

2. 国内AI行业产品化处于从1到N的早期阶段,科大讯飞在国内智能语音市场中优 势明显

视觉及语音类AI产品的主要商业模式:其一,AI技术融入解决方案,在传统行业信 息化中的占比提升,对应科大讯飞的智慧课堂、城市大脑等业务;其二,特定AI技 术(如机器视觉、NLU/NLP自然语音识别与处理)在特定场景的产品化落地,对应 科大讯飞的学习机、录音笔、智能办公本等产品。目前第一种商业模式仍占据整体 市场空间的较大比例。

科大讯飞是稀缺的已实现规模化收入利润的技术型AI公司,并居于智能语音产业价 值链的中心环节;但另一方面,当前智能语音技术更多是作为入口/工具融入了诸多 场景,其单独作为主打产品的商业模式和市场空间仍在探索与挖掘中。凭借领先的 算法模型及在诸多行业中的渠道优势,公司在AI语音技术变现方面的进展领先于同 业厂商,教育、消费电子、智慧城市等场景中的商业价值逐渐清晰;但同时也需要看 到,公司商业模式尚未发生质变,当前公司主要的业务板块仍以2G和项目制为主。 在未来的探索中,公司的产品化率及利润率水平均有明确的提升预期;从产业发展 规律来看,我们认为这将在中长期的维度上持续兑现。

3. 商业模式持续改善,可期待C端产品收入占比持续提升

随着近年来录音笔、翻译机、办公本、学习机等明星产品的销量与口碑快速增长,公 司已逐渐在教育和办公场景中形成完善的智能硬件产品矩阵。同时,公司线上转写 平台讯飞听见及教育资源平台智学网与硬件类产品互为补充,为用户在日常 办公与课外学习等场景中提供软硬一体化服务。 目前公司标准化产品的营收占比仍然较低,具备较大增长潜力。公司年报披露,2021 年智能硬件(不包含学习机)营收为12.37亿元,同比增长41.6%,智能硬件产品收 入占比从2016年的1.1%提升至2021年的6.75%(若加上学习机的销售收入21年在总 营收占比约15%)。

(四)中科创达

1. AI产业深度参与者,持续拓展业务空间

AI产业深度参与者,不断推进在汽车、IOT等领域中的应用。中科创达多年深耕底层 OS开源生态,目前形成了手机、智能车载、物联网三大业务板块。依托在智能操作 系统领域和边缘侧的经验与技术能力,中科创达自主研发物体识别、缺陷检测、人 脸识别等诸多人工智能应用,并向开发者和制造商推出人工智能开发套件。 在汽车领域,公司计算视觉能力突出。2017年公司并购了 Rightware,并于2018年 收购了图像视觉技术公司 MM Solutions,显著提升了在智能网联汽车领域的技术能 力,并将AI的算法和工程化领域的内容切入汽车行业,通过模块化实现AI产品的适 配,重点解决AI工程化的问题。

2. 加大AI领域投资,不断扩张产业链朋友圈

近年来中科创达围绕AI产业链上下游进行产业投资,通过战略布局以夯实自身实力。 在AI领域,公司投资聚焦在边缘侧的人工智能,因为公司算法都应用在边缘端和设 备端,公司可以通过投资让AI算法在具体的边缘设备和边缘处理器上发挥最好的性 能。 AI 芯片、传感器芯片企业一直是公司重点关注的领域,并投资了包括恒玄科技在内 的一些芯片厂商。 此外,AI算法及AI应用领域的国内外创业公司,也在公司投资关注的范围内,在下游 的应用程序开发方面,中科创达则通过与腾讯等生态伙伴进行战略合作,将其 AI 平 台能力下沉。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】。未来智库 - 官方网站

互联网小常识:在一些中高端交换机中,通常把交换表保存在CAM(content-addressable memory)中,可以通过交换机的show cam命令查看,大中型为show cam dynamic ,小型为show mac-address-table。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186