2024云厂商AI算力自用需求、外供竞争格局及相关功能公司梳理分析报告.pdf

2024-06-11 14:46
2024云厂商AI算力自用需求、外供竞争格局及相关功能公司梳理分析报告.pdf

2023年深度行业分析研究报告正文目录核心观点.....42005-2023年复盘:云资本开支持续扩大,AI贡献新动能5波动溯源:结构性调整与经营性平衡是重要影响因素.7传统驱动:IaaS+PaaS+SaaS服务贡献早期动能.12新兴驱动:扩大资本开支成为共识,AI算力成为新一轮建设重点....13AI需求1:云厂商加速MaaS布局,满足外供训练&推理.....16Amazon:云计算先发者,23年加速AI追赶17Microsoft:MaaS转型顺利,商业化逐步落地....18Google:MaaS布局日趋完善,初创AI企业热门选择...19AI需求2:大模型渗透基础业务,大厂自用需求或放量..21理论:大模型落地推荐系统,具备技术可行性....22传统架构:大模型与CRM的单点/多点整合,效能优化是重点23新兴架构:重塑范式,打造基于Transformer的第三代推荐系统...28实践:Meta、Google加速探索大模型的推荐场景落地..29Meta:“三步走”战略明确,统一推荐系统或将26年落地....29Google:生成式大模型迭代搜索算法,SGE进展顺利.32影响:模型变化影响算力要求,自用GPU需求或将放量.....34相关产业公司梳理.36图表目录图表1:云CapEx复盘与展望:AI推动算力建设进入新周期.4图表2:海外云厂商资本开支情况复盘及展望(2005-2026E)....5图表3:2005-2009年海外云厂商资本开支变化情况..6图表4:2010-2015年海外云厂商资本开支变化情况..6图表5:2016-2019年海外云厂商资本开支变化情况..6图表6:2020-2023年海外云厂商资本开支变化情况..6图表7:2006-2023年海外云厂商资本开支同比增速情况及波动(同比减少)归因...7图表8:Amazon资本开支波动原因详解...8图表9:2015-2023年AWS数据中心占地面积变化...8图表10:Microsoft资本开支波动原因详解.....9图表11:Google资本开支波动原因详解11图表12:Meta资本开支波动原因详解....12图表13:2008-2023年海外云厂商资本开支与全球云计算市场规模同频共振....12图表14:2020Q1-2024Q1云业务收入同比增速变化.....13图表15:公有云(IaaS+PaaS)市场规模预测(按工作负载分类)....13图表16:22Q2-24Q1Microsoft季度资本开支及环比变化....14图表17:22Q2-24Q1Google季度资本开支及环比变化.14图表18:22Q2-24Q1Amazon季度资本开支及环比变化.....14图表19:22Q2-24Q1Meta季度资本开支及环比变化....14图表20:23Q4及24Q1年海外云厂商资本开支指引对比....15图表21:主流云厂商MaaS服务差异化对比16图表22:云托管仍是海外企业模型服务的重要来源..17图表23:AmazonMaaS服务布局....17图表24:MicrosoftMaaS服务布局..18图表25:微软AI业务推进情况梳理..19图表26:GoogleMaaS服务布局.....19图表27:GoogleAI+应用布局....20图表28:GoogleMaaS合作客户案例....20图表29:搜索/广告/推荐相关业务在大厂中的收入占比..21图表30:搜索/广告/推荐技术流程示意及潜在大模型融合方向...22图表31:大模型+推荐系统研究发展趋势及代表论文22图表32:大模型与传统推荐模型可实现优势互补.....23图表33:基于深度学习的推荐系统架构及LLM可应用场景.23图表34:LLM在传统推荐系统各环节的典型研究成果...24图表35:LLM在特征工程阶段的应用场景及研究成果概览..24图表36:LLM在特征编码阶段可强化文本信息的理解...25图表37:LLM在打分排序阶段的应用场景举例..25图表38:LLM在用户交互阶段的应用场景范例..26图表39:LLM在流程控制阶段的应用范例....26图表40:传统推荐架构下大模型与推荐系统融合的演进趋势.....27图表41:生成式推荐架构采用文本序列统一用户及项目表征.....28图表42:生成式推荐模型有望成为第三代推荐系统..28图表43:Meta推荐系统迭代已进入第三阶段.....29图表44:Meta提出首个生成式推荐系统模型.....29图表45:MetaGRs实现三大技术突破...30图表46:长序列处理速度较传统深度学习模型显著提升30图表47:以1.5倍吞吐量服务285倍复杂的模型(相同推理成本)30图表48:EvalHitRate@100与训练量呈幂律scaling趋势.30图表49:EvalHitRate@500与训练量呈幂律scaling趋势.30图表50:Meta搭建4KGPU集群服务传统推荐模型31图表51:Meta的生成式推荐模型在召回/排序任务中超越传统推荐模型31图表52:Google搜索算法加速迭代,SGE引入大模型能力32图表53:SGE提供更精准、更个性、更智能的搜索体验.....32图表54:GoogleSGE界面概览.33图表55:千亿模型推理的A100等效GPU需求量约为2.4万张34图表56:大模型推理算力需求测算(以10亿月活为测算基准).....34图表57:NVIDIA出货量与Meta需求量对比示意图.35核心观点大模型时代,AI需求有望拉动云厂商资本开支持续扩大,全球算力需求将持续向上。复盘历史:2005-2023年云资本开支整体保持扩大趋势,2009、2015、2023年Amazon、Microsoft、Google、Meta合计支出规模出现小幅波动,剔除结构性调整因素影响,我们发现除2009年Google、Microsoft受经营压力影响有意缩小CapEx支出之外,过去近20年时间,云厂商用于数据中心建设的资本开支并未出现明显缩减。从历史复盘的视角看,CapEx支出扩大得益于自用/外供两方面因素影响。自用视角下云厂商核心业务完成SaaS转型,伴随用户规模扩大,自用算力需求稳定增长;外供视角下海外企业加速业务上云、数据上云,伴随云化比例提升,云托管需求带动外供算力需求稳步抬升。需求展望:大模型成为新一代技术变革关键,正全面重塑IT产业结构,同样从自用/外供两个维度展望,我们发现扩大AI算力建设已成为海外云厂商公司共识,新一轮云基础设施建设周期全面开启。对于外供视角下的需求增长,目前市场共识较高,受益于MaaS需求拉动,Microsoft、Google、Amazon的云收入增速自23Q3开始逐步企稳,各家MaaS布局竞争日趋激烈,算力规模和模型能力是后续的竞争关键。对于自用视角下的需求增长,或仍存在较大的市场预期差,大模型正加速向推荐/搜索/广告等传统互联网业务渗透,我们认为,若大模型实现在传统业务场景的算法替代,云厂商自用的AI推理需求将加速释放。以Meta10亿月活用户数应用为测算基准,若生成式推荐模型全面替换传统算法,对应A100等效GPU需求超52万张,远高于目前推荐场景的4,000张GPU

点击免费阅读完整报告
© 2017-2023 上海俟德教育科技有限公司
沪ICP备17027418号-1 | 增值电信业务经营许可证:沪B2-20210551
回顶部
报告群
公众号
小程序
APP
在线客服
收起