计算机行业专题研究:国产大模型“凭”什么降价?.pdf

2024-06-10 16:36
华泰证券
计算机行业专题研究:国产大模型“凭”什么降价?.pdf

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。1证券研究报告计算机国产大模型“凭”什么降价?华泰研究计算机增持(维持)研究员谢春生SACNo.S0570519080006SFCNo.BQZ938xiechunsheng@htsc.com+(86)2129872036联系人袁泽世,PhDSACNo.S0570122080053yuanzeshi@htsc.com+(86)2128972228行业走势图资料来源:Wind,华泰研究重点推荐股票名称股票代码目标价(当地币种)投资评级浪潮信息000977CH50.67买入金山办公688111CH354.50买入福昕软件688095CH73.96买入泛微网络603039CH41.97买入资料来源:华泰研究预测2024年6月10日│中国内地专题研究国产模型厂商进入API“价格战”,利好AI应用开发2024年5月6日,DeepSeek发布最新MoE模型DeepSeek-V2(32K上下文),刷新了模型API定价:输入¥1元/Mtokens、输出¥2元/Mtokens。紧接着,智谱、阿里、百度、腾讯、讯飞等厂商均宣布旗下模型API降价,部分降价幅度高达100%。我们深入拆解了各家API产品矩阵,发现降价的主要是轻量级模型,对于高并发B端用户或影响不大。我们从定性逻辑和定量技术两个维度分析降价的原因。我们认为,API降价将吸引更多的ISV开发AI相关应用,有望提高SuperApp出现概率,建议关注算力和应用相关公司,包括浪潮信息、金山办公、福昕软件、泛微网络等。降价以入门级轻量API为主,可以从技术优化和生态抢占来解释降价厂商中,智谱、百度和讯飞主要降价产品为轻量版;阿里和腾讯则将旗下全部模型进行降价,降价幅度不等。字节为首次定价,价格较低。可以看出,降价幅度和范围较大的主要是互联网企业,其资源更加丰富。分析降价原因,一方面,DeepSeekV2证明了,确实可以通过注意力机制优化,大大减少所需缓存的量,降低成本和提高效率。另一方面,即使没有技术上的降价逻辑,通过降价手段吸引开发者,目前看仍是抢占生态的重要手段。从技术层面降低模型推理成本,核心在于优化KVcache目前,大模型的长文本支持能力已成为趋势。在推理长文本时,需要首先将文本预填充到GPU的HBM中,然后再解码出token。其中预填充速度主要受GPU计算能力影响,解码速度受HBM带宽影响。当文本很长时,KVcache将占用HBM相当大的空间,导致用户并发性下降,且解码耗时更长。用户并发性下降,还将带来新的问题,即需要从HBM上“卸载”暂时不用的KVcache,再“加载”下一个用户的KVcache,带来新的耗时。因此,降低KVcache是优化关键。典型优化方法:压缩KVcache,或采用全局KVcache我们研究了近期DeepSeekV2和微软的YOCO典型的KVcache压缩方法,代表两种流派。DeepSeekV2引入多头隐注意力(MLA)机制,不再缓存全部的KV,而是用隐向量来压缩KV,与Transformer原始的多头注意力相比,KVcache可以减少90%以上。微软的YOCO则将Decoder架构一切为二,下半部分负责用高效的注意力机制产生全局KVcache,上半部分则直接使用全局KVcache,不再需要额外计算,也大大降低了缓存量。模型降价有望利好算力和应用,建议关注相关产业链公司我们认为,模型降价将吸引更多的开发者开发AI应用,或进一步提振算力需求,提升SuperApp出现概率,建议关注:1)AI服务器:浪潮信息等;2)AI应用:金山办公、福昕软件、泛微网络等。其他产业链相关公司:1)海外算力产业链:光模块(中际旭创、天孚通信、新易盛)、AI服务器(工业富联)等;2)国产算力产业链:海光信息、寒武纪、神州数码等。风险提示:宏观经济波动,技术进步不及预期。(45)(32)(19)(5)8Jun-23Oct-23Feb-24Jun-24(%)计算机沪深300免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。2计算机正文目录拆解大模型推理过程,洞察国产模型降价本质.3表现:国产厂商进入API“价格战”阶段3趋势:长上下文已经成为全球模型的共性发展特点....7拆解:当我们使用长上下文时,模型究竟发生了什么?...7从幻方和微软进展看KVcache压缩的典型算法.12幻方DeepSeekV2:优化注意力机制来大幅压缩KVcache12微软YOCO:通过全局缓存方式来大幅压缩KVcache..14KVcache压缩技术可复制,模型边际调用成本或接近016AIAgent或是提高应用表现的下一个关键.....16相关产业公司梳理.....17风险提示..18免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。3计算机拆解大模型推理过程,洞察国产模型降价本质表现:国产厂商进入API“价格战”阶段幻方DeepSeekV2引发了国产大模型厂商的降价浪潮。2024年5月6日,幻方旗下深度求索(Deepseek)发布最新MoE模型DeepSeek-V2,并将模型的API定价为:每百万tokens输入1元、输出2元(32K上下文),价格仅为GPT-4-Turbo的近百分之一,刷新了大模型API的低价记录。随后,部分国内大模型初创公司、互联网厂商、科技公司等陆续宣布模型API降价,有些甚至将API免费提供。图表1:幻方DeepSeekV2价格仅为GPT-4-Turbo的近百分之一(截至24年5月6日)模型名称模型厂商API价格/百万tokens输入(元)输出(元)DeepSeek-V2深度求索12GPT-4-Turbo-1106OpenAI72217GPT-4-0613OpenAI217434GPT-3.5OpenAI1114Gemini1.5ProGoogle51152Claude3OpusAnthropic109543Claude3SonnetAnthropic22109Claude3HaikuAnthropic29abab-6.5MiniMax3030abab-6.5sMiniMax1010ERNIE-4.0百度120120GLM-4智谱100100Moonshot-v1月之暗面2424Qwen1.572B阿里2020LLaMA370BMeta2782Mixtral8x22BMistralAI1443资料来源:DeepSeek官网、华泰研究图表2:国内大模型厂商API“降价”复盘(截至24年5月)资料来源:各公司官网、华泰研究降价甚至免费的模型,不一定是厂商最先进的模型。基于各大模型厂商的降价现象,我们统计了被降价的模型细节,发现降价甚至免费的,并不是模型厂商最先进的模型,往往是Lite轻量版或本身价格较低的模型。我们认为,国产厂商在这波降价中,并不会盲目打“价格战”,仍然会考虑成本等因素,“循序渐进”。此外,还可以发现,降价幅度较大(80%以上)的多是国内互联网大厂,拥有自有的云算力基础设施。免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。4计算机图表3:宣布模型API降价厂商的模型产品矩阵细节(截至24年5月)厂商大语言模型API版本降价前降价后降价幅度说明智谱G

点击免费阅读完整报告
© 2017-2023 上海俟德教育科技有限公司
沪ICP备17027418号-1 | 增值电信业务经营许可证:沪B2-20210551
回顶部
报告群
公众号
小程序
APP
在线客服
收起