计算机行业周报:国产大模型进步显著,北美云巨头capex预期乐观.pdf

2024-05-15 09:39
上海证券
吴婷婷
计算机行业周报:国产大模型进步显著,北美云巨头capex预期乐观.pdf

证券研究报告行业周报国产大模型进步显著,北美云巨头capex预期乐观——计算机行业周报(2024.5.6—2024.5.10)[Table_Rating]增持(维持)able_Summary][Table_Summary]◼市场回顾过去一周(5.6-5.10)上证综指上涨1.60%,创业板指上涨1.06%,沪深300指数上涨1.72%,计算机(申万)指数下跌3.24%,跑输上证综指4.84pcts,跑输创业板指4.30pcts,跑输沪深300指数4.95pcts,位列全行业第31名。◼周观点国产大模型进步显著,开始卷价格。(1)DeepSeek:5月6日,幻方旗下DeepSeek发布开源MoE模型DeepSeek-V2,中文综合能力开源模型中最强,与GPT-4-Turbo、文心4.0等闭源模型在评测中处于同一梯队;英文综合能力与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral8x22B;知识、数学、推理、编程等榜单结果也位居前列,并支持128K上下文窗口。DeepSeek-V2API的定价为每百万tokens输入1元、输出2元(32K上下文),价格仅为GPT-4-Turbo的近百分之一,性价比极高。模型通过使用MLA(Multi-headLatentAttention)架构,大幅减少计算量和推理显存,自研Sparse结构DeepSeekMoE则进一步将计算量降低到极致,两者结合最终实现模型性能跨级别的提升。(2)通义千问:5月9日,通义千问2.5正式发布,闭源赶超GPT-4Turbo、开源击败Llama-3-70B。与通义千问2.1版本相比,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%;与GPT-4相比,中文语境下,通义千问2.5文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超GPT-4。同时,阿里云也发布了最新款开源模型1100亿参数的Qwen1.5-110B,在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型,在HuggingFace推出的开源大模型排行榜OpenLLMLeaderboard上位列榜首。通义千问大模型持续推进行业落地,目前已通过阿里云服务企业超9万、通过钉钉服务企业超过220万,通义开源模型累计下载量突破700万,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。(3)智谱GLM:5月11日,智谱AI宣布GLM-3Turbo模型调用价格由5元/百万tokens调整为1元/百万tokens,此外包括GLM-3Turbo在内的GLM系列将迎来更新,正在部分开放测试中。我们认为,随着国产大模型的不断迭代优化以及性价比的持续提升,国产大模型竞争力将有效增强,有利于国内AI应用的落地。北美云巨头capex预期乐观,国内算力开始兑现业绩。微软、谷歌、Meta、亚马逊CY1Q24合计资本支出467亿美元,四大云厂商均计划继续扩大AI投资规模,我们认为,资本支出将逐季增长。TrendForce此前预测,2024年四大云厂商占全球AI服务器需求超60%。MetaAI主管证实Meta为购入英伟达GPU已经花费了300亿美元,另一边微软和OpenAI要打造的星际之门花费1000亿美元,谷歌的投入想必也不会少。我们认为,AI军备竞赛仍在继续,AI算力仍然是AI产业中景[Table_Industry]行业:计算机日期:shzqdatemark[Table_Author]分析师:吴婷婷Tel:021-53686158E-mail:wutingting@shzq.comSAC编号:S0870523080001[Table_QuotePic]最近一年行业指数与沪深300比较[Table_ReportInfo]相关报告:《大模型加速迭代,海外科技大厂上调capex》——2024年04月30日《Llama3发布,开源大模型迎重要进展》——2024年04月23日《华为发布AIPC新品,鸿蒙生态再迎里程碑式进展》——2024年04月16日《国家数据局再度发声,数据要素化进程不断加快》——2024年04月10日《华为P70发布在即,鸿蒙迎重大催化》——2024年04月04日-40%-33%-26%-20%-13%-6%1%8%15%05/2307/2310/2312/2302/2405/24计算机沪深3002024年05月14日行业周报气度和业绩兑现度较高的方向。国内算力链相关公司Q1业绩亮眼,浪潮营收176亿,yoy+85%,净利润3亿,yoy+64%;新华三营收121亿,yoy+14%,净利润8亿,yoy+8%;工业富联营收1187亿,yoy+12%,净利润42亿,yoy+34%。后续AI催化包括5月的谷歌I/O大会、微软Build2024大会、英伟达财报发布、6月的WWDC苹果开发者大会。◼投资建议建议关注:(1)AI算力:工业富联、中科曙光、浪潮信息、软通动力、神州数码、拓维信息、海光信息、寒武纪、景嘉微等;(2)AI应用:科大讯飞、金山办公、万兴科技、同花顺、佳发教育、新致软件、鼎捷软件、焦点科技等。◼风险提示下游景气度不及预期;政策推进不及预期;技术创新不及预期、行业竞争加剧。行业周报请务必阅读尾页重要声明3目录1周观点.....42市场回顾.52.1计算机板块表现....52.2计算机个股表现....63行业要闻.73.1国内要闻...73.2海外动态...74公司动态.84.1重大事项...84.2股份增减持...104.3股权激励.115一级投融资一览116风险提示.....12图图1:过去一周申万一级行业指数市场表现...5图2:计算机指数(申万)近10年PE(TTM)6表表1:过去一周各类指数行情回顾.....5表2:过去一周计算机个股涨跌幅及换手率前五.6表3:过去一周计算机行业一级投融资情况.11行业周报请务必阅读尾页重要声明41周观点国产大模型进步显著,开始卷价格。(1)DeepSeek:5月6日,幻方旗下DeepSeek发布开源MoE模型DeepSeek-V2,中文综合能力开源模型中最强,与GPT-4-Turbo、文心4.0等闭源模型在评测中处于同一梯队;英文综合能力与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral8x22B;知识、数学、推理、编程等榜单结果也位居前列,并支持128K上下文窗口。DeepSeek-V2API的定价为每百万tokens输入1元、输出2元(32K上下文),价格仅为GPT-4-Turbo的近百分之一,性价比极高。模型通过使用MLA(Multi-headLatentAttention)架构,大幅减少计算量和推理显存,自研Sparse结构DeepSeekMoE则进一步将计算量降低到极致,两者结合最终实现模型性能跨级别的提升。(2)通义千问:5月9日,通义千问2.5正式发布,闭源赶超GPT-4Turbo、开源击败Llama-3-70B。与通义千问2.1版本相比,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、

点击免费阅读完整报告
© 2017-2023 上海俟德教育科技有限公司
沪ICP备17027418号-1 | 增值电信业务经营许可证:沪B2-20210551
回顶部
报告群
公众号
小程序
APP
在线客服
收起