人工智能应用专题(6):2024群雄逐鹿,人工智能的机遇与挑战.pdf

2024-05-16 22:35
国信证券
张伦可
人工智能应用专题(6):2024群雄逐鹿,人工智能的机遇与挑战.pdf

请务必阅读正文之后的免责声明及其项下所有内容2024年05月16日人工智能应用专题(6):2024群雄逐鹿,人工智能的机遇与挑战行业研究·海外市场专题投资评级:超配(维持评级)证券研究报告|证券分析师:张伦可联系人:刘子谭0755-81982651021-60375431zhanglunke@guosen.com.cnliuzitan@guosen.com.cnS0980521120004请务必阅读正文之后的免责声明及其项下所有内容摘要:人工智能行业阶段性的机遇与挑战Ø2024年行业处于群雄逐鹿状态,无论是海外的科技巨头,还是国内一线的互联网公司,都在积极训练和迭代自身的模型能力。从模型的进阶维度,我们看到大模型由最初大语言模型向多模态不断进阶,模型能力从文本到文生图、文生视频维度不断扩充。Ø观察一:大模型的差距逐渐收敛,越来越多大模型从能力和实用性上比肩GPT4。OpenAI的核心能力主要体现在三个方面:1)数据收集和处理的能力,包括数据来源,清洗方式,数据结构等;2)模型结构,包括注意力、隐藏层等设计;3)训练方法,包括各类超参数,学习率等。Ø观察二:模型迭代速度快,目前仍然处于模型-应用边界模糊的阶段,浅层应用易被冲击。判断是否会被AI冲击或赋能的核心角度,应该重点关注原有商业模式解决的核心痛点是否会被GPT取代。举例:同为教育IT公司,Chegg的商业模式核心解决的是帮助学生查找历年考试的试卷题目和答案,GPT可能代替部分查找答案的需求。而Duolingo的商业模式核心为通过设计游戏化机制等开发愿意让用户积极学习的APP。Ø观察三:观察海外B端软件企业,目前处在结合模型能力调试产品性能的阶段,AI功能付费深度尚在探索期。Ø观察四:率先出AI业绩的公司应集中观察海外科技巨头。海外科技巨头具备领先的模型能力和应用场景,微软云已率先受益于AI云的需求增加,Meta多次提及广告业务易被赋能,谷歌和苹果正在积极研发AI模型和手机的结合。Ø观察五:独立应用层面,我们看好两类型AI需求:1)AI对生产力的提升。举例:通过应用AIGC功能,能够替代原有线下拍摄等需求,案例包含美图23年推出AI商品图、蘑菇街的AI商拍工具WeShop等。2)AI陪伴场景的需求。举例:教育公司Duolingo设计开发MAX线上一对一语法教师功能。请务必阅读正文之后的免责声明及其项下所有内容人工智能浪潮的进展阶段—模型进阶之路3模型由大语言模型向多模态不断进阶,模型能力从文本到文生图、文生视频维度不断扩充。①GPT4:开创性的多模态模型,凭借着领先的综合实力成为行业标杆,后续推出的GPT4-V、GPT4-Turbo和GPT4-O性价比逐步提升。②Llama:开源模型的代表,在各家云端皆可使用,最新版本Llama3不管从能力还是生态建设上不弱于GPT系列。③Gemini:最小版本的Gemini-nano面向端侧设计,是谷歌布局移动端、面向自家安卓系统和Pixel手机的设计。④Sora:文生视频进阶模型,高质量生成内容与长度不仅在GenAI领域引起强烈关注和模仿,其代表的真实世界模型引发对后续AGI模型的探索。图:近年来现有大语言模型的时间轴  资料来源:《ASurveyofLargeLanguageModels》,各公司官网,国信证券经济研究所整理 DALL・E3StableLM3BGPT-4VGeminiGPT4-Turbo美图3.0文心4.0StableDiffusionXLAudiobox11-121-2Llama3Claude3开放GPT-4TurboGemini1.5SoraClaude2Lumiere文生视频MistralLarge3-45DeepSeek-V2GPT4-O2024多模态模型StableLM请务必阅读正文之后的免责声明及其项下所有内容人工智能浪潮的进展阶段—国内大模型的分类Ø按厂商背景来看:①互联网等大厂:将机器学习、搜广推的背景团队转向大模型研发,如百度、字节。模型更加通用,专注模型与自身业务和云产品结合。②第三方模型机构:团队具备更高的灵活性和更明确的模型发展思路,如面向开源的智谱、面向长文本的Kimi、面向降低成本的DeepSeek。主要基于大模型研究路线和学术背景,如月之暗面的杨植麟团队和清华的智谱团队。Ø按技术路线来看:①自研效果复现类:参考GPT论文自研复现效果,前期耗时、后续Finetuning对于数据数量质量也有一定要求,能力天花板高;②基于开源迭代类:训练更顺畅但天花板低,依赖开源社区,且开源模型如Llama2比较GPT3.5还是有差距。互联网等大厂第三方模型机构百度:最新版本文心大模型4.0具备强大的理解、生成能力,在23Q4贡献数亿广告增量收入,对话助手文心一言流量领先。腾讯:混元具有超千亿的参数规模,混元助手是基于腾讯混元大模型的多模态对话Bot产品,已支持文生图功能。字节:云雀大模型及BuboGPT等模型在语音、视频图像和多模态等领域积累较强,应用有AI助手豆包、ChitChop、CiCi等。阿里:通义大模型部署阿里云,对话助手通义千问,AIGC产品妙鸭相机。华为:盘古大模型有NLP、CV以及多模态版本,专注行业,打造金融、政务、制造、矿山、气象、铁路等行业垂类大模型。智谱:GLM系列,千亿基座的对话模型ChatGLM及开源版本ChatGLM-6B,全球下载量超过800万,AI生成式助手“智谱清言”。月之暗面:Kimi千亿大模型,智能助手KimiChat核心能力为长文本能力(LongContext),流量增长显著。百川:Baichuan系列,先后发布Baichuan1/2-7B/13B,开源模型和Baichuan-53B、Baichuan2-192K、Baichuan2-Turbo四款闭源模型。幻方量化:DeepSeekMoE模型,DeepSeek-V2以236B总参数大致达到70B~110B Dense的模型能力,节约了42.5%训练成本,推理的KV Cache节约了93.3%。4请务必阅读正文之后的免责声明及其项下所有内容图:Claude3任务评分超过GPT系列、Gemini系列 图:在LLaMA上进行的研究工作的演化图  资料来源:Anthropic官网,国信证券经济研究所整理 资料来源:《ASurveyofLargeLanguageModels》,国信证券经济研究所整理模型本身差距逐步走向收敛,成本显著降低,利好应用发展5Ø大模型的差距逐渐收敛,越来越多大模型从能力和实用性上比肩GPT4。•OpenAI的核心能力主要体现在三个方面:1)数据收集和处理的能力,包括数据来源,清洗方式,数据结构等;2)模型结构,包括注意力、隐藏层等设计;3)训练方法,包括各类超参数,学习率等。Ø大模型的成本显著降低:23年OpenAI GPT4的调用成本降低了90%以上,最新的GPT4-O多模态免费且之前付费用户才有的GPTs、图像理解、代码解释器等全部免费。预计随着算力端与模型架构不断发展,GPT-4 水平的模型免费指日可待。Ø面向垂类的精细化模型越来越多,确保细分场景的性价比:不同行业具有各自垂类模型,不同大小的模型适用于不同场景。由于企业场景、业务流程差异化,不同的领域模型

点击免费阅读完整报告
© 2017-2023 上海俟德教育科技有限公司
沪ICP备17027418号-1 | 增值电信业务经营许可证:沪B2-20210551
回顶部
报告群
公众号
小程序
APP
在线客服
收起