大模型:多模态引领新篇章丨
中信证券 计算机
通用大语言模型追求高泛化能力,可以高质量完成自然语言理解和生成任务。基于底层Transformer形成三大技术路线,GPT采用解码器路线获得认可。
当前大语言模型与通用
人工智能(AGI)存在差距。多模态能力从性能、认知能力、工具使用、创作能力等方面进一步提升大模型能力。本轮多模态涵盖语音、视觉、代码等,
语音能力与文本底层技术互通,利用“STT+TTS+GPT”快速落地,技术门槛相对较低。
视觉能力为多模态大模型核心。理解方面形成模块化和一体化两大路径呢,模块化以GPT-4V为代表,具有较高性价比;一体化以谷歌Gemini为代表,追求更强多模态融合能力,视觉理解能力有望重塑
安防等领域。生成方面图像和视频生成底层均采用扩散模型,大模型+视觉生成开拓丰富应用市场,以Runway、Pika、NeverEnds为代表的视频生成领域获得高度关注。
我国AI市场2025年规模有望超过2000亿,我们持续看好大模型千行百业的落地机遇,建议关注办公、教育、企业管理、消费娱乐等行业应用进展。
海外模型更新和国产模型推出下,AI商业化进程加速和市场天花板打开。建议持续关注相关领域的头部AI公司:
1)应用层:
金山办公 、
科大讯飞 、
用友网络 、
金蝶国际 、
万兴科技 、
当虹科技 、
虹软科技 等;
2)算法/数据处理:科大讯飞、
星环科技 等;
3)算力层:
海光信息 、
工业富联 、
中科曙光 、
浪潮信息 等。
$浪潮信息(sz000977)$