事件催化:
周五上午字节正式发布视觉理解模型。将赋能
AI眼镜AI手机,实现智能理解拓展场景边界。拥有视觉理解能力的交互型多模态大模型是应用爆发的基础,因为人类信息的绝大部分都是来自视觉,应用非常广泛。字节展示了豆包大模型的视觉能力,包括能够同时处理文本与图像信息。具备强大的图像识别、理解和推理能力,不仅能识别物体类别,还能理解物体之间的关系、空间布局等,响应时间也非常短。火山引擎总裁谭待宣布,豆包视觉理解模型价格降至0.003元/千Tokens,比行业平均价格降低85%。
重点应用场景包括:
1)教育场景:智能辅导作业、优化作文,通过拍照识别玩具并生成故事;
2)旅游场景:用户可以通过上传照片,获取旅行推荐、外文菜单翻译、建筑背景知识等;
3)电商场景:商家能够创建AI搜索和推荐功能,同时帮助生成营销文案和直播话术。
同时豆包pro能力升级之外进一步结合音乐、文生图、3D模型等多模态能力,多模态能力的整合为通用大模型能力的重要进阶。模型调用量快速增长,2024年12月15日,豆包大模型的日均token调用量突破了4万亿,较7个月前增长超过33倍。
具体场景方面,信息处理场景增长了39倍,客服和销售场景增长了16倍,硬件终端场景增长了13倍,AI工具场景增长了9倍。
字节跳动这个豆包大模型,不是单纯的题材炒作,因为它自身构建了场景、流量、技术、算力这个生态圈。如果说前段时间炒AI应用,是映射美股,炒题材。那么字节这个豆包是实际的用户增长,通过硬件软件产品合作以及投放广告就能变现,是能看到回报的,将来能出业绩,这是机构看中的。最重要的是,豆包大模型这个东西,涵盖了软件和硬件,后续会有各种技术进展以及发布会等催化,这种组合会无形拉长炒作周期,也是短线资金喜欢参与的炒作类型,可以回想之前炒华为,也是硬件和软件的组合。这个方向,有望从题材周期走长走成基本面主线。
已明确合作硬件公司:
在二级市场,目前明确与字节产品产生合作的公司有:
乐鑫科技 (WiFi和蓝牙芯片、部分语音处理芯片用于字节AI玩具)
润欣科技 (为字节火山引擎提供一站式智能AI玩具解决方案)
中科蓝讯 (做字节AI耳机)
恒玄科技 (预计合作字节AI眼镜)
视觉处理芯片公司:随着字节推出带视觉功能的多模态交互模型,未来的AI玩具、眼镜等终端将需要带视觉处理能力的SoC芯片,上市公司
安凯微 、
星辰科技 等有相关数据处理能力,有望受益。
另外,做
机器人 视觉与AI视觉的
奥比中光 也值得重点关注。
潜在受益存储模块公司:如果AI终端需要增加小的存储模块(如NOR),
普冉股份 、
恒烁股份 、
兆易创新 这样也会受益。