AI科学家李飞飞带领的团队日前发布了具身智能最新成果:大模型接入
机器人,把复杂指令转化成具体行动规划,人类可以很随意地用自然语言给机器人下达指令。更重要的是,通过将LLM(大语言模型)+VLM(视觉语言模型)结合在一起,机器人与环境进行交互的能力进一步提升,无需额外数据和训练便可完成任务。
如何解决训练数据稀缺的难题,将成为具身智能乃至
人工智能发展过程中的第一大拦路虎。李飞飞团队将该系统命名为VoxPoser,相比传统方法需要进行额外的预训练,这个方法让机器人在零样本的前提下完成了,解决了机器人训练数据稀缺的问题。
机器视觉是AI深度学的一种应用与技术方向,无论是人形机器人还是智能驾驶都是机器视觉的落地方向之一。
华西证券认为
特斯拉在智能驾驶和人形机器人在机器视觉的路径上具有异曲同工之妙。华西证券指出,机器人是AI的下一重量级落地场景,叠加与ChatGPT等大模型实现产业共振,未来有望带来万亿级别的空前蓝海,同时有望赋能千行百业。在各大厂商加速布局AI算法和机器人产业链,同时寻求多领域场景落地可能性的背景下,受益领域包括:机器人产业链、机器视觉、视觉领域大模型。