在最近的展会上,经常听到了很多行业大佬在讲“AI Agent”。
一般附在大模型的后面,介绍的篇幅甚至要比大模型更长更详细。
那么,备受推崇的AI Agent究竟是什么,与目前的大模型有什么区别呢?
按
百度 百科来讲,AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的
人工智能,AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。
意思就是,相比于大模型,AI Agent“会使用工具”。
如果说人与动物的区别是人类会使用工具,那么AI Agent与大模型的区别亦然。
因为当前的LLM(大语言模型),无论是国外的ChatGPT还是国内的文心一言、Kimi智能助手等,都是对话式,都是按照用户提问-回答-再提问-再回答(如此循环)来实现。
那么,问题就来了,这些大模型输出的内容常取决于用户的提问能力,如果提问不够精确、不够全面,是不是就得不到满意的效果?
因此,现在网上甚至出现一些“大模型提示词怎么写?”“AI大模型或重塑职场!‘会提问‘将成制胜新技能”等言论。
就连好多设计师也曾吐槽过,虽然大模型出一张图很快,但如何让它设计出满意的图,却比自己完成花的时间更久。
由此可见,当前人工智能方面的重要矛盾是人们对大模型日益增长的需要与大模型提问模式不平衡不充分的发展之间的矛盾。
而且,随着AI的不断迭代,如今很多算法已经实现了自主学、调用工具的能力,因此,AI Agent应运而生。
OpenAI预计将于2025年1月推出全新AI Agent——Operator,该系统能够自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。据悉,Operator可能会在Computer use的基础上进行大幅度创新和应用简化,扩大AI Agent的使用范围和应用场景。
近日,前OpenAI联创、SSI创始人 Ilya Sutskever直接宣布:预训练从此将彻底终结——我们只有一个互联网,训练模型需要的
海量数据 即将枯竭,唯有从现有数据中寻找新的突破,AI才会继续发展。