现在这些号称国内翘楚的AI,真的有点吹上天,实用性差一批。以我现在的认知,发表一下看法,希望不是我猜的,要是真的,太绝望了。
[淘股吧]根据试用的几个AI,粗略画了一个AI的逻辑流程。Kimi和文心一言应该都是走这套,就是当你不认可结果的时候,它应该会根据你的对话反馈,再去找条件分析,分析为什么你会Say No。例如上面的对话,为什么不是第一首五言《和项王哥》,系统就去找关键字”《和项王歌》“、”五言”(需要算字数)、“第一首“(需要理解成时间)。显然这个反馈,在五言那里出现问题,它应该没有数字数(count)能力。经过我反复质疑,才确认这个是五言诗(不排除根本不数,而是基于我不认可四言这个结果)。随后让对话继续。因为文心一言的使用中,类似情况很普遍,反正你质疑到想要的结果,就能继续下去。
这是语文类的体验,可以模糊点。但是在数学类的,如果你写得一板一眼,常规的东西,还行。嵌套的逻辑一多,很容易出现两碗水煮成一桶水的情况。
综上猜测,它的机制极可能是根据语料,成为一个高级一点的搜索引擎。导出结果后,你认可就对,不认可就回溯,形成一个循环。至于结果对不对,根本不重要的。现在很多AI就是定位聊天
机器人,把你聊开心是最重要的,需要精度的数理化层面,基本就是靠原始资料的结果,计算能力巨差。
百度对话AI回答我,它们并不是百度公司,而是去年收购回来的初创公司,估计是当时需要这么一个产品。到现在为止,我试用3.5,感觉真的没啥进步。如果机制没变,我认为4.0付费也不会有根本改变。
星火常常会聊天到死循环,你说不行,它反馈还是输出同一个结果给你,估计是没有回溯机制。当然,它没有百度滑头,结果更主观。
Kimi确实长文阅读理解比其它产品强,例如你问《庆余年》里面,范闲和范建感情好吗?范建后来躲在哪里烧玻璃瓶赚外快?它起码人物关系能给你整对,也有些分析。仅限于些对输出精度不高的结果。
或许,人家本来就是设计来聊天的,是我要求高了。如果猜测是真的,AI大竞赛时代这样搞,洗洗睡吧。聪明才智都放在忽悠上面。老外都是奔着生产力助手去做的。