那也不是,AI确实是数据技术一次重大革命。我谈的是适应式场景和现阶段能达到的智能水平,没有贬低AI的意思。对比使用搜索引擎,它还是很智能的,有一定的生成式能力,能节省不少文书时间。
现在称“大模型”的数据库,大多数是使用非监督方式计算生成的,所以一般会赋予“学羽”的形容。因为生成之前,是没框架和预设答案的,也就是让机器根据指令发送的要求自己分析,然后生成数据库。使用得最多的这类算法就是“聚类分析”,
https://www.tgb.cn/a/1VvuASpPpMr 当年这个帖子实际上就是聚类分析,只不过比较初阶的聚类分析而已。如里面提到,把涨停数量分成5组,专业的说法是5"簇”,当时我那些分界都是算出来的,也就是说,并非我主动分割,而是根据数据特点计算分割,这种就是生成式的原理(大概)。我把整租数据发给软件,它会把算好的结果(模型)反馈给我。然后这些数据就能用在我的股票系统里面。
里面还提出一个涨停占比在一定时间区间恒定输出的问题,这个也是没计算之前不知道的。都是使用大量计算后得出的结果。在数据维度来说,单独涨停数量是2维数组,涨停数量+涨停占比是3维数组,涨停数量+涨停占比是3维+N就是多维数组。这些实际上也是以前没AI时候,所说的“因子”。非监督学羽技术长足进步,那就能把多维数组直接给软件生成多维数组的大模型。生成大模型后,再拿模型通过技术手段反证它在原始数据或者原始数据之前的条件比对,去证伪它的有效性、相关性、决定系数之类。那我生成100个,总有几个有用的(举例),由于是非监督学羽,结果没出之前,大家是不知道在推理方面是否有用的,所以很多模型又叫“推理式大模型”,大不大谁知道呢?
回到幻方模型的宣传,一直强调多少钱多少个tokens,号称是GPT的3%。你可以理解成去GPT游戏厅100块1个代币,现在DS只要3块。里面的
大数据都是针对使用场景切好块的,如你要查询,周一开1%+140亿+30个一字板+节前收官日,市场会涨会跌?收盘多少点?出豹子的概率高不高?它根据大模型算好的反馈结果,回答你的问题。至于结果,你不是干这个的,给你个数字,怎么会知道合理不合理?Tokens是必扣的。
很多AI公司都强调投算力,买显卡。驱动逻辑就是需要更多超级算力,算更多的大模型,更完善的大模型,不断让AI的能力进化。这期间就是不断试和不断证伪的过程。“数据蒸馏”这东西也不是第一天出现,我的智商至今没想明白如何可以在大数据集里面无损做出子集,而又可以无损还原总集,既能又能?要是有损压缩,必然会导致数据质量下降,那现在可信度本来就成疑,疑兵估步疑兵?假设是后者,还不是降价降质,那“
拼多多”之名的宣传就是跟大家玩脑筋急转弯了。那5短状元,0命中率大模型不是梦,玩笑了,100次中几次还是可以的。
还是回到早上说的,以结果论。如果你收费,给我的建议不能赚钱,说明作用不大。如果我有能力完整看懂你的东西,或许就不需要你了。但对比以往
百度后还要人脑筛选,甚至百度都不用纯口技,现在AI还是进步很大的。
以上仅仅是个人现阶段对于AI的理解,纯延伸思考。非专业人士,别当真。毕竟跟整个团队比智慧,还是有很大差距的。否则我拿着600亿割韭菜,天天剪羊毛,还嫌弃羊毛长得慢嘞。