这个事情非数据研究外行和研究者看到东西是不一样。技术本身具备相当高的门槛。
网上有批喜欢拉踩的小将,连非监督学羽是什么都没搞懂,就站队开喷。这是现在非常不好的一种风气。
论原创
OPEN AI必然,现在生成式AI全部基于它的研究基础。但是随着这两年技术发展,相当多的大模型开源,给了社区更大的交流自主度和技术提升的条件。争议在于,通过API调取了OPEN AI数据,研究了它的算法。不研究,你怎么提升和改良?这本就是悖论。还记得OPEN AI因为成功了,把非盈利性质变成了盈利性质,原来的股东跟马斯克闹翻了,才有现在老马自己搞AI?抓小辫子何患无辞,甚至无中生有。
DS这次的创新,个人认为最有价值的是2点。
1.改写NV显卡基础接口
CUDA ,让显卡利用效率更高。充分利用显卡里面"气泡"时间,让运行负荷上限更高,显卡使用效率提高30%以上。就是这项技术,让它可以不用NV显卡,改改接口也能用昇腾的显卡。
2. 优化了生成式计算方法。图一、图二来源互联网,懒得自己画了。高阶运算是初始化数据后,计算数据之间的距离、直径等等。然后把数据聚类,形成层层的逻辑反馈。例如,提问“吃什么?”,就能在食物簇上选择反馈“面包、
猪肉、花鸟、虫、鱼”等等。如过“吃什么”+“鲁迅”,结果簇可以加上“人”。生成这些数据,均使用非监督学,当初一大堆食物是打在一块的,里面甚至有“钢铁、水泥、冥王星、恐龙蛋正在吃恐龙”之类。通过类似技术把它们分成簇,没分成之前,并不知道会分成分怎样。这个跟你用10/5=2,出现确定性答案是两码事。分好以后,这些数据就是大模型里面的基础数据,当你提问“
XXXX X”,根据关键字用神经网路式配对,找出最优解反馈,形成“推理结果”。DS的创新,在于使用类似计算数据相对点距离或者别的时候,在40-50次迭代运算的时候加入"AHA Monent",就是对前面迭代运算规律的总结,通过这个这个总结对后面运算的预计算,达到节省算力的目的。设计理念就是,本来就是生成式AI,可以接受误差。俺不图100%精确,通过预计算减少总的运算,部分采用生成属于替代,不精确的地方用补偿算法,接近竞争对手的精度。但是,我对算力的消耗减少了,成本低,在低精度应用领域有相当大的适用性。所以,年前猫仔举了当年MP3的例子。估计很多人这几天都用过了,文字反馈效果不是强国内对手一点半半点。
单上面2点,喷DS抄袭,过分了吧?这也是很多国外大咖赞赏它的地方。美帝和
微软后面调查,属于输打赢要。技术确实是你的,X86架构和编程技术基础开发也是你的,互联网技术也是你的,不讲道理都对。只关心技术,大家都有进步;只关心利益,讲什么都废话;只讲立场,纯浪费时间。
网上有很多截图,套壳说,把人家GPT整个抄了。只能说,不同知识圈层的讨论,最好不讨论。要么拉到跟喷子一样的水平,全垃圾话开火就对了。
这里应该很少这类,我这种需要认证才能进场的博主几乎都拦了,毕竟喷子喜欢居高临下,多点个键就不来了。新一年,大家还是更关注事情本质,实事求是的进步。争论是带不来财富的。炒股是另一码事,DS都这个热度,还需要吹真伪吗?