0
鱼哥,是圆教威武!
此去泉台招旧部,旌旗十万斩阎罗。
0
虎踞龙盘今胜昔,
天翻地覆慨而康。
0
好一招除你武器,威武!
0
教主,这些太难理解了,把你原来传授的知识就够用了,原来滴难道半个目标都弄不了吗?
0
我觉得他好难看啊,
7
Rich Sutton近期的采访:https://www.youtube.com/watch?v=21EYKqUsPfg
主要观点:
1. RL是「基础AI」,核心在于理解世界并决定「做什么」(通过经验学),而LLM则旨在模仿人类和文本
2. 尽管LLM的拥趸认为LLM是「苦涩教训」哲学的成功,但Sutton并不认为LLM真正遵循了这个原则。最终真正可扩展的、仅依赖经验和计算的方法将取代LLM
3. 萨顿强调了持续学(continual learning)的重要性,这是所有哺乳动物都具备的能力,但目前AI系统缺乏。
4. RL的「经验流」范式:智能的基础是持续地调整行动以最大化奖励,知识内容必须能通过与经验流的比较来测试和学。
5. 人类在工作中获取的巨量“背景”(Context)和信息,并不仅仅来自奖励。他认为目前的深度学方法在跨状态或任务的良好泛化方面非常欠缺,当前的成功泛化往往是研究人员精心设计的结果,而非算法本身驱动。
6. 他认为AI历史上最大的胜利是「弱方法」(如搜索和学)彻底战胜了「强方法」(注入人类知识的系统)。尽管AlphaGo/AlphaZero的成功引人注目,但从他的角度看,这更多是现有RL技术的规模化和应用,而非全新的突破。
2
你看他前面建仓,多有血性,这里装乌龟没懂葫芦里什么药,看有无选手去尝尝咸淡
1
0
32没头绪,mark