象数道玄_青花须折

靖江炒家

25-10-14 12:14

0

鱼哥，是圆教威武！

此去泉台招旧部，旌旗十万斩阎罗。

靖江炒家

25-10-14 10:04

0

虎踞龙盘今胜昔，
天翻地覆慨而康。

咸的鱼

25-10-14 09:56

0

好一招除你武器，威武！

靖江炒家

25-10-14 09:53

0

教主，这些太难理解了，把你原来传授的知识就够用了，原来滴难道半个目标都弄不了吗？

胖朵朵

25-10-14 09:03

0

🌸掌教，兴业来福

快跑茜茜

25-10-14 08:56

0

我觉得他好难看啊，

红叶堪摘

25-10-14 08:51

7

Rich Sutton近期的采访：https://www.youtube.com/watch?v=21EYKqUsPfg

主要观点：
1. RL是「基础AI」，核心在于理解世界并决定「做什么」（通过经验学），而LLM则旨在模仿人类和文本
2. 尽管LLM的拥趸认为LLM是「苦涩教训」哲学的成功，但Sutton并不认为LLM真正遵循了这个原则。最终真正可扩展的、仅依赖经验和计算的方法将取代LLM
3. 萨顿强调了持续学（continual learning）的重要性，这是所有哺乳动物都具备的能力，但目前AI系统缺乏。
4. RL的「经验流」范式：智能的基础是持续地调整行动以最大化奖励，知识内容必须能通过与经验流的比较来测试和学。
5. 人类在工作中获取的巨量“背景”（Context）和信息，并不仅仅来自奖励。他认为目前的深度学方法在跨状态或任务的良好泛化方面非常欠缺，当前的成功泛化往往是研究人员精心设计的结果，而非算法本身驱动。
6. 他认为AI历史上最大的胜利是「弱方法」（如搜索和学）彻底战胜了「强方法」（注入人类知识的系统）。尽管AlphaGo/AlphaZero的成功引人注目，但从他的角度看，这更多是现有RL技术的规模化和应用，而非全新的突破。

咸的鱼

25-10-14 08:16

2

你看他前面建仓，多有血性，这里装乌龟没懂葫芦里什么药，看有无选手去尝尝咸淡

拳手空

25-10-14 01:29

1

@咸的鱼应该是真底了.就是不知几时被教主临幸

拳手空

25-10-14 01:28

0

32没头绪，mark