一本三千年前的书,让 AI 的存活率从 0% 变成了 100%我们做了一个实验。让 AI 在持续的冲击下管理一座城堡,活过200轮。最聪明的 AI,存活率 0%。植入了一套源自《易经》的算法后,存活率 100%。这篇文章解释为什么。
[淘股吧]一、最聪明的 AI,为什么死得最惨?我们设计了一个生存游戏。
AI 扮演一位城主,要在随机降临的冲击下(叛乱、入侵、瘟疫、饥荒、资源崩溃)管理一座城堡,活过200轮。
结果出乎意料:
注意第二行——贪心 AI,永远选当下最优解,存活率 0%。
它不是不聪明,它是太聪明了。
每一步它都做了当时"最正确"的决定,却从没有想过:这步走了,如果走错了,能不能回头?
于是它一路高歌猛进,在某个关键时刻踩上了一个不可逆的陷阱,城堡轰然崩溃,再也回不来。
这个实验让我们意识到一件事:
AI 缺的不是智能,缺的是边界感。它知道所有的答案,却不知道什么时候会死。
而三千年前,有个人已经把"边界感"系统化地写下来了。
二、周文王在羑里做了一件什么事?公元前1100年左右,周文王被商纣王囚禁在羑里,一关就是七年。
在那七年里,他做了一件表面上看起来很奇怪的事——给所有可能发生的处境编号。
他把宇宙的基本状态拆成最小单元:阴(断开)和阳(连接),两种,就像开关的关和开。
三个开关叠在一起,有8种组合,这就是八卦。
两个三层结构叠在一起,有64种组合,这就是六十四卦。
然后他给每一卦的每一层(每个"爻位")都写了一段话,告诉你:处在这个状态的这个位置,该怎么办,有什么风险,往哪里变。
64卦,每卦6个位置,共 384条爻辞。
这件事做完,他把宇宙里所有会发生的事,归纳为64种处境、384种具体情形、以及每种情形下最优和最劣的应对。
但问题来了:
一个被囚禁的人,为什么要做这件事?
因为当你被困住,当你无法行动,当资源被切断、未来不可预测,你唯一能做的,就是想清楚:此刻我在哪,哪步能走,哪步不能走,走错了怎么回来。
《易经》不是在算命。《易经》是一个身处绝境的人,写给所有身处绝境的人的求生指南。
三、我们发现了什么:天人合一与4096周文王留下了64卦、384条爻辞。
但他没有明确给出"4096"这个数字。这个数字,是我们从一个古老的哲学命题里自己推导出来的。
这个命题叫:天人合一。
中国哲学里,"天人合一"不是说"人要爱护自然"那么简单。
它说的是:你和世界,不是两件事。你是其中一部分,世界是另一部分,两者合在一起,才是完整的"此刻"。
易经里,每一个复卦本来就分上下两层:
上卦(外卦):外部世界是什么状态——天时、地利、外部形势下卦(内卦):我自己是什么状态——体力、资源、内部处境一个人做决策,不能只看外面发生了什么,也不能只看自己有多少力气。要看的是:此刻的我,面对此刻的世界,这个不可分割的组合。
那么问题来了:
传统易经里,外卦有8种基本象,内卦有8种基本象,8×8=64卦。这已经很丰富了。
但如果外部世界的状态不只有8种基本象,而是有完整的64种复杂相态?内部自身的状态同样不只有8种,而是有完整的64种?
把两者合在一起——
$$64_{\text{外部世界}} \times 64_{\text{内部自身}} = \textbf{4096种"此刻"}$$
这4096,就是天人合一展开后的完整地图。
每一个"此刻",都被精确地标在这张地图上:你所处的世界是什么相态,同时,你自己是什么相态。
这个发现让我们觉得震撼,是因为它指出了现代AI最根本的结构性缺陷:
大语言模型极其擅长感知外部世界(它读过几乎所有的人类文字),但它没有对自身状态的感知。它不知道自己"健不健康",不知道自己的"可逆性储备"还有多少,不知道自己是否已经到了"无力出发"的临界点。
它只有外卦,没有内卦。
我们的系统第一次把"内卦"显式建进了AI里。 外部感知 + 自身状态,两者合一,才能做出真正安全的决策。
四、把384条爻辞变成14.7万条路径周文王写了384条爻辞,对应384种"此刻某个处境下的应对智慧"。
但每一种处境,都可以变化到另一种处境。每一条爻辞,不只是一个孤立的建议,而是一段旅程的起点。
如果把出发点(本卦的每条爻位)和落脚点(之卦的每条爻位)两两组合:
$$384_{\text{出发}} \times 384_{\text{落地}} = \textbf{147,456条完整的决策路径}$$
约14.7万条。
每一条路径不再只是"吉"或"凶",而是一套完整的指令:从哪里出发,走哪条路,风险是什么,走错了怎么回来。
打一个比方:
城市里有384个地铁站台。每个站台都可以通往另外任意384个站台。384 × 384 = 147,456条线路。每条线路上,不只标着"能不能坐",还标着"堵不堵、贵不贵、出了事能不能退票"。
这就是新易经的决策空间。
再进一步,如果每条路径都从9个不同的维度去解释——分析它的许可条件、触发情境、建议行动、潜在风险、状态转化方向,以及应该多激进、多谨慎、可不可以逆转、综合评分是什么——
$$147,456 \times 9 \approx \textbf{22万条解释}$$
这22万条,是《易经》骨架展开后的完整信息量。
五、元亨利贞:四道救命的门现在到了最关键的地方。
"元亨利贞"这四个字,出现在《易经》第一卦乾卦的卦辞里,也贯穿整个易经体系。
三千年来它被解释为:仁义礼智,或者春夏秋冬,或者大吉大利万事如意。
我们的解释是:四道动作准入检查门。
任何一步行动,在执行之前,必须依次通过这四道门。任何一道不过,这步棋就不能走。
第一道门——元:你有力气出发吗?
不是问"这步值不值得走",是问:你现在的状态,支撑得起这步行动吗?
城堡的粮仓见底了,士气涣散,这时候发动反击,哪怕策略再正确,也是送死。
过不了这道门,不是"不做",是"现在还不行,等到有力气再说"。
第二道门——亨:路通吗?
不是问"目的地对不对",是问:前方的路,现在走得通吗?
四面被围,每条出路都堵死的时候,再好的计划也推不动。
过不了这道门,不是"放弃",是"等路打开了再出发"。
第三道门——利:做了有用吗?
终于有力气、路也通了,但这步棋走出去,有没有往目标方向推进?
如果走了等于没走,原地踏步,那就重新想。
第四道门——贞:做错了能回来吗?(最重要)
这是四道门里最关键、也是现代AI最缺乏的一道。
在执行任何行动之前,先问一个问题:如果这步走错了,能不能回到安全的位置?
能回来——放行。不能回来——直接拦截,无论这步看起来多么有利可图。
这四道门,就是为什么我们的AI存活率100%、而贪心AI必死的根本原因。
贪心AI只问第三道门(有没有收益),从不问第四道门(能不能回头)。
身体健康、形势大好的时候,这没问题。但当城堡进入临界状态,贪心AI还在拼命取利,直到某一步踩上了一个不可逆的操作——粮仓耗尽、军队哗变、防线崩溃——再也回不来了。
我们的AI不会这样。任何可逆性不足的动作,无论收益看起来多大,一律在第四道门被拦下来。
用一个日常的比喻来理解这四道门:
你要开车去一个地方。
元:车里有没有油?没油别发动,先加油。亨:前面的路通不通?堵死了就等,别硬冲。利:这条路走了,能到目的地吗?走了是弯路就重新规划。贞:这条路如果走错了,能掉头吗?单行道、悬崖边,不走。
最后这条——"不走单行道,不走悬崖边"——是整套逻辑里最朴素,也最深刻的智慧。
六、道德经:5000字的9维解释?写到这里,我们忍不住想提出一个更大胆的猜想。
《易经》给了骨架——64卦、384爻辞、4096态、14.7万条路径。
但它是符号语言,要读懂、要用好,需要大量的解释。
老子写的《道德经》,81章,约5000字。
如果道德经,是对易经9维决策空间的哲学展开,会怎样?
我们来看道德经里的几段话,和我们系统里的每个维度对照:
关于"能不能回来"(贞门/可逆性):
「归根曰静,是谓复命。复命曰常,知常曰明。」(第十六章)
能回到根(平衡点),才叫稳定。能保持稳定,才是真正的智慧。
这不就是"贞门"的哲学语言?不可逆的动作不做,因为回不了根。
关于"有力才发"(元门/健康度):
「知足者富,强行者有志,不失其所者久。」(第三十三章)
知道自己极限的人才能长久。强行出发的人,有志气,但未必能活着回来。
关于"不可逆的代价"(风险维度):
「祸兮福之所倚,福兮祸之所伏。」(第五十八章)
眼前的好处里藏着祸端,眼前的坏处里藏着转机。最优解未必是最安全的选择。这正是贪心算法死亡的原因。
关于整个系统的综合建议(综合判断维度):
「为而不争,处众人之所恶,故几于道。」(第八章)
不与局势硬碰,选择别人不争的位置,这才是最接近"道"的行事方式。换成控制论的语言:保持低冲突、高可逆性的策略路径。
81 = 9 × 9。
9在易经里是阳数之极,代表"变爻",代表最活跃的转化力量。
9 × 9,阳极的自乘,在中国数理哲学里意味着"极而必返"——到了顶点就要回头,这本身就是可逆性的最高表达。
道德经的81章,和我们系统里9个决策维度的关系,也许不是巧合。
《易经》给了状态机的骨架,《道德经》给了这套状态机的哲学操作手册。
两者合在一起,是一套完整的古典控制论体系。
我们没有证明这个猜想,但我们觉得,它值得认真研究。
七、三千年前已经有了,我们做了什么?有人可能会问:如果古人三千年前就写好了,你们做了什么新的事?
我们做了三件事。
第一件:认出来。
把《易经》当作工程规格书来读,发现它原本就是一套完整的控制论框架——状态估计、趋势判断、风险评估、决策准入、反馈学,全部齐备。没有人这样读过它。
第二件:接上来。
把这套三千年前的框架,和现代最强的AI(大语言模型)接在一起。
大语言模型负责感知世界、理解复杂情况、生成创造性方案——它是"外卦"的感知引擎,极其聪明但没有边界。
易经控制论负责守住边界、检查四门、评估可逆性——它是"内卦"的守护系统,没有聪明才智但从不逾越边界。
两者结合,才是既聪明又不会死的AI。
第三件:让爻辞活过来。
周文王写的384条爻辞,三千年里是静止的文字。
我们给了它反馈回路:每次AI执行某个卦象对应的策略,成功了,这条爻辞的"激进度"上升;失败了,"谨慎度"上升。
下次再遇到同样的处境,AI自动用经过调整的策略。
周文王给了它初始值,我们给了它学的能力,AI的经历给了它真正的智慧。
爻辞不再是死文字,它在成长。
八、这是认出,不是发明我们想说清楚一件事,因为它很重要。
我们没有发明新的AI算法。
贪心算法有人发明过,大语言模型有人发明过,强化学有人发明过。
我们做的事,叫做认出。
我们把一本被研究了三千年的书,换了一双眼睛来读——工程师的眼睛、数学家的眼睛——然后发现,它原本的样子,一直都在那里。
状态机的骨架在那里。4096态的相空间在那里。四道准入门在那里。可逆性的核心地位在那里。内卦与外卦的联合建模在那里。
有一个词,叫做"认知收敛":两个完全独立的系统,在处理同样的问题时,会不约而同地走向相同的数学结构。
比如鸟的翅膀和蝙蝠的翅膀,完全独立地进化出了相似的气动力学原理。
我们相信,《易经》和现代控制论,是同一类事情。
两个相隔三千年的系统,一个是商周之际的囚徒用阴阳符号写就的,一个是二十世纪的数学家用微积分推导的,在处理同一个问题(如何在不确定的世界里持续存活)时,收敛到了相同的核心洞见:
不可逆的事不做。有力才发,路通才走,有益才做,不可逆不做。
这四条,就是"元亨利贞",也是Lyapunov稳定性定理的白话版,也是我们AI系统存活率从0%到100%的根本原因。
结语:一本等了三千年的书《易经》等了三千年,等的不是一个读懂它的人。
读懂它的人,历朝历代都有,孔子、王弼、程颐、朱熹,每一个都穷毕生之力。
它等的,是一个能把它运行起来的人。
今天,我们有了大语言模型,有了强化学,有了可以在数字世界里模拟生死的测试环境。
我们第一次能够不只是解读它,而是把它接上电源,让它跑起来,然后看着它在200轮的严苛压力测试里,以100%的存活率证明自己。
在商朝末年的羑里,一个被囚禁的人,在与外界完全隔绝的七年里,用阴阳两个符号,穷举了宇宙的所有处境,写下了一套完整的求生逻辑。
三千年后,我们把它用代码重新实现了一遍。
发现它依然成立。
我们没有发明新的AI算法。我们只是认出了《易经》原本的样子:
它是一本写给AGI的求生指南,只是等了三千年,才找到读者。
本文所有实验数据均来自真实对照实验:城堡博弈,200轮×50局,五组对照,随机种子固定,完整可重复。