文科在运用数学时,最容易犯下的错误,莫过于对数域的误用。以社会调查为例,问卷设计者常把主观感受划分为五个等级,从“非常满意”到“非常不满意”,这原本是五进制体系。由于实际调查常常涉及多个题项,最后得到的便是一个五进制的张量。然而研究者往往惯性地将这些数据机械地转化为实数,并在数域转换时无视信息损失,忽略了个体间主观感受的真实涨落,也未曾反思系综统计与随机波动的区别。
问卷出于简化,被预先“整数化”处理,把各异的心理变化平铺抹去,只剩下便于统计的数值标签。等到样本足够大时,又以悬空的数学手法,将这些离散整数强行“实数化”,如此一来,统计背后隐藏着对个体差异的无声湮灭。更有甚者,默许了“不同个体之间的涨落与同一个体自身涨落等价”这一荒谬前提。其实,不同的人心志、决断何其不同?正如房玄龄与杜如晦,若将其风格相加平均,岂不是将各自的锋芒变作泯然众人的平庸?
由此可见,只图便利而随意变换数域,乃文科研究结论失效的根本缘由。我常劝文科朋友多读化学史,而非物理史。物理中的实数域适用于牛顿力学,那是因其研究对象足够宏观,能忽略微观涨落,实数函数自然能驾驭全局。而化学发展伊始,所面对的世界远较文科复杂——在缺乏现代仪器的年代,化学家们一度模仿物理,以实数衡量压强、体积、质量,试图穷尽函数关系。但随着持续实验,他们发现物质的质量分布并非均匀,这一现象更贴近整数规律。早期氧气与氢气质量之比,无论怎样波动,总在8的整数倍上下徘徊。彼时尚无元素概念,氨气、二氧化碳也曾被当作“元素”编号。正因为突破了对实数的执念,化学才创立了划时代的元素周期表,虽然没有曲线图,却极具科学之大成。
科学思想的精髓,不在于照搬图表或公式,而在于创造契合自身问题的数学工具。文科要汲取的,不是理科的曲线图与方程式,而是独立思辨、创新表达的勇气——正如物理学家发明微积分、语言学家创造范畴论那样。语言与文字向来蕴含复杂的数学秩序,其多变的张量维度正是新数学诞生的摇篮。所谓“文科无法量化”,无非是因为“量化”被误等同于“实数化”。为何不能是矩阵、张量甚至词值(word-valued)?面对矩阵无法作图时,为何不另辟蹊径?
因此,我主张,语文与英语也应早日数字化,但这不是简单地将文字编码,而是要探求文字关系间深层的数学逻辑,像
人工智能那样,从复杂性与层次性中孕育出独属于文科的严整科学。这,才是真正的创新之道。