我崇尚一个理念,万事万物都具有可重复性,如果没有可重复性那炒股不会盈利的。技术指标的可重复性,图标的可重复性,补涨的可重复性,事件的可重复性等等。 我喜欢量化,基于可重复性原理,我每个手法凭直觉做一段时间我都会尝试进行量化,把过往三到五年所有的关于该手法的所有票全找出来,找出成功的和失败的,成功的共性在哪里,失败的共性在哪里。开始做统计套利,开始用具体的数值量化交易。这里有一个很邪门的事情,我每次凭直觉做的时候该手法收益率都很高,但只要量化完之后再做收益率直线下降。这么多年换了无数种手法,无一例外。我今年才知道我是过拟合了。我用过去死的数据来预判活的未来,尤其数据越精确的数值未来错的越快。我犯了几个典型的过拟合特征,
参数敏感型(如21日均线上穿55日均线,过去收益率很高,但只要把55日换成54,收益率就极度下滑,这个就犯了参数敏感型错误)
规则堆砌型(如总结了过去100个大牛股的特征,股价要在20日均线智商,成交量要大于5日均量的1.2倍,MACD0轴上方金叉,KDJ的J值小于20后拐头,且上午十点半涨停。这种就是犯了趋势因子,动量因子各种因子规则堆砌型错误)条件过度挖掘
(参数敏感型和规则堆砌型后面括号里的内容全是我现编的,只是用来方便举例子,里面的条件我从来没用过。)
所有行为都犯了一个思维陷阱:试图通过不断增加历史具体的细节参数来提升回测曲线收益率
就像学驾照,在固定的考试路线,记住了第
三棵树方向盘打一圈半,看到地上的特殊标记刹车,倒车入库必须看左后视镜对准第二根黄线。这种就根本不会开车,只会跑特定路线。
就像一张照片,他瞳距6.3厘米,鼻翼宽2.1厘米,嘴角上扬15度,眉毛长3厘米。耳朵长4厘米....把这张照片里各种参数记录到极致,那完全按着这个参数去大街上找人,一个都要找不到。
像补涨有的人翻遍过往几年的情况,记住当龙头A上涨多少时买入B。或者龙头A第几个板一字,且封单多少,买入B。或者记住各种各种精准的细节,比如看到龙头上涨过程中有地天板的成份,或者看龙头的各种历史细节参数,这些都是精准的记录了特殊标记,越精准灾难越大。 我突然就想起来当年听哲学课时的场景,我的做法听起来好听,翻遍过往3,5年所有手法的标地,找出成功的共性和失败的共性,我以为越具体越好,实不知我所有的行为不就是在找老师讲的那个长120厘米,宽80厘米且下方有4个70厘米柱状体的桌子吗,只盯参数不盯桌子的本质不就是在僵化‘桌子’的这个概念吗。只记住了殊相而没记住共相。 我觉得要去参考奇异值分解。那些所有的具体参数都妨碍去了解‘桌子’的本质,那些都是噪音。根本就不是‘桌子’的本质。