下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

AI和A股---数学原理

20-12-05 21:40 2256次浏览
lihf05
+关注
博主要求身份验证
登录用户ID:
接上篇,大家可能很好奇为啥机器(软件)能从大量样本中学到知识,竟然这么智能,是怎么做到的?本篇主要从
数学原理角度来阐述“学”的本质。前文提及,Ai一开始走的是模仿人的思路,就是基于规则,建立符号系统,借鉴形式逻辑的方法论,
实现机器的自动推理。还是用语言翻译来举例,一开始我们试图建立语法,文法规则,但是失败了。不过这思路用在计算机 高级语言设计和编程中是很
成功的,如果没有这套东西,今天我们可能还在用汇编语言这样的类机器语言编程,那么就不可能就今天这么发达的软件
技术了。

那么基于规则的技术体系失败了,今天的AI总体用的是啥思路了?其实今天AI从数学角度来看,完全是基于概率统计来实现的。
其实和所谓的人脑的智能没啥关系。还以语言翻译为例,比如英文翻译为中文,可能有会有程序看到bush这个单词,那么这个单词到底
如何翻译了,因为bush这个单词有小树丛的意思,也有美国前总统布什的意思。那么机器是如何翻译了,其实机器就看bush这个单词
前后的词,比如如果前面出现的是英文president单词,那么bush就翻译成布什,为啥前面出现president就翻译为总统布什了?因为
根据大量的已经翻译的中英文翻译历史数据统计表面,我们发现前面是president后面是bush,bush被翻译成布什的频率(几乎等价概率)
为87%(这个数据是我瞎编,就是表达个意思),当然了,如果出现了其他词语,出现歧义的时候,我们可以看前面或者是后面更多的单词,建立条件概率。基于这个思路往下走,
可以把单词之间的关系用概率表示,比如((president,bush),0.87  )这样的值对表示,把历史的样例数据做个统计,建立大量这样的
单词对和值放到机器中存储起来,翻译的时候查表看概率大的翻译就行了。

说到概率统计,不得不提及贝叶斯公式,这个公式几乎支撑了概率统计的半壁江山,如果没有贝叶斯公式,概率统计的一套东西估计还是
学术玩具,根本没法进入到实践中。贝叶斯公式有先验概率和后验概率,先验概率可以理解是基础概率,不依赖任何信息,我们以股票
来说,如果不给出更多信息,让我们判断明天股市涨跌的概率,我们怎么做?很简单的思路就是看下A股开市以来,上涨的频率(几乎等价概率)
,下跌频率(几乎等价概率)。我们只能以这个统计结果来回答明天股市的涨跌概率,没问题吧?但是这样的回答大家满意嘛?肯定不满意。
为啥不满意了,因为没有可操作性,无法指导明天的操作。明天是开仓好,还是平仓好。所以了,也有很多人说股市根本没有规律,纯属随机
游走。如果纯粹的从基础概率这个角度看,每天的涨跌独立同分布,的确是这样。但是我相信这个说法,很多人都不会相信。如果真的每天
的涨跌是独立同分布的,那么技术流派的道氏理论(趋势)就不成立了。我相信众多的趋势交易派信徒是不认可的。具个简单的例子,一个公司
突发利空,当日跌停,然后你和我说明天这个股票涨跌各有大概50%的可能性,你是在安慰我吗?显然大家的预期是明天会继续惯性下跌。下跌
的概率远远大于上涨概率。为啥大家要打板,不就是基于统计数据,今天封死涨停,明天继续惯性上涨的概率要远大于下跌的概率嘛?
从这个例子中我们知道,其实股市明天的涨跌,不仅仅是和全局的统计(A股开市以来整体的涨跌概率)有关系,
其实和今天上涨还是下跌有关系,按照趋势派的观点,如果当前处于上升趋势,今天上涨,明天继续上涨的概率肯定要大于基础概率(A股开市以
来整体的上涨概率)。所以今天的涨跌这个信息对于明天股市是否涨跌是有加强或者是削弱的作用的。所以这里就出现了条件概率的概念,
我们不仅仅简单统计A股开始以来涨跌的整体概率,我们还可以统计前一个交易日上涨,第二日继续上涨的概率,前一个交易日下跌,第二日上涨的
概率这些信息。当然聪明如你,你可能会发现明天涨跌不仅仅和今天的涨跌有关系,也许和市场情绪有关系,比如最高空间板的挣钱效应。
是的,是有关系!也许还有更多可以统计的地方,那么这个股票AI系统大家可能觉得越来越靠谱了吧。这里有个问题,就是我们统计的都是
单一因素(数学中的专业术语叫做向量的分量,股票中有专门的术语叫因子),但是我们需要的是最终结果,就是你告诉我明天涨跌概率到底是
一个具体啥样的概率,如果上涨概率大,我就加仓,如果下跌概率大,我就开盘清仓,这个时候就有实践的指导意义了。一言以蔽之,贝叶斯公式
就能从理论上将大量的统计信息合在一个公式中,计算得出明天的涨跌概率。所以这里的所谓的学的意思,就是统计历史样例中的一个个的统计信息,
然后带入到贝叶斯公式中,得出最终涨跌的概率。上面描述的其实就是贝叶斯算法机器学算法,最早成功的一个案例就是垃圾邮件分类。我学生时代
AI课程的大作业之一就是基于贝叶斯机器学算法来判断一封邮件是不是垃圾邮件。

记得小时候听过一个故事,一个地主家教书先生第一天教孩子一字写一笔就行了,第二天二字写两笔,第三天三字写三笔,然后孩子直呼写字太容易了,
辞退了先生。一日,地主要给姓万的朋友写信,孩子在书房写了半天一个万字都没写好,直叹“天下姓氏何其多,奈何姓万”,因为他真的写了一万笔。
我说这个例子意思是说,不少人听完上面的介绍,肯定以为“原来AI就是概率统计啊,原来这么简单,我懂了,我懂了”。原则来讲,AI基于概率统计
的论断当然是没错的,但是实际上现在的AI只是把概率统计作为底层技术使用,甚至只是评判基准来使用。就是说不会脱离概率统计,但是又要远远比
概率统计复杂。

在开始新得介绍前,先直接说个结论。就是我们关心的东西都能用数学表达,确切的是用函数表示。从集合论来说,函数实际是关于一个样本点到唯一实数
的映射。即使我们关心的规则,用函数表达也是没问题的。比如,具体到股市,我们关心的是一个样例,比如今天收盘后股市的状态,当然了,这个状态可以
很复杂,可以包括两市的成交量,涨跌家数,龙头股的挣钱效应等等,总之你能想到都少都可以,这个东西用一个向量来整体表达。那么我们关心
的是啥了?可能你关心的是明天股市的涨跌概率,也可能你想更加精确一点,直接预测收盘后的精确点位(所以你看,AI不仅仅预测概率的,也可以预测准确的点位)。
也就是说,我们可以理解股市的规律其实就是一个函数,只是这个函数很复杂。现在看来,可能只有上帝知道这个函数长得啥样,我们人类应该是不清楚的。
如果谁知道了。谁就拥有了挣钱机器,因为根据这个函数,可以精确预测股市未来的点位,这还了得?所以牛顿能预测天体的运行轨迹,但是无法预测股市的涨跌了。

现在让我们思路回到初中数学,我们第一次接触函数这个概率应该是初中的代数。最简单的函数应该是直线函数,几何上的一根直线,在坐标系中,可以用y=ax+b这样
的表达式表示,x叫做自变量,y叫做因变量,a叫做斜率,b为截距。这个可能是最简单的函数了。x,y是变量,我们可以不管,但是a,b必须是确切的数字。几何上
的一根直线和(a,b)这样的值对是一一对应的,也就是说直线确定了,a,b的值也就确定了。a,b的值确定了,那么这根直线也就能唯一画出来了。从几何角度看,我们知道
两点确定一条直线,也就说如果我们知道一根直线的两个点,那么也就等价知道了这个直线。假定股市运作很简单,就是个直线函数,那么这里总结下:股市的运作规律,y=ax+b
函数,(a,b)值对,坐标系中看到的直线,其实这几个说法是同一个意思。因为两点可以确定一条直线,这个结论非常重要,这个意思就是说历史上的两个样本点就能确定直线,
也就是说就能把股市的运行规律表达出来,这个就是反复提及的从样本数据中学的本质含义。既然两点可以确定一个直线,那么具体如何确定了?不知道大家还记得初中数学
的待定系数法不?我们假定2个点分别是(x1,y1),(x2,y2),分别带入到y=ax+b,就是个2元1次方程组,二元一次方程方程组会解的吧?好的,二元一次方程组解解出来了,也
就是(a,b)值对解出来了,也就是说股市规律找到了,最简单来说,这个公式的表达式的x的意思是今天的收盘价,y是明天的收盘价,那么我们收盘的时候把今天的收盘价(x)
带入到函数,就能算出明天的收盘价。这个绝对智能了吧?
打开淘股吧APP
7
评论(52)
收藏
展开
热门 最新
狮子口

20-12-08 08:12

0
以后不说了,不懂根本,白费唾沫。
狮子口

20-12-06 19:37

0
实践验证吧。
反语

20-12-06 16:04

0
关于情绪周期的这个认知兄大概率是错了

比如你说的近期高位股封板次日一字跌停
他看起来是比较无厘头的 之前还在保持强势 次日直接按死

但其实是因为 他有个大的周期在做过程主导
大的周期如果高位股都处于一个比较好的 容易赚钱的状态 那么各种老师的理论和战法只要坚持下去实际上都会得到一个很好的结果
这个结果并不是由单日主导的 而是这一段时间总体会不错

这里的大周期 是从6月底 光大证券开始的 直到现在其实高位整体都是处于一个非常不错的状态
这里 怎么说呢 从天山之后 高位股其实一直在走下坡路
但是根据某种规则 暂称为抄底规则点
实际上高位股在下跌之后的抄底规则点都是有爆发的(要一直切换最强) 从双良-新余 到 优德精密-智慧农业 再到小康-郑州煤电 我有策略盈亏图 看的非常清楚
仅说天山之后
第一波买入点在9月24日 双良节能试错 然后到新余爆发
第二波买入点在10月30日 优德精密-智慧农业
第三波买入点在11月20日 金浦钛业-小康-龙州-郑州煤电

但是他们的接力点到最高点 高度即持续盈利是越来越低的 而且到金浦钛业-小康这里 低点的规则实际上也是连续出现了亏损 之后才由郑州煤电补回来
这个抄底买入的规则盈亏情况已经越来越弱了 这代表什么?
这代表这个高位的大周期正在衰竭 接下来大概率就是抄底的规则点失效的时候

正因为如此 所以高位才频繁出现了当日盈利次日却直接按死的情况 每次要出现连续的行情之前(不管是上涨还是下跌) 高位都会出现这种特征
同样的 可以仔细思考一下 19年12月高位大爆发之前 11月是不是这么个情况 当时的长城动漫 再到麦克奥迪
是不是也反复这么折腾过很久 当日大亏 次日反包 然后大反包之后次日再按死 按死之后次日再反包
每次要变盘之前 都会出现这种仅仅隔日就会极端的大涨大跌走势
包括天山之前 也是经历了协鑫集成 再到沧州明珠的反复折腾 然后出连续爆发的天山
目前这里 必定是要出现高位的连续行情了 在没有巨大增量干扰的情况下 大概率是要出现连续的大跌行情(只针对高位接力)

这样去理解情绪周期 才是合理的 短周期的话 变数太多 而且会有资金做局强封的股存在 样本会具有偶然性
lihf05

20-12-06 15:24

0
👍
狮子口

20-12-06 15:21

0
毕竟真正去深入思考的,太少了。都以为人家说的大道至简适合自己,岂不知应用方法得出之前,中间的理论推导是极其巨大的工作量。所以,只有几个人赚钱。
狮子口

20-12-06 15:15

0
还有情绪周期,我也不认可。比如近期封板后高位板,次日却近乎一字跌停。闷了不少人吧。
难道被闷的情绪在买入后都一致看跌了?
这就是根本立足点错误导致推导结果混乱。
这种现象,其实在东方术数界极其普遍,比如风水,八字之类的。没几个真能去除掉垃圾的,因为他们相伴而生。
lihf05

20-12-06 15:07

0
这也是很多人质疑量化的原因。不是量化不靠谱,而是好的量化策略能承接资金量不大的原因,靠谱的策略,机构自营盘自己的资金都不能承接,一堆机构,大佬上亿的资金都无法接,怎么可能轮到普通散户了?其实同样的道理,大家觉得龙头战法靠谱,其实这也就是小散户玩玩,根本无法承接大资金。大家看到华鑫每天2个亿不到的资金量几乎都已经包场了,可能都要破坏生态了。
狮子口

20-12-06 15:07

0
还有,最最常见的是为何自己介入后迟迟不拉却一直洗盘?实在熬不住后出来了,人家却拉升了?缠论根本无法解释的。
总根源错了,立足点严重失误。
其实,社会上这类型的人与事比比皆是。但死不认账居多。所以没出息的居多。但股市不同,错了直接打脸!没有什么解释。这也是我喜欢股市的原因。不需要别人认同。觉得自己对,就让市场检验。省的废话了。简单粗暴,直切问题要害。
狮子口

20-12-06 14:58

0
缠论无法解释打板操作。即使手里有票,几乎全都卖飞。所以根本不实用。
狮子口

20-12-06 14:57

0
还有某球的量化分析,其实几乎都是建立在错误的基础之上,只有钻了某些小空子的才能盈利一段时间。
但这又不属于量化了吧?淘吧里高手都是在用啊。
刷新 首页上一页 下一页 末页
提交