下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

AI和A股---数学原理

20-12-05 21:40 2253次浏览
lihf05
+关注
博主要求身份验证
登录用户ID:
接上篇,大家可能很好奇为啥机器(软件)能从大量样本中学到知识,竟然这么智能,是怎么做到的?本篇主要从
数学原理角度来阐述“学”的本质。前文提及,Ai一开始走的是模仿人的思路,就是基于规则,建立符号系统,借鉴形式逻辑的方法论,
实现机器的自动推理。还是用语言翻译来举例,一开始我们试图建立语法,文法规则,但是失败了。不过这思路用在计算机 高级语言设计和编程中是很
成功的,如果没有这套东西,今天我们可能还在用汇编语言这样的类机器语言编程,那么就不可能就今天这么发达的软件
技术了。

那么基于规则的技术体系失败了,今天的AI总体用的是啥思路了?其实今天AI从数学角度来看,完全是基于概率统计来实现的。
其实和所谓的人脑的智能没啥关系。还以语言翻译为例,比如英文翻译为中文,可能有会有程序看到bush这个单词,那么这个单词到底
如何翻译了,因为bush这个单词有小树丛的意思,也有美国前总统布什的意思。那么机器是如何翻译了,其实机器就看bush这个单词
前后的词,比如如果前面出现的是英文president单词,那么bush就翻译成布什,为啥前面出现president就翻译为总统布什了?因为
根据大量的已经翻译的中英文翻译历史数据统计表面,我们发现前面是president后面是bush,bush被翻译成布什的频率(几乎等价概率)
为87%(这个数据是我瞎编,就是表达个意思),当然了,如果出现了其他词语,出现歧义的时候,我们可以看前面或者是后面更多的单词,建立条件概率。基于这个思路往下走,
可以把单词之间的关系用概率表示,比如((president,bush),0.87  )这样的值对表示,把历史的样例数据做个统计,建立大量这样的
单词对和值放到机器中存储起来,翻译的时候查表看概率大的翻译就行了。

说到概率统计,不得不提及贝叶斯公式,这个公式几乎支撑了概率统计的半壁江山,如果没有贝叶斯公式,概率统计的一套东西估计还是
学术玩具,根本没法进入到实践中。贝叶斯公式有先验概率和后验概率,先验概率可以理解是基础概率,不依赖任何信息,我们以股票
来说,如果不给出更多信息,让我们判断明天股市涨跌的概率,我们怎么做?很简单的思路就是看下A股开市以来,上涨的频率(几乎等价概率)
,下跌频率(几乎等价概率)。我们只能以这个统计结果来回答明天股市的涨跌概率,没问题吧?但是这样的回答大家满意嘛?肯定不满意。
为啥不满意了,因为没有可操作性,无法指导明天的操作。明天是开仓好,还是平仓好。所以了,也有很多人说股市根本没有规律,纯属随机
游走。如果纯粹的从基础概率这个角度看,每天的涨跌独立同分布,的确是这样。但是我相信这个说法,很多人都不会相信。如果真的每天
的涨跌是独立同分布的,那么技术流派的道氏理论(趋势)就不成立了。我相信众多的趋势交易派信徒是不认可的。具个简单的例子,一个公司
突发利空,当日跌停,然后你和我说明天这个股票涨跌各有大概50%的可能性,你是在安慰我吗?显然大家的预期是明天会继续惯性下跌。下跌
的概率远远大于上涨概率。为啥大家要打板,不就是基于统计数据,今天封死涨停,明天继续惯性上涨的概率要远大于下跌的概率嘛?
从这个例子中我们知道,其实股市明天的涨跌,不仅仅是和全局的统计(A股开市以来整体的涨跌概率)有关系,
其实和今天上涨还是下跌有关系,按照趋势派的观点,如果当前处于上升趋势,今天上涨,明天继续上涨的概率肯定要大于基础概率(A股开市以
来整体的上涨概率)。所以今天的涨跌这个信息对于明天股市是否涨跌是有加强或者是削弱的作用的。所以这里就出现了条件概率的概念,
我们不仅仅简单统计A股开始以来涨跌的整体概率,我们还可以统计前一个交易日上涨,第二日继续上涨的概率,前一个交易日下跌,第二日上涨的
概率这些信息。当然聪明如你,你可能会发现明天涨跌不仅仅和今天的涨跌有关系,也许和市场情绪有关系,比如最高空间板的挣钱效应。
是的,是有关系!也许还有更多可以统计的地方,那么这个股票AI系统大家可能觉得越来越靠谱了吧。这里有个问题,就是我们统计的都是
单一因素(数学中的专业术语叫做向量的分量,股票中有专门的术语叫因子),但是我们需要的是最终结果,就是你告诉我明天涨跌概率到底是
一个具体啥样的概率,如果上涨概率大,我就加仓,如果下跌概率大,我就开盘清仓,这个时候就有实践的指导意义了。一言以蔽之,贝叶斯公式
就能从理论上将大量的统计信息合在一个公式中,计算得出明天的涨跌概率。所以这里的所谓的学的意思,就是统计历史样例中的一个个的统计信息,
然后带入到贝叶斯公式中,得出最终涨跌的概率。上面描述的其实就是贝叶斯算法机器学算法,最早成功的一个案例就是垃圾邮件分类。我学生时代
AI课程的大作业之一就是基于贝叶斯机器学算法来判断一封邮件是不是垃圾邮件。

记得小时候听过一个故事,一个地主家教书先生第一天教孩子一字写一笔就行了,第二天二字写两笔,第三天三字写三笔,然后孩子直呼写字太容易了,
辞退了先生。一日,地主要给姓万的朋友写信,孩子在书房写了半天一个万字都没写好,直叹“天下姓氏何其多,奈何姓万”,因为他真的写了一万笔。
我说这个例子意思是说,不少人听完上面的介绍,肯定以为“原来AI就是概率统计啊,原来这么简单,我懂了,我懂了”。原则来讲,AI基于概率统计
的论断当然是没错的,但是实际上现在的AI只是把概率统计作为底层技术使用,甚至只是评判基准来使用。就是说不会脱离概率统计,但是又要远远比
概率统计复杂。

在开始新得介绍前,先直接说个结论。就是我们关心的东西都能用数学表达,确切的是用函数表示。从集合论来说,函数实际是关于一个样本点到唯一实数
的映射。即使我们关心的规则,用函数表达也是没问题的。比如,具体到股市,我们关心的是一个样例,比如今天收盘后股市的状态,当然了,这个状态可以
很复杂,可以包括两市的成交量,涨跌家数,龙头股的挣钱效应等等,总之你能想到都少都可以,这个东西用一个向量来整体表达。那么我们关心
的是啥了?可能你关心的是明天股市的涨跌概率,也可能你想更加精确一点,直接预测收盘后的精确点位(所以你看,AI不仅仅预测概率的,也可以预测准确的点位)。
也就是说,我们可以理解股市的规律其实就是一个函数,只是这个函数很复杂。现在看来,可能只有上帝知道这个函数长得啥样,我们人类应该是不清楚的。
如果谁知道了。谁就拥有了挣钱机器,因为根据这个函数,可以精确预测股市未来的点位,这还了得?所以牛顿能预测天体的运行轨迹,但是无法预测股市的涨跌了。

现在让我们思路回到初中数学,我们第一次接触函数这个概率应该是初中的代数。最简单的函数应该是直线函数,几何上的一根直线,在坐标系中,可以用y=ax+b这样
的表达式表示,x叫做自变量,y叫做因变量,a叫做斜率,b为截距。这个可能是最简单的函数了。x,y是变量,我们可以不管,但是a,b必须是确切的数字。几何上
的一根直线和(a,b)这样的值对是一一对应的,也就是说直线确定了,a,b的值也就确定了。a,b的值确定了,那么这根直线也就能唯一画出来了。从几何角度看,我们知道
两点确定一条直线,也就说如果我们知道一根直线的两个点,那么也就等价知道了这个直线。假定股市运作很简单,就是个直线函数,那么这里总结下:股市的运作规律,y=ax+b
函数,(a,b)值对,坐标系中看到的直线,其实这几个说法是同一个意思。因为两点可以确定一条直线,这个结论非常重要,这个意思就是说历史上的两个样本点就能确定直线,
也就是说就能把股市的运行规律表达出来,这个就是反复提及的从样本数据中学的本质含义。既然两点可以确定一个直线,那么具体如何确定了?不知道大家还记得初中数学
的待定系数法不?我们假定2个点分别是(x1,y1),(x2,y2),分别带入到y=ax+b,就是个2元1次方程组,二元一次方程方程组会解的吧?好的,二元一次方程组解解出来了,也
就是(a,b)值对解出来了,也就是说股市规律找到了,最简单来说,这个公式的表达式的x的意思是今天的收盘价,y是明天的收盘价,那么我们收盘的时候把今天的收盘价(x)
带入到函数,就能算出明天的收盘价。这个绝对智能了吧?
打开淘股吧APP
7
评论(52)
收藏
展开
热门 最新
lihf05

20-12-06 14:07

1
本科学的是机械,所以你说电机啥的知道一点点概念。研究生学的是软件,职业前半段在互联网行业混。学生时代梦想成为数学家,无奈天赋不够。后来觉得量化和数学有一些关联,就转行做量化了。
狮子口

20-12-06 13:56

1
记得我当时用的是建模软件。
周五没看到什么好票,随便抓了几个。闲的没事干。也懒得再分析。周末不交易太无聊。
狮子口

20-12-06 09:07

1
神经网络与蚁群算法等,曾经搞过建模。虽然感觉不错,但本人一直认为,只有抓住事物本质,才是根本。
这也就是近些年来,越发喜欢东方传统思维的原因了。
本人研究了中医,发现当今好多都是错误的理论。
刷新 首页上一页 下一页末页
提交