下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

AI和A股---数学原理

20-12-05 21:40 2262次浏览
lihf05
+关注
博主要求身份验证
登录用户ID:
接上篇,大家可能很好奇为啥机器(软件)能从大量样本中学到知识,竟然这么智能,是怎么做到的?本篇主要从
数学原理角度来阐述“学”的本质。前文提及,Ai一开始走的是模仿人的思路,就是基于规则,建立符号系统,借鉴形式逻辑的方法论,
实现机器的自动推理。还是用语言翻译来举例,一开始我们试图建立语法,文法规则,但是失败了。不过这思路用在计算机 高级语言设计和编程中是很
成功的,如果没有这套东西,今天我们可能还在用汇编语言这样的类机器语言编程,那么就不可能就今天这么发达的软件
技术了。

那么基于规则的技术体系失败了,今天的AI总体用的是啥思路了?其实今天AI从数学角度来看,完全是基于概率统计来实现的。
其实和所谓的人脑的智能没啥关系。还以语言翻译为例,比如英文翻译为中文,可能有会有程序看到bush这个单词,那么这个单词到底
如何翻译了,因为bush这个单词有小树丛的意思,也有美国前总统布什的意思。那么机器是如何翻译了,其实机器就看bush这个单词
前后的词,比如如果前面出现的是英文president单词,那么bush就翻译成布什,为啥前面出现president就翻译为总统布什了?因为
根据大量的已经翻译的中英文翻译历史数据统计表面,我们发现前面是president后面是bush,bush被翻译成布什的频率(几乎等价概率)
为87%(这个数据是我瞎编,就是表达个意思),当然了,如果出现了其他词语,出现歧义的时候,我们可以看前面或者是后面更多的单词,建立条件概率。基于这个思路往下走,
可以把单词之间的关系用概率表示,比如((president,bush),0.87  )这样的值对表示,把历史的样例数据做个统计,建立大量这样的
单词对和值放到机器中存储起来,翻译的时候查表看概率大的翻译就行了。

说到概率统计,不得不提及贝叶斯公式,这个公式几乎支撑了概率统计的半壁江山,如果没有贝叶斯公式,概率统计的一套东西估计还是
学术玩具,根本没法进入到实践中。贝叶斯公式有先验概率和后验概率,先验概率可以理解是基础概率,不依赖任何信息,我们以股票
来说,如果不给出更多信息,让我们判断明天股市涨跌的概率,我们怎么做?很简单的思路就是看下A股开市以来,上涨的频率(几乎等价概率)
,下跌频率(几乎等价概率)。我们只能以这个统计结果来回答明天股市的涨跌概率,没问题吧?但是这样的回答大家满意嘛?肯定不满意。
为啥不满意了,因为没有可操作性,无法指导明天的操作。明天是开仓好,还是平仓好。所以了,也有很多人说股市根本没有规律,纯属随机
游走。如果纯粹的从基础概率这个角度看,每天的涨跌独立同分布,的确是这样。但是我相信这个说法,很多人都不会相信。如果真的每天
的涨跌是独立同分布的,那么技术流派的道氏理论(趋势)就不成立了。我相信众多的趋势交易派信徒是不认可的。具个简单的例子,一个公司
突发利空,当日跌停,然后你和我说明天这个股票涨跌各有大概50%的可能性,你是在安慰我吗?显然大家的预期是明天会继续惯性下跌。下跌
的概率远远大于上涨概率。为啥大家要打板,不就是基于统计数据,今天封死涨停,明天继续惯性上涨的概率要远大于下跌的概率嘛?
从这个例子中我们知道,其实股市明天的涨跌,不仅仅是和全局的统计(A股开市以来整体的涨跌概率)有关系,
其实和今天上涨还是下跌有关系,按照趋势派的观点,如果当前处于上升趋势,今天上涨,明天继续上涨的概率肯定要大于基础概率(A股开市以
来整体的上涨概率)。所以今天的涨跌这个信息对于明天股市是否涨跌是有加强或者是削弱的作用的。所以这里就出现了条件概率的概念,
我们不仅仅简单统计A股开始以来涨跌的整体概率,我们还可以统计前一个交易日上涨,第二日继续上涨的概率,前一个交易日下跌,第二日上涨的
概率这些信息。当然聪明如你,你可能会发现明天涨跌不仅仅和今天的涨跌有关系,也许和市场情绪有关系,比如最高空间板的挣钱效应。
是的,是有关系!也许还有更多可以统计的地方,那么这个股票AI系统大家可能觉得越来越靠谱了吧。这里有个问题,就是我们统计的都是
单一因素(数学中的专业术语叫做向量的分量,股票中有专门的术语叫因子),但是我们需要的是最终结果,就是你告诉我明天涨跌概率到底是
一个具体啥样的概率,如果上涨概率大,我就加仓,如果下跌概率大,我就开盘清仓,这个时候就有实践的指导意义了。一言以蔽之,贝叶斯公式
就能从理论上将大量的统计信息合在一个公式中,计算得出明天的涨跌概率。所以这里的所谓的学的意思,就是统计历史样例中的一个个的统计信息,
然后带入到贝叶斯公式中,得出最终涨跌的概率。上面描述的其实就是贝叶斯算法机器学算法,最早成功的一个案例就是垃圾邮件分类。我学生时代
AI课程的大作业之一就是基于贝叶斯机器学算法来判断一封邮件是不是垃圾邮件。

记得小时候听过一个故事,一个地主家教书先生第一天教孩子一字写一笔就行了,第二天二字写两笔,第三天三字写三笔,然后孩子直呼写字太容易了,
辞退了先生。一日,地主要给姓万的朋友写信,孩子在书房写了半天一个万字都没写好,直叹“天下姓氏何其多,奈何姓万”,因为他真的写了一万笔。
我说这个例子意思是说,不少人听完上面的介绍,肯定以为“原来AI就是概率统计啊,原来这么简单,我懂了,我懂了”。原则来讲,AI基于概率统计
的论断当然是没错的,但是实际上现在的AI只是把概率统计作为底层技术使用,甚至只是评判基准来使用。就是说不会脱离概率统计,但是又要远远比
概率统计复杂。

在开始新得介绍前,先直接说个结论。就是我们关心的东西都能用数学表达,确切的是用函数表示。从集合论来说,函数实际是关于一个样本点到唯一实数
的映射。即使我们关心的规则,用函数表达也是没问题的。比如,具体到股市,我们关心的是一个样例,比如今天收盘后股市的状态,当然了,这个状态可以
很复杂,可以包括两市的成交量,涨跌家数,龙头股的挣钱效应等等,总之你能想到都少都可以,这个东西用一个向量来整体表达。那么我们关心
的是啥了?可能你关心的是明天股市的涨跌概率,也可能你想更加精确一点,直接预测收盘后的精确点位(所以你看,AI不仅仅预测概率的,也可以预测准确的点位)。
也就是说,我们可以理解股市的规律其实就是一个函数,只是这个函数很复杂。现在看来,可能只有上帝知道这个函数长得啥样,我们人类应该是不清楚的。
如果谁知道了。谁就拥有了挣钱机器,因为根据这个函数,可以精确预测股市未来的点位,这还了得?所以牛顿能预测天体的运行轨迹,但是无法预测股市的涨跌了。

现在让我们思路回到初中数学,我们第一次接触函数这个概率应该是初中的代数。最简单的函数应该是直线函数,几何上的一根直线,在坐标系中,可以用y=ax+b这样
的表达式表示,x叫做自变量,y叫做因变量,a叫做斜率,b为截距。这个可能是最简单的函数了。x,y是变量,我们可以不管,但是a,b必须是确切的数字。几何上
的一根直线和(a,b)这样的值对是一一对应的,也就是说直线确定了,a,b的值也就确定了。a,b的值确定了,那么这根直线也就能唯一画出来了。从几何角度看,我们知道
两点确定一条直线,也就说如果我们知道一根直线的两个点,那么也就等价知道了这个直线。假定股市运作很简单,就是个直线函数,那么这里总结下:股市的运作规律,y=ax+b
函数,(a,b)值对,坐标系中看到的直线,其实这几个说法是同一个意思。因为两点可以确定一条直线,这个结论非常重要,这个意思就是说历史上的两个样本点就能确定直线,
也就是说就能把股市的运行规律表达出来,这个就是反复提及的从样本数据中学的本质含义。既然两点可以确定一个直线,那么具体如何确定了?不知道大家还记得初中数学
的待定系数法不?我们假定2个点分别是(x1,y1),(x2,y2),分别带入到y=ax+b,就是个2元1次方程组,二元一次方程方程组会解的吧?好的,二元一次方程组解解出来了,也
就是(a,b)值对解出来了,也就是说股市规律找到了,最简单来说,这个公式的表达式的x的意思是今天的收盘价,y是明天的收盘价,那么我们收盘的时候把今天的收盘价(x)
带入到函数,就能算出明天的收盘价。这个绝对智能了吧?
打开淘股吧APP
7
评论(52)
收藏
展开
热门 最新
lihf05

20-12-06 10:57

0
是这样的
lihf05

20-12-06 10:56

0
有懂行的过来了,👍
lihf05

20-12-06 10:52

0
👍。说的非常好,很认可你说的
赚钱干网红

20-12-06 10:39

0
AI高频程序化交易,能收割的对象其实也是具备特定的特征的。市场包容一切,市场里理论上存在的无数种不同的交易模式,只要交易者的交易模式不属于高频AI程序的收割对象,交易者根本不用担心。

而且当有实力的资金发现了某个AI高频程序化交易的交易模式,则可以反其道而行之,达到收割使用该AI高频程序化交易的资金。
赚钱干网红

20-12-06 10:33

0
AI的最有效的操作周期,是高频秒级别交易。

在投机市场,价格的波动幅度和时间周期是正相关的。也就是说:时间周期越短,则价格波动幅度越小,而时间周期越长,价格波动幅度越大。

同时:交易的时间周期越短,盈利的确定性越高,而时间周期越长,盈利的不确定性越高。

AI 通过秒级别的交易,锁定单次秒级别的盈利,通过高频次秒级别的交易,可以不断累积单次秒级别的盈利。

但任何盈利模式都有临界点,过了临界点,就起反作用了。比如高频交易的资金规模不能太大,因为秒级别的交易,能容纳的资金量是很少的。
同时,如果AI高频交易的对手方也是AI高频交易,则AI高频交易的优势,就不复存在了,又回到五五开的概率了,跟赌博完全没有区别了。
历史的教训

20-12-06 10:27

0
很有意思的文章!👍
执股轮回

20-12-06 10:19

0
对的 说一下我自己的真实案例
某策略A  
训练AI深度学  策略A17-19年盈亏  得到最佳方案
然后用学之后的AI去执行10-13年的一段
得到的结果是-30%
那么10-13年无脑执行(每天开仓)策略A的结果是什么呢?复利700%
AI不是跑不过无脑执行的结果  是压根就是亏损的
从结果分布上来看  很多时间AI几乎完美做反  开仓即大亏  空仓策略A就大涨
也就是说  AI学到并且自己去调整的参数 最适合17-19的行情
同样的方法放到10-13年就是完美做反的

当然 如果是实际操作 AI肯定会一边学一边执行 不会这么惨  但是我估计  它也跑不赢无脑执行的结果
那么AI的意思何在?
赚钱干网红

20-12-06 10:10

0
程序化,就是建立一个数学模型,人为设定有多少个参数会对未来的价格产生影响,并分配不同的权重。那么当这个模型建立起来以后,只要输入对应参数的变量,模型就会输出不同的涨跌概率。

但是,注意一下,参数依然是通过人为设置的,那么也就是说人的主观意识依然在主导这个数学模型。那么整个数学模型依然无法做到完全客观。

某些参数可能在过去某段时间内对涨跌起主导作用,但在未来是否还能对价格的涨跌起主导作用??数学模型永远无法做到适时匹配。

只要当数学模型输出的结果与实际走势之间存在的偏差大到一定的程度,此时人才会意识到,数学模型失效了。此时人就必须对数学模型进行修正,比如修正数学函数,调整参数的权重,甚至删除某些参数,再增加新的参数。如果还是不行,则整个原来的数学模型就会抛弃,再重新设计一个新数学模型。

股市包括期货市场包括债券市场,这些系统是开放式的,不是封闭式的。那么其实就意味着影响价格波动的参数是永远无法计数的。一个数学模型,其包含的参数肯定是有限的。这其实已经预告了任何数学模型终有失效的那一刻。

历史可以影响未来,但历史决定不了未来。
反语

20-12-06 10:02

0
对的  基于神经网络让AI自主学  实际上就是训练AI做一个对已知样本分析的过程
然后如果未来算法是有穷尽的  那么AI就是无敌的
这个过程实际人脑也可以代替的 但是做不到AI这么高效且无错

但即使AI高效无错 你指望他发财也是不可能的

这涉及到的本质很简单

已知样本你做到像神一样也不能准确预知未来  
因为博弈是动态的  
方法A处于爆发周期  就会越来越多的人聚集到方法A 方法A的对手盘则要么连续踏空 要么大幅亏损
按人类整体趋利避害的本质  方法A的拥护者越来越多  对手盘越来越少  超越到一个极限  方法A即崩溃
这个极限AI是算不出来的 没人能算出来  因为这不但和场内博弈的对手有关 还涉及到场内是否减员以及场外是否有增量
你说  这个东西  AI如何去算?随便一个货币政策的导向  就能导致很大的偏差  
但是用AI挣点小钱还是可以的  因为如果训练得当他能第一时间找到方法A  也能很快感受到危险  
这个过程虽然不能实现爆发 但是鱼尾还是能吃到一些的  当然  如果方法A的持续周期太短  那AI一样会亏钱  
但是整体累计下来 肯定是比不懂本质  没有正期望值策略的大部分股民 要强得多

很多人去神话AI  却连它是什么都不知道  之前回过一个帖子  那楼主大概的意思就是  你们随便说  我一张图让你们领会我蔑视的眼神
像这种人不去理就好了  
楼主还是说的比较细致也是能共同探讨之人 还望不吝赐教
lihf05

20-12-06 09:51

0
好比打板交易,做的好挣点小钱是可以的。但是指望纯打板交易就能上福布斯是不现实的
刷新 首页 上一页 下一页 末页
提交