今儿找老师第二次毕设讨论
早上6点起床赶着读论文和书
约的15:10,15:00刚读完书出门,到后15:08
最后几分钟书还差几页没看,扫了下章节目录,急中生智,思路如下:
1.线性or非线性?
传统业界和学术界多用多因子模型于股票分析,为线性模型,优点在于可解释性强,而机器学为非线性,准确率更高但是过拟合且没有理论支撑
2.机器学前提
机器学前提要求序列的稳定性,毫无疑问金融序列并不稳定,与吴恩达机器学课程里训练自动驾驶的规则性来讲,金融更多随机游走,所以拿机器学预测股价无非是过拟合的产物
3.什么符合机器学?
人的心理,人的
思维模式,面对股票暴涨暴跌的恐慌/贪婪(暂定,市场在有效化,这里假设市场投资者不专业,情绪化)行为金融从套利限制和心理学出发,暂不考虑套利限制,从心理学出发,行为金融各种研究比如预期偏差,风险偏好偏差,认知限制等等容易情景分析即仅考虑单一变量,各种变量间(预期,风偏,认知限制)关系无法把握。何解?用魔法对抗魔法,用机器学拟合情绪,用非线性拟合非线性
4.情绪标签从哪来?
这是老师问我的问题,真没想过,还好我反应快。我愣了十几秒,说:NLP。用NLP,数据取东财,
同花顺,基金评论区评论进行情感分析,结果作为标签即训练集。老师点点头:这种现成研究有很多
5.怎么做到短期预测?
我又被问到了。老师说:一天这么多时间段,你怎么把握实时性?分时间段吗?比如9:30到10:00打个标签。。。我点点头。我觉得不对劲,赶紧又说:没有必要,只用取15:00后数据到开盘前作为一天情绪数据输入,考虑到讨论的密集度,可以对特定时间段附以惩罚(这是我现在写的时候想到的)
6.把NLP结果作为训练集附以其他当天数据采用机器学(感觉LSTM都没必要,只要最普通的就行)拟合出0-1变量
7.师点点头又开始摇头,觉得两个变量相关性太强,说:没事,你先去做做看
8.拟合出非线性的情绪因子,加入传统多因子模型(四/五有待考究),如此就兼顾了可解释性和准确度,非线性和线性
9.我问师:老师,是不是还挺新颖的,我感觉好像还没什么人这么做(鬼知道有没有,只能这么问,问老师感觉怎么样万一说不行呢?)师点点头:感觉好像还挺创新的 师说:你这周先看看NLP怎么弄,给了我一本NLP的书,还挺新的 我:好嘞
10:又闲聊了一会宿舍留宿流程,供暖情况,我说:老师那我先走了,拜拜,师笑着说:拜拜
11.真不错,又混过一周