@系统和我 兄好。您的回复我仔细看过。我完全理解您说的特征是本质的含义。这在machine learning 或者以前叫做 statistical learning 阶段,是共识,直到现在也是共识。 特征+分类器,是早期机器学标配,以至于搞具体应用的人只需要设计极具辨识度、informative 的特征即可,这在直觉上和洞见上都是说的过去的,我认可您的观点并在我做machine learning和一些具体应用领域的研究时,这也是我的核心认知。
后来业内人士认为,既然特征是核心,那能否抛开专家,让系统自己学重要的特征,给他们分配合适的权重。至于特征的语义是什么,系统不需要知道,甚至设计者也不需要知道,只要它结果好,比如经常用到的一些metrics,如accuracy、precision、recall等等。因此machine
learning有段时间演化为关心如何让系统自己学特征,叫做feature learning。后来又觉得feature 这个词儿和之前专家们设计出来的feature没有区分度,不能体现是机器自己学出来的,因此大家又采用representation learning,这里的representation相比feature更加泛化了,并没有显示的语义,但是它确实是某种“feature”。而深度学就是这样一种工具,它是在行业认知转变之后不断发展的工具,这个工具体现了研究领域的认知转变,即:设计好的网络结构(或者系统),让它自己学特征,然后做prediction、reasoning或别的什么任务。
我想之所以deep learning的方法在量化领域还不能显示出威力,原因在于交易数据的时间序列和拓扑属性,而普通的NNs无力解决此类问题,又或者系统优化方面的人才没有配合。但现在NNs领域新出来的图网络在处理拓扑属性非常明显的数据的时候有与生俱来的优势,后续或可在交易领域有用武之地。当然,这是后话了。