凡是搞计量经济的,都关注这个号了
稿件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
关于机器学习在计量分析中的应用,各位学者可以参阅如下文章:1.Python中的计量回归模块及所有模块概览,2.空间计量软件代码资源集锦(Matlab/R/Python/SAS/Stata), 不再因空间效应而感到孤独,3.回归、分类与聚类:三大方向剖解机器学习算法的优缺点(附Python和R实现),4.机器学习第一书, 数据挖掘, 推理和预测,5.从线性回归到机器学习, 一张图帮你文献综述,6.11种与机器学习相关的多元变量分析方法汇总,7.机器学习和大数据计量经济学, 你必须阅读一下这篇,8.机器学习与Econometrics的书籍推荐, 值得拥有的经典,9.机器学习在微观计量的应用最新趋势: 大数据和因果推断,10.机器学习在微观计量的应用最新趋势: 回归模型,11.机器学习对计量经济学的影响, AEA年会独家报道,12.机器学习,可异于数理统计,13.Python, Stata, R软件史上最全快捷键合辑!,14.Python与Stata, R, SAS, SQL在数据处理上的比较, 含code及细致讲解,15.Python做因果推断的方法示例, 解读与code,16.文本分析的步骤, 工具, 途径和可视化如何做?17.文本大数据分析在经济学和金融学中的应用, 最全文献综述,18.文本函数和正则表达式, 文本分析事无巨细。
前面,我们引荐了①“机器学习方法出现在AER, JPE, QJE等顶刊上了!”,②前沿: 机器学习在金融和能源经济领域的应用分类总结,③Lasso, 岭回归, 弹性网估计在软件中的实现流程和示例解读”,④回归方法深度剖析(OLS, RIDGE, ENET, LASSO, SCAD, MCP, QR),⑤高维回归方法: Ridge, Lasso, Elastic Net用了吗,⑥Lasso回归操作指南, 数据, 程序和解读都有,⑦七种常用回归技术,如何正确选择回归模型?,⑧共线性、过度/不能识别问题的Solutions,⑨计量经济学与实验经济学的若干新近发展及展望,⑩计量经济学新进展,供参考等,在学术同行间引起巨大反响。
机器学习方法逐渐在经济管理等社科类顶刊,如AER,JPE,QJE,JOF等期刊上出现了。为了进一步了解机器学习在国外最新应用动向,我们为各位学者奉上“深度学习在金融领域的现状汇总与前沿瞻望”。对机器学习方法感兴趣的学者,建议认真研读这篇非常重要、全面的文章。**正文**
关于下方文字内容,作者:陈庆冲,东北财经大学金融工程,通信邮箱:yukichen1213@163.com
br/>**正文**
关于下方文字内容,作者:陈庆冲,东北财经大学金融工程,通信邮箱:yukichen1213@163.com
Deep Learning for Financial Applications : A Survey
引言
机器学习(Machine Learning,ML)发展至今,已在金融领域发光发热。而深度学习(Deep Learning,DL)由于其优越的表现,现阶段受到广泛关注,金融领域正是深度学习的新兴领域,且处于活跃状态。这篇文章除了对深度学习的算法原理进行介绍外,主要关注以下几个问题:1.深度学习在金融领域的应用包括哪些?2.目前在各领域的研究进度如何?3.还有哪些有潜力的应用领域?4.哪一种深度学习模型更被青睐?5.深度学习与机器学习相比,哪一个更适合用作研究?6.深度学习的未来方向是什么?
深度学习算法介绍
深度学习(DL)是一种特殊类型的机器学习(ML),它由多层神经网络复合而成,属于复杂度较高的模型。我们对将介绍其中改的七种分支:深层感知器(Deep Multilayer Perceptron,DMLP)、卷积神经网络(Convolutional Neural Networks, CNN)、循环神经网络(Recurrent Neural Network, RNN)、长短期记忆网络(Long Short-Term Memory, LSTM)、限制玻尔兹曼机(Restricted Boltzmann Machines, RBMs)、深度信念网络(Deep Belief Networks, DBNs)、自编码器(Autoencoders, AEs)。
1.多层感知机(DMLP)
深层感知器与多层感知器(MLP)类似,由输入层、隐含层和输出层组成,但层数较多。对于每层的神经元,都有对应的输入项x、权重w和偏差b。神经网络中的一个神经元输出如式(1):
(1)
此外,每个神经元都有一个非线性激活函数,该函数通过对前一层神经元的输出加权求和产生该层神经元的输出。常用激活函数包括:Sigmoid函数、双曲正切函数(hyperbolic tangent)、Relu函数(Rectified Linear Unit)、Leaky Relu函数、Swish函数和Softmax函数。
深层感知器与多层感知器相比,具有更好的分类和回归性能。深层感知器的学习过程通过反向传播实现,输出层神经元的输出误差会反映到前一层神经元上,并对其进行修正,而随机梯度下降法(SGD)是最常用的更新权重的方法。
2.卷积神经网络(CNNs)
卷积神经网络(CNN)是一种深度神经网络(DNN),主要在图像分类及识别领域运用。整个图像由1x1、3x3、5x5等尺寸的过滤器扫描,并由不同类型的层形成架构:输入层、卷积层、池化层(平均值或最大值)、全连接层与输出层,是一种常用的前馈型神经网络。
3.递归神经网络(RNN)
递归神经网络处理的数据规格较为特殊,常限定于序列数据:如时间序列、音频和语音数据、文字等,常被用于手写文字识别、语音识别等。
与前馈型网络不同,递归神经网络使用内部存储器对输入进行处理。存在不同类型的递归神经网络结构,如一对一、多对一与多对多。RNN对每个输入进行处理,隐含层中的神经元将输入项的历史信息包含在“状态向量”(state vector)里。训练方法常使用时间反向传播法(BPTT),原理为:t时刻损失函数的微分反映了前一时刻的权值。但该类神经网络的训练比前馈神经网络更困难,且周期较长。
4.长短时记忆网络(LSTM)
长短时记忆网络是处理序列数据的深度学习算法。优势在于可以对网络中的短期值与长期值同时进行记忆,因此广泛使用于语音识别、语音翻译、手写字符识别、时间序列数据预测等领域。LSTM网络由LSTM神经元组成,LSTM神经元又由三扇门构成:遗忘门(forget gate)、输入门(input gate)、输出门(output gate)。这三扇门对信息流进行控制。通过这些结构特征,每个神经元可以在任意的时间间隔内记住所需的值,若干个LSTM神经元又组成了神经网络层。
5.限制玻尔兹曼机(RBMs)
RBM可以对输入集的概率分布进行学习,主要用于降维、分类和特征学习。RBM是一个两层(可见层与隐含层,两层间不连接)的二部无向图模型,每层的神经元互不连接。每个神经元都具有对输入进行计算的能力,并随机决策是否执行计算。在计算时,输入值使用特定的权重加权,再添加特定的偏差,并通过激活函数传递计算值。随后,在重构阶段,输出的结果作为输入重新进入网络,再作为输出从可见层退出,最后比较前一个输入的值和处理后的值。RBM的缺点是训练过程较为复杂,尽管有对于对数似然梯度进行估计的好方法,但对于对数似然本身的估计并不容易。
6.深度信念网络(DBNs)
DBN由一组RBM层组成,由潜在变量组成的概率生成模型。DBNs用于使用非监督方法在输入集中寻找独立特征。DBM可以在训练过程中学习以概率方式重构输入集。随后,网络中的各层开始检测鉴别特征,在学习过程完成后,对分类进行监督学习。
7.自编码器(AEs)
自编码器常用于特征提取和降维,通过重新对输入进行映射,是输入更能对分类起到作用,换而言之,该算法在执行一个无监督的特征学习过程。AEs包含编码器和解码器两部分,结构与前馈型神经网络相似,由输入层、输出层和一个(多个)隐含层组成,且输入层和输出层所包含神经元个数相同,呈对称状态。特征提取与降维后会损失掉原有的数据内部关系等信息,是AEs的一个缺陷。
8.其他模型
DL模型除了包括上述7个模型外,较常用的还有深度强化学习(Deep Reinforcement Learning, DRL)、生成式对抗网络(Generative Adversarial Networks, GANs)、胶囊网络(Capsule Networks, Deep Gaussian Processes, DGPs)。但除了DRL外,其他两个模型暂未被学者们投入金融的研究中,但仍可以对其潜力进行期待。
DL在金融领域中的应用
在已有的文献中,深度学习与金融领域的结合较多。与此同时,还有很多领域未被充分挖掘,目前已有的研究领域可分为以下几类:
1.算法交易(Algorithmic Trading)
算法交易是仅由算法模型,不通过人类的决策做出的买入与抛售决定。这些决策不仅可以基于简单的线性规则与数学模型,也可以使用ML/DL来对交易策略进行优化。随着网上交易平台的引入,算法交易在过去20年几乎接管了金融行业,而基于深度学习的algo(algorand)交易模型开始受到大量关注。
Algo-trading应用程序通常与价格预测模型进行结合,对市场的时机进行迅速选择,其本质在于对买卖信号的价格/趋势进行预测;也可以通过优化交易参数(包含买卖价差、
订单簿分析、头寸规模),来关注交易本身的动态。高频交易(HFT)的研究人员对深度学习的应用十分感兴趣,并运用于高频交易研究中。
本文将学者们对基于DL模型的Algo-trading 研究的过去与现状进行了梳理,主要分为3个板块:1嵌入时间序列预测模型的算法交易2基于分类(买卖信号、趋势预测)的算法交易模型3其他的独立研究或算法交易模型(配对交易、套利等)。
1.1 时间序列预测与算法交易
大多数的算法交易研究都集中在对股票或指数价格的预测上,而长短时记忆网络(LSTM)是其中最受欢迎的模型。而LSTM常常与其他算法进行结合使用,包括且不限于小波变换WT(Wei et al.,2017)、卷积神经网络CNN(Liu et al.,2017)等。除了LSTM外,对于股票价格预测的模型各有千秋,Zhang et al.(2017)提出了可处理多种频率交易的股票价格预测模型SFM;Deng et al.(2017)使用了FDDR模型,可以预测股价和生成交易信号。此外,学者们选取了不同国家的股票数据,增强了深度学习模型的泛用性,其中包括希腊、新加坡、中国等地。与此同时,以比特币为首的加密货币的交易也受到学者们的广泛关注,汇总表格如表1所示:
表 1 嵌入时间序列预测模型的算法交易
注:以下表格都可以往右滑动,这样就能看全所有表格内容。
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 土耳其担保银行 2016 OCHLV、价差、波动性、换手率等 PLR、Graves改进的LSTM MSE、RMSE、MAE、RSE、相关系数和R2 Spark
2 沪深300、印度Nifty50、恒生指数(HSI)、日经225、标普500、道琼斯指数 2010-2016 OCHLV、技术指标 WT、Stacked autoencoders、LSTM MAPE、相关系数、THEILU -
3 中国股市 2007-2017 OCHLV CNN+LSTM 年化收益率、最大回撤 Python
4 纽交所50个股票 2007-2016 价格数据 SFM MSE -
5 芬兰股市5只股票的市值 2010 要价/报价、成交量 WMTR、MDA 准确率、精确率、召回率、F1分数 -
6 300支深交所股票 2014-2015 价格数据 FDDR、DNN+RL 利润、回报、SR Keras
7 标普500指数 1989-2005 价格数据、成交量 LSTM 回报、STD、SR、准确率 Python、TensorFlow、Keras、R、H2O
8 希腊银行股票(ETE) 2009-2014 FTSE100、道琼斯指数、GDAX交易所、日经225、欧元美元汇率、黄金 GASVR、LSTM 回报、波动性、SR、准确率 TensorFlow
9 中国IF-IH-IC股指期货 2016-2017 价格变动 MODRL+LSTM 收益与亏损、SR -
10 新加坡股市指数 2010-2017 过去十天指数的OCHL DNN RMSE、MAPE、利润、SR -
11 英镑/美元 2017 价格数据 RL+LSTM+NES SR、下偏比、总利润 Python、Keras、TensorFlow
12 商品、外汇期货、ETF 1991-2014 价格数据 DNN SR、CP值、回报 C++、Python
13 美元/英镑、标普500、英国富时100(FTSE100)、石油、黄金 2016 价格数据 AE+CNN SR、波动性、平均回报/交易量、回报率 H2O
14 比特币(Bitcoin)、达世币(Dash)、瑞波币(Ripple)、门罗币(Monero)、莱特币(Litecoin)、狗币(Dogecoin)、未来币(Nxt)、域名币(Namecoin) 2014-2017 移动平均线(MA)、布林线(BOLL)、CRIX回报、欧洲银行同业拆借利率、OCHLV LSTM、RNN、MLP 准确率、F1分数 Python、TensorFlow
15 标普500、韩国KOSPI指数、恒生指数和欧洲斯托克50指数 1987-2017 200天股票价格 深度Q-Learning、DNN 总利润、相关性 -
16 标普500包含的股票 1990-2015 价格数据 DNN、GBT、RF 平均回报、MDD、Calmar比率 H2O
17 基础数据、技术数据与经济数据 - 基础、技术和市场信息 CNN - -
注:
1.特征集:OCHLV表示开盘价(Open)、收盘价(Close)、最高价(High)、最低价(Low)、成交量(Volume),OCHL同理。
2.算法:PLR(Piecewise Linear Representation):分段线性表示;WT(Wavelet Transforms):小波变换;SFM(State Frequency Memory):状态频率存储器;WMTR(Weighted Multichannel Time-series Regression):加权多通道时间序列回归;MDA(Multilinear Discriminant Analysis):多线性判别分析;FDDR(Fuzzy Deep Direct Reinforcement Learning):模糊深层直接强化学习;RL(Reinforcement Learning):强化学习;GASVR(GA with a SVR):遗传算法+支持向量回归机;MODRL(Multi-objective Deep Reinforcement Learning):多目标深层强化学习;NES(Natural Language Processing):自然进化策略;DNN(Deep Neural Network):深度神经网络;RF(Random Forest):随机森林;GBT(Gradient Boosted Trees):梯度提升树
3.性能指标:MSE(Mean Squared Error):均方误差;RMSE(Root Mean Square Error):标准误差;MAE(Mean Absolute Error):平均绝对误差;RSE(Relative Squared Error):相对平方误差;STD(Standard Deviation):标准差;SR(Sharpe-ratio):夏普比率;MDD(Maximum Drawdown):最大浮动亏损
1.2 分类与算法交易
除了上述算法交易外,启发式算法与深度学习算法的结合也被学者们进行开发,并多用于股票的技术层面分析,Sezer et al.(2017)采用遗传算法(GA)对技术指标进行优化,并用作提高预测的精度;此外,MACD也被用来预测股票的价格走势(Troiano et al.,2018)。除股票价格预测外,分类算法也是深度学习与算法交易结合的一个重要领域。如,由于CNN在图像分类问题上运用广泛,其被用来将财务输入数据转换为图像(Gudelek et al.,2017)。除了对图像的转换外,Sezer et al.(2019)将条形图图像作为CNN的输入,并预测了图像中的点未来会买进、持有还是卖出,并开发了相应的算法交易模型。表2对算法交易中的分类算法进行了汇总:
表 2 基于分类的算法交易模型
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 道琼斯30指数中的股票 1997-2017 RSI 遗传算法修参的DMLP 年化收益率 Spark MLlib、Java
2 标普500ETF,十只来自标普500的股票 2014-2016 价格数据 FFNN 累计收益 MatConvNet、Matlab
3 道琼斯30股票 2012-2016 收盘价和若干个技术指标 LSTM 准确率 Python、Keras、Tensorflow、TALIB
4 所有高频交易记录 2014-2017 价格数据,订单与交易 LSTM 准确率 -
5 纳斯达克交易所 2010 LOB中的价格与交易量 LSTM 精确率、召回率、F1分数、kappa系数 -
6 17个ETF 2000-2016 价格数据,技术指标 CNN 准确率、MSE、利润、AUROC Keras、Tensorflow
7 道琼斯30股票和9个最大交易量的ETF 1997-2017 价格数据,技术指标 CNN+图像特征 召回率、精确率、F1分数、年化收益率 Python、TensorFlow、Keras、Java
8 英国富时100 2000-2017 价格数据 CAE TR、SR、MDD、平均回报 -
9 纳斯达克交易所 2010 价格,交易量,10个LOB中的订单 CNN 精确率、召回率、F1分数、kappa系数 Theano、Scikitlearn、Python
10 土耳其Borsa Istanbul 100指数中的股票 2011-2015 75项技术指标与OCHLV CNN 准确率 Keras
11 ETF和道琼斯30指数 1997-2007 价格数据 CNN+图像特征 年化收益率 Keras、Tensorflow
12 8项债券/衍生品市场中的实验资产 - 资产价格数据 RL、DNN、遗传算法 学习误差与遗传算法误差 -
13 10只来自标普500的股票 - 股票价格 TDNN、RNN、PNN 遗失率、虚警率 -
14 伦交所 2007-2008 订单簿、交易、买/卖订单,删除订单 CNN 准确率、kappa系数 Caffe
15 加密货币,比特币 2014-2017 价格数据 CNN、RNN、LSTM 累计投资组合价值、MDD、SR -
注:
1.特征集:RSI(Relative Strength Index):相对强弱指数;LOB(Limit Order Book Data):订单簿
2.算法:FFNN(Feedforward Neural Network):前向反馈神经网络;CAE(Convolutional Autoencoder):卷积自编码器;TDNN(Timedelay Neural Network):时延神经网络;PNN(Probabilistic Neural Network):概率神经网络
3.性能指标:AUROC(Area Under the Receiver Operating Characteristics):接收机的工作面积;TR(Total Return):总回报
1.3 算法交易的其他领域模型
除了股票的价格预测外,看涨期权和看跌期权的价格预测也受到了学者的关注(Tino et al.,2001)。对于文本数据的挖掘也有助于算法交易,Bari et al.(2018)利用文本挖掘从金融新闻中提取信息,并利用LSTM、RNN、GRU三种算法生成交易信号。表3介绍了其他领域的汇总:
表 3 其他算法交易模型
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 德国DAX、英国富时100指数、看涨/看跌期权 1991-1998 价格数据 马尔科夫模型、RNN 日利润的均值和标准差 -
2 台湾股指期货、迷你股指期货 2012-2014 图像中的价格数据 可视化方法+CNN 累计利润、准确率 -
3 标普500中的能源部门/核心公司 2015-2016 文本与价格数据 LSTM、RNN、GRU 回报、夏普比率、精确率、召回率、准确率 Python、Tweepy API
4 芝商所信息 2016 订单簿、时间戳、价格数据 RNN 精确率、召回率、F1分数 Python、TensorFlow、R
5 台湾股指期货(TAIFEX) 2017 价格数据 RL+CNN预处理 准确率 -
6 标普500中的股票 2010-2016 OCHLV DCNL PCC、DTW、VWL Pytorch
7 来自今日新闻网、苹果日报、自由时报、理财网中的关于18只股票的新闻 2013-2014 文本、观点 DNN 回报 Python、Tensorflow
8 来自标普500的和纳斯达克100的489只股票 2014-2015 订单簿 空间神经网络 交叉熵误差 NVIDIA’s cuDNN
9 实验数据集 - 价格数据 由CNN、LSTM、GRU和MLP组成的深度强化学习 平均利润 Python
注:
1.算法:GRU(Gated-Recurrent Unit):门控循环单元;DCNL(Deep Co-investment Network Learning):参与投资的深度学习网络
2.性能指标:PCC(Pearson’s Correlation Coefficient):皮尔森相关系数;DTW(Dynamic Time Warping):动态时间规整;VWL(WL Kernel-based Method):核函数方法
2.风险评估(Risk Assessment)
深度学习研究还作用于风险评估领域,它对于给定资产、公司、个人、产品与银行等的风险进行识别与评估。细分方向包括:破产预测、信用评分、贷款/保险承保、债券评级、贷款申请、消费信贷确定、企业信用评级、抵押贷款选择、财务困境预测等,在这些领域中,风险状况的识别至关重要。若未进行合适的风险评估,后果严重性不可想象:如2008年房地产泡沫的破裂就是一个较为有代表的例子。
信用风险评估大多集中在1信用评分和银行困境分类,也有部分论文研究2抵押贷款违约的可能性、风险交易检测与危机预测。
2.1 信用评分与困境
信用评级一直是一个热门话题,由于其所涉及维度较多,且主观性较强,目前常出现于各大数据竞赛中(Kaggle、天池等)。深度学习在此方面表现良好,Yu et al.(2018)采用DBN+SVM,将预测准确率达到了80-90%。除了对评级得分这种连续型数值外,信用风险分类的运用也较为广泛,如Neagoe et al.(2018)利用DMLP和深度CNN对信用评分进行分类,详情如表4所示:
表 4 信用评分与困境分类
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 信用违约掉期 2016 回收率、传播路径、部门和地区 DBN+RBM AUROC、FN、FP、准确率 WEKA
2 德国、日本信贷数据集 - 个人金融变量 SVM+DBN 加权准确率、TP、TN -
3 来自Kaggle平台的信贷数据 - 个人金融变量 DNN 准确率、TP、TN、G-mean指标 -
4 澳大利亚、德国信贷数据 - 个人金融变量 GP+AE优化DNN FP Python、Scikitlearn
5 澳大利亚、德国信贷数据 - 个人金融变量 DCNN、MLP 准确率、虚警、漏警 -
6 来自中国金融公司的消费者信贷数据 - 使用Relief算法选择50个最重要的维度 CNN+ Relief AUROC、K统计量、准确率 Keras
7 来自UCI 机器学习repo的信贷数据集 - UCI信贷数据集 双曲正切函数、maxout函数、Rectifier函数 - AWS、EC2、H2O、R
注:
1.性能指标:FN(False Negative):假阴性;FP(False Positive):假阳性;TN(True Negative):真阴性;TP(True Positive):真阳性
2.2 财务困境预测
银行和企业的财务困境预测,一直是比较难以解决的问题,而深度学习的出现对此问题产生了一定的攻克。Lanbouri and Achchab(2015)将DBN与SVM混合,用于财务困境预测,取得了较高的准确率;Ronnqvist and Sarlin(2015)对文字信息进行提取,并根据语意向量表示银行压力,对阈值进行分类,识别银行的财务困境,更多类似研究如表5所示:
表 5 财务困境、破产、银行风险、组合风险与危机预测研究
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 966家法国公司 - 财务比率 RBM+SVM 精确率、召回率 -
2 883家来自EDGAR的银行持股公司 2006-2017 代币、加权情感极性、杠杆率和ROA CNN、LSTM、SVM、RF 准确率、精确率、召回率、F1分数 Keras、Python、Scikitlearn
3 大型欧洲银行的事件数据集、路透社的新闻文章 2007-2014 单词与句子 DNN+NLP预处理 相对实用性、F1分数 -
4 欧洲银行的事件数据集、路透社的新闻 2007-2014 文本与句子 句子向量+DFFN 实用性、F1分数、AUROC -
5 路透社的新闻、财务数据 2007-2014 财务指标和新闻文本 doc2vec+NN 相对实用性 Doc2vec
6 宏微观经济变量、来自银行持股公司的银行特征/绩效变量 1976-2017 宏观经济变量和银行绩效 CGAN、MVN、MV-t、LSTM、VAR、FE-QAR RMSE、对数似然值、贷款损失率 -
7 法国公司的财务报表 2002-2006 财务比率 DBN 召回率、精确率、F1分数、FP、FN -
8 来自证券价格研究中心的美国上市公司股票回报 2001-2011 价格数据 DBN 准确率 Python、Theano
9 几个来自日本股票市场的公司财务报表 2002-2016 财务比率 CNN F1分数、AUROC -
10 包含当地和全国经济因素的投资组合数据集 1995-2014 与特征有关的投资组合 ANN 负对数似然值 AWS
11 来自挪威金融集团的投资组合数据、挪威银行 2012-2016 个人财务变量 CNN 准确率、敏感性、特异性、AUROC -
12 私人经纪公司的真实风险交易数据 - 订单详情等250个特征 CNN、LSTM F1分数 Keras、Tensorflow
13 由几个数据集拼合而成 1996-2017 指数数据、10年期债券收益率、汇率 Logit、CART、RF、SVM、NN、XGBoost、DNN AUROC、KS、G-mean值、似然比率、DP、BA、WBA R
注:
1.特征集:ROA(Return on Assets):总资产回报率
2.算法:NLP(Natural Language Processing):自然语言处理;DFNN(Deep Feedforward Neural Network):深层前馈网络;NN(Neural Network):神经网络;CGAN(Conditional GAN):有条件的GAN;GAN(Generative Adversarial Networks):生成式对抗网络;MVN(Multivariate Normal Distribution):多元高斯分布;MV-t(Multivariate t Distribution):多元t分布;VAR(Vector Auto Regression):向量自相关;FE-QAR(Fixed Effects Quantile VAR):基于VAR的固定效应分位数回归;CART(Classification and Regression Trees):分类树和回归树;XGBoost(eXtreme Grandient Boosting):XGBoost算法
3.性能指标:KS(Kolmogorov-Smirnov):KS检验形成的指标;DP(Discriminant Power):判别力;BA(Balanced Accuracy):平衡精度;WBA(Weighted Balanced Accuracy):加权平衡精度
3.欺诈预测(Fraud Detection)
随着金融中介规模的不断扩大,金融欺诈如今成为各国政府和当局拼命寻求解决办法的领域之一。信用卡诈骗、洗钱、消费信贷诈骗、偷税漏税、银行诈骗等金融诈骗案件层出不穷。这类研究大多是异常检测,通常划分为分类问题。Roy et al.(2018)使用LSTM模型进行信用卡欺诈检测,Wang et al.(2018)利用LSTM从信用卡交易序列中检测出信用卡诈骗,并用精度与其他算法进行了比较,研究如表6所示:
表 6 反欺诈研究
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 印度尼西亚一家当地银行的借机卡交易记录 2016-2017 在若干时间段中的交易量 CNN、叠加LSTM、CNN-LSTM AUROC -
2 来自零售银行的信用卡交易 2017 交易变量和几个衍生特征 LSTM、GRU 准确率 Keras
3 银行卡的消费记录 2014-2015 每个国家目前/起始的欺诈概率、其他欺诈相关特征 ANN AUROC -
4 欧洲持卡人的信用卡交易记录 2013 对个人财务变量进行PCA ANN、RF 召回率、精确率、准确率 -
5 信用卡交易记录 2015 交易特征与银行特征 LSTM AUROC Keras、Scikitlearn
6 巴西联邦税收秘书处对外贸易数据库 2014 出口贸易、税、交易、员工、发票等8个特征 AE MSE H2O、R
7 众议院公开数据、来自巴西联邦税收秘书处的公司数据 2009-2017 巴西国家开支、当事人、支出类别等21个特征 深度自编码器 MSE、RMSE H2O、R
8 被标记为骗保的汽车保险公司真实数据 - 汽车、保险和事故相关特征 DNN+LDA TP、FP、准确率、精确率、F1分数 -
9 来自一个巨大的在线支付平台的交易记录 2006 个人财务变量 GBDT+DNN AUROC -
10 金融交易 - 交易数据 LSTM t-SNE -
11 来自希腊公司的实验数据 - - DQL 收入 Torch
注:
1.算法:LDA(Latent Dirichlet Allocation):文本主题模型;GBDT(Gradient-Boosted-Decision Trees):梯度下降树;DQL(Deep Q-Learning):深度Q学习
2.性能指标:t-SNE(t-distributed stochastic neighbor embedding):t-
.分布领域嵌入算法
4.投资组合管理(Portfolio Management)
投资组合管理通常指在预先确定的时期内,构建一个投资组合选择各种资产的过程。主要关注以下领域:投资组合优化、投资组合选择、投资组合配置。投资组合管理实质上是一个优化的过程,许多模型应运而生。Takeuchi et al.(2013)根据预期收益将股票分成低动量与高动量两组,使用了深度RBM网络,获得了较高的收益。除此之外,深度强化学习(DRL)被选为主要的深度学习模型,被广泛运用,文献综述如表7所示:
表 7 投资组合管理研究
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 加密货币、比特币 2014-2017 价格数据 CNN、RNN、LSTM 累计投资组合价值、MDD、SR -
2 来自纽交所、美交所、纳斯达克交易所的股票 1965-2009 价格数据 自动编码器+RBM 准确率、混淆矩阵 -
3 20只标普500中的股票 2012-2015 技术指标 MLP 准确率 Python、Scikitlearn、Keras、Theano
4 中国股票数据 2012-2013 技术指标与基本指标 逻辑回归、RF、DNN AUC、准确率、精确率、召回率、真正例率、反正例率 Keras、Tensorflow、Python、Scikitlearn
5 标普500中最大的5个公司 - 价格数据与财务比率 LSTM、自动编码器、智能索引 CAGR -
6 纳斯达克生物科技交易所基金 2012-2016 价格数据 自动编码器、校准验证 回报 -
7 台湾股票市场 - 价格数据 Elman神经网络、RNN MSE、回报 -
8 外汇(EUR/USD)、黄金 2013 价格数据 RNN 回报 Python
9 纽交所、美交所、纳斯达克交易所的股票日内交易数据 1993-2017 价格、15种公司特征 LSTM+MLP 月回报、SR Python、Keras、Tensorflow in AWS
10 标普500 1985-2006 月度和日度的对数回报 DBN+MLP 检验误差 Theano、Python、Matlab
11 10只标普500中的股票 1997-2016 OCHLV、价格数据 RNN、LSTM、GRU 准确率、月回报 Keras、Tensorflow
12 东京和大阪证券交易所的分析报告 2016-2018 文本 LSTM、CNN、Bi-LSTM 准确率、R2 R、Python、Matlab
13 中国/美国股票市场中的股票 2015-2018 OCHLV、基本面数据 DDPG、PPO SR、MDD Keras、Python、MeCab
14 对冲基金月度回报数据 1996-2015 回报、SR、STD、偏度、风度、欧米茄比率、基金中的alpha DNN 夏普比率、年回报、累计回报 -
15 12种交易量最大的加密货币 2015-2016 价格数据 CNN+RL SR、投资组合价值、MDD -
注:
1.算法:Bi-LSTM(Bidirectional LSTM):双向LSTM ;DDPG(Deep Deterministic Policy Gradient):深度确定性策略梯度;PPO(Proximal Policy Optimization):深度增强学习
2.性能指标:AUC(Area Under the Curve):曲线下方面积;CAGR(Compound Annual Growth Rate):复合增长率
5.资产定价与衍生品市场(Asset Pricing and Derivatives Market)
资产的准确定价与估值问题是金融学的一个研究领域。机器学习在银行、企业、房地产、衍生品产品中的运用很广泛,但深度学习还没有广泛应用到该领域。深度学习模型可能在这个领域发光发热,但目前研究仅有少数几项,如表8所示:
表 8 资产定价与衍生品市场研究
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 东京和大阪证券交易所的分析报告 2016-2018 文本 LSTM、CNN、Bi-LSTM 准确率、R2 R、Python、MeCab
2 模拟一系列看涨期权价格 - 价格信息、执行价格、期限、股利、无风险利率、波动性 DNN RMSE、平均定价误差百分比 Tensorflow
3 台湾指数(TAIEX) 2017 OCHLV、基本面分析、期权价格 MLP、使用斯科尔斯期权定价模型的MLP RMSE、MAE、MAPE -
4 纽交所、美交所和纳斯达克交易所的回报 1975-2017 57个公司特征 Fama-French n因子模型 R2、RMSE Tensorflow
加密货币和区块链研究(Cryptocurrency and Blockchain Studies)
加密货币在过去几年一直被人们津津乐道,因为它们可以在短时间内完成难以置信的价格涨跌,而区块链作为一个分布式的账本系统,很好地适应了加密货币,两者高度耦合。学者们使用深度学习模型,对加密货币算法交易模型与价格预测做出了尝试:Lopes et al.(2018)将市场与加密货币交易的价格预测相结合,使用CNN和LSTM进行文本挖掘,并以OCHLV的价格、技术指标和情绪分析作为特征集,类似研究如表9所示:
表 9 加密货币和区块链研究
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 比特币、达世币、瑞波币、门罗币、狗币、未来币、域名币 2014-2017 MA、BOLL、CRIX日回报、欧洲银行同业拆借利率、EURO/UK、EURO/USD和US/JPY的OCHLV LSTM、RNN、MLP 准确率、F1分数 Python、Tensorflow
2 加密货币、比特币 2014-2017 价格数据 CNN 累计投资组合价值、MDD、SR -
3 12种交易量最大的比特币 2015-2016 价格数据 CNN+RL SR、投资组合价值、MDD -
4 比特币数据 2010-2017 哈希值、比特币地址、公钥/私钥、数字签名 TS模糊模型、模糊认知图 层次分析法 -
5 比特币数据 2012,2013,2016 交易ID、买入/卖出地址、时间戳 启发式图嵌入算法、拉普拉斯映射、深度自编码器 F1分数 -
6 比特币、莱特币、推特 2015-2018 OCHLV、技术指标、敏感性分析 CNN、LSTM、状态频率模型 MSE Keras、Tensorflow
7 比特币 2013-2016 价格数据 贝叶斯优化后的RNN、LSTM 敏感性、特异性、精确率、准确率、RMSE Keras、Python、Hyperas
注:
1.特征集:MA(Moving Average):移动平均线;BOLL(Bollinger Band):布林线;CRIX(The Cryptocurrency Index):加密货币指数
7.财务情绪分析和行为金融学(Financial Sentiment Analysis and Behavioral Finance)
投资者情绪是行为金融学的一个重要组成成分。文本挖掘技术的崛起为社交媒体情绪的提取做出了良好的铺垫。学者们也对该领域较为感兴趣:Kearney et al.(2014)基于调查,使用文本数据对情绪进行了挖掘,此类研究数量较多且方向类似,如表10所示:
表 10 财务情绪的文本挖掘与预测
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 东京、大阪证券交易所的分析报告 2016-2018 文本 LSTM、CNN、Bi-LSTM 准确率、R2 R、Python、Mecab
2 新浪微博、证券市场记录 2012-2015 技术指标、句子 DRSE F1分数、精确率、召回率、准确率、AUROC Python
3 来自路透社和彭博的关于标普500股票的新闻 2006-2015 财经新闻、价格数据 DeepClue 准确率 Dynet software
4 路透社和彭博新闻,历史股票安全数据 2006-2013 新闻、价格数据 DNN 准确率 -
5 上证综合指数价格 2008-2015 变化率的OCHL、价格 情感分析+LSTM MSE -
6 上证综合指数价格 2013-2016 文本数据和价格数据 LSTM 准确率、F1分数 Python、Keras
7 谷歌、微软和苹果公司的股票 2016-2017 推特情感和股票价格 RNN - �ͳ�,����Spark、Flume、Twitter、API
8 30支道琼斯股票、标普500、道琼斯指数、路透社新闻 2002-2016 价格数据、新闻和文章的特征 LSTM、NN、CNN和word2vec 准确率 VADER
9 沪深300指数的股票及OCHLV 2009-2014 情感帖子、价格数据 朴素贝叶斯+LSTM 精确率、召回率、F1分数、准确率 Python、Keras
10 标普500、纽交所、道琼斯、纳斯达克交易所 2009-2011 推特情绪、指数数据 DNN、CNN 错误率 Keras、Theano
注:
1.算法:DRSE(Deep Random Subspace Ensembles):深度随机子空间集成
8.金融文本挖掘(Financial Text Mining)
随着社交媒体和实时媒体/推文的迅速传播,基于文本的即时信息检索成为金融模型开发的可用工具,因此,近几年来金融文本挖掘变得非常流行,有仅用于预测的,也有仅用作情绪分析的,同时存在其他类型。
8.1 以预测为目的
Huynh et al.(2017)利用路透社、彭博社的财经新闻和股价数据对未来的股价走势进行预测;Dang et al.(2018)利用Stock2Vec模型与两流GRU模型,从金融新闻和股票价格中生成输入数据,对股票价格进行分类,类似研究如表11所示:
表 11 以预测为目的,不含情感分析的文本挖掘研究
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 标普500中的能源部门/核心公司 2015-2016 文本和价格数据
回报、SR、精确率、召回率、准确率 Python、Tweepy API
2 来自路透社和彭博的新闻 2006-2013 财经新闻、价格数据 Bi-GRU 准确率 Python、Keras
3 来自新浪网的新闻、ACE2005中文标注语料库 2012-2016 一系列新闻文本 独特算法 精确率、召回率、F1分数 -
4 德国CDAX股票市场数据 2010-2013 财经新闻、股票市场价格 LSTM MSE、RMSE、MAE、准确率、AUC TensorFlow、Theano、Python、Scikit-Learn
5 来自路透社和彭博的苹果、空中客车公司、亚马逊新闻、标普500股票价格 2006-2013 价格数据、新闻、技术指标 TGRU、stock2vec 准确率、精确率、AUROC Keras、Python
6 标普500指数、15只标普500股票 2006-2013 路透社和彭博新闻 CNN 准确率、MCC -
7 来自路透社的标普500指数新闻 2006-2013 财经新闻标题、技术指标 SI-RCNN(LSTM+CNN) 准确率 -
8 10只日经225成分股和新闻 2001-2008 文本信息和股票价格 段落向量+LSTM 利润 -
9 印度NIFTY50指数、银行/汽车/互联网/能源行业指数、新闻 2013--2017 指数数据、新闻 LSTM MCC、准确率 -
10 价格数据、指数数据、新闻、社会媒体数据 2015 价格数据、来自文章和社交媒体的新闻 耦合矩阵和张量 准确率、MCC Jieba
11 沪深300 2015-2017 社交媒体新闻、价格数据 文档生成模型与RNN-Boost 准确率、MAE、MAPE、RMSE Python、Scikitlearn
12 新闻和中国股票数据 2014-2017 新闻中的选词 HAN 准确率、年回报 -
13 新闻,来自港交所的价格数据 2001 价格数据和来自新闻的TF-IDF ELM、DLR、PCA、BELM、KELM、NN 准确率 Matlab
14 台湾TWSE指数、4只TWSE成分股 2001-2017 技术指标、价格数据、新闻 CNN+LSTM RMSE、利润 Keras、Python、TALIB
15 Tsugami公司的股票 2013 价格数据 LSTM RMSE Keras、Tensorflow
16 新闻、Nikkei股票的均值、10个Nikkei成分公司 1999-2008 新闻、MACD RNN、RBM+DBN 准确率、P值 -
17 ISMIS2017矿业竞争比赛数据 - 专项标示符、分类 LSTM+GRU+FFNN 准确率 -
18 路透社和彭博新闻、标普500指数价格 2006-2013 新闻和句子 LSTM 准确率 -
19 标普500、来自路透社的新闻 2011-2017 输入新闻、OCHLV、技术指标 CNN+LSTM、CNN+SVM 准确率、F1分数 Tensorflow
20 日经225指数、标普500指数、来自路透社和彭博的新闻 2001-2013 股票价格数据和新闻 DGM 准确率、MCC、利润率 -
21 标普500成分股 2006-2013 文本(新闻)和价格数据 LAR+新闻、RF+新闻 MAPE、RMSE -
注:
1.特征集:TF-IDF(Term Frequency-Inverse Document Frequency):词频-逆文档频率
2.算法:Bi-GRU(Bidirectional GRU):双向门控循环单元 ;TGRU(Two-stream GRU):双流门控循环单元;HAN(Hybrid Attention Network):混合注意力网络;ELM(Extreme Learning Machine):极限学习机;DLR(Deep Learning Representation):深度表征学习;PCA(Principal Component Analysis):层次分析法;BELM(Basic Extreme Learning Machine):基础极限学习机;KELM(Kernel Extreme Learning Machine):核极限学习机;LAR(Linear Auto-regression Predictor):线性自回归预测;
3.性能指标:MCC(Matthew Correlation Coefficient):马修斯相关系数
8.2 以情感分析为目的
Yoshihara et al.(2014)提出了一种新的方法,将RBM、DBN和词嵌入相结合,为RNN-RBM-DBN网络创建词向量预测股票价格;Cristo et al.(2015)将股票价格和词嵌入都用于股票价格预测,取得了较好的效果,相关研究如表12所示:
表 12 金融情绪研究与不含预测的文本挖掘
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 883家来自EDGAR的银行持股公司 2006-2017 代币、加权情感极性、杠杆率和ROA、 CNN、LSTM、SVM、随机森林 准确率、精确率、召回率、F1分数 Keras、Python、Scikitlearn
2 2017年SemEval数据集、金融文本、新闻、股票市场数据 2017 博客中的情感、新闻标题 集成SVR、CNN、LSTM、GRU 余弦相似度、等级得分、赞同得分 Python、Keras、Scikitlearn
3 来自路透社的金融新闻 2006-2015 词向量、词汇与语境输入 Tree-LSTM 累计超额收益率(CAR) -
4 来自推特的股票情感分析 2015 Stock-Twits中的信息 LSTM、Doc2Vec、CNN 准确率、精确率、召回率、f得分、AUC -
5 新浪微博、股票市场记录 2012-2015 技术指标、句子 DRSE F1得分、精确率、召回率、准确率、AUROC Python
6 来自今日新闻网、苹果日报、自由时报、理财网的关于18只股票的新闻 2013-2014 文本、情感 - 回报 Python、Tensorflow
7 推特 2008-2016 句子、Stock-Twits中的信息 CNN、LSTM、GRU MCC、WSURT Keras、Tensorflow
8 日本公司的财务报表 - 句子、文本 DNN 精确率、召回率、F得分 -
9 推特文章、新闻标题 - 句子、文本 Deep-FASP 准确率、MSE、R2 -
10 论坛数据 2004-2013 句子和关键词 递归神经网络 精确率、召回率、F得分 -
11 金融时报中与美国股票相关的新闻 - 新闻标题中的情绪 SVR、双向LSTM 余弦相似度 Python、Scikitlearn、Keras、Tensorflow
注:
1.性能指标:WSURT(Wilcoxon Sum-rank Test):Wlicoxon和秩检验
8.3 其他文本挖掘研究
文本挖掘研究还可以用作许多其他领域,如Wang et al.(2018)利用文本挖掘和DNN模型对汽车保险诈骗进行检测,Sarlin et al.(2015)通过提取新闻语义,确定银行压力,并将其与相关事件进行分类,更多研究如表13所示:
表 13 其他文本挖掘研究
编号 数据集 时间段 特征集 算法 性能指标 运行环境
1 来自今日新闻网、苹果日报、自由时报、理财网的关于18只股票的新闻 2013-2014 文本、情感 - 回报 Python、Tensorflow
2 大型欧洲银行的事件数据集、路透社的新闻文章 2007-2014 单词与句子 DNN+NLP预处理 相对实用性、F1分数 -
3 欧洲银行的事件数据集、路透社的新闻 2007-2014 文本与句子 句子向量+DFFN 实用性、F1分数、AUROC -
4 路透社的新闻、财务数据 2007-2014 财务指标和新闻文本 doc2vec+NN 相对实用性 Doc2vec
5 被标记为骗保的汽车保险公司真实数据 - 汽车、保险和事故相关特征 DNN+LDA TP、FP、准确率、精确率、F1分数 -
6 金融交易 - 交易数据 LSTM t-SNE -
7 台湾居民养老保险 2008-2014 保险人ID、地区编码、性别等 RNN 准确率、所有误差 Python
8 Stock-Twits 2015-2016 句子、Stock-Twits信息 Doc2vec、CNN 准确率、精确率、召回率、f得分、AUC Python、Tensorflow
理论与概念研究
除了上述对于算法的实际运用外,还有一些论文对模型的理论概念进行了关注,并具有其独特的价值,如表14所示:
表 14 其他理论与概念研究
编号 主题 数据集 时间段 特征集 算法 性能指标 运行环境
1 AE、SVD的分析 纳斯达克生物科技交易所基金指数的成分股、安进股份中的股票 2012-2014 价格数据 AE、SVD - -
2 银行中的反欺诈 风险管理/反欺诈 - - DRL - -
注:
1.算法:SVD(Singluar Value Decomposition):奇异值分解
10.其他金融应用领域
此外,还有一些研究与上述领域没有包含关系,但同样具有较大的意义,这些研究包括社会保险支付分类、银行电话营销成功率预测、逃税与洗钱检测等,具体描述如表15所示:
表 15 其他金融应用
编号 主题 数据集 时间段 特征集 算法 性能指标 运行环境
1 促进成交决策 标普500、韩国KOSPI指数、恒生指数和欧洲斯托克50指数 1987-2017 200天股票价格 深度Q-Learning、DNN 总利润、相关性 -
2 确定地下经济的最大交易者 论坛数据 2004-2013 句子和关键词 递归神经网络 精确率、召回率、F得分 -
3 预测支付习惯 台湾居民养老保险 2008-2014 保险人ID、地区编码、性别等 RNN 准确率、所有误差 Python
4 加速 45个芝商所的上市产品和外汇期货 1991-2014 价格数据 DNN - -
5 基础预测 纽交所、纳斯达克交易所或美交所的股票 1970-2017 来自资金平衡表的16个基本指标 MLP、LFM MSE、年收益、SR -
6 预测银行的电话销售 银行市场数据中的电话记录 2008-2010 16个金融相关变量 CNN 准确率 -
7 公司绩效预测 22家美国股票市场中的药物公司 2000-2015 11个经济变量、4个其他变量 RBM、DBN RMSE、利润 -
注:
1.算法:LFM(Lookahead Factor Models):前瞻因素模型
金融领域深度学习应用的现状
本文回顾了144篇来自不同金融应用领域的论文。每篇论文根据其主题、类型、方法、数据集、特征集和性能指标进行分析,下面我们将提供当前金融+深度学习的摘要统计信息。
如上图所示,我们将相关领域研究中的各种主题聚集到一起,快速浏览图片后可以发现:在美国,金融文本挖掘和算法交易是研究人员研究最多的两个领域,风险评估、情感分析、投资组合管理和欺诈检测则紧随其后。与此同时,该领域的研究成果大多来自于近三年,汇总图片如下所示,这表明了该领域的时效性与活跃性。值得一提的是,2013年的所有研究都是用了RNN模型。
当我们对模型进行分组汇总时,结果如下图所示。我们观察到,不管是所有年份还是近三年,RNN一直是深度学习中的主流算法,而DMLP和CNN算法也具有自己独到的优势。
我们通过词云图(Wordcloud)对最常用的模型实现框架与运行环境进行了汇总,并使用扇形图对所占百分比进行了详细解读,结果如下图所示。我们可以从左侧扇形图中得知,Python占了所有运行环境中的80%,R则占了10%,其他10%分配给其他各语言;右侧扇形图表示开发人员使用Python实现深度学习时使用的库和框架,Keras、Tensorflow目前在各类库中占据优势地位。
顶级期刊列表如下图所示,近3年发表论文最多的期刊包括:Expert Systems with Applications、Decision Support Systems、Applied Soft Computing、Neurocomputing、Knowledge-based Systems和European Journal of Operational Research.
此外,目前来看,DMLP一般适用于分类问题,是目前金融领域对于分类问题的首选,但由于它是MLP的拓展,所以它的历史比其他深度学习模型更长。而CNN最近开始受到更广泛的关注,且近三年的应用突飞猛进,其在未来可能会超越其他模型。
一些对于现状的思考
对于模型的讨论
LSTM模型目前在金融时间序列数据预测方面,是大多数研究人员首选的深度学习模型。这是由于金融的数据大多具有时变性,这非常适合LSTM系列的算法,因为它们具有很好的适应性。与此同时,在过去的两年里,CNN系列模型受到研究人员的更多青睐。与LSTM不同,CNN对于分类问题的解决能力较强,适合静态数据或非时变数据,这在金融领域的应用并不是非常合适。但一些研究人员发现,一维时变金融数据可以金融创新变换,将其转换为二维,静态的类图像数据,并使用CNN解决问题。这在复杂的财务模式中非常有效,而未来的走向需要时间给我们答案。
另一个关注度逐渐走高的模型是DRL系列,特别是与其他算法结合时,效果较好,但复杂模型的解释能力需要进行考虑。
与此同时,由于目前DL库处于开源状态,框架也在不断完善,其在金融领域的新型应用并不是难事。值得注意的是,DL相对于ML性能较高,性能评价结果也较好,这些改进中受益最大的是算法交易模型和文本挖掘研究,在每年增加的论文中我们可以找到相关依据。
2.对于应用领域的讨论
在所有已应用的领域中,价格预测和算法交易模型受到更广泛的关注。而作为已在机器学习领域尝到甜头的风险评估和投资组合管理,在深度学习中表现也不错。
在金融文本领域逐渐扩大的今天,金融新闻、博客等媒体的流行为金融界开辟了一个全新的世界,对于文字信息的解读,可以更好地提高性能,已有很多研究人员在这个方向不断进行尝试,提高模型的精度。
另一个深度学习中的热点领域是加密货币和区块链,两者通常一起使用。加密货币价格是最具吸引力的细分领域,而更多的细分领域正在进行探索。
3,待解决的问题和未来的工作
目前,虽然深度学习已为金融领域注入了新的活力,但仍有问题需要解决。我们将通过对现状的梳理,从模型开发和研究主题的观点提出对现存问题的见解:
3.1模型开发角度:
CNN作为新兴算法,在各个金融领域具有适应性,它为很多问题的解决提供了机会;图卷积网络(Graph-CNN)与CNN密切相关但具有差异,它并没有被广泛运用,这一算法仍有发展的空间。
最近开发的深度学习模型,如GAN、胶囊网络等,为现有的实现提供可行的替代方案。它们逐渐出现在各种非金融研究中,这是一种比较好的态势。
由于金融文本挖掘正在迅速发展,可以对Stock2Vec等新的数据模型进行增强,以获得更好的模型。此外,基于NLP的集成模型或许可以与图像相结合,提高现有模型的准确性。
- 混合模型比独立模型更受欢迎,且这个趋势很可能持续下去。研究人员需要引入更多通用的或非常规的模型来获得更好的结果,可能是研究人员找寻正“alpha”的一个有效手段。
3.2 应用领域角度:
算法交易、投资组合管理、风险评估可能会继续在金融研究领域占据主导地位。与此同时,一些新兴领域开始得到更广泛的关注,这对金融界的影响值得思考与关注。
加密货币和区块链技术具有可能性。它为研究人员提供了一个很好的机会,可以塑造未来的新金融世界,充满着创新的希望。
投资组合管理也是一个新的受益领域。机器人咨询系统在世界范围应用越来越多,这些系统依赖于高性能的自动决策系统,而深度学习模型很适合此类工作。我们有理由相信,深度学习对于此领域的运用是未来可期的。
在衍生品市场,深度学习的应用并不够。衍生金融产品具有极强的灵活性,对计算的性能要求极高,深度学习可以进行更多的尝试。其中,期权策略优化、期货交易、期权定价、套利交易等都可以从深度学习中受益。
情感分析、文本挖掘、风险资产定价可能是未来的发展方向,它们已受到研究人员的关注,但仍未充分利用。
- 高频交易领域由于需要进行快速的运算,仍未从机器学习领域得到有效的提高。而深度学习可以研究更多硬件方面,为高频交易助力。
3.3 对未来研究的建议
把握区块链和加密货币领域,目前来看是具有必要的
- 注意文本挖掘、金融情绪分析与行为金融学的耦合,其中隐藏着大量的机会。行为金融学的研究并未使用深度学习,这可能是由于难以量化行为金融学的投入与产出。但随着文本挖掘、NLP的不断完善,未来可以进行尝试。
对引言中提出问题的回复:
通过上述分析,我们对引言提出的问题有了更深刻的理解,Q&A如下所示:
Q: 深度学习(DL)在金融领域的应用包括哪些?
A: 金融文本挖掘、算法交易、风险评估、情感分析、投资组合管理和欺诈交易是其中最受关注的领域。
Q: 目前在各领域的研究进度如何?
A:虽然深度学习模型已经在几乎所有领域取得了比传统模型更好地成绩,但仍然具有很好的发展前景,研究人员们的热情高涨。
Q: 还有哪些有潜力的应用领域?
A:加密货币、区块链、行为金融、高频交易和衍生品市场。
Q: 哪一种深度学习(DL)模型更被青睐?
A:RNN模型系列(特别是LSTM)目前发展较好,CNN和DMLP也被广泛使用。其中LSTM更适合时间序列预测,DMLP和CNN更适合分类问题的解决。
Q: 深度学习(DL)与机器学习(ML)相比,哪一个更适合用作研究?
A:在大多数研究中,DL模型比ML模型表现更好。但在一些特定情况下,ML具有更好的解决办法。总的来说,DL比较优质。
Q: 深度学习(DL)的未来方向是什么?
A:在不久的将来,NLP、空间数据、语义和基于文本挖掘的混合模型可能会逐渐变得重要。
结论
金融行业和学术界已经开始意识到,深度学习模型在各个领域具有极高的潜力。研究的数量正在逐年加速增长,而此时,正是高速发展的时代,越来越多的研究会被逐渐落实,新的模式会不断涌入。在这篇文章中,我们不仅提供了目前研究现状的细分领域介绍,并试图为未来的研究人员确定方向。这一领域具有难以置信的机遇,并且这些机遇不会很快消失。我希望这篇文章是一个很好的契机,鼓励对该领域感兴趣的研究人员继续探索,将深度学习进行更深度的挖掘。
长按以上二维码可以阅读Deep Learning for Financial Applications : A Survey原文
关于一些计量方法的合辑,各位学者可以参看如下文章:①“实证研究中用到的200篇文章, 社科学者常备toolkit”、②实证文章写作常用到的50篇名家经验帖, 学者必读系列、③过去10年AER上关于中国主题的Articles专辑、④AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向,⑤2020年中文Top期刊重点选题方向, 写论文就写这些,⑥过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图。后面,咱们又引荐了①使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑!,②这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授,③Python, Stata, R软件史上最全快捷键合辑!,④关于(模糊)断点回归设计的100篇精选Articles专辑!,⑤关于双重差分法DID的32篇精选Articles专辑!,⑥关于合成控制法SCM的33篇精选Articles专辑!⑦最近80篇关于中国国际贸易领域papers合辑!,⑧最近70篇关于中国环境生态的经济学papers合辑!⑨使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑!⑩最近50篇使用系统GMM开展实证研究的papers合辑!
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
2.5年,计量经济圈近1000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle