27

五个经验教训：机器学习应用量化策略的那些坑！

4 years ago

source link: http://mp.weixin.qq.com/s?__biz=MzAxNTc0Mjg0Mg%3D%3D&%3Bmid=2653297668&%3Bidx=1&%3Bsn=70e83c404a310e0c3213f916d413cc3b
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

Vj6R3qb.jpg!web

标星★ 置顶 公众号 爱你们 ♥

作者：IAN J. HISSEY 编译：方的馒头

1

前言

2quyyu2.png!web

2

在量化研究中引入机器学习

7nyAjuf.png!web

UZNzIfV.png!web

3

自动化机器学习

NZ32mq3.png!web

I3eAJfY.png!web

ANVzIn2.png!web

4

建立和测试模型

为了表明机器学习可用于增强传统的量化因子，我们建立了中国A股的股票预测模型。我们为2012年12月至2019年8月编制了中证800指数的股票表现和各种因子数据的月度概况。我们将目标变量设置为股票的未来一个月收益，并使用原始投资组合模型中的因子。

B7b6JvZ.png!web

ayMZriF.png!web

EnIremY.png!web

5

不要混淆样本内和样本外

zAR7Nbb.png!web

BfaAbym.png!web

6

屏蔽噪音并一次建模

与机器学习的典型用例（如预测同店销售额或个人银行贷款违约的可能性）不同，股票收益数据是嘈杂的。众所周知，时间序列金融数据受复杂行为困扰，包括异方差性、黑天鹅和尾部相关性。在我们的案例中，我们并不试图预测市场收益，而只是预测要投资的股票。为了最大程度地减少这些现象的影响，我们可以仅关注基准相对或同级相对表现，以将噪声降至最低。

7

简化问题陈述以产生更好的模型

I3eIZnM.png!web

NFjau2J.png!web

8

解释你的模型与构建模型一样重要

3iau63E.png!web

qam22me.png!web

此图表解释了特征与预测的关系。这些可以是并且通常是非线性的。就价值而言，公司的风险敞口越高，我们模型中的预测就越高。

VVfQrqf.png!web

然后，我们可以从理论到实践的理解，并研究该策略的交易方式。下图显示了该模型推荐的公司的SWS行业。Y轴在1到5的范围内显示一个行业的相对重要性，其中1表示最高，气泡的大小表示观测的频率。我们的模型在收购电子行业的公司时避免了金融和公用事业。

77JbyuZ.png!web

然后，我们根据之前强调的国有企业标志将预测分为两组。通过分析各组股票收益的相关性，我们发现该模型根据公司是否为国有企业给出了截然不同的建议。对于国有企业，我们的模型更倾向于价值股票，而对于民营企业，我们的模型倾向于对成长型公司进行更多投资。

fMnqUfm.png!web

9

尝试多种方法并快速失败

IzmINnE.png!web

fq6zQvi.png!web

10

结论

2020年第 66 篇文章

量化投资与机器学习微信公众号，是业内垂直于 Quant、MFE、 Fintech、AI、ML 等领域的 量化类主流自媒体。 公众号拥有来自 公募、私募、券商、期货、银行、保险资管、海外 等众多圈内 18W+ 关注者。每日发布行业前沿研究成果和最新量化资讯。

你点的每个“在看”，都是对我们最大的鼓励

Recommend

About Joyk

Aggregate valuable and interesting links.
Joyk means Joy of geeK