多因子选股模型是如何赚钱的?

广州量量资产管理有限公司   2017-08-04 本文章182阅读

一千个读者眼里有一千个哈姆雷特。其实,每个投资者脑中都有一个多因子量化模型。信奉价值投资的基金经理会选择估值低、基本面较好的股票,也许还会考虑过去一段时间的涨跌幅,这就涉及了至少3个因子;个人投资者也是一样。


多因子量化投资就是将上述人脑决策的过程写成程序,不同之处则是大脑考虑不了10个以上的因子,而模型可以考虑100个甚至更多的候选因子。




多因子选股模型的起源


在多因子选股模型出现之前,广泛被市场接受的是Sharp(1964),Lintner(1965)和Black(1972)年提出的资本资产定价模型(CAPM)。


主流观点认为,股票的收益只与整个股票市场的系统风险存在线性关系。即R=Rf+β(Rm-Rf)。但是,后来许多学者发现股票的收益还与许多其他因素相关,如市盈率、账面市值比等,其中最为著名的是Fama-French的三因子模型,由此开启了多因子选股的时代。


在最早的Fama和French的三因子模型中,将市场资产组合、市值因子和账面市值比因子纳入模型中,三因子虽然突破了原CAPM的框架,但依旧有如短期反转、中期动量等较多变量未被解释。


于是,多因子选股模型呼之欲出。


多因子选股模型


是指采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。多因子模型的关键是找到因子与收益率之间的关联性,而“因子”就是这个投资方法考虑的因素。其核心思想在于,市场虽然是动态的、轮动的,但是总会有一些因子在一段时间内发挥作用。在实践中,由于每一个分析师对于市场的动态、因子的理解都有所不同,所以会构建出不同的多因子模型。可以说多因子模型是三因子模型的拓展。


举个栗子,一批运动员参加马拉松比赛,如果我们想知道哪些选手最终可能会取得比较好的名次,理论上我们可以在开跑前对他们做一个身体测试,测一下他们的肺活量、最大摄氧量等指标,并对测试的结果进行排名,排名靠前的选手获得好名次的可能性就比较大。多因子模型的原理与此类似,可以利用某些指标(因子)选择未来可能表现较好的股票。


多因子模型的判断方法


一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。


1、打分法


打分法是根据各因子的大小对股票进行打分,按照一定的权重加权得到一个总分,再根据总分筛选股票。


打分法的优点是相对比较稳健,不容易受到极端值的影响。但打分法主观性较强,需要人为设定各个因子的权重,这也是比较困难和关键的地方。


2、回归法


回归法就是用过去股票的收益率对多因子进行回归,得到一个回归方程,然后把最新的因子值代入回归方程得到一个对未来股票收益的预判,并依此进行选股。


回归法的优点是能够比较及时地调整股票对各因子的敏感性,而且不同的股票对不同的因子的敏感性也可以不同。回归法的缺点在于很难找到一个精确拟合的回归方程,存在很大的模型误差,所以实战中用处不广。


多因子模型的建立


多因子选股模型的建立一般分为五步,首先是选取候选因子、检验选股因子有效性、剔除冗余因子、建立综合评分模型和持续改进模型。

其中,选取候选因子主要依赖于经济逻辑和市场经验,主要因素包括PS,PE,PCF,营业收入增长率,净利润增长率,经营现金流增长率,ROE增长率,ROA增长率等。也包括一些技术面的因素,如动量、换手率、波动率等。


检验选股因子有效性是通过排序的方法检验候选因子的有效性。在模型形成期开始计算市场中每只交易股票的该因子大小,进行排序,并平均分为n个组合,一直持续到月末,以此每隔一段时间重复进行。具体的参数优选需要历史数据的检验。


剔除冗余因子的原理是不同的选股因子内在的驱动因素大致相同,所选出的组合在个股构成和收益方面有较高的一致性,因此需要剔除这些多余的因子,只保留同类中收益最好的一个因子。


建立综合评分模型是在剔除冗余因子后,对市场中正常交易的个股计算每个因子的最新得分按一定的权重求得所有因子的平均分。最后,根据模型分数对股票进行排序,根据需要选择排名靠前的股票。


此外,对于量化选股打分法还需要注意两个方面:一方面,多因子选股模型中有的因子会逐渐失效,而另一些新的因子可能被验证有效而加入到模型当中;


另一方面,一些因子可能在过去的市场环境下比较有效,而随着市场风格的改变,这些因子可能短期内失效。在这种情况下,对综合评分选股模型的使用过程中,需要对选用的因子、模型本身做持续的再评价和不断的改进以适应变化的市场环境。(来源:量化炒股Alpha狗)