现在我们再来考虑基础股票池的构建。最直接的方法是以forecast_adj_txt因子的分十层股票池第一层为基础股票池进行股票精选。当然考虑到forecast_adj_txt因子与其余两组因子的相关性并不算特别高,我们也可以考虑利用因子组合来构建基础股票池。这里我们给出两组示例,在不削减基础池收益的情况下扩充基础池股票数量。

从结果来看,两组基础股票池的年化收益均在22%~23%左右,每一期股票数量平均大约在200只左右,相对于中证500年化超额收益大约在13%左右,两组基础股票池供读者参考。

基础池示例1:forecast_adj_txt与sue_txt叠加

第一组尝试我们每月末以forecast_adj_txt的分十层的多头第一层叠加sue_txt分十层的多头第一层为基础股票池。基础股票池的收益特征及股票数量如下图表所示。

【华泰金工林晓明团队】人工智能57:文本FADT选股基础池示例2:forecast_adj_txt与forecast_adj叠加

第二组尝试我们每月末以forecast_adj_txt分十层的多头第一层叠加forecast_adj分十层的多头第一层为基础股票池。基础股票池的收益特征及股票数量如下图表所示。

基础池增强:FADT选股组合

本文的最后,我们基于基础股票池继续构建增强组合,这里我们直接以forecast_adj_txt的第一层为基础股票池。从基本面出发,我们认为ROE、营业收入、净利润、经营性现金流等维度是考察一只股票首先会关注的环节,应予以考虑;从技术面出发,我们发现反转、换手、尾盘成交占比等因子对基础池具有较好的区分度,也予以考虑;此外我们还考虑股票的市值风格。上述考虑的要素我们都以因子的形式体现,各要素具体选择的因子如下表所示。

每月末,我们使用上述因子进行等权合成,合成之前需要对因子进行行业市值中性化处理,同时对因子方向进行调整。根据合成得分,我们选择靠前的25只股票等权重持有,每月第一个交易日调仓,剔除停牌股票及调仓日涨跌停股票(不剔除ST股票),交易手续费取双边千分之三。回测结果如上图所示,该组合回测区间内年化收益44.13%,夏普比率1.48,平均年化双边换手约16倍。分年度业绩情况如下表所示。我们将该组合称为FADT选股组合。

组合分析

最后我们对组合的持仓分布、风格进行分析。从持仓分布来看,FADT选股组合在各板块分布较为均衡,整体科技、消费板块上的股票配置数量偏多,周期、金融等板块股票配置偏少。宽基指数上,整体覆盖度偏中小市值股票,中证1800股票池内的股票平均来看覆盖度只能占到约50%(中证1800成分股是指沪深300+中证500+中证1000)。实际上大市值股票由于市场关注度高,分析师覆盖透彻,可能更不容易频繁出现大幅度的盈利预测调整,而市场关注度低的股票则相反,因此FADT股票池更多覆盖中小市值股票也合理。

从FADT组合的Barra风格因子暴露程度来看,组合在市值风格上的负向暴露比较高,即偏小市值风格;在成长因子上长期为较明显的正向暴露,成长风格明显;在盈利因子上整体为正向暴露,说明FADT股票池注重成分股的盈利水平。

最后我们分析选股组合的单日交易策略容量。首先我们计算组合中每只股票的过去20个交易日日均成交额,该成交额的10%作为每只股票单日可买入的最大金额;再将组合内所有股票日均成交额的下侧1/4分位数乘以组合股票数量,即为组合单日可买入的最大金额。从结果来看,历史平均单日策略容量为1.5亿元左右,如果需要进一步提高策略容量,可以考虑多个交易日建仓,同时降低调仓频率。