数量化专题之八:风格中性多因子有效性测试之质量因子
市场有风险,投资需谨慎 请务必阅读正文之后的免责条款部分 证券研究报告:金融工程 2018 年 10 月 17 日 近期研报 风格中性多因子选股策略初探——数量化专题之一 风格中性多因子之因子数据预处理——数量化专题之二 风格中性多因子有效性测试之估值因子——数量化专题之三 风格中性多因子有效性测试之情绪因子——数量化专题之四 研发部 首席分析师:程毅敏 SAC 执业证书编号:S1340511010001 联系电话:010-67017788 Email:chengyimin@cnpsec.com风格中性多因子有效性测试之质量因子——数量化专题之八 前言: 多因子选股策略作为量化投资领域的经典模型,在海内外各投资机构均受到广泛的研究以及实践应用。就大陆而言,自从2010年沪深300股指期货上线以来,以多因子选股为代表的阿尔法对冲策略也逐渐走进大众的视野。但是2014年12月以及2017年下半年,阿尔法对冲策略却遭受重大挫折,究其原因可以发现:组合带有过于明显的市值风格特征是导致策略表现不好的主要原因。 本系列报告基于对因子的研究,尝试研究因子权重、股票权重对策略风格特征的影响,希望找到在市值中性、行业中性、风格因子中性约束下的最优投资组合,以获得稳健的超额收益。 本报告介绍了单因子测试框架:分层回测、回归法、因子IC 值分析; 风险提示:单因子测试结果是历史经验的总结,存在失效的可能。 请务必阅读正文之后的免责条款部分 2 目录 一、引言 .................................................................................. 3 二、有效因子识别 .......................................................................... 4 二、单因子测试流程: ...................................................................... 6 请务必阅读正文之后的免责条款部分 3 一、引言 经典的多因子模型表达式为: 其中: :股票 j 在因子 k 上的因子暴露(因子载荷) :因子 k 的因子收益 :股票 j 的残差收益率 我们从统计的角度研究因子收益率变化规律,并且从组合的角度对因子暴露进行管理。 多因子模型一般有三种主要的形式: 1、 宏观经济因子模型:宏观经济因子模型使用可观察到的宏观经济数据序列,比如:通货膨胀、利率等指标,作为股票市场收益率变动的主要解释变量。宏观经济因子模型的主要思想是:股票市场和外边经济之间存在关联,并且试图利用外部经济指标对股票市场收益率进行刻画。 宏观经济因子模型在实际操作中遇到的主要问题时数据问题,假设一个包含10 个宏观经济因子和 1000 只股票的模型,如果每个月进行分析,需要进行1000 次回归。其次每个月的回归可能需要 60 个月的数据来估计 10 个宏观经济因子的载荷,这可能会导致严重的估计偏差,因为这些因子载荷并非静态,即使能够在统计意义下精确的描述过去,这些估计值也很难反映当前的情况。 2、 基本面子因子模型:基本面因子模型使用可观察到的股票自身的基本属性,比如:分红比例、估值水平、成长性、换手率等指标,作为股票市场收益率变动的主要解释变量。基本面因子主要进行横截面分析,确定股票收益率对因子的敏感性(Beta 值),基本面因子一般可以归纳为基本面类、估值类、市场类。 3、 统计因子模型:统计因子模型则从股票收益率的协方差矩阵中提取统计因子,作为股票市场收益率变动的主要解释变量,常见的统计分析方法有主成分分析(Principal Component Analysis)、最大似然分析(Maximum Likelihood Analysis)和预期最大化分析(Expectations Maximization Analysis)等。统计因子模型的主要缺点是因子自难有直观的含义,并且因子的估计过程很容易受到“伪相关性”影响。 Barra 对三种多因子模型都做过分析研究,发现:基本面多因子的模型要明显好于其他两类模型,现在对多因子的研究也主要集中于基本面多因子研究。 基本面多因子模型的最基本假设是:具有类似“属性”的股票,在市场是有相似的收益率。这些类似的属性可以是相同的行业、相似的交易属性(例如:交易价格、交易量、市值大小、波动率等)、相似财务属性(来自于三张财务报表的各种比例或者增长率等)、相似的估值属性(pb、pe、ps、pcf 等)。 请务必阅读正文之后的免责条款部分 4 多因子模型通过识别这些共同的基本面因子,并且估计收益率对这些因子的敏感性,得出股票或者组合的预期收益率,最后通过风险模型,根据投资者的收益——风险偏好挑选合适的股票并进行权重分配。 假设一个投资组合由 N 个股票组成,它们在组合中的权重分别为 hp1,hp2,…,hpN,则组合的收益率为: 其中: 对于一个包含 N 只股票和 K 个因子的系统,多因子模型本质上是将对 N 只股票的收益——风险预测转变成对于 K 个因子的收益——风险预测。 多因子模型会极大的降低预测工作量。 多因子模型的构建主要可以分为如下四个步骤: 1、 准备工作: 包含:数据采集、数据标准化、有效因子识别。 2、 收益模型 包含:大类因子分析、因子共线性分析、残差异方差分析、多元线性回归、估计因子预期收益以及计算股票预期收益。 3、 风险模型 包含:计算因子收益率协方差矩阵、残差风险估计。 4、 优化模型 包含:确定组合的收益目标、确定组合的风险目标、行业权重约束、因子暴露约束、个股上下限约束、二次规划求解组合权重分配以及模拟回溯。 本篇报告侧重在因子有效性测试方面。 二、有效因子识别 有效因子应该满足两个条件:第一,在逻辑上应该和收益率存在一定的相关性;第二,在实证中确实和收益率存在比较明显的相关性。 1、 单因子回归确定每个因子每期的因子收益 我们仅纳入行业因子,而将市场因子包含在行业因子中,针对因子 k,单因子的回归模型如下: 请务必阅读正文之后的免责条款部分 5 上式中,从左到右各项依次表示: :股票 j 在第 t 期的收益率; :股票 j 在第 t 期在行业 s 上的暴露,此项为一个 0-1 哑变量,即:如果股票 j 属于 s 行业,则暴露度为 1,否则为 0; :行业 s 在第 t 期的收益率(需回归拟合); :股票 j 在第 t 期在因子 k 上的暴露; :因子 k 在第 t 期的收益率(需回归拟合,在所有截面期上,我们对因子k 进行回归测试,能够得到该因子的因子收益率序列(即所有截面期回归系数构成的序列)和对应的 t 值序列)。 2、 因子收益率序列 t 检验 是因子𝑘在第𝑡期的因子收益,为确定因子𝑘在第𝑡期是否和股票收益率显著相关,即 是否显著不等于 0,我们需要对 进行𝑡检验 t:𝑥的𝑡统计量 𝑥 : 样本的均值 𝑢: 总体的均值 𝜎: 样本的标准差 𝑛: 样本的容量 对于𝑡检验,需要进行三个方面的分析: 1. 𝑡值绝对值
[中邮证券]:数量化专题之八:风格中性多因子有效性测试之质量因子,点击即可下载。报告格式为PDF,大小0.75M,页数14页,欢迎下载。