策略深度:财务报表分析系列,机器学习在上市公司财务造假识别中的应用
本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。 证券研究报告·策略深度 机器学习在上市公司财务造假识别中的应用 ——财务报表分析系列 核心观点:财务造假会影响投资者的判断,从而给投资者带来巨大的损失。本文选取了 2001 至 2022 年间,证监会,上交所以及深交所发布的公告中搜集到发生财务造假的 A 股上市公司作为造假样本,共涉及 1503 家公司的 3959 份年报。从财务指标、公司基本情况和市场指标三个 维度 入手, 构建 了特征 变量 池。 使用了 Logistic 回归、XGBoost 和 MLP,3 种机器学习方法,构建上市公司财务造假识别模型。其中 XGBoost 回归结果最优,XGBoost 结果为准确率 76.43%,精确率18.12%,召回率 69.63%,特异性 76.93%。通过对特征重要度的分析可以发现,非标的审计意见、与财务费用相关的指标、与净利润相关的指标、预付款项等,在现实中如果要判断财务造假,可以从这些特征入手,观察它们是否出现异常。 财务造假数量增加,虚假记载是最主要的造假动机 2001 至 2022 年,涉及财务造假的公司达 1503 家。财务造假会影响投资者的判断,从而给投资者带来巨大的损失,也给中国资本市场的健康发展蒙上了阴影。财务造假数量呈现增长趋势,虽然近两年有所缓解,但对财务造假的甄别仍然值得关注。经统计,超过 90%的财务造假处罚类型均为虚假记载,因此可以围绕利润的形成过程,构建识别的特征。本文选取了 2001 至 2022 年间,证监会,上交所以及深交所发布的公告中搜集到发生财务造假的 A 股上市公司作为造假样本,共涉及 1503 家公司的 3959 份年报。为了保证模型的可回测性,选取控制样本为当年所有无造假的上市公司。对于连续年度造假的样本,将每一年都视为一个独立的造假样本。 根据财务指标、公司基本情况和市场指标,构建特征变量池,结合显著性检验筛选,使用多种机器学习算法构建预测模型 依据财务造假常见的手段,从财务指标、公司基本情况和市场指标三个维度入手,构建了特征变量池,结合显著性检验进一步筛选。本文使用了 Logistic 回归、XGBoost 和 MLP,3 种机器学习方法,构建上市公司财务造假识别模型。不同算法的原理不同,表现相近。结果表明,XGBoost 回归结果最优,XGBoost 结果为准确率 76.43%,精确率18.12%,召回率 69.63%,特异性 76.93%。 不同机器学习算法中特征重要度均较高的特征是财务造假识别的关键特征 通过对特征重要度的分析可以发现,在现实中如果要判断财务造假,可以从非标的审计意见、与财务费用相关的指标、与净利润相关的指标、预付款项等特征入手,观察它们是否出现异常。 风险提示:数据质量风险、机器学习模型风险、依赖风险 王程畅 wangchengchang@csc.com.cn SAC 执证编号:S1440520010001 发布日期: 2024 年 11 月 19 日 市场表现 相关研究报告 24.08.16 基于四大属性的黄金中长期择时策略 23.11.14 中国 VIX 指数估计及择时策略 23.08.28 基于机构调研问答文本的行业轮动策略 22.11.20 机构调研对行业轮动和选股的启示 22.08.10 基于低频拥挤度规避高景气行业下行风险 21.11.16 基于宏观数据的行业轮动策略 21.08.24 基于中微观基本面数据的行业轮动策略 -30%-20%-10%0%10%20%2023/11/162023/12/162024/1/162024/2/162024/3/162024/4/162024/5/162024/6/162024/7/162024/8/162024/9/162024/10/16万得全A投资策略研究 1 投 资策略研究 策略深度报告 请务必阅读正文之后的免责条款和声明 目录 一、财务造假样本筛选及特征分析 ......................................................................................................... 2 1.1、造假公司的样本整理 ............................................................................................................... 2 1.2、造假公司的行业与时间分布..................................................................................................... 2 1.3、造假的违规类型 ...................................................................................................................... 4 1.4、样本处理方式.......................................................................................................................... 5 二、财务造假特征的选择 ....................................................................................................................... 5 2.1、财务指标................................................................................................................................. 5 2.2、公司基本情况.......................................................................................................................... 6 2.3、市场指标................................................................................................................................. 7 2.4、指标处理.................................................................
[中信建投]:策略深度:财务报表分析系列,机器学习在上市公司财务造假识别中的应用,点击即可下载。报告格式为PDF,大小3.16M,页数19页,欢迎下载。
