基于财报文本的情感语调的分析:DeepSeek辅助识别财务瑕疵

请务必阅读正文之后的免责声明及其项下所有内容证券研究报告 | | 20252025年4月1717日DeepSeek辅助识别财务瑕疵——基于财报文本的情感语调的分析策略研究 · 策略专题证券分析师:陈凯畅021-60375429chengkaichang@guosen.com.cnS0980523090002证券分析师:王 开021-60933132wangkai8@guosen.com.cnS0980521030001请务必阅读正文之后的免责声明及其项下所有内容➢ 财务造假样本分析:从CSMAR数据库“财务违规表”筛选2010-2021年样本,通讯服务行业造假占比最高,金融和公用事业最低。2010-2018年造假公司数量及占比上升,2019年后下降,且约58.3%的造假行为在1-2年内暴露或终止。信息披露违规成为主流,虚构利润和虚列资产减少。➢ 特征池构建:基于上市公司定期财务报告,从8个维度构建378个比率型指标,经筛选处理后保留100个指标,形成特征池,包含5483个财务造假样本和42046个控制样本。➢ 情感语调因子构建:利用DeepSeek R1模型分析财报文本情感语调,设计相关函数和处理流程,获取情感语调分数。财务造假公司情感语调分数整体低于正常公司,可捕捉情绪矛盾、模糊表述和行业异常等风险线索。➢ 模型表现:分别构建 Logistic、LightGBM和MLP模型,加入情感语调因子后,三个模型召回率均提升,第二类错误下降。情感语调因子在非线性模型(MLP、LightGBM)中重要性高,与传统财务指标协同,提升综合预警能力。➢ 拓展路径:基于Zero-Shot的财报文本直接分析模式,利用大模型通用语义理解能力挖掘潜在造假信号;基于违规说明的Fine-Tuning模式,对基座LLMs进行微调构建专家模型,通过精准匹配率和人工盲测评估。➢ 风险提示:模型过拟合风险,DeepSeek的训练依赖于投喂的框架语料与底稿数据,多维框架下存在未来函数和过拟合风险;数据口径调整风险,财务指标统计口径的调整可能带来AI配置结论的改变;AI推理的不稳健性,AI模型的输出结论具备一定随机性,多次生成可能产生不同的结果。请务必阅读正文之后的免责声明及其项下所有内容财务造假上市公司样本整理01基于结构化数据构建财务造假识别模型特征池02AI挖掘财报文本信息的拓展路径05目录目录情感语调因子在财务造假识别模型中的表现04DeepSeek辅助构建基于财报文本的情感语调因子03请务必阅读正文之后的免责声明及其项下所有内容图:上市公司违规类型说明资料来源:CSMAR,国信证券经济研究所整理造假的违规类型造假的违规类型➢ 认定财务造假需满足三个要件:主观故意性、财务数据操纵性、误导利益相关者目的性。在15个违规类型中,通常认为虚构利润、虚列资产、虚假记载、重大遗漏、披露不实、欺诈上市、一般会计处理不当为财务造假类违规。违规名称解释说明违规分类虚构利润虚构收入、成本费用等相关导致利润增加的科目事项均纳入此类别,包括以虚构利润为目的隐瞒亏损(利润表里的科目)。财务造假类虚列资产虚构负债等相关科目导致资产增加的事项均纳入此类别(负债表里的科目)。财务造假类虚假记载(误导性陈述)虚假记载,即负有信息披露义务的相关主体,在履行披露信息义务时,在其公开的文件中作出与事实不相符合的记载的行为;误导性陈述,即负有信息披露义务的相关主体在其公开的文件中或者通过媒体,作出误导市场投资者对其投资行为发生错误判断并产生重大影响的陈述。财务造假类重大遗漏重大遗漏,即信息披露义务人在信息披露文件中,未将应当记载的事项完全记载或者仅部分予以记载,强调的应披露内容的完整性。财务造假类披露不实(其他)在信息披露中提供不实信息,如虚假陈述、隐瞒事实等。根据公告无法判断披露的信息是内容不真实,还是内容不完整,或者是披露时间不够及时,此时将这种情况收录在此项。财务造假类欺诈上市指在招股说明书或认股书、公司、企业债券募集办法中隐瞒重要事实或编造重大虚假内容。财务造假类一般会计处理不当会计处理不符合会计准则,导致财务报表不准确。或滥用会计政策进行“财务洗澡”。财务造假类出资违规一般是出资不实,包括虚假出资,抽逃出资,出资不到位,不按照规定等情况;虚假出资、抽逃出资罪,是指公司发起人、股东违反公司法的规定未交付货币、实物或者未转移财产权,或者在公司成立后又暗中撤回出资,数额巨大、后果严重或者有其他严重情节的行为。公司治理类擅自改变资金用途公告中说明的擅自改变资金用途的。注意:若是捏造不存在募集资金用途,则是虚假陈述。公司治理类占用公司资产公司实际控制人或高管占用公司资产,损害公司利益。公司治理类内幕交易内幕交易是指内幕人员和以不正当手段获得内幕消息的其他人员违反法律规定,泄露内幕信息,根据内幕信息买卖股票或者向他人提出买卖股票的建议的行为。公司治理类违规买卖股票主要收录除了内幕交易以外的其他违规买卖股票,如违规董事,监事和高管自公司股票上市日起一年和离职后半年内,不得转让其所持本公司股份;任职期间拟买卖本公司股票应当根据相关规定提前向交易所备案,所持本公司股份发生变动的, 应当及时向公司表格并由公司在交易所网站公告的规定等,都属于违规买卖股票。公司治理类操纵股价操纵股价(操纵证券市场)是指单独或者合谋,集中资金优势,持股或者持仓优势或者利用信息优势联合或者连续买卖,操纵证券,期货交易价格或者证劵,期货交易量的,与他人串通,以事先约定的时间,价格和方式互相进行证劵,期货交易,影响证券,期货交易价格或者证券,期货交易量的,在自己实际控制的账户之间进行证券交易,或者以自己为交易对象,自买自卖期货合约。公司治理类违规担保中国证券监督管理委员会公告[2009]16号三、《管理办法》所规定的“违规对外提供担保”,是指上市公司及其附属公司违反相关法律、行政法规、规章、中国证监会发布的规范性文件、公司章程的规定对外提供担保。公司治理类推迟披露推迟披露主要是指相关的信息没有及时披露,即没有按照信息披露限期规定的要求及时披露相关的信息。信息披露时效性问题其他除了以上的分类之外的违规。其他请务必阅读正文之后的免责声明及其项下所有内容图:样本初步处理方式资料来源:国信证券经济研究所整理样本初步处理样本初步处理➢ 在财务造假样本筛选中,本文的数据来源于CSMAR数据库的“ 财务违规表”。本文选择2010年1月1日之后的样本进行分析。同时,由于财务造假的处罚公布具有滞后性,因此决定暂时不研究最近2年,即2023年12月31日之后的所有样本。步骤处理方法数据来源与基础筛选本研究采用CSMAR数据库的「财务违规表」作为基础数据源,该表整合了证监会、沪深交易所公告中经官方认定的财务造假案例。为确保数据权威性,仅保留基于监管机构正式处罚决定的样本,排除媒体曝光但未获官方认定的疑似案例。时间窗口设定​选取2010年1月1日至2023年12月31日作为研究区间,该设定基于双重考量:•监管滞后性:根据证监会处罚周期统计,财务舞弊从发生到被处罚平均存在3-5年滞后期,排除近两年数据可规避未曝光舞弊样本对模型训练的干扰。•会计准则稳定性:2010年后企业会计准则修订幅度较小,确保财务指标可比性。样本构造

立即下载
综合
2025-04-21
国信证券
30页
1.62M
收藏
分享

[国信证券]:基于财报文本的情感语调的分析:DeepSeek辅助识别财务瑕疵,点击即可下载。报告格式为PDF,大小1.62M,页数30页,欢迎下载。

本报告共30页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共30页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
相对估值表
综合
2025-04-21
来源:济川药业(600566)多元化中药龙头,产品梯队稳步贡献业绩
查看原文
FCFF 估值敏感性分析
综合
2025-04-21
来源:济川药业(600566)多元化中药龙头,产品梯队稳步贡献业绩
查看原文
FCFF 估值明细(百万元)
综合
2025-04-21
来源:济川药业(600566)多元化中药龙头,产品梯队稳步贡献业绩
查看原文
公司营收测算汇总(百万元)
综合
2025-04-21
来源:济川药业(600566)多元化中药龙头,产品梯队稳步贡献业绩
查看原文
中国流感药物竞争格局
综合
2025-04-21
来源:济川药业(600566)多元化中药龙头,产品梯队稳步贡献业绩
查看原文
常用的抗流感病毒药物
综合
2025-04-21
来源:济川药业(600566)多元化中药龙头,产品梯队稳步贡献业绩
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起