Alpha掘金系列之八:沪深300另类舆情增强因子,FinGPT对金融论坛数据情感的精准识别

敬请参阅最后一页特别声明 1 -- 情感分析是自然语言处理(NLP)的一个重要分支,在金融领域,情感分析在金融论坛评论上的分析有重要应用,因为金融论坛的情绪很大程度上反映了投资者的集体心态,投资者的心态、预期和信心可以对股票价格产生重大影响。 本报告采用子长科技提供的金融论坛股民情绪数据。子长科技基于公开社交媒体信息,包括股民及股市大 V 的各类言论,结合公司,行业,产品,相关技术等数据,运用 AI 知识模型 LKM,准确将股民情绪关联及定位到相关股票。并根据情绪表达,产生实时的量化情绪分数及统计信息。 2018 年 1 月 1 日至 2023 年 6 月 30 日,子长科技跟踪的金融论坛一共有超过 1300 万条主帖数据和超过 480 万条评论数据,每周平均可对应沪深 300 中超过 260 只股票。金融论坛数据有多样性和高度情绪化、信噪比低、随事件波动和受到特定类型评论影响等特征。主帖数据与评论数据在情感表达方面有明显区别。 在定位到相关股票的金融论坛数据之上本篇报告通过 FinGPT 其进行了情感分析,通过验证论坛情感与股票价格之间的关系探索了大语言模型模情感分析在量化策略上的直接应用。 FinGPT 是由 AI4Finance-Foundation 开发的一个开源项目,专注于金融领域的大型语言模型,其“V3.1”版本是在中文能力较强的 ChatGLM-6B 基础上进行 LoRA 微调训练而来,FinGPT 在情感打分任务上相比 ChatGLM-6B 又有进一步的提升。FinGPT 优秀的中文能力和情感分析能力都很适合在金融论坛评论之上进行应用。 情感打分体系主要包含三个方面,情感表达、情感分歧与情感变化。利用大语言模型进行情感分析,我们能准确地识别和量化每一条评论中的正面、负面或中立情感,为每位投资者的发言赋予一个情感得分。 从打分体系的因子测试结果看,投资者对某只股票情感越乐观情况下,该只股票更有可能获得超额收益。其中乐观情感和因子单因子 IC 达到 3.68%,分位数组合单调性良好,多空组合年化收益率为 12.71%,多空净值增加平稳,是有效评价情感与选股的指标。 大模型舆情情感因子与基本面因子相关性低,而情感和因子与市值相关性为0.55但是区别于市值因子其为降序因子,能够证明金融论坛评论情感分析是独立于基本面的另类有效选股指标。 我们以乐观情感总和因子构建大模型金融论坛舆情增强策略。每一期选择因子排名最靠前的 20%的股票等权构造策略组合。策略为月频调仓,在千分之三的手续费下策略年化收益率为 6.69%,夏普比率为 0.32,策略的超额年化收益率为 8.02%,信息比率为 1.58,策略的超额最大回撤仅为 6.94%。金融论坛评论确实带来了额外增量信息。 以上结果通过历史数据统计、建模和测算完成,历史规律未来可能存在失效;大语言模型基于上下文预测进行回答,不能保证回答准确性。 金融工程专题报告 敬请参阅最后一页特别声明 2 扫码获取更多服务 内容目录 一、另类数据情感分析的新方法 ................................................................... 5 二、金融论坛评论的数据特征 ..................................................................... 5 2.1 数据来源 .............................................................................. 5 2.2 什么是 LKM(Large Knowledge Model) ...................................................... 5 2.3 论坛的主帖和评论的区别 ................................................................ 7 三、大语言开源模型落地 ......................................................................... 8 3.1 利用大语言模型进行情感分析 ............................................................ 8 3.1.1 大模型强大的语言理解和更好的泛化能力 ................................................ 8 3.1.2 GPT 情感分析效果最佳,但成本过于高昂 ................................................. 9 3.2 本地化部署的开源模型 .................................................................. 9 3.2.1 开源模型 ............................................................................ 9 3.2.2 ChatGLM 与 FinGPT ................................................................... 10 四、情绪打分体系构建 .......................................................................... 11 4.1 因子测试方法 ......................................................................... 12 4.2 为什么要选择金融论坛评论数据 ......................................................... 12 4.3 大模型舆情情感因子 ................................................................... 13 4.4 因子相关性与因子收益 ................................................................. 15 五、大模型金融论坛舆情增强策略 ................................................................ 16 5.1 策略构建 ............................................................................. 16 5.2 策略表现 ............................................................................. 16 六、总结 ....

立即下载
金融
2023-10-27
国金证券
22页
2.46M
收藏
分享

[国金证券]:Alpha掘金系列之八:沪深300另类舆情增强因子,FinGPT对金融论坛数据情感的精准识别,点击即可下载。报告格式为PDF,大小2.46M,页数22页,欢迎下载。

本报告共22页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共22页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图 14、2022 年以来行业 ALPHA 组合与 HS300 累积收益对比
金融
2023-10-27
来源:10月市场跟踪:市场风险测度与研判月报
查看原文
表 2、2022 年以来不同月份收益分布
金融
2023-10-27
来源:10月市场跟踪:市场风险测度与研判月报
查看原文
图 13、行业 ALPHA 相关性选股收益(一个月行业 ALPHA 动量)
金融
2023-10-27
来源:10月市场跟踪:市场风险测度与研判月报
查看原文
图 12、行业 ALPHA 动量和反转表现(1 个月 ALPHA)
金融
2023-10-27
来源:10月市场跟踪:市场风险测度与研判月报
查看原文
图 11、考夫曼自适应均值曲线择时策略
金融
2023-10-27
来源:10月市场跟踪:市场风险测度与研判月报
查看原文
图 10、国债收益率与 EP 之差走势
金融
2023-10-27
来源:10月市场跟踪:市场风险测度与研判月报
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起