智能化选基系列之四:如何用LLM生成基金经理调研报告并构建标签体系?
敬请参阅最后一页特别声明 1 本篇报告是国金证券金融工程团队智能化选基系列的第四篇,也是我们围绕 ChatGPT 等大语言模型开展的多项深度前瞻研究的第四篇。在本篇报告中,我们将大语言模型应用到了基金研究中,我们以基金经理调研纪要为研究对象,利用大语言模型,对冗长的基金经理调研纪要进行深度解析。 2023 年初,OpenAI 发布的 ChatGPT 因其较强的性能引发全球追捧,国内外各类大语言模型层出不穷,开启了人工智能的新时代。2023 年 7 月份,Anthropic 公司推出 Claude 2,相比于 ChatGPT-4,Claude 2 支持更大的上下文窗口、便捷的文件上传能力、免费使用的特点,也引发了大量关注。基金经理调研,是基金研究的重要环节,基金经理调研纪要往往较为冗长,而 Claude 2 支持 10w token 上下文度,能够帮助我们对冗长的基金经理调研纪要进行文本分析,挖掘其中隐含的关键信息,提高工作效率。 为了更清晰有效的阅读基金经理调研纪要,挖掘其中的关键信息,我们将以三种形式对基金经理调研纪要进行解析,即基金经理调研总结报告、基于基金经理调研内容的个性化问答生成结构化数据、基金经理投资框架思维导图。Claude 2 处理 PDF 文件时有较好的识别和定位能力,对于多篇调研纪要能够同时处理。通过设计有效的提示词,我们可以个性化的将对话形式的调研纪要,制作成调研总结报告,也可以通过问答形式,批量提问,生成结构化的数据形式,此外 Claude 2 可以生成 mermaid 格式思维导图,清晰展示基金经理投资框架。 市场中有大量微信公众号、研报包含了基金经理调研纪要、基金经理定性研究信息,我们可以将大批量冗长的纪要及研报,使用 Claude 2 将其处理成结构化的基金经理定性标签数据,便于存储和使用。我们通过文本收集、文本整理与清洗、大模型解析、结果检查与汇总等步骤,将搜集到的 98 篇研报及 63 篇调研纪要,从投资框架、风格偏好、行业偏好、选股逻辑、择时倾向、交易特征等维度进行拆解,构建了二维数据表格,包含日期、基金经理姓名、各维度特征标签等信息,形成了我们的基金经理研究数据库。 大语言模型存在一定的随机性,开启不同对话可能会导致输出结果的不同。大语言模型仍然会犯错,需要我们在使用过程中注意甄别结果的准确性。在设计提示词的过程中,可以通过赋予角色、详细描述问题并提供解决方法、限定大模型不可以胡编乱造等方式,提高大模型使用效果。Claude 2 解析基金经理调研纪要的能力,一方面取决于大模型的性能,也取决于提示词的有效性,另一方面也依赖于调研纪要的质量。尽管 Claude 2 能够支持较长文本的分析,但大批量的调研纪要数据仍然可能超过其分析能力,在大模型不断升级迭代的情况下,有望得到解决。 大语言模型输出结果具有一定随机性,对同一个问题可能会产生不同的结论;模型迭代升级、新功能开发可能会导致结论不同;人工智能模型得出的结论仅供参考,答案可能存在错误的风险;调研纪要文本质量影响最终输出结果的风险。 金融工程专题报告 敬请参阅最后一页特别声明 2 扫码获取更多服务 内容目录 1、大语言模型推陈出新,长文本分析大有可为....................................................... 4 1.1 Claude 2 基本情况介绍 ................................................................... 4 1.2 Claude 特色——宪法式 AI 技术 ............................................................ 4 1.3 产品迭代升级,Claude 2 表现优异 ......................................................... 5 1.4 Claude 2 VS ChatGPT:为什么我们选择了 Claude 2 ........................................... 7 1.5 LLM 模型助力基金经理调研纪要的结构化处理 ................................................ 7 2、利用 Claude 2 撰写基金经理调研报告并绘制思维导图.............................................. 8 2.1 方法介绍................................................................................ 8 2.2 案例展示................................................................................ 9 3、调研纪要批量处理及基金经理定性标签数据库构建................................................ 13 3.1 方法介绍............................................................................... 13 3.2 案例展示............................................................................... 13 4、总结........................................................................................ 14 5、风险提示.................................................................................... 15 图表目录 图表 1: Claude 大模型升级迭代................................................................... 4 图表 2: 宪法式 AI 的训练过程 .................................................................... 5 图表 3: Claude 2 单位 token 的损失............................................................... 5 图表 4: Claude 各版本的无害性测试............................................................... 6 图表 5: Claude 各版本在“HHH”的总体表现 ...............................................
[国金证券]:智能化选基系列之四:如何用LLM生成基金经理调研报告并构建标签体系?,点击即可下载。报告格式为PDF,大小1.86M,页数16页,欢迎下载。
