通信行业专题研究:OpenAI o1占领后训练扩展律前沿,从快速识别走向深度思考
行业报告 | 行业专题研究 请务必阅读正文之后的信息披露和免责申明 1 通信 证券研究报告 2024 年 09 月 24 日 投资评级 行业评级 强于大市(维持评级) 上次评级 强于大市 作者 唐海清 分析师 SAC 执业证书编号:S1110517030002 tanghaiqing@tfzq.com 王奕红 分析师 SAC 执业证书编号:S1110517090004 wangyihong@tfzq.com 余芳沁 分析师 SAC 执业证书编号:S1110521080006 yufangqin@tfzq.com 资料来源:聚源数据 相关报告 1 《通信-行业研究周报:微软与阿联酋G42 新 建 2 个 AI 中 心;通 义千问Qwen2.5各 项 性 能 显 著 提 升 》 2024-09-22 2 《通信-行业研究周报:OpenAI 发布新模型 o1;微软 Office 全家桶重磅升级》 2024-09-18 3 《通信-行业研究周报:全球 AI 基建计划制定,光博会即将开启,积极看好 AI推 动 算 力 基 础 设 施 投 资 机 会 》 2024-09-08 行业走势图 OpenAI o1 占领后训练扩展律前沿,从快速识别走向深度思考 o1 模型通过强化学习训练和产生思维链,能在做出响应前花更多时间思考问题 9 月 12 日 , OpenAI 发 布 一 系 列 新 大 语 言 模 型 o1 , 经 过 强 化 学 习(Reinforcement Learning)训练,可以执行复杂推理,该模型可以产生一个长程思维链(Chain of Thought),在做出响应前花更多时间思考问题。 新模型包括 o1-preview 和 o1-mini 两种版本,其中 o1-mini 更快、更具成本效益,适用于需要推理但不需要广泛知识的应用程序 o1-mini 是一个较小的模型,针对预训练期间的 STEM 推理进行了优化。速度方面,在单词推理问题回答中 o1-mini 找到答案的速度比 o1-preview大约快了 3~5 倍;成本方面,OpenAI 向第五梯队 API 用户开放的 o1-mini成本端比 o1-preview 便宜 80%。 o1 通用性不及 GPT-4o,高推理能力伴随高成本 作为早期模型,o1 并不具备浏览网页、上传文件和图像等功能,通用性尚不及 GPT-4o。但相较于 GPT-4o 多模态、反应快等特点,o1-preview 更加注重推理能力,输入、输出 tokens 成本分别是 GPT-4o 的 3、4 倍。 o1 在数理化复杂问题推理中的性能明显优于 GPT-4o,在物理和生物学专业知识基准上的表现超越人类博士 o1 在竞争性编程问题(Codeforces)中拿到 89%的百分位, GPT-4o 仅为11%;在国际数学奥林匹克竞赛 (IMO) 的资格考试中,o1 解答正确率为83%,而 GPT-4o 正确率仅为 13%;在安全方面,o1 在越狱测试中的分数高达 84,而 GPT-4o 的得分仅为 22 分。 后训练扩展律(Post-Training Scaling Law)显现,或将引发业界对算力重新分配、后训练能力的思考 o1 模型的亮点在于其性能会随着强化学习时间(训练时间的计算量)和思考时间(测试时间的计算量)的增加而不断提升,扩展这种方法的限制与传统 LLM 预训练方法(通过增加参数量和数据量)的限制有着很大不同,后训练方法的重要性或将引发业界对算力分配、后训练能力的思考。 从快速反应走向深度思考,拓宽行业应用场景 o1 在训练过程中能够使其思维链进行高效思考,模拟了人类在面对复杂问题时的思考过程,这预示着 AI 除了在快系统中可被应用(人脸识别等),在慢系统中的可用型或将得到提升。 快慢系统结合或将成为新的 AI 发展战略,OpenAI、Google 占据前沿阵地 Google DeepMind 在此前论文中提出测试时的计算比扩展模型参数更有效; AlphaGeometry 模型在国际数学奥林匹克(IMO)几何问题的基准测试中解决了 25 个问题(总共 30 个问题),AlphaGeometry 由神经语言模型和符号推导引擎组成,将快慢系统结合,一个系统提供快速、直观的想法,另一个系统则提供更深思熟虑、更理性的决策。 风险提示:AI 应用发展不及预期风险;海外大厂投资不及预期风险;中美摩擦升级风险。 -24%-20%-16%-12%-8%-4%0%2023-092024-012024-05通信沪深300 行业报告 | 行业专题研究 请务必阅读正文之后的信息披露和免责申明 2 重点标的 股票 股票 收盘价 投资 EPS(元) P/E 代码 名称 2024-09-23 评级 2023A 2024E 2025E 2026E 2023A 2024E 2025E 2026E 300308.SZ 中际旭创 108.90 买入 1.94 5.33 8.96 11.18 56.13 20.43 12.15 9.74 300502.SZ 新易盛 95.25 买入 0.97 2.27 3.73 4.99 98.20 41.96 25.54 19.09 300394.SZ 天孚通信 73.87 增持 1.32 2.85 5.21 6.68 55.96 25.92 14.18 11.06 688498.SH 源杰科技 86.73 增持 0.23 0.59 1.74 2.74 377.09 147.00 49.84 31.65 002463.SZ 沪电股份 32.17 增持 0.79 1.35 1.83 2.20 40.72 23.83 17.58 14.62 000063.SZ 中兴通讯 24.90 买入 1.95 2.15 2.38 2.61 12.77 11.58 10.46 9.54 000938.SZ 紫光股份 18.87 增持 0.74 0.85 1.01 1.20 25.50 22.20 18.68 15.73 301191.SZ 菲菱科思 64.67 增持 2.08 2.17 3.15 4.15 31.09 29.80 20.53 15.58 600941.SH 中国移动 101.05 买入 6.14 6.48 6.78 7.09 16.46 15.59 14.90 14.25 601728.SH 中国电信 6.06 增持 0.33 0.36 0.39 0.41 18.36 16.83 15.54 14.78 600050.SH 中国联通 4.49 增持 0.26 0.29 0.32 0.35 17.27 15.48 14.03 12.83 300442.SZ 润泽科技 22.79 买入 1.02 1.28 1.92 2.46 22.34 17.80 11.87 9.26 002929.SZ 润建股份 24.81 买入 1.56 1.63 2.03 2.49 15.90 15.22 12.22 9.96 002335.SZ 科华数据 18.47 买入 1.10 1.24 1.88 2.42 16
[天风证券]:通信行业专题研究:OpenAI o1占领后训练扩展律前沿,从快速识别走向深度思考,点击即可下载。报告格式为PDF,大小1.49M,页数9页,欢迎下载。
