计算机：AI动态跟踪系列（六）-OpenAI o3、豆包新品首发，关注原生Agent与多模态推理

AI 动态跟踪系列（六） OpenAI o3、豆包新品首发，关注原生 Agent 与多模态推理行业动态跟踪报告请通过合法途径获取本公司研究报告，如经由未经许可的渠道获得研究报告，请慎重使用并注意阅读研究报告尾页的声明内容。行业报告计算机 2025 年 04 月 17 日强于大市（维持）行情走势图相关研究报告【平安证券】行业动态跟踪报告*计算机*AI 动态跟踪系列（五）国产 AI 当打之年：Manus 新星闪耀，产业与政策持续催化*强于大市 20250306 【平安证券】行业动态跟踪报告*计算机*AI 动态跟踪系列（四）：DeepSeek 引发广泛关注大模型应用落地将加速*强于大市 20250206 证券分析师闫磊投资咨询资格编号 S1060517070006 YANLEI511@pingan.com.cn 黄韦涵投资咨询资格编号 S1060523070003 HUANGWEIHAN235@pingan.com.cn 研究助理王佳一一般证券从业资格编号 S1060123070023 WANGJIAYI446@pingan.com.cn 事项： 4 月 17 日，OpenAI 公司发布 o 系列模型中的最新款 o3 和 o4-mini，火山引擎发布豆包1.5·深度思考模型等新品。平安观点：  OpenAI o3、o4-mini 新增图像深度思考与 Agent 能力，Codex CLI 智能体开源推动 AI 编程生态开放。o3 和 o4-mini 被称为是 OpenAI 迄今为止发布的最智能的模型，我们认为，在 o1 优越能力的背后，核心突破在于运用思维链（chain of thought）方法来处理复杂任务，而 o3 和 o4-mini 的主要突破在于两个能力：1）图像深度思考。首次实现在思维链中用图像来思考，结合高级推理与 Web 搜索、图像处理等工具（自动缩放、裁剪、翻转或增强图像）。2）Agent 能力（代理能力）。OpenAI 推理模型首次可以代理使用和组合 ChatGPT 中的各个工具，包括搜索网络、使用 Python 分析上传的文件和其他数据、对视觉输入进行深入推理，甚至生成图像。此外，OpenAI 进一步推动 AI 编程生态开放，开源了轻量级编程智能体Codex CLI，仅需 OpenAI API key 即可零配置启动，开发者可直接从命令行体验多模态推理。  豆包 1.5·深度思考模型对标全球推理模型第一梯队，视觉理解模型实现更强视觉定位能力。火山引擎在 4 月 17 日 FORCE LINK AI 创新巡展·杭州站上，发布豆包 1.5·深度思考模型等新品，我们认为以下进展值得重点关注：1）推理模型。性能上，豆包 1.5·深度思考模型在数学、代码、科学等专业领域推理任务中表现已经达到或接近全球第一梯队水平，对标 DeepSeek R1、QWQ-32B 等顶尖模型，并增加了视觉理解能力；功能上，豆包 APP 基于豆包 1.5·深度思考模型进行了定向训练，可以实现“边想边搜”。2）多模态。升级的豆包·文生图模型 3.0 在最新的文生图领域权威榜单 Artificial Analysis 竞技场中排名全球第一梯队；新版本豆包·视觉理解模型实现更强的视觉定位能力，可应用于线下门店的巡检场景、GUI agent、机器人训练、自动驾驶训练等。3）企业级服务。面向 Agent 服务，发布OS Agent、GUI Agent 大模型（豆包 1.5·UI-TARS），面向大规模推理，发布 AI云原生·ServingKit 推理套件。  投资建议：我们认为，近期包括 OpenAI、豆包在内发布的新模型，解题思路在此前思维链 CoT 基础上，更多体现对模型原生 Agent 能力（即工具使用）以及多模态推理能力的重视。全球大模型领域的竞争依然白热化，我们坚定看好 AI 主题的投资机会，当前 Agent 在企业端落地进度较为靠前，AI 应用建议关注 OA/ERP/编程/办公等领域；算力方面，Agent 将带来更多的推理端应用需求，从而拉动推理端算力乃至整体算力需求向上。当前全球贸易摩擦持续演化，从性价比以及供应链安全的角度，我国国产 AI 算力在国内 AI 算力市场的接受度将进一步提高，市占率有望进一步提升，我们坚定看好国产 AI 算力产业链。标的方面：1）AI 应用：AI+企服，建议关注泛微网络、致远互联、卓易信息、金蝶国际、税友股份、博思软件、普联软件；AI+办公，推荐金山办公、福昕软件、万兴科技，建议关注合合信息。2）AI 算力：推荐海光信息、龙芯中科、浪潮信息、紫光股份、中科曙光、神州数码、工业富联、深信服，建议关注寒武纪、景嘉微、华勤技术、软通动力、拓维信息。  风险提示：1）AI 算力供应链风险上升。2）大模型产品的应用落地低于预期。3）国内大模型算法发展可能不及预期。证券研究报告请通过合法途径获取本公司研究报告，如经由未经许可的渠道获得研究报告，请慎重使用并注意阅读研究报告尾页的声明内容。计算机·行业动态跟踪报告 2/ 9 一、 OpenAI o3、o4-mini 新增图像深度思考与 Agent 能力，Codex CLI智能体开源推动 AI 编程生态开放 4 月 17 日，OpenAI 公司发布 o系列模型中的最新款 o3 和 o4-mini，被称为是 OpenAI 迄今为止发布的最智能的模型。我们认为，在 o1 优越能力的背后，核心突破在于运用思维链（chain of thought）方法来处理复杂任务，而 o3 和 o4-mini 的主要突破在于两个能力：1）图像深度思考。作为 o 系列中最新的视觉推理模型，o3 和 o4-mini 第一次实现在思维链中用图像来思考，将高级推理与 Web 搜索、图像处理等工具（自动缩放、裁剪、翻转或增强图像）无缝结合。2）Agent 能力（代理能力）。OpenAI 推理模型第一次可以代理使用和组合 ChatGPT 中的各个工具，包括搜索网络、使用 Python 分析上传的文件和其他数据、对视觉输入进行深入推理，甚至生成图像。 OpenAI 称，o3 是他们最强大的推理模型，它在编码、数学、科学、视觉感知等方面推动了前沿发展，o3 在包括 Codeforces、SWE-bench（无需构建自定义模型特定的支架）和 MMMU 在内的基准上设定了新的 SOTA。它非常适合需要多方面分析的复杂查询，在分析图像、图表和图形等可视化任务方面表现特别出色。在外部专家的评估中，o3 在困难的现实任务上犯的重大错误比 OpenAI o1 少 20%，尤其是在编程、商业/咨询和创意构思等领域表现出色。早期测试人员强调了它作为思想伙伴的分析严谨性，并强调了它产生和批判性评估新假设的能力，尤其是在生物学、数学和工程环境中。 o4-mini 则是一种较小的模型，针对快速、经济高效的推理进行了优化，在大小和成本方面实现高性能，尤其是在数学、编码和视觉任务方面，它是 AIME 2024 和 2025 上表现最好的基准模型。在专家评估中，它在非 STEM 任务以及数据科学等领域的表现也优

立即下载

电子设备

2025-04-18

平安证券

闫磊,黄韦涵,王佳一

9页

1.67M

[平安证券]:计算机：AI动态跟踪系列（六）-OpenAI o3、豆包新品首发，关注原生Agent与多模态推理，点击即可下载。报告格式为PDF，大小1.67M，页数9页，欢迎下载。

本报告共9页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共9页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

计算机：AI动态跟踪系列（六）-OpenAI o3、豆包新品首发，关注原生Agent与多模态推理

关于我们

联系我们

计算机：AI动态跟踪系列（六）-OpenAI o3、豆包新品首发，关注原生Agent与多模态推理

关于我们

联系我们

小程序

公众号