计算机:AI动态跟踪系列(六)-OpenAI o3、豆包新品首发,关注原生Agent与多模态推理

AI 动态跟踪系列(六) OpenAI o3、豆包新品首发,关注原生 Agent 与多模态推理 行业动态跟踪报告 请通过合法途径获取本公司研究报告,如经由未经许可的渠道获得研究报告,请慎重使用并注意阅读研究报告尾页的声明内容。 行业报告 计算机 2025 年 04 月 17 日 强于大市(维持) 行情走势图 相关研究报告 【平安证券】行业动态跟踪报告*计算机*AI 动态跟踪系列(五)国产 AI 当打之年:Manus 新星闪耀,产业与政策持续催化*强于大市 20250306 【平安证券】行业动态跟踪报告*计算机*AI 动态跟踪系列(四):DeepSeek 引发广泛关注 大模型应用落地将加速*强于大市 20250206 证券分析师 闫磊 投资咨询资格编号 S1060517070006 YANLEI511@pingan.com.cn 黄韦涵 投资咨询资格编号 S1060523070003 HUANGWEIHAN235@pingan.com.cn 研究助理 王佳一 一般证券从业资格编号 S1060123070023 WANGJIAYI446@pingan.com.cn 事项: 4 月 17 日,OpenAI 公司发布 o 系列模型中的最新款 o3 和 o4-mini,火山引擎发布豆包1.5·深度思考模型等新品。 平安观点:  OpenAI o3、o4-mini 新增图像深度思考与 Agent 能力,Codex CLI 智能体开源推动 AI 编程生态开放。o3 和 o4-mini 被称为是 OpenAI 迄今为止发布的最智能的模型,我们认为,在 o1 优越能力的背后,核心突破在于运用思维链(chain of thought)方法来处理复杂任务,而 o3 和 o4-mini 的主要突破在于两个能力:1)图像深度思考。首次实现在思维链中用图像来思考,结合高级推理与 Web 搜索、图像处理等工具(自动缩放、裁剪、翻转或增强图像)。2)Agent 能力(代理能力)。OpenAI 推理模型首次可以代理使用和组合 ChatGPT 中的各个工具,包括搜索网络、使用 Python 分析上传的文件和其他数据、对视觉输入进行深入推理,甚至生成图像。此外,OpenAI 进一步推动 AI 编程生态开放,开源了轻量级编程智能体Codex CLI,仅需 OpenAI API key 即可零配置启动,开发者可直接从命令行体验多模态推理。  豆包 1.5·深度思考模型对标全球推理模型第一梯队,视觉理解模型实现更强视觉定位能力。火山引擎在 4 月 17 日 FORCE LINK AI 创新巡展·杭州站上,发布豆包 1.5·深度思考模型等新品,我们认为以下进展值得重点关注:1)推理模型。性能上,豆包 1.5·深度思考模型在数学、代码、科学等专业领域推理任务中表现已经达到或接近全球第一梯队水平,对标 DeepSeek R1、QWQ-32B 等顶尖模型,并增加了视觉理解能力;功能上,豆包 APP 基于豆包 1.5·深度思考模型进行了定向训练,可以实现“边想边搜”。2)多模态。升级的豆包·文生图模型 3.0 在最新的文生图领域权威榜单 Artificial Analysis 竞技场中排名全球第一梯队;新版本豆包·视觉理解模型实现更强的视觉定位能力,可应用于线下门店的巡检场景、GUI agent、机器人训练、自动驾驶训练等。3)企业级服务。面向 Agent 服务,发布OS Agent、GUI Agent 大模型(豆包 1.5·UI-TARS),面向大规模推理,发布 AI云原生·ServingKit 推理套件。  投资建议:我们认为,近期包括 OpenAI、豆包在内发布的新模型,解题思路在此前思维链 CoT 基础上,更多体现对模型原生 Agent 能力(即工具使用)以及多模态推理能力的重视。全球大模型领域的竞争依然白热化,我们坚定看好 AI 主题的投资机会,当前 Agent 在企业端落地进度较为靠前,AI 应用建议关注 OA/ERP/编程/办公等领域;算力方面,Agent 将带来更多的推理端应用需求,从而拉动推理端算力乃至整体算力需求向上。当前全球贸易摩擦持续演化,从性价比以及供应链安全的角度,我国国产 AI 算力在国内 AI 算力市场的接受度将进一步提高,市占率有望进一步提升,我们坚定看好国产 AI 算力产业链。标的方面:1)AI 应用:AI+企服,建议关注泛微网络、致远互联、卓易信息、金蝶国际、税友股份、博思软件、普联软件;AI+办公,推荐金山办公、福昕软件、万兴科技,建议关注合合信息。2)AI 算力:推荐海光信息、龙芯中科、浪潮信息、紫光股份、中科曙光、神州数码、工业富联、深信服,建议关注寒武纪、景嘉微、华勤技术、软通动力、拓维信息。  风险提示:1)AI 算力供应链风险上升。2)大模型产品的应用落地低于预期。3)国内大模型算法发展可能不及预期。 证券研究报告 请通过合法途径获取本公司研究报告,如经由未经许可的渠道获得研究报告,请慎重使用并注意阅读研究报告尾页的声明内容。 计算机·行业动态跟踪报告 2/ 9 一、 OpenAI o3、o4-mini 新增图像深度思考与 Agent 能力,Codex CLI智能体开源推动 AI 编程生态开放 4 月 17 日,OpenAI 公司发布 o系列模型中的最新款 o3 和 o4-mini,被称为是 OpenAI 迄今为止发布的最智能的模型。我们认为,在 o1 优越能力的背后,核心突破在于运用思维链(chain of thought)方法来处理复杂任务,而 o3 和 o4-mini 的主要突破在于两个能力:1)图像深度思考。作为 o 系列中最新的视觉推理模型,o3 和 o4-mini 第一次实现在思维链中用图像来思考,将高级推理与 Web 搜索、图像处理等工具(自动缩放、裁剪、翻转或增强图像)无缝结合。2)Agent 能力(代理能力)。OpenAI 推理模型第一次可以代理使用和组合 ChatGPT 中的各个工具,包括搜索网络、使用 Python 分析上传的文件和其他数据、对视觉输入进行深入推理,甚至生成图像。 OpenAI 称,o3 是他们最强大的推理模型,它在编码、数学、科学、视觉感知等方面推动了前沿发展,o3 在包括 Codeforces、SWE-bench(无需构建自定义模型特定的支架)和 MMMU 在内的基准上设定了新的 SOTA。它非常适合需要多方面分析的复杂查询,在分析图像、图表和图形等可视化任务方面表现特别出色。在外部专家的评估中,o3 在困难的现实任务上犯的重大错误比 OpenAI o1 少 20%,尤其是在编程、商业/咨询和创意构思等领域表现出色。早期测试人员强调了它作为思想伙伴的分析严谨性,并强调了它产生和批判性评估新假设的能力,尤其是在生物学、数学和工程环境中。 o4-mini 则是一种较小的模型,针对快速、经济高效的推理进行了优化,在大小和成本方面实现高性能,尤其是在数学、编码和视觉任务方面,它是 AIME 2024 和 2025 上表现最好的基准模型。在专家评估中,它在非 STEM 任务以及数据科学等领域的表现也优

立即下载
电子设备
2025-04-18
平安证券
闫磊,黄韦涵,王佳一
9页
1.67M
收藏
分享

[平安证券]:计算机:AI动态跟踪系列(六)-OpenAI o3、豆包新品首发,关注原生Agent与多模态推理,点击即可下载。报告格式为PDF,大小1.67M,页数9页,欢迎下载。

本报告共9页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共9页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
行业流通股总市值短期跌幅较大,反弹后有明显调整需求
电子设备
2025-04-17
来源:计算机行业周报四月第一周:中美关税争端加剧
查看原文
计算机行业流通股换手率反弹后再度下行
电子设备
2025-04-17
来源:计算机行业周报四月第一周:中美关税争端加剧
查看原文
本周(4.7-4.11)行业日均换手率前十(算术平均)
电子设备
2025-04-17
来源:计算机行业周报四月第一周:中美关税争端加剧
查看原文
本周(4.7-4.11)计算机行业市占率指标无明显趋势性方向
电子设备
2025-04-17
来源:计算机行业周报四月第一周:中美关税争端加剧
查看原文
本周(4.7-4.11)计算机设备业表现较为抗跌
电子设备
2025-04-17
来源:计算机行业周报四月第一周:中美关税争端加剧
查看原文
本周(4.7-4.11)计算机行业指数再度大幅下挫
电子设备
2025-04-17
来源:计算机行业周报四月第一周:中美关税争端加剧
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起