计算机行业周报:阿里深夜开源Qwen2.5-Omni,DeepSeek-V3 上线新版本
2025 年 04 月 04 日 阿里深夜开源 Qwen2.5-Omni, DeepSeek-V3 上线新版本 —计算机行业周报 推荐(维持) 投资要点 分析师:宝幼琛 S1050521110002 baoyc@cfsc.com.cn 行业相对表现 表现 1M 3M 12M 计算机(申万) -8.8 16.1 26.8 沪深 300 -0.6 2.3 8.2 市场表现 资料来源:Wind,华鑫证券研究 相关研究 1、《计算机行业点评报告:文远知行(WRD.O):收入承压与商业化突破并行,自动驾驶长赛道静待拐点》2025-04-04 2、《计算机行业点评报告:禾赛科技(HSAI.O):激光雷达龙头加速业绩兑现,多元布局打开成长空间》2025-04-04 3、《计算机行业点评报告:英伟达[NVDA.O]:Blackwell 架构擎动业绩新高,AI 算力领航产业变革》2025- 04-04 ▌ 算 力 : 算 力 租 赁 价 格 平 稳 , 阿 里 深 夜 开 源Qwen2.5-Omni 3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。 这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。 团队提出了 Thinker-Talker 架构,这是一个端到端的多模态模型,旨在感知包括文本、图像、音频和视频在内的多种模态,同时以流式方式生成文本和自然语音响应。此外,团队还提出了一种名为 TMRoPE(Time-aligned Multimodal RoPE)的新型位置嵌入,用于同步视频输入与音频的时间戳。实时语音和视频聊天方面,该架构专为完全实时交互而设计,支持分块输入和即时输出。它还具备自然且稳健的语音生成:在语音生成方面,Qwen2.5-Omni 超越了许多现有的流式和非流式替代方案,展现出卓越的稳健性在和自然性。 多模态性能强劲:在与同样大小的单模态模型进行基准测试时,Qwen2.5-Omni 在所有模态上均展现出卓越的性能。Qwen2.5-Omni 在 音 频 能 力 上 超 越 了 同 样 大 小 的 Qwen2-Audio,并且达到了与 Qwen2.5-VL-7B 相当的性能;出色的端到端语音指令遵循能力:Qwen2.5-Omni 在端到端语音指令遵循方面的表现可与文本输入的有效性相媲美,这一点在 MMLU 和 GSM8K 等基准测试中得到了证明。 Thinker 对于 Qwen2.5-Omni 就像大脑一样,负责处理和理解来自文本、音频和视频模态的输入,生成高级表示以及对应的文本。Talker 则像人类的嘴巴,以流式方式接收 Thinker 产生的高级表示和文本,并流畅地输出离散的语音 token。Thinker 是一个 Transformer 解码器,配备有音频和图像的编码器,以便于提取信息。相比之下,Talker 被设计为一种双轨自回归 Transformer 解码器架构。 ▌AI 应 用 : Gemini 搜 索 访 问 量 环 比 +6.85% ,DeepSeek-V3 上线新版本 DeepSeek 上线新版本 DeepSeek-V3-0324,参数量为 6850-40-200204060(%)计算机沪深300证券研究报告 行业研究 证券研究报告 请阅读最后一页重要免责声明 2 诚信、专业、稳健、高效 亿,相较上个版本参数增幅不大(6710 亿)。DeepSeek V3的一大亮点在于采用 MIT 开源协议,上个版本还是自定义许可证,这不仅可以自由修改、分发模型,还支持模型蒸馏、商业化应用。 DeepSeek-V3-0324 所有指标性能暴涨,击败了 Claude 3.5 Sonnet,成为目前最强的非推理模型。就代码能力来看,DeepSeek-V3-0324 同样能够与 Claude 3.5 Sonnet 一决高下。另外,在 Aider 的多语言基准测试中,DeepSeek-V3-0324 拿下 55% 的成绩,较前代版本显著提升,成为仅次于Sonnet 3.7 的非推理类模型第二名。其表现已可媲美 R1 和o3-mini 等具备推理能力的模型。 在 KCORES 大模型竞技场中,Claude-3.7-Sonnet-Thinking无疑是 LLM 当之无愧的王者,DeepSeek-V3-0324 以 328.3 分拿下第三名,仅次于 Claude 3.5 Sonnet。在 mandelbrot-set-meet-libai 测试中,DeepSeek-V3-0324 没有过多变化,较初版仅仅低了 2 分,完成度提升很高。还有在火星任务测试中,DeepSeek-V3-0324 星球渲染正确,所有模型中位列第三。九大行星测试,DeepSeek-V3-0324 真正绘制出了太阳系的 完 整 图 。 此 外 , DeepSeek-V3-0324在Misguided Attention 基准上,跃居非推理类模型榜首,甚至超越了Claude Sonnet 3.7(非推理模型)。 ▌AI 融资动向: 两兄妹再次出手惊艳 AI 圈,再次融资 250 亿 近日,Anthropic 宣布完成 E 轮 35 亿美元(约合人民币 250亿元)融资,投后估值 615 亿美元(约合人民币 4450 亿元),这距离 Anthropic 上一轮 10 亿美元的融资仅仅过去不到 10 天。 达里奥·阿莫迪和丹妮拉·阿莫迪兄妹——2021 年离开OpenAI 开始创业,以他们为代表的 AI 新贵们正在进行一场史无前例的融资竞赛。2025 年短短 3 个月,从 OpenAI 到xAI、再到 Anthropic,以及 OpenAI 前 CTO 创立的新 AI 公司都在疯狂融资。 通过这项融资,Anthropic 将推进其下一代 AI 系统的发展,扩大其计算能力,加深其在机械性和一致性方面的研究,并加速其国际扩张。 诞生于前 OpenAI 最早期员工达里奥·阿莫迪和妹妹丹妮拉·阿莫迪之手,Anthropic 融资之路可谓势如破竹。就在两个月前已经获得来自谷歌的 10 亿美元投资,估值一度增长至 600 亿美元,条件之一是必须使用谷歌的云服务,在此之前,Anthropic 也和亚马逊签过类似的条款。 2025 年仅过去四分之一,Anthropic 就拿下了超 45 亿美元。而再回过头来看,从 2021 年 2 月创立开始,Anthropic 已经证券研究报告 请阅读最后一页重要免责声明 3 诚信、专业、稳健、高效 陆陆续续完成 10 多轮融资,估值飙升至 615 亿美元(约合人民币 4400 亿元),是崛起速度最快的 AI 公司之一。 ▌投资建议 DeepSeek-V3-0324 的新版本代码能力显著提升,数学与逻辑推理能力增强,模型架构与开源生态进一步提升,凸显中国AI 企业在技术与成本上的竞争力,更重要的是,其性能跳跃表明该团队可能在为后续重大版本铺路。目前,借助借助新版 DeepSeek-V3,Ai 应用将在垂直领域加
[华鑫证券]:计算机行业周报:阿里深夜开源Qwen2.5-Omni,DeepSeek-V3 上线新版本,点击即可下载。报告格式为PDF,大小0.87M,页数15页,欢迎下载。
