AI周观察:谷歌发布TPUv7和新模型应用,国内AI应用访问量提升
敬请参阅最后一页特别声明 1 摘要 - 谷歌在 Cloud Next 25 发布第七代 TPU Ironwood (TPU v7),显著提升 AI 定制硬件能力。该芯片是谷歌首款主攻 AI 推理的 TPU,旨在驱动 LLMs、MoEs 等复杂模型以迎接“推理时代”。性能大幅提升,支持高达 9,216 芯片的 42.5 Exaflops (FP8) 集群,单芯片 HBM 增至 192GB。尤为关键的是,其能效(性能功耗比)较上一代 Trillium 提升近 2 倍。Ironwood 强化了谷歌在 AI 推理基础设施的布局,旨在以高性能、高效率平台满足未来 AI 需求,增强自身服务及云业务竞争力,预计 2025 年下半年上市。 - 访问量数据,海外主要 AI 应用周度环比呈现小幅增长,而国内 AI 应用活跃度显著上升,其中文心一言、Kimi、豆包和通义千问的环比增长均超过 25%,元宝的访问量也上升了约 18%。 - 在 2025 年 4 月 9 日的 Google Cloud Next 2025 大会上,谷歌发布了开源智能体开发框架 Agent Development Kit (ADK),旨在简化多智能体系统的构建、管理和部署。同时,谷歌还推出了注重效率的推理模型 Gemini 2.5 Flash,并计划在第三季度支持 Gemini 模型的本地部署。此外,谷歌云 Vertex AI 平台新增了视频、图像、语音和音乐生成 AI 工具,并发布了旨在实现跨平台智能体通信与协作的开放协议 Agent2Agent (A2A)。 - 持续的关税争端给存储市场带来显著不确定性。虽然新季度价格谈判已在进行,但最终定价不明朗。现货市场交易放缓,短期供需平稳,但潜在风险不容忽视。终端电子产品制造商正评估关税影响,担心成本上升导致售价提高、销量下滑。这种压力预期将传导至上游存储芯片,抑制未来的备货需求。 - 相比于 PC 设备,手机硬件提升的空间有限,在已有的硬件框架里提升效率能更加有效的推动端侧 AI 的发展。联发科在天玑 9400+里对 NPU 的开发是值得关注的。此前手机 SoC 中虽然 NPU 可以帮助端侧设备完成一些推理任务,但大多数任务仍是由 SoC 中的 GPU 完成的。我们认为在 NPU 能力不断开发、模型能力不断提升的情况下,手机端侧 AI 开发将会加速。 - 我们认为,苹果折叠屏产品进入市场后将会促进折叠屏手机销量增长,同时带动消费者对于折叠屏产品的热情,最终推动其他消费电子厂商与产业链跟进。 风险提示 芯片制程发展与良率不及预期 中美科技领域政策恶化 智能手机销量不及预期 行业周报(简报) 敬请参阅最后一页特别声明 2 扫码获取更多服务 内容目录 海外市场行情回顾................................................................................ 3 Google Cloud Next 发布新模型和应用 .............................................................. 4 谷歌发布 TPUv7,强化 AI 推理与能效优势 ........................................................... 6 存储现货本周横盘调整............................................................................ 7 联发科发布新一代天玑 9400+芯片 .................................................................. 8 苹果可能于 2026 年发布折叠屏产品................................................................. 9 风险提示....................................................................................... 10 行业周报(简报) 敬请参阅最后一页特别声明 3 扫码获取更多服务 海外市场行情回顾 图表1:截至 4 月 11 日海外 AI 相关个股行情 来源:Reuters、国金证券研究所 行业周报(简报) 敬请参阅最后一页特别声明 4 扫码获取更多服务 Google Cloud Next 发布新模型和应用 图表2:聊天助手类 AI 应用活跃度 来源:Similarweb、国金证券研究所 行业周报(简报) 敬请参阅最后一页特别声明 5 扫码获取更多服务 从聊天助手访问量看,海外主要 AI 应用周度环比多数个位数小幅上升,国内 AI 应用活跃度上升明显,文心一言、Kimi、豆包和通义千问环比均上升超过 25%,元宝访问量上升约18%。 2025 年 4 月 9 日,在拉斯维加斯举行的 Google Cloud Next 2025 大会上,谷歌正式发布了 Agent Development Kit (ADK),一款全新的开源智能体开发框架。该基于 Python 的工具包旨在简化多智能体系统的构建、管理和部署流程,被视为 AI 代理开发领域的重要突破。 大会首日,谷歌还推出了全新的推理模型 Gemini 2.5 Flash,很快将向公众开放。与 Gemini 2.5 Pro 不同,该模型在提供强大性能的同时更注重效率,允许开发者根据查询复杂性动态调整处理时间,从而在速度、准确性和成本之间实现灵活平衡,尤其适用于高流量和实时性要求的商业场景,例如客户服务和文档解析。此外,谷歌宣布计划于第三季度开始支持 Gemini 模型的本地部署,进一步满足企业对数据管理和合规性的需求。 在工具层面,谷歌云 Vertex AI 平台迎来重大更新,新增视频、图像、语音和音乐生成 AI 工具,其中 Veo 2 视频生成模型新增编辑和相机控制功能,Imagen 3 图像生成模型则显著提升了对象移除的自然效果。更值得关注的是,谷歌发布了全新的开放协议 Agent2Agent (A2A),旨在连接不同生态系统中的 AI Agents,实现跨平台智能体之间的无缝通信和协作,有望大幅降低集成成本并提升企业生产力。A2A 协议基于 HTTP、SSE 和 JSON-RPC 等现有流行标准构建,旨在降低部署难度,并易于集成到企业现有的 IT 架构中。 行业周报(简报) 敬请参阅最后一页特别声明 6 扫码获取更多服务 图表3:视频生成类 AI 应用活跃度 来源:Similarweb、国金证券研究所 视频生成类应用中,Sora、Runway 均有小幅下降,可灵国内版因域名更新,原网站流量下降。 谷歌发布 TPUv7,强化 AI 推理与能效优势 谷歌公司在其 Cloud Next 25 大会上正式发布了其第七代张量处理单元(TPU),产品代号为 Ironwood (TPU v7)。此举标志着谷歌在人工智能定制硬件领域
[国金证券]:AI周观察:谷歌发布TPUv7和新模型应用,国内AI应用访问量提升,点击即可下载。报告格式为PDF,大小2.12M,页数11页,欢迎下载。
