计算机行业点评:英伟达发布NIM软件包,简化AI部署

此报告仅供内部客户参考 请务必阅读正文之后的免责条款部分 证券研究报告 英伟达发布 NIM 软件包,简化 AI 部署 计算机行业点评 2024 年 07 月 30 日 评级 同步大市 评级变动: 维持 行 业涨跌幅比较 % 1M 3M 12M 计算机 -4.38 -15.38 -35.42 沪深 300 -2.05 -5.40 -15.08 何 晨 分 析师 执业证书编号:S0530513080001 hechen@hnchasing.com 黄 奕景 研 究助理 huangyijing@hnchasing.com 相关报告 1 计算机行业 6 月月报:AI 和自主可控为大势所趋 2024-07-02 2 计算机行业 5 月月报:信创产业有望边际回暖,算力资本开支延续高景气 2024-06-03 3 计算机行业点评:安可测评结果出炉,信创订单有望释放 2024-05-21 重 点股票 2023A 2024E 2025E 评 级 EPS(元) PE( 倍 ) EPS( 元 ) PE(倍) EPS(元) PE( 倍 ) 浪潮信息 1.21 30.52 1.45 25.45 1.73 21.34 增持 资料来源:iFinD,财信证券 注:按照 7-29 收盘价计算 投资要点:  英伟达发布全新软件包 NIM。 财联社 7 月 30 日电,英伟达公司正式发布了 Nvidia inference micro services(NIM),这个软件包可以解决将AI 用于特定目的所需的许多后勤问题。生成式 AI 是聊天机器人、语音识别和其他自动化人机交互背后的技术,通常需要协调众多硬件、软件和信息检索。许多公司不具备这方面的专业知识,所以英伟达试图就此提供服务并收取费用。英伟达创始人兼首席执行官黄仁勋周一在丹佛举行的 Siggraph 大会上展示并宣传了该最新产品。  什么是 NIM:NVIDIA NIM 是一套经过优化的云原生微服务,旨在缩短 AI 上市时间,并简化生成式 AI 模型在云、数据中心和 GPU 加速工作站的任何位置的部署。借助行业标准 API 和抽象化 AI 模型开发,开发者可以使用几行代码借助 NIM 部署 AI 模型。  NIM 的核心优势:1)随时随地部署;2)使用行业标准 API 进行开发;3)利用特定领域的模型;4)在优化的推理引擎上运行;5)支持企业级 AI;6)加速 AI 模型随时可供部署。  投资建议: NIM 作为英伟达在 AI 应用层的全新软件工具包,进一步巩固了英伟达在 AI 领域的竞争优势和护城河。国内的企业级 AI 开发者也有望通过英伟达中国的解决方案合作伙伴使用 NIM 服务进行 AI模型部署。建议关注:亚康股份、紫光股份、浪潮信息。  风险提示:AI技术发展不及预期;宏观环境不及预期;政策不及预期。 -38%-28%-18%-8%2%12%2023/072023/102024/012024/042024/07计算机沪深300行业点评 计算机 此报告仅供内部客户参考 -2- 请务必阅读正文之后的免责条款部分 行业研究报告 1 什么是 NIM? NVIDIA NIM 是一套经过优化的云原生微服务,旨在缩短 AI 上市时间,并简化生成式 AI 模型在云、数据中心和 GPU 加速工作站的任何位置的部署。借助行业标准 API 和抽象化 AI 模型开发,开发者可以使用几行代码借助 NIM 部署 AI 模型。NIM 容器可与Kubernetes(K8s)生态系统无缝集成,从而实现容器化 AI 应用程序的高效编排和管理。 图 1: NVIDIA NIM工 作 原 理 资料来源:英伟达官网,财信证券 2 NIM 核心优势 1)随时随地部署 NIM 专为可移植性和可控性而构建,支持跨各种基础设施 (从本地工作站到云再到本地数据中心) 进行模型部署。其中包括 NVIDIA DGX、NVIDIA DGX 云、NVIDIA 认证系统、NVIDIA RTX 工作站和 PC。 NIM 通过预构建的容器和 Helm Chart 打包了优化模型,并在不同的 NVIDIA 硬件平台、云服务提供商和 Kubernetes 发行版中进行了严格验证和基准测试。这支持所有NVIDIA 驱动的环境,并确保组织可以在任何地方部署其生成式 AI 应用。 2)使用行业标准 API 进行开发 开发者可以通过符合每个领域行业标准的 API 访问 AI 模型,从而简化 AI 应用的开发。这些 API 与生态系统中的标准部署流程兼容,使开发者能够快速更新其 AI 应用(通常只需 3 行代码)。这种无缝集成和易用性有助于在企业环境中快速部署和扩展 AI 解决方案。 3)利用特定领域的模型 此报告仅供内部客户参考 -3- 请务必阅读正文之后的免责条款部分 行业研究报告 NIM 包含特定于领域的 NVIDIA CUDA 库,以及为语言、语音、视频处理、医疗健康等各个领域量身定制的专用代码,可确保应用程序准确无误并与其特定用例相关。 4)在优化的推理引擎上运行 NIM 针对每个模型和硬件设置利用经过优化的推理引擎,在加速基础设施上提供尽可能好的延迟和吞吐量。这降低了在扩展推理工作负载时运行推理工作负载的成本,并改善了最终用户体验。除了支持优化的社区模型外,开发者还可以通过使用从未离开数据中心边界的专有数据源对模型进行对齐和微调,从而实现更高的准确性和性能。 5)支持企业级 AI 作为 NVIDIA AI Enterprise 的一部分,NIM 采用企业级基础容器构建,通过功能分支、严格的验证、通过服务级别协议提供的企业级支持以及针对 CVE 的定期安全更新,为企业 AI 软件提供坚实的基础。全面的支持结构和优化功能突出了 NIM 作为在生产环境中部署高效、可扩展和定制的 AI 应用的关键工具的作用。 6)加速 AI 模型随时可供部署 支持多种 AI 模型,包括社区模型 NVIDIA AI 基础模型和 NVIDIA 合作伙伴提供的定制 AI 模型。NIM 支持跨多个领域的 AI 用例,包括 大型语言模型 (LLM)、视觉语言模型 (VLM),以及用于语音、图像、视频、3D、药物研发、医学成像等的模型。 开发者可以使用 NVIDI 托管的云 API 测试新的生成式 AI 模型,或者通过下载 NIM 来自行托管模型,并在主要云提供商或本地使用 Kubernetes 快速部署,以减少开发时间、复杂性和成本。 NIM 微服务通过打包算法、系统和运行时优化并添加行业标准 API 来简化 AI 模型部署流程。这使开发者能够将 NIM 集成到其

立即下载
信息科技
2024-08-02
财信证券
5页
0.63M
收藏
分享

[财信证券]:计算机行业点评:英伟达发布NIM软件包,简化AI部署,点击即可下载。报告格式为PDF,大小0.63M,页数5页,欢迎下载。

本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
万得一致盈利预测
信息科技
2024-08-01
来源:新质生产力专题研究:发展新质生产力,技术创新及颠覆性突破是核心要素
查看原文
国内厂商产品进展
信息科技
2024-08-01
来源:新质生产力专题研究:发展新质生产力,技术创新及颠覆性突破是核心要素
查看原文
国家层面低空经济相关政策梳理
信息科技
2024-08-01
来源:新质生产力专题研究:发展新质生产力,技术创新及颠覆性突破是核心要素
查看原文
低空经济产业链
信息科技
2024-08-01
来源:新质生产力专题研究:发展新质生产力,技术创新及颠覆性突破是核心要素
查看原文
国家空域基础分类示意图 图 12:eVTOL 示意图
信息科技
2024-08-01
来源:新质生产力专题研究:发展新质生产力,技术创新及颠覆性突破是核心要素
查看原文
从整体看半导体设备国产化率仍处于较低水平
信息科技
2024-08-01
来源:新质生产力专题研究:发展新质生产力,技术创新及颠覆性突破是核心要素
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起