星海系列:人形机器人与AI大模型之Robot+AI的Transformer之旅

本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 1 星海系列: 人形机器人与 AI 大模型之 Robot +AI 的 Transformer 之旅 2024 年 11 月 07 日 ➢ 从 Transformer 到多模态大模型的演进与应用。Transformer 不仅在语言处理上广泛应用,还扩展至图像、视频、音频等多模态任务。诸如 Stable Diffusion、VideoPoet 和 MusicLM 等模型展现了其强大的生成能力,推动了多模态大模型(MLLM)的发展。 ➢ 机器人现实世界至数据化的突破:RT-2、RoboCat 与 MimicGen。RT-2 通过大规模的视觉-语言预训练,将视觉识别与低级机器人控制结合,实现了机器人在复杂任务和未见环境中的强大泛化能力。RoboCat 则基于 Gato 模型,展示了多任务和多具身平台上的自我迭代学习能力,能够快速适应新任务并生成跨任务策略。英伟达的 MimicGen 自动生成大量模仿学习数据,有效减少了人工干预,提升了机器人学习的效率。 ➢ 特斯拉 FSD,端到端算法成为主流,数据为关键。2020 年 FSD 引入Transformer 模型,走向了数据驱动的模型范式,2024 年初 FSD V12 完全采用神经网络进行车辆控制,从机器视觉到驱动决策都将由神经网络进行控制。FSD V12 能够模拟人类驾驶决策,成为自动驾驶领域全新发展路径。 ➢ 英伟达 Robocasa:具体智能关键节点,首次论证 real-sim-real。通过升级模拟平台并构建模拟框架,基于厨房场景和原子任务、复合任务、真实世界三个场景收集行为数据集并进行结果评估。说明模拟器的丰富多样性以及视觉和物理真实性显著改善了模拟效果,实验结果首次论证了 real-sim-real 可行。 ➢ 后续演绎:在机器人 real-sim-real 可行,证明存在 scaling law 的基础上,持续推荐可执行任务的泛化能力,迈向真正的 AGI 智能化:1)李飞飞 Rekep:一种针对机器人操作任务的新型空间和时间约束表示方法,提供了一种三任务闭环的解决方案。通过关键点约束解构机器人行为,将操作行为分为多阶段,并构建子目标约束和路径约束,基于此提出一种三任务闭环的解决方案。同时,融入大型视觉模型和视觉-语言模型,利用 VLM 和 GPT-4o 生成 Rekep 约束,避免了手动指定 Rekep 的需要。2)1x 世界模型:首证扩展定律,能通过大量学习理解周围环境。通过大量的真实数据学习和模拟,机器人能够预测复杂的物体互动,理解周围环境,并灵活应对日常任务。1x 的进展首次在机器人上证明了扩展法则。3)GR-2 的高效动作预测与泛化能力。由字节跳动研究团队开发的第二代机器人大模型,凭借大规模视频预训练和多模态学习技术,展示了卓越的泛化能力与多任务通用性。4)数字表亲:机器人训练法优化,以更低的成本获取更好的泛化能力。在保留数字孪生优势的基础上,数字表亲表现出了更强的适应能力和鲁棒性,成功实现了从模拟到现实的零样本迁移,为机器人学习在复杂、多变的真实环境中的应用开辟了新的可能性。 ➢ 投资建议:1) 关注算法训练中,需要使用的传感器公司,如视觉方案奥比中光,力学方案安培龙;2)关注同步受益的机器人本体公司,如总成方案三花智控、拓普集团;丝杆公司北特科技、五洲新春、贝斯特、双林股份、震裕科技等;3)关注其他产业链可延伸公司。 ➢ 风险提示:机器人算法迭代进步速度不及预期,人形机器人落地场景实际需求不及预期 推荐 维持评级 [Table_Author] 分析师 李哲 执业证书: S0100521110006 邮箱: lizhe_yj@mszq.com 分析师 罗松 执业证书: S0100521110010 邮箱: luosong@mszq.com 相关研究 1.一周解一惑系列:轮胎模具需求稳步增长,出海空间广阔-2024/10/20 2.一周解一惑系列:苹果海外供应链受阻,国内有望新设产线-2024/10/13 3.一周解一惑:AI 驱动+产业转移,PCB 曝光设备受益-2024/09/30 4.一周解一惑系列:复盘日本拖拉机历史,大拖占比提升大势所趋-2024/09/21 5.扬帆系列:船舶需求分析(二):干散货船需求与测算-2024/09/18 行业深度研究/机械 本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明 证券研究报告 2 目录 1 Transformer 模型的演进:从语言翻译到多模态智能的前沿探索 ............................................................................. 3 1.1 开篇:Robot +AI 的核心时间线与关键节点结论 ...................................................................................................................... 3 1.2 Transformer 网络架构的提出.......................................................................................................................................................... 3 1.3 语言、图片、视频大模型的出现 .................................................................................................................................................... 4 1.4 多模态、跨模态大模型的难点 ......................................................................................................................................................... 6 1.5 Scaling Law 的存在 ........................................................................................................................................................................... 6 2 机器人现实世界至数据化的突破:RT-2、RoboCat 与 MimicGen ....................................................................

立即下载
综合
2024-11-07
民生证券
李哲,罗松
54页
4.8M
收藏
分享

[民生证券]:星海系列:人形机器人与AI大模型之Robot+AI的Transformer之旅,点击即可下载。报告格式为PDF,大小4.8M,页数54页,欢迎下载。

本报告共54页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共54页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
图表 1. 2024 年三季度业绩摘要
综合
2024-11-07
来源:三大板块协同发展,加速全球化布局
查看原文
图表 1.2024 年三季度业绩摘要
综合
2024-11-07
来源:固德威(688390)三季度业绩环比改善,推出股权激励计划
查看原文
2024Q3 主要新材料企业财务指标
综合
2024-11-07
来源:建材行业2024年三季报综述:行业延续承压,底部逐渐明确
查看原文
2024Q1-3 主要新材料企业财务指标
综合
2024-11-07
来源:建材行业2024年三季报综述:行业延续承压,底部逐渐明确
查看原文
国内碳纤维行业库存天数(天) 图 30:国内碳纤维行业周度开工率
综合
2024-11-07
来源:建材行业2024年三季报综述:行业延续承压,底部逐渐明确
查看原文
玻纤库存走势
综合
2024-11-07
来源:建材行业2024年三季报综述:行业延续承压,底部逐渐明确
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起