2024AI+研发数字峰会:大模型驱动的多智能体协同初探

大模型驱动的多智能体协同初探钱忱 清华大学演讲嘉宾钱忱清华大学 博士后清华大学软件学院博士,现于清华大学自然语言处理实验室(THUNLP)担任博士后,清华大学水木学者,主要研究方向为预训练模型、自主智能体、群体智能;合作导师为孙茂松和刘知远教授,曾在ACL、SIGIR、ICLR、AAAI、CIKM等人工智能、信息管理、软件工程等相关的国际学术会议或期刊上以第一作者身份发表论文数篇。在群体智能方面,主持发布了大语言模型驱动的群体协作框架ChatDev、群体共学习范式Co-Learning、群体协同网络MacNet,面向任务完成和社会模拟的多智能体平台AgentVerse等。目 录CONTENTS1.从大模型走向自主智能体2.大模型多智能体系统3.多智能体协同及演化4.智能体协同的缩放法则5.总结与展望从大模型走向自主智能体PART 01大模型驱动的自主智能体学习环境静态训练数据有限监督信号直接大模型为智能“灵魂”学习环境动态训练数据无限监督信号间接智能体为智能“载体”大模型驱动智能体智能体反馈大模型• 基础大模型作为智能应用技术的内核,必须以自主智能体作为载体与动态环境进行交互,才能充分胜任动态复杂的智能应用,因此亟需发展大模型驱动的自主智能体技术人工智能将进入智能体时代2023 年 11 月 6 日 ,OpenAI在第一届开发者大会上正式提出构建自主智能体及相关生态的战略目标自主智能体是OpenAI核心战略之一自主智能体相关研究在大模型带动下迅速成为人工智能研究必争之地,2023年自主智能体研究论文数量呈井喷趋势自主智能体相关研究爆发式增长现处于争夺自主智能体技术高地的重要战略窗口期目前自主智能体技术呈现百花齐放、多面竞争态势,我国与人工智能领域国际领先研发机构(OpenAI、微软、谷歌、Meta、斯坦福大学等)处于同一起跑线2年增长约100倍人类智能与人工智能• 人工智能很可能即将走跟人类智能一样的发展路径人类智能人工智能脑容量小脑容量大工具使用群体协作小模型大模型智能体群体智能XAgent:大模型驱动的自主智能体框架• XAgent通过双循环机制协调决策制定和任务执行过程:外循环规划、内循环执行• 外循环处理任务的高级管理和分配,内循环专注每个子任务的低级执行和优化大模型多智能体系统PART 02多智能体系统的两种基本类型斯坦福SmallVille小镇:基于层次规划的智能体社会小镇,实现人类社群行为的可信模拟清华ChatDev数字团队:基于语言交互的智能体数字公司,实现群体协作式软件开发社会模拟型任务完成型Chen Qian, et al. ChatDev: Communicative Agents for Software Development. In ACL-2024.Park J S, et al. Generative agents: Interactive simulacra of human behavior. In UIST-2023.多智能体自主交互:任务解决新范式• 群体协作实现多方优势互补、配合无间,提高解决问题的准确率• 语言交互搭建沟通桥梁、缓解信息茧房,通过任务分工和协作执行处理复杂任务⾃主智能体群体协作?!!!?- - - -- - - -- - - -- - - -- - - -解决⽅案复杂任务⼤语⾔模型多智能体系统核心研究框架• 顺序型:各子组织间依次行动• 互斥型:各子组织间选择性行动• 并发型:各子组织间并行行动• 无目标导向型:群体自由规划及行为执行(e.g., 社会模拟)• 目标导向型:制定群体特定目标以协同进行任务完成(e.g., 软件开发)• 行为关系:合作关系、竞争关系• 组织行为:激励行为、团队凝聚力、劳动力多元化、资源竞争、同龄人压力、群体懈怠、评价焦虑、情绪感染等任务目标组织管理社会组织行为路由• 联盟结构:独立结构、层次化结构、中心化结构、全连接结构• 组织规模:小规模、中规模、大规模……多智能体协同及演化PART 03ChatDev – 交互链进行编排• 通过角色扮演交流实现智能体间的方案提议和决策研讨过程• 交流链将复杂任务分解为由原子任务组成的“方案生产线”Chen Qian, et al. ChatDev: Communicative Agents for Software Development. In ACL-2024.CEOCPOCEOCTOCTOProgrammerProgrammerReviewerProgrammerTesterCTOProgrammer{modality}{language}{code}{code}{code}{spec}{task}DesignerProgrammer{code}CEOCPO{manual}CTOProgrammerCEOCPODocumentingTestingCTOProgrammerDesignerCodingCEOCPOCTODesigninginstructorassistantWaterfall ModelPhase-LevelChat ChainChat-LevelProgrammerReviewerTesterChatDev – 交互机制Chen Qian, et al. ChatDev: Communicative Agents for Software Development. In ACL-2024.• 通过角色化、记忆流、自反思机制,实现自上下文感知的主交互You are a CEO for decision-making…You are a CTO for system design…Language?Too Hard!Java, ok?Python!The Process of Communication{Dialogue}.Conclusion?— — —— —— —— —{Dialogue}Python!PseudoQuestionerChatDev – 交互模式Chen Qian, et al. ChatDev: Communicative Agents for Software Development. In ACL-2024.• 通过交互除幻机制(Communicative Dehallucination)缓解编码幻觉(Coding Hallucination)TesterProgrammerTraceback: File “main.py", line 12 self.num = nNameError: name 'n' is not definedExplain and Suggest:NameError is …Add parameter n in initProgrammerTesterSuggestion:Add parameter n in initclass Game: def init(self, n): self.num = n ... TesterTest Pass!多智能体协同实现“降本增效”• 软件制作平均时间小于7.0分钟且制作成本约$0.3美元Chen Qian

立即下载
电子设备
2025-03-24
中智凯灵(北京)科技
35页
13.68M
收藏
分享

[中智凯灵(北京)科技]:2024AI+研发数字峰会:大模型驱动的多智能体协同初探,点击即可下载。报告格式为PDF,大小13.68M,页数35页,欢迎下载。

本报告共35页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共35页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
全球各厂商头戴式 VR 市场份额
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
各智能手机品牌在印度的市场份额
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
北美三大 CSP 厂资本开支
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
中国台湾服务器相关营收(亿新台币)
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
全球公共充电桩保有量情况
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
覆盖标的本周涨跌幅
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起