与开发者同频——百度构建人机协同新范式的实践

与开发者同频 —— 百度构建人机协同新范式的实践 牛万鹏 百度Comate架构师演讲嘉宾牛万鹏百度Comate架构师百度资深研发工程师,毕业于吉林大学,毕业后入职百度长期负责DevOps工具的孵化和落地,涵盖项目管理、代码管理、流水线、制品库、应用部署、运维管理等平台建设和商业化现负责百度研发智能化,通过构造全新智能编码工具,搭建全新的产品形态,推动百度万人研发范式的变革。目 录CONTENTS1.在AI前夜——百度研发现状2.在AI时代——智能研发助手3.在AI未来——人机协同新范式在AI前夜——百度研发现状PART 01业界软件开发模式的发展轨迹软件开发的基本性质沟通密集性协作密集性持续迭代性不可复制性需要每个角色密切沟通,保证理解一致性,降低随机性需要从产品经理到研发、测试、运维等一系列的角色参与代码要被不断组装在一起,不断打补丁,让软件系统能够持续工作软件规模虽然在不断扩大,但并非重复,工程师每天都写不同的代码研发协作的密度增高和迭代周期增长,引起效率降低。瀑布模型敏捷精益DevOps研发效能时期业务复杂度DOS/PCPC(GUI)/客户端-服务器Web / 互联网移动/云AI/边缘/量子…全部聚焦『流程提效』 极少关注『个人提效』百度研效工具的发展轨迹•SVN•Jenkins•iCafe•iCode•iPipe时期业务复杂度DOS/PCPC(GUI)/客户端-服务器Web / 互联网移动/云AI/边缘/量子…•iCafe•iCode•iPipe•iScan•iCov•iTest•iCafe•iCode•iPipe•iScan•iCov•iTest•工程能力底图•价值流、健康度•iCafe•iCode•iPipe•iScan•iCov•iTest•工程能力底图•价值流、健康度•一站式、云原生Ø 1w+工程师 ,1k+业务团队,10w+代码库Ø 85%的需求一周交付,50%的研发资源云化Ø 80%的应用从开发到上线全流程在线 Ø 每天1w次代码提交Ø 每月1kw次流水线自动化任务流程支撑工具支撑聚焦『流程』+『协作工具』面向流程的研发提效窘境n 技术迭代的太快,流程的更新赶不上技术的更新,持续滞后阻碍研发效率提升ü 流程是是实践后的经验、教训等总结,一定是『滞后的』ü 如,针对Prompt、数据集等在工程团队如何管理,目前没有明确的范式n 多数开发者对敏捷、效能、DevOps等不感冒,也不理解其实际意义ü 面对花样繁多的项目管理流程,多数开发者更想聚焦于研发ü 过度在团队内推广研发流程,反而引起开发者的抗拒心理,大幅降低开发者的幸福感核心原因在于整个提效的设计不是站在开发者个人,而是站在组织上Github Copilot + ChatGPT的诞生,吹响了『开发者个人提效』的号角,几乎一夜之间所有组织都开始关注智能研发助手 = 代码自动补全(Completions)+ 理解私域知识(RAG) + 独立分析需求(Agent)大模型催生了开发者个人提效的『银弹』开发者的『iPhone』时刻在AI时代——智能研发助手PART 02Baidu Comate的从无到有0.27%1.82%7.53%15.27%25%27%202223-Q123-Q223-Q323-Q4当前代码⽣成占⽐30%百度内部 Comate 代码生成占比百度全局提效 工程师使用 85%+用户满意度 90%+代码生成占比 30%+采纳率 46%+智能研发助手发展路径012354Human引领AI驱动AI引领无助手代码续写代码生成知识增强代码智能体自适应全自主ü 单指令交互ü 基于通用知识ü 快思考ü 多轮交互ü 基于私域+领域知识ü 慢思考当前节点整体建设思路模型层推理调度 + 代码生成 + 代码续写 + Embedding + 意图识别知识层代码类(代码片段、代码依赖等)+ 文本类(技术文档、需求文档等)框架层Agent + RAG + P-RAG能力层IDE端(目录区、编辑区、Console区等)能力层问答区编辑区Console区能力层 —— 编辑区代码续写,根据代码上下文自动触发-单行推荐-多行推荐-基于注释推荐-基于上下文依赖推荐1函数头上快捷键,开发者主动触发-函数注释-行间注释-生成单测-代码解释-调优建议-函数拆分2能力层 —— 问答区点击唤起Comate问答区1向Comate提问,咨询任何通用问题、生成通用代码等2通过『#』命令符唤起知识增强选项,如-基于网络检索,查询最新的技术方案-基于当前代码库,检索代码库内的相关代码-基于知识集,查询团队内的技术方案3能力层 —— Console区在VSCode通过选中错误内容后,右键打开Comate快速修复。1在JetBrains自动捕捉错误,开发者可一键点击修复。2知识层 —— 为什么需要知识增强•通用模型存在瓶颈:GitHub采纳率停留在46%,长期没有显著增长。主要在于依靠模型内部压缩的知识(以及少量的Neighborsource)没有办法再给出更符合『当前代码库』、更符合『当前业务逻辑』的代码,达到模型瓶颈。•人类程序员在开发时也需要掌握额外的知识:编程现场会存在大量『私域知识』,如本地代码库、业务接口文档等。这些私域知识组成了每个『业务/项目/服务』的全链路开发指南,当我们对这些知识掌握的越完整、越熟练,在开发新的代码时速度越快,编写的代码质量越高。•知识增强是Comate进化成智能体的必要前提:对『编程现场』的理解是所有编码助手的下一步方向,是能够突破现有瓶颈,大幅提高开发者效率,构造真正的人机协同的必经之路。知识层 —— 与开发者同频业务接口文档本地代码库产品需求文档测试用例文档服务部署文档本地Console信息编程现场存在于开发者脑海之中具象成知识给到编程助手代码类:向量检索、关键词检索、元信息检索文本类:向量检索、关键词检索依靠对开发者编程现场的理解,保持和开发者同频,帮助开发者解决繁琐、重复的问题。对『编程现场』的理解:• 是所有编码助手的下一步方向• 是从『简单续写』到『复杂生成』的必经之路• 是能够大幅提高开发者效率,构造真正的人机协同的必经之路知识层 —— 如何完全理解文本业务接口文档产品需求文档测试用例文档文本服务部署文档如果有大量的文档分散在不同的目录中,建议每个层级目录的命名言简意赅,能够充分表达这一层级目录的文档类别。文字描述丰富目录结构清晰文档逻辑清晰文档中尽可能增加详实的文字描述而不仅仅是图片,将会显著提高学习质量。文档内容有层次、语言描述言简意赅无歧义、每个段落有标题等结构,会显著提高检索质量。PaddlePaddle某篇技术说明文档AI阅读文档的逻辑和人一样,文档结构越清晰,AI学习的越好。知识层 —— 人类如何完全理解代码目录层级宏观项目职责技术栈关键业务词汇核心逻辑实体关系启动/构建对外API微观这是一个用来xxxxx的项目,它的使用了xxxx、xxxx等框架,分为xxxx、xxxx等模块。主要逻辑包括xxxx、xxxx、xxxx。对外暴露了xxxx、xxxx等关键API。它使用xxxx方式进行部署,启动入口在xxxx。脑海中『直接』沉淀出如下总结这个项目中,新增xxx相

立即下载
电子设备
2025-03-24
中智凯灵(北京)科技
36页
8.18M
收藏
分享

[中智凯灵(北京)科技]:与开发者同频——百度构建人机协同新范式的实践,点击即可下载。报告格式为PDF,大小8.18M,页数36页,欢迎下载。

本报告共36页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共36页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
全球各厂商头戴式 VR 市场份额
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
各智能手机品牌在印度的市场份额
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
北美三大 CSP 厂资本开支
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
中国台湾服务器相关营收(亿新台币)
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
全球公共充电桩保有量情况
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
覆盖标的本周涨跌幅
电子设备
2025-03-24
来源:半导体与半导体生产设备行业周报:GTC未超预期英伟达股价承压,CSP资本开支提升AI基建逻辑不变
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起