计算机行业:DeepSeek+DeepResearch应用
DeepSeek+Deep Research应用2025年2月10日 壹 参与式观察一个团队的 大模型应用与内化贰Deep Research应用概述叁推理大模型使用心得目 录 AI大事记(简版) 通用大模型怎么了?推理大模型这么火!概述:推理大模型建立在通用大模型基础之上,在推理框架上线之前,通用大模型直接回答。那现在就让他基于思维链,一步一步做好规划、调整、校对并完成输出。所以通用大模型和推理大模型它不是矛盾的存在。简单来看,推理大模型和通用大模型功能不一,如果把AI模型比作工具包,DeepSeek把传统通用大模型比作一把瑞士军刀,功能多但不够锋利;推理大模型则像手术刀,专精切割但用途单一。1.需求明确度✅ 任务模糊(如闲聊):选通用模型-HER✅ 目标明确(如解数学题):选推理模型-Deadline2.容错成本✅ 允许试错(如写诗):通用模型✅ 必须精确(如医疗诊断):推理模型3.资源限制✅ 算力充足:可叠加使用两者✅ 预算有限:按核心需求单选选择指南核心对比 通用大模型+推理大模型也是“王炸”组合通用模型:处理90%的常规咨询(查订单、退换货) 推理模型:解决5%的复杂纠纷(多环节理赔计算)实战案例应用:电商客服场景顾客:你好,我想查一下我的订单号为123456789的订单状态。通用客服模型:您好!很高兴为您服务。您的订单号123456789目前处于“已发货”状态,发货时间是2025年2月9日。根据物流信息,预计将在2月12日送达。您可以通过以下物流单号在快递官网查询详细物流信息:[物流单号]。如果您还有其他问题,欢迎随时咨询。顾客:好的,谢谢!另外,我收到商品后发现有一件商品损坏了,我需要申请退换货。通用客服模型:非常抱歉给您带来不便。关于商品损坏的问题,您可以选择退货或换货。请先告诉我以下信息:1.您要申请退换货的商品名称和数量;2.损坏的具体情况(最好提供照片);3.您希望选择退货还是换货。顾客:是这款智能手表,我需要换货。手表的屏幕碎了,我这就拍照上传。通用客服模型:好的,麻烦您上传照片,我会为您核实情况并处理换货申请。同时,请您确保商品包装完整,配件齐全,以便我们顺利为您处理换货。(顾客上传照片后)通用客服模型:感谢您提供照片,商品损坏情况已经确认。我们已为您发起换货申请,预计换货商品将在3 - 5个工作日内发出。您可以在“我的订单” - “售后服务”中查看换货进度。如果还有其他问题,可以随时联系我们。顾客:好的,我知道了。还有一个问题,我在购买时购买了商品的延长保修服务,这次换货后,保修期怎么计算?推理客服模型:您好,关于延长保修服务的问题,我来为您详细解答。根据我们的保修政策,当您购买商品并附加延长保修服务时,保修期是从商品购买日期开始计算的。如果在保修期内发生换货,新的商品保修期将从换货完成日期重新计算,但总保修时长不会超过原购买的延长保修期限。例如,您购买的商品保修期为1年,同时购买了1年的延长保修服务,总保修期为2年。如果在保修期内换货,新的商品保修期将从换货完成日期开始,再计算剩余的保修时长。如果换货发生在保修期的第10个月,那么新的商品将有14个月的保修期(2年总保修期减去已过的10个月)。如果您还有其他疑问,或者需要进一步确认保修细节,可以提供您的订单号,我为您查询具体的保修信息。“没有最好的模型,只有最合适的工具——通用模型是社交达人,推理模型是解题高手,用好这对黄金组合,才是AI时代的生存之道。”——DeepSeek行业产品端融合:谷歌PaLI-3、Anthropic Claude已尝试在通用模型中嵌入推理模块技术突破:思维链(Chain-of-Thought)技术让两类模型能力边界逐渐模糊当前建议:优先关注垂直领域优化模型(如医疗推理专用模型) 直观感受通用大模型和推理大模型的差异实战案例应用:分析辅助Prompt:在推理大模型的帮助下,没有建立起独立思考能力的人来说,是一种退步大模型2:进一步明确任务大模型1:将观点作为核心结论,细化后成文DeepSeek:呈现拟人化思考过程1、对核心定义的具象化和确定性思考:你说的是啥?颗粒度对齐一下2、需求场景和用途思考,决定大方向正确与否:用来干什么?呈给谁看?3、定写作方向、基本思路,乃至一级提纲确立类思考:从哪个角度切入?此刻我的os:结果怎么样再说,看这个思考过程挺靠谱,很有想法!…… 直观感受通用大模型和推理大模型的差异:DeepSeek生成实战案例应用:分析辅助DeepSeek输出材料:更像个人,不是停留在语义层面的“拟人”,而是在独立、认真思考等更深层面Prompt:在推理大模型的帮助下,没有建立起独立思考能力的人来说,是一种退步壹Deep Research应用概述PART ONE(一)DeepSeek 深度思考R1概述及主要用途 DeepSeek 深度思考R1 是一款基于深度学习技术的推理模型,其核心功能在于通过强化学习提升模型的推理能力。其设计目标是通过强化学习等技术,引入了自我反思能力,使其在推理过程中能够自我验证和反思,从而提高推理的准确性和可靠性。 性能数据:官方数据显示,DeepSeek R1 在数学、代码、自然语言推理等任务上的表现已可与OpenAI的顶级模型GPT-4相当。例如,DeepSeek系列模型在美国高级中学数学竞赛 AIME 2024 题目上的一次性解题正确率达到39.2%,而GPT-4仅约9.3%。 现实案例:业内已经出现利用该模型辅助科研的例子。例如,有研究者在实验中让DeepSeek模型逐步求解AIME(美国数学邀请赛)竞赛难题,DeepSeek展现了清晰的链式推理过程,输出的思路连贯且易于理解。 思维链设计:DeepSeek 深度思考R1通过原生思维链设计,使模型在推理过程中能够生成详细的推理路径。这种设计不仅提高了推理的准确性,还增强了模型的可解释性。 四步理解DeepSeek R1功能推理流程帮我画出DeepSeek R1 的推理过程流程图,流程图的每个阶段需标注关键技术。以下是推理过程文字描述:DeepSeek R1 的推理过程可以划分为四个主要阶段,每个阶段都运用了特定的 AI 技术来逐步完善推理链条,最终得出高质量答案。这一流程采用蓝色系流程图设计,结构清晰,便于在 PPT 中展示和理解。以下是各阶段及其关键技术说明: 1输入阶段(用户问题解析)用户输入自然语言问题,DeepSeek R1 首先对问题进行理解与解析。 在这一阶段,模型运用了**自然语言处理(NLP)**技术,将用户的自然语言提问转换为机器可理解的内部表示,提取问题的意图和关键信息。通过对输入的预处理,模型为后续推理做好准备。 2思维链生成(构建初步推理路径)根据解析后的问题,DeepSeek R1 开始“思考”,生成解决问题的初步步骤链条(即思维链)。 这一过程运用了**思维链推理(Chain-of-Thought, CoT)**技术。模型被鼓励像人类一样逐步思考,将复杂问题拆解为一系列连贯的中间推理步骤,并在每个步骤产出过渡结论。这种链式推理能提升模型对复杂任务的准确性和透明度,让观众看到模型解决问题的思
[清华大学]:计算机行业:DeepSeek+DeepResearch应用,点击即可下载。报告格式为PDF,大小8.84M,页数58页,欢迎下载。