DeepSeek应用与部署PPT
DeepSeek应用与部署山东大学经济学院 教授山东大学国家治理研究院 研究员李铁岗听听真我数字人讲DeepSeekAIGC发展历程AIGC 2014-2024自然语言处理与语言模型大语言模型LLM:2018 —2024DeepSeek介绍DeepSeek:2023 —DeepSeek:技术创新——模型架构 | V2(Multi-Head Latent Attention)DeepSeek:技术创新—模型架构 | V3DeepSeek:技术创新—推理模型 | RL强化学习让智能体(Agent)在环境(Environment)中不断尝试、学习,并优化自己的策略(Policy),最终获得最大化的奖励(Reward)。 PPO:Proximal Policy OptimizationGRPO:Group Relative Policy OptimizationDeepSeek应用场景DeepSeek的能力层级• 1. 基础能力层 多模态数据融合与结构化理解,包括跨模态语义对齐(文本、图像、音频、视频、代码、传感器数据统一语义)和动态数据治理(解决数据缺失、噪音干扰、概念飘逸等),支持200多种数据格式自动解析。• 2. 中级能力层 领域问题建模与复杂推理,包括领域自适应学习(建立医、教育、金融垂直应用于模型)、因果推理引擎(建立因果图模型)和多目标优化决策(求解帕 累托最有解)。• 3. 高级能力层 复杂系统建模与自主决策,包括数字孪生仿真系统(构建物理于数字融合虚拟环境模拟天气等)、多智能体协同优化(将每个个体作为智能体通过联邦学习模拟群体行为)和元认知调控机制(实施监控自身决策、动态分配资源、自动触发行为)。• 4. 终极能力层 自主进化与创造性突破,包括概念空间探索(通过对抗网络探索新合金成分等)、范式转移预警(监控跨领域知识流、识别技术革命前兆)和自编程能力(自动模块设计、代码编写、测试用例)。Deepseek V3Deepseek R1Deepseek r1鞅的证明Deepseek r1 Roy安全准则组合模型推理Deepseek r1推理玻尿酸配方DeepSeek提示词工程提示词工程Deepseek十类提示词• 1. 内容生成类 :文本生成、代码生成、创意生成和数据模拟。• 2. 信息处理类 :文本摘要、信息抽取、情感分析和多语言翻译。• 3. 对话交互类 :角色扮演、多轮对话、反问引导。• 4. 技能应用类 :数学计算、代码解释、逻辑推理。• 5. 个性化定制类 :风格迁移、知识库绑定、偏好记忆。• 6. 系统操作类:模式切换、资源优化、记忆管理。 • 7. 知识查询类:事实核查、概念解释、溯源检索。 • 8. 教育与研究类:题目生成、论文润色、实验设计。 • 9. 多模态处理类:图文互译、表格解析、视频脚本。 • 10. 伦理与安全类:内容审核、价值观对齐、风险预警。DeepSeek部署方案Deepseek部署全线图本地部署蒸馏小模型第三方UI客户管接入服务云端网站接入服务移动手机应用DeepseekDeepseek模型及蒸馏模型API接入API及蒸馏模型API及蒸馏模型Chatbox API及网络调用本地网络调用Chatbox API及网络调用DeepseeK替代部署方案• 本地部署蒸馏小模型:可通过ollama平台、LM Studio平台快速本地部署基于Llama和Qwen蒸馏的DeepSeek - R1推理模型,涵盖多种不同参数规模,适合想在本地运行模型的用户。• 第三方UI客户管接入服务:可通过Anything LLM、Cherry Studio、Chatbox等选择API接入。• 秘塔AI搜索:接入满血版DeepSeek - R1推理模型,无广告且搜索结果直达。以学习JDK21新特性为例,能详细给出学习计划,包括快速预览、深入学习核心特性、实战与总结等阶段。• 硅基流动:注册即送2000万Tokens,提供多个基于DeepSeek - R1蒸馏训练的模型,如DeepSeek - R1 - Distill - Llama - 70B等,在推理能力上表现出色。• 阿里云百炼:提供多个DeepSeek系列模型,如DeepSeek - V3、DeepSeek - R1 - Distill - Qwen - 1.5B等,部分限时免费,涵盖文本生成等功能。• 百度智能云:千帆ModelBuilder全面支持DeepSeek - R1/V3调用,且限时免费,其模型在百科知识、数学推理等任务表现突出。• 英伟达:可通过特定接口调用DeepSeek - R1 671B全量模型,获取API Key后能进行相关操作。DeepSeek API调用API 调用方法• DeepSeek API model='deepseek-chat' 即可调用 DeepSeek-V3model='deepseek-reasoner',即可调用 DeepSeek-R1。Token 用量计算• token 是模型用来表示自然语言文本的基本单位,也是我们的计费单元,可以直观的理解为“字”或“词”;通常 1 个中文词语、1 个英文单词、1 个数字或 1 个符号计为 1 个 token。• 一般情况下模型中 token 和字数的换算比例大致如下:• 1 个英文字符 ≈ 0.3 个 token。• 1 个中文字符 ≈ 0.6 个 token。• 但因为不同模型的分词不同,所以换算比例也存在差异,每一次实际处理 token 数量以模型返回为准,您可以从返回结果的 usage 中查看。阿里云部署Deepseek以 DeepSeek-R1 满血版为例进行演示,通过百炼模型服务进行 DeepSeek 开源模型调用,可以根据实际需求选择其他参数规模的 DeepSeek 模型。百炼平台的 API 提供标准化接口,无需自行搭建模型服务基础设施,且具备负载均衡和自动扩缩容机制,保障 API 调用稳定性。搭配 Chatbox 可视化界面客户端,进一步简化了调用流程,无需在命令行中操作,通过图形化界面即可轻松配置和使用 DeepSeek 模型。https://chatboxai.app/zh#downloadDeepSeekDeepSeekDeepSeek-R1-Ditill-Qwen-1.5BDeepSeek-R1-Ditill-Qwen-7BDeepSeek-R1-Ditill-Qwen-14BDeepSeek-R1-Ditill-Qwen-32BDeepSeek-R1-Ditill-Ollama-7BDeepSeek-R1-Distill-Ollama-7BDeepSeek-R1DeepSeek-V3腾讯云部署流程• Cloud Studio:登录腾讯云官网,进入Cloud Studio,可一键部署,即开即用,能快速体验7B以下DeepSeek - R1蒸馏模型。• 云原生构建:登录腾讯云,云原生构建相关服务,一键体验DeepSeek,无需等待下载,支持1.5b/7b/8b/14b/32b多款模型。• TI平台:登录腾讯云TI平台,提供专属算力、多种尺寸模型、0代码模型部署等功能。• HAI:登录腾讯云
[山东大学]:DeepSeek应用与部署PPT,点击即可下载。报告格式为PDF,大小8.82M,页数80页,欢迎下载。