Deepseek在药企研发领域的本地化部署和应用场景-智慧芽
Deepseek在药企研发领域的本地化部署和应用场景智慧芽生物医药2025年03月目录Deepseek-R1在药企的本地化部署02芽仔与Deepseek-R1对接03AI融入智慧芽生物医药产品04大模型的发展阶段和deepseek01智慧芽@LS-GTM2资料来源:中文大模型基准测评2024年度报告(2025.01.08)大模型的发展阶段智慧芽@LS-GTM3•基础能力:进入推理模型阶段,跻身全球第一梯队•推理能力跃升:DeepSeek大模型核心技术突破,实现复杂推理任务的精准处理与高效执行,覆盖多模态场景应用。•国际竞争力对标:模型综合性能跃居全球第一梯队,技术指标与国际顶尖水平(如GPT系列、Claude等)直接对标,奠定国产大模型的行业标杆地位。•加分项:开源、低成本、国产化Deepseek出圈引爆全行业的原因?智慧芽@LS-GTM4•打破垄断:R1版以低成本和开源特性打破以往头部企业垄断局面。•价格优势:DeepSeek-R1的API定价仅为行业均价的1/10,推动了中小型企业低成本接入AI,对各个行业产生了积极影响。•创新:重新定义了芯片和算力对大模型的影响。•Deepseek的三种使用方式:在 软 件 系 统 中 调 用 官 方AP I 、 模 型 微 调 、 直 接 使 用 。资料来源:AI肖睿团队,北京大学-DeepSeek原理与落地应用Deepseek对行业产生巨大影响智慧芽@LS-GTM5目录Deepseek-R1在药企的本地化部署02芽仔与Deepseek-R1对接03AI融入智慧芽生物医药产品04大模型的发展阶段和deepseek016资料来源:AI肖睿团队,北京大学-DeepSeek原理与落地应用Deepseek-R1在药企的本地化部署智慧芽@LS-GTM7•个人部署:Ollma 框架适合个人用户私有化本地部署,但在多用户并发场景下 性能衰减明显。•企业部署:推荐使用Transformers 来快速验证模型能力 ,使用 vLLM 框架借助PagedAttention技术实现 24倍于 Transformers的吞吐量实现大模型的高效推理,针对不同企业场景, 则提供不同的企业级部署方案。•其他方式:近期出现的KTransformer s 、 Unsloth 等多套低成本动态量化模型的DeepSeek 部署解决方案。 目前暂不够成熟 。•vLLM部署简单, 更适合中小型企业做大模型推理部署, 对于大型企业, 可以使用配置较为复杂的Tensor RT框架。资料来源:AI肖睿团队,北京大学-DeepSeek原理与落地应用Deepseek-R1在药企的本地化部署智慧芽@LS-GTM8•DeepSeek R1模型就成了很多应用场景下的当务之急。受限于DeepSeekR1 671B(6710亿参数)的模型规模,通常情况下部署Deepseek R1满血版模型需要1200G左右显存(考虑百人内并发情况),需要双节点8卡H100服务器才能运行(总成本约在260万-320万左右),即便是INT4半精度下,也至少需要490G显存,需要单节点8卡H100服务器才能运行。•为了实现低成本DeepSeek R1模型的高性能部署,目前大多数方案都采用了牺牲模型推理速度的策略。使用CPU+GPU混合推理的方式,将一部分推理计算转移到CPU上,降低GPU的负载。由于CPU并不适合深度学习计算,导致模型整体推理速度较慢。Deepseek-R1满血版模型部署方案智慧芽@LS-GTM9资料来源:AI肖睿团队,北京大学-DeepSeek原理与落地应用Deepseek-R1部署方案简介智慧芽@LS-GTM10目录Deepseek-R1在药企的本地化部署02芽仔与Deepseek-R1对接03AI融入智慧芽生物医药产品04大模型的发展阶段和deepseek011112Deepseek出圈引爆全行业:仍有幻觉问题,例如出现专利号需要查证13为什么需要RAG?MM生物医药知识中台模型平台内部数据管线数据新闻数据临床数据专利数据文献数据RAGSOTNER关系识别OCSR自研数据自有数据M应用平台药物交易追踪专利追踪一键生成竞品报告自动ASCO会议总结自动医学写作protocol文献、专利助手构建路径...智能知识平台的组成标准字典表流病数据1415芽仔与Deepseek-R1对接智慧芽@LS-GTM16资料来源: https://hiro-ls.zhihuiya.com/share/NTiG7D?campaign_promotion=LS360_SHARE_PAGE问题:根据PDB库和智慧芽数据库的信息,给出药物BMS986278和靶蛋白的结合模式芽仔与Deepseek-R1对接:分子设计场景,问阳性药与靶蛋白的结合17资料来源: https://hiro-ls.zhihuiya.com/share/NTiG7D?campaign_promotion=LS360_SHARE_PAGE问题:根据PDB库和智慧芽数据库的信息,给出药物BMS986278和靶蛋白的结合模式芽仔与Deepseek-R1对接:分子设计场景,问阳性药与靶蛋白的结合18解决方案:自主设计的新分子通过智能体agent快速完成分子对接的过程•从PDB数据库下载带有hit分子的靶蛋白结构(PDB ID: 3wzm),提取A链,移除水分子,作为起点。•通过与GROMACS Copilot对话,要求其搭建体系,构建小分子力场、建立复合物拓扑、溶解、平衡等步骤后,进行1ns的正式模拟。•对轨迹移除PBC,根据蛋白质进行旋转平移对齐,最后输出RMSF,并且对RMSF进行分析。•基于芽仔,可以连贯地完成这个过程。分子设计场景:智能体agent一键式生成分子动力学模拟图19资料来源: https://hiro-ls.zhihuiya.com/share/2_fvLf?campaign_promotion=LS360_SHARE_PAGE问题:我是临床项目经理,我公司的药物HW-1在同等剂量下小鼠暴露量是AMG510的2倍,同等剂量下大鼠暴露量是AMG510的4倍,同等剂量下犬的暴露量是AMG510的1.3倍,同等剂量下猴的暴露量是AMG510的0.8倍,在犬和猴中的安全窗和AMG510一致,请参考智慧芽的各个数据库和AMG510的一期临床剂量,给出临床一期阶段我公司的药物HW-1的参考剂量芽仔与Deepseek-R1对接:推荐临床一期剂量场景20资料来源: https://hiro-ls.zhihuiya.com/share/2_fvLf?campaign_promotion=LS360_SHARE_PAGE问题:我是临床项目经理,我公司的药物HW-1在同等剂量下小鼠暴露量是AMG510的2倍,同等剂量下大鼠暴露量是AMG510的4倍,同等剂量下犬的暴露量是AMG510的1.3倍,同等剂量下猴的暴露量是AMG510的0.8倍,在犬和猴中的安全窗和AMG510一致,请参考智慧芽的各个数据库和AMG510的一期临床剂量,给出临床一期阶段我公司的药物HW-1的参考剂量芽仔与Deepseek-R1对接:推荐临床一期剂量场景21资料来源: https://hiro-ls.z
Deepseek在药企研发领域的本地化部署和应用场景-智慧芽,点击即可下载。报告格式为PDF,大小5.69M,页数33页,欢迎下载。
