生成式人工智能赋能智慧司法及相关思考

生成式人工智能赋能智慧司法及相关思考况琨 浙江大学计算机学院浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江提纲l生成式人工智能发展脉络l生成式人工智能赋能智慧司法l生成式人工智能的不能2浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江什么是生成式人工智能什么是人工智能?什么是生成式模型?浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江什么是人工智能?• 人工智能(Artificial Intelligence):是以机器为载体所展示出来的人类智能,亦称为机器智能(Machine Intelligence)• 让机器模拟人类在视觉、听觉、语言和行为等方面的某些功能浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江什么是生成式模型5生成式模型•学习“数据如何生成的”(联合概率分布)•目标:学习数据背后的“完整故事”,包括数据的分布规律,甚至能自己“编故事”(生成新样本)。•像什么:一个画家,不仅会判断“这是猫还是狗”,还能亲手画出一只猫或狗。•怎么做:先分别学习猫和狗的特征(比如猫的尖耳朵、狗的尾巴形状),然后建模它们的整体分布规律。判别式模型•学习“如何区分数据”(条件概率或决策边界)•目标:直接找到“区分猫狗的关键线索”,不关心数据本身如何生成。•像什么:一个侦探,专注研究“猫和狗有什么不同”,快速抓住关键证据。•怎么做:直接学习猫狗之间的“分界线” ,不关心猫狗各自长什么样。浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江什么是生成式模型6生成式模型•学习“数据如何生成的”(联合概率分布)•目标:学习数据背后的“完整故事”,包括数据的分布规律,甚至能自己“编故事”(生成新样本)。•像什么:一个画家,不仅会判断“这是猫还是狗”,还能亲手画出一只猫或狗。•怎么做:先分别学习猫和狗的特征(比如猫的尖耳朵、狗的尾巴形状),然后建模它们的整体分布规律。判别式模型•学习“如何区分数据”(条件概率或决策边界)•目标:直接找到“区分猫狗的关键线索”,不关心数据本身如何生成。•像什么:一个侦探,专注研究“猫和狗有什么不同”,快速抓住关键证据。•怎么做:直接学习猫狗之间的“分界线” ,不关心猫狗各自长什么样。区分芒果和榴莲:生成式模型:研究芒果的颜色、形状、气味,以及榴莲的尖刺、气味,甚至能“合成”一个虚拟的芒果。判别式模型:直接记住“有尖刺的是榴莲,黄色椭圆形的是芒果”,遇到水果时快速对比。浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江什么是生成式人工智能生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。《生成式人工智能服务管理暂行办法》浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江XRn生成式人工智能的典型代表:ChatGPTnChatGPT:大数据+超算力,现象级AI应用引发范式革命生成式人工智能的到来浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江生成式人工智能发展脉络---以GPT为例• GPT-1(2018):开启预训练范式9• 核心突破:基于Transformer解码器架构,采用“无监督预训练+任务微调”的训练模式,参数1.17亿。• 任务微调指在预训练模型的基础上,使用特定任务的数据继续训练,来优化其在目标任务上的性能。通俗来说,就是给一个“什么都会一点但不精通的通才”做专项特训。• 能力特点:掌握基础语义规律,但生成文本较机械,像刚学会造句的小学生。GPT-12018GPT-22019GPT-32020ChatGPT2022GPT-42023浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江生成式人工智能发展脉络---以GPT为例10• 规模升级:参数增至15亿,训练数据扩展至40GB网页文本。• 技术亮点:证明了无需任务微调即可完成翻译、摘要等任务,生成文本连贯且富有创意,如撰写短篇小说。• 社会争议:因可能生成虚假信息,OpenAI一度限制其开源 。GPT-12018GPT-22019GPT-32020ChatGPT2022GPT-42023• GPT-2(2019):展现零样本学习能力浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江生成式人工智能发展脉络---以GPT为例11• 参数跃迁:1750亿参数创纪录,训练数据涵盖45TB互联网内容。• 能力质变:a. 少样本学习:对于一个全新的任务,只需要给其提供1-5个示范案例,AI就能根据原有知识,迅速掌握全新的技能任务b. 通用性突破:具有卓越的语言理解能力,和一定的归纳、演绎逻辑推理能力。• 局限性:存在“幻觉”问题,可能编造看似合理但错误的内容 。• GPT-3(2020):参数爆炸与少样本学习GPT-12018GPT-22019GPT-32020ChatGPT2022GPT-42023浙江大学人工智能教育教学研究中心中心人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江生成式人工智能发展脉络---以GPT为例12• 技术革新:基于GPT-3.5,引入三阶段训练:a. 海量文本预训练:构建语言知识库

立即下载
信息科技
2025-04-02
浙江大学
64页
9.77M
收藏
分享

[浙江大学]:生成式人工智能赋能智慧司法及相关思考,点击即可下载。报告格式为PDF,大小9.77M,页数64页,欢迎下载。

本报告共64页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共64页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
回顶部
报告群
公众号
小程序
在线客服
收起