大模型与AIGC蓝皮书
1© 2023 China Insights Consultancy. All rights reserved. This document contains highly confidential information and is solely for the use of our client. No part of it may be circulated, quoted, copied or otherwise reproduced without the written consent of China Insights Consultancy.CIC灼识咨询大模型与AIGC蓝皮书2灼识咨询是一家知名咨询公司。其服务包括IPO行业咨询、商业尽职调查、战略咨询、专家网络服务等。其咨询团队长期追踪物流、互联网、消费品、大数据、高科技、能源电力、供应链、人工智能、金融服务、医疗、教育、文娱、环境和楼宇科技、化工、工业、制造业、农业等方面最新的市场趋势,并拥有上述行业最相关且有见地的市场信息。灼识咨询通过运用各种资源进行一手研究和二手研究。一手研究包括访谈行业专家和业内人士。二手研究包括分析各种公开发布的数据资源,数据来源包括中华人民共和国国家统计局、上市公司公告等。灼识咨询使用内部数据分析模型对所收集的信息和数据进行分析,通过对使用各类研究方法收集的数据进行参考比对,以确保分析的准确性。所有统计数据真实可靠,并是基于截至本报告发布日的可用信息。若您希望获取CIC灼识咨询的详细资料、与灼识建立媒体/市场合作,或加入灼识行业交流群,欢迎扫码、致电021-23560288或致函marketing@cninsights.com。3I.大模型如今已展现出卓越的能力,随着其不断演进和完善,必将引领AI的未来道路,开创智能时代的新纪元II. 受益于大模型技术的日益成熟,AIGC有望掀起新一轮产业革命,开启人类发展的智能新时代III. GPGPU高度并行的计算资源为大型模型的训练和推理提供了不可或缺的支持,推动了大模型与AI领域的不断进步和创新IV. 彩蛋:生成式AI如何提升工作效率目录4行业数据及AI基础设施建设中国AI应用情况AI应用的挑战数据量数据质量IT系统成熟度中国AI支出占AI市场比例,2022AI占IT支出比例AI支出CAGR,22-27E20222027E金融12.1%11.8%19.8%28.1%•不同机构之间的数据孤岛•数据系统安全及隐私零售5.7%3.7%5.7%26.6%•传统零售商获取结构化/高度可用的数据•供应链机器学习算法优化制造业8.6%1.8%4.4%43.6%•专注单点技术突破,但无法跨场景规模化应用•数据整合程度低,管理欠佳•AI解决方案供应商分散能源2.6%5.1%9.8%41.4%•AI应用/转型进度较慢医疗5.6%5.5%8.2%27.6%•数据分散在各医院/管理机构•数据系统安全及隐私汽车12.3%19.5%25.5%21.0%•自动驾驶数据融合难度高政府27.1%21.6%28.3%18.7%•不同机构之间的数据孤岛•数据系统安全及隐私强/主要的弱/次要的全球AI市场预计将于2030年达到1万亿美元,并且全球超过15%的GDP将由AI驱动;AI在各垂直领域的应用渗透率也将继续提升。AI应用现状AI在垂直领域中的应用资料来源:灼识咨询5•AI可分为ANI (Artificial Narrow Intelligence)、AGI (Artificial General Intelligence) 和ASI (Artificial Super Intelligence)。ANI是专注于执行某一领域任务的经过训练的人工智能,是目前大多数的AI形式;AGI是通用人工智能,是指一种具有与人类相当的认知能力的智能系统,能够理解、学习、计划和解决问题;ASI是超级人工智能,指在几乎所有领域都超过最优秀的人类所具备的智能、知识、创造力、智慧和社交能力的智能系统。目前,ANI已经广泛应用,AGI处于研发阶段,而大模型是实现AGI的重要路径。定义AI的三种类型比较擅长领域具备能力发展成熟度某一特定领域具备执行能力已应用广泛大部分领域拥有能够与人类相媲美的智慧处于研发阶段所有领域全知全能尚处早期专用人工智能 (ANI)超级人工智能 (ASI)大模型是实现AGI的重要路径,其具有诸多特点⚫ 涌现性大模型参数超过百亿级时,模型性能会呈现出指数级增长,同时能够对未经专门训练的问题举一反三。⚫ 工程化大模型对数据、算法、算力要求极高,需要工程化的经营思路。需要严格把控数据清洗,把控用于关键性训练的数据,和构建大规模高质量训练的算力。⚫ 高投入大模型具有重投入、长周期的特点,如每次测试需要海量的算力资源,训练一次成本高达千万美元。⚫ 通用性大模型可以快速并大规模地与云计算、互联网等其他技术结合,广泛地应用在经济的各个领域。大模型是基于海量多源数据打造的模型,其是实现通用人工智能(AGI)的重要路径。大模型可以整合多种不同类型的数据和信息,实现多模态处理和分析,从而更全面地理解和解决复杂问题,其具备通用性、涌现性等诸多特点。通用人工智能 (AGI)四大特点资料来源:灼识咨询大模型的定义6大模型产业涵盖了行业应用、产品服务、模型工具和基础设施四个关键层面,广泛应用于各行业与垂直场景,前景广阔。大模型产业图谱资料来源:中国信通院,灼识咨询行业应用产品服务模型与工具基础设施金融教育艺术设计游戏医药文化娱乐其他文本图像音频视频虚拟空间代码算法模型工具平台模型托管/交易数据云平台芯片大模型相关产业图谱7基础大模型1精调大模型2能力涌现的大模型3模型变化…………模型示意图,以GPT-3模型为例共128层每层千个节点每层千个节点每层千个节点指令精调示意图能力涌现示意图学习输出模板建立评分机制根据结果重复优化过程人工对大量问题的回答形成模板供模型学习人工对模型的数个输出进行排序,建立奖励模型并为后续结果进行打分模型根据打分结果调整后续输出,并不断重复上述过程以优化模型•随着模型参数的指数级增长,大模型能力呈现明显的爆发增长,呈现能力涌现的情况。•指令精调在于确保模型输出结果的准确性及安全性,在该阶段需要使用较多的人工标注介入。在此基础上,引入奖励模型,让模型脱落人工指引,实现自优化。•GPT-3采用了96层的多头Transformer,参数量达到1,750亿,并使用45TB数据进行训练。模型特征•具备大量知识储备,能理解并生成语言,质量差强人意。•能按照人类偏好及普世价值取向,并保证一定安全性的前提下生成高度可用的内容。•具备逻辑推理能力及上下文理解能力,更接近人类水平。语境理解多任务自然语言理解真实问答场景映射修辞手法单词解谜国际音标转写取余数运算准确性准确性准确性准确性准确性准确性准确性准确性模型规模大模型的演变经历3个阶段:基础大模型具备大量知识储备,能理解并生成内容,质量差强人意;精调大模型能按照人类偏好及普世价值取向、并保证一定安全性的前提下,生成高度可用的内容;而出现能力涌现的大模型所生成的内容接近人类水平。大模型演变概览资料来源:“Are Emergent Abilities of L
[CIC灼识咨询]:大模型与AIGC蓝皮书,点击即可下载。报告格式为PDF,大小6.62M,页数43页,欢迎下载。