AI全行业赋能系列深度研究之五:领军路径分歧,更大的模型还是更低的成本?
领军路径分歧:更大的模型还是更低的成本?——AI全行业赋能系列深度研究之五证券分析师:刘洋A0230513050006、洪依真A0230519060003、施鑫展A0230519080002、周海晨A02305110400362021.12.13www.swsresearch.com2结论 以商汤、旷视为代表的AI明星在平台上有什么特别的布局?•自研了深度学习训练、推理平台,大量算法积累,AIDC算力支持;•商汤科技:SenseCore大模型+小模型,降低AI应用落地成本;•旷视科技:Brain++平台支撑了跨行业AIoT解决方案。 深度学习开源训练框架格局如何?国内AI公司自研深度学习框架有何种意义?•TensorFlow、PyTorch、MXNet、CNTK已可以满足工业界、学界的绝大部分要求;•技术遗留问题:静态图、动态图技术方案都还有缺陷,有同时解决的可能性;•国产平台由于技术遗留问题、国产化等适配性等原因可能仍有空间。 为何AI大模型成为趋势?复现大模型的难度在哪里?•以GPT为代表的大模型能大幅降低对数据量的需求,预训练大模型+细分场景微调,更适合长尾落地。•但对存储、算力要求极高,普通机构难以复现。商汤、旷视在复现大模型上有算力、训练推理平台优势。 对于必然的碎片化AI落地,不同公司路径差异在哪里?哪种路径可能胜出?•更大的模型路径:较高软件占比,硬件外采;大规模参数的通用模型,极高的首次开发成本;模型长尾投入理想状态接近0;适合额外硬件建设较少,下游需求标准化程度强,产业链已有分工度高的行业;•更低的成本路径:自有生产线压缩硬件成本;小模型、小算力,较低的首次开发成本;中台复用等方式控制成本。适合已有硬件基础差,需求标准化程度低,产业链已有分工度低的行业。pOtQrQoOuMqPsOnNrMmRnP7NdNbRsQmMtRpOfQpOsQlOqRsObRnMrPMYmOtNNZmRtNwww.swsresearch.com3两种路径更适合的场景3算法和平台能力全栈解决方案硬件物联软件方案需要额外的硬件建设少下游标准化程度高下游标准化程度低下游客户付费能力强下游客户付费能力弱产业链分工程度高产业链分工程度低 智慧城市/安防 手机需要额外的硬件建设多 工业智能化 物流 汽车 医疗更低的成本更大的模型目录1. AI产业链:从算力到应用2. AI平台层:何种训练模型可以脱颖而出?3. AI大模型:为何更大的模型成为行业新趋势4. AI明星:商汤、旷视自研平台亮点5. AI碎片化问题:软件公司应对的两种路径熟优?4www.swsresearch.com51.1 AI行业产业链——工作流程视角 设计、实现、运行:•算法设计环节:机器视觉、语音识别、自然语音处理、知识图谱;•算法实现环节:深度学习框架,训练、推理部署,对模型的调参优化;•算法运行环节:AI芯片和AIDC超算中心,提供硬件基础。图:算法实现工作流程资料来源:英伟达、英特尔、寒武纪官网,申万宏源研究www.swsresearch.com61.2 AI行业产业链——代表厂商资料来源:艾瑞咨询《中国人工智能产业研究报告(Ⅲ)2020》,申万宏源研究图:AI行业更领域代表性公司www.swsresearch.com71.2 AI芯片:突破Nv壁垒的三种可能性AI芯片的整体性能=AI芯片硬件性能×(AI芯片厂商算子库和工具链+深度学习框架支持)AI芯片公司需要做的软件生态壁垒产生的根源在于软硬件的高度耦合最大的工作量是对海量算子和特定芯片的支持突破AI生态壁垒的三种可能机会从苹果MacOS X案例可以推测,当任何一家AI芯片公司能够从英伟达手中逐渐拿走10%份额的时候,深度学习框架厂商也大概率会去逐渐投入为该厂商的AI芯片去做特定优化。AI编译器的成熟芯片性能和英伟达相比具备明显优势等待英伟达失误123AI芯片公司所采取不同突围路线AI芯片公司遇到了不同的瓶颈AMD华为寒武纪谷歌兼容CUDA的路线,借力英伟达生态在走英伟达的路线深度学习框架+AI芯片”自研路线难点在于其更新迭代速度永远跟不上CUDA并且很难做到完全兼容华为:没有深度学习框架厂商主动支持,其自研的MindSpore框架尚未解决TF/PyTorch面临的共同痛点谷歌:TPU本身性能还有进一步提升空间以及过于专用的问题芯片本身性能以及算子库丰富程度还有追赶空间,没有深度学习框架厂商基于芯片做特定优化解决算子自动开发优化的问题,以及将训练好的模型部署到各种AI芯片上的问题,从而实现AI软硬件的解耦AI芯片整体的性能是由基础软件和芯片硬件本身共同决定的,虽然软件生态存在短板,但是如果硬件本身性能非常突出是有可能获得整体上的优势的类比PC时代AMD在英特尔两次犯错时分别获得了明显市占率提升的机会资料来源:艾瑞咨询《中国人工智能产业研究报告(Ⅲ)2020》,申万宏源研究www.swsresearch.com81.2 AI平台层:巨头必争之地平台层 AI平台层:•支撑AI大规模训练生产、部署的技术体系;•包括训练框架、模型生产平台、推理部署框架、数据平台。 训练、推理部署框架是核心:•机器学习框架或深度学习框架:AI开发依赖的环境安装、部署、测试以及不断迭代改进准确性和性能调优,框架目的是为了简化、加速和优化这个过程。•避免重复发明轮子,而专注于技术研究和产品创新。•巨头竞争的核心点,各大厂建设算法模型数据库,将其封装为软件框架,为应用开发提供集成软件工具包,为上层应用开发提供了算法调用接口。资料来源:艾瑞咨询《中国人工智能产业研究报告(Ⅲ)2020》,申万宏源研究www.swsresearch.com91.2 AI应用层:百花齐放,工程和变现能力为核心资料来源:艾瑞咨询《中国人工智能产业研究报告(Ⅲ)2020》,申万宏源研究 AI+安防、AI+金融是标配:•智慧城市和安防仍然是AI机器视觉最成熟的落地场景;•安防+金融合计收入在四小龙中占比都在50%以上。•云从科技:继续探索AI在社区、政务、金融更深层次全栈应用。 AI+手机仍然是最理想的收费场景:•虹软、商汤、旷视该业务毛利率可能都在80%以上,纯SDK收费,理想的场景;•但规模后续增长有限 AI+汽车、 AI+教育、AI+零售可能为新的增长空间:•商汤科技:AI+汽车,探索机器视觉在L2+自动驾驶应用。•旷视科技:探索AIoT在物流、智造等多行业的广泛应用www.swsresearch.com101.3 AI行业产业链——整体图谱应用软件及解决方案层算法层行业应用(安防、交通、智能制造、金融、医疗等)应用软件解决方案计算机视觉应用平台自然语言应用平台其他AI平台通用技术算法模型计算机视觉自然语言处理知识图谱其他(智能语音、自动驾驶等)图像分类目标检测目标追踪图像分割文本分类信息抽取情感分析机器翻译知识表示知识抽取知识存储知识问答平台层数据平台训练框架推理部署框架模型生产平台采集标注生产存储Tensor FlowCaffeePyTorchMXNetTensor Flow LiteSense PPLPaddle-MobileCore MLAutoML分布式INT8加速技术算力层AIDC超算中心服
[申万宏源]:AI全行业赋能系列深度研究之五:领军路径分歧,更大的模型还是更低的成本?,点击即可下载。报告格式为PDF,大小3.93M,页数70页,欢迎下载。
