20160910-36氪研究院-2016年计算机视觉行业研究报告

2016年9月36氪研究院机器之眼, 看懂世界----计算机视觉行业研究报告目 录 Contents一、计算机视觉行业概述二、计算机视觉技术与应用场景三、计算机视觉行业与创业公司梳理1.1 定义与研究意义1.2 行业驱动— 数据量、运算力、算法技术1.3 政策法规1.4 投资热度全球投资热度国内投资热度1.5 市场规模2.1 通用视觉识别技术流程2.2 识别技术与应用场景简介生物特征识别光学字符识别物体与场景识别视频对象提取与分析3.1 产业链3.2 全景图3.3 商业模式3.4 行业竞争市场格局创业公司分析3.5 行业思考商业模式技术趋势计算机视觉行业概述Chapter 1•定义与研究意义•行业驱动— 数据量、运算力 、算法技术•政策法规•投资热度全球投资热度国内投资热度•市场规模4“To know what is where by looking.”(通过看去了解所在之处。)----亚里士多德计算机视觉是指用计算机来模拟人的视觉系统,实现人的视觉功能,以适应、理解外界环境和控制自身的运动。概括的说, 视觉系统主要解决的是物体识别、物体形状和方位确认以及物体运动判断这三个问题。而计算机视觉的研究,则是专注于让机器代替人眼,解决这些问题。(1)物体的识别:即理解物体是什么,对物体的识别主要体现在两方面,第一是是将不同物体归类,第二是对同类型物体的区分与鉴别,如不同人脸的鉴别。物体识别要求既能抽象出物体的共同属性,又能分别出相似物体间的细微差别。(2)物体形状和方位的确定:判断物体的形状和方位是为了让物体在视觉的三维空间里得到记忆的重建,进而进行场景分析与判断。(3)物体运动的判断:和物体形状方位的确定一样,对物体的运动的判断也是一种对于场景的重建和理解,用于进行视觉主体(人或机器)对场景的分析,乃至做出自身行动的决策,实现视觉主体和场景的交互。定义让机器之眼代替人眼,看懂所在世界人体识别文字识别物体识别1.1 定义与研究意义1.2 行业驱动---数据量运算力算法技术1.3 政策法规1.4 投资热度全球投资热度国内投资热度1.5 市场规模36Kr-计算机视觉行业研究报告2016年9月5计算机视觉作为计算机的眼睛,是机器认识世界、看懂世界的一种方式。而认识世界、看懂世界是人工智能产品或方案不可或缺的重要部分。唯有看见,才能够做出分析判断,进而代替人类完成更多的任务。它与语音识别、语言识别一并构成了人工智能的感知智能,让机器完成对外部世界的探测,进而做出判断,采取行动,让更复杂层面的智慧决策、自主行动成为可能。基于深度学习算法模型和CPU、GPU等关键硬件的支撑,计算机视觉技术应用得以实现,并最终集成于多类产品和应用场景之中(如机器人、无人驾驶等等)。计算机视觉能够增强、改善人们的生活,代替人类完成更多的任务。一方面,它为人类自身视觉提供强有力的辅助和增强,极大的改善人与世界交互的方式。比如,我们可以通过图片搜索引擎找到与之相关信息;另一方面,机器可以准确、客观而稳定的看见,突破人类视觉的局限,代替人类完成更多的任务。比如,机器可以24小时不间断、不疲倦的进行场景监控。研究意义计算机视觉赋予机器“看”和“认知”的功能,是人工智能的一类基础应用技术人工智能基础架构自然语言处理计算机视觉语音识别智慧家电智慧工业关键硬件算法模型路径规划GPUNPU传感器深度学习(CNN、RNN等)CPU基础应用技术回归分析最速梯度下降法分布式存储产品知识架构层基础支撑层技术应用层方案集成层空间搜索来源:36氪研究院预测计划和安排智慧交通36Kr-计算机视觉行业研究报告2016年9月1.1 定义与研究意义1.2 行业驱动---数据量运算力算法技术1.3 政策法规1.4 投资热度全球投资热度国内投资热度1.5 市场规模6数据量、运算力和算法模型是影响计算机视觉行业发展的三大要素。2000年之后,数据量的上涨、运算力的提升和深度学习算法的出现极大的促进了计算机视觉行业的发展。要理解数据量的重要性,得先从算法说起。数据量和算法可以分别比作人工智能的燃料和发动机。算法是计算机基于所训练的数据集归纳出的识别逻辑,好的算法模型可以实现精准的物体和场景识别。而数据集的丰富性和大规模性对算法的训练尤为重要。因此可以说,实现机器精准视觉识别的第一步,就是获取海量而优质的应用场景数据。以人脸识别为例,训练该算法模型的图片数据量至少应为百万级别。2000年以来,得益于互联网、社交媒体、移动设备和廉价的传感器,这个世界产生并存储的数据量急剧增加,这为通过深度学习的方法来训练计算机视觉技术提供很好的土壤。IDC数据显示,从2011年起,全球所产生的数据量已达到ZB级别(1ZB约为10亿GB ),此后仍将高速增长,预计2020年达到近40ZB。海量的数据将为计算机视觉算法模型提供远远不断的素材,助力机器视觉的精准度提升。行业驱动 · 数据量海量数据为计算机视觉发展提供燃料大数据训练模型应用模型识别场景算法模型物体及场景识别0102030405020092010201120122013201420152016e 2017e 2018e 2019e 2020e2009-2020年全球总体数据量(单位:ZB)来源:IDC,36氪研究院36Kr-计算机视觉行业研究报告2016年9月1.1 定义与研究意义1.2 行业驱动---数据量运算力算法技术1.3 政策法规1.4 投资热度全球投资热度国内投资热度1.5 市场规模7在计算机视觉领域,图像、视频作为数据密集型问题,需要大量的矩阵计算操作,因此特别适合使用并行运算芯片进行数据处理。而传统的CPU一次只能同时做一两个加减法运算,无法满足并行运算的需求。在GPU出现之前,算法运行的速度是很慢的,即使是一个简单的神经网络数据的培训,也得花费几天、甚至几周的时间。 这对算法的优化调整带来巨大瓶颈。而由于机器学习的理论刚刚起步,需要不断的试验、迭代,这时运算能力就变得尤为关键。1999 年,Nvidia 公司在推销自己的 Geforce 256 芯片时,提出了GPU (Graphics Processing Unit, 图像处理器) 这个概念。GPU是专为执行复杂的数学和集合计算而设计的数据处理芯片。它的出现让并行计算成为可能,对数据处理规模、数据运算速度带来了指数级的增长与改善,极大的促进计算机视觉的发展。GPU与传统CPU相比,在处理海量数据方面有压倒性的优势。 据Rajat Raina 与吴恩达的合作论文 “用 GPU 进行大规模无监督深度学习”(“Large-scale Deep Unsupervised Learning using Graphic Processors)显示,在运行大规模无监督深度学习模型时,使用 GPU 和使用传统双核 CPU 在运算速度上的差距最大会达到近七十倍。在一个四层,一亿个参数的深度学习网络上,使用 GPU 将程序运行时间从几周降低到一天。在今天,数据处理速度不再成为制约计算机视觉发展的瓶颈。想要发挥专用芯片的计算效率优势,需要芯片结构和软件算法两者相匹配。目前的趋势是,随着对人工智能各类应用需求的不断增强,专门用于加速人工智能应用的AI-PU或将成为计算机另一个标配组件。行

立即下载
信息科技
2016-09-22
40页
2.63M
收藏
分享

20160910-36氪研究院-2016年计算机视觉行业研究报告,点击即可下载。报告格式为PDF,大小2.63M,页数40页,欢迎下载。

本报告共40页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共40页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
PPP 总库规模增长与投资趋势有些相似图表 15:PPP 落地规模增长与把投资相关性较低
信息科技
2018-12-20
来源:PPP大数据追踪系列:PPP数据对经济,金融影响有多大?
查看原文
从 2016 年的 ‘前低后高’到 2017 年的“前高后低”
信息科技
2018-12-20
来源:PPP大数据追踪系列:PPP数据对经济,金融影响有多大?
查看原文
PPP 总库规模和趋势相关性强图表 12:PPP 落地规模与节奏的相关性较高
信息科技
2018-12-20
来源:PPP大数据追踪系列:PPP数据对经济,金融影响有多大?
查看原文
退库项目占比基本符合原本分布,旅游、保障房退库相对占比偏高
信息科技
2018-12-20
来源:PPP大数据追踪系列:PPP数据对经济,金融影响有多大?
查看原文
分行业来看,保障房、旅游占比下降,交运、城镇开发占比上升
信息科技
2018-12-20
来源:PPP大数据追踪系列:PPP数据对经济,金融影响有多大?
查看原文
大部分退库项目处于识别或准备的初期阶段
信息科技
2018-12-20
来源:PPP大数据追踪系列:PPP数据对经济,金融影响有多大?
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起