计算机视觉(Computer Vision, CV)是一门研究如何让计算机实现人类视觉系统功能的学科。人类的视觉系统主要分为眼球作用区和大脑作用区。其中眼球作用区负责将视频景物转换为大脑中的电信号,而大脑作用区则将电信号进一步转变为感知。通过以成像设备和系统替代视觉器官,并以计算机替代大脑完成视觉输入的理解和处理,CV 技术能够完成对人类视觉系统的模拟,从而实现适应、理解外界环境和控制自身运动等复杂的智能功能。
作为人工智能的重要分支之一,计算机视觉与语音识别、语言识别等技术一同构成了人工智能的感知基础。它让计算机能够“睁眼看世界”。斯坦福大学教授李飞飞将这种“看”的能力称作“计算机科学领域最前沿的、具有革命性潜力的科技”。作为人的感官的延伸,计算机视觉将被广泛应用于图像识别、人脸检测、人脸识别等方面,并逐步渗透到无人驾驶、安防、机器人、智能家居等众多领域中。可以预见,在不久的将来,计算机视觉技术将会成为许多行业发展的新动力。
尽管计算机视觉从诞生至今已经历了 50 余年的发展,该领域依然存在一些有待解决的问题。例如如何高效准确地识别目标、如何有效地构造易于实现的识别算法、如何解决实时性和稳定性问题等。这些问题也将成为计算机视觉企业的发展机遇。现在已有部分优质企业在应用方面对这些问题给出了一些解决方案。展望计算机视觉技术的未来,图像特征选择、动态性能提升等方面将会成为重点的研究方向。
诞生——来自人工智能之父的 CV 元年
1966 年被称作计算机视觉元年。尽管在此之前的 20 世纪 50 年代中,学者们已经将计算机视觉的有关技术作为统计模式识别部分内容进行了研究,但研究的内容主要集中在光学字符、显微图谱、航空图片等二维图像的分析和研究中,并且计算机视觉在此时尚未成成为一门独立的学科。在 1966 年的夏天,著名的人工智能学者马文明斯基(Marvin Lee Minsky)要求其学生通过编程让计算机告诉使用者摄像头所拍摄的内容。这一任务触及到了计算机视觉的本质之一,也标志着计算机视觉的诞生。
Larry Roberts 发表了计算机视觉领域的第一篇博士论文《Machine Perception of Three-Dimensional Solids》。Roberts 将现实世界简化为由简单的三维结构所组成的“积木世界”,并且使用计算机从“积木世界”中提取出了立方体、棱柱等多种三维结构。此外,Roberts 还对物体的形状和空间关系做出了描述。对“积木世界”的研究是计算机视觉早期的重要尝试。它使人们相信,对简单的“积木世界”的理解能够推广到更复杂的现实世界中,并最终彻底实现人类视觉系统的完全替代。
繁荣——始于理论框架的建立
随后计算机视觉进入了蓬勃发展的时代。B. K. P. Horn 教授于 20 世纪 70 年代中期在 MIT 的人工智能实验室正式开设了“计算机视觉”课程。这成为了计算机视觉史上的标志性事件之一。后来人工智能实验室的 David Marr 教授提出了著名的计算视觉理论。该理论认为人类视觉的主要功能是复原三维场景的可见几何表面,即三维重建问题,并且这种从二维图像到三维几何结构的复原过程可以通过计算完成。理论强调从不同阶段去研究时间信息处理的问题。这一理论至今仍旧是计算机视觉研究的基本框架。20 世纪 80 年代后,计算机视觉技术又迈上了一个新的台阶。著名的卷积神经网络的实现在此期间诞生。卷积神经网络的理论基础是生物视觉中的“局部感受野”概念。生物在利用视觉识别物体的过程中并非显式地从图像中提取特征,而是通过一个自组织的深层网络结构逐层地将前一层信息抽象化。每一个视觉神经元都不感知图像的整体而只感受图像的局部信息。各个神经元感知的局部特征在神经网络的更高层级中综合时,生物就能够感知到图像的全局信息。图像局部感知能够保证图像发生平移或形变时图像的关键特征依然可以准确地被提取。
除了实现卷积神经网络外,主动视觉、目的视觉、重建理论、基于学习的视觉等重要的计算机视觉理论体系均在随后诞生。各类新方法和新理论的出现为计算机视觉带来了前所未有的繁荣。90 年代起,各类统计学习方法开始逐渐流行。统计学习通过统计方法提取了物体的局部特征。这些局部特征不同于形状、纹理等全局特征,不会犹豫平移或视角的改变而生剧烈的变化,因此具备了一定的特征旋转和平移不变性。基于局部特征,人们可以建立不同物品的局部特征集,从而实现类似物品的检索。图像搜索等技术正是因此得以发展。
突破——深度学习将计算机视觉带入新时代
进入 21 世纪后,机器学习开始大行其道。“机器学习”一词源自 IBM 的一篇论文,指利用计算机实现或模仿人类的学习行为。机器学习技术不同于先前使用的方法。它无需人为设计和提取特征,而是通过特定的算法从大量的样本中自动归纳学习。机器学习的应用需要大量的数据样本来支撑,而 2000 年以来的互联网技术的飞速发展为机器学习技术提供了所需的海量数据。例如,著名的 ImageNet 数据集包含了 2 万多个类别供 1400 万张图片。此数据集是世界上最大的图像识别数据库,计算机视觉研究人员将其作为重要的数据来源之一,开发人员不约而同地将模型在 ImageNet 上的识别准确率作为比较基准。研究者们在该数据集训练了 AlexNet、GoogleNet 等著名的模型,并且不断刷新着物体识别的准确率。在 2006 年之前,计算机视觉中所使用的模式识别方法主要是机器学习中的浅层学习技术,如支持向量机、决策树等。这些方法存在特征提取能力不足、容易出现过拟合等问题。2006 年,Hinton 等人提出了深度臵信网络模型(DBN)。DBN 是深度学习领域的第一个模型。它通过将多个受限波尔茨曼机(RBM)堆叠成为一个深度网络结构,获得了浅层模型难以比拟的高层次抽象特征提取能力,从而具备了更加优越的性能。此模型通过逐层预训练和整体微调的方式使深层次的神经网络的训练成为了可能。在深度学习技术的推动下,计算机视觉由原先精度低、复杂性高、人为干预多的情况进入了发展的新时代。
卷积神经网络(CNN)是最常用于计算机视觉的深度学习技术之一。CNN 借鉴了生物视觉的有关概念。网络像生物视觉器官一样逐层从输入中提取局部特征并在高层次进行汇总,最终完成对输入的模式识别。除 DBN 和 CNN 外,递归神经网络(RNN)、堆栈自编码器(SAE)等深度学习技术也在计算机视觉等方面得到许多应用。
在之后的时间里,其他深度网络模型如雨后春笋一般涌现。各种深度学习模型被广泛运用在计算机视觉中,为计算机视觉带来了一场革命。以人脸识别为例,在深度学习技术出现之前,人脸识别方法以模板匹配法、基于特征的方法、基于连接的方法等传统技术为主。这些技术存在易受表情影响、所提取特征质量较差等问题。
深度学习出现后,人脸识别研究迎来了新的高潮。在很短的时间内,深度学习技术就将人脸识别的准确率提高到了 99%以上。在深度学习的浪潮下,一批优秀的计算机视觉相关的企业相继诞生。
中国报告网发布的报告书内容严谨、数据翔实,更辅以大量直观的图表帮助本行业企业准确把握行业发展动向、市场前景、正确制定企业竞争战略和投资策略。本报告依据国家统计局、海关总署和国家信息中心等渠道发布的权威数据,以及我中心对本行业的实地调研,结合了行业所处的环境,从理论到实践、从宏观到微观等多个角度进行市场调研分析。它是业内企业、相关投资公司及政府部门准确把握行业发展趋势,洞悉行业竞争格局,规避经营和投资风险,制定正确竞争和投资战略决策的重要决策依据之一。本报告是全面了解行业以及对本行业进行投资不可或缺的重要工具。
本研究报告数据主要采用国家统计数据,海关总署,问卷调查数据,商务部采集数据等数据库。其中宏观经济数据主要来自国家统计局,部分行业统计数据主要来自国家统计局及市场调研数据,企业数据主要来自于国统计局规模企业统计数据库及证券交易所等,价格数据主要来自于各类市场监测数据库。
【报告目录】
第一章 人工智能的基本介绍
1.1 人工智能的基本概述
1.1.1 人工智能的内涵
1.1.2 人工智能的分类
1.1.3 人工智能关键环节
1.1.4 人工智能研究阶段
1.1.5 人工智能的产业链
1.2 人工智能发展历程
1.2.1 发展简史
1.2.2 研究历程
1.2.3 发展阶段
1.3 人工智能的研究方法
1.3.1 大脑模拟
1.3.2 符号处理
1.3.3 子符号法
1.3.4 统计学法
1.3.5 集成方法
第二章 国际人工智能行业发展分析
2.1 全球人工智能行业发展综况
2.1.1 人工智能概念的悄然兴起
2.1.2 驱动人工智能的内外动因
2.1.3 人工智能的发展阶段分析
2.1.4 全球人工智能产业发展状况
2.1.5 发达国家重视人工智能产业
2.1.6 世界人工智能迎来发展新阶段
2.2 美国
2.2.1 人工智能成美国发展战略
2.2.2 人工智能应用于美国国防
2.2.3 美国量子技术助力AI发展
2.2.4 美国机器人市场需求预测
2.3 日本
2.3.1 AI成日本工业发展重点
2.3.2 日本政府推进人工智能
2.3.3 日本重视人工智能研究
2.3.4 日本人工智能投资计划
2.3.5 日本科技发展借力人工智能
2.4 各国人工智能产业发展动态
2.4.1 欧盟推进服务机器人研发
2.4.2 欧美推出大脑发展计划
2.4.3 俄国成功开发AI系统
2.4.4 韩国人工智能研发动态
2.4.5 AI应用于巴西世界杯
2.5 国际企业加快布局人工智能领域
2.5.1 互联网企业加快AI产业布局
2.5.2 Facebook建设AI硬件平台
2.5.3 戴尔开展人工智能研发合作
2.5.4 雅虎迈出人工智能发展步伐
2.5.5 维基百科涉足人工智能领域
第三章 中国人工智能行业政策环境分析
3.1 政策助力人工智能发展
3.1.1 政策加码布局人工智能
3.1.2 人工智能将纳入“十三五”
3.1.3 中国大脑研究计划开启
3.1.4 人工智能成为国家战略重点
3.2 人工智能行业相关政策分析
3.2.1 “中国制造”助力人工智能
3.2.2 “互联网+”推动人工智能
3.3 人工智能行业地方政策环境分析
3.3.1 AI或纳入北京“十三五”
3.3.2 上海市推出AI“脑计划”
3.3.3 人工智能获广州财政支持
3.3.4 深圳市具备AI发展优势
3.4 机器人行业政策规划分析
3.4.1 政策大力支持机器人行业
3.4.2 工业机器人将持续高增长
3.4.3 服务机器人将成为新蓝海
第四章 中国人工智能行业发展分析
4.1 人工智能行业发展综况
4.1.1 人工智能技术方兴未艾
4.1.2 国内人工智能布局加快
4.1.3 人工智能实验室成立
4.1.4 人工智能行业发展迅猛
4.1.5 人工智能市场需求将增长
4.1.6 人工智能市场进入新阶段
4.2 人工智能产业生态格局分析
4.2.1 生态格局基本架构
4.2.2 基础资源支持层
4.2.3 技术实现路径层
4.2.4 应用实现路径层
4.2.5 未来生态格局展望
4.3 人工智能区域发展动态分析
4.3.1 哈尔滨逐步完善机器人产业
4.3.2 安徽省建立人工智能学会
4.3.3 四川成立人工智能实验室
4.3.4 上海进一步推进人工智能
4.3.5 福建建立仿脑智能实验室
4.4 人工智能技术研究动态分析
4.4.1 人工智能再获重大突破
4.4.2 智能语音识别及控制技术
4.4.3 高级人工智能逐步突破
4.4.4 AI神经网络识别技术
4.4.5 人工智能带来媒体变革
4.5 人工智能行业发展存在的主要问题
4.5.1 人工智能发展面临的困境
4.5.2 人工智能发展的隐性问题
4.5.3 人工智能发展的道德问题
4.5.4 人工智能发展的技术障碍
4.6 人工智能行业发展对策及建议
4.6.1 人工智能的发展策略分析
4.6.2 人工智能的技术发展建议
4.6.3 人工智能伦理问题的对策
第五章 人工智能行业发展驱动要素分析
5.1 硬件基础日益成熟
5.1.1 高性能CPU
5.1.2 “人脑”芯片
5.1.3 量子计算机
5.1.4 仿生计算机
5.2 大规模并行运算的实现
5.2.1 云计算的关键技术
5.2.2 云计算的应用模式
5.2.3 我国推进云计算发展
5.2.4 云计算技术发展动态
5.2.5 云计算成人工智能基础
5.3 大数据技术的崛起
5.3.1 大数据技术的内涵
5.3.2 大数据的各个环节
5.3.3 大数据的主要应用领域
5.3.4 大数据成人工智能数据源
5.3.5 大数据技术助力人工智能
5.4 深度学习技术的出现
5.4.1 机器学习的阶段
5.4.2 深度学习技术内涵
5.4.3 深度学习算法技术
5.4.4 深度学习的技术应用
5.4.5 深度学习提高人工智能水平
第六章 人工智能行业的技术基础分析
6.1 自然语言处理
6.1.1 自然语言处理内涵
6.1.2 语音识别技术分析
6.1.3 语义技术研发状况
6.1.4 自动翻译技术内涵
6.2 计算机视觉
6.2.1 计算机视觉的内涵
6.2.2 计算机视觉的应用
6.2.3 计算机视觉的运作
6.2.4 人脸识别技术应用
6.3 模式识别技术
6.3.1 模式识别技术内涵
6.3.2 文字识别技术应用
6.3.3 指掌纹识别技术应用
6.3.4 模式识别发展潜力
6.4 知识表示
6.4.1 知识表示的内涵
6.4.2 知识表示的方法
6.4.3 知识表示的进展
6.5 其他技术基础
6.5.1 自动推理技术
6.5.2 环境感知技术
6.5.3 自动规划技术
6.5.4 专家系统技术
第七章 人工智能技术的主要应用领域分析
7.1 工业领域
7.1.1 智能工厂进一步转型
7.1.2 人工智能的工业应用
7.1.3 人工智能应用于制造领域
7.1.4 人工智能助力中国制造
7.1.5 人工智能成工业发展方向
7.1.6 AI工业应用的前景广阔
7.2 医疗领域
7.2.1 人工智能的医疗应用概况
7.2.2 人工智能在中医学中的应用
7.2.3 人工神经网络技术的医学应用
7.2.4 AI在医学影像诊断中的应用
7.2.5 AI在医疗诊断应用中的展望
7.2.6 企业加快布局医疗人工智能
7.3 社交领域
7.3.1 人工智能的移动社交应用
7.3.2 人工智能社交产品发布
7.3.3 社交网络成AI应用焦点
7.4 无人驾驶领域
7.4.1 无人驾驶的效益分析
7.4.2 自动驾驶技术发展进程
7.4.3 无人驾驶产业发展加快
7.4.4 人工智能助力无人驾驶
7.4.5 AI成为智能汽车发展方向
7.5 其他领域
7.5.1 人工智能的智能搜索应用
7.5.2 人工智能应用于电子商务
7.5.3 人工智能与可穿戴设备结合
7.5.4 人工智能成3D打印基础
7.5.5 人工智能的“虚拟助手”
7.5.6 人工智能家居成为新趋势
第八章 人工智能机器人发展分析
8.1 机器人产业发展综况
8.1.1 全球机器人行业规模分析
8.1.2 中国工业机器人市场现状
8.1.3 机器人行业产业链构成
8.1.4 机器人的替代优势明显
8.1.5 机器人下游应用产业多
8.1.6 智能机器人成为发展趋势
8.2 人工智能在机器人行业的应用状况
8.2.1 人工智能与机器人的关系
8.2.2 AI于机器人的应用过程
8.2.3 AI大量运用于小型机器人
8.2.4 AI机器人的重要应用领域
8.3 人工智能在智能机器人领域的技术应用
8.3.1 专家系统的应用
8.3.2 模式识别的应用
8.3.3 机器视觉的应用
8.3.4 机器学习的应用
8.3.5 分布式AI的应用
8.3.6 进化算法的应用
8.4 机器人重点应用领域分析
8.4.1 医疗机器人
8.4.2 军事机器人
8.4.3 教育机器人
8.4.4 家用机器人
8.4.5 物流机器人
8.4.6 协作型机器人
第九章 国际人工智能行业重点企业分析
9.1 微软公司
(1)企业概况
(2)主营业务情况分析
(3)公司运营情况分析
(4)公司优劣势分析
9.2 IBM公司
(1)企业概况
(2)主营业务情况分析
(3)公司运营情况分析
(4)公司优劣势分析
9.3 谷歌公司
(1)企业概况
(2)主营业务情况分析
(3)公司运营情况分析
(4)公司优劣势分析
9.4 亚马逊公司
(1)企业概况
(2)主营业务情况分析
(3)公司运营情况分析
(4)公司优劣势分析
第十章 中国人工智能行业重点企业分析
10.1 百度公司
(1)企业概况
(2)主营业务情况分析
(3)公司运营情况分析
(4)公司优劣势分析
10.2 腾讯公司
(1)企业概况
(2)主营业务情况分析
(3)公司运营情况分析
(4)公司优劣势分析
10.3 阿里集团
(1)企业概况
(2)主营业务情况分析
(3)公司运营情况分析
(4)公司优劣势分析
10.4 科大讯飞股份有限公司
(1)企业概况
(2)主营业务情况分析
(3)公司运营情况分析
(4)公司优劣势分析
10.5 北京捷通华声语音技术有限公司
(1)企业概况
(2)主营业务情况分析
(3)公司运营情况分析
(4)公司优劣势分析
第十一章 人工智能行业投资状况分析
11.1 人工智能行业投资综况
11.1.1 全球人工智能的投融资分析
11.1.2 国内人工智能的投融资状况
11.1.3 人工智能行业投资总量分析
11.1.4 人工智能行业投资进程加快
11.1.5 AI认知技术商业投资加快
11.2 人工智能行业投资动态
11.2.1 AnkiDrive获得新一轮投资
11.2.2 Vicarious公司开启AI融资
11.2.3 特斯拉注资建人工智能公司
11.2.4 Demiurge公司注资人工智能
11.2.5 格灵深瞳公司获得天使投资
11.3 人工智能行业迎来投资机遇
11.3.1 人工智能成为投资风口
11.3.2 人工智能进入黄金时期
11.3.3 人工智能迎来投资机遇
11.3.4 全球人工智能投资升温
第十二章 人工智能行业发展前景及趋势预测
12.1 人工智能行业发展前景展望
12.1.1 人工智能发展前景展望
12.1.2 人工智能的市场空间巨大
12.1.3 人工智能成为发展新热点
12.1.4 人工智能产业的机遇与挑战
12.2 人工智能行业发展趋势预测
12.2.1 人工智能未来发展趋势
12.2.2 “智能+X”将成新时尚
12.2.3 机器视觉成主要发展方向
12.2.4 人工智能将带来新变化
12.2.5 人工智能市场规模预测
图表目录
图表 人工智能产业链
图表 全球运功监测传动器市场
图表 计算成本
图表 全球每年产生的数据总量
图表 人工智能的重点品类
图表 人工智能的重点品类的公司分布
图表 人工智能的重点品类的融资分布
图表 最受风险资本青睐的人工智能品类
图表 全球人工智能“战局”
图表 人工智能各品类成熟度排行
图表 计算机在图像识别的错误率
更多图表详见正文( GSLWK)
特别说明:中国报告网所发行报告书中的信息和数据部分会随时间变化补充更新,报告发行年份对报告质量不会有任何影响,并有助于降低企事业单位投资风险。