当前位置:主页 > 毕业论文 >

深度学习在计算机视觉中的应用与进展

请输入课题关键词,搜索相关范文

文档下载

网盘链接 https://pan.baidu.com/s/1b0K4CI9irXGLaIykppNs2Q

提取码: ougv


部分内容展示

计算机视觉是通用人工智能中一个重要的组成部分,以目标检测和图像分类为代表的计算机视觉技术的应用范围逐渐扩大,与传统机器学习算法在计算机视觉中的应用相比,近年来所研究的深度学习在计算机视觉领域取得了丰硕的成果。本文以深度学习在计算机视觉中的应用与进展为研究课题,将散见于各著作中有关深度学习在计算机视觉中的应用成果进行综述,以期为之后的深入研究提供一定的理论参考。
 
关键词:深度学习;计算机视觉;图像分类 ;更多范文
深度学习在计算机视觉中的应用与进展
作为计算机科学与技术的一个领域,计算机视觉已经形成了一系列实用技术,如图像识别与检索、指纹识别与判断、人脸识别与鉴定等。当今,研究这一技术的人越来越多,应用越来越广泛。但是,传统的计算机视觉只能对对象进行采集和处理,不能提供仅对抽象知识概念的对象模型建立认知能力。所以,在计算机领域,深度学习越来越受到重视。
深度学习技术作为一种计算机视觉数据处理的智能型技术,可以从客观事物中提取一些数据并通过人工神经网络的构建,通过计算机深入挖掘处理,并通过监督学习或无监督学习的方式获得数据的特征,从而使图像识别等计算机视觉技术在处理过程中具有速度更快、数据量更大、精度更高等优点。本文就对深度学习在计算机视觉中的应用与进展进行综述,以期为之后的研究提供一定的理论参考。
在科学杂志上发表的一篇论文中,多伦多大学机器学习研究的GeofferyHinton教授首次提出了深度学习的概念。从此,深度学习的思想得到广泛的认同和传播。深度学习是机器学习的一个分支,它用人工神经网络模拟人脑进行数据智能处理。以深度学习为辅助,通过智能处理实现机器智能[1]。人工神经网络的工作结构是:输入层对图像和数据进行采集和输入,然后根据具体的计算方法,通过智能处理将其传输到下一层的节点,深度学习就是通过这种多隐含层来实现类似于人脑神经元的信号传递[2]
计算机视觉主要是指利用摄像机和处理机对目标的特征进行识别、提取和记录,并在一定程度上进行技术处理,使之更符合人眼所见事物。在图像处理、分析、场景分析等方面,计算机视觉已得到了广泛的应用。结合电脑视觉技术,人们还可以足不出户地了解世界,并对其周围环境有较深的印象。电脑图像识别主要是利用摄像机对物体进行拍摄,利用图像处理技术深入分析物体的图像,使计算机能更准确地掌握事物,根据物体的特征进行识别。常规计算机中,大多数图像采集和图像分析是独立完成的,大多数是手工设计的[3]。从计算机视觉的发展目标来看,一是帮助人们识别和记忆外界的事物,二是帮助机器实现对其周围环境的意识。
在深度学习的背景和要求下,卷积神经网络的发展越来越成熟,应用也越来越广泛,如在图像分类中的应用。张顺和王进军[4]指出,图像分类最常用的数据集是ImageNet,ImageNet数据集规模大,在深度可视模型中,字段允许在模型中使用网络结构。卢宏涛,张秦川[5]提出,图像分类是通过对图像的分析,强调对图像整体语义的判断,将图像分类为特定的一类。有很多标记的数据集可以用来确定这样的算法,比较常用的是ImageNet和CIFAR-10/100。
随着研究的深入,几个incep-tion版本相继被提出。Inception-v2[6]使用处理归一化来防止梯度变化,替换之前的5x5卷积层与VGGNet相同的两个3x3卷积层。Inception-v3[7]进一步将一个2D卷积分解为两个1D卷积。WRN[8]的研究重点主要集中在广度上。WRN模型其余部分的卷积核数是ResNet的两倍,而ILSVRC-12验证集只有50层网络结构,错误率低于ResNet的152层错误率。
将深度学习应用于图像检测,需要具备准确收集、搜索和分类照片的能力。从目前图像检测的发展水平来看,这一技术仍然非常复杂。这主要是由于不同类型的图像中存在不同的对象。然而,在大量的实验研究和无数科学家的努力下,深度学习的发展越来越快,也最终实现了SSD技术的创作,它的高精度和快速性也极大地推动了图像检测技术的发展。

  • 添加微信,提供课题关键词,帮你找

猜你喜欢