一、文献综述
(一)国内外研究现状
所谓图像分割是凭借目标与布景的先验常识,目标和背景的形象标志,然后确定目标从背景或其他错误的目标。图像分割是图像理解的重要构成部分,其目的是分离目标和背景、目标。图像分割是图像理解的重要构成部分,其目的是分离目标和背景、目标辨认等后续处理,准确定位,结果将直接影响后续处理。如何快速、有用地将感兴趣的目标从复杂背景分割一直是一个热门的研究。分割艰难的问题在于模糊和噪声干扰的图像数据[1]。到目前为止,还没有一个或更多完美的分割方式。在图像场景中,遇到一个问题需要通过各方面进行仔细的分析调查,根据调查出的数据并进行分析最后选出一个自己觉得合适的方法。分割结果是好是坏,没有一个全面的评估标准,分割的好坏必须从分割的效果和实际的应用场景来看。
从汽车自动驾驶到医学诊断,对图像分割的要求无处不在。图像分割是计算机视觉中不可缺少的任务之一。该任务比其他视觉任务复杂,因为它需要低层次的空间信息。图像分割基本上可以分为两种类型:语义分割和实例分割。这两个基本任务的组合版本称为全景分割[2].近年来,深卷积神经网络(CNN)的成功极大地影响了分割的领域,并为我们提供了迄今为止各种成功的模型。
随着算力的增加以及深度学习的不断发展,一些传统的分割方法在效果上已经不能与基于深度学习的分割方法相比较了,但是有些天才的思想还是非常值得学习的。传统的图像分割方法分为基于阈值的分割方法、基于区域的图像分割方法、基于边缘检测的分割方法以及结合特定工具的图像分割算法。[2]基于深度学习的分割方法也有很多,但与传统图像分割方法研究不同,深度学习的分割方法更加注重对分割网络模型的研究。例如FCN、UNET、SegNet等.[3]还有一些目标检测算法,也要进行研究如R-CNN、Faster R-CNN、YOLO等.
(二)研究主要成果
本次论文主要研究的是基于深度网络模型的图像分割方法,传统的图像分割方法便不再赘述,主要介绍各种深度网络模型的成果.首先是分割网络模型:
- FCN
FCN是不含全连接层的全卷积网络,对图像进行像素级的分割,解决了图像的语义分割问题[4]。可以接受任意尺寸的图像大小,采用反卷积对最后一个特征图(feature map)进行处理,使其恢复到输入图像的尺寸,对每个像素产生一个预测,反卷积和卷积类似,都是相乘相加的运算。
- Unet
Unet的结构是先编码(下采用)再解码(上采样)的U形结构,保持输入和输出大小一样。[5]在FCN中,Skip connection的联合是通过对应像素的求和,而U-Net则是对其的channel的concat过程。在SegNet中的Pooling比其他Pooling多了一个Pooling Index功能,也就是每次Pooling,都会保存通过max选出的权值在2x2 filter中的相对位置。
- SegNet
Segnet和Unet有点像,它采用的是编码-解码的结构,这样的对称结构有种自编码器的感觉在里面,先编码再解码。[6]这样的结构主要使用了反卷积和上池化。解码器通过池化索引来实现非线性的上采样,这个池化索引是由与解码器相对应的编码器进行最大池化操作计算得到的。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。