文献综述(或调研报告):
基于机器学习的三维人脸分割方法研究的文献综述
摘要:近年来深度学习被应用在点云分割上并取得了重要进展。综述了近几年来基于深度学习的点云分割的最新工作,按基本分为基于视图和投影的方法、基于体素的方法和点云的方法,并简要评述;最后分析各类方法优劣并展望未来研究趋势
- 引言
图像分割技术是计算机视觉领域的重要研究方向,是由图像处理到图像分割的关键步骤。图像分割是指将图像分成若干具有相似性质的区域的过程。近年来,随着深度学习技术的逐步深入,图像分割技术有了迅猛发展,该技术相关的场景物体分割、人脸人体解析、三维重建等技术已经在无人驾驶、安防监控和医学影像等行业都得到了广泛的应用。
点云分割,即对点云中的每个点赋予有意义的标注,标注代表可以是任何具有特定意义的信息。现实世界中三维场景都较为复杂,三维点云数据具有丰富的空间位置信息,对于三维图像的处理和分割具有重要的意义。
本文对近几年来在点云分割问题上的最新工作,按基本方法分为基于二维图像处理、基于体素方法和点云的方法。并对这些算法的优劣及应用进行简要分析,最后展望未来研究趋势。
- 基于深度学习的三维数据分割方法
深度学习自诞生以来,在许多领域产生了突破性的进展,在点云分割上也不例外,其发展的总体趋势是从二维到三维,从转换数据到直接处理。由于思路来源的不同,出现了几种发展方向,本文介绍以下三类。
- 基于投影和视图的方法
为了能利用基于二维CNN 的网络架构,通过变换将点云光栅化为2.5D结构化图像阵列,或者按照球面、柱面将三维坐标投影到二维平面上。这样不仅可以避免复杂的3D处理,还能利用成熟的图像处理技术和海量的二维图像数据集进行模型预训练。
早在地理信息科学中,就有将ALS点云数据光栅化为二维图像的做法[1-2]。而Su 等人提出了多视图CNN[3]后,视图投影方法就开始广泛应用。最近,Qin 等人提出了一种多视图的对ALS 点云进行地形分类的方法[4]。所提出的网络架构TLFnet,是第一个将多视图CNN应用于大规模ALS 点云分割的一种通用架构。
近年来,随着Microsoft Kinect R 这样的低成本RGB-D传感器的广泛应用,越来越多研究倾向于针对RGB-D图像的设计网络架构[5]。虽然RGB-D图像与点云是不同类型的三维数据,但Boulch 等人提出的SnapNet 网络架构[6]打破了两者之间的鸿沟。该方法经多场景的实验证明有着十分广泛的应用范围。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。