基于三维几何表示的人体动作识别研究文献综述

 2022-11-25 16:47:35

基于三维几何表示的人体动作识别研究文献综述

前言:近年来,随着人机交互技术的广泛应用和相关技术研究不断取得突破,人体动作识别也成为计算机视觉领域一个非常活跃的研究主题。动作识别技术属于多学科的交叉研究课题,其涉及到图像视频处理、模式识别、人工智能、机器学习等多个学科。人体动作识别研究对我们的生活和社会发展具有十分重要的意义,在诸如运动康复、老年人健康监测、运动体态分析、服务机器人研发、公共场合安全监控、体感游戏、异常行为监测等领域展现出极其广泛的应用前景。在人体动作识别研究中,行为主要通过视频或图像的形式获取进而进行识别,一般的动作识别采用以下的流程:首先收集数据,接着对收集到的数据进行去噪或预处理,接着提取出特征量,然后训练和分类,最后实现人体动作的识别。在这五个部分中,数据去噪和提取出特征量是关键的两个环节。研究人员都在深入地对这两个环节进行不断的改进和发展,提高了识别精确度。本文中涉及的相关文献主要来源于知网、中国期刊网全文数据库、学位论文全文数据库、ScienceDirect全文数据库等资料库,通过关键词和文章名进行检索查阅。

一、研究现状

在针对动作识别的早期研究中,通常是对单帧图像进行特征提取。基于单帧图像的识别优势在于图像数据集更容易获得,但是由于图像没有时间信息导致识别的过程更加困难,并且容易出现误判。因此研究人员提出了基于视频的动作识别方法,在该方法中可以通过有效地获取视频中的时间和空间信息,从而在很大程度上提高识别的准确率,且又因为基于视频的特征提取具有强拓展性和高灵活度,基于视频的动作识别成为研究的主要方向。

动作识别的主要挑战在于数据获取的准确度和整个动作序列的动态建模,影响动作识别准确度的主要因素可以分为:(1)遮挡、阴影、光照条件等;(2)视角变化;(3)尺度的变化(4)类内变异和类间相似性。传统的视频动作识别基于RGB数据,但该数据在采集时容易受前三类因素影响,使得从背景图像中提取特征变得异常困难。近年来,随着3D深度摄像机的发布,比如微软公司的Kinect,可以提供场景的三维深度数据变化,从而显著改善了动作识别的前三类问题,此外RGBD视频数据还能提供3D骨架信息,这简化了动作识别的运动内部变化,并且去除了杂乱的背景噪声。本文将根据查阅的文献针对基于获得的3D骨架信息进行不同特征提取的算法设计进而进行动作识别的综述。

二、基于关键帧特征提取的动作识别方法

文献[13]中利用Kinect提取的人体骨架信息,根据空间不变性计算各结构变量和中心向量之间的夹角,将夹角的角速度(前后两帧的角度差作为前一帧的角速度)作为一种新的动作描述特征,由此得到一组中心角速度的特征,再利用AP(Affinity Propagation)聚类[18]算法提取关键帧,最后利用SVM对其进行分类。

关键帧即在一个动作视频序列中能够反映该动作的代表性视频帧。文献[13]中根据运动序列图像间相似度,将图片聚类,然后从每类中选取一帧作为关键帧。基于聚类分析提取的关键帧能较好地描述人体行为动作,但需要再聚类前设定好聚类中心,然而在动作不确定时,提前设定好聚类数目和中心不仅困难,而且效果不好。如文献[19]采用是的是K-means聚类算法提取关键帧,这种算法的K值的选定是非常难以估计的;从算法的框架上可以看出,该算法需要不断进行样本分类调整,当数据量非常大时,算法的时间开销非常大。因而文献[13]利用不需要预设聚类中心的近邻仿射AP聚类算法进行关键帧的自动提取。将运动视频序列的每一帧看作是一个点,每个关节点的角速度看作是每个点的坐标,由此得到点,进而得到运动视频序列帧之间的相似度并构成相似度矩阵S(i, j)。通过输入相似度矩阵S(i, j),得到聚类中心,从而提取关键帧。文献[13]在CAD-60数据集上实验显示具有良好的识别率。

三、基于模型匹配的动作识别方法

基于图像处理和特征匹配的识别算法,例如战荫伟等人首先对Kinect的深度图像进行局部梯度特征提取,再结合条件随机场(CRF)模型,提出一种新的人体动作分析方法实现了人体动作识别,但该方法模板匹配运算量太大需要大量设备进行并行处理,需要比较高端的处理器。基于滤波预测和轮廓匹配的算法,例如瞿畅等人利用Kinect深度图像技术获取人体深度图像前景图,建立前景图三维包围盒,通过计算三维包围盒的长、宽、高数值以及数值的变化速度,判断人体跌倒是否发生。陈翰雄[21]等人利用Kinect所获取的彩色和深度图像,建立人体骨骼图来定位人体各个关节的位置,根据关节位置对人体动作进行识别。以上算法虽然消除了数据抖动,但其算法的鲁棒性不好,人物发生变化对识别效果有较大影响。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。