meanshift的视频跟踪算法研究
摘 要当今社会,目标跟踪已经成了计算机视觉与模式识别领域一个重要的研究方向,在目标跟踪的算法里值得一提的是Mean shift算法,Mean shift算法最初被用于模式识别领域聚类分析方面,如今在目标跟踪领域也有了广泛的应用。本文主要是在简单背景环境下用Mean shift算法对目标跟踪进行研究并对其缺点进行改进。首先对Mean shift算法的理论基础和基本原理进行学习,了解了Mean shift算法实现的具体步骤,接着分析了Mean shift视频跟踪算法在进行目标跟踪时的具体结果,这里包括对avi格式视频的目标跟踪和用摄像头进行实时跟踪。在对不同视频进行目标跟踪的测试时,通过对比发现Mean shift算法的搜索窗口不能根据目标的大小变化。为了解决搜索窗口不能自适应变化的问题,本文采用了Camshift算法。在对Camshift算法的性能进行研究前,先了解了反向投影的基本原理以及Mean shift算法在Camshift算法中的具体计算过程,接着用Camshift算法对之前用过的视频进行目标跟踪,将跟踪得到的结果与Mean shift算法的跟踪结果进行对比,发现Camshift目标跟踪算法中的搜索窗口已经完全能根据目标尺寸的大小进行变化,在某些背景环境中Camshift算法的跟踪效果也比Mean shift算法更理想。
目 录
摘 要 I
ABSTRACT II
目 录 III
第一章 绪论 1
1.1 引言 1
1.2 目标跟踪的研究意义与研究现状 1
1.3 Mean shift算法的国内外研究现状 2
1.4 本文主要内容及章节安排 3
第二章 基于Mean shift的视频跟踪算法研究 4
2.1 非参数密度估计理论 4
2.1.1 核密度估计算法 4
2.1.2 Epanechnikov核函数 6
2.2 Mean shift算法的基本原理 6
2.2.1 Mean shift向量 7
2.3 基于颜色直方图的Mean shift跟踪算法的基本原理 8
2.3.1 目标模型描述 8
2.3.2 候选模型描
*好棒文|www.hbsrm.com +Q: ^351916072*
述 9
2.3.3 基于Bhattacharyya的相似性度量 9
2.3.4 Mean shift算法的迭代过程 10
2.4 Mean shift算法的实现 11
2.5 实验结果与分析 13
2.5.1 直接读取视频进行目标跟踪 13
2.5.2 利用电脑的摄像头进行目标跟踪 17
第三章 Camshift视频跟踪算法 19
3.1 Camshift算法的基本原理 19
3.1.1 反向投影原理 19
3.1.2 Mean shift算法的原理 20
3.1.3 Camshift算法的原理 20
3.2 Camshift算法的实现 20
3.3 实验结果与分析 22
3.3.1 直接读取视频进行目标跟踪 22
3.3.2 利用电脑进行目标跟踪 25
第四章 Mean shift算法与Camshift算法跟踪性能比较 27
4.1 Mean shift算法的优缺点 27
4.2 Camshift算法的优缺点 27
4.3 Mean shift算法与Camshift算法的比较 28
第五章 总结与展望 29
5.1 本文工作总结 29
5.2 展望 29
参考文献 31
致 谢 35
附 录 36
第一章 绪论
1.1 引言
视觉是人们进行各项活动、获取各项信息的根本途径,但是在很多环境下,人们无法亲自进行查看,而希望用机器代替人眼来感知世界、获取信息。近年来,人们通常会用摄像头来获取周围的环境信息或是对一些重要的场所、建筑进行监控,之后用电脑再对获取来的信息进行识别、跟踪并作进一步处理。这些新的应用、技术逐渐形成了一个学科,这个新的学科就是我们现在常常提到的计算机视觉[1]。
计算机视觉起源于20世纪50年代,直到20世纪70年代,Barrow和Marr等人才提出用于描述视觉过程的一个比较完善的计算机视觉理论[2]。Marr理论的核心是从图像中恢复物体的三维形象[3],这个理论是计算机视觉领域的重要理论框架。
1.2 目标跟踪的研究意义与研究现状
在计算机视觉与图像识别领域,基于视频的目标跟踪已经成为该领域的一个核心课题。目标跟踪涉及到图像处理、模式识别、人工智能等学科的一些知识和核心技术。视频跟踪技术可以在下一帧图像中找到目标的位置进行跟踪,并为视频的分析、理解提供信息和数据。随着科学技术的发展、计算机和摄像设备的普及,目标跟踪在人类生活、工作中的应用越来越广泛,如:人机交互、安全监控、交通管理以及医疗诊断等[5]。在人机交互[6]方面,以前人机交互是通过键盘显示器、鼠标和各种模式识别设备进行的,但这并不能满足人们的需求,人们希望计算机能更智能化[7],例如:能识别人的动作、人的手势、人的姿势等,能与人进行简单的“交流”,如今目标跟踪已经可以实现这些功能了。在安全监控方面,如视频监控[89],可以对指定场所进行监视,配合管理人员完成安保工作。在交通管理方面,视频跟踪可以对车辆进行实时跟踪,还可以对某一路段的车流量、车速、路况等进行监控。在医疗诊断[10]方面,跟踪技术已经应用于核磁共振[11]和超声波图像的自动分析中。
随着计算机视觉与模式识别技术的发展,目标跟踪受到了人们的广泛关注,国内外的许多大学和研究所也对这一热门课题进行了专项研究,取得了一定的成果并将这些成果成功地应用于人们的生活中。
目前,目标跟踪的方法主要有四种[12],分别为:基于区域的跟踪、基于特征的跟踪、基于模型的跟踪和基于主动轮廓线的跟踪。基于区域的跟踪[13]是将包含目标的区域作为一个整体进行跟踪,将候选模型与目标模型进行相关运算计算出它们的相似度,相似度函数值最大的地方就是目标所在的位置[14];基于特征的跟踪[1516]是将目标的某个特征与候选区域的特征进行匹配来实现对目标的跟踪,用来匹配的特征在运动中几乎没有变化,在跟踪过程中如果出现目标被遮挡的情况,只要目标特征有一部分没被遮挡就可以继续完成对目标的跟踪;基于模型的跟踪[17]实际上是基于目标模型的跟踪,首先要建立目标的三维模型,接着要建立摄像机的成像模型,然后记录下目标的位置和运动的方向并以此为依据利用摄像机成像模型将三维模型投影到平面上并对模型进行匹配来达到跟踪的目的[18];基于主动轮廓线的跟踪[19]是以构成轮廓线的控制点为模板,通过模板自身的模型力产生形变并将其与目标轮廓进行拟合,基于主动轮廓线的跟踪算法的复杂度和计算成本较低,但跟踪的效果会受目标遮挡情况的影响,即只要有部分目标被遮挡,跟踪的效果就会不理想。
衡量目标跟踪算法跟踪效果好坏的指标主要有:准确性、实时性和鲁棒性。准确性主要指算法在进行目标跟踪时能正确的跟踪目标,不会出现目标跟踪错误的情况。实时性指算法可以用于实时的目标跟踪而不是用已经存在的视频进行目标跟踪,这主要是对算法的复杂度和计算速度的要求。鲁棒性描述的是周围环境,如光照、其他物体的遮挡等对跟踪结果的影响。算法的鲁棒性越好,表明算法的抗干扰能力越好。
目 录
摘 要 I
ABSTRACT II
目 录 III
第一章 绪论 1
1.1 引言 1
1.2 目标跟踪的研究意义与研究现状 1
1.3 Mean shift算法的国内外研究现状 2
1.4 本文主要内容及章节安排 3
第二章 基于Mean shift的视频跟踪算法研究 4
2.1 非参数密度估计理论 4
2.1.1 核密度估计算法 4
2.1.2 Epanechnikov核函数 6
2.2 Mean shift算法的基本原理 6
2.2.1 Mean shift向量 7
2.3 基于颜色直方图的Mean shift跟踪算法的基本原理 8
2.3.1 目标模型描述 8
2.3.2 候选模型描
*好棒文|www.hbsrm.com +Q: ^351916072*
述 9
2.3.3 基于Bhattacharyya的相似性度量 9
2.3.4 Mean shift算法的迭代过程 10
2.4 Mean shift算法的实现 11
2.5 实验结果与分析 13
2.5.1 直接读取视频进行目标跟踪 13
2.5.2 利用电脑的摄像头进行目标跟踪 17
第三章 Camshift视频跟踪算法 19
3.1 Camshift算法的基本原理 19
3.1.1 反向投影原理 19
3.1.2 Mean shift算法的原理 20
3.1.3 Camshift算法的原理 20
3.2 Camshift算法的实现 20
3.3 实验结果与分析 22
3.3.1 直接读取视频进行目标跟踪 22
3.3.2 利用电脑进行目标跟踪 25
第四章 Mean shift算法与Camshift算法跟踪性能比较 27
4.1 Mean shift算法的优缺点 27
4.2 Camshift算法的优缺点 27
4.3 Mean shift算法与Camshift算法的比较 28
第五章 总结与展望 29
5.1 本文工作总结 29
5.2 展望 29
参考文献 31
致 谢 35
附 录 36
第一章 绪论
1.1 引言
视觉是人们进行各项活动、获取各项信息的根本途径,但是在很多环境下,人们无法亲自进行查看,而希望用机器代替人眼来感知世界、获取信息。近年来,人们通常会用摄像头来获取周围的环境信息或是对一些重要的场所、建筑进行监控,之后用电脑再对获取来的信息进行识别、跟踪并作进一步处理。这些新的应用、技术逐渐形成了一个学科,这个新的学科就是我们现在常常提到的计算机视觉[1]。
计算机视觉起源于20世纪50年代,直到20世纪70年代,Barrow和Marr等人才提出用于描述视觉过程的一个比较完善的计算机视觉理论[2]。Marr理论的核心是从图像中恢复物体的三维形象[3],这个理论是计算机视觉领域的重要理论框架。
1.2 目标跟踪的研究意义与研究现状
在计算机视觉与图像识别领域,基于视频的目标跟踪已经成为该领域的一个核心课题。目标跟踪涉及到图像处理、模式识别、人工智能等学科的一些知识和核心技术。视频跟踪技术可以在下一帧图像中找到目标的位置进行跟踪,并为视频的分析、理解提供信息和数据。随着科学技术的发展、计算机和摄像设备的普及,目标跟踪在人类生活、工作中的应用越来越广泛,如:人机交互、安全监控、交通管理以及医疗诊断等[5]。在人机交互[6]方面,以前人机交互是通过键盘显示器、鼠标和各种模式识别设备进行的,但这并不能满足人们的需求,人们希望计算机能更智能化[7],例如:能识别人的动作、人的手势、人的姿势等,能与人进行简单的“交流”,如今目标跟踪已经可以实现这些功能了。在安全监控方面,如视频监控[89],可以对指定场所进行监视,配合管理人员完成安保工作。在交通管理方面,视频跟踪可以对车辆进行实时跟踪,还可以对某一路段的车流量、车速、路况等进行监控。在医疗诊断[10]方面,跟踪技术已经应用于核磁共振[11]和超声波图像的自动分析中。
随着计算机视觉与模式识别技术的发展,目标跟踪受到了人们的广泛关注,国内外的许多大学和研究所也对这一热门课题进行了专项研究,取得了一定的成果并将这些成果成功地应用于人们的生活中。
目前,目标跟踪的方法主要有四种[12],分别为:基于区域的跟踪、基于特征的跟踪、基于模型的跟踪和基于主动轮廓线的跟踪。基于区域的跟踪[13]是将包含目标的区域作为一个整体进行跟踪,将候选模型与目标模型进行相关运算计算出它们的相似度,相似度函数值最大的地方就是目标所在的位置[14];基于特征的跟踪[1516]是将目标的某个特征与候选区域的特征进行匹配来实现对目标的跟踪,用来匹配的特征在运动中几乎没有变化,在跟踪过程中如果出现目标被遮挡的情况,只要目标特征有一部分没被遮挡就可以继续完成对目标的跟踪;基于模型的跟踪[17]实际上是基于目标模型的跟踪,首先要建立目标的三维模型,接着要建立摄像机的成像模型,然后记录下目标的位置和运动的方向并以此为依据利用摄像机成像模型将三维模型投影到平面上并对模型进行匹配来达到跟踪的目的[18];基于主动轮廓线的跟踪[19]是以构成轮廓线的控制点为模板,通过模板自身的模型力产生形变并将其与目标轮廓进行拟合,基于主动轮廓线的跟踪算法的复杂度和计算成本较低,但跟踪的效果会受目标遮挡情况的影响,即只要有部分目标被遮挡,跟踪的效果就会不理想。
衡量目标跟踪算法跟踪效果好坏的指标主要有:准确性、实时性和鲁棒性。准确性主要指算法在进行目标跟踪时能正确的跟踪目标,不会出现目标跟踪错误的情况。实时性指算法可以用于实时的目标跟踪而不是用已经存在的视频进行目标跟踪,这主要是对算法的复杂度和计算速度的要求。鲁棒性描述的是周围环境,如光照、其他物体的遮挡等对跟踪结果的影响。算法的鲁棒性越好,表明算法的抗干扰能力越好。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/1060.html