视觉感知对象分割与检测算法研究

视觉感知对象分割与检测算法研究[20191214192337]
摘 要
基于视觉感知对象的检测与跟踪是计算机视觉领域的重要研究方向之一,它是智能监控、人机交互、模式识别等众多应用的基础。运动目标检测是其中的重难点,检测的完整性与准确度影响到视频后期处理的效果。不同场景下应用不同的运动目标检测算法会达到不同的效果,背景环境的影响如光照、阴影、树叶抖动等常常降低了前景目标的检测准确度,因此运动目标检测主要针对不同场景应用相适应的算法以满足实际需求。
本文针对背景固定的情况研究了运动目标的检测与跟踪,论文的主要内容包括以下几个方面:首先介绍了运动目标检测与跟踪的研究背景与意义,然后研究了运动目标检测一些基本方法:背景差法、帧差法和光流法,由于应用要求的提高我们研究了一些基于背景差和帧差的改进算法。最后本文实验研究了基于混合高斯模型的运动目标检测算法和基于Kalman滤波的运动目标跟踪算法,并通过生活中拍摄的视频验证了算法的可行性。
 查看完整论文请+Q: 351916072 
关键字:运动目标检测;目标跟踪;混合高斯模型;Kalman滤波
目 录
摘 要 I
ABSTRACT II
目 录 III
第一章 绪论 1
1.1 课题研究背景与意义 1
1.2 课题相关领域的研究现状 2
1.3 本文研究内容与结构安排 3
第二章 运动目标检测技术 5
2.1 引言 5
2.2 运动目标检测基本算法与分析 5
2.2.1 背景差分法 5
2.2.2 帧间差分法 7
2.2.3 光流法 8
2.2.4 几种算法的优缺点分析 11
2.3 基于背景差与帧差的改进算法研究 11
第三章 运动目标跟踪技术 14
3.1 引言 14
3.2 Kalman滤波器 14
3.3 粒子滤波器 15
3.4 Mean Shift技术 16
第四章 系统设计与实验结果分析 19
4.1 系统设计 19
4.2 运动目标检测实验结果及分析 19
4.3 运动目标跟踪实验结果与分析 24
第五章 总结与展望 27
5.1 本文工作总结 27
5.2 展望 27
参考文献 28
致谢 30
英文文献翻译 31
第一章 绪论
1.1 课题研究背景与意义
在现实生活中,人们信息量获取70%来自视觉信息[4],所以如果一个智能机,给它以视觉函数来代替人类一些冗长而详细的工作,这将对人类的发展具有重要的意义。计算机的极速发展促使一门新兴科学的诞生——计算机视觉[1]。简单地说,就是把计算机比作人,研究如何给计算机制造一双眼睛,让它通过这双“眼睛”替代人的工作对视频中感兴趣的对象进行判别、跟踪和分析,并对图像作进一步的处理,通过电脑快速有效的计算处理以使人们可以直观地观察和分析,同时也方便传送给其他仪器设备作进一步处理。作为一个科学学科,计算机视觉的钻研方向是制作一个智能系统,这个系统能够从视频序列图像或者大量数据中获取我们感兴趣的信息。视频序列图像中运动目标的检测与跟踪是计算机视觉领域研究的一个方向,具有不可避免的重大研究意义,它是视频监控后续处理的前提。当今社会正在朝着科技化、智能化的方向发展,计算机技术已深入我们日常生活中的方方面面,运动目标检测与跟踪系统在很多方面得到了广泛的应用,主要有视频监控、智能化交通、智能导航、卫星云图分析、人机交互、模式识别、视频编码处理等领域。
近年来,随着计算机技术的快速发展,计算机视觉的研究方向开始发生转变,原来是对静态图像的处理分析,现在已发展到对视频序列图像的处理[3],即研究对运动目标的视觉分析,对视频序列图像中有价值的或者我们感兴趣的目标进行检测、跟踪并分析描述它们的行为也是它的重要研究方向。一幅图像包含的信息比一段语音或者文字描述包含的信息要多得多,而一段视频包含的信息却又比一幅图像包含的信息要多,因为视频可以展现运动,很多有价值的信息其实都包含在目标的运动当中,所以对视频序列中运动目标的检测与跟踪是这一方向研究的必经之路,也是视频后期处理的前提与基础,是现如今很多学者广泛关心并钻研的方向,但这也是计算机视觉处理分析的重点和难点。
1.2 课题相关领域的研究现状
视频监控系统是图像处理、视频压缩/解压缩、人工智能和计算机网络等技术综合运用的结果。视频监控系统从技术发展进程来看主要有三个阶段[5]:第一阶段,模拟视频监控,采用模拟信号作为视频传输手段,并发展相应的压缩算法,即闭路电视监控;第二阶段,数字视频监控,采用数字信号作为视频传输手段,它是伴随数字信号系统发展起来的,也是现在的主流;第三阶段,分布式视频监控,将监控系统分布在更大的范围,部署更多的监控节点。智能监控系统就是第三代监控系统的一个重要的发展方向。它是利用网络与分布式技术,实现视频采集与处理的网络化;利用计算机的数据处理能力,实现视频信息的数字化:采用计算机视觉技术,对视频进行发现,理解视频内容,在最短时间内自动报警,方便管理,减少损失。相比人工方式大大降低了错报、误报率,提高了监控系统的可靠性。
运动目标检测是对视频图像序列中我们感兴趣的目标进行分析处理并把它们与背景区分开,以便更好地观察它们的行为,达到实时监控的便利性和高效性。运动目标检测和运动目标的提取一般放在一起进行处理,其中运动目标检测是视频监控系统最基础的部分,后期视频的很多高级处理比如运动目标的分类等都要以此为基础。运动目标的检测一般两种,即静止或趋于稳定背景下的运动检测和运动背景下的运动检测,目前阶段我们主要研究静止背景下的运动目标检测。对于静态背景下视频序列图像中运动目标的检测,目前主要有三种常用的基本方法:背景差分法、帧间差分法和光流法。在实时检测系统中,帧间差分法或背景差法具有比较好的处理结果。
动态背景中的运动目标检测相比静态背景算法处理要复杂很多,因为我们感兴趣的目标和不感兴趣的背景同时运动,难以区分,只能通过特殊的算法来辨别,这些算法有光流估计法、块匹配法、图像匹配法以及全局运动估计法等,这些都是当前常用的针对动态背景的运动目标检测算法。
运动目标跟踪是根据运动目标的一些特征从背景图像中区分开来的,这些特征必须是运动目标所特有的,唯一的,所以运动目标跟踪的关键是如何选择好的目标特征。此外,运动目标跟踪的一个重要思想是选择实用的特性匹配搜寻算法,这种算法同时可以从两个方面去研究,一方面是预测,即先通过一些处理分析预测运动目标在以后几帧中可能出现的位置,然后再在这些区域搜索运动目标,从而大大减少了计算量和搜寻时间。另一方面是优化,即通过优化算法来提高目标匹配速度,这种思想相比第一种存在一定的缺陷,但可以同时综合这两种思路来优化算法,最大限度提高算法的有效性和实用性。
目标跟踪是在下一帧图像中搜寻与运动目标特征最为相似的区域,因此这里有一个问题,搜寻范围是全图还是里面的一个区域[2],如果是在全图中搜索那明显增加了算法的复杂度和计算量,而且有时候也不必全图搜索,一般情况下,运动目标在前后几帧的位置变化不大,所以可以以此为出发点找到一种避免全图搜索的算法,这种算法要能实现区域搜索的快速跟踪。当前这一领域经常用到的定位运动目标位置的方法有平方预测、统计预测和线性预测。本文以Kalman滤波方法[6]实现对运动目标在后面帧图像中位置的预测,这种算法缩小了目标在匹配过程中的搜索区域,也避免了传统目标跟踪中使用的全局匹配法比较耗时的问题,在进行运动目标跟踪确定目标在下一帧中位置时结合目标检测的结果只需要搜索前一帧中预测的范围,减少了目标模板与候选目标匹配检测的次数,从而有效提高了目标跟踪的速度。
1.3 本文研究内容与结构安排
本文以视频序列为研究对象,学习并研究了静态背景下运动目标的检测与跟踪算法,总结起来,论文主要内容包括以下几个方面:
(1)深入研究了视频序列运动目标检测的一些基本方法,并讨论了它们各自的优点和缺点,为以后智能监控的后续研究奠定了基础。
(2)总结前人经验,概括了基于背景差分和帧间差分的改良算法,大大提高了运动目标检测的完整性与准确性,但对于当前检测难题仍需要作进一步的改进。
(3)重点研究了基于混合高斯模型的运动目标检测算法,并通过MATLAB平台进行了实验仿真,根据实验结果做出了相应分析。
本文共有五个章节,结构安排如下:
第一章是绪论,介绍了运动目标检测与跟踪这一研究领域的背景和意义,并阐述了这一研究领域国内外的发展情况,最后说明了本文的工作内容和各章节安排,提供了本文的基本框架。
第二章介绍了运动目标检测技术的一些经典实用算法。首先研究了当前对于运动目标检测的三种基本方法:背景差法、帧差法和光流法,并对这三种基本方法作出了比较分析。然后研究了基于背景差和帧差的改进算法,大大提升了算法的实用性。
第三章介绍了运动目标跟踪技术的算法研究:Kalman滤波器、粒子滤波器和Mean Shift技术。
第四章通过基于MATLAB的仿真实验分析了混合高斯模型和Kalman滤波算法的可行性和实用性。
第五章对本文工作作了总结,针对仍然存在的问题作进一步的指证,并对课题研究相关领域作出未来展望。
第二章 运动目标检测技术
2.1 引言
运动目标检测是指将有价值的信息从背景中分离出来,它是视频序列图像处理的关键步骤,是智能交通管理、智能导航、人机交互等技术中的一个重要前提环节,是视频序列图像中运动对象分类、跟踪、动作行为理解的前提。运动目标检测主要实现视频序列图像中运动区域的提取,并对我们感兴趣的目标实现初步定位,这很大程度上降低了后续高级处理如跟踪,行为理解等的难度。运动对象检测的完整性和准确性直接影响到后续图像序列处理的效果,决定了智能视频监控系统的整体性能。然而运动目标的检测也不是那么简单,需要克服现实生活中许多不确定因素的干扰,比如运动对象的阴影、天气变化、光线变化、视频背景的小像素干扰等,研究实用有效的检测算法一直以来都是学者们努力的方向。目前比较简单经典的运动目标检测算法主要有三种[3]:背景差法、帧差法和光流法。
2.2 运动目标检测基本算法与分析
2.2.1 背景差分法
背景差分法是利用视频序列图像中的当前帧与通过建模确定的背景模型比较来检测运动目标的一种方法[7]。这种方法的关键在于背景建模,背景建模的准确程度,对整个方法的检测结果影响很大。所有目标检测算法都应该满足现实生活中的各种不同处理需求,但是由于现实生活着拍摄环境的影响和硬件条件等造成的噪声的存在,比如光线的变化、部分物体的变动、摄像机的抖动等,使得背景的建模比较困难。
主要思想:首先通过背景建模建立一个除去运动目标以外的背景模型,然后将当前帧图像与背景模型作差分运算,通过设定阈值,判定每个像素点是属于背景还是前景,大于阈值的判定为运动目标。公式表达如下:
假设I(x,y)和B(x,y)分别表示当前帧图像和背景图像,T为设定的阈值,则处理后的图像表示为: (2.1)
常用背景建模方法:
(1)中值法背景建模:截取视频序列中的一段,把这段时间的每一帧图像对应像素点的灰度值按照从小到大的顺序排列,取中间的灰度值作为背景模型对象像素点的灰度值。
(2)均值法背景建模:对一段视频序列中连续帧对应像素点的灰度值取平均值作为背景模型中该像素点的灰度值。这种算法运算速度快,但背景环境的微小变化都可能会影响该算法的性能准确度。
(3)单高斯分布模型:这种模型是用随机过程(X)替代图像中每一个像素点的灰度值,并假定像素一定范围的灰度值出现概率服从高斯分布,用数学形式表示为:
(2.2)
(4)多高斯分布模型:相比单高斯分布模型,这是利用多个高斯分布来对图像中每个像素点进行建模,一个背景场景采用一种高斯模型分布,所以对于复杂环境的背景建模这种方法可以形象地模拟出来。
(5)高级背景模型:获得视频图像序列中像素的时间序列模型。这种建模对于时间的波动处理能获得比较好的结果,但缺点是这种建模方法需要损耗很多的内存。
(6)Kalman滤波器模型:把背景看成一种近似稳定的体系,把运动目标看成一种噪声,用基于Kalman滤波理论的时域递归低通滤波来预测变化缓慢的背景图像,如此不仅可以利用运动目标图像去更新背景图像,还可以保持背景的稳定性,较少了噪声对结果的影响。
2.2.2 帧间差分法
帧间差分法[9]与背景差分法相差不大,主要区别在于背景差分法是当前帧与背景图像相减,而帧间差分法是相邻帧图像作差分,因此不需要建立并更新背景模型,一定程度上简化了算法步骤。这里简要介绍该算法内容。
主要思想:选取视频序列中连续两帧图像作差分运算,运算数值结果大于设定阈值则判定为运动目标,否则判定为背景图像。公式表达如下:

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/dzkxyjs/2461.html

好棒文