基于视频的行为观察技术
基于视频的行为观察技术[20191214192824]
摘 要
传统的动物行为分析方法采用的是人为的观察和记录的方法,用人眼对动物行为进行判断,不仅要花费很多时间,而且判断的结果具有不准确性以及主观性等缺点,从而导致动物实验结果会出现一些偏差,甚者还会出现错误。本文采用视频跟踪技术,运用软件直接对视频中的动物行为进行分析,提高了实验的可行性以及准确性。
本文主要研究了西瓜虫的运动转向问题。首先设计了一个迷宫,分别对西瓜虫在迷宫3个不同部分的运动转向进行视频采集并对其转向时间进行计算。实验中采用MATLAB作为视频处理软件,选择这个软件是因为:(1)使用方便;(2)内部函数非常丰富;(3)强大的图形与符号功能;(4)能够自主选择算法。通过比较发现传统算法(高斯混合模型的方法)耗时较多,而本文所用的方框质心法大大缩减了所花费的时间,而且方框质心法的鲁棒性比较好,所以最终选择方框质心法进行目标追踪。
查看完整论文请+Q: 351916072
关键字:视频跟踪技术;运动转向;方框质心法;鲁棒性;
目录
摘 要 I
ABSTRACT II
第1章 绪 论 1
1.1 研究背景及其意义 1
1.2视频分析技术 1
1.3论文的主要工作内容 3
第2章 视频图像分割与处理 4
2.1视频图像分割提取的基本概述 4
2.1.1视频对象的定义 4
2.1.2视频分割与图像分割的关系 5
2.2视频对象分割方法的分类与应用概况 5
2.2.1分割方法的分类 5
2.2.2应用概况 7
2.3 图像平滑 7
2.3.1 中值滤波原理 8
2.3.2 平滑效果实验分析 9
2.4 灰度调整 9
2.4.1 灰度调整原理 9
2.4.2 灰度调整效果实验分析 10
2.5数学形态学后处理 10
第3章 运动目标的检测与跟踪方法 12
3.1 运动目标检测常用算法 12
3.1.1 帧间差分法 12
3.1.2 背景差分法 13
3.2 运动目标跟踪算法简介 13
3.2.1 基于模型的跟踪 13
3.2.2 基于区域的跟踪 14
3.2.3 基于变形模型的跟踪 14
3.2.4 基于特征的跟踪 14
3.3 结论 15
第4章 实验设计与实现 16
4.1实验对象及设计 16
4.1.1实验对象 16
4.1.2实验设计 16
4.1.3实验采集系统 18
4.1.4实验处理软件 18
4.2实验方法对比 20
4.2.1本实验算法跟踪图 20
4.2.2传统算法跟踪图 23
4.2.3算法对比结果 26
4.3实验结果及结论 26
4.3.1实验结果 26
4.3.2实验结论 29
第5章 结论与展望 30
5.1 结论 30
5.2 展望 30
致 谢 32
参考文献 33
附录中英文翻译 35
第1章 绪 论
1.1 研究背景及其意义
传统的动物行为分析方法采用的是人为的观察以及记录,通过人的眼睛对动物的行为进行判断,不但非常得耗费时间,而且判断的结果也会具有不准确性以及主观性等缺点,从而导致动物实验结果会出现一些偏差,甚者产生一些错误。动物行为分析方法的发展经历了人工观察阶段、传感器检测技术阶段以及视频跟踪技术阶段等。
动物行为分析系统通常会由硬件平台与软件平台相互结合并广泛应用于跟踪、分析动物(或人)的行为、运动及活动。目前,国内市场上的动物行为分析产品绝大多数都是国外产品,而自主的产品相对少了很多,并且价格相对也比较贵,因此很少结合国内的研究现状。在各大高校生物实验室或医学研究院,在研究精神药理学以及行为科学等方面的研究通常需要对动物进行一些实验,所以对于构建一套性价比较高,根据国内生物研究的研究状况,研究价值非常高,操作非常简便的动物行为检测系统是一件非常紧迫的事情。
1.2视频分析技术
随着计算机技术的迅猛发展和图象处理技术的逐步成熟,各种基于计算机图象分析的行为测量系统日渐增加。和其它传感测量方法相比而言,图象处理拥有许多明显的优点:(l)它和动物大小没有太大关联,能够非常方便地调整监测范围;(2)依靠目前先进的图象处理技术,能够对多种动物行为参数(例如位置、活动轨迹、方向、移动距离、平均速度、进入特定区域或者停留时间等)实现精确的测定;(3)依靠图象模式识别技术能够对动物特征活动实现识别;(4)通过多个摄像机甚至能够对动物活动实现实时监测。以上几个优点让图象处理的方法可以对动物行为进行更加灵活、精细、全面的测量,现今已经是最受广大行为学研究者欢迎的动物行为监测技术。
图像处理技术虽然发展迅速,但是把视频中动物或者人的行为进行自动分类识别,仍然是计算机领域中最具挑战的研究工作之一,因此视频分析技术的学习研究极其重要。视频分析技术简单的说就是使用计算机图像视觉分析技术,通过将场景中背景和目标分离进而分析并追踪在视频中出现的目标。视频分析方法主要有这两类,一类是背景减除方法,背景减除方法其实是依据当前图象与背景图象的差分将运动区域检测出来的一种方法。这个方法能够提供比较完整的运动目标特征数据。而且其精确度与灵敏度相对比较高,具有良好的性能表现。另一类是时间差分法,时间差分法又称相邻帧差法,就是依据视频图象特征,从连续得到的视频流中将所需要的动态目标信息提取出来。时间差分法的实质其实就是通过相邻帧图象相减从而将前景目标移动的信息提取出来。这个方法不能完全提取所有相关特征象素点,在运动实体内部或许会产生空洞,智能检测出目标的边缘。以上方法是目前比较常用的方法[3]。
视频分析过程是视频分析技术的重要部分, 其利用的是计算机视觉技术,对画面进行分析、处理以及应用的过程,过程如下:
(1)背景学习过程:视频分析开始生效后,系统会先对背景进行学习,学习时间与背景热闹程度有关,在这个期间,系统会自动建立背景模型。一般系统完成建模以后,随着时间的缓慢变化,背景也会发生一些变化,不过系统拥有“背景维护”的能力,也就是能够把一些后来融入背景的图像,如树木等自动作为背景。常见的背景建模方法有帧差法、平均背景法、高斯背景建模法以及Codebook背景建模法。
(2)移动目标提取与跟踪:完成背景学习阶段以后,系统将会进入目标提取和跟踪阶段。目标提取是基于背景建模完成后,假如前景出现移动物体目标,并在设置的范围区域内而且目标物体大小满足预先设置,系统就会对这个目标进行提取并跟踪。目标的良好跟踪是视频分析效果的基础前提条件,视频分析过程需要知道目标出现和运动的时间、位置、速度以及方向等要素,而这些要素主要通过目标跟踪得到。常用的目标跟踪方法有滤波理论的目标跟踪方法、Meanshift跟踪方法以及偏微分方程的跟踪方法[2]。
(3)目标的识别与行为分析:目标的识别其实就是系统对先前提取并跟踪的目标进行识别和辨识。
(4)视频分析的过程:该过程其实是系统的关键过程,有了先前的背景、目标跟踪、目标识别等过程,视频分析是利用以上过程的结果,并结合预先设置好的行为规则,实现视频分析的过程。
视频分析技术应用前景很广,值得研究开发,利用此技术对动物行为进行研究,更是一件有意义的事情,值得研究者去学习与研究,从而能提出更多高效而快捷的方法。
1.3论文的主要工作内容
通过动物实验得到动物运动转向的运动学参数。构建这样的运动分析系统,首先需要选择合适的硬件来组建系统硬件平台,然后依据被拍对象的运动特点设计合适的算法并且编程实现运动跟踪,最后通过分析运动参数系统地对实验进行验证。因此,本论文针对以下几个方面展开了工作:
(1)视频采集系统地硬件组成;
(2)图像处理所用到的软件;
(3)传统跟踪算法与实验算法比较;
(4)实验数据的记录与分析。
第2章 视频图像分割与处理
2.1视频图像分割提取的基本概述
进入第二十一个世纪以来,随着信息社会的发展,人们对多媒体信息的需求不断增加,视觉信息是非常重要的一部分。视频的视觉信息是指一个观测系统(如相机)的运动图像序列记录的人,是一个重要的动态信息直接从外部获得,但由于数据量巨大,为了方便运输和储存,需要进行高效的压缩编码。
现有的视频压缩标准,能够分为两类。第一类压缩标准以JPEG、MPEG1/2等作为代表,它的主要特点是把像素和像素块作为基本的编码单元,该类编码标准已经在VCD/DVD、数字电视以及视频通信等一些方面应用并取得了成功。用基于对象(内容)编码作为特点的第二类压缩标准MPEG-4除了可以提供高效的压缩编码效率以外,还可以提供基于对象的交互功能,使用户可以访问(浏览、搜索)和操作(移动、剪切、粘贴)场景中的各个对象,能够更加广泛地延拓应用范围,所以也被叫作第二代编码标准[1]。
基于对象的编码与交互功能首先要把场景或者视频序列中的各类对象(比如说树木、运动中的汽车以及人等一些前景对象与静止的房屋等一些背景对象)分割提取出来,但是MPEG-4并没有规定从视频序列中分割出这类拥有语义意义的视频对象(video object,VO)的方法,而是对用户开放,它的目的是为了便于用户根据具体应用来设计特定的视频对象分割算法[3]。然而,语义视频对象分割和早期的图像分割相比较而言更是一项挑战性的问题,为此自MPEG-4标准诞生后的十多年来,国内外包含各大公司、高校以及各类研究机构在内的研究者已经进行了深入、广泛的研究工作。到现在为止,虽然还没有那么完善,但是已经进入了应用阶段,而且应用领域已经远超了原先仅仅作为便于高效编码与对象交互功能的范围。
2.1.1视频对象的定义
在MPEG-4标准中,视频对象的定义是“场景中的一个单元,允许用户访问(搜索,浏览)和操作(剪切,粘贴,移动)”,这是视频对象区域聚集,且至少有一个特征出现在视频序列中,此描述较为抽象。在本质上的实际视频领域,视频对象是指一定的语义实体和区域,如汽车,人等可以作为视频对象。但对同一视频场景,不同的应用所感兴趣的视频对象是不同的。语义视频对象的提取过程在本质上属于分割问题,因此有时称为提取,有时也称为分割。
2.1.2视频分割与图像分割的关系
视频是一连串的的图像序列,视频中的每一帧(某一时刻的采样)即可视为一幅图像。因此,扩展图像序列中的时间维度的视频,但视频处理和图像处理在时间维度上不是简单的扩展,这是由于在视频序列图像相邻地段空间冗余和时间冗余的存在,有很强的相关性。因此,图像分割与视频分割之间存在区别与联系:1)图像分割常利用空间信息进行分割,视频分割同时还利用时间信息进行分割。2)图像分割取决于底层特征的像素水平,如一致,纹理,颜色和灰色聚类的区域,通常是相似的,通常不涉及语义,因此它也被称为“低级”分割。视频对象分割由于对象包含着运动信息,常会发生遮挡区和显露区等问题以及存在非刚体对象的形变问题,很难仅用上述的低级特征来刻画,还需借助于语义的一致性。由此而言,视频分割比图像分割要复杂得多。3)图像分割是一幅静态图像单独的分割。视频分割先要进行初始帧分割,分割初始帧对象时既可沿用图像分割的某些方法,又常运用后续帧的相关信息,获得初始帧视频对象后,通过对象跟踪算法,持续地分割出后续帧的视频对象,因此视频分割并不是单独一帧图像的分割,而是一种前后关联的多线索融合分割。此外,由于图像分割已经研究了很多年,所以目前分割算法就有上千种,而视频对象分割起步相对图像分割较晚,但由于视频对象分割有广泛的应用前景,发展十分迅速,吸引了很多研究者的目光。
2.2视频对象分割方法的分类与应用概况
2.2.1分割方法的分类
常见的视频对象分割方法可以有下面四种分类。
1.应用目标不同
按照应用目标不同来分类可以分为两类:一类是要求得到准确的视频对象轮廓,但是不追求实时应用;另一类是实时处理的要求,在线申请,但得到的视频对象轮廓的分割精度要求不是很严格。
2.是否需要人工参与或人机交互
按照是否需要人工参与或者人机交互来分类可以分为两类:一类需借助人机交互的半自动分割,即借助人工参与或者人机交互来定义语义视频对象的轮廓形状和位置,从而来分割初始帧的视频对象,后续帧的对象跟踪则自动地进行(有时需对跟踪对象的区域边界按预先定义的语义特征稍微做些修正,从而减少跟踪误差);另一类是自动分割,无需人工参与或人机交互,包括初始帧的视频对象分割,对象跟踪在后续的帧自动进行。
3.分割过程中所用信息不同
摘 要
传统的动物行为分析方法采用的是人为的观察和记录的方法,用人眼对动物行为进行判断,不仅要花费很多时间,而且判断的结果具有不准确性以及主观性等缺点,从而导致动物实验结果会出现一些偏差,甚者还会出现错误。本文采用视频跟踪技术,运用软件直接对视频中的动物行为进行分析,提高了实验的可行性以及准确性。
本文主要研究了西瓜虫的运动转向问题。首先设计了一个迷宫,分别对西瓜虫在迷宫3个不同部分的运动转向进行视频采集并对其转向时间进行计算。实验中采用MATLAB作为视频处理软件,选择这个软件是因为:(1)使用方便;(2)内部函数非常丰富;(3)强大的图形与符号功能;(4)能够自主选择算法。通过比较发现传统算法(高斯混合模型的方法)耗时较多,而本文所用的方框质心法大大缩减了所花费的时间,而且方框质心法的鲁棒性比较好,所以最终选择方框质心法进行目标追踪。
查看完整论文请+Q: 351916072
关键字:视频跟踪技术;运动转向;方框质心法;鲁棒性;
目录
摘 要 I
ABSTRACT II
第1章 绪 论 1
1.1 研究背景及其意义 1
1.2视频分析技术 1
1.3论文的主要工作内容 3
第2章 视频图像分割与处理 4
2.1视频图像分割提取的基本概述 4
2.1.1视频对象的定义 4
2.1.2视频分割与图像分割的关系 5
2.2视频对象分割方法的分类与应用概况 5
2.2.1分割方法的分类 5
2.2.2应用概况 7
2.3 图像平滑 7
2.3.1 中值滤波原理 8
2.3.2 平滑效果实验分析 9
2.4 灰度调整 9
2.4.1 灰度调整原理 9
2.4.2 灰度调整效果实验分析 10
2.5数学形态学后处理 10
第3章 运动目标的检测与跟踪方法 12
3.1 运动目标检测常用算法 12
3.1.1 帧间差分法 12
3.1.2 背景差分法 13
3.2 运动目标跟踪算法简介 13
3.2.1 基于模型的跟踪 13
3.2.2 基于区域的跟踪 14
3.2.3 基于变形模型的跟踪 14
3.2.4 基于特征的跟踪 14
3.3 结论 15
第4章 实验设计与实现 16
4.1实验对象及设计 16
4.1.1实验对象 16
4.1.2实验设计 16
4.1.3实验采集系统 18
4.1.4实验处理软件 18
4.2实验方法对比 20
4.2.1本实验算法跟踪图 20
4.2.2传统算法跟踪图 23
4.2.3算法对比结果 26
4.3实验结果及结论 26
4.3.1实验结果 26
4.3.2实验结论 29
第5章 结论与展望 30
5.1 结论 30
5.2 展望 30
致 谢 32
参考文献 33
附录中英文翻译 35
第1章 绪 论
1.1 研究背景及其意义
传统的动物行为分析方法采用的是人为的观察以及记录,通过人的眼睛对动物的行为进行判断,不但非常得耗费时间,而且判断的结果也会具有不准确性以及主观性等缺点,从而导致动物实验结果会出现一些偏差,甚者产生一些错误。动物行为分析方法的发展经历了人工观察阶段、传感器检测技术阶段以及视频跟踪技术阶段等。
动物行为分析系统通常会由硬件平台与软件平台相互结合并广泛应用于跟踪、分析动物(或人)的行为、运动及活动。目前,国内市场上的动物行为分析产品绝大多数都是国外产品,而自主的产品相对少了很多,并且价格相对也比较贵,因此很少结合国内的研究现状。在各大高校生物实验室或医学研究院,在研究精神药理学以及行为科学等方面的研究通常需要对动物进行一些实验,所以对于构建一套性价比较高,根据国内生物研究的研究状况,研究价值非常高,操作非常简便的动物行为检测系统是一件非常紧迫的事情。
1.2视频分析技术
随着计算机技术的迅猛发展和图象处理技术的逐步成熟,各种基于计算机图象分析的行为测量系统日渐增加。和其它传感测量方法相比而言,图象处理拥有许多明显的优点:(l)它和动物大小没有太大关联,能够非常方便地调整监测范围;(2)依靠目前先进的图象处理技术,能够对多种动物行为参数(例如位置、活动轨迹、方向、移动距离、平均速度、进入特定区域或者停留时间等)实现精确的测定;(3)依靠图象模式识别技术能够对动物特征活动实现识别;(4)通过多个摄像机甚至能够对动物活动实现实时监测。以上几个优点让图象处理的方法可以对动物行为进行更加灵活、精细、全面的测量,现今已经是最受广大行为学研究者欢迎的动物行为监测技术。
图像处理技术虽然发展迅速,但是把视频中动物或者人的行为进行自动分类识别,仍然是计算机领域中最具挑战的研究工作之一,因此视频分析技术的学习研究极其重要。视频分析技术简单的说就是使用计算机图像视觉分析技术,通过将场景中背景和目标分离进而分析并追踪在视频中出现的目标。视频分析方法主要有这两类,一类是背景减除方法,背景减除方法其实是依据当前图象与背景图象的差分将运动区域检测出来的一种方法。这个方法能够提供比较完整的运动目标特征数据。而且其精确度与灵敏度相对比较高,具有良好的性能表现。另一类是时间差分法,时间差分法又称相邻帧差法,就是依据视频图象特征,从连续得到的视频流中将所需要的动态目标信息提取出来。时间差分法的实质其实就是通过相邻帧图象相减从而将前景目标移动的信息提取出来。这个方法不能完全提取所有相关特征象素点,在运动实体内部或许会产生空洞,智能检测出目标的边缘。以上方法是目前比较常用的方法[3]。
视频分析过程是视频分析技术的重要部分, 其利用的是计算机视觉技术,对画面进行分析、处理以及应用的过程,过程如下:
(1)背景学习过程:视频分析开始生效后,系统会先对背景进行学习,学习时间与背景热闹程度有关,在这个期间,系统会自动建立背景模型。一般系统完成建模以后,随着时间的缓慢变化,背景也会发生一些变化,不过系统拥有“背景维护”的能力,也就是能够把一些后来融入背景的图像,如树木等自动作为背景。常见的背景建模方法有帧差法、平均背景法、高斯背景建模法以及Codebook背景建模法。
(2)移动目标提取与跟踪:完成背景学习阶段以后,系统将会进入目标提取和跟踪阶段。目标提取是基于背景建模完成后,假如前景出现移动物体目标,并在设置的范围区域内而且目标物体大小满足预先设置,系统就会对这个目标进行提取并跟踪。目标的良好跟踪是视频分析效果的基础前提条件,视频分析过程需要知道目标出现和运动的时间、位置、速度以及方向等要素,而这些要素主要通过目标跟踪得到。常用的目标跟踪方法有滤波理论的目标跟踪方法、Meanshift跟踪方法以及偏微分方程的跟踪方法[2]。
(3)目标的识别与行为分析:目标的识别其实就是系统对先前提取并跟踪的目标进行识别和辨识。
(4)视频分析的过程:该过程其实是系统的关键过程,有了先前的背景、目标跟踪、目标识别等过程,视频分析是利用以上过程的结果,并结合预先设置好的行为规则,实现视频分析的过程。
视频分析技术应用前景很广,值得研究开发,利用此技术对动物行为进行研究,更是一件有意义的事情,值得研究者去学习与研究,从而能提出更多高效而快捷的方法。
1.3论文的主要工作内容
通过动物实验得到动物运动转向的运动学参数。构建这样的运动分析系统,首先需要选择合适的硬件来组建系统硬件平台,然后依据被拍对象的运动特点设计合适的算法并且编程实现运动跟踪,最后通过分析运动参数系统地对实验进行验证。因此,本论文针对以下几个方面展开了工作:
(1)视频采集系统地硬件组成;
(2)图像处理所用到的软件;
(3)传统跟踪算法与实验算法比较;
(4)实验数据的记录与分析。
第2章 视频图像分割与处理
2.1视频图像分割提取的基本概述
进入第二十一个世纪以来,随着信息社会的发展,人们对多媒体信息的需求不断增加,视觉信息是非常重要的一部分。视频的视觉信息是指一个观测系统(如相机)的运动图像序列记录的人,是一个重要的动态信息直接从外部获得,但由于数据量巨大,为了方便运输和储存,需要进行高效的压缩编码。
现有的视频压缩标准,能够分为两类。第一类压缩标准以JPEG、MPEG1/2等作为代表,它的主要特点是把像素和像素块作为基本的编码单元,该类编码标准已经在VCD/DVD、数字电视以及视频通信等一些方面应用并取得了成功。用基于对象(内容)编码作为特点的第二类压缩标准MPEG-4除了可以提供高效的压缩编码效率以外,还可以提供基于对象的交互功能,使用户可以访问(浏览、搜索)和操作(移动、剪切、粘贴)场景中的各个对象,能够更加广泛地延拓应用范围,所以也被叫作第二代编码标准[1]。
基于对象的编码与交互功能首先要把场景或者视频序列中的各类对象(比如说树木、运动中的汽车以及人等一些前景对象与静止的房屋等一些背景对象)分割提取出来,但是MPEG-4并没有规定从视频序列中分割出这类拥有语义意义的视频对象(video object,VO)的方法,而是对用户开放,它的目的是为了便于用户根据具体应用来设计特定的视频对象分割算法[3]。然而,语义视频对象分割和早期的图像分割相比较而言更是一项挑战性的问题,为此自MPEG-4标准诞生后的十多年来,国内外包含各大公司、高校以及各类研究机构在内的研究者已经进行了深入、广泛的研究工作。到现在为止,虽然还没有那么完善,但是已经进入了应用阶段,而且应用领域已经远超了原先仅仅作为便于高效编码与对象交互功能的范围。
2.1.1视频对象的定义
在MPEG-4标准中,视频对象的定义是“场景中的一个单元,允许用户访问(搜索,浏览)和操作(剪切,粘贴,移动)”,这是视频对象区域聚集,且至少有一个特征出现在视频序列中,此描述较为抽象。在本质上的实际视频领域,视频对象是指一定的语义实体和区域,如汽车,人等可以作为视频对象。但对同一视频场景,不同的应用所感兴趣的视频对象是不同的。语义视频对象的提取过程在本质上属于分割问题,因此有时称为提取,有时也称为分割。
2.1.2视频分割与图像分割的关系
视频是一连串的的图像序列,视频中的每一帧(某一时刻的采样)即可视为一幅图像。因此,扩展图像序列中的时间维度的视频,但视频处理和图像处理在时间维度上不是简单的扩展,这是由于在视频序列图像相邻地段空间冗余和时间冗余的存在,有很强的相关性。因此,图像分割与视频分割之间存在区别与联系:1)图像分割常利用空间信息进行分割,视频分割同时还利用时间信息进行分割。2)图像分割取决于底层特征的像素水平,如一致,纹理,颜色和灰色聚类的区域,通常是相似的,通常不涉及语义,因此它也被称为“低级”分割。视频对象分割由于对象包含着运动信息,常会发生遮挡区和显露区等问题以及存在非刚体对象的形变问题,很难仅用上述的低级特征来刻画,还需借助于语义的一致性。由此而言,视频分割比图像分割要复杂得多。3)图像分割是一幅静态图像单独的分割。视频分割先要进行初始帧分割,分割初始帧对象时既可沿用图像分割的某些方法,又常运用后续帧的相关信息,获得初始帧视频对象后,通过对象跟踪算法,持续地分割出后续帧的视频对象,因此视频分割并不是单独一帧图像的分割,而是一种前后关联的多线索融合分割。此外,由于图像分割已经研究了很多年,所以目前分割算法就有上千种,而视频对象分割起步相对图像分割较晚,但由于视频对象分割有广泛的应用前景,发展十分迅速,吸引了很多研究者的目光。
2.2视频对象分割方法的分类与应用概况
2.2.1分割方法的分类
常见的视频对象分割方法可以有下面四种分类。
1.应用目标不同
按照应用目标不同来分类可以分为两类:一类是要求得到准确的视频对象轮廓,但是不追求实时应用;另一类是实时处理的要求,在线申请,但得到的视频对象轮廓的分割精度要求不是很严格。
2.是否需要人工参与或人机交互
按照是否需要人工参与或者人机交互来分类可以分为两类:一类需借助人机交互的半自动分割,即借助人工参与或者人机交互来定义语义视频对象的轮廓形状和位置,从而来分割初始帧的视频对象,后续帧的对象跟踪则自动地进行(有时需对跟踪对象的区域边界按预先定义的语义特征稍微做些修正,从而减少跟踪误差);另一类是自动分割,无需人工参与或人机交互,包括初始帧的视频对象分割,对象跟踪在后续的帧自动进行。
3.分割过程中所用信息不同
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/dzkxyjs/2481.html