基于BP神经网络的双目视觉系统标定

基于BP神经网络的双目视觉系统标定[20191213104847]
摘 要
计算机视觉是当今最为活跃而又富有挑战意义的研究领域,其研究内容和应用领域十分广泛,因为摄像机标定是计算机视觉获取三维空间信息的前提和基础,是立体视觉的一个重要组成部分。本文主要研究摄像机标定理论和方法,为计算机视觉和立体视觉的下一步研究奠定良好的基础,最终能够提高精度
文中使用平面模板实现对摄像机进行标定。利用神经网络直接学习图像信息与三维信息之间的关系,不需要确定摄像机具体的内部参数和外部参数,也不需要知道有关模型或参数的先验知识,对摄像机进行畸变校正。并通过实验验证了其准确和有效性。
但是由于BP神经网络的稳定性是和网络的初始训练值有关的缺点,于是,本文又引入遗传算法来改进BP神经网络。先用遗传算法对初始权值进行优化,在解空间中得到较好的搜索空间,之后用BP算法在这些小的解空间中搜索出最优解。通过相同数据进行实验证明了该方法的可行性,并且速度和精度得到提高。
 查看完整论文请+Q: 351916072 
关键字:字计算机视觉摄像机标定;BP神经网络;遗传算法
目 录
摘要 I
ABSTRACT II
第一章 绪论 1
1.1 引言 1
1.2 摄像机标定技术的研究和内容 2
1.3 摄像机标定技术的发展和现状 3
1.4 课题研究的依据 4
1.5 课题研究的主要内容 6
第二章 摄像机标定理论 7
2.1 参考坐标系及其变换 7
2.1.1图像像素坐标系与图像物理坐标系 7
2.1.2 摄像机坐标系与世界坐标系 8
2.2 线性摄像机模型 9
2.3 非线性摄像机模型 10
2.4 传统标定方法 14
2.4.1直接线性变换法 14
2.4.2 非线性优化方法 15
2.4.3 两步法 15
2.5 摄像机自标定方法 16
2.5.1 基于主动视觉的摄像机自标定方法 16
2.5.2 基于本质矩阵及基本矩阵的自标定方法 16
2.5.3 基于绝对二次曲线和极线变换的摄像机自标定方法 17
2.6 本章小结 17
第三章 图像预处理 18
3.1 图像灰度变换 18
3.2 基于区域生长的重心检测 19
3.3 本章小结 21
第四章 神经网络标定技术 22
4.1 神经网络基本概念 22
4.2 神经网络构成 22
4.2.1神经元模型 22
4.2.2激活函数 23
4.2.3网络结构 26
4.2.4学习方式 28
4.3 BP神经网络 29
4.3.1性能函数与泰勒级数展开 29
4.3.2 性能优化 30
4.3.3 BP神经网络 32
4.4 神经网络用于摄像机标定 34
4.4.1 神经网络用于摄像机标定的可行性分析 35
4.4.2 神经网络用于摄像机标定的共性分析 36
4.5 神经网络设计 37
4.5.1 激活函数的选取 37
4.5.2网络层数选取 38
4.5.3 输入层和输出层设计 38
4.5.4神经网络实现摄像机标定 39
4.5.5神经网络参数选取 39
4.6 算法实现 40
4.7 误差分析 43
4.8 本章小结 43
第五章 基于遗传算法的神经网络训练方法 44
5.1 遗传算法概述 44
5.1.1遗传算法的基本概念 44
5.1.2遗传算法的基本流程 45
5.1.3 遗传编码 47
5.1.4适应度函数 47
5.1.5遗传算子 48
5.1.6控制参数 48
5.2 方案设计 49
5.2.1编码方式的确定 49
5.2.2适应度函数的设计 50
5.2.3遗传算法参数的选择 50
5.3 算法实现 50
5.4 本章小结 54
第六章 总结与展望 55
6.1 总结 55
6.2 展望 56
参考文献 57
致 谢 59
附图、附录 60
英文原文 62
英文翻译 65
第一章 绪论
1.1 引言
机器视觉是用计算机实现人眼的功能,从图像或者图像序列中提取信息,对客观世界的三维景物和物体进行形态和运动识别[1-3]。计算机视觉属于人工智能范畴的新领域,它是以视觉处理理论为中心,以模式识别,图像处理,计算机技术和生理学为基础的,是信息处理科学中的一个重要分支。计算机视觉就是代替人的视觉器官,利用计算机从二维图像中提取实际物体的二维或三维的结构和属性信息。机器视觉研究目的之一就是寻找模仿人类视觉过程,从而开发出图像输入到景物分析的图像理解系统。
21世纪以来,随着计算机技术的发展以及人类对信息需求的增加,计算机视觉得到了很大的发展。现今计算机视觉的基本理论框架是由David Marr 教授在20世纪提出[5],他提出了第一个较完善的视觉系统框架,使得计算机视觉有了一个基本的体系[12]。尽管这个理论尚不完善,但仍在计算机视觉领域占有十分重要的地位。
随着电子、光学、计算机技术的日益发展以及学科之间的相互融合,以计算机视觉技术为基础的机器视觉技术也得到了长足的发展。机器视觉的兴起也为人们提供了一个新型的检测手段,其应用已经十分广泛,例如航空航天,军事,医疗,物体识别,文字图像识别,加工制造,工业检测,自动化控制以及生命科学等。在物体识别,生产加工,尺寸控制,环境监控中起着重要的作用。
立体视觉作为计算机视觉最主要的研究方向之一也得到了迅速的发展。近几年来,在获取三维立体视觉信息的方法和技术上取得了长足的发展,其中根据照明方式可分为主动和被动测距法,前者利用特别的光源提供的结构信息,后者采用非结构照明的方式,获取立体视觉的信息可以在自然光条件下进行,因而在某些特殊的场合具有独特的优点,被动三维传感技术已经广泛应用在机器视觉领域,同时立体视觉又扩展了机器视觉的应用领域。
景物理解和分析是计算机处理的要点之一。当前三维景物分析工作的重点在于三维景物与自然景物的分析和识别上。可以把视觉当成是根据获得的图像理解景物信息的处理过程。计算机视觉主要是利用计算机去完成信息的处理。具体有视觉信息的获取,图像低层次处理、分割、描述、识别理解工作。
三维信息获取是计算机视觉的基础,主要方法有主动法和被动法。主要法要对被测物体加上特殊的人造光源。被动法是在自然光条件下获取三维信息的方法。
由上述介绍可以了解到,摄像机标定是见算计视觉领域的一个十分重要的研究方向,是进行立体视觉研究的重要部分,也是获取三维空间信息的前提和基础,标定结果的精确程度直接影响到三维测量的精度和重建结果。因此摄像机标定方法具有重要的研究意义和使用价值。
1.2 摄像机标定技术的研究和内容
计算机视觉的基本任务之一是从摄像机所获取的图像信息中计算三维空间中物体的几何信息,并根据所获取的信息进行识别和重建物体。空间物体表面某点的三维几何位置与在图像中对应的点的关系是由摄像机成像的几何模型决定的。几何模型的各项参数就是摄像机参数。计算机标定就是计算这些参数的过程。
摄像机标定始于摄影测量中的镜头校正[7]。摄影测量学中所使用的方法是数学解析分析的方法。在标定过程中我们都要用到数学的方法对获取的图像信息数据进行处理。通过数学处理的方法,摄像机标定建立起专业测量摄像机与非测量摄像机的联系。非测量摄像机是指内部参数完全未知、部分未知或者不稳定。摄像机参数是摄像机成像的基本参数,如图像中心,焦距,径向镜头畸变,切向镜头畸变以及其它系统误差参数。当用计算机技术对三维景物进行描述,识别和理解时,CCD摄像机是对物理世界进行三维重建的一个基本工具,摄像机标定就成了实现三维欧式空间立体视觉关键的一步。
在立体计算机视觉中,若是进行物体识别,则物体对于某个参考坐标系的绝对寻址不是那么重要,特征点的相对精度则成了关键,若是进行工业产品的尺寸检测,那么参考系中的定位精度就显得十分重要。
摄像机的参数是相对于某种几何成像模型,模型是对于光学成像的简化,常用的是针孔模型,然而在实际中这种线性模型不能准确的代表成像的几何关系,如是广角镜头,距离较近等情形,需要考虑线性或者非线性的畸变补偿,才能更加准确合理的表示成像过程。利用校正后的模型才能得到更加准确的精度。
1.3 摄像机标定技术的发展和现状
立体视觉是计算机视觉的一个重要组成部分,有着广阔的前景和实用价值。在这之中,三维信息获取又是计算机视觉的基础,所以三维信息获取的一个十分重要的环节——摄像机标定技术的研究倍受重视[3]。
摄像机参数总是相对于某种几何成像模型,这个模型是对于光学成像过程的简化,比如针孔模型,针孔模型是摄像机标定研究的基本模型。然后很多种情况下针孔模型不能代表十分准确的描述摄像机成像的几何关系,如在近距、广角情况下。所以还需要采用线性或非线性的畸变补偿,才能更加准确的看作针孔模型成像过程。所以成像模型和畸变的补偿成为摄像机标定研究的一个重要方向。
基于上述内容,计算机标定研究的基本方法是:在一定的摄像机模型下,对于尺寸、形状确定的标定参照物对其图像进行处理,用数学变换和计算方法,获得摄像机的内外部参数。大致有对于单帧图像的基本方法和基于多帧已知关系的立体视觉方法。
然而在很多种情况下,由于需要经常调整计算机,而且不能设置已知标定参照物,这是就需要一种不依赖标定参照物的所谓摄像机的自标定方法,这也就成为了另一个重要的应用背景以及成为摄像机标定研究的重点。现在摄像机标定的方法可分为两类:传统的摄像机标定方法和摄像机自标定方法。
从计算方法的角度,传统摄像机标定方法可分为这样四类
(1) 最优化算法的标定方法
(2) 摄像机变换矩阵的标定方法
(3) 考虑畸变补偿的两步法
(4) 采用摄像机成像模型的双平面标定方法
近几年来,无需标定物,基于图像序列的自标定法成为了标定研究的重要方向。在小孔成像模型下,摄像机的自标定可以在三个层次上进行。在对于对外参数未知的情况下,即对空间结构不做任何假设,摄像机的运动也不能量化,这时的标定只能给出投影矩阵,而不能以此得到摄像机内外参数。如果是成像深度足够大,即是平行投影条件,可以进行仿射意义下的标定。其结果是由无穷远点引入的同形矩阵。若能精确得到摄像机运动的外参数,投影矩阵的分解可能就是唯一的,就可以得到摄像机的内部参数,是最为理想的标定。利用基础和本质矩阵的摄像机标定方法,根据对应点关系,首先求解本质矩阵或者基础矩阵,从而得到摄像机的参数。Faugeras,Luong和Maybank等率先提出了自标定的概念,从射影的几何角度证明了每两幅图像存在两个形如Kruppa方程的二次约束,通过求解Kruppa方程组可以得到摄像机的参数。用主动视觉系统的摄像机标定方法,先使计算机做特定的运动,然后根据运动的约束条件求解方程,以此得到摄像机的内部参数。用多幅图像之间的直线对应关系的摄像机标定方法,这种方法三幅(或三幅以上)图像求解摄像机参数。Heyden,Astorm,Pollefeys等从理论上已经证明:在内部参数满足一定条件的前提下,可变内参数下的自标定是完全可能的。
现在有很多种摄像机标定的方法,但对此的研究还远远没有结束,在运算瓶颈、病态方程、模型表达方面还没有很好的解决,这也是摄像机标定技术研究的重要方向。
1.4 课题研究的依据
涡轮叶片是关系到发动机性能和安全的高负荷零件, 严格控制叶片的制造质量是叶片加工中的关键问题, 因此叶片检测是叶片加工技术中的重要内容,叶片型面误差检测具有形状复杂、工作量大、技术条件和尺寸精度要求严格特点。目前,对叶片型面的检测方法主要分两大类,一类是接触法,另一类是非接触法,常用的接触式检测法有型面样板法、三坐标测量机法等,工厂现在主要采用型面样板法进行叶型测量。型面样板主要是通过比较标准样板与叶片固定截面来确定是否合格。这种方法只能测量少数几个截面, 而且无法获得具体的误差数据。且由于所使用的组合样板为手工制造,刚性差、容易变形,已逐步被淘汰。三坐标测量机是20世纪60年代发展起来的一种高效率的新型精密测量仪器,是一种具有很强柔性的大型精密三坐标测量设备。三坐标测量机已经得到广泛应用。由于三坐标测量机具有对连续曲面进行扫描来制备数控加工程序的功能,因此一开始就被选为主要数字化设备并一直使用至今。三坐标测量机测量叶片,主要测量误差在于叶片基准本身的加工误差引起的定位误差,如叶片叶盆或叶背侧平面角度误差,在加工工序检测中对测量结果的影响很大。加工部位的形状误差直接影响三坐标测量机采样生成的数学模型的形状或者位置。此外,三坐标测量机的成本较高,测量效率较低。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jxgc/zdh/4930.html

好棒文