自动驾驶系统低速园区背景下的视觉感知【字数:14243】

摘 要人工智能一直是高校科研的重要方向,自动驾驶作为最完美的产学研结合的研究方向具有着重大的科研价值和产业需求。自动驾驶自2015年起,开始大规模的从高校研究阶段进入企业落地阶段,自动驾驶系统的研究分为公开道路的乘用车和封闭区域的商用车。本项目着眼低速场景下的封闭园区的自动驾驶系统研发,采用了视觉定位与激光雷达3D检测的融合感知方案,并基于PID算法实现了基于车辆偏移量的车辆巡航控制系统和基于障碍物3D检测跟踪的障碍物制动控制系统。视觉定位基于深度学习的语义分割模型实现,在ICNet的backbone基础上进行了本地结构调整、数据重训练的迁移手段,实现了封闭环境下的道路语义感知并达到90%以上准确率,由道路分割结果过滤出道路边界信息从而进行边界线的多项式拟合,计算出车辆的偏移距离,实现自身车辆的相对定位。障碍物感知由Yolov3的图像2D检测和激光点云的3D信息融合实现,计算激光点云到图像的投影变换矩阵从而实现图像2D物体的3D数据感知,并且对物体进行klt光流跟踪,计算出物体的相对速度,最后提供给决策层。PID控制算法具有简单道路下良好的实验效果,根据上述计算出的车辆偏移距离,可以快速的计算出方向盘的转角输出,在一定的曲率半径范围内的道路具有不错的舒适性和贴合性。基于车辆与障碍物间的相对速度建立车速、相对速度、制动压的二元多项式函数,计算适合的制动压输出达到减速、制动的效果。
目 录
1.引言.........................................................................................................8
1.1.研究背景 8
1.2.研究目的和意义 8
1.3.国内外研究及发展现状 9
2.相关开发技术 10
2.1.硬件条件概要 10
2.2.软件技术介绍 10
2.2.1 ROS 10
2.2.3 Python 10
2.2.4 机器学习 11
2.2.5 OpenCV 11
2.2.6 Tensorflow 11
3.系统设计概要 13
3.1系统概要 *好棒文|www.hbsrm.com +Q: ¥351916072¥ 
13
3.1.1 框架概要 13
3.1.2 行驶区域感知概要 14
3.1.3 车辆横向控制 15
3.1.4 目标2D检测 16
3.1.5 激光点云映射至图像 17
3.1.6 障碍物3D检测与追踪 18
3.1.7 ROI与AEB 19
4.系统设计与实现 21
4.1.环境搭建 21
4.1.1 工控机环境配置 21
4.1.2 传感器配置 22
4.2.系统的实现 23
4.2.1 传感器模块 23
4.2.2 行驶区域规划模块 23
4.2.3 障碍物检测模块 37
4.2.4 规划 41
5.调试及优化 46
5.1 线控车调试 46
5.2 感知调试及优化 47
5.2.1 行驶区域感知调试及优化 47
5.3 车辆横向控制公式调试及优化 50
5.3.1 控制的评价指标 50
5.3.2 车辆横向控制测试 50
5.4 遇障制动调试及优化 52
6.设计总结 55
参考文献..58
致谢..60
攻读学位期间参加的科研项目和成果 61
引言
研究背景
自动驾驶源自于移动机器人,是机器人学中的一个重要分支。在20世纪60年代,斯坦福研究院(SRI)制造了名为shakey的自主式移动机器人,其将人工智能应用在复杂环境下,希望完成机器人系统的自主推理、规划和控制。从此,移动机器人开始蓬勃发展,各类移动机器人大赛层出不穷,国内的有从大尺寸的“中国智能车未来挑战赛”到小尺寸的“飞思卡尔杯全国大学生智能车竞赛”,不断有高校加入自动驾驶的研究领域。近年来,自动驾驶从学术性质的研究地位进入了商业化程度。以国内的Apollo(百度)、图森未来、驭势科技等及国外的waymo(google)、Uber、特斯拉等独角兽企业为主,掀起了一场波及政府、高校、传统车企、互联网公司、传感器零部件厂商以及初创公司的自动驾驶浪潮。
研究目的和意义
本课题研究低速园区环境下的自动驾驶中的视觉感知部分。感知作为自动驾驶技术中最重要的部分,其执行效率、准确率、鲁棒性是整个驾驶系统正常、有效运行的基石。视觉感知相对于激光雷达或毫米波雷达的感知方案,大大缩减了成本,有利于自动驾驶的量产化、平民化。本文希望像人类的眼睛一样分析道路、车辆和行人等路况,为自动驾驶系统决策层提供实时、精确、鲁棒的环境感知支持。
国内外研究及发展现状
自动驾驶的视觉感知模块包含了诸多的技术,甚至不同的方案会采用不同的技术。其中主要的几个技术点:2D物体检测、2D语义分割、单目测距、双目测距、SLAM等。
1999年由Lowe提出的SIFT(尺度不变特征变换匹配算法),该算法用于侦测与描述影像中的局部性特征,具有:高速性、多量性(少数的物体也可产生大量特征)、可拓展性,能一定程度上解决噪声。
2003年由Sivic 和 Zisserman的Bag of Words,BoW通过特征向量对图像进行分类。算法使用SIFT算法提取特征向量,并将特征向量集合利用KMeasn算法合并语义相近的特征向量,构造一个包含K个特征向量的表,使用该表对图像进行分类。
2005年由Dalal 和 Triggs提出的HOG,该算法与SIFT同样用来计算图像中物体的特征描述,HOG特征结合SVM算法被广泛应用于图像识别中,尤其在处理行人检测中取得极大的成功。
2008年由Felzenszwalb et al.提出的DPM,DPM的原理与HOG类似,但对特征向量的shape等方面进行了很大的改动(即在HOG的基础上主要进行了模型的改进)。DPM算法连续获得VOC 07,08,09年的检测冠军,成为众多分类器、人体检测的重要部分。
2012年由Krizhevsky et al.提出的DCNN AlexNet,创新性的将CNN应用到人脸关键点检测,提出了级联CNN的思想(3个level)。
2014年由Girshick et al.提出的RCNN,可用来定位目标物和图像分割,且fineutning的效果较好,模型的移植性好。
2015年由Simonyan和Zisserman提出的VGGNet,该算法研究CNN的深度与其性能之间的关系,整个网络采用同样大小的卷积核(3*3)和最大池化(2*2),获得了ILSVRC2014比赛定位项目第一名、分类项目第2名。
2017年由He et al.提出的Mask RCNN,由何凯明基于faster rcnn架构,添加一个分支使用现有的检测对目标进行并行预测。在图像语义分割、特征点检测等领域大大提升了精度

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/rjgc/526.html

好棒文