opencv的建筑图纸信息检测系统设计(源码)
为了提高建筑图纸审查的效率,更好的服务于设计单位和图审专家,通过建筑图纸格式转换、图纸预处理、区域分割以及字符识别开发基于OpenCV的建筑图纸信息检测系统。本课题以设计单位和图审专家为服务对象,满足建筑图纸审查中图纸预审查的应用需求,主要针对建筑图纸中的信息区域的检测,包括注册签章、出图签章和详细信息区域,提供建筑图纸预审查的服务。对74张建筑图纸进行测试,其中注册签章、出图签章和详细信息区域的检出率为100%,图纸中涉及的印刷体识别准确率为99%,手写体识别率为88.2%,实现建设单位在提交图纸过程中的预审查功能,在一定程度上提高了建筑图纸审查的效率。关键词 建筑图纸,预审查,图像处理,图像分割,字符识别
目 录
1 引言 1
1.1 课题背景 1
1.2 国内外研究综述 1
1.3 课题来源 2
2 需求分析 2
2.1 功能需求分析 2
2.2 系统业务流程 2
2.3 可行性分析 3
2.4 系统性能分析 5
3 系统功能设计 5
3.1 系统目标及设计方案 5
3.2 系统模块分析 7
4 建筑图纸预处理 8
4.1 pdf转jpg 9
4.2 灰度化 9
4.3 二值化 11
4.4 膨胀腐蚀 13
4.5 边缘检测 15
5 区域分割 19
5.1 区域分割思路 20
5.2 目标分割 20
6 字符识别 22
6.1 印刷体识别 22
6.2 手写体识别 24
7 系统部署与结果测试 29
7.1 系统部署 29
7.2 系统测试 30
7.3 测试总结 33
结 论 34
致 谢 35
附录A 用户操作手册 38
附录B 大学期间参与的项目 41
附录C 大学期间发表的论文 42
附录D 大 *好棒文|www.hbsrm.com +Q: ¥351916072¥
学期间公开的专利 47
附录E 查重报告 49
1 引言
1.1 课题背景
我国农村城市化速度明显提高,城市规模逐步扩大,建筑工程量大幅增长,建筑图纸数目也迅猛增加。随着数字图像处理的发展,应用于众多领域,如交通、消防的自动识别[1],而建筑图纸信息的审查则需要人工的方法来确认,这样就需要投入大量的人力和时间,而且会随着图审专家的工作时长的增加而导致工作效率的降低。如何有效提高用户和图审专家在图审过程中的效率成为我们亟待解决的问题。
图像处理和识别技术应用于众多领域:如交通管理、医疗卫生、军事以及消防安全等等[2]。我国城市化和信息化进程的不断推进和完善,伴随着建筑图纸数目的增加和图审流程的规范,建筑图纸审查平台应运而生,而图像识别技术强大的图像处理能力可以有效的我们在图审过程中起着辅助作用。
建筑图纸包含结构、建设、消防、绿化和水电等多种施工图纸,这就需要图审专家具有很强的专业性,并且需要在规定时间完成审查并给出初审意见。建筑图纸信息检测系统是通过对图纸信息的预处理、字符分割和字符识别实现图纸的预审查功能[3],提高建筑图纸审查的效率。
1.2 国内外研究综述
1.2.1 国外研究综述
1920年人们在北大西洋海底铺设电缆时,从英国伦敦到美国纽约传输了一张经过简单技术处理过的照片,可以说是图像的起源的处理技术[4]。20世纪50年代电子计算机发展慢慢兴起,并且计算机呈现出强大的数据分析处理能力,让人们看到了新的发展方向。数字图像处理(Digital Image Processing)的研究也逐渐变得火热,数字图像处理这一全新学科由此诞生[5]。
20世纪60年代,数字图像处理开始应用于美国宇航领域,对月球探测器传回的数千张月表图片进行了去噪、校正和变换处理绘制了月表地形图,为人类的探月工程做出了不可磨灭的巨大贡献[6];1979 年全身 CT 诊断技术获得了诺贝尔江,该技术由英国EMI公司研发 [7];20世纪90 年代以来,Electronic Toll Collection系统在高速公路上试用,并快速的国内进行普及,提高了交通通行效率,方便了人们的生活[8]。
发展至今,图像识别技术得到较大突破, Facebook开发的DeepFace以及雅虎开发的Glow均是通过人脸识别技术,通过为手机中存储的照片自动生成标签来帮助用户进行分类管理 [9]。
1.2.2 国内研究综述
20世纪50年代,徐光佑下工作富asvisiting学者、戴汝为和蔡资兴等国内著名学者开始对数字图像处理和识别技术的研究。中国在1981年国际模式识别协会(IAPR)上,正式加入IAPR,并在国内举办了第一次模式识别会议。1984年,国内从事图像处理和识别技术的研究人员开始建立国家重点实验室[10]。
目前,图像识别技术在我国发展迅速,技术成熟,在众多领域中都有应用[11]。李彦宏在2011年提出马上就要进入新时代,图像识别技术不竭的创新和发展,我国的众多公司接踵而至的涌入图像识别领域,从火焰识别到AI机器人的创造,标志着更加智能的时代将会来临[12]。
1.3 课题来源
我国农村城市化速度明显提高,城市规模逐步扩大,建筑工程量大幅增长,建筑图纸数目也迅猛增加。随着数字图像处理的发展,应用于众多领域,如交通、消防的自动识别,而建筑图纸信息的审查则需要人工的方法来确认,这样就需要投入大量的人力和时间,而且会随着图审专家的工作时长的增加而导致工作效率的降低。通过对图纸信息的提取及检测,检测图纸信息的准确性和有效性,满足建设单位在提交图纸过程中的预审查功能,在一定程度上提高了建筑图纸审查的效率。
2 需求分析
2.1 功能需求分析
对于建筑图纸信息检测系统,设计单位在提交建筑图纸时,能够查看该图纸信息预审查的结果,其中包括建设单位名称是否与系统一致、设计单位名称是否与系统一致、出图签章和注册签章是否缺失及是否在有效期内,并进行提示,能查看本设计单位图纸信息的错误统计。
2.2 系统业务流程
对于建筑图纸信息检测系统,首先是图纸数据采集模块,用户通过Web端选择pdf格式图纸文件上传到服务器进行检测。接着是图纸预处理[13]模块,OpenCV[14]开源视觉库暂不支持对pdf文件进行处理,所以需要先将pdf转换成jpg格式,再对建筑图纸进行灰度化[15]操作,可以减少原始图纸数据量,并对灰度化的图纸进行二值化[16]操作,随后进行膨胀腐蚀[17]和边缘增强[18]操作,去掉建筑图纸图像中的噪声,提高后续的识别效率[19]。接着是图纸信息分析模块,在建筑图纸中,需要对出图签章、注册签章、设计单位、建设单位及日期等做出识别及检测工作,需要根据特征和位置进行图像分割[20],在分割完成后,进行文字识别[21]的工作。对于标准印刷体而言,这里选择调用第三方百度OCR[22]提供的接口进行识别,而对于手写字体[23],使用CNN卷积神经网络[24]和TensorFlow[25]进行实现。最后将图纸信息识别及检测结果通过flask搭建网站进行展示。
目 录
1 引言 1
1.1 课题背景 1
1.2 国内外研究综述 1
1.3 课题来源 2
2 需求分析 2
2.1 功能需求分析 2
2.2 系统业务流程 2
2.3 可行性分析 3
2.4 系统性能分析 5
3 系统功能设计 5
3.1 系统目标及设计方案 5
3.2 系统模块分析 7
4 建筑图纸预处理 8
4.1 pdf转jpg 9
4.2 灰度化 9
4.3 二值化 11
4.4 膨胀腐蚀 13
4.5 边缘检测 15
5 区域分割 19
5.1 区域分割思路 20
5.2 目标分割 20
6 字符识别 22
6.1 印刷体识别 22
6.2 手写体识别 24
7 系统部署与结果测试 29
7.1 系统部署 29
7.2 系统测试 30
7.3 测试总结 33
结 论 34
致 谢 35
附录A 用户操作手册 38
附录B 大学期间参与的项目 41
附录C 大学期间发表的论文 42
附录D 大 *好棒文|www.hbsrm.com +Q: ¥351916072¥
学期间公开的专利 47
附录E 查重报告 49
1 引言
1.1 课题背景
我国农村城市化速度明显提高,城市规模逐步扩大,建筑工程量大幅增长,建筑图纸数目也迅猛增加。随着数字图像处理的发展,应用于众多领域,如交通、消防的自动识别[1],而建筑图纸信息的审查则需要人工的方法来确认,这样就需要投入大量的人力和时间,而且会随着图审专家的工作时长的增加而导致工作效率的降低。如何有效提高用户和图审专家在图审过程中的效率成为我们亟待解决的问题。
图像处理和识别技术应用于众多领域:如交通管理、医疗卫生、军事以及消防安全等等[2]。我国城市化和信息化进程的不断推进和完善,伴随着建筑图纸数目的增加和图审流程的规范,建筑图纸审查平台应运而生,而图像识别技术强大的图像处理能力可以有效的我们在图审过程中起着辅助作用。
建筑图纸包含结构、建设、消防、绿化和水电等多种施工图纸,这就需要图审专家具有很强的专业性,并且需要在规定时间完成审查并给出初审意见。建筑图纸信息检测系统是通过对图纸信息的预处理、字符分割和字符识别实现图纸的预审查功能[3],提高建筑图纸审查的效率。
1.2 国内外研究综述
1.2.1 国外研究综述
1920年人们在北大西洋海底铺设电缆时,从英国伦敦到美国纽约传输了一张经过简单技术处理过的照片,可以说是图像的起源的处理技术[4]。20世纪50年代电子计算机发展慢慢兴起,并且计算机呈现出强大的数据分析处理能力,让人们看到了新的发展方向。数字图像处理(Digital Image Processing)的研究也逐渐变得火热,数字图像处理这一全新学科由此诞生[5]。
20世纪60年代,数字图像处理开始应用于美国宇航领域,对月球探测器传回的数千张月表图片进行了去噪、校正和变换处理绘制了月表地形图,为人类的探月工程做出了不可磨灭的巨大贡献[6];1979 年全身 CT 诊断技术获得了诺贝尔江,该技术由英国EMI公司研发 [7];20世纪90 年代以来,Electronic Toll Collection系统在高速公路上试用,并快速的国内进行普及,提高了交通通行效率,方便了人们的生活[8]。
发展至今,图像识别技术得到较大突破, Facebook开发的DeepFace以及雅虎开发的Glow均是通过人脸识别技术,通过为手机中存储的照片自动生成标签来帮助用户进行分类管理 [9]。
1.2.2 国内研究综述
20世纪50年代,徐光佑下工作富asvisiting学者、戴汝为和蔡资兴等国内著名学者开始对数字图像处理和识别技术的研究。中国在1981年国际模式识别协会(IAPR)上,正式加入IAPR,并在国内举办了第一次模式识别会议。1984年,国内从事图像处理和识别技术的研究人员开始建立国家重点实验室[10]。
目前,图像识别技术在我国发展迅速,技术成熟,在众多领域中都有应用[11]。李彦宏在2011年提出马上就要进入新时代,图像识别技术不竭的创新和发展,我国的众多公司接踵而至的涌入图像识别领域,从火焰识别到AI机器人的创造,标志着更加智能的时代将会来临[12]。
1.3 课题来源
我国农村城市化速度明显提高,城市规模逐步扩大,建筑工程量大幅增长,建筑图纸数目也迅猛增加。随着数字图像处理的发展,应用于众多领域,如交通、消防的自动识别,而建筑图纸信息的审查则需要人工的方法来确认,这样就需要投入大量的人力和时间,而且会随着图审专家的工作时长的增加而导致工作效率的降低。通过对图纸信息的提取及检测,检测图纸信息的准确性和有效性,满足建设单位在提交图纸过程中的预审查功能,在一定程度上提高了建筑图纸审查的效率。
2 需求分析
2.1 功能需求分析
对于建筑图纸信息检测系统,设计单位在提交建筑图纸时,能够查看该图纸信息预审查的结果,其中包括建设单位名称是否与系统一致、设计单位名称是否与系统一致、出图签章和注册签章是否缺失及是否在有效期内,并进行提示,能查看本设计单位图纸信息的错误统计。
2.2 系统业务流程
对于建筑图纸信息检测系统,首先是图纸数据采集模块,用户通过Web端选择pdf格式图纸文件上传到服务器进行检测。接着是图纸预处理[13]模块,OpenCV[14]开源视觉库暂不支持对pdf文件进行处理,所以需要先将pdf转换成jpg格式,再对建筑图纸进行灰度化[15]操作,可以减少原始图纸数据量,并对灰度化的图纸进行二值化[16]操作,随后进行膨胀腐蚀[17]和边缘增强[18]操作,去掉建筑图纸图像中的噪声,提高后续的识别效率[19]。接着是图纸信息分析模块,在建筑图纸中,需要对出图签章、注册签章、设计单位、建设单位及日期等做出识别及检测工作,需要根据特征和位置进行图像分割[20],在分割完成后,进行文字识别[21]的工作。对于标准印刷体而言,这里选择调用第三方百度OCR[22]提供的接口进行识别,而对于手写字体[23],使用CNN卷积神经网络[24]和TensorFlow[25]进行实现。最后将图纸信息识别及检测结果通过flask搭建网站进行展示。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/911.html