数据挖掘的建设工程图纸(源码)

为了帮助图纸审查机构从海量的审查意见中快速、准确地评估图纸设计质量,提高审查意见分类的准确度,实现了基于数据挖掘的建设工程图纸质量评估系统。本系统针对图审数据库中的专家对于图纸的审查意见进行提取,在预处理阶段,结合jieba分词工具,按照分词字典对文本信息进行文本分词,然后在结合常用停用词表去除文本信息中的停用词,接着使用TF-IDF算法提取出特征值转换为文本特征向量;在分类算法阶段,先通过预处理的数据集生成批处理迭代器,然后通过convolutional neural network算法搭建文本分类器,接着运用TensorFlow搭建神经网络的训练框架。系统通过启发式的特征提取,达到了改善短文本分类准确率的效果。实验在二分类效果上取得了99.5%的准确率,并且损失值降到了0.11,在三分类效果上取得了96.1%的准确率,损失值为0.26左右。系统以图审人员为服务对象,满足其快速评估设计单位建设工程图纸的设计质量的需求。关键词 特征提取,深度学习,卷积神经网络,TensorFlow,文本分类
目 录
1 引言 1
1.1 课题背景 1
1.2 国内外研究综述 1
1.3 课题来源 2
2 需求分析 2
2.1 功能需求分析 2
2.2 可行性分析 2
2.3 系统性能分析 3
3 关键问题的研究 3
3.1 数据分析 4
3.2 关键技术 5
4 系统建模 10
4.1 系统业务流程建模 10
4.2 系统顺序建模 11
4.4 系统类建模 12
4.5 系统关联映射到RDB设计 12
5 系统程序设计 13
5.1 数据预处理 13
5.2特征提取 16
5.3分类算法 17
6 实验过程 25
6.1 数据预处理 25
6.2 特征提取 26
6.3 分类算法 27
7 系统模块设计 32
7.1 系统整体架构 32
7.2 数 *好棒文|www.hbsrm.com +Q: ¥351916072¥ 
据挖掘设计 32
7.3 文本预处理模块 33
7.4 算法模型设计 33
8 系统部署与结果测试 33
8.1 系统部署 33
8.2 系统测试 36
结 论 39
致 谢 40 参 考 文 献 41
附录A 用户操作手册 43
附录B 大学期间的完成项目 47
附录C 大学期间获得的竞赛证书 48
附录D 查重报告 49
1 引言
1.1 课题背景
中国政府不断加大对基础建设的投入,建设工程图纸的数量也呈几何状增长。在庞杂的建设工程图纸中,如何帮助图纸审查机构从海量的审查意见中快速、准确地评估图纸设计质量已经成为一个迫切需要解决的课题。本系统针对数据库中的专家对于图纸的审查意见进行提取,对该数据进行清洗,做分析前的预处理,提取出建筑设计质量评估的特征值,结合专家审查意见,进行多维度的分析与研究,帮助系统使用者快速地评估设计单位建设工程图纸的设计质量,不仅可以减轻审查机构的冗杂工作,还可以提高设计单位建筑工程图纸的设计质量。
随着建筑领域安全问题的频频事故,建筑设施安全越来越得到人们的普遍关注,建筑楼房模型精度低[1] 、设计不合理、质量不合格等诸多问题也日益凸显出来。人们对于建筑的安全要求也与日俱增,特别是对于建筑工程图纸的设计要求。目前,国内建筑工程图纸的审查是由专门的审查机构来负责,但是因为地域差异,导致在审查时可能出现多重评判标准和不同的规范理解,而且对于图纸质量审查环节的重视程度不够[2]。对于国外来说,建筑质量的评估更多的关注的是房屋绿色健康问题,并且目前研究人员已经把Indoor Environmental Quality(IEQ)纳入到建筑的质量评估体系中[3]。
数据挖掘、神经网络技术伴随着计算能力的迅速提升、数据量的快速积累和算法的有效改进也得到了长足的进步[4],这些技术在建设工程图纸质量的评估中也具有极大的意义和价值。不过,图审部门常常忽视了审查意见的潜在价值,从而令这些具有潜在价值的数据在快速的流失[5]。所以,针对大量的图纸审查意见,结合数据挖掘和神经网络技术的分析与研究,建立建设工程图纸质量评估系统,来帮助审查机构提高审查效率和质量成为一个重要问题。
1.2 国内外研究综述
1.2.1 国外研究综述
在1960以后,“数据挖掘”等专业词汇被统计学家指代直接进行数据分析所导致结果偏差的不准确做法。在20世纪80年代末,知识发现(Knowledge Discovery in Databases)正式形成于第十一届国际人工智能会议,在数据库研究范围中,经常被人们把它和DM认为是有重要研究价值的课题之一[6]。
数据挖掘在过去的几十年中,在知识发现和决策支持方面发挥了不可估量的作用,从过程数据中提取有用的信息,并将其转化为有效的知识,从而提高分析过程的深度理解和支持。
经过多年发展,数据挖掘技术在工业支持上越来越发挥重要的作用,在很多领域目前都有了专门的研究专题[7]。作为数据挖掘和分析的计算引擎,机器学习是信息提取、数据模式识别和预测的基本工具,在工业流程中一直有效地进行数据挖掘和分析,扮演着重要的角色。
1.2.2 国内研究综述
与国外不同的是,国内的相关技术是在近代才开始发展起来的,在1990年以后,伴随着互联网的兴起,国内处于业界领军人物才开始重视数据挖掘方面技术[8]。
国内的数据挖掘软件产业仍处于成长阶段,大量的研究人才主要聚集于高等院校和专门的研究所,分布在公司的只有包括阿里巴巴、腾讯、百度、华为等少量人才[9]。国内数据挖掘涉及的领域偏向于理论和算法方面。目前,国内关于数据挖掘的会议主要包括中国数据挖掘会议(CCDM)等[10],经过多年的累积和发展,国内研究人员的整体实力和研究成果有了很大的提升。
1.3 课题来源
随着淮安市基础建设的飞速增长,建设工程图纸的审查质量回复单数量越来越庞大,如何帮助图纸审查机构从海量的审查意见中快速、准确地评估图纸设计质量已经成为一个迫切需要解决的问题。为此,建设工程图纸质量评估系统帮助用户从海量审查意见中评估设计单位建设工程图纸的设计质量,可以减轻审查机构的冗杂审查工作。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/941.html

好棒文