地名地址信息检索技术的研究与应用(源码)【字数:8627】

摘 要随着地理空间数据交换平台建设的深入,平台管理的地名地址数据日益增多,地名地址的非标准、多义性等特点不利于发掘地名地址数据应用价值。面对繁多复杂的数据,如何快速准确地查找出目标信息,已经成为了当今研究的热点话题之一。然而,通用搜索引擎例如百度,虽然能够为用户提供大量结果,但是仍然存在着一些不足之处,例如结果重复率高、查准率低下等现象。为了解决上述不足,全文检索引擎应运而生。此外,除了上述信息检索技术外,地理信息技术在空间分析和可视化方面有着很大的操作优势,将这两种技术相结合,能够更高效地实现地名地址信息检索系统。本文分析地名地址的表达特征,针对地名地址数据的索引、检索、排序等方面展开研究,利用地名地址信息检索的关键技术设计出了一个基于Lucene的地名地址信息检索原型系统。该系统具有较高的检索效率和准确度,可应用于地理空间数据交换平台,促进其大众化、社会化应用和发展。
目 录
第一章 绪 论 1
1.1研究背景与意义 1
1.2国内外研究现状 1
1.2.1对地名地址数据的研究 1
1.2.2对地理编码的研究 1
1.2.3对全文检索技术的研究 2
1.3研究目标与内容 2
1.4技术路线 2
1.5论文组织结构 3
第二章 地名地址信息检索关键技术 5
2.1方法综述 5
2.2Lucene框架 5
2.3构建索引 6
2.4查询表达式解析 6
2.5检索结果排序算法 7
第三章 基于Lucene的地名地址信息检索原型系统的设计 8
3.1功能设计 8
3.2数据库设计 9
3.2.1标准地址概念建模 9
3.2.2数据字典设计 9
第四章 基于Lucene的地名地址信息检索原型系统的实现 15
4.1地名地址信息检索WEB端 15
4.1.1检索服务模块 15
4.1.2智能分析模块 16
4.2地名地址信息检索后台管理 18
4.2.1数据管理 18
4.2. *好棒文|www.hbsrm.com +Q: ^351916072^ 
2索引构建 19
4.2.3地名地址检索 21
结束语 22
致 谢 23
参考文献 24
第一章 绪 论
1.1研究背景与意义
地名地址是人们对具有特定方位、地域范围的地理实体赋予的专有名词。作为最常用的一类公共信息,地名地址不仅与人们的日常生活息息相关,还是国家行政管理、经济建设、国内外交往不可或缺的基础信息资源[1] 。地名、地址是重要的位置信息,地名地址信息检索技术是地理信息系统中的重要技术,也是大千世界各类信息相互沟通的桥梁,能够实现各行业大数据的空间化,实现各类地理信息检索。
此次研究地名地址信息检索技术,一方面可以较为系统地应用地理信息中关于地名地址这一领域的专业知识,另一方面可以直观地管理地名地址信息数据,高效地实现数据的转换与融合,便捷地达到快速检索信息的目的,若有机会推广实施,更是会在人文、环境、测绘等周边领域产生不错的反响。而且在大数据时代,地理信息科学具有广阔的发展前景,因此,此次研究地名地址信息检索技术及其应用也具有紧跟时代步伐的现实意义。
1.2国内外研究现状
1.2.1对地名地址数据的研究
国外的地名地址数据建设和地名地址信息检索技术研究起步较早,积累了大量的经验,形成了较大的技术优势,且提供比较完善的实时信息,提供免费的共享服务,已经成功地应用于国家的政治、外交、军事、经济和公共服务等各个领域。而我国地名地址数据库的建设与研究起步较晚,主要由民政部门和测绘部门承担,目前,各大城市的各个职能部门在以往的业务管理过程中,各自建立起自己的地名地址数据库,但仍都存在着一定的缺陷,并非完整的地名地址数据,而且相互之间无法共享[2] 。通过借鉴和吸收国外发展过程中的一些经验和教训,未来可以取得非常不错的研究进展。
1.2.2对地理编码的研究
美国是地址编码应用最早、最广泛的国家,为配合1970年的人口普查,20世纪60年代中期,美国国情普查局研究发展了“双重独立地图编码系统”,简称DIME[3] ,随着后来版本的不断更新,对社会公众产生了有力的影响。加拿大、德国、以色列等国家,同样很早就对地址编码技术做了细致而大量的研究工作和实际应用。同美国一样,这些成果在对各自国家的规划、行政、测绘等事业的工作都起到了积极的作用[4] 。
在我国,从20世纪80年代开始,一部分城市的规划、测绘及管理部门对城市地址编码问题相继开展了研究工作[4] 。在上海、北京、大连等大城市,都纷纷展开了对地理编码的研究和使用工作并取得了不错的成果。然而,随着使用的深入,地理编码的弊端也显现了出来。编码的使用范围和唯一性存在分歧,同一种编码存在相对的局限性等等,这些都有待于进一步的研究优化。
1.2.3对全文检索技术的研究
全文检索这种情报检索技术最早出现于20世纪50年代。1973年,美国米德公司面向公众查询的收录有大量以法律、新闻、商业经济、政府出版物等内容为主的大型全文数据库Lexis的投入使用,标志着全文检索领域的诞生。20世纪80年代以来,英文全文检索发展得较为迅速和完善,如今已成为国外文字型信息检索的主流[5] 。
我国全文检索技术的研究起步于20世纪80年代末,但发展速度较快。我国科研工作者们根据自身实际情况,提出了一系列检索模式,并且通过试验都取得了很好的效果。例如基于汉语自身特点,我国学者已提出了自己的全文检索模式——单汉字无标引全文检索系统和全文后控检索系,并不断深入研究构造新的全文检索模式,如《全文检索研究》一文中提出了一种“自动标引算法”[6] ,以避开歧义切分问题,保证检索结果的查全率和查准率。
1.3研究目标与内容
要实现一个地名地址信息检索系统,核心技术就是全文检索技术。但总结已有的基于全文检索的地名地址检索方法,大多方法借鉴了全文检索技术,较好地提高了检索效率,却忽略了地名地址的空间、语义等特性[710]。本文在总结现有地名地址、信息检索等领域的理论与技术的基础上,分析地名地址的表达特征,对地名地址的索引、检索、排序等方面进行研究,提高地名地址信息检索的效率和准确性,拓展地名地址信息检索的应用范畴。
1.4技术路线
根据论文的研究目标与内容,本文拟采用以下技术路线,如图11所示。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/135.html

好棒文