lucene的个性化信息服务系统(附件)

摘要:本文针对广大读者对图书馆、博物馆等场所数据信息的不同需求,为弥补还没有建立起针对各大文化场馆的手机端信息服务系统的不足,结合网络爬虫技术和KNN信息分类算法,对各大文化场所的信息采集提出了一个较为全面详细的设计方案。该系统基于数据访问,业务逻辑和用户界面的三层架构,利用SQL Server 2008设计数据库,结合Lucene创建文档索引,利用java语言进行开发,对各大文化场所网站上的信息数据进行采集、过滤以及分类,提供了一个基于Android平台的个性化信息推送系统。
目录
摘要 1
关键词 1
Abstract 1
Key words 1
引言 1
1 选题背景 1
1.1 问题的提出 1
1.2 国内外研究状况 1
1.2.1 国外研究状况 2
1.2.2 国内研究状况 2
2 开发平台及应用技术 2
2.1 Android简介 2
2.2 数据库概述 2
2.2.2 SQL Server 2008的特点 3
2.3 Lucene简介 3
2.3.1 Lucene架构设计 3
2.3.2 Lucene索引的核心类 4
2.3.3 Lucene搜索过程中的核心类 5
2.3.4 Lucene的排序算法 5
2.4 网络爬虫 5
2.4.1 网络爬虫基本原理 5
2.4.2网络爬虫的两个策略 6
2.4.2.1 深度优先策略 6
2.4.2.2 广度优先策略 6
2.4.3 通用网络爬虫工作流程 6
2.5 文本分类算法 6
2.5.1 特征提取 7
2.5.2 文本相似度计算 7
2.5.3 KNN算法基本原理 7
2.6 百度地图API 7
3 研究内容 8
3.1 研究内容 8
3.2 技术路线 9
4 系统设计 9
4.1 整体结构图 9

 *好棒文|www.hbsrm.com +Q: *351916072* 
4.2 服务端设计 9
4.2.1 服务端的框图 9
4.2.2 爬虫模块 10
4.2.2.1 爬虫基本方法 10
4.2.2.2 爬虫模块流程图 10
4.2.2.3 爬虫算法的主要函数 11
4.2.2.4 爬虫算法分析 12
4.2.3 KNN算法 14
4.2.3.1 算法概述 14
4.2.3.2 KNN算法流程图 14
4.2.3.3 TFIDF算法 14
4.2.3.4 KNN算法的主要函数 15
4.2.3.5 KNN算法分析 16
4.2.3.6 可行性分析 17
4.2.4 数据库设计 17
4.2.4.1 数据库表的结构 17
4.2.4.2 ER图 18
4.2.5 Lucene 18
4.2.5.1 Lucene创建索引 18
4.2.5.2 Lucene全文检索 19
4.2.6 webservice 19
4.3 客户端设计 20
4.3.1 各模块简介 20
5 系统展示 20
5.1 登录和注册功能 20
5.1.1功能流程图 20
5.1.2 功能展示 21
5.2 选择兴趣词 22
5.2.1功能流程图 22
5.2.2 功能展示 22
5.3 信息浏览 22
5.3.1功能流程图 23
5.3.2 功能展示 23
5.4 信息检索 23
5.4.1功能流程图 23
5.4.2 功能展示 24
5.5 地图界面 24
5.5.1 功能流程图 24
5.5.2 功能展示 25
6 总结和展望 26
致谢 27
参考文献: 27
基于Lucene的个性化信息服务系统
引言
引言
1 选题背景
1.1 问题的提出
各大图书馆,博物馆的Web网站已经建立得非常完善,但是随着手机用户的激增,开发信息推送的手机客户端是未来一大趋势。并且Web网站提供的文化活动信息零落分散,深藏在互联网的海量信息中,市民无法全面、及时获取自己感兴趣的信息。因此,急需将各家深墙之中的公共文化活动信息整合并展示出来,从而使公共文化信息更有效的,更丰富的呈现在用户面前。
1.2 国内外研究状况
1.2.1 国外研究状况
在国外,较早研究移动图书馆方面知识的要数欧美、日韩等国家,这些国家对移动图书馆方面的研究已经比较详尽和完善。医学图书馆是国外最早的移动图书馆案例,所以说医学人员是最早使用移动图书馆的人员[1]。2000年9月,日本富山大学图书馆推出的手机端的书目查询系统,使得移动图书馆走向众人的视野,该系统还为读者提供了包括书目检索、图书预约、图书续借、图书催还以及消息及时通知在内的各种信息服务[2]。2001年11月,芬兰的赫尔辛基理工大学图书馆使用了Portalify公司开发的图书馆系统Liblet,该系统为读者提供包括书目检索、图书的预约、续借和到期提醒在内的各种服务并以发送短信的形式告知读者[3]。美国的互联网技术发展迅速,其移动图书馆出现在2001年左右,一直发展至今并走向成熟。欧美国家的移动图书馆发展至今已经比较成熟和普及,2011年有学者对美国20家大学图书馆和20家城市公共图书馆进行了调查和统计,发现其中九成以上的图书馆已经开通了移动图书馆的服务[4]。
1.2.2 国内研究状况
从2000年开始,国内开始陆续出现了移动图书馆,我国最早研究移动图书馆的文献出现在2007年之后。从分布地域上看,开展移动图书馆服务较早的是北京地区和上海地区,而在这两个地区中开通移动图书馆服务最多的就是高校的图书馆。我国出现最早的移动图书馆应当是北京理工大学的图书馆,其在2003年12月推出了手机短信提醒服务。2011年,北京大学图书馆和清华大学图书馆分别在3月和11月推出了他们的新版移动图书馆。从2005年开始,上海图书馆的移动服务拉开序幕,先是通过发短信提供移动服务,再是推出手机端的网站,最后推出了它的手机客户端给用户提供移动服务。我国移动图书馆的服务主要包括馆藏查询、期刊导航、图书导航、读者账户、意见反馈、热门推荐等,还包括一些活动通知、热门搜索、开馆时间、相关新闻、讲座信息、参考咨询、新书通报、服务指南、分馆导引和到馆路线查询等。
2 开发平台及应用技术

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/wljs/681.html

好棒文