微博话题实时检测方法的设计与实现(源码)【字数:9352】
摘 要随着新型科技及新兴媒体的不断崛起,与往日不同,主流媒体并非为突发性事件报道的唯一途径。微博因其独特的优势在各种媒体传播中崭露头角,已成为许多热点事件及突发性话题的重要传播手段。作为脱颖而出的新媒体,公众微博为传统媒体提供了热点话题的相关信息。在微博中,每日都有大量的话题,用户在大致浏览后,可根据自身的喜好在当中选取感兴趣的话题,然后阅览并发表评论。如若要进一步地了解某一热点话题,用户需浏览更多的相干的话题,从而更加清晰地明白事件的发展形态。另外,用户也可采用不断刷新的方式来浏览更多的话题,了解其评论热度及转发量,从而跟踪最新热点话题。但是,这样无疑需要消耗极大的精力,并且还不能获得完整的信息,达到理想效果。那么如何在成千上万的微博话题当中自动查找出热点,使得用户能够快速浏览话题,已成为当下一个研究热点。值得一提的是某些情报信息的发掘及分析在一些特殊部门的业务应用工作中起到了举足轻重的作用。微博内容真实地来源于生活,它提供了许多研究人类日常生活规律的相关资料,为数据开发提供了宽广的发展机遇。本文为三部分探讨公众微博突发性话题检测方法的设计与实现数据采集、数据分析处理、界面结果显示的过程。实现的功能主要是管理员登陆、微博导入、按照顺序和分类推送热点、微博展示和用户登录界面。该检测系统基于web方式。在开发过程中使用Mysql作为数据库,运用Myeclipse作为开发工具对各个功能模块进行实现。
目 录
第一章 前言 7
1.1研究背景及意义 7
1.2国内研究现状 7
1.3本文的主要研究内容 7
1.4技术支持 8
1.5 本章小结 9
第二章 需求分析 10
2.1 可行性分析 10
2.1.1技术的可行性 10
2.1.2经济的可行性 10
2.1.3操作的可行性 10
2.2系统功能需求分析 10
2.2.1系统开发目的 10
2.2.2系统各模块开发流程 12
2.2.2.1 用户注册模块 12
2.2.2.2用户登录模块 13
2.2.2.3导入数据模块 14
2.2.2.4微博数据查询 *好棒文|www.hbsrm.com +Q: #351916072#
模块 15
2.2.2.5统计高频词模块 16
2.2.3系统开发类模型图 17
2.3 设计的基本思想 18
2.4 本章小结 18
第三章 系统分析与设计 19
3.1 数据库的分析与设计 19
3.1.1 数据库分析与MYSQL的优点 19
3.1.2 数据库设计表 20
3.2 系统功能实现 21
3.2.1 注册界面 21
3.2.2 登陆页面 22
3.2.3 微博excel导入界面 23
3.2.4 微博查询界面 24
3.2.5统计高频词界面 25
3.3 本章小结 26
第四章 系统编码设计 27
4.1 编码说明 27
4.2 本章小结 31
第五章 系统测试 32
5.1 功能测试 32
5.2 本章小结 33
结束语 34
致 谢 35
参考文献 35
第一章 前言
1.1研究背景及意义
在这个信息共享的时代,信息高速地传播、更新,微博应运而生。2006年,美国出现了一种叫推特的大众信息共享平台,这就是最早的微博同时也是现在最具影响力的微博。用户可以写出140个字记录自己的状态或者是一些别的信息,并且随时可以发布。至2010年1月,全球大概有七千多万的推特用户。2009年8月,我国的新浪网也开放了“新浪微博”的测试版,从此中国的微博走入国人的生活。截至2011年,仅时间,我国新浪微博的用户以达二点五亿,将成为世界拥有微博用户最多的国家。
信息时代的更替,微博作为信息传播的载体,更是以一个不可小觑的速度在发展。据不完全统计,百分之九十六的人是通过微博了解时下的热点话题,并借此发表自己的观点。微博俨然已成为大众了解时事的重要工具。尤其是面对突发性事件时,微博的存在也是对事件一个有力的推动。
尤其近年来,我国突发性事件频频发生,而这些事件往往影响着大众的利益,引起极大的关注,在这个背景下,大众的选择就是通过微博来表达自己的看法。但是十个人就有十个想法,不一样的观点,造成了网络上的战争,键盘侠也成了这个时代的产物。这个时候如何妥善的引导处理这些突发事件的信息传播从而化解公众社会危机就成了重要的课题。
1.2国内研究现状
十几年前,一个名叫王兴的人创建了饭否网,他也是人人网的创始人。饭否网开始在我国悄悄出现,可以说是微博的前生,但并没有被大众认可。一年后,微博正式诞生,新浪网开放了新浪微博,从此,人们开始关心起微博的发展。在饭否网上,人们可以自由的交流,除了文字之外,还可以发送图片进行更好的交流,这一点也被后面的各种聊天软件所借鉴。在此之后国内也曾出现过一些类似的网站,不过都夭折了,目前只有小部分还可以使用。虽然微博也在学习推特,并不断向他靠拢,但从某种意义上来说,微博还是给小婴儿。相比于美国推特的用户不仅局限于个人用户更有公司用户,中国的微博则大多是个人用户,方便网友发表个人想法。虽然第一批的博客相继关闭,但也为下一个微博做了铺垫,不一样的营销手段使新浪微博在仅仅六个月时间里迅速走进大众的视野,席卷而来,并获得了上万网友的关注,新浪微博成为了微博届的领头羊。
1.3本文的主要研究内容
根据客户的实际需求,对其进行理解分析,继而进行严谨的程序推导,按照“数据收集数据分析结果显示”的步骤一步一步的进行开发。本系统提供的功能是典型的面向管理者,首先将分析所导入的微博后台数据,提示管理者提取流程的进行,帮助管理者鉴别微博突发性话题和提供舆论情报的监控等,本系统凭借一个功能强大的后台分析模块,可以在线抓取公众微博数据和分类识别。
1) 数据收集
通过调用导入的微博数据集,利用大数据把挖掘的数据分析,从而获取所需的网络信息,运用ASP或JSP技术开发与后台的数据库(MySQL)相交互构建一个公众热点分析的网页系统,将抓取的数据信息按照数据库中的分类字段存储于数据库服务器中,从而提供热点话题排名显示和展示信息的功能。
2) 数据分析处理
目 录
第一章 前言 7
1.1研究背景及意义 7
1.2国内研究现状 7
1.3本文的主要研究内容 7
1.4技术支持 8
1.5 本章小结 9
第二章 需求分析 10
2.1 可行性分析 10
2.1.1技术的可行性 10
2.1.2经济的可行性 10
2.1.3操作的可行性 10
2.2系统功能需求分析 10
2.2.1系统开发目的 10
2.2.2系统各模块开发流程 12
2.2.2.1 用户注册模块 12
2.2.2.2用户登录模块 13
2.2.2.3导入数据模块 14
2.2.2.4微博数据查询 *好棒文|www.hbsrm.com +Q: #351916072#
模块 15
2.2.2.5统计高频词模块 16
2.2.3系统开发类模型图 17
2.3 设计的基本思想 18
2.4 本章小结 18
第三章 系统分析与设计 19
3.1 数据库的分析与设计 19
3.1.1 数据库分析与MYSQL的优点 19
3.1.2 数据库设计表 20
3.2 系统功能实现 21
3.2.1 注册界面 21
3.2.2 登陆页面 22
3.2.3 微博excel导入界面 23
3.2.4 微博查询界面 24
3.2.5统计高频词界面 25
3.3 本章小结 26
第四章 系统编码设计 27
4.1 编码说明 27
4.2 本章小结 31
第五章 系统测试 32
5.1 功能测试 32
5.2 本章小结 33
结束语 34
致 谢 35
参考文献 35
第一章 前言
1.1研究背景及意义
在这个信息共享的时代,信息高速地传播、更新,微博应运而生。2006年,美国出现了一种叫推特的大众信息共享平台,这就是最早的微博同时也是现在最具影响力的微博。用户可以写出140个字记录自己的状态或者是一些别的信息,并且随时可以发布。至2010年1月,全球大概有七千多万的推特用户。2009年8月,我国的新浪网也开放了“新浪微博”的测试版,从此中国的微博走入国人的生活。截至2011年,仅时间,我国新浪微博的用户以达二点五亿,将成为世界拥有微博用户最多的国家。
信息时代的更替,微博作为信息传播的载体,更是以一个不可小觑的速度在发展。据不完全统计,百分之九十六的人是通过微博了解时下的热点话题,并借此发表自己的观点。微博俨然已成为大众了解时事的重要工具。尤其是面对突发性事件时,微博的存在也是对事件一个有力的推动。
尤其近年来,我国突发性事件频频发生,而这些事件往往影响着大众的利益,引起极大的关注,在这个背景下,大众的选择就是通过微博来表达自己的看法。但是十个人就有十个想法,不一样的观点,造成了网络上的战争,键盘侠也成了这个时代的产物。这个时候如何妥善的引导处理这些突发事件的信息传播从而化解公众社会危机就成了重要的课题。
1.2国内研究现状
十几年前,一个名叫王兴的人创建了饭否网,他也是人人网的创始人。饭否网开始在我国悄悄出现,可以说是微博的前生,但并没有被大众认可。一年后,微博正式诞生,新浪网开放了新浪微博,从此,人们开始关心起微博的发展。在饭否网上,人们可以自由的交流,除了文字之外,还可以发送图片进行更好的交流,这一点也被后面的各种聊天软件所借鉴。在此之后国内也曾出现过一些类似的网站,不过都夭折了,目前只有小部分还可以使用。虽然微博也在学习推特,并不断向他靠拢,但从某种意义上来说,微博还是给小婴儿。相比于美国推特的用户不仅局限于个人用户更有公司用户,中国的微博则大多是个人用户,方便网友发表个人想法。虽然第一批的博客相继关闭,但也为下一个微博做了铺垫,不一样的营销手段使新浪微博在仅仅六个月时间里迅速走进大众的视野,席卷而来,并获得了上万网友的关注,新浪微博成为了微博届的领头羊。
1.3本文的主要研究内容
根据客户的实际需求,对其进行理解分析,继而进行严谨的程序推导,按照“数据收集数据分析结果显示”的步骤一步一步的进行开发。本系统提供的功能是典型的面向管理者,首先将分析所导入的微博后台数据,提示管理者提取流程的进行,帮助管理者鉴别微博突发性话题和提供舆论情报的监控等,本系统凭借一个功能强大的后台分析模块,可以在线抓取公众微博数据和分类识别。
1) 数据收集
通过调用导入的微博数据集,利用大数据把挖掘的数据分析,从而获取所需的网络信息,运用ASP或JSP技术开发与后台的数据库(MySQL)相交互构建一个公众热点分析的网页系统,将抓取的数据信息按照数据库中的分类字段存储于数据库服务器中,从而提供热点话题排名显示和展示信息的功能。
2) 数据分析处理
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/rjgc/13.html