网络舆情分析系统(附件)
当前网络意见平台激增,网络上充斥着更多不良消息,更容易对网络民众造成误导。本文从当前形势出发,使用SpringMVC+Spring+Mybatis框架搭建一个网络舆情分析系统,抓取知乎意见平台上的内容,提取出内容主题、关键词等。同时,利用SVM算法对未知分类文本进行分类,从而自动检测出舆情。另一方面,利用网络爬虫爬取当前平台用户,将拥有大量粉丝的用户设置为意见领袖,然后分析意见领袖的答案,总结文章内容,快速筛选信息,提高管理者的效率。最后,使用ECTARS图表将网络舆情信息高效、直观的显示在管理者面前,辅助管理人员对网络舆情进行检测、发现、分析、处理。
目录
摘要 1
关键词 1
ABSTRACT 1
KEY WORDS 1
引言 1
1 综述 1
1.1 问题的提出 1
1.2 国内外研究状况 2
1.3 研究的目的和内容 2
2 需求分析 2
2.1 功能需求 2
2.2 系统模块 3
3 设计流程及思想 3
3.1 设计思想 3
3.2 设计的总体流程图 4
4 开发平台及应用技术 4
4.1 INTELLIJ IDEA简介 4
4.2 SSM简介 4
4.3 网络爬虫技术介绍 5
4.4 MYSQL数据库 5
4.5 HANLP汉语处理器 6
4.6 HANLP关键词提取TEXTRANK算法 6
4.6.1 TextRank算法简介 6
4.6.2 TextRank算法详解 6
4.7 基于向量机SVM的文本分类算法 6
4.7.1 SVM算法简介 6
4.7.2 SVM算法详解 7
4.7.3 SVM算法java实现 8
5 网络舆情分析系统介绍 9
5.1 系统结构设计 9
5.1.1 系统总类图 10
5.1.2 系统管理类图 10
5.1.3 舆情 *好棒文|www.hbsrm.com +Q: ^351916072*
管理类图 10
5.1.4 系统管理用例图 11
5.1.5 舆情管理用例图 11
5.2 功能模块设计 12
5.2.1 爬虫模块设计 12
5.2.2 登录模块设计 13
5.2.3 系统管理模块设计 13
5.2.4 数据分析模块设计 13
5.3 系统数据库设计 14
5.3.1 网络舆情系统ER图 14
6 系统结果展示 14
6.1 功能实现和相应页面 15
6.1.1 登录页面 15
6.1.2 话题简报和专题简报页面 15
6.1.3 舆情分析页面 16
6.1.4 舆情分类页面 17
6.1.5 用户简报页面 18
6.1.6 意见领袖页面 18
6.1.7 系统用户管理页面 18
6.1.8 系统菜单管理页面 19
6.1.9 系统权限管理页面 19
7 总结 20
7.1 系统总结 20
7.2 未来展望 20
致谢 20
参考文献 20
网络舆情分析系统
引言
引言:近年来,大量中国网民涌入各种意见平台,例如知乎、贴吧、微博等等,他们利用互联网意见平台针砭时弊、宣泄情绪、表达利益诉求。这种行为频率越来越高,对公共事务的影响力越来越大,从而一旦被有心人利用,则社会危害性也越大[1]。近年来国家对于公共舆论安全加大了关注力度,要求必须在公共透明的平台上做到信息纯净化、信息可靠化、信息积极化。然而面对传播快速、互动频繁、受众广大的信息管理平台,如何在众多用户消息数据中发现舆情,处理舆情,控制舆情,给各信息平台管理人员、政府等公共管理部门以及公司紧急公关处理人员等带来了巨大的压力和挑战[2]。
1 综述
1.1 问题的提出
网络舆情分析针对突发紧急状况应该具备优秀的处理能力,其作为网络舆情管控监控、舆情危机预警系统中最关键的一环[3],运用当前数据挖掘,文本分析等技术,对当前实时、交互的网络信息进行自动化分类,并提取舆情,实现舆情自动化识别、实时分析、实现智能研判,对促进社会和谐、保护社会稳定、达成信息安全具有划时代的意义。
1.2 国内外研究状况
网络舆情分析是一门基于话题检测与追踪(Topic Detection Tracking, TDT)、信息评判分类等技术的应用型学科,交叉学科众多,包括信息检索、数据挖掘、人工智能等等。网络舆情分析无论是在军事还是政治上都有极高的运用价值,在缺乏知识先验的前提下,对信息进行话题分析并实现内容查找。无论是国内还是国外研究专家都极其看重网络舆情分析的价值。大量研究学者提出在网络舆情分析之前对其先进行模型构建,使其不局限于单一话题,具备广泛适用性。
同时近些年来,国内外学者针对TDT、话题检测、热度追踪等提出了一系列的模型和算法。其中,从德尔菲法和层次分析法中融合衍生的指标权重法性能较为优异[4],该方法采用指标来对舆情进行定量研究,通过获取文本内容的指标权重进行舆情的重要程度进行判断,给舆情研究人员很大启迪。另一方面,还有学者提出了多级模糊评判模型,该模型通过对对象集和因素集等研究集合的处理确定,为整个舆情信息建立特定评语集,然后采集评语的权重值,为舆情信息建立模糊度隶属矩阵,从而得到舆情的综合评判结果。
目录
摘要 1
关键词 1
ABSTRACT 1
KEY WORDS 1
引言 1
1 综述 1
1.1 问题的提出 1
1.2 国内外研究状况 2
1.3 研究的目的和内容 2
2 需求分析 2
2.1 功能需求 2
2.2 系统模块 3
3 设计流程及思想 3
3.1 设计思想 3
3.2 设计的总体流程图 4
4 开发平台及应用技术 4
4.1 INTELLIJ IDEA简介 4
4.2 SSM简介 4
4.3 网络爬虫技术介绍 5
4.4 MYSQL数据库 5
4.5 HANLP汉语处理器 6
4.6 HANLP关键词提取TEXTRANK算法 6
4.6.1 TextRank算法简介 6
4.6.2 TextRank算法详解 6
4.7 基于向量机SVM的文本分类算法 6
4.7.1 SVM算法简介 6
4.7.2 SVM算法详解 7
4.7.3 SVM算法java实现 8
5 网络舆情分析系统介绍 9
5.1 系统结构设计 9
5.1.1 系统总类图 10
5.1.2 系统管理类图 10
5.1.3 舆情 *好棒文|www.hbsrm.com +Q: ^351916072*
管理类图 10
5.1.4 系统管理用例图 11
5.1.5 舆情管理用例图 11
5.2 功能模块设计 12
5.2.1 爬虫模块设计 12
5.2.2 登录模块设计 13
5.2.3 系统管理模块设计 13
5.2.4 数据分析模块设计 13
5.3 系统数据库设计 14
5.3.1 网络舆情系统ER图 14
6 系统结果展示 14
6.1 功能实现和相应页面 15
6.1.1 登录页面 15
6.1.2 话题简报和专题简报页面 15
6.1.3 舆情分析页面 16
6.1.4 舆情分类页面 17
6.1.5 用户简报页面 18
6.1.6 意见领袖页面 18
6.1.7 系统用户管理页面 18
6.1.8 系统菜单管理页面 19
6.1.9 系统权限管理页面 19
7 总结 20
7.1 系统总结 20
7.2 未来展望 20
致谢 20
参考文献 20
网络舆情分析系统
引言
引言:近年来,大量中国网民涌入各种意见平台,例如知乎、贴吧、微博等等,他们利用互联网意见平台针砭时弊、宣泄情绪、表达利益诉求。这种行为频率越来越高,对公共事务的影响力越来越大,从而一旦被有心人利用,则社会危害性也越大[1]。近年来国家对于公共舆论安全加大了关注力度,要求必须在公共透明的平台上做到信息纯净化、信息可靠化、信息积极化。然而面对传播快速、互动频繁、受众广大的信息管理平台,如何在众多用户消息数据中发现舆情,处理舆情,控制舆情,给各信息平台管理人员、政府等公共管理部门以及公司紧急公关处理人员等带来了巨大的压力和挑战[2]。
1 综述
1.1 问题的提出
网络舆情分析针对突发紧急状况应该具备优秀的处理能力,其作为网络舆情管控监控、舆情危机预警系统中最关键的一环[3],运用当前数据挖掘,文本分析等技术,对当前实时、交互的网络信息进行自动化分类,并提取舆情,实现舆情自动化识别、实时分析、实现智能研判,对促进社会和谐、保护社会稳定、达成信息安全具有划时代的意义。
1.2 国内外研究状况
网络舆情分析是一门基于话题检测与追踪(Topic Detection Tracking, TDT)、信息评判分类等技术的应用型学科,交叉学科众多,包括信息检索、数据挖掘、人工智能等等。网络舆情分析无论是在军事还是政治上都有极高的运用价值,在缺乏知识先验的前提下,对信息进行话题分析并实现内容查找。无论是国内还是国外研究专家都极其看重网络舆情分析的价值。大量研究学者提出在网络舆情分析之前对其先进行模型构建,使其不局限于单一话题,具备广泛适用性。
同时近些年来,国内外学者针对TDT、话题检测、热度追踪等提出了一系列的模型和算法。其中,从德尔菲法和层次分析法中融合衍生的指标权重法性能较为优异[4],该方法采用指标来对舆情进行定量研究,通过获取文本内容的指标权重进行舆情的重要程度进行判断,给舆情研究人员很大启迪。另一方面,还有学者提出了多级模糊评判模型,该模型通过对对象集和因素集等研究集合的处理确定,为整个舆情信息建立特定评语集,然后采集评语的权重值,为舆情信息建立模糊度隶属矩阵,从而得到舆情的综合评判结果。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/wljs/400.html