python的歌曲评论与分析系统
2一、引言 4(一)课题背景 4(二)开发程序 4二、需求分析 4(一)环境简介 4(二)数据库设计 5三 爬虫设计与数据显示 5(一)技术分析 5(二)实现过程 6四 特征词提取设计与实现 10(一)技术分析 10(二)实现方法 11五 图表的设计与实现 13(一)技术分析 13(二)实现方法 13六 数据的展示 15(一)技术分析 15(二)实现方法 16七、总结 23致谢 25参考文献 26 基于Python的歌曲评论与分析系统
目 录
基于Python的歌曲评论与分析系统 2
Abstract:
As we all know, every song of Netease has its own story behind it. It uses Python crawler technology to disguise itself as a server to get its popular reviews, comment time, and the number of comments, and then saves them as CSV files in the form of json. Anaconda contains pythons many scientific packages and objects, including plugins such as Wordcloud and Matplotlib, one for numerical calculation, and one for image framework. The comments obtained by the combination of the two are transformed into word clouds by TXT documents. By searching for keywords, people can more intuitively see the meaning of the song. Numpy in Anaconda carries out data analysis and charts the number of voters so that people can *好棒文|www.hbsrm.com +Q: ^351916072*
more intuitively understand the popularity of each song. The acquired data are imported into the database and displayed through the web form of asp. net. The data are displayed more intuitively in front of people with charts. Finally, a web page is formed for people to view and analyze intuitively.
【Keywords】python ;Anaconda;Matplotlib
一、引言
(一)课题背景
现在是大数据时代,计算机已经开始变得信息化,搜索引擎现在是互联网中最有效的获取信息的一种途径,已经对整个社会的发展造成了非常大的影响, Python具有简单、交互式等特点,内容爬取简单,在数据分析领域获得了很多的应用。“网易云”作为人们休闲、放松时最喜欢用的听歌软件,人们往往被其富有感情的评论所认同,为了方便用户直观的了解人们对于歌曲的看法,python的爬虫技术可以帮助人们自动获取到歌曲的评论信息,通过asp.net人们可以选择想要查看的音乐,直观的获取详情信息,大大提高了查看的效率,减少人们通过翻看软件获取评论等一系列不必要的麻烦。
(二)开发程序
1、程序开发技术
(1)Python
Python具有强大的语言库,起初它的作用是编写自动化脚本,随着时间的推移和技术的不断进步,现用的最多的地方就是数据爬虫,因而Python又被人们称为网络蜘蛛。
(2)Anaconda
Anaconda是Python的一个版本,其包含了很多个科学架包及其依赖项等,简单的说anaconda为Python提供了开发所需要的环境,使用anaconda可以十分便捷的下载所需要的架包及其环境
(3)ASP.NET
微软创建的ASP.NET,它的用途是来创建一种简单且强大的web服务器端技术,其中自带Form表格形式,使数据简单明了的展现在人们面前。在写代码方面,是以MVC形式,将页面层与业务逻辑层分开,让代码与内容展示的时候分开,使程序代码看起来变得更简单、明了。
二、需求分析
(一)环境简介
开发系统:windows 10
开发平台: pycharm 、 visual studio
编程语言: Python、 C#
数据库: Sql server
运行环境: Anaconda
数据包:Numpy 、Matplotlib、Wordcloud
(二)数据库设计
1.数据库分析
(1)歌曲评论表:
包括的数据项有userid、username、评论时间、点赞量、评论内容等。
(2)数据表:
包括的数据项有id、歌名、和词云和图表。
(3)成员:
包括用户id、账号、密码。
2.数据库的逻辑结构设计
表21 Hotcomments表
字段名称
类型
宽度
可否未空
约束
含义
Userid
varchar
50
否
主键
用户id
Username
varchar
50
否
外键
用户名
Commens
text
无
否
外键
评论
Num
varchar
目 录
基于Python的歌曲评论与分析系统 2
Abstract:
As we all know, every song of Netease has its own story behind it. It uses Python crawler technology to disguise itself as a server to get its popular reviews, comment time, and the number of comments, and then saves them as CSV files in the form of json. Anaconda contains pythons many scientific packages and objects, including plugins such as Wordcloud and Matplotlib, one for numerical calculation, and one for image framework. The comments obtained by the combination of the two are transformed into word clouds by TXT documents. By searching for keywords, people can more intuitively see the meaning of the song. Numpy in Anaconda carries out data analysis and charts the number of voters so that people can *好棒文|www.hbsrm.com +Q: ^351916072*
more intuitively understand the popularity of each song. The acquired data are imported into the database and displayed through the web form of asp. net. The data are displayed more intuitively in front of people with charts. Finally, a web page is formed for people to view and analyze intuitively.
【Keywords】python ;Anaconda;Matplotlib
一、引言
(一)课题背景
现在是大数据时代,计算机已经开始变得信息化,搜索引擎现在是互联网中最有效的获取信息的一种途径,已经对整个社会的发展造成了非常大的影响, Python具有简单、交互式等特点,内容爬取简单,在数据分析领域获得了很多的应用。“网易云”作为人们休闲、放松时最喜欢用的听歌软件,人们往往被其富有感情的评论所认同,为了方便用户直观的了解人们对于歌曲的看法,python的爬虫技术可以帮助人们自动获取到歌曲的评论信息,通过asp.net人们可以选择想要查看的音乐,直观的获取详情信息,大大提高了查看的效率,减少人们通过翻看软件获取评论等一系列不必要的麻烦。
(二)开发程序
1、程序开发技术
(1)Python
Python具有强大的语言库,起初它的作用是编写自动化脚本,随着时间的推移和技术的不断进步,现用的最多的地方就是数据爬虫,因而Python又被人们称为网络蜘蛛。
(2)Anaconda
Anaconda是Python的一个版本,其包含了很多个科学架包及其依赖项等,简单的说anaconda为Python提供了开发所需要的环境,使用anaconda可以十分便捷的下载所需要的架包及其环境
(3)ASP.NET
微软创建的ASP.NET,它的用途是来创建一种简单且强大的web服务器端技术,其中自带Form表格形式,使数据简单明了的展现在人们面前。在写代码方面,是以MVC形式,将页面层与业务逻辑层分开,让代码与内容展示的时候分开,使程序代码看起来变得更简单、明了。
二、需求分析
(一)环境简介
开发系统:windows 10
开发平台: pycharm 、 visual studio
编程语言: Python、 C#
数据库: Sql server
运行环境: Anaconda
数据包:Numpy 、Matplotlib、Wordcloud
(二)数据库设计
1.数据库分析
(1)歌曲评论表:
包括的数据项有userid、username、评论时间、点赞量、评论内容等。
(2)数据表:
包括的数据项有id、歌名、和词云和图表。
(3)成员:
包括用户id、账号、密码。
2.数据库的逻辑结构设计
表21 Hotcomments表
字段名称
类型
宽度
可否未空
约束
含义
Userid
varchar
50
否
主键
用户id
Username
varchar
50
否
外键
用户名
Commens
text
无
否
外键
评论
Num
varchar
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/rjgc/1008.html