网络社区用户评论筛选系统设计任务书

综合运用Java语言或Python语言、数据库技术和WEB编程技术,研究并设计一个网络社区用户评论智能获取与筛选系统。


毕业设计(论文)题目:

     网络社区用户评论的智能获取与筛选系统

一、毕业设计(论文)内容及要求(包括原始数据、技术要求、达到的指标和应做的实验等)

   学习和研究网络社区的访问机制和网页文本获取方法,综合运用Java语言或Python语言、数据库技术和WEB编程技术,研究并设计一个网络社区用户评论智能获取与筛选系统。该系统主要功能包括:(1)自动访问网络社区的功能;(2)获取网络社区评论的功能;(3)自动筛选社区评论,剔除无效评论的功能;(4)分类自动呈现获取的评论信息的功能。

要求:后台数据要求具有一致性、完整性、安全性,前台应用程序系统要求功能完备、易于使用和界面友好。

二、完成后应交的作业(包括各种说明书、图纸等)

  1. 毕业设计论文

2. 源程序

3. 英文原文及译文

三、完成日期及进度

  2017年1月9日至2017年6月9日,共17周。

进度安排:

1. 1.09-1.15,分配任务,提出要求,查阅课题相关的文献资料;

2. 2.20-2.26,项目调研,课题设计准备;

3. 2.27-3.12,系统需求分析,确定研究内容、方法和步骤;

4. 3.13-4.09,撰写开题报告,按系统需求,完成系统的初步设计方案;

5. 4.10-5.07,系统详细设计并实现,进行中期检查;

6. 5.08-5.21,系统测试、改进,撰写毕业设计论文;

7. 5.22-6.09,整理相关设计文档,完善毕业设计论文,进行毕业设计答辩。

四、主要参考资料(包括书刊名称、出版年月等):

  [1] 罗刚.自己动手写网络爬虫(修订版)[M]. 清华大学出版社,2016.8.

[2] 理查德•劳森(Richard Lawson) 著, 李斌 译. 用Python写网络爬虫 [M]. 人民邮电出版社,2016.8.

[3] 胡松涛. Python 网络爬虫实战[M]. 清华大学出版社. 2016.12.

[4] 米切尔 (Ryan Mitchell)著,陶俊杰, 陈小莉 译. Python网络数据采集[M]. 人民邮电出版社,2016.03.

[5] 梁春燕. Internet主题搜索引擎设计与研究[M]. 中国水利水电出版社,2012.03.

[6] Elliotte Rusty Harold(哈诺德 R.E.) 著, 李帅,荆涛 等 译. Java网络编程(第四版)[M]. 中国电力出版社,2014.09.

[7] 明日科技 著. Java从入门到精通(第4版 附光盘)[M].清华大学出版社, 2016,10.

[8] 魏勇, 胡丹露, 郝晨光 等. 基于分类关键词词频模型的地缘政治主题爬虫设计[J]. 计算机工程, 2016,42(2):45-50.

[9] 关卫国,骆永成. 基于概念背景图的主题爬虫设计与实现[J]. 计算机工程与设计, 2016,37(10):2679-2684.

[10] 王帅,周国民,王健. 基主题爬虫相关度算法研究综述[J]. 计算机与现代化, 2013,4:27-30.