综合运用Java语言或Python语言、数据库技术和WEB编程技术,研究并设计一个网络社区用户评论智能获取与筛选系统。
毕业设计(论文)题目:
网络社区用户评论的智能获取与筛选系统
一、毕业设计(论文)内容及要求(包括原始数据、技术要求、达到的指标和应做的实验等)
学习和研究网络社区的访问机制和网页文本获取方法,综合运用Java语言或Python语言、数据库技术和WEB编程技术,研究并设计一个网络社区用户评论智能获取与筛选系统。该系统主要功能包括:(1)自动访问网络社区的功能;(2)获取网络社区评论的功能;(3)自动筛选社区评论,剔除无效评论的功能;(4)分类自动呈现获取的评论信息的功能。
要求:后台数据要求具有一致性、完整性、安全性,前台应用程序系统要求功能完备、易于使用和界面友好。
二、完成后应交的作业(包括各种说明书、图纸等)
1. 毕业设计论文
2. 源程序
3. 英文原文及译文
三、完成日期及进度
2017年1月9日至2017年6月9日,共17周。
进度安排:
1. 1.09-1.15,分配任务,提出要求,查阅课题相关的文献资料;
2. 2.20-2.26,项目调研,课题设计准备;
3. 2.27-3.12,系统需求分析,确定研究内容、方法和步骤;
4. 3.13-4.09,撰写开题报告,按系统需求,完成系统的初步设计方案;
5. 4.10-5.07,系统详细设计并实现,进行中期检查;
6. 5.08-5.21,系统测试、改进,撰写毕业设计论文;
7. 5.22-6.09,整理相关设计文档,完善毕业设计论文,进行毕业设计答辩。
四、主要参考资料(包括书刊名称、出版年月等):
[1] 罗刚.自己动手写网络爬虫(修订版)[M]. 清华大学出版社,2016.8.
[2] 理查德•劳森(Richard Lawson) 著, 李斌 译. 用Python写网络爬虫 [M]. 人民邮电出版社,2016.8.
[3] 胡松涛. Python 网络爬虫实战[M]. 清华大学出版社. 2016.12.
[4] 米切尔 (Ryan Mitchell)著,陶俊杰, 陈小莉 译. Python网络数据采集[M]. 人民邮电出版社,2016.03.
[5] 梁春燕. Internet主题搜索引擎设计与研究[M]. 中国水利水电出版社,2012.03.
[6] Elliotte Rusty Harold(哈诺德 R.E.) 著, 李帅,荆涛 等 译. Java网络编程(第四版)[M]. 中国电力出版社,2014.09.
[7] 明日科技 著. Java从入门到精通(第4版 附光盘)[M].清华大学出版社, 2016,10.
[8] 魏勇, 胡丹露, 郝晨光 等. 基于分类关键词词频模型的地缘政治主题爬虫设计[J]. 计算机工程, 2016,42(2):45-50.
[9] 关卫国,骆永成. 基于概念背景图的主题爬虫设计与实现[J]. 计算机工程与设计, 2016,37(10):2679-2684.
[10] 王帅,周国民,王健. 基主题爬虫相关度算法研究综述[J]. 计算机与现代化, 2013,4:27-30.