Python基于用户偏好的娱乐项目推介系统的设计与实验(3)

1.2本课题的基本内容(重点,难点) 1.2.1本课题的基本内容 本课题的题目是基于用户偏好的娱乐项目推介系统的设计与实现,通过这个系统,能够对用户


1.2 本课题的基本内容(重点,难点)

1.2.1 本课题的基本内容

本课题的题目是基于用户偏好的娱乐项目推介系统的设计与实现,通过这个系统,能够对用户的搜索浏览进行分析,然后向用户提供属于每一个用户的偏好娱乐项目,提升用户的体验度,确保信息的合理分配。

例如在网易云音乐这个网站上做用户偏好的娱乐项目推介,第一步,是需要获取用户信息,通过网页或者API爬取想要得到的信息。第二步,将爬下来的信息导入到Excel表格中进行储存。第三步,创建数据库。第四步,编写算法。第五步,就是进行测试,来检验设计的合理性和算法的准确性,分别对可结果的准确性,召回率,F1值进行评价。

在网页上,爬数据,根据用户的评价,利用皮尔逊相关度评价算法生成2个推荐的音乐,爬虫的方法及操作,以及分析爬到的数据,并进行推荐是本课题研究的主要内容。

1.2.2 本课题的重点

本课题的重点是用户数据的爬取,爬取的信息量巨大,并且爬取的信息不单一,需要爬取不同种类的信息。

建立数据库,把信息放进去,并列表分析这些数据中有用的信息,将他们挑选出来,这里需要用到一些其他的技术。

建立合适的模型,适合这个操作。

此外,算法的设计并不单一,需要设计多种算法,在运行时,在多种算法中选择适用的算法进行操作。

在设计完这一系列的实验后,还需要对程序的合理性和准确性进行测试,测试需要的一定条件和环境。

1.2.3 本课题的难点

难点是模型的建立和算法的设计,因为课题和爬取内容之间的复杂性,需要采用多个算法,这是难点。以外,在校内课程中,只学习过MATLAB编程,虽然python也是热点的编译软件,但我是第一次接触,对于PYTHON知之甚少,所以要从从头开始学习关于Python的知识,开始入门,这是一个循序渐进的过程,需要花费一定的时间,才能开始关于本课题的编程。此外,关于一些算法的研究,也是难点,在算法的选择中存在着很多的可能,选用算法的方法,直接影响着未来做的推荐平台的推荐好坏,正确度等,其中牵扯到很多关于数学的知识,包括平方差,求和等。关于模型,是在算法之前,先要确定好模型,再去研究算法,所以每一步都是很关键的。

1.3 采取的手段

1.3.1 步骤

第一步是获取用户信息,这需要数据挖掘技术来抓取用户信息。 需要抓取的信息包括歌曲的标题,歌手,所属专辑以及其所属专辑的封面。

第二步,是获取对应用户网易云的信息。

第三步,将爬取的信息放入数据库中,进行设计。

第四步,编写算法,在众多的算法中,选择合适的算法,现如今,应用较为广泛,而更成熟的算法则基于协同过滤算法和组合推荐算法。

第五步,制作界面,设计登录表单,注册表单等,在考虑正确性的前提下,要做到美观。

第六步,测试运行。      

第二章 国内外发展

2.1发展情况

2.1.1 国内外发展趋势

近年来,不仅仅是一些娱乐网站,在一些购物网站,新闻网站,我们都能切身体会到用户偏好推介系统带来的便利,比如国内淘宝,经常会在主页上推荐经常访问物品的偏好推荐,可见用户偏好推介系统的应用相当的广泛,并且在未来具有很大的上升空间,必然会成为国内外热点的技术,以达到更加人性化,准确化的服务,找到每个用户的兴趣点,并准确推荐,用户能享受到高质量的服务,开发商也能从中获利,推动了经济和科技的发展,必然不断的创新进步。就我此次研究的音乐网站网易云来说,其实很多的音乐网站,不单单是网易云,国外的网站Pandora和last.fm是音乐推荐的最早期的代表,前者Pandora音乐网站是根据音乐的特征,即根据音乐的属性,其速度,节奏,音频等,将他们都量化成具体的数字,然后进行对比,将相似度高的都集中在一起,向用户推荐通过量化处理过的相似音乐。而后者是根据用户的下载量和收藏行为的分析,将若干喜欢同样歌曲的用户集中在一起,并将相似的用户所喜欢的歌曲推荐给需要的用户。相比较国内的音乐推荐,比较同期的国外网站,国内则发展较为缓慢,但现如今,经过科技的高速发展,很多很好的音乐网站的推介系统都发展的很好,比如虾米,酷狗,网易云等等。在虾米网上注册用户,并成为会员之后,会让注册的用户选择至少5位用户喜欢并感兴趣的歌手,把他们收藏起来,用用户所选择的这些歌手进行推测,用户对于哪些歌手感兴趣,对哪种歌手的曲风喜爱,用这些来确定后台将推荐给用户收听的歌曲。此外,用户还能够从大家的推荐中找出自己要听的歌曲,并且能够从与自己有同样喜好的用户好友中寻找出自己喜欢的音乐。