1.4 本文创新点 针对上述现有研究现状的不足,本文尝试着眼于社交媒体平台的用户客观行为数据,定量分析用户偏好,并基于用户及其偏好属性之间的耦
1.4 本文创新点
针对上述现有研究现状的不足,本文尝试着眼于社交媒体平台的用户客观行为数据,定量分析用户偏好,并基于用户及其偏好属性之间的耦合关联关系,构建基于耦合聚类的用户偏好识别模型,同时通过运用随机森林算法实现特征选择,选取特定的目标属性,构建基于分类的用户偏好识别模型,依托模型寻找到最优的阈值,实现偏好领域最优划分,进而解决用户偏好识别和用户社区划分的问题。
1.5 研究内容和研究思路
本文拟通过典型社交媒体的用户生成内容平台“百度贴吧”及“百度指数”的数据,基于商家的视角挖掘用户潜在需求和制定旅游策略。相关的工作主要有:
(1)基于一定的网络数据的获取及预处理策略,有效获取典型用户的检索、标注及评价等客观化行为的社交网络数据;
(2)基于偏好主题对相关的用户进行耦合聚类分析,以发现具有相似偏好的用户,进而可进行个性化推荐或协同推荐;
(3)基于用户对相关的偏好主题进行耦合聚类分析,以发现具有相互关联性的偏好主题,进而可优化企业的产品或服务功能;
(4)选取目标特征属性完成基于分类的聚类研究,寻找出偏好领域划分的最优阈值,进而实现偏好领域的最优划分;
(5)将主题公园的主题领域服务与游客用户的需求偏好进行关联匹配,辅助商家制定较为优秀的旅游策略。