基于用户生成内容的主题公园智慧旅游策略研究(2)

致谢35 参考文献36 附录(代码)40 基于用户生成内容的主题公园智慧旅游策略研究 0 引言 由于主题公园商家与游客用户之间存在信息不对称的问题,主题


致谢 35

参考文献 36

附录(代码) 40

基于用户生成内容的主题公园智慧旅游策略研究

0 引言

由于主题公园商家与游客用户之间存在信息不对称的问题,主题公园商家无法准确获知游客用户的偏好需求,同时游客用户也无法精确了解主题公园商家提供的服务[1, 2]。本文挖掘社交媒体用户数据和分析主题公园数据,识别游客用户的需求偏好、划分游客用户社区以及界定主题公园的相关功能,进而减轻信息不对称的程度。

在社交媒体环境下,用户基于用户生成内容(User Generated Content, UGC)平台,如微博、博客、微信等,通过相关的检索、标注及评价等客观行为,主动参与对企业产品或服务功能的体验性评价,表达参与用户的客观需求和主观意愿[3-5]。相关的社交媒体客观行为数据能够较充分体现用户的认知偏好,因此,社交媒体用户行为数据能够精准识别用户偏好、优化服务功能、提高用户满意度、吸引更多的用户,进而提高产品或服务的市场占有率[6]。

1 相关研究现状

对主题公园用户生成内容的研究是实现个性化推荐以及商家精准营销的前提,同时也是近年学术研究热点问题之一。已有研究主要围绕用户偏好的识别问题和用户社区的划分问题展开,本文首先对这两个方面分别叙述其研究现状,随后评述当前研究的问题和不足,最后提出本文研究的创新点。

1.1 用户偏好识别

用户偏好识别是通过研究用户个人信息和行为数据来发现用户的个人偏好需求,实现为用户提供准确服务的功能,进而能够在刺激用户消费的同时提供较好的用户体验。

目前有很多学者在用不同的方法和角度研究用户偏好识别的问题。其中,以胡新明为代表的一部分学者将自然语言处理技术与数据科学技术相结合,设定相关领域的情感词表,通过对比预处理后的文本与情感词语实现对用户情感喜好的分析研究,进而识别用户偏好[7, 8]。以孔繁超为代表的一部分学者在考虑时间的因素前提下使用聚类等数据科学算法,实时跟踪用户偏好需求的变化,动态挖掘和识别用户需求偏好[9, 10]。以王洪伟为代表的一部分学者使用数据库存储的大规模用户信息数据和行为数据来合理有效的提取用户的短期需求和长期兴趣,进而实现识别用户偏好[11]。还有以张云中为代表的一部分学者在分布式分类系统中研究和识别用户偏好[12, 13]。

1.2 用户社区划分

用户社区划分是通过计算用户之间的相关系数或者分析其他表示用户关联关系的指标,将用户群体按照一定的标准划分成多个用户社区,并且在划分后的每个社区内部,用户之间的存在较强的相关性或者较高关联关系的指标。

当前学者们从多个方面研究用户社区划分。其中,以周小平为代表的一部分学者根据领域知识和行业经验,分析不同数据来源的数据特征,在原先基础上改进模型或者根据需要构建新的适用性模型,探寻更优的发现用户社区的方法,进而实现用户社区划分[14, 15]。以吴小兰为代表的一部分学者在特定场景下从多维分析的角度出发,界定用户之间的特征关系,实现用户社区的划分[16]。此外,以马慧芳为代表的一部分学者将标签和用户进行关联和绑定,凭借核心标签来表示用户角色和偏好特征,通过对核心标签的研究分析,发现用户社区,进而实现用户社区划分[17]。

1.3 研究评述

已有的研究理论为本文的研究提供了基础,然而也存在一些不足之处:(1)传统的用户偏好识别和用户社区划分研究主要基于传统环境或者网络环境,较少涉及目前比较流行的是社交新媒体平台,从而缺乏用户主动参加讨论和信息交流,不能完全体现用户实时的需求和真实的偏好。(2)传统的聚类方法多是对象的社区划分聚类,较少涉及对象属性的领域划分聚类,此外,基于属性的对象社区划分聚类以及基于对象的属性领域划分聚类,也即兼顾对象与属性之间的从属性关联关系,进行对象社区划分与属性领域划分的层次性耦合聚类的相关研究较少。传统的聚类方法容易忽略游客用户社区划分和偏好主题词领域划分之间的耦合关联关系以及耦合聚类所形成的层次关系,不能深入揭示用户社区和偏好主题词领域之间客观全面的相互影响关系。(3)在用户偏好识别特征选取过程中,目前研究主要运用基于聚类以及基于遗传算法等特征选择方法来实现属性维度的约减,这样可能会导致特征选择性能不高、精确度较低、鲁棒性较差以及运算量大的现象发生,直接导致选取的属性特征质量较差,最终影响实验结论的准确性和实验理论的实用性[18-20]。(4)目前有关于用户偏好识别和用户社区划分边值(即阈值)选取的研究较少,实际应用中一般根据相关领域知识,人为规定阈值数值,容易造成误差和缺乏科学合理的理论解释。