首页 / 一种基于双边画像的旅游景点推荐方法及系统

一种基于双边画像的旅游景点推荐方法及系统实质审查 发明

技术领域

[0001] 本发明涉及大数据和计算机科学技术领域,尤其涉及一种基于双边画像的旅游景点推荐方法及系统。

相关背景技术

[0002] 在当前的旅游市场中,随着互联网技术的快速发展和普及,人们对旅游信息的获取方式发生了根本性变化。旅游者不再仅依赖传统的旅行社或旅游手册来规划他们的旅行,而是越来越多地转向在线平台和社交媒体来寻找旅游灵感和建议。在这种趋势下产生了了大量关于旅游景点的描述性文本和用户生成的内容,如评论和评分,这些都是了解景点特性和旅游者偏好的宝贵资源。
[0003] 然而,面对庞大而复杂的数据,如何有效地从中提取有用信息,并根据这些信息为旅游者提供个性化的景点推荐,成为了旅游推荐平台所面临的挑战。传统的推荐系统往往侧重于用户的历史行为和显式评分,而忽视了文本内容中蕴含的丰富信息。此外,这些系统通常不考虑景点本身的特性,从而限制了推荐的准确性和个性化程度,造成推荐信息类型趋向单一。

具体实施方式

[0052] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
[0053] 实施例1
[0054] 参照图1‑图2,为本发明的一个实施例,提供了一种基于双边画像的旅游景点推荐方法,包括,
[0055] S100:获取景点信息,依据景点信息挖掘景点特征标签,以得到景点画像;
[0056] 更进一步的,景点信息包括景点描述信息以及景点相关评论;
[0057] 依据景点信息挖掘景点特征标签,以得到景点画像包括:
[0058] 通过ETM主题挖掘模型对景点描述信息和景点相关评论进行主题挖掘;
[0059] 通过主题连贯性指标确定所挖掘的主题质量,并人工审核主题含义;
[0060] 确定主题特征词作为景点特征标签,得到景点画像。
[0061] 更进一步的,景点特征标签还包括通过主题特征词计算得到的对应景点特征标签的吸引力分数,表示为:
[0062]
[0063] 其中,si为某个景点,fi为某个景点特征标签,rk为景点的某个相关评论语句,R为评论语句的集合,lab_scosi,fi表示景点si在景点特征标签fi上的吸引力分数,revfi表示涉及景点特征标签fi的评论语句的集合,emo_scofi,rk表示景点相关评论rk所带有的情感分数。
[0064] S200:获取用户信息,依据用户信息建立用户兴趣标签和基本信息标签,以得到用户画像;
[0065] 更进一步的,用户信息包括:基本信息、出游历史、用户评论;
[0066] 用户兴趣标签包括:兴趣特征词及其对应的兴趣权重;
[0067] 兴趣权重通过用户前往的景点所包含的特征标签、用户评论中涉及到的主题以及分配给该主题的情感分数emoj计算得到,表示为:
[0068]
[0069] 其中,ui为某个用户,pi为某个兴趣标签,Wui,pi为经过本次更新后的权重,W′ui,pi为用户ui的标签pi本次计算前的权重,Tui,pi为用户ui的标签pi在上次计算时间到本次的时间间隔,S为常数,ΔWui,pi为用户ui的标签pi在本次交互的基本权重变化值,emopi为评论中对标签pi的情感分数,lab_scopi表示景点的特征标签pi的吸引力分数,rev_th表示用户评论涉及到的景点特征集合,[pi∈rev_th]的值当标签pi属于rev_th时为1,标签pi不属于rev_th时为0。
[0070] 具体的,上述基本信息标签包括用户的一些静态信息,比如性别、职业、婚姻状况。
[0071] 应说明的是,文本信息包含了景点详细的描述和用户行为记录、评论等丰富的语义内容,提取这些特征有助于刻画出景点的独特性和用户的个性化需求。通过获取景点画像与用户画像之间的文本特征,为后续能够更精确地找到与用户兴趣相匹配的景点,提升推荐的精准度提供基础;同时可以从多个维度来反映景点属性(如文化价值、景观特色、设施服务等)和用户兴趣(如历史偏好、户外活动喜好、美食偏好等),从而多维度展现用户与景点之间的潜在关联;并且由于用户和景点的文本信息通常随时间而变化,例如用户可能会增加或改变兴趣,景点也可能有新的活动或评价,通过不断更新文本特征,本发明方案能及时捕捉到这些变化,提供实时的个性化推荐。
[0072] 同时,对文本信息的深入挖掘也可借助NLP(自然语言处理)技术,例如情感分析、主题模型等,不仅限于表面的关键词提取,更能深入揣摩提取用户的真实意图和潜在需求,以及景点深层次的价值内涵。
[0073] S300:对相似用户进行聚类,所述聚类通过结合k簇心思想的金豺优化算法获取与目标用户相似的用户群体,获取目标用户群体的景点选择偏好集合;
[0074] 更进一步的,对相似的用户进行聚类,包括:
[0075] 计算用户相似度,用户相似度通过选取用户兴趣标签与基本信息标签结合作为用户相似度,表示为:
[0076]
[0077] 其中,S为基本信息标签集合,I为兴趣标签集合,xi和yi分别为用户X和Y的某个分量,和 为X和Y的样本均值,a和b为比例系数。
[0078] 应说明的是,用户相似度采用余弦相似度和皮尔逊相关系数组合构成,使用余弦相似度和皮尔逊相关系数两种不同的度量方式,可以充分利用两者的优势。余弦相似度适用于稀疏数据集,适合基本信息的处理;皮尔逊相关系数对于连续性变量和顺序性偏好表现出良好的敏感性,对于兴趣点的计算更适合。二者结合有助于弥补单一指标可能存在的局限性,提高推荐算法的稳健性。
[0079] 更进一步的,通过结合k簇心思想的金豺优化算法获取与目标用户相似的用户群体,得到目标用户群体的选择偏好,包括:
[0080] 采用切比雪夫映射选定多组初始用户聚类的中心,每组用户中心代表一个聚类方案,作为一个可行解;
[0081] 具体的,先选定一个初始值,根据公式计算映射序列,再将序列值用于计算初始种群的各个维度的值,计算切比雪夫映射序列的公式表示为:
[0082] xn+1=cos(kcos‑1xn) (1)
[0083]
[0084] 其中,k为映射参数, 为第i个初始聚类中心第j维的初始值, 和 分别为第i个初始聚类中心第j维的上界和下界,xid+j为根据式(1)计算第id+j个值,d为聚类中心的维度。
[0085] 对所有用户聚类中心组应用反向学习,生成新的用户聚类中心组加入可行解;
[0086] 具体的,使用反向学习计算反向个体的位置时,若新个体适应度更高,则替换原个体加入种群,计算公式如下:
[0087] Y*=α(Ymax+Ymin)‑Y
[0088] 其中,Y*为反向学习后的新个体,Ymax和Ymin分别为个体可以取到的上界和下界,α为[0,1]区间符合均匀分布的随机数。
[0089] 计算每个用户聚类中心组的适应度,将最高适应度的可行解作为雄性金豺,排序第二的可行解作为雌性金豺;
[0090] 具体的,计算每个个体适应度,表示为:
[0091]
[0092] 其中,k为某个类,K为所有类的集合,sim(X,Ck)表示用户X和类k的中心点Ck之间的相似度。
[0093] 对雌雄金豺应用柯西变异和高斯变异;
[0094] 具体的,使用柯西变异和高斯变异计算雄金豺个体新位置时,公式表示为:
[0095]
[0096] 其中,t为本次迭代次数,T为预先设置的迭代次数,Cauchy(0,1)为标准柯西分布,Gauss(0,1)为标准高斯分布。
[0097] 计算猎物的逃脱能量E,若|E|≥1,则执行金豺个体侵扰猎物,更新所有可行解,并跳转至对所有用户聚类中心组应用反向学习,生成新的用户聚类中心组加入可行解的步骤,继续执行后续步骤;
[0098] 若|E|<1,则执行金豺个体捕食猎物,更新所有可行解,若满足结束条件,输出适应度最高的可行解,否则重新计算每个可行解的适应度并执行后续步骤;
[0099] 具体的,计算逃脱能量时采用二次下降曲线,公式表示为:
[0100]
[0101] 其中,E为逃脱能量,t为本次迭代次数,T为预先设置的迭代次数。
[0102] S400:通过景点画像与目标用户画像的匹配程度,获取用户对于各景点的偏好值,所述偏好值作为所述景点选择偏好集合的排列依据。
[0103] 更进一步的,用户对于各景点的偏好值,表示为:
[0104] pref=∑pi∈I(wpi×label_scopi)
[0105] 其中,wpi为兴趣标签pi的权重值,label_scopi为景点特征标签中与用户兴趣标签pi对应的特征标签所拥有的吸引力分数。
[0106] 应说明的是,本发明通过结合k簇心思想的金豺优化算法获取与目标用户相似的用户群体能够避免经典的k‑means聚类算法容易陷入局部最优,效果受初始聚类中心的影响太大的问题;同时可以提高聚类的准确性,有效地避免初始中心点的误差,通过将相似的用户进行聚类,获取景点偏好合集,可以缩小计算推荐值时的匹配范围,同时也可以提高推荐精度,为用户提供符合满足用户个性化需求的景点推荐。
[0107] 上述为本实施例的一种基于双边画像的旅游景点推荐方法的示意性方案。需要说明的是,该基于双边画像的旅游景点推荐的系统的技术方案与上述的基于双边画像的旅游景点推荐方法的技术方案属于同一构思,本实施例中基于双边画像的旅游景点推荐系统的技术方案未详细描述的细节内容,均可以参见上述基于双边画像的旅游景点推荐方法的技术方案的描述。
[0108] 本实施例中基于双边画像的旅游景点推荐系统,包括:
[0109] 第一标签构建模块,用于获取景点信息,依据景点信息挖掘景点特征标签,以得到景点画像;
[0110] 第二标签构建模块,用于获取用户信息,依据用户信息建立用户兴趣标签和基本信息标签,以得到用户画像;
[0111] 聚类模块,用于对相似用户进行聚类,聚类通过结合k簇心思想的金豺优化算法获取与目标用户相似的用户群体,得到目标用户群体的选择偏好,并设为候选推荐;
[0112] 计算模块,用于通过目标用户画像与景点画像的匹配程度,获取用户对于各景点的偏好值,偏好值作为推荐列表的排列依据。
[0113] 本实施例还提供一种计算设备,适用于基于双边画像的旅游景点推荐的情况,包括:
[0114] 存储器和处理器;存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,实现如上述实施例提出的实现基于双边画像的旅游景点推荐方法。
[0115] 本实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提出的实现基于双边画像的旅游景点推荐方法。
[0116] 本实施例提出的存储介质与上述实施例提出的实现基于双边画像的旅游景点推荐方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
[0117] 通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(ReadOnly,Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
[0118] 实施例2
[0119] 参照表1,基于上一个实施例,本实施例提供了一种基于双边画像的旅游景点推荐方法的应用示例。
[0120] 通过与基于项目的协同过滤方法、基于用户‑项目的协同过滤方法进行比较,对同一批共1181名用户点击推荐列表中前5个项目的概率和用户进入景点详情页后的停留时间进行分析,具体见表1。
[0121] 表1:三种推荐方法点击率和停留时间表
[0122]  前5个项目点击率(%) 进入详情页后停留时间(min)
基于项目的协同过滤 44 1.7
基于用户‑项目的协同过滤 49 2.2
本方法 56 2.6
[0123] 从表1可以看出,对于基于项目的协同过滤算法,其前5个项目点击率为44%,用户在进入景点详情页的平均停留时间为1.7分钟。
[0124] 基于用户‑项目的协同过滤的前5个项目点击率稍高,为49%,与此同时,用户在景点详情页的平均停留时间为2.2分钟,表明用户可能因为更相关的推荐而花费更多时间浏览。
[0125] 本方法的前5个项目点击率最高,达到56%,相应地,用户在景点详情页的停留时间也最长,平均为2.6分钟。
[0126] 可以看出,随着推荐准确率的提升,用户在景点详情页的停留时间也趋于增加,这反映本发明用户对推荐内容的兴趣和满意度的提升。
[0127] 应说明的是,以上实施例仅用于说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

当前第1页 第1页 第2页 第3页