首页 / 一种基于深度学习的旅游数据分析方法及系统

一种基于深度学习的旅游数据分析方法及系统实质审查 发明

技术领域

[0001] 本发明涉及数据分析领域,特别是一种基于深度学习的旅游数据分析方法及系统。

相关背景技术

[0002] 随着全球旅游业的蓬勃发展,旅游市场规模不断扩大,旅游活动的多样性和丰富性也日益增加。在此背景下,旅游相关的数据呈现出爆炸式增长的态势。数据涵盖了多个方面,从游客的基本信息,如年龄、性别、地域等,到游客详细的旅游行程信息,包括出发地、目的地、在各个景点的停留时间等;从游客对景点的评价信息,如对景点的满意度、改进建议等,到旅游过程中的消费信息,像交通、住宿、餐饮、购物等各方面的开销。传统的数据分析方法在面对这种大规模、高维度、多模态的旅游数据时,有明显的局限性。从分析效率方面,传统方法往往依赖于人工或者简单的统计工具。在处理海量数据时,需要耗费大量的人力和时间,对大量游客行程数据进行分析,需要人工逐一核对和统计,导致整个分析过程缓慢,无法满足快速决策的需求。

具体实施方式

[0065] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0066] 本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“所述”也可包括复数形式。应所述进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
[0067] 下面结合附图对本发明进行具体描述,如图1所示,一种基于深度学习的旅游数据分析方法,旅游数据分析方法包括以下步骤:
[0068] 步骤101、获取物联网设备中的初始旅游数据,对初始旅游数据进行数据预处理,得到标准旅游数据;
[0069] 具体的,本实施例中获取物联网设备中的初始旅游数据,初始旅游数据至少包括预订的酒店、旅游套餐、景点门票信息;从初始旅游数据提取游客基本信息、旅游行程信息和旅游消费信息;初始旅游数据还包括从旅游攻略网站收集游客发布的游记和攻略,获取游客对不同景点的评价信息以及游客在旅游过程中的详细行程安排和个人体验;初始旅游数据还包括与景点的票务管理系统建立接口,实时获取游客的购票时间、购票数量、门票类型信息;初始旅游数据还包括从票务系统中提取游客的入园时间、出园时间等数据,计算游客在景点内的停留时长。
[0070] 获取初始旅游数据,基于预设的规则进行数据筛选和删除,得到第一初始旅游数据;去除第一初始旅游数据中的重复记录,对于数值型数据采用均值填充法,对文本型数据利用基于GAN生成对抗网络的文本生成模型进行填充,得到第二初始旅游数据;对第二初始旅游数据中的数值型数据利用归一化处理,对于分类数据利用One‑Hot独热编码进行处理,得到第三初始旅游数据;将第三初始旅游数据中游客在社交媒体上发布的旅游体验文本和图片信息,根据文本中的时间戳、地点信息以及图片的EXI F信息进行对齐;利用深度学习中的多模态融合技术对某一景点的评价文本和相关图片,注意力机制会自动学习文本和图片中对景点特征描述的重要部分,将重要特征进行融合,得到标准旅游数据。
[0071] 步骤102、利用卷积神经网络与循环神经网络相结合的模型架构对标准旅游数据进行特征提取,得到特征旅游数据;
[0072] 具体的,本实施例中建立一个多层CNN架构,多层CNN架构包含3‑5个卷积层,在卷积层中使用不同大小的3x3卷积核提取不同尺度的图像特征,如边缘、纹理、形状;
[0073] 在卷积层之后添加平均池化层,包括采用2x2的最大池化窗口,将图片的尺寸缩小一半,同时保留最重要的特征信息;
[0074] 使用GRU门控循环单元结构的RNN处理游游客的移动轨迹数据,GRU学习游客在不同景点之间的移动模式;将CNN提取的图像特征和RNN处理的序列数据在输入层进行融合,将图像特征作为额外的输入信息,使模型利用空间和时间信息进行特征提取;根据数据特征对旅游分析的重要性,定义一个可学习的权重矩阵,通过将数据特征与注意力权重矩阵相乘,得到每个特征的注意力得分;根据注意力得分对原始数据特征进行加权处理,使模型自动聚焦于对旅游分析影响度高的数据特征,得到特征旅游数据。
[0075] 步骤103、通过融合多种深度学习算法构建旅游数据的分析模型对特征旅游数据进行分析,分析至少包括游客的旅游偏好分析、旅游高峰时段、景点热度随时间的变化规律、不同地区游客的消费模式分析,结合聚类算法对游客进行细分,得到旅游行为特征群体;
[0076] 具体的,本实施例中建立自编码器,利用自编码器对融合后的特征数据进行降维处理,自编码器由编码器和解码器组成,编码器将高维的特征数据压缩为低维的潜在表示,解码器再将潜在表示还原为近似原始数据;通过调整自编码器的参数,使还原后的误差最小,得到数据本质特征表示;基于GAN生成对抗网络建立分析模型,将自编码器提取的低维特征与特征旅游数据再次融合,输入分析模型中;利用分析模型进行数据扩充和模拟:GAN生成对抗网络至少包括由生成器和判别器,生成器负责生成假数据,判别器负责区分真假数据;分析至少包括游客的旅游偏好分析、旅游高峰时段、景点热度随时间的变化规律、不同地区游客的消费模式分析,结合聚类算法对游客进行细分,得到旅游行为特征群体。
[0077] 通过GWO灰狼算法优化DBSCAN聚类算法,得到GWO‑DBSCAN算法;根据游客的旅游行为特征、旅游消费特征和从社交媒体上提取的旅游偏好信息等多方面特征作为聚类依据;通过肘部法则定最佳的聚类数量,将旅游行为特征群体输入GWO‑DBSCAN算法中,得到不同的游客群体,游客群体至少包括消费文化探索型游客、经济型休闲度假型游客、家庭亲子游游客、年轻背包客。
[0078] 通过GWO灰狼算法优化DBSCAN聚类算法,得到GWO‑DBSCAN算法,还包括:设定GWO算法的最大迭代次数、种群规模和初始向量值,根据最大迭代次数、种群规模和初始向量值生成初始解集合;将初始解集合中的元素依次代入DBSCAN算法中,对原始用户数据集进行聚类,计算并存储每次聚类结果的s i l houette指标;对初始解集合与对应的s i l houette值按照升序排序,得到初始解集合中的最优的前三个解和最优的前三个s i l houette值;计算系数向量的参数,对初始解集合中的每个元素进行位置更新,并重新代入DBSCAN算法中对数据集进行聚类,计算s i l houette值;判断是否到达GWO算法的最大迭代次数,若满足则输出最大迭代次数、种群规模和初始向量值,将最大迭代次数、种群规模和初始向量值设为DBSCAN算法的初始参数,得到GWO‑DBSCAN算法。
[0079] 步骤104、将旅游行为特征群体通过AR虚拟增强现实展示,并根据用户需求进行实时动态调整。
[0080] 具体的,本实施例中
[0081] 增强现实(AR)展示:
[0082] 开发基于移动设备的AR应用程序:该应用程序可以在智能手机或者平板电脑上运行,利用设备的摄像头和传感器获取现实场景信息。
[0083] 数据可视化:将旅游数据分析结果与现实场景相结合进行可视化展示。例如,当游客在景区内打开AR应用程序时,通过摄像头看到的景区画面上会叠加显示景点热度信息(如用不同颜色的热点表示景点的热门程度)、游客流量信息(如在道路上显示人流量的多少)以及最佳游览路线(用箭头或者线条指示)等。
[0084] 交互功能:AR应用程序提供交互功能,游客可以点击屏幕上的景点热点获取更详细的信息,如景点介绍、游客评价等;也可以根据自己的需求调整显示的信息类型和透明度。
[0085] 交互式动态报告形式输出:
[0086] 报告生成:利用数据可视化工具(如Tab l eau、PowerBI等)生成动态报告。报告中包含各种图表(如柱状图、折线图、饼图等)和数据表格,用于展示游客的旅游偏好、景点热度随时间的变化规律、不同地区游客的消费模式等分析结果。
[0087] 交互设计:在报告中设置交互元素,如下拉菜单、筛选按钮、滑块等。用户可以通过交互元素选择不同的分析维度(如不同时间段、不同景点、不同游客群体等),实时更新报告中的数据和图表。例如,旅游管理部门可以通过下拉菜单选择不同的季节,查看该季节景区内游客的流量分布和消费情况;旅游企业可以通过筛选按钮选择特定的游客群体,分析游客的旅游需求和消费潜力。
[0088] 其有益效果在于,通过获取物联网设备中的初始旅游数据,对初始旅游数据进行数据预处理,得到标准旅游数据;利用卷积神经网络与循环神经网络相结合的模型架构对标准旅游数据进行特征提取,得到特征旅游数据;通过融合多种深度学习算法构建旅游数据的分析模型对特征旅游数据进行分析,分析至少包括游客的旅游偏好分析、旅游高峰时段、景点热度随时间的变化规律、不同地区游客的消费模式分析,结合聚类算法对游客进行细分,得到旅游行为特征群体;将旅游行为特征群体通过AR虚拟增强现实展示,并根据用户需求进行实时动态调整。可以综合多种数据源,特别是融合社交媒体和物联网设备数据,提供更全面的旅游数据视角。结合卷积神经网络、循环神经网络、注意力机制等多种先进技术,提高特征提取的准确性和效率。通过聚类算法对游客进行细分,为旅游企业提供更精准的市场定位和个性化服务的依据。利用增强现实和交互式动态报告,使分析结果更直观、更易于理解和使用。
[0089] 本实施例中,请参阅图2,本发明实施例中一种基于深度学习的旅游数据分析方法的第二个实施例,获取物联网设备中的初始旅游数据,对初始旅游数据进行数据预处理,得到标准旅游数据包括以下步骤:
[0090] 步骤201、获取初始旅游数据,基于预设的规则进行数据筛选和删除,得到第一初始旅游数据;
[0091] 步骤202、去除第一初始旅游数据中的重复记录,对于数值型数据采用均值填充法,对文本型数据利用基于GAN生成对抗网络的文本生成模型进行填充,得到第二初始旅游数据;
[0092] 步骤203、对第二初始旅游数据中的数值型数据利用归一化处理,对于分类数据利用One‑Hot独热编码进行处理,得到第三初始旅游数据;
[0093] 步骤204、将第三初始旅游数据中游客在社交媒体上发布的旅游体验文本和图片信息,根据文本中的时间戳、地点信息以及图片的EX I F信息进行对齐;
[0094] 步骤205、利用深度学习中的多模态融合技术对某一景点的评价文本和相关图片,注意力机制会自动学习文本和图片中对景点特征描述的重要部分,将重要特征进行融合,得到标准旅游数据。
[0095] 上面对本发明实施例提供的一种基于深度学习的旅游数据分析方法进行了描述,下面对本发明实施例的一种基于深度学习的旅游数据分析系统进行描述,请参阅图3,本发明实施例中旅游数据分析系统一个实施例包括:
[0096] 数据获取模块,用于获取物联网设备中的初始旅游数据,对所述初始旅游数据进行数据预处理,得到标准旅游数据;
[0097] 特征提取模块,用于利用卷积神经网络与循环神经网络相结合的模型架构对所述标准旅游数据进行特征提取,得到特征旅游数据;
[0098] 数据分析模块,用于通过融合多种深度学习算法构建旅游数据的分析模型对所述特征旅游数据进行分析,所述分析至少包括游客的旅游偏好分析、旅游高峰时段、景点热度随时间的变化规律、不同地区游客的消费模式分析,结合聚类算法对游客进行细分,得到旅游行为特征群体;
[0099] 数据展示模块,用于将所述旅游行为特征群体通过AR虚拟增强现实展示,并根据用户需求进行实时动态调整。
[0100] 以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应所述了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变和改进,变和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

当前第1页 第1页 第2页 第3页