CN117909745A - 露营地识别模型的训练方法及露营地识别方法 - Google Patents

露营地识别模型的训练方法及露营地识别方法 Download PDF

Info

Publication number
CN117909745A
CN117909745A CN202410310714.6A CN202410310714A CN117909745A CN 117909745 A CN117909745 A CN 117909745A CN 202410310714 A CN202410310714 A CN 202410310714A CN 117909745 A CN117909745 A CN 117909745A
Authority
CN
China
Prior art keywords
camping
user
campsite
data
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410310714.6A
Other languages
English (en)
Inventor
李明宙
莫松谕
梁天鹏
朱轩平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Daye Intelligent Data Co ltd
Beijing Daye Smart Data Technology Service Co ltd
Original Assignee
Guangxi Daye Intelligent Data Co ltd
Beijing Daye Smart Data Technology Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Daye Intelligent Data Co ltd, Beijing Daye Smart Data Technology Service Co ltd filed Critical Guangxi Daye Intelligent Data Co ltd
Priority to CN202410310714.6A priority Critical patent/CN117909745A/zh
Publication of CN117909745A publication Critical patent/CN117909745A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书公开了一种露营地识别模型的训练方法及露营地识别方法,涉及数据处理技术领域。能获取在目标区域的用户的用户数据,并对用户数据进行特征提取,确定特征向量。还能基于聚类算法对特征向量进行聚类,确定实施露营行为的目标用户。再获取地理环境数据及目标用户的信令数据,并基于此,从人类常驻地以外的区域确定目标用户在预设夜间时段内停留时长大于预设时长的过夜点。再根据地理环境数据以及过夜点,确定多个露营地特征样本。最后,通过露营地特征样本对露营地识别模型进行训练。可见,本方法能实现对露营地识别模型的训练,使露营地识别模型仅需输入某个地点的信息,便可对该地点是否具备成为露营地的前景进行识别,提高了识别精度。

Description

露营地识别模型的训练方法及露营地识别方法
技术领域
本说明书涉及数据处理技术领域,尤其涉及一种露营地识别模型的训练方法及露营地识别方法。
背景技术
随着旅游业的发展,越来越多的人选择通过旅游来来度过闲暇时间。而对于部分人来说,在旅行过程中,相比于居住在酒店、民宿等地点,更倾向于在野外露营。但在野外露营往往需要一个安全、环境适宜的露营地。于是,如何选择露营地,就成了很多用户苦恼的问题。
在现有技术中,通常由服务提供商指导用户选择露营地,而服务提供商往往会通过对遥感图像、卫星图像等地图进行分析,来确定露营地。
但是,由于遥感图像、卫星图像的质量会受到天气状况、地形起伏等多种因素的影响,精度较差,基于此确定出的露营地较少,难以满足用户的需求。
发明内容
本说明书提供一种露营地识别模型的训练方法及露营地识别方法,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种露营地识别模型的训练方法,包括:
获取在预设的目标区域活动的多个用户的用户数据,以及地理环境数据;所述目标区域包括景区以及公开露营地;所述用户数据包括多个信令数据以及用户消费数据,所述信令数据包括时间戳、位置信息以及关联基站信息;
分别对所述多个用户数据进行特征提取,确定多个特征向量;
基于聚类算法,从所述多个特征向量中,确定与露营行为对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个目标用户;
获取所述多个目标用户分别对应的多个信令数据,并根据所述地理环境数据及所述多个信令数据,从人类常驻地以外的区域,确定所述多个目标用户在预设夜间时段内停留时长大于预设时长的过夜点;
根据所述地理环境数据以及所述多个过夜点,确定多个露营地特征样本;所述露营地特征样本包括自然环境信息和/或基础设施完善指标和/或交通可达性;
基于所述多个露营地特征样本,对露营地识别模型进行训练。
优选的,所述基于聚类算法,从所述多个特征向量中,确定与露营行为对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个目标用户,包括:
基于聚类算法,从所述多个特征向量中,确定与露营行为对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个待选用户;
根据所述多个待选用户的用户数据,将所述多个待选用户区分为自驾游用户以及徒步露营用户;
将所述自驾游用户和/或所述徒步露营用户确定为目标用户。
优选的,所述根据所述多个待选用户的用户数据,将所述多个待选用户区分为自驾游用户以及徒步露营用户,包括:
根据所述多个待选用户的信令数据,分别确定每个待选用户往返过夜点的平均速度以及多个瞬时速度;所述过夜点为所述待选用户在预设夜间时段内停留时长大于预设时长,且不属于人类常驻地的区域;
针对每个待选用户,当确定该待选用户的平均速度小于预设的平均阈值和/或确定该待选用户的n个瞬时速度小于预设的瞬时阈值时,确定该待选用户为徒步露营用户;n为预设的整数;
将所述待选用户中除了所述徒步露营用户之外的待选用户,均确定为自驾游用户。
优选的,所述基于所述多个露营地特征样本,对露营地识别模型进行训练,包括:
根据每个露营地特征样本对应的待选用户是否为自驾游用户,将所述多个露营地特征样本分为自驾露营样本以及徒步露营样本;
基于所述自驾露营样本以及所述徒步露营样本,分别对所述露营地识别模型进行训练,使得所述露营地识别模型在对露营地进行识别时,能够确定所述露营地对应的目标群体,所述目标群体为自驾游用户或徒步露营用户。
优选的,所述获取在预设的目标区域活动的多个用户的用户数据,包括:
根据预设的目标区域,确定能够为所述目标区域的用户提供通讯服务的至少一个通讯基站;
根据所述至少一个通讯基站,获取在所述目标区域活动的多个用户的信令数据;
通过设立在所述目标区域内的服务提供商,获取用户在所述服务提供商进行消费的消费数据;
将所述消费数据以及所述信令数据,确定为用户数据。
优选的,所述分别对所述多个用户数据进行特征提取,确定多个特征向量,包括:
对所述多个用户数据进行数据预处理;所述数据预处理包括数据清洗和/或时间序列转换和/或地理编码;
基于预设的特征提取算法,从完成预处理的所述多个用户数据中,分别提取多个用户数据对应的行为特征以及消费特征;所述行为特征包括停留时长和/或移动速度和/或信号强度变化数据和/或跨目标区域迁移频率;所述消费特征包括户外装备购买数据和/或野外食品购买数据和/或居住场所选择数据;
将多个用户对应的行为特征以及消费特征分别整合为多个特征向量。
优选的,所述基于聚类算法,从所述多个特征向量中,确定与背包客对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个目标用户,包括:
对所述多个特征向量进行聚类,确定多个簇;
根据每个簇对应的多个用户数据,从所述多个簇中确定与背包客对应的至少一个目标簇;
将所述至少一个目标簇中的多个特征向量,确定为与背包客对应的多个特征向量;
将所述多个特征向量分别对应的用户,确定为多个目标用户。
优选的,所述根据所述地理环境数据以及所述多个过夜点,确定多个露营地特征样本,包括:
根据所述地理环境数据,确定每个过夜点的多个关联特征;所述关联特征包括地形地貌和/或气候条件和/或自然资源丰富度和/或基础设施完善程度;
将所述多个过夜点以及多个过夜点的关联特征作为样本,输出到预设的回归算法模型中,并根据所述回归算法模型的输出,从所述多个关联特征中,确定至少一个露营地决策特征,以及每个露营地决策特征的影响权重;
分别根据所述多个过夜点的露营地决策特征,确定多个露营地特征样本。
优选的,所述基于所述多个露营地特征样本,对露营地识别模型进行训练,包括:
将所述多个露营地特征样本划分为训练集以及验证集;
基于所述训练集,对露营地识别模型进行训练;
通过所述验证集,对所述露营地识别模型的性能指标进行验证;所述性能指标包括泛化能力和/或预测准确率和/或误差指标;
当确定所述露营地识别模型的性能指标通过验证时,确定完成训练;
当确定所述露营地识别模型的性能指标未通过验证时,返回所述基于所述训练集,对露营地识别模型进行训练。
另一方面,本说明书提供了一种露营地识别方法,包括:
获取待识别露营地的露营地特征信息,所述露营地特征信息包括露营地位置和/或地形地貌和/或气候条件和/或自然资源丰富度和/或基础设施完善程度;
将所述露营地特征信息输入至所述露营地识别模型;所述露营地识别模型是基于上述一方面提供的露营地识别模型的训练方法训练完成的;
确定所述露营地识别模型输出的识别结果。
另一方面,本说明书提供了一种露营地识别模型的训练装置,包括:
第一获取单元,用于获取在预设的目标区域活动的多个用户的用户数据,以及地理环境数据;所述目标区域包括景区以及公开露营地;所述用户数据包括多个信令数据以及用户消费数据,所述信令数据包括时间戳、位置信息以及关联基站信息;
提取单元,用于分别对所述多个用户数据进行特征提取,确定多个特征向量;
筛选单元,用于基于聚类算法,从所述多个特征向量中,确定与背包客对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个目标用户;
第二获取单元,用于获取所述多个目标用户分别对应的多个信令数据,并根据所述地理环境数据及所述多个信令数据,从人类常驻地以外的区域,确定多个目标用户在预设夜间时段内停留时长大于预设时长的过夜点;
确定单元,用于根据所述地理环境数据以及所述多个过夜点,确定多个露营地特征样本;所述露营地特征样本包括自然环境信息和/或基础设施完善指标和/或交通可达性;
训练单元,用于基于所述多个露营地特征样本,对露营地识别模型进行训练。
另一方面,本说明书提供了一种露营地识别装置,包括:
获取单元,用于获取待识别露营地的露营地特征信息,所述露营地特征信息包括露营地位置和/或地形地貌和/或气候条件和/或自然资源丰富度和/或基础设施完善程度;
输入单元,用于将所述露营地特征信息输入至所述露营地识别模型;所述露营地识别模型是基于上述一方面提供的露营地识别模型的训练方法训练完成的;
识别单元,用于确定所述露营地识别模型输出的识别结果。
另一方面,本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方面提供的方法。
另一方面,本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一方面提供的方法。
另一方面,本说明书提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行上述任一方面提供的方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的露营地识别模型的训练方法中,能获取在预设的目标区域活动的多个用户的用户数据,并对该多个用户数据进行特征提取,确定多个特征向量。再基于聚类算法,从多个特征向量中确定与露营行为对应的多个特征向量,以及这部分特征向量对应的目标用户。还能获取该多个目标用户分别对应的多个信令数据,及地理环境数据,并基于此,从人类常驻地以外的区域确定该多个目标用户在预设夜间时段内停留时长大于预设时长的过夜点。再根据该地理环境数据以及该多个过夜点,确定多个露营地特征样本。最后,通过该多个露营地特征样本对露营地识别模型进行训练。
从上述方法中可以看出,本方法能够实现对露营地识别模型的训练,使得该露营地识别模型仅需输入某个地点的相关信息,便可对该地点成为露营地的前景进行识别,并输出结果。该识别过程不会受到天气、环境的因素的影响,提高了露营地识别的精准度。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书提供的一种露营地识别模型的训练方法的流程示意图;
图2为本说明书提供的一种露营地识别方法的流程示意图;
图3为本说明书提供的一种露营地识别模型的训练装置的结构示意图;
图4为本说明书提供的一种露营地识别装置的结构示意图;
图5为本说明书提供的一种电子设备的结构示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
本领域技术人员能够理解的是,用户在野外选择露营地时,往往要从安全性、水源地、防蚊防虫、防水、防雷击等多个方面进行考虑,缺乏一定经验的用户很难考虑周全。而现有技术中的露营地筛选方法,往往是通过卫星、无人机等高空侦测设备从空中拍摄图像,从而确定露营地,但这种方式精度低、实时性差,且容易受到天气因素的影响,难以为用户提供可靠的露营地信息。
基于此,本说明书提供了一种露营地识别模型的训练方法及露营地识别方法,从实施露营行为的目标用户出发,结合机器学习模型,对多个目标用户选择的露营地的特征进行总结,从而实现露营地的识别。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中一种露营地识别模型的训练方法的流程示意图,具体包括以下步骤:
S100:获取在预设的目标区域活动的多个用户的用户数据,以及地理环境数据;所述目标区域包括景区以及公开露营地;所述用户数据包括多个信令数据以及用户消费数据,所述信令数据包括时间戳、位置信息以及关联基站信息。
在本说明书的一个或多个实施例中,该露营地识别模型的训练方法,可由电子设备执行,该电子设备具体可以是计算机、服务器、手机等设备,该电子设备具体为何种设备,本说明书不做限制,可根据需要设置。
在对多个目标用户选择的露营地的特征进行总结,从而实现露营地的识别之前,需要优先筛选出多个目标用户。其中,目标用户为实施露营行为的用户。于是,在本说明书的一个优选的实施例中,该电子设备可获取多个用户的用户数据,并基于多个用户的用户数据,从多个用户中,确定实施露营行为的目标用户。
并且,本领域技术人员能够理解的是,在旅游景区、公开露营地活动的用户,往往更有可能实施露营行为,于是,在本说明书提供的一个优选的实施例中,该电子设备可从预设的目标区域活动的多个用户中,确定实施露营行为的目标用户。
优选的,该电子设备可获取多个用户的用户信息。
优选的,该电子设备可获取地理环境数据,该地理环境数据包括住宅区、室内消费场所、景区、公开露营地等区域的位置、范围边界等,还包括野外的自然环境信息、基础设施信息、交通信息等;自然环境信息包括地形地貌信息、海拔高度信息、气候条件信息、自然资源丰富度、水资源信息、自然植被信息等,基础设施信息包括建筑信息、公共卫生间信息、停车区域信息等。
优选的,该电子设备可获取在预设的目标区域活动的多个用户的用户信息。
优选的,该目标区域包括旅游景区、公开露营地等区域。
优选的,该用户信息包括用户消费数据以及多个信令数据等。
本领域技术人员能够理解的是,该电子设备能够通过多种方式获取该用户信息,例如,该电子设备可通过设置在该目标区域内或该目标区域周围的通讯基站,获取在该目标区域内活动的用户的信令数据。该电子设备也可基于设置在该目标区域内的多个服务提供商,获取用户在多个服务提供商消费的消费数据。或者,该电子设备可响应于操作该电子设备的用户的输入操作,接收多个用户的用户信息。本说明书不限制该电子设备具体如何获取用户信息。
优选的,该信令数据包括时间戳、位置信息、移动终端信号强度变化、切换基站的时间戳、用户的进入和离开电子围栏的时间记录以及关联基站信息等。该关联基站信息为基站标识、基站经纬度及新基站位置等信息。
本领域技术人员能够理解的是,信令数据通常是移动终端用户在发生通话、短信、上网及变换寻呼区等活动时在运营商网络中产生的数据。也就是说,信令数据在产生过程中,通常需要与通讯基站交互,于是,该通讯基站即为该信令数据关联的通讯基站。另外本领域技术人员能够理解的是,信令数据中的位置信息可能并不是准确的用户位置,而是通讯基站的位置。通常,通讯基站内的基站工参数据包含每个信令数据对应的用户的位置,于是,该电子设备在获取用户信息中的信令数据时,可结合该关联基站信息对应的通讯基站的基站工参数据,并采用基站工参数据中的位置对该信令数据中的位置信息进行校准。
优选的,该消费数据包括住宿预订记录(入住时间、退房时间、入住地点)、餐饮消费记录(消费时间、消费地点、消费金额)、购物消费记录(购买商品种类、购买时间、购买地点)等。
S102:分别对所述多个用户数据进行特征提取,确定多个特征向量。
在本说明书的一个或多个实施例中,该电子设备在获取多个用户数据后,便可基于多个用户数据,从多个用户中,筛选出实施露营行为的目标用户。
优选的,该电子设备可分别对每个用户的用户数据进行特征提取,确定每个用户对应的特征向量。
优选的,该电子设备在对用户数据进行特征提取前,可优先进行数据预处理。
优选的,数据预处理包括数据清洗、时间序列转换、地理位置编码等。
优选的,该电子设备可对多个用户进行数据清洗,具体来说,该电子设备可将部分缺失、重复的用户数据删除,或将明显错误的数据删除。本领域技术人员能够理解的是,对数据预处理的技术已经发展的较为成熟,本说明书在此不对数据预处理的过程详细阐述,也不限制数据清洗、时间序列转换、地理位置编码等数据预处理的操作具体如何执行。
优选的,该电子设备可对多个用户进行时间序列转换,具体来说,该电子设备可基于用户的信令数据,确定用户在不同的时间区间停留的位置和/或行进的路径。或者,该电子设备可基于用户的信令数据,确定用户的频率统计指标,该频率统计指标包括平均停留时间、活动频率等。
优选的,该电子设备可对多个用户进行地理位置编码,具体来说,该电子设备可基于用户的信令数据,将位置信息对应的经纬度坐标转化为便于处理的空间索引,或者计算地理距离相关的特征。
优选的,该特征向量包括行为特征以及消费特征。
优选的,该电子设备能够基于每个用户的用户数据,确定该用户在不同时间段内的移动距离、速度、停留时间、活动频率等信息,还能确定该用户的每日或每周活动模式。例如该用户在法定节假日或周末的日程安排、出行频率等。并将其归纳为行为特征,该行为特征能够反映该用户实施户外活动的活跃程度及规律。
优选的,该行为特征包括用户在该目标区域内的停留时长、用户的平均移动速度、用户移动终端的信号强度变化趋势、用户的跨区域迁移频率、平均每日移动距离、最常前往的地理区域类别、参与露营活动的次数等。
优选的,该电子设备能够基于每个用户的用户数据,确定该用户在户外装备店、露营地、自然景区附近的消费记录,并确定该用户对露营产品的购买频次、金额、以及消费地点、时间,其中,露营产品包括帐篷、睡袋、编写炊具等;还能确定该用户在导游服务、户外运动课程、露营咨询等方面的消费频次,并基于此确定该用户的露营经验水平。其中,该露营经验水平也可作为该用户的行为特征。
优选的,该消费特征包括露营住宿设施的选择频率、每月户外装备支出、户外装备购买数据、野外食品购买数据、居住场所选择数据等。
优选的,该电子设备确定各用户的行为特征以及消费特征后,可将各用户的行为特征与消费特征分别进行整合或合并,确定各用户的特征向量。
优选的,该电子设备在对各用户的行为特征与消费特征分别进行整合或合并,确定各用户的特征向量时,可针对每个特征向量,对该特征向量中的多个字段进行归一化处理。
优选的,该特征向量为高维度的特征向量,该特征向量的每个维度对应一个经过处理后的原始数据字段(用户移动终端的信号强度变化趋势、野外食品采购信息等),以便该电子设备将该特征向量输入到聚类算法中。
S104:基于聚类算法,从所述多个特征向量中,确定与露营行为对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个目标用户。
在本说明书的一个或多个实施例中,该电子设备在确定各用户的特征向量后,便可基于聚类算法,从多个用户中确定实施露营行为的目标用户。
优选的,该电子设备可将各用户的特征向量输入至预设的聚类算法中,通过该聚类算法基于每个特征向量包含的原始数据字段,对各特征向量进行聚类,确定多个簇。每个簇至少包括一个特征向量。
其中,该聚类算法可以是K平均(K means)聚类算法、数据库扫描(DBSCAN)聚类算法等聚类算法,本说明书在此不限制具体采用哪种聚类算法。其中,K means聚类算法能够通过设定聚类数量,自动从各特征向量中寻找具有相似的原始数据字段的特征向量。DBSCAN聚类算法是基于密度的空间聚类算法,能在不预设聚类数量的前提下,确定任意形状的特征向量集群,并基于特征向量在特征空间中的分布密度来区分潜在的目标用户,能够找出多次实施露营行为的目标用户。
优选的,该电子设备在完成对多个特征向量的聚类后,可针对聚类完成之后的每个簇,根据组成该簇的至少一个特征向量在预设的p个原始数据字段的平均值和/或中位数和/或众数和/或方差,确定组成该簇的特征向量对应的用户是否为目标用户。
其中,预设的p个原始数据字段包括参与露营活动的次数和/或露营住宿设施的选择频率和/或户外装备购买频次和/或野外食品采购信息。该电子设备在从该p个原始数据字段中,确定m个原始数据字段的平均值和/或中位数和/或众数和/或方差处于预设的目标用户区间内时,即可确定组成该簇的特征向量对应的用户为目标用户,并确定该簇为目标簇。m小于或等于p,且m、p均为预设的大于0的整数。
优选的,该电子设备在对各特征向量聚类之后,还可响应于用户的操作,从多个簇中,选定至少一个目标簇,并确定该至少一个目标簇簇包括的特征向量对应的用户为目标用户。
S106:获取所述多个目标用户分别对应的多个信令数据,并根据所述地理环境数据及所述多个信令数据,从人类常驻地以外的区域,确定所述多个目标用户在预设夜间时段内停留时长大于预设时长的过夜点。
在本说明书的一个或多个实施例中,该电子设备在确定出目标用户之后,便可对目标用户的行为进行分析,从而确定目标用户在实施露营行为时,选择的露营地的特征,从而确定露营地特征样本。
本领域技术人员能够理解的是,在训练露营地识别模型的过程中,需要大量的露营地样本,该露营地样本基于是目标用户在实施露营行为时选择的露营地确定的。但是,目标用户在该目标区域内活动时,选择的露营地通常是已经为人所知的露营地,或者是景区工作人员预先设置的露营地,这类露营地的数量往往较少,仅基于这部分露营地的特征,难以完成对该露营地识别模型的训练。
于是,在本说明书的一个或多个实施例中,该电子设备能够针对确定出的多个目标用户,再次获取该多个目标用户的信令数据。需要说明的是,该信令数据并不局限于某一个区域或某一个时间段,该电子设备能够获取多个目标用户在不同的地点活动时产生的信令数据。
优选的,该电子设备能够对已获取的信令数据进行处理,以便确定目标用户的活动轨迹,进一步确定目标用户在实施露营行为时,选择的露营地。
优选的,该电子设备可针对每个目标用户,根据该目标用户的多个信令数据,将该目标用户的多个信令数据按照从前到后的时间顺序排列,确定该目标用户的时间序列。需要说明的是,该时间序列中的每个时间戳,都对应着包含该时间戳的信令数据,该信令数据中还包括位置信息、关联基站信息等数据。
优选的,该电子设备可通过预设的自回归综合移动平均(AutoregressiveIntegrated Moving Average,ARIMA)模型、季节性ARIMA模型、状态空间模型(state spacemodel)等时间序列分析模型,对各目标用户的时间序列进行处理,确定各目标用户的每日活跃时段、夜间停留地点、夜间驻留时长、活动周期性、活动趋势性等具有时间规律的行为规律特征。本领域技术人员能够理解的是,相比于炎热的夏季和寒冷的冬季,用户更喜欢在气候适宜的春季和秋季实施露营行为,于是,该电子设备在通过时间序列分析模型对各目标用户的时间序列进行处理的过程中,还可结合季节性因素。
本领域技术人员能够理解的是,目标用户除了实施露营行为之外,往往也会居住在住宅、酒店等场所,于是,该电子设备在确定目标用户选择的露营地时,能够避开酒店、住宅区、消费场所等人类常驻地,从而精确的筛选出露营地。
优选的,该电子设备能够根据该地理环境数据,确定人类常驻地以外的区域,并基于目标用户的信令数据和/或时间序列和/或行为规律特征,从人类常驻地以外的区域中,确定目标用户在预设夜间时段内停留,且停留时长大于预设时长的过夜点。需要说明的是,该地理环境数据包括住宅区、室内消费场所、景区、公开露营地等区域的位置、范围边界等,还包括野外的自然环境信息、基础设施信息、交通信息等;自然环境信息包括地形地貌信息、海拔高度信息、气候条件信息、自然资源丰富度、水资源信息、自然植被信息等,基础设施信息包括建筑信息、公共卫生间信息、停车区域信息等。
优选的,该预设夜间时段为预先设置的时间区间,例如,19时至第二天上午7时、21时至第二天上午5时等,本说明书在此不限制该预设夜间时段具体的范围。
优选的,该预设时长为5小时、7小时、9小时等,本说明书在此不对该预设时长的值进行限制。
优选的,当该电子设备确定任一目标用户在该预设夜间时段内曾更换过多次停留地点时,可基于邻近分析(Near Analysis)法判定该目标用户是否在实施露营行为。具体来说,当该电子设备确定任一目标用户在该预设夜间时段内曾更换过多次停留地点时,该电子设备可统计该目标用户在y个持续的最短时长内移动的距离是否均小于预设的距离阈值,若是,则确定该目标用户正在实施露营行为,并确定该目标用户在y个持续的最短时长内停留的至少一个地点为过夜点。其中,y为预设值,例如,3、4、5、6等,最短时长也为预设值,例如1小时、2小时等,距离阈值也为预设值,例如200m、400m等。
优选的,该电子设备能够根据该地理环境数据,确定人类常驻地以外的区域,并基于目标用户的信令数据和/或时间序列和/或行为规律特征,从人类常驻地以外的区域中,确定目标用户在预设夜间时段内停留,且停留时长大于预设时长的地点后,还可结合已知的公开露营地对该地点是否为过夜点进行判断。
具体来说,该电子设备可统计已知露营地的特征,例如周边设施类型(旅馆、公共卫生间等)、环境特点(与水源地的距离、与城市中心的距离、海拔高度等),并判断该地点是否具有x个已知露营地的特征,若是,则可判断该地点为过夜点。其中,x为预设值,例如3、4、5等。
S108:根据所述地理环境数据以及所述多个过夜点,确定多个露营地特征样本;所述露营地特征样本包括自然环境信息和/或基础设施完善指标和/或交通可达性。
在本说明书的一个或多个实施例中,该电子设备在确定出目标用户的过夜点后,便可基于该过夜点,确定露营地特征样本。
优选的,该电子设备可根据该地理环境数据以及该多个过夜点,分别确定每个过夜点对应的露营地特征样本。其中,露营地特征样本包括自然环境信息、基础设施完善指标、交通可达性等。
优选的,该电子设备可根据多个过夜点分别对应的信令数据,将每个过夜点的位置信息、目标用户停留时间、目标用户停留位置的空间分布等数据,也作为该过夜点对应的露营地特征样本。
优选的,该电子设备在确定该露营地特征样本之前,还可对自然环境信息、基础设施完善指标、交通可达性、目标用户停留时间、目标用户停留位置的空间分布等数据进行分析,从而确定出多个关联特征的权重,并从多个关联特征中选出至少一个露营地决策特征。具体来说,该电子设备可采用以下步骤进行分析。
首先,该电子设备可对自然环境信息、基础设施完善指标、交通可达性等数据进行细化,确定多个关联特征。例如,该电子设备可确定该自然环境信息包括地形特征、地貌特征、气候条件特征、自然资源丰富度等关联特征。
其次,该电子设备可通过多元线性回归、泊松回归、广义加性模型(GeneralizedAdditive Model ,GAM)等,对各过夜点的自然环境信息进行分析,确定该露营地特征样本内自然环境信息中每个关联特征对过夜点选择的影响权重,并确定每个关联特征的理想范围。
或者,该电子设备可基于逻辑回归模型、决策树模型或随机森林算法,建立预测模型。并通过该预测模型对每个过夜点的自然环境信息、基础设施完善指标、交通可达性、目标用户停留时间、目标用户停留位置的空间分布等数据进行分析。最后,基于该预测模型输出的特征权重、特征重要性得分或SHAP值,分别确定该露营地特征样本内自然环境信息、基础设施完善指标、交通可达性中、目标用户停留时间、目标用户停留位置的空间分布等数据每个关联特征的影响权重。
例如,该电子设备可对目标用户实施露营行为的时间进行分析,确定“是否为节假日”是否为反映目标用户偏好的露营地决策特征。或者,该电子设备可对过夜点的位置进行分析,确定“邻近自然资源类型”是否为反映目标用户偏好的露营地决策特征,如临近湖边、临近山脚。或者,该电子设备可对过夜点周边的公共卫生间、停车区域、水源、野餐区域等基础设施建设进行分析,确定“设施完备度”是否为反映目标用户偏好的露营地决策特征。或者,该该电子设备可对过夜点周边的主要道路、公共交通站点进行分析,确定“从最近公路或公交站到露营地的直线距离”或“驾车/步行所需时间”或“与交通枢纽之间的距离”或“可选交通工具类型” 是否为反映目标用户偏好的露营地决策特征。或者,该电子设备可获取历史天气数据,并基于此确定出每个过夜点的年平均温度、降雨量等气候条件,并将其转化为“年均舒适天数”“非雨雪天数”等数值特征,并确定“年均舒适天数”“非雨雪天数”是否为反映目标用户偏好的露营地决策特征。
需要说明的是,该自然环境信息、基础设施完善指标以及交通可达性、目标用户停留时间、目标用户停留位置的空间分布等数据均包含了至少一个关联特征。例如,自然环境信息包括地形特征、地貌特征、气候条件特征、自然资源丰富度等关联特征,基础设施完善指标包括建筑信息、公共卫生间信息、停车区域信息等关联特征。交通可达性包括与交通枢纽之间的距离、可选交通工具类型等关联特征。
S110:基于所述多个露营地特征样本,对露营地识别模型进行训练。
优选的,该电子设备在确定出多个露营地特征样本后,便可通过多个露营地特征样本,对露营地识别模型进行训练。
优选的,该电子设备在对该露营地识别模型进行训练之前,可优先对露营地特征样本进行数据预处理。具体来说,该电子设备可对完成分析的数据进行整理,即,确定每个关联特征对应的影响权重。
优选的,该电子设备可基于各关联特征对应的影响权重,从多个关联特征中确定至少一个影响权重最大的露营地决策特征,并基于该至少一个露营地决策特征,构建露营地特征样本。
优选的,该电子设备可基于深度学习网络,将多个露营地特征样本划分为训练集以及验证集,并在训练该露营地识别模型的过程中,采用交叉验证的方式,确保该露营地识别模型的准确性、客观性。
优选的,该电子设备可将多个露营地特征样本划分为训练集、验证集以及测试集。
优选的,该电子设备可基于训练集数据训练该露营地识别模型,并通过调整模型参数优化性能。例如,该电子设备可调整树的数量、节点分裂规则、核函数类型、学习率、隐藏层结构等参数。
优选的,该电子设备可通过验证集评估该露营地识别模型在新样本上的预测准确率、泛化能力、误差指标,计算相应的性能指标。
优选的,当该电子设备确定该露营地识别模型的性能指标通过验证时,确定完成训练。
优选的,当该电子设备确定该露营地识别模型的性能指标未通过验证时,重新基于该训练集,对露营地识别模型进行训练。
优选的,该电子设备可根据该露营地识别模型对该验证集的识别结果,进一步调整该露营地识别模型的参数,直至该露营地识别模型的预测准确率和/或泛化能力和/或误差指标均达到预设的预测标准。
优选的,该露营地识别模型的输入为某个地点的关联特征,包括自然环境信息和/或基础设施完善指标和/或交通可达性和/或用户停留时间和/或用户停留位置的空间分布等。该露营地识别模型的输出为该地点的露营地前景得分/概率值以及决策依据,露营地前景得分或概率值越高,表示该地点作为优质露营地的潜力越大。决策依据为该地点的各关联特征中,哪些关联特征符合优质露营地的标准,哪些关联特征与理想露营地存在差距,从而对用户提供详实的决策支持,以便用户基于该决策依据,对该地点进行规划和管理。
根据本说明书提供的露营地识别模型的训练方法,能获取在预设的目标区域活动的多个用户的用户数据,并对该多个用户数据进行特征提取,确定多个特征向量。再基于聚类算法,从多个特征向量中确定与露营行为对应的多个特征向量,以及这部分特征向量对应的目标用户。还能获取该多个目标用户分别对应的多个信令数据,及地理环境数据,并基于此,从人类常驻地以外的区域确定该多个目标用户在预设夜间时段内停留时长大于预设时长的过夜点。再根据该地理环境数据以及该多个过夜点,确定多个露营地特征样本。最后,通过该多个露营地特征样本对露营地识别模型进行训练。
可见,该方法能够实现对露营地识别模型的训练,使得该露营地识别模型仅需输入某个地点的相关信息,便可对该地点是否具备成为露营地的可能进行识别,并输出结果。该识别过程不会受到天气、环境的因素的影响,提高了露营地识别的精准度。
本领域技术人员能够理解的是,实施露营行为的用户通常分为自驾游用户和徒步旅行用户,而这两部分用户对于露营地的要求是存在区别的。例如,自驾游用户往往对于公共卫生间、野餐区域等基础设施的需求较低,但对于水源、停车区域、交通可达性等要求较高。
于是,在本说明书的一个或多个实施例中,该电子设备可区分自驾游用户和徒步旅行用户。
优选的,该电子设备在确定目标用户的过程中,可优先将通过聚类算法确定出的多个特征向量对应的用户,确定为多个待选用户。再根据该多个待选用户的用户数据,将该多个待选用户区分为自驾游用户以及徒步露营用户。最后,再将该自驾游用户和/或该徒步露营用户,均确定为目标用户。
本领域技术人员能够理解的是,自驾游用户在实施露营行为时,往往会将车辆驾驶至露营地,也就是说,自驾游用户在往返露营地的过程中,往往会一直保持较快的速度。而徒步露营用户在前往露营地时,往往会徒步行走一段路程。于是,该电子设备在区分自驾游用户与徒步露营用户时,可基于此进行区分。
优选的,该电子设备可根据该多个待选用户的信令数据,分别确定每个待选用户往返过夜点的平均速度以及多个瞬时速度。
其中,由于该瞬时速度是基于信令数据确定出的,而同一个用户的两个信令数据之间可能存在几秒至几分钟的间隔,因此,该瞬时速度并不是指该待选用户在某一秒的速度,而是基于该待选用户的连续两个信令数据,确定出的该待选用户的速度。
本领域技术人员能够理解的是,由于徒步露营用户通常在即将到达露营地时,开始徒步前进,于是,该电子设备在确定该瞬时速度时,可优先基于该待选用户在与露营地距离较近的位置产生的信令数据,确定瞬时速度。例如,该电子设备可优先基于该待选用户在距离露营地1公里范围内的位置产生的信令数据,确定瞬时速度。
优选的,该电子设备可针对每个待选用户,当确定该待选用户的平均速度小于预设的平均阈值时,确定该待选用户为徒步露营用户。
优选的,该电子设备可针对每个待选用户,当确定该待选用户的n个瞬时速度均小于预设的瞬时阈值时,确定该待选用户为徒步露营用户,n为预设的整数。
优选的,该电子设备可针对每个待选用户,当确定该待选用户小于该瞬时阈值的瞬时速度与所有瞬时速度的比例大于预设的比例阈值时,确定该待选用户为徒步露营用户。
优选的,该电子设备可将该待选用户中除了该徒步露营用户之外的待选用户,均确定为自驾游用户。
优选的,在将该目标用户区分为自驾游用户与徒步露营用户之后,该电子设备在执行步骤S106、步骤S108以及步骤S110时,均可对自驾游用户与徒步露营用户进行区分。也就是说,该电子设备在确定露营地特征样本时,可根据每个露营地特征样本对应的待选用户是否为自驾游用户,将该多个露营地特征样本分为自驾露营样本以及徒步露营样本。在训练该露营地识别模型时,可基于该自驾露营样本以及该徒步露营样本,分别对该露营地识别模型进行训练,使得该露营地识别模型在对露营地进行识别时,能够确定该露营地对应的目标群体,该目标群体为自驾游用户或徒步露营用户。
优选的,该电子设备在执行步骤S104时,在对多个特征向量进行聚类之前,该电子设备可根据多个特征向量分别对应的用户数据,从该多个特征向量中,确定多个背包客对应的特征向量,并将该特征向量确定为目标向量。再对该多个特征向量进行聚类,确定多个簇。并将目标向量的数量大于预设的数量阈值的簇,确定为背包客对应的目标簇,且将该目标簇中的多个特征向量,确定为与背包客对应的多个特征向量。最后,将该多个特征向量分别对应的用户,确定为多个目标用户。
优选的,该电子设备在执行步骤S100时,可根据目标区域内旅游景区、公开露营地的边界,以及移动通信运营商提供的基站分布图或相关信息,将上述区域与各个基站的位置关联起来,构建基于基站信号覆盖范围的电子围栏区域。该电子围栏不仅限于该旅游景区和公开露营地的范围,还可能覆盖到其辐射区域以及潜在的新开发区域。该电子设备在采集用户信息时,在该电子围栏内采集。
优选的,该电子设备在建立好电子围栏后,可实时或按预设时间间隔从移动通信网络中采集在该电子围栏内活动的用户的信令数据以及消费数据。
优选的,该电子设备在获取旅游景区、公开露营地的信息时,可通过权威地理信息系统或公开数据源获取已知旅游景区和公开露营地的地理环境数据(Point of Interest,POI)。该地理环境数据包括经纬度坐标、名称、类别、范围边界等属性。
以上为本说明书的一个或多个实施例提供的露营地识别模型的训练方法,基于同样的思路,本说明书还提供了一种露营地识别方法,如图2所示。
图2为本说明书中一种露营地识别方法的流程示意图,具体包括以下步骤:
S200:获取待识别露营地的露营地特征信息,所述露营地特征信息包括露营地位置和/或地形地貌和/或气候条件和/或自然资源丰富度和/或基础设施完善程度。
在本说明书的一个或多个实施例中,该露营地识别方法,可由电子设备执行,该电子设备具体可以是计算机、服务器、手机等设备,该电子设备具体为何种设备,本说明书不做限制,可根据需要设置。
需要说明的是,该露营地识别方法利用到上述任一实施例提供的露营地识别模型的训练方法所训练完成的露营地识别模型。
优选的,该电子设备可获取待识别露营地的露营地特征信息,该露营地特征信息包括露营地位置和/或地形地貌和/或气候条件和/或自然资源丰富度和/或基础设施完善程度和/或邻近自然资源类型和/或可选交通工具类型和/或年均舒适天数等。
S202:将所述露营地特征信息输入至所述露营地识别模型。
优选的,该电子设备可将该露营地特征信息输入至该露营地识别模型中。
优选的,该露营地识别模型是基于上述任意一个实施例提供的露营地识别模型的训练方法训练完成的。
S204:确定所述露营地识别模型输出的识别结果。
优选的,该电子设备可确定该露营地识别模型输出的识别结果,完成对该待识别露营地的识别。
优选的,该露营地识别模型的输出为该地点的露营地前景得分/概率值以及决策依据,露营地前景得分或概率值越高,表示该地点作为优质露营地的潜力越大。决策依据为该地点的各关联特征中,哪些关联特征符合优质露营地的标准,哪些关联特征与理想露营地存在差距,从而对用户提供详实的决策支持,以便用户基于该决策依据,对该地点进行规划和管理。
优选的,该露营地识别结果还可包括露营地类型,该露营地类型分为自驾游露营地以及徒步旅行露营地,自驾游露营地适合驾驶车辆的用户实施露营行为,徒步旅行露营地适合徒步旅行的用户实施露营行为。
需要说明的是,本说明书中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
以上为本说明书的一个或多个实施例提供的露营地识别模型的训练方法,基于同样的思路,本说明书还提供了相应的露营地识别模型的训练装置,如图3所示。
第一获取单元300,用于获取在预设的目标区域活动的多个用户的用户数据,以及地理环境数据;所述目标区域包括景区以及公开露营地;所述用户数据包括多个信令数据以及用户消费数据,所述信令数据包括时间戳、位置信息以及关联基站信息。
提取单元302,用于分别对所述多个用户数据进行特征提取,确定多个特征向量。
筛选单元304,用于基于聚类算法,从所述多个特征向量中,确定与露营行为对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个目标用户。
第二获取单元306,用于获取所述多个目标用户分别对应的多个信令数据,并根据所述地理环境数据及所述多个信令数据,从人类常驻地以外的区域,确定所述多个目标用户在预设夜间时段内停留时长大于预设时长的过夜点。
确定单元308,用于根据所述地理环境数据以及所述多个过夜点,确定多个露营地特征样本;所述露营地特征样本包括自然环境信息和/或基础设施完善指标和/或交通可达性。
训练单元310,用于基于所述多个露营地特征样本,对露营地识别模型进行训练。
以上为本说明书的一个或多个实施例提供的露营地识别方法,基于同样的思路,本说明书还提供了相应的露营地识别装置,如图4所示。
获取单元400,用于获取待识别露营地的露营地特征信息,所述露营地特征信息包括露营地位置和/或地形地貌和/或气候条件和/或自然资源丰富度和/或基础设施完善程度。
输入单元402,用于将所述露营地特征信息输入至所述露营地识别模型。
识别单元404,用于确定所述露营地识别模型输出的识别结果。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的露营地识别模型的训练方法和/或上述图2提供的露营地识别方法。
本说明书还提供了一种计算机程序,该计算机程序在被电子设备执行时,可实现上述图1提供的露营地识别模型的训练方法和/或上述图2提供的露营地识别方法。
本说明书还提供了图5所示的电子设备的结构示意图。如图5所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的露营地识别模型的训练方法以及上述图2所述的露营地识别方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device, PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (15)

1.一种露营地识别模型的训练方法,其特征在于,包括:
获取在预设的目标区域活动的多个用户的用户数据,以及地理环境数据;所述目标区域包括景区以及公开露营地;所述用户数据包括多个信令数据以及用户消费数据,所述信令数据包括时间戳、位置信息以及关联基站信息;
分别对所述多个用户数据进行特征提取,确定多个特征向量;
基于聚类算法,从所述多个特征向量中,确定与露营行为对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个目标用户;
获取所述多个目标用户分别对应的多个信令数据,并根据所述地理环境数据及所述多个信令数据,从人类常驻地以外的区域,确定所述多个目标用户在预设夜间时段内停留时长大于预设时长的过夜点;
根据所述地理环境数据以及所述多个过夜点,确定多个露营地特征样本;所述露营地特征样本包括自然环境信息和/或基础设施完善指标和/或交通可达性;
基于所述多个露营地特征样本,对露营地识别模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述基于聚类算法,从所述多个特征向量中,确定与露营行为对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个目标用户,包括:
基于聚类算法,从所述多个特征向量中,确定与露营行为对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个待选用户;
根据所述多个待选用户的用户数据,将所述多个待选用户区分为自驾游用户以及徒步露营用户;
将所述自驾游用户和/或所述徒步露营用户确定为目标用户。
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个待选用户的用户数据,将所述多个待选用户区分为自驾游用户以及徒步露营用户,包括:
根据所述多个待选用户的信令数据,分别确定每个待选用户往返过夜点的平均速度以及多个瞬时速度;所述过夜点为所述待选用户在预设夜间时段内停留时长大于预设时长,且不属于人类常驻地的区域;
针对每个待选用户,当确定该待选用户的平均速度小于预设的平均阈值和/或确定该待选用户的n个瞬时速度小于预设的瞬时阈值时,确定该待选用户为徒步露营用户;n为预设的整数;
将所述待选用户中除了所述徒步露营用户之外的待选用户,均确定为自驾游用户。
4.根据权利要求2所述的方法,其特征在于,所述基于所述多个露营地特征样本,对露营地识别模型进行训练,包括:
根据每个露营地特征样本对应的待选用户是否为自驾游用户,将所述多个露营地特征样本分为自驾露营样本以及徒步露营样本;
基于所述自驾露营样本以及所述徒步露营样本,分别对所述露营地识别模型进行训练,使得所述露营地识别模型在对露营地进行识别时,能够确定所述露营地对应的目标群体,所述目标群体为自驾游用户或徒步露营用户。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述获取在预设的目标区域活动的多个用户的用户数据,包括:
根据预设的目标区域,确定能够为所述目标区域的用户提供通讯服务的至少一个通讯基站;
根据所述至少一个通讯基站,获取在所述目标区域活动的多个用户的信令数据;
通过设立在所述目标区域内的服务提供商,获取用户在所述服务提供商进行消费的消费数据;
将所述消费数据以及所述信令数据,确定为用户数据。
6.根据权利要求1-4任意一项所述的方法,其特征在于,所述分别对所述多个用户数据进行特征提取,确定多个特征向量,包括:
对所述多个用户数据进行数据预处理;所述数据预处理包括数据清洗和/或时间序列转换和/或地理编码;
基于预设的特征提取算法,从完成预处理的所述多个用户数据中,分别提取多个用户数据对应的行为特征以及消费特征;所述行为特征包括停留时长和/或移动速度和/或信号强度变化数据和/或跨目标区域迁移频率;所述消费特征包括户外装备购买数据和/或野外食品购买数据和/或居住场所选择数据;
将多个用户对应的行为特征以及消费特征分别整合为多个特征向量。
7.根据权利要求1-4任意一项所述的方法,其特征在于,所述基于聚类算法,从所述多个特征向量中,确定与背包客对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个目标用户,包括:
对所述多个特征向量进行聚类,确定多个簇;
根据每个簇对应的多个用户数据,从所述多个簇中确定与背包客对应的至少一个目标簇;
将所述至少一个目标簇中的多个特征向量,确定为与背包客对应的多个特征向量;
将所述多个特征向量分别对应的用户,确定为多个目标用户。
8.根据权利要求1-4任意一项所述的方法,其特征在于,所述根据所述地理环境数据以及所述多个过夜点,确定多个露营地特征样本,包括:
根据所述地理环境数据,确定每个过夜点的多个关联特征;所述关联特征包括地形地貌和/或气候条件和/或自然资源丰富度和/或基础设施完善程度;
将所述多个过夜点以及多个过夜点的关联特征作为样本,输出到预设的回归算法模型中,并根据所述回归算法模型的输出,从所述多个关联特征中,确定至少一个露营地决策特征,以及每个露营地决策特征的影响权重;
分别根据所述多个过夜点的露营地决策特征,确定多个露营地特征样本。
9.根据权利要求1-4任意一项所述的方法,其特征在于,所述基于所述多个露营地特征样本,对露营地识别模型进行训练,包括:
将所述多个露营地特征样本划分为训练集以及验证集;
基于所述训练集,对露营地识别模型进行训练;
通过所述验证集,对所述露营地识别模型的性能指标进行验证;所述性能指标包括泛化能力和/或预测准确率和/或误差指标;
当确定所述露营地识别模型的性能指标通过验证时,确定完成训练;
当确定所述露营地识别模型的性能指标未通过验证时,返回所述基于所述训练集,对露营地识别模型进行训练。
10.一种露营地识别方法,其特征在于,包括:
获取待识别露营地的露营地特征信息,所述露营地特征信息包括露营地位置和/或地形地貌和/或气候条件和/或自然资源丰富度和/或基础设施完善程度;
将所述露营地特征信息输入至所述露营地识别模型;所述露营地识别模型是基于权利要求1-9任意一项所述的露营地识别模型的训练方法训练完成的;
确定所述露营地识别模型输出的识别结果。
11.一种露营地识别模型的训练装置,其特征在于,包括:
第一获取单元,用于获取在预设的目标区域活动的多个用户的用户数据,以及地理环境数据;所述目标区域包括景区以及公开露营地;所述用户数据包括多个信令数据以及用户消费数据,所述信令数据包括时间戳、位置信息以及关联基站信息;
提取单元,用于分别对所述多个用户数据进行特征提取,确定多个特征向量;
筛选单元,用于基于聚类算法,从所述多个特征向量中,确定与背包客对应的多个特征向量,并将所述多个特征向量分别对应的用户,确定为多个目标用户;
第二获取单元,用于获取所述多个目标用户分别对应的多个信令数据,并根据所述地理环境数据及所述多个信令数据,从人类常驻地以外的区域,确定多个目标用户在预设夜间时段内停留时长大于预设时长的过夜点;
确定单元,用于根据所述地理环境数据以及所述多个过夜点,确定多个露营地特征样本;所述露营地特征样本包括自然环境信息和/或基础设施完善指标和/或交通可达性;
训练单元,用于基于所述多个露营地特征样本,对露营地识别模型进行训练。
12.一种露营地识别装置,其特征在于,包括:
获取单元,用于获取待识别露营地的露营地特征信息,所述露营地特征信息包括露营地位置和/或地形地貌和/或气候条件和/或自然资源丰富度和/或基础设施完善程度;
输入单元,用于将所述露营地特征信息输入至所述露营地识别模型;所述露营地识别模型是基于权利要求1-9任意一项所述的露营地识别模型的训练方法训练完成的;
识别单元,用于确定所述露营地识别模型输出的识别结果。
13.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~10任一项所述的方法。
14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~10任一项所述的方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-10任意一项所述的方法。
CN202410310714.6A 2024-03-19 2024-03-19 露营地识别模型的训练方法及露营地识别方法 Pending CN117909745A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410310714.6A CN117909745A (zh) 2024-03-19 2024-03-19 露营地识别模型的训练方法及露营地识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410310714.6A CN117909745A (zh) 2024-03-19 2024-03-19 露营地识别模型的训练方法及露营地识别方法

Publications (1)

Publication Number Publication Date
CN117909745A true CN117909745A (zh) 2024-04-19

Family

ID=90689267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410310714.6A Pending CN117909745A (zh) 2024-03-19 2024-03-19 露营地识别模型的训练方法及露营地识别方法

Country Status (1)

Country Link
CN (1) CN117909745A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101404709B1 (ko) * 2014-01-06 2014-06-09 주식회사 엑스마크 캠핑장 예약 서비스 제공 방법
WO2021135105A1 (zh) * 2020-01-02 2021-07-08 平安科技(深圳)有限公司 基于大数据的对象识别方法、装置、设备及存储介质
KR20210090104A (ko) * 2020-01-08 2021-07-19 주식회사 캠버 캠핑카 예약 정보를 활용한 캠핑장 맞춤 제공 방법 및 시스템
DE102023004848A1 (de) * 2023-11-25 2024-01-18 Mercedes-Benz Group AG Verfahren zur Empfehlung von Campingplätzen

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101404709B1 (ko) * 2014-01-06 2014-06-09 주식회사 엑스마크 캠핑장 예약 서비스 제공 방법
WO2021135105A1 (zh) * 2020-01-02 2021-07-08 平安科技(深圳)有限公司 基于大数据的对象识别方法、装置、设备及存储介质
KR20210090104A (ko) * 2020-01-08 2021-07-19 주식회사 캠버 캠핑카 예약 정보를 활용한 캠핑장 맞춤 제공 방법 및 시스템
DE102023004848A1 (de) * 2023-11-25 2024-01-18 Mercedes-Benz Group AG Verfahren zur Empfehlung von Campingplätzen

Similar Documents

Publication Publication Date Title
US11156470B2 (en) Methods and systems for providing information for an on-demand service
KR101399267B1 (ko) 모바일 디바이스에서의 애플리케이션 추천 장치 및 방법
RU2406158C2 (ru) Способы предсказания пунктов назначения из частичных траекторий, применяющие способы моделирования открытого и замкнутого мира
CN104537027B (zh) 信息推荐方法及装置
Poonawala et al. Singapore in motion: Insights on public transport service level through farecard and mobile data analytics
US7181345B2 (en) Location-based weather nowcast system and method
Kounadi et al. Population at risk: Using areal interpolation and Twitter messages to create population models for burglaries and robberies
Furletti et al. Identifying users profiles from mobile calls habits
KR101801335B1 (ko) 기상 및 기후 요소를 고려한 관광매력도 제공 장치 및 제공 방법
CN106570722A (zh) 一种智能推荐系统及智能推荐方法
CN102047249A (zh) 用于聚合和呈现与地理位置相关联的数据的方法和设备
Marakkalage et al. Understanding the lifestyle of older population: Mobile crowdsensing approach
JP2013093015A (ja) 情報推薦方法、装置及びプログラム
Cao et al. Understanding metropolitan crowd mobility via mobile cellular accessing data
Talpur et al. A study of tourist sequential activity pattern through location based social network (LBSN)
CN112923939A (zh) 用于导航的方法、装置、设备和介质
CN117909745A (zh) 露营地识别模型的训练方法及露营地识别方法
Nishigaki et al. Estimating the number of tourists in Kyoto based on GPS traces and aggregate mobile statistics
CN114297530A (zh) 一种基于大数据的行程规划方法及系统
CN113672823A (zh) 一种用户籍贯的预测方法及装置
Bollenbach et al. Using machine learning to predict POI occupancy to reduce overcrowding
Hasnat Analyzing Destination Choices of Tourists and Residents from Location Based Social Media Data
CN114895982B (zh) 基于用户信息的应用唤起方法、系统、设备及存储介质
Kloos et al. Weather, weekday, and vacation effects on webcam recorded daily visitor numbers in the alpine winter season
Capuano et al. CATRES: a Context-Aware Recommender System for Indoor and Outdoor Museums Tours Planning.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination