CN117217872A - 一种基于游客画像智能生成景区游玩方案的方法 - Google Patents

一种基于游客画像智能生成景区游玩方案的方法 Download PDF

Info

Publication number
CN117217872A
CN117217872A CN202311234377.9A CN202311234377A CN117217872A CN 117217872 A CN117217872 A CN 117217872A CN 202311234377 A CN202311234377 A CN 202311234377A CN 117217872 A CN117217872 A CN 117217872A
Authority
CN
China
Prior art keywords
data
tourist
scenic spot
user
playing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311234377.9A
Other languages
English (en)
Inventor
罗锐
刘晴
王波
李倩
任燕
刘华轶
陆扬
吴抿君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Tourism Cloud Information Technology Co ltd
Original Assignee
Chongqing Tourism Cloud Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Tourism Cloud Information Technology Co ltd filed Critical Chongqing Tourism Cloud Information Technology Co ltd
Priority to CN202311234377.9A priority Critical patent/CN117217872A/zh
Publication of CN117217872A publication Critical patent/CN117217872A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于游客画像智能生成景区游玩方案的方法,本发明涉及旅游技术领域,现提出如下方案,包括:识别景区多维度标签、设定游客画像维度、游玩方案推荐。本发明中,通过构建游客画像,收集景区特色标签,通过将游客与景区数据进行对比,借助人工智能分析路线,形成游玩方案,再通过标签来匹配游客特点进行智能推荐;路线和游玩方案不在局限于单个景区或有合作关系的某几个景区,通过贴合游客的游玩喜好,推荐和游客画像数据吻合的景点;实现通过对景区景点的特点特色进行分析,形成标签体系与游客特点进行匹配,根据匹配结果、游客游玩时间、游玩范围、游玩人数等信息进行综合分析,智能生成多种游玩路线和游玩方案以供游客备选。

Description

一种基于游客画像智能生成景区游玩方案的方法
技术领域
本发明涉及旅游技术领域,具体涉及一种基于游客画像智能生成景区游玩方案的方法。
背景技术
现有景区的游玩方案大多以人工分析路线,形成游玩方案,再通过标签来匹配游客特点进行智能推荐。路线和游玩方案大多局限于单个景区或有合作关系的某几个景区,游客面对路线时往往只对其中的某一两个景点或景区感兴趣,未能完全贴合游客的游玩喜好,无法满足游客的游玩体验需求。
发明内容
针对上述缺陷,本发明所要解决的技术问题在于提供一种基于游客画像智能生成景区游玩方案的方法,包括如下的生成步骤:
识别景区多维度标签:
识别景区业态类型:为每个景区设定一到多个不同业态类型的标签;例如:山水风景、田园风光、都市景观、古镇、游乐场、公园、动物园、博物馆、海洋馆;
识别景区特色:为每个景区打上一到多个具有代表性特色的标签,例如:避暑纳凉、露营、烧烤、玩水、钓鱼、滑雪、夜景、赏花、历史、文物;
景区多属性标识:景区游玩时长、所在区域、人均消费、适合人群进行标识;
游客画像:
设定游客画像维度:其中的画像维度包括:性别、年龄段、学历、来源地、消费能力、旅游偏好、有无子女、有无汽车、健身偏好、理财偏好;
识别游客喜好标签:根据游客历史游玩数据,将游玩过的景区业态标签和特色标签作为游客的喜好标签,多个相同标签的游玩次数累加,计算出每个标签游玩次数的占比,该占比作为游客喜好标签的喜好值,对喜好值进行降序排列,排名第一的为该游客首选喜好;
识别游客备选喜好标签:具有相同首选喜好的游客可归纳为相同喜好组,将相同喜好组中所有喜好形成一个喜好标签组集合,并对喜好值分组累加,组内游客的喜好标签集合与喜好标签组集合取差集,差集中喜好值最高前N项可作为游客备选喜好标签;
游玩方案推荐:
根据游客所在地或游玩目的地获取景区资源数据,然后将景区标签与游客标签进行比对,按游客喜好值筛选出景区;
根据天气、月份和季节对景区标签评分进一步筛选;
根据游客消费画像和预计游玩时长对景区进一步筛选,初步确定游玩的景区;
通过景区的地理位置关系和游玩时长等形成游玩顺序;
根据游玩顺序规划旅游交通线路推荐、饮食推荐、住宿推荐。
在上述一种基于游客画像智能生成景区游玩方案的方法的技术方案中,优选地,所述识别景区业态类型中包括如下的识别方法:
根据景区公布网络的业种、业状和业势内容,将景区分为休闲度假游、工业遗产游、乡村民宿游、生态和谐游、文化体验游、红色教育游、研学知识游、康养体育游、城市购物游、邮轮游艇游、自驾房车游十一个类型;
其中,根据网络提供的旅游网站、景区网站对景区的描述,以及游客游玩后的体验数据,利用聚类分析对各景区的业态类型进行识别归纳;
其中,对于给定的n个景区数据对象的数据集D,将数据对象组织成k(k≤n)个分区,其中,每个分区代表一个簇;计算数据对象之间的距离,每次将距离最近的点合并到同一个簇;计算簇与簇之间的距离,将距离最近的簇合并为一个大簇,不停地合并,直到合成了一个簇,或者达到某个终止条件为止。
在上述一种基于游客画像智能生成景区游玩方案的方法的技术方案中,优选地,所述识别景区特色的步骤有:
收集旅游软件(例如携程、Airbnb等)每天的大量游客评论,在海量的评论中,对它们进行针对性地处理,通过自然语言处理中的话题检测与跟踪范畴,自动发现评论中反映的热点问题,对服务、位置、卫生、环境和性价比等方面进行针对性分析;
对游客评论数据进行关键词提取,例如“不错”、“非常”等指代对象不明且与游客印象无关的特征词,需要借助人工识别和剔除;通过迭代方法求解的分析算法,将游客评论数据点分成若干类,在指定的K个簇中,聚类效果与簇内的数据样本相似度成正比,直到所有的簇聚成一类为止;
其中,聚类需要确定聚类数据K,在特征空间中选择K个点作为初始的聚类中心点;
计算每个特征到聚类中心点的距离,并分配给距离最短的中心点;
得到每个聚类中心点对应的簇,从而完成第一轮聚类;
每轮结束后,需结合各个簇所对应聚类点的特征坐标,根据设定方法更新聚类中心,以新的中心重新聚类,选出新的簇,并不断重复上述过程。
在上述一种基于游客画像智能生成景区游玩方案的方法的技术方案中,优选地,所述景区多属性标识中具体有:
以景区官方发布的景区游玩描述作为多属性数据的一项,以游客评论、社会评论作为多属性数据的另一项,且二者占比为1:1,;根据存在内容完全一致的评论,可能是发布者通过简单复制粘贴产生,假定最早发布的评论具有参考价值,而对于内容相似评论,由于围绕景点描述的关键词通常具有相似性,因此保留内容不完全一致;
对评论进行按时间排序,使用python程序判断评论是否完全重复,保留发布时间最早评论;得到每个景区评论中重复文本的数量占比;
基于TF-IDF的关键词提取评论文本中关键词,并输出关键词所占重要性权重;结合词频和逆文档频率来衡量候选关键词的重要度;如果某个词在一篇文档中出现的频率越高,即TF越高;并且在语料库中其他文档中很少出现,即文档频率(DF)越低,逆文档频率(IDF)越高,则认为该词具有较好的区分能力。
在上述一种基于游客画像智能生成景区游玩方案的方法的技术方案中,优选地,所述游客画像维度的设定中:
用户数据采集:包含宏观和微观两个层面;首先是宏观维度,数据来自于行业数据、用户总体数据、总体浏览数据、总体内容数据等;其次是微观维度,数据包括用户属性数据、用户行为数据、用户成长数据、访问深度、模块化数据、用户参与度数据和用户点击数据;
数据分析及用户细分:在完成用户画像的基础数据采集后,对海量的用户源数据进行分析梳理,提取有效数据并构建有效模型;即根据相应的标准对不同维度的用户数据进行精细化处理,拆分成不同的用户群组和用户标签,对用户进行细分;依据用户属性、用户偏好、消费场景等要素将数据进行处理和区分,从而构建多维度完整的用户画像
完善用户画像:在完成用户数据的基本呈现后,品在创建出的用户角色框架中提取出更加关键的信息,根据关键特征数据进行用户评估分级,并结合用户规模、用户价值和使用频率来划分用户画像,确定高净值用户群、一般价值用户群和潜在价值用户群。
在上述一种基于游客画像智能生成景区游玩方案的方法的技术方案中,优选地,所述识别游客喜好标签中具体有:
通过网络抓取的手段,将微博,微信,OTAs,今日头条,各类论坛等信源进行分析,从舆情监测分析、客户满意度分析、传播分析、品牌评估四个方面进行游客画像分析;根据旅游舆情监测数据,将舆情风险指数、舆情信源占比、变化趋势等组合分析,并将游客情绪标记为正/中/负三个级别;
利用互联网旅游大数据技术,实时收集和监测旅游目的地的相关传播资讯,通过最近7天的新闻,文章,热议话题的传播情况,传播趋势对品牌传播力进行量化评估,一方面通过关键字或时间段检索分析传播概况,用河流图可视化展示传播趋势,从原点呈现事件完整传播信源路径,并可导出为pdf,用于跟踪因为营销事件或舆情事件引起的品牌传播力变化情况;
通过气泡图,趋势图,雷达图,词云图等可视化分析,从知名度,忠诚度,获得感,质量,景区魅力细节分析品牌形象的影响因素及变化情况。
在上述一种基于游客画像智能生成景区游玩方案的方法的技术方案中,优选地,所述识别游客备选喜好标签中具体有:
从实时客流、历史客流、游客分布、画像分析几个方面入手进行游客画像分析;通过对接整合多家互联网app运营商数据,实现对游客移动终端设备的数据采集;
通过结合天气,节假日等信息,通过时/天/周/日客流粒度及时间维度和游客来源地等多维度分析;主要分析游客到访分布和游客来源地分布,通过游客来源地,性别,年龄,旅游偏好,app偏好,消费偏好等,通过分类分析,得到各类型游客的主要偏好方向。
在上述一种基于游客画像智能生成景区游玩方案的方法的技术方案中,优选地,所述游玩方案推荐中,根据景区标签与游客标签进行比对,具体有如下的对比流程:
纵比情况下,在同一空间条件下,对不同时期景区游玩人数数据和游客游玩时间数据的比较;随后对同时期的景区游玩人数数据和游客同时期游玩时间数据的比较;最后,与前一个统计期内进行环比比较。
另外,将景区当前时期游玩数据与特定时期的游玩数据对比,如与历史最好水平或与某一关键的时期进行对比,并将游客当前时期游玩数据与特定时期的游玩数据对比;通过对比数据之间的契合程度,匹配游客的游玩时间与对应景区的呼应;如,当前时间游客是否有游玩时间、游玩动机、游玩目的,根据景区的标签推荐一个或一个以上的景区给游客。
在上述一种基于游客画像智能生成景区游玩方案的方法的技术方案中,优选地,所述游玩方案推荐,具体有如下的设计步骤:
确定景区的出入口,核心景点的位置以及其他景点的位置;
根据核心、其他景点分布特征类型,确定游线走向;
游玩线路制定过程中需要与相关规划和现状实物的协调;
游线串接主要景点,同时方便各种交通方式的换乘。
由上述技术方案可知,本发明提供一种基于游客画像智能生成景区游玩方案的方法与现有技术相比,本发明具有以下有益效果:
本发明中,通过构建游客画像,收集景区特色标签,通过将游客与景区数据进行对比,借助人工智能分析路线,形成游玩方案,再通过标签来匹配游客特点进行智能推荐;路线和游玩方案不在局限于单个景区或有合作关系的某几个景区,通过贴合游客的游玩喜好,推荐和游客画像数据吻合的景点;实现通过对景区景点的特点特色进行分析,形成标签体系与游客特点进行匹配,根据匹配结果、游客游玩时间、游玩范围、游玩人数等信息进行综合分析,智能生成多种游玩路线和游玩方案以供游客备选。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图做出简单地介绍和说明。显而易见地,下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为生成景区游玩方案的方法框架示意图;
图2为游玩方案推荐中的细分框架示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,以下所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了对本发明的技术方案和实现方式做出更清楚地解释和说明,以下介绍实现本发明技术方案的几个优选的具体实施例。
具体实施例
参阅附图1和附图2所示;
基于游客画像智能生成景区游玩方案的方法;
本实施例中包括:
识别景区多维度标签:
1、识别景区业态类型:为每个景区设定一到多个不同业态类型的标签;例如:山水风景、田园风光、都市景观、古镇、游乐场、公园、动物园、博物馆、海洋馆;
2、识别景区特色:为每个景区打上一到多个具有代表性特色的标签,例如:避暑纳凉、露营、烧烤、玩水、钓鱼、滑雪、夜景、赏花、历史、文物;
3、景区多属性标识:景区游玩时长、所在区域、人均消费、适合人群进行标识。
具体为,根据景区公布网络的业种、业状和业势内容,将景区分为休闲度假游、工业遗产游、乡村民宿游、生态和谐游、文化体验游、红色教育游、研学知识游、康养体育游、城市购物游、邮轮游艇游、自驾房车游十一个类型;其中,根据网络提供的旅游网站、景区网站对景区的描述,以及游客游玩后的体验数据,利用聚类分析对各景区的业态类型进行识别归纳。
其中,对于给定的n个景区数据对象的数据集D,将数据对象组织成k(k≤n)个分区,其中,每个分区代表一个簇;计算数据对象之间的距离,每次将距离最近的点合并到同一个簇;计算簇与簇之间的距离,将距离最近的簇合并为一个大簇,不停地合并,直到合成了一个簇,或者达到某个终止条件为止。
收集旅游软件(例如携程、Airbnb等)每天的大量游客评论,在海量的评论中,对它们进行针对性地处理,通过自然语言处理中的话题检测与跟踪范畴,自动发现评论中反映的热点问题,对服务、位置、卫生、环境和性价比等方面进行针对性分析;
对游客评论数据进行关键词提取,例如“不错”、“非常”等指代对象不明且与游客印象无关的特征词,需要借助人工识别和剔除;通过迭代方法求解的分析算法,将游客评论数据点分成若干类,在指定的K个簇中,聚类效果与簇内的数据样本相似度成正比,直到所有的簇聚成一类为止;
其中,聚类需要确定聚类数据K,在特征空间中选择K个点作为初始的聚类中心点;
计算每个特征到聚类中心点的距离,并分配给距离最短的中心点;
得到每个聚类中心点对应的簇,从而完成第一轮聚类;
每轮结束后,需结合各个簇所对应聚类点的特征坐标,根据设定方法更新聚类中心,以新的中心重新聚类,选出新的簇,并不断重复上述过程。
以景区官方发布的景区游玩描述作为多属性数据的一项,以游客评论、社会评论作为多属性数据的另一项,且二者占比为1:1,;根据存在内容完全一致的评论,可能是发布者通过简单复制粘贴产生,假定最早发布的评论具有参考价值,而对于内容相似评论,由于围绕景点描述的关键词通常具有相似性,因此保留内容不完全一致;
对评论进行按时间排序,使用python程序判断评论是否完全重复,保留发布时间最早评论;得到每个景区评论中重复文本的数量占比;基于TF-IDF的关键词提取评论文本中关键词,并输出关键词所占重要性权重;结合词频和逆文档频率来衡量候选关键词的重要度;如果某个词在一篇文档中出现的频率越高,即TF越高;并且在语料库中其他文档中很少出现,即文档频率(DF)越低,逆文档频率(IDF)越高,则认为该词具有较好的区分能力。
游客画像:
1、设定游客画像维度:其中的画像维度包括:性别、年龄段、学历、来源地、消费能力、旅游偏好、有无子女、有无汽车、健身偏好、理财偏好;
2、识别游客喜好标签:根据游客历史游玩数据,将游玩过的景区业态标签和特色标签作为游客的喜好标签,多个相同标签的游玩次数累加,计算出每个标签游玩次数的占比,该占比作为游客喜好标签的喜好值,对喜好值进行降序排列,排名第一的为该游客首选喜好;
3、识别游客备选喜好标签:具有相同首选喜好的游客可归纳为相同喜好组,将相同喜好组中所有喜好形成一个喜好标签组集合,并对喜好值分组累加,组内游客的喜好标签集合与喜好标签组集合取差集,差集中喜好值最高前N项可作为游客备选喜好标签。
用户数据采集:包含宏观和微观两个层面;首先是宏观维度,数据来自于行业数据、用户总体数据、总体浏览数据、总体内容数据等;其次是微观维度,数据包括用户属性数据、用户行为数据、用户成长数据、访问深度、模块化数据、用户参与度数据和用户点击数据;
数据分析及用户细分:在完成用户画像的基础数据采集后,对海量的用户源数据进行分析梳理,提取有效数据并构建有效模型;即根据相应的标准对不同维度的用户数据进行精细化处理,拆分成不同的用户群组和用户标签,对用户进行细分;依据用户属性、用户偏好、消费场景等要素将数据进行处理和区分,从而构建多维度完整的用户画像
完善用户画像:在完成用户数据的基本呈现后,品在创建出的用户角色框架中提取出更加关键的信息,根据关键特征数据进行用户评估分级,并结合用户规模、用户价值和使用频率来划分用户画像,确定高净值用户群、一般价值用户群和潜在价值用户群。
通过网络抓取的手段,将微博,微信,OTAs,今日头条,各类论坛等信源进行分析,从舆情监测分析、客户满意度分析、传播分析、品牌评估四个方面进行游客画像分析;根据旅游舆情监测数据,将舆情风险指数、舆情信源占比、变化趋势等组合分析,并将游客情绪标记为正/中/负三个级别;
利用互联网旅游大数据技术,实时收集和监测旅游目的地的相关传播资讯,通过最近7天的新闻,文章,热议话题的传播情况,传播趋势对品牌传播力进行量化评估,一方面通过关键字或时间段检索分析传播概况,用河流图可视化展示传播趋势,从原点呈现事件完整传播信源路径,并可导出为pdf,用于跟踪因为营销事件或舆情事件引起的品牌传播力变化情况;
通过气泡图,趋势图,雷达图,词云图等可视化分析,从知名度,忠诚度,获得感,质量,景区魅力细节分析品牌形象的影响因素及变化情况。
从实时客流、历史客流、游客分布、画像分析几个方面入手进行游客画像分析;通过对接整合多家互联网app运营商数据,实现对游客移动终端设备的数据采集;
通过结合天气,节假日等信息,通过时/天/周/日客流粒度及时间维度和游客来源地等多维度分析;主要分析游客到访分布和游客来源地分布,通过游客来源地,性别,年龄,旅游偏好,app偏好,消费偏好等,通过分类分析,得到各类型游客的主要偏好方向
游玩方案推荐:
根据游客所在地或游玩目的地获取景区资源数据,然后将景区标签与游客标签进行比对,按游客喜好值筛选出景区;
根据天气、月份和季节对景区标签评分进一步筛选;
根据游客消费画像和预计游玩时长对景区进一步筛选,初步确定游玩的景区;
通过景区的地理位置关系和游玩时长等形成游玩顺序;
根据游玩顺序规划旅游交通线路推荐、饮食推荐、住宿推荐。
纵比情况下,在同一空间条件下,对不同时期景区游玩人数数据和游客游玩时间数据的比较;随后对同时期的景区游玩人数数据和游客同时期游玩时间数据的比较;最后,与前一个统计期内进行环比比较。
另外,将景区当前时期游玩数据与特定时期的游玩数据对比,如与历史最好水平或与某一关键的时期进行对比,并将游客当前时期游玩数据与特定时期的游玩数据对比;通过对比数据之间的契合程度,匹配游客的游玩时间与对应景区的呼应;如,当前时间游客是否有游玩时间、游玩动机、游玩目的,根据景区的标签推荐一个或一个以上的景区给游客。
确定景区的出入口,核心景点的位置以及其他景点的位置;
根据核心、其他景点分布特征类型,确定游线走向;
游玩线路制定过程中需要与相关规划和现状实物的协调;
游线串接主要景点,同时方便各种交通方式的换乘。
最后,还需要说明的是,本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本申请可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本申请所能产生的功效及所能达成的目的下,均应仍落在本申请所揭示的技术内容得能涵盖的范围内。本发明并不局限于上述最佳实施方式,任何人应该得知在本发明的启示下做出的结构变化,凡是与本发明具有相同或相近的技术方案,均落入本发明的保护范围之内。

Claims (9)

1.一种基于游客画像智能生成景区游玩方案的方法,其包括如下的生成步骤:
识别景区多维度标签:
识别景区业态类型:为每个景区设定一到多个不同业态类型的标签;例如:山水风景、田园风光、都市景观、古镇、游乐场、公园、动物园、博物馆、海洋馆;
识别景区特色:为每个景区打上一到多个具有代表性特色的标签,例如:避暑纳凉、露营、烧烤、玩水、钓鱼、滑雪、夜景、赏花、历史、文物;
景区多属性标识:景区游玩时长、所在区域、人均消费、适合人群进行标识;
游客画像:
设定游客画像维度:其中的画像维度包括:性别、年龄段、学历、来源地、消费能力、旅游偏好、有无子女、有无汽车、健身偏好、理财偏好;
识别游客喜好标签:根据游客历史游玩数据,将游玩过的景区业态标签和特色标签作为游客的喜好标签,多个相同标签的游玩次数累加,计算出每个标签游玩次数的占比,该占比作为游客喜好标签的喜好值,对喜好值进行降序排列,排名第一的为该游客首选喜好;
识别游客备选喜好标签:具有相同首选喜好的游客可归纳为相同喜好组,将相同喜好组中所有喜好形成一个喜好标签组集合,并对喜好值分组累加,组内游客的喜好标签集合与喜好标签组集合取差集,差集中喜好值最高前N项可作为游客备选喜好标签;
游玩方案推荐:
根据游客所在地或游玩目的地获取景区资源数据,然后将景区标签与游客标签进行比对,按游客喜好值筛选出景区;
根据天气、月份和季节对景区标签评分进一步筛选;
根据游客消费画像和预计游玩时长对景区进一步筛选,初步确定游玩的景区;
通过景区的地理位置关系和游玩时长等形成游玩顺序;
根据游玩顺序规划旅游交通线路推荐、饮食推荐、住宿推荐。
2.根据权利要求1所述的一种基于游客画像智能生成景区游玩方案的方法,其特征在于,所述识别景区业态类型中包括如下的识别方法:
根据景区公布网络的业种、业状和业势内容,将景区分为休闲度假游、工业遗产游、乡村民宿游、生态和谐游、文化体验游、红色教育游、研学知识游、康养体育游、城市购物游、邮轮游艇游、自驾房车游十一个类型;
其中,根据网络提供的旅游网站、景区网站对景区的描述,以及游客游玩后的体验数据,利用聚类分析对各景区的业态类型进行识别归纳;
其中,对于给定的n个景区数据对象的数据集D,将数据对象组织成k(k≤n)个分区,其中,每个分区代表一个簇;计算数据对象之间的距离,每次将距离最近的点合并到同一个簇;计算簇与簇之间的距离,将距离最近的簇合并为一个大簇,不停地合并,直到合成了一个簇,或者达到某个终止条件为止。
3.根据权利要求1所述的一种基于游客画像智能生成景区游玩方案的方法,其特征在于,所述识别景区特色的步骤有:
收集旅游软件(例如携程、Airbnb等)每天的大量游客评论,在海量的评论中,对它们进行针对性地处理,通过自然语言处理中的话题检测与跟踪范畴,自动发现评论中反映的热点问题,对服务、位置、卫生、环境和性价比等方面进行针对性分析;
对游客评论数据进行关键词提取,例如“不错”、“非常”等指代对象不明且与游客印象无关的特征词,需要借助人工识别和剔除;通过迭代方法求解的分析算法,将游客评论数据点分成若干类,在指定的K个簇中,聚类效果与簇内的数据样本相似度成正比,直到所有的簇聚成一类为止;
其中,聚类需要确定聚类数据K,在特征空间中选择K个点作为初始的聚类中心点;
计算每个特征到聚类中心点的距离,并分配给距离最短的中心点;
得到每个聚类中心点对应的簇,从而完成第一轮聚类;
每轮结束后,需结合各个簇所对应聚类点的特征坐标,根据设定方法更新聚类中心,以新的中心重新聚类,选出新的簇,并不断重复上述过程。
4.根据权利要求1所述的一种基于游客画像智能生成景区游玩方案的方法,其特征在于,所述景区多属性标识中具体有:
以景区官方发布的景区游玩描述作为多属性数据的一项,以游客评论、社会评论作为多属性数据的另一项,且二者占比为1:1,;根据存在内容完全一致的评论,可能是发布者通过简单复制粘贴产生,假定最早发布的评论具有参考价值,而对于内容相似评论,由于围绕景点描述的关键词通常具有相似性,因此保留内容不完全一致;
对评论进行按时间排序,使用python程序判断评论是否完全重复,保留发布时间最早评论;得到每个景区评论中重复文本的数量占比;
基于TF-IDF的关键词提取评论文本中关键词,并输出关键词所占重要性权重;结合词频和逆文档频率来衡量候选关键词的重要度;如果某个词在一篇文档中出现的频率越高,即TF越高;并且在语料库中其他文档中很少出现,即文档频率(DF)越低,逆文档频率(IDF)越高,则认为该词具有较好的区分能力。
5.根据权利要求1所述的一种基于游客画像智能生成景区游玩方案的方法,其特征在于,所述游客画像维度的设定中:
用户数据采集:包含宏观和微观两个层面;首先是宏观维度,数据来自于行业数据、用户总体数据、总体浏览数据、总体内容数据等;其次是微观维度,数据包括用户属性数据、用户行为数据、用户成长数据、访问深度、模块化数据、用户参与度数据和用户点击数据;
数据分析及用户细分:在完成用户画像的基础数据采集后,对海量的用户源数据进行分析梳理,提取有效数据并构建有效模型;即根据相应的标准对不同维度的用户数据进行精细化处理,拆分成不同的用户群组和用户标签,对用户进行细分;依据用户属性、用户偏好、消费场景等要素将数据进行处理和区分,从而构建多维度完整的用户画像
完善用户画像:在完成用户数据的基本呈现后,品在创建出的用户角色框架中提取出更加关键的信息,根据关键特征数据进行用户评估分级,并结合用户规模、用户价值和使用频率来划分用户画像,确定高净值用户群、一般价值用户群和潜在价值用户群。
6.根据权利要求1所述的一种基于游客画像智能生成景区游玩方案的方法,其特征在于,所述识别游客喜好标签中具体有:
通过网络抓取的手段,将微博,微信,OTAs,今日头条,各类论坛等信源进行分析,从舆情监测分析、客户满意度分析、传播分析、品牌评估四个方面进行游客画像分析;根据旅游舆情监测数据,将舆情风险指数、舆情信源占比、变化趋势等组合分析,并将游客情绪标记为正/中/负三个级别;
利用互联网旅游大数据技术,实时收集和监测旅游目的地的相关传播资讯,通过最近7天的新闻,文章,热议话题的传播情况,传播趋势对品牌传播力进行量化评估,一方面通过关键字或时间段检索分析传播概况,用河流图可视化展示传播趋势,从原点呈现事件完整传播信源路径,并可导出为pdf,用于跟踪因为营销事件或舆情事件引起的品牌传播力变化情况;
通过气泡图,趋势图,雷达图,词云图等可视化分析,从知名度,忠诚度,获得感,质量,景区魅力细节分析品牌形象的影响因素及变化情况。
7.根据权利要求1所述的一种基于游客画像智能生成景区游玩方案的方法,其特征在于,所述识别游客备选喜好标签中具体有:
从实时客流、历史客流、游客分布、画像分析几个方面入手进行游客画像分析;通过对接整合多家互联网app运营商数据,实现对游客移动终端设备的数据采集;
通过结合天气,节假日等信息,通过时/天/周/日客流粒度及时间维度和游客来源地等多维度分析;主要分析游客到访分布和游客来源地分布,通过游客来源地,性别,年龄,旅游偏好,app偏好,消费偏好等,通过分类分析,得到各类型游客的主要偏好方向。
8.根据权利要求1所述的一种基于游客画像智能生成景区游玩方案的方法,其特征在于,所述游玩方案推荐中,根据景区标签与游客标签进行比对,具体有如下的对比流程:
纵比情况下,在同一空间条件下,对不同时期景区游玩人数数据和游客游玩时间数据的比较;随后对同时期的景区游玩人数数据和游客同时期游玩时间数据的比较;最后,与前一个统计期内进行环比比较。
另外,将景区当前时期游玩数据与特定时期的游玩数据对比,如与历史最好水平或与某一关键的时期进行对比,并将游客当前时期游玩数据与特定时期的游玩数据对比;通过对比数据之间的契合程度,匹配游客的游玩时间与对应景区的呼应;如,当前时间游客是否有游玩时间、游玩动机、游玩目的,根据景区的标签推荐一个或一个以上的景区给游客。
9.根据权利要求1所述的一种基于游客画像智能生成景区游玩方案的方法,其特征在于,所述游玩方案推荐,具体有如下的设计步骤:
确定景区的出入口,核心景点的位置以及其他景点的位置;
根据核心、其他景点分布特征类型,确定游线走向;
游玩线路制定过程中需要与相关规划和现状实物的协调;
游线串接主要景点,同时方便各种交通方式的换乘。
CN202311234377.9A 2023-09-24 2023-09-24 一种基于游客画像智能生成景区游玩方案的方法 Pending CN117217872A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311234377.9A CN117217872A (zh) 2023-09-24 2023-09-24 一种基于游客画像智能生成景区游玩方案的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311234377.9A CN117217872A (zh) 2023-09-24 2023-09-24 一种基于游客画像智能生成景区游玩方案的方法

Publications (1)

Publication Number Publication Date
CN117217872A true CN117217872A (zh) 2023-12-12

Family

ID=89049248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311234377.9A Pending CN117217872A (zh) 2023-09-24 2023-09-24 一种基于游客画像智能生成景区游玩方案的方法

Country Status (1)

Country Link
CN (1) CN117217872A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117788224A (zh) * 2023-12-28 2024-03-29 广州松麓圣方电子科技有限公司 5g+云融合的全域旅游数据管理系统
CN117788226A (zh) * 2024-02-23 2024-03-29 福建拾联乡村产业发展有限公司 一种数字乡村业务数据分析方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117788224A (zh) * 2023-12-28 2024-03-29 广州松麓圣方电子科技有限公司 5g+云融合的全域旅游数据管理系统
CN117788226A (zh) * 2024-02-23 2024-03-29 福建拾联乡村产业发展有限公司 一种数字乡村业务数据分析方法及系统

Similar Documents

Publication Publication Date Title
Quercia et al. The digital life of walkable streets
Luo et al. Topic modelling for theme park online reviews: analysis of Disneyland
Liu et al. Using text mining to track changes in travel destination image: the case of Macau
CN107291888B (zh) 基于机器学习统计模型的入住酒店附近生活推荐系统方法
Park et al. Influence of the ‘slow city’brand association on the behavioural intention of potential tourists
Lyu et al. Big data in action: An overview of big data studies in tourism and hospitality literature
CN110442662B (zh) 一种确定用户属性信息的方法以及信息推送方法
van Weerdenburg et al. Where to go and what to do: Extracting leisure activity potentials from Web data on urban space
CN117217872A (zh) 一种基于游客画像智能生成景区游玩方案的方法
Zheng et al. Chinese tourists in Nordic countries: An analysis of spatio-temporal behavior using geo-located travel blog data
Kim et al. Assessing and mapping cultural ecosystem services of an urban forest based on narratives from blog posts
Shin et al. Identifying attributes of wineries that increase visitor satisfaction and dissatisfaction: Applying an aspect extraction approach to online reviews
CN113570198B (zh) 基于WebGIS的城市文化信息交互方法及系统
YILMAZ The effects on consumer behavior of hotel related comments on the Tripadvisor website: An Istanbul case
Zhang et al. Understanding user economic behavior in the city using large-scale geotagged and crowdsourced data
Hameed et al. Regional development through tourism in Balochistan under the China-Pakistan economic corridor
Floris et al. Social media data in tourism planning: analysing tourists’ satisfaction in space and time
Wang et al. Competitive location selection of a commercial center based on the vitality of commercial districts and residential emotion
Ćorluka et al. The temporal dimension of tourist attraction
Alamsyah et al. Mining Digital Traces to Uncover Global Perception of Bali’s Topmost Destinations
Kim et al. Tourism identity in social media: The case of Suzhu, a Chinese historic city
Altarawneh et al. Role of perceived risks to tourists in building their future intention: a conceptual model
GAVRA JURAVLE et al. QUALITATIVE ANALYSIS REGARDING THE DECISION-MAKERS IN TERMS OF TOURISM PROMOTION.
Akiyama et al. Development of commercial accumulation polygon data throughout Japan based on the digital classified telephone directory
Widyawati et al. Content analysis of tourist opinion based on tourism quality (TOURQUAL) by Text mining online reviews: The case of Borobudur

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination