CN112287248A - 基于旅游大数据利用概率统计匹配旅游目的地的方法 - Google Patents

基于旅游大数据利用概率统计匹配旅游目的地的方法 Download PDF

Info

Publication number
CN112287248A
CN112287248A CN202011244516.2A CN202011244516A CN112287248A CN 112287248 A CN112287248 A CN 112287248A CN 202011244516 A CN202011244516 A CN 202011244516A CN 112287248 A CN112287248 A CN 112287248A
Authority
CN
China
Prior art keywords
tourist
information
tourists
matching
attraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011244516.2A
Other languages
English (en)
Inventor
康顺光
牛旭
吴勇
贾佳
徐爱英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin Tourism University
Original Assignee
Guilin Tourism University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin Tourism University filed Critical Guilin Tourism University
Priority to CN202011244516.2A priority Critical patent/CN112287248A/zh
Publication of CN112287248A publication Critical patent/CN112287248A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于数据分析技术领域,尤其为基于旅游大数据利用概率统计匹配旅游目的地的方法,包括如下步骤:步骤一:建立游客特征信息库;游客特征包括游客旅游信息的基本特征,将基本特征分为游客的基本属性特征和基本消费行为特征;步骤二:建立旅游景点信息数据库;采集internet网络中最新的旅游景点信息和坐标信息;然后,对采集的数据进行抽取、转换、加载,形成完整的旅游景点信息库和旅游景点坐标库;步骤三:基于大数据分析的游客特征提取。本发明通过建立游客特征信息库,利用大数据分析对游客特征和旅游景点特征进行提取,通过将旅游景点匹配推送给该访客,有效地解决漫无目的地泛滥式地推送旅游信息的方式。

Description

基于旅游大数据利用概率统计匹配旅游目的地的方法
技术领域
本发明涉及数据分析技术领域,尤其涉及基于旅游大数据利用概率统计匹配旅游目的地的方法。
背景技术
手机的功能越来越强大,游客通过手机浏览旅游景点相关信息,查询其他游客的旅游经验和攻略,或者依靠商家推送的信息进行旅游的方式已经成为当前旅游的主要方式。
然而,这种旅游方式存在一些不足以及不够人性化的地方,比如:用户主动浏览旅游景点相关信息比较费时费力;其他游客的旅游经验和攻略由于行程、喜好不同,游客难以直接套用;推送的信息缺乏地位位置关联,即使游客感兴趣,也可能由于距离过远、路径不熟而放弃目标行程;营销信息主要是泛滥式地统一向用户推送,并没有很好的针对性,长期漫无目的地进行营销信息推送,会给针对性弱的用户造成浏览及消费疲劳,甚至会造成用户的流失。
因此我们提出了基于旅游大数据利用概率统计匹配旅游目的地的方法用于解决上述问题。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的基于旅游大数据利用概率统计匹配旅游目的地的方法。
为了实现上述目的,本发明采用了如下技术方案:基于旅游大数据利用概率统计匹配旅游目的地的方法,包括如下步骤:
步骤一:建立游客特征信息库;游客特征包括游客旅游信息的基本特征,将基本特征分为游客的基本属性特征和基本消费行为特征;
步骤二:建立旅游景点信息数据库;采集internet网络中最新的旅游景点信息和坐标信息;然后,对采集的数据进行抽取、转换、加载,形成完整的旅游景点信息库和旅游景点坐标库;
步骤三:基于大数据分析的游客特征提取;利用大数据分析技术对不同层次的游客特征进行提取,通过针对游客特征的计算机操作标注方式对其旅游中提供的旅游商品或旅游服务进行标注定义;利用爬虫网络方法在与旅游相关联的网站或者手机app的互联网消费记录和使用记录中搜索提取获得访客的游客特征,并与已标注定义的旅游商品或旅游服务相匹配;
步骤四:推送消息;推送消息包括依次进行的以下步骤:①游客特征信息库和旅游景点信息库的匹配计算;在旅游景点信息库中寻找包含与游客特征信息库中的关键词组相同词组的消息,然后逐一将找到的旅游景点信息库的消息与游客的特征进行匹配并计算出相似度;②将相似度大于设定阈值的旅游景点消息结合LBS优先推送方式推送给对应的相似游客。
优选的,所述访客基本属性特征包括年龄、性别、地理位置与职业信息,网络访问特征包括历史旅游浏览行为数据与朋友圈、微博等分享软件公开旅游数据,基本消费行为特征包括访客消费行为数据、支付行为数据与生活轨迹行为信息。
优选的,所述步骤四具体包括步骤①:统计介绍信息的点击率与访客在介绍信息页面停留时间;步骤②:基于点击率、停留时间判断访客对该类信息关注度指数;步骤③:基于关注度指数的大小最终将关注度数较高的旅游景点推送给访客。
优选的,所述旅游景点信息库包括旅游景点项目的访客评价数据、各个所述景点的相关事件信息以及包含各个旅游景点旅游攻略的推荐评分。
优选的,当访客对对所述推送的消息响应后,系统将找到该消息中与个性消费行为特征相匹配的个性行为关键词,搜索旅游景点消息库中具有该个性行为关键词的其他消息向访客推送。
优选的,所述游客特征信息库包括个散客旅游类和团队旅游类,团队旅游类包括休闲娱乐类别,散客旅游类包括探亲访友类别、商务类别、专业访问类别。
与现有技术相比,本发明的有益效果是:通过游客的基本属性特征和基本消费行为特征建立游客特征信息库;通过对采集到的的旅游景点的基本信息和坐标信息来建立旅游景点信息库;对已来过景点游玩的游客进行特征分析并构建出具有游客特点的关键词信息库;通过将访客和旅游景点的关键词进行匹配计算并将相似度高的旅游景点推送给访客;统计介绍信息的点击率与用户在介绍信息页面停留时间,基于点击率、停留时间判断用户对该类信息关注度指数,基于关注度指数的大小最终将关注度数较高的旅游景点推送给访客。
本发明通过建立游客特征信息库,利用大数据分析对游客特征和旅游景点特征进行提取,通过将旅游景点匹配推送给该访客,有效地解决漫无目的地泛滥式地推送旅游信息的方式。
附图说明
图1为本发明提出的基于旅游大数据利用概率统计匹配旅游目的地的方法的整体流程图;
图2为本发明提出的基于旅游大数据利用概率统计匹配旅游目的地的方法中步骤四的具体流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
参考图1-2,本实施例中提出了基于旅游大数据利用概率统计匹配旅游目的地的方法,包括如下步骤:
步骤一:建立游客特征信息库;游客特征包括游客旅游信息的基本特征,将基本特征分为游客的基本属性特征和基本消费行为特征;
步骤二:建立旅游景点信息数据库;采集internet网络中最新的旅游景点信息和坐标信息;然后,对采集的数据进行抽取、转换、加载,形成完整的旅游景点信息库和旅游景点坐标库;
步骤三:基于大数据分析的游客特征提取;利用大数据分析技术对不同层次的游客特征进行提取,通过针对游客特征的计算机操作标注方式对其旅游中提供的旅游商品或旅游服务进行标注定义;利用爬虫网络方法在与旅游相关联的网站或者手机app的互联网消费记录和使用记录中搜索提取获得访客的游客特征,并与已标注定义的旅游商品或旅游服务相匹配;
步骤四:推送消息;推送消息包括依次进行的以下步骤:①游客特征信息库和旅游景点信息库的匹配计算;在旅游景点信息库中寻找包含与游客特征信息库中的关键词组相同词组的消息,然后逐一将找到的旅游景点信息库的消息与游客的特征进行匹配并计算出相似度;②将相似度大于设定阈值的旅游景点消息结合LBS优先推送方式推送给对应的相似游客;
所述访客基本属性特征包括年龄、性别、地理位置与职业信息,网络访问特征包括历史旅游浏览行为数据与朋友圈、微博等分享软件公开旅游数据,基本消费行为特征包括访客消费行为数据、支付行为数据与生活轨迹行为信息,所述步骤四具体包括步骤①:统计介绍信息的点击率与访客在介绍信息页面停留时间;步骤②:基于点击率、停留时间判断访客对该类信息关注度指数;步骤③:基于关注度指数的大小最终将关注度数较高的旅游景点推送给访客,所述旅游景点信息库包括旅游景点项目的访客评价数据、各个所述景点的相关事件信息以及包含各个旅游景点旅游攻略的推荐评分,当访客对对所述推送的消息响应后,系统将找到该消息中与个性消费行为特征相匹配的个性行为关键词,搜索旅游景点消息库中具有该个性行为关键词的其他消息向访客推送,所述游客特征信息库包括个散客旅游类和团队旅游类,团队旅游类包括休闲娱乐类别,散客旅游类包括探亲访友类别、商务类别、专业访问类别
本实施例中,通过游客的基本属性特征和基本消费行为特征建立游客特征信息库;通过对采集到的的旅游景点的基本信息和坐标信息来建立旅游景点信息库;对已来过景点游玩的游客进行特征分析并构建出具有游客特点的关键词信息库;通过将访客和旅游景点的关键词进行匹配计算并将相似度高的旅游景点推送给访客;统计介绍信息的点击率与用户在介绍信息页面停留时间,基于点击率、停留时间判断用户对该类信息关注度指数,基于关注度指数的大小最终将关注度数较高的旅游景点推送给访客。
本实施例中,本发明通过建立游客特征信息库,利用大数据分析对游客特征和旅游景点特征进行提取,通过将旅游景点匹配推送给该访客,有效地解决漫无目的地泛滥式地推送旅游信息的方式。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (6)

1.基于旅游大数据利用概率统计匹配旅游目的地的方法,其特征在于,包括如下步骤:
步骤一:建立游客特征信息库;游客特征包括游客旅游信息的基本特征,将基本特征分为游客的基本属性特征和基本消费行为特征;
步骤二:建立旅游景点信息数据库;采集internet网络中最新的旅游景点信息和坐标信息;然后,对采集的数据进行抽取、转换、加载,形成完整的旅游景点信息库和旅游景点坐标库;
步骤三:基于大数据分析的游客特征提取;利用大数据分析技术对不同层次的游客特征进行提取,通过针对游客特征的计算机操作标注方式对其旅游中提供的旅游商品或旅游服务进行标注定义;利用爬虫网络方法在与旅游相关联的网站或者手机app的互联网消费记录和使用记录中搜索提取获得访客的游客特征,并与已标注定义的旅游商品或旅游服务相匹配;
步骤四:推送消息;推送消息包括依次进行的以下步骤:①游客特征信息库和旅游景点信息库的匹配计算;在旅游景点信息库中寻找包含与游客特征信息库中的关键词组相同词组的消息,然后逐一将找到的旅游景点信息库的消息与游客的特征进行匹配并计算出相似度;②将相似度大于设定阈值的旅游景点消息结合LBS优先推送方式推送给对应的相似游客。
2.根据权利要求1所述的基于旅游大数据利用概率统计匹配旅游目的地的方法,其特征在于,所述访客基本属性特征包括年龄、性别、地理位置与职业信息,网络访问特征包括历史旅游浏览行为数据与朋友圈、微博等分享软件公开旅游数据,基本消费行为特征包括访客消费行为数据、支付行为数据与生活轨迹行为信息。
3.根据权利要求1所述的基于旅游大数据利用概率统计匹配旅游目的地的方法,其特征在于,所述步骤四具体包括步骤①:统计介绍信息的点击率与访客在介绍信息页面停留时间;步骤②:基于点击率、停留时间判断访客对该类信息关注度指数;步骤③:基于关注度指数的大小最终将关注度数较高的旅游景点推送给访客。
4.根据权利要求1所述的基于旅游大数据利用概率统计匹配旅游目的地的方法,其特征在于,所述旅游景点信息库包括旅游景点项目的访客评价数据、各个所述景点的相关事件信息以及包含各个旅游景点旅游攻略的推荐评分。
5.根据权利要求3所述的基于旅游大数据利用概率统计匹配旅游目的地的方法,其特征在于,当访客对对所述推送的消息响应后,系统将找到该消息中与个性消费行为特征相匹配的个性行为关键词,搜索旅游景点消息库中具有该个性行为关键词的其他消息向访客推送。
6.根据权利要求1所述的基于旅游大数据利用概率统计匹配旅游目的地的方法,其特征在于,所述游客特征信息库包括个散客旅游类和团队旅游类,团队旅游类包括休闲娱乐类别,散客旅游类包括探亲访友类别、商务类别、专业访问类别。
CN202011244516.2A 2020-11-10 2020-11-10 基于旅游大数据利用概率统计匹配旅游目的地的方法 Pending CN112287248A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011244516.2A CN112287248A (zh) 2020-11-10 2020-11-10 基于旅游大数据利用概率统计匹配旅游目的地的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011244516.2A CN112287248A (zh) 2020-11-10 2020-11-10 基于旅游大数据利用概率统计匹配旅游目的地的方法

Publications (1)

Publication Number Publication Date
CN112287248A true CN112287248A (zh) 2021-01-29

Family

ID=74351832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011244516.2A Pending CN112287248A (zh) 2020-11-10 2020-11-10 基于旅游大数据利用概率统计匹配旅游目的地的方法

Country Status (1)

Country Link
CN (1) CN112287248A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106227900A (zh) * 2016-09-06 2016-12-14 北京易游华成科技有限公司 景点推荐设备、方法及系统
CN110968766A (zh) * 2018-09-28 2020-04-07 广州威阿科技有限公司 基于游客画像及lbs数据的出游方案推荐算法
CN111191121A (zh) * 2019-12-19 2020-05-22 安徽逻根农业科技有限公司 一种基于大数据的智慧旅游目标匹配方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106227900A (zh) * 2016-09-06 2016-12-14 北京易游华成科技有限公司 景点推荐设备、方法及系统
CN110968766A (zh) * 2018-09-28 2020-04-07 广州威阿科技有限公司 基于游客画像及lbs数据的出游方案推荐算法
CN111191121A (zh) * 2019-12-19 2020-05-22 安徽逻根农业科技有限公司 一种基于大数据的智慧旅游目标匹配方法

Similar Documents

Publication Publication Date Title
US11238120B1 (en) Selecting, ranking, and/or presenting microsite content
Li et al. A time-aware personalized point-of-interest recommendation via high-order tensor factorization
US11755674B2 (en) Dynamic radius threshold selection
Shaw et al. Learning to rank for spatiotemporal search
JP5602864B2 (ja) 位置ベースのサービスミドルウェア
KR102067278B1 (ko) 친구 추천 방법 및 이를 위한 서버 및 단말
CN104731917B (zh) 一种推荐方法及装置
Meng et al. Travel purpose inference with GPS trajectories, POIs, and geo-tagged social media data
WO2016206196A1 (zh) 用于获取用户属性信息的方法、装置及服务器
CN103327053B (zh) 在线音乐推送方法和系统
JP5732441B2 (ja) 情報推薦方法、装置及びプログラム
CN106022934A (zh) 一种基于移动轨迹模式的潜在好友发现方法及系统
CN105532030A (zh) 用于分析目标实体的移动的装置、系统和方法
CN102939604A (zh) 用于上下文索引的网络资源的方法和装置
CN101999119A (zh) 用于输入识别和完成的技术
CN103609144A (zh) 用于解析地理标识的方法和装置
CN103514191A (zh) 用于确定目标推广信息的关键词匹配模式的方法和设备
CN115408618B (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
KR20140027011A (ko) 친구 추천 방법 및 이를 위한 서버 및 단말
Tang et al. Discovering Travel Community for POI Recommendation on Location‐Based Social Networks
Chen et al. Place recommendation based on users check-in history for location-based services
CN110968766A (zh) 基于游客画像及lbs数据的出游方案推荐算法
CN112241489A (zh) 信息推送方法、装置、可读存储介质和计算机设备
KR101523192B1 (ko) 소셜 검색 시스템 및 기법
CN112287248A (zh) 基于旅游大数据利用概率统计匹配旅游目的地的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210129