CN111429220B - 基于运营商大数据的旅游路线推荐系统及方法 - Google Patents
基于运营商大数据的旅游路线推荐系统及方法 Download PDFInfo
- Publication number
- CN111429220B CN111429220B CN202010220317.1A CN202010220317A CN111429220B CN 111429220 B CN111429220 B CN 111429220B CN 202010220317 A CN202010220317 A CN 202010220317A CN 111429220 B CN111429220 B CN 111429220B
- Authority
- CN
- China
- Prior art keywords
- tourist
- tour
- tourists
- scenic spot
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000011664 signaling Effects 0.000 claims abstract description 13
- 238000005065 mining Methods 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 2
- 238000013506 data mapping Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000009412 basement excavation Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 206010027336 Menstruation delayed Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0639—Item locations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明基于运营商大数据的旅游路线推荐方法,包括,步骤1,在需要推荐旅游路线的区域内和采集周期的连续时间内,获取区域内游览景区的游客的手机位置信令数据、游客来源地信息以及区域内旅游景区的位置信息;步骤2,根据步骤1中采集到的信息,构建所有游客在不同旅游景区内的游览轨迹;步骤3:根据游客来源地,对步骤2中的游览轨迹进行挖掘排序,得到不同来源地游客在采集周期中的游览轨迹序列;步骤4:按照不同来源地,将该区域对应的游览轨迹序列作为旅游路线的推荐输出,推荐给目标游客。通过采集覆盖用户范围广的信令数据,可以细粒度地描述游客在区域内的移动行为和人流的实时分布,使得游客在区域内景区的游览路线的数据更具准确性。
Description
技术领域
本发明涉及移动通信领域运营商大数据分析应用领域,具体为基于运营商大数据的旅游路线推荐系统及方法。
背景技术
近年来,我国旅游业取得了蓬勃发展,据文化和旅游部统计数据,仅在2019年“五一”假期间,全国国内旅游接待总人数1.95亿人次,游客平均外出停留时间为2.25天,旅游收入达1176.7亿元,旅游市场的繁荣同时也大力拉动了群众的文化、休闲、餐饮等消费。
在游客集中出游的假期中,各地景区、交通压力不断增大。为确保游客出行和游览安全,各地采取管控客流、增加车位等多种措施,并且随着移动技术的不断发展,人们的出行越来越多的依赖于网络信息的推送;现有技术中的旅行app以及旅游软件通常根据景区的热度以及历史游览数据来确定热门旅游路线,不仅推荐路线单一,而且无法对使用者进行精准匹配,同时结果还缺少实时性及动态性,极易造成目的地的超负荷运营;部分app虽然结合GPS数据或手机数据利用最短路径对旅游路线进行推荐,但其采用的Dijkstra算法复杂度较高,在大数据环境下,会造成人员的密集流动,无法有效缓解目的地集中问题,不仅无法满足用户的需求,而且也不利于旅游路线的开发和挖掘。
发明内容
针对现有技术中存在的问题,本发明提供一种基于运营商大数据的旅游路线推荐系统及方法,方法简单可行,能够满足不同地域旅客的需求,同时缓解景区人员集中的压力,实现有针对性和准确度的路线推荐。
本发明是通过以下技术方案来实现:
基于运营商大数据的旅游路线推荐方法,包括如下步骤,
步骤1,在需要推荐旅游路线的区域内和采集周期的连续时间内,获取区域内游览景区的游客的手机位置信令数据、游客来源地信息以及区域内旅游景区的位置信息;
步骤2,根据步骤1中采集到的信息,构建所有游客在不同旅游景区内的游览轨迹;
步骤3:根据游客来源地,对步骤2中的游览轨迹进行挖掘排序,得到不同来源地游客在采集周期中的游览轨迹序列;
步骤4:按照不同来源地,将该区域对应的游览轨迹序列作为旅游路线的推荐输出,推荐给目标游客。
优选的,步骤1中,手机位置信令数据包括按天存储的用户ID、时间戳、用户位置信息;游客来源地信息包括游客来源省份编码和游客来源地市编码;区域内旅游景区的位置信息通过调用高德API来获取。
优选的,所述的位置信息采用经纬度表示和存储。
优选的,步骤2中,根据步骤1中采集到的信息,构建所有游客在不同旅游景区内的游览轨迹;具体包括如下步骤,
步骤2.1,过滤景区附近居民和景区工作人员;
步骤2.2,将采集周期内每天的游客信息作为每轮循环输入流,过滤掉游客因路过而记录的位置,找到游客停驻位置信息;
步骤2.3,将游客停驻位置与景区位置相匹配,得到游客一个月内在景区的轨迹,将每个游客每天的轨迹压缩为一条景点序列,得到每个游客在采集周期内的游览轨迹<(D1),(D2),(D3)…>,其中,Di代表游客第i天的旅游的景点序列,并按照游客来源地进行分组;利用MapReduce计算框架,将用户ID和来源地记为key,每个游客在采集周期内游览轨迹记为value,记为输出流A。
进一步的,步骤2.1中,将连续N天在7:00-19:00频繁连接景区基站的游客记为景区工作人员进行过滤,将连续N天在21:00至第二天7:00频繁连接景区基站的记为景区附近居民进行过滤,其中,3≤N≤采集周期。
进一步的,步骤3的具体步骤如下,将输出流A的信息作为MapReduce计算框架map的输入流,map输出端的key为来源地编码,value为来自对应来源地的游客在采集周期内的游览轨迹,记为输出流B。
进一步的,步骤4的具体步骤如下,将输出流B的信息作为MapReduce中reduce的输入,用PrefixSpan频繁序列挖掘算法对每个分组里的景点序列进行挖掘,挖掘出的序列、频次及排名进入输出流C;
将输出流C的信息作为输入流,对每组中挖掘出的热门序列按照序列长度分组排序,得到分来源地游客到该区域内旅游的热门路线,作为输出流D推荐输出,推荐给目标游客。
基于运营商大数据的旅游路线推荐系统,包括,
采集模块,用于获取区域内游览景区的游客的手机位置信令数据、游客来源地信息以及区域内旅游景区的位置信息;
构建模块,用于根据采集到的信息,构建所有游客在不同旅游景区内的游览轨迹;
挖掘模块,用于根据游客来源地,对游览轨迹进行挖掘排序,得到不同来源地游客在采集周期中的游览轨迹序列;
推荐发送模块,用于按照不同来源地,将该区域对应的游览轨迹序列作为旅游路线的推荐输出,推荐给目标游客。
优选的,所述的构建模块包括,
数据过滤模块,用于过滤景区附近居民和景区工作人员的对应数据;
数据统计模块,用于将采集周期内每天的游客信息作为每轮循环输入流,过滤掉游客因路过而记录的位置,找到游客停驻位置信息;
数据映射模块,将游客停驻位置与景区位置相匹配,得到游客一个月内在景区的轨迹,将每个游客每天的轨迹压缩为一条景点序列,并按照游客来源地进行分组。
优选的,所述的挖掘模块包括存储模块和计算模块;
存储模块中用于存储MapReduce和PrefixSpan频繁序列挖掘算法;
计算模块用于采用存储模块中存储的MapReduce和PrefixSpan频繁序列挖掘算法,将输入的来源地的游客在采集周期内的游览轨迹挖掘出的序列、频次及排名;并将对每组中挖掘出的热门序列按照序列长度分组排序,得到分来源地游客到该区域内旅游的热门路线推荐输出,推荐给目标游客。
与现有技术相比,本发明具有以下有益的技术效果:
本发明采用的运营商信令数据产生于个体使用手机的过程中,由所通信的运营商基站自动的收集数据记录,可以采集到2G、3G、4G用户发生的主被叫、接收及发送短信、开关机、位置切换等事件信息,全面掌握个体用户时空行为。本发明通过采集覆盖用户范围广的信令数据,可以细粒度地描述游客在区域内的移动行为和人流的实时分布,使得游客在区域内景区的游览路线的数据更具准确性。
进一步的,本发明基于MapReduce分布式计算框架,将原始的海量数据划分为block进行并行计算,可以高效、快速处理PB级别数据,保障旅游路线可以以小时、天、周、月等粒度更新。
进一步的,本发明在大数据环境下利用PrefixSpan算法挖掘热门旅游路线,由于不用产生候选序列,且投影数据库缩小的很快,内存消耗比较稳定,相比于其他序列挖掘算法有较大优势,是解决实际工程问题常用的方法。同时,本发明根据游客来源地为相同区域的游客推荐旅游路线,避免了推荐系统中的用户冷启动问题。
附图说明
图1为本说明书实施例提供的基于运营商大数据的旅游路线推荐方法的步骤原理图。
图2为本说明书实施例提供的基于运营商大数据的旅游路线推荐方法的输入信息。
图3为本说明书实施例提供的基于运营商大数据的旅游路线推荐方法的输出信息。
具体实施方式
下面结合具体的实施例对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。
为使本说明书实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了基于运营商大数据的旅游路线推荐方法,其流程参见图1,具体的实施过程是:
步骤1:在需要推荐旅游路线的区域内和采集周期的连续时间内,获取用户也就是区域内游览景区的游客的手机位置信令数据、用户来源地信息以及某省旅游景区的位置(经纬度)信息。
手机位置信令数据包括用户ID,时间戳,用户位置信息(经纬度),数据按天存储;
用户来源地信息包括用户来源省份编码,用户来源地市编码;
某省旅游景区的位置(经纬度)信息可以通过调用高德API来获取。
步骤2:构建多天内用户在不同景区内游览的轨迹。
过滤景区附近居住或者工作的常驻人口,也就是将景区附近居民和景区工作人员从游客从用户中剔除。由于景区附近可能存在居住、工作的人,因此需要将这部分常驻人口过滤掉。可根据用户的手机信令数据,将连续N天在早7:00-19:00频繁连接景区基站的记为景区工作人员,将连续N天在晚9:00至第二天7:00频繁连接景区基站的记为景区附近居民,得到用户职住表,过滤此类人口造成的影响。
将用户停驻位置与景区位置相匹配,得到游客一个月内在景区的轨迹,将每个游客每天的轨迹压缩为一条景点序列,并按照游客来自的省份及所在的地市分组,得到该游客多天内的游览轨迹,如:<(D1),(D2),(D3)…>,其中Di代表第i天的旅游路线,若某天未检测到该用户的旅游路线,则记为空。利用MapReduce计算框架,将用户ID和来源地市编码份记为key,游览轨迹记为value,记为输出流A。
步骤3:根据用户来源地,得到不同地市游客多天内的游览轨迹。
将输出流A的信息作为MapReduce计算框架map的输入流,map输出端的key为地市编码,value为来自该地区游客多天内的游览轨迹,记为输出流B。形如:
C01<(D11),(D12),(D13)…,(D1j)><(D21),(D22),(D23)…D2j><(Di1),(Di2)…Dij>…
C02<(D11),(D12),(D13)…,(D1j)><(D21),(D22),(D23)…D2j><(Di1),(Di2)…Dij>…
……
其中,C01、C02为用户来源地代码,i代表游客数,j代表天数,Dij为游客i在第j天的景区游览路线,若为空值则不显示
步骤4:挖掘来自不同省份游客的热门景区路线。
将输出流B的信息作为MapReduce中reduce的输入,给定一个支持度阈值α,用PrefixSpan频繁序列挖掘算法对每个分组里的景点序列进行挖掘,挖掘出的序列、频次及排名进入输出流C。
PrefixSpan算法是前缀投影的模式挖掘,假如序列为<ab(ac)b(dfe)>,当前缀为<a>时,前缀投影为<b(ac)b(dfe)>。PrefixSpan算法的目标是挖掘出满足最小支持度的频繁序列。主要步骤为:
1)找出所有长度为1的前缀和对应的投影数据库,本方法中前缀及后缀都为用户轨迹所对应的景区代码。
2)对长度为1的前缀进行计数,将支持度低于阈值α的前缀对应的项从数据集S(即<(D1),(D2),(D3)…>)中删除,同时得到所有的频繁1项序列,其中i=1。
3)对于每个长度为i满足支持度要求的前缀进行递归挖掘:
a)找出前缀所对应的投影数据库。如果投影数据库为空,则递归返回。
b)统计对应投影数据库中各项的支持度计数。如果所有项的支持度计数都低于阈值α,则递归返回。
c)将满足支持度计数的各个单项和当前的前缀进行合并,得到若干新的前缀。
d)令i=i+1,前缀为合并单项后的各个前缀,分别递归执行第3)步。
根据上述步骤,结合本发明内容,假设来源于某地的游客有4人,他们游览轨迹分别为:
<a,b,(cd),(ef)><(ad),c,e><(ef),a><(eg),a,f>,其中a,b,c,d,e,f代表不同景区。
其中,长度为1的前缀包括<a>,<b>,<c>,<d>,<e>,<f>,<g>,对这6个前缀分别递归搜索找各个前缀对应的频繁序列。若假定支持度阈值为50%,由于b只在序列1出现1次,g只在序列4出现1次,支持度计数小于阈值2,则长度为1的频繁序列为<a>,<c>,<d>,<e>,<f>。去除所有序列中的b、g,即第1条记录变成<a,(cd),(ef)>,第4条记录变成<e,a,f>。
开始挖掘频繁序列,分别从长度为1的频繁项开始,此处以景区a为例。以a为前缀,则后缀为<(cd),(ef)><(_d),c,e><f>,对a的后缀进行计数,得到{c:2,d:1,_d:1,e:2,f:2},由于此时d,_d达不到支持度阈值,因此我们递归得到的前缀为a的2项频繁序列为<ac>,<ae>和<af>。将<ac>作为前缀,其后缀投影为<_d,(ef)><e>,只有e达到支持度阈值,因此以a为前缀挖掘得到的子序列,即以a景区为首次游览景点的游览路线为<a><ac><ae><af><ace>,同理可以分别计算以c、d、e、f景区为首次游览景点的频繁游览路线分别为<ce>、<de>、<e_f>,输出流C的key为游客来源地市编码C01,value为<a><ac><ae><af><ace><ce><de><e_f>。
将输出流C的信息作为输入流,将同一省份内来自不同地市游客的旅游路线进行合并,即合并value中的热门序列,对每组中挖掘出的热门序列按照序列长度分组排序,得到分省游客到指定省份地市景区旅游的热门路线。
本发明的推荐方法能够面向当地旅游市场的需求,可以挖掘出来自不同地区的人们对某地景区旅游线路设置的喜好,且在大数据环境下有较好的表现,进行精准的推送,更加充分合理有效的利用旅游资源。
Claims (2)
1.基于运营商大数据的旅游路线推荐方法,其特征在于,包括如下步骤,
步骤1,在需要推荐旅游路线的区域内和采集周期的连续时间内,获取区域内游览景区的游客的手机位置信令数据、游客来源地信息以及区域内旅游景区的位置信息;
步骤2,根据步骤1中采集到的信息,构建所有游客在不同旅游景区内的游览轨迹;
步骤3:根据游客来源地,对步骤2中的游览轨迹进行挖掘排序,得到不同来源地游客在采集周期中的游览轨迹序列;
步骤4:按照不同来源地,将该区域对应的游览轨迹序列作为旅游路线的推荐输出,推荐给目标游客;
步骤1中,手机位置信令数据包括按天存储的用户ID、时间戳、用户位置信息;游客来源地信息包括游客来源省份编码和游客来源地市编码;区域内旅游景区的位置信息通过调用高德API来获取;
所述的位置信息采用经纬度表示和存储;
步骤2中,根据步骤1中采集到的信息,构建所有游客在不同旅游景区内的游览轨迹;具体包括如下步骤,
步骤2.1,过滤景区附近居民和景区工作人员;
步骤2.2,将采集周期内每天的游客信息作为每轮循环输入流,过滤掉游客因路过而记录的位置,找到游客停驻位置信息;
步骤2.3,将游客停驻位置与景区位置相匹配,得到游客一个月内在景区的轨迹,将每个游客每天的轨迹压缩为一条景点序列,得到每个游客在采集周期内的游览轨迹<(D1),(D2),(D3)…>,其中,Di代表游客第i天的旅游的景点序列,并按照游客来源地进行分组;利用MapReduce计算框架,将用户ID和来源地记为key,每个游客在采集周期内游览轨迹记为value,记为输出流A;
步骤2.1中,将连续N天在7:00-19:00频繁连接景区基站的游客记为景区工作人员进行过滤,将连续N天在21:00至第二天7:00频繁连接景区基站的记为景区附近居民进行过滤,其中,3≤N≤采集周期;
步骤3的具体步骤如下,将输出流A的信息作为MapReduce计算框架map的输入流,map输出端的key为来源地编码,value为来自对应来源地的游客在采集周期内的游览轨迹,记为输出流B;
步骤4的具体步骤如下,将输出流B的信息作为MapReduce中reduce的输入,用PrefixSpan频繁序列挖掘算法对每个分组里的景点序列进行挖掘,挖掘出的序列、频次及排名进入输出流C;
将输出流C的信息作为输入流,对每组中挖掘出的热门序列按照序列长度分组排序,得到分来源地游客到该区域内旅游的热门路线,作为输出流D推荐输出,推荐给目标游客。
2.基于运营商大数据的旅游路线推荐系统,其特征在于,用于执行如权利要求1所述的方法,包括,
采集模块,用于获取区域内游览景区的游客的手机位置信令数据、游客来源地信息以及区域内旅游景区的位置信息;
构建模块,用于根据采集到的信息,构建所有游客在不同旅游景区内的游览轨迹;
挖掘模块,用于根据游客来源地,对游览轨迹进行挖掘排序,得到不同来源地游客在采集周期中的游览轨迹序列;
推荐发送模块,用于按照不同来源地,将该区域对应的游览轨迹序列作为旅游路线的推荐输出,推荐给目标游客;
所述的构建模块包括,
数据过滤模块,用于过滤景区附近居民和景区工作人员的对应数据;
数据统计模块,用于将采集周期内每天的游客信息作为每轮循环输入流,过滤掉游客因路过而记录的位置,找到游客停驻位置信息;
数据映射模块,将游客停驻位置与景区位置相匹配,得到游客一个月内在景区的轨迹,将每个游客每天的轨迹压缩为一条景点序列,并按照游客来源地进行分组;
所述的挖掘模块包括存储模块和计算模块;
存储模块中用于存储MapReduce和PrefixSpan频繁序列挖掘算法;
计算模块用于采用存储模块中存储的MapReduce和PrefixSpan频繁序列挖掘算法,将输入的来源地的游客在采集周期内的游览轨迹挖掘出的序列、频次及排名;并将对每组中挖掘出的热门序列按照序列长度分组排序,得到分来源地游客到该区域内旅游的热门路线推荐输出,推荐给目标游客。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010220317.1A CN111429220B (zh) | 2020-03-25 | 2020-03-25 | 基于运营商大数据的旅游路线推荐系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010220317.1A CN111429220B (zh) | 2020-03-25 | 2020-03-25 | 基于运营商大数据的旅游路线推荐系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111429220A CN111429220A (zh) | 2020-07-17 |
CN111429220B true CN111429220B (zh) | 2024-04-05 |
Family
ID=71555454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010220317.1A Active CN111429220B (zh) | 2020-03-25 | 2020-03-25 | 基于运营商大数据的旅游路线推荐系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111429220B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113282637A (zh) * | 2021-04-16 | 2021-08-20 | 北京工业大学 | 景区游客识别方法、装置、电子设备及存储介质 |
CN113313307A (zh) * | 2021-05-31 | 2021-08-27 | 哈尔滨工业大学 | 基于信令大数据的旅游路线挖掘方法 |
CN114862456A (zh) * | 2022-04-23 | 2022-08-05 | 中电万维信息技术有限责任公司 | 一种基于手机信令数据的游客行为偏好分析方法 |
CN117076786B (zh) * | 2023-08-31 | 2024-04-16 | 广州丰石科技有限公司 | 一种基于漫游信息的跨省旅行热门线路推荐方法 |
CN117455727B (zh) * | 2023-12-25 | 2024-03-08 | 西安文理学院 | 一种全程旅游智慧在线综合管理系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631781A (zh) * | 2014-11-26 | 2016-06-01 | 英业达科技有限公司 | 自动化导游方法 |
CN107423837A (zh) * | 2017-04-12 | 2017-12-01 | 宁夏丝路风情旅游网络股份有限公司 | 旅游路线的智能规划方法及系统 |
CN107680010A (zh) * | 2017-09-29 | 2018-02-09 | 桂林电子科技大学 | 一种基于游览行为的景区路线推荐方法及其系统 |
CN108198098A (zh) * | 2018-01-04 | 2018-06-22 | 深圳峰创优爱科技有限公司 | 一种自助旅游方法及移动终端 |
CN109034454A (zh) * | 2018-06-25 | 2018-12-18 | 腾讯大地通途(北京)科技有限公司 | 路线挖掘方法、装置、计算机可读存储介质和计算机设备 |
CN109684564A (zh) * | 2019-01-03 | 2019-04-26 | 东喜和仪(珠海市)数据科技有限公司 | 旅游服务推荐方法和装置 |
CN109978723A (zh) * | 2019-01-16 | 2019-07-05 | 深圳壹账通智能科技有限公司 | 旅游规划方法、装置、计算机设备及存储介质 |
CN110060182A (zh) * | 2019-03-16 | 2019-07-26 | 深圳壹账通智能科技有限公司 | 旅游行为追踪方法、装置、计算机设备和存储介质 |
CN110222277A (zh) * | 2019-05-06 | 2019-09-10 | 特斯联(北京)科技有限公司 | 一种基于大数据分析的旅游信息推荐方法及装置 |
CN110779536A (zh) * | 2018-07-31 | 2020-02-11 | 阿里巴巴集团控股有限公司 | 信息处理方法、信息显示方法、装置、终端及服务器 |
-
2020
- 2020-03-25 CN CN202010220317.1A patent/CN111429220B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631781A (zh) * | 2014-11-26 | 2016-06-01 | 英业达科技有限公司 | 自动化导游方法 |
CN107423837A (zh) * | 2017-04-12 | 2017-12-01 | 宁夏丝路风情旅游网络股份有限公司 | 旅游路线的智能规划方法及系统 |
CN107680010A (zh) * | 2017-09-29 | 2018-02-09 | 桂林电子科技大学 | 一种基于游览行为的景区路线推荐方法及其系统 |
CN108198098A (zh) * | 2018-01-04 | 2018-06-22 | 深圳峰创优爱科技有限公司 | 一种自助旅游方法及移动终端 |
CN109034454A (zh) * | 2018-06-25 | 2018-12-18 | 腾讯大地通途(北京)科技有限公司 | 路线挖掘方法、装置、计算机可读存储介质和计算机设备 |
CN110779536A (zh) * | 2018-07-31 | 2020-02-11 | 阿里巴巴集团控股有限公司 | 信息处理方法、信息显示方法、装置、终端及服务器 |
CN109684564A (zh) * | 2019-01-03 | 2019-04-26 | 东喜和仪(珠海市)数据科技有限公司 | 旅游服务推荐方法和装置 |
CN109978723A (zh) * | 2019-01-16 | 2019-07-05 | 深圳壹账通智能科技有限公司 | 旅游规划方法、装置、计算机设备及存储介质 |
CN110060182A (zh) * | 2019-03-16 | 2019-07-26 | 深圳壹账通智能科技有限公司 | 旅游行为追踪方法、装置、计算机设备和存储介质 |
CN110222277A (zh) * | 2019-05-06 | 2019-09-10 | 特斯联(北京)科技有限公司 | 一种基于大数据分析的旅游信息推荐方法及装置 |
Non-Patent Citations (3)
Title |
---|
"大数据"开启全域旅游新篇章 中国联通积极布局"大数据"旅游;黄春芳;《信息化建设》;全文 * |
From Motion Activity to Geo-Embeddings: Generating and Exploring Vector Representations of Locations, Traces and Visitors through Large-Scale Mobility Data;Crivellari, A;ISPRS INTERNATIONAL JOURNAL OF GEO-INFORMATION;全文 * |
周裕杰.基于大数据的区域联系及调度需求研究.中国优秀硕士学位论文全文数据库 信息科技辑.2019,(第09期),41-57. * |
Also Published As
Publication number | Publication date |
---|---|
CN111429220A (zh) | 2020-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111429220B (zh) | 基于运营商大数据的旅游路线推荐系统及方法 | |
CN104380293B (zh) | 基于位置从地图历史提供相关元素信息的方法和计算装置 | |
Comito et al. | Mining human mobility patterns from social geo-tagged data | |
CN105142106B (zh) | 基于手机信令数据的出行者职住地识别与出行链刻画方法 | |
CN102810118B (zh) | 一种变权网k近邻搜索方法 | |
CN106649656B (zh) | 一种面向数据库的时空轨迹大数据存储方法 | |
CN106920387B (zh) | 获取交通道路中路线热度的方法及装置 | |
Han et al. | Road-network aware trajectory clustering: Integrating locality, flow, and density | |
US9792813B2 (en) | Management of data collected for traffic analysis | |
CN106254142A (zh) | 一种基于移动通信运营数据的城市群体行为监测系统 | |
CN108320501A (zh) | 基于用户手机信令的公交线路识别方法 | |
CN105466435A (zh) | 一种导航系统的路线规划方法和装置 | |
EP3241367B1 (en) | Method and system for real-time computing of origin-destination matrices relating to attendees at a public happening through analysis of mobile communication network data | |
CN102097004A (zh) | 一种基于手机定位数据的出行od矩阵获取方法 | |
CN110880238B (zh) | 一种基于手机通信大数据的道路拥堵监测方法 | |
EP2608181B1 (en) | Method for detecting traffic | |
CN110222277B (zh) | 一种基于大数据分析的旅游信息推荐方法及装置 | |
Ma et al. | Deriving operational origin-destination matrices from large scale mobile phone data | |
CN105808754A (zh) | 一种从移动轨迹数据中快速发现聚集模式的方法 | |
US9955299B2 (en) | Method and system for a posteriori computation of origin-destination matrices relating to gathering of people through analysis of mobile communication network data | |
Lee et al. | Crowd-sourced carpool recommendation based on simple and efficient trajectory grouping | |
Muñoz-Villamizar et al. | Study of urban-traffic congestion based on Google Maps API: the case of Boston | |
Chen et al. | Understanding travel patterns of tourists from mobile phone data: A case study in Hainan | |
CN113313307A (zh) | 基于信令大数据的旅游路线挖掘方法 | |
CN114595300A (zh) | 一种结合多源时空数据的活动链重建方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |