CN107341693A - 旅游用户筛选的方法和旅游用户筛选的系统 - Google Patents
旅游用户筛选的方法和旅游用户筛选的系统 Download PDFInfo
- Publication number
- CN107341693A CN107341693A CN201710546055.6A CN201710546055A CN107341693A CN 107341693 A CN107341693 A CN 107341693A CN 201710546055 A CN201710546055 A CN 201710546055A CN 107341693 A CN107341693 A CN 107341693A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- strange land
- tourism
- travel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0253—During e-commerce, i.e. online transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0261—Targeted advertisements based on user location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明属于大数据处理/旅游技术领域,具体涉及一种旅游用户筛选的方法和旅游用户筛选的系统。该旅游用户筛选的方法,包括步骤:获取数据:从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;对数据进行分析处理:根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。本发明利用运营商的实时位置数据,可以获知用户异地出行、异地停留的轨迹,感知用户“去过哪”,利用移动用户上网记录,可以获知用户有无了解旅游资讯的兴趣或出行的意愿,判定哪些用户是旅游爱好者。进而,结合其以往行为数据,为其推荐适合的旅游信息。
Description
技术领域
本发明属于大数据处理/旅游技术领域,具体涉及一种旅游用户筛选的方法和旅游用户筛选的系统。
背景技术
随着经济的快速发展,旅游越来越成为人们满足精神享受的方式。景区、酒店、旅行社、OTA应用等均希望发掘旅游爱好者,向用户定向推送旅游相关信息。
目前,景区、酒店、旅行社等实体旅游行业主体,并无智能定位旅游爱好者以及发掘潜在客户群的有效方法及手段或渠道,均通过公共广告投放或向老顾客投放广告等实现信息宣传。OTA应用(Online Travel Agent,即在线旅行代理,例如携程、途牛、蚂蜂窝、去哪儿等),大多在APP应用商店推广应用,扩张注册用户数,再通过分析注册用户在其应用上的浏览、搜索、订购行为,向用户推荐相关度高的旅游信息及产品。
另外,OTA应用分散自立,仅能掌握本应用注册用户的行为特征和爱好,无法分析哪些非注册用户是旅游潜在用户,且对新注册用户也无信息推荐的依据。可见,目前客户群和实体旅游行业主体供需信息极度不对称,不利于旅游资源及产品的针对性营销和推广。
提供一种有效的旅游用户定位以及发掘新旅游用户方法,成为目前对旅游爱好者进行精准旅游资讯推荐亟待解决的技术问题。
发明内容
本发明所要解决的技术问题是针对现有技术中存在的上述不足,提供一种旅游用户筛选的方法和旅游用户筛选的系统,有效的解决了旅游用户定位以及发掘新旅游用户的问题。
解决本发明技术问题所采用的技术方案是该旅游用户筛选的方法,其中,基于移动运营商大数据进行分析和定位旅游爱好者,该方法包括步骤:
获取数据:从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;
对数据进行分析处理:根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。
优选的是,在对数据进行分析处理时,构造函数为:
根据构造函数计算每个用户的旅游爱好概率,大于预设阈值者即确定用户为旅游爱好者,其中:y为用户为旅游爱好者的概率,y∈[0,1];
为向量,f1为用户出现在异地的频次、t1为用户出现在异地的时长、r1为白天附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例、r2为晚上附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例、f2为用户使用的频次、t2为用户使用OTA应用的时长以及b为用户使用OTA应用的流量,上述各项均为正向特征,各项取值越大,用户为旅游爱好者的概率越高;
θ为调整参数,θ为向量。
优选的是,移动运营商大数据记录用户使用的移动终端与移动网络的所有信息交互,其中包括移动终端实时接入的基站/小区,且基站/小区的位置可转换为地图上的经纬度信息;
根据消息交互出现的时间和基站/小区的归属地,确定用户所在地点和时间,并根据用户常驻地进行比较,得出异地出行时间、地点、异地停留时间和次数;
以及,根据用户上网记录数据中与访问OTA应用、浏览旅游网页相关的流量统计和比较,结合用户访问OTA应用、浏览旅游网页的时间、地点以及后续所在地点和时间,判断用户是否有旅游倾向的概率。
优选的是,还包括根据用户以往历史行为数据,估计调整参数θ的步骤,包括:
根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ;
选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计;
将n个向量θ1,θ2,θ3...θn,分别带入构造函数,其中为上述m个已知旅游爱好者的样本取值,得到ym(θn);
计算并比较真实样本值与ym(θn)的误差和:
找出最小值Δy对应的样本,其对应的向量θ即为调整参数。
优选的是,对数据进行分析处理还包括根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析;
该方法还进一步包括:结合用户手机套餐使用情况,为旅游爱好者推荐相应档次的旅游资讯。
一种旅游用户筛选的系统,其基于移动运营商大数据进行分析和定位旅游爱好者,该系统包括数据获取模块1和数据分析处理模块,其中:
所述数据获取模块1:用于从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;
所述数据分析处理模块:用于根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。
优选的是,在所述数据分析处理模块中包括数据分类单元和计算单元,其中:
在所述数据分类单元中,对获取的数据进行如下分类:f1为用户出现在异地的频次、t1为用户出现在异地的时长、r1为白天附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例、r2为晚上附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例、f2为用户使用OTA应用的频次、t2为用户使用OTA应用的时长以及b为用户使用OTA应用的流量;
在所述计算单元中,构造函数为:
根据构造函数计算每个用户的旅游爱好概率,大于预设阈值者即确定用户为旅游爱好者,其中:y为用户为旅游爱好者的概率,y∈[0,1];
为向量,上述各项均为正向特征,各项取值越大,用户为旅游爱好者的概率越高;
θ为调整参数,θ为向量。
优选的是,移动运营商大数据记录用户使用的移动终端与移动网络的所有信息交互,其中包括移动终端实时接入的基站/小区,且基站/小区的位置可转换为地图上的经纬度信息;
在所述数据分类单元中,根据消息交互出现的时间和基站/小区的归属地,确定用户所在地点和时间,并根据用户常驻地进行比较,得出异地出行时间、地点、异地停留时间和次数;以及,根据用户上网记录数据中与访问OTA应用、浏览旅游网页相关的流量统计和比较,结合用户访问OTA应用、浏览旅游网页的时间、地点以及后续所在地点和时间,判断用户是否有旅游倾向的概率。
优选的是,所述数据分析处理模块还包括调整参数单元,用于根据用户以往历史行为数据,估计调整参数θ,包括:
根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ;
选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计;
将n个向量θ1,θ2,θ3...θn,分别带入构造函数,其中为上述m个已知旅游爱好者的样本取值,得到ym(θn);
计算并比较真实样本值与ym(θn)的误差和:
找出最小值Δy对应的样本,其对应的向量θ即为调整参数。
优选的是,所述数据分析处理模块还用于根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析;
该系统还进一步包括还包括资讯推荐模块,用于结合用户手机套餐使用情况,为旅游爱好者推荐相应档次的旅游资讯。
本发明的有益效果是:本发明的旅游用户筛选的方法和旅游用户筛选的系统,基于移动运营商大数据,从海量的数据中提炼或筛选出有用的当前位置和与旅游相关的数据,可以获知用户异地出行、异地停留的轨迹,感知用户“去过哪”;利用移动用户上网记录,可以获知用户有无了解旅游资讯的兴趣或出行的意愿,通过“做和想”的结合,可以科学、精准地判定“谁”是旅游爱好者,进而,结合用户以往行为数据,向这群人推荐“什么”,从而实现为用户推荐适合的旅游信息的目的,大大提高了数据资料的准确性和用户定位的有效性。
附图说明
图1为本发明实施例中旅游用户筛选的方法的流程图;
图2为本发明实施例中用户异地出行数据图;
图3为本发明实施例中用户异地停留数据图;
图4为本发明实施例中用户上网记录数据图;
图5为本发明实施例中用户手机消费数据图;
图6为本发明实施例中构造函数的曲线图;
图7为本发明实施例中旅游用户筛选的系统的结构框图;
附图标记中:
1-数据获取模块;
2-数据分析处理模块;21-数据分类单元;22-计算单元;23-调整参数单元;
3-资讯推荐模块。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。
本发明实施例提供一种基于运营商大数据的旅游用户挖掘及定位旅游用户并相应进行信息推荐的方法及相应的系统。该基于运营商大数据的旅游用户挖掘及信息推荐的方法及相应的系统,通过对用户异地出行、异地停留、上网行为等特征分析,挖掘热爱旅游的用户群,并根据用户以往旅游消费档次,结合手机消费情况,为用户推荐合适的旅游资讯。
该旅游用户筛选的方法,基于移动运营商大数据进行分析和定位旅游爱好者,包括步骤:
获取数据:从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;
对数据进行分析处理:根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。
其中,在对数据进行分析处理时,构造函数为:
根据构造函数计算每个用户的旅游爱好概率,大于预设阈值者即确定用户为旅游爱好者,其中:y为用户为旅游爱好者的概率,y∈[0,1];
为向量,f1为用户出现在异地的频次、t1为用户出现在异地的时长、r1为白天附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例、r2为晚上附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例、f2为用户使用的频次、t2为用户使用OTA应用的时长以及b为用户使用OTA应用的流量,上述各项均为正向特征,各项取值越大,用户为旅游爱好者的概率越高;
θ为调整参数,θ为向量。
其中,移动运营商大数据记录用户使用的移动终端与移动网络的所有信息交互,其中包括移动终端实时接入的基站/小区,且基站/小区的位置可转换为地图上的经纬度信息;根据消息交互出现的时间和基站/小区的归属地,确定用户所在地点和时间,并根据用户常驻地(移动运营商通过历史大数据挖掘分析得出)进行比较,得出异地出行时间、地点、异地停留时间和次数。
移动运营商大数据记录的信息包括手机号码、位置区编码、基站编码、终端设备标识(IMEI)、流量类型、开始时间、结束时间、上行流量、下行流量、访问的网络类型等等。运营商网络业务和信令大数据(语音/短信/上网接入基站/小区、附着、位置更新、切换、MR数据等)记录着每个用户移动终端的当前位置(位于哪个移动网络基站/小区内),通过信号转接可实时感知用户位于移动网络中的哪个小区。根据小区的行政区划分布表,可以获知用户位于哪个城市。经过长期的分析,可知用户的常驻地在哪里(城市级别);当当前位置与用户常驻地不一致时,说明其在异地出行。并可进一步通过所在基站/小区的归属城市,可知其在哪个异地城市。通过基站/小区的归属地、经纬度及位置场景类型、用户在各个基站/小区的停留时间等,从而获知用户的异地停留数据
运营商网络业务大数据记录着每个用户使用移动终端上网的各种信息,访问的应用/网站名称、产生的流量、使用的时长、访问的应用/网站类型等。根据用户上网记录数据中与访问OTA应用、浏览旅游网页相关的流量统计和比较,结合用户访问OTA应用、浏览旅游网页的时间、地点以及后续所在地点和时间,判断用户是否有旅游倾向的概率。
该方法还包括根据用户以往历史行为数据,估计调整参数θ的步骤,其中的调整参数为,根据运营商原始话单数据或统计分析结果数据进行计算得到。具体步骤包括:
根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ;
选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计;
将n个向量θ1,θ2,θ3...θn,分别带入构造函数,其中为上述m个已知旅游爱好者的样本取值,得到ym(θn);
计算并比较真实样本值与ym(θn)的误差和:
找出最小值Δy对应的样本,其对应的向量θ即为调整参数。
即通过M个样本取值,分别代入构造函数,估计n个调整参数,判断哪个误差和最小,最小者最趋近于真实值的估计值,最小者对应的估计值即为调整参数。这里应该理解的是,对调整参数的估算可以采用多种估计方法,例如最大似然估计等,这里仅以最小误差和估计法作为示例。
该方法还可以进一步包括旅游资讯推荐的步骤:对数据进行分析处理还包括根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析;
该方法还进一步包括:结合用户手机套餐使用情况,为旅游爱好者推荐相应档次的旅游资讯。
根据如图1所示的旅游用户筛选的方法的流程,详细说明该旅游用户筛选的方法如下:
步骤S1):获取数据。
基于运营商大数据获得如下几类数据:
(1)用户异地出行数据
用户使用的移动终端时刻与移动网络保持着信息交互,移动网络可实时感知用户位于网络中的哪个小区。根据小区的行政区划分布表,可以获知用户位于哪个城市。如图2所示,用户的当前位置在移动网络中可对应至基站/小区(位置区编码/小区号),根据基站/小区基础信息表可对应为经纬度,进而对应出城市;然后,可判断用户当前位置与常驻地是否一致,不一致则说明其在异地出行。
(2)用户异地停留数据
根据运营商网管系统对小区的基础信息记录,可获知用户位于哪类场所。如图3所示,用户异地出行的当前位置,也对应至移动网络中的基站/小区,根据基站/小区基础信息表可获知该小区的场景类型,是否在饭店、酒店、景区附近,可根据此判断用户是否具有旅游特征。
(3)用户上网记录数据
根据运营商网络侧采集的移动用户上网记录,可以获知用户访问的应用列表。如图4所示,可计算每个用户使用OTA应用的时长和流量。
(4)用户手机消费数据
根据运营商计费管理系统内的业务使用数据,可以获知用户的消费情况。如图5所示,可计算每个用户的月消费额度,为其消费水平提供参考。
步骤S2):对数据进行分析处理。
基于以上采集到的数据,评估用户对旅游的喜爱程度,即找到“谁”是旅游爱好者。
步骤S21):设置关键参数。
(1)找出周末或节假日前后出现在异地的用户,设用户出现在异地的频次为f1;
(2)设用户出现在异地的时长为t1;
(3)白天(如:8:00-20:00)附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例r1;
(4)晚上(如:20:00-次日8:00)附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例r2;
(5)使用OTA应用的频次为f2;
(6)使用OTA应用的时长为t2;
(7)使用OTA应用的流量为b;
步骤S22):构造预测模型。
上述特征均为正向特征,各项取值越大,用户是旅游爱好者的概率越高,设概率为y,则构造函数:
其中:θ为向量,θ为调整参数。构造函数的曲线如图6所示,y∈[0,1]。图6中,用户是否旅游用户的概率在[0,1]区间,x越大,概率越趋近于1。
步骤S23):根据用户以往历史行为数据,估计调整参数θ。
(1)根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ。
(2)选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计。
(3)将n个向量θ1,θ2,θ3...θn,分别带入公式(1)的构造函数其中为上述m个已知旅游爱好者的样本取值,得到ym(θn)。
(4)比较真实样本值与ym(θn)的误差和,找出最小值Δy,用户对应的向量θ即为调整参数:
(5)根据公式(1)的构造函数计算每个用户的旅游爱好概率,大于预设阈值(如0.5)者,即认为用户是旅游爱好者。
通过以上步骤,解决了“谁”是旅游爱好者的判定问题,接下来,需要解决向这群人推荐“什么”的问题。
步骤S3):推荐相应档次的旅游资讯。
在步骤S2)找到“谁”是旅游爱好者的基础上,实现给“谁”推荐旅游资讯能实现较大的推荐成果。
根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析,结合用户手机套餐使用情况,为用户划分旅游消费档次,比如划分为高、中、低档,为用户推荐相应的旅游资讯。
本发明还提供一种旅游用户筛选的系统,基于移动运营商大数据进行分析和定位旅游爱好者,如图7所示,该系统包括数据获取模块1和数据分析处理模块2,其中:
数据获取模块1:用于从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;
数据分析处理模块2:用于根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。
优选的是,在数据分析处理模块2中包括数据分类单元21和计算单元22,其中:
在数据分类单元21中,对获取的数据进行如下分类:f1为用户出现在异地的频次、t1为用户出现在异地的时长、r1为白天附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例、r2为晚上附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例、f2为用户使用OTA应用的频次、t2为用户使用OTA应用的时长以及b为用户使用OTA应用的流量;
在计算单元22中,构造函数为:
根据构造函数计算每个用户的旅游爱好概率,大于预设阈值者即确定用户为旅游爱好者,其中:y为用户为旅游爱好者的概率,y∈[0,1];
为向量,上述各项均为正向特征,各项取值越大,用户为旅游爱好者的概率越高;
θ为调整参数,θ为向量。
其中,移动运营商大数据记录用户使用的移动终端与移动网络的所有信息交互,其中包括移动终端实时接入的基站/小区,且基站/小区的位置可转换为地图上的经纬度信息;
在数据分类单元21中,根据消息交互出现的时间和基站/小区的归属地,确定用户所在地点和时间,并根据用户常驻地进行比较,得出异地出行时间、地点、异地停留时间和次数;
以及,根据用户上网记录数据中与访问OTA应用、浏览旅游网页相关的流量统计和比较,结合用户访问OTA应用、浏览旅游网页的时间、地点以及后续所在地点和时间,判断用户是否有旅游倾向的概率。
其中,数据分析处理模块2还包括调整参数单元23,用于根据用户以往历史行为数据,估计调整参数θ,包括:
根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ;
选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计;
将n个向量θ1,θ2,θ3...θn,分别带入构造函数,其中为上述m个已知旅游爱好者的样本取值,得到ym(θn);
计算并比较真实样本值与ym(θn)的误差和:
找出最小值Δy对应的样本,其对应的向量θ即为调整参数。
另外,作为进一步的应用,数据分析处理模块2还用于根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析;该系统还进一步包括还包括资讯推荐模块3,用于结合用户手机套餐使用情况,为旅游爱好者推荐相应档次的旅游资讯。
本发明的旅游用户筛选的方法和旅游用户筛选的系统,基于一种并不向大众公开的大数据平台,利用移动运营商大数据,通过对庞大的信息量整合和对比分析,从海量的数据中提炼或筛选出有用的当前位置和与旅游相关的数据,可以获知用户异地出行、异地停留的轨迹,感知用户“去过哪”;利用移动用户上网记录,可以获知用户有无了解旅游资讯的兴趣或出行的意愿,通过“做和想”的结合,可以科学、精准地判定“谁”是旅游爱好者,进而,结合用户以往行为数据,向这群人推荐“什么”,从而实现为用户推荐适合的旅游信息的目的,大大提高了数据资料的准确性和用户定位的有效性。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (10)
1.一种旅游用户筛选的方法,其特征在于,基于移动运营商大数据进行分析和定位旅游爱好者,该方法包括步骤:
获取数据:从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;
对数据进行分析处理:根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。
2.根据权利要求1所述的旅游用户筛选的方法,其特征在于,在对数据进行分析处理时,构造函数为:
根据构造函数计算每个用户的旅游爱好概率,大于预设阈值者即确定用户为旅游爱好者,其中:y为用户为旅游爱好者的概率,y∈[0,1];
为向量,f1为用户出现在异地的频次、t1为用户出现在异地的时长、r1为白天附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例、r2为晚上附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例、f2为用户使用的频次、t2为用户使用OTA应用的时长以及b为用户使用OTA应用的流量,上述各项均为正向特征,各项取值越大,用户为旅游爱好者的概率越高;
θ为调整参数,θ为向量。
3.根据权利要求2所述的旅游用户筛选的方法,其特征在于,移动运营商大数据记录用户使用的移动终端与移动网络的所有信息交互,其中包括移动终端实时接入的基站/小区,且基站/小区的位置可转换为地图上的经纬度信息;
根据消息交互出现的时间和基站/小区的归属地,确定用户所在地点和时间,并根据用户常驻地进行比较,得出异地出行时间、地点、异地停留时间和次数;
以及,根据用户上网记录数据中与访问OTA应用、浏览旅游网页相关的流量统计和比较,结合用户访问OTA应用、浏览旅游网页的时间、地点以及后续所在地点和时间,判断用户是否有旅游倾向的概率。
4.根据权利要求2所述的旅游用户筛选的方法,其特征在于,还包括根据用户以往历史行为数据,估计调整参数θ的步骤,包括:
根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ;
选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计;
将n个向量θ1,θ2,θ3...θn,分别带入构造函数,其中为上述m个已知旅游爱好者的样本取值,得到ym(θn);
计算并比较真实样本值与ym(θn)的误差和:
找出最小值Δy对应的样本,其对应的向量θ即为调整参数。
5.根据权利要求1所述的旅游用户筛选的方法,其特征在于,对数据进行分析处理还包括根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析;
该方法还进一步包括:结合用户手机套餐使用情况,为旅游爱好者推荐相应档次的旅游资讯。
6.一种旅游用户筛选的系统,其特征在于,基于移动运营商大数据进行分析和定位旅游爱好者,该系统包括数据获取模块和数据分析处理模块,其中:
所述数据获取模块:用于从移动运营商大数据中获取用户异地出行数据、用户异地停留数据、用户上网记录数据和用户手机消费数据;
所述数据分析处理模块:用于根据构造函数,对用户异地出行数据、用户异地停留数据和用户上网记录数据进行分析,确定用户为旅游爱好者。
7.根据权利要求6所述的旅游用户筛选的系统,其特征在于,在所述数据分析处理模块中包括数据分类单元和计算单元,其中:
在所述数据分类单元中,对获取的数据进行如下分类:f1为用户出现在异地的频次、t1为用户出现在异地的时长、r1为白天附着在位置场景类型为景区/饭店的小区的时长占用户当次异地停留时间的比例、r2为晚上附着在位置类型为酒店/饭店的小区的时长占用户当次异地停留时间的比例、f2为用户使用OTA应用的频次、t2为用户使用OTA应用的时长以及b为用户使用OTA应用的流量;
在所述计算单元中,构造函数为:
根据构造函数计算每个用户的旅游爱好概率,大于预设阈值者即确定用户为旅游爱好者,其中:y为用户为旅游爱好者的概率,y∈[0,1];
为向量,上述各项均为正向特征,各项取值越大,用户为旅游爱好者的概率越高;
θ为调整参数,θ为向量。
8.根据权利要求7所述的旅游用户筛选的系统,其特征在于,移动运营商大数据记录用户使用的移动终端与移动网络的所有信息交互,其中包括移动终端实时接入的基站/小区,且基站/小区的位置可转换为地图上的经纬度信息;
在所述数据分类单元中,根据消息交互出现的时间和基站/小区的归属地,确定用户所在地点和时间,并根据用户常驻地进行比较,得出异地出行时间、地点、异地停留时间和次数;以及,根据用户上网记录数据中与访问OTA应用、浏览旅游网页相关的流量统计和比较,结合用户访问OTA应用、浏览旅游网页的时间、地点以及后续所在地点和时间,判断用户是否有旅游倾向的概率。
9.根据权利要求7所述的旅游用户筛选的系统,其特征在于,所述数据分析处理模块还包括调整参数单元,用于根据用户以往历史行为数据,估计调整参数θ,包括:
根据用户历史数据及以往运营经验,从已建立的数据经验库中选取n个向量θ;
选取m个已知旅游爱好者的历史数据作为样本数据,对向量θ进行估计;
将n个向量θ1,θ2,θ3...θn,分别带入构造函数,其中为上述m个已知旅游爱好者的样本取值,得到ym(θn);
计算并比较真实样本值与ym(θn)的误差和:
找出最小值Δy对应的样本,其对应的向量θ即为调整参数。
10.根据权利要求6所述的旅游用户筛选的系统,其特征在于,所述数据分析处理模块还用于根据用户在异地附着小区的位置场景类型,对用户去过的酒店、饭店、景区的价格进行分析;
该系统还进一步包括还包括资讯推荐模块,用于结合用户手机套餐使用情况,为旅游爱好者推荐相应档次的旅游资讯。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710546055.6A CN107341693A (zh) | 2017-07-06 | 2017-07-06 | 旅游用户筛选的方法和旅游用户筛选的系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710546055.6A CN107341693A (zh) | 2017-07-06 | 2017-07-06 | 旅游用户筛选的方法和旅游用户筛选的系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107341693A true CN107341693A (zh) | 2017-11-10 |
Family
ID=60218459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710546055.6A Pending CN107341693A (zh) | 2017-07-06 | 2017-07-06 | 旅游用户筛选的方法和旅游用户筛选的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107341693A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107730330A (zh) * | 2017-11-14 | 2018-02-23 | 重庆途比达信息技术有限公司 | 旅游交互网络平台及其数据交互方法 |
CN109002549A (zh) * | 2018-07-31 | 2018-12-14 | 国政通科技有限公司 | 一种精准命中高端旅游潜在用户的方法及装置 |
CN109325177A (zh) * | 2018-09-06 | 2019-02-12 | 广州视源电子科技股份有限公司 | 信息推送方法、系统、可读存储介质和计算机设备 |
CN110049446A (zh) * | 2019-03-25 | 2019-07-23 | 浙江每日互动网络科技股份有限公司 | 一种基于移动终端数据获取终端用户属性标签的服务器 |
CN110177152A (zh) * | 2019-06-11 | 2019-08-27 | 秒针信息技术有限公司 | 一种资讯推送方法及装置 |
CN110795637A (zh) * | 2019-11-06 | 2020-02-14 | 黑龙江科技大学 | 基于5g网络和历史旅游信息的个人定制式国内旅游景区推荐系统及方法 |
CN111556434A (zh) * | 2020-04-28 | 2020-08-18 | 中国联合网络通信集团有限公司 | 一种游客画像方法及装置 |
CN113079472A (zh) * | 2021-03-15 | 2021-07-06 | 湖南科技大学 | 一种信息精准发送方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8914399B1 (en) * | 2011-03-09 | 2014-12-16 | Amazon Technologies, Inc. | Personalized recommendations based on item usage |
CN106487664A (zh) * | 2016-12-08 | 2017-03-08 | 宇龙计算机通信科技(深圳)有限公司 | 一种信息推荐的方法、装置及移动终端 |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
CN106570722A (zh) * | 2016-10-31 | 2017-04-19 | 上海斐讯数据通信技术有限公司 | 一种智能推荐系统及智能推荐方法 |
-
2017
- 2017-07-06 CN CN201710546055.6A patent/CN107341693A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8914399B1 (en) * | 2011-03-09 | 2014-12-16 | Amazon Technologies, Inc. | Personalized recommendations based on item usage |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
CN106570722A (zh) * | 2016-10-31 | 2017-04-19 | 上海斐讯数据通信技术有限公司 | 一种智能推荐系统及智能推荐方法 |
CN106487664A (zh) * | 2016-12-08 | 2017-03-08 | 宇龙计算机通信科技(深圳)有限公司 | 一种信息推荐的方法、装置及移动终端 |
Non-Patent Citations (1)
Title |
---|
张富峥: "《基于大规模位置和消费数据的用户行为理解》", 《万方学位论文数据库》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107730330A (zh) * | 2017-11-14 | 2018-02-23 | 重庆途比达信息技术有限公司 | 旅游交互网络平台及其数据交互方法 |
CN107730330B (zh) * | 2017-11-14 | 2022-04-19 | 重庆途比达信息技术有限公司 | 旅游交互网络平台及其数据交互方法 |
CN109002549A (zh) * | 2018-07-31 | 2018-12-14 | 国政通科技有限公司 | 一种精准命中高端旅游潜在用户的方法及装置 |
CN109325177A (zh) * | 2018-09-06 | 2019-02-12 | 广州视源电子科技股份有限公司 | 信息推送方法、系统、可读存储介质和计算机设备 |
CN109325177B (zh) * | 2018-09-06 | 2021-05-14 | 广州视源电子科技股份有限公司 | 信息推送方法、系统、可读存储介质和计算机设备 |
CN110049446A (zh) * | 2019-03-25 | 2019-07-23 | 浙江每日互动网络科技股份有限公司 | 一种基于移动终端数据获取终端用户属性标签的服务器 |
CN110177152A (zh) * | 2019-06-11 | 2019-08-27 | 秒针信息技术有限公司 | 一种资讯推送方法及装置 |
CN110795637A (zh) * | 2019-11-06 | 2020-02-14 | 黑龙江科技大学 | 基于5g网络和历史旅游信息的个人定制式国内旅游景区推荐系统及方法 |
CN110795637B (zh) * | 2019-11-06 | 2023-04-25 | 黑龙江科技大学 | 基于5g网络和历史旅游信息的个人定制式国内旅游景区推荐方法 |
CN111556434A (zh) * | 2020-04-28 | 2020-08-18 | 中国联合网络通信集团有限公司 | 一种游客画像方法及装置 |
CN113079472A (zh) * | 2021-03-15 | 2021-07-06 | 湖南科技大学 | 一种信息精准发送方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107341693A (zh) | 旅游用户筛选的方法和旅游用户筛选的系统 | |
Jiang et al. | Activity-based human mobility patterns inferred from mobile phone data: A case study of Singapore | |
Ghahramani et al. | Urban sensing based on mobile phone data: Approaches, applications, and challenges | |
Widhalm et al. | Discovering urban activity patterns in cell phone data | |
Isaacman et al. | Ranges of human mobility in Los Angeles and New York | |
Becker et al. | A tale of one city: Using cellular network data for urban planning | |
Smith et al. | Ubiquitous sensing for mapping poverty in developing countries | |
Demissie et al. | Exploring cellular network handover information for urban mobility analysis | |
Zhang et al. | Daily OD matrix estimation using cellular probe data | |
Furletti et al. | Identifying users profiles from mobile calls habits | |
Doyle et al. | Utilising mobile phone billing records for travel mode discovery | |
Baggio et al. | Strategic visitor flows and destination management organization | |
GB2497931A (en) | Inferring repeated journey patterns of a mobile telephone from network data | |
CN105893537A (zh) | 地理信息点的确定方法和装置 | |
EP3241367B1 (en) | Method and system for real-time computing of origin-destination matrices relating to attendees at a public happening through analysis of mobile communication network data | |
EP3014491B1 (en) | Displaying demographic data | |
Demissie et al. | Inferring origin-destination flows using mobile phone data: A case study of Senegal | |
US20150006255A1 (en) | Determining demographic data | |
Bwambale et al. | Modelling long-distance route choice using mobile phone call detail record data: a case study of Senegal | |
Kanasugi et al. | Spatiotemporal route estimation consistent with human mobility using cellular network data | |
Pu et al. | Visual analysis of people's mobility pattern from mobile phone data | |
Leng et al. | Analysis of tourism dynamics and special events through mobile phone metadata | |
Silva et al. | Discovering mobile application usage patterns from a large-scale dataset | |
CN111104468B (zh) | 一种基于语义轨迹推断用户活动的方法 | |
EP3241369B1 (en) | Method and system for a posteriori computation of origin-destination matrices relating to gathering of people through analysis of mobile communication network data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171110 |
|
RJ01 | Rejection of invention patent application after publication |