CN111182463B - 一种区域实时客流来源分析方法及装置 - Google Patents
一种区域实时客流来源分析方法及装置 Download PDFInfo
- Publication number
- CN111182463B CN111182463B CN201811344928.6A CN201811344928A CN111182463B CN 111182463 B CN111182463 B CN 111182463B CN 201811344928 A CN201811344928 A CN 201811344928A CN 111182463 B CN111182463 B CN 111182463B
- Authority
- CN
- China
- Prior art keywords
- user
- base station
- real
- time
- station cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 62
- 238000013507 mapping Methods 0.000 claims abstract description 29
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000010801 machine learning Methods 0.000 claims description 15
- 238000001914 filtration Methods 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000007405 data analysis Methods 0.000 claims description 4
- 238000010295 mobile communication Methods 0.000 abstract description 13
- 230000011664 signaling Effects 0.000 abstract description 5
- 230000001419 dependent effect Effects 0.000 abstract 1
- 230000008569 process Effects 0.000 description 18
- 238000012549 training Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000005211 surface analysis Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Signal Processing (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明实施例公开了一种区域实时客流来源分析方法及装置,方法包括:获取预设时间段的用户位置数据生成位置快照信息;根据位置快照信息获知用户当前所在的基站小区,将热点区域与基站小区进行拟合,得到热点区域与基站小区的映射表;根据位置快照信息和映射表对区域实时客流进行统计,建立用户常驻地模型,将统计结果输入用户常驻地模型,得到区域实时客流的来源。通过小区拟合,对区域实时客流进行统计,并建立用户常驻地模型分析得到区域实时客流的来源,是基于移动通信信令数据,而不是依赖于传统的人工统计或少数区域的单点采集,实现对区域实时客流来源地的完整判断和准确分析,数据覆盖广、采集成本低、时间短、效率高且结果可靠。
Description
技术领域
本发明实施例涉及移动通信技术领域,具体涉及一种区域实时客流来源分析方法及装置。
背景技术
在移动通信领域之外,目前尚缺乏对区域实时客流来源的可靠分析方案。一些旅游景点,采用的是事后根据票务信息、景点身份证读卡信息、旅行团报名信息来粗略统计客流的来源;一些交通枢纽/站点,可以大致根据票务信息来统计到站客流的来源,但对于离站的客流,基本上没有有效的统计和判断方法;对于一些商圈客流,使用较多的是问卷调查等方法来统计和确认客流来源。移动通信领域内,目前使用的技术主要是通过模型训练,得到用户的区县级居住地,以居住地作为客流的来源地。
移动通信领域外使用的是传统的客流来源统计分析方法,周期长、成本高、数据覆盖面小、更新频率低,且易于出错。移动通信领域内目前所使用的基于模型训练的用户居住地客流来源判断方法,有一定的合理性,该技术方案依赖于事先根据数天的数据来训练得到居住地表,对于刚漫入本地的国外/境外用户、省外用户和临时过境客流,存在分析“漏洞”,对于本地用户漫游到省外/境外后再次回到本地的情况,再根据前期训练得到的居住地表分析则可能对来源存在误判。
发明内容
由于现有方法存在上述问题,本发明实施例提出一种区域实时客流来源分析方法及装置。
第一方面,本发明实施例提出一种区域实时客流来源分析方法,包括:
获取预设时间段的用户位置数据,并根据所述用户位置数据生成位置快照信息;
根据所述位置快照信息获知用户当前所在的基站小区,将热点区域与所述基站小区进行拟合,得到热点区域与所述基站小区的映射表;
根据所述位置快照信息和所述映射表对区域实时客流进行统计,得到统计结果;
建立用户常驻地模型,将所述统计结果输入所述用户常驻地模型,得到区域实时客流的来源。
可选地,所述获取预设时间段的用户位置数据,并根据所述用户位置数据生成位置快照信息,具体包括:
通过集群从共享层实时接入全省的2G/3G/4G全量外部数据表示法xDR话单数据到大数据平台,以五分钟为一个时间切片,获取最近五分钟的xDR话单数据;
从所述五分钟的xDR话单数据中抽取时间、手机号码和小区通用网关接口CGI关键信息,过滤预设字段,得到精简的xDR话单数据;
对所述精简的xDR话单数据以手机号码为key,进行不同接口话单之间的关联和排序,根据手机号码的号段表回填各号码的归属地,并根据物联网号段信息标记物联网卡号码,生成用户每一个五分钟的位置快照信息。
可选地,所述将热点区域与所述基站小区进行拟合,具体包括:
若判断获知所述基站小区的经纬度位于所述热点区域内部,则确定所述基站小区为热点区域覆盖小区;
若判断获知所述基站小区的经纬度位于所述热点区域外部,则根据机器学习的区域与基站小区拟合算法进行判断。
可选地,所述机器学习的区域与基站小区拟合算法具体包括:
通过数据分析,建立信号强度预测模型;
根据观测点与小区的距离、观测点与小区天线朝向夹角两个维度预测信号强度,如果所述信号强度大于阀值,则确定所述基站小区可以覆盖所述热点区域,否则确定所述基站小区无法覆盖所述热点区域。
可选地,所述建立用户常驻地模型,将所述统计结果输入所述用户常驻地模型,得到区域实时客流的来源,具体包括:
建立用户常驻地模型;
根据区域当前的客流号码明细,以预设时间段的用户所驻留基站小区位置对应的区县作为用户的实时来源,将所述实际来源输入所述用户常驻地模型匹配得到第一区域实时客流的来源;
对于所述第一区域实时客流以外的第二区域实时客流,根据所述用户常驻地模型中最新的漫出表进行匹配,匹配得到漫出外地后重新回来的本地用户的第二区域实时客流的来源;
对于除所述第一区域实时客流和所述第二区域实时客流以外的第三区域实时客流,以所述用户常驻地模型中用户常驻地作为第三区域实时客流的来源;
对于除所述第一区域实时客流、所述第二区域实时客流和所述第三区域实时客流以外的第四区域实时客流,以所述用户常驻地模型中用户号码的归属地作为第四区域实时客流的来源。
第二方面,本发明实施例还提出一种区域实时客流来源分析装置,包括:
快照信息生成模块,用于获取预设时间段的用户位置数据,并根据所述用户位置数据生成位置快照信息;
映射表获取模块,用于根据所述位置快照信息获知用户当前所在的基站小区,将热点区域与所述基站小区进行拟合,得到热点区域与所述基站小区的映射表;
结果统计模块,用于根据所述位置快照信息和所述映射表对区域实时客流进行统计,得到统计结果;
来源分析模块,用于建立用户常驻地模型,将所述统计结果输入所述用户常驻地模型,得到区域实时客流的来源。
可选地,所述快照信息生成模块具体用于:
通过集群从共享层实时接入全省的2G/3G/4G全量外部数据表示法xDR话单数据到大数据平台,以五分钟为一个时间切片,获取最近五分钟的xDR话单数据;
从所述五分钟的xDR话单数据中抽取时间、手机号码和小区通用网关接口CGI关键信息,过滤预设字段,得到精简的xDR话单数据;
对所述精简的xDR话单数据以手机号码为key,进行不同接口话单之间的关联和排序,根据手机号码的号段表回填各号码的归属地,并根据物联网号段信息标记物联网卡号码,生成用户每一个五分钟的位置快照信息。
可选地,所述映射表获取模块具体用于:
若判断获知所述基站小区的经纬度位于所述热点区域内部,则确定所述基站小区为热点区域覆盖小区;
若判断获知所述基站小区的经纬度位于所述热点区域外部,则根据机器学习的区域与基站小区拟合算法进行判断。
第三方面,本发明实施例还提出一种电子设备,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述方法。
第四方面,本发明实施例还提出一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述方法。
由上述技术方案可知,本发明实施例通过将热点区域与基站小区进行拟合,对区域实时客流进行统计,并建立用户常驻地模型分析得到区域实时客流的来源,是基于移动通信信令数据,而不是依赖于传统的人工统计或少数区域的单点采集,实现对区域实时客流来源地的完整判断和准确分析,数据覆盖广、采集成本低、时间短、效率高且结果可靠。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
图1为本发明一实施例提供的一种区域实时客流来源分析方法的流程示意图;
图2为本发明另一实施例提供的一种区域实时客流来源分析方法的流程示意图;
图3为本发明一实施例提供的生成位置快照信息的流程示意图;
图4为本发明一实施例提供的区域与基站小区拟合的流程示意图;
图5为本发明一实施例提供的基于机器学习的区域与基站小区拟合算法的流程示意图;
图6为本发明一实施例提供的信号强度与小区距离的关系示意图;
图7为本发明一实施例提供的前馈神经网络的模型架构示意图;
图8为本发明一实施例提供的sigmoid函数表达式及图像示意图;
图9为本发明一实施例提供的区域客流统计的流程示意图;
图10为本发明一实施例提供的建立用户常驻地模型的流程示意图;
图11为本发明一实施例提供的用户的来源地分析的流程示意图;
图12为本发明一实施例提供的一种区域实时客流来源分析装置的结构示意图;
图13为本发明一实施例提供的电子设备的逻辑框图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
图1示出了本实施例提供的一种区域实时客流来源分析方法的流程示意图,包括:
S101、获取预设时间段的用户位置数据,并根据所述用户位置数据生成位置快照信息。
其中,所述预设时间段根据需要设定,例如五分钟。
所述位置快照信息包括用户的手机号码、占用的基站小区CGI信息、记录的时间、号码的归属地以及物联网卡号码等信息。
S102、根据所述位置快照信息获知用户当前所在的基站小区,将热点区域与所述基站小区进行拟合,得到热点区域与所述基站小区的映射表。
其中,热点区域与所述基站小区进行拟合是为了确认基站小区是否覆盖热点区域,并根据拟合的结果形成热点区域与基站小区的映射表。
S103、根据所述位置快照信息和所述映射表对区域实时客流进行统计,得到统计结果。
S104、建立用户常驻地模型,将所述统计结果输入所述用户常驻地模型,得到区域实时客流的来源。
其中,用户常驻地模型是根据多天的用户五分钟位置快照表,训练得到用户的区县级常驻地模型。
本实施例在移动通信网的基础上,根据用户的手机终端与移动通信网的信息交互,提出了一种基于位置快照算法和区域基站小区拟合算法,利用用户位置快照和常驻地数据,对区域实时客流来源进行分析的方法,实现对区域实时客流来源地完整判断和准确分析,详细的分析过程如图2所示。
本实施例通过将热点区域与基站小区进行拟合,对区域实时客流进行统计,并建立用户常驻地模型分析得到区域实时客流的来源,是基于移动通信信令数据,而不是依赖于传统的人工统计或少数区域的单点采集,实现对区域实时客流来源地的完整判断和准确分析,数据覆盖广、采集成本低、时间短、效率高且结果可靠。
进一步地,在上述方法实施例的基础上,S101具体包括:
通过集群从共享层实时接入全省的2G/3G/4G全量外部数据表示法xDR话单数据到大数据平台,以五分钟为一个时间切片,获取最近五分钟的xDR话单数据。
从所述五分钟的xDR话单数据中抽取时间、手机号码和小区通用网关接口CGI关键信息,过滤预设字段,得到精简的xDR话单数据。
对所述精简的xDR话单数据以手机号码为key,进行不同接口话单之间的关联和排序,根据手机号码的号段表回填各号码的归属地,并根据物联网号段信息标记物联网卡号码,生成用户每一个五分钟的位置快照信息。
在生成位置快照信息的过程中,参见图3,具体包括以下步骤:
步骤一:通过kafka集群从共享层实时接入全省的2G/3G/4G全量xDR话单数据到PaaS大数据平台。
步骤二:以五分钟为一个时间切片,获取最近五分钟的xDR数据。
步骤三:从最近获取得到的五分钟xDR话单数据中抽取时间、手机号码、小区CGI等关键信息,过滤其他字段,得到精简的xDR数据。
步骤四:对最近五分钟的精简xDR话单数据以手机号码为key,进行不同接口话单之间的关联和排序,若一个五分钟之内用户存在多条记录,则从时间最新的记录中抽取用户的手机号码、占用的基站小区CGI信息、记录的时间。
步骤五:根据号段表回填各号码的归属地。
步骤六:根据物联网号段信息标记物联网卡号码。
步骤七:生成全省用户的五分钟快照准实时位置,每个用户当前五分钟内所在的最新基站位置被记录。
步骤八:将用户五分钟位置快照数据入库。循环上述流程,得到用户每一个五分钟的位置快照信息。
进一步地,在上述方法实施例的基础上,S102中所述将热点区域与所述基站小区进行拟合,具体包括:
若判断获知所述基站小区的经纬度位于所述热点区域内部,则确定所述基站小区为热点区域覆盖小区;
若判断获知所述基站小区的经纬度位于所述热点区域外部,则根据机器学习的区域与基站小区拟合算法进行判断。
其中,所述机器学习的区域与基站小区拟合算法具体包括:
通过数据分析,建立信号强度预测模型。
根据观测点与小区的距离、观测点与小区天线朝向夹角两个维度预测信号强度,如果所述信号强度大于阀值,则确定所述基站小区可以覆盖所述热点区域,否则确定所述基站小区无法覆盖所述热点区域。
具体地,参见图4,得到用户的五分钟位置快照表后,即可知道用户当前所在的基站小区位置,针对所要分析的热点区域,确定区域的边界,根据基站小区的覆盖范围,与区域位置进行拟合,得到区域与基站小区的映射表,并将区域与基站小区映射表入库。
其中,区域与基站小区拟合算法支持矩形、规则或不规则多边形、圆形三类形状的电子围栏区域定义。首先对基站小区的GPS坐标进行转换,转换成与电子地图相同的坐标系。接下来开始进行区域及基站小区的拟合计算。分两种情况:1)通过计算比较,经纬度位于区域内部的基站小区,会被记为区域覆盖小区;2)对于位置在区域边界以外的基站小区,通过下列基于机器学习的区域与基站小区拟合算法进行判断。
该算法流程如图5所示,通过数据分析,建立信号强度预测模型,根据“到小区距离(观测点与小区的距离)”、“角度(观测点与小区天线朝向夹角)”两个维度预测信号强度,之后设定一个信号强度的阀值,如果大于这个阀值,说明小区可以覆盖到这个区域,反之则表明该小区在目标区域内信号弱,不会或者基本不会被占用到。这个算法的优点在于:通过信号强度判定小区是否覆盖区域,而信号强度是通过合理的算法模型不断训练测试和验证得到的,而非人为随机确定。该拟合算法经过三步后实现:
第一步:信号强度数据分析。
利用S1U_http话单表中所采集到的用户终端的GPS数据,分析基站小区信号的覆盖距离、信号覆盖点与基站小区的角度、小区信号强度三者之间的数学关系。将信号强度归一化(压缩到0-1之间),统计每个小区0-3000米覆盖范围内各角度的信号强度,得到关系图如图6所示。
通过以上分析大致可以看出,当距离小区比较近的时候,信号强度变化小,当距离小区距离达到几百米的时候,信号强度急剧下降,当距离小区比较远的时候,信号强度已经趋近于零。
第二步:建立机器学习模型,学习到小区距离、角度与信号强度之间的模型参数。
建立广义线性回归的机器学习模型,通过到小区距离、角度这两个变量预测信号强度。由上图结果可知,这三者之间并非是简单的线性关系,而是呈现S型的相关关系,所以在此采用前馈神经网络实现,便于学习非线性相关关系,模型架构如图7所示。
1)正向传播的过程:
隐藏层及计算
加权求和:H1=in1*W_01+in2*w_02,非线性化变换:O1=sigmoid(0,H1)
加权求和:H2=in1*W_03+in2*w_04,非线性化变换:O2=sigmoid(0,H2)
加权求和:H3=in1*W_05+in2*w_06,非线性化变换:O3=sigmoid(0,H3)
其中sigmoid函数表达式及图像如图8所示。
通过sigmoid函数变换,将原始数据进行非线性变换,从而让神经网络学习到非线性相关的规律。
输出层计算
加权求和:Out=W_11*O1+W_12*O2+W_13*O3
综上所述,正向传播的过程就是根据“到小区距离”、“角度”这两个维度预测出“信号强度”值的过程。但是预测出来的“信号强度”可能是有偏差的,这取决于W参数的大小是多少,一定存在一组W参数,使得预测效果最好,下面通过“反向传播”算法来科学、最快地更新W参数,以便于模型逐步的优化,越来越“聪明”。
2)反向传播的过程
反向传播的过程就是不断更新W参数的过程,使得模型越来越优化,也就是机器学习的过程。在此采用梯度下降的方法来实现,正向传播结束后,预测值跟真实值之间会存在误差,计算误差对每一个W参数的偏导数,就是计算梯度的过程,W参数沿着梯度下降的反方向更新,就能最终达到最小误差,从而变成一组最佳拟合参数。机器学习的过程就是学习这么一组最佳W参数,使得预测结果跟实际结果误差最小。通过反复不断地迭代,对每个小区都进行这样的机器学习,就会得到每个小区的信号强度预测模型。
第三步:计算小区覆盖范围。
通过第二步训练好的机器学习模型,输入“到小区距离”、“角度”,可预测出“信号强度”,这个信号强度是一个“0-1”之间的实数。设计一个小区距离、角度、信号强度对应关系表,表结构如下,将模型运算出来的结果插入到表中(其中,信号强度这一项是通过第二步的模型预测出来的):
小区ID | 到小区距离 | 角度 | 信号强度 |
ID00001 | 151m | 30° | 0.97 |
ID00001 | 1013m | 30° | 0.36 |
通过由内到外遍历小区边缘,查询上表,可以设定一个信号强度阀值(比如设置为0.2),那么当划定区域的边缘预测出来的信号强度大于0.2的时候,认为小区覆盖了这个区域,否则不覆盖。
进一步地,在上述方法实施例的基础上,S104具体包括:
建立用户常驻地模型。
根据区域当前的客流号码明细,以预设时间段的用户所驻留基站小区位置对应的区县作为用户的实时来源,将所述实际来源输入所述用户常驻地模型匹配得到第一区域实时客流的来源。
对于所述第一区域实时客流以外的第二区域实时客流,根据所述用户常驻地模型中最新的漫出表进行匹配,匹配得到漫出外地后重新回来的本地用户的第二区域实时客流的来源。
对于除所述第一区域实时客流和所述第二区域实时客流以外的第三区域实时客流,以所述用户常驻地模型中用户常驻地作为第三区域实时客流的来源。
对于除所述第一区域实时客流、所述第二区域实时客流和所述第三区域实时客流以外的第四区域实时客流,以所述用户常驻地模型中用户号码的归属地作为第四区域实时客流的来源。
具体地,用户五分钟位置快照表,记录了用户当前所在的基站位置,而区域与基站映射表,则明确了区域的覆盖小区信息。两者结合,即可计算得到区域内具有存在哪些用户,实现区域客流的统计,如图9所示,需要说明的是,区域客流计算时过滤物联网卡号码。
建立用户常驻地模型,根据多天的用户五分钟位置快照表,训练得到用户的区县级常驻地,如图10所示。用户常驻地的模型定义如下:
对一周连续7天的五分钟位置快照表进行分析,针对每一用户,统计分析7天内每一天凌晨0点至5点期间用户驻留时长最长的基站小区,并根据区县与及基站小区的映射表,确定用户所驻留的行政区。针对上述计算得到的每一用户7天驻留的县区进行统计分析,若一周内五天或以上夜间驻留的区县相同,则该区县作为用户的常驻地。若模型会包含本地用户以及常驻本地的外地用户,该模型没有命中的用户,则说明在此7天分析周期内,该用户驻留本地市的时间较短或者没有较稳定的常驻地,以号码归属地作为其常驻地。用户的常驻地每周滚动更新一次,不断进行训练。
经过上述步骤,已经具备了对客流来源分析的数据基础。经过如下四个分析逻辑,准确且全面地得到用户的来源地分析和人数统计,参见图11:
流程一:根据区域当前的客流号码明细,以1小时前(具体的时间可根据需求进行调整)用户所驻留基站小区位置对应的区县作为用户的实时来源,可匹配出大部分用户的来源地。
流程二:对于流程一中没有匹配出来源地的用户,可能是本地漫出外地一段时间后刚回到本地的用户,又或者长时间关机后重启的用户等情形,此时利用最新的漫出表进行匹配,可匹配得到漫出外地后重新回来的本地用户的来源地。此时,以漫出地作为其来源,也与实际情况更为相符。
流程三:经过上2个流程后,可以匹配到大部分用户的来源地,对于某些原因造成1小时前没有快照表记录的用户号码,将以用户常驻地作为其来源地。
流程四:经过前3个流程后,若有少数用户匹配不到来源地,比如省外、国外用户刚漫入到本地的场景,此种情况则可以以用户号码的归属地作为其来源。
本申请提案根据用户的手机终端与移动通信网的信息交互,基于移动通信信令数据,而不是依赖于传统的人工统计或少数区域的单点采集,实现对区域实时客流来源地完整判断和准确分析。具有数据覆盖广、采集成本低、时间短的优点;本提案对区域客流来源的分析,充分考虑了现实中的各类场景,首创以用户位置快照、HLR漫出数据和常驻地对来源进行综合分析的流程和方法,实现对区域实时客流的来源的全面准确分析,速度快、效率高、结果可靠。
图12示出了本实施例提供的一种区域实时客流来源分析装置的结构示意图,所述装置包括:快照信息生成模块1201、映射表获取模块1202、结果统计模块1203和来源分析模块1204,其中:
所述快照信息生成模块1201用于获取预设时间段的用户位置数据,并根据所述用户位置数据生成位置快照信息;
所述映射表获取模块1202用于根据所述位置快照信息获知用户当前所在的基站小区,将热点区域与所述基站小区进行拟合,得到热点区域与所述基站小区的映射表;
所述结果统计模块1203用于根据所述位置快照信息和所述映射表对区域实时客流进行统计,得到统计结果;
所述来源分析模块1204用于建立用户常驻地模型,将所述统计结果输入所述用户常驻地模型,得到区域实时客流的来源。
具体地,所述快照信息生成模块1201获取预设时间段的用户位置数据,并根据所述用户位置数据生成位置快照信息;所述映射表获取模块1202根据所述位置快照信息获知用户当前所在的基站小区,将热点区域与所述基站小区进行拟合,得到热点区域与所述基站小区的映射表;所述结果统计模块1203根据所述位置快照信息和所述映射表对区域实时客流进行统计,得到统计结果;所述来源分析模块1204建立用户常驻地模型,将所述统计结果输入所述用户常驻地模型,得到区域实时客流的来源。
本实施例通过将热点区域与基站小区进行拟合,对区域实时客流进行统计,并建立用户常驻地模型分析得到区域实时客流的来源,是基于移动通信信令数据,而不是依赖于传统的人工统计或少数区域的单点采集,实现对区域实时客流来源地的完整判断和准确分析,数据覆盖广、采集成本低、时间短、效率高且结果可靠。
进一步地,在上述装置实施例的基础上,所述快照信息生成模块1201具体用于:
通过集群从共享层实时接入全省的2G/3G/4G全量外部数据表示法xDR话单数据到大数据平台,以五分钟为一个时间切片,获取最近五分钟的xDR话单数据;
从所述五分钟的xDR话单数据中抽取时间、手机号码和小区通用网关接口CGI关键信息,过滤预设字段,得到精简的xDR话单数据;
对所述精简的xDR话单数据以手机号码为key,进行不同接口话单之间的关联和排序,根据手机号码的号段表回填各号码的归属地,并根据物联网号段信息标记物联网卡号码,生成用户每一个五分钟的位置快照信息。
进一步地,在上述装置实施例的基础上,所述映射表获取模块1202具体用于:
若判断获知所述基站小区的经纬度位于所述热点区域内部,则确定所述基站小区为热点区域覆盖小区;
若判断获知所述基站小区的经纬度位于所述热点区域外部,则根据机器学习的区域与基站小区拟合算法进行判断。
本实施例所述的区域实时客流来源分析装置可以用于执行上述方法实施例,其原理和技术效果类似,此处不再赘述。
参照图13,所述电子设备,包括:处理器(processor)1301、存储器(memory)1302和总线1303;
其中,
所述处理器1301和存储器1302通过所述总线1303完成相互间的通信;
所述处理器1301用于调用所述存储器1302中的程序指令,以执行上述各方法实施例所提供的方法。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种区域实时客流来源分析方法,其特征在于,包括:
获取预设时间段的用户位置数据,并根据所述用户位置数据生成位置快照信息;
根据所述位置快照信息获知用户当前所在的基站小区,将热点区域与所述基站小区进行拟合,得到热点区域与所述基站小区的映射表;
根据所述位置快照信息和所述映射表对区域实时客流进行统计,得到统计结果;
建立用户常驻地模型,将所述统计结果输入所述用户常驻地模型,得到区域实时客流的来源。
2.根据权利要求1所述的方法,其特征在于,所述获取预设时间段的用户位置数据,并根据所述用户位置数据生成位置快照信息,具体包括:
通过集群从共享层实时接入全省的2G/3G/4G全量外部数据表示法xDR话单数据到大数据平台,以五分钟为一个时间切片,获取最近五分钟的xDR话单数据;
从所述五分钟的xDR话单数据中抽取时间、手机号码和小区通用网关接口CGI关键信息,过滤预设字段,得到精简的xDR话单数据;
对所述精简的xDR话单数据以手机号码为key,进行不同接口话单之间的关联和排序,根据手机号码的号段表回填各号码的归属地,并根据物联网号段信息标记物联网卡号码,生成用户每一个五分钟的位置快照信息。
3.根据权利要求1所述的方法,其特征在于,所述将热点区域与所述基站小区进行拟合,具体包括:
若判断获知所述基站小区的经纬度位于所述热点区域内部,则确定所述基站小区为热点区域覆盖小区;
若判断获知所述基站小区的经纬度位于所述热点区域外部,则根据机器学习的区域与基站小区拟合算法进行判断。
4.根据权利要求3所述的方法,其特征在于,所述机器学习的区域与基站小区拟合算法具体包括:
通过数据分析,建立信号强度预测模型;
根据观测点与小区的距离、观测点与小区天线朝向夹角两个维度预测信号强度,如果所述信号强度大于阀值,则确定所述基站小区可以覆盖所述热点区域,否则确定所述基站小区无法覆盖所述热点区域。
5.根据权利要求1所述的方法,其特征在于,所述建立用户常驻地模型,将所述统计结果输入所述用户常驻地模型,得到区域实时客流的来源,具体包括:
建立用户常驻地模型;
根据区域当前的客流号码明细,以预设时间段的用户所驻留基站小区位置对应的区县作为用户的实时来源,将所述实时来源输入所述用户常驻地模型匹配得到第一区域实时客流的来源;
对于所述第一区域实时客流以外的第二区域实时客流,根据所述用户常驻地模型中最新的漫出表进行匹配,匹配得到漫出外地后重新回来的本地用户的第二区域实时客流的来源;
对于除所述第一区域实时客流和所述第二区域实时客流以外的第三区域实时客流,以所述用户常驻地模型中用户常驻地作为第三区域实时客流的来源;
对于除所述第一区域实时客流、所述第二区域实时客流和所述第三区域实时客流以外的第四区域实时客流,以所述用户常驻地模型中用户号码的归属地作为第四区域实时客流的来源。
6.一种区域实时客流来源分析装置,其特征在于,包括:
快照信息生成模块,用于获取预设时间段的用户位置数据,并根据所述用户位置数据生成位置快照信息;
映射表获取模块,用于根据所述位置快照信息获知用户当前所在的基站小区,将热点区域与所述基站小区进行拟合,得到热点区域与所述基站小区的映射表;
结果统计模块,用于根据所述位置快照信息和所述映射表对区域实时客流进行统计,得到统计结果;
来源分析模块,用于建立用户常驻地模型,将所述统计结果输入所述用户常驻地模型,得到区域实时客流的来源。
7.根据权利要求6所述的装置,其特征在于,所述快照信息生成模块具体用于:
通过集群从共享层实时接入全省的2G/3G/4G全量外部数据表示法xDR话单数据到大数据平台,以五分钟为一个时间切片,获取最近五分钟的xDR话单数据;
从所述五分钟的xDR话单数据中抽取时间、手机号码和小区通用网关接口CGI关键信息,过滤预设字段,得到精简的xDR话单数据;
对所述精简的xDR话单数据以手机号码为key,进行不同接口话单之间的关联和排序,根据手机号码的号段表回填各号码的归属地,并根据物联网号段信息标记物联网卡号码,生成用户每一个五分钟的位置快照信息。
8.根据权利要求6所述的装置,其特征在于,所述映射表获取模块具体用于:
若判断获知所述基站小区的经纬度位于所述热点区域内部,则确定所述基站小区为热点区域覆盖小区;
若判断获知所述基站小区的经纬度位于所述热点区域外部,则根据机器学习的区域与基站小区拟合算法进行判断。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至5任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行如权利要求1至5任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811344928.6A CN111182463B (zh) | 2018-11-13 | 2018-11-13 | 一种区域实时客流来源分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811344928.6A CN111182463B (zh) | 2018-11-13 | 2018-11-13 | 一种区域实时客流来源分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111182463A CN111182463A (zh) | 2020-05-19 |
CN111182463B true CN111182463B (zh) | 2021-03-16 |
Family
ID=70620879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811344928.6A Active CN111182463B (zh) | 2018-11-13 | 2018-11-13 | 一种区域实时客流来源分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111182463B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784414B (zh) * | 2020-07-21 | 2022-04-29 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备及介质 |
CN112328654A (zh) * | 2020-10-30 | 2021-02-05 | 上海钐昆网络科技有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN116744237B (zh) * | 2023-08-15 | 2023-10-10 | 中移(苏州)软件技术有限公司 | 数据确定方法、装置、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295787A (zh) * | 2015-05-29 | 2017-01-04 | 中国移动通信集团浙江有限公司 | 一种基于移动信令的客流统计方法及装置 |
CN106982413A (zh) * | 2016-01-15 | 2017-07-25 | 中国移动通信集团上海有限公司 | 一种区域客流趋势的预测方法及装置 |
CN107730319A (zh) * | 2017-10-30 | 2018-02-23 | 聚诚(深圳)网络科技有限公司 | 关联式营销利润分配方法 |
CN108282860A (zh) * | 2017-01-05 | 2018-07-13 | 中国移动通信集团山西有限公司 | 数据处理方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10342067B2 (en) * | 2016-07-11 | 2019-07-02 | Veniam, Inc. | Systems and methods for vehicular positioning based on wireless fingerprinting data in a network of moving things including, for example, autonomous vehicles |
-
2018
- 2018-11-13 CN CN201811344928.6A patent/CN111182463B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295787A (zh) * | 2015-05-29 | 2017-01-04 | 中国移动通信集团浙江有限公司 | 一种基于移动信令的客流统计方法及装置 |
CN106982413A (zh) * | 2016-01-15 | 2017-07-25 | 中国移动通信集团上海有限公司 | 一种区域客流趋势的预测方法及装置 |
CN108282860A (zh) * | 2017-01-05 | 2018-07-13 | 中国移动通信集团山西有限公司 | 数据处理方法及装置 |
CN107730319A (zh) * | 2017-10-30 | 2018-02-23 | 聚诚(深圳)网络科技有限公司 | 关联式营销利润分配方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111182463A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Widhalm et al. | Discovering urban activity patterns in cell phone data | |
Wang et al. | Crowdsensing-based consensus incident report for road traffic acquisition | |
Xu et al. | A survey for mobility big data analytics for geolocation prediction | |
CN106355289B (zh) | 一种基于位置服务的景区客流量预测方法 | |
CN111182463B (zh) | 一种区域实时客流来源分析方法及装置 | |
Shi et al. | ParkCrowd: Reliable crowdsensing for aggregation and dissemination of parking space information | |
US20140280231A1 (en) | Dynamically Expiring Crowd-Sourced Content | |
CN110232104B (zh) | 一种数据显示方法、装置、存储介质及计算机设备 | |
CN110297875B (zh) | 一种评估城市各功能区之间联系需求紧密度的方法和装置 | |
CN110414732A (zh) | 一种出行未来轨迹预测方法、装置、储存介质及电子设备 | |
Li et al. | Supreme: Fine-grained radio map reconstruction via spatial-temporal fusion network | |
CN115034524A (zh) | 基于手机信令的工作居住人口预测方法、系统和存储介质 | |
CN113139140A (zh) | 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法 | |
Rubio et al. | Adaptive non-parametric identification of dense areas using cell phone records for urban analysis | |
CN115511210A (zh) | 基于多源大数据的社区生活圈划定方法和装置 | |
CN112015956B (zh) | 移动对象的相似性确定方法、装置、设备和存储介质 | |
Li et al. | Delineation of the Shanghai megacity region of China from a commuting perspective: Study based on cell phone network data in the Yangtze River Delta | |
CN113326877A (zh) | 模型训练、数据处理方法、装置、设备、存储介质及程序 | |
CN111310340B (zh) | 基于人类移动的城市区域交互异常关系识别方法及设备 | |
Ruiz-Lendínez et al. | Method for an automatic alignment of imagery and vector data applied to cadastral information in Poland | |
CN110619090A (zh) | 一种区域吸引力评估方法及设备 | |
CN110633890A (zh) | 一种土地利用效率判断方法和系统 | |
CN116052421A (zh) | 一种基于静态和动态多图融合的交通流量预测方法 | |
CN115936762A (zh) | 景区人流量的预测方法、装置、设备及存储介质 | |
US11551322B2 (en) | Methods and devices for searching for a missing person |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |