CN110830978B - 基于区域的用户数据处理方法、装置、设备及介质 - Google Patents

基于区域的用户数据处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN110830978B
CN110830978B CN201911055890.5A CN201911055890A CN110830978B CN 110830978 B CN110830978 B CN 110830978B CN 201911055890 A CN201911055890 A CN 201911055890A CN 110830978 B CN110830978 B CN 110830978B
Authority
CN
China
Prior art keywords
user
time
data
user data
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911055890.5A
Other languages
English (en)
Other versions
CN110830978A (zh
Inventor
孙苑苑
赵雨
李树春
张念启
陈龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Jiangsu Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Jiangsu Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Jiangsu Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201911055890.5A priority Critical patent/CN110830978B/zh
Publication of CN110830978A publication Critical patent/CN110830978A/zh
Application granted granted Critical
Publication of CN110830978B publication Critical patent/CN110830978B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/02Processing of mobility data, e.g. registration information at HLR [Home Location Register] or VLR [Visitor Location Register]; Transfer of mobility data, e.g. between HLR, VLR or external networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了基于区域的用户数据处理方法、装置、设备及介质。该方法包括:获取待处理用户数据,待处理用户数据包括第一位置和第一时间,第一位置为用户在第一时间所处的位置;获取已处理的上一条用户的历史用户数据,历史用户数据包括第二位置和第二时间,第二位置为用户在第二时间所处的位置;当第一时间晚于第二时间,且第一位置和/或第二位置位于监控区域时,根据待处理用户数据更新第一位置对应的小区的用户数据。本发明能够将用户归属基站的数据结构转换为基站拥有用户的数据结构,提高计算的效率和准确性。

Description

基于区域的用户数据处理方法、装置、设备及介质
技术领域
本发明涉及大数据领域,尤其涉及一种基于区域的用户数据处理方法、装置、设备和计算机可读存储介质。
背景技术
随着移动通信业务的发展,全国各地都建立了移动通信基站,为身处各地的居民提供移动通信服务,通信网内的信令承担了整个网络的数据传递和业务控制的作用,可以通过信令统计区域内用户流量。
目前,用户当前的全量用户轨迹,是一种位置序列。当需要统计某个时刻的某个区域的客流数据时,需要遍历全量用户的位置数据,将这些位置按照区域指定的基站进行筛选和其他处理,形成当前某个区域的客流统计。整个流程耗时长,满足不了客户的实时性需求。
发明内容
本发明实施例提供了一种基于区域的用户数据处理方法、装置、设备和计算机可读存储介质,能够将用户归属基站的数据结构转换为基站拥有用户的数据结构,提高计算的效率和准确性。
第一方面,本发明提供一种基于区域的用户数据处理方法,该方法包括:获取待处理用户数据,待处理用户数据包括第一位置和第一时间,第一位置为用户在第一时间所处的位置;获取已处理的上一条用户的历史用户数据,历史用户数据包括第二位置和第二时间,第二位置为用户在第二时间所处的位置;当第一时间晚于第二时间,且第一位置和/或第二位置位于监控区域时,根据待处理用户数据更新第一位置对应的小区的用户数据。
根据上述第一方面,该方法还包括:当第一位置和/或第二位置位于监控区域,且第一时间晚于第二时间时,将待处理用户数据更新至历史用户数据列表;
获取已处理的上一条用户的历史用户数据,包括:从历史用户数据列表获取已处理的上一条用户的历史用户数据。
根据上述方面,在根据待处理用户数据更新第一位置对应的小区的用户数据之后,该方法还包括:当第一位置与第二位置一致时,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据;或者,当第一位置与第二位置不一致,且第一位置和第二位置均位于监控区域时,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据;或者,当第一位置与第二位置不一致,且第二位置位于监控区域时,对第二位置对应的小区的用户数据中的用户做失效处理,且当第一位置位于监控区域时,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据。
根据上述方面,在根据待处理用户数据更新第一位置对应的小区的用户数据之后,该方法还包括:从监控区域中小区的用户数据获取用户的位置信令数据,其中,用户的位置信令数据按照时间顺序排序;检查用户的位置信令数据中连续两条位置信令数据的发生时间差是否超过预设时间阈值,当连续两条位置信令数据的发生时间差超过预设时间阈值时,插入一条位置信令数据;和/或,对用户连续在同一个小区出现的多条位置信令数据进行合并。
根据上述方面,该方法还包括:当第一时间早于第二时间时,对待处理用户数据做无效处理。
第二方面,本发明提供一种基于区域的用户数据处理装置,该装置包括:第一获取模块,用于获取待处理用户数据,待处理用户数据包括第一位置和第一时间,第一位置为用户在第一时间所处的位置;第二获取模块,用于获取已处理的上一条用户的历史用户数据,历史用户数据包括第二位置和第二时间,第二位置为用户在第二时间所处的位置;第一更新模块,用于当第一时间晚于第二时间,且第一位置和/或第二位置位于监控区域时,根据待处理用户数据更新第一位置对应的小区的用户数据。
根据上述第二方面,该装置还包括:第二更新模块,用于当第一位置和/或第二位置位于监控区域,且第一时间晚于第二时间时,将待处理用户数据更新至历史用户数据列表;
第二获取模块具体用于:从历史用户数据列表获取已处理的上一条用户的历史用户数据。
根据上述方面,该装置还包括:第三更新模块,用于在根据待处理用户数据更新第一位置对应的小区的用户数据之后,当第一位置与第二位置一致时,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据;或者,当第一位置与第二位置不一致,且第一位置和第二位置均位于监控区域时,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据;或者,当第一位置与第二位置不一致,且第二位置位于监控区域时,对第二位置对应的小区的用户数据中的用户做失效处理,且当第一位置位于监控区域时,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据。
根据上述方面,该装置还包括:插入模块,用于在根据待处理用户数据更新第一位置对应的小区的用户数据之后,从监控区域中小区的用户数据获取用户的位置信令数据,其中,用户的位置信令数据按照时间顺序排序;检查用户的位置信令数据中连续两条位置信令数据的发生时间差是否超过预设时间阈值,当连续两条位置信令数据的发生时间差超过预设时间阈值时,插入一条位置信令数据;和/或,对用户连续在同一个小区出现的多条位置信令数据进行合并。
根据上述方面,该装置还包括:无效模块,用于当第一时间早于第二时间时,对待处理用户数据做无效处理。
第三方面,本发明提供一种基于区域的用户数据处理设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现如上所述的基于区域的用户数据处理方法。
第四方面,本发明提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如上所述的基于区域的用户数据处理方法。
本发明涉及大数据领域,尤其涉及一种基于区域的用户数据处理方法、装置、设备和计算机可读存储介质,通过将待处理用户数据与历史用户数据相比较,更新小区的用户数据,能够将用户归属基站的数据结构转换为基站拥有用户的数据结构,便于通过基站的用户数据统计用户,而不需要全量用户遍历,提高计算的效率和准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于区域的用户数据处理方法的流程示意图;
图2是本发明实施例提供的另一种基于区域的用户数据处理方法的流程示意图;
图3是本发明实施例提供的一种基于区域的用户数据处理装置的结构示意图;
图4是本发明实施例提供的一种基于区域的用户数据处理设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
可以理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
下面对本发明实施例所提供的基于区域的用户数据处理方法进行介绍。
目前在对指定区域内用户信息进行统计时,例如旅游行业客户(旅游局、景区等)需要对旅游景区进行实时客流监控,需要遍历全量用户的位置信息,将这些位置按照区域指定的基站进行筛选和其他处理,形成当前某个区域的客流统计,如此将会导致流程耗时长,满足不了实时性需求。
而采用本发明实施例提供的基于区域的用户数据处理方法,当用户生成一条新的信令过来时,就对该用户数据进行处理,匹配到指定的区域中,将用户归属基站的数据结构转换为基站拥有用户的数据结构。此时若需要统计区域客流,就直接拉取已经分类归纳好的数据,而不需要进行全量用户遍历,从而提高计算的效率、准确性。
图1是本发明实施例提供的一种基于区域的用户数据处理方法的流程示意图;如图1所示,该基于区域的用户数据处理方法100主要包括以下步骤:
步骤S110,获取待处理用户数据,待处理用户数据包括第一位置和第一时间,第一位置为用户在第一时间所处的位置。
具体地,可以从当前待处理的用户位置信令数据中获取待处理用户数据,用户位置信令数据处于位置序列中,其中,当前待处理的用户位置信令数据不一定是最新产生的用户位置信令数据。例如,由于网络信令延迟,消息队列多通道并行处理等原因,导致用户位置信令数据的到达并非严格按照时间顺序,有可能先产生的用户位置信令数据晚于后产生的用户位置信令数据到达。
待处理用户数据中的第一时间可以为产生当前待处理的用户位置信令数据的时间,而第一位置为用户在第一时间所处的位置,也就是说,第一位置可以为当前待处理的用户位置信令数据中用户位于的小区。其中,小区可以使用位置区域码(location areacode,lac)和小区(cell)组合唯一表示,一个小区被一个基站覆盖,一个基站可以有一个或多个小区,进一步每个lac和每个cell组合可以对应一个基站。
可选地,待处理用户数据可以基于Kafka消息队列获取。
此外,在获取用户的待处理用户数据之前,还可以根据国际移动台综合业务数字网码(Mobile Subscriber International Integrated Service Digital Network,MSISDN)标识用户,并且对用户的数据进行分区,将监控区域的小区数据初始化。
其中,监控区域可以是一个或多个小区,也可以是一个基站的区域,也可以是多个基站的区域。例如,监控区域可以是火车站、机场、旅游景区等。
其中,MSISDN是在公共电话网交换网络编号计划中,唯一能识别移动用户的号码,在一些实施例中,MSISDN也称为移动用户号码。
作为一个示例,MSISDN可以包括如下组成部分:CC+NDC+SN,其中,CC(countrycode)为国家码,NDC(National Destination Code)为国内目的地址码,也可以成为网络接入号,SN为用户号码。
作为一个具体的示例,MSISDN为“86+134+11111111”,其中86表示中国的国家码,134为国内目的地址码,11111111为用户号码,在该 MSISDN中将国家码CC去除,可以获得移动台的国内身份号码,也就是手机号码。
步骤S120,获取已处理的上一条用户的历史用户数据,历史用户数据包括第二位置和第二时间,第二位置为用户在第二时间所处的位置。
具体地,历史用户数据可以从当前待处理的用户位置信令数据的上一已处理用户位置信令数据获取,与步骤S110中的内容类似,上一用户位置信令数据不一定是用户的上一个产生的位置信令数据。
历史用户数据中的第二时间可以为产生上一已处理用户位置信令数据的时间,而第二位置为用户在第二时间所处的位置,也就是说,第二位置可以为上一已处理用户位置信令数据中用户位于的小区。
可选地,历史用户数据可以基于远程字典服务器(Remote Dictionary Serve,Redis)获取。
步骤S130,当第一时间晚于第二时间,且第一位置和/或第二位置位于监控区域时,根据待处理用户数据更新第一位置对应的小区的用户数据。
具体地,当第一时间晚于第二时间时,说明第一位置和第二位置之间是时间顺序的关系,也就是说,用户先到达第二位置,再到达第一位置,待处理用户数据与历史用户数据之间不存在乱序。当第一位置和/或第二位置位于监控区域时,意味着,用户到达过监控区域。进而,当第一时间晚于第二时间,且第一位置和/或第二位置位于监控区域时,根据待处理用户数据更新第一位置对应的小区的用户数据,具体地,将待处理用户数据更新至第一位置对应的小区的用户数据。
这里,可以将用户的待处理用户数据中的第一位置和第一时间更新至第一位置对应的小区的用户数据中,并将用户表示为第一位置对应的小区中的用户。其中,小区的用户数据的结构可以为:小区、小区中的用户、用户在小区的最新时间。可以将小区作为分组标识,表示基站的小区拥有用户。需要注意的是,第一位置对应的小区的用户数据以第一位置为分组标识,小区中的用户为位于第一位置的用户,用户在小区的最新时间为第一时间。也就是说,将以用户为分组标识的数据结构转变为以基站的小区为分组标识的数据结构,进而以基站为分组标识的数据结构。
可选地,小区的用户数据可以基于远程字典服务器Redis存储。
此外,当第一时间早于第二时间时,说明待处理用户数据与历史用户数据之间存在乱序,对待处理用户数据做无效处理,也就是说将该条待处理用户数据抛弃,不做进一步处理。而且,当第一位置和/或第二位置没有位于监控区域时,对待处理位置数据不做处理。
上述基于区域的用户数据处理方法,通过将用户的待处理用户数据与历史用户数据相比较,更新小区的用户数据,能够将用户归属基站的数据结构转换为基站拥有用户的数据结构,便于通过基站的用户数据统计用户,而不需要全量用户遍历,克服了数据乱序,提高计算的效率和准确性。
在一些实施例中,当第一位置和/或第二位置位于监控区域,且第一时间晚于第二时间时,将待处理用户数据更新至历史用户数据列表。反之,不更新。其中,在步骤S120中,可以从历史用户数据列表获取已处理的上一条用户的历史用户数据。在这里,历史用户数据列表可以基于Redis 获取。用户的历史用户数据的结构可以为:Type:string,Key:Msisdn, Value:Lac:cell,time。其中,Type为string类型,Key值为手机号码, Value为Lac:cell,表示小区。
在一些实施例中,在根据用户的待处理用户数据更新第一位置对应的小区的用户数据之后,可以从监控区域中小区的用户数据获取该用户的位置信令数据,其中,用户的位置信令数据按照时间顺序排序。此时,检查用户的位置信令数据中连续两条位置信令数据的发生时间差是否超过预设时间阈值,当连续两条位置信令数据的发生时间差超过预设时间阈值时,插入一条位置信令数据。和/或,也可以对用户连续在同一个小区出现的多条位置信令数据进行合并。
与步骤S110-S120的用户位置信令数据不同的是,从监控区域中小区的用户数据获取的用户的位置信令数据实质是从经过数据结构转变后的监控区域中的一个或多个小区的用户数据获取的,优选地,为监控区域中所有小区的用户数据。
针对按时间顺序排序后的用户的位置信令数据,检查前后两条位置信令数据的发生时间,若前后两条发生时间差超过1小时,假设正常位置信令数据时间差不超过1小时,则插入一条缺失的位置信令数据,进行位置信令数据补齐,标识该时间点位置信令数据缺失。其中,缺失的位置信令数据内容包括:发生时间=上条信令发生时间+1小时,lac=0,cell=0。
上述位置信令数据补齐操作需要注意的是:
(1)当天用户全天没有位置信令数据,不做补齐;
(2)当天用户全天只有一条位置信令数据,不做补齐;
(3)当天用户全天至少有两条以上位置信令数据:首条位置信令数据之前不进行位置信令数据补齐处理,从首条位置信令数据开始往下找下一条信令数据,找到后根据上下条信令数据开始时间期间每隔1小时插补一条位置空缺记录,当天找不到下一条信令数据时,停止补齐。
(4)用户位置跨天补齐:上一天23点至0点有一条信令数据,则在第二天0点补一条信令数据,位置为上一个信令数据,即上一天的最后一个位置,且作为当天用户的首条真实位置信令数据。之后按照前述位置补缺来补。上一天23点至0点无信令数据,则第二天0点不补,直到第二天当天开始出现用户的位置信令数据,按照前述位置补缺来补。
作为一个示例,用户的原始位置信令数据如表1所示,根据上述操作,通过插入缺失的位置信令数据补齐用户的原始位置信令数据,补齐后的用户的位置信令数据如表2所示。通过对补齐后的用户的位置信令的判断,可以精确感知在指定时间内,用户是否已经失联。
表1
序号 号码 发生时间 lac cell
1 13XXXXXXX87 20160701090010 2356 33299
2 13XXXXXXX87 20160701092010 2346 33577
3 13XXXXXXX87 20160701092210 2346 33577
4 13XXXXXXX87 20160701093210 2346 33577
5 13XXXXXXX87 20160701095010 2470 31546
6 13XXXXXXX87 20160701100110 2356 33577
7 13XXXXXXX87 20160701152010 2167 45129
表2
Figure GDA0003610677720000091
Figure GDA0003610677720000101
具体地,对用户连续在同一个小区出现的多条位置信令数据进行合并主要包括:用户的位置信令数据处理时需要对同一用户连续在一个小区出现的多条位置信令数据进行合并,合并时,按时间顺序,取第一条位置信令数据的发生时间作为合并后的开始时间,取最后一条位置信令数据的发生时间作为合并后的最后活跃时间。
上述位置信令数据合并操作需要注意的是:
(1)只有发生同一用户在一个位置上出现时间连续的多条位置信令数据,需要合并处理时,才将合并后位置信令数据的最后活跃时间设为合并的位置信令数据中最后一条信令位置信令数据的开始时间。其他所有位置信令数据的最后活跃时间设为该条位置信令数据的开始时间。
(2)经过位置信令数据合并操作后。每条位置信令数据的结束时间设为下一条信令的开始时间,其中上述位置信令数据合并操作的位置信令数据可以包括补充的缺失的位置信令数据。
此外,针对当天最后一条位置信令数据,判断开始时间与当天23:59 的时间差,若时间差>1小时,设置结束时间=开始时间+1小时,若时间差 <=1小时,设置结束时间=23:59。
作为一个示例,用户的原始位置信令数据如表3所示,通过对用户连续在同一个小区出现的多条位置信令数据进行合并,合并后的用户的位置信令数据如表4所示。可以去除多余的重复数据,提高数据处理效率。
表3
Figure GDA0003610677720000102
Figure GDA0003610677720000111
表4
Figure GDA0003610677720000112
在实际应用中,利用上述基于区域的用户数据处理方法可以对区域形的用户统计做了结构优化,当用户生成一条新的信令过来时,就对该用户信息进行处理,匹配到指定的区域中。此时若需要统计区域客流,就直接拉取已经分类归纳好的数据,而不需要进行全量用户遍历,从而提高计算的效率、准确性。
下面以区域驻留时长为统计的目标数据,结合图2说明基于区域的用户数据处理方法在实际应用中的具体流程。其中,图2是本发明实施例提供的另一种基于区域的用户数据处理方法的流程示意图。
如图2所示,图2的步骤与图1的步骤类似,为了简洁,类似的步骤不做过多的赘述。
图2步骤如下:
步骤S210,将监控区域的小区数据初始化。
具体地,该流程以特定用户为目标,可以用Msisdn标识用户,即手机号码相同的用户视为本流程处理的用户,用户仅在特定Java虚拟机(Java Virtual Machine,JVM)中处理,因此为规避同一个用户在多个流程中被处理,需要对用户数据进行分区操作,例如,根据手机号码取模。然后,可以将监控区域的小区数据初始化到当前的worker进程中。可选地,当前的worker进程可以基于分布式实时计算框架Jstrom实现。
步骤S220,获取待处理用户数据。
具体地,可以从Kafka的消息队列中的标准位置话题获取待处理用户数据。
步骤S230,获取历史用户数据。
在这里,历史用户数据可以为待处理用户数据的上一个已处理位置数据,可以基于Redis获取。
步骤S240,判断第一位置和/或第二位置是否位于监控区域。
当第一位置和/或第二位置位于监控区域时,执行步骤S250,反之,执行步骤S240-1。
步骤S240-1,不处理。
步骤S250,判断第一时间是否晚于第二时间。
当第一时间晚于第二时间时,执行步骤S260,反之执行步骤S250- 1。
步骤S250-1,无效待处理用户数据。
也就是说,当第一时间早于第二时间时,待处理用户数据与历史用户数据之间存在乱序,可以对待处理用户数据做无效处理,不做进一步处理。
步骤S260,更新历史用户数据。
步骤S270,根据待处理用户数据更新第一位置对应的小区的用户数据。
其中,小区的用户数据可以基于远程字典服务器Redis存储,结构可以为:Type:SortedSet,Key:Lac:cell:seq,Value:Msisdn,Score: Time。其中,Type为SortedSet类型,Key值为小区+手机号码,手机号码起到加盐作用,Value为手机号码,Score:为用户在该小区的最新时间。
可以通过如下操作从小区的用户数据中取数据:获取小区中曾经到过的全量用户,条件不加score;获取当前在小区的用户,条件score>0;获取特定时间内小区用户,score∈时间范围。
步骤S280,判断第一位置与第二位置是否一致。
当第一位置与第二位置一致时,执行步骤S290,反之,执行步骤 S280-1。
步骤S290,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据。
当第一位置与第二位置一致时,说明用户停留在了第二位置,其中,用户驻留时长数据是用户停留在监控区域内的时长,即区域驻留时长。在这里,通过第一时间与第二时间之差更新小区累计时长,进而,通过累计区域内用户的小区累计时长更新用户驻留时长数据,表示用户在监控区域的驻留时间。
其中,用户驻留时长数据结构可以为:Type:Hash,Key:Msisdn, Hash:loc:startTime。其中,Type为Hash类型,Key值为手机号码, Hash中loc为lac和cell,startTime为用户到小区的时间。可以看作,根据 Key查出来的一组数据,即某个用户经过不同小区时的数据。
步骤S280-1,判断第一位置与第二位置是否位于监控区域。
当第一位置与第二位置不一致时,说明用户变更了位置,从第二位置到了第一位置,当第一位置与第二位置位于监控区域时,执行步骤S290- 1,反之,执行步骤S280-2。
S280-2,不处理。
步骤S290-1,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据。
上述方法是针对区域驻留时长这一目标数据展开的流程,可以快速地统计区域内用户驻留时长。
此外,在一些实施例中,在根据用户的待处理用户数据更新第一位置对应的小区的用户数据之后,当第一位置与第二位置不一致,且第二位置位于监控区域时,可以对第二位置对应的小区的用户数据中的该用户做失效处理,且当第一位置位于监控区域时,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据。
其中,对第二位置对应的小区的用户数据中的用户做失效处理,实质是对经过数据结构转变后的第二位置对应的小区的用户数据中的用户做失效处理。可以理解为,以第二位置为分组标识的小区的用户数据中的位于第二位置的用户离开了第二位置,需要将该用户表示为已经离开了第二位置。作为一个具体的示例,需要将用户对应的Score选项清零。此外,当第一位置与第二位置不一致,且第二位置没有位于监控区域时,说明用户第一次到达监控区域,不需要更新监控区域的用户驻留时长数据。
图3是本发明实施例提供的一种基于区域的用户数据处理装置的结构示意图,如图3所示,该基于区域的用户数据处理装置300包括:第一获取模块310、第二获取模块320、第一更新模块330。
其中,第一获取模块310用于获取待处理用户数据,待处理用户数据包括第一位置和第一时间,第一位置为用户在第一时间所处的位置。第二获取模块320用于获取已处理的上一条用户的历史用户数据,历史用户数据包括第二位置和第二时间,第二位置为用户在第二时间所处的位置。第一判断模块330用于当第一时间晚于第二时间,且第一位置和/或第二位置位于监控区域时,根据待处理用户数据更新第一位置对应的小区的用户数据。
在一些实施例中,该装置300还包括:初始化模块,用于在获取待处理用户数据之前,将监控区域的小区数据初始化。
在一些实施例中,该装置300还包括:第二更新模块,用于当第一位置和/或第二位置位于监控区域,且第一时间晚于第二时间时,将待处理用户数据更新至历史用户数据列表。
第二获取模块320具体用于:从历史用户数据列表获取已处理的上一条用户的历史用户数据。
在一些实施例中,该装置300还包括:第三更新模块,用于在根据待处理用户数据更新第一位置对应的小区的用户数据之后,当第一位置与第二位置一致时,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据。或者,当第一位置与第二位置不一致,且第一位置和第二位置均位于监控区域时,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据。或者,当第一位置与第二位置不一致,且第二位置位于监控区域时,对第二位置对应的小区的用户数据中的用户做失效处理,且当第一位置位于监控区域时,根据第一时间与第二时间之差更新监控区域的用户驻留时长数据。
在一些实施例中,该装置300还包括:插入模块,用于在根据待处理用户数据更新第一位置对应的小区的用户数据之后,从监控区域中小区的用户数据获取用户的位置信令数据,其中,用户的位置信令数据按照时间顺序排序。检查用户的位置信令数据中连续两条位置信令数据的发生时间差是否超过预设时间阈值,当连续两条位置信令数据的发生时间差超过预设时间阈值时,插入一条位置信令数据。和/或,对用户连续在同一个小区出现的多条位置信令数据进行合并。
在一些实施例中,该装置300还包括:无效模块,用于当第一时间早于第二时间时,对待处理用户数据做无效处理。
上述基于区域的用户数据处理装置,通过将用户的待处理用户数据与历史用户数据相比较,更新小区的用户数据,能够将用户归属基站的数据结构转换为基站拥有用户的数据结构,便于通过基站的用户数据统计用户,而不需要全量用户遍历,克服了数据乱序,提高计算的效率和准确性。
可以理解的是,本发明实施例的基于区域的用户数据处理装置300,可以对应于本发明实施例图1中的基于区域的用户数据处理方法的执行主体,基于区域的用户数据处理装置300的各个模块/单元的操作和/或功能的具体细节可以参见上述本发明实施例图1的基于区域的用户数据处理方法中的相应部分的描述,为了简洁,在此不再赘述。
图4是本发明实施例提供的一种基于区域的用户数据处理设备的硬件结构示意图。
如图4所示,本实施例中的基于区域的用户数据处理设备400包括输入设备401、输入接口402、中央处理器403、存储器404、输出接口 405、以及输出设备406。其中,输入接口402、中央处理器403、存储器 404、以及输出接口405通过总线410相互连接,输入设备401和输出设备 406分别通过输入接口402和输出接口405与总线410连接,进而与基于区域的用户数据处理设备400的其他组件连接。
具体地,输入设备401接收来自外部的输入信息,并通过输入接口 402将输入信息传送到中央处理器403;中央处理器403基于存储器404中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器404中,然后通过输出接口405将输出信息传送到输出设备406;输出设备406将输出信息输出到基于区域的用户数据处理设备400的外部供用户使用。
也就是说,图4所示的基于区域的用户数据处理设备也可以被实现为包括:存储有计算机可执行指令的存储器;以及处理器,该处理器在执行计算机可执行指令时可以实现结合图1和图3描述的基于区域的用户数据处理方法和装置。
在一个实施例中,图4所示的基于区域的用户数据处理设备400包括:存储器404,用于存储程序;中央处理器403,用于运行存储器中存储的程序,以执行本发明实施例基于区域的用户数据处理方法。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现本发明实施例提供的基于区域的用户数据处理方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,做出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、只读存储器(Read-Only Memory, ROM)、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(Radio Frequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于区域的用户数据处理方法,其特征在于,所述方法包括:
获取待处理用户数据,所述待处理用户数据包括第一位置和第一时间,所述第一位置为用户在所述第一时间所处的位置;
获取已处理的上一条所述用户的历史用户数据,所述历史用户数据包括第二位置和第二时间,所述第二位置为所述用户在所述第二时间所处的位置;
当所述第一时间晚于所述第二时间,且所述第一位置和/或所述第二位置位于监控区域时,根据所述待处理用户数据更新所述第一位置对应的小区的用户数据;
在所述根据所述待处理用户数据更新所述第一位置对应的小区的用户数据之后,当所述第一位置与所述第二位置一致时,根据所述第一时间与所述第二时间之差更新所述监控区域的用户驻留时长数据;或者,
当所述第一位置与所述第二位置不一致,且所述第一位置和所述第二位置均位于所述监控区域时,根据所述第一时间与所述第二时间之差更新所述监控区域的用户驻留时长数据;或者,
当所述第一位置与所述第二位置不一致,且所述第二位置位于所述监控区域时,对所述第二位置对应的小区的用户数据中的所述用户做失效处理,且当所述第一位置位于所述监控区域时,根据所述第一时间与所述第二时间之差更新所述监控区域的用户驻留时长数据。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述第一位置和/或所述第二位置位于所述监控区域,且所述第一时间晚于所述第二时间时,将所述待处理用户数据更新至历史用户数据列表;
所述获取已处理的上一条所述用户的历史用户数据,包括:
从所述历史用户数据列表获取已处理的上一条所述用户的历史用户数据。
3.根据权利要求1所述的方法,其特征在于,在所述根据所述待处理用户数据更新所述第一位置对应的小区的用户数据之后,所述方法还包括:
从所述监控区域中小区的用户数据获取所述用户的位置信令数据,其中,所述用户的位置信令数据按照时间顺序排序;
检查所述用户的位置信令数据中连续两条位置信令数据的发生时间差是否超过预设时间阈值,当所述连续两条位置信令数据的发生时间差超过所述预设时间阈值时,插入一条位置信令数据;和/或,
对所述用户连续在同一个小区出现的多条位置信令数据进行合并。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述第一时间早于所述第二时间时,对所述待处理用户数据做无效处理。
5.一种基于区域的用户数据处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取待处理用户数据,所述待处理用户数据包括第一位置和第一时间,所述第一位置为用户在所述第一时间所处的位置;
第二获取模块,用于获取已处理的上一条所述用户的历史用户数据,所述历史用户数据包括第二位置和第二时间,所述第二位置为所述用户在所述第二时间所处的位置;
第一更新模块,用于当所述第一时间晚于所述第二时间,且所述第一位置和/或所述第二位置位于监控区域时,根据所述待处理用户数据更新所述第一位置对应的小区的用户数据;
第三更新模块,用于在所述根据所述待处理用户数据更新所述第一位置对应的小区的用户数据之后,当所述第一位置与所述第二位置一致时,根据所述第一时间与所述第二时间之差更新所述监控区域的用户驻留时长数据;或者,
当所述第一位置与所述第二位置不一致,且所述第一位置和所述第二位置均位于所述监控区域时,根据所述第一时间与所述第二时间之差更新所述监控区域的用户驻留时长数据;或者,
当所述第一位置与所述第二位置不一致,且所述第二位置位于所述监控区域时,对所述第二位置对应的小区的用户数据中的所述用户做失效处理,且当所述第一位置位于所述监控区域时,根据所述第一时间与所述第二时间之差更新所述监控区域的用户驻留时长数据。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第二更新模块,用于当所述第一位置和/或所述第二位置位于所述监控区域,且所述第一时间晚于所述第二时间时,将所述待处理用户数据更新至历史用户数据列表;
所述第二获取模块具体用于:
从所述历史用户数据列表获取已处理的上一条所述用户的历史用户数据。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
插入模块,用于在所述根据所述待处理用户数据更新所述第一位置对应的小区的用户数据之后,从所述监控区域中小区的用户数据获取所述用户的位置信令数据,其中,所述用户的位置信令数据按照时间顺序排序;
检查所述用户的位置信令数据中连续两条位置信令数据的发生时间差是否超过预设时间阈值,当所述连续两条位置信令数据的发生时间差超过所述预设时间阈值时,插入一条位置信令数据;和/或,
对所述用户连续在同一个小区出现的多条位置信令数据进行合并。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括:
无效模块,用于当所述第一时间早于所述第二时间时,对所述待处理用户数据做无效处理。
9.一种基于区域的用户数据处理设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-4任一项所述的基于区域的用户数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-4任一项所述的基于区域的用户数据处理方法。
CN201911055890.5A 2019-10-31 2019-10-31 基于区域的用户数据处理方法、装置、设备及介质 Active CN110830978B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911055890.5A CN110830978B (zh) 2019-10-31 2019-10-31 基于区域的用户数据处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911055890.5A CN110830978B (zh) 2019-10-31 2019-10-31 基于区域的用户数据处理方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN110830978A CN110830978A (zh) 2020-02-21
CN110830978B true CN110830978B (zh) 2022-08-09

Family

ID=69552010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911055890.5A Active CN110830978B (zh) 2019-10-31 2019-10-31 基于区域的用户数据处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN110830978B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114666753B (zh) * 2020-12-04 2023-08-15 中国移动通信集团广东有限公司 信令流数据处理方法、位置信息服务方法及电子设备
CN115514485B (zh) * 2022-11-23 2023-10-24 中网道科技集团股份有限公司 一种带量子加密进行社区矫正系统数据传输的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102883266A (zh) * 2012-09-25 2013-01-16 方春 一种基于区域的信息发布系统
CN105491529A (zh) * 2016-01-07 2016-04-13 中国联合网络通信集团有限公司 移动终端位置数据的内存映射处理方法及大数据平台
CN105848104A (zh) * 2016-03-22 2016-08-10 中国联合网络通信集团有限公司 基于区域的人员流动状态监测方法及装置
CN108492565A (zh) * 2018-04-20 2018-09-04 广东亿迅科技有限公司 基于用户出行数据分析的公共交通控制方法和系统
CN108632746A (zh) * 2018-03-21 2018-10-09 电信科学技术第十研究所有限公司 一种确定区域人流量的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102883266A (zh) * 2012-09-25 2013-01-16 方春 一种基于区域的信息发布系统
CN105491529A (zh) * 2016-01-07 2016-04-13 中国联合网络通信集团有限公司 移动终端位置数据的内存映射处理方法及大数据平台
CN105848104A (zh) * 2016-03-22 2016-08-10 中国联合网络通信集团有限公司 基于区域的人员流动状态监测方法及装置
CN108632746A (zh) * 2018-03-21 2018-10-09 电信科学技术第十研究所有限公司 一种确定区域人流量的方法
CN108492565A (zh) * 2018-04-20 2018-09-04 广东亿迅科技有限公司 基于用户出行数据分析的公共交通控制方法和系统

Also Published As

Publication number Publication date
CN110830978A (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
CN106878262B (zh) 报文检测方法及装置、建立本地威胁情报库的方法及装置
US7941161B2 (en) System for providing alert-based services to mobile stations in a wireless communications network
CN110830978B (zh) 基于区域的用户数据处理方法、装置、设备及介质
CN109117275B (zh) 基于数据分片的对账方法、装置、计算机设备及存储介质
CN112434039A (zh) 数据的存储方法、装置、存储介质以及电子装置
CN104486743A (zh) 一种对核心网各接口xdr数据进行用户信息关联的方法
CN111078818B (zh) 地址分析方法、装置、电子设备及存储介质
CN110933683B (zh) 信号覆盖范围确定方法、装置、电子设备及可读存储介质
CN107545318B (zh) 公交线路优先级确定、公交换乘线路排序方法及装置
CN111147596A (zh) Prometheus集群部署方法、装置、设备及介质
CN104778193A (zh) 数据去重方法及装置
CN116112418A (zh) 路由泄露的定位方法、装置、电子设备及存储介质
CN113542043A (zh) 网络设备的数据采样方法、装置、设备及介质
CN108108929B (zh) 一种家电极速安装的方法及系统
CN111628888B (zh) 一种故障诊断方法、装置、设备及计算机存储介质
CN105634999B (zh) 一种介质访问控制地址的老化方法及装置
CN109996224B (zh) 跟踪区域码tac边界的优化方法、系统、设备及存储介质
CN110992081A (zh) 用于线下服务商的数据处理方法及装置
CN109842482A (zh) 一种信息同步方法、系统及终端设备
CN110620724B (zh) 用于实现业务链路径追踪的方法、节点和通信系统
CN112954583B (zh) 定位方法、装置、系统和计算机可读存储介质
CN109657018B (zh) 一种分布式车辆行驶数据查询方法及终端设备
CN105426978B (zh) 一种业务并发性预测方法与预测系统
CN111372073B (zh) 视频质量的评价方法、装置、设备和介质
CN114143367A (zh) 区块链网络中优化邻居节点的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant