CN113453215B - 一种获取终端标识的方法及装置 - Google Patents
一种获取终端标识的方法及装置 Download PDFInfo
- Publication number
- CN113453215B CN113453215B CN202110661758.XA CN202110661758A CN113453215B CN 113453215 B CN113453215 B CN 113453215B CN 202110661758 A CN202110661758 A CN 202110661758A CN 113453215 B CN113453215 B CN 113453215B
- Authority
- CN
- China
- Prior art keywords
- mac address
- suspected
- mac
- field
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012216 screening Methods 0.000 claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims description 25
- 230000015654 memory Effects 0.000 claims description 21
- 238000004891 communication Methods 0.000 claims description 19
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000008030 elimination Effects 0.000 claims description 6
- 238000003379 elimination reaction Methods 0.000 claims description 6
- 238000007418 data mining Methods 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 230000011664 signaling Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010295 mobile communication Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/22—Processing or transfer of terminal data, e.g. status or physical capabilities
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请提供一种获取终端标识的方法及装置,涉及数据挖掘与网络管理领域,能够从海量业务话单信息中提取规整、真实的MAC地址,并将其与终端IMEI组合,为移动网络与外部应用提供容易获取的不变终端标识。该方法包括:获取用户业务话单;其中,所述用户业务话单基于用户面业务数据进行深度报文解析后生成,所述用户业务话单的每条记录包括统一资源标志符URI字段和国际移动设备标识IMEI字段;根据所述用户业务话单中各记录的所述URI字段,筛选出包含媒体存取控制MAC地址的目标记录;将所述目标记录中的所述MAC地址与所述IMEI字段组合,作为终端标识保存以供应用调用。
Description
技术领域
本申请涉及数据挖掘与网络管理领域,尤其涉及一种获取终端标识的方法及装置。
背景技术
移动终端作为移动互联网的重要入口,各类应用软件(application,app)会依据自身功能及需求,请求获取及调用移动终端唯一标识,作为其功能使用及业务拓展的重要标识。但由于频繁且广泛的调用终端标识,会给用户及终端隐私带来隐患,android、iOS等操作系统均在不断设置各类标识的调用权限,同时推出可替换的身份标识供应用调用。
因此,可以作为终端唯一标识的内容越来越少,多数app已无法获取不变化的终端标识类信息。如何提出一种新的不变终端标识,为终端识别提供有效备选方案,成为亟待解决的问题。
发明内容
本申请提供一种获取终端标识的方法及装置,能够从海量业务话单信息中提取规整、真实的MAC地址与IMEI的组合,为移动网络与外部应用提供可调用的不变终端标识。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供一种获取终端标识的方法,该方法可以包括:获取用户业务话单;其中,所述用户业务话单基于用户面业务数据进行深度报文解析后生成,所述用户业务话单的每条记录包括统一资源标志符URI字段和国际移动设备标识IMEI字段;根据所述用户业务话单中各记录的所述URI字段,筛选出包含媒体存取控制MAC地址的目标记录;将所述目标记录中的所述MAC地址与所述IMEI字段组合,作为终端标识保存以供应用调用。
第二方面,本申请提供一种获取终端标识的装置,该装置包括:处理模块、处理模块和存储模块。其中,处理模块,用于获取用户业务话单;其中,所述用户业务话单基于用户面业务数据进行深度报文解析后生成,所述用户业务话单的每条记录包括统一资源标志符URI字段和国际移动设备标识IMEI字段;处理模块,还用于根据所述用户业务话单中各记录的所述URI字段,筛选出包含MAC地址的目标记录;存储模块,用于将所述目标记录中的所述MAC地址与所述IMEI字段组合,作为终端标识保存以供应用调用。
第三方面,本申请提供一种获取终端标识的装置,该装置包括:处理器、通信接口和存储器。其中,存储器用于存储一个或多个程序。该一个或多个程序包括计算机执行指令,当该获取终端标识的装置运行时,处理器执行该存储器存储的该计算机执行指令,以使该获取终端标识的装置执行第一方面及其各种可选的实现方式中任意之一所述的获取终端标识的方法。
第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当计算机执行该指令时,该计算机执行上述第一方面及其各种可选的实现方式中任意之一所述的获取终端标识的方法。
第五方面,本申请提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行上述第一方面及其各种可选的实现方式中任意之一所述的获取终端标识的方法。
第六方面,本申请提供一种通信系统。该通信系统包括一个或多个终端设备、基站、数据网络,以及上述第三方面及其各种可选的实现方式中任意之一所述的获取终端标识的装置。
本申请提供的获取终端标识的方法及装置,获取用户业务话单;其中,所述用户业务话单基于用户面业务数据进行深度报文解析后生成,所述用户业务话单的每条记录包括统一资源标志符URI字段和国际移动设备标识IMEI字段;根据所述用户业务话单中各记录的所述URI字段,筛选出包含媒体存取控制MAC地址的目标记录;将所述目标记录中的所述MAC地址与所述IMEI字段组合,作为终端标识保存以供应用调用。相对于现有技术中,基于信令或者协议从单个终端获取终端不变标识,受到操作系统各种权限限制。本申请提供的获取终端标识的方法,利用运营商强大的数据采集和处理能力,批量获取全网海量用户的用户面业务话单,直接获取记录级别的终端IMEI和终端MAC地址映射,并从该话单中提取需要的MAC地址和对应IMEI字段,从而能够避免隐私政策对外部应用获取终端标识类信息的各种限制,将移动网络和宽带网络通用的终端不变标识(MAC地址+IMEI)存入数据库,供外部应用调用。
附图说明
图1为本申请实施例提供的获取终端标识的方法及装置应用的通信网络结构示意图;
图2为4G网络的结构示意图;
图3为本申请实施例提供的获取终端标识的方法示意图一;
图4为本申请实施例提供的获取终端标识的方法示意图二;
图5为本申请实施例提供的获取终端标识的装置的结构示意图一;
图6为本申请实施例提供的获取终端标识的装置的结构示意图二。
具体实施方式
下面结合附图对本申请实施例提供的获取终端标识的方法、装置及系统进行详细地描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
本申请实施例提供的获取终端标识的方法可以应用于图1所示的通信网络中,该通信网络可以为第4代(4th generation,4G)移动通信系统,如长期演进(long termevolution,LTE)系统,第五代(5th generation,5G)移动通信系统,如新空口(new radio,NR)系统,以及未来的通信系统,如第六代(6th generation,6G)移动通信系统,还可以为其他实际的移动通信网络,本申请不予限制。
为便于理解本申请实施例,首先以图1和图2中所示出的通信系统为例,详细说明适用于本申请实施例的通信系统。应当指出的是,本申请实施例中的方案还可以应用于其他移动通信系统中,相应的名称也可以用其他移动通信系统中的对应功能的名称进行替代。
示例性的,图1为本申请实施例提供的获取终端标识的方法所适用的一种通信系统的架构示意图。如图1所示,该通信网络可以包含:终端设备、基站、数据网络。
上述基站主要用于实现无线物理层功能、资源调度和无线资源管理、无线接入控制以及移动性管理功能,包括但不限于:演进型节点B(evolved Node B,eNB)、无线网络控制器(radio network controller,RNC)、节点B(Node B,NB)、基站控制器(base stationcontroller,BSC)、基站收发台(base transceiver station,BTS)、家庭基站(例如,homeevolved NodeB,或home Node B,HNB)、基带单元(baseband unit,BBU),无线中继节点、无线回传节点、传输点(transmission and reception point,TRP或者transmission point,TP)等,还可以为5G,如,新空口(new radio,NR)系统中的gNB,或,传输点(TRP或TP),5G系统中的基站的一个或一组(包括多个天线面板)天线面板,或者,还可以为构成gNB或传输点的网络节点,如基带单元(BBU),或,分布式单元(distributed unit,DU)、具有基站功能的路边单元(road side unit,RSU)等。
上述终端设备用于通过无线空口连接到运营商部署的接入网设备,继而接入数据网络。该终端设备也可以称为用户装置、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置。本申请的实施例中的终端设备可以是手机(mobile phone)、平板电脑(Pad)、带无线收发功能的电脑、虚拟现实(virtual reality,VR)终端、增强现实(augmented reality,AR)终端、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端、车载终端、具有终端功能的RSU等。
需要说明的是,图1仅为示例性架构图,除图1中所示功能单元之外,该网络架构还可以包括其他功能单元,本申请实施例对此不进行限定。
示例性的,图2为4G系统的结构示意图。如图2所示,该4G网络可以包括基站和核心网两部分。演进的无线基站(evolved Node B,eNodeB):eNodeB(简称eNB),负责UE接入4G核心网,透传UE和MME之间的非接入层(non-access stratum,NAS)协议,以及用户信令和数据的上下行传输等功能。核心网部分主要包括如下网元:移动性管理设备(mobilitymanagement entity,MME)网元、服务网关(serving gateway,S-GW)网元、公共数据网网关(packet data network gateway,P-GW)网元等。IP多媒体子系统(IP multimediasubsystem,IMS)用于为用户提供语音、视频、短信、炫铃等丰富的多媒体业务,满足用户多样化的业务需求。
其中,MME网元为4G核心网的核心控制网元,负责4G用户接入控制、安全管理、移动性管理、会话管理等功能。
S-GW网元为4G核心网的用户面接入网元,负责4G用户的用户面处理、移动性管理、会话管理等功能,是用户本地移动性管理的锚点,可与P-GW合设或分设。
P-GW网元在4G核心网中起网关作用,负责与外部数据网络连接,以及用户数据的路由和转发等功能,一般情况下与S-GW合设或分设。
应理解,图1和图2仅为便于理解而示例的简化示意图,图1和图2中所示出的通信系统中还可以包括其他网络设备,和/或,其他终端设备,图1中未予以画出。
本申请实施例描述的网络架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
如图2所示,图2中的虚线为控制面接口,传输控制信令。实线为用户面接口,传输用户数据。S1-U接口用于在S-GW网元与eNodeB设备间建立隧道,传送用户数据业务,即用户面数据。S5/S8接口为设备内部接口,用于在GW设备间建立隧道,传送用户面数据和控制面信息。
终端设备按照操作系统的不同,可以划分为安卓(Android)设备与iOS设备。安卓设备使用的标识码主要包括:国际移动设备身份码(international mobile equipmentidentity,IMEI)、移动设备识别码(mobile equipment identifier,MEID)、媒体存取控制位址(media access control address,MAC address)、国际移动用户识别码(international mobile subscriber identity,IMSI)、通用唯一识别码(universallyunique identifier,UUID)、设备唯一标识符(unique device identifier,UDID)。iOS设备使用的标识码主要包括:应用开发商标识符(identifier forvendor,IDFV)、广告标识符(identifier for advertising,IDFA)、UUID、IMEI、UDID、MAC地址。
其中,IMEI和MEID都是用于标识一台物理设备的ID信息,相当于移动终端的身份证,是写在主板上的,重装APP也不会改变,区别在于,IMEI用于GSM设备,MEID用于CDMA制式的移动设备。安卓设备中IMEI和MEID的获取,都需要开启READ_PHONE_STATE权限,而在iOS5之后,iOS设备的IMEI被禁止获取。
MAC地址在网络中唯一标识一个网卡,一台设备中的多个网卡有多个MAC地址,烧制在网卡EPROM中,包括WiFiMAC地址和蓝牙MAC地址。在Android系统中,通常使用IMEI、MAC结合去标识一台设备。Android6.0之后,安卓设备MAC地址的获取被禁止,若获取则会被判定为有害应用。iOS7后禁止获取iOS设备MAC地址。
IMSI用于标识SIM卡。UUID是由随机算法得到的伪唯一识别码,每次获取都会改变。在iOS5之后,iOS设备弃用了UDID。当用户卸载某应用商的所有应用,重装该应用商的应用时,IDFV改变。IDFA是苹果专门给各广告提供商用来追踪用户而设的,由系统存储,用户可以通过主动还原隐私、还原广告标识符、开关IDFA开关、充值系统来改变IDFA值。
由此可见,由于iOS系统限制,在iOS上可获取的设备标识为IDFV、IDFA,其他设备标识需要“越狱”手机才可获取。而在Android系统中,通常使用IMEI、MAC去标识一台设备,但外部应用获取终端IMEI、MAC都受到较大权限限制。
如上所述,在Android系统中,外部应用不能或者很难获取IMEI,虽然可以获取MAC,但无法获取IMEI和MAC地址的映射关系。并且,出于保护设备隐私的需求,将来可能受到更大限制,即外部应用可能无法直接从单个终端获取终端的不变标识。区别于外部应用从个体终端获取不变标识,利用网络抓包工具,运营商可以对经由运营商端口的全量用户数据进行采集和分析,例如采用深度报文解析(deeppacket inspection,DPI)技术,实现报文分析、用户行为分析、流量内容识别、xDR话单生成和合并等功能。
深度报文解析技术所谓“深度”是和普通报文检测相比而言的,普通报文检测仅检测IP包中包括源地址、目的地址、源端口、目的端口等内容,而DPI技术除了对上述内容进行检测外,还增加了应用层的检测,能够识别各种应用,并能进行统计和管理。
xDR话单是指基于控制面的全量信令数据及用户面的全量业务数据进行处理后,生成的供上网日志留存和信令监测类应用使用的信令及业务的详细记录,因此,话单中蕴含了非常丰富的数据分析和挖掘价值。xDR话单按照数据类型可以划分为信令xDR(基于所采集的控制面信令而生成的信令过程的详细记录)和业务xDR(基于所采集的用户面业务数据而生成的业务传输过程的详细记录)。
本申请实施例提供的获取终端标识的方法,应用于图1或图2所示的通信网络的数据挖掘和网络管理中。利用运营商强大的数据采集和处理能力,对用户面接口进行数据采集和DPI解析,生成需要的用户业务话单,并从该话单中提取需要的MAC地址和IMEI字段,从而能够避免隐私政策对外部应用获取终端标识类信息的各种限制,将移动网络和宽带网络通用的终端不变标识(MAC地址+IMEI)存入数据库,供外部应用调用。
本申请实施例提供一种获取终端标识的方法,如图3所示,该方法可以包括S301-S303:
S301、获取用户业务话单。
其中,所述用户业务话单基于用户面业务数据进行深度报文解析后生成,所述用户业务话单包含多条记录,每条记录中包括统一资源标志符URI字段和国际移动设备标识IMEI字段。
示例性的,所述用户面接口包括图2中所示的S1-U接口和S5/S8接口,也可以包括3G网络架构中的Gn接口等,本申请在此不做限定。运营商对上述用户面接口进行数据采集,并完成对采集数据的DPI解析,生成超文本传输协议(hypertext transfer protocol,HTTP)业务、超文本传输安全协议(hypertext transfer protocol over secure socketlay,HTTPS)业务过程的详细记录,即用户HTTP/HTTPS业务话单。用户业务话单中包括海量用户终端进行HTTP/HTTPS业务过程的详细记录,每条记录可能包括:基本信息,例如业务起止时间、会话ID、五元组信息等;用户信息,例如手机号/用户账号、IMSI、移动台设备标识(例如IMEI、MAC地址)、网络接入标识等;网元信息,例如用户接入网络类型、基站标识、小区等;质量信息,例如时延、乱序报文数、重传报文数、重传字节数、记录关闭原因等;流量信息,例如报文数、字节数等;业务信息,例如协议类型、业务应用、业务特有信息等。
HTTP/HTTPS都使用统一资源标识符(uniform resource identifier,URI)来传输数据和建立连接。URI用于唯一的标识一个资源,一般由三部分组成:访问资源的命名机制、存放资源的主机名、资源自身的名称。用户在使用某些业务或APP时,MAC地址会被请求并记录在URI中。在终端附着(ATTACH)到网络和位置区更新(locat ion area update,LAU)的时候,会要求终端通过identity response上报其IMEI,并将其记录在核心网MME或服务GPRS支持节点(serving GPRS support node,SGSN)等设备中。因此,用户业务话单中的每条记录都包含IMEI,但是只有部分记录是存在MAC地址的。
可选的,本申请实施例可以从运营商DPI设备获取上述用户业务话单,也可以对用户面业务数据进行采集和DPI解析后获取上述用户业务话单,本申请实施例对此不作限定。
S302、根据用户业务话单中各记录的URI字段,筛选出包含MAC地址的目标记录。
具体的,对采集的HTTP/HTTPS数据包进行DPI解析,提取其中的URI字段后,根据URI字段,设置各类前置及筛选条件,就能逐步筛除用户业务话单中不包括MAC地址的记录,并且实现从目标记录中批量提取出海量用户的准确MAC地址。
在一种可能的实现方式中,如图4所示,根据用户业务话单中各记录的统一资源标志符URI字段,通过如下步骤筛选出包含MAC地址的目标记录:
步骤一:筛选出URI字段包括MAC关键字的初始记录。
其中,所述MAC关键字包括:字符串“mac=”或“mac_address=”或“macaddress=”,这三个关键字是综合考虑了覆盖性和排他性之后确定的关键字,能够初步确定可能包含MAC地址的记录。而单独的“mac”或“address”等字符串,并不一定是MAC地址相关信息。从用户业务话单中筛选出URI字段包括MAC关键字的记录,不包括则丢弃该记录。
步骤二:从初始记录的URI字段中提取疑似MAC地址。
示例性的,以正则方式,截取初始记录的URI字段中MAC关键字后的字符串,作为疑似MAC地址。
示例性的,将疑似MAC地址记为mac_tmp,上述正则规则用hiveSQL语言可以描述为:mac_tmp=regexp_extract(uri,'(mac=|mac_address=|macaddress=)(.*?)(&)(.*)',2),即对URI字段进行匹配,只要发现URI字段能匹配字符串“mac=”、“mac_adress=”、“macaddress=”,就进行截取,将URI字段中MAC关键字后的字符串记为mac_tmp,作为疑似MAC地址。
需要说明的是,上述步骤一和步骤二可以合并操作,换句话说,在匹配发现某记录的URI字段中包括上述MAC关键字之后,先以正则方式截取该记录中MAC关键字后的字符串,作为疑似MAC地址,再对下一条记录进行筛选,本申请对此不作限定。
步骤三:对疑似MAC地址进行异常排除,筛选出MAC地址。
通过上述步骤二截取到的疑似MAC地址,只是可能为MAC地址的字符串,还需要进一步筛选和提取,才能获得较为规整的真实MAC地址。
示例性的,按照如下步骤对疑似MAC地址进行异常排除:
1)、判断疑似MAC地址的字符串长度,去除长度小于第一长度或大于第二长度的第一疑似MAC地址,得到第二疑似MAC地址。
其中,MAC地址最短为12位,通过对URI进行统计可知,加上MAC标识及各类分隔符后,MAC地址也不会超过50位,因此第一长度可以选取为10,第二长度可以选取为50。
2)、将第二疑似MAC地址中的字母都转换为大写字母,并将第二疑似MAC地址中的分隔符替换为空,得到第三疑似MAC地址。
URI字符串中通常大写和小写字母都有,将疑似MAC地址中的字母都转换为大写,便于后续分隔符替换和去重操作。
其中,各类应用调取MAC地址的分隔方式有所不同,而MAC地址的常规分隔符为“:”,通过对海量URI进行统计可知,URI中常见MAC地址分隔符还包括“%3A”、“-”、“%253A”等,因此,上述分隔符包括“%3A”、“:”、“-”、“%253A”。
3)、去除长度大于第三长度的第三疑似MAC地址,得到第四疑似MAC地址。
将分隔符替换为空后,疑似MAC地址就只剩下MAC地址的12位字符,因此,上述第三长度可以选取为12,长度大于12的疑似MAC地址则被丢弃。
4)、去除包括不合法字符的第四疑似MAC地址,得到第五疑似MAC地址。
示例性的,MAC地址为16进制字符串,判断疑似MAC地址内每个字符是否均在0-9或A-F之间,若不在则丢弃。
5)、去除第五疑似MAC地址中的典型异常值,得到MAC地址。
应当去除疑似MAC地址中的典型异常值,例如全A、全9、“020000000000”等。同时,可以规定若疑似MAC地址中“0”或“F”的个数超过6个,即认为此疑似MAC地址为异常值并将其丢弃。
通过上述步骤1)至5),即可从疑似MAC地址中筛选并提取出较为规整的MAC地址。需要说明的是,在上述步骤1)至5)中,进行去除异常MAC地址的操作的同时,也可以丢弃该异常MAC地址对应的记录。
步骤四:将包括MAC地址的记录作为目标记录。
示例性的,以上述步骤三筛选得到的MAC地址为标识,将包括MAC地址的记录作为目标记录,其余记录则丢弃。
S303、将目标记录中的MAC地址与IMEI字段组合,作为终端标识保存。
通过上述步骤筛选得到的目标记录,每条目标记录都包括一一对应的MAC地址和IMEI。因此,将目标记录中的MAC地址与对应的IMEI字段组合,即可获取精准的终端不变标识(MAC地址+IMEI),将其保存入终端标识数据库,供外部应用调用。
可选的,将MAC地址与IMEI字段组合后,还可以包括去重操作,去除重复的终端不变标识。
本申请提供的获取终端标识的方法,获取用户业务话单;其中,所述用户业务话单基于用户面业务数据进行深度报文解析后生成,所述用户业务话单的每条记录包括统一资源标志符URI字段和国际移动设备标识IMEI字段;根据所述用户业务话单中各记录的所述URI字段,筛选出包含媒体存取控制MAC地址的目标记录;将所述目标记录中的所述MAC地址与所述IMEI字段组合,作为终端标识保存以供应用调用。相对于现有技术中,基于信令或者协议从单个终端获取终端不变标识,受到操作系统的各种权限限制。本申请提供的获取终端标识的方法,利用运营商强大的数据采集和处理能力,批量获取全网海量用户的用户面业务话单,直接获取记录级别的终端IMEI和终端MAC地址映射,并从该话单的记录中提取需要的MAC地址和对应IMEI字段,从而能够避免隐私政策对外部应用获取终端标识类信息的各种限制,将移动网络和宽带网络通用的终端不变标识(MAC地址+IMEI)存入数据库,供外部应用调用。
本申请实施例可以根据上述方法示例对装置进行功能模块或者功能单元的划分,例如,可以对应各个功能划分各个功能模块或者功能单元,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块或者功能单元的形式实现。其中,本申请实施例中对模块或者单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图5示出了上述实施例中所涉及的获取终端标识的装置的一种可能的结构示意图。该装置包括处理模块501和存储模块502。
其中,所述处理模块501,用于获取用户业务话单;其中,所述用户业务话单基于用户面业务数据进行深度报文解析后生成,所述用户业务话单的每条记录包括统一资源标志符URI字段和国际移动设备标识IMEI字段。
所述处理模块501,还用于根据所述用户业务话单中各记录的所述URI字段,筛选出包含MAC地址的目标记录。
所述存储模块502,用于将所述目标记录中的所述MAC地址与所述IMEI字段组合,作为终端标识保存以供应用调用。
可选的,所述处理模块501,具体用于:筛选出初始记录;其中,所述初始记录的URI字段中包括MAC关键字;根据所述MAC关键字,从所述初始记录的URI字段中提取疑似MAC地址;对所述疑似MAC地址进行异常排除,筛选出MAC地址;将包括所述MAC地址的记录作为目标记录。
可选的,所述MAC关键字包括:字符串“mac=”或“mac_address=”或“macaddress=”;所述根据所述MAC关键字,从所述初始记录的URI字段中提取疑似MAC地址,具体包括:以正则方式,截取所述URI字段中字符串“mac=”或“mac_address=”或“macaddress=”后的字符串,作为疑似MAC地址。
可选的,所述处理模块501,用于对所述疑似MAC地址进行异常排除,筛选出MAC地址,具体包括:判断所述疑似MAC地址的字符串长度,去除长度小于第一长度或大于第二长度的第一疑似MAC地址,得到第二疑似MAC地址;将所述第二疑似MAC地址中的字母都转换为大写字母,并将所述第二疑似MAC地址中的分隔符替换为空,得到第三疑似MAC地址;去除长度大于第三长度的所述第三疑似MAC地址,得到第四疑似MAC地址;去除包括不合法字符的所述第四疑似MAC地址,得到第五疑似MAC地址;去除所述第五疑似MAC地址中的典型异常值,得到MAC地址。
本申请实施例提供的获取终端标识的装置,包括处理模块和存储模块;其中,所述处理模块,用于获取用户业务话单;其中,所述用户业务话单基于用户面业务数据进行深度报文解析后生成,所述用户业务话单的每条记录包括统一资源标志符URI字段和国际移动设备标识IMEI字段;所述处理模块,还用于根据所述用户业务话单中各记录的所述URI字段,筛选出包含MAC地址的目标记录;所述存储模块,用于将所述目标记录中的所述MAC地址与所述IMEI字段组合,作为终端标识保存以供应用调用。相对于现有技术中,基于信令或者协议从单个终端获取终端不变标识,受到操作系统的各种权限限制。本申请提供的获取终端标识的装置,利用运营商强大的数据采集和处理能力,批量获取全网海量用户的用户面业务话单,直接获取记录级别的终端IMEI和终端MAC地址映射,并从该话单的记录中提取需要的MAC地址和对应IMEI字段,从而能够避免隐私政策对外部应用获取终端标识类信息的各种限制,将移动网络和宽带网络通用的终端不变标识(MAC地址+IMEI)存入数据库,供外部应用调用。
图6示出了上述实施例中所涉及的获取终端标识的装置的又一种可能的结构示意图。该装置包括:处理器601和通信接口603。处理器601用于对获取终端标识的装置的动作进行控制管理,例如,执行上述处理模块501执行的步骤,和/或用于执行本文所描述的技术的其它过程。通信接口603用于支持获取终端标识的装置与其他网络实体的通信。获取终端标识的装置还可以包括存储器602和总线604,存储器602用于存储获取终端标识的装置的程序代码和数据,例如,执行上述存储模块502执行的步骤。
其中,存储器602可以是获取终端标识的装置中的存储器等,该存储器可以包括易失性存储器,例如随机存取存储器;该存储器也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。
上述处理器601可以是实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线604可以是扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。总线604可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本申请实施例提供一种通信系统,该通信系统可以包括基站、终端设备、数据网络和获取终端标识的装置,该获取终端标识的装置用于采集数据网络中的用户面接口数据,以执行本申请实施例提供的获取终端标识的方法。对于基站、终端设备、数据网络和获取终端标识的装置的描述具体可以参见上述方法实施例和装置实施例中的相关描述,此处不再赘述。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行上述方法实施例所述的获取终端标识的方法。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当获取终端标识的装置执行该指令时,该装置执行上述方法实施例所示的方法流程中的各个步骤。
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合、或者本领域熟知的任何其它形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(Application Specific Integrated Circuit,ASIC)中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种获取终端标识的方法,其特征在于,包括:
获取用户业务话单;其中,所述用户业务话单基于用户面业务数据进行深度报文解析后生成,所述用户业务话单的每条记录包括统一资源标志符URI字段和国际移动设备标识IMEI字段;
根据所述用户业务话单中各记录的所述URI字段,筛选出包含媒体存取控制MAC地址的目标记录;
将所述目标记录中的所述MAC地址与所述IMEI字段组合,作为终端标识保存以供应用调用。
2.根据权利要求1所述的方法,其特征在于,所述根据用户业务话单中各记录的URI字段,筛选出包括MAC地址的目标记录,具体包括:
筛选出初始记录;其中,所述初始记录的URI字段中包括MAC关键字;
根据所述MAC关键字,从所述初始记录的URI字段中提取疑似MAC地址;
对所述疑似MAC地址进行异常排除,筛选出MAC地址;
将包括所述MAC地址的记录作为目标记录。
3.根据权利要求2所述的方法,其特征在于,所述MAC关键字包括:字符串“mac=”或“mac_address=”或“macaddress=”;所述根据所述MAC关键字,从所述初始记录的URI字段中提取疑似MAC地址,具体包括:以正则方式,截取所述URI字段中字符串“mac=”或“mac_address=”或“macaddress=”后的字符串,作为疑似MAC地址。
4.根据权利要求2所述的方法,其特征在于,根据权利要求2所述的方法,其特征在于,所述对所述疑似MAC地址进行异常筛选,筛选出MAC地址,具体包括:
判断所述疑似MAC地址的字符串长度,去除长度小于第一长度或大于第二长度的第一疑似MAC地址,得到第二疑似MAC地址;
将所述第二疑似MAC地址中的字母都转换为大写字母,并将所述第二疑似MAC地址中的分隔符替换为空,得到第三疑似MAC地址;
去除长度大于第三长度的所述第三疑似MAC地址,得到第四疑似MAC地址;
去除包括不合法字符的所述第四疑似MAC地址,得到第五疑似MAC地址;
去除所述第五疑似MAC地址中的典型异常值,得到MAC地址。
5.一种获取终端标识的装置,其特征在于,包括:
处理模块,用于获取用户业务话单;其中,所述用户业务话单基于用户面业务数据进行深度报文解析后生成,所述用户业务话单的每条记录包括统一资源标志符URI字段和国际移动设备标识IMEI字段;
所述处理模块,还用于根据所述用户业务话单中各记录的所述URI字段,筛选出包含MAC地址的目标记录;
存储模块,用于将所述目标记录中的所述MAC地址与所述IMEI字段组合,作为终端标识保存以供应用调用。
6.根据权利要求5所述的装置,其特征在于,所述处理模块,具体用于:
筛选出初始记录;其中,所述初始记录的URI字段中包括MAC关键字;
根据所述MAC关键字,从所述初始记录的URI字段中提取疑似MAC地址;
对所述疑似MAC地址进行异常排除,筛选出MAC地址;
将包括所述MAC地址的记录作为目标记录。
7.根据权利要求6所述的装置,其特征在于,所述MAC关键字包括:字符串“mac=”或“mac_address=”或“macaddress=”;所述根据所述MAC关键字,从所述初始记录的URI字段中提取疑似MAC地址,具体包括:以正则方式,截取所述URI字段中字符串“mac=”或“mac_address=”或“macaddress=”后的字符串,作为疑似MAC地址。
8.根据权利要求7所述的装置,其特征在于,所述处理模块,用于对所述疑似MAC地址进行异常排除,筛选出MAC地址,具体包括:
判断所述疑似MAC地址的字符串长度,去除长度小于第一长度或大于第二长度的第一疑似MAC地址,得到第二疑似MAC地址;
将所述第二疑似MAC地址中的字母都转换为大写字母,并将所述第二疑似MAC地址中的分隔符替换为空,得到第三疑似MAC地址;
去除长度大于第三长度的所述第三疑似MAC地址,得到第四疑似MAC地址;
去除包括不合法字符的所述第四疑似MAC地址,得到第五疑似MAC地址;
去除所述第五疑似MAC地址中的典型异常值,得到MAC地址。
9.一种获取终端标识的装置,其特征在于,所述获取终端标识的装置包括:处理器、通信接口和存储器;其中,存储器用于存储一个或多个程序,该一个或多个程序包括计算机执行指令,当该获取终端标识的装置运行时,处理器执行该存储器存储的该计算机执行指令,以使该获取终端标识的装置执行权利要求1至4中任一项所述的获取终端标识的方法。
10.一种计算机可读存储介质,计算机可读存储介质中存储有指令,当计算机执行该指令时,该计算机执行上述权利要求1至4中任一项所述的获取终端标识的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110661758.XA CN113453215B (zh) | 2021-06-15 | 2021-06-15 | 一种获取终端标识的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110661758.XA CN113453215B (zh) | 2021-06-15 | 2021-06-15 | 一种获取终端标识的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113453215A CN113453215A (zh) | 2021-09-28 |
CN113453215B true CN113453215B (zh) | 2022-05-24 |
Family
ID=77811435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110661758.XA Active CN113453215B (zh) | 2021-06-15 | 2021-06-15 | 一种获取终端标识的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113453215B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116261110B (zh) * | 2022-12-06 | 2024-04-12 | 中国联合网络通信集团有限公司 | Sdr数据的确定方法、装置以及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102640082A (zh) * | 2010-06-29 | 2012-08-15 | 安特波罗德公司 | 行动器件的远程访问 |
CN110637449A (zh) * | 2017-09-29 | 2019-12-31 | 华为技术有限公司 | 一种访问设备标识符的方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7882217B2 (en) * | 2007-05-17 | 2011-02-01 | Verint Systems Inc. | Network identity clustering |
CA2734607C (en) * | 2008-01-29 | 2013-06-04 | Research In Motion Limited | System and method for addressing a unique device from a common address book |
US8621203B2 (en) * | 2009-06-22 | 2013-12-31 | Nokia Corporation | Method and apparatus for authenticating a mobile device |
US9621625B2 (en) * | 2013-07-11 | 2017-04-11 | Cinarra Systems | Method and system for correlation of internet application domain identities and network device identifiers |
-
2021
- 2021-06-15 CN CN202110661758.XA patent/CN113453215B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102640082A (zh) * | 2010-06-29 | 2012-08-15 | 安特波罗德公司 | 行动器件的远程访问 |
CN110637449A (zh) * | 2017-09-29 | 2019-12-31 | 华为技术有限公司 | 一种访问设备标识符的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113453215A (zh) | 2021-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11122435B2 (en) | Radio access technology based security in service provider networks | |
US11805153B2 (en) | Location based security in service provider networks | |
US11323483B2 (en) | Mobile equipment identity and/or IOT equipment identity and application identity based security enforcement in service provider networks | |
US11457044B2 (en) | Mobile user identity and/or sim-based IoT identity and application identity based security enforcement in service provider networks | |
Dabrowski et al. | The messenger shoots back: Network operator based IMSI catcher detection | |
EP3286877B1 (en) | Sim whitelisting and multi-operator core networks | |
CN108574667B (zh) | 一种业务流的控制方法及装置 | |
CN106465089B (zh) | 用户设备、服务器装置及通信控制方法 | |
CN112752306B (zh) | 一种业务分流方法、终端、系统和存储介质 | |
US20130286869A1 (en) | Lawful intercepts | |
EP2846566A1 (en) | Method and device for charging local traffic on wireless side | |
WO2016177106A1 (zh) | 专用核心网的选择方法和装置 | |
CN114697945A (zh) | 发现响应消息的生成方法及装置、发现消息的处理方法 | |
CN113453215B (zh) | 一种获取终端标识的方法及装置 | |
US8990941B2 (en) | Apparatus for detecting and controlling infected mobile terminal | |
CN114915958B (zh) | 一种灾难漫游的方法、装置和系统 | |
EP3639165B1 (en) | Location based security in service provider networks | |
US11606303B1 (en) | Device initiated quality of service | |
CN109495978B (zh) | 一种数据传输方法及装置 | |
KR102026215B1 (ko) | 위치기반 서비스 제공 방법 및 이를 위한 시스템 | |
KR101447685B1 (ko) | 전송패킷 내용정보 기반 감염 이동단말의 탐지 및 제어 장치 | |
EP3416084B1 (en) | Communication apparatus, method and software | |
CN114423008A (zh) | 终端身份溯源方法、设备及计算机可读存储介质 | |
CN110839233A (zh) | 流量统计方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |