CN102469435A - 一种提高移动终端的终端型号识别准确率的方法及装置 - Google Patents

一种提高移动终端的终端型号识别准确率的方法及装置 Download PDF

Info

Publication number
CN102469435A
CN102469435A CN2010105344996A CN201010534499A CN102469435A CN 102469435 A CN102469435 A CN 102469435A CN 2010105344996 A CN2010105344996 A CN 2010105344996A CN 201010534499 A CN201010534499 A CN 201010534499A CN 102469435 A CN102469435 A CN 102469435A
Authority
CN
China
Prior art keywords
imei
terminal
mapping table
tac
confidence level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105344996A
Other languages
English (en)
Other versions
CN102469435B (zh
Inventor
郑浩彬
庄仁峰
孔轶
黄伟湘
秦晋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Guangdong Co Ltd filed Critical China Mobile Group Guangdong Co Ltd
Priority to CN201010534499.6A priority Critical patent/CN102469435B/zh
Publication of CN102469435A publication Critical patent/CN102469435A/zh
Application granted granted Critical
Publication of CN102469435B publication Critical patent/CN102469435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了一种提高移动终端的终端型号识别准确率的方法及装置,其中所述方法包括:根据预定时间段内网络中移动终端的通信话单,建立移动终端的用户标识与IMEI之间的第一对应关系表;根据预定时间段内网络中移动终端的数据通信话单,建立移动终端的用户标识与终端型号之间的第二对应关系表;关联第一、第二对应关系表中具有相同用户标识的对应关系,生成用户标识、TAC和终端型号之间的第三对应关系表;根据所述第三对应关系表,统计得到相同TAC对应的各种终端型号的数量分布比例,作为该TAC对应于各种终端型号的可信度参数。本发明能够提高现网中移动终端的终端型号识别的准确率,并给出对应的可信度参数。

Description

一种提高移动终端的终端型号识别准确率的方法及装置
技术领域
本发明涉及移动通信技术领域,具体涉及一种提高移动终端的终端型号识别准确率的方法及装置。
背景技术
目前,移动通信网络中存在着正规厂商生成的各种品牌、型号的移动终端,同时还存在着大量的山寨机、黑手机。这些非法的移动终端通常盗用其它正规厂商生产的合法终端的国际移动设备识别码(IMEI,International MobileEquipment Identity number)。并且,网络中各种移动终端更新换代的速度非常快,因此,现网中具有相同设备型号核准号码(TAC)的移动终端通常具有多种与之对应的终端型号。
在移动终端上网浏览WEB网站时,预先了解该移动终端的设备型号信息,对于为该移动终端提供适合该设备型号的服务是非常有必要的。目前,识别移动终端的终端型号的方法主要是采集访问移动互联网的用户的用户代理(UA,User Agent)数据,据此判断终端型号。由于并不是所有移动终端都访问过移动互联网,因此该方案识别的移动终端的范围有限,不能很好地覆盖现网中的全部或大部分移动终端。并且,由于现网中存在大量山寨机、黑手机,这些终端上传的UA格式不规范,甚至会因为病毒等原因导致UA数据不真实,因此如果以UA数据为唯一标准进行终端型号的识别,则识别准确率不高。
发明内容
本发明所要解决的技术问题是提供一种提高移动终端的终端型号识别准确率的方法及装置,结合数据通信话单和通信话单,能够统计得到现网中的大部分移动终端的终端型号,并给出对应的可信度参数,以提高终端型号的识别准确率。
为解决上述技术问题,本发明提供方案如下:
一种提高移动终端的终端型号识别准确率的方法,包括:
根据预定时间段内网络中移动终端的通信话单,建立移动终端的用户标识与国际移动设备识别码IMEI之间的第一对应关系表;
根据所述预定时间段内网络中移动终端的数据通信话单,建立移动终端的用户标识与终端型号之间的第二对应关系表;
关联第一、第二对应关系表中具有相同用户标识的对应关系,得到用户标识、IMEI和终端型号之间的对应关系,并生成用户标识、设备型号核准号码TAC和终端型号之间的第三对应关系表;
根据所述第三对应关系表,统计得到相同TAC对应的各种终端型号的数量分布比例,作为该TAC对应于各种终端型号的可信度参数。
优选地,上述方法中,所述建立移动终端的用户标识与国际移动设备识别码IMEI之间的第一对应关系表,包括:
获得所述预定时间段内网络中移动终端的通信话单;
从每个所述通信话单中提取移动终端的用户标识与IMEI,建立所提取的移动终端的用户标识和IMEI之间的对应关系,得到所述第一对应关系表。
优选地,上述方法中,所述建立移动终端的用户标识与国际移动设备识别码IMEI之间的第一对应关系表,还包括:
统计所述第一对应关系表中每个IMEI对应的用户标识的数量;
根据统计得到的IMEI对应的用户标识的数量,确定非法IMEI,其中,在在IMEI对应的用户标识的数量大于预定门限时,判断该IMEI为非法IMEI;
从所述第一对应关系表中删除非法IMEI与用户标识之间的对应关系,仅保留合法IMEI与用户标识之间的对应关系。
优选地,上述方法中,
所述建立移动终端的用户标识与终端型号之间的第二对应关系表,包括:
从每个数据通信话单中提取移动终端的用户标识与用户代理UA字段;
根据所述UA数据中包含的终端特征字段,确定对应的解析规则,根据所确定的解析规则,从所述UA数据提取包括移动终端的厂家信息和型号在内的设备型号;
建立所提取的移动终端的用户标识和设备型号之间的对应关系,得到所述第二对应关系表。
优选地,上述方法中,在获得相邻两个所述预定时间段内的TAC对应于各种终端型号的可信度参数的统计结果后,所述方法还包括:
针对每个TAC,分别从相邻两个所述预定时间段内的统计结果中,选择数值最大的预定数量的可信度参数;
在选择出的可信度参数中,计算该TAC对应的所有终端型号的最新可信度参数的和值,并计算该TAC对应的每一终端型号的最新可信度参数与所述和值的比值,并根据该比值,修正该TAC对应的每一终端型号的可信度参数。
优选地,上述方法中,
所述用户标识为国际移动用户识别码IMSI或移动用户综合业务数字网号码MSISDN,所述数据通信话单是WAP网关话单。
本发明实施例还提供了一种提高移动终端的终端型号识别准确率的装置,包括:
第一建立单元,用于根据预定时间段内网络中移动终端的通信话单,建立移动终端的用户标识与国际移动设备识别码IMEI之间的第一对应关系表;
第二建立单元,用于根据所述预定时间段内网络中移动终端的数据通信话单,建立移动终端的用户标识与终端型号之间的第二对应关系表;
关联单元,用于关联第一、第二对应关系表中具有相同用户标识的对应关系,得到用户标识、IMEI和终端型号之间的对应关系,并生成用户标识、设备型号核准号码TAC和终端型号之间的第三对应关系表;
统计单元,用于根据所述第三对应关系表,统计得到相同TAC对应的各种终端型号的数量分布比例,作为该TAC对应于各种终端型号的可信度参数。
优选地,上述的装置中,
所述第一建立单元,具体用于:
获得所述预定时间段内网络中移动终端的通信话单;从每个所述通信话单中提取移动终端的用户标识与IMEI,建立所提取的移动终端的用户标识和IMEI之间的对应关系,得到所述第一对应关系表。
优选地,上述的装置中,
所述第一建立单元,还用于:
统计所述第一对应关系表中每个IMEI对应的用户标识的数量;
根据统计得到的IMEI对应的用户标识的数量,确定非法IMEI,其中,在在IMEI对应的用户标识的数量大于预定门限时,判断该IMEI为非法IMEI;
从所述第一对应关系表中删除非法IMEI与用户标识之间的对应关系,仅保留合法IMEI与用户标识之间的对应关系。
优选地,上述的装置中,
所述第二建立单元,具体用于:
从每个数据通信话单中提取移动终端的用户标识与用户代理UA字段;
根据所述UA数据中包含的终端特征字段,确定对应的解析规则,根据所确定的解析规则,从所述UA数据提取包括移动终端的厂家信息和型号在内的设备型号;
建立所提取的移动终端的用户标识和设备型号之间的对应关系,得到所述第二对应关系表。
优选地,上述的装置中,还包括:
修正单元,用于在所述统计单元获得相邻两个所述预定时间段内的TAC对应于各种终端型号的可信度参数的统计结果后,针对每个TAC,分别从相邻两个所述预定时间段内的统计结果中,选择数值最大的预定数量的可信度参数;以及,在选择出的可信度参数中,计算该TAC对应的所有终端型号的最新可信度参数的和值,并计算该TAC对应的每一终端型号的最新可信度参数与所述和值的比值,并根据该比值,修正该TAC对应的每一终端型号的可信度参数。
优选地,上述的装置中,所述用户标识为国际移动用户识别码IMSI或移动用户综合业务数字网号码MSISDN,所述数据通信话单是WAP网关话单。
从以上所述可以看出,本发明提供的提高移动终端的终端型号识别准确率的方法及装置,利用包括有终端的用户标识和UA数据的数据通信话单、和包括有终端的用户标识和IMEI的通信话单进行综合分析,从而能够实现对现网中的大部分终端的终端型号进行统计,并能提高终端型号的识别速度;本发明实施例还能够基于用户的通信话单对非法IMEI进行识别并建立IMEI黑名单。并且,本发明实施例通过对UA内容进行预处理,解决了因终端UA信息不规范的问题,提高了终端型号识别的准确率。本发明实施例在将IMEI(TAC)、UA数据和终端型号进行融合分析的同时,创新地提出可信度的概念,把IMEI信息和终端型号之间一对多的现状通过数理统计的方法直观的体现出来。
附图说明
图1为本发明实施例所述识别非法IMEI的方法的流程示意图;
图2为本发明实施例提供的提高移动终端的终端型号识别准确率的方法的流程示意图;
图3为本发明实施例所述统计移动终端的终端型号的装置的结构示意图。
具体实施方式
正规厂家生产的移动终端,如手机,通常都具有唯一的IMEI,即IMEI和终端设备之间是一一对应的关系;而山寨机、黑手机这些非法终端则通常多个终端设备共用同一个IMEI,因此可以根据IMEI对应的用户数量采识别非法的IMEI。以下将结合附图,通过具体实施例对本发明做进一步的说明。
请参照图1,本发明实施例所述识别非法IMEI的方法,包括以下步骤:
步骤11,获得预定时间段内网络中移动终端的通信话单,每个所述通信话单中包括有移动终端的IMEI与用户标识,所述通信话单具体可以是语音通信话单、视频通信话单或其他任何包括有移动终端的IMEI与用户标识的话单。
步骤12,根据所述通信话单,建立移动终端的用户标识与IMEI之间的第一对应关系表。
这里,所述用户标识为国际移动用户识别码(IMSI,International MobileSubscriber Identification Number)或移动用户综合业务数字网号码(MSISDN,Mobile Subscriber International ISDN number)。每个通信话单中的IMEI与该话单中的用户标识相对应。
步骤13,统计所述第一对应关系表中每个IMEI对应的用户标识的数量。
步骤14,根据统计得到的IMEI对应的用户标识的数量,确定非法I MEI。
这里,所述步骤14中,确定非法IMEI,具体包括:在IMEI对应的用户标识的数量大于预定门限时,判断该IMEI为非法IMEI;否则判断该IMEI为合法IMEI。考虑到现网中存在一机多号的移动终端,因此,上述预定门限通常取3以上的数值,例如3、4、或10等数值。
通过以上步骤,本实施例基于通信话单,能够识别出移动网络中存在的非法IMEI,并可以将这些识别出来的非法IMEI加入到IMEI黑名单中。
在识别出非法IMEI之后,本实施例还可以进一步在步骤14之后执行:
步骤15,从所述第一对应关系表中删除非法IMEI与用户标识之间的对应关系,仅保留合法IMEI与用户标识之间的对应关系。
经过上述步骤15处理得到的上述第一对应关系表中仅包括合法IMEI与用户标识之间的对应关系,上述第一对应关系表可以应用在后续的网络对用户终端的行为分析处理中,使得网络只对合法IMEI进行相关处理,不再对非法IMEI进行处理,从而可以更有针对性地利用有限的处理资源去对合法用户进行相关分析处理。
由于现网中的移动终端更新换代非常频繁,并且黑手机、山寨机充斥市场,同一设备型号核准号码(TAC,TAC是IMEI的前八位)通常存在着与之对应的多个设备型号。而对网络运营商来说,预先了解移动终端的设备型号,才能够更好地向该移动终端提供适应于该设备型号的服务,为此目的,本发明一个实施例还可以利用上述的第一对应关系表来分析网络中某个TAC对应于某个终端型号的概率(可信度),为后续的网络服务提供依据,以下将详细说明。
清参照图2,本发明的一个实施例还提供了一种提高移动终端的终端型号识别准确率的方法,请参照图2,该方法具体包括:
步骤21,根据预定时间段内网络中移动终端的通信话单,建立移动终端的用户标识与IMEI之间的第一对应关系表,,所述通信话单具体可以是语音通信话单、视频通信话单或其他任何包括有移动终端的IMEI与用户标识的话单。
步骤22,根据所述预定时间段内网络中移动终端的数据通信话单,建立移动终端的用户标识与终端型号之间的第二对应关系表,所述数据通信话单中包括有终端的用户标识和UA数据,每个数据通信话单中提取的终端型号与该话单中的用户标识相对应。
步骤23,关联第一、第二对应关系表中具有相同用户标识的对应关系,得到用户标识、IMEI和终端型号之间的对应关系,并生成用户标识、设备型号核准号码TAC和终端型号之间的第三对应关系表。
步骤24,根据所述第三对应关系表,统计得到相同TAC对应的各种终端型号的数量分布比例,作为该TAC对应于各种终端型号的可信度参数。
这样,通过以上步骤,本实施例获得了TAC对应的终端型号的可信度,该可信度表示该终端型号对应于该TAC的概率,即可信度越高,该TAC对应于该终端型号的可能性就越大。
以下对上述步骤进行详细说明。
作为一种实施方式,上述步骤21具体可以通过执行上述步骤11~12得以实现,从而获得所述第一对应关系表,即:从每个通信话单中提取移动终端的用户标识与IMEI,建立所提取的移动终端的用户标识和IMEI之间的对应关系,得到所述第一对应关系表。
作为另一种实施方式,上述步骤21可以通过执行上述步骤11~15得以实现,从而可以删除所述第一对应关系表中非法IMEI的对应表项,即在获得上述第一对应关系表之后,进一步通过统计所述第一对应关系表中每个IMEI对应的用户标识的数量;根据统计得到的IMEI对应的用户标识的数量,确定非法IMEI,其中,在在IMEI对应的用户标识的数量大于预定门限时,判断该IMEI为非法IMEI;从所述第一对应关系表中删除非法IMEI与用户标识之间的对应关系,仅保留合法IMEI与用户标识之间的对应关系,这样所得到的所述第一对应关系表中删除了非法IMEI的对应关系。
上述步骤22中,所述数据通信话单优选地采用无线应用协议(WAP)网关产生的WAP网关话单,所述建立移动终端的用户标识与终端型号之间的第二对应关系表,则具体包括:
步骤221,从每个数据通信话单中提取移动终端的用户标识与用户代理(UA,User Agent)字段;
步骤222,根据所述UA数据中包含的终端特征字段,确定对应的解析规则,根据所确定的解析规则,从所述UA数据提取包括移动终端的厂家信息和型号在内的设备型号;
步骤223,建立所提取的移动终端的用户标识和设备型号之间的对应关系,得到所述第二对应关系表。
本发明实施例还可以周期性地执行上述步骤21~24,获得多个预定时间段内的TALC对应于各种终端型号的可信度参数。在获得相邻两个所述预定时间段内的TAC对应于各种终端型号的可信度参数,本实施例还可以针对每一TAC,累加与该TAC对应的相同终端型号的可信度参数,得到第一和值;以及累加与该TAC对应的所有终端型号的可信度参数,得到第二和值;然后,计算所述第一和值与所述第二和值的比值,作为与该TAC对应的所述相同终端型号的新的可信度参数。
为了帮助理解以上实施例,下面通过具体实例对上述实施例的步骤进行说明。
上述步骤11~15在具体实现时可以是:
一、从业务运营支撑系统(BOSS)中获取用户语音通话话单,选取3个月内所有用户的IMEI信息形成IMEI数据表,即第一对应关系表,该表中每条记录包括手机号码(MSISDN)和IMEI号码的对应关系,还可以包括日期字段(用于指示该用户最近一次通话的时间),该表可采用如下格式(以下“×”表示0~9中的一个数字),该表中的每一行代表MSISDN和IMEI之间的一个对应关系:
  MSISDN   IMEI字段   日期
  1390222×××   8601110000453××
  1390222×××   8601110000453××
二、基于IMEI数据表首先统计每个IMEI对应的用户数量,即对应同一IMEI的手机号码数量;
三、如果统计出一个IMEI号码对应的用户数量大于10个,则将该IMEI记录到IMEI黑名单中;
四、将对IMEI数据表中的IMEI字段和IMEI黑名单进行比较,如果IMEI字段记录在黑名单中,则从IMEI数据表删除该IMEI对应的记录,即删除该IMEI与MSISDN之间的对应表项。
通过上述方案,能够实现在网络侧基于用户通话话单自动识别非法IMEI,并同时输出了合法IMEI与其对应手机号码的之间的对应关系作为第一对应关系表,用于后续进行终端型号的自动识别。
上述步骤22~24在具体实现时可以是:
一、通过在WAP网关与GGSN之间的Gi口收集用户上网UA数据。
例如,可以利用部署在在WAP网关与网关GPRS支持节点(GGSN,Gateway GPRS Support Node)之间的Gi口的不良信息监测系统收集UA数据。这里,该不良信息监测系统的数据结构与WAP网关相同,而采集点比WAP网关相对集中,从而部署成本低。当不良信息监测系统接受到一个用户的WAP访问请求(包括get请求和post请求),就生成一条数据通信的话单记录,话单信息包括用户的手机号码(MSISDN)、User Agent(UA数据)、访问的URL、上网时间、私有IP地址等内容。当然,也可以通过WAP网关来收集上述话单。
二、通过以上话单,选取时间在3个月内网络中所有用户的手机号码(MSISDN)、USERAGENT(UA原始串)数据,例如可将其记录成如下格式:
Figure BSA00000336146000091
三、通过对UA字段进行预处理,识别出UA字段中有效的终端型号。
由于现网中包括多种多样的移动终端,移动终端在访问WAP网关时通常会上报UA数据,本实施例针对各厂商生产的移动终端的UA数据格式中的特征字段,制定对应的解析规则,用以从UA数据种获取移动终端的设备型号信息。以下针对目前常见的移动终端的UA数据格式给出对应的解析规则和步骤,对于其它未列出的UA数据格式,均可以根据其格式特点进行类似的解析。
从移动终端提交的UA字段中提取出终端型号(mb_str)的具体实现步骤:
步骤1、判断UA字段中是否包含有“iPhone”:若是,则mb_str为iPhone,否则进入步骤2;
步骤2、判断UA字段中是否包含有字符“/”:若是,则取UA字段中该字符“/”前面的部分作为mb_str,否则整个UA字段作为mb_str;在执行步骤2之后进入步骤3;
步骤3、判断mb_str是否包含“Mozilla”:如果不包含“Mozilla”,则进入步骤4;如果包含“Mozilla”,则进一步判断:
3a)如果UA字段包含“Nokia”,则将mb_str修正为UA字段中“Nokia”开始到第一个字符“/”为止
3b)如果UA字段包含“HTC”,则将mb_str修正为UA字段中“HTC”开始到第一个“/”、“\”或“)”为止
3c)如果UA字段包含“MOT”,则将mb_str修正为UA字段中“MOT”开始到第一个“/”为止
3d)如果UA字段包含“Xda”,则将mb_str修正为UA字段中“Xda”开始到第一个字符“;”或“/”为止,如果“Xda”字段后没有“;”和“/”,则将mb_str修正为“Xda”开始到最后一个字符为止的字段。
3e)如果UA字段包含“samsung/”,则将mb_str修正为UA字段中“samsung/”开始到“samsung/”之后第一个“/”为止
3f)如果UA字段包含“samsung”但不包括“samsung/”,则将mb_str修正为UA字段中“samsung”开始到“samsung”字段后的第一个“/”为止
3g)如果UA字段包含“LG”,则将mb_str修正为UA字段中“LG”开始到“LG”之后的第一个“/”为止
3h)如果UA字段包含“bp”的,则将mb str修正为UA字段中从“hp”开始到“bp”之后的第一个“/”或“)”为止,如果“hp”字段后没有“/”和“)”,则一直取到最后一个字符。
3i)如果UA字段包含“LG”,则将mb_str修正为UA字段中“LG”开始到“LG”字段后的第一个“/”为止
3j)如果UA字段包含“ASUS”,则将mb_str修正为UA字段中“ASUS”开始到“ASUS”之后的第一个“/”为止
3k)如果UA字段包含“GIGA”,则将mb_str修正为UA字段中“GIGA”开始到最后一个字符
31)如果UA字段包含“dopod”,则将mb_str修正为UA字段中“dopod”开始到“dopod”之后的“/”、“)”或“;”为止;
步骤4、在mb_str不包含“Mozilla”时,进一步判断:
4a)、对于mb_str为“MOT”开头的,如果mb_str包含“;”,则将mb_str修正为去掉“;”及其后的部分;
4b)、对于mb_str为“TIANYU-KTOUCH”开头的,将将mb_str修正为UA字段中“TIANYU-KTOUCH”开始到“TIANYU-KTOUCH”后的第二个“/”为止;
4c)、对于mb_str为“Samsung”开头的,将将mb_str修正为UA字段中“Samsung”开始到“Samsung”后的第二个“/”为止;
4d)、对于mb_str为“Sharp”开头的,将将mb_str修正为UA字段中从“Sharp”到“/SHC”为上的部分;
4e)、对于mb_str为“UNTRUSTED”开头的,如果UA字段包含“Nokia”、“SonyEricsson”、“LG”、“MOT”、“Amoi”、或“Panasonic”字段,将将mb_str修正为上述字段开始到上述字段后的第一个“/”为止的部分;
4f)、对于mb_str为“Vodafone”的:如果UA字段包含“Toshiba”,则将mb_str修正为“Toshiba”开始到“Toshiba”之后的第一个“/”为止;否则,将mb_str修正为UA字段开始到第二个“/”为止的部分
4g)、对于mb_str以“samsung”或“kejian”开头的,如果UA字段包含“*”,则将mb_str修正为从“samsung”或“kejian”开始到“*”前一个字符。
四、统计出每个有效的终端型号的用户数量(group by UA)。
五、保存用户数量大于10个有效终端型号,其他删除。
六、根据有效终端型号形成用户标识(如MSISDN)与终端型号之间的第二对应关系表,该表中还可以包括UA字段等参数,该表的一种形式如下表所示:
Figure BSA00000336146000111
Figure BSA00000336146000121
七、基于上述的第一对应关系表和第二对应关系表,以用户的MSISDN为索引,关联统计出同一用户的IMEI、UA字段和、终端型号等信息,并提取IMEI中的前八位作为TAC,从而形成3个月粒度的MSISDN、设备型号核准号码TAC和终端型号之间的第三对应关系表,可将其记录成如下格式:
Figure BSA00000336146000122
八、基于上述第三对应关系表,针对每个TAC,统计出该TAC对应的各终端型号的数量分布比例,选取比例数值最高的预定数量的(最多7个)终端型号数据,记录入TAC-终端型号对应关系表中,该比例作为TAC对应于终端型号的可信度。例如:
通过统计,发现TAC号(IMEI前8位)为86011100对应有2种可能的终端型号,包括酷派TD-6168H和酷派TD-6168,前者在第三对应关系表中的记录数占该TAC号对应的总记录数的70%,即该TAC对应于终端型号“酷派TD-6168H”的可信度为70%,后者在第三对应关系表中的记录数占该TAC号对应的总记录数的28%,即该TAC对应于终端型号“酷派TD-6168”的可信度为28%。由此得到的TAC与终端型号的一种对应关系如下表所示:
  TAC  品牌1   型号1   可信度1  品牌2   型号2   可信度2
  86011100  酷派   TD-6168H   70%  酷派   TD-6168   28%
九、每间隔设定周期,如3个月,重复上述步骤,统计得到预定时间段内的TAC对应于终端型号的可信度参数。可以将相邻两个周期内获得的可信度参数,按照以下方式进行合并:
针对每个TAC,分别从相邻两个预定时间段内的统计结果中,按照可信度参数从大到小的顺序,选择预定数量的可信度参数;
然后,在选择出的可信度参数中,计算该TAC对应的所有终端型号的最新可信度参数的和值,并计算该TAC对应的每一终端型号的最新可信度参数与所述和值的比值,根据该比值,修正该TAC对应的每一终端型号的可信度参数。
上述合并方式具体可以按照以下步骤实现:
1)统计得到相邻两个周期内的TAC与终端型号可信度参数的对应关系表,这里,将相邻两个周期中前一个周期的对应关系表称作旧表,将相邻两个周期中后一个周期的对应关系表称作新表:
2)把旧表复制一份作为合并后对应关系表的初始数据。
3)在新表中提取一行记录(包括TAC号、终端型号、可信度):
如果该TAC数据没有包括在旧表中,则直接将该记录增加在合并后的对应关系表中;
如果TAC数据包括在旧的关系表中,把新、旧关系表中对应该TAC号的所有终端型号、可信度提取出来,根据可信度排序,从新、旧表中选取可信度最高的预定数量(例如七个)的终端型号,计算每一终端型号的最新可信度参数与选取的所有终端型号的最新可信度参数之和的比值,将该每一终端型号的可信度参数修正为该比值。
由于同一TAC可能对应于大量的终端型号,通过以上方式对新旧表中数量比例较大的若干个终端型号进行加权合并,并修正TAC对应于各个终端型号的可信度参数,输出更值得关心的数据。而对于一下数量比较很小的终端型号,则可以不予考虑。一种按照上述方式进行合并的示例如下,该示例中仅考虑新、旧表中可信度参数最高的2个终端型号:
假设相邻两个周期中前一周期的对应关系表中,TAC=8601100与各个终端型号的可信度参数如下表所示:
  TAC  品牌1   型号1   可信度1  品牌2   型号2   可信度2
  86011100  酷派   TD-6168H   70%  酷派   TD-6168   28%
假设相邻两个周期中后一周期的对应关系表中,TAC=8601100与各个终端型号的可信度参数如下表所示:
  TAC   品牌1   型号1   可信度1   品牌2   型号2   可信度2
  86011100   酷派   TD-6168H   80%   酷派   TD-6268   10%
上述两张表中,“86011100”的TAC对应于TD-6168H的最新可信度参数为80%,对应于TD-6168的最新可信度参数为28%,对应于TD-6268的最新可信度参数为10%,于是可信度加权算法:
TD-6168H可信度:80%/(80%+28%+10%)=68%
TD-6168可信度:28%/(80%+28%+10%)=24%
TD-6268可信度:10%/(80%+28%+10%)=8%
合并后,TAC=8601100对应于以下终端型号的可信度参数如下表所示:
  TAC   品牌1   型号1   可信度1
  86011100   酷派   TD-6168H   68%
  86011100   酷派   TD-6168   24%
  86011100   酷派   TD-6268   8%
从以上所述可以看出,本发明实施例提供的识别非法IMEI的方法,能够基于用户的话单对非法IMEI进行识别并建立IMEI黑名单。并且本发明实施例通过对UA内容进行预处理,解决了因终端UA信息不规范的问题,提高了终端型号识别的准确率。本发明实施例还将IMEI(TAC)、UA数据和终端型号进行融合分析,并通过对现网海量数据的统计分析,创新地提出可信度的概念,把IMEI信息和终端型号之间一对多的现状通过数理统计的方法直观的体现出来。本发明实施例通过自动更新的算法,使得整个流程都是自动化,无须人工干预,实时更新周期缩短到1天,新终端型号的捕抓入库周期为1天。经过测试,与传统的识别方法相比,本发明实施例识别准确性比以前的算法提高100%,识别的用户终端覆盖率比以前的算法提升42%。
最后,基于以上实施例提供的方法,本发明实施例还提供了用以实施上述方法的装置,请参照图3,本实施例提供的一种提高移动终端的终端型号识别准确率的装置,具体包括:
第一建立单元,用于根据预定时间段内网络中移动终端的通信话单,建立移动终端的用户标识与国际移动设备识别码IMEI之间的第一对应关系表;
第二建立单元,用于根据所述预定时间段内网络中移动终端的数据通信话单,建立移动终端的用户标识与终端型号之间的第二对应关系表;
关联单元,用于关联第一、第二对应关系表中具有相同用户标识的对应关系,得到用户标识、IMEI和终端型号之间的对应关系,并生成用户标识、设备型号核准号码TAC和终端型号之间的第三对应关系表;
统计单元,用于根据所述第三对应关系表,统计得到相同TAC对应的各种终端型号的数量分布比例,作为该TAC对应于各种终端型号的可信度参数。
优选地,上述装置中,所述第一建立单元,具体用于:
获得所述预定时间段内网络中移动终端的通信话单;从每个通信话单中提取移动终端的用户标识与IMEI,建立所提取的移动终端的用户标识和IMEI之间的对应关系,得到所述第一对应关系表。
优选地,上述装置中,所述第一建立单元,还用于:
统计所述第一对应关系表中每个IMEI对应的用户标识的数量;
根据统计得到的IMEI对应的用户标识的数量,确定非法IMEI,其中,在在IMEI对应的用户标识的数量大于预定门限时,判断该IMEI为非法IMEI;
从所述第一对应关系表中删除非法IMEI与用户标识之间的对应关系,仅保留合法IMEI与用户标识之间的对应关系。
优选地,上述装置中,所述第二建立单元,具体用于:
从每个数据通信话单中提取移动终端的用户标识与用户代理UA字段;
根据所述UA数据中包含的终端特征字段,确定对应的解析规则,根据所确定的解析规则,从所述UA数据提取包括移动终端的厂家信息和型号在内的设备型号;
建立所提取的移动终端的用户标识和设备型号之间的对应关系,得到所述第二对应关系表。
优选地,上述装置中,还包括:
修正单元,用于在所述统计单元获得相邻两个所述预定时间段内的TAC对应于各种终端型号的可信度参数的统计结果后,针对每个TAC,分别从相邻两个所述预定时间段内的统计结果中,选择数值最大的预定数量的可信度参数;以及,在选择出的可信度参数中,计算该TAC对应的所有终端型号的最新可信度参数的和值,并计算该TAC对应的每一终端型号的最新可信度参数与所述和值的比值,并根据该比值,修正该TAC对应的每一终端型号的可信度参数。
优选地,上述装置中,所述用户标识为国际移动用户识别码IMSI或移动用户综合业务数字网号码MSISDN,所述数据通信话单是WAP网关话单。
以上所述仅是本发明的实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种提高移动终端的终端型号识别准确率的方法,其特征在于,包括:
根据预定时间段内网络中移动终端的通信话单,建立移动终端的用户标识与国际移动设备识别码IMEI之间的第一对应关系表;
根据所述预定时间段内网络中移动终端的数据通信话单,建立移动终端的用户标识与终端型号之间的第二对应关系表;
关联第一、第二对应关系表中具有相同用户标识的对应关系,得到用户标识、IMEI和终端型号之间的对应关系,并生成用户标识、设备型号核准号码TAC和终端型号之间的第三对应关系表;
根据所述第三对应关系表,统计得到相同TAC对应的各种终端型号的数量分布比例,作为该TAC对应于各种终端型号的可信度参数。
2.如权利要求1所述的方法,其特征在于,所述建立移动终端的用户标识与国际移动设备识别码IMEI之间的第一对应关系表,包括:
获得所述预定时间段内网络中移动终端的通信话单;
从每个所述通信话单中提取移动终端的用户标识与IMEI,建立所提取的移动终端的用户标识和IMEI之间的对应关系,得到所述第一对应关系表。
3.如权利要求2所述的方法,其特征在于,所述建立移动终端的用户标识与国际移动设备识别码IMEI之间的第一对应关系表,还包括:
统计所述第一对应关系表中每个IMEI对应的用户标识的数量;
根据统计得到的IMEI对应的用户标识的数量,确定非法IMEI,其中,在在IMEI对应的用户标识的数量大于预定门限时,判断该IMEI为非法IMEI;
从所述第一对应关系表中删除非法IMEI与用户标识之间的对应关系,仅保留合法IMEI与用户标识之间的对应关系。
4.如权利要求1所述的方法,其特征在于,
所述建立移动终端的用户标识与终端型号之间的第二对应关系表,包括:
从每个数据通信话单中提取移动终端的用户标识与用户代理UA字段;
根据所述UA数据中包含的终端特征字段,确定对应的解析规则,根据所确定的解析规则,从所述UA数据提取包括移动终端的厂家信息和型号在内的设备型号;
建立所提取的移动终端的用户标识和设备型号之间的对应关系,得到所述第二对应关系表。
5.如权利要求1所述的方法,其特征在于,在获得相邻两个所述预定时间段内的TAC对应于各种终端型号的可信度参数的统计结果后,所述方法还包括:
针对每个TAC,分别从相邻两个所述预定时间段内的统计结果中,选择数值最大的预定数量的可信度参数;
在选择出的可信度参数中,计算该TAC对应的所有终端型号的最新可信度参数的和值,并计算该TAC对应的每一终端型号的最新可信度参数与所述和值的比值,并根据该比值,修正该TAC对应的每一终端型号的可信度参数。
6.如权利要求1所述的方法,其特征在于,
所述用户标识为国际移动用户识别码IMSI或移动用户综合业务数字网号码MSISDN,所述数据通信话单是WAP网关话单。
7.一种提高移动终端的终端型号识别准确率的装置,其特征在于,包括:
第一建立单元,用于根据预定时间段内网络中移动终端的通信话单,建立移动终端的用户标识与国际移动设备识别码IMEI之间的第一对应关系表;
第二建立单元,用于根据所述预定时间段内网络中移动终端的数据通信话单,建立移动终端的用户标识与终端型号之间的第二对应关系表;
关联单元,用于关联第一、第二对应关系表中具有相同用户标识的对应关系,得到用户标识、IMEI和终端型号之间的对应关系,并生成用户标识、设备型号核准号码TAC和终端型号之间的第三对应关系表;
统计单元,用于根据所述第三对应关系表,统计得到相同TAC对应的各种终端型号的数量分布比例,作为该TAC对应于各种终端型号的可信度参数。
8.如权利要求7所述的装置,其特征在于,
所述第一建立单元,具体用于:
获得所述预定时间段内网络中移动终端的通信话单;从每个所述通信话单中提取移动终端的用户标识与IMEI,建立所提取的移动终端的用户标识和IMEI之间的对应关系,得到所述第一对应关系表。
9.如权利要求8所述的装置,其特征在于,
所述第一建立单元,还用于:
统计所述第一对应关系表中每个IMEI对应的用户标识的数量;
根据统计得到的IMEI对应的用户标识的数量,确定非法IMEI,其中,在在IMEI对应的用户标识的数量大于预定门限时,判断该IMEI为非法IMEI;
从所述第一对应关系表中删除非法IMEI与用户标识之间的对应关系,仅保留合法IMEI与用户标识之间的对应关系。
10.如权利要求7所述的装置,其特征在于,
所述第二建立单元,具体用于:
从每个数据通信话单中提取移动终端的用户标识与用户代理UA字段;
根据所述UA数据中包含的终端特征字段,确定对应的解析规则,根据所确定的解析规则,从所述UA数据提取包括移动终端的厂家信息和型号在内的设备型号;
建立所提取的移动终端的用户标识和设备型号之间的对应关系,得到所述第二对应关系表。
11.如权利要求7所述的装置,其特征在于,还包括:
修正单元,用于在所述统计单元获得相邻两个所述预定时间段内的TAC对应于各种终端型号的可信度参数的统计结果后,针对每个TAC,分别从相邻两个所述预定时间段内的统计结果中,选择数值最大的预定数量的可信度参数;以及,在选择出的可信度参数中,计算该TAC对应的所有终端型号的最新可信度参数的和值,并计算该TAC对应的每一终端型号的最新可信度参数与所述和值的比值,并根据该比值,修正该TAC对应的每一终端型号的可信度参数。
12.如权利要求7所述的装置,其特征在于,
所述用户标识为国际移动用户识别码IMSI或移动用户综合业务数字网号码MSISDN,所述数据通信话单是WAP网关话单。
CN201010534499.6A 2010-11-08 2010-11-08 一种提高移动终端的终端型号识别准确率的方法及装置 Active CN102469435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010534499.6A CN102469435B (zh) 2010-11-08 2010-11-08 一种提高移动终端的终端型号识别准确率的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010534499.6A CN102469435B (zh) 2010-11-08 2010-11-08 一种提高移动终端的终端型号识别准确率的方法及装置

Publications (2)

Publication Number Publication Date
CN102469435A true CN102469435A (zh) 2012-05-23
CN102469435B CN102469435B (zh) 2014-11-05

Family

ID=46072471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010534499.6A Active CN102469435B (zh) 2010-11-08 2010-11-08 一种提高移动终端的终端型号识别准确率的方法及装置

Country Status (1)

Country Link
CN (1) CN102469435B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103260173A (zh) * 2013-04-12 2013-08-21 南京安讯科技有限责任公司 一种基于用户上网日志信息识别山寨手机的方法
CN103533530A (zh) * 2013-09-26 2014-01-22 林毅 一种跨设备的用户对应及用户追踪方法、系统
WO2014194467A1 (zh) * 2013-06-04 2014-12-11 华为技术有限公司 一种信息获取方法及设备
CN104283918A (zh) * 2013-07-05 2015-01-14 中国移动通信集团浙江有限公司 一种无线局域网终端类型获取方法及系统
CN104602274A (zh) * 2014-12-05 2015-05-06 珠海世纪鼎利通信科技股份有限公司 一种动态识别终端品牌和终端类型的方法及系统
CN104639550A (zh) * 2015-02-12 2015-05-20 北京嘀嘀无限科技发展有限公司 用户识别方法和设备
CN105260365A (zh) * 2014-06-04 2016-01-20 中国移动通信集团宁夏有限公司 终端信息的处理方法和装置
CN105554800A (zh) * 2015-12-11 2016-05-04 中国联合网络通信集团有限公司 一种终端网络性能的评估方法及装置
CN105591842A (zh) * 2016-01-29 2016-05-18 中国联合网络通信集团有限公司 一种获取移动终端操作系统版本的方法和装置
CN105848155A (zh) * 2015-01-14 2016-08-10 中国移动通信集团河南有限公司 一种终端非法刷机识别方法及装置
CN106550363A (zh) * 2015-09-21 2017-03-29 中兴通讯股份有限公司 一种终端接入方法、终端、网络设备和无线网络
CN107105428A (zh) * 2016-02-23 2017-08-29 中国移动通信集团内蒙古有限公司 快速补全终端信息库的方法及装置
CN108011976A (zh) * 2017-12-26 2018-05-08 福建星瑞格软件有限公司 一种上网终端型号的识别方法及计算机设备
CN108834124A (zh) * 2018-07-04 2018-11-16 中国联合网络通信集团有限公司 2g物联网终端识别方法及系统
CN109121137A (zh) * 2017-06-23 2019-01-01 中国移动通信集团广东有限公司 双卡终端的用户号码使用类型识别方法及装置
CN109361529A (zh) * 2018-08-03 2019-02-19 锐捷网络股份有限公司 一种终端类型识别方法、装置、电子设备及存储介质
CN110120986A (zh) * 2018-02-05 2019-08-13 腾讯科技(深圳)有限公司 一种电子设备信息的获取方法、装置及设备
CN110662212A (zh) * 2019-10-11 2020-01-07 上海德拓信息技术股份有限公司 一种基于大数据的手机终端识别方法
CN110769424A (zh) * 2018-07-27 2020-02-07 中国联合网络通信集团有限公司 一种非法终端的识别方法及装置
CN112087744A (zh) * 2020-08-21 2020-12-15 宜通世纪科技股份有限公司 一种识别终端型号的方法、系统、装置及存储介质
CN114938504A (zh) * 2022-05-23 2022-08-23 西安航空学院 敏感场合特定终端阻止方法、计算机设备、介质及终端

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022672A (zh) * 2007-02-16 2007-08-22 华为技术有限公司 一种检查移动用户合法性的方法及系统
WO2010057539A1 (en) * 2008-11-24 2010-05-27 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for aquiring an imei associated to an imsi

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022672A (zh) * 2007-02-16 2007-08-22 华为技术有限公司 一种检查移动用户合法性的方法及系统
WO2010057539A1 (en) * 2008-11-24 2010-05-27 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for aquiring an imei associated to an imsi

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103260173A (zh) * 2013-04-12 2013-08-21 南京安讯科技有限责任公司 一种基于用户上网日志信息识别山寨手机的方法
WO2014194467A1 (zh) * 2013-06-04 2014-12-11 华为技术有限公司 一种信息获取方法及设备
CN104283918A (zh) * 2013-07-05 2015-01-14 中国移动通信集团浙江有限公司 一种无线局域网终端类型获取方法及系统
CN104283918B (zh) * 2013-07-05 2017-11-03 中国移动通信集团浙江有限公司 一种无线局域网终端类型获取方法及系统
CN103533530A (zh) * 2013-09-26 2014-01-22 林毅 一种跨设备的用户对应及用户追踪方法、系统
CN103533530B (zh) * 2013-09-26 2017-09-26 余飞 一种跨设备的用户对应及用户追踪方法、系统
CN105260365A (zh) * 2014-06-04 2016-01-20 中国移动通信集团宁夏有限公司 终端信息的处理方法和装置
CN105260365B (zh) * 2014-06-04 2018-12-04 中国移动通信集团宁夏有限公司 终端信息的处理方法和装置
CN104602274A (zh) * 2014-12-05 2015-05-06 珠海世纪鼎利通信科技股份有限公司 一种动态识别终端品牌和终端类型的方法及系统
CN105848155A (zh) * 2015-01-14 2016-08-10 中国移动通信集团河南有限公司 一种终端非法刷机识别方法及装置
CN105848155B (zh) * 2015-01-14 2020-01-17 中国移动通信集团河南有限公司 一种终端非法刷机识别方法及装置
CN104639550A (zh) * 2015-02-12 2015-05-20 北京嘀嘀无限科技发展有限公司 用户识别方法和设备
CN106550363A (zh) * 2015-09-21 2017-03-29 中兴通讯股份有限公司 一种终端接入方法、终端、网络设备和无线网络
CN105554800A (zh) * 2015-12-11 2016-05-04 中国联合网络通信集团有限公司 一种终端网络性能的评估方法及装置
CN105591842A (zh) * 2016-01-29 2016-05-18 中国联合网络通信集团有限公司 一种获取移动终端操作系统版本的方法和装置
CN105591842B (zh) * 2016-01-29 2018-12-21 中国联合网络通信集团有限公司 一种获取移动终端操作系统版本的方法和装置
CN107105428A (zh) * 2016-02-23 2017-08-29 中国移动通信集团内蒙古有限公司 快速补全终端信息库的方法及装置
CN109121137A (zh) * 2017-06-23 2019-01-01 中国移动通信集团广东有限公司 双卡终端的用户号码使用类型识别方法及装置
CN109121137B (zh) * 2017-06-23 2021-08-27 中国移动通信集团广东有限公司 双卡终端的用户号码使用类型识别方法及装置
CN108011976A (zh) * 2017-12-26 2018-05-08 福建星瑞格软件有限公司 一种上网终端型号的识别方法及计算机设备
CN108011976B (zh) * 2017-12-26 2022-07-26 福建星瑞格软件有限公司 一种上网终端型号的识别方法及计算机设备
CN110120986A (zh) * 2018-02-05 2019-08-13 腾讯科技(深圳)有限公司 一种电子设备信息的获取方法、装置及设备
CN110120986B (zh) * 2018-02-05 2021-10-19 腾讯科技(深圳)有限公司 一种电子设备信息的获取方法、装置及设备
CN108834124B (zh) * 2018-07-04 2021-06-04 中国联合网络通信集团有限公司 2g物联网终端识别方法及系统
CN108834124A (zh) * 2018-07-04 2018-11-16 中国联合网络通信集团有限公司 2g物联网终端识别方法及系统
CN110769424A (zh) * 2018-07-27 2020-02-07 中国联合网络通信集团有限公司 一种非法终端的识别方法及装置
CN110769424B (zh) * 2018-07-27 2023-05-26 中国联合网络通信集团有限公司 一种非法终端的识别方法及装置
CN109361529B (zh) * 2018-08-03 2022-03-18 锐捷网络股份有限公司 一种终端类型识别方法、装置、电子设备及存储介质
CN109361529A (zh) * 2018-08-03 2019-02-19 锐捷网络股份有限公司 一种终端类型识别方法、装置、电子设备及存储介质
CN110662212A (zh) * 2019-10-11 2020-01-07 上海德拓信息技术股份有限公司 一种基于大数据的手机终端识别方法
CN110662212B (zh) * 2019-10-11 2022-01-07 上海德拓信息技术股份有限公司 一种基于大数据的手机终端识别方法
CN112087744A (zh) * 2020-08-21 2020-12-15 宜通世纪科技股份有限公司 一种识别终端型号的方法、系统、装置及存储介质
CN114938504A (zh) * 2022-05-23 2022-08-23 西安航空学院 敏感场合特定终端阻止方法、计算机设备、介质及终端
CN114938504B (zh) * 2022-05-23 2023-04-18 西安航空学院 敏感场合特定终端阻止方法、计算机设备、介质及终端

Also Published As

Publication number Publication date
CN102469435B (zh) 2014-11-05

Similar Documents

Publication Publication Date Title
CN102469435B (zh) 一种提高移动终端的终端型号识别准确率的方法及装置
CN102469460B (zh) 一种识别非法国际移动设备识别码的方法及装置
CN102075963B (zh) 一种移动业务数据采集分析方法及系统
CN111278014A (zh) 一种防诈骗系统、方法、服务器及存储介质
CN107145556B (zh) 通用的分布式采集系统
CN106547793A (zh) 获取代理服务器地址的方法和装置
CN113412607B (zh) 内容推送方法、装置、移动终端及存储介质
CN102469117A (zh) 一种异常访问行为的识别方法及装置
CN102932775A (zh) 一种利用imei与ua结合进行终端识别的方法及装置
CN102111453A (zh) 一种提取互联网用户网络行为的方法和系统
CN102857555A (zh) 终端、服务器和软件升级方法
CN105447147A (zh) 一种数据处理方法及装置
CN104301161A (zh) 业务质量指标的计算方法、计算装置以及通信系统
CN103020188A (zh) 多平台应用搜索方法和服务器
CN102905233A (zh) 一种终端功能推荐的方法及装置
CN109710440A (zh) 网页前端的异常处理方法、装置、存储介质及终端设备
CN107832333A (zh) 基于分布式处理和dpi数据构建用户网络数据指纹的方法和系统
CN105512318B (zh) 页面生成方法和装置
CN105578395A (zh) 一种更新终端信息库中终端属性的方法及装置
CN102681996A (zh) 预读方法和装置
CN106304122B (zh) 一种业务数据分析方法及系统
CN102480722B (zh) 吸费终端识别方法、装置及系统
TW201520791A (zh) 網頁的處理方法及裝置
CN103577585A (zh) 互联网中用户的标识方法和装置
CN105848155B (zh) 一种终端非法刷机识别方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant