CN109640312A - “黑卡”识别方法、电子设备及计算机程序产品 - Google Patents

“黑卡”识别方法、电子设备及计算机程序产品 Download PDF

Info

Publication number
CN109640312A
CN109640312A CN201811390723.1A CN201811390723A CN109640312A CN 109640312 A CN109640312 A CN 109640312A CN 201811390723 A CN201811390723 A CN 201811390723A CN 109640312 A CN109640312 A CN 109640312A
Authority
CN
China
Prior art keywords
telephone number
state
data
normal
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811390723.1A
Other languages
English (en)
Other versions
CN109640312B (zh
Inventor
夏玉明
魏国富
殷钱安
汲丽
梁淑云
陶景龙
徐�明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information and Data Security Solutions Co Ltd
Original Assignee
Information and Data Security Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information and Data Security Solutions Co Ltd filed Critical Information and Data Security Solutions Co Ltd
Priority to CN201811390723.1A priority Critical patent/CN109640312B/zh
Publication of CN109640312A publication Critical patent/CN109640312A/zh
Application granted granted Critical
Publication of CN109640312B publication Critical patent/CN109640312B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/06Authentication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请实施例中提供了一种“黑卡”识别方法、电子设备及计算机程序产品。采用本申请中的方案,获取原始数据,并对所述原始数据进行处理,形成以电话号码为唯一标识的识别数据;对识别数据进行异常检测,确定每个电话号码的异常标签;将异常标签加入对应电话号码所标识的识别数据后,根据加入异常标签的识别数据构建无向图;根据无向图识别各电话号码是否为“黑卡”。本方案形成以电话号码为唯一标识的识别数据,对识别数据进行异常检测,确定每个电话号码的异常标签之后,还会将异常标签加入对应电话号码所标识的识别数据,根据加入异常标签的识别数据构建无向图,根据无向图识别各电话号码是否为“黑卡”,实现了“黑卡”的准确识别。

Description

“黑卡”识别方法、电子设备及计算机程序产品
技术领域
本申请涉及信息安全技术,具体地,涉及一种“黑卡”识别方法、电子设备及计算机程序产品。
背景技术
电话“黑卡”是指未进行或盗用他人身份信息实名登记,可能被不法分子利用实施违法犯罪活动等行为的移动电话卡。虽然各运营商已加强实名制,但不法分子依然能获得“实名制”的电话卡,而这些卡跟不法分子本人的身份信息没有丝毫关系,从而为他们的不法行为提供了极大的便利性及隐匿性。这些“黑卡”部分被高价销售,部分被用于为了“薅羊毛”而大量囤积于不法分子手中,即养卡。例如某些平台的“首单优惠”活动,某些互联网金融平台的新用户注册活动,电商平台的刷单、刷信誉,社交平台的刷粉、水军等,养卡者都可以利用手中大量“实名”的电话“黑卡”,获得可观的非法收入。目前“黑卡”从供到销已形成成熟的产业链。提高对电话“黑卡”的识别,有利于预防和阻止各类违法犯罪活动,保障电信用户的合法权益,有利于维护国家安全和社会稳定。
目前采用半人工计算处理的方式识别电话“黑卡”用户,具体是:首先根据经验自定义“黑卡”识别规则;然后根据自定义的识别规则,识别出哪些用户属于“黑卡”用户。
该方法需要根据样本数据人工总结“黑卡”识别规则及阈值,缺乏自适应能力,需不断总结新的识别规则及阈值,以防止识别规则及被避开。
发明内容
本申请实施例中提供了一种“黑卡”识别方法、电子设备及计算机程序产品。
根据本申请实施例的第一个方面,提供一种“黑卡”识别方法,包括:
获取原始数据,并对所述原始数据进行处理,形成以电话号码为唯一标识的识别数据;
对所述识别数据进行异常检测,确定每个电话号码的异常标签;
将异常标签加入对应电话号码所标识的识别数据后,根据加入异常标签的识别数据构建无向图;
根据所述无向图识别各电话号码是否为“黑卡”。
根据本申请实施例的第二个方面,提供了一种电子设备,所述电子设备包括:显示器,存储器,一个或多个处理器;以及一个或多个模块,所述一个或多个模块被存储在所述存储器中,并被配置成由所述一个或多个处理器执行,所述一个或多个模块包括用于执行上述第一个方面任一所述方法中各个步骤的指令。
根据本申请实施例的第三个方面,提供了一种计算机程序产品,所述计算机程序产品对用于执行一种过程的指令进行编码,所述过程包括上述第一个方面中任一项所述的方法。
采用本申请实施例中提供的方法,获取原始数据后,对原始数据进行处理,形成以电话号码为唯一标识的识别数据,再对识别数据进行异常检测,确定每个电话号码的异常标签之后,还会将异常标签加入对应电话号码所标识的识别数据,根据加入异常标签的识别数据构建无向图,根据无向图识别各电话号码是否为“黑卡”,实现了“黑卡”的准确识别。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请一实施例提供的一种“黑卡”识别方法的流程示意图;
图2为本申请一实施例提供的一种电子设备结构示意图。
具体实施方式
在实现本申请的过程中,发明人发现,目前采用半人工计算处理的方式识别电话“黑卡”用户,具体是:首先根据经验自定义“黑卡”识别规则;然后根据自定义的识别规则,识别出哪些用户属于“黑卡”用户。
该方法需要根据样本数据人工总结“黑卡”识别规则及阈值,缺乏自适应能力,需不断总结新的识别规则及阈值,以防止识别规则及被避开。
为了解决上述问题,本提案提供一种“黑卡”识别方法、电子设备及计算机程序产品,获取原始数据后,对原始数据进行处理,形成以电话号码为唯一标识的识别数据,再对识别数据进行异常检测,确定每个电话号码的异常标签之后,还会将异常标签加入对应电话号码所标识的识别数据,根据加入异常标签的识别数据构建无向图,根据无向图识别各电话号码是否为“黑卡”,实现了“黑卡”的准确识别。
为了使本申请实施例中的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
参见图1,本实施例所示的“黑卡”识别方法的实现流程如下:
101,获取原始数据,并对原始数据进行处理,形成以电话号码为唯一标识的识别数据。
本步骤在具体实现时,考虑到数据量较大,可在大数据集群上执行。
本步骤获取的原始数据为:运营商客户资料数据、产品数据、销售品数据、近n个月的账单数据、缴费日志数据、通话短信记录数据、基站信令数据、电渠接口调用数据、电渠登录日志数据。
其中,n为预设的正整数值。n可为3,即近3个月的账单数据。
另外,账单数据为月度数据,在获取近n个月的账单数据时,可以以当月月6号为基准采集最近n个月数据入大数据集群。
例如,获取运营商客户资料数据、产品数据、销售品数据、近n个月的账单数据、缴费日志数据、通话短信记录数据、基站信令数据、电渠接口调用数据、电渠登录日志数据后,将其导入大数据集群。
在获取到原始数据之后,对原始数据进行处理,形成以电话号码为唯一标识的识别数据的实现过程如下:
101-1,从运营商客户资料数据中提取状态正常的电话号码和状态正常的电话号码所对应的第一属性信息,并根据状态正常的电话号码和第一属性信息,生成以状态正常的电话号码为唯一标识的运营商客户表;
其中,第一属性信息包括:用户姓名、证件类型、用户年龄、性别、证件归属地、证件对应的有效手机号码数、帐户、账户对应的有效手机号码数、所属客户编码、所属客户编码对应的有效手机号码数。
例如,一个用户用身份证办理了1张主卡和至少1张副卡,则两张卡同属一个账户。具体实现时,账户可以通过acct_id参数获得。
所属客户编码与用户标识相关,与其办理的套餐无关,例如用户A办理套餐A,其对应的客户编码为001,若用户A办理套餐B,则对应的客户编码依然为001。在具体实现时,客户编码可以通过own_cust_id参数获得。
其中,001仅为示例,具体实现时以实际情况为准。
具体实现时,用户号码可以通过service_nbr参数获得。
证件类型为身份证,或者,营业执照,或者,户口簿,或者,其他证件。
证件归属地为省内,或者,省外。
证件对应的有效手机号码数为去重后的手机号码数,即非重复的手机号码数。在具体实现时,可以通过对service_nbr参数进行去重处理(如利用diff函数去重),再对去重后的计数。
账户对应的有效手机号码数为状态正常的手机号码数。
所属客户编码对应的有效手机号码数为状态正常的手机号码数。
本步骤在具体执行时,可以将运营商客户资料数据在hive中加工处理成标准化结构,例如:以状态正常的电话号码作为主键,使得运营商客户表中每个状态正常的电话号码仅有一条记录,从而形成1张标准化宽表。
101-2,从产品数据中提取状态正常的电话号码对应的第二属性信息,并根据状态正常的电话号码和第二属性信息,生成以状态正常的电话号码为唯一标识的产品表。
其中,第二属性信息包括:号码头是否新号段、虚拟网号段、是否近1月入网、是否近3月入网、是否近6月入网、网龄、开卡受理人、开卡受理营业厅、是否代理商、代理商标识、号码等级、是否开通语音功能、是否开通上网功能。
可以将最近一年中运营商新采用的号段确定为新号段,也可以将运营商最近新采用的m次号段确定为新号段。其中m为设置的,可以是正整数中的任一值。
虚拟网号段为电话号码前3位。
是否近1月入网、是否近3月入网、是否近6月入网均是根据入网时间确定的,入网时间为用户买到手机号码卡后,开通服务的时间。
网龄为当前时间-入网时间。
在具体实现时,开卡受理人可以通过empee_id参数获得。
在具体实现时,开卡受理营业厅可以通过channel_id参数获得。
号码等级可以根据运营商是否为靓号的区分标准确定,即号码等级与电话号码相关,例如电话号码后四位为8888,则其号码等级为5级,电话号码后六位为888888,则其号码等级为7级等。
上述号码等级与电话号码的对应关系仅为示例,具体号码等级与电话号码的对应关系以实际为准。
本步骤在具体执行时,可以将运营商客户资料数据在hive中加工处理成标准化结构,例如:以状态正常的电话号码作为主键,使得产品表中每个状态正常的电话号码仅有一条记录,从而形成1张标准化宽表。
101-3,从销售品数据中提取状态正常的电话号码对应的第三属性信息,并根据状态正常的电话号码和第三属性信息,生成以状态正常的电话号码为唯一标识的销售品表。
其中,第三属性信息包括:对应套餐的套餐类型、套餐档次、是否加装增值业务、套餐下有效手机号码数。
对应套餐的套餐类型为单产品业务型,或者,宽带及号码业务型,或者,其他类型。
属于单产品业务的套餐为仅办理号码业务的套餐。属于宽带及号码业务型的套餐为套餐中既包括宽带业务也包括号码业务。非属于单产品业务型和宽带及号码业务型的套餐,均属于其他类型为。
例如,套餐中包括宽带业务、号码业务、视频业务,此种套餐即为其他类型。
在具体实现时,单产品业务型也可称为单C类型,宽带及号码业务型也可称为宽+C类型,其他类型也可称为融合类型。本实施例不对具体名称进行限定。
套餐档次根据用户主套餐价值量分为小于30元、小于50元、小于100元、小于200元、小于300元、大于等于300元6个档次,分别以1、2、3、4、5、6对应表示。
是否加装增值业务中的增值业务包括但不限于流量包。
套餐下有效手机号码数是手机号码剔重后计数,即非重的号码数量。
本步骤在具体执行时,可以将运营商客户资料数据在hive中加工处理成标准化结构,例如:以状态正常的电话号码作为主键,使得销售品表中每个状态正常的电话号码仅有一条记录,从而形成1张标准化宽表。
101-4,从账单数据中提取状态正常的电话号码对应的第四属性信息,并根据状态正常的电话号码和第四属性信息,生成以状态正常的电话号码为唯一标识的账单表。
其中,第四属性信息包括:各月出账金额、n个月的平均账单金额、是否欠费、欠费金额、欠费月数。
若n为3,则各月出账金额为当月出账金额、上月出账金额、、第三月出账金额。
若n为3,则n个月的平均账单金额为近3个月费用均值。
本步骤在具体执行时,可以将运营商客户资料数据在hive中加工处理成标准化结构,例如:以状态正常的电话号码作为主键,使得账单表中每个状态正常的电话号码仅有一条记录,从而形成1张标准化宽表。
101-5,从缴费日志数据中提取状态正常的电话号码对应的第五属性信息,并根据状态正常的电话号码和第五属性信息,生成以状态正常的电话号码为唯一标识的缴费日志表。
其中,第五属性信息包括:6个月内的缴费次数、平均每次缴费金额、缴费方式、缴费渠道、缴费金额的变异系数。
平均每次缴费金额为缴费总额/缴费次数。本实施例并不限定缴费总额和缴费次数的统计时长,只要缴费总额的统计期间与缴费次数的统计期间相同即可。例如,6个月内的缴费总额/6个月内的缴费次数。再例如,n个月内的缴费总额/n个月内的缴费次数。
缴费方式为现金,或者,充值卡,或者,网厅充值,或者,电商充值。
缴费渠道为网厅缴费,或者,第三方合作电商缴费,或者,营业厅缴费,或者,代理点缴费。
缴费金额的变异系数为缴费标准差/缴费均值。
本步骤在具体执行时,可以将运营商客户资料数据在hive中加工处理成标准化结构,例如:以状态正常的电话号码作为主键,使得缴费日志表中每个状态正常的电话号码仅有一条记录,从而形成1张标准化宽表。
101-6,从通话短信记录数据中提取状态正常的电话号码对应的第六属性信息,并根据状态正常的电话号码和第六属性信息,生成以状态正常的电话号码为唯一标识的通话短信记录表。
其中,第六属性信息包括:n个月内的主叫总时长、主叫次数、主叫号码数、主叫号码离散度、被叫时长、被叫次数、被叫号码数、被叫号码离散度。
若n为3,则抽取近3个月内的主叫总时长。
主叫号码数是作为主叫时,通过对被叫的号码(如通过called_nbr参数获取)进行去重处理(如利用diff函数去重),再对去重后的计数。
主叫号码离散度为主叫号码数/主叫次数。
被叫时长是作为被叫时通话时长总和。
被叫次数是作为被叫时通话次数。
被叫号码数是作为被叫时,通过对主叫的号码(如通过calling_nbr参数获取)进行去重处理(如利用diff函数去重),再对去重后的计数
被叫号码离散度为被叫号码数/被叫次数。
本步骤在具体执行时,可以将运营商客户资料数据在hive中加工处理成标准化结构,例如:以状态正常的电话号码作为主键,使得通话短信记录表中每个状态正常的电话号码仅有一条记录,从而形成1张标准化宽表。
101-7,从基站信令数据中提取状态正常的电话号码对应的第七属性信息,并根据状态正常的电话号码和第七属性信息,生成以状态正常的电话号码为唯一标识的基站信令表。
其中,第七属性信息包括:1个月内的接入基站总数、基站标识、每天接入基站数的标准差、每天接入基站数的平均值、基站接入数的变异系数、最常接入基站信息。
基站接入数的变异系数为每天接入基站数的标准差/每天接入基站数的平均值。
最常接入基站信息包括但不限于LAC、CELL_ID等。
本步骤在具体执行时,可以将运营商客户资料数据在hive中加工处理成标准化结构,例如:以状态正常的电话号码作为主键,使得基站信令表中每个状态正常的电话号码仅有一条记录,从而形成1张标准化宽表。
101-8,从电渠接口调用数据中提取状态正常的电话号码对应的第八属性信息,并根据状态正常的电话号码和第八属性信息,生成以状态正常的电话号码为唯一标识的电渠接口调用表。
其中,第八属性信息包括:状态正常的电话号码的操作频数、最小的每个状态正常的电话号码每种操作类型两次操作间隔、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数、每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数、每个状态正常的电话号码每种操作类型的最小操作间隔的最大连续次数、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数占比。
最小的每个状态正常的电话号码每种操作类型两次操作间隔的确定方式为:先确定每个状态正常的电话号码每种操作类型两次操作间隔,再从每个状态正常的电话号码每种操作类型两次操作间隔中选择最小的每个状态正常的电话号码每种操作类型两次操作间隔。
每个状态正常的电话号码每种操作类型两次操作间隔的确定方式为:针对每一个状态正常的电话号码,按操作类型进行分组;针对每组电渠接口调用数据,按操作时间从前到后排序,形成第一序列;从第一序列中第二个电渠接口调用数据开始,计算其与其前一个电渠接口调用数据之间的操作时间差,并将所有时间差均作为该状态正常的电话号码该种操作类型两次操作间隔。
操作类型包括但不限于:领券、充值。
例如,状态正常的电话号码为号码1和号码2,操作类型为领券和充值,则针对每一个状态正常的电话号码,按操作类型进行分组后得到4组,分别为号码1-领券对应的组11,号码1-充值对应的组12,号码2-领券对应的组13,号码2-充值对应的组14。对组11中的电渠接口调用数据按操作时间从前到后排序,形成第一序列11;对组12中的电渠接口调用数据按操作时间从前到后排序,形成第一序列12;对组13中的电渠接口调用数据按操作时间从前到后排序,形成第一序列13;对组14中的电渠接口调用数据按操作时间从前到后排序,形成第一序列14。
下面仅以第一序列11作为示例进行说明,其他第一序列的实现方式相同。若第一序列11为数据11、数据12、数据13、数据14、数据15、数据16。则从第一序列11中第二个电渠接口调用数据开始,计算其与其前一个电渠接口调用数据之间的操作时间差(数据12的操作时间-数据11操作时间,数据13的操作时间-数据12的操作时间,数据14的操作时间-数据13的操作时间,数据15的操作时间-数据14的操作时间,数据16的操作时间-数据15的操作时间),并将所有时间差(数据12的操作时间-数据11操作时间,数据13的操作时间-数据12的操作时间,数据14的操作时间-数据13的操作时间,数据15的操作时间-数据14的操作时间,数据16的操作时间-数据15的操作时间)均作为该状态正常的电话号码该种操作类型两次操作间隔。
最小的每个状态正常的电话号码每种操作类型两次操作间隔是每个状态正常的电话号码的每种操作类型下的两次操作间隔最小的。
例如,状态正常的电话号码为号码1和号码2,操作类型为领券和充值,那么最小的每个状态正常的电话号码每种操作类型两次操作间隔包括4个值,1为号码1-领券下的所有两次操作间隔中最小值,2为号码1-充值下的所有两次操作间隔中最小值,3为号码2-领券下的所有两次操作间隔中最小值,4为号码2-充值下的所有两次操作间隔中最小值。
对于最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数,仍以状态正常的电话号码为号码1和号码2,操作类型为领券和充值为例,最小的每个状态正常的电话号码每种操作类型两次操作间隔包括4个值,1为号码1-领券下的所有两次操作间隔中最小值(如T11),2为号码1-充值下的所有两次操作间隔中最小值(如T22),3为号码2-领券下的所有两次操作间隔中最小值(如T33),4为号码2-充值下的所有两次操作间隔中最小值(如T44)。最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数也包括4个,1为号码1-领券下的所有两次操作间隔的间隔值中,为T11的间隔值总数。2为号码1-领券下的所有两次操作间隔的间隔值中,为T22的间隔值总数。3为号码1-领券下的所有两次操作间隔的间隔值中,为T33的间隔值总数。4为号码1-领券下的所有两次操作间隔的间隔值中,为T44的间隔值总数。
每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数的确定方式为:针对每一个状态正常的电话号码的每个操作类型,按该状态正常的电话号码该种操作类型的两次操作间隔进行分组;针对每组电渠接口调用数据,按操作时间从前到后排序,形成第二序列;计算同一电渠接口调用数据在第一序列中的序号与其在第二序列中的序号差,将相同序号差的最大数量作为该状态正常的电话号码该状种操作类型以该相同操作间隔的最大连续次数。
以号码1-领券对应的组11为例,若对组11中的电渠接口调用数据按操作时间从前到后排序,形成第一序列11为数据11、数据12、数据13、数据14、数据15、数据16,则数据11在序列1中的序号为1,数据12在序列1中的序号为2,数据13在序列1中的序号为3,数据14在序列1中的序号为4,数据15在序列1中的序号为5,数据16在序列1中的序号为6。若第一序列11中第二个电渠接口调用数据开始,计算其与其前一个电渠接口调用数据之间的操作时间差如下:数据12的操作时间-数据11操作时间=5秒,数据13的操作时间-数据12的操作时间=6秒,数据14的操作时间-数据13的操作时间=5秒,数据15的操作时间-数据14的操作时间=5秒,数据16的操作时间-数据15的操作时间=5秒,则每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数的确定方式为:针对每一个状态正常的电话号码的每个操作类型,按该状态正常的电话号码该种操作类型的两次操作间隔进行分组,得到2组,分别为号码1-领券-5秒对应的组21(组21包括:数据11、数据12、数据14、数据15、数据16),号码1-领券-6秒对应的组22(组22包括:数据12、数据13)。对组21中的电渠接口调用数据按操作时间从前到后排序,形成第二序列21(如数据11、数据12、数据14、数据15、数据16);对组22中的电渠接口调用数据按操作时间从前到后排序,形成第二序列22(如数据12、数据13)。
下面仅以第二序列21作为示例进行说明,其他第二序列的实现方式相同。若第二序列21为数据11、数据12、数据14、数据15、数据16。对于数据11,其在第二序列中的序号为1,对于数据12,其在第二序列中的序号为2,对于数据14,其在第二序列中的序号为3,对于数据15,其在第二序列中的序号为4,对于数据16,其在第二序列中的序号为5。为了方便描述,下面将同一电渠接口调用数据在第一序列和第二序列中的序号以表格形式展现。
序号差为0的数量为2,序号差为1的数量为3,将3作为号码1领券操作类型以5秒操作间隔的最大连续次数。
最小的每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数是每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数的最小值。
例如,以号码1-领券对应的组11为例,若对组11中的电渠接口调用数据按操作时间从前到后排序,形成第一序列11为数据11、数据12、数据13、数据14、数据15、数据16,则数据11在序列1中的序号为1,数据12在序列1中的序号为2,数据13在序列1中的序号为3,数据14在序列1中的序号为4,数据15在序列1中的序号为5,数据16在序列1中的序号为6。若第一序列11中第二个电渠接口调用数据开始,计算其与其前一个电渠接口调用数据之间的操作时间差如下:数据12的操作时间-数据11操作时间=5秒,数据13的操作时间-数据12的操作时间=6秒,数据14的操作时间-数据13的操作时间=5秒,数据15的操作时间-数据14的操作时间=5秒,数据16的操作时间-数据15的操作时间=5秒,则最小的号码1领券以相同操作间隔的最大连续次数是号码1领券操作类型以5秒操作间隔的最大连续次数与号码1领券操作类型以6秒操作间隔的最大连续次数中的最小值。
最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数占比为最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数/总操作次数。
通过最小的每个状态正常的电话号码每种操作类型两次操作间隔、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数参数,可以反映每个预设时间进行一次操作的机器行为。
但实际操作时发现,机器行为的时间间隔并非相同,而是具有一定规律,例如当前触发1秒钟触发第二次,第二次触发2秒后触发第三次,第三次触发3秒后触发第四次,第四次触发4秒后触发第五次,之后再次循环该触发规律,即第五次触发1秒后触发第六次,第六次触发2秒后触发第七次,第七次触发3秒后触发第八次,第八次触发4秒后触发第九次,之后再次循环该触发规律,如此循环。对于此种现象,通过每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数、每个状态正常的电话号码每种操作类型的最小操作间隔的最大连续次数可以反映。
本步骤在具体执行时,可以将运营商客户资料数据在hive中加工处理成标准化结构,例如:以状态正常的电话号码作为主键,使得电渠接口调用表中每个状态正常的电话号码仅有一条记录,从而形成1张标准化宽表。
101-9,从电渠登录日志数据中提取状态正常的电话号码对应的第九属性信息,并根据状态正常的电话号码和第九属性信息,生成以状态正常的电话号码为唯一标识的电渠登录日志表。
其中,第九属性信息包括:用户登录次数、一天内登录小时数、登录设备标识、登录IP数、同一登录IP下的最大曾登录手机号码数、同一登录设备下的最大曾登录手机号码数。
在具体实现时,一天内登录小时数可以从登录时间中提取登录的小时(如hour参数),再对其进行去重处理(如利用diff函数去重),再对去重后的计数得到。
在具体实现时,登录设备标识可以对imsi参数进行去重处理(如利用diff函数去重),再对去重后的计数得到。
在具体实现时,登录IP数可以对IP参数进行去重处理(如利用diff函数去重),再对去重后的计数得到。
同一登录IP下的最大曾登录手机号码数的确定方式为:确定每一登录IP下曾登录的不同手机号码数,将最大的不同手机号码数确定为同一登录IP下的最大曾登录手机号码数。
例如,若登录IP有2个,分别为IP1和IP2,若IP1下曾登录的不同手机号码数为2,IP2下曾登录的不同手机号码数为3,则将3确定为同一登录IP下的最大曾登录手机号码数。
同一登录设备下的最大曾登录手机号码数的确定方式为:确定每一登录设备下曾登录的不同手机号码数,将最大的不同手机号码数确定为同一登录设备下的最大曾登录手机号码数。
例如,若登录设备有2个,分别为设备1和设备2,若设备1下曾登录的不同手机号码数为4,设备2下曾登录的不同手机号码数为5,则将5确定为同一登录设备下的最大曾登录手机号码数。
本步骤在具体执行时,可以将运营商客户资料数据在hive中加工处理成标准化结构,例如:以状态正常的电话号码作为主键,使得电渠登录日志表中每个状态正常的电话号码仅有一条记录,从而形成1张标准化宽表。
执行至此,已形成9张标准化宽表。
101-10,以状态正常的电话号码为唯一标识,将运营商客户表、产品表、销售品表、账单表、缴费日志表、通话短信记录表、基站信令表、电渠接口调用表、电渠登录日志表整合成一张表,并将整合后的表作为以电话号码为唯一标识的识别数据。
在上述9张标准化宽表中,以运营商客户表作为基础表,以状态正常的电话号码作为关联字段(唯一标识),将其余8张表均拼接到基础表中,从而形成一张包含所有特征的宽表,并将整合后的宽表作为以电话号码为唯一标识的识别数据。
102,对识别数据进行异常检测,确定每个电话号码的异常标签。
本步骤可以通过如下方式实现:
102-1,对识别数据中的证件类型、性别、号码头是否新号段、是否近1月入网、是否近3月入网、是否近6月入网、是否代理商、套餐类型、号码等级、是否欠费、缴费方式、缴费渠道进行one-hot编码处理。
本步骤通过one-hot编码处理可以将离散的分类型变量转化为可处理变量,以适用于孤立森林模型。
例如,通过python读取加工后的宽表数据,对于证件类型、性别、号码头是否新号段、是否近1月入网、是否近3月入网、是否近6月入网、是否代理商、套餐类型、号码等级、是否欠费、缴费方式、缴费渠道等分类型变量进行one-hot编码处理,以适用于孤立森林模型。
102-2将处理后的识别数据输入孤立森林模型,得到每个电话号码的异常标签。
其中,异常标签为-1或1,当异常标签为-1时,确定对应的电话号码为疑似异常号码。当异常标签为1时,确定对应的电话号码为疑似正常号码。
孤立森林(iForest)模型属于无参数和无监督的模型,即不需要假设数据模型也不需要有label的训练模型。对于查找哪些点容易被孤立(异常点),孤立森林用一个随机超平面来切割数据空间,切一次后可以生成两个子空间,之后再继续用随机一个超平面来切割每个子空间,循环下去,直到每子空间里面只有一个数据点为止。直观上来讲,可以发现那些密度很高的簇需要被切很多次才会停止切割,但那些密度很低的点就会很容易很早的停到一个子空间了。由于切割是随机的,所以需要用ensemble的方法来得到一个收敛值,即反复从头开始切,然后平均每次切的结果。孤立森林由t个iTree(孤立树)组成,每个iTree是一个二叉树结构。孤立森林实现步骤大致如下:1.从训练数据中随机抽取部分样本作为子样本集;2.随机指定一个维度,在当前节点数据中随机产生一个切割的,以此切割点生成一个超平面,将当前节点数据空间分为2个子空间;3.递归步骤2,不断构造新的子节点,直到子节点中只有一个数据或达到限定高度。获得t个iTree之后,孤立森林训练就结束了,输入每个样本是否异常标签,以及异常分数。
例如,将步骤1中识别数据中的所有属性(状态正常的电话号码、用户姓名、证件类型、用户年龄、性别、证件归属地、证件对应的有效手机号码数、帐户、账户对应的有效手机号码数、所属客户编码、所属客户编码对应的有效手机号码数、号码头是否新号段、虚拟网号段、是否近1月入网、是否近3月入网、是否近6月入网、网龄、开卡受理人、开卡受理营业厅、是否代理商、代理商标识、号码等级、是否开通语音功能、是否开通上网功能、对应套餐的套餐类型、套餐档次、是否加装增值业务、套餐下有效手机号码数、各月出账金额、n个月的平均账单金额、是否欠费、欠费金额、欠费月数、6个月内的缴费次数、平均每次缴费金额、缴费方式、缴费渠道、缴费金额的变异系数、n个月内的主叫总时长、主叫次数、主叫号码数、主叫号码离散度、被叫时长、被叫次数、被叫号码数、被叫号码离散度、1个月内的接入基站总数、基站标识、每天接入基站数的标准差、每天接入基站数的平均值、基站接入数的变异系数、最常接入基站信息、状态正常的电话号码的操作频数、最小的每个状态正常的电话号码每种操作类型两次操作间隔、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数、每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数、每个状态正常的电话号码每种操作类型的最小操作间隔的最大连续次数、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数占比、用户登录次数、一天内登录小时数、登录设备标识、登录IP数、同一登录IP下的最大曾登录手机号码数、同一登录设备下的最大曾登录手机号码数)作为特征变量X,输入孤立森林模型,计算对应号码是否异常输出异常标签。
103,将异常标签加入对应电话号码所标识的识别数据后,根据加入异常标签的识别数据构建无向图。
本步骤的实现方式如下:
103-1,若异常标签为-1,则将其改为1后,将1作为异常属性加入对应电话号码所标识的识别数据中;若异常标签为1,则将其改为0后,将0作为异常属性加入对应电话号码所标识的识别数据中。
103-2,基于加入异常标签的识别数据,将每个电话号码作以及每个电话号码对应的登录IP均作为点。
103-3,将每个电话号码与其对应的登录IP之间构建一条边,且该边的权重为该电话号码对应的异常属性的值。
103-4,所有的点和边形成无向图。
本步骤将孤立森林模型输出结果中-1的异常标签改为1,1的异常标签改为0,从而生成新的异常属性。将登录IP、电话号码与异常属性作为无向图的输入数据,其中登录IP、电话号码为图的节点,异常属性值作为登录IP、电话号码两个节点间边的权重。
104,根据无向图识别各电话号码是否为“黑卡”。
本步骤的实现过程如下:
104-1,计算每个登录IP对应的点的异常程度。
对于任一登录IP对应的点j,其异常程度通过计算。
或者,对于任一登录IP对应的点j,其异常程度通过计算。
其中,Sj为任一登录IP对应的点j的异常程度,nj为任一登录IP对应的点j的度数,i为度标识,wi为第i度对应边的权重,oi为第i度对应边的对端点的度数,m为登录IP对应点的总数量,M为电话号码对应点的总数量。
104-2,将异常程度大于预设阈值的点确定为疑似异常点。
104-3,根据疑似异常点确定异常的电话号码。
在实现104-3时,可以在无向图中,将与疑似异常点连接的点对应的电话号码确定为异常的电话号码。
除此之外,还可以通过如下过程实现。
104-3-1,将疑似异常点对应的登录IP作为疑似登录IP。
104-3-2,确定疑似异常点所对应的电话号码,并将其作为疑似电话号码。
104-3-3,确定疑似电话号码对应的登录设备标识,并将其作为疑似登录设备标识。
104-3-4,确定疑似电话号码对应的基站标识,并将其作为疑似基站标识。
104-3-5,确定疑似电话号码对应的代理商标识,并将其作为疑似代理商标识。
104-3-6,确定疑似电话号码对应的证件归属地,并将其作为疑似证件归属地。
104-3-7,基于加入异常标签的识别数据,将每个电话号码、每个电话号码对应的登录IP、每个电话号码对应的登录设备标识、每个电话号码对应的基站标识、每个电话号码对应的代理商标识、每个电话号码对应的证件归属地均作为点,根据各点之间的使用和归属关系作为边,构建有向图。
104-3-8,在有向图中确定疑似登录IP、疑似电话号码、疑似登录设备标识、疑似基站标识、疑似代理商标识、疑似证件归属地对应的点,并将其均作为初始点。
104-3-9,从初始点开始,在有向图中,以边进行深度溯源,得到包括初始点的点集。
104-3-10,将点集中各点对应的电话号码均确定为异常的电话号码。
步骤104-3-1至步骤104-3-10会将步骤104-2中确定的疑似异常点的电话号码、登录IP、登录设备标识、基站标识、代理商标识、证件归属地作为源点,利用图数据库分析技术深度溯源思路,挖掘未被孤立森林模型识别的异常电话号码。
例如,1)以电话号码、登录IP、登录设备标识、基站标识、代理商标识、证件归属地为节点,以各节点之间使用、归属关系作为边,构建有向有环图。将步骤104-2中确定的疑似异常点的电话号码、登录IP、登录设备标识、基站标识、代理商标识、证件归属地作为起始点,通过关系图中节点与节点之间是否存在连接的边进行溯源。2)基于深度溯源思路,从起始点开始,任意选择一条边,通过这条边找到第二个节点,然后标记这个节点,再任意选择这个节点的一条边继续找到第三个节点,以此类推,直到没有可选择的边和节点为止(过程中保证选择过的边和节点不再备选到)。这样就得到了一条由多个黑卡号码串联组成的黑卡链。3)基于广度溯源思路,从起始点开始,任意选择一条边,通过这条边找到第二个节点,然后回到起始点,再选择随机选择一条与之前不一样的边,得到第三个节点。以此类推,每次找到一个节点之后再回到初始节点,当选择完初始点所有的边之后,再依次选择第二个节点的边,直到达到限制的遍历次数为止,这样就可以精准定位到了一个异常群体。
通过该异常群体能够发现黑卡群体中未被孤立森林模型识别的“黑卡”电话号码。
104-4,将异常的电话号码和异常标签为-1的电话号码均确定为“黑卡”。
本步骤通过每个登录IP对应的点的异常程度反应该登录IP的异常度,异常程度越大,该登录IP越异常。筛选出异常程度较大的登录IP,从而识别出以异常程度较大的登录IP为中心的“黑卡”电话号码群体。
由于孤立森林模型存在一定的容错率,可能是异常的“黑卡”并未被识别到。因此本实施例提供的“黑卡”识别方法并非仅根据孤立森林得到的异常标签确定电话号码是否为黑卡,而是通过步骤103将该异常标签作为一个新的属性加入识别数据中,再通过图的方法寻找异常登录IP,将异常登录IP相关联的电话号码和异常标签为-1的电话号码均确定为“黑卡”,避免了漏识“黑卡”的情况,提升本提案的识别准确性。
本实施例提供的方法,获取原始数据后,对原始数据进行处理,形成以电话号码为唯一标识的识别数据,再对识别数据进行异常检测,确定每个电话号码的异常标签之后,还会将异常标签加入对应电话号码所标识的识别数据,根据加入异常标签的识别数据构建无向图,根据无向图识别各电话号码是否为“黑卡”,实现了“黑卡”的准确识别。
基于同一发明构思,本实施例提供了一种电子设备,参见图2,包括存储器201、处理器202、总线203以及存储在存储器201上并可在处理器202上运行的计算机程序,所述处理器202执行所述程序时实现如下步骤。
获取原始数据,并对原始数据进行处理,形成以电话号码为唯一标识的识别数据;
对识别数据进行异常检测,确定每个电话号码的异常标签;
将异常标签加入对应电话号码所标识的识别数据后,根据加入异常标签的识别数据构建无向图;
根据无向图识别各电话号码是否为“黑卡”。
可选地,获取以电话号码为唯一标识的识别数据,包括:
获取运营商客户资料数据、产品数据、销售品数据、近n个月的账单数据、缴费日志数据、通话短信记录数据、基站信令数据、电渠接口调用数据、电渠登录日志数据,其中,n为预设的正整数值;
从运营商客户资料数据中提取状态正常的电话号码和状态正常的电话号码所对应的第一属性信息,并根据状态正常的电话号码和第一属性信息,生成以状态正常的电话号码为唯一标识的运营商客户表;第一属性信息包括:用户姓名、证件类型、用户年龄、性别、证件归属地、证件对应的有效手机号码数、帐户、账户对应的有效手机号码数、所属客户编码、所属客户编码对应的有效手机号码数;
从产品数据中提取状态正常的电话号码对应的第二属性信息,并根据状态正常的电话号码和第二属性信息,生成以状态正常的电话号码为唯一标识的产品表;第二属性信息包括:号码头是否新号段、虚拟网号段、是否近1月入网、是否近3月入网、是否近6月入网、网龄、开卡受理人、开卡受理营业厅、是否代理商、代理商标识、号码等级、是否开通语音功能、是否开通上网功能;
从销售品数据中提取状态正常的电话号码对应的第三属性信息,并根据状态正常的电话号码和第三属性信息,生成以状态正常的电话号码为唯一标识的销售品表;第三属性信息包括:对应套餐的套餐类型、套餐档次、是否加装增值业务、套餐下有效手机号码数;
从账单数据中提取状态正常的电话号码对应的第四属性信息,并根据状态正常的电话号码和第四属性信息,生成以状态正常的电话号码为唯一标识的账单表;第四属性信息包括:各月出账金额、n个月的平均账单金额、是否欠费、欠费金额、欠费月数;
从缴费日志数据中提取状态正常的电话号码对应的第五属性信息,并根据状态正常的电话号码和第五属性信息,生成以状态正常的电话号码为唯一标识的缴费日志表;第五属性信息包括:6个月内的缴费次数、平均每次缴费金额、缴费方式、缴费渠道、缴费金额的变异系数;
从通话短信记录数据中提取状态正常的电话号码对应的第六属性信息,并根据状态正常的电话号码和第六属性信息,生成以状态正常的电话号码为唯一标识的通话短信记录表;第六属性信息包括:n个月内的主叫总时长、主叫次数、主叫号码数、主叫号码离散度、被叫时长、被叫次数、被叫号码数、被叫号码离散度;
从基站信令数据中提取状态正常的电话号码对应的第七属性信息,并根据状态正常的电话号码和第七属性信息,生成以状态正常的电话号码为唯一标识的基站信令表;第七属性信息包括:1个月内的接入基站总数、基站标识、每天接入基站数的标准差、每天接入基站数的平均值、基站接入数的变异系数、最常接入基站信息;
从电渠接口调用数据中提取状态正常的电话号码对应的第八属性信息,并根据状态正常的电话号码和第八属性信息,生成以状态正常的电话号码为唯一标识的电渠接口调用表;第八属性信息包括:状态正常的电话号码的操作频数、最小的每个状态正常的电话号码每种操作类型两次操作间隔、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数、每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数、每个状态正常的电话号码每种操作类型的最小操作间隔的最大连续次数、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数占比;
从电渠登录日志数据中提取状态正常的电话号码对应的第九属性信息,并根据状态正常的电话号码和第九属性信息,生成以状态正常的电话号码为唯一标识的电渠登录日志表;第九属性信息包括:用户登录次数、一天内登录小时数、登录设备标识、登录IP数、同一登录IP下的最大曾登录手机号码数、同一登录设备下的最大曾登录手机号码数;
以状态正常的电话号码为唯一标识,将运营商客户表、产品表、销售品表、账单表、缴费日志表、通话短信记录表、基站信令表、电渠接口调用表、电渠登录日志表整合成一张表,并将整合后的表作为以电话号码为唯一标识的识别数据。
可选地,对应套餐的套餐类型为单产品业务型,或者,宽带及号码业务型,或者,其他类型;
缴费方式为现金,或者,充值卡,或者,网厅充值,或者,电商充值;
缴费渠道为网厅缴费,或者,第三方合作电商缴费,或者,营业厅缴费,或者,代理点缴费;
缴费金额的变异系数为缴费标准差与缴费均值的商;
主叫号码离散度为主叫号码数与主叫次数的商;
被叫号码离散度为被叫号码数与被叫次数的商;
基站接入数的变异系数为每天接入基站数的标准差与每天接入基站数的平均值的商;
同一登录IP下的最大曾登录手机号码数的确定方式为:确定每一登录IP下曾登录的不同手机号码数,将最大的不同手机号码数确定为同一登录IP下的最大曾登录手机号码数;
同一登录设备下的最大曾登录手机号码数的确定方式为:确定每一登录设备下曾登录的不同手机号码数,将最大的不同手机号码数确定为同一登录设备下的最大曾登录手机号码数;
最小的每个状态正常的电话号码每种操作类型两次操作间隔的确定方式为:先确定每个状态正常的电话号码每种操作类型两次操作间隔,再从每个状态正常的电话号码每种操作类型两次操作间隔中选择最小的每个状态正常的电话号码每种操作类型两次操作间隔;
每个状态正常的电话号码每种操作类型两次操作间隔的确定方式为:针对每一个状态正常的电话号码,按操作类型进行分组;针对每组电渠接口调用数据,按操作时间从前到后排序,形成第一序列;从第一序列中第二个电渠接口调用数据开始,计算其与其前一个电渠接口调用数据之间的操作时间差,并将所有时间差均作为该状态正常的电话号码该种操作类型两次操作间隔;
每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数的确定方式为:针对每一个状态正常的电话号码的每个操作类型,按该状态正常的电话号码该种操作类型的两次操作间隔进行分组;针对每组电渠接口调用数据,按操作时间从前到后排序,形成第二序列;计算同一电渠接口调用数据在第一序列中的序号与其在第二序列中的序号差,将相同序号差的最大数量作为该状态正常的电话号码该状种操作类型以该状操作间隔操作的连续次数;
最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数占比为最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数与总操作次数的商。
可选地,对识别数据进行异常检测,确定每个电话号码的异常标签,包括:
对识别数据中的证件类型、性别、号码头是否新号段、是否近1月入网、是否近3月入网、是否近6月入网、是否代理商、套餐类型、号码等级、是否欠费、缴费方式、缴费渠道进行one-hot编码处理;
将处理后的识别数据输入孤立森林模型,得到每个电话号码的异常标签;
异常标签为-1或1,当异常标签为-1时,确定对应的电话号码为疑似异常号码。
可选地,将异常标签加入对应电话号码所标识的识别数据后,根据加入异常标签的识别数据构建无向图,包括:
若异常标签为-1,则将其改为1后,将1作为异常属性加入对应电话号码所标识的识别数据中;若异常标签为1,则将其改为0后,将0作为异常属性加入对应电话号码所标识的识别数据中;
基于加入异常标签的识别数据,将每个电话号码作以及每个电话号码对应的登录IP均作为点;
将每个电话号码与其对应的登录IP之间构建一条边,且该边的权重为该电话号码对应的异常属性的值;
所有的点和边形成无向图。
可选地,根据无向图识别各电话号码是否为“黑卡”,包括:
计算每个登录IP对应的点的异常程度;
将异常程度大于预设阈值的点确定为疑似异常点;
根据疑似异常点确定异常的电话号码;
将异常的电话号码和异常标签为-1的电话号码均确定为“黑卡”。
可选地,计算每个登录IP对应的点的异常程度,包括:
对于任一登录IP对应的点j,其异常程度通过如下公式之一计算:
或者,
其中,Sj为任一登录IP对应的点j的异常程度,nj为任一登录IP对应的点j的度数,i为度标识,wi为第i度对应边的权重,oi为第i度对应边的对端点的度数,m为登录IP对应点的总数量,M为电话号码对应点的总数量。
可选地,根据疑似异常点确定异常的电话号码,包括:
在无向图中,将与疑似异常点连接的点对应的电话号码确定为异常的电话号码;或者,
将疑似异常点对应的登录IP作为疑似登录IP;
确定疑似异常点所对应的电话号码,并将其作为疑似电话号码;
确定疑似电话号码对应的登录设备标识,并将其作为疑似登录设备标识;
确定疑似电话号码对应的基站标识,并将其作为疑似基站标识;
确定疑似电话号码对应的代理商标识,并将其作为疑似代理商标识;
确定疑似电话号码对应的证件归属地,并将其作为疑似证件归属地;
基于加入异常标签的识别数据,将每个电话号码、每个电话号码对应的登录IP、每个电话号码对应的登录设备标识、每个电话号码对应的基站标识、每个电话号码对应的代理商标识、每个电话号码对应的证件归属地均作为点,根据各点之间的使用和归属关系作为边,构建有向图;
在有向图中确定疑似登录IP、疑似电话号码、疑似登录设备标识、疑似基站标识、疑似代理商标识、疑似证件归属地对应的点,并将其均作为初始点;
从初始点开始,在有向图中,以边进行深度溯源,得到包括初始点的点集;
将点集中各点对应的电话号码均确定为异常的电话号码。
本实施例提供的电子设备,获取原始数据后,对原始数据进行处理,形成以电话号码为唯一标识的识别数据,再对识别数据进行异常检测,确定每个电话号码的异常标签之后,还会将异常标签加入对应电话号码所标识的识别数据,根据加入异常标签的识别数据构建无向图,根据无向图识别各电话号码是否为“黑卡”,实现了“黑卡”的准确识别。
基于同一发明构思,本实施例提供了一种计算机存储介质,其上存储有计算机程序所述程序被处理器执行时实现如下步骤。
获取原始数据,并对原始数据进行处理,形成以电话号码为唯一标识的识别数据;
对识别数据进行异常检测,确定每个电话号码的异常标签;
将异常标签加入对应电话号码所标识的识别数据后,根据加入异常标签的识别数据构建无向图;
根据无向图识别各电话号码是否为“黑卡”。
可选地,获取以电话号码为唯一标识的识别数据,包括:
获取运营商客户资料数据、产品数据、销售品数据、近n个月的账单数据、缴费日志数据、通话短信记录数据、基站信令数据、电渠接口调用数据、电渠登录日志数据,其中,n为预设的正整数值;
从运营商客户资料数据中提取状态正常的电话号码和状态正常的电话号码所对应的第一属性信息,并根据状态正常的电话号码和第一属性信息,生成以状态正常的电话号码为唯一标识的运营商客户表;第一属性信息包括:用户姓名、证件类型、用户年龄、性别、证件归属地、证件对应的有效手机号码数、帐户、账户对应的有效手机号码数、所属客户编码、所属客户编码对应的有效手机号码数;
从产品数据中提取状态正常的电话号码对应的第二属性信息,并根据状态正常的电话号码和第二属性信息,生成以状态正常的电话号码为唯一标识的产品表;第二属性信息包括:号码头是否新号段、虚拟网号段、是否近1月入网、是否近3月入网、是否近6月入网、网龄、开卡受理人、开卡受理营业厅、是否代理商、代理商标识、号码等级、是否开通语音功能、是否开通上网功能;
从销售品数据中提取状态正常的电话号码对应的第三属性信息,并根据状态正常的电话号码和第三属性信息,生成以状态正常的电话号码为唯一标识的销售品表;第三属性信息包括:对应套餐的套餐类型、套餐档次、是否加装增值业务、套餐下有效手机号码数;
从账单数据中提取状态正常的电话号码对应的第四属性信息,并根据状态正常的电话号码和第四属性信息,生成以状态正常的电话号码为唯一标识的账单表;第四属性信息包括:各月出账金额、n个月的平均账单金额、是否欠费、欠费金额、欠费月数;
从缴费日志数据中提取状态正常的电话号码对应的第五属性信息,并根据状态正常的电话号码和第五属性信息,生成以状态正常的电话号码为唯一标识的缴费日志表;第五属性信息包括:6个月内的缴费次数、平均每次缴费金额、缴费方式、缴费渠道、缴费金额的变异系数;
从通话短信记录数据中提取状态正常的电话号码对应的第六属性信息,并根据状态正常的电话号码和第六属性信息,生成以状态正常的电话号码为唯一标识的通话短信记录表;第六属性信息包括:n个月内的主叫总时长、主叫次数、主叫号码数、主叫号码离散度、被叫时长、被叫次数、被叫号码数、被叫号码离散度;
从基站信令数据中提取状态正常的电话号码对应的第七属性信息,并根据状态正常的电话号码和第七属性信息,生成以状态正常的电话号码为唯一标识的基站信令表;第七属性信息包括:1个月内的接入基站总数、基站标识、每天接入基站数的标准差、每天接入基站数的平均值、基站接入数的变异系数、最常接入基站信息;
从电渠接口调用数据中提取状态正常的电话号码对应的第八属性信息,并根据状态正常的电话号码和第八属性信息,生成以状态正常的电话号码为唯一标识的电渠接口调用表;第八属性信息包括:状态正常的电话号码的操作频数、最小的每个状态正常的电话号码每种操作类型两次操作间隔、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数、每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数、每个状态正常的电话号码每种操作类型的最小操作间隔的最大连续次数、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数占比;
从电渠登录日志数据中提取状态正常的电话号码对应的第九属性信息,并根据状态正常的电话号码和第九属性信息,生成以状态正常的电话号码为唯一标识的电渠登录日志表;第九属性信息包括:用户登录次数、一天内登录小时数、登录设备标识、登录IP数、同一登录IP下的最大曾登录手机号码数、同一登录设备下的最大曾登录手机号码数;
以状态正常的电话号码为唯一标识,将运营商客户表、产品表、销售品表、账单表、缴费日志表、通话短信记录表、基站信令表、电渠接口调用表、电渠登录日志表整合成一张表,并将整合后的表作为以电话号码为唯一标识的识别数据。
可选地,对应套餐的套餐类型为单产品业务型,或者,宽带及号码业务型,或者,其他类型;
缴费方式为现金,或者,充值卡,或者,网厅充值,或者,电商充值;
缴费渠道为网厅缴费,或者,第三方合作电商缴费,或者,营业厅缴费,或者,代理点缴费;
缴费金额的变异系数为缴费标准差与缴费均值的商;
主叫号码离散度为主叫号码数与主叫次数的商;
被叫号码离散度为被叫号码数与被叫次数的商;
基站接入数的变异系数为每天接入基站数的标准差与每天接入基站数的平均值的商;
同一登录IP下的最大曾登录手机号码数的确定方式为:确定每一登录IP下曾登录的不同手机号码数,将最大的不同手机号码数确定为同一登录IP下的最大曾登录手机号码数;
同一登录设备下的最大曾登录手机号码数的确定方式为:确定每一登录设备下曾登录的不同手机号码数,将最大的不同手机号码数确定为同一登录设备下的最大曾登录手机号码数;
最小的每个状态正常的电话号码每种操作类型两次操作间隔的确定方式为:先确定每个状态正常的电话号码每种操作类型两次操作间隔,再从每个状态正常的电话号码每种操作类型两次操作间隔中选择最小的每个状态正常的电话号码每种操作类型两次操作间隔;
每个状态正常的电话号码每种操作类型两次操作间隔的确定方式为:针对每一个状态正常的电话号码,按操作类型进行分组;针对每组电渠接口调用数据,按操作时间从前到后排序,形成第一序列;从第一序列中第二个电渠接口调用数据开始,计算其与其前一个电渠接口调用数据之间的操作时间差,并将所有时间差均作为该状态正常的电话号码该种操作类型两次操作间隔;
每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数的确定方式为:针对每一个状态正常的电话号码的每个操作类型,按该状态正常的电话号码该种操作类型的两次操作间隔进行分组;针对每组电渠接口调用数据,按操作时间从前到后排序,形成第二序列;计算同一电渠接口调用数据在第一序列中的序号与其在第二序列中的序号差,将相同序号差的最大数量作为该状态正常的电话号码该状种操作类型以该状操作间隔操作的连续次数;
最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数占比为最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数与总操作次数的商。
可选地,对识别数据进行异常检测,确定每个电话号码的异常标签,包括:
对识别数据中的证件类型、性别、号码头是否新号段、是否近1月入网、是否近3月入网、是否近6月入网、是否代理商、套餐类型、号码等级、是否欠费、缴费方式、缴费渠道进行one-hot编码处理;
将处理后的识别数据输入孤立森林模型,得到每个电话号码的异常标签;
异常标签为-1或1,当异常标签为-1时,确定对应的电话号码为疑似异常号码。
可选地,将异常标签加入对应电话号码所标识的识别数据后,根据加入异常标签的识别数据构建无向图,包括:
若异常标签为-1,则将其改为1后,将1作为异常属性加入对应电话号码所标识的识别数据中;若异常标签为1,则将其改为0后,将0作为异常属性加入对应电话号码所标识的识别数据中;
基于加入异常标签的识别数据,将每个电话号码作以及每个电话号码对应的登录IP均作为点;
将每个电话号码与其对应的登录IP之间构建一条边,且该边的权重为该电话号码对应的异常属性的值;
所有的点和边形成无向图。
可选地,根据无向图识别各电话号码是否为“黑卡”,包括:
计算每个登录IP对应的点的异常程度;
将异常程度大于预设阈值的点确定为疑似异常点;
根据疑似异常点确定异常的电话号码;
将异常的电话号码和异常标签为-1的电话号码均确定为“黑卡”。
可选地,计算每个登录IP对应的点的异常程度,包括:
对于任一登录IP对应的点j,其异常程度通过如下公式之一计算:
或者,
其中,Sj为任一登录IP对应的点j的异常程度,nj为任一登录IP对应的点j的度数,i为度标识,wi为第i度对应边的权重,oi为第i度对应边的对端点的度数,m为登录IP对应点的总数量,M为电话号码对应点的总数量。
可选地,根据疑似异常点确定异常的电话号码,包括:
在无向图中,将与疑似异常点连接的点对应的电话号码确定为异常的电话号码;或者,
将疑似异常点对应的登录IP作为疑似登录IP;
确定疑似异常点所对应的电话号码,并将其作为疑似电话号码;
确定疑似电话号码对应的登录设备标识,并将其作为疑似登录设备标识;
确定疑似电话号码对应的基站标识,并将其作为疑似基站标识;
确定疑似电话号码对应的代理商标识,并将其作为疑似代理商标识;
确定疑似电话号码对应的证件归属地,并将其作为疑似证件归属地;
基于加入异常标签的识别数据,将每个电话号码、每个电话号码对应的登录IP、每个电话号码对应的登录设备标识、每个电话号码对应的基站标识、每个电话号码对应的代理商标识、每个电话号码对应的证件归属地均作为点,根据各点之间的使用和归属关系作为边,构建有向图;
在有向图中确定疑似登录IP、疑似电话号码、疑似登录设备标识、疑似基站标识、疑似代理商标识、疑似证件归属地对应的点,并将其均作为初始点;
从初始点开始,在有向图中,以边进行深度溯源,得到包括初始点的点集;
将点集中各点对应的电话号码均确定为异常的电话号码。
本实施例提供的计算机存储介质,获取原始数据后,对原始数据进行处理,形成以电话号码为唯一标识的识别数据,再对识别数据进行异常检测,确定每个电话号码的异常标签之后,还会将异常标签加入对应电话号码所标识的识别数据,根据加入异常标签的识别数据构建无向图,根据无向图识别各电话号码是否为“黑卡”,实现了“黑卡”的准确识别。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种“黑卡”识别方法,其特征在于,包括:
获取原始数据,并对所述原始数据进行处理,形成以电话号码为唯一标识的识别数据;
对所述识别数据进行异常检测,确定每个电话号码的异常标签;
将异常标签加入对应电话号码所标识的识别数据后,根据加入异常标签的识别数据构建无向图;
根据所述无向图识别各电话号码是否为“黑卡”。
2.根据权利要求1所述的方法,其特征在于,所述获取原始数据,包括:
获取运营商客户资料数据、产品数据、销售品数据、近n个月的账单数据、缴费日志数据、通话短信记录数据、基站信令数据、电渠接口调用数据、电渠登录日志数据,其中,n为预设的正整数值;
所述对所述原始数据进行处理,形成以电话号码为唯一标识的识别数据,包括:
从所述运营商客户资料数据中提取状态正常的电话号码和所述状态正常的电话号码所对应的第一属性信息,并根据所述状态正常的电话号码和第一属性信息,生成以状态正常的电话号码为唯一标识的运营商客户表;所述第一属性信息包括:用户姓名、证件类型、用户年龄、性别、证件归属地、证件对应的有效手机号码数、帐户、账户对应的有效手机号码数、所属客户编码、所属客户编码对应的有效手机号码数;
从所述产品数据中提取所述状态正常的电话号码对应的第二属性信息,并根据所述状态正常的电话号码和第二属性信息,生成以状态正常的电话号码为唯一标识的产品表;所述第二属性信息包括:号码头是否新号段、虚拟网号段、是否近1月入网、是否近3月入网、是否近6月入网、网龄、开卡受理人、开卡受理营业厅、是否代理商、代理商标识、号码等级、是否开通语音功能、是否开通上网功能;
从所述销售品数据中提取所述状态正常的电话号码对应的第三属性信息,并根据所述状态正常的电话号码和第三属性信息,生成以状态正常的电话号码为唯一标识的销售品表;所述第三属性信息包括:对应套餐的套餐类型、套餐档次、是否加装增值业务、套餐下有效手机号码数;
从所述账单数据中提取所述状态正常的电话号码对应的第四属性信息,并根据所述状态正常的电话号码和第四属性信息,生成以状态正常的电话号码为唯一标识的账单表;所述第四属性信息包括:各月出账金额、n个月的平均账单金额、是否欠费、欠费金额、欠费月数;
从所述缴费日志数据中提取所述状态正常的电话号码对应的第五属性信息,并根据所述状态正常的电话号码和第五属性信息,生成以状态正常的电话号码为唯一标识的缴费日志表;所述第五属性信息包括:6个月内的缴费次数、平均每次缴费金额、缴费方式、缴费渠道、缴费金额的变异系数;
从所述通话短信记录数据中提取所述状态正常的电话号码对应的第六属性信息,并根据所述状态正常的电话号码和第六属性信息,生成以状态正常的电话号码为唯一标识的通话短信记录表;所述第六属性信息包括:n个月内的主叫总时长、主叫次数、主叫号码数、主叫号码离散度、被叫时长、被叫次数、被叫号码数、被叫号码离散度;
从所述基站信令数据中提取所述状态正常的电话号码对应的第七属性信息,并根据所述状态正常的电话号码和第七属性信息,生成以状态正常的电话号码为唯一标识的基站信令表;所述第七属性信息包括:1个月内的接入基站总数、基站标识、每天接入基站数的标准差、每天接入基站数的平均值、基站接入数的变异系数、最常接入基站信息;
从所述电渠接口调用数据中提取所述状态正常的电话号码对应的第八属性信息,并根据所述状态正常的电话号码和第八属性信息,生成以状态正常的电话号码为唯一标识的电渠接口调用表;所述第八属性信息包括:状态正常的电话号码的操作频数、最小的每个状态正常的电话号码每种操作类型两次操作间隔、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数、每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数、每个状态正常的电话号码每种操作类型的最小操作间隔的最大连续次数、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数占比;
从所述电渠登录日志数据中提取所述状态正常的电话号码对应的第九属性信息,并根据所述状态正常的电话号码和第九属性信息,生成以状态正常的电话号码为唯一标识的电渠登录日志表;所述第九属性信息包括:用户登录次数、一天内登录小时数、登录设备标识、登录IP数、同一登录IP下的最大曾登录手机号码数、同一登录设备下的最大曾登录手机号码数;
以所述状态正常的电话号码为唯一标识,将运营商客户表、产品表、销售品表、账单表、缴费日志表、通话短信记录表、基站信令表、电渠接口调用表、电渠登录日志表整合成一张表,并将整合后的表作为以电话号码为唯一标识的识别数据。
3.根据权利要求2所述的方法,其特征在于,所述对应套餐的套餐类型为单产品业务型,或者,宽带及号码业务型,或者,其他类型;
所述缴费方式为现金,或者,充值卡,或者,网厅充值,或者,电商充值;
所述缴费渠道为网厅缴费,或者,第三方合作电商缴费,或者,营业厅缴费,或者,代理点缴费;
所述缴费金额的变异系数为缴费标准差与缴费均值的商;
所述主叫号码离散度为主叫号码数与主叫次数的商;
所述被叫号码离散度为被叫号码数与被叫次数的商;
所述基站接入数的变异系数为每天接入基站数的标准差与每天接入基站数的平均值的商;
所述同一登录IP下的最大曾登录手机号码数的确定方式为:确定每一登录IP下曾登录的不同手机号码数,将最大的不同手机号码数确定为所述同一登录IP下的最大曾登录手机号码数;
所述同一登录设备下的最大曾登录手机号码数的确定方式为:确定每一登录设备下曾登录的不同手机号码数,将最大的不同手机号码数确定为所述同一登录设备下的最大曾登录手机号码数;
所述最小的每个状态正常的电话号码每种操作类型两次操作间隔的确定方式为:先确定每个状态正常的电话号码每种操作类型两次操作间隔,再从每个状态正常的电话号码每种操作类型两次操作间隔中选择最小的每个状态正常的电话号码每种操作类型两次操作间隔;
所述每个状态正常的电话号码每种操作类型两次操作间隔的确定方式为:针对每一个状态正常的电话号码,按操作类型进行分组;针对每组电渠接口调用数据,按操作时间从前到后排序,形成第一序列;从第一序列中第二个电渠接口调用数据开始,计算其与其前一个电渠接口调用数据之间的操作时间差,并将所有时间差均作为该状态正常的电话号码该种操作类型两次操作间隔;
所述每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数的确定方式为:针对每一个状态正常的电话号码的每个操作类型,按该状态正常的电话号码该种操作类型的两次操作间隔进行分组;针对每组电渠接口调用数据,按操作时间从前到后排序,形成第二序列;计算同一电渠接口调用数据在第一序列中的序号与其在第二序列中的序号差,将相同序号差的最大数量作为该状态正常的电话号码该状种操作类型以该相同操作间隔的最大连续次数;
所述最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数占比为最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数与总操作次数的商。
4.根据权利要求3所述的方法,其特征在于,所述对所述识别数据进行异常检测,确定每个电话号码的异常标签,包括:
对所述识别数据中的证件类型、性别、号码头是否新号段、是否近1月入网、是否近3月入网、是否近6月入网、是否代理商、套餐类型、号码等级、是否欠费、缴费方式、缴费渠道进行one-hot编码处理;
将处理后的识别数据输入孤立森林模型,得到每个电话号码的异常标签;
所述异常标签为-1或1,当异常标签为-1时,确定对应的电话号码为疑似异常号码。
5.根据权利要求4所述的方法,其特征在于,所述将异常标签加入对应电话号码所标识的识别数据后,根据加入异常标签的识别数据构建无向图,包括:
若异常标签为-1,则将其改为1后,将1作为异常属性加入对应电话号码所标识的识别数据中;若异常标签为1,则将其改为0后,将0作为异常属性加入对应电话号码所标识的识别数据中;
基于加入异常标签的识别数据,将每个电话号码作以及每个电话号码对应的登录IP均作为点;
将每个电话号码与其对应的登录IP之间构建一条边,且该边的权重为该电话号码对应的异常属性的值;
所有的点和边形成无向图。
6.根据权利要求5所述的方法,其特征在于,所述根据所述无向图识别各电话号码是否为“黑卡”,包括:
计算每个登录IP对应的点的异常程度;
将异常程度大于预设阈值的点确定为疑似异常点;
根据所述疑似异常点确定异常的电话号码;
将异常的电话号码和异常标签为-1的电话号码均确定为“黑卡”。
7.根据权利要求6所述的方法,其特征在于,所述计算每个登录IP对应的点的异常程度,包括:
对于任一登录IP对应的点j,其异常程度通过如下公式之一计算:
或者,
其中,Sj为任一登录IP对应的点j的异常程度,nj为任一登录IP对应的点j的度数,i为度标识,wi为第i度对应边的权重,oi为第i度对应边的对端点的度数,m为登录IP对应点的总数量,M为电话号码对应点的总数量。
8.根据权利要求6所述的方法,其特征在于,所述根据所述疑似异常点确定异常的电话号码,包括:
在所述无向图中,将与所述疑似异常点连接的点对应的电话号码确定为异常的电话号码;或者,
将所述疑似异常点对应的登录IP作为疑似登录IP;
确定所述疑似异常点所对应的电话号码,并将其作为疑似电话号码;
确定所述疑似电话号码对应的登录设备标识,并将其作为疑似登录设备标识;
确定所述疑似电话号码对应的基站标识,并将其作为疑似基站标识;
确定疑似电话号码对应的代理商标识,并将其作为疑似代理商标识;
确定疑似电话号码对应的证件归属地,并将其作为疑似证件归属地;
基于加入异常标签的识别数据,将每个电话号码、每个电话号码对应的登录IP、每个电话号码对应的登录设备标识、每个电话号码对应的基站标识、每个电话号码对应的代理商标识、每个电话号码对应的证件归属地均作为点,根据各点之间的使用和归属关系作为边,构建有向图;
在所述有向图中确定疑似登录IP、疑似电话号码、疑似登录设备标识、疑似基站标识、疑似代理商标识、疑似证件归属地对应的点,并将其均作为初始点;
从初始点开始,在所述有向图中,以边进行深度溯源,得到包括初始点的点集;
将点集中各点对应的电话号码均确定为异常的电话号码。
9.一种电子设备,其特征在于,所述电子设备包括:显示器,存储器,一个或多个处理器;以及一个或多个模块,所述一个或多个模块被存储在所述存储器中,并被配置成由所述一个或多个处理器执行,所述一个或多个模块包括用于执行权利要求1-8中任一所述方法中各个步骤的指令。
10.一种计算机程序产品,所述计算机程序产品对用于执行一种过程的指令进行编码,所述过程包括根据权利要求1-8中任一项所述的方法。
CN201811390723.1A 2018-11-21 2018-11-21 “黑卡”识别方法、电子设备及计算机可读取存储介质 Active CN109640312B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811390723.1A CN109640312B (zh) 2018-11-21 2018-11-21 “黑卡”识别方法、电子设备及计算机可读取存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811390723.1A CN109640312B (zh) 2018-11-21 2018-11-21 “黑卡”识别方法、电子设备及计算机可读取存储介质

Publications (2)

Publication Number Publication Date
CN109640312A true CN109640312A (zh) 2019-04-16
CN109640312B CN109640312B (zh) 2021-09-14

Family

ID=66068719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811390723.1A Active CN109640312B (zh) 2018-11-21 2018-11-21 “黑卡”识别方法、电子设备及计算机可读取存储介质

Country Status (1)

Country Link
CN (1) CN109640312B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362607A (zh) * 2019-06-11 2019-10-22 中国平安财产保险股份有限公司 异常号码识别方法、装置、计算机设备及存储介质
CN110933080A (zh) * 2019-11-29 2020-03-27 上海观安信息技术股份有限公司 一种用户登录异常的ip群体识别方法及装置
CN110990242A (zh) * 2019-11-29 2020-04-10 上海观安信息技术股份有限公司 一种用户操作次数波动异常的确定方法及装置
CN111132144A (zh) * 2019-12-25 2020-05-08 中国联合网络通信集团有限公司 异常号码识别方法及设备
CN112601215A (zh) * 2020-12-01 2021-04-02 深圳市和讯华谷信息技术有限公司 一种设备标识统一的方法及装置
CN112954685A (zh) * 2021-01-29 2021-06-11 上海安恒时代信息技术有限公司 黑灰产手机号码识别方法及系统
CN113076776A (zh) * 2020-01-03 2021-07-06 中国移动通信集团广东有限公司 通信号码的识别方法、装置和电子设备
CN113141611A (zh) * 2021-05-27 2021-07-20 哈尔滨工业大学(威海) 一种基于多元异常行为特征检测云手机号码账户的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303441A (zh) * 2015-10-28 2016-02-03 联动优势科技有限公司 利用sim卡号和手机识别码预防申请欺诈的办法和装置
CN107809762A (zh) * 2017-11-01 2018-03-16 南京欣网互联网络科技有限公司 利用大数据与设备指纹的养卡识别的安全风险控制方法
CN107820252A (zh) * 2017-11-15 2018-03-20 中国联合网络通信集团有限公司 养卡识别方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303441A (zh) * 2015-10-28 2016-02-03 联动优势科技有限公司 利用sim卡号和手机识别码预防申请欺诈的办法和装置
CN107809762A (zh) * 2017-11-01 2018-03-16 南京欣网互联网络科技有限公司 利用大数据与设备指纹的养卡识别的安全风险控制方法
CN107820252A (zh) * 2017-11-15 2018-03-20 中国联合网络通信集团有限公司 养卡识别方法及系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362607B (zh) * 2019-06-11 2024-02-06 中国平安财产保险股份有限公司 异常号码识别方法、装置、计算机设备及存储介质
CN110362607A (zh) * 2019-06-11 2019-10-22 中国平安财产保险股份有限公司 异常号码识别方法、装置、计算机设备及存储介质
CN110933080B (zh) * 2019-11-29 2021-10-26 上海观安信息技术股份有限公司 一种用户登录异常的ip群体识别方法及装置
CN110933080A (zh) * 2019-11-29 2020-03-27 上海观安信息技术股份有限公司 一种用户登录异常的ip群体识别方法及装置
CN110990242A (zh) * 2019-11-29 2020-04-10 上海观安信息技术股份有限公司 一种用户操作次数波动异常的确定方法及装置
CN110990242B (zh) * 2019-11-29 2023-06-20 上海观安信息技术股份有限公司 一种用户操作次数波动异常的确定方法及装置
CN111132144B (zh) * 2019-12-25 2022-09-13 中国联合网络通信集团有限公司 异常号码识别方法及设备
CN111132144A (zh) * 2019-12-25 2020-05-08 中国联合网络通信集团有限公司 异常号码识别方法及设备
CN113076776A (zh) * 2020-01-03 2021-07-06 中国移动通信集团广东有限公司 通信号码的识别方法、装置和电子设备
CN112601215A (zh) * 2020-12-01 2021-04-02 深圳市和讯华谷信息技术有限公司 一种设备标识统一的方法及装置
CN112954685A (zh) * 2021-01-29 2021-06-11 上海安恒时代信息技术有限公司 黑灰产手机号码识别方法及系统
CN112954685B (zh) * 2021-01-29 2022-11-18 上海安恒时代信息技术有限公司 黑灰产手机号码识别方法及系统
CN113141611A (zh) * 2021-05-27 2021-07-20 哈尔滨工业大学(威海) 一种基于多元异常行为特征检测云手机号码账户的方法
CN113141611B (zh) * 2021-05-27 2022-09-16 哈尔滨工业大学(威海) 一种基于多元异常行为特征检测云手机号码账户的方法

Also Published As

Publication number Publication date
CN109640312B (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN109640312A (zh) “黑卡”识别方法、电子设备及计算机程序产品
CN103605791B (zh) 信息推送系统和信息推送方法
CN104283918B (zh) 一种无线局域网终端类型获取方法及系统
CN108924333A (zh) 诈骗电话识别方法、装置和系统
CN110337059B (zh) 一种用户家庭关系的分析算法、服务器及网络系统
CN107506776A (zh) 一种诈骗电话号码的分析方法
WO2017186090A1 (zh) 通信号码处理方法及装置
CN105007171A (zh) 基于通信领域大数据的用户数据分析系统及方法
CN110401779A (zh) 一种识别电话号码的方法、装置和计算机可读存储介质
CN113961712B (zh) 一种基于知识图谱的诈骗电话分析方法
CN108462785A (zh) 一种恶意呼叫电话的处理方法及装置
CN108156336A (zh) 一种基于多特征加权模型分析话单号码的控制系统
CN111104521A (zh) 一种基于图分析的反欺诈检测方法及检测系统
CN106570014A (zh) 用于确定用户的家庭属性信息的方法与设备
CN108989581A (zh) 一种用户风险识别方法、装置及系统
CN104217088B (zh) 运营商移动业务资源的优化方法与系统
CN112925899B (zh) 排序模型建立方法、案件线索推荐方法、装置及介质
CN114331473A (zh) 电信诈骗事件的识别方法及其装置、计算机可读存储介质
CN110536302A (zh) 电信诈骗提醒方法和装置
Ighneiwa et al. Bypass fraud detection: Artificial intelligence approach
CN106982284A (zh) 骚扰电话号码的识别方法及装置
CN110677269B (zh) 通信用户关系的确定方法、装置和计算机可读存储介质
CN108921433B (zh) 基于业务连续性的风险定量分析系统
Alraouji et al. International call fraud detection systems and techniques
CN104270735B (zh) 一种基于前缀树的计费方法及计费系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant