CN113422836B - 养卡用户识别方法、装置、设备以及存储介质 - Google Patents

养卡用户识别方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN113422836B
CN113422836B CN202110749212.XA CN202110749212A CN113422836B CN 113422836 B CN113422836 B CN 113422836B CN 202110749212 A CN202110749212 A CN 202110749212A CN 113422836 B CN113422836 B CN 113422836B
Authority
CN
China
Prior art keywords
user
social
information
card
matching degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110749212.XA
Other languages
English (en)
Other versions
CN113422836A (zh
Inventor
周雪
李峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202110749212.XA priority Critical patent/CN113422836B/zh
Publication of CN113422836A publication Critical patent/CN113422836A/zh
Application granted granted Critical
Publication of CN113422836B publication Critical patent/CN113422836B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种养卡用户识别方法、装置、设备以及存储介质。该方法包括:获取指定时间段内待识别用户的社交信息;将所述社交信息与社交标准信息进行特征比对,得到所述社交信息与社交标准信息之间的匹配度,其中,所述特征比对包括社交平衡性比对;若所述匹配度小于第一预设匹配度,确定所述待识别用户为养卡用户;若所述匹配度大于或等于所述第一预设匹配度,且小于第二预设匹配度,获取所述待识别用户的出账信息,并在所述出账信息不满足指定条件时,确定所述待识别用户为养卡用户;将所述养卡用户的信息发送至监管平台。本申请的方法能够根据用户的社交信息以及结合出账信息对养卡用户进行识别,从而有效提升养卡用户的识别准确性。

Description

养卡用户识别方法、装置、设备以及存储介质
技术领域
本申请涉及通信技术,尤其涉及一种养卡用户识别方法、装置、设备以及存储介质。
背景技术
在通信运营商和代理商的合作过程中,一些代理商为了获得更高的报酬,往往通过批量开通虚拟账户的作弊手段提升销售业绩,这种行为被称为养卡。大量的养卡用户会造成运营商客户虚增,出现运营、活动成本提高但是运营商的业务收入却在下降的情况,导致运营商的直接经济损失。因此,需要准确地识别出养卡用户并及时进行处理。
目前,一般采用对已确认养卡用户的通信数据进行分析,发现养卡用户的数据特征,例如养卡用户的主叫分钟和被叫分钟远低于正常通信分钟数,或者短信次数和上网流量少等通信数据特征。通过对养卡用户的数据特征进行分析以及构建识别养卡用户的判断模型,并根据该判断模型对全网数据进行分析,挖掘异常用户行为,确定疑似养卡用户名单。
然而,目前用户的通信数据的差异性并不大,而养卡器又可以轻易模仿通话、短信、上网等行为,所以很难识别哪些是真正的养卡行为,导致对养卡用户的识别不准确。
发明内容
本申请提供一种养卡用户识别方法、装置、设备以及存储介质,用以解决对养卡用户的识别不准确的问题。
第一方面,本申请提供一种养卡用户识别方法,该方法包括:
获取指定时间段内待识别用户的社交信息;
将社交信息与社交标准信息进行特征比对,得到社交信息与社交标准信息之间的匹配度,其中,特征比对包括社交平衡性比对;
若匹配度小于第一预设匹配度,确定待识别用户为养卡用户;
若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,获取待识别用户的出账信息,并在出账信息不满足指定条件时,确定待识别用户为养卡用户;
将养卡用户的信息发送至监管平台。
在一种可能的实施方式中,将社交信息与社交标准信息进行特征比对,得到社交信息与社交标准信息之间的匹配度,包括:
基于社交信息与社交标准信息进行社交多样性比对、社交平衡性比对以及社交亲密性比对,得到多样性比对结果、平衡性比对结果以及亲密性比对结果;
基于多样性比对结果、平衡性比对结果以及亲密性比对结果确定社交信息与社交标准信息之间的匹配度。
在一种可能的实施方式中,社交信息包括亲密联系人的数量、呼出联系人的数量以及呼入联系人的数量,社交标准信息包括第一阈值、第二阈值、第三阈值以及指定范围;基于社交信息与社交标准信息进行社交多样性比对、社交平衡性比对以及社交亲密性比对,得到多样性比对结果、平衡性比对结果以及亲密性比对结果,包括:
若呼出联系人的数量大于或等于第一阈值,且呼入联系人的数量大于或等于所第二阈值,则确定多样性比对结果为正常;
若呼出联系人的数量与呼入联系人的数量之间的比例处于指定范围内,则确定平衡性比对结果为正常;
若亲密联系人的数量大于或等于第三阈值,则确定亲密性比对结果为正常。
在一种可能的实施方式中,基于多样性比对结果、平衡性比对结果以及亲密性比对结果确定社交信息与社交标准信息之间的匹配度,包括:
获取多样性比对结果、平衡性比对结果以及亲密性比对结果中结果为正常的比对结果的数量;
基于结果为正常的比对结果的数量确定社交信息与社交标准信息之间的匹配度,其中,正常的比对结果的数量与匹配度呈正相关。
在一种可能的实施方式中,方法还包括:
若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,将待识别用户确定为可疑用户;
获取可疑用户在指定时间段内使用过的基站的基站信息;
若基站信息不满足预设条件,确定可疑用户为养卡用户。
在一种可能的实施方式中,在若基站信息不满足预设条件,确定可疑用户为养卡用户之前,还包括:
获取待识别用户在指定时间段内的出行记录;
若出行记录与基站信息不匹配,则确定基站信息不满足预设条件。
在一种可能的实施方式中,出账信息包括预设时间段内的出账金额,在若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,获取待识别用户的出账信息,并在出账信息不满足指定条件时,确定待识别用户为养卡用户之前,还包括:
若出账金额的不超过金额阈值,则确定出账信息不满足指定条件。
第二方面,本申请提供一种养卡用户识别装置,该养卡用户识别装置包括:
社交信息获取模块,用于获取指定时间段内待识别用户的社交信息;
匹配度获取模块,用于将社交信息与社交标准信息进行特征比对,得到社交信息与社交标准信息之间的匹配度,其中,特征比对社交平衡性比对;
第一确定模块,用于若匹配度小于第一预设匹配度,确定待识别用户为养卡用户;
第二确定模块,用于若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,获取待识别用户的出账信息,并在出账信息不满足指定条件时,确定待识别用户为养卡用户;
发送模块,用于将养卡用户的信息发送至监管平台。
第三方面,本申请提供一种养卡用户识别设备,包括:存储器,处理器;其中,存储器,用于存储处理器可执行指令的存储器;其中,处理器被配置为用于实现第一方面的方法。
第四方面,本申请还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面的方法。
第五方面,本申请实施例还提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行第一方面的方法。
本申请提供的养卡用户识别方法、装置、设备以及存储介质,通过获取指定时间段内待识别用户的社交信息,再将社交信息与社交标准信息进行特征比对,得到社交信息与社交标准信息之间的匹配度,其中,特征比对包括社交平衡性比对。若匹配度小于第一预设匹配度,确定待识别用户为养卡用户。若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,获取待识别用户的出账信息,并在出账信息不满足指定条件时,确定待识别用户为养卡用户,最后将养卡用户的信息发送至监管平台。由于社交信息不容易被伪造,特别是社交平衡性难以伪造,因此基于社交信息可以准确判定出养卡用户,提升养卡用户的识别准确性,另外,在社交信息不足以识别出养卡用户时,通过结合社交信息和出账信息进行识别,能够提升识别的准确性和灵活性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的养卡用户识别方法的一种应用场景图;
图2为本申请一个实施例提供的养卡用户识别方法的流程图;
图3为本实施例提供的养卡用户识别方法在实际应用中的实施流程图;
图4为本申请另一个实施例提供的养卡用户识别方法的流程图;
图5为本申请图4所示实施例中步骤202的流程图;
图6为本申请图4所示实施例中步骤207至209的流程图;
图7为本申请实施例提供的出行路线与多个基站的分布示意图;
图8为本申请实施例提供的养卡用户识别装置的结构示意图;
图9是本公开一种实施例提供的养卡用户识别设备的框图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
移动互联网时代,运营商为了获取更多的用户,会增加代理商渠道、线上自助等渠道的数量。无论代理商渠道还是线上发展渠道,为了恶意套取佣金,会开通或者激活一定数量的号码,不使用这些号码进行正常的打电话、上网等,而是参与运营商活动;也有运营商的一部分地市公司、营业网点为了达到每年运营商总部下达的经营业绩指标,会恶意开通激活一些僵尸卡,伪造业绩。上述情况即为养卡,而持有此类电话卡的用户即为养卡用户。
目前,养卡已经形成了产业链,养卡器是一种专门为批量养卡设计制造的仪器,可以通过插入真实的运营商手机卡,然后设置IMEI号即可使用,模拟出用户接打电话、发短信、使用虚拟IP上网、位置移动等。因此,目前急需要能够准确地识别出养卡用户并及时进行处理的方法。
相关技术中的养卡识别方法主要提取了运营商用户的一些数据特征,包括:用户主叫分钟,用户被叫分钟,短信次数,上网流量,上网时长,开关机天数等,通过这些特征数据构造出养卡条件判断模型。
但是,上述方式中,由于目前养卡器可以模仿通话、短信、上网等行为,所以很难识别哪些是真正的养卡行为。
另一种识别养卡的方法主要是依赖于国际移动设备识别码(IMEI)判断,判断IMEI是否真实或者是否高度复用来识别养卡。
但是上述方式中,目前真实IMEI号的获取成本很低,而且用户使用期间IMEI信息的唯一性是相对的,因此极大可能造成一种误判,所以此方法的识别效果一般。
为了解决上述的技术问题,本申请实施例提供料箱处理系统、方法、设备、电子设备及存储介质,能够根据用户的社交信息以及结合出账信息对养卡用户进行识别,从而有效提升养卡用户的识别准确性。
下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
下面对本申请实施例的应用场景进行解释:
图1为本申请实施例提供的养卡用户识别方法的一种应用场景图,如图1所示,该应用场景包括服务器10和待识别用户集合,其中,待识别用户集合可以包括多个待识别用户,例如,待识别用户集合包括第一用户201、第二用户202、第三用户203、第四用户204及第五用户205。
可以理解的是,本实施例中的用户可以是指该用户所使用的移动终端,如第一用户201可以是指第一用户201使用的移动终端。
其中,服务器10可以为运营商服务器,该服务器10可以分别于第一用户201、第二用户202、第三用户203、第四用户204及第五用户205通信连接。可选地,第一用户201、第二用户202、第三用户203、第四用户204及第五用户205之间也可以相互通信。
可选地,该移动终端包括但不限于可以插入手机卡的智能手机、个人电脑、平板电脑等。
图2为本申请一个实施例提供的养卡用户识别方法的流程图,该养卡用户识别方法可以应用于上述应用环境中的服务器,如图2所示,本实施例提供的养卡用户识别方法可以包括以下步骤:
101、获取指定时间段内待识别用户的社交信息。
其中,社交信息可以是指用户在通过手机卡进行社交过程中产生的信息,例如社交信息可以包括呼出联系人、呼入联系人、呼出时间、呼入时间、短信条数、流量去向等等。
在一些实施方式中,服务器可以实时记录待识别用户的社交信息并存储到数据库中,若需要指定时间段内指待识别用户的社交信息,则可以根据指定时间段的时间节点直接从该数据库中进行调用。
102、将社交信息与社交标准信息进行特征比对,得到社交信息与社交标准信息之间的匹配度,其中,特征比对包括社交平衡性比对。
其中,社交标准信息可以是确定用户的社交信息在该指定时间段内为正常的指标范围,若用户的社交信息在指标范围内,则该社交信息为正常,若在指标范围之外,则该社交信息为异常,作为一种示例,例如用户在上个月的通话时长小于通话最低时长,则可以确定用户在上个月的社交信息中通话时长为异常。可选地,社交标准信息包括但不限于指定时间段内的通话最低时长、短信最低数量、呼出联系人的数量阈值、呼入联系人的数量阈值等。
其中,社交平衡性是指用户的呼入联系的数量和呼出联系人的数量的平衡情况,例如呼入联系的数量和呼出联系人的数量相差不大,则用户的社交平衡性较好,否则,社交平衡性较差。
社交平衡性比对可以是指将用户的呼入联系的数量和呼出联系人的数量之间的比值与社交标准信息中的指定范围件比对,如果该比值在视角标准信息规定的范围内,则确定社交平衡性正常。
在一些实施方式中,服务器可以将多个类型的社交信息与社交标准信息进行比对,然后确定多个类型的社交信息中各类型的社交信息是否正常,然后计算正常的标准信息占社交信息类型总数的比例值,并将该比例值确定为社交信息与社交标准信息之间的匹配度。
作为一种示例,例如有四个类型的社交信息分别为呼出联系人的数量、呼入联系人的数量、呼出联系人的数量与呼入联系人的数量之间的比例、以及亲密联系人的数量。其中,若呼出联系人的数量与社交标准信息对比后为正常,则表明待识别用户的主叫满足号码多样性。若呼入联系人的数量与社交标准信息对比后为正常,则表明待识别用户的被叫满足号码多样性。若呼出联系人的数量和呼入联系人的数量之间的比例与社交标准信息对比后为正常,则表明待识别用户满足社交平衡性。若亲密联系人的数量与社交标准信息对比后为正常,则表明待识别用户满足社交亲密性。其中,如果上述4个类型的社交信息中有3个类型的社交信息为正常,1个为异常,则匹配度为3/4。如果上述4个类型的社交信息中有0个类型的社交信息为正常,则匹配度为0。
103、若匹配度小于第一预设匹配度,确定待识别用户为养卡用户。
作为一种示例,例如第一预设匹配度为1/4,若当前比对后得到的匹配度为0,则可以确定该待识别用户为养卡用户。
104、若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,获取待识别用户的出账信息,并在出账信息不满足指定条件时,确定待识别用户为养卡用户。
承接上述示例,例如第一预设匹配度为1/4、第二预设匹配度为3/4,若当前比对后得到的匹配度为2/4,那么服务器可以获取待识别用户的出账信息,并在出账信息不满足指定条件时,确定待识别用户为养卡用户。其中,出账信息可以包括待识别用户在各个月份的出账金额,可选地,指定条件可以是连续N个月中每个月的出账金额超过金额阈值,其中,N可以为大于等于2的整数。
作为另一种示例,若匹配度大于或等于第二预设匹配度,则可以确定该待识别用户为正常用户。
105、将养卡用户的信息发送至监管平台。
其中,养卡用户的信息可以包括手机卡号码、身份证号码、名称、地址等信息。
在一些实施方式中,服务器可以将养卡用户的信息发送至监管平台,以指示监管平台对该养卡用户进行处理,可选地,监管平台可以对该养卡用户的信息拉入黑名单,还可以将该养卡用户的手机卡号注销。具体地,对于探测到的养卡用户,可以通过标记号码池的形式下发到各省管理员,对这些号码进行重点监控,不允许这些用户在参与运营商举办的活动,必要时可采取关停等手段。
下面结合步骤101至步骤105进行整体说明,请参阅图3,图3为本实施例提供的养卡用户识别方法在实际应用中的实施流程。如图3所示。
服务器可以从用户详单数据库中调用待测试用户的社交信息,可以判断社交信息是否满足4个条件(如是否满足主叫号码多样性、被叫满足号码多样性、社交平衡性、以及社交亲密性)。若4个条件都满足,则可以确定该待识别用户为正常用户。
若4个条件中有部分条件满足,例如满足3个条件,服务器可以继续从用户出账数据库中调用出账金额,若连续三个月出账金额小于阈值X,则可以确定该待识别用户为养卡用户;若连续三个月出账金额大于或等于阈值X,则可以确定该待识别用户为正常用户。
若4个条件中全部条件都不满足或者只有2个或1个条件满足,则可以确定该待识别用户为养卡用户。
在本实施例中,通过获取指定时间段内待识别用户的社交信息,再将社交信息与社交标准信息进行特征比对,得到社交信息与社交标准信息之间的匹配度,其中,特征比对包括社交平衡性比对。若匹配度小于第一预设匹配度,确定待识别用户为养卡用户。若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,获取待识别用户的出账信息,并在出账信息不满足指定条件时,确定待识别用户为养卡用户,最后将养卡用户的信息发送至监管平台。由于社交信息不容易被伪造,特别是社交平衡性,由于社交平衡性需要满足呼入联系人的数量和呼出联系人的数量接近,所以更加难以伪造,因此基于社交信息可以准确判定出养卡用户,提升养卡用户的识别准确性,另外,在社交信息不足以识别出养卡用户时,通过结合社交信息和出账信息进行识别,能够提升识别的准确性和灵活性。
图4为本申请另一个实施例提供的养卡用户识别方法的流程图,该养卡用户识别方法可以应用于上述应用环境中的服务器,如图4所示,本实施例提供的养卡用户识别方法可以包括以下步骤:
201、获取指定时间段内待识别用户的社交信息。
其中,步骤201的具体实施方式可以参考步骤101,故不在此赘述。
202、基于社交信息与社交标准信息进行社交多样性比对、社交平衡性比对以及社交亲密性比对,得到多样性比对结果、平衡性比对结果以及亲密性比对结果。
作为一种方式,社交信息包括亲密联系人的数量、呼出联系人的数量以及呼入联系人的数量,社交标准信息包括第一阈值、第二阈值、第三阈值以及指定范围;如图5所示,步骤202可以包括:
2021、若呼出联系人的数量大于或等于第一阈值,且呼入联系人的数量大于或等于第二阈值,则确定多样性比对结果为正常。
作为一种示例,假设第一阈值为m,具体可以为10、第二阈值为n具体可以为10,如果呼出联系人的数量大于10个,且呼入联系人的数量大于或等于10个,可以确定多样性比对结果为正常,否则,确定多样性比对结果为异常。
可选地,第一阈值可以为该待识别用户在之前N个月中呼出联系人数量的平均值。第二阈值可以为该待识别用户在之前N个月中呼入联系人数量的平均值。从而可以根据待识别用户的实际呼入、呼出情况准确确定多样性比对结果。
2022、若呼出联系人的数量与呼入联系人的数量之间的比例处于指定范围内,则确定平衡性比对结果为正常。
作为一种示例,假设指定范围为大于a且小于b,如a=0.7,b=1.3,如果呼出联系人的数量与呼入联系人的数量之间的比例大于0.7且小于1.3,则可以确定衡性比对结果为正常,否则,确定平衡性比对结果为异常。可选地,指定范围中的下限a<1,指定范围中的上限1<b<2。可选地,指定范围的上限可以为该待识别用户在之前N个月中呼出联系人的数量与呼入联系人的数量之间的比例的最大值,指定范围的下限可以为该待识别用户在之前N个月中呼出联系人的数量与呼入联系人的数量之间的比例的最小值。
2023、若亲密联系人的数量大于或等于第三阈值,则确定亲密性比对结果为正常。
作为一种示例,假设第三阈值为q,如q=1,那么亲密联系人的数量大于1,则可以确定亲密性比对结果为正常,否则确定亲密性比对结果为异常。
其中,亲密联系人可以是待识别用户在指定时间段内通话时长大于时长阈值的用户,也可以是待识别用户在指定时间段内通话频率大于频率阈值的用户。
可选地,第三阈值可以为该待识别用户在之前N个月中亲密联系人数量的平均值。
203、基于多样性比对结果、平衡性比对结果以及亲密性比对结果确定社交信息与社交标准信息之间的匹配度。
作为一种方式,步骤203的具体实施方式可以包括:获取多样性比对结果、平衡性比对结果以及亲密性比对结果中结果为正常的比对结果的数量;基于结果为正常的比对结果的数量确定社交信息与社交标准信息之间的匹配度,其中,正常的比对结果的数量与匹配度呈正相关。
作为一种示例,例如多样性比对结果还可以包括呼入多样性比对结果和呼出多样性比对结果。可以将呼入多样性比对结果、呼出多样性比对结果、平衡性比对结果以及亲密性比对结果中结果为正常的比对结果的数量占所有对比结果的数量比例作为匹配值,例如,结果为正常的比对结果的数量为1,所有对比结果的数量为4,则可以确定匹配值为1/4。
204、若匹配度小于第一预设匹配度,确定待识别用户为养卡用户。
其中,步骤204的具体实施方式可以参考步骤103,故不在此赘述。
205、若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,获取待识别用户的出账信息,并在出账信息不满足指定条件时,确定待识别用户为养卡用户。
在一些实施方式中,出账信息可以包括出账金额,在步骤204之前,该方法还可以包括:若出账金额的不超过金额阈值,则确定出账信息不满足指定条件。
可选地,出账金额可以为指定时间内的出账总金额,例如3个月的出账总金额,如果指定时间内的出账总金额不超过金额阈值,则可以确定出账信息不满足指定条件。
可选地,出账金额可以为指定时间内的平均出账金额,例如3个月的平均出账金额,如果指定时间内的平均出账金额不超过金额阈值,则可以确定出账信息不满足指定条件。
在另一些实施方式中,出账信息还可以包括出账类型,例如流量购买、短信购买、通话时长购买等,在步骤204之前,该方法还可以包括:
确定出账类型的类型数量,若类型数量不超过预设数量,可以出账信息不满足指定条件。
考虑到养卡器不容易模拟出多种出账类型,在本实施方式中,通过确定出账类型的类型数量,若类型数量不超过预设数量,可以出账信息不满足指定条件,从而可以准确识别出账信息是否满足条件。
206、将养卡用户的信息发送至监管平台。
作为一种示例,将步骤201至步骤206作为一个整体进行说明,具体地,服务器中可以预先配置有用户社交正常标签计算模块,该用户社交正常标签计算模块可以用于根据用户的社交数据确定用户是否为正常的用户。其中,该计算模块,返回结果可以是由0或者1组成的一个四位字符串,初始字符串为“0000”。具体地,该用户社交正常标签计算模块可以做出如下判断:
(1)每月主叫呼出号码是否大于等于m个人的,m=10;
(2)每月被叫呼入号码大于等于n个人的,n=10;
(3)每月主叫呼出号码个数与每月被叫呼出号码个数之比,大于a(a<1),小于b(1<b<2),其中,a=0.7,b=1.3;
(4)每月主叫号码大于等于p次的,呼出号码大于等于q个人,即为有q个以上亲密联系人的。其中,q=1。
下面以表1为例进行说明,表1包括多个用户的社交信息(如表1中的用户id、phone_number、主叫联系人个数、被叫联系人个数、主被叫号码比例、亲密联系人个数)以及用户社交正常标签计算模块做出的判断结果(如表1中的user_label)。其中,主叫联系人个数、被叫联系人个数、主被叫号码比例、亲密联系人个数为用户的4个特征值,最后一列是根据规则得到的结果字符串。
表1
Figure BDA0003143892920000101
Figure BDA0003143892920000111
然后,可以使用预先配置的用户分群判断模块,根据表1的结果将多个用户划分为正常用户和养卡用户。作为一种示例,用户分群判断模块可以通过如下程序将对正常用户和养卡用户进行划分,其中,该程序用于将4个特征都满足条件的用户划分为正常用户,将3个特征满足条件的用户划分为需进一步识别的用户,将其余用户划分为养卡用户。其中,user_label中1代表特征满足条件,0代表不满足条件。
Figure BDA0003143892920000112
可见,通过上述程序可以直接判断出用户1、3、6、7为正常用户,用户2、9、10为养卡用户,用户4、5、8进入后续判断环节。
接下来,需进一步识别的用户,即部分满足社交正常用户(如用户4、5、8),可以根据预先配置的出账二次判断模块,设出账均值阈值为19.9元,然后结合出账均值阈值判断部分满足社交正常用户是否为养卡用户。作为一种示例,部分满足社交正常用户的在三个月(如last_1_arpu、last_2_arpu、last_3_arpu)内的出账金额可以如表2所示:
表2
id phone_number last_1_arpu last_2_arpu last_3_arpu
4 186xxxx8338 57 31 66
5 186xxxx8426 17 19 25
8 186xxxx8879 9 9 9
其中,出账二次判断模块可以通过如下程序对出账金额正常的用户进行识别。
Figure BDA0003143892920000121
可见,根据该程序可以判断出用户4是正常的,用户5和8是养卡用户。
最后,服务器可以将用户2、5、8、9、10作为识别出的高风险养卡号码通知到监管平台。
在一些实施方式中,如图6所示,本实施例提供的养卡用户识别方法还可以包括:
207、若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,将待识别用户确定为可疑用户。
其中,服务器可以将该待识别用户标记为可疑用户,即表明该待识别用户标记有养卡嫌疑,但不能完全确定该待识别用户是养卡用户。
208、获取可疑用户在指定时间段内使用过的基站的基站信息。
作为一种示例,服务器可以查询各基站在指定时间段内被使用的记录,其中,被使用的记录中可以包含使用该基站的手机卡号、以及使用时间。然后将各基站中记录有该待识别用户的手机卡号基站确定为使用过的基站,再获取该使用过的基站的基站信息。可选地,基站信息可以包括基站的位置信息、编号信息等。
209、若基站信息不满足预设条件,确定可疑用户为养卡用户。
作为一种方式,在步骤208之前,该方法还包括:获取待识别用户在指定时间段内的出行记录。若出行记录与基站信息不匹配,则确定基站信息不满足预设条件。
其中,出行记录可以包括待识别用户处于不同位置时的位置信息和时间信息、在预设之间段内的出行路线等。
可选地,服务器可以对装有待识别用户的手机卡的移动终端进行定位,并根据定位信息确定出待识别用户在指定时间段内的出行记录。可选地,可以通过运营商客户端APP获取到手机卡号的行程位置信息等进行记录,然后根据行程位置信息和基站出行记录做比对。
作为一种示例,若被使用的基站包括基站A,且基站A被待识别用户使用的时间为时间a,那么可以查看出行记录中时间a对应的待识别用户的行程位置信息,若该待识别用户的位置与基站A的位置超过距离阈值,则可以确定行程位置信息和基站出行记录的比对结果为异常,从而确定基站信息不满足预设条件。
作为另一种示例,如图7所示,可以预先根据各基站的位置信息和待识别用户的行程位置信息,确定行程位置信息可能使用的基站,例如图7中行程位置信息可能使用的基站包括基站b1、基站b2以及基站b2。若基站b1、基站b2以及基站b2中指定数量的基站检测到被待识别用户使用的记录,可以根据该记录生成基站出行记录,然后将行程位置信息和基站出行记录做比对,如至少两个基站检测到被待识别用户使用的记录,则可以确定行程位置信息和基站出行记录的比对结果为正常,从而确定基站信息满足预设条件。否则,确定基站信息不满足预设条件。
考虑到非养卡用户在使用手机卡时,若处于不同的位置会使用不同的基站,在本实施方式中,通过获取待识别用户在指定时间段内的出行记录。若出行记录与基站信息不匹配,则确定基站信息不满足预设条件,从而能够提升对养卡用户的识别准确性。
作为另一种方式,在步骤208之前,该方法还包括:
从各基站中获取待识别用户使用频率最多的基站作为目标基站,然后检测目标基站中是否具有待识别用户的亲密联系人的使用记录。若有,则确定目标基站信息满足预设条件。
考虑到用户和其亲密联系人(如家庭成员)很大概率会使用相同的基站,在本实施方式中,通过从各基站中获取待识别用户使用频率最多的基站作为目标基站,然后检测目标基站中是否具有待识别用户的亲密联系人的使用记录。若有,则确定目标基站信息满足预设条件,能够准确根据基站信息确定待识别用户是否是养卡用户。
在本实施例中,通过基于社交信息与社交标准信息进行社交多样性比对、社交平衡性比对以及社交亲密性比对,得到多样性比对结果、平衡性比对结果以及亲密性比对结果;再若亲密联系人的数量大于或等于第三阈值,则确定亲密性比对结果为正常;最后基于多样性比对结果、平衡性比对结果以及亲密性比对结果确定社交信息与社交标准信息之间的匹配度,从而能够从用户的不同社交方面去确定匹配度,提升了匹配度判断的全面性和准确性。
图8为本申请实施例提供的养卡用户识别装置,该养卡用户识别装置包括:
社交信息获取模块31,用于获取指定时间段内待识别用户的社交信息。
匹配度获取模块32,用于将社交信息与社交标准信息进行特征比对,得到社交信息与社交标准信息之间的匹配度,其中,特征比对社交平衡性比对。
第一确定模块33,用于若匹配度小于第一预设匹配度,确定待识别用户为养卡用户。
第二确定模块34,用于若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,获取待识别用户的出账信息,并在出账信息不满足指定条件时,确定待识别用户为养卡用户。
发送模块35,用于将养卡用户的信息发送至监管平台。
可选地,匹配度获取模块32,包括:
比对结果获取单元,用于基于社交信息与社交标准信息进行社交多样性比对、社交平衡性比对以及社交亲密性比对,得到多样性比对结果、平衡性比对结果以及亲密性比对结果。
匹配度获取单元,用于基于多样性比对结果、平衡性比对结果以及亲密性比对结果确定社交信息与社交标准信息之间的匹配度。
可选地,社交信息包括亲密联系人的数量、呼出联系人的数量以及呼入联系人的数量,社交标准信息包括第一阈值、第二阈值、第三阈值以及指定范围;比对结果获取单元,具体用于:若呼出联系人的数量大于或等于第一阈值,且呼入联系人的数量大于或等于所第二阈值,则确定多样性比对结果为正常;若呼出联系人的数量与呼入联系人的数量之间的比例处于指定范围内,则确定平衡性比对结果为正常;若亲密联系人的数量大于或等于第三阈值,则确定亲密性比对结果为正常。
可选地,匹配度获取单元,具体用于获取多样性比对结果、平衡性比对结果以及亲密性比对结果中结果为正常的比对结果的数量;基于结果为正常的比对结果的数量确定社交信息与社交标准信息之间的匹配度,其中,正常的比对结果的数量与匹配度呈正相关。
可选地,该养卡用户识别装置还包括:
可疑用户确定模块,用于若匹配度大于或等于第一预设匹配度,且小于第二预设匹配度,将待识别用户确定为可疑用户;
基站信息获取模块,用于获取可疑用户在指定时间段内使用过的基站的基站信息;
养卡用户确定模块,用于若基站信息不满足预设条件,确定可疑用户为养卡用户。
可选地该养卡用户识别装置还包括:
出行记录获取单元,用于获取待识别用户在指定时间段内的出行记录。
基站信息确定单元,用于若出行记录与基站信息不匹配,则确定基站信息不满足预设条件。
可选地,第二确定模块34,具体用于若出账金额的不超过金额阈值,则确定出账信息不满足指定条件。
图9是本申请实施例提供的一种养卡用户识别设备的结构示意图,如图6所示,养卡用户识别设备包括存储器43和处理器44。
存储器43,用于存储处理器44可执行指令的存储器。
处理器44被配置为执行上述实施例提供的方法。
养卡用户识别设备还包括接收器40和发送器41。接收器40用于接收外部设备发送的指令和数据,发送器41用于向外部设备发送指令和数据。
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现本公开上述实施例中任一实施例提供的方法。
其中,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本申请实施例还提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (9)

1.一种养卡用户识别方法,其特征在于,包括:
获取指定时间段内待识别用户的社交信息;所述社交信息包括:亲密联系人的数量、呼出联系人的数量以及呼入联系人的数量;
基于所述社交信息与社交标准信息进行社交多样性比对、社交平衡性比对以及社交亲密性比对,得到多样性比对结果、平衡性比对结果以及亲密性比对结果;其中,所述社交平衡性比对为所述呼出联系人的数量与所述呼入联系人的数量之间的比例与指定范围的比对;
获取所述多样性比对结果、所述平衡性比对结果以及所述亲密性比对结果中结果为正常的比对结果的数量;
基于所述结果为正常的比对结果的数量确定所述社交信息与社交标准信息之间的匹配度,其中,所述正常的比对结果的数量与所述匹配度呈正相关;
若所述匹配度小于第一预设匹配度,确定所述待识别用户为养卡用户;若所述匹配度大于或等于所述第一预设匹配度,且小于第二预设匹配度,获取所述待识别用户的出账信息,并在所述出账信息不满足指定条件时,确定所述待识别用户为养卡用户;
将所述养卡用户的信息发送至监管平台。
2.根据权利要求1所述的方法,其特征在于,所述社交标准信息包括第一阈值、第二阈值、第三阈值以及指定范围;所述基于所述社交信息与社交标准信息进行社交多样性比对、社交平衡性比对以及社交亲密性比对,得到多样性比对结果、平衡性比对结果以及亲密性比对结果,包括:
若所述呼出联系人的数量大于或等于所述第一阈值,且所述呼入联系人的数量大于或等于所第二阈值,则确定所述多样性比对结果为正常;
若所述呼出联系人的数量与所述呼入联系人的数量之间的比例处于所述指定范围内,则确定所述平衡性比对结果为正常;
若亲密联系人的数量大于或等于所述第三阈值,则确定所述亲密性比对结果为正常。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述匹配度大于或等于所述第一预设匹配度,且小于第二预设匹配度,将所述待识别用户确定为可疑用户;
获取所述可疑用户在所述指定时间段内使用过的基站的基站信息;
若所述基站信息不满足预设条件,确定所述可疑用户为养卡用户。
4.根据权利要求3所述的方法,其特征在于,在所述若所述基站信息不满足预设条件,确定所述可疑用户为养卡用户之前,还包括:
获取所述待识别用户在所述指定时间段内的出行记录;
若所述出行记录与所述基站信息不匹配,则确定基站信息不满足预设条件。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述出账信息包括预设时间段内的出账金额,在所述若所述匹配度大于或等于所述第一预设匹配度,且小于第二预设匹配度,获取所述待识别用户的出账信息,并在所述出账信息不满足指定条件时,确定所述待识别用户为养卡用户之前,还包括:
若所述出账金额的不超过金额阈值,则确定所述出账信息不满足指定条件。
6.一种养卡用户识别装置,包括:
社交信息获取模块,用于获取指定时间段内待识别用户的社交信息;所述社交信息包括:亲密联系人的数量、呼出联系人的数量以及呼入联系人的数量;
匹配度获取模块,用于基于所述社交信息与社交标准信息进行社交多样性比对、社交平衡性比对以及社交亲密性比对,得到多样性比对结果、平衡性比对结果以及亲密性比对结果;其中,所述社交平衡性比对为所述呼出联系人的数量与所述呼入联系人的数量之间的比例与指定范围的比对;获取所述多样性比对结果、所述平衡性比对结果以及所述亲密性比对结果中结果为正常的比对结果的数量;基于所述结果为正常的比对结果的数量确定所述社交信息与社交标准信息之间的匹配度,其中,所述正常的比对结果的数量与所述匹配度呈正相关;
第一确定模块,用于若所述匹配度小于第一预设匹配度,确定所述待识别用户为养卡用户;
第二确定模块,用于若所述匹配度大于或等于所述第一预设匹配度,且小于第二预设匹配度,获取所述待识别用户的出账信息,并在所述出账信息不满足指定条件时,确定所述待识别用户为养卡用户;
发送模块,用于将所述养卡用户的信息发送至监管平台。
7.一种养卡用户识别设备,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为用于实现如权利要求1-5任一项所述的养卡用户识别方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-5任一项所述的养卡用户识别方法。
9.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-5中任一项所述的养卡用户识别方法。
CN202110749212.XA 2021-07-01 2021-07-01 养卡用户识别方法、装置、设备以及存储介质 Active CN113422836B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110749212.XA CN113422836B (zh) 2021-07-01 2021-07-01 养卡用户识别方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110749212.XA CN113422836B (zh) 2021-07-01 2021-07-01 养卡用户识别方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN113422836A CN113422836A (zh) 2021-09-21
CN113422836B true CN113422836B (zh) 2022-08-05

Family

ID=77720081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110749212.XA Active CN113422836B (zh) 2021-07-01 2021-07-01 养卡用户识别方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113422836B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648093A (zh) * 2018-04-23 2018-10-12 腾讯科技(深圳)有限公司 数据处理方法、装置及设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080263099A1 (en) * 2007-04-19 2008-10-23 Brady-Kalnay Susann M Affinity based social agent
CN102081774A (zh) * 2009-11-26 2011-06-01 中国移动通信集团广东有限公司 养卡识别方法及系统
US8538960B2 (en) * 2011-08-05 2013-09-17 Microsoft Corporation Providing objective and people results for search
CN110611929A (zh) * 2018-06-15 2019-12-24 中国移动通信集团有限公司 异常用户识别方法及装置
CN109636433A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 基于大数据分析的养卡识别方法、装置、设备和存储介质
CN110084619A (zh) * 2019-04-03 2019-08-02 中国联合网络通信集团有限公司 养卡行为的识别方法、装置及计算机可读存储介质
CN112601228B (zh) * 2019-09-16 2023-04-18 中国电信股份有限公司 养卡号码检测方法和装置、计算机可读存储介质
CN111626754B (zh) * 2020-05-28 2023-07-07 中国联合网络通信集团有限公司 养卡用户识别方法及装置
CN111754337B (zh) * 2020-06-30 2024-02-23 上海观安信息技术股份有限公司 一种信用卡养卡套现团体识别的方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648093A (zh) * 2018-04-23 2018-10-12 腾讯科技(深圳)有限公司 数据处理方法、装置及设备

Also Published As

Publication number Publication date
CN113422836A (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
CN108009915B (zh) 一种欺诈用户社区的标记方法及相关装置
CN107248082B (zh) 养卡识别方法及装置
CN109302434B (zh) 提示信息推送方法及装置、服务平台及存储介质
CN110493476B (zh) 一种检测方法、装置、服务器及存储介质
CN110248322B (zh) 一种基于诈骗短信的诈骗团伙识别系统及识别方法
WO2017186090A1 (zh) 通信号码处理方法及装置
CN106713579B (zh) 一种电话号码识别方法及装置
CN113412607B (zh) 内容推送方法、装置、移动终端及存储介质
CN110995937B (zh) 一种被骚扰用户的识别方法及装置
CN111654866A (zh) 移动通讯防诈骗的方法、装置及计算机存储介质
CN110611929A (zh) 异常用户识别方法及装置
CN112866192A (zh) 一种识别异常聚集行为的方法及装置
CN111626754B (zh) 养卡用户识别方法及装置
CN113206909A (zh) 骚扰电话拦截方法及装置
CN110113748B (zh) 骚扰电话监控方法、装置
KR20170006158A (ko) 문자 메시지 부정 사용 탐지 방법 및 시스템
CN105704337A (zh) 号码标记方法和系统
CN111105064B (zh) 确定欺诈事件的嫌疑信息的方法及装置
CN113923048A (zh) 网络攻击行为识别方法、装置、设备及存储介质
CN104506743B (zh) 一种动态拦截电话的方法及装置
CN113422836B (zh) 养卡用户识别方法、装置、设备以及存储介质
CN109121137B (zh) 双卡终端的用户号码使用类型识别方法及装置
CN113076533A (zh) 一种业务处理方法及装置
CN107040603B (zh) 用于确定应用程序App活跃场景的方法和装置
CN116016769A (zh) 一种欺诈团伙的识别方法、装置及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant