CN109474923A - 对象识别方法及装置、存储介质 - Google Patents
对象识别方法及装置、存储介质 Download PDFInfo
- Publication number
- CN109474923A CN109474923A CN201811410353.3A CN201811410353A CN109474923A CN 109474923 A CN109474923 A CN 109474923A CN 201811410353 A CN201811410353 A CN 201811410353A CN 109474923 A CN109474923 A CN 109474923A
- Authority
- CN
- China
- Prior art keywords
- data
- score
- communicating number
- enhancing
- basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/18—Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
Abstract
本发明提供一种对象识别方法及装置、存储介质。该方法包括:获取通信数据,所述通信数据包括:基础数据与增强数据,然后,根据所述基础数据,在各待识别对象中确定可疑对象;其中,所述基础数据包括:通话时长数据、账单数据与套餐数据中的至少一种,进而,根据所述增强数据,在所述可疑对象中确定目标对象;其中,所述增强数据包括:通信基站数据、通信渠道数据与身份数据中的至少一种。本发明的方法,能够利用容易获取到的通信数据实现对养卡用户的身份识别。
Description
技术领域
本发明涉及数据处理技术,尤其涉及一种对象识别方法及装置、存储介质。
背景技术
随着通信业务的不断发展,部分代理商会开通或者激活一定数量的号码,但是这些号码并未被出售,而仅仅是用以套取运营商的佣金,这种号码对应的用户称之为养卡用户。因此,如何准确有效的识别出养卡用户,是本领域重点关注问题。
现有技术中,一般是利用相似度算法、分类算法或者聚类算法实现对养卡用户的识别。但是,采用相似度算法、分类算法均需要大量的养卡用户的样本,这些样本获取难度较高,数据来源问题限制了现有的养卡用户识别方法。
因此,亟待提供一种新的养卡用户识别方法。
发明内容
本发明提供一种对象识别方法及装置、存储介质,以期利用通信数据来实现对养卡用户的识别。
第一方面,本发明提供一种对象识别方法,包括:
获取通信数据,所述通信数据包括:基础数据与增强数据;
根据所述基础数据,在各待识别对象中确定可疑对象;其中,所述基础数据包括:通话时长数据、账单数据与套餐数据中的至少一种;
根据所述增强数据,在所述可疑对象中确定目标对象;其中,所述增强数据包括:通信基站数据、通信渠道数据与身份数据中的至少一种。
第二方面,本发明提供一种对象识别装置,包括:
获取模块,用于获取通信数据,所述通信数据包括:基础数据与增强数据;
第一识别模块,用于根据所述基础数据,在各待识别对象中确定可疑对象;其中,所述基础数据包括:通话时长数据、账单数据与套餐数据中的至少一种;
第二识别模块,用于根据所述增强数据,在所述可疑对象中确定目标对象;其中,所述增强数据包括:通信基站数据、通信渠道数据与身份数据中的至少一种。
第三方面,本发明提供一种对象识别装置,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面任一项所述的方法。
第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如第一方面任一项所述的方法。
本发明提供的对象识别方法及装置、存储介质,通过对对待识别对象的通信数据进行业务分析实现对目标对象(也就是养卡用户)的筛选,具体而言,首先基于对其基础数据的分析,从中筛选出可疑对象,其次针对可疑对象,对其增强数据进行分析以确定目标对象。本发明实施例所提供技术方案的数据来源于通信运营商自身维护的通信数据,数据来源可靠,容易获取,实现了针对目标对象的识别,且具备较高的准确率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本发明实施例所提供的一种对象识别方法的流程示意图;
图2为本发明实施例所提供的另一种对象识别方法的流程示意图;
图3为本发明实施例所提供的另一种对象识别方法的流程示意图;
图4为本发明实施例所提供的另一种对象识别方法的流程示意图;
图5为本发明实施例所提供的一种对象识别装置的功能方块图;
图6为本发明实施例所提供的一种对象识别装置的实体结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先对本发明所涉及的名词进行解释:
养卡用户:是指部分被开通或激活的号码并未被出售使用,而仅用以套取运营商佣金,这些号码对应用户为养卡用户。
本发明具体的应用场景为运营商针对养卡用户的识别场景。
具体而言,养卡用户专用于套取运营商佣金,破坏通信行业的正常秩序,不利于通信行业健康发展,因此,对养卡用户准确识别是非常必要的。而现有的分类或聚类方法,诚如前所述,受到数据来源的较大限制,若无可靠的、大量的养卡用户的大量数据,则无法支持分类或聚类算法,也就无法实现针对养卡用户的识别。此外,对于聚类算法而言,聚类算法属于机器学习中的无监督学习,目的性较差,而且,预设的需要聚类的类别数目对结果影响很大,聚类结果的准确率较低。
而本发明提供的技术方案,旨在解决现有技术的如上技术问题,并提出如下解决思路:利用养卡用户的业务特点来实现识别,其中,所谓业务特点也就是其通信特征,如此,各通信运营商可利用自身提供服务的号码的通信数据来实现对养卡用户的身份识别,数据来源可靠且容易获取,而基于业务特点的识别,在一定程度上也具备较高的准确率。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
实施例一
本发明实施例提供了一种对象识别方法。请参考图1,该方法包括如下步骤:
S102,获取通信数据;通信数据包括:基础数据与增强数据。
本发明实施例中,通信数据可直接来源于运营商提供的通信业务的数据,而将待识别对象的通信数据分为两大类,其中,基础数据主要用于在大量(甚至海量)待识别对象中筛选出可疑对象,之后,再针对可疑对象做进一步筛选判断,而针对非可疑对象,则可暂不作处理。这种实现方式具备较高的通用性,能够有效提高识别效率。
此外,这些通信数据可以是实时数据,也可以是一个或多个指定时段内的阶段性数据。具体实现时,考虑到针对养卡用户的识别在一定程度上越及时越好,因此,在获取数据时,可尽量获取接近当前时刻的时段,例如,可选取当前时刻前三个月的通信数据;或者,又例如,可选取当前自然年份内的通信数据。
需要说明的是,由于养卡用户名下可能开通了多个通信号码,因此,在具体获取通信数据时,需要获取每个待识别对象名下的全部通信号码的通信数据。这与前述数据获取时段相结合实现时,也就是,获取前述时段内每个待识别对象名下对应的全部通信号码的通信数据。
S104,根据基础数据,在各待识别对象中确定可疑对象;其中,基础数据包括:通话时长数据、账单数据与套餐数据中的至少一种。
具体而言,通话时长数据用以表征通信号码与其他号码进行通话的时长数据。在具体获取时,可具体表现为通话时长表单。针对任一通信号码,若该通信号码的对外通话时长很短,则可能为养卡用户名下的通信号码。
而账单数据用以表征通信号码的出账情况。在具体实现时,可具体表现为:用户平均收入(Average Revenue Per User,ARPU)值,ARPU值能够用以表征一个时段内运营商能够从每个用户中获得的利润,利润越高,ARPU值越高。针对任一通信号码,若该通信号码的ARPU值较低,则可能为养卡用户名下的通信号码。
套餐数据用以表征通信号码采用的通信套餐。一般情况下,运营商会为用户提供多种可供选择的、不同档次类别的套餐服务。针对任一通信号码,若该通信号码采用的套餐对应的月租较低或无月租,则可能为养卡用户名下的通信号码。
S106,根据增强数据,在可疑对象中确定目标对象;其中,增强数据包括:通信基站数据、通信渠道数据与身份数据中的至少一种。
具体而言,通信基站数据用以表征通信号码在一个时段内进行对外通信所采用的基站信息,若其为同一个基站,则可能为养卡用户名下的通信号码。
通信渠道数据用以对通信号码的办卡渠道是否为异常渠道进行标记。可知,针对任一通信号码,若其通信渠道异常,则该号码可能为养卡用户名下的通信号码。此外,关于通信渠道是否异常的判断及标记方式,后续具体说明。
身份数据用以表征该通信号码对应的用户身份名下的通信号码数目,其数目越多,则该用户为养卡用户的可能性越高。
通过前述说明可知,本发明实施例所涉及到的基础数据与增强数据都是运营商提供给用户的通信服务中的一些数据,这些数据都很容易被运营商获取到,这首先解决了数据来源的问题。
还需要说明的是,本发明实施例中,基础数据与增强数据可以同时获取,或者,也可以在不同时段处理。
在一个可能的实现场景中,请参考图2,此时,S102包括S1022与S1044两个步骤,其中,S1022步骤用以获取各待识别对象的基础数据,执行在S104之前;而S1024步骤用以获取各可疑对象的增强数据,执行在S106之前。这种实现方式中,无需获取所有待识别对象的增强数据,而仅获取可疑对象的增强数据即可,如此,通过S104的初步筛选步骤,可以有效缩减此时的数据获取量,有利于进一步提高处理效率。
基于前述数据,本发明实施例采用打分制的方式来具体实现可疑对象与目标对象的筛选和识别。以下,结合具体实现方式举例说明。
在执行前述S104步骤中针对可疑对象的筛选确定时,无需特别区分对象(用户),而直接、无差别的利用各通信号码的基础数据实现判断。也就是,针对单一号码的基础数据进行判断,若其中任意一个号码可疑,则该号码对应的用户即确定为可疑用户。
例如,若用户A名下对应号码A1、号码A2与号码A3,则针对每个号码分别判断每个号码是否可疑,若号码A1、号码A2与号码A3中存在任意一个或多个号码可疑,则确定该用户A为可疑对象。
此时,图3示出了该实现方式的实现流程示意图,如图3,S104步骤包括:
S1042,针对任一通信号码,获取该通信号码的每个基础数据对应的基础分数。
S1044,获取基础分数之和,得到通信号码的基础可疑分数。
S1046,若通信号码的基础可疑分数达到预设分数阈值,将该通信号码对应的待识别对象确定为可疑对象。
具体而言,每一个基础数据对应于一个基础分数,该基础分数的总和即可作为通信号码的基础可疑分数。由于基础数据可以包括但不限于:通话时长数据、账单数据与套餐数据中的至少一种,以下,以一个通信号码为例,分别对这三种基础数据对应的基础分数的获取方式进行说明。
第一种,若基础数据为通话时长数据。在执行S1042时,可以根据通话时长数据,获取该通信号码在第二时段内的平均通话时长,然后,根据预设的通话时长与分数之间的第四对应关系,获取平均通话时长对应的分数,以作为通话时长数据对应的基础分数。
而第四对应关系可根据养卡用户的通信行为特征提前预设。由于养卡用户对应的通信号码一般不出售,仅用以套取运营商佣金,因此,其通话时长可能很短,则可根据通话时长越短,分数越高的原则预设第四对应关系。
此外,在一个可能的设计中,还可以进一步考虑通话类型。考虑到养卡用户的主叫通话较少,则可以在执行前述步骤时,在前述通话时长中获取主叫通话时长,然后根据第二时段内的主叫通话时长来确定该基础分数。
其中,第四对应关系可以通过一个或多个阈值的方式预设。例如,设置一个阈值,前述平均通话时长(或主叫平均通话时长)低于该阈值时,对应于一个较高的分数;若前述平均通话时长(或主叫平均通话时长)大于或者等于该阈值时,对应于一个较低的分数。
例如,可以获取该通信号码在最近2个月(当前时刻前两个月或当前时刻对应的两个自然月)内的通话时长数据,然后,筛选出主叫通话时长,求平均值,得到主叫平均通话时长;若该主叫平均通话时长小于时长阈值,假设为3分钟,则确定该通话时长数据对应的基础分数为1。反之,若该主叫平均通话时长大于或者等于3分钟,则确定该通话时长数据对应的基础分数为0。
此外,除以平均通话时长的方式实现之外,还可以以最大通话时长来实现,其中,最大通话时长小于前述阈值,则说明该通信号码在第一时段内的所有通话时长(或主叫通话时长)均小于该阈值。该实现方式的具体原理同上,不再赘述。
第二种,若基础数据为账单数据。在执行S1042时,可以根据账单数据,获取通信号码在第三时段内的账单金额,然后,根据预设的金额与分数之间的第五对应关系,获取账单金额对应的分数,以作为账单数据对应的基础分数。
如前,以账单数据为ARPU值为例,与第一种实现方式类似,提前预设ARPU值(或其所属范围)与分数的第五对应关系,然后,基于该对应关系确定该项对应的基础分数。具体而言,根据养卡用户的通信行为特征,第五对应关系可按照ARPU值越低,分数越高的原则进行预设。
举例说明,可以获取该通信号码在最近2个月(当前时刻前两个月或当前时刻对应的两个自然月)内的ARPU值,并确定ARPU值的最大值;若该ARPU值的最大值小于账单阈值,假设为10元,则确定该账单数据对应的基础分数为1。反之,若该ARPU值的最大值大于或者等于10元,则确定该账单数据对应的基础分数为0。
与前述方式类似,除以ARPU最大值的方式实现之外,也可以通过平均值的方式实现本方案,不再赘述。
第三种,若基础数据为套餐类型。在执行S1042时,可以根据预设的套餐类型与分数之间的第六对应关系,获取通信号码所采用的套餐类型对应的分数,以作为套餐数据对应的基础分数。
根据养卡用户的通信行为特征,可以将第六对应关系可以按照套餐月租越低,其对应分数越高的原则进行预设。
例如,若该通信号码所使用的套餐为无月租套餐,则可以根据第六对应关系,确定套餐类型对应的基础分数为2;若该通信号码所使用的套餐的月租低于套餐阈值,假设为15元,则确定套餐类型对应的基础分数为1;若该通信号码所使用的套餐的月租大于或者等于15元,则确定套餐类型对应的基础分数为0。
此外,在前述第四对应关系、第五对应关系、第六对应关系中,可任意设置不同或相同的分数,并通过各基础数据对应的基础分数之和与预设的分数阈值之间的大小关系,确定可疑对象。
在一种可能的设计中,可以将统计前述满足可疑条件的个数,若在前述多个基础数据中存在至少两个基础数据满足可疑用户的数据行为特征,则确定该通信号码对应的用户为可疑对象。
此外还需要说明的是,可疑对象的基础可疑分数可疑由前述各基础分数相加得到,或者,若针对待识别对象还设置有最初分数,则该基础可疑分数由最初分数与各基础分数之和得到。其中,不同待识别对象的不同通信号码之间的最初分数可以相同,也可以不同,根据需要设置。此外,在一种可能的设计中,该最初分数还可以与该对象的其他行为数据(非通信数据)相关,本发明实施例对此无特殊限定。
通过前述步骤,在各待识别对象中初步确定了可疑对象。
基于前述可疑对象的确定,本发明实施例还进一步给出了在可疑对象中确定目标对象的实现方式,其实质为根据养卡用户的通信行为特征,确定各可疑对象的增强分数。在执行该步骤的判断时,可采用与S104类似的处理思路来处理,也就是,获取可疑对象的各通信号码在各项增强数据上的增强分数,结合基础可疑分数,得到各通信号码的总可疑分数,然后,基于各通信号码的总可疑分数来判断该对象是否为目标对象。
此时,图4示出了S106步骤的具体实现流程:
S1062,针对任一可疑对象的任一通信号码,获取该通信号码的每个增强数据对应的增强分数。
S1064,获取每个通信号码的各增强分数与基础可疑分数之和,得到通信号码的总可疑分数。
S1066,根据各通信号码的总可疑分数,确定该可疑对象是否为目标对象。
与前述方式类似,以下,以一个可疑对象的一个通信号码为例,说明针对该可疑对象的识别方式。
第一种,若基础数据为通信渠道数据。在执行S1062时,可以根据通信渠道数据,判断该通信号码的办理渠道是否为异常渠道,得到第一判断结果,然后,根据第一判断结果与分数之间的第一对应关系,获取第一判断结果对应的分数,以作为该通信号码的通信渠道数据对应的增强分数。
根据养卡用户的通信行为特征,第一对应关系可以按照异常渠道对应分数高于正常渠道对应分数的方式预设。例如,可以将异常渠道的分数设置为2,正常渠道对应的分数设置为0,并以此建立第一对应关系。
除此之外,该实现步骤中,还需要判断办理渠道是否为异常渠道。该步骤可以包括但不限于以下两种实现方式:
方式A,提前对各办理渠道是否为异常渠道进行判断,并通过添加标识的方式实现。添加标识可以包括:仅为异常渠道添加异常渠道标识;或者,仅为正常渠道添加正常渠道标识;或者,为异常渠道添加异常渠道标识,以及,为正常渠道添加正常渠道标识。
以仅为异常渠道添加异常渠道标识为例,在执行该判断步骤时,若能读取到该异常标识,则将该通信渠道确定为异常渠道;反之,若读取不到该异常标识,则确定其为正常渠道。
方式B,不提前针对渠道进行判断,而是在执行该步骤时,直接利用前述S102获取到的数据判断该办理渠道是否为异常渠道。
基于前述思路,本发明实施例还进一步给出了判断通信渠道是否异常的实现方式:针对任一办理渠道,根据通信渠道数据,获取在该办理渠道办理通信业务的可疑对象的涨幅或占比;从而,若涨幅达到预设涨幅阈值,和/或,占比达到预设占比阈值,确定该办理渠道为异常渠道。
其中,可疑对象的涨幅可以用增长数字来表示,例如,可以通过新增可疑对象数目是否超过数目阈值,如100人,来判断其是否为异常渠道;或者,涨幅还可以通过增长比例的方式来表示,例如,新增可疑对象在所有新增对象中的占比与历史占比之差,是否大于差值阈值,如5%,来判断其是否为异常渠道。
具体实现时,还可以结合涨幅与占比两方面来综合判断异常渠道。例如,可以判断新增可疑对象的数目是否大于20人,以及,判断新增可疑对象在新增对象中的占比是否大于30%,若二者的判断结果均为是,则确定该办理渠道为异常渠道。
此外,针对异常渠道的判断可以采用全部数据,或者,一定时段内的数据,不再赘述。
第二种,若基础数据为通信基站数据。在执行S1062时,可以根据通信基站数据,判断该通信号码在第一时段内所使用的通信基站是否相同,得到第二判断结果,然后,根据第二判断结果与分数之间的第二对应关系,获取第二判断结果对应的分数,以作为该通信号码的通信基站数据对应的增强分数。
根据养卡用户的通信行为特征,第二对应关系可以按照如下规则进行预设:在第一时段内,采用相同基站对应的分数大于采用不同基站对应的分数。例如,可以将采用相同基站对应的分数设置为2,采用不同基站对应的分数设置为0,并以此建立第二对应关系。
具体实现方式同上,不再赘述。
第三种,若基础数据为身份数据。在执行S1062时,可以根据身份数据,确定该通信号码所对应的可疑对象名下的通信号码数目,然后,根据预设的数目范围与分数之间的第三对应关系,确定通信号码数目所在数目范围对应的分数,以作为该通信号码的身份数据对应的增强分数。
根据养卡用户的通信行为特征,第三对应关系可以按照如下规则进行预设:可疑对象名下的通信号码数目越多,对应的分数越高。例如,可以设置多个不同档次:若一个可疑对象名下的通信号码数目为1个,则对应的分数设置为0;若一个可疑对象名下的通信号码数目为2~3个(包含2和3),则对应的分数设置为1;若一个可疑对象名下的通信号码数目为4~6个(包含4和6),则对应的分数设置为2;若一个可疑对象名下的通信号码数目大于6个,则对应的分数设置为3。
通过前述手段,可以得到每个通信号码对应的增强分数,由此,可得到每个通信号码对应的总可疑分数。
由此,在进一步执行S1066中的目标对象的识别判断时,可以根据其中的一个通信号码的总可疑分数实现识别判断,或者,也可以通过多个(部分或全部)通信号码的总可疑分数实现识别判断。
其中,若通过一个通信号码的总可疑分数识别判断目标对象时,则该通信号码可以是该可疑对象的所有通信号码中总可疑分数最大的一个通信号码;或者,是随机任意的一个通信号码。
或者,若以多个通信号码的总可疑分数识别判断目标对象时,可以获取多个通信号码的总可疑分数的平均总可疑分数,并以此为依据判断该可疑对象是否为目标对象;或者,也可以将各通信号码的总可疑分数逐个与总分数阈值进行比较,得到比较结果,并针对各比较结果做加权后处理,得到最终数值后,再通过与总分数阈值的比较,来确定该可疑对象是否为目标对象。
此外,需要说明的是,本发明实施例中所涉及到的各时段、分数等数值大小无特别限定,以时段为例,第一时段与第二时段可以相同,也可以不同(独立设置)。
还需要说明的是,本发明实施例在具体实现时,可以包括但不限于前述通信数据。在实际执行养卡用户的身份识别时,还可增加其他可获取通信数据,并根据养卡用户的通信行为特征设置条件,并预设分值,来实现对养卡用户的身份识别。
可以理解的是,上述实施例中的部分或全部步骤骤或操作仅是示例,本申请实施例还可以执行其它操作或者各种操作的变形。此外,各个步骤可以按照上述实施例呈现的不同的顺序来执行,并且有可能并非要执行上述实施例中的全部操作。
基于上述实施例一所提供的对象识别方法,本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
本发明实施例提供了一种对象识别装置,请参考图5,该对象识别装置500,包括:
获取模块51,用于获取通信数据,通信数据包括:基础数据与增强数据;
第一识别模块52,用于根据基础数据,在各待识别对象中确定可疑对象;其中,基础数据包括:通话时长数据、账单数据与套餐数据中的至少一种;
第二识别模块53,用于根据增强数据,在可疑对象中确定目标对象;其中,增强数据包括:通信基站数据、通信渠道数据与身份数据中的至少一种。
一种可能的设计中,第二识别模块53,用于:
针对任一可疑对象的任一通信号码,获取该通信号码的每个增强数据对应的增强分数;
获取每个通信号码的各增强分数与基础可疑分数之和,得到通信号码的总可疑分数;
根据各通信号码的总可疑分数,确定该可疑对象是否为目标对象。
其中,第二识别模块53,具体用于:
根据通信渠道数据,判断该通信号码的办理渠道是否为异常渠道,得到第一判断结果;
根据第一判断结果与分数之间的第一对应关系,获取第一判断结果对应的分数,以作为该通信号码的通信渠道数据对应的增强分数。
此时,第二识别模块53,还用于:
判断该通信号码的办理渠道是否为异常渠道之前,针对任一办理渠道,根据通信渠道数据,获取在该办理渠道办理通信业务的可疑对象的涨幅或占比;
若涨幅达到预设涨幅阈值,和/或,占比达到预设占比阈值,确定该办理渠道为异常渠道。
其中,第二识别模块53,具体用于:
根据通信基站数据,判断该通信号码在第一时段内所使用的通信基站是否相同,得到第二判断结果;
根据第二判断结果与分数之间的第二对应关系,获取第二判断结果对应的分数,以作为该通信号码的通信基站数据对应的增强分数。
其中,第二识别模块53,具体用于:
根据身份数据,确定该通信号码所对应的可疑对象名下的通信号码数目;
根据预设的数目范围与分数之间的第三对应关系,确定通信号码数目所在数目范围对应的分数,以作为该通信号码的身份数据对应的增强分数。
另一种可能的设计中,第一识别模块52,用于:
针对任一通信号码,获取该通信号码的每个基础数据对应的基础分数;
获取基础分数之和,得到通信号码的基础可疑分数;
若通信号码的基础可疑分数达到预设分数阈值,将该通信号码对应的待识别对象确定为可疑对象。
其中,第一识别模块52,具体用于:
根据通话时长数据,获取该通信号码在第二时段内的平均通话时长;
根据预设的通话时长与分数之间的第四对应关系,获取平均通话时长对应的分数,以作为通话时长数据对应的基础分数。
其中,第一识别模块52,具体用于:
根据账单数据,获取通信号码在第三时段内的账单金额;
根据预设的金额与分数之间的第五对应关系,获取账单金额对应的分数,以作为账单数据对应的基础分数。
其中,第一识别模块52,具体用于:
根据预设的套餐类型与分数之间的第六对应关系,获取通信号码所采用的套餐类型对应的分数,以作为套餐数据对应的基础分数。
并且,本发明实施例提供了一种对象识别装置,请参考图6,该对象识别装置600,包括:
存储器610;
处理器620;以及
计算机程序;
其中,计算机程序存储在存储器610中,并被配置为由处理器620执行以实现如上述实施例所述的方法。
此外,如图6所示,在该对象识别装置600中还设置有收发器630,用于与其他设备进行数据传输或通信,在此不再赘述。存储器610、处理器620与收发器630通过总线连接。
此外,本发明实施例提供了一种可读存储介质,其上存储有计算机程序,
该计算机程序被处理器执行以实现如前述实施例任一种实现方式所述的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。
Claims (22)
1.一种对象识别方法,其特征在于,包括:
获取通信数据,所述通信数据包括:基础数据与增强数据;
根据所述基础数据,在各待识别对象中确定可疑对象;其中,所述基础数据包括:通话时长数据、账单数据与套餐数据中的至少一种;
根据所述增强数据,在所述可疑对象中确定目标对象;其中,所述增强数据包括:通信基站数据、通信渠道数据与身份数据中的至少一种。
2.根据权利要求1所述的方法,其特征在于,所述根据所述增强数据,在所述可疑对象中确定目标对象,包括:
针对任一所述可疑对象的任一通信号码,获取该通信号码的每个所述增强数据对应的增强分数;
获取每个通信号码的各所述增强分数与基础可疑分数之和,得到所述通信号码的总可疑分数;
根据各通信号码的所述总可疑分数,确定该可疑对象是否为所述目标对象。
3.根据权利要求2所述的方法,其特征在于,所述获取该通信号码的每个所述增强数据对应的增强分数,包括:
根据所述通信渠道数据,判断该通信号码的办理渠道是否为异常渠道,得到第一判断结果;
根据第一判断结果与分数之间的第一对应关系,获取所述第一判断结果对应的分数,以作为该通信号码的通信渠道数据对应的增强分数。
4.根据权利要求3所述的方法,其特征在于,所述判断该通信号码的办理渠道是否为异常渠道之前,所述方法还包括:
针对任一办理渠道,根据所述通信渠道数据,获取在该办理渠道办理通信业务的可疑对象的涨幅或占比;
若所述涨幅达到预设涨幅阈值,和/或,所述占比达到预设占比阈值,确定该办理渠道为异常渠道。
5.根据权利要求2所述的方法,其特征在于,所述获取该通信号码的每个所述增强数据对应的增强分数,包括:
根据所述通信基站数据,判断该通信号码在第一时段内所使用的通信基站是否相同,得到第二判断结果;
根据第二判断结果与分数之间的第二对应关系,获取所述第二判断结果对应的分数,以作为该通信号码的通信基站数据对应的增强分数。
6.根据权利要求2所述的方法,其特征在于,所述获取该通信号码的每个所述增强数据对应的增强分数,包括:
根据所述身份数据,确定该通信号码所对应的可疑对象名下的通信号码数目;
根据预设的数目范围与分数之间的第三对应关系,确定所述通信号码数目所在数目范围对应的分数,以作为该通信号码的所述身份数据对应的增强分数。
7.根据权利要求1或2所述的方法,其特征在于,所述根据所述基础数据,在各待识别对象中确定可疑对象,包括:
针对任一通信号码,获取该通信号码的每个所述基础数据对应的基础分数;
获取所述基础分数之和,得到所述通信号码的基础可疑分数;
若所述通信号码的基础可疑分数达到预设分数阈值,将该通信号码对应的待识别对象确定为所述可疑对象。
8.根据权利要求7所述的方法,其特征在于,所述获取该通信号码的每个所述基础数据对应的基础分数,包括:
根据所述通话时长数据,获取该通信号码在第二时段内的平均通话时长;
根据预设的通话时长与分数之间的第四对应关系,获取所述平均通话时长对应的分数,以作为所述通话时长数据对应的基础分数。
9.根据权利要求7所述的方法,其特征在于,所述获取该通信号码的每个所述基础数据对应的基础分数,包括:
根据所述账单数据,获取所述通信号码在第三时段内的账单金额;
根据预设的金额与分数之间的第五对应关系,获取所述账单金额对应的分数,以作为所述账单数据对应的基础分数。
10.根据权利要求7所述的方法,其特征在于,所述获取该通信号码的每个所述基础数据对应的基础分数,包括:
根据预设的套餐类型与分数之间的第六对应关系,获取所述通信号码所采用的套餐类型对应的分数,以作为所述套餐数据对应的基础分数。
11.一种对象识别装置,其特征在于,包括:
获取模块,用于获取通信数据,所述通信数据包括:基础数据与增强数据;
第一识别模块,用于根据所述基础数据,在各待识别对象中确定可疑对象;其中,所述基础数据包括:通话时长数据、账单数据与套餐数据中的至少一种;
第二识别模块,用于根据所述增强数据,在所述可疑对象中确定目标对象;其中,所述增强数据包括:通信基站数据、通信渠道数据与身份数据中的至少一种。
12.根据权利要求11所述的装置,其特征在于,所述第二识别模块,用于:
针对任一所述可疑对象的任一通信号码,获取该通信号码的每个所述增强数据对应的增强分数;
获取每个通信号码的各所述增强分数与基础可疑分数之和,得到所述通信号码的总可疑分数;
根据各通信号码的所述总可疑分数,确定该可疑对象是否为所述目标对象。
13.根据权利要求12所述的装置,其特征在于,所述第二识别模块,具体用于:
根据所述通信渠道数据,判断该通信号码的办理渠道是否为异常渠道,得到第一判断结果;
根据第一判断结果与分数之间的第一对应关系,获取所述第一判断结果对应的分数,以作为该通信号码的通信渠道数据对应的增强分数。
14.根据权利要求13所述的装置,其特征在于,所述第二识别模块,还用于:
判断该通信号码的办理渠道是否为异常渠道之前,针对任一办理渠道,根据所述通信渠道数据,获取在该办理渠道办理通信业务的可疑对象的涨幅或占比;
若所述涨幅达到预设涨幅阈值,和/或,所述占比达到预设占比阈值,确定该办理渠道为异常渠道。
15.根据权利要求12所述的装置,其特征在于,所述第二识别模块,具体用于:
根据所述通信基站数据,判断该通信号码在第一时段内所使用的通信基站是否相同,得到第二判断结果;
根据第二判断结果与分数之间的第二对应关系,获取所述第二判断结果对应的分数,以作为该通信号码的通信基站数据对应的增强分数。
16.根据权利要求12所述的装置,其特征在于,所述第二识别模块,具体用于:
根据所述身份数据,确定该通信号码所对应的可疑对象名下的通信号码数目;
根据预设的数目范围与分数之间的第三对应关系,确定所述通信号码数目所在数目范围对应的分数,以作为该通信号码的所述身份数据对应的增强分数。
17.根据权利要求11或12所述的装置,其特征在于,所述第一识别模块,用于:
针对任一通信号码,获取该通信号码的每个所述基础数据对应的基础分数;
获取所述基础分数之和,得到所述通信号码的基础可疑分数;
若所述通信号码的基础可疑分数达到预设分数阈值,将该通信号码对应的待识别对象确定为所述可疑对象。
18.根据权利要求17所述的装置,其特征在于,所述第一识别模块,具体用于:
根据所述通话时长数据,获取该通信号码在第二时段内的平均通话时长;
根据预设的通话时长与分数之间的第四对应关系,获取所述平均通话时长对应的分数,以作为所述通话时长数据对应的基础分数。
19.根据权利要求17所述的装置,其特征在于,所述第一识别模块,具体用于:
根据所述账单数据,获取所述通信号码在第三时段内的账单金额;
根据预设的金额与分数之间的第五对应关系,获取所述账单金额对应的分数,以作为所述账单数据对应的基础分数。
20.根据权利要求17所述的装置,其特征在于,所述第一识别模块,具体用于:
根据预设的套餐类型与分数之间的第六对应关系,获取所述通信号码所采用的套餐类型对应的分数,以作为所述套餐数据对应的基础分数。
21.一种对象识别装置,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-10任一项所述的方法。
22.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,
所述计算机程序被处理器执行以实现如权利要求1-10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811410353.3A CN109474923B (zh) | 2018-11-23 | 2018-11-23 | 对象识别方法及装置、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811410353.3A CN109474923B (zh) | 2018-11-23 | 2018-11-23 | 对象识别方法及装置、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109474923A true CN109474923A (zh) | 2019-03-15 |
CN109474923B CN109474923B (zh) | 2022-02-01 |
Family
ID=65673385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811410353.3A Active CN109474923B (zh) | 2018-11-23 | 2018-11-23 | 对象识别方法及装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109474923B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084619A (zh) * | 2019-04-03 | 2019-08-02 | 中国联合网络通信集团有限公司 | 养卡行为的识别方法、装置及计算机可读存储介质 |
CN111125193A (zh) * | 2019-12-23 | 2020-05-08 | 精硕科技(北京)股份有限公司 | 多媒体非正常评论的识别方法、装置、设备及存储介质 |
CN112601228A (zh) * | 2019-09-16 | 2021-04-02 | 中国电信股份有限公司 | 养卡号码检测方法和装置、计算机可读存储介质 |
CN113205443A (zh) * | 2020-02-03 | 2021-08-03 | 中国移动通信集团浙江有限公司 | 异常用户的识别方法及装置 |
CN114268939A (zh) * | 2021-11-12 | 2022-04-01 | 重庆市通信产业服务有限公司中冉信息分公司 | 一种移动通信中异常用户识别的方法及智能设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030023440A1 (en) * | 2001-03-09 | 2003-01-30 | Chu Wesley A. | System, Method and computer program product for presenting large lists over a voice user interface utilizing dynamic segmentation and drill down selection |
US20030158796A1 (en) * | 2001-12-08 | 2003-08-21 | Balent Bruce F. | Distributed personal automation and shopping method, apparatus, and process |
WO2004019638A2 (en) * | 2002-08-23 | 2004-03-04 | Sony Ericsson Mobile Communications Ab | System and method for home network determination in a mobile phone |
CN102081774A (zh) * | 2009-11-26 | 2011-06-01 | 中国移动通信集团广东有限公司 | 养卡识别方法及系统 |
CN103164474A (zh) * | 2011-12-15 | 2013-06-19 | 中国移动通信集团贵州有限公司 | 一种对数据业务进行分析的方法 |
CN104320525A (zh) * | 2014-09-19 | 2015-01-28 | 小米科技有限责任公司 | 电话号码识别方法及装置 |
CN104602182A (zh) * | 2015-02-12 | 2015-05-06 | 中国联合网络通信集团有限公司 | 渠道价值获取方法和装置 |
CN105451234A (zh) * | 2015-11-09 | 2016-03-30 | 北京市天元网络技术股份有限公司 | 一种基于信令交互数据的可疑号码分析方法及装置 |
CN106937291A (zh) * | 2017-04-25 | 2017-07-07 | 中国联合网络通信集团有限公司 | 养卡识别方法及系统 |
CN107248082A (zh) * | 2017-05-23 | 2017-10-13 | 北京道隆华尔软件股份有限公司 | 养卡识别方法及装置 |
CN107809762A (zh) * | 2017-11-01 | 2018-03-16 | 南京欣网互联网络科技有限公司 | 利用大数据与设备指纹的养卡识别的安全风险控制方法 |
CN107820252A (zh) * | 2017-11-15 | 2018-03-20 | 中国联合网络通信集团有限公司 | 养卡识别方法及系统 |
CN108271134A (zh) * | 2016-12-31 | 2018-07-10 | 中国移动通信集团吉林有限公司 | 一种通信业务的计费方法及设备 |
-
2018
- 2018-11-23 CN CN201811410353.3A patent/CN109474923B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030023440A1 (en) * | 2001-03-09 | 2003-01-30 | Chu Wesley A. | System, Method and computer program product for presenting large lists over a voice user interface utilizing dynamic segmentation and drill down selection |
US20030158796A1 (en) * | 2001-12-08 | 2003-08-21 | Balent Bruce F. | Distributed personal automation and shopping method, apparatus, and process |
WO2004019638A2 (en) * | 2002-08-23 | 2004-03-04 | Sony Ericsson Mobile Communications Ab | System and method for home network determination in a mobile phone |
CN102081774A (zh) * | 2009-11-26 | 2011-06-01 | 中国移动通信集团广东有限公司 | 养卡识别方法及系统 |
CN103164474A (zh) * | 2011-12-15 | 2013-06-19 | 中国移动通信集团贵州有限公司 | 一种对数据业务进行分析的方法 |
CN104320525A (zh) * | 2014-09-19 | 2015-01-28 | 小米科技有限责任公司 | 电话号码识别方法及装置 |
CN104602182A (zh) * | 2015-02-12 | 2015-05-06 | 中国联合网络通信集团有限公司 | 渠道价值获取方法和装置 |
CN105451234A (zh) * | 2015-11-09 | 2016-03-30 | 北京市天元网络技术股份有限公司 | 一种基于信令交互数据的可疑号码分析方法及装置 |
CN108271134A (zh) * | 2016-12-31 | 2018-07-10 | 中国移动通信集团吉林有限公司 | 一种通信业务的计费方法及设备 |
CN106937291A (zh) * | 2017-04-25 | 2017-07-07 | 中国联合网络通信集团有限公司 | 养卡识别方法及系统 |
CN107248082A (zh) * | 2017-05-23 | 2017-10-13 | 北京道隆华尔软件股份有限公司 | 养卡识别方法及装置 |
CN107809762A (zh) * | 2017-11-01 | 2018-03-16 | 南京欣网互联网络科技有限公司 | 利用大数据与设备指纹的养卡识别的安全风险控制方法 |
CN107820252A (zh) * | 2017-11-15 | 2018-03-20 | 中国联合网络通信集团有限公司 | 养卡识别方法及系统 |
Non-Patent Citations (3)
Title |
---|
GYANENDRA K VERMA: "A Digital Security System with Door Lock System Using RFID Technology", 《INTERNATIONAL JOURNAL OF COMPUTER APPLICATIONS》 * |
刘世伟: "基于大数据的养卡行为识别模式", 《移动通信》 * |
茜茜西A: "客户发展质量管理规范", 《百度文库》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084619A (zh) * | 2019-04-03 | 2019-08-02 | 中国联合网络通信集团有限公司 | 养卡行为的识别方法、装置及计算机可读存储介质 |
CN112601228A (zh) * | 2019-09-16 | 2021-04-02 | 中国电信股份有限公司 | 养卡号码检测方法和装置、计算机可读存储介质 |
CN112601228B (zh) * | 2019-09-16 | 2023-04-18 | 中国电信股份有限公司 | 养卡号码检测方法和装置、计算机可读存储介质 |
CN111125193A (zh) * | 2019-12-23 | 2020-05-08 | 精硕科技(北京)股份有限公司 | 多媒体非正常评论的识别方法、装置、设备及存储介质 |
CN111125193B (zh) * | 2019-12-23 | 2023-08-29 | 北京秒针人工智能科技有限公司 | 多媒体非正常评论的识别方法、装置、设备及存储介质 |
CN113205443A (zh) * | 2020-02-03 | 2021-08-03 | 中国移动通信集团浙江有限公司 | 异常用户的识别方法及装置 |
CN114268939A (zh) * | 2021-11-12 | 2022-04-01 | 重庆市通信产业服务有限公司中冉信息分公司 | 一种移动通信中异常用户识别的方法及智能设备 |
CN114268939B (zh) * | 2021-11-12 | 2024-03-08 | 重庆市中冉数字科技有限公司 | 一种移动通信中异常用户识别的方法及智能设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109474923B (zh) | 2022-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109474923A (zh) | 对象识别方法及装置、存储介质 | |
CN107248082B (zh) | 养卡识别方法及装置 | |
CN109522304A (zh) | 异常对象识别方法及装置、存储介质 | |
CN110782335B (zh) | 基于人工智能处理信贷数据的方法、装置及存储介质 | |
CN110401779A (zh) | 一种识别电话号码的方法、装置和计算机可读存储介质 | |
CN109688275A (zh) | 骚扰电话识别方法、装置及存储介质 | |
CN108989581B (zh) | 一种用户风险识别方法、装置及系统 | |
CN110533085A (zh) | 同人识别方法及装置、存储介质、计算机设备 | |
CN109145050B (zh) | 一种计算设备 | |
CN109711801A (zh) | 一种网银对账方法及装置 | |
CN108268477A (zh) | 一种基于话单的用户关系确定方法和装置 | |
CN109191167A (zh) | 一种目标用户的挖掘方法和装置 | |
CN109993417A (zh) | 一种业务状态标识添加方法、装置及存储介质 | |
CN113206909A (zh) | 骚扰电话拦截方法及装置 | |
CN109918645A (zh) | 深度分析文本的方法、装置、计算机设备和存储介质 | |
CN110675263B (zh) | 交易数据的风险识别方法以及装置 | |
CN110347566A (zh) | 用于对注册风控模型进行效能评估的方法及装置 | |
CN110489242A (zh) | 分布式数据计算方法、装置、终端设备及存储介质 | |
CN104217088B (zh) | 运营商移动业务资源的优化方法与系统 | |
CN111242314A (zh) | 深度学习加速器基准测试方法和装置 | |
CN115103063A (zh) | 一种针对假冒客服类的互联网诈骗识别方法及装置 | |
CN109858901A (zh) | 基于手机信令大数据的移动用户支付识别方法 | |
CN110210884A (zh) | 确定用户特征数据的方法、装置、计算机设备及存储介质 | |
CN108633109A (zh) | 双卡终端的主卡的识别方法和装置 | |
CN108875029A (zh) | 数据处理方法及装置、存储介质和处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |