CN113076776A - 通信号码的识别方法、装置和电子设备 - Google Patents

通信号码的识别方法、装置和电子设备 Download PDF

Info

Publication number
CN113076776A
CN113076776A CN202010004192.9A CN202010004192A CN113076776A CN 113076776 A CN113076776 A CN 113076776A CN 202010004192 A CN202010004192 A CN 202010004192A CN 113076776 A CN113076776 A CN 113076776A
Authority
CN
China
Prior art keywords
communication
communication number
user
characteristic data
behavior characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010004192.9A
Other languages
English (en)
Inventor
范曾
周妤
徐继业
周敏虎
张英霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Guangdong Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202010004192.9A priority Critical patent/CN113076776A/zh
Publication of CN113076776A publication Critical patent/CN113076776A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种通信号码的识别方法、装置和电子设备,该方法包括:获取用户使用通信号码所产生的至少两种行为特征数据;根据至少两种行为特征数据,对所述用户的通信号码进行分类,得到通信号码的识别类型。在本实施例中的方法,通过获取用户使用通信号码所产生的至少两种行为特征数据,对通信号码进行分类,得到通信号码的识别类型,根据通信号码的识别类型,能够确定通信号码是否异常,进而减少异常的通信号码被遗漏的概率,提高通信号码的识别准确率。

Description

通信号码的识别方法、装置和电子设备
技术领域
本发明涉及通信领域,尤其涉及一种通信号码的识别方法、装置和电子设备。
背景技术
随着通信行业的不断发展,广大用户开始逐渐享受到多样化的通信服务。但越来越多恶意的异常通信行为不断涌现,大量的群体或个人以电信诈骗、营销或个人攻击等手段对目标人群实现骚扰,影响普通用户的正常通信。因此,行之有效的识别通信号码的方法是必不可少的。
目前识别通信号码的方法是基于通信网全网用户上传的通讯录、黑名单和白名单聚合形成号码关系图,根据号码关系图识别垃圾短信以及更新好友列表。然而,依赖用户上传通讯录及黑白名单,收集到的数据有限,在此基础上建立的号码关系图存在局限,且识别准确率低。
发明内容
本发明实施例提供一种通信号码的方法、装置和电子设备,以解决现有技术对通信号码的识别方式比较局限,且识别准确率低的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,提供了一种通信号码的识别方法,该方法包括:
获取用户使用通信号码所产生的至少两种行为特征数据;
根据所述至少两种行为特征数据,对所述用户的通信号码进行分类,得到所述通信号码的识别类型。
第二方面,提供了一种通信号码的识别装置,该装置包括:
获取模块,用于获取用户使用通信号码所产生的至少两种行为特征数据;
分类模块,用于根据所述至少两种行为特征数据,对所述用户的通信号码进行分类,得到所述通信号码的识别类型。
第三方面,提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法的步骤。
在本发明实施例中,获取用户使用通信号码所产生的至少两种行为特征数据,根据至少两种行为特征数据,对通信号码进行分类,得到通信号码的识别类型,根据通信号码的识别类型,能够确定通信号码是否异常,进而减少异常的通信号码被遗漏的概率,提高通信号码的识别准确率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明的一个实施例的通信号码的识别方法的流程示意图;
图2是本发明的另一个实施例的构建分类模型的方法的流程示意图;
图3是本发明的一个实施例的人工神经网络模型的结构示意图;
图4是本发明的再一个实施例的构建分类模型的方法的流程示意图;
图5是本发明的一个实施例的通信号码的识别装置的结构示意图;
图6是本发明的一个实施例的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明的一个实施例的通信号码的识别方法的流程示意图,如图1所示,该方法可以由通信号码的识别装置执行,图1所示的方法包括:
步骤S102,获取用户使用通信号码所产生的至少两种行为特征数据。
在步骤S102中,获取用户使用通信号码所产生的至少两种行为特征数据,该至少两种行为特征数据可以包括基础行为特征数据、通信行为特征数据、上网流量行为特征数据、消费行为特征数据,其中,基础行为特征数据包括产品订购/退订的种类、次数等数据;通信行为特征数据包括通话时长、次数、发短信次数、联系人、地点等数据;上网流量行为特征数据包括互联网访问app/网站、次数、时长、使用流量等数据;消费行为特征数据包括每用户平均收入均值、订购套餐/非套餐产品金额等数据。
另外,步骤S102中至少两种行为特征数据还可以包括:用于评价用户信用度的信用指标数据和/或用于评价用户交往能力的交往圈影响力指标数据。
在一些实施例中,为了能够更准确地识别出通信号码的识别类型,上述至少两种行为特征数据中还可包括信用指标数据和/或交往圈影响力指标数据,其中,信用指标数据能够有效地反映出用户信用度的情况,交往圈影响力指标数据能够有效地反映出用户在交往圈内的影响力大小以及该用户与其他用户之间的交往关系是否紧密。
根据包括有信用指标和/或交往圈影响力指标数据的至少两种行为特征数据,对通信号码的识别类型进行区分,确定通信号码的识别类型,能够提高通信号码的分类准确率。
可选地,在一些实施例中,信用指标数据的获取过程可以如下:
获取用户使用通信号码过程中的身份信息、通信消费信息、信用历史信息、行为偏好信息、人脉关系信息中的至少一种信用指标信息;
根据获取的信用指标信息对用户的信用度进行评价,得到用户的信用指标数据。
具体地,上述至少一种信用指标信息包括身份信息、通信消费信息、信用历史信息、行为偏好信息和人脉关系信息,其中,身份信息包括用户的通信号码是否已实名制、用户年龄、用户身份标签等指标数据;通信消费信息包括用户的账户余额、近三月的用户收入均值、近三月的用户数据流量均值、近一个月总通话次数等指标数据;信用历史信息包括近一个月停机天数、近三个月欠费总次数等指标数据;行为偏好信息包括月流量活跃天数、月通话活跃天数、漫游地偏好top3等指标数据,人脉关系信息包括该用户近三个月联系其他用户的次数、时长、联系地点等指标数据。根据获取到的信息指标信息,对用户的信用度进行评价,得到用于评价该用户信用度的信用指标数据。
比如,根据获取的身份信息、通信消费信息、信用历史信息、行为偏好信息和人脉关系信息构建逻辑回归模型,得到用户的信用指标数据。其中,逻辑回归模型本质上是一种有监督的分类学习方法,具备易于实现、解释性好以及容易扩展等优点,该逻辑回归模型预测的概率能够作为衡量用户信用健康程度的评分。
具体地,上述逻辑回归模型为逻辑函数,该逻辑函数如公式(1)所示:
Figure BDA0002354617390000041
其中,a表示用户的信用指标数据,x=常数+(用户的通信号码是否已实名制)×系数1+(用户年龄)×系数2+(用户身份标签)×系数3+(账户余额)×系数4+(近三月的用户收入均值)×系数5+(近三个月的用户数量流量均值)×系数6+(近一个月总通话次数)×系数7+(月通话活跃天数)×系数8+.......。
可选地,在另一些实施例中,交往圈影响力指标数据的获取过程可以如下:
获取目标用户使用通信号码过程中与其他用户所使用通信号码之间的通信次数;
根据其他用户的交往圈影响力指标数据,以及其他用户与目标用户的通信次数,得到目标用户的交往圈影响力指标数据。
举例说明,在实际应用场景中,假设目标用户A和其他用户B、C、D的交往圈影响力指标数据初始值相等,获取目标用户A所使用通信号码分别与其他用户B、C、D所使用通信号码之间的通信次数,采用交往圈影响力模型,对目标用户A、其他用户B、C、D的交往圈影响力指标数据以及目标用户A所使用通信号码分别与其他用户B、C和D所使用通信号码之间的通信次数进行交际圈影响力预测,得到目标用户A最终的交往圈影响力指标数据。
进一步地,交往圈影响力模型如公式(2)所示;
Figure BDA0002354617390000051
其中,PR(X)表示用户使用通信号码产生的交往圈影响力指标数据,在实际应用场景中,可设置各PR(X)对应相同的初始值,根据公式(2)对目标用户A的PR(A)进行递归计算,得到更新后的PR(A);L(X)表示目标用户A所使用通信号码与其他用户X所使用通信号码之间的通信次数。
步骤S104,根据至少两种行为特征数据,对用户的通信号码进行分类,得到通信号码的识别类型。
在步骤S104中,基于用户所使用通信号码所产生的至少两种行为特征数据,对该通信号码进行分类,得到通信号码的识别类型,根据通信号码的识别类型,能够确定该通信号码是否异常,进而减少异常的通信号码被遗漏的概率,提高通信号码的识别准确率。
比如,根据用户使用通信号码所产生的基础行为特征数据和通信行为特征数据,对用户的通信号码的识别类型进行区分,得到通信号码的识别类型,根据通信号码的识别类型,确定该通信号码是否异常,能够减少异常的通信号码被遗漏的概率,提高通信号码的识别准确率。
或者,根据用户使用通信号码所产生的基础行为特征数据、通信行为特征数据、上网流量行为特征数据、消费行为特征数据、信用指标数据、交往圈影响力指标数据等多个行为特征数据,对用户的通信号码进行分类,得到通信号码的识别类型。其中,基于增加信用指标数据和交往圈影响力指标数据,能够更准确、快速地识别出通信号码的识别类型,提高通信号码的识别准确率。
可选地,在一些实施例中,通信号码的识别类型包括垃圾短信号码、养卡号码、欺诈通信号码、白名单号码。
可以理解的是,垃圾短信号码定义为每个月频繁发送短信,且通话行为少的通信号码;养卡号码定义为每个月主动通话行为少,且存在与固定的通信号码互相通话的通信号码;欺诈通信号码定义为通话过程中实施欺诈行为的通信号码;白名单号码定义为垃圾短信概率极低的通信号码。
基于识别类型包括垃圾短信号码、养卡号码、欺诈通信号码和白名单号,即通信号码的识别类型比较全面、多样化,有利于提高通信号码识别的准信率。
可选地,在另一些实施例中,图1所示的方法还包括:
采用BP神经网络,对已标注识别类型的用户使用通信号码所产生的行为特征数据进行学习,得到行为特征数据与通信号码的识别类型之间的映射关系,并形成相应的分类模型;
根据至少两种行为特征数据,对用户的通信号码进行分类,得到该通信号码的识别类型,包括:
将至少两种行为特征数据采用分类模型进行分类预测,得到该通信号码的识别类型。
在一些实施例中,比如,获取三个月内已标注识别类型的用户使用通信号码,已标注识别类型包括垃圾短信号码、养卡号码、欺诈通信号码、白名单号码;其中,垃圾短信号码是根据每个月发短信次数满足预设次数条件得到的,欺诈号码是根据工信部或者公安部门提供的名单确定的,养卡号码是根据每个月的通话情况以及交往圈数据确定的,白名单号码是根据与五星钻客户的通信号码之间的亲密度指数满足预设亲密度条件确定的。
获取已标注识别类型的用户使用通信号码所产生的多种行为特征数据,该多种行为特征数据行为特征数据包括基础行为特征数据、通信行为特征数据、上网流量行为特征数据和消费行为特征数据。
采用BP神经网络,对已标注识别类型的用户使用通信号码所产生的行为特征数据进行学习,得到行为特征数据与通信号码的识别类型之间的映射关系,并形成相应的分类模型。
或者,如图2所示,构建分类模型的方法的步骤如下:
步骤S202,选取当月用户所使用的通信号码作为分析样本,且将当月用户所使用的通信号码分为4个群体,分别是垃圾短信号码、欺诈号码、养卡号码、白名单号码。
步骤S204,获取4个群体所产生的多种行为特征数据,该多种行为特征数据包括基础行为特征数据、通信行为特征数据、上网流量行为特征数据、消费行为特征数据、信用指标数据和交往圈影响力指标数据。
步骤S206,采用BP神经网络,分别对4个群体所产生的多种行为特征数据进行学习,得到多种行为特征数据与4个群体之间的映射关系,并构建符合4个群体的分类模型。
具体地,BP神经网络实质上实现了一个从输入到输出的映射功能,它具有实现任何复杂非线性映射的功能,这使得它特别适合于求解内部机制复杂的问题,因此也非常适合用于这种复杂而且非线性的异常通信号码识别模型。
人工神经网络(Artificial Neural Networks,ANN),一种模范动物神经网络行为特征,进行分布式并行信息处理的数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经元是人工神经网络操作的基本信息单位,如图3所示,人工神经元将收集到已标注识别类型的通信号码所产生的X1至Xm个行为特征数据加权求和后作为u值输入激活函数,同时设置阈值b,计算输出y值,作为神经元的输出。
在神经元接收到y值后,会进行输入层,隐藏层和输出层的传递,然后根据输出误差进行权重wij(输入神经元i和输出神经元j)的修改。BP神经网络的学习方法是δ学习规则,误差函数E为输出向量Yk和期望值向量Tk的误差,该误差函数E如公式(3)所示:
Figure BDA0002354617390000081
具体地,如图4所示,该方法的具体步骤如下:
步骤S402,初始化,对BP神经网络的权值和人工神经网络的阈值赋予小的随机数,一般在[-1,1]。
步骤S404,将已标注识别类型的通信号码输入BP神经网络中,BP神经网络正向传播,得到中间层和输出层的值。
步骤S406,比较输出层的值与期望值的误差,用误差函数E来判断误差是否在预设范围内,若否,则执行步骤S408;若是,则执行步骤S412。
步骤S408,确定学习次数是否到达预设值,若到达,则执行步骤S412;若未到达,则执行步骤S410。
步骤S410,对中间层和输出层的权值和阈值进行更新,更新的方法为δ学习规则,得到更新后的中间层和输出层的权值和阈值,并打算对已标注识别类型的通信号码进行重新学习,执行步骤S404。
步骤S412,确定中间层和输出层的权值和阈值,即确定分类模型,学习结束。
利用BP神经网络方法构建分类模型,基于定义如下建模参数进行建模:
layer_neuron_num:各层神经元数目,这是生成神经网络需要的唯一参数,网络输入层神经元节点数就是系统的特征因子(自变量)个数。
weights:神经网络初始化之后需要用训练好的权值矩阵去初始化权值,一般初始化的做法是权值和阈值赋予小的随机数,取值在[-1,1]之间。
activation_function:使用神经网络的过程其实就是前向计算的过程,显然需要知道激活函数是什么,目前激活函数选取的范围包括域值函数(阶梯函数)、分段线性函数、非线性转移函数、Relu函数,本发明使用Relu函数,因为该激活函数能够大幅度提高分类模型的准确率。
learning_rate:如果要在现有分类模型的基础上继续训练以得到更好的分类模型,更新权值的时候需要用到权重函数,更新的方法为δ学习规则,该权重函数如公式(4)所示:
Δwij=ησiyj………………………公式(4)
其中,η为学习率,这里取值为0.01。
nb_epoch:迭代次数,这里取1000次。
可选地,在另一些实施例中,图1所示的方法还包括:
基于通信号码的识别类型,对使用通信号码的用户执行停机、关闭通信号码、警告、不处理中的至少一种业务操作。
在一些实施例中,根据通信号码的识别类型,对使用该通信号码的用户执行相应的业务操作,能够减少异常通信行为,保障用户正常地使用网络资源,提高用户体验。
具体地,若通信号码的识别类型包括白名单号码,则使用该通信号码的用户不执行任何处理的业务操作。
若通信号码的识别类型包括垃圾短信号码、养卡号码、欺诈通信号码中的一种,则可以对使用该通信号码的用户执行停机、警告以及关闭该通信号码中的至少一种业务操作。停机操作如停机一个月;关闭通信号码操作如在一个月内该通信号码发不了短信,也打通不了电话;警告操作如以短信方式警告该通信号码的用户。
在本发明实施例中,获取用户使用通信号码所产生的至少两种行为特征数据,根据至少两种行为特征数据,对通信号码进行分类,得到通信号码的识别类型,根据通信号码的识别类型,能够确定通信号码是否异常,进而减少异常的通信号码被遗漏的概率,提高通信号码的识别准确率。
图5是本发明的一个实施例的通信号码的识别装置的结构示意图,图5所示的装置50包括:
获取模块51,用于获取用户使用通信号码所产生的至少两种行为特征数据;
分类模块52,用于根据至少两种行为特征数据,对用户的通信号码进行分类,得到通信号码的识别类型。
在本发明实施例中,获取用户使用通信号码所产生的至少两种行为特征数据,根据至少两种行为特征数据,对通信号码进行分类,得到通信号码的识别类型,根据通信号码的识别类型,能够确定通信号码是否异常,进而减少异常的通信号码被遗漏的概率,提高通信号码的识别准确率。
可选地,作为一个实施例,上述至少两种行为特征数据包括:用于评价用户信用度的信用指标数据和/或用于评价用户交往能力的交往圈影响力指标数据。
可选地,作为一个实施例,该装置50还包括:
获取模块51,还用于获取用户使用通信号码过程中的身份信息、通信消费信息、信用历史信息、行为偏好信息、人脉关系信息中的至少一种信用指标信息;
评价模块,用于根据所获取的信用指标信息对用户的信用度进行评价,得到用户的信用指标数据。
可选地,作为一个实施例,该装置50还包括:
获取模块51,还用于获取目标用户使用通信号码过程中与其他用户所使用通信号码之间的通信次数;
确定模块,用于根据其他用户的交往圈影响力指标数据,以及其他用户与目标用户的通信次数,得到目标用户的交往圈影响力指标数据。
可选地,作为一个实施例,该装置50还包括:
学习模块,用于采用BP神经网络,对已标注识别类型的用户使用通信号码所产生的行为特征数据进行学习,得到行为特征数据与通信号码的识别类型之间的映射关系,并形成相应的分类模型;
上述分类模块52,包括:
将至少两种行为特征数据采用分类模型进行分类预测,得到该通信号码的识别类型。
可选地,作为一个实施例,通信号码的识别类型包括垃圾短信号码、养卡号码、欺诈通信号码、白名单号码。
可选地,作为一个实施例,该装置50还包括:
执行模块,用于基于通信号码的识别类型,对使用通信号码的用户执行停机、关闭通信号码、警告、不处理中的至少一种业务操作。
本发明实施例提供的装置50能够实现图1至图4的方法实施例中实现的各个过程,为避免重复,这里不再赘述。
下面将结合图6详细描述根据本申请一个实施例的电子设备。参考图6,在硬件层面,电子设备包括处理器,可选地,包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外设部件互连标准(Peripheral Component Interconnect,PCI)总线或扩展工业标准结构(ExtendedIndustry Standard Architecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成通信号码的识别装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取用户使用通信号码所产生的至少两种行为特征数据;
根据至少两种行为特征数据,对用户的通信号码进行分类,得到通信号码的识别类型。
在本发明实施例中,获取用户使用通信号码所产生的至少两种行为特征数据,根据至少两种行为特征数据,对通信号码进行分类,得到通信号码的识别类型,根据通信号码的识别类型,能够确定通信号码是否异常,进而减少异常的通信号码被遗漏的概率,提高通信号码的识别准确率。
上述如本申请图1所示实施例揭示的通信号码的识别装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random ACGess Memory,简称RAM)、磁碟或者光盘等。
本发明实施例提供一种计算机可读存储介质,获取用户使用通信号码所产生的至少两种行为特征数据;根据至少两种行为特征数据,对用户的通信号码进行分类,得到通信号码的识别类型。
在本发明实施例中,获取用户使用通信号码所产生的至少两种行为特征数据,根据至少两种行为特征数据,对通信号码进行分类,得到通信号码的识别类型,根据通信号码的识别类型,能够确定通信号码是否异常,进而减少异常的通信号码被遗漏的概率,提高通信号码的识别准确率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的定界,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种通信号码的识别方法,其特征在于,所述方法包括:
获取用户使用通信号码所产生的至少两种行为特征数据;
根据所述至少两种行为特征数据,对所述用户的通信号码进行分类,得到所述通信号码的识别类型。
2.如权利要求1所述的方法,其特征在于,所述至少两种行为特征数据包括:用于评价用户信用度的信用指标数据和/或用于评价用户交往能力的交往圈影响力指标数据。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
获取用户使用通信号码过程中的身份信息、通信消费信息、信用历史信息、行为偏好信息、人脉关系信息中的至少一种信用指标信息;
根据所获取的所述信用指标信息对所述用户的信用度进行评价,得到所述用户的信用指标数据。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
获取目标用户使用通信号码过程中与其他用户所使用通信号码之间的通信次数;
根据所述其他用户的交往圈影响力指标数据,以及所述其他用户与所述目标用户的通信次数,得到所述目标用户的交往圈影响力指标数据。
5.如权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
采用BP神经网络,对已标注识别类型的用户使用通信号码所产生的行为特征数据进行学习,得到行为特征数据与通信号码的识别类型之间的映射关系,并形成相应的分类模型;
所述根据所述至少两种行为特征数据,对所述用户的通信号码进行分类,得到所述通信号码的识别类型,包括:
将所述至少两种行为特征数据采用所述分类模型进行分类预测,得到所述通信号码的识别类型。
6.如权利要求1至4任一项所述的方法,其特征在于,所述识别类型包括垃圾短信号码、养卡号码、欺诈通信号码、白名单号码。
7.如权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
基于所述通信号码的识别类型,对使用所述通信号码的用户执行停机、关闭通信号码、警告、不处理中的至少一种业务操作。
8.一种通信号码的识别装置,其特征在于,所述装置包括:
获取模块,用于获取用户使用通信号码所产生的至少两种行为特征数据;
分类模块,用于根据所述至少两种行为特征数据,对所述用户的通信号码进行分类,得到所述通信号码的识别类型。
9.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述通信号码的识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的通信号码的识别方法的步骤。
CN202010004192.9A 2020-01-03 2020-01-03 通信号码的识别方法、装置和电子设备 Pending CN113076776A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010004192.9A CN113076776A (zh) 2020-01-03 2020-01-03 通信号码的识别方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010004192.9A CN113076776A (zh) 2020-01-03 2020-01-03 通信号码的识别方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN113076776A true CN113076776A (zh) 2021-07-06

Family

ID=76608599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010004192.9A Pending CN113076776A (zh) 2020-01-03 2020-01-03 通信号码的识别方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN113076776A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114449106A (zh) * 2022-02-10 2022-05-06 恒安嘉新(北京)科技股份公司 一种异常电话号码的识别方法、装置、设备和存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6029062A (en) * 1997-02-04 2000-02-22 National Telemanagement Corporation Prepay telecommunications system with unregistered roaming call processing
US20090305673A1 (en) * 2008-06-06 2009-12-10 Ebay, Inc. Secure short message service (sms) communications
WO2011026121A2 (en) * 2009-08-31 2011-03-03 Connectiva Systems Systems, methods, and computer program products for user identification in communication networks
US20150106265A1 (en) * 2013-10-11 2015-04-16 Telesign Corporation System and methods for processing a communication number for fraud prevention
CN105869035A (zh) * 2016-04-07 2016-08-17 中国联合网络通信集团有限公司 一种移动用户信用评估方法及装置
CN106604281A (zh) * 2015-10-20 2017-04-26 阿里巴巴集团控股有限公司 一种确定手机号码稳定性的方法及设备
CN108924333A (zh) * 2018-06-12 2018-11-30 阿里巴巴集团控股有限公司 诈骗电话识别方法、装置和系统
CN109429230A (zh) * 2017-08-28 2019-03-05 中国移动通信集团浙江有限公司 一种通信诈骗识别方法及系统
CN109640312A (zh) * 2018-11-21 2019-04-16 上海观安信息技术股份有限公司 “黑卡”识别方法、电子设备及计算机程序产品
CN109995924A (zh) * 2017-12-30 2019-07-09 中国移动通信集团贵州有限公司 欺诈电话识别方法、装置、设备及介质
CN110401780A (zh) * 2018-04-25 2019-11-01 中国移动通信集团广东有限公司 一种识别诈骗电话的方法及装置
CN110493477A (zh) * 2019-09-12 2019-11-22 中国联合网络通信集团有限公司 诈骗号码识别方法、装置、设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6029062A (en) * 1997-02-04 2000-02-22 National Telemanagement Corporation Prepay telecommunications system with unregistered roaming call processing
US20090305673A1 (en) * 2008-06-06 2009-12-10 Ebay, Inc. Secure short message service (sms) communications
WO2011026121A2 (en) * 2009-08-31 2011-03-03 Connectiva Systems Systems, methods, and computer program products for user identification in communication networks
US20150106265A1 (en) * 2013-10-11 2015-04-16 Telesign Corporation System and methods for processing a communication number for fraud prevention
CN106604281A (zh) * 2015-10-20 2017-04-26 阿里巴巴集团控股有限公司 一种确定手机号码稳定性的方法及设备
CN105869035A (zh) * 2016-04-07 2016-08-17 中国联合网络通信集团有限公司 一种移动用户信用评估方法及装置
CN109429230A (zh) * 2017-08-28 2019-03-05 中国移动通信集团浙江有限公司 一种通信诈骗识别方法及系统
CN109995924A (zh) * 2017-12-30 2019-07-09 中国移动通信集团贵州有限公司 欺诈电话识别方法、装置、设备及介质
CN110401780A (zh) * 2018-04-25 2019-11-01 中国移动通信集团广东有限公司 一种识别诈骗电话的方法及装置
CN108924333A (zh) * 2018-06-12 2018-11-30 阿里巴巴集团控股有限公司 诈骗电话识别方法、装置和系统
CN109640312A (zh) * 2018-11-21 2019-04-16 上海观安信息技术股份有限公司 “黑卡”识别方法、电子设备及计算机程序产品
CN110493477A (zh) * 2019-09-12 2019-11-22 中国联合网络通信集团有限公司 诈骗号码识别方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘鲲鹏等: "基于大数据算法的电话号码与客户编号对应关系的识别研究与实现", 《计算机应用与软件》, vol. 36, no. 3, pages 301 - 307 *
郭育辰: "基于话单大数据的诈骗电话识别与响应模型研究", 《中国优秀硕士学位论文全文数据库社会科学Ⅰ辑》, no. 4, pages 113 - 26 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114449106A (zh) * 2022-02-10 2022-05-06 恒安嘉新(北京)科技股份公司 一种异常电话号码的识别方法、装置、设备和存储介质
CN114449106B (zh) * 2022-02-10 2024-04-30 恒安嘉新(北京)科技股份公司 一种异常电话号码的识别方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN110278175B (zh) 图结构模型训练、垃圾账户识别方法、装置以及设备
CN109936525B (zh) 一种基于图结构模型的异常账号防控方法、装置以及设备
CN110033314B (zh) 广告数据处理方法及装置
CN109063966B (zh) 风险账户的识别方法和装置
CN112950231A (zh) 一种基于XGBoost算法的异常用户识别方法、设备及计算机可读存储介质
CN107862053A (zh) 基于用户关系的用户画像构造方法、装置及计算设备
CN111818093A (zh) 用于进行风险评估的神经网络系统、方法及装置
CN114548300B (zh) 解释业务处理模型的业务处理结果的方法和装置
CN111951008A (zh) 一种风险预测方法、装置、电子设备和可读存储介质
CN113076776A (zh) 通信号码的识别方法、装置和电子设备
CN115641201B (zh) 数据异常检测方法、系统、终端设备及存储介质
CN108764489B (zh) 基于虚拟样本的模型训练方法及设备
CN113256422B (zh) 分仓账户识别方法、装置、计算机设备和存储介质
CN113657635B (zh) 一种预测通信用户流失的方法及电子设备
CN112905987B (zh) 账号识别方法、装置、服务器及存储介质
CN113284027A (zh) 团伙识别模型的训练方法、异常团伙识别方法及装置
CN117033745B (zh) 一种作弊对象识别方法、系统、设备和存储介质
CN114268939B (zh) 一种移动通信中异常用户识别的方法及智能设备
CN112131607B (zh) 资源数据处理方法、装置、计算机设备和存储介质
US11256826B2 (en) Method and system for generating consent recommendation
CN117648638A (zh) 监测策略的确定方法、装置以及电子设备
CN116980379A (zh) 红点消息推送方法及相关装置
CN118096229A (zh) 客户资源确定方法、模型训练方法、电子设备及存储介质
CN117391490A (zh) 金融业务的评价信息处理方法、装置和计算机设备
CN114626889A (zh) 对象数量预估方法、装置、存储介质、设备及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination