CN113194458B - 多卡宝号码识别方法、装置 - Google Patents

多卡宝号码识别方法、装置 Download PDF

Info

Publication number
CN113194458B
CN113194458B CN202110377236.7A CN202110377236A CN113194458B CN 113194458 B CN113194458 B CN 113194458B CN 202110377236 A CN202110377236 A CN 202110377236A CN 113194458 B CN113194458 B CN 113194458B
Authority
CN
China
Prior art keywords
sample
feature
card
time sequence
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110377236.7A
Other languages
English (en)
Other versions
CN113194458A (zh
Inventor
王子斌
鹿林
龚鸥波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING SINOVATIO TECHNOLOGY CO LTD
Original Assignee
NANJING SINOVATIO TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING SINOVATIO TECHNOLOGY CO LTD filed Critical NANJING SINOVATIO TECHNOLOGY CO LTD
Priority to CN202110377236.7A priority Critical patent/CN113194458B/zh
Publication of CN113194458A publication Critical patent/CN113194458A/zh
Application granted granted Critical
Publication of CN113194458B publication Critical patent/CN113194458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/22Processing or transfer of terminal data, e.g. status or physical capabilities
    • H04W8/24Transfer of terminal data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls

Abstract

本发明公开了一种多卡宝号码识别方法、装置,所述方法包括:获取样本中每个样本号码取样周期内的短期时序特征和长期时序特征;将短期时序特征和长期时序特征进行拼接获得相应的特征矩阵;将存在通联关系的样本号码特征矩阵输入图注意力网络,输入号码的特征更新为与输入号码通联的号码特征的加权和;将样本号码的特征输入transformer模型,将号码所有日期的特征进行融合后输出,再经过全连接层输出结果,确定样本号码是否为多卡宝号码。采用上述技术方案,可以准确、快速地识别号码是否为多卡宝号码。

Description

多卡宝号码识别方法、装置
技术领域
本发明涉及通信领域,尤其涉及一种多卡宝号码识别方法、装置。
背景技术
多卡宝(Simbox)是一种多卡多待的外部扩展设备。用户可以将多张手机卡插入到一台多卡宝中,使用时通过手机App连接多卡宝,则可以使用手机拨打电话、发送信息和接听电话等,通过一部手机同时操作多个电话卡。
多卡宝的设计初衷是好的,但是在实际使用中,多卡宝经常被不法分子用作是诈骗的工具,包括将境外通话转化为境内通话,导致运营商通信营收减少,一人同时向多人拨打电话和发送短信等。
因此,如何从众多号码中识别多卡宝号码成为了预防违法行为的重要途径,现有技术中还没有成熟的技术方案可以实现多卡宝号码的识别。
发明内容
发明目的:本发明提供一种多卡宝号码识别方法、装置,旨在基于样本号码的特征和通联关系,通过图注意力网络和transformer模型判断号码是否为多卡宝号码。
技术方案:本发明提供一种多卡宝号码识别方法,包括:获取样本中每个样本号码取样周期内的特征,其中特征包括与通信时间和次数有关的短期时序特征,以及与设备和地区有关的长期时序特征;将短期时序特征和长期时序特征进行拼接获得相应的特征矩阵;将存在通联关系的样本号码特征矩阵输入图注意力网络,输入号码的特征更新为与输入号码通联的号码特征的加权和;其中通联关系指多个样本号码与同一号码存在通信关系;将样本号码的特征输入transformer模型,将号码所有日期的特征进行融合后输出,再经过全连接层输出结果,确定样本号码是否为多卡宝号码。
具体的,将长期时序特征按照取样周期内短期时序的数量进行复制,与短期时序特征拼接。
具体的,采用以下公式计算更新后的号码i的特征hi':
hi'=σ(∑i,j∈gaijWhj),
其中,aij=softmax(eij),
Figure BDA0003011599570000021
hi和hj分别为样本号码i和j的特征矩阵,样本号码i和j之间存在通联关系,g表示存在通联关系的号码,σ表示sigmoid函数,W表示训练参数。
具体的,采用以下公式计算特征融合后的输出fi':
fi'=∑j=1,2,3,4,5,6,7bijW'fj
其中,
Figure BDA0003011599570000022
W'表示训练参数,fi表示样本号码第i天的特征。
具体的,全连接层输出1×1的结果,若结果不小于0,则判断对应的样本号码是多卡宝号码;若结果小于0,则判断对应的样本号码不是多卡宝号码。
本发明还提供一种多卡宝号码识别装置,包括:特征获取单元、特征合并单元、特征加权单元、特征融合单元和结果判断单元,其中:
所述特征获取单元,用于获取样本中每个样本号码取样周期内的特征,其中特征包括与通信时间和次数有关的短期时序特征,以及与设备和地区有关的长期时序特征;
所述特征合并单元,用于将短期时序特征和长期时序特征进行拼接获得相应的特征矩阵;
所述特征加权单元,用于将存在通联关系的样本号码特征矩阵输入图注意力网络,输入号码的特征更新为与输入号码通联的号码特征的加权和;其中通联关系指多个样本号码与同一号码存在通信关系;
所述特征融合单元,用于将样本号码的特征输入transformer模型,将号码所有日期的特征进行融合后输出;
所述结果判断单元,用于将融合后的输出输入全连接层,根据输出结果确定样本号码是否为多卡宝号码。
具体的,所述特征合并单元,用于将长期时序特征按照取样周期内短期时序的数量进行复制,与短期时序特征拼接。
具体的,所述特征加权单元,用于采用以下公式计算更新后的号码i的特征hi':
hi'=σ(∑i,j∈gaijWhj),
其中,aij=softmax(eij),
Figure BDA0003011599570000031
hi和hj分别为样本号码i和j的特征矩阵,样本号码i和j之间存在通联关系,g表示存在通联关系的号码,σ表示sigmoid函数,W表示训练参数。
具体的,所述特征融合单元,用于采用以下公式计算特征融合后的输出fi':
fi'=∑j=1,2,3,4,5,6,7bijW'fj
其中,
Figure BDA0003011599570000032
W'表示训练参数,fi表示样本号码第i天的特征。
具体的,所述结果判断单元,用于全连接层输出1×1的结果,若结果不小于0,则判断对应的样本号码是多卡宝号码;若结果小于0,则判断对应的样本号码不是多卡宝号码。
有益效果:与现有技术相比,本发明具有如下显著优点:准确、快速地识别号码是否为多卡宝号码。
附图说明
图1为本发明提供的多卡宝号码识别方法的流程示意图;
图2为本发明提供的图注意力网络的结构示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
参阅图1,其为本发明提供的多卡宝号码识别方法的流程示意图。
步骤1,获取样本中每个样本号码取样周期内的特征。
本发明实施例中,其中特征包括与通信时间和次数有关的短期时序特征,以及与设备和地区有关的长期时序特征
在具体实施中,通过对多卡宝设备原理的研究,以及对多卡宝号码的特征挖掘,发现多卡宝号码具有以下区别普通号码的特征:(1)Simbox号码本身可能几乎不发短信,也有可能为了误导检测商发一些短信;(2)Simbox号码作为被叫的次数远远小于作为主叫的次数,即更多用来拨出,较少用来接听;(3)普通号码一般呼叫中心在工作时间,呼出比较多,而Simbox号码的呼叫在24小时内分布比较均匀;(4)Simbox拨打的号码分布范围会比较广,平均与每个拨打号码的通话次数很少;(5)Simbox号码的通话时长分布与普通号码不同,普通号码的通话大部分时间为30~60s,小部分通话会出现较长时间,即平均时长较短、方差较大,而simbox号码的通话时长波动剧烈,几乎会有一半通话在5s内挂断,另外一半通话时长往往在20min以上;(6)Simbox号码会在较长的一段时间内停留在某个地区,而普通号码的地区移动较为频繁;(7)普通用户的号码一般只对应1个IMEI(手机序列号),即使是更换手持设备,那么也只是偶尔为之,Simbox为了误导检测系统,有可能会将一个号码用在多个IMEI上;(8)普通号码的每天接打次数分布较为均匀,但simbox号码可能在很长的一段时间内没有接打,某天开始突然有上百通电话;(9)一个被simbox拨打过的号码很有可能在当天被另一个simbox号码拨打。
通过对上述特征进行整理,主要可将特征归为如下3类:
1.号码一天内的统计特征:指第(1)~(5)条特征,该类特征为号码可以以天为周期进行统计的特征,包括当天的主叫次数、被叫次数、发短信次数、收短信次数、通话时长分布、通话时间分布等;
2.号码一段时间内的统计特征:指第6~8条特征,该类特征为号码必须以一段时间,如周、月等为周期进行统计的特征,包括一段时间内号码出现的地区数量、关联的IMEI数量、每天通信特征(指第1类特征)的波动情况等;
3.号码之间的通联特征:指第9条特征,该类特征为号码之间的关联信息,需要考虑号码间的通信情况;
根据以上分类,统计样本号码的每日时序特征,共总结了42条每日时序特征,具体如下所示:
Figure BDA0003011599570000041
Figure BDA0003011599570000051
Figure BDA0003011599570000061
以上表格中所示,即为短期时序特征(短期可以为一日也可以为其他周期)。设定取样周期为一周,则每个样本号码有7×42的短期时序特征。
在具体实施中,短期时序特征主要是涉及接收发送短信(包括在特定时间段的次数)、呼叫接听电话(包括在特定时间段的次数,时长等)等,与通信时间和次数有关。
统计样本号码的周期时序特征,共总结了3条周期时序特征,具体如下所示:
序号 特征字段 特征释义
1 c_num_imei 号码周期内关联的imei总数
2 c_num_imsi 号码周期内关联的imsi总数
3 c_num_area 号码周期内出现的不同地区总数
以上表格中所示,即为长期时序特征(长期可以为一周也可以为其他周期)。设定取样周期为一周,则每个样本号码有1×3的长期时序特征。
在具体实施中,国际移动设备识别码(International Mobile EquipmentIdentity,IMEI),国际移动用户识别码(英语:IMSI,International Mobile SubscriberIdentity)。长期时序特征与号码关联的设备,号码出现的地区有关。
步骤2,将短期时序特征和长期时序特征进行拼接获得相应的特征矩阵。
本发明实施例中,将长期时序特征按照取样周期内短期时序的数量进行复制,与短期时序特征拼接(长期时序与取样周期的时间长度相等)。
在具体实施中,将1×3的长期时序特征复制7次,扩展为7×3,而后与7×42的短期时序特征进行拼接,生成7×45的特征矩阵。
本发明实施例中,通联关系指多个样本号码与同一号码存在通信关系。
在具体实施中,为了捕捉号码的通联关系特征,需要先将话单整合为通联关系图。例如,当号码A、号码B在同一天内打给了号码C,则在通联关系图中建立“号码A-号码B”这一无向关系,根据完整通联关系图可以得到通联矩阵(也叫邻接矩阵),即假定共有N个号码,根据每个号码与其他所有号码是否存在通联关系,可以生成N*N的矩阵,其中若第i个号码与第j个号码存在通联关系,则(i,j)=1,否则(i,j)=0。
步骤3,将存在通联关系的样本号码特征矩阵输入图注意力网络,输入号码的特征更新为与输入号码通联的号码特征的加权和。
参阅图2,其为本发明提供的图注意力网络的结构示意图,其中h1’表示h1经过计算后的加权和,a11表示h1与其自身进行权重计算,h2表示与h1存在通联关系的号码,a12表示h2和h1进行权重计算,h3表示与h1存在通联关系的号码,a13表示h3和h1进行权重计算,h4表示与h1存在通联关系的号码,a14表示h4和h1进行权重计算,h5表示与h1存在通联关系的号码,a15表示h5和h1进行权重计算。
在具体实施中,图注意力网络(Graph Attention Network)是一种基于attention进行节点分类的网络,基本思想是通过每一个节点在邻近节点的attention值来更新节点表示。
在具体实施中,采用图注意力网络,可以将其他具有通联关系的样本号码的特征信息融合至待识别的样本号码,样本号码特征可以反映更多的关联号码的信息,提升识别结果的准确性。
在具体实施中,每次输入图注意力网络的是单个样本号码,该样本号码是与样本中其他样本号码存在通联关系的。输入号码即是输入图注意力网络的单个样本号码,特征是指该样本号码的特征矩阵。
本发明实施例中,采用以下公式计算更新后的号码i的特征hi':
hi'=σ(∑i,j∈gaijWhj),
其中,aij=softmax(eij),
Figure BDA0003011599570000071
hi和hj分别为样本号码i和j的特征矩阵,样本号码i和j之间存在通联关系,g表示存在通联关系的号码,σ表示sigmoid函数,W表示训练参数。
在具体实施中,为了降低训练参数的数量,对eij采用了向量相似度的计算方式,提升识别过程的效率,降低计算量。
在具体实施中,图注意力网络的输入为样本号码的特征矩阵和通联矩阵(只对存在通联关系的样本号码进行计算,也即(i,j)=1),输出为样本号码的新特征矩阵,矩阵依然保持7*45(也即保持与输入一致)。
步骤4,将样本号码的特征输入transformer模型,将号码所有日期的特征进行融合后输出。
在具体实施中,transformer模型核心为self-attention结构,即序列中所有元素都与其他任一元素进行一次权重计算,输出结果为所有元素的加权和。本发明中样本号码的特征矩阵中,可以将每一天的特征向量视作为一个元素,即每个号码的特征矩阵有7个元素,每个元素为1*45的特征向量(在短期时序周期为一天,长期时序周期为一周的情况下)。
本发明实施例中,采用以下公式计算特征融合后的输出fi':
fi'=∑j=1,2,3,4,5,6,7bijW'fj
其中,
Figure BDA0003011599570000081
W'表示训练参数,fi表示样本号码第i天的特征。
在具体实施中,fi'表示与其余所有天的特征向量进行融合后的第i天的特征向量,步骤4最终融合后的输出是transformer模型的输出,是多个fi'进行组合得到的7×45的特征矩阵。
在具体实施中,由于长期时序周期为一周,短期时序周期为一天,每天对应的元素为1×45特征向量,因此j的取值范围为1~7,即fj对应号码特征矩阵中1~7天的特征向量,transformer模型的输出为融合所有日期特征后组成的新特征矩阵,矩阵依然保持7×45。在取样周期、长期时序周期和短期时序周期为其他时间长度,每个元素的特征向量、特征矩阵大小、j的取值范围和fi中i所对应的时间段均会产生相应改变。
本发明实施例中,融合所有日期特征后新的特征矩阵,再经过全连接层输出结果,确定样本号码是否为多卡宝号码。
本发明实施例中,全连接层输出1×1的结果,若结果不小于0,则判断对应的样本号码是多卡宝号码;若结果小于0,则判断对应的样本号码不是多卡宝号码。
在具体实施中,将7×45特征矩阵重新拼接为1×315的中间层结果,然后再经过一层[315,1]的全连接层,最终输出1×1的结果。
在具体实施中,本发明提供一种GAT+Transformer双层attention的多卡宝号码识别方案,其中基于优化后的GAT模型捕捉号码的通联特征,transformer模型捕捉号码的时序特征,基于双层attention算法可以挖掘样本号码的深度特征,最终实现准确、快速地号码识别。
在具体实施中,针对不同数据量,可以建立两个模型版本,完整版与轻量版。其中,完整版模型会将全部通联关系图加载入内存,其特点是速度快、理论效果好、内存占用高、每次内存占用取决于当天数据量。轻量版模型会将通联关系图分批次加载入内存,其特点是速度慢、理论效果比完整版模型差、内存占用低、每次运行内存固定占用6g左右。两版模型的建模方案基本相同。
在具体实施中,根据一周的测试数据量显示,完整版模型的平均单日计算时间为12分钟,而轻量版模型的平均单日计算时间为165分钟;完整版模型的平均单日多卡宝号码的发现数量为轻量版模型的1.5倍左右。
在具体实施中,为证明本发明技术方案的有效性,分别建立如下两个对比模型作为参照:
(1)将GAT去除,即仅对7×45特征矩阵进行transformer计算后,通过神经网络(全连接层)进行分类;
(2)将GAT与Transformer都去除,即7×45特征矩阵直接通过神经网络(全连接层)进行分类;
最终通过人工拨测验证,三种模型的效果如下所示:
每日平均发现simbox号码数量 平均正确率
GAT+Transformer 64.1 97.5%
Transformer 15.52 91.2%
神经网络 11.45 73.0%
由此表明,本发明技术方案的识别结果的准确性。
本发明还提供一种多卡宝号码识别装置,包括:特征获取单元、特征合并单元、特征加权单元、特征融合单元和结果判断单元,其中:
所述特征获取单元,用于获取样本中每个样本号码取样周期内的特征,其中特征包括与通信时间和次数有关的短期时序特征,以及与设备和地区有关的长期时序特征;
所述特征合并单元,用于将短期时序特征和长期时序特征进行拼接获得相应的特征矩阵;
所述特征加权单元,用于将存在通联关系的样本号码特征矩阵输入图注意力网络,输入号码的特征更新为与输入号码通联的号码特征的加权和;其中通联关系指多个样本号码与同一号码存在通信关系;
所述特征融合单元,用于将样本号码的特征输入transformer模型,将号码所有日期的特征进行融合后输出;
所述结果判断单元,用于将融合后的输出输入全连接层,根据输出结果确定样本号码是否为多卡宝号码。
本发明实施例中,所述特征合并单元,用于将长期时序特征按照取样周期内短期时序的数量进行复制,与短期时序特征拼接。
本发明实施例中,所述特征加权单元,用于采用以下公式计算更新后的号码i的特征hi':
hi'=σ(∑i,j∈gaijWhj),
其中,aij=softmax(eij),
Figure BDA0003011599570000101
hi和hj分别为样本号码i和j的特征矩阵,样本号码i和j之间存在通联关系,g表示存在通联关系的号码,σ表示sigmoid函数,W表示训练参数。
本发明实施例中,所述特征融合单元,用于采用以下公式计算特征融合后的输出fi':
fi'=∑j=1,2,3,4,5,6,7bijW'fj
其中,
Figure BDA0003011599570000102
W'表示训练参数,fi表示样本号码第i天的特征。
本发明实施例中,所述结果判断单元,用于全连接层输出1×1的结果,若结果不小于0,则判断对应的样本号码是多卡宝号码;若结果小于0,则判断对应的样本号码不是多卡宝号码。

Claims (10)

1.一种多卡宝号码识别方法,其特征在于,包括:
获取样本中每个样本号码取样周期内的特征,其中特征包括与通信时间和次数有关的短期时序特征,以及与设备和地区有关的长期时序特征;
将短期时序特征和长期时序特征进行拼接获得相应的特征矩阵;
将存在通联关系的样本号码特征矩阵输入图注意力网络,输入号码的特征更新为与输入号码通联的号码特征的加权和;其中通联关系指多个样本号码与同一号码存在通信关系;
将样本号码的特征输入transformer模型,将号码所有日期的特征进行融合后输出,再经过全连接层输出结果,确定样本号码是否为多卡宝号码。
2.根据权利要求1所述的多卡宝号码识别方法,其特征在于,所述将短期时序特征和长期时序特征进行拼接获得相应的特征矩阵,包括:
将长期时序特征按照取样周期内短期时序的数量进行复制,与短期时序特征拼接。
3.根据权利要求2所述的多卡宝号码识别方法,其特征在于,所述输入号码的特征更新为与输入号码通联的号码特征的加权和,包括:
采用以下公式计算更新后的号码i的特征hi':
hi'=σ(∑i,j∈gaijWhj),
其中,aij=softmax(eij),
Figure FDA0003011599560000011
hi和hj分别为样本号码i和j的特征矩阵,样本号码i和j之间存在通联关系,g表示存在通联关系的号码,σ表示sigmoid函数,W表示训练参数。
4.根据权利要求3所述的多卡宝号码识别方法,其特征在于,所述将号码所有日期的特征进行融合后输出,包括:
采用以下公式计算特征融合后的输出fi’:
fi'=∑j=1,2,3,4,5,6,7bijW'fj
其中,
Figure FDA0003011599560000012
W'表示训练参数,fi表示样本号码第i天的特征。
5.根据权利要求4所述的多卡宝号码识别方法,其特征在于,所述再经过全连接层输出结果,确定样本号码是否为多卡宝号码,包括:
全连接层输出1×1的结果,若结果不小于0,则判断对应的样本号码是多卡宝号码;若结果小于0,则判断对应的样本号码不是多卡宝号码。
6.一种多卡宝号码识别装置,其特征在于,包括:特征获取单元、特征合并单元、特征加权单元、特征融合单元和结果判断单元,其中:
所述特征获取单元,用于获取样本中每个样本号码取样周期内的特征,其中特征包括与通信时间和次数有关的短期时序特征,以及与设备和地区有关的长期时序特征;
所述特征合并单元,用于将短期时序特征和长期时序特征进行拼接获得相应的特征矩阵;
所述特征加权单元,用于将存在通联关系的样本号码特征矩阵输入图注意力网络,输入号码的特征更新为与输入号码通联的号码特征的加权和;其中通联关系指多个样本号码与同一号码存在通信关系;
所述特征融合单元,用于将样本号码的特征输入transformer模型,将号码所有日期的特征进行融合后输出;
所述结果判断单元,用于将融合后的输出输入全连接层,根据输出结果确定样本号码是否为多卡宝号码。
7.根据权利要求6所述的多卡宝号码识别装置,其特征在于,所述特征合并单元,用于将长期时序特征按照取样周期内短期时序的数量进行复制,与短期时序特征拼接。
8.根据权利要求7所述的多卡宝号码识别装置,其特征在于,所述特征加权单元,用于采用以下公式计算更新后的号码i的特征hi':
hi'=σ(∑i,j∈gaijWhj),
其中,aij=softmax(eij),
Figure FDA0003011599560000021
hi和hj分别为样本号码i和j的特征矩阵,样本号码i和j之间存在通联关系,g表示存在通联关系的号码,σ表示sigmoid函数,W表示训练参数。
9.根据权利要求8所述的多卡宝号码识别装置,其特征在于,所述特征融合单元,用于采用以下公式计算特征融合后的输出fi':
fi'=∑j=1,2,3,4,5,6,7bijW'fj
其中,
Figure FDA0003011599560000031
W'表示训练参数,fi表示样本号码第i天的特征。
10.根据权利要求9所述的多卡宝号码识别装置,其特征在于,所述结果判断单元,用于全连接层输出1×1的结果,若结果不小于0,则判断对应的样本号码是多卡宝号码;若结果小于0,则判断对应的样本号码不是多卡宝号码。
CN202110377236.7A 2021-04-08 2021-04-08 多卡宝号码识别方法、装置 Active CN113194458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110377236.7A CN113194458B (zh) 2021-04-08 2021-04-08 多卡宝号码识别方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110377236.7A CN113194458B (zh) 2021-04-08 2021-04-08 多卡宝号码识别方法、装置

Publications (2)

Publication Number Publication Date
CN113194458A CN113194458A (zh) 2021-07-30
CN113194458B true CN113194458B (zh) 2022-05-13

Family

ID=76975087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110377236.7A Active CN113194458B (zh) 2021-04-08 2021-04-08 多卡宝号码识别方法、装置

Country Status (1)

Country Link
CN (1) CN113194458B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114189866A (zh) * 2021-11-09 2022-03-15 武汉绿色网络信息服务有限责任公司 一种多卡宝的欺诈检测方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222025A (zh) * 2019-12-27 2020-06-02 南京中新赛克科技有限责任公司 一种基于卷积神经网络的诈骗号码识别方法及系统
CN111726460A (zh) * 2020-06-15 2020-09-29 国家计算机网络与信息安全管理中心 一种基于时空图的诈骗号码识别方法
WO2021022521A1 (zh) * 2019-08-07 2021-02-11 华为技术有限公司 数据处理的方法、训练神经网络模型的方法及设备
CN112560432A (zh) * 2020-12-11 2021-03-26 中南大学 基于图注意力网络的文本情感分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021022521A1 (zh) * 2019-08-07 2021-02-11 华为技术有限公司 数据处理的方法、训练神经网络模型的方法及设备
CN111222025A (zh) * 2019-12-27 2020-06-02 南京中新赛克科技有限责任公司 一种基于卷积神经网络的诈骗号码识别方法及系统
CN111726460A (zh) * 2020-06-15 2020-09-29 国家计算机网络与信息安全管理中心 一种基于时空图的诈骗号码识别方法
CN112560432A (zh) * 2020-12-11 2021-03-26 中南大学 基于图注意力网络的文本情感分析方法

Also Published As

Publication number Publication date
CN113194458A (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
CN111726460B (zh) 一种基于时空图的诈骗号码识别方法
CN109756632B (zh) 一种基于多维时间序列的诈骗电话分析方法
CN111222025A (zh) 一种基于卷积神经网络的诈骗号码识别方法及系统
CN103906027A (zh) 一种基于移动用户上网行为的用户价值评价方法和系统
CN102083010B (zh) 一种用户信息筛选方法和设备
CN107092651B (zh) 一种基于通信网络数据分析的关键人物挖掘方法及系统
CN102215504A (zh) 新入网用户的类别识别方法及系统
CN113194458B (zh) 多卡宝号码识别方法、装置
CN110113748A (zh) 骚扰电话监控方法、装置
CN109525739B (zh) 一种电话号码识别方法、装置及服务器
CN110677269B (zh) 通信用户关系的确定方法、装置和计算机可读存储介质
CN109274834B (zh) 一种基于通话行为的快递号码识别方法
CN108769434A (zh) 来电处理方法、装置及系统
CN115099934A (zh) 一种高潜客户识别方法、电子设备和存储介质
CN112307075B (zh) 用户关系识别方法及装置
CN115967906A (zh) 用户常驻位置识别方法、终端、电子设备及存储介质
CN115130577A (zh) 一种欺诈号码识别方法、装置及电子设备
CN110312213B (zh) 运营商占比率计算方法和装置
CN113076451B (zh) 异常行为识别和风险模型库的建立方法、装置及电子设备
CN107154875B (zh) 一种电话通信网络中节点敏感性排序的方法
CN112512052A (zh) 基于时间分段特征统计的数据安全异常检测方法及系统
CN114520969B (zh) 一种号卡使用判断方法、装置、设备及计算机存储介质
CN111242147A (zh) 一种亲密联系人和频繁活跃区域识别的方法及装置
CN115051969B (zh) 一种goip诈骗窝点溯源方法、装置、电子设备和存储介质
CN114071454B (zh) 一种移动用户识别码的识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant