CN111726460B - 一种基于时空图的诈骗号码识别方法 - Google Patents

一种基于时空图的诈骗号码识别方法 Download PDF

Info

Publication number
CN111726460B
CN111726460B CN202010542365.2A CN202010542365A CN111726460B CN 111726460 B CN111726460 B CN 111726460B CN 202010542365 A CN202010542365 A CN 202010542365A CN 111726460 B CN111726460 B CN 111726460B
Authority
CN
China
Prior art keywords
space
time
user
target user
call
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010542365.2A
Other languages
English (en)
Other versions
CN111726460A (zh
Inventor
李鹏
孙旭东
戚梦苑
初国俊
侯炜
刘瑶
计哲
肖红
宁珊
张震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinxun Digital Technology Hangzhou Co ltd
National Computer Network and Information Security Management Center
Original Assignee
EB INFORMATION TECHNOLOGY Ltd
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EB INFORMATION TECHNOLOGY Ltd, National Computer Network and Information Security Management Center filed Critical EB INFORMATION TECHNOLOGY Ltd
Priority to CN202010542365.2A priority Critical patent/CN111726460B/zh
Publication of CN111726460A publication Critical patent/CN111726460A/zh
Application granted granted Critical
Publication of CN111726460B publication Critical patent/CN111726460B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6027Fraud preventions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Technology Law (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种基于时空图的诈骗号码识别方法,包括:由全量通话记录生成电信通联网络,并构建识别诈骗号码的时空图,使用Snapshot方法按时间间隔T、从图中连续截取出多张时空子图;基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从时空子图中提取和其有相同被叫的邻居用户;构建、并训练识别诈骗号码的时空图神经网络;将待识别目标用户和其所有邻居用户在所有时空子图中的通话特征指标向量输入时空图神经网络,并根据输出判断待识别目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能动态的捕获到号码呼叫行为的变化,从而实现诈骗号码的精准识别。

Description

一种基于时空图的诈骗号码识别方法
技术领域
本发明涉及一种基于时空图的诈骗号码识别方法,属于信息技术领域。
背景技术
目前,针对诈骗号码的识别主要包括有以下几种技术方案:
1)基于号码标记的方法,这类方案的缺陷是存在滞后性、标记不准确、无法应对团伙诈骗;
2)基于语音和语义的方法,比如关键词匹配,这类方案存在的问题是检测过程复杂,而且由于诈骗方式层出不穷、诈骗分子会变换说法,从而导致识别准确率较低;
3)基于特征提取类的方法,由于诈骗分子具有反侦查意识,他们会伪装成正常号码的拨打行为,以正常的频次拨打电话,或者使用改号平台不停地换号,诈骗模式越来越隐蔽,因此识别准确率也较低。
专利申请CN 201910410802.2(申请名称:一种基于图嵌入的诈骗号码识别方法,申请日:2019-05-16,申请人:国家计算机网络与信息安全管理中心、杭州东信北邮信息技术有限公司)公开了一种基于图嵌入的诈骗号码识别方法,包括:基于用户在一段时间内的通话信令,计算用户的通话特征指标,并构成每个用户的通话特征指标向量,同时,提取和用户在一段时间内存在通话关系的联系人作为用户的直接邻居,构成每个用户的直接邻居组;构建、并训练识别诈骗号码的图嵌入神经网络,其输入是目标用户和多个关联用户的通话特征指标向量,输出是标识目标用户号码是否是疑似诈骗号码的标签信息;将待识别的目标用户和多个关联用户的通话特征指标向量输入训练后的图嵌入神经网络,然后根据输出判断待识别的目标用户号码是否是疑似诈骗号码。该技术方案基于诈骗电话“多点—点”的通联关系结构模式,会根据用户在一段时间内的通话信令构建一张静态图,但对于改号诈骗这种存在周期性的呼叫模式,即诈骗分子会使用多个主叫号码依次向外拨打诈骗电话,由于每个号码的通话频次都很低,该技术方案难以动态的捕获到这段时间内诈骗号码呼叫行为的变化。
因此,如何能动态的捕获号码呼叫行为的变化,从而实现诈骗号码的精准识别,已经成为技术人员普遍关注的技术问题。
发明内容
有鉴于此,本发明的目的是提供一种基于时空图的诈骗号码识别方法,能动态的捕获号码呼叫行为的变化,从而实现诈骗号码的精准识别。
为了达到上述目的,本发明提供了一种基于时空图的诈骗号码识别方法,包括有:
步骤一、由全量通话记录生成电信通联网络:G={V,E,Y},并据此构建识别诈骗号码的时空图,所构建的时空图是由连续多张时空子图组成的集合,其中,V表示所有通信用户的节点集合,vi∈V,vi表示用户i的节点,E表示所有用户节点之间通话关系的集合,eijt=(vi,vj,t)∈E,eijt表示用户i在t时刻给用户j的通话,Y表示人工标注的用户身份集合,yi∈Y,yi是人工标注的用户i的身份,然后使用Snapshot方法按一定的时间间隔T、从构建的时空图中连续截取出多张时空子图:Gk={Vk,Ek,Xk,Y},其中,Gk表示截取出的第k张时空子图,Vk表示时空子图Gk中所有通信用户的节点集合,Ek表示时空子图Gk中所有用户节点之间通话关系的集合,Xk表示时空子图Gk中所有用户的通话特征指标向量集合,dik∈Xk,dik表示时空子图Gk中用户i的通话特征指标向量;
步骤二、基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从所有时空子图中提取和其拥有相同被叫的邻居用户,并由所有邻居用户构成每个用户的邻居组;
步骤三、构建、并训练识别诈骗号码的时空图神经网络,所述时空图神经网络的输入是目标用户和其邻居组中的所有邻居用户在所有时空子图中的通话特征指标向量,输出是标识目标用户号码是否是疑似诈骗号码的标签信息;
步骤四、将待识别的目标用户和其邻居组中的所有邻居用户在所有时空子图中的通话特征指标向量输入训练后的时空图神经网络,并根据时空图神经网络的输出判断待识别的目标用户号码是否是疑似诈骗号码,
所述时空图神经网络包含有图卷积网络和递归神经网络,当输入目标用户和其邻居组中的所有邻居用户在所有时空子图中的通话特征指标向量时,时空图神经网络的具体计算过程如下:
步骤1、依次将目标用户和其邻居组中的所有邻居用户在每张时空子图对应时间周期下的通话特征指标向量输入图卷积神经网络,从而输出目标用户在每张时空子图对应时间周期下的空间融合特征向量,并将目标用户在所有时空子图对应时间周期下的空间融合特征向量构成目标用户的空间融合特征向量组;
步骤2、将目标用户的空间融合特征向量组输入递归神经网络,以通过递归神经网络的隐状态实现目标用户及其邻居用户在不同时空子图对应时间周期下的特征信息的整合,并根据最后一张时空子图对应时间周期下的隐状态获得递归神经网络的输出,即标识用户号码是否是疑似诈骗号码的标签信息。
与现有技术相比,本发明的有益效果是:本发明基于动态时空图结构,时空图中的节点数、边数都会随时间而变化,与静态图不同,从而可以动态的捕获到号码呼叫行为的变化,精准识别诈骗号码;本发明的时空图神经网络在图卷积网络的基础上,增加递归神经网络,从而能充分利用时间维度的信息,特别对于改号诈骗这种存在周期性的呼叫模式,即便每个号码的通话频次都很低,本发明也能识别出其呼叫行为的时间规律:比如通话时刻分布的周期性、相邻呼叫的时间差固定、仅在某个较短的时间段内呼叫等等。
附图说明
图1是本发明一种基于时空图的诈骗号码识别方法的流程图。
图2是以1个小时为时间间隔,从识别诈骗号码的时空图中连续截取出的3张时空子图的一个实施例的示意图。
图3是时空图神经网络的具体计算步骤流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
如图1所示,本发明一种基于时空图的诈骗号码识别方法,包括有:
步骤一、由全量通话记录生成电信通联网络:G={V,E,Y},并据此构建识别诈骗号码的时空图,所构建的时空图是由连续多张时空子图组成的集合,其中,V表示所有通信用户的节点集合,vi∈V,vi表示用户i的节点,E表示所有用户节点之间通话关系的集合,eijt=(vi,vj,t)∈E,eijt表示用户i在t时刻给用户j的通话,Y表示人工标注的用户身份集合,yi∈Y,yi是人工标注的用户i的身份,可以标记为自然诈骗人或普通用户,然后使用Snapshot方法按一定的时间间隔T、从构建的时空图中连续截取出多张时空子图:Gk={Vk,Ek,Xk,Y},其中,Gk表示截取出的第k张时空子图,Vk表示时空子图Gk中所有通信用户的节点集合,Ek表示时空子图Gk中所有用户节点之间通话关系的集合,Xk表示时空子图Gk中所有用户的通话特征指标向量集合,dik∈Xk,dik表示时空子图Gk中用户i的通话特征指标向量;
步骤二、基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,其中,构成通话特征指标向量的通话特征指标可以包括但不限于:呼叫频次、被叫号码数、离散度、忙时率、通话间隔平均值、呼叫间隔平均值、通话时长平均值、振铃时长平均值、未接通振铃时长平均值、接通率、被叫释放率、主叫类型、被叫类型、主叫地区、被叫地区,同时,为每个用户从所有时空子图中提取和其拥有相同被叫的邻居用户,并由所有邻居用户构成每个用户的邻居组;
步骤三、构建、并训练识别诈骗号码的时空图神经网络,所述时空图神经网络的输入是目标用户和其邻居组中的所有邻居用户在所有时空子图中的通话特征指标向量,输出是标识目标用户号码是否是疑似诈骗号码的标签信息;可以从黑白名单中选取多个已确认的诈骗号码和非诈骗号码作为时空图神经网络的训练样本;
步骤四、将待识别的目标用户和其邻居组中的所有邻居用户在所有时空子图中的通话特征指标向量输入训练后的时空图神经网络,并根据时空图神经网络的输出判断待识别的目标用户号码是否是疑似诈骗号码。
为了更进一步清楚直观的介绍本发明所构建的识别诈骗号码的时空图,图2示出了以1个小时为时间间隔,从识别诈骗号码的时空图中连续截取出的3张时空子图的示意图。其中,G1、G2、G3这3张时空子图分别对应的时间周期是8:00-9:00、9:00-10:00、10:00-11:00,时空子图中由节点vi指向vj的有向边表示用户i在时空子图对应时间周期下存在有给用户j的1次通话,例如,G1中由v1指向v2的有向边表示用户1在t11时刻给用户2的1次通话。
所述时空图神经网络包含有图卷积网络和递归神经网络,当输入目标用户和其邻居组中的所有邻居用户在所有时空子图中的通话特征指标向量时,如图3所示,时空图神经网络的具体计算过程如下:
步骤1、依次将目标用户和其邻居组中的所有邻居用户在每张时空子图对应时间周期下的通话特征指标向量输入图卷积神经网络,从而输出目标用户在每张时空子图对应时间周期下的空间融合特征向量,并将目标用户在所有时空子图对应时间周期下的空间融合特征向量构成目标用户的空间融合特征向量组;
由于时空图中的节点数、边数都会随时间变化,因此从时空图中截取出来的每张时空子图的节点和边都会存在差异。为了保证下一步能用递归神经网络,本发明可以通过一种“占位”的操作,将时空子图中没有出现的节点补充上,从而使得每张时空子图中的节点数相等,这样,当目标用户或邻居用户在其中一张时空子图中由于不存在通信行为,所以不存在有对应的通信用户的节点时,以第z张时空子图为例,步骤1还可以包括有:将目标用户或邻居用户在第z张时空子图对应时间周期下的通话特征指标向量设置为全0向量,从而保证每个目标用户的空间融合特征向量组中都存在有相同数量的空间融合特征向量;
步骤2、将目标用户的空间融合特征向量组输入递归神经网络,以通过递归神经网络的隐状态实现目标用户及其邻居用户在不同时空子图对应时间周期下的特征信息的整合,并根据最后一张时空子图对应时间周期下的隐状态获得递归神经网络的输出,即标识用户号码是否是疑似诈骗号码的标签信息。
步骤1将目标用户和其邻居用户的通话特征指标向量以图卷积的形式融合,从而可以充分提取数据中隐含的空间维度信息,步骤1还可以进一步通过下面两种方式来计算目标用户在每张时空子图对应时间周期下的空间融合特征向量:
1、根据邻居用户特征的平均值来计算,步骤1可以进一步包括有:
步骤A1、计算目标用户在每张时空子图对应时间周期下的空间融合特征向量:
Figure GDA0002946904980000051
其中,d′ik是目标用户i在第k张时空子图对应时间周期下的空间融合特征向量,dik是目标用户i在第k张时空子图对应时间周期下的通话特征指标向量,
Figure GDA0002946904980000052
是目标用户i的第m个邻居用户在第k张时空子图对应时间周期下的通话特征指标向量,M是目标用户i的邻居用户总数,σ(·)是非线性激活函数,Ws是线性变换矩阵,bs是偏置向量,σ(·)可以根据实际业务需要而设置(例如使用relu()激活函数),Ws和bs可以通过步骤二对时空图神经网络进行训练而获得。
2、根据和邻居用户之间的相关度来计算,步骤1进一步包括有:
步骤B1、计算目标用户和每个邻居用户在每张时空子图对应时间周期下的特征指标相关度:
Figure GDA0002946904980000061
其中,
Figure GDA0002946904980000062
是目标用户i和其第m个邻居用户在第k张时空子图对应时间周期下的特征指标相关度,
Figure GDA0002946904980000063
是dik
Figure GDA0002946904980000064
这两个向量的余弦值;
步骤B2、对目标用户和每个邻居用户在每张时空子图对应时间周期下的特征指标相关度进行归一化操作:
Figure GDA0002946904980000065
其中,a(im)是目标用户i和第m个邻居用户在第k张时空子图对应时间周期下的特征指标相关度的归一化值;
步骤B3、计算目标用户在每张时空子图对应时间周期下的空间融合特征向量:
Figure GDA0002946904980000066
步骤2将目标用户的空间融合特征向量组输入到递归神经网络中,通过递归神经网络的隐状态对目标用户在空间和时间两个维度的特征信息进行整合。递归神经网络在第τ张时空子图对应时间周期下的隐藏层状态h′不仅与目标用户i在第τ张时空子图对应时间周期的空间融合特征向量d′有关,也与前一张时空子图对应时间周期(即第τ-1个时间周期)下的隐藏层状态h′iτ-1有关,h′可以使用以下公式来计算:h′=σ(Wt·[d′,h′iτ-1]+bt),其中,Wt是线性变换矩阵,bt是偏置向量,[d′,h′iτ-1]表示将d′、h′iτ-1进行拼接,Wt和bt可以通过步骤二对时空图神经网络进行训练而获得,对于不同的历史时刻,递归神经网络的隐藏层参数(例如Wt和bt)是共享的。
步骤2中,根据最后一张时空子图对应时间周期下的隐状态获得递归神经网络的输出,即标识用户号码是否是疑似诈骗号码的标签信息,可以进一步包括有:
计算递归神经网络的输出值:y′i=Softmax(W·h′iE+b),其中,y′i是标识目标用户i号码是否是疑似诈骗号码的标签信息,h′iE是最后一张时空子图对应时间周期下的隐藏层状态,W是线性变换矩阵,b是偏置向量,W和b是递归神经网络的输出层参数,其值可以通过步骤二对时空图神经网络进行训练而获得,Softmax(·)是输出层的激活函数。
通过步骤1和2,目标用户在时间维度和空间维度的特征信息都分别被整合到递归神经网络的隐状态当中,而最后一张时空子图对应时间周期下的隐状态h′iE则被用来预测最终的标签信息,通过设置神经网络的隐藏层,用户的通话特征将被投射到更紧致的隐空间。
本发明可以使用批量梯度下降法(Batch Gradient Descent)最小化损失函数L,更新训练递归神经网络中的参数W、b、Ws、bs、Wt和bt,相比于传统的交叉熵损失函数,这种Focal Loss损失函数则更加关注容易混淆的样本,同时给正样本分配更高的权重,从而更好地适应样本不平衡的情况。训练后的神经网络将以同样的方式去预测未被人工标记的数据,输出每个用户的标签信息。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (7)

1.一种基于时空图的诈骗号码识别方法,其特征在于,包括有:
步骤一、由全量通话记录生成电信通联网络:G={V,E,Y},并据此构建识别诈骗号码的时空图,所构建的时空图是由连续多张时空子图组成的集合,其中,V表示所有通信用户的节点集合,vi∈V,vi表示用户i的节点,E表示所有用户节点之间通话关系的集合,eijt=(vi,vj,t)∈E,eijt表示用户i在t时刻给用户j的通话,Y表示人工标注的用户身份集合,yi∈Y,yi是人工标注的用户i的身份,然后使用Snapshot方法按一定的时间间隔T、从构建的时空图中连续截取出多张时空子图:Gk={Vk,Ek,Xk,Y},其中,Gk表示截取出的第k张时空子图,Vk表示时空子图Gk中所有通信用户的节点集合,Ek表示时空子图Gk中所有用户节点之间通话关系的集合,Xk表示时空子图Gk中所有用户的通话特征指标向量集合,dik∈Xk,dik表示时空子图Gk中用户i的通话特征指标向量;
步骤二、基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从所有时空子图中提取和其拥有相同被叫的邻居用户,并由所有邻居用户构成每个用户的邻居组;
步骤三、构建、并训练识别诈骗号码的时空图神经网络,所述时空图神经网络的输入是目标用户和其邻居组中的所有邻居用户在所有时空子图中的通话特征指标向量,输出是标识目标用户号码是否是疑似诈骗号码的标签信息;
步骤四、将待识别的目标用户和其邻居组中的所有邻居用户在所有时空子图中的通话特征指标向量输入训练后的时空图神经网络,并根据时空图神经网络的输出判断待识别的目标用户号码是否是疑似诈骗号码,
所述时空图神经网络包含有图卷积网络和递归神经网络,当输入目标用户和其邻居组中的所有邻居用户在所有时空子图中的通话特征指标向量时,时空图神经网络的具体计算过程如下:
步骤1、依次将目标用户和其邻居组中的所有邻居用户在每张时空子图对应时间周期下的通话特征指标向量输入图卷积神经网络,从而输出目标用户在每张时空子图对应时间周期下的空间融合特征向量,并将目标用户在所有时空子图对应时间周期下的空间融合特征向量构成目标用户的空间融合特征向量组;
步骤2、将目标用户的空间融合特征向量组输入递归神经网络,以通过递归神经网络的隐状态实现目标用户及其邻居用户在不同时空子图对应时间周期下的特征信息的整合,并根据最后一张时空子图对应时间周期下的隐状态获得递归神经网络的输出,即标识用户号码是否是疑似诈骗号码的标签信息。
2.根据权利要求1所述的方法,其特征在于,步骤二中,构成通话特征指标向量的通话特征指标包括但不限于:呼叫频次、被叫号码数、离散度、忙时率、通话间隔平均值、呼叫间隔平均值、通话时长平均值、振铃时长平均值、未接通振铃时长平均值、接通率、被叫释放率、主叫类型、被叫类型、主叫地区、被叫地区。
3.根据权利要求1所述的方法,其特征在于,当目标用户或邻居用户在其中一张时空子图中不存在有对应的通信用户的节点时,以第z张时空子图为例,步骤1还包括有:
将目标用户或邻居用户在第z张时空子图对应时间周期下的通话特征指标向量设置为全0向量。
4.根据权利要求1所述的方法,其特征在于,步骤1进一步包括有:
步骤A1、计算目标用户在每张时空子图对应时间周期下的空间融合特征向量:
Figure FDA0002946904970000021
其中,d′ik是目标用户i在第k张时空子图对应时间周期下的空间融合特征向量,dik是目标用户i在第k张时空子图对应时间周期下的通话特征指标向量,
Figure FDA0002946904970000022
是目标用户i的第m个邻居用户在第k张时空子图对应时间周期下的通话特征指标向量,M是目标用户i的邻居用户总数,σ(·)是非线性激活函数,Ws是线性变换矩阵,bs是偏置向量。
5.根据权利要求1所述的方法,其特征在于,步骤1进一步包括有:
步骤B1、计算目标用户和每个邻居用户在每张时空子图对应时间周期下的特征指标相关度:
Figure FDA0002946904970000023
其中,
Figure FDA0002946904970000024
是目标用户i和其第m个邻居用户在第k张时空子图对应时间周期下的特征指标相关度,
Figure FDA0002946904970000031
是dik
Figure FDA0002946904970000032
这两个向量的余弦值:
步骤B2、对目标用户和每个邻居用户在每张时空子图对应时间周期下的特征指标相关度进行归一化操作:
Figure FDA0002946904970000033
其中,a(im)是目标用户i和第m个邻居用户在第k张时空子图对应时间周期下的特征指标相关度的归一化值;
步骤B3、计算目标用户在每张时空子图对应时间周期下的空间融合特征向量:
Figure FDA0002946904970000034
其中,σ(·)是非线性激活函数,Ws是线性变换矩阵,bs是偏置向量。
6.根据权利要求1所述的方法,其特征在于,步骤2中,递归神经网络在第τ张时空子图对应时间周期下的隐藏层状态h’使用以下公式来计算:h’=σ(Wt·[d’,h’iτ-1]+bτ),其中,σ(·)是非线性激活函数,Wt是线性变换矩阵,bt是偏置向量,d′是目标用户i在第τ张时空子图对应时间周期的空间融合特征向量,h′iτ-1是第τ-1张时空子图对应时间周期的隐藏层状态,[d′,h′iτ-1]表示将d′、h′iτ-1进行拼接。
7.根据权利要求1所述的方法,其特征在于,步骤2中,根据最后一张时空子图对应时间周期下的隐状态获得递归神经网络的输出,即标识用户号码是否是疑似诈骗号码的标签信息,进一步包括有:
计算递归神经网络的输出值:y′i=Softmax(W·h′iE+b),其中,y′i是标识目标用户i号码是否是疑似诈骗号码的标签信息,h′iE是最后一张时空子图对应时间周期下的隐藏层状态,W是线性变换矩阵,b是偏置向量,W和b是递归神经网络的输出层参数,Softmax(·)是输出层的激活函数。
CN202010542365.2A 2020-06-15 2020-06-15 一种基于时空图的诈骗号码识别方法 Active CN111726460B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010542365.2A CN111726460B (zh) 2020-06-15 2020-06-15 一种基于时空图的诈骗号码识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010542365.2A CN111726460B (zh) 2020-06-15 2020-06-15 一种基于时空图的诈骗号码识别方法

Publications (2)

Publication Number Publication Date
CN111726460A CN111726460A (zh) 2020-09-29
CN111726460B true CN111726460B (zh) 2021-04-20

Family

ID=72566720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010542365.2A Active CN111726460B (zh) 2020-06-15 2020-06-15 一种基于时空图的诈骗号码识别方法

Country Status (1)

Country Link
CN (1) CN111726460B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112437197B (zh) * 2020-10-30 2021-06-18 中国人民解放军战略支援部队信息工程大学 一种基于通信行为信息熵的异常呼叫发现方法与装置
CN112866486B (zh) * 2021-02-01 2022-06-07 西安交通大学 一种基于多源特征的诈骗电话识别方法、系统及设备
CN113194458B (zh) * 2021-04-08 2022-05-13 南京中新赛克科技有限责任公司 多卡宝号码识别方法、装置
CN114827353B (zh) * 2022-04-15 2023-10-10 中国电信股份有限公司 通信网络通话预测方法、装置、设备及存储介质
CN115278687B (zh) * 2022-07-27 2023-08-15 联通(山东)产业互联网有限公司 一种基于时空网络和图算法的电话号码诈骗检测的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10009375B1 (en) * 2017-12-01 2018-06-26 KnowBe4, Inc. Systems and methods for artificial model building techniques
CN109474756A (zh) * 2018-11-16 2019-03-15 国家计算机网络与信息安全管理中心 一种基于协同网络表示学习的电信异常检测方法
CN110059889A (zh) * 2019-03-28 2019-07-26 国家计算机网络与信息安全管理中心 基于无监督学习的诈骗呼叫序列检测方法
CN110177179A (zh) * 2019-05-16 2019-08-27 国家计算机网络与信息安全管理中心 一种基于图嵌入的诈骗号码识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10009375B1 (en) * 2017-12-01 2018-06-26 KnowBe4, Inc. Systems and methods for artificial model building techniques
CN109474756A (zh) * 2018-11-16 2019-03-15 国家计算机网络与信息安全管理中心 一种基于协同网络表示学习的电信异常检测方法
CN110059889A (zh) * 2019-03-28 2019-07-26 国家计算机网络与信息安全管理中心 基于无监督学习的诈骗呼叫序列检测方法
CN110177179A (zh) * 2019-05-16 2019-08-27 国家计算机网络与信息安全管理中心 一种基于图嵌入的诈骗号码识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
图神经网络推荐研究进展;吴国栋,查志康,涂立静,陶鸿,宋福根;《智能系统学报》;20200130;第15卷(第1期);第15-23页 *

Also Published As

Publication number Publication date
CN111726460A (zh) 2020-09-29

Similar Documents

Publication Publication Date Title
CN111726460B (zh) 一种基于时空图的诈骗号码识别方法
CN110177179B (zh) 一种基于图嵌入的诈骗号码识别方法
CN109615116B (zh) 一种电信诈骗事件检测方法和检测系统
CN106550155B (zh) 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统
CN111222025B (zh) 一种基于卷积神经网络的诈骗号码识别方法及系统
Moreau et al. Detection of mobile phone fraud using supervised neural networks: A first prototype
CN106161209B (zh) 一种基于深度自学习的垃圾短信过滤方法及系统
CN109756632B (zh) 一种基于多维时间序列的诈骗电话分析方法
CN111159387B (zh) 基于多维度报警信息文本相似度分析的推荐方法
CN107527240B (zh) 一种运营商行业产品口碑营销效果鉴定系统及方法
CN107491729B (zh) 基于余弦相似度激活的卷积神经网络的手写数字识别方法
CN102083010A (zh) 一种用户信息筛选方法和设备
CN111917574B (zh) 社交网络拓扑模型及构建方法、用户置信度和亲密度计算方法及电信诈骗智能拦截系统
CN109145050B (zh) 一种计算设备
CN109600520B (zh) 骚扰电话号码识别方法、装置及设备
CN109474755B (zh) 基于排序学习和集成学习的异常电话主动预测方法、系统及计算机可读存储介质
CN110213449B (zh) 一种漫游诈骗号码的识别方法
CN109274834B (zh) 一种基于通话行为的快递号码识别方法
CN100405870C (zh) 一种采集和使用用户特征数据识别用户的系统和方法
CN111062422A (zh) 一种套路贷体系化识别方法及装置
CN113194458B (zh) 多卡宝号码识别方法、装置
CN111709472B (zh) 一种动态融合规则到诈骗行为识别模型的方法
CN112512052A (zh) 基于时间分段特征统计的数据安全异常检测方法及系统
CN109871469A (zh) 基于动态图元的小簇人群识别方法
CN109815984A (zh) 一种基于卷积神经网络的用户行为鉴别系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100029 Beijing city Chaoyang District Yumin Road No. 3

Patentee after: NATIONAL COMPUTER NETWORK AND INFORMATION SECURITY MANAGEMENT CENTER

Patentee after: Xinxun Digital Technology (Hangzhou) Co.,Ltd.

Address before: 100029 Beijing city Chaoyang District Yumin Road No. 3

Patentee before: NATIONAL COMPUTER NETWORK AND INFORMATION SECURITY MANAGEMENT CENTER

Patentee before: EB Information Technology Ltd.