CN112153220A - 一种基于社交评价动态更新的通信行为识别方法 - Google Patents

一种基于社交评价动态更新的通信行为识别方法 Download PDF

Info

Publication number
CN112153220A
CN112153220A CN202010872161.5A CN202010872161A CN112153220A CN 112153220 A CN112153220 A CN 112153220A CN 202010872161 A CN202010872161 A CN 202010872161A CN 112153220 A CN112153220 A CN 112153220A
Authority
CN
China
Prior art keywords
user
communication
period
intimacy
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010872161.5A
Other languages
English (en)
Other versions
CN112153220B (zh
Inventor
李静林
袁泉
罗贵阳
刘志晗
娄云敬
陈诗萌
王尚广
周傲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202010872161.5A priority Critical patent/CN112153220B/zh
Publication of CN112153220A publication Critical patent/CN112153220A/zh
Application granted granted Critical
Publication of CN112153220B publication Critical patent/CN112153220B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6027Fraud preventions

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于社交评价动态更新的通信行为识别方法,属于网络欺诈识别、深度学习和通信社交技术领域。首先对目标用户A向用户B呼出的全量通话话单中统计通信指标,得到用户间量化的通信满意度。根据通信满意度结合历史亲密度,对当前周期的用户A和用户B之间亲密度进行迭代更新。同时将用户A以及每个交互用户各自对应的个体特征向量,以及与每个交互用户更新后的亲密度建立通信社交网络,计算每个交互用户对用户A的局部信任度,结合用户A与每个交互用户的亲密度向量,得到用户A的局部推荐信任度。最后对用户A的置信度进行更新,判断更新后的用户A是否为疑似诈骗用户,重复上述方法,统计出疑似诈骗用户名单。本发明为用户构建了一个安全的通话环境。

Description

一种基于社交评价动态更新的通信行为识别方法
技术领域
本发明属于网络欺诈识别、深度学习和通信社交技术领域,涉及一种基于社交评价动态更新的通信行为识别方法。
背景技术
随着通信行业和互联网行业的高速发展,人与人之间的沟通成本日益降低,但同时层出不穷的电信诈骗行为引起了全社会的广泛关注。诈骗分子一般通过远程作案,利用人们趋利避害的心理编造虚假信息以骗取钱财,给人民群众造成了严重的经济损失和精神损失。
电信诈骗具有非接触式、诈骗技术更新快和反侦察能力强的特点,使得电信诈骗案件的破案率远低于其他刑事案件。
现有技术针对电信诈骗采取了很多方法,如文献1:专利申请号为201410693578.X的一种基于聚类算法的实时拦截诈骗电话的方法和系统,能在全网范围内实现诈骗号码的自动精准识别和实时拦截;但是,该方案仅仅依据电话号码的若干通话指标判断此电话号码是否为诈骗号码,通过提取主叫号码在一个周期内的若干个指标,根据这若干个指标基于聚类算法将主叫号码分为三个簇,分别是普通号码簇、疑似诈骗号码簇和诈骗号码簇。没有注重电话号码之间通信时隐含的社交信息,而且非常依赖于若干个指标的选取,由于用户通话行为的多样性,选取出能够严格区分诈骗号码、疑似诈骗号码和普通号码的若干个指标非常不易。
文献2:专利号为201710211148.3的一种基于大数据和机器学习的防范电信诈骗系统及方法,联合移动端、运营商、公安和银行等机构,不仅能实现快速有效防范还能实现及时打击电信诈骗。但是,该方案通过约束规则,利用决策树算法检测主叫电话是否为诈骗电话,约束规则库中的诈骗特征都是基于历史信息诈骗数据库进行的特征提取,需要花费大量时间和人力完善扩充诈骗信息数据库,随着诈骗手段层出不穷可能会导致诈骗信息数据库更新不及时,从而影响诈骗特征的提取,不能准确根据约束规则库判定诈骗电话。另外,用决策树算法进行诈骗分类,单纯依靠提取的电信诈骗的特征进行分类,虽然能够拦截部分诈骗行为,但由于用户通话行为的复杂性,效果往往不够理想,难以应对日益复杂的电信诈骗用户识别任务。
文献3:专利号为201811373658.1的一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,缓解了数据稀疏性问题,发现基于群组的异常特征。但是,过度依赖用户的通话行为,检测是否为诈骗电话的依据是固定窗口的统计特征,例如:呼叫时间间隔均值、呼叫成功比例、呼叫成功次数以及平均每天通话次数等,这些统计特征虽然在一定程度上能够被用于拦截诈骗电话,但是随着诈骗手段的多样化,单从用户的通话行为获得的统计特征建立的电信诈骗模型效果往往不理想。
文献4:专利号为201811573805.X的一种基于卷积神经网络的用户行为鉴别系统及方法,能够对具有电信诈骗行为的用户进行精确识别,保证了系统针对电信诈骗行为的防控能力。该方法利用卷积神经网络虽然能够自动完成用户特征学习,获得具有重要影响的特征,实现用户行为更准确的分类,但是卷积神经网络模型的输入数据来源于对用户通话记录的统计特征和行为特征,而随着用户通话行为的复杂多样,基于用户通话记录的特征构建变得更加困难,使得仅依赖用户行为特征建立的电信诈骗模型在实践过程中往往效果不太理想。
鉴于这些不足之处,希望构建一种更加智能有效的检测方法,能够将用户的通话行为和通信社交网络相结合去分析用户的欺诈性,从而有效进行诈骗拦截。主要解决电信诈骗领域内三个方面的问题:
1)依赖用户短期的通信话单
现有的技术方案大多依赖于用户一个周期内的通信话单,从中提取用户的通话指标后,基于规则、聚类算法或者分类算法判断用户是否为疑似诈骗用户。这就要求在判断之前必须获得用户一个周期内的通信话单。然而能够获取诈骗用户一个周期内的通信话单意味着诈骗用户可能在这一整个周期都在实施诈骗行为。周期越短,时效性越高,同时获得的信息量越少,判断结果可能越差。因此,不能仅仅依赖用户短期的通信话单。
2)过度强调用户的通话行为
传统的机器学习技术方案,包括聚类技术和分类技术,从用户的通话行为入手,通过建立模型判断用户是否属于诈骗用户。虽然用户的通话行为固然与诈骗行为有一定的关系,但由于用户通话行为的多样性,只考虑用户的通话行为过于片面,模型的结果往往不够理想。因此不仅要从用户的通话行为中进行分析,还要从其他相关方面进行深入思考。
3)忽视用户社交关系问题
除了用户本身的通话行为外,用户间的相互通话构成的通信社交网络也能够为诈骗检测提供有用的信息。在通信社交网络图中,普通用户与其部分交互用户建立长期稳定的通话关系;相对于普通用户来说,由于欺诈行为本身的特性,诈骗用户与其所有交互用户都不太可能建立长期稳定的通话关系。所以,如何充分利用用户的社交关系帮助进行欺诈识别是需要解决的一个重点问题。
发明内容
针对上述问题,本发明提出了一种基于社交评价动态更新的通信行为识别方法,利用深度学习和社交网络技术计算用户的置信度,筛选出疑似诈骗用户,从而提高电信诈骗案件的破案率,减少电信诈骗造成的损失。
具体步骤如下:
步骤一、针对目标用户A,从一个周期内向用户B呼出的全量通话话单中统计通信指标;
用户周期T的长度根据实际情况决定。
每个话单都包括:主叫号码、被叫号码、呼损原因(表示通话成功或者失败原因)、起呼时间、应答时间和挂机时间。
通信指标是指从全部通话话单中统计成功通话次数、平均通话时长和累计通话时长;
步骤二、根据通信指标得到用户间量化的通信强度,进而得到用户间量化的通信满意度;首先,在时间周期T内用户A向用户B呼出的通信强度公式为:
I(A,B)=∑λiXi(A,B)
∑λi=1
Xi(A,B)∈[0,1]
其中,λi对应第i个通信指标的权重;Xi(A,B)为第i个通信指标归一化后的值。
然后,利用通信强度计算周期T内用户A和用户B之间的通信满意度,公式为:
Figure BDA0002651470600000031
Figure BDA0002651470600000032
Figure BDA0002651470600000033
且b>a
其中,g1(I(A,B),I(B,A))用于衡量双方用户通信强度的均衡程度,随着双方用户通信强度的均衡程度的增大而增大;σ1表示g1(I(A,B),I(B,A))的权重;I(B,A)表示时间周期T内用户B向用户A呼出的通信强度。
g2(I(A,B),I(B,A))用于衡量双方用户通信强度的差值,随着双方用户通信强度差值的增大而减少;σ2表示g2(I(A,B),I(B,A))的权重。
a和b是自定义的参数,用于调节通信满意度随着通信强度差值减小的坡度。
步骤三、根据当前周期T的通信满意度结合历史亲密度,对当前周期的用户A和用户B之间亲密度进行迭代更新。
用户A和用户B之间的亲密度迭代更新算法如下:
步骤301、判断用户A与用户B在第i-1个周期的亲密度IntAB(i-1)是否大于亲密度阈值Intδ,如果是,表明两用户间的亲密度已足够大,第i个周期的亲密度与第i-1个周期的亲密度保持相同,结束算法;否则,进入步骤302;
初始i=1,对应的历史亲密度为零或者自定义数值;
步骤302、判断用户A和用户B在第i个周期的非负通信满意度SAB(i)是否等于0,如果是,进入步骤303;否则,进入步骤304;
步骤303、用户A和用户B在第i个周期内未进行通信,用户A和用户B距离上一次通话的周期数tAB自增1,然后判断tAB是否超过周期阈值tδ,如果是,按照用户之间亲密度的衰减函数M对第i个周期的亲密度进行更新;否则第i个周期的亲密度与第i-1个周期的亲密度相同,结束算法。
衰减函数M计算如下:
Figure BDA0002651470600000041
步骤304、用户A和用户B之间的通信满意度SAB(i)大于零,判断tAB是否超过tδ;如果是,第i-1个周期的亲密度经过了衰减,按照亲密度的更新函数W2对第i个周期的亲密度进行更新;否则,第i-1个周期的亲密度未衰减,则按照亲密度的更新函数W1对第i个周期的亲密度进行更新;亲密度更新之后,tAB置为零。
更新函数W1,计算公式如下:
W1(IntAB(i-1),SAB(i))=IntAB(i-1)+μ1*SAB(i)
SAB(i)表示用户A和用户B在第i个周期的通信满意度。μ1是通信满意度在亲密度更新函数W1中的权重系数;μ1越大,表明通信满意度在亲密度的更新中就越重要。
更新函数W2,计算公式如下:
W2(IntAB(max),SAB(i),tAB)=IntAB(max)+μ*SAB(i)+ρ*tAB
ρ是tAB的权重参数,ρ越大,tAB在亲密度的更新中就越重要。
步骤四、同时,将一个周期内用户A与所有交互用户的全量通话话单中,分别统计每个用户个体相关的特征向量;
各用户的特征向量都包括:总的通信次数,成功通信次数、成功通信率、平均通话时长和总的通话时长。
步骤五、利用步骤三分别更新用户A与相交互的每个用户之间的亲密度;
步骤六、根据用户A以及每个交互用户各自对应的个体特征向量,以及与每个交互用户更新后的亲密度建立通信社交网络,基于消息传递网络算法得到每个交互用户对用户A的局部信任度;
通信社交网络以用户间的亲密度为边权、以用户的个体特征向量为节点。
消息传递网络采用两层空域卷积和两层全连接网络:首先输入用户A及其所有交互用户的个体特征向量和用户间的亲密度,然后学习神经网络将图的特征转换并累计,计算每个用户的终态,最后将所有用户的终态转换为整个通信社交网络的状态,输出每个交互用户对用户A的局部信任度。
步骤七、将用户A与每个交互用户的局部信任度构成局部信任度向量,用户A与每个交互用户的亲密度构成亲密度向量,做点积运算得到用户A的局部推荐信任度。
用户A的交互用户集合为{0,1,2,...j,...J},用户j在第i个周期的局部信任度为Tj(i),用户A与用户j在第i个周期的亲密度为IntAj(i),则用户A在第i个周期的局部推荐信任度为TRA(i):
Figure BDA0002651470600000051
步骤八、根据用户A的局部信任度、局部推荐信任度和历史置信度对用户A当前周期的置信度进行迭代更新;
更新的步骤为:
首先、针对第i-1个周期,判断用户A的历史置信度R(i-1)是否高于置信度的高阈值Rβ,如果是,则表明用户A高度可信,用户A第i个周期的置信度保持不变,即R(i)=R(i-1),更新过程结束;否则,将第i个周期用户A的局部信任度TA(i)和局部信任度的高低阈值分别比较,更新周期tα、周期tβ和周期t的值。
局部信任度的低阈值为Tα,高阈值为Tβ
tα为历史上有通话的周期内局部信任度低于低阈值的周期数,tβ为历史上有通话的周期内局部信任度高于高阈值的周期数,t为历史上有通话的周期数。
更新周期tα、周期tβ和周期t具体为:
判断用户A的局部信任度TA(i)是否大于零,如果是,则周期数t增1,即t=t+1,否则周期数t不变。同理,判断用户A的局部信任度TA(i)是否小于低阈值Tα,如果是,则周期数tα增1,否则周期数tα不变。同理,判断用户A的局部信任度TA(i)是否大于高阈值Tβ,如果是,则周期数tβ增1,否则周期数tβ不变。
接着利用更新的周期数tα和tβ,计算可信因子φ的值,利用可信因子φ更新用户A第i个周期的置信度RA(i)。
可信因子φ的计算公式如下:
Figure BDA0002651470600000061
ω为用来调节可信因子范围的参数。
更新用户A第i个周期的置信度RA(i)计算公式如下:
RA(i)=RA(i-1)*((μ2*TA(i)+TRA(i))*eλ*φ)
λ是可信因子的系数,表明可信因子在置信度更新过程中的重要程度。μ2是用户A的局部信任度TA(i)的权重系数,表明局部信任度在置信度更新过程中的重要程度。
步骤九、判断更新后的用户A的置信度是否低于阈值,如果是,则用户A为疑似诈骗用户,否则,用户A正常;
步骤十、同理,选择下一个目标用户,重复步骤一到步骤九,统计出疑似诈骗用户的名单。
本发明与现有技术相比,具有以下优势:
一种基于社交评价动态更新的通信行为识别方法,相比于现有方法,本方法创造性地提出了亲密度和置信度的迭代更新算法,将用户通话行为和通信社交网络结合在一起,并引入了卷积神经网络、消息传递网络等技术,取得了良好的效果。
附图说明
图1是本发明一种基于社交评价动态更新的通信行为识别方法原理图;
图2是本发明一种基于社交评价动态更新的通信行为识别方法流程图;
图3是本发明当前周期的用户A和用户B之间亲密度进行迭代更新的流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图对本发明作进一步的详细和深入描述。
目前的电信欺诈检测一般是通过构建诈骗号码数据库,限制诈骗号码的呼叫行为,但是,当犯罪分子更换手机号后,原有的诈骗电话号码数据库不能实现自动更新。同时,基于机器学习技术,通过提取用户通话行为的特征来判别诈骗号码的方法,虽然能够实现自动拦截诈骗号码,但是由于用户通话行为的复杂性,效果往往不够理想,难以应对日益复杂的电信诈骗用户识别任务。
本发明提出电信诈骗的社交网络模型,以用户的特征向量作为通信社交网络图的节点、以用户间的亲密度作为通信社交网络图的边权,利用通信满意度对用户间的亲密度进行迭代更新,构造用户的局部社交网络图,通过消息传递网络输出用户的局部信任度。然后以局部信任度为基础,对用户的置信度进行迭代更新,从而筛选出置信度较低的疑似诈骗用户。通过对疑似诈骗用户进行实时检测或拦截,为用户构建一个安全的通话环境。
整体技术方案的核心框架如图1所示,主要分为两个模块:亲密度模块和置信度模块。在亲密度模块中,首先从用户一个周期内的全量数据中提取两两用户间通信特征向量,然后据此特征向量得到用户间量化的通信强度,进而得到用户间量化的通信满意度,最后根据历史亲密度和通信满意度对亲密度进行迭代更新。在置信度模块中,首先从用户周期内的全量数据中提取用户个体特征向量,然后据此特征向量和更新的用户间的亲密度,建立以用户间的亲密度为边权、以用户的个体特征向量为节点的通信社交网络,基于消息传递网络算法得到用户的局部信任度,根据用户的局部信任度和历史置信度完成用户置信度的迭代更新,最后基于置信度对用户进行筛选,置信度低于一定阈值的判定为疑似诈骗用户,从而得到疑似诈骗用户名单。
如图2所示,具体步骤如下:
步骤一、针对目标用户A,从一个周期内向用户B呼出的全量通话话单中统计通信指标;
用户周期T的长度根据实际情况决定。
每个话单都包括:主叫号码、被叫号码、呼损原因(表示通话成功或者失败原因)、起呼时间、应答时间和挂机时间。
通信指标是指从全部通话话单中统计的成功通话次数、平均通话时长和累计通话时长等;比如提取用户的成功通话次数这个特征,就是从全量话单中统计每个用户的成功通话次数,即统计每个用户有多少呼损原因等于0(等于0表示通话成功)的话单。
所有通信指标归一化后的集合为:
X(A,B)=(X1(A,B),X2(A,B),X3(A,B));
步骤二、根据通信指标得到用户间量化的通信强度,进而得到用户间量化的通信满意度;
用户间的通信强度用于反映周期内用户与另一用户通信行为的频繁程度。
通信强度一般与成功通话次数、平均通话时长和累计通话时长等指标有关。且通信强度具有不对称性,即用户A对用户B的通信强度与用户B对用户A的通信强度无关。
定义在时间周期T内用户A向用户B呼出的通信强度公式为:
I(A,B)=∑λiXi(A,B)
∑λi=1
Xi(A,B)∈[0,1]
其中,λi对应第i个通信指标的权重;Xi(A,B)为在时间周期T内用户A向用户B呼出话单的第i个通信指标归一化后的值;由于Xi(A,B)在区间[0,1]内,且特征的权重相加为1,因此通信强度的值域为[0,1]。
通信满意度用于衡量双方对周期内的通信行为的满意度。通信满意度与双方用户通信强度的均衡程度和差值相关。即只有双方的通信强度比较均衡,且通信强度的差值比较小时,通信满意度才会处于一个较高水平。如果用户A对用户B的通信强度较大,而用户B对用户A的通信强度较小时,那么用户A和用户B的通信满意度较低。
利用通信强度计算周期T内用户A和用户B之间的通信满意度,公式为:
Figure BDA0002651470600000081
Figure BDA0002651470600000082
Figure BDA0002651470600000083
且b>a
其中,g1(I(A,B),I(B,A))用于衡量双方用户通信强度的均衡程度,随着双方用户通信强度的均衡程度的增大而增大;且g1(I(A,B),I(B,A))的值域区间为[0,1]。
σ1表示g1(I(A,B),I(B,A))的权重;I(B,A)表示时间周期T内用户B向用户A呼出的通信强度。
g2(I(A,B),I(B,A))用于衡量双方用户通信强度的差值,随着双方用户通信强度差值的增大而减少;且g2(I(A,B),I(B,A))的值域区间为[0,1]。σ2表示g2(I(A,B),I(B,A))的权重。
a和b是自定义的参数,用于调节通信满意度随着通信强度差值减小的坡度。
步骤三、根据当前周期T的通信满意度结合历史亲密度,对当前周期的用户A和用户B之间亲密度进行迭代更新。
亲密度以各周期用户间的通信满意度为基础,用于反映用户间长期的通信满意度。上一周期的亲密度和本周期的通信满意度得到本周期的亲密度,以此类推,第1个周期的历史亲密度为零或者自定义一个数值。为了构建可信的通信社交网络图,如图3所示,用户A和用户B之间的亲密度迭代更新算法如下:
步骤301、判断用户A与用户B在第i-1个周期的亲密度IntAB(i-1)是否大于用户间亲密度的阈值Intδ,如果是,表明两用户间的亲密度已足够大,第i个周期的亲密度与第i-1个周期的亲密度保持相同,亲密度的更新完成;否则,进入步骤302;
初始i=1,对应的历史亲密度为零或者自定义数值;
步骤302、判断用户A和用户B在第i个周期的非负通信满意度SAB(i)是否等于0,如果是,进入步骤303;否则,进入步骤304;
步骤303、用户A和用户B在第i个周期内未进行通信,用户A和用户B距离上一次通话的周期数tAB自增1,然后判断tAB是否超过用户距离最近一次通话周期数的阈值tδ,如果是,按照用户之间亲密度的衰减函数M对第i个周期的亲密度进行更新;否则第i个周期的亲密度与第i-1个周期的亲密度相同,结束算法。
衰减函数M计算如下:
Figure BDA0002651470600000091
步骤304、用户A和用户B之间的通信满意度SAB(i)大于零,判断tAB是否超过tδ;如果是,第i-1个周期的亲密度经过了衰减,按照亲密度的更新函数W2对第i个周期的亲密度进行更新;否则,第i-1个周期的亲密度未衰减,则按照亲密度的更新函数W1对第i个周期的亲密度进行更新;亲密度更新之后,tAB置为零。
更新函数W1,计算公式如下:
W1(IntAB(i-1),SAB(i))=IntAB(i-1)+μ1*SAB(i)
SAB(i)表示用户A和用户B在第i个周期的通信满意度。μ1是通信满意度在亲密度更新函数W1中的权重系数;μ1越大,表明通信满意度在亲密度的更新中就越重要。
更新函数W2,计算公式如下:
W2(IntAB(max),SAB(i),tAB)=IntAB(max)+μ*SAB(i)+ρ*tAB
ρ是tAB的权重参数,ρ越大,tAB在亲密度的更新中就越重要。
步骤四、同时,将一个周期内用户A与所有交互用户的全量通话话单中,分别统计每个用户个体相关的特征向量;
各用户的特征向量都包括:总的通信次数,成功通信次数、成功通信率、平均通话时长和总的通话时长。
步骤五、利用步骤三分别更新用户A与相交互的每个用户之间的亲密度;
步骤六、根据用户A以及每个交互用户各自对应的个体特征向量,以及与每个交互用户更新后的亲密度建立通信社交网络,基于消息传递网络算法得到每个交互用户对用户A的局部信任度;
通信社交网络以用户间的亲密度为边权、以用户的个体特征向量为节点。
局部信任度基于社交关系拓扑,从中提取与目标用户相交互的所有用户。在这些用户的个体特征向量和用户间的亲密度构成的局部社交关系拓扑的基础上,可以利用消息传递网络计算目标用户的局部信任度。
消息传递网络针对三层社交网络特点,采用两层空域卷积更新每个用户状态,采用两层全连接网络定义读出函数。利用空域卷积为用户产生嵌入表示:
首先输入目标用户及其所有交互用户的个体特征向量和用户间的亲密度;
然后学习神经网络,将图的特征转换并累计,计算目标用户和其所有交互用户的终态。图的特征包括点的特征和边的特征,点的特征就是用户个体相关的特征向量,边的特征是用户间的亲密度。
最后将用户集合的终态转换为整个通信社交网络的状态,输出所有交互用户对目标用户的局部信任度。
步骤七、将用户A与每个交互用户的局部信任度构成局部信任度向量,用户A与每个交互用户的亲密度构成亲密度向量,做点积运算得到用户A的局部推荐信任度。
目标用户的局部推荐信任度同目标用户与其交互用户的亲密度和局部信任度有关,设用户A的交互用户集合为{0,1,2,...j,...J},用户j在第i个周期的局部信任度为Tj(i)(Tj(i)∈[0,1])用户A与用户j在第i个周期的亲密度为IntAj(i),则用户A在第i个周期的局部推荐信任度为TRA(i):
Figure BDA0002651470600000111
步骤八、根据用户A的局部信任度、局部推荐信任度和历史置信度对用户A当前周期的置信度进行迭代更新;
具体过程为、针对第i-1个周期,判断用户A的历史置信度R(i-1)是否高于置信度的高阈值Rβ,如果是,则表明用户A高度可信,有极小的概率是诈骗电话,极大概率是正常电话。用户A第i个周期的置信度保持不变,即R(i)=R(i-1),置信度更新过程结束;否则,将第i个周期用户A的局部信任度TA(i)和局部信任度的高低阈值分别比较,更新周期tα、周期tβ和周期t的值。
局部信任度的低阈值为Tα,高阈值为Tβ
tα为历史上有通话的周期内局部信任度低于低阈值的周期数,tβ为历史上有通话的周期内局部信任度高于高阈值的周期数,t为历史上有通话的周期数。
更新周期tα、周期tβ和周期t具体为:
判断用户A的局部信任度TA(i)是否大于零,如果是,则周期数t增1,即t=t+1,否则周期数t不变。同理,判断用户A的局部信任度TA(i)是否小于低阈值Tα,如果是,则周期数tα增1,否则周期数tα不变。同理,判断用户A的局部信任度TA(i)是否大于高阈值Tβ,如果是,则周期数tβ增1,否则周期数tβ不变。
接着利用更新的周期数tα和tβ,计算可信因子φ的值,利用可信因子φ更新用户A第i个周期的置信度RA(i)。
可信因子φ的计算公式如下:
Figure BDA0002651470600000112
ω为用来调节可信因子范围的参数。
更新用户A第i个周期的置信度RA(i)计算公式如下:
RA(i)=RA(i-1)*((μ2*TA(i)+TRA(i))*eλ*φ)
λ是可信因子的系数,表明可信因子在置信度更新过程中的重要程度。μ2是用户A的局部信任度TA(i)的权重系数,表明局部信任度在置信度更新过程中的重要程度。
步骤九、判断更新后的用户A的置信度是否低于阈值,如果是,则用户A为疑似诈骗用户,否则,用户A正常;
步骤十、同理,选择下一个目标用户,重复步骤一到步骤九,统计出疑似诈骗用户的名单。
本发明除了依据电话号码的通话指标之外,也注重电话号码之间通信时隐含的社交信息,从这两个方面能够更加真实地衡量电话号码的置信度;通过周期性对置信度和电话号码间的亲密度进行迭代更新,更多的是依赖用户长期的通信行为;基于电话号码的置信度判断电话是否为疑似诈骗号码,可以通过调节置信度的阈值更加灵活地筛选疑似诈骗号码。
本发明的核心包括:通信社交关系的量化、亲密度的更新算法和基于通信社交网络的置信度更新算法三个部分。
1)通信社交关系的量化
通信社交关系的量化包括通信强度的量化和通信满意度的量化。通信强度用于衡量周期内用户对于另一用户的通信行为的频繁程度。通信强度具有不对称性,且通信行为越频繁,通信强度越大;反之,通信强度越小。通信满意度根据周期内双方的通信强度衡量通信双方的满意度。通信满意度具有对称性,且双方的通信强度差值越小,均衡程度越大,通信满意度越大。反之,双方的通信强度差值越大,均衡程度越小,通信满意度越小。
2)亲密度的更新算法
为了能够对通信社交网络图的置信度进行迭代更新,需要构造一个以用户的特征向量为节点的值、以用户间的亲密度为边权的通信社交无向网络图。亲密度用于反映用户间长期的通信满意度。经过通信社交关系的量化部分,得到用户周期内的通信满意度。在通信满意度的基础上,对亲密度进行迭代更新。亲密度的迭代更新需要满足多个条件:当用户间一段时间没有交互行为时,用户间的亲密度应该下降;当用户间的亲密度到达一定水平时,用户间的亲密度应该不再下降;长期具有交互行为的两用户,即使交互行为不频繁,用户间的亲密度也应处于较高水平。为了满足亲密度的这些条件,本发明定义了亲密度的衰减函数和两个更新函数,用于处理不同情况下亲密度的迭代更新。
3)基于通信社交网络的置信度更新算法
基于通信社交网络的置信度更新算法主要过程包括局部信任度的计算、局部推荐信任度的计算和置信度的迭代更新。局部信任度的计算需要构造目标用户的局部社交网络图,此局部社交网络图以目标用户及其交互用户的个体特征向量为节点、以用户间的亲密度为边权,将此局部社交网络图输入到消息传递网络中,消息传递网络输出目标用户的局部置信度。局部推荐信任度的计算以局部信任度为基础,目标用户的局部推荐信任度为目标用户与其交互用户的亲密度构成的亲密度向量和交互用户的局部信任度构成的局部信任度做点积运算。置信度迭代更新依赖于用户的局部信任度和局部推荐信任度和置信度的阈值。本发明定义的置信度更新的算法,能够较为准确地通过置信度对用户进行评价。根据目标用户的置信度分析其通信行为;如果目标用户的置信度较高,则此用户的通信行为风险较小;反之,目标用户的置信度较低,则此用户的通信行为风险较高,疑似诈骗用户,即可采取对应措施。

Claims (5)

1.一种基于社交评价动态更新的通信行为识别方法,其特征在于,具体步骤如下:
步骤一、针对目标用户A,从一个周期内向用户B呼出的全量通话话单中统计通信指标;
步骤二、根据通信指标得到用户间量化的通信强度,进而得到用户间量化的通信满意度;
首先,在时间周期T内用户A向用户B呼出的通信强度公式为:
I(A,B)=∑λiXi(A,B)
∑λi=1
Xi(A,B)∈[0,1]
其中,λi对应第i个通信指标的权重;Xi(A,B)为第i个通信指标归一化后的值;
然后,利用通信强度计算周期T内用户A和用户B之间的通信满意度,公式为:
Figure FDA0002651470590000011
Figure FDA0002651470590000012
Figure FDA0002651470590000013
且b>a
其中,g1(I(A,B),I(B,A))用于衡量双方用户通信强度的均衡程度,随着双方用户通信强度的均衡程度的增大而增大;σ1表示g1(I(A,B),I(B,A))的权重;I(B,A)表示时间周期T内用户B向用户A呼出的通信强度;
g2(I(A,B),I(B,A))用于衡量双方用户通信强度的差值,随着双方用户通信强度差值的增大而减少;σ2表示g2(I(A,B),I(B,A))的权重;
a和b是自定义的参数,用于调节通信满意度随着通信强度差值减小的坡度;
步骤三、根据当前周期T的通信满意度结合历史亲密度,对当前周期的用户A和用户B之间亲密度进行迭代更新;
用户A和用户B之间的亲密度迭代更新算法如下:
步骤301、判断用户A与用户B在第i-1个周期的亲密度IntAB(i-1)是否大于亲密度阈值Intδ,如果是,表明两用户间的亲密度已足够大,第i个周期的亲密度与第i-1个周期的亲密度保持相同,结束算法;否则,进入步骤302;
初始i=1,对应的历史亲密度为零或者自定义数值;
步骤302、判断用户A和用户B在第i个周期的非负通信满意度SAB(i)是否等于0,如果是,进入步骤303;否则,进入步骤304;
步骤303、用户A和用户B在第i个周期内未进行通信,用户A和用户B距离上一次通话的周期数tAB自增1,然后判断tAB是否超过周期阈值tδ,如果是,按照用户之间亲密度的衰减函数M对第i个周期的亲密度进行更新;否则第i个周期的亲密度与第i-1个周期的亲密度相同,结束算法;
衰减函数M计算如下:
Figure FDA0002651470590000021
步骤304、用户A和用户B之间的通信满意度SAB(i)大于零,判断tAB是否超过tδ;如果是,第i-1个周期的亲密度经过了衰减,按照亲密度的更新函数W2对第i个周期的亲密度进行更新;否则,第i-1个周期的亲密度未衰减,则按照亲密度的更新函数W1对第i个周期的亲密度进行更新;亲密度更新之后,tAB置为零;
更新函数W1,计算公式如下:
W1(IntAB(i-1),SAB(i))=IntAB(i-1)+μ1*SAB(i)
SAB(i)表示用户A和用户B在第i个周期的通信满意度。μ1是通信满意度在亲密度更新函数W1中的权重系数;μ1越大,表明通信满意度在亲密度的更新中就越重要;
更新函数W2,计算公式如下:
W2(IntAB(max),SAB(i),tAB)=IntAB(max)+μ*SAB(i)+ρ*tAB
ρ是tAB的权重参数,ρ越大,tAB在亲密度的更新中就越重要;
步骤四、同时,将一个周期内用户A与所有交互用户的全量通话话单中,分别统计每个用户个体相关的特征向量;
步骤五、利用步骤三分别更新用户A与相交互的每个用户之间的亲密度;
步骤六、根据用户A以及每个交互用户各自对应的个体特征向量,以及与每个交互用户更新后的亲密度建立通信社交网络,基于消息传递网络算法得到每个交互用户对用户A的局部信任度;
步骤七、将用户A与每个交互用户的局部信任度构成局部信任度向量,用户A与每个交互用户的亲密度构成亲密度向量,做点积运算得到用户A的局部推荐信任度;
用户A的交互用户集合为{0,1,2,...j,...J},用户j在第i个周期的局部信任度为Tj(i),用户A与用户j在第i个周期的亲密度为IntAj(i),则用户A在第i个周期的局部推荐信任度为TRA(i):
Figure FDA0002651470590000022
步骤八、根据用户A的局部信任度、局部推荐信任度和历史置信度对用户A当前周期的置信度进行迭代更新;
步骤九、判断更新后的用户A的置信度是否低于阈值,如果是,则用户A为疑似诈骗用户,否则,用户A正常;
步骤十、同理,选择下一个目标用户,重复步骤一到步骤九,统计出疑似诈骗用户的名单。
2.如权利要求1所述的一种基于社交评价动态更新的通信行为识别方法,其特征在于,所述的话单包括:主叫号码、被叫号码、呼损原因、起呼时间、应答时间和挂机时间;
通信指标是指从全部通话话单中统计成功通话次数、平均通话时长和累计通话时长。
3.如权利要求1所述的一种基于社交评价动态更新的通信行为识别方法,其特征在于,步骤四中所述的每个用户的特征向量包括:总的通信次数,成功通信次数、成功通信率、平均通话时长和总的通话时长。
4.如权利要求1所述的一种基于社交评价动态更新的通信行为识别方法,其特征在于,步骤六中所述的通信社交网络以用户间的亲密度为边权、以用户的个体特征向量为节点;
消息传递网络采用两层空域卷积和两层全连接网络:首先输入用户A及其所有交互用户的个体特征向量和用户间的亲密度,然后学习神经网络将图的特征转换并累计,计算每个用户的终态,最后将所有用户的终态转换为整个通信社交网络的状态,输出每个交互用户对用户A的局部信任度。
5.如权利要求1所述的一种基于社交评价动态更新的通信行为识别方法,其特征在于,步骤八中所述的更新的步骤为:
首先、针对第i-1个周期,判断用户A的历史置信度R(i-1)是否高于置信度的高阈值Rβ,如果是,则表明用户A高度可信,用户A第i个周期的置信度保持不变,即R(i)=R(i-1),更新过程结束;否则,将第i个周期用户A的局部信任度TA(i)和局部信任度的高低阈值分别比较,更新周期tα、周期tβ和周期t的值;
局部信任度的低阈值为Tα,高阈值为Tβ
tα为历史上有通话的周期内局部信任度低于低阈值的周期数,tβ为历史上有通话的周期内局部信任度高于高阈值的周期数,t为历史上有通话的周期数;
更新周期tα、周期tβ和周期t具体为:
判断用户A的局部信任度TA(i)是否大于零,如果是,则周期数t增1,即t=t+1,否则周期数t不变。同理,判断用户A的局部信任度TA(i)是否小于低阈值Tα,如果是,则周期数tα增1,否则周期数tα不变。同理,判断用户A的局部信任度TA(i)是否大于高阈值Tβ,如果是,则周期数tβ增1,否则周期数tβ不变;
接着利用更新的周期数tα和tβ,计算可信因子φ的值,利用可信因子φ更新用户A第i个周期的置信度RA(i);
可信因子φ的计算公式如下:
Figure FDA0002651470590000041
ω为用来调节可信因子范围的参数;
更新用户A第i个周期的置信度RA(i)计算公式如下:
RA(i)=RA(i-1)*((μ2*TA(i)+TRA(i))*eλ*φ)
λ是可信因子的系数,表明可信因子在置信度更新过程中的重要程度;μ2是用户A的局部信任度TA(i)的权重系数,表明局部信任度在置信度更新过程中的重要程度。
CN202010872161.5A 2020-08-26 2020-08-26 一种基于社交评价动态更新的通信行为识别方法 Active CN112153220B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010872161.5A CN112153220B (zh) 2020-08-26 2020-08-26 一种基于社交评价动态更新的通信行为识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010872161.5A CN112153220B (zh) 2020-08-26 2020-08-26 一种基于社交评价动态更新的通信行为识别方法

Publications (2)

Publication Number Publication Date
CN112153220A true CN112153220A (zh) 2020-12-29
CN112153220B CN112153220B (zh) 2021-08-27

Family

ID=73888466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010872161.5A Active CN112153220B (zh) 2020-08-26 2020-08-26 一种基于社交评价动态更新的通信行为识别方法

Country Status (1)

Country Link
CN (1) CN112153220B (zh)

Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101969647A (zh) * 2010-09-10 2011-02-09 南京邮电大学 移动自组织网络中基于信任模型的协作通信方法
CN102164149A (zh) * 2011-05-17 2011-08-24 北京交通大学 一种基于标识分离映射网络的映射欺骗防范方法
CN102915307A (zh) * 2011-08-02 2013-02-06 腾讯科技(深圳)有限公司 一种个性化信息推荐的方法、装置及信息处理系统
US8595801B2 (en) * 2008-08-19 2013-11-26 Eharmony, Inc. Creating tests to identify fraudulent users
CN104660594A (zh) * 2015-02-09 2015-05-27 中国科学院信息工程研究所 一种面向社交网络的虚拟恶意节点及其网络识别方法
US20170011232A1 (en) * 2014-01-08 2017-01-12 Callminer, Inc. Real-time compliance monitoring facility
CN106411707A (zh) * 2016-09-29 2017-02-15 重庆工商大学 社交网络中基于辅助决策的双尺度信任感知方法
CN106936997A (zh) * 2017-03-20 2017-07-07 华中科技大学鄂州工业技术研究院 一种基于社交关系图谱的垃圾语音识别方法和系统
CN107547718A (zh) * 2017-08-22 2018-01-05 电子科技大学 基于深度学习的电信诈骗识别与防御系统
CN107809370A (zh) * 2016-09-09 2018-03-16 腾讯科技(深圳)有限公司 用户推荐方法及装置
CN108427715A (zh) * 2018-01-30 2018-08-21 重庆邮电大学 一种融合信任度的社交网络好友推荐方法
CN109218090A (zh) * 2018-09-10 2019-01-15 中国民航大学 一种物联网节点信任度评估方法
CN109286631A (zh) * 2018-10-18 2019-01-29 长安大学 车载社交网络中融合社交属性的车辆节点信任评估方法
CN109451182A (zh) * 2018-10-19 2019-03-08 北京邮电大学 一种诈骗电话的检测方法和装置
CN109600752A (zh) * 2018-11-28 2019-04-09 国家计算机网络与信息安全管理中心 一种深度聚类诈骗检测的方法和装置
CN109816519A (zh) * 2019-01-25 2019-05-28 宜人恒业科技发展(北京)有限公司 一种欺诈团伙识别方法、装置及设备
CN109905399A (zh) * 2019-03-14 2019-06-18 哈尔滨工程大学 一种基于自我网络结构演化的社交媒体个体异常用户检测方法
US10432605B1 (en) * 2012-03-20 2019-10-01 United Services Automobile Association (Usaa) Scalable risk-based authentication methods and systems
CN111026536A (zh) * 2019-12-16 2020-04-17 北京邮电大学 一种基于信任融合评估的任务处理方法、装置及边缘节点
CN111192153A (zh) * 2019-12-19 2020-05-22 浙江大搜车软件技术有限公司 人群关系网络构建方法、装置、计算机设备和存储介质
CN111201528A (zh) * 2017-09-22 2020-05-26 摩根大通国家银行 整合网络欺诈情报和支付风险决策的系统和方法
CN111565188A (zh) * 2020-04-30 2020-08-21 长安大学 基于结合消息类型和信任值置信度的vanet信任模型工作方法

Patent Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8595801B2 (en) * 2008-08-19 2013-11-26 Eharmony, Inc. Creating tests to identify fraudulent users
CN101969647A (zh) * 2010-09-10 2011-02-09 南京邮电大学 移动自组织网络中基于信任模型的协作通信方法
CN102164149A (zh) * 2011-05-17 2011-08-24 北京交通大学 一种基于标识分离映射网络的映射欺骗防范方法
CN102915307A (zh) * 2011-08-02 2013-02-06 腾讯科技(深圳)有限公司 一种个性化信息推荐的方法、装置及信息处理系统
US10432605B1 (en) * 2012-03-20 2019-10-01 United Services Automobile Association (Usaa) Scalable risk-based authentication methods and systems
US20170011232A1 (en) * 2014-01-08 2017-01-12 Callminer, Inc. Real-time compliance monitoring facility
CN104660594A (zh) * 2015-02-09 2015-05-27 中国科学院信息工程研究所 一种面向社交网络的虚拟恶意节点及其网络识别方法
CN107809370A (zh) * 2016-09-09 2018-03-16 腾讯科技(深圳)有限公司 用户推荐方法及装置
CN106411707A (zh) * 2016-09-29 2017-02-15 重庆工商大学 社交网络中基于辅助决策的双尺度信任感知方法
CN106936997A (zh) * 2017-03-20 2017-07-07 华中科技大学鄂州工业技术研究院 一种基于社交关系图谱的垃圾语音识别方法和系统
CN107547718A (zh) * 2017-08-22 2018-01-05 电子科技大学 基于深度学习的电信诈骗识别与防御系统
CN111201528A (zh) * 2017-09-22 2020-05-26 摩根大通国家银行 整合网络欺诈情报和支付风险决策的系统和方法
CN108427715A (zh) * 2018-01-30 2018-08-21 重庆邮电大学 一种融合信任度的社交网络好友推荐方法
CN109218090A (zh) * 2018-09-10 2019-01-15 中国民航大学 一种物联网节点信任度评估方法
CN109286631A (zh) * 2018-10-18 2019-01-29 长安大学 车载社交网络中融合社交属性的车辆节点信任评估方法
CN109451182A (zh) * 2018-10-19 2019-03-08 北京邮电大学 一种诈骗电话的检测方法和装置
CN109600752A (zh) * 2018-11-28 2019-04-09 国家计算机网络与信息安全管理中心 一种深度聚类诈骗检测的方法和装置
CN109816519A (zh) * 2019-01-25 2019-05-28 宜人恒业科技发展(北京)有限公司 一种欺诈团伙识别方法、装置及设备
CN109905399A (zh) * 2019-03-14 2019-06-18 哈尔滨工程大学 一种基于自我网络结构演化的社交媒体个体异常用户检测方法
CN111026536A (zh) * 2019-12-16 2020-04-17 北京邮电大学 一种基于信任融合评估的任务处理方法、装置及边缘节点
CN111192153A (zh) * 2019-12-19 2020-05-22 浙江大搜车软件技术有限公司 人群关系网络构建方法、装置、计算机设备和存储介质
CN111565188A (zh) * 2020-04-30 2020-08-21 长安大学 基于结合消息类型和信任值置信度的vanet信任模型工作方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
朱碧川等: "An Edge-Assisted Vehicle Routing Method Based on Game-Theoretic Multiagent Learning", 《2019 IEEE 25TH INTERNATIONAL CONFERENCE ON PARALLEL AND DISTRIBUTED SYSTEMS 》 *
杨浩波: "基于卷积神经网络的电信欺诈行为识别系统", 《电信技术》 *

Also Published As

Publication number Publication date
CN112153220B (zh) 2021-08-27

Similar Documents

Publication Publication Date Title
CN109615116B (zh) 一种电信诈骗事件检测方法和检测系统
CN109600752B (zh) 一种深度聚类诈骗检测的方法和装置
Xing et al. Employing latent dirichlet allocation for fraud detection in telecommunications
CN109451182B (zh) 一种诈骗电话的检测方法和装置
CN106686264B (zh) 一种诈骗电话筛选分析方法及系统
CN111917574B (zh) 社交网络拓扑模型及构建方法、用户置信度和亲密度计算方法及电信诈骗智能拦截系统
CN107038449B (zh) 一种欺诈用户的识别方法及装置
CN109168168B (zh) 一种检测国际盗打的方法
CN107169629A (zh) 一种电信诈骗识别方法及数据处理设备
CN101686444B (zh) 垃圾短信发送号码实时检测系统及方法
CN111614690A (zh) 一种异常行为检测方法及装置
CN110177179B (zh) 一种基于图嵌入的诈骗号码识别方法
CN113961712B (zh) 一种基于知识图谱的诈骗电话分析方法
CN110493476B (zh) 一种检测方法、装置、服务器及存储介质
CN107092651B (zh) 一种基于通信网络数据分析的关键人物挖掘方法及系统
CN112153221B (zh) 一种基于社交网络图计算的通信行为识别方法
Irarrázaval et al. Telecom traffic pumping analytics via explainable data science
CN112464058A (zh) 一种基于XGBoost算法的电信互联网诈骗识别方法
CN112153220B (zh) 一种基于社交评价动态更新的通信行为识别方法
CN111131627B (zh) 基于流数据图谱的个人有害呼叫检测方法、装置及可读介质
CN109274834B (zh) 一种基于通话行为的快递号码识别方法
Alraouji et al. International call fraud detection systems and techniques
CN113163057B (zh) 一种诈骗电话动态识别区间构建方法
KR102332997B1 (ko) 금융사기 위험도 판단 서버, 방법 및 프로그램
CN113645356A (zh) 一种基于网内开卡行为分析的诈骗电话识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant