CN110493476B - 一种检测方法、装置、服务器及存储介质 - Google Patents

一种检测方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN110493476B
CN110493476B CN201910646703.4A CN201910646703A CN110493476B CN 110493476 B CN110493476 B CN 110493476B CN 201910646703 A CN201910646703 A CN 201910646703A CN 110493476 B CN110493476 B CN 110493476B
Authority
CN
China
Prior art keywords
telephone number
user
call
victim
behavior data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910646703.4A
Other languages
English (en)
Other versions
CN110493476A (zh
Inventor
何洋
胡入祯
戴晶
邵妍
叶艳
鲁银冰
林宇俊
许鑫伶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Hangzhou Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910646703.4A priority Critical patent/CN110493476B/zh
Publication of CN110493476A publication Critical patent/CN110493476A/zh
Application granted granted Critical
Publication of CN110493476B publication Critical patent/CN110493476B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6027Fraud preventions

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例涉及数据处理领域,公开了一种检测方法、装置、服务器及存储介质。本申请的部分实施例中,检测方法包括:在确定用户的通话行为数据指示用户的通话行为符合第一预设条件后,根据用户的通话行为数据或用户的电话号码,确定可疑电话号码;根据可疑电话号码的第一通话特征,确定可疑电话号码是否为诈骗电话号码;其中,可疑电话号码的第一通话特征是根据可疑电话号码的通话行为数据,和/或,可疑电话号码的消费行为数据确定的。该部分实施例中,避免了侵犯用户通话隐私、影响用户感知等问题。

Description

一种检测方法、装置、服务器及存储介质
技术领域
本发明实施例涉及数据处理领域,特别涉及一种检测方法、装置、服务器及存储介质。
背景技术
近年来,通讯信息诈骗造成的损失逐年递增,且诈骗形式和剧本层出不穷。诈骗团伙多冒充亲友、公职人员,对受害人进行欺诈,在多次通话并获得受害人信任后,诱使受害人将资金转至诈骗团伙账户,给用户带来财产损失。
然而,发明人发现现有技术中至少存在如下问题:已标记的诈骗电话号码样本难以获取,而爬取第三方黑名单库所耗费时间较长,且对于活跃期短或新出现的诈骗电话号码难以识别。业内的有关通讯信息诈骗识别方面的技术较多,但存在侵犯用户通话隐私、影响用户感知等问题。
发明内容
本发明实施方式的目的在于提供一种检测方法、装置、服务器及存储介质,使得避免了侵犯用户通话隐私、影响用户感知等问题。
为解决上述技术问题,本发明的实施方式提供了一种检测方法,包括以下步骤:在确定用户的通话行为数据指示用户的通话行为符合第一预设条件后,根据用户的通话行为数据或用户的电话号码,确定可疑电话号码;根据可疑电话号码的第一通话特征,确定可疑电话号码是否为诈骗电话号码;其中,可疑电话号码的第一通话特征是根据可疑电话号码的通话行为数据,和/或,可疑电话号码的消费行为数据确定的。
本发明的实施方式还提供了一种检测装置,包括:确定模块和判断模块;确定模块用于在确定用户的通话行为数据指示用户的通话行为符合第一预设条件后,根据用户的通话行为数据或用户的电话号码,确定可疑电话号码;判断模块用于根据可疑电话号码的第一通话特征,确定可疑电话号码是否为诈骗电话号码;其中,可疑电话号码的第一通话特征是根据可疑电话号码的通话行为数据,和/或,可疑电话号码的消费行为数据确定的。
本发明的实施方式还提供了一种服务器,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施方式提及的检测方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述实施方式提及的检测方法。
本发明实施方式相对于现有技术而言,在用户的通话行为符合第一预设条件,即发生通话异常行为时,根据用户的通话记录确定可疑电话号码。从通话行为数据,和/或,消费行为数据中提取可疑电话号码的通话特征,确定可疑电话号码是否为诈骗电话进行判别,使得能够在不侵犯用户隐私的情况下,识别诈骗电话,避免了侵犯用户通话隐私、影响用户感知等问题。
另外,根据可疑电话号码的第一通话特征,确定可疑电话号码是否为诈骗电话号码,具体包括:将可疑电话号码记录在可疑电话号码集中;根据可疑电话号码集中各可疑电话号码的第一通话特征,确定各可疑电话号码对应的空间点,得到可疑电话号码点集;通过离群点检测算法,确定可疑电话号码点集中的离群点;判断可疑电话号码是否为离群点;若判断结果为是,则确定可疑电话号码为诈骗电话号码。该实现中,提高了识别准确性。
另外,在根据可疑电话号码的第一通话特征,确定可疑电话号码是否为诈骗电话号码之后,检测方法还包括:获取诈骗电话号码的通话行为数据;根据诈骗电话号码的通话行为数据,确定受害者电话号码;根据受害者电话号码的通话行为数据,确定受害者的易感级别。该实现中,为第三方介入等操作提供了数据基础。
另外,根据受害者电话号码的通话行为数据,确定受害者的易感级别,具体包括:根据受害者电话号码的通话行为数据,以及各个易感级别的第二预设条件,确定受害者的易感级别。
另外,在根据受害者电话号码的通话行为数据,确定受害者的易感级别之后,检测方法还包括:获取受害者的第二通话特征;受害者的第二通话特征是根据受害者电话号码的通话行为数据,和/或,受害者的消费行为数据确定的;将受害者的易感级别和受害者的第二通话特征,作为样本数据;根据样本数据,以及待测用户的第三通话特征,确定待测用户的易感级别;待测用户的第三通话特征根据待测用户的通话行为数据,和/或,待测用户的消费行为数据确定的。该实现中,能够对潜在受害者或新入网用户分级,便于对不同易感级别的用户采用不同措施。
另外,根据样本数据,以及待测用户的第三通话特征,确定待测用户的易感级别,具体包括:利用k最近邻算法,确定样本数据中,与待测用户的第三通话特征最接近的前N个受害者的第二通话特征;N为正整数;根据最接近的前N个受害者的第二通话特征对应的易感级别,确定待测用户的易感级别。
另外,第一预设条件为:用户在第一预设时长内的呼叫次数大于第一阈值,且,用户的电话号码属于被叫方的陌生电话号码;或者,用户在接听陌生电话号码后的第二预设时长内,呼叫预设电话号码集中的电话号码,预设电话号码集中包括报警电话号码,和/或,客服电话号码。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本发明的第一实施方式的检测方法的流程图;
图2是本发明的第二实施方式的检测方法的流程图;
图3是本发明的第二实施方式的易感级别判断的过程的示意图;
图4是本发明的第三实施方式的检测装置的结构示意图;
图5是本发明的第四实施方式的服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的第一实施方式涉及一种检测方法,应用于服务器。如图1所示,该检测方法包括以下步骤:
步骤101:在确定用户的通话行为数据指示用户的通话行为符合第一预设条件后,根据用户的通话行为数据或用户的电话号码,确定可疑电话号码。
具体地说,由于单独一次通话一般无法完成整个诈骗流程,多是由诈骗团伙成员各有分工,通过多次通话获得受害人信任,从而完成诈骗。而从用户角度而言,大部分用户接到诈骗电话后可短时间内识别,不会有后续通话行为。而无法短时间内识别诈骗电话的用户,则会与诈骗号码或其他号码有交互行为,且通话时间较长。因此,可从用户异常行为角度入手,通过挖掘用户的通话行为,定位可疑电话号码。
值得一提的是,由于服务器可以通过监控用户的通话行为数据,得到可疑电话号码,不对用户通话内容进行监听,避免了侵犯用户通话隐私、影响用户感知等问题。
在一个例子中,用户的通话行为数据中包括用户每次通话行为对应的电话号码和通话时间,第一预设条件为:用户在第一预设时长内的呼叫次数大于第一阈值,且,用户的电话号码属于被叫方的陌生电话号码。具体地说,由于诈骗人员往往需要广撒网,常常会在短时间内拨打多个电话号码。因此,服务器可以监控用户的通话行为数据,若通话行为数据指示用户在第一预设时长内的呼叫次数大于预设的第一阈值,并且,对于被叫方而言,该用户的电话号码是陌生号码,说明该用户可能使用该电话号码进行诈骗,将该用户的电话号码作为可疑电话号码。其中,陌生号码指第二预设时间(如30天)内未曾与该用户有过通话行为的号码,且排除客服电话、警用电话等。
需要说明的是,本领域技术人员可以理解,陌生电话的含义可以根据应用场景定义,本实施方式不限制陌生电话的具体含义。
需要说明的是,本领域技术人员可以理解,实际应用中,第一预设时长和第一阈值可以根据经验设置,本实施方式不限制第一预设时长和第一阈值的具体取值。
在一个例子中,用户的通话行为数据中包括用户每次通话行为对应的电话号码和通话时间,第一预设条件为:用户在接听陌生电话号码后的第二预设时长内,呼叫预设电话号码集中的电话号码。预设电话号码集中包括报警电话号码,和/或,客服电话号码。由于诈骗人员可能冒充公检法、警察或者客服,给他人拨打电话,实施诈骗。而接到诈骗电话的用户为确认真伪,可能在接到电话后,会致电相关机构的真实电话,以确定真假,也可能会在识别出对方是诈骗人员后,拨打报警电话。因此,可以将报警电话、客服电话等写入预设电话号码集中。服务器可以基于用户的通话行为数据,确定用户是否发生以下行为:在接听陌生电话号码后的第二预设时长内,呼叫预设电话号码集中的电话号码,若确定是,说明用户接听的陌生电话号码可能是诈骗电话号码,将该陌生电话号码作为可疑电话号码。
在一个例子中,用户的通话行为数据中包括用户每次通话行为对应的电话号码和通话时间,第一预设条件为:用户在接听陌生电话后,在第三预设时间内拨打另一陌生电话。具体地说,由于常常会出现多人合伙诈骗的情况,该情况下,被骗者往往会在接听陌生电话后,按照该陌生电话的指示,拨通另一陌生电话,若用户发生该通话行为,则说明用户有可能被诈骗了,上述两个电话号码有可能是诈骗电话。因此,服务器通过通话行为数据监控到该通话行为后,将上述两个陌生电话作为可疑电话号码。
在一个例子中,第一预设条件包括上述三种情况提及的所有条件,服务器在监控到用户通话行为符合任一条件时,根据上述三种情况的描述,将相关的电话号码作为可疑诈骗电话号码。
需要说明的是,本领域技术人员可以理解,实际应用中,还可以设置其他的第一预设条件,此处不一一列举。
步骤102:根据可疑电话号码的第一通话特征,确定可疑电话号码是否为诈骗电话号码。
具体地说,可疑电话号码的第一通话特征是根据可疑电话号码的通话行为数据,和/或,可疑电话号码的消费行为数据确定的。
在一个例子中,通话行为数据可疑根据信令数据统计获得,消费行为数据可以根据业务运营支撑系统(BOSS)数据获取。
在一个例子中,根据信令数据和BOSS数据获得的第一通话特征可以如表1所示。
表1
Figure BDA0002133667610000051
需要说明的是,本领域技术人员可以理解,表1仅为示例说明,实际应用中,可以有选择的选取联系人信息中的任意特征、主被叫信息的任意特征和消费行为信息中的任意特征,组成第一通话特征。
在一个例子中,服务器确定可疑电话号码是否是诈骗电话号码的过程如下:服务器将可疑电话号码记录在可疑电话号码集中;根据可疑电话号码集中各可疑电话号码的第一通话特征,确定各可疑电话号码对应的空间点,得到可疑电话号码点集;通过离群点检测算法,确定可疑电话号码点集中的离群点;判断可疑电话号码是否为离群点;若判断结果为是,则确定可疑电话号码为诈骗电话号码。具体地说,诈骗电话和广告推销等非诈骗电话,均具有主叫高频、外地联系人占比高、通话时长长尾型分布等特点。为进一步精确判定诈骗电话号码,引入离群点检测方法进行精准识别。由于对于疑似诈骗电话样本,难以获得其是否为真正诈骗的标签,因此采用无监督学习方法中的离群点检测技术,找到疑似诈骗电话中的异常点,作为诈骗电话。即,将可疑电话号码集视为X,通过引入基于相对密度概念技术,将离群的得分较高的前N个号码视为诈骗电话。其中,离群点检测算法步骤如下:
步骤1021:设置最近邻个数k。
步骤1022:确定可疑电话号码集中的每个可疑电话号码(x)的k-最近邻集合(N(x,k)),即对可疑电话号码点集进行分割;使用x的最近邻(即N(x,k)中的对象),确定x的密度(density(x,k))。其中,密度的计算公式如公式a所示。
公式a:
Figure BDA0002133667610000061
其中,density(x,k)表示x的密度,|N(x,k)|表示N(x,k)的大小,y表示其中一个最近邻,D(x,k)表示基于马氏距离(Mahalanobis)的邻近性度量,有D(x,k)=(x-k)S-1(x-k)T,S-1为数据协方差的逆矩阵。
步骤1023:确定可疑电话号码点集中的每个可疑电话号码的离群点得分。其中,离群点得分的计算公式如公式b所示。
公式b:
Figure BDA0002133667610000062
其中,outline_score(x,k)表示离群点得分,density(x,k)表示x的密度,|N(x,k)|表示N(x,k)的大小,y表示其中一个最近邻。
步骤1024:将可疑电话号码点集中所有可疑电话号码对应的点按离群点得分进行升序排列,并取前Q个点作为离群点。Q为正整数,可以根据需要设置。
以下结合实际情况,举例说明根据可疑电话号码的第一通话特征,确定可疑电话号码对应的空间点的方式。假设可疑电话号码的第一通话特征中各个通话特征对应的数值分别为A1、A2、A3、A4和A5,则可疑电话号码对应的空间点是坐标(A1,A2,A3,A4,A5)所对应的空间点。
值得一提的是,通过离群点检测算法进一步筛选诈骗电话号码,相对于直接将可疑电话号码作为诈骗电话号码,能够更准确地识别诈骗电话号码。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中提供的检测方法,在用户的通话行为符合第一预设条件,即发生通话异常行为时,根据用户的通话记录确定可疑电话号码。从通话行为数据,和/或,消费行为数据中提取可疑电话号码的通话特征,确定可疑电话号码是否为诈骗电话进行判别,使得能够在不侵犯用户隐私的情况下,识别诈骗电话,避免了侵犯用户通话隐私、影响用户感知等问题。
本发明的第二实施方式涉及一种检测方法。第二实施方式是对第一实施方式的进一步改进,具体改进之处为:在步骤102之后,增加了确定受害者、确定受害者的易感级别等相关步骤。
具体的说,如图2所示,在本实施方式中,包含步骤201至步骤208,其中,步骤201和步骤202分别与第一实施方式中的步骤101和步骤102大致相同,此处不再赘述。下面主要介绍不同之处:
执行步骤201和步骤202。
步骤203:获取诈骗电话号码的通话行为数据。
具体地说,服务器在确定诈骗电话号码后,获取诈骗电话号码的通话行为数据。诈骗电话号码的通话行为数据中包括该诈骗电话号码呼叫的用户的电话号码。
步骤204:根据诈骗电话号码的通话行为数据,确定受害者电话号码。
具体地说,服务器可以将诈骗电话号码呼叫的用户电话号码,作为受害者电话号码。
需要说明的是,本领域技术人员可以理解,为进一步提高确认的受害者电话号码的准确性,也可以采用其他规则,从诈骗电话号码的通话行为数据中,搜索受害者电话号码,本实施方式不限制确定受害者电话号码的具体方式。
值得一提的是,能够匹配出更多受害人,及时对受害人进行分级,帮助运营商和公安介入。
步骤205:根据受害者电话号码的通话行为数据,确定受害者的易感级别。
具体地说,服务器可以根据受害者电话号码的通话行为数据,以及各个易感级别的第二预设条件,确定受害者的易感级别。
需要说明的是,本领域技术人员可以理解,实际应用中,可以易感级别可以包括2个等级,或者3个等级,或者4个等级……或者N个等级,N为大于1的正整数,本实施方式不作限制。其中,每个易感级别所对应的受害者类型,即各个易感级别的第二预设条件可以根据需要设置,本实施方式不作限制。
值得一提的是,及时对受害人进行分级,为运营商和公安介入提供了数据基础,使得运营商和公安可以对用户进行提示告警,降低用户受骗概率。
以下结合实际场景,举例说明确定受害者的易感级别的过程。
由于用户对诈骗电话的识别能力具有差异性,部分用户可以立即判断并挂掉,此类情况受骗可能性较小。而部分用户会在接到诈骗电话后,呼叫亲友、114等号码进行确认,也存在部分用户一天内被多次骚扰的情况,因此需要对多种受害人后续行为场景进行分级。
假设,易感级别包括3个级别,每个易感级别的受害人的定义如下:
1)一级易感级别:与诈骗电话号码通话时长较短,且受害人未发起主叫也未被多次骚扰;或受害人发起主叫,主叫对象为110、95550等公共电话,能够及时中止诈骗。
2)二级易感级别:与诈骗电话号码通话时长较短,且受害人主叫对象为亲密联系人或陌生电话,存在被骗可能;或受害人在短期内遭到了陌生电话的多次骚扰。
3)三级易感级别:与诈骗电话号码通话时长较长,超过10分钟;或受害人在接到诈骗电话后,主动拨给了另一个诈骗电话号码,被骗可能性很大。
受害人发起主叫的对象分为亲密人、诈骗电话号码、公共电话、陌生号码四类,各类对象定义如下:
1)亲密人指在受害者的若干天通话记录中,符合亲密人判定规则的联系人。其中,亲密人判定规则是指同一归属地,且30内与受害人通话不少于5次的号码。受害人接到诈骗电话后,若拨给自己的亲密人。
2)诈骗电话号码指已被识别规则判别为诈骗电话号码的电话号码。
3)公共电话指110、114和95550等客服电话。
4)陌生号码指除了亲密人、诈骗电话、公共电话之外的号码,可能是联系不频繁的亲密人或未标记的诈骗电话,存在一定被骗可能,故将其放入二级深度受害人数据库。
该情况下,易感级别判断的过程如图3所示,包括以下步骤:
步骤301:获取受害者的通话行为数据。
步骤302:判断受害者电话号码与诈骗电话号码的通话时长是否超过第三阈值。若确定是,执行步骤310,否则,执行步骤303。
步骤303:判断受害者电话号码是否发起主叫。若确定是,执行步骤304,否则,执行步骤307。
步骤304:判断受害者是否呼叫联系人。即判断受害者在接到诈骗电话号码后的第三预设时长内,是否呼叫受害者的联系人。若确定是,执行步骤309,否则,执行步骤305。
步骤305:判断受害者是否呼叫其他诈骗电话号码。若确定是,执行步骤310,否则,执行步骤306。
步骤306:判断受害者是否呼叫公共电话号码。若确定是,执行步骤309,否则,执行步骤308。
步骤307:判断受害者是否被多次骚扰,即判断受害者的通话行为数据中是否包括多个诈骗电话号码。若确定是,执行步骤309,否则,执行步骤308。
步骤308:确定受害者的易感级别为一级。之后结束流程。
步骤309:确定受害者的易感级别为二级。之后结束流程。
步骤310:确定受害者的易感级别为三级。之后结束流程。
值得一提的是,根据受害者用户与诈骗电话号码通话情况,对受害者的受害程度进行分级,使得能够帮助运营商模拟受害人心理,从源头上对电信诈骗受害人进行锁定和监控。
步骤206:获取受害者的第二通话特征。
具体地说,受害者的第二通话特征是根据受害者电话号码的通话行为数据,和/或,受害者电话号码的消费行为数据确定的。
在一个例子中,通话行为数据可疑根据信令数据统计获得,消费行为数据可以根据业务运营支撑系统(BOSS)数据获取。
在一个例子中,根据信令数据和BOSS数据获得的第二通话特征可以如表2所示。
表2
Figure BDA0002133667610000091
需要说明的是,本领域技术人员可以理解,表2仅为示例说明,实际应用中,可以有选择的选取联系人信息中的任意特征、主被叫信息的任意特征、消费行为信息中的任意特征和用户信息中的任意特征,组成第二通话特征。
步骤207:将受害者的易感级别和受害者的第二通话特征,作为样本数据。
具体地说,由于同一个易感级别的受害者常常具有一些相似特征,将受害者的易感级别和受害者的第二通话特征作为样本数据,可以用于用户画像和分析。
步骤208:根据样本数据,以及待测用户的第三通话特征,确定待测用户的易感级别。
具体地说,待测用户的第四三通话特征根据待测用户的通话行为数据,和/或,待测用户的消费行为数据确定的。
需要说明的是,本领域技术人员可以理解,为提高待测用户的分级结果的准确性,可以令第三通话特征所包含的特征类别与第二通话特征所包含的特征类别相同,本实施方式不限制具体实现方式。
值得一提的是,基于样本数据快速评估新入用户或未受害用户的易感程度,进而可以更早的提醒为不同用户提供不同的提醒服务。
在一个例子中,利用k最近邻算法,确定样本数据中,与待测用户的第三通话特征最接近的前N个受害者的第二通话特征;N为正整数;根据最接近的前N个受害者的第二通话特征对应的易感级别,确定待测用户的易感级别。
在一个例子中,在利用k最近邻算法时,算法的调试过程如下:
步骤2091:把两组已知的打好标签的样本数据放到分布式系统基本架构(Hadoop)的分布式文件系统(HDFS)上,分别作为训练数据和测试数据。数据的表示形式如下:A用户可以表示成(xA0,xA1,……xA10),B用户可以表示成(xB0,xB1,……xB10),其中xA0表示用户A联系人数,xA1表示外地联系人个数,以此类推。
步骤2092:通过Map函数计算测试数据的节点到训练样本节点之间的距离。其中,距离计算方法采用上述Mahalanobis距离公式。按照距离递增次序排序,排序的结果作为Map的输出结果,并作为Reduce函数的输入量。
步骤2093:在Reduce函数中,选取与当前节点距离最小的m个点,并确定前m个点所在易感级别的出现频率,最终返回前m个点出现频率最高的易感级别作为当前点的预测易感级别。
步骤2094:计算测试数据中kNN算法的错误率,通过调节m的大小来对分类器进行调优。
需要说明的是,本领域技术人员可以理解,实际应用中,还可以通过其他方式确定待测用户的易感级别。例如,将受害者的第二通话特征作为训练数据中的输入数据,将受害者的易感级别作为训练数据中的输出数据;利用训练数据训练深度学习网络模型,得到深度学习网络模型中的各个参数,进而得到易感级别的分级模型;将待测用户的第三通话特征数据分级模型,即可得到待测用户的易感级别。本实施方式不限制确定待测用户的易感级别的方式。
需要说明的是,本领域技术人员可以理解,第二实施方式中,步骤206至步骤208不是必须要执行的步骤,实际应用中,可以有选择性的执行步骤206至步骤208,以及发送告警信息至预设的易感级别的受害者电话号码等其他操作,也可以有选择的执行步骤206至步骤208,以及发送告警信息至预设的易感级别的受害者电话号码等其他操作中的任意一种,本实施方式不起限定作用。
需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中提供的检测方法,在用户的通话行为符合第一预设条件,即发生通话异常行为时,根据用户的通话记录确定可疑电话号码。从通话行为数据,和/或,消费行为数据中提取可疑电话号码的通话特征,依据异常点检测识别规则对是否为诈骗电话进行判别,使得能够在不侵犯用户隐私的情况下,识别诈骗电话。除此之外,在可疑电话号码被判别为诈骗电话号码后,筛选出与诈骗电话号码有过通话行为的所有号码,根据通话行为特征判别上述用户受害程度,便于第三方介入,进行监控和告警,提高了电话网络的安全性。最后,根据受害人的通话行为和消费行为,对易感人群进行画像,从而实现对其他用户的易感程度分级。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明的第三实施方式涉及一种检测装置,如图4所示,包括:确定模块401和判断模块402。确定模块401用于在确定用户的通话行为数据指示用户的通话行为符合第一预设条件后,根据用户的通话行为数据或用户的电话号码,确定可疑电话号码。判断模块402用于根据可疑电话号码的第一通话特征,确定可疑电话号码是否为诈骗电话号码;其中,可疑电话号码的第一通话特征是根据可疑电话号码的通话行为数据,和/或,可疑电话号码的消费行为数据确定的。
不难发现,本实施方式为与第一实施方式相对应的系统实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明的第四实施方式涉及一种服务器,如图5所示,包括:至少一个处理器501;以及,与至少一个处理器501通信连接的存储器502;其中,存储器502存储有可被至少一个处理器501执行的指令,指令被至少一个处理器501执行,以使至少一个处理器501能够执行上述实施方式提及的检测方法。
该服务器包括:一个或多个处理器501以及存储器502,图5中以一个处理器501为例。处理器501、存储器502可以通过总线或者其他方式连接,图5中以通过总线连接为例。存储器502作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器501通过运行存储在存储器502中的非易失性软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述检测方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储选项列表等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施方式中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至外接设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器502中,当被一个或者多个处理器501执行时,执行上述任意方法实施方式中的检测方法。
上述产品可执行本申请实施方式所提供的方法,具备执行方法相应的功能模块和有益效果,未在本实施方式中详尽描述的技术细节,可参见本申请实施方式所提供的方法。
本发明的第五实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (7)

1.一种检测方法,其特征在于,包括:
在确定用户的通话行为数据指示用户的通话行为符合第一预设条件后,根据所述第一预设条件中的陌生电话号码确定可疑电话号码,其中,所述第一预设条件包括所述用户在第一预设时长内的呼叫次数大于第一阈值,且,所述用户的电话号码属于被叫方的陌生电话号码;或者,所述用户在接听陌生电话号码后的第二预设时长内,呼叫预设电话号码集中的电话号码,所述预设电话号码集中包括报警电话号码,和/或,客服电话号码;
根据所述可疑电话号码的第一通话特征,确定所述可疑电话号码是否为诈骗电话号码;其中,所述可疑电话号码的第一通话特征是根据所述可疑电话号码的通话行为数据,和/或,所述可疑电话号码的消费行为数据确定的;
在所述根据所述可疑电话号码的第一通话特征,确定所述可疑电话号码是否为诈骗电话号码之后,所述检测方法还包括:
获取所述诈骗电话号码的通话行为数据;
根据所述诈骗电话号码的通话行为数据,确定受害者电话号码;
根据所述受害者电话号码的通话行为数据,确定所述受害者的易感级别;
在所述根据所述受害者电话号码的通话行为数据,确定所述受害者的易感级别之后,所述检测方法还包括:
获取受害者的第二通话特征;所述受害者的第二通话特征是根据所述受害者电话号码的通话行为数据,和/或,所述受害者的消费行为数据确定的;
将所述受害者的易感级别和所述受害者的第二通话特征,作为样本数据;
根据所述样本数据,以及待测用户的第三通话特征,确定所述待测用户的易感级别;所述待测用户的第三通话特征根据所述待测用户的通话行为数据,和/或,所述待测用户的消费行为数据确定的。
2.根据权利要求1所述的检测方法,其特征在于,所述根据所述可疑电话号码的第一通话特征,确定所述可疑电话号码是否为诈骗电话号码,具体包括:
将所述可疑电话号码记录在可疑电话号码集中;
根据可疑电话号码集中各所述可疑电话号码的第一通话特征,确定各所述可疑电话号码对应的空间点,得到可疑电话号码点集;
通过离群点检测算法,确定所述可疑电话号码点集中的离群点;
判断所述可疑电话号码是否为离群点;
若判断结果为是,则确定所述可疑电话号码为诈骗电话号码。
3.根据权利要求1所述的检测方法,其特征在于,所述根据所述受害者电话号码的通话行为数据,确定所述受害者的易感级别,具体包括:
根据所述受害者电话号码的通话行为数据,以及各个易感级别的第二预设条件,确定所述受害者的易感级别。
4.根据权利要求1所述的检测方法,其特征在于,所述根据所述样本数据,以及待测用户的第三通话特征,确定所述待测用户的易感级别,具体包括:
利用k最近邻算法,确定所述样本数据中,与所述待测用户的第三通话特征最接近的前N个所述受害者的第二通话特征;N为正整数;
根据所述最接近的前N个所述受害者的第二通话特征对应的易感级别,确定所述待测用户的易感级别。
5.一种检测装置,其特征在于,包括:确定模块和判断模块;
所述确定模块用于在确定用户的通话行为数据指示用户的通话行为符合第一预设条件后,根据所述第一预设条件中的陌生电话号码确定可疑电话号码,其中,所述第一预设条件包括所述用户在第一预设时长内的呼叫次数大于第一阈值,且,所述用户的电话号码属于被叫方的陌生电话号码;或者,所述用户在接听陌生电话号码后的第二预设时长内,呼叫预设电话号码集中的电话号码,所述预设电话号码集中包括报警电话号码,和/或,客服电话号码;
所述判断模块用于根据所述可疑电话号码的第一通话特征,确定所述可疑电话号码是否为诈骗电话号码;其中,所述可疑电话号码的第一通话特征是根据所述可疑电话号码的通话行为数据,和/或,所述可疑电话号码的消费行为数据确定的;
所述检测装置还用于:
获取所述诈骗电话号码的通话行为数据;
根据所述诈骗电话号码的通话行为数据,确定受害者电话号码;
根据所述受害者电话号码的通话行为数据,确定所述受害者的易感级别;
所述检测装置还用于:
获取受害者的第二通话特征;所述受害者的第二通话特征是根据所述受害者电话号码的通话行为数据,和/或,所述受害者的消费行为数据确定的;
将所述受害者的易感级别和所述受害者的第二通话特征,作为样本数据;
根据所述样本数据,以及待测用户的第三通话特征,确定所述待测用户的易感级别;所述待测用户的第三通话特征根据所述待测用户的通话行为数据,和/或,所述待测用户的消费行为数据确定的。
6.一种服务器,其特征在于,包括:至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至4中任一项所述的检测方法。
7.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的检测方法。
CN201910646703.4A 2019-07-17 2019-07-17 一种检测方法、装置、服务器及存储介质 Active CN110493476B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910646703.4A CN110493476B (zh) 2019-07-17 2019-07-17 一种检测方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910646703.4A CN110493476B (zh) 2019-07-17 2019-07-17 一种检测方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN110493476A CN110493476A (zh) 2019-11-22
CN110493476B true CN110493476B (zh) 2021-08-10

Family

ID=68547311

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910646703.4A Active CN110493476B (zh) 2019-07-17 2019-07-17 一种检测方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN110493476B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737318B (zh) * 2020-06-24 2024-06-11 国家计算机网络与信息安全管理中心浙江分中心 一种网络诈骗易感人群筛选方法
CN112134998B (zh) * 2020-09-09 2021-08-17 中移(杭州)信息技术有限公司 码号区分方法、电子设备和计算机可读存储介质
CN112291424B (zh) * 2020-10-29 2021-09-14 上海观安信息技术股份有限公司 一种诈骗号码识别方法、装置、计算机设备及存储介质
CN114979369A (zh) * 2022-04-14 2022-08-30 马上消费金融股份有限公司 异常通话检测方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1432217A2 (en) * 2002-12-20 2004-06-23 Lucent Technologies Inc. A monitoring system for a remote telephone station
CN103167502A (zh) * 2013-02-20 2013-06-19 广西英伦通信技术有限公司 基于ota技术整治非法呼叫的方法
CN106254691A (zh) * 2016-09-29 2016-12-21 中国联合网络通信集团有限公司 一种欺诈号码的识别方法和识别装置
CN109816404A (zh) * 2019-01-28 2019-05-28 天津市国瑞数码安全系统股份有限公司 基于dbscan算法的电信诈骗团伙聚类方法及电信诈骗团伙聚类系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106657690A (zh) * 2016-12-09 2017-05-10 北京奇虎科技有限公司 一种防止电话诈骗的方法、装置及移动终端
CN108156336A (zh) * 2018-02-01 2018-06-12 天津市国瑞数码安全系统股份有限公司 一种基于多特征加权模型分析话单号码的控制系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1432217A2 (en) * 2002-12-20 2004-06-23 Lucent Technologies Inc. A monitoring system for a remote telephone station
CN103167502A (zh) * 2013-02-20 2013-06-19 广西英伦通信技术有限公司 基于ota技术整治非法呼叫的方法
CN106254691A (zh) * 2016-09-29 2016-12-21 中国联合网络通信集团有限公司 一种欺诈号码的识别方法和识别装置
CN109816404A (zh) * 2019-01-28 2019-05-28 天津市国瑞数码安全系统股份有限公司 基于dbscan算法的电信诈骗团伙聚类方法及电信诈骗团伙聚类系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
并行离群点检测在异常电话检测中的应用;廖凡迪;《软件》;20121231;第33卷(第12期);151-155 *

Also Published As

Publication number Publication date
CN110493476A (zh) 2019-11-22

Similar Documents

Publication Publication Date Title
CN110493476B (zh) 一种检测方法、装置、服务器及存储介质
CN108924333B (zh) 诈骗电话识别方法、装置和系统
CN107566358B (zh) 一种风险预警提示方法、装置、介质及设备
CN109819126B (zh) 一种异常号码识别方法及装置
CN108471429A (zh) 一种网络攻击告警方法及系统
CN107197463A (zh) 一种电话诈骗的检测方法、存储介质及电子设备
CN103052044B (zh) 一种陌生来电的处理方法及移动终端
CN105825129B (zh) 一种融合通信中恶意软件鉴别方法和系统
CN111654866A (zh) 移动通讯防诈骗的方法、装置及计算机存储介质
CN107092651B (zh) 一种基于通信网络数据分析的关键人物挖掘方法及系统
CN110381218A (zh) 一种识别电话诈骗团伙的方法及装置
CN111131627B (zh) 基于流数据图谱的个人有害呼叫检测方法、装置及可读介质
CN113206909A (zh) 骚扰电话拦截方法及装置
CN107705126B (zh) 一种交易指令的处理方法及装置
JP2000507765A (ja) 遠隔通信網における不正監視
KR20170006158A (ko) 문자 메시지 부정 사용 탐지 방법 및 시스템
CN114338915A (zh) 来电号码风险识别方法、装置、设备及存储介质
CN114449106B (zh) 一种异常电话号码的识别方法、装置、设备和存储介质
CN116367162A (zh) 一种电信诈骗黑名单用户的识别方法、装置、设备及介质
CN116170537A (zh) 一种信息处理方法、设备及存储介质
CN116418915A (zh) 非正常号码识别方法、装置、服务器和存储介质
CN114363465A (zh) 信息处理方法、装置、设备及存储介质
CN110830664B (zh) 识别电信诈骗潜在受害用户的方法和装置
CN112512052A (zh) 基于时间分段特征统计的数据安全异常检测方法及系统
CN113422836B (zh) 养卡用户识别方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant