CN114374769A - 一种异常号码的获取方法、装置、服务器和存储介质 - Google Patents

一种异常号码的获取方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN114374769A
CN114374769A CN202111452214.9A CN202111452214A CN114374769A CN 114374769 A CN114374769 A CN 114374769A CN 202111452214 A CN202111452214 A CN 202111452214A CN 114374769 A CN114374769 A CN 114374769A
Authority
CN
China
Prior art keywords
call
abnormal
user
numbers
screening condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111452214.9A
Other languages
English (en)
Other versions
CN114374769B (zh
Inventor
付金星
王方圆
尚程
梁彧
傅强
蔡琳
杨满智
田野
王杰
金红
陈晓光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eversec Beijing Technology Co Ltd
Original Assignee
Eversec Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eversec Beijing Technology Co Ltd filed Critical Eversec Beijing Technology Co Ltd
Priority to CN202111452214.9A priority Critical patent/CN114374769B/zh
Publication of CN114374769A publication Critical patent/CN114374769A/zh
Application granted granted Critical
Publication of CN114374769B publication Critical patent/CN114374769B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种异常号码的获取方法及装置,该方法包括:根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取至少一个用户号码中,满足第一前置筛选条件的备选用户号码;根据第二预设时间内备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取备选用户号码中的异常用户号码;根据后置筛选条件,对异常用户号码进行筛选。本发明实施例提供的技术方案,实现了基于异常号码识别模型获取存在异常行为的用户号码,前置筛选条件减少了输入至异常号码识别模型中的用户号码数量,提高了异常号码识别模型的识别效率,后置筛选条件在不影响异常识别模型的识别结果的前提下,提高了异常号码的获取准确性。

Description

一种异常号码的获取方法、装置、服务器和存储介质
技术领域
本发明实施例涉及通信技术,尤其涉及一种异常号码的获取方法、装置、服务器和存储介质。
背景技术
随着通信技术的不断发展,以电话作为通信媒介,通过冒充他人、贷款、刷单等为由的电信网络异常行为越来越多,由此对于存在异常行为的异常号码的检测也变得尤为重要。
现有技术中,对于电信网络异常行为的检测和识别,通常是基于用户的通话数据,识别并提取固定且有限数量的几个通话特征作为异常号码的检测依据,但是为了躲避打击,其通话行为也会不断变化,上述检测方式难以有效应对异常行为的行为特征更新,导致异常号码的检测出现遗漏,同时,上述检测方式也常常出现误检测的现象,即将正常号码误检测为异常号码,由此给用户带来极大不便,极大地降低了用户体验。
发明内容
本发明实施例提供了一种异常号码的获取方法、装置、服务器和存储介质,以根据用户号码的通话记录,获取存在异常行为的异常用户号码。
第一方面,本发明实施例提供了一种异常号码的获取方法,包括:
根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码;其中,所述第一前置筛选条件与总通话时长、总通话次数、主叫通话时长和被叫通话次数中的至少一个相关;
根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码;其中,所述第二预设时间大于所述第一预设时间;
根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码;其中,所述后置筛选条件基于所述异常用户号码的反馈结果构建。
第二方面,本发明实施例提供了一种异常号码的获取装置,包括:
备选用户号码获取模块,用于根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码;其中,所述第一前置筛选条件与总通话时长、总通话次数、主叫通话时长和被叫通话次数中的至少一个相关;
异常用户号码获取模块,用于根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码;其中,所述第二预设时间大于所述第一预设时间;
后置筛选执行模块,用于根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码;其中,所述后置筛选条件基于所述异常用户号码的反馈结果构建。
第三方面,本发明实施例还提供了一种服务器,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的异常号码的获取方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时实现本发明任意实施例所述的异常号码的获取方法。
本发明实施例提供的技术方案,实现了基于异常号码识别模型获取存在异常行为的用户号码,前置筛选条件减少了输入至异常号码识别模型中的用户号码数量,提高了异常号码识别模型的识别效率,后置筛选条件在不影响异常识别模型的识别结果的前提下,对其中的正常用户号码进行了过滤,极大地提高了异常号码的获取准确性。
附图说明
图1是本发明实施例一提供的一种异常号码的获取方法的流程图;
图2是本发明实施例二提供的一种异常号码的获取方法的流程图;
图3是本发明实施例三提供的一种异常号码的获取装置的结构框图;
图4是本发明实施例四提供的一种服务器的结构框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种异常号码的获取方法的流程图,本实施例可适用于基于前置筛选条件、异常号码识别模型和后置筛选条件,获取异常用户号码,该方法可以由本发明实施例中异常号码的获取装置来执行,该装置可以通过软件和/或硬件实现,并集成在服务器上,典型的,可以集成在通信运营商的业务服务器中,用于检测存在骚扰等异常行为的用户号码,该方法具体包括如下步骤:
S110、根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码;其中,所述第一前置筛选条件与总通话时长、总通话次数、主叫通话时长和被叫通话次数中的至少一个相关。
第一预设时间通常设定为较小数值,例如,1天,也即获取待检测的一个或多个用户号码1天内的通话记录,第一预设时间可以作为检测周期,即服务器每间隔第一预设时间,进行一次异常号码检测,获取待检测的用户号码在第一预设时间内的通话记录;其中,为了减少待筛选的用户号码的数量,可以将第一预设时间内具备至少一条通话数据的用户号码作为待筛选的用户号码,避免对第一预设时间内不具备任何通话数据的非活跃号码进行检测,节省检测资源。
存在骚扰等异常行为的用户号码在拨打电话和接听电话时,相比于正常用户号码均存在显著差别,例如,异常号码的通话记录中,通常主叫通话次数远大于被叫通话次数,主叫通话时长也大于被叫通话时长;同时,总通话(即包括主叫通话和被叫通话)次数较多,但每次的通话时长较短,因此,总通话次数与总通话时长的比值较小,因此,可以将总通话时长、总通话次数、主叫通话时长和被叫通话次数中一个或多个,作为第一前置筛选条件,以在当前获取到的通话记录中,获取符合上述筛选条件的备选用户号码。
可选的,在本发明实施例中,所述第一前置筛选条件包括如下至少一项:总通话时长大于第一时间阈值;通话次数大于第一数量阈值的被叫号码的数量,在被叫号码总数中的占比小于第一占比阈值;被叫通话次数大于第二数量阈值;单次主叫通话的最大时长大于第二时间阈值;被叫号码为手机号码的通话次数,在被叫号码总数中的占比大于第二占比阈值;通话时长最长且在总通话次数中占比达到第三占比阈值的通话,在总通话时长中的占比大于第四占比阈值。
具体的,虽然异常号码每次的通话时长较短,但是由于其通话频次较高,因此其总通话时长相对较长,第一时间阈值相应设定为较大数值,例如,8小时。异常号码通常会在较短时间内,频繁拨打多个用户号码,因此其被叫号码的数量较多,而被叫号码的用户在接听并确认本次通话为骚扰等异常通话时,也会在极短时间内挂断,而异常号码为了提高其拨打效率,通常不会对已挂断的通话在短时间内重复拨打,因此第一数量阈值可以设定为较小数值,例如,设定为1次,第一占比阈值同样设定为较小数值,例如,设定为3%,也即通话次数大于1次的被叫号码的数量,在被叫号码总数中的占比较低时,表明当前检测的用户号码发起的主叫通话中,绝大多数的被叫号码仅被拨打一次。异常号码发起主叫通话的频次较高,相应的主叫通话未被接通的现象也会多次出现,被叫用户可能会根据未接信息回拨通话,因此异常号码中也会存在一定数量的被叫通话,但被叫通话次数显然小于主叫通话次数,因此,第二数量阈值可以设定为较小数值,例如,设定为1次。
如上述技术方案所述,被叫号码的用户在接听并确认本次通话为骚扰等异常通话时,通常会在极短时间内挂断,但是如果单次主叫通话时长较长,表明当前被叫号码的受影响程度较大,该异常号码对当前被叫号码实际上产生了较大程度的危害。同样的,通话时长最长且在总通话次数中占比达到第三占比阈值(例如,5%)的通话(例如,数量为5个),在总通话时长中的占比大于第四占比阈值(例如,40%),同样表明上述5个通话中的被叫号码受影响程度较大,该异常号码实际上对上述5个被叫号码产生了较大程度的危害;另外,由于手机号码的用户身份较为明确,可以明确定位到个人,而固定电话有时无法明确定位到个人,因此,异常号码针对手机号码的骚扰行为,相比于固话号码更加频繁,因此,异常号码发起的主叫通话中,被叫号码为手机号码的比例相对较高。
S120、根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码;其中,所述第二预设时间大于所述第一预设时间。
由于短时间内的通话记录无法准确反映一个用户号码的拨打及接听规律,因此在获取到备选用户号码后,继续获取上述备选用户号码在较长时间内,即第二预设时间内(例如,30天内)的通话记录,并将备选用户号码在第二预设时间内的通话记录作为输入数据,输入至预训练完成的异常号码识别模型中,以通过异常号码识别模型输出各个备选用户号码的分类结果;其中,异常识别号码模型可以基于神经网络(Neural Networks,NNs)或随机森林(Random Forest,RF)预先构建,并通过训练样本训练完成,训练样本包括标签为正常号码的正常通话记录以及标签为异常号码的异常通话记录,分类结果包括正常用户号码和异常用户号码。
可选的,在本发明实施例中,所述根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码,具体包括:根据第二预设时间内所述备选用户号码的通话记录,以及第二前置筛选条件,获取所述备选用户号码中,满足所述第二前置筛选条件的目标用户号码;其中,所述第二前置筛选条件与平均单日通话次数、平均单日通话时长和平均单日主叫通话时长中的至少一个相关;根据第二预设时间内所述目标用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述目标用户号码中的异常用户号码。
具体的,通过第一前置筛选条件,已经过滤掉了用户号码中的部分正常号码,缩小了检测范围,但是由于第一预设时间较短,无法准确反映一个用户号码的拨打及接听规律,因此继续获取备选用户号码在较长时间(即第二预设时间)内的通话记录,并通过第二前置筛选条件获取备选用户号码中的目标用户号码,以减少输入至异常号码识别模型中的用户号码数量,提高异常号码识别模型的识别效率;其中,第二前置筛选条件与第二预设时间内通话次数、通话时长和主叫通话时长的单日平均数值相关。
可选的,在本发明实施例中,所述第二前置筛选条件包括工作日筛选条件和/或节假日筛选条件;所述工作日筛选条件包括如下至少一项:平均单日通话次数大于第三数量阈值;平均单次主叫时长小于第三时间阈值;平均单日主叫通话时长位于第一数值区间;只存在一条被叫通话记录的主叫号码,在被叫通话记录的主叫号码总数中的占比,大于第五占比阈值;漫游通话次数在总通话次数中的占比大于第六占比阈值;所述节假日筛选条件包括如下至少一项:平均单日通话次数大于第四数量阈值;平均单次主叫时长小于第四时间阈值;平均单日主叫通话时长位于第二数值区间;只存在一条被叫通话记录的主叫号码,在被叫通话记录的主叫号码总数中的占比,大于第七占比阈值;漫游通话次数在总通话次数中的占比大于第八占比阈值。
异常电话在工作日和节假日中存在相同的行为规律,但其具体的行为数值又往往不同,因此通过相同的筛选方式但不同的筛选阈值,分别对工作日和节假日的通话记录进行筛选;具体的,如上述技术方案所述,异常号码的平均单日通话次数较多,平均单次主叫时长较短,平均单日主叫通话时长较长;其中,第三数量阈值和第四数量阈值均设定为较大数值,且第四数量阈值大于第三数量阈值;第三时间阈值和第四时间阈值均设定为较小数值,且第四时间阈值小于第三时间阈值;第一数值区间和第二数值区间的起止节点均为较大数值,且第一数值区间的起始节点小于第二数值区间的起始节点,第二数值区间的终止节点小于第二数值区间的终止节点。
另外,如上述技术方案所述,异常号码为了提高其拨打效率,通常不会对已被接听方挂断的通话发起重复拨打,因此被叫号码最多接收到一次未接来电,相应的被叫号码作为主叫号码发起回拨时,当前用户号码的被叫通话记录中,绝大多数的主叫号码仅拨打一次,因此,第五占比阈值和第七占比阈值均设定为较大数值,且第七占比阈值大于第五占比阈值,例如,第五占比阈值和第七占比阈值分别为90%和95%;同时,由于异常号码会对不同区域的用户号码进行拨打,不会仅针对一个区域内的电话拨打,因此,漫游通话次数在总通话次数中的占比较大,因此,第六占比阈值和第八占比阈值均设定为较大数值,且第八占比阈值大于第六占比阈值,例如,第六占比阈值和第八占比阈值分别为80%和85%。
特别的,所述第二前置筛选条件还包括:夜间通话时长在总通话时长中的占比大于第九占比阈值;和/或夜间通话次数在总通话次数中的占比大于第九占比阈值。对于部分类型的电信网络异常行为,以及无目的的恶意骚扰行为,发生在夜间(例如,晚上22点至第二点凌晨6点)的通话频率较高,因此,对于部分类型的电信网络异常行为的检测,以及无目的的恶意骚扰行为的检测,还可以将夜间通话时长占比,和/或夜间通话次数占比作为第二前置筛选条件,且第九占比阈值设定为较大数值,例如,设定为70%。
S130、根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码;其中,所述后置筛选条件基于所述异常用户号码的反馈结果构建。
前置筛选条件(包括第一前置筛选条件和第二前置筛选条件)基于异常用户号码的通话特征,预先构建完成且固定不变,特别是前置筛选条件与异常识别模型提取的通话特征参数相关联时,前置筛选条件固定不变,使得预训练完成的异常识别模型具备稳定性;而后置筛选条件的来源,与前置筛选条件不同,后置筛选条件基于异常用户号码的反馈结果构建,随着异常用户号码的反馈结果,后置筛选条件可以动态改变。具体的,根据上述技术方案获取到异常用户号码,并标注为异常用户号码后,服务器通过获取上述异常用户号码的电话申诉或者在线申诉后,进行人工复核,确定该异常用户号码实际为正常用户号码后,将上述误判断的正常用户号码加入误判断集合中,并依据上述误判断集合构建后置筛选条件,避免异常号码误判断行为的发生;后置筛选条件的设置,既不影响异常识别模型的识别结果,同时又根据异常用户号码的反馈结果,过滤其中的正常用户号码,极大地提高了获取异常号码的准确性。
以上述技术方案为例,后置筛选条件可以与第二预设时间内,异常用户号码的常用联系号码的数量相关;其中,常用联系号码是与异常用户号码的单日通话次数大于第五数量阈值的用户号码,第五数量阈值可以设定为较小数值,例如1次。具体的,如果在第二预设时间(例如,30天)内,用户号码有指定天数(例如,10天)或指定天数以上的常用联系号码的数量大于1个,表明该用户号码实际上存在多个常用的联系号码,因此,同样视为正常用户号码。
可选的,在本发明实施例中,在根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码后,还包括:根据所述第一预设时间内所述异常用户号码的通话记录,获取所述异常用户号码的通话号码;根据所述第一预设时间内,所述通话号码与所述异常用户号码的总通话时长和/或单次最大通话时长,确定所述通话号码的受影响程度。如果第一预设时间内通话号码与所述异常号码的总通话时长大于对应的总通话时长阈值,单次最大通话时长大于对应的单次最大通话时长阈值,则表明该通话号码的受骚扰程度较深;反之,则表明该通话号码的受骚扰程度较浅;服务器可以向受骚扰程度较深的通话号码发送相关的提醒。
本发明实施例提供的技术方案,实现了基于异常号码识别模型获取存在异常行为的用户号码,前置筛选条件减少了输入至异常号码识别模型中的用户号码数量,提高了异常号码识别模型的识别效率,后置筛选条件在不影响异常识别模型的识别结果的前提下,对其中的正常用户号码进行了过滤,极大地提高了异常号码的获取准确性。
实施例二
图2为本发明实施例二提供的一种异常号码的获取方法的流程图,本发明实施例在上述技术方案的基础上进行具体化,具体的,该方法包括如下步骤:
S210、根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码,以及所述备选用户号码的当前通话特征参数;其中,所述第一前置筛选条件与总通话时长、总通话次数、主叫通话时长和被叫通话次数中的至少一个相关。
S220、将所述备选用户号码的当前通话特征参数,加入第二预设时间内所述备选用户号码的通话记录中。
S230、根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码。
由于第二预设时间较长,异常号码识别模型在提取通话特征参数时,通常提取较长时间段内的历史通话特征参数,而当前检测时间内(即第一预设时间) 的通话特征参数,即当前通话特征参数,往往对用户号码是否存在异常行为的判断结果影响权重较大,因此,在根据第一前置筛选条件进行前置筛选的基础上,依据第一前置筛选条件包括的筛选项,获取第一预设时间内的通话特征参数,即当前通话特征参数,并加入第二预设时间内备选用户号码的通话记录中,以强化第一预设时间内的通话特征,对异常号码判断结果的影响权重;异常号码识别模型根据第二预设时间内的通话记录,提取历史通话特征参数的同时,也将上述第一预设时间内的当前通话特征参数同样作为分类依据。
以上述技术方案为例,若第一前置筛选条件包括总通话时长大于第一时间阈值;通话次数大于第一数量阈值的被叫号码的数量,在被叫号码总数中的占比小于第一占比阈值;被叫通话次数大于第二数量阈值;单次主叫通话的最大时长大于第二时间阈值;被叫号码为手机号码的通话次数,在被叫号码总数中的占比大于第二占比阈值;通话时长最长且在总通话次数中占比达到第三占比阈值的通话,在总通话时长中的占比大于第四占比阈值;相应的,当前通话特征参数包括总通话时长;通话次数大于第一数量阈值的被叫号码的数量,在被叫号码总数中的占比;被叫通话次数;单次主叫通话的最大时长;被叫号码为手机号码的通话次数,在被叫号码总数中的占比;通话时长最长且在总通话次数中占比达到第三占比阈值的通话,在总通话时长中的占比。
S240、根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码;其中,所述后置筛选条件基于所述异常用户号码的反馈结果构建。
本发明实施例提供的技术方案,通过在第二预设时间内备选用户号码的通话记录中加入当前通话特征参数,使得在执行第一前置筛选的同时,获取到当前通话特征参数的计算结果,实现了在不增加计算资源消耗的前提下,获取第一预设时间内的当前通话特征参数,提高了当前时刻的通话特征参数,对异常号码判断结果的影响权重,提升了异常识别模型的分类结果准确性。
实施例三
图3是本发明实施例三所提供的一种异常号码的获取装置的结构框图,该装置具体包括:备选用户号码获取模块310、异常用户号码获取模块320和后置筛选执行模块330。
备选用户号码获取模块310,用于根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码;其中,所述第一前置筛选条件与总通话时长、总通话次数、主叫通话时长和被叫通话次数中的至少一个相关;
异常用户号码获取模块320,用于根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码;其中,所述第二预设时间大于所述第一预设时间;
后置筛选执行模块330,用于根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码;其中,所述后置筛选条件基于所述异常用户号码的反馈结果构建。
本发明实施例提供的技术方案,实现了基于异常号码识别模型获取存在异常行为的用户号码,前置筛选条件减少了输入至异常号码识别模型中的用户号码数量,提高了异常号码识别模型的识别效率,后置筛选条件在不影响异常识别模型的识别结果的前提下,对其中的正常用户号码进行了过滤,极大地提高了异常号码的获取准确性。
可选的,在上述技术方案的基础上,所述第一前置筛选条件包括如下至少一项:
总通话时长大于第一时间阈值;
通话次数大于第一数量阈值的被叫号码的数量,在被叫号码总数中的占比小于第一占比阈值;
被叫通话次数大于第二数量阈值;
单次主叫通话的最大时长大于第二时间阈值;
被叫号码为手机号码的通话次数,在被叫号码总数中的占比大于第二占比阈值;
通话时长最长且在总通话次数中占比达到第三占比阈值的通话,在总通话时长中的占比大于第四占比阈值。
可选的,在上述技术方案的基础上,异常用户号码获取模块220,具体包括:
目标用户号码获取单元,用于根据第二预设时间内所述备选用户号码的通话记录,以及第二前置筛选条件,获取所述备选用户号码中,满足所述第二前置筛选条件的目标用户号码;其中,所述第二前置筛选条件与平均单日通话次数、平均单日通话时长和平均单日主叫通话时长中的至少一个相关;
异常用户号码获取单元,用于根据第二预设时间内所述目标用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述目标用户号码中的异常用户号码。
可选的,在上述技术方案的基础上,所述第二前置筛选条件包括工作日筛选条件和/或节假日筛选条件;
所述工作日筛选条件包括如下至少一项:
平均单日通话次数大于第三数量阈值;
平均单次主叫时长小于第三时间阈值;
平均单日主叫通话时长位于第一数值区间;
只存在一条被叫通话记录的主叫号码,在被叫通话记录的主叫号码总数中的占比,大于第五占比阈值;
漫游通话次数在总通话次数中的占比大于第六占比阈值;
所述节假日筛选条件包括如下至少一项:
平均单日通话次数大于第四数量阈值;
平均单次主叫时长小于第四时间阈值;
平均单日主叫通话时长位于第二数值区间;
只存在一条被叫通话记录的主叫号码,在被叫通话记录的主叫号码总数中的占比,大于第七占比阈值;
漫游通话次数在总通话次数中的占比大于第八占比阈值。
可选的,在上述技术方案的基础上,所述第二前置筛选条件还包括:夜间通话时长在总通话时长中的占比大于第九占比阈值,和/或夜间通话次数在总通话次数中的占比大于第九占比阈值。
可选的,在上述技术方案的基础上,备选用户号码获取模块310,具体用于根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码,以及所述备选用户号码的当前通话特征参数。
可选的,在上述技术方案的基础上,异常用户号码获取模块220,具体用于将所述备选用户号码的当前通话特征参数,加入第二预设时间内所述备选用户号码的通话记录中;根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码。
可选的,在上述技术方案的基础上,异常号码的获取装置,还包括:
通话号码获取模块,用于根据所述第一预设时间内所述异常用户号码的通话记录,获取所述异常用户号码的通话号码;
受影响程度获取模块,用于根据所述第一预设时间内,所述通话号码与所述异常用户号码的总通话时长和/或单次最大通话时长,确定所述通话号码的受影响程度。
上述装置可执行本发明任意实施例所提供的异常号码的获取方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的异常号码的获取方法。
实施例四
图4为本发明实施例四提供的一种服务器的结构示意图。图4示出了适于用来实现本发明实施方式的示例性服务器12的框图。图4显示的服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,服务器12以通用计算机设备的形式表现。服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,存储器28,连接不同系统组件(包括存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA) 总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA) 局域总线以及外围组件互连(PCI)总线。
服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/ 或方法。
服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该服务器12交互的设备通信,和/或与使得该服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的异常号码的获取方法。也即:根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码;其中,所述第一前置筛选条件与总通话时长、总通话次数、主叫通话时长和被叫通话次数中的至少一个相关;根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码;其中,所述第二预设时间大于所述第一预设时间;根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码;其中,所述后置筛选条件基于所述异常用户号码的反馈结果构建。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的异常号码的获取方法;该方法包括:
根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码;其中,所述第一前置筛选条件与总通话时长、总通话次数、主叫通话时长和被叫通话次数中的至少一个相关;
根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码;其中,所述第二预设时间大于所述第一预设时间;
根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码;其中,所述后置筛选条件基于所述异常用户号码的反馈结果构建。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器 (CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、 Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN) —连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种异常号码的获取方法,其特征在于,包括:
根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码;其中,所述第一前置筛选条件与总通话时长、总通话次数、主叫通话时长和被叫通话次数中的至少一个相关;
根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码;其中,所述第二预设时间大于所述第一预设时间;
根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码;其中,所述后置筛选条件基于所述异常用户号码的反馈结果构建。
2.根据权利要求1所述的方法,其特征在于,所述第一前置筛选条件包括如下至少一项:
总通话时长大于第一时间阈值;
通话次数大于第一数量阈值的被叫号码的数量,在被叫号码总数中的占比小于第一占比阈值;
被叫通话次数大于第二数量阈值;
单次主叫通话的最大时长大于第二时间阈值;
被叫号码为手机号码的通话次数,在被叫号码总数中的占比大于第二占比阈值;
通话时长最长且在总通话次数中占比达到第三占比阈值的通话,在总通话时长中的占比大于第四占比阈值。
3.根据权利要求1或2所述的方法,其特征在于,所述根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码,具体包括:
根据第二预设时间内所述备选用户号码的通话记录,以及第二前置筛选条件,获取所述备选用户号码中,满足所述第二前置筛选条件的目标用户号码;其中,所述第二前置筛选条件与平均单日通话次数、平均单日通话时长和平均单日主叫通话时长中的至少一个相关;
根据第二预设时间内所述目标用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述目标用户号码中的异常用户号码。
4.根据权利要求3所述的方法,其特征在于,所述第二前置筛选条件包括工作日筛选条件和/或节假日筛选条件;
所述工作日筛选条件包括如下至少一项:
平均单日通话次数大于第三数量阈值;
平均单次主叫时长小于第三时间阈值;
平均单日主叫通话时长位于第一数值区间;
只存在一条被叫通话记录的主叫号码,在被叫通话记录的主叫号码总数中的占比,大于第五占比阈值;
漫游通话次数在总通话次数中的占比大于第六占比阈值;
所述节假日筛选条件包括如下至少一项:
平均单日通话次数大于第四数量阈值;
平均单次主叫时长小于第四时间阈值;
平均单日主叫通话时长位于第二数值区间;
只存在一条被叫通话记录的主叫号码,在被叫通话记录的主叫号码总数中的占比,大于第七占比阈值;
漫游通话次数在总通话次数中的占比大于第八占比阈值。
5.根据权利要求4所述的方法,其特征在于,所述第二前置筛选条件还包括:夜间通话时长在总通话时长中的占比大于第九占比阈值,和/或夜间通话次数在总通话次数中的占比大于第九占比阈值。
6.根据权利要求1所述的方法,其特征在于,所述根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码,具体包括:
根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码,以及所述备选用户号码的当前通话特征参数;
所述根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码,具体包括:
将所述备选用户号码的当前通话特征参数,加入第二预设时间内所述备选用户号码的通话记录中;
根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码。
7.根据权利要求1-6任一所述的方法,其特征在于,在根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码后,还包括:
根据所述第一预设时间内所述异常用户号码的通话记录,获取所述异常用户号码的通话号码;
根据所述第一预设时间内,所述通话号码与所述异常用户号码的总通话时长和/或单次最大通话时长,确定所述通话号码的受影响程度。
8.一种异常号码的获取装置,其特征在于,包括:
备选用户号码获取模块,用于根据第一预设时间内至少一个用户号码的通话记录,以及第一前置筛选条件,获取所述至少一个用户号码中,满足所述第一前置筛选条件的备选用户号码;其中,所述第一前置筛选条件与总通话时长、总通话次数、主叫通话时长和被叫通话次数中的至少一个相关;
异常用户号码获取模块,用于根据第二预设时间内所述备选用户号码的通话记录,以及预训练完成的异常号码识别模型,获取所述备选用户号码中的异常用户号码;其中,所述第二预设时间大于所述第一预设时间;
后置筛选执行模块,用于根据后置筛选条件,对所述异常用户号码进行筛选,以过滤所述异常用户号码中的正常用户号码;其中,所述后置筛选条件基于所述异常用户号码的反馈结果构建。
9.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的异常号码的获取方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的异常号码的获取方法。
CN202111452214.9A 2021-12-01 2021-12-01 一种异常号码的获取方法、装置、服务器和存储介质 Active CN114374769B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111452214.9A CN114374769B (zh) 2021-12-01 2021-12-01 一种异常号码的获取方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111452214.9A CN114374769B (zh) 2021-12-01 2021-12-01 一种异常号码的获取方法、装置、服务器和存储介质

Publications (2)

Publication Number Publication Date
CN114374769A true CN114374769A (zh) 2022-04-19
CN114374769B CN114374769B (zh) 2024-07-19

Family

ID=81140800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111452214.9A Active CN114374769B (zh) 2021-12-01 2021-12-01 一种异常号码的获取方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN114374769B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115589443A (zh) * 2022-09-29 2023-01-10 中国联合网络通信集团有限公司 一种异常号码确定方法、装置、服务器及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055424A (en) * 1997-01-29 2000-04-25 Telefonaktiebolaget Lm Ericsson Intelligent terminal application protocol
EP1005762A1 (en) * 1997-01-06 2000-06-07 TELEFONAKTIEBOLAGET L M ERICSSON (publ) Intelligent terminal application protocol
JP2016110289A (ja) * 2014-12-03 2016-06-20 日本電信電話株式会社 異常抽出装置、方法、及びプログラム
CN109547393A (zh) * 2017-09-21 2019-03-29 腾讯科技(深圳)有限公司 恶意号码识别方法、装置、设备和存储介质
CN109639913A (zh) * 2019-01-03 2019-04-16 中国联合网络通信集团有限公司 一种自动语音骚扰号码处理方法、装置及系统
CN109819126A (zh) * 2017-11-21 2019-05-28 中移(杭州)信息技术有限公司 一种异常号码识别方法及装置
CN109995707A (zh) * 2017-12-29 2019-07-09 中国移动通信集团陕西有限公司 一种高清语音防骚扰和ddos攻击方法及装置
CN110213448A (zh) * 2018-09-13 2019-09-06 腾讯科技(深圳)有限公司 恶意号码识别方法、装置、存储介质和计算机设备
CN111885270A (zh) * 2020-07-09 2020-11-03 恒安嘉新(北京)科技股份公司 一种异常通信的检测方法、装置、设备及存储介质
WO2021174840A1 (zh) * 2020-03-03 2021-09-10 平安科技(深圳)有限公司 语音流程设置方法、装置、计算机设备和存储介质
CN113452845A (zh) * 2020-03-26 2021-09-28 中国移动通信集团福建有限公司 识别异常电话号码的方法和电子设备
CN113727351A (zh) * 2020-05-12 2021-11-30 中国移动通信集团广东有限公司 一种通信欺诈识别方法、装置及电子设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1005762A1 (en) * 1997-01-06 2000-06-07 TELEFONAKTIEBOLAGET L M ERICSSON (publ) Intelligent terminal application protocol
US6055424A (en) * 1997-01-29 2000-04-25 Telefonaktiebolaget Lm Ericsson Intelligent terminal application protocol
JP2016110289A (ja) * 2014-12-03 2016-06-20 日本電信電話株式会社 異常抽出装置、方法、及びプログラム
CN109547393A (zh) * 2017-09-21 2019-03-29 腾讯科技(深圳)有限公司 恶意号码识别方法、装置、设备和存储介质
CN109819126A (zh) * 2017-11-21 2019-05-28 中移(杭州)信息技术有限公司 一种异常号码识别方法及装置
CN109995707A (zh) * 2017-12-29 2019-07-09 中国移动通信集团陕西有限公司 一种高清语音防骚扰和ddos攻击方法及装置
CN110213448A (zh) * 2018-09-13 2019-09-06 腾讯科技(深圳)有限公司 恶意号码识别方法、装置、存储介质和计算机设备
CN109639913A (zh) * 2019-01-03 2019-04-16 中国联合网络通信集团有限公司 一种自动语音骚扰号码处理方法、装置及系统
WO2021174840A1 (zh) * 2020-03-03 2021-09-10 平安科技(深圳)有限公司 语音流程设置方法、装置、计算机设备和存储介质
CN113452845A (zh) * 2020-03-26 2021-09-28 中国移动通信集团福建有限公司 识别异常电话号码的方法和电子设备
CN113727351A (zh) * 2020-05-12 2021-11-30 中国移动通信集团广东有限公司 一种通信欺诈识别方法、装置及电子设备
CN111885270A (zh) * 2020-07-09 2020-11-03 恒安嘉新(北京)科技股份公司 一种异常通信的检测方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JINHAN KIM 等: "《Automatic Abnormal Log Detection by Analyzing Log History for Providing Debugging Insight》", 《IEEE》, 8 December 2020 (2020-12-08) *
何东 等: "《基于No.7信令监测系统的网间异常信令分析》", 《电信科学》, 15 July 2007 (2007-07-15) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115589443A (zh) * 2022-09-29 2023-01-10 中国联合网络通信集团有限公司 一种异常号码确定方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
CN114374769B (zh) 2024-07-19

Similar Documents

Publication Publication Date Title
CN105898085B (zh) 骚扰通信账号的识别方法及装置
CN106534463B (zh) 一种陌生来电处理方法、装置、终端及服务器
CN103052044B (zh) 一种陌生来电的处理方法及移动终端
US11336763B2 (en) Incoming call processing method, mobile terminal, and computer storage medium
CN104219672A (zh) 来电或短信识别方法和装置
US10284699B2 (en) Contact list availability prioritization
CN111131629A (zh) 骚扰电话的处理方法、装置、存储介质以及终端
CN105933497B (zh) 一种多模式的来电拦截方法与装置
CN114374769B (zh) 一种异常号码的获取方法、装置、服务器和存储介质
US20170164167A1 (en) Call notification method and electronic device
CN113055523A (zh) 一种骚扰电话拦截方法、装置、电子设备和存储介质
CN103179533A (zh) 来电屏蔽方法及移动终端
CN107154996B (zh) 来电拦截方法、装置、存储介质及终端
CN111885269B (zh) 一种信息检测方法、装置、设备及存储介质
CN107566596B (zh) 一种来电拦截方法与装置
US10602351B1 (en) Communication information hiding realization method and realization system
CN112040068B (zh) 虚假国际号码识别方法、装置、设备及可读存储介质
CN111756910A (zh) 来电免打扰方法、系统、计算机设备及存储介质
CN104052852A (zh) 通信方法及装置
CN112771499A (zh) 一种消息加载方法、消息加载装置及移动终端
CN113286035B (zh) 异常呼叫检测方法、装置、设备及介质
CN114444611A (zh) 号码识别模型训练、号码识别方法、装置、设备及介质
US20240242303A1 (en) Tool differentiator between fraud and struggling customers in real time
CN104881278A (zh) 一种终端
CN113286041A (zh) 一种用于境外手机号码的非正常使用的识别方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant