CN114979369A - 异常通话检测方法、装置、电子设备及存储介质 - Google Patents
异常通话检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114979369A CN114979369A CN202210394119.6A CN202210394119A CN114979369A CN 114979369 A CN114979369 A CN 114979369A CN 202210394119 A CN202210394119 A CN 202210394119A CN 114979369 A CN114979369 A CN 114979369A
- Authority
- CN
- China
- Prior art keywords
- call
- node
- call record
- historical
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 123
- 238000001514 detection method Methods 0.000 title claims abstract description 30
- 238000003066 decision tree Methods 0.000 claims abstract description 75
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000012545 processing Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims description 24
- 238000013507 mapping Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012795 verification Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 10
- 230000011664 signaling Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 208000003443 Unconsciousness Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请实施例提供一种异常通话检测方法,该方法包括:获取通话记录的通话参数集,通话参数集包括至少一个通话参数;基于通话记录的通话参数集和预先训练的决策树模型,得到通话记录的分值;在通话记录的分值在预设区间的情况下,确定通话记录为异常通话。本申请实施例提供的技术方案,通过基于通话记录的通话参数集以及决策树模型来预测该通话记录为异常通话的概率,最后基于表征上述概率的分值所属的区间来确定通话记录是否为异常通话,实现了异常通话的自动识别,提高异常通话的识别效率,以使得后续能够及时针对异常通话提供相应的处理措施。
Description
技术领域
本申请涉及人工智能技术领域,更具体地,涉及一种异常通话检测方法、装置、电子设备及存储介质。
背景技术
目前,在服务、销售、售后等领域,通常需要客服人员通过网络电话的方式与客户进行沟通。
客服人员与客户之间的通话记录中通常存在较多的异常通话,比如较长时间没有人接听、接听后很快被挂断等等。相关技术中,由坐席来判断本次通话记录是否为异常通话,并向后台服务器进行上报。
相关技术中,通过人工方式来判断是否存在异常通话,从而导致异常通话的检测效率较低。
发明内容
本申请实施例提供一种异常通话检测方法、装置、电子设备及存储介质。
第一方面,本申请实施例提供一种异常通话检测方法,该方法包括:获取通话记录的通话参数集,通话参数集包括至少一个通话参数;基于通话参数集和决策树模型对通话记录进行打分,得到通话记录的分值,决策树模型包括多个节点树,节点树是根据历史通话记录的通话参数集对历史通话记录进行划分得到的,通话记录的分值表征通话记录为异常通话的概率;在通话记录的分值在预设区间的情况下,确定通话记录为异常通话。
第二方面,本申请实施例提供一种异常通话检测装置,该装置包括:参数获取模块、打分模块和检测模块。参数获取模块,用于获取通话记录的通话参数集,通话参数集包括至少一个通话参数;打分模块,用于基于通话参数集和决策树模型对通话记录进行打分,得到通话记录的分值,决策树模型包括多个节点树,节点树是根据历史通话记录的通话参数集对历史通话记录进行划分得到的,通话记录的分值表征通话记录为异常通话的概率;检测模块,用于在通话记录的分值在预设区间的情况下,确定通话记录为异常通话。
第三方面,本申请实施例提供一种决策树模型的训练方法,决策树模型包括多个节点树,该方法包括:获取历史通话记录数据集及历史通话记录数据集的通话参数数据集,历史通话记录数据集包括多个历史通话记录;对决策树模型进行迭代训练,直至异判率小于预设阈值,得到训练好的决策树模型,具体包括:将目标历史通话记录对应的节点确定为节点树的根节点,目标历史通话记录为历史通话记录数据集中的任一项历史通话记录;根据通话记录数据集的通话参数数据集,确定节点树的各层节点的超平面划分依据;根据节点树的各层节点的超平面划分依据以及节点树的根节点,确定其他历史通话记录对应的节点在节点树中的位置信息,其他历史通话记录为历史通话记录数据集中除目标历史通话记录之外的历史通话记录;基于其他历史通话记录对应的节点在节点树中的位置信息,得到其它历史通话记录的分值;基于其它历史通话记录的分值,确定其他历史通话记录是否为异常通话;获取异判率,异判率为判断其他历史通话记录为异常通话错误的数量与其他历史通话记录的总数量之间的比值。
第四方面,本申请实施例提供一种决策树模型的训练装置,该装置包括:数据获取模块,用于获取历史通话记录数据集及历史通话记录数据集的通话参数数据集,历史通话记录数据集包括多个历史通话记录。处理模块,用于对决策树模型进行迭代训练,直至异判率小于预设阈值,得到训练好的决策树模型。处理模块,具体用于将目标历史通话记录对应的节点确定为节点树的根节点,目标历史通话记录为历史通话记录数据集中的任一项历史通话记录;根据通话记录数据集的通话参数数据集,确定节点树的各层节点的超平面划分依据;根据节点树的各层节点的超平面划分依据以及节点树的根节点,确定其他历史通话记录对应的节点在节点树中的位置信息,其他历史通话记录为历史通话记录数据集中除目标历史通话记录之外的历史通话记录;基于其他历史通话记录对应的节点在节点树中的位置信息,得到其它历史通话记录的分值;基于其它历史通话记录的分值,确定其他历史通话记录是否为异常通话;获取异判率,异判率为判断其他历史通话记录为异常通话错误的数量与其他历史通话记录的总数量之间的比值。
第五方面,本申请实施例提供一种电子设备,电子设备包括处理器、存储器,存储器存储有计算机程序指令,计算机程序指令被处理器调用执行如上所述的异常通话检测方法,或者,决策树模型的训练方法。
第六方面,本申请实施例提供一种计算机可读存储介质,其特征在于,计算机可读存储介质中存储有程序代码,程序代码被处理器调用执行如上所述的异常通话检测方法,或者,决策树模型的训练方法。
第七方面,本申请实施例提供一种计算机程序产品,当该计算机程序产品被执行时,用于实现如上所述的异常通话检测方法,或者,决策树模型的训练方法。
本申请实施例提供一种异常通话检测方法,通过预先训练的决策树模型以及通话记录的各项参数来量化通话记录为异常通话的概率,由于决策树模型是以历史通话记录为实例进行分类的模型,在通过大量历史通话记录的各项参数来训练得到决策树模型的情况下,决策树模型能够基于通话记录的各项参数来准确判断其是否为异常通话,因此能在保证异常通话记录的识别准确率的基础上实现了异常通话的自动识别,提高异常通话的识别效率,以使得后续能够及时针对异常通话提供相应的处理措施。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的实施环境的示意图。
图2是本申请一个实施例提供的异常通话检测方法的流程图。
图3是本申请一个实施例提供的异常通话检测方法的流程图。
图4是本申请一个实施例提供的得到通话记录分值的流程图。
图5是本申请一个实施例提供的节点树的示意图。
图6是本申请一个实施例提供的决策树模型的训练方法的流程图。
图7是本申请一个实施例提供的异常通话检测装置的框图。
图8是本申请一个实施例提供的决策树模型的构建装置的框图。
图9是本申请一个实施例提供的电子设备的框图。
图10是本申请一个实施例提供的计算机可读存储介质的框图。
具体实施方式
下面详细描述本申请的实施方式,实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性地,仅用于解释本申请,而不能理解为对本申请的限制。
为了使本技术领域的人员更好地理解本申请的方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
发明人发现,在通过人工审核方式判断通话记录是否为异常通话时,存在效率低下的问题。基于此,发明人设计一种自动判断通话记录是否为异常通话记录的方案,具体地,通过预先训练的决策树模型以及通话记录的各项参数来量化通话记录为异常通话的概率,由于决策树模型是以历史通话记录为实例进行分类的模型,在通过大量历史通话记录的各项参数来训练得到决策树模型的情况下,决策树模型能够基于通话记录的各项参数来准确判断其是否为异常通话,因此能在保证异常通话记录的识别准确率的基础上实现了异常通话的自动识别,提高异常通话的识别效率,以使得后续能够及时针对异常通话提供相应的处理措施。
图1是本申请一个实施例提供的实施环境的示意图。该实施环境包括网络呼叫系统,网络呼叫系统包括多个第一终端110、服务器120、第二终端130。
第一终端110提供网络电话服务,客服人员(以下称为坐席)通过第一终端110提供的网络电话服务与客户进行沟通。第一终端110可以是固定电话、个人计算机、移动终端等等。以第一终端110为个人计算机为例,第一终端110可以安装有提供网络电话服务的应用程序,坐席通过上述应用程序与客户进行网络电话。
需要说明的是,坐席通过第一终端110与客户进行沟通时,第一终端110会记录本次通话记录的通话参数,包括且不限于:振铃时长、通话时长、被叫号码、通话录音、挂机方向、网关信令值等等。振铃时长是指坐席发起网络电话到客户接听网络电话之间的时间长度。通话时长是指网络电话接通到挂断之间的时间长度。被叫号码是指客户的SIM卡对应的号码。通话录音是指对网络通话进行录制得到的录音文件,通常包括坐席的说话内容、客户的说话内容、环境语音信号等等。挂机方向是指挂断网络电话的一方,其可以是坐席方或客户方。网关信令值表征在进行网络电话的过程中的网络质量。
第二终端130提供通话服务,客户通过第二终端130提供的通话服务与坐席进行沟通。在一些实施例中,第二终端130安装有通话应用程序,通过该通话应用程序提供的通话服务与坐席沟通。第二终端130可以是智能手机、固定电话等等。
服务器120用于确定通话记录是否为异常通话。在本申请实施例中,服务器120为预先训练决策树模型,通过决策树模型以及通话记录的通话参数集对其进行打分,并根据分值所属的范围来确定该通话记录是否为异常通话。其中,服务器训练决策树模型所采用的算法可以是孤立森林算法。可选地,服务器120可以是第一终端110安装的指定应用程序对应的后台服务器。服务器120可以是一台服务器,也可以是多台服务器组成的服务器集群,还可以是一个云计算服务中心。
第一终端110和服务器120之间可以通话有线网络或者无线网络建立通信连接。第一终端110和第二终端130之间可以通过无线网络建立通信连接。
本申请实施例提供一种异常通话检测方法,通过预先训练的决策树模型以及通话记录的各项参数来量化通话记录为异常通话的概率,由于决策树模型是以历史通话记录为实例进行分类的模型,在通过大量历史通话记录的各项参数来训练得到决策树模型的情况下,决策树模型能够基于通话记录的各项参数来准确判断其是否为异常通话,因此能在保证异常通话记录的识别准确率的基础上实现了异常通话的自动识别,提高异常通话的识别效率,以使得后续能够及时针对异常通话提供相应的处理措施。
参考图2,其示出本申请一个实施例提供的异常通话检测的流程框图。服务器将通话记录输入预先训练的决策树模型中,根据表征通话记录的目标节点在决策树模型中的各个节点树的位置,来获取通话记录的分数,之后基于分数来判断是否为异常通话。
本申请实施例提供的技术方案,可以应用在与用户存在语音沟通需求的场景中,例如电话销售、电话提醒、售后回访等等。以电话提醒为例,坐席与客户进行电话沟通后,通过本申请实施例提供的技术方案来判断本次通话记录是否为异常通话,进而能够及时排查出逾期用户拒接电话、逾期用户不愿意沟通等等情况,以进一步确定逾期用户的归还资源意愿,及根据上述归还资源意愿来制定相应的处理措施。
图3是本申请一个实施例提供的异常通话检测方法的流程图。该方法的执行主体可以是图1实施环境中的服务器,该方法包括如下步骤:
步骤301,获取通话记录的通话参数集。
通话参数集包括至少一个通话参数。上述至少一个通话参数包括且不限于:通话时间、通话时长、振铃时长、挂断方向、通话录音、被叫号码、网关信令值等等。
在一些实施例中,服务器从第一终端中获取通话记录的通话参数集。第一终端在与第二终端进行网络电话的过程中,通常会记录下本次通话记录的通话参数集,并在通话结束后向服务器上报上述通话参数集。也即,服务器可以实现对通话记录的实时检测。在另一些实施例中,服务器从数据库服务器中获取通话记录的通话参数集。第一终端在通话结束后向数据库服务器上报本次通话记录的通话参数集,由数据库服务器对通话记录进行分类存储,比如按照通话时间进行分类、按照第二终端的号码进行分类等等。
需要说明的是,在服务器从数据库中获取通话记录的通话参数集的情况下,服务器可以在预先设定的异常通话检测时段执行上述步骤301,例如,上述预先设定的异常通话检测时段可以是22:00-24:00。
在一些实施例中,在步骤201之后,服务器先检测通话记录是否满足无效通话条件,在通话记录不满足无效通话条件的情况下,执行后续的打分步骤。其中,无效通话条件包括以下至少一项:振铃时长小于指定时长、通话时段处于异常时间段。指定时长和异常时间段均根据实际需求设定,示例性地,指定时长为1秒,异常事件段为[23:00-7:00],当振铃时长过短,或者,通话时段为晚上的情况下,本次通话记录有较大概率是用户无意识情况下触发的,通过上述方式,可以排除上述无意识触发的通话记录,避免对其进行打分得到不具有参考价值的分值,节省服务器的处理资源。
步骤302,基于通话记录的通话参数集和预先训练的决策树模型对通话记录进行打分,得到通话记录的分值。
决策树模型包括多个节点树。节点树是根据历史通话记录的通话参数集对历史通话记录进行划分得到的。节点树包括根节点和至少一个叶子节点,根节点和叶子节点均表示历史通话记录。在一些实施例中,电子设备基于孤立森林算法对多项历史通话记录进行训练得到决策树模型,孤立森林是属于无监督学习范畴中检测异常值的一种算法,其通过样本的疏密程度来判断样本的是否孤立。具体训练过程将在下文实施例进行阐述。
通话记录的分值表征通话记录为异常通话的概率。通话记录的分值越趋近于1,则说明该通话记录为异常通话记录的概率越大。通话记录的分值越趋近于零,则说明该通话记录为异常通话记录的概率越小。
步骤303,在通话记录的分值在预设区间的情况下,确定通话记录为异常通话。
预设区间根据实验或经验设定,本申请实施例对此不作限定。示例性地,预设区间为[0.5,1]。在一个示例中,通话记录A的分值为0.62,在上述预设区间,则确定通话记录A为异常通话。
综上所述,本申请实施例提供地技术方案,通过预先训练的决策树模型以及通话记录的各项参数来量化通话记录为异常通话的概率,由于决策树模型是以历史通话记录为实例进行分类的模型,在通过大量历史通话记录的各项参数来训练得到决策树模型的情况下,决策树模型能够基于通话记录的各项参数来准确判断其是否为异常通话,因此能在保证异常通话记录的识别准确率的基础上实现了异常通话的自动识别,提高异常通话的识别效率,以使得后续能够及时针对异常通话提供相应的处理措施。
图4示出本申请一个实施例提供的得到通话记录分值的流程图。在一些实施例中,图3中的步骤302可以具体包括图4中的步骤3021-步骤3024。步骤302,具体包括:
步骤3021,对通话参数集中的各项通话参数进行映射处理,得到各项通话参数分别对应的标准值。
映射处理是指将按照指定映射方式,将通话参数映射成标准值。通话参数对应的标准值为第一预设值或第二预设值。第一预设值小于第二预设值。第一预设值、第二预设值均是预先设定的,在一个具体的例子中,第一预设值为1,第二预设值为0。不同通话参数对应的映射方式不同。下面对各项参数对应的映射方式进行阐述。
当通话参数包括平均振铃时长时,若平均振铃时长大于第一预设时长,则服务器将其映射为第一数值,若平均振铃时长小于第一预设时长,则服务器将其映射为第二数值。第一预设时长、第一数值、第二数值均根据实验或经验设定。示例性地,第一预设时长为3000毫秒,第一数值为1,第二数值为0。也即,平均振铃时长对应的指定映射方式可以表示成:平均振铃时长(毫秒):{[0-3000],标准值0;[3000-无穷大],标准值1}。
当通话参数包括通话时长时,若通话时长大于第二预设时长,则服务器将其映射为第一数值,若通话时长小于第二预设时长,则服务器将其映射为第二数值。第二预设时长根据实验或经验设定。示例性地,第二预设时长为5秒。也即,通话时长对应的指定映射方式可以表示成:通话时长(秒):{[0-5],标准值0;[5-无穷大],标准值1}。
当通话参数包括挂机方向时,若挂机方向为客户方,则服务器将其映射为第一数值,若挂机方向为坐席方,则服务器将其映射为第二数值。也即,挂机方向对应的指定映射方式可以表示成:挂机方向:{坐席方,标准值0;客户方,标准值1}。
当通话参数包括呼叫次数时,若呼叫次数大于第一预设值,则服务器将其映射为第一数值,若呼叫次数小于或等于第一预设值,则服务器将其映射为第二数值。第一预设值根据实验或经验设定。示例性地,第一预设值为1。也即,呼叫次数对应的指定映射方式可以表示成:呼叫次数:{1,标准值0;[1-无穷大],标准值1}。
当通话参数包括通话时段时,若通话时段属于第一时段,则服务器将其映射为第一数值,若通话时段属于第二时段,则服务器将其映射为第二数值。第一时段和第二时段根据实际需求设定,第一时段为9:00-12:00,第二时段为1:30-9:00。也即,通话时段对应的指定映射方式可以表示成:通话时段:{[9:00-12:00],标准值0;[1:30-9:00],标准值1}。
当通话参数包括是否在回复什么事情后说信号不好,若是,则服务器将其映射为第一数值,若不是,则服务器将其映射为第二数值。
当网络参数包括网关信令值,若网关信令值为指定字符,则服务器将其映射为第一数值,若不为指定字符,则服务器将其映射为第二数值。指定字符根据实际需求设定,示例性地,指定字符为200OK。
通话参数还可以包括其它参数,本申请实施例其它参数的指定映射方式不作限定。通过上述方式,将每项通话参数映射成标准值,以便后续的统一运算。
需要说明的是,同一通话参数也可以对应不同的指定映射方式。在一些实施例中,服务器确定该通话记录对应的用户的逾期时长,根据该逾期时长确定通话参数的指定映射方式,以通话参数为呼叫次数为例,逾期时长越长,则第一预设时长越大,逾期时长越短,则第一预设时长越小。以下表-1示出了通话参数为平均振铃时长时,逾期时长与指定映射关系之间的对应关系。
表-1
其中,M1是指逾期时长在一个季度内,M2是指逾期时长在一个季度和两个季度之间,M3是指逾期时长在两个季度和三个季度之间,M4是指逾期时长在三个季度和四个季度之间。
以通话参数为平均振铃时长为例,逾期时长越长,则第一预设时长越小,逾期时长越短,则第一预设时长越大。以下表-2示出了通话参数为平均振铃时长时,逾期时长与指定映射关系之间的对应关系。
表-2
以通话参数为通话时长为例,逾期时长越长,则第二预设时长越大,逾期时长越短,则第二预设时长越小。以下表-3示出了通话参数为通话时长时,逾期时长与指定映射关系之间的对应关系。
表-3
通过上述方式,结合通话记录对应的用户对应的逾期时长将通话参数映射成相应的标准值,可以使得标准值的划分更加符合账单逾期用户的心理状态,从而使得异常通话的检测更为准确。
步骤3022,基于各通话参数分别对应的标准值,确定目标节点在每个节点树中的位置信息。
目标节点用于表征通话记录。在本申请实施例中,通过目标节点来表示通话记录,以使得能够通过预先训练的决策树模型对其进行处理。目标节点通常为叶子节点。
节点树包括根节点和叶子节点,根节点是指节点树的最顶端的节点,叶子节点是指节点树中除根节点之外的节点。在本申请实施例中,节点树包括多层,每层上包括一个或多个节点,上述一个或多个节点按照该层的超平面划分依据分布在该层,每层的超平面划分依据是通话参数集中的一项通话参数,不同层的超平面划分依据不相同。在一个具体的例子中,节点树包括四层,第一层到第四层的超平面划分依据依次为通话时长、振铃时长、通话时间、挂断方向。
可选地,节点树包括n层节点,对于每个节点树,步骤3022可以替代实现为如下步骤:
获取节点树的第i+1层节点的超平面划分依据的分界值,其中,将通话记录中的目标通话参数作为节点树的第i+1层节点的超平面划分依据,目标通话参数为通话记录的通话参数集中的任一项通话参数,n为大于1的整数,i为正整数,并且i小于等于n-1;若目标通话参数对应的标准值大于或等于i+1层的超平面划分依据的分界值,则确定目标节点在节点树的位置信息为在第i层节点的第一分支,及将第i层节点的第一分支确定为第i+2层节点的上一级节点;若目标通话参数对应的标准值小于i+1层的超平面划分依据的分界值,则确定目标节点在节点树的位置信息为在第i层节点的第二分支,及将第i层节点的第二分支确定为第i+2层节点的上一级节点。其中,i的取值依次为1至n-1。
超平面划分依据的分界值是预先设定的,其通常大于第一预设值且小于第二预设值。示例性地,超平面划分依据的分界值为0.5。第一分支和第二分支不相同。在一个具体的例子中,第i层节点的第一分支为第i层节点的左边分支,第i层节点的第二分支为第i层节点的右边分支。
参见图5,图5示出本申请一个实施例提供的节点树的示意图。该节点树包括四层,每一层到第四层的超平面划分依据依次为振铃时长、通话时长、通话时间、挂断方向。每一层的超平面划分依据的分界值均为0.5,在图5中采用虚线来表示,并且,虚线左侧为第一分支,虚线右侧为第二分支。目标节点的振铃时长对应的标准值为1,通话时长对应的标准值为1,通话时间对应的标准值为0,挂断方向对应的标准值为0。对于第1层,由于通话记录的振铃时长对应的标准值大于分界值,则目标节点在根节点的虚线右侧;对于第二层,由于通话记录的通话时长对应的标准值大于分界值,则目标节点在节点2(第1层的第一分支)的右侧;对于第三层,由于通话记录的通话时间对应的标准值小于分界值,则目标节点在节点4(第2层的第一分支)的左侧;对于第四层,由于通话记录的挂断对应的标准值小于分界值,则目标节点在节点5(第3层的第二分支)的左侧。
步骤3023,基于目标节点在每个节点树中的位置信息,确定目标节点在每个节点树中的分数。
在一些实施例中,步骤3023可以包括如下子步骤。对每个节点树都执行下述步骤。基于目标节点在节点树中的位置信息获取目标节点与节点树的根节点之间的节点个数;获取节点树的平均节点数量,基于目标节点与节点树的根节点之间的节点个数、节点树的平均节点数量,确定目标节点在节点树中的分值。
在一些实施例中,服务器基于目标节点在节点树中的位置信息,确定目标节点在节点树中所处的层的序号,并将该序号与1的差值确定为目标节点与节点树的根节点之间的节点个数。请再次参见图5,目标节点在节点树的第四层,则目标节点与节点树的根节点之间存在三个节点,分别为节点2、节点4和节点5。
节点树的平均节点数量是指节点树中的各个节点与根节点之间的节点个数的平均值。
目标节点在该节点树下的分值与目标节点与节点树的根节点之间的节点个数之间呈负相关关系。也即,目标节点与节点树的根节点之间的节点个数越少,则目标节点在该节点树下的分值越大;目标节点与节点树的根节点之间的节点个数越多,则目标节点在该节点树下的分值越小。
目标节点在该节点树下的分值与节点树的平均节点数量之间呈负相关关系。也即,节点树的平均节点数量越大,则目标节点在该节点树下的分值越小,节点树的平均节点数量越小,则目标节点在该节点树下的分值越大。在一些实施例中,服务器通过如下公式计算目标节点在该节点树下的分值。
S(x,n)=2((e(h(x))/c(n))。
其中,h(x)为目标节点到根节点之间的节点个数,c(n)表示节点树的平均节点数量,n是节点树包括的节点数量,x表示目标节点。c(n)=2H(n-1)*(2(n-1)/n),H(n)为常数,示例性地,H(n)为0.577。
步骤3024,基于目标节点在每个节点树中的分数,得到通话记录的分值。
可选地,服务器将目标节点在每个节点树中的分数的平均值,确定为通话记录的分值。在一些实施例中,步骤303可以具体包括:
步骤3031,基于通话记录对应的用户属性对通话记录的分值进行加权处理,得到加权处理后的分值。
用户属性包括以下至少一项:通话记录对应的逾期时长、通话记录对应的号码所属的地区。
在用户属性包括通话记录对应的逾期时长的情况下,服务器先确定通话记录对应的逾期时长对应的加权系数,之后将该加权系数与通话记录的分值进行相乘,得到加权处理后的分值。其中,逾期时长与加权系数之间呈正相关关系,也即逾期时长越长,则加权系数越大。以下表-4示例性示出了逾期时长与加权系数之间的对应关系。
逾期时长 | 加权系数 |
M1 | 0.80 |
M2 | 0.85 |
M3 | 0.90 |
M4 | 0.95 |
表-4
在用户属性包括通话记录对应的号码所属的地区的情况下,服务器先确定该地区是否为金融高风险地区,若该地区为金融高风险地区,则将加权系数设为第一系数,之后将该第一系数通话记录的分值进行相乘,得到加权处理后的分值。若该地区不为金融高风险地区,则无需进行加权处理。其中,金融高风险地区可以通过人工评估得到。
通过上述方式,基于用户属性对通话记录的分值进行加权处理,使得通话记录的实际得分与用户属性相关联,更加符合实际情况,使得通话记录的分值更为准确。
步骤3032,在加权处理后的分值在预设区间的情况下,确定通话记录为异常通话。
需要说明的是,在步骤3032之后,电子设备还可以获取校验结果,若校验结果表征通话记录为异常通话记录的结果不准确,则调整至少一个节点树的超平面划分依据。校验结果用于表征判断通话记录为异常通话记录的结果是否准确。校验结果可以通过人工审核得到。通过上述方式,可以使得决策树模型中的节点树的精度提高,进而提高判断通话记录是否为异常通话记录的准确率。
本申请实施例提供的技术方案,通过确定表征通话记录的目标节点在决策树模型中的各个节点树的位置,并基于目标节点在每个节点树的位置计算分数,基于目标节点在每个节点树下的分数确定通话记录的分数,由于决策树模型是以历史通话记录为实例进行分类的模型,在通过大量历史通话记录的各项参数来训练得到决策树模型的情况下,决策树模型能够基于通话记录的各项参数来准确判断其是否为异常通话,因此保证异常通话记录的识别准确率,还通过基于用户属性对通话记录的分值进行加权处理,使得通话记录的实际得分与用户属性相关联,更加符合实际情况,使得通话记录的分值更为准确。
请参阅图6,其示出本申请一个实施例提供的决策树模型的训练方法的流程图。该方法包括如下步骤:
步骤601,获取历史通话记录数据集以及历史通话记录数据集的通话参数数据集。
历史通话记录数据集包括多个历史通话记录。服务器可以从各个第一终端上报的通话记录中获取历史通话记录数据集,也可以从数据库中获取历史通话记录集。历史通话记录数据集中的每个历史通话记录对应有通话参数集。
步骤602,对决策树模型进行迭代训练,直至异判率小于预设阈值,得到训练好的决策树模型。
异判率为判断其他历史通话记录为异常通话错误的数量与其他历史通话记录的总数量之间的比值。服务器根据其它历史通话记录的分值确定其它历史通话记录是否为异常通话,之后将判断结果与人工标注结果进行比对,进而判断本次判断为成功判断还是失败判断,最终根据失败判断的数量与历史通话记录的总数量之间的比值确定异判率。
预设阈值根据精度要求实际设定,精度要求越高,则预设阈值越小。示例性地,预设阈值为千分之一。
在一些实施例中,步骤602可以包括如下子步骤。
步骤602a,将目标历史通话记录对应的节点确定为节点树的根节点。
目标历史通话记录为历史通话记录数据集中的任一项历史通话记录。对于每一节点树,在历史通话记录数据集中随机选择一历史通话记录作为根节点,不同节点树的根节点所表征的历史通话记录不相同。
步骤602b,根据通话记录数据集的通话参数数据集,确定节点树的各层节点的超平面划分依据。
节点树的每层节点的超平面划分依据是通话参数数据集中的任一项通话参数。不同层的超平面划分依据不相同。需要说明的是,对于不同节点树,其在同一层的超平面划分依据通常不相同。举例来说,节点树A的第一层的超平面划分依据为通话时长,节点树B的第一层的超平面划分依据为振铃时长。
步骤602c,根据节点树的各层节点的超平面划分依据以及节点树的根节点,确定其他历史通话记录对应的节点在节点树中的位置信息。
其他历史通话记录为历史通话记录数据集中除目标历史通话记录之外的历史通话记录。可选地,节点树包括n层节点,对于每个历史通话记录对应的节点,步骤602c可以替代实现为如下步骤:获取节点树的第i+1层节点的超平面划分依据的分界值,其中,将历史通话记录中的目标通话参数作为节点树的第i+1层节点的超平面划分依据,目标通话参数为历史通话记录的通话参数集中的任一项通话参数,n为大于1的整数,i为正整数,并且i小于等于n-1;若目标通话参数对应的标准值大于或等于i+1层的超平面划分依据的分界值,则确定历史通话记录对应的节点在节点树的位置信息为在第i层节点的第一分支,并将第i层节点的第一分支作为第i+2层节点的上一级节点;若目标通话参数对应的标准值小于i+1层的超平面划分依据的分界值,则确定历史通话记录对应的节点在节点树的位置信息为在第i层节点的第二分支,并将第i层节点的第二分支作为第i+2层节点的上一级节点。其中,i的取值依次为1至n-1。
步骤602d,基于其他历史通话记录对应的节点在节点树中的位置信息,得到其它历史通话记录的分值。
可选地,在一些实施例中,步骤602d可以包括如下子步骤。对每个节点树都执行下述步骤。获取历史通话记录对应的节点与节点树的根节点之间的节点个数,以及节点树的平均节点数量,基于历史通话记录对应的节点与节点树的根节点之间的节点个数、节点树的平均节点数量,确定历史通话记录对应的节点在节点树中的分值。最后,服务器根据历史通话记录对应的节点在每个节点树中的分值,得到历史通话记录的分值。
步骤602e,基于其它历史通话记录的分值,确定其他历史通话记录是否为异常通话。
在其它历史通话记录的分值属于预设区间时,确定其它历史通话记录为异常通话。
步骤602f,获取异判率。
若异判率大于预设阈值,则调整节点树的相关参数,直至异判率小于预设阈值,得到决策树模型。
相关参数包括以下至少一项:节点树的数量、节点树包括的节点数量、节点树包括的节点的层数,节点树的各层节点的超平面划分依据。
节点树的数量是指决策树模型所包括的节点树的数量,也即n_estimators,节点树包括的节点数量是指构建节点树的历史通话记录的数量,也即max_samples,节点数包括的节点的层数是指构建节点树时所用到的通话参数的数量,也即max_features。其中,调整节点树的各层节点的超平面划分依据是指将节点树的每层对应的通话参数的顺序进行调换。在一个具体的例子中,节点树包括四层,每一层到第四层的超平面划分依据依次为振铃时长、通话时长、通话时间、挂断方向,对节点树的各层节点的超平面划分依据进行调换,调整后的节点树的第一层到第四层的超平面划分依据依次为通话时长、通话时间、挂断方向、振铃时长。
本申请实施例提供的技术方案,通过大量无标注的历史通话记录来训练决策树模型,后续能够通过该训练的决策树模型对实时通话记录进行打分,实现了异常通话的自动识别,提高异常通话的识别效率,以使得后续能够及时针对异常通话提供相应的处理措施。
请参阅图7,其示出了本申请实施例提供的一种异常通话检测装置700的结构框图。该装置700包括:参数获取模块710,用于获取通话记录的通话参数集,通话参数集包括至少一个通话参数。打分模块720,用于基于通话记录的通话参数集和预先训练的决策树模型,得到通话记录的分值,决策树模型包括多个节点树,节点树是根据历史通话记录的通话参数集对历史通话记录进行划分得到的,通话记录的分值表征通话记录为异常通话的概率。检测模块730,用于在通话记录的分值在预设区间的情况下,确定通话记录为异常通话。
本申请实施例提供一种异常通话检测装置,通过预先训练的决策树模型以及通话记录的各项参数来量化通话记录为异常通话的概率,由于决策树模型是以历史通话记录为实例进行分类的模型,在通过大量历史通话记录的各项参数来训练得到决策树模型的情况下,决策树模型能够基于通话记录的各项参数来准确判断其是否为异常通话,因此能在保证异常通话记录的识别准确率的基础上实现了异常通话的自动识别,提高异常通话的识别效率,以使得后续能够及时针对异常通话提供相应的处理措施。
在一些实施例中,打分模块720,用于对通话参数集中的各项通话参数分别进行映射处理,得到各通话参数分别对应的标准值;通话参数对应的标准值为第一预设值或者第二预设值,第一预设值小于第二预设值;基于各通话参数分别对应的标准值,确定通话记录对应的目标节点在每个节点树中的位置信息;基于目标节点在每个节点树中的位置信息,确定目标节点在每个节点树中的分数;基于目标节点在每个节点树中的分数,得到通话记录的分值。
在一些实施例中,打分模块720,用于对每个节点树都执行下述步骤:基于目标节点在节点树中的位置信息获取目标节点与节点树的根节点之间的节点个数;获取节点树的平均节点数量,节点树的平均节点数量是指节点树中的各个节点与根节点之间的节点个数的平均值;基于目标节点与节点树的根节点之间的节点个数、节点树的平均节点数量,确定目标节点在节点树中的分值,目标节点在节点树中的分值与目标节点与节点树的根节点之间的节点个数呈负相关关系,目标节点在节点树下的分值与节点树的平均节点数量呈负相关关系。
在一些实施例中,节点树包括n层节点;打分模块720,用于对每个节点树都执行下述步骤:获取节点树的第i+1层节点的超平面划分依据的分界值,其中,将通话记录中的目标通话参数作为节点树的第i+1层节点的超平面划分依据,目标通话参数为通话记录的通话参数集中的任一项通话参数,n为大于1的整数,i为正整数,并且i小于等于n-1;若目标通话参数对应的标准值大于或等于i+1层的超平面划分依据的分界值,则确定目标节点在节点树的位置信息为在第i层节点的第一分支,及将第i层节点的第一分支作确定为第i+2层节点的上一级节点;若目标通话参数对应的标准值小于i+1层的超平面划分依据的分界值,则确定目标节点在节点树的位置信息为在第i层节点的第二分支,及将第i层节点的第二分支确定为第i+2层节点的上一级节点,其中,i的取值依次为1至n-1。
在一些实施例中,该装置还包括:结果获取模块和第一调整模块(图中未示出)。结果获取模块,用于获取校验结果,校验结果用于表征判断通话记录为异常通话记录的结果是否准确。第一调整模块,用于若校验结果表征通话记录为异常通话记录的结果不准确,则调整至少一个节点树的超平面划分依据。
在一些实施例中,装置还包括:加权模块(图7未示出)。加权模块,用于基于通话记录对应的用户属性对通话记录的分值进行加权处理,得到加权处理后的分值,用户属性包括以下至少一项:通话记录对应的逾期时长、通话记录对应的号码所属的地区。检测模块730,用于在加权处理后的分值属于预设区间的情况下,确定通话记录对应为异常通话。
请参阅图8,其示出了本申请实施例提供的一种决策树模型的训练装置800的结构框图。该装置800包括:数据获取模块810和处理模块820。
数据获取模块810,用于获取历史通话记录数据集及历史通话记录数据集的通话参数数据集,历史通话记录数据集包括多个历史通话记录。迭代训练模块820,用于对决策树模型进行迭代训练,直至异判率小于预设阈值,得到训练好的决策树模型。处理模块820,具体用于将目标历史通话记录对应的节点确定为节点树的根节点,目标历史通话记录为历史通话记录数据集中的任一项历史通话记录;根据通话记录数据集的通话参数数据集,确定节点树的各层节点的超平面划分依据;根据节点树的各层节点的超平面划分依据以及节点树的根节点,确定其他历史通话记录对应的节点在节点树中的位置信息,其他历史通话记录为历史通话记录数据集中除目标历史通话记录之外的历史通话记录;基于其他历史通话记录对应的节点在节点树中的位置信息,得到其它历史通话记录的分值;基于其它历史通话记录的分值,确定其他历史通话记录是否为异常通话;获取异判率,异判率为判断其他历史通话记录为异常通话错误的数量与其他历史通话记录的总数量之间的比值。
本申请实施例提供一种决策树模型的训练装置,通过大量无标注的历史通话记录来训练决策树模型,后续能够通过该训练的决策树模型对实时通话记录进行打分,实现了异常通话的自动识别,提高异常通话的识别效率,以使得后续能够及时针对异常通话提供相应的处理措施。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
如图9所示,本申请示例还提供一种电子设备900,该电子设备900可以是服务器,该电子设备900包括处理器910、存储器920。其中,存储器920存储有计算机程序指令。
处理器910可以包括一个或者多个处理核。处理器910利用各种接口和线路连接整个电池管理系统内的各种部分,通过运行或执行存储在存储器920内的指令、程序、代码集或指令集,以及调用存储在存储器920内的数据,执行电池管理系统的各种功能和处理数据。可选地,处理器910可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器910可集成中央处理器910(Central Processing Unit,CPU)、图像处理器910(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器910中,单独通过一块通信芯片进行实现。
存储器920可以包括随机存储器920(Random Access Memory,RAM),也可以包括只读存储器920(Read-Only Memory)。存储器920可用于存储指令、程序、代码、代码集或指令集。存储器920可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各种方法示例的指令等。存储数据区还可以存储电子设备在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
请参阅图10,其示出了本申请实施例还提供一种计算机可读存储介质1000,该计算机可读存储介质1000中存储有计算机程序指令1010,计算机程序指令1010可被处理器调用以执行上述实施例中所描述的方法。
计算机可读存储介质1000可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质1000包括非易失性计算机可读存储介质(non-transitory computer-readable storage medium)。计算机可读存储介质1000具有执行上述方法中的任何方法步骤的计算机程序指令1010的存储空间。这些计算机程序指令1010可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。计算机程序指令1010可以以适当形式进行压缩。
以上,仅是本申请的较佳示例而已,并非对本申请作任何形式上的限制,虽然本申请已以较佳示例揭示如上,然而并非用以限定本申请,任何本领域技术人员,在不脱离本申请技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效示例,但凡是未脱离本申请技术方案内容,依据本申请的技术实质对以上示例所作的任何简介修改、等同变化与修饰,均仍属于本申请技术方案的范围内。
Claims (10)
1.一种异常通话检测方法,其特征在于,所述方法包括:
获取通话记录的通话参数集,所述通话参数集包括至少一个通话参数;
基于所述通话记录的通话参数集和预训练的决策树模型,得到所述通话记录的分值,其中,所述决策树模型包括多个节点树,所述节点树是根据历史通话记录的通话参数集对所述历史通话记录进行划分得到的,所述通话记录的分值用于表征所述通话记录为异常通话的概率;
在所述通话记录的分值在预设区间的情况下,确定所述通话记录为异常通话。
2.根据权利要求1所述的方法,其特征在于,所述基于所述通话记录的通话参数集和预训练的决策树模型,得到所述通话记录的分值,包括:
对所述通话参数集中的各项通话参数分别进行映射处理,得到所述各通话参数分别对应的标准值;所述通话参数对应的标准值为第一预设值或者第二预设值,所述第一预设值小于所述第二预设值;
基于所述各通话参数分别对应的标准值,确定目标节点在每个所述节点树中的位置信息,其中,所述目标节点用于表征所述通话记录;
基于所述目标节点在每个所述节点树中的位置信息,确定所述目标节点在每个所述节点树中的分数;
基于所述目标节点在每个所述节点树中的分数,得到所述通话记录的分值。
3.根据权利要求2所述的方法,其特征在于,
所述节点树包括n层节点;
所述基于所述各通话参数分别对应的标准值,确定目标节点在每个所述节点树中的位置信息,包括:
对每个所述节点树都执行下述步骤:
获取节点树的第i+1层节点的超平面划分依据的分界值,其中,将通话记录中的目标通话参数作为所述节点树的第i+1层节点的超平面划分依据,所述目标通话参数为所述通话记录的通话参数集中的任一项通话参数,n为大于1的整数,i为正整数,并且i小于等于n-1;
若所述目标通话参数对应的标准值大于或等于所述i+1层的超平面划分依据的分界值,则确定所述目标节点在所述节点树的位置信息为在所述第i层节点的第一分支,及将所述第i层节点的第一分支确定为第i+2层节点的上一级节点;
若所述目标通话参数对应的标准值小于所述i+1层的超平面划分依据的分界值,则确定所述目标节点在所述节点树的位置信息为在所述第i层节点的第二分支,及将所述第i层节点的第二分支确定为第i+2层节点的上一级节点,其中,i的取值依次为1至n-1。
4.根据权利要求2所述的方法,其特征在于,所述基于所述目标节点在每个所述节点树中的位置信息,确定所述目标节点在每个所述节点树中的分数,包括:
对每个所述节点树都执行下述步骤:
基于所述目标节点在所述节点树中的位置信息,获取所述目标节点与所述节点树的根节点之间的节点个数;
获取所述节点树的平均节点数量,所述节点树的平均节点数量是指所述节点树中的各个节点与所述根节点之间的节点个数的平均值;
基于所述目标节点与所述节点树的根节点之间的节点个数、所述节点树的平均节点数量,确定所述目标节点在所述节点树中的分值,所述目标节点在所述节点树中的分值与所述目标节点与所述节点树的根节点之间的节点个数呈负相关关系,所述目标节点在所述节点树下的分值与所述节点树的平均节点数量呈负相关关系。
5.根据权利要求1所述的方法,其特征在于,所述确定所述通话记录为异常通话之后,还包括:
获取校验结果,所述校验结果用于表征判断所述通话记录为异常通话记录的结果是否准确;
若所述校验结果表征所述通话记录为异常通话记录的结果不准确,则调整至少一个节点树的超平面划分依据。
6.根据权利要求1所述的方法,其特征在于,所述得到所述通话记录的分值之后,还包括:
基于所述通话记录对应的用户属性对所述通话记录的分值进行加权处理,得到加权处理后的分值,所述用户属性包括以下至少一项:所述通话记录对应的逾期时长、所述通话记录对应的号码所属的地区。
7.一种决策树模型的训练方法,其特征在于,所述决策树模型包括多个节点树,所述方法包括:
获取历史通话记录数据集及所述历史通话记录数据集的通话参数数据集,所述历史通话记录数据集包括多个历史通话记录;
对所述决策树模型进行迭代训练,直至异判率小于预设阈值,得到训练好的决策树模型,具体包括:
将目标历史通话记录对应的节点确定为节点树的根节点,所述目标历史通话记录为所述历史通话记录数据集中的任一项历史通话记录;
根据所述通话记录数据集的通话参数数据集,确定节点树的各层节点的超平面划分依据;根据所述节点树的各层节点的超平面划分依据以及所述节点树的根节点,确定其他历史通话记录对应的节点在所述节点树中的位置信息,所述其他历史通话记录为所述历史通话记录数据集中除所述目标历史通话记录之外的历史通话记录;基于其他历史通话记录对应的节点在所述节点树中的位置信息,得到所述其它历史通话记录的分值;
基于所述其它历史通话记录的分值,确定其他历史通话记录是否为异常通话;获取异判率,所述异判率为判断其他历史通话记录为异常通话错误的数量与其他历史通话记录的总数量之间的比值。
8.一种异常通话检测装置,其特征在于,所述装置包括:
参数获取模块,用于获取通话记录的的通话参数集,所述通话参数集包括至少一个通话参数;
打分模块,用于基于所述通话记录的通话参数集和预训练的决策树模型,得到所述通话记录的分值,其中,所述决策树模型包括多个节点树,所述节点树是根据历史通话记录的通话参数集对所述历史通话记录进行划分得到的,所述通话记录的分值用于表征所述通话记录为异常通话的概率;
检测模块,用于在所述通话记录的分值在预设区间的情况下,确定所述通话记录为异常通话。
9.一种电子设备,其特征在于,所述电子设备包括处理器、存储器,所述存储器存储有计算机程序指令,所述计算机程序指令被所述处理器调用执行如权利要求1-6任一项所述的异常通话检测方法,或者,如权利要求7所述的决策树模型的训练方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,所述程序代码被处理器调用执行如权利要求1-6任一项所述的异常通话检测方法,或者,如权利要求7所述的决策树模型的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210394119.6A CN114979369A (zh) | 2022-04-14 | 2022-04-14 | 异常通话检测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210394119.6A CN114979369A (zh) | 2022-04-14 | 2022-04-14 | 异常通话检测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114979369A true CN114979369A (zh) | 2022-08-30 |
Family
ID=82976862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210394119.6A Pending CN114979369A (zh) | 2022-04-14 | 2022-04-14 | 异常通话检测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114979369A (zh) |
Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106255116A (zh) * | 2016-08-24 | 2016-12-21 | 王瀚辰 | 一种骚扰号码的识别方法 |
CN108833720A (zh) * | 2018-05-04 | 2018-11-16 | 北京邮电大学 | 诈骗电话号码识别方法与系统 |
CN109600520A (zh) * | 2017-09-30 | 2019-04-09 | 上海触乐信息科技有限公司 | 骚扰电话号码识别方法、装置及设备 |
CN109819126A (zh) * | 2017-11-21 | 2019-05-28 | 中移(杭州)信息技术有限公司 | 一种异常号码识别方法及装置 |
CN110147430A (zh) * | 2019-04-25 | 2019-08-20 | 上海欣方智能系统有限公司 | 基于随机森林算法的骚扰电话识别方法及系统 |
CN110493476A (zh) * | 2019-07-17 | 2019-11-22 | 中移(杭州)信息技术有限公司 | 一种检测方法、装置、服务器及存储介质 |
CN110677269A (zh) * | 2018-07-03 | 2020-01-10 | 中国电信股份有限公司 | 通信用户关系的确定方法、装置和计算机可读存储介质 |
CN111062422A (zh) * | 2019-11-29 | 2020-04-24 | 上海观安信息技术股份有限公司 | 一种套路贷体系化识别方法及装置 |
WO2020140678A1 (zh) * | 2019-01-04 | 2020-07-09 | 深圳壹账通智能科技有限公司 | 异常申请检测方法、装置、计算机设备和存储介质 |
CN111885270A (zh) * | 2020-07-09 | 2020-11-03 | 恒安嘉新(北京)科技股份公司 | 一种异常通信的检测方法、装置、设备及存储介质 |
CN112291427A (zh) * | 2020-11-02 | 2021-01-29 | 迈普通信技术股份有限公司 | 电话处理方法、装置、电子设备及存储介质 |
CN112329843A (zh) * | 2020-11-03 | 2021-02-05 | 中国平安人寿保险股份有限公司 | 基于决策树的呼叫数据处理方法、装置、设备及存储介质 |
CN112819045A (zh) * | 2021-01-20 | 2021-05-18 | 国家卫生健康委科学技术研究所 | 用于用户生理状态分类的方法、装置、电子设备及介质 |
CN113240510A (zh) * | 2021-05-28 | 2021-08-10 | 平安科技(深圳)有限公司 | 异常用户预测方法、装置、设备及存储介质 |
CN113596260A (zh) * | 2020-04-30 | 2021-11-02 | 中国移动通信集团广东有限公司 | 异常电话号码检测方法和电子设备 |
US20210365963A1 (en) * | 2017-08-24 | 2021-11-25 | Ping An Technology (Shenzhen) Co., Ltd. | Target customer identification method and device, electronic device and medium |
CN113850630A (zh) * | 2021-09-29 | 2021-12-28 | 中国电信股份有限公司 | 满意度预测方法及装置、存储介质、电子设备 |
CN113949652A (zh) * | 2021-10-12 | 2022-01-18 | 平安普惠企业管理有限公司 | 基于人工智能的用户异常行为检测方法、装置及相关设备 |
CN113962276A (zh) * | 2020-07-17 | 2022-01-21 | 中国移动通信集团湖南有限公司 | 异常信息确定方法、装置及电子设备、存储介质 |
CN113961712A (zh) * | 2021-09-08 | 2022-01-21 | 武汉众智数字技术有限公司 | 一种基于知识图谱的诈骗电话分析方法 |
CN114125154A (zh) * | 2021-11-12 | 2022-03-01 | 杭州摸象大数据科技有限公司 | 外呼策略参数调整方法、装置、计算机设备及存储介质 |
-
2022
- 2022-04-14 CN CN202210394119.6A patent/CN114979369A/zh active Pending
Patent Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106255116A (zh) * | 2016-08-24 | 2016-12-21 | 王瀚辰 | 一种骚扰号码的识别方法 |
US20210365963A1 (en) * | 2017-08-24 | 2021-11-25 | Ping An Technology (Shenzhen) Co., Ltd. | Target customer identification method and device, electronic device and medium |
CN109600520A (zh) * | 2017-09-30 | 2019-04-09 | 上海触乐信息科技有限公司 | 骚扰电话号码识别方法、装置及设备 |
CN109819126A (zh) * | 2017-11-21 | 2019-05-28 | 中移(杭州)信息技术有限公司 | 一种异常号码识别方法及装置 |
CN108833720A (zh) * | 2018-05-04 | 2018-11-16 | 北京邮电大学 | 诈骗电话号码识别方法与系统 |
CN110677269A (zh) * | 2018-07-03 | 2020-01-10 | 中国电信股份有限公司 | 通信用户关系的确定方法、装置和计算机可读存储介质 |
WO2020140678A1 (zh) * | 2019-01-04 | 2020-07-09 | 深圳壹账通智能科技有限公司 | 异常申请检测方法、装置、计算机设备和存储介质 |
CN110147430A (zh) * | 2019-04-25 | 2019-08-20 | 上海欣方智能系统有限公司 | 基于随机森林算法的骚扰电话识别方法及系统 |
CN110493476A (zh) * | 2019-07-17 | 2019-11-22 | 中移(杭州)信息技术有限公司 | 一种检测方法、装置、服务器及存储介质 |
CN111062422A (zh) * | 2019-11-29 | 2020-04-24 | 上海观安信息技术股份有限公司 | 一种套路贷体系化识别方法及装置 |
CN113596260A (zh) * | 2020-04-30 | 2021-11-02 | 中国移动通信集团广东有限公司 | 异常电话号码检测方法和电子设备 |
CN111885270A (zh) * | 2020-07-09 | 2020-11-03 | 恒安嘉新(北京)科技股份公司 | 一种异常通信的检测方法、装置、设备及存储介质 |
CN113962276A (zh) * | 2020-07-17 | 2022-01-21 | 中国移动通信集团湖南有限公司 | 异常信息确定方法、装置及电子设备、存储介质 |
CN112291427A (zh) * | 2020-11-02 | 2021-01-29 | 迈普通信技术股份有限公司 | 电话处理方法、装置、电子设备及存储介质 |
CN112329843A (zh) * | 2020-11-03 | 2021-02-05 | 中国平安人寿保险股份有限公司 | 基于决策树的呼叫数据处理方法、装置、设备及存储介质 |
CN112819045A (zh) * | 2021-01-20 | 2021-05-18 | 国家卫生健康委科学技术研究所 | 用于用户生理状态分类的方法、装置、电子设备及介质 |
CN113240510A (zh) * | 2021-05-28 | 2021-08-10 | 平安科技(深圳)有限公司 | 异常用户预测方法、装置、设备及存储介质 |
CN113961712A (zh) * | 2021-09-08 | 2022-01-21 | 武汉众智数字技术有限公司 | 一种基于知识图谱的诈骗电话分析方法 |
CN113850630A (zh) * | 2021-09-29 | 2021-12-28 | 中国电信股份有限公司 | 满意度预测方法及装置、存储介质、电子设备 |
CN113949652A (zh) * | 2021-10-12 | 2022-01-18 | 平安普惠企业管理有限公司 | 基于人工智能的用户异常行为检测方法、装置及相关设备 |
CN114125154A (zh) * | 2021-11-12 | 2022-03-01 | 杭州摸象大数据科技有限公司 | 外呼策略参数调整方法、装置、计算机设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
MOJTABA MALEK AKHLAGH ET AL: ""Temporal data classification and rule extraction using a probabilistic decision tree"", 《2012 INTERNATIONAL CONFERENCE ON COMPUTER & INFORMATION SCIENCE (ICCIS)》, 10 September 2012 (2012-09-10) * |
李慧: ""一种改进的随机森林并行分类方法在运营商大数据的应用"", 《 CNKI优秀硕士学位论文全文库》, 15 March 2016 (2016-03-15) * |
王家定;胡访宇: "基于移动通话记录特征库的模糊诀策树构建", 电子技术(上海), no. 006, 31 December 2013 (2013-12-31) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12015731B2 (en) | Call classification through analysis of DTMF events | |
EP3306867A1 (en) | Auto-response method, apparatus and device, and computer-readable storage medium | |
CN106650398B (zh) | 移动平台的验证码识别系统及识别方法 | |
US10637990B1 (en) | Call center load balancing and routing management | |
US10659605B1 (en) | Automatically unsubscribing from automated calls based on call audio patterns | |
US10498897B1 (en) | Systems and methods for simulating multiple call center balancing | |
CN108449482A (zh) | 号码识别的方法和系统 | |
CN111435482A (zh) | 一种外呼模型的构建方法、外呼方法、装置和存储介质 | |
CN113627566A (zh) | 一种网络诈骗的预警方法、装置和计算机设备 | |
CN112995414A (zh) | 基于语音通话的行为质检方法、装置、设备及存储介质 | |
CN111340574B (zh) | 风险用户的识别方法、装置和电子设备 | |
CN114979369A (zh) | 异常通话检测方法、装置、电子设备及存储介质 | |
CN111131629A (zh) | 骚扰电话的处理方法、装置、存储介质以及终端 | |
CN109754319B (zh) | 信用分值确定系统、方法、终端及服务器 | |
WO2023050669A1 (zh) | 基于神经网络的信息推送方法、系统、设备及介质 | |
CN109255016A (zh) | 基于深度学习的应答方法、装置及计算机可读存储介质 | |
CN115118820A (zh) | 一种通话处理方法、装置、计算机设备及存储介质 | |
CN110166635B (zh) | 可疑终端识别方法和可疑终端识别系统 | |
CN114257688A (zh) | 电话诈骗识别方法及相关装置 | |
CN114157763A (zh) | 交互过程中的信息处理方法、装置、终端及存储介质 | |
CN113837587A (zh) | 客服质检方法、装置、计算机设备及存储介质 | |
CN112820302A (zh) | 声纹识别方法、装置、电子设备和可读存储介质 | |
CN113723524B (zh) | 基于预测模型的数据处理方法、相关设备及介质 | |
US11880847B2 (en) | Visual representation generation for bias correction | |
CN112036350B (zh) | 一种基于政务云的用户调查方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |