WO2021051504A1

WO2021051504A1 - 异常通话对象的判断方法、装置、计算机设备和存储介质

Info

Publication number: WO2021051504A1
Application number: PCT/CN2019/116342
Authority: WO
Inventors: 王珏; 彭俊清; 王健宗
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-09-18
Filing date: 2019-11-07
Publication date: 2021-03-25
Also published as: CN110769425A; CN110769425B

Abstract

一种异常通话对象的判断方法、装置、计算机设备和存储介质，所述方法包括：获取第一通话语音，以及获取第二通话语音；分别提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据；若所述第一声音数据和所述第二声音数据均为电子音，则构建通话通道；记录通话内容，并将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值；若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，则判定所述第一对象端与所述第二对象端均为异常通话对象。从而提高了异常通话对象判断的准确性。

Description

异常通话对象的判断方法、装置、计算机设备和存储介质

本申请要求于2019年9月18日提交中国专利局、申请号为201910882722.7，发明名称为“异常通话对象的判断方法、装置、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及到计算机领域，特别是涉及到一种异常通话对象的判断方法、装置、计算机设备和存储介质。

背景技术

非正常电话(异常电话)，例如恶意推销、诈骗电话、钓鱼电话等等，一直是长期存在的令用户饱受困扰的问题,每年在全世界造成数十亿美元的财务损失。近几年人工智能技术的发展催生了自动外呼机器人产业的快速成熟，据统计目前市场上最低仅需要几千元即可引入自动外呼机器人产品，越来越多的商家使用外呼机器人产品替代人工坐席完成电话销售任务，在这样的情况使非正常电话问题更加严重。业内对于异常通话的处理大多采用“标记——拦截”这种标准的处理方法，虽然可以有效的降低骚扰电话对用户的影响，但是仍然有很多缺陷，比如：无法核实标记的准确性、若标记信息有误，用户可能会遗漏重要电话、面对不同用户很难用统一的指标实施拦截动作。因此目前判断异常通话的准确性较低。

技术问题

本申请的主要目的为提供一种异常通话对象的判断方法、装置、计算机设备和存储介质，旨在提高判断异常通话的准确性。

技术解决方案

为了实现上述发明目的，本申请提出一种异常通话对象的判断方法，应用于服务器，包括：

获取第一通话语音，以及获取第二通话语音，其中所述第一通话语音是第一用户端与第一对象端的通话语音，所述第二通话语音是第二用户端与第二对象端的通话语音；

根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据；

根据预设的电子音判断方法，判断所述第一声音数据是否为电子音，并且判断所述第二声音数据是否为电子音；

若所述第一声音数据和所述第二声音数据均为电子音，则构建通话通道，所述通话通道用于接通所述第一对象端和所述第二对象端；

记录所述第一对象端和所述第二对象端的通话内容，并将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值；

判断所述第一情绪波动值和所述第二情绪波动值是否均小于预设的情绪波动阈值；

若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，则判定所述第一对象端与所述第二对象端均为异常通话对象。

有益效果

本申请的异常通话对象的判断方法、装置、计算机设备和存储介质，获取第一通话语音，以及获取第二通话语音；分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据；若所述第一声音数据和所述第二声音数据均为电子音，则构建通话通道，所述通话通道用于接通所述第一对象端和所述第二对象端；记录所述第一对象端和所述第二对象端的通话内容，并将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值；若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，则判定所述第一对象端与所述第二对象端均为异常通话对象。从而提高了异常通话对象判断的准确性。

附图说明

图1为本申请一实施例的异常通话对象的判断方法的流程示意图；

图2为本申请一实施例的异常通话对象的判断装置的结构示意框图；

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

本申请的最佳实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请实施例提供一种异常通话对象的判断方法，应用于服务器，包括：

S1、获取第一通话语音，以及获取第二通话语音，其中所述第一通话语音是第一用户端与第一对象端的通话语音，所述第二通话语音是第二用户端与第二对象端的通话语音；

S2、根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据；

S3、根据预设的电子音判断方法，判断所述第一声音数据是否为电子音，并且判断所述第二声音数据是否为电子音；

S4、若所述第一声音数据和所述第二声音数据均为电子音，则构建通话通道，所述通话通道用于接通所述第一对象端和所述第二对象端；

S5、记录所述第一对象端和所述第二对象端的通话内容，并将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值；

S6、判断所述第一情绪波动值和所述第二情绪波动值是否均小于预设的情绪波动阈值；

S7、若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，则判定所述第一对象端与所述第二对象端均为异常通话对象。

本申请通过构建通话通道，所述通话通道用于接通第一对象端和第二对象端的方式，并利用情绪波动值判断第一对象端和第二对象端是否为异常通话对象，从而减轻了计算压力(无需构建并且使用应答机器人)并且提高了判断异常通话的准确性(自然人具有情绪波动，而机器人没有)。本申请的技术方案的构思是，先假设第一对象端和第二对象端均是机器人，而机器人采用的语音则为电子合成音(电子音)，并且将两个机器人接通，因为机器人的机械性，会持续通话以实现恶意推销或者信息采集的目的，并且在通话过程中机器人没有情绪波动，据此判断是否为异常通话对象。其中所述异常通话对象指的是，符合本申请的判断方法的通话对象。

如上述步骤S1所述，获取第一通话语音，以及获取第二通话语音，其中所述第一通话语音是第一用户端与第一对象端的通话语音，所述第二通话语音是第二用户端与第二对象端的通话语音。其中，所述第一通话语音与所述第二通话语音均是在当前时间保持连接的通话中获取的。所述第一用户端与所述第二用户端是本申请的服务器提供的服务的消费端，而所述第一对象端和所述第二对象端是本申请要进行判断的对象。

如上述步骤S2所述，根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据。由于人的声纹特征是不同的，可用于身份认证的依据，同样也可以将两个通话对象的声音区别出来，据此可以提取出声音数据。其中，声音数据提取方法可以为任意方法，例如包括:获取预存的第一用户端对应的第一声纹特征，以及获取预存的第二用户端对应的第二声纹特征；根据预设的说话人聚类技术，对所述第一通话语音进行聚类处理，从而得到具有不同声纹特征的两个第一语音集，并将不符合所述第一声纹特征的所述第一语音集记为所述第一对象端的第一声音数据；根据预设的说话人聚类技术，对所述第二通话语音进行聚类处理，从而得到具有不同声纹特征的两个第二语音集，并将不符合所述第二声纹特征的所述第二语音集记为所述第二对象端的第二声音数据；提取所述第一声音数据和所述第二声音数据。

如上述步骤S3所述，根据预设的电子音判断方法，判断所述第一声音数据是否为电子音，并且判断所述第二声音数据是否为电子音。机器人采用的语音为电子合成音(电子音)，而自然人的发声一般与电子音具有明显的区别，因此若确定声音数据为电子音，则有理由怀疑为非正常对象端。具体地，预设的电子音判断方法可为任意方法，例如将声音数据与预存的电子音数据库中的电子音进行对比，若对比结果为相似，则判定声音数据为电子音。更具体地，预设的电子音判断方法包括：识别所述第一声音数据得到文字文本；根据所述文字文本采用预设的电子音生成参照语音；判断所述参照语音与所述第一声音数据的相似程度；若相似程度大于预设阈值，则判定所述第一声音数据为电子音。其中相似程度可以为任意方面可行的相似程度，例如声纹特征的相似程度，波形图的相似程度等。

如上述步骤S4所述，若所述第一声音数据和所述第二声音数据均为电子音，则构建通话通道，所述通话通道用于接通所述第一对象端和所述第二对象端。若所述第一声音数据和所述第二声音数据均为电子音，则所述第一对象端和所述第二对象端有可能均为机器人，据此构建通话通道，所述通话通道用于接通所述第一对象端和所述第二对象端。从而在不需要构建应答机器人并且使用应答机器人的前提下，就能获取通话内容。

如上述步骤S5，记录所述第一对象端和所述第二对象端的通话内容，并将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值。其中预设的情绪波动识别模型可为任意模型，例如为基于机器学习模型的情绪波动识别模型。所述机器学习模型例如为神经网络模型、卷积神经网络模型、长短期记忆网络模型等，在此不再赘述。所述将所述通话内容输入预设的情绪波动识别模型中进行处理例如为：从所述通话内容中分离出所述第一对象端的第一语音片段集合和所述第二对象端的第二语音片段集合；采集所述第一语音片段集合的第一声音特征数据和所述第二语音片段集合中的第二声音特征数据；根据公式：情绪波动值＝(声音特征数据的最大值-声音特征数据的最小值)/声音特征数据的平均值，计算得到所述第一对象端对应的第一情绪波动值和所述第二对象端对应的第二情绪波动值。其中自然人的声音特征是与情绪关联的，例如恼怒时的音量一般大于平静时的音量，从而通过通话内容可以计算出情绪波动值。

如上述步骤S6所述，判断所述第一情绪波动值和所述第二情绪波动值是否均小于预设的情绪波动阈值。情绪波动值反应的情绪变化幅度，这与自然人关联，而机器人不具有情绪波动。因此以情绪波动值作为判断是否为非正常对象端的依据。

如上述步骤S7所述，若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，则判定所述第一对象端与所述第二对象端均为异常通话对象。若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，表明所述第一对象端与所述第二对象端均未出现较大的情绪变化，据此判定所述第一对象端与所述第二对象端均为异常通话对象。

在一个实施方式中，所述根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据的步骤S2,包括：

S201、获取预存的第一用户端对应的第一声纹特征，以及获取预存的第二用户端对应的第二声纹特征；

S202、根据预设的说话人聚类技术，对所述第一通话语音进行聚类处理，从而得到具有不同声纹特征的两个第一语音集，并将不符合所述第一声纹特征的所述第一语音集记为所述第一对象端的第一声音数据；

S203、根据预设的说话人聚类技术，对所述第二通话语音进行聚类处理，从而得到具有不同声纹特征的两个第二语音集，并将不符合所述第二声纹特征的所述第二语音集记为所述第二对象端的第二声音数据；

S204、提取所述第一声音数据和所述第二声音数据。

如上所述，实现了从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据。由于第一用户端与第二用户端是本申请的服务器的消费者，预先在服务器中存储了对应的声纹特征，据此可以识别出第一用户端与第二用户端的语音。其中预设的说话人聚类技术是指将具有相同声纹特征的语音片段归为一类，从而形成语音集，以使混合有两个说话人的第一通话语音分离为两个第一语音集。其中两个第一语音集一者为第一用户端，一者为第一对象端，其中不符合所述第一声纹特征的所述第一语音集即为所述第一对象端的第一声音数据。同理可获取所述第二对象端的第二声音数据。

在一个实施方式中，所述根据预设的电子音判断方法，判断所述第一声音数据是否为电子音的步骤S3,包括：

S301、根据所述第一声音数据，生成所述第一声音数据对应的波形图的表达函数F(t)；

S302、根据公式：

获取函数H(t),其中f(t)为预设的电子音的波形图的表达函数，E(t)为所述函数F(t)与所述函数f(t)的差值函数，

为所述差值函数对时间的微分函数，t为时间，m为预设的大于0的误差参数值；

S303、获取所述函数H(t)在时间轴上不等于m时的第一时间长度和等于m时的第二时间长度，根据公式：贴合程度值＝所述第一时间长度/(所述第一时间长度+所述第二时间长度)，计算出所述贴合程度值，并判断所述贴合程度值是否大于预设的贴合阈值；

S304、若所述贴合程度值大于预设的贴合阈值，则判定所述第一声音数据为电子音。

如上所述，实现了判断所述第一声音数据是否为电子音。声音是由机械振动而产生的，其本身具有对应的波形图，而波形图具有相应的函数表达式，据此生成第一声音数据对应的波形图的表达函数F(t)。再根据公式：

获取函数H(t),获取所述函数H(t)在时间轴上不等于m时的第一时间长度和等于m时的第二时间长度，根据公式：贴合程度值＝所述第一时间长度/(所述第一时间长度+所述第二时间长度)，计算出所述贴合程度值，并判断所述贴合程度值是否大于预设的贴合阈值；若所述贴合程度值大于预设的贴合阈值，则判定所述第一声音数据为电子音。从而利用函数H(t)以确定第一声音数据与预设的电子音是否相近，据此确定是否为电子音。

在一个实施方式中，所述根据预设的电子音判断方法，判断所述第一声音数据是否为电子音，并且判断所述第二声音数据是否为电子音的步骤S3之后,包括：

S31、若所述第一声音数据和所述第二声音数据中仅有一者为电子音，则将为电子音的第一声音数据或者第二声音数据记为嫌疑声音数据，所述嫌疑声音数据对应对象端记为嫌疑对象端；

S32、构建通话通道以接通所述嫌疑对象端与预设的应答机器人；

S33、记录所述嫌疑对象端与预设的应答机器人的通话内容，并将通话内容输入预设的情绪波动识别模型中进行处理，得到所述嫌疑对象端的嫌疑情绪波动值；

S34、判断嫌疑情绪波动值是否小于预设的情绪波动阈值；

S35、若嫌疑情绪波动值小于预设的情绪波动阈值，则判定所述嫌疑对象端为异常通话对象。

如上所述，实现了对仅存在单个嫌疑对象端时的异常通话对象的判断。若所述第一声音数据和所述第二声音数据中仅有一者为电子音，则无法以接通第一对象端与第二对象端的方式获取通话内容。作为替换，本申请采用预设的应答机器人与嫌疑对象端进行通话，从而获取通话内容。并且嫌疑对象端或也为机器人，那么应答机器人与嫌疑对象端的通话将能够进行下去，并且不会泄漏用户端的隐私。再根据通话内容，判断嫌疑情绪波动值是否小于预设的情绪波动阈值，若嫌疑情绪波动值小于预设的情绪波动阈值，则判定所述嫌疑对象端为异常通话对象。

在一个实施方式中，所述记录所述嫌疑对象端与预设的应答机器人的通话内容，并将通话内容输入预设的情绪波动识别模型中进行处理，得到所述嫌疑对象端的嫌疑情绪波动值的步骤S33之前,包括：

S321、利用所述应答机器人在通话通道中输入刺激声音，其中所述刺激声音包括噪音、音量大于预设音量阈值的声音或者频率高于预设频率阈值的声音；

S322、生成通话记录指令，其中所述通话记录指令用于指示记录所述嫌疑对象端与预设的应答机器人的通话内容，所述通话内容至少包括所述嫌疑对象端针对所述刺激声音的回复。

如上所述，实现了采用输入刺激声音的方式，提高了判断的准确性。若对象端为自然人，并且未发现通话对象为机器人，或者自然人的自制力很强，那么对象端的情绪波动不大，从而造成异常通话对象的判断错误。本申请采用利用所述应答机器人在通话通道中输入刺激声音的方式，使得自然人受激会发生应激反应(例如尖叫)，而所述应激反应难以被自然人控制，而机器人却不受此影响，从而提高了自然人的情绪波动值，据此提高了异常通话对象判断的准确性。

在一个实施方式中，所述将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值的步骤S5,包括：

S501、从所述通话内容中分离出所述第一对象端的第一语音片段集合和所述第二对象端的第二语音片段集合；

S502、采集所述第一语音片段集合的第一声音特征数据和所述第二语音片段集合中的第二声音特征数据；

S503、根据公式：情绪波动值＝(声音特征数据的最大值-声音特征数据的最小值)/声音特征数据的平均值，计算得到所述第一对象端对应的第一情绪波动值和所述第二对象端对应的第二情绪波动值。

如上所述，实现了将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值。其中声音特征数据可为任意数据，例如为音频、音量、语速等等。若情绪平稳，通话时的声音特征数据也应是保持在一定范围内，而情绪激动时，则声音特征数据会有大幅度的变化。因此，根据公式：情绪波动值＝(声音特征数据的最大值-声音特征数据的最小值)/声音特征数据的平均值，计算得到所述第一对象端对应的第一情绪波动值和所述第二对象端对应的第二情绪波动值。

在一个实施方式中，所述获取第一通话语音，以及获取第二通话语音，其中所述第一通话语音是第一用户端与第一对象端的通话语音，所述第二通话语音是第二用户端与第二对象端的通话语音的步骤S1之前，包括：

S01、获取所述第一对象端和所述第二对象端的电话号码和电话号码激活时间；

S02、判断所述第一对象端和所述第二对象端的电话号码是否均属于预设的非正常数据库；

S03、若所述第一对象端和所述第二对象端的电话号码均不属于预设的非正常数据库，则判断所述电话号码激活时间是否均晚于预设的时间点；

S04、若所述电话号码激活时间均晚于预设的时间点，则生成通话语音获取指令，所述通话语音获取指令用于指示获取第一通话语音，以及获取第二通话语音。

如上所述，实现了采用预先判断以识别异常通话端。一般而言，若电话号码被标记并存入预设的非正常数据库，则表明该电话号码常进行恶意推销、诈骗等异常通话，此时即可直接判定其为异常通话对象；反之则不能确定其是否为异常通话对象，需要进一步判断。若电话号码激活时间晚于预设的时间点，表明该电话号码是新入网用户，由于缺少足够的通话记录信息，有可能为异常通话对象，因此需要进一步识别，据此生成通话语音获取指令，所述通话语音获取指令用于指示获取第一通话语音，以及获取第二通话语音。

参照图2，本申请实施例提供一种异常通话对象的判断装置，应用于服务器，包括：

通话语音获取单元10，用于获取第一通话语音，以及获取第二通话语音，其中所述第一通话语音是第一用户端与第一对象端的通话语音，所述第二通话语音是第二用户端与第二对象端的通话语音；

声音数据提取单元20，用于根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据；

电子音判断单元30，用于根据预设的电子音判断方法，判断所述第一声音数据是否为电子音，并且判断所述第二声音数据是否为电子音；

通话通道构建单元40，用于若所述第一声音数据和所述第二声音数据均为电子音，则构建通话通道，所述通话通道用于接通所述第一对象端和所述第二对象端；

通话内容记录单元50，用于记录所述第一对象端和所述第二对象端的通话内容，并将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值；

情绪波动阈值判断单元60，用于判断所述第一情绪波动值和所述第二情绪波动值是否均小于预设的情绪波动阈值；

异常通话对象判定单元70，用于若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，则判定所述第一对象端与所述第二对象端均为异常通话对象。

其中上述单元分别用于执行的操作与前述实施方式的异常通话对象的判断方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述声音数据提取单元20,包括：

声纹特征获取子单元，用于获取预存的第一用户端对应的第一声纹特征，以及获取预存的第二用户端对应的第二声纹特征；

第一声音数据获取子单元，用于根据预设的说话人聚类技术，对所述第一通话语音进行聚类处理，从而得到具有不同声纹特征的两个第一语音集，并将不符合所述第一声纹特征的所述第一语音集记为所述第一对象端的第一声音数据；

第二声音数据获取子单元，用于根据预设的说话人聚类技术，对所述第二通话语音进行聚类处理，从而得到具有不同声纹特征的两个第二语音集，并将不符合所述第二声纹特征的所述第二语音集记为所述第二对象端的第二声音数据；

声音数据提取子单元，用于提取所述第一声音数据和所述第二声音数据。

其中上述子单元分别用于执行的操作与前述实施方式的异常通话对象的判断方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述电子音判断单元30,包括：

表达函数F(t)生成子单元，用于根据所述第一声音数据，生成所述第一声音数据对应的波形图的表达函数F(t)；

函数H(t)获取子单元，用于根据公式：

贴合程度值计算子单元，用于获取所述函数H(t)在时间轴上不等于m时的第一时间长度和等于m时的第二时间长度，根据公式：贴合程度值＝所述第一时间长度/(所述第一时间长度+所述第二时间长度)，计算出所述贴合程度值，并判断所述贴合程度值是否大于预设的贴合阈值；

电子音判定子单元，用于若所述贴合程度值大于预设的贴合阈值，则判定所述第一声音数据为电子音。

在一个实施方式中，所述装置,包括：

嫌疑标记单元，用于若所述第一声音数据和所述第二声音数据中仅有一者为电子音，则将为电子音的第一声音数据或者第二声音数据记为嫌疑声音数据，所述嫌疑声音数据对应对象端记为嫌疑对象端；

构建通话通道单元，用于构建通话通道以接通所述嫌疑对象端与预设的应答机器人；

嫌疑情绪波动值获取单元，用于记录所述嫌疑对象端与预设的应答机器人的通话内容，并将通话内容输入预设的情绪波动识别模型中进行处理，得到所述嫌疑对象端的嫌疑情绪波动值；

嫌疑情绪波动值判断单元，用于判断嫌疑情绪波动值是否小于预设的情绪波动阈值；

嫌疑对象端判定单元，用于若嫌疑情绪波动值小于预设的情绪波动阈值，则判定所述嫌疑对象端为异常通话对象。

在一个实施方式中，所述装置,包括：

刺激声音输入单元，用于利用所述应答机器人在通话通道中输入刺激声音，其中所述刺激声音包括噪音、音量大于预设音量阈值的声音或者频率高于预设频率阈值的声音；

通话记录指令生成单元，用于生成通话记录指令，其中所述通话记录指令用于指示记录所述嫌疑对象端与预设的应答机器人的通话内容，所述通话内容至少包括所述嫌疑对象端针对所述刺激声音的回复。

在一个实施方式中，所述通话内容记录单元50,包括：

语音片段集合获取子单元，用于从所述通话内容中分离出所述第一对象端的第一语音片段集合和所述第二对象端的第二语音片段集合；

声音特征数据采集子单元，用于采集所述第一语音片段集合的第一声音特征数据和所述第二语音片段集合中的第二声音特征数据；

情绪波动值计算子单元，用于根据公式：情绪波动值＝(声音特征数据的最大值-声音特征数据的最小值)/声音特征数据的平均值，计算得到所述第一对象端对应的第一情绪波动值和所述第二对象端对应的第二情绪波动值。

在一个实施方式中，所述装置，包括：

电话号码获取单元，用于获取所述第一对象端和所述第二对象端的电话号码和电话号码激活时间；

非正常数据库判断单元，用于判断所述第一对象端和所述第二对象端的电话号码是否均属于预设的非正常数据库；

时间点判断单元，用于若所述第一对象端和所述第二对象端的电话号码均不属于预设的非正常数据库，则判断所述电话号码激活时间是否均晚于预设的时间点；

通话语音获取指令生成单元，用于若所述电话号码激活时间均晚于预设的时间点，则生成通话语音获取指令，所述通话语音获取指令用于指示获取第一通话语音，以及获取第二通话语音。

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储异常通话对象的判断方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常通话对象的判断方法。

上述处理器执行上述异常通话对象的判断方法，其中所述方法包括的步骤分别与执行前述实施方式的异常通话对象的判断方法的步骤一一对应,在此不再赘述。

本领域技术人员可以理解，图中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现异常通话对象的判断方法，其中所述方法包括的步骤分别与执行前述实施方式的异常通话对象的判断方法的步骤一一对应,在此不再赘述。其中计算机可读存储介质例如为，非易失性的计算机可读存储介质，或者为易失性的计算机可读存储介质。

Claims

一种异常通话对象的判断方法，应用于服务器，其特征在于，包括：

获取第一通话语音，以及获取第二通话语音，其中所述第一通话语音是第一用户端与第一对象端的通话语音，所述第二通话语音是第二用户端与第二对象端的通话语音；

根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据；

根据预设的电子音判断方法，判断所述第一声音数据是否为电子音，并且判断所述第二声音数据是否为电子音；

若所述第一声音数据和所述第二声音数据均为电子音，则构建通话通道，所述通话通道用于接通所述第一对象端和所述第二对象端；

记录所述第一对象端和所述第二对象端的通话内容，并将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值；

判断所述第一情绪波动值和所述第二情绪波动值是否均小于预设的情绪波动阈值；

若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，则判定所述第一对象端与所述第二对象端均为异常通话对象。
根据权利要求1所述的异常通话对象的判断方法，其特征在于，所述根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据的步骤,包括：

获取预存的第一用户端对应的第一声纹特征，以及获取预存的第二用户端对应的第二声纹特征；

根据预设的说话人聚类技术，对所述第一通话语音进行聚类处理，从而得到具有不同声纹特征的两个第一语音集，并将不符合所述第一声纹特征的所述第一语音集记为所述第一对象端的第一声音数据；

根据预设的说话人聚类技术，对所述第二通话语音进行聚类处理，从而得到具有不同声纹特征的两个第二语音集，并将不符合所述第二声纹特征的所述第二语音集记为所述第二对象端的第二声音数据；

提取所述第一声音数据和所述第二声音数据。
根据权利要求1所述的异常通话对象的判断方法，其特征在于，所述根据预设的电子音判断方法，判断所述第一声音数据是否为电子音的步骤,包括：

根据所述第一声音数据，生成所述第一声音数据对应的波形图的表达函数F(t)；

根据公式：

H(t)＝min(G(t)，m)，其中
获取函数H(t),其中f(t)为预设的电子音的波形图的表达函数，E(t)为所述函数F(t)与所述函数f(t)的差值函数，
为所述差值函数对时间的微分函数，t为时间，m为预设的大于0的误差参数值；

获取所述函数H(t)在时间轴上不等于m时的第一时间长度和等于m时的第二时间长度，根据公式：贴合程度值＝所述第一时间长度/(所述第一时间长度+所述第二时间长度)，计算出所述贴合程度值，并判断所述贴合程度值是否大于预设的贴合阈值；

若所述贴合程度值大于预设的贴合阈值，则判定所述第一声音数据为电子音。
根据权利要求1所述的异常通话对象的判断方法，其特征在于，所述根据预设的电子音判断方法，判断所述第一声音数据是否为电子音，并且判断所述第二声音数据是否为电子音的步骤之后,包括：

若所述第一声音数据和所述第二声音数据中仅有一者为电子音，则将为电子音的第一声音数据或者第二声音数据记为嫌疑声音数据，所述嫌疑声音数据对应对象端记为嫌疑对象端；

构建通话通道以接通所述嫌疑对象端与预设的应答机器人；

记录所述嫌疑对象端与预设的应答机器人的通话内容，并将通话内容输入预设的情绪波动识别模型中进行处理，得到所述嫌疑对象端的嫌疑情绪波动值；

判断嫌疑情绪波动值是否小于预设的情绪波动阈值；

若嫌疑情绪波动值小于预设的情绪波动阈值，则判定所述嫌疑对象端为异常通话对象。
根据权利要求4所述的异常通话对象的判断方法，其特征在于，所述记录所述嫌疑对象端与预设的应答机器人的通话内容，并将通话内容输入预设的情绪波动识别模型中进行处理，得到所述嫌疑对象端的嫌疑情绪波动值的步骤之前,包括：

利用所述应答机器人在通话通道中输入刺激声音，其中所述刺激声音包括噪音、音量大于预设音量阈值的声音或者频率高于预设频率阈值的声音；

生成通话记录指令，其中所述通话记录指令用于指示记录所述嫌疑对象端与预设的应答机器人的通话内容，所述通话内容至少包括所述嫌疑对象端针对所述刺激声音的回复。
根据权利要求1所述的异常通话对象的判断方法，其特征在于，所述将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值的步骤,包括：

从所述通话内容中分离出所述第一对象端的第一语音片段集合和所述第二对象端的第二语音片段集合；

采集所述第一语音片段集合的第一声音特征数据和所述第二语音片段集合中的第二声音特征数据；

根据公式：情绪波动值＝(声音特征数据的最大值-声音特征数据的最小值)/声音特征数据的平均值，计算得到所述第一对象端对应的第一情绪波动值和所述第二对象端对应的第二情绪波动值。
根据权利要求1所述的异常通话对象的判断方法，其特征在于，所述获取第一通话语音，以及获取第二通话语音，其中所述第一通话语音是第一用户端与第一对象端的通话语音，所述第二通话语音是第二用户端与第二对象端的通话语音的步骤之前，包括：

获取所述第一对象端和所述第二对象端的电话号码和电话号码激活时间；

判断所述第一对象端和所述第二对象端的电话号码是否均属于预设的非正常数据库；

若所述第一对象端和所述第二对象端的电话号码均不属于预设的非正常数据库，则判断所述电话号码激活时间是否均晚于预设的时间点；

若所述电话号码激活时间均晚于预设的时间点，则生成通话语音获取指令，所述通话语音获取指令用于指示获取第一通话语音，以及获取第二通话语音。
一种异常通话对象的判断装置，应用于服务器，其特征在于，包括：

通话语音获取单元，用于获取第一通话语音，以及获取第二通话语音，其中所述第一通话语音是第一用户端与第一对象端的通话语音，所述第二通话语音是第二用户端与第二对象端的通话语音；

声音数据提取单元，用于根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据；

电子音判断单元，用于根据预设的电子音判断方法，判断所述第一声音数据是否为电子音，并且判断所述第二声音数据是否为电子音；

通话通道构建单元，用于若所述第一声音数据和所述第二声音数据均为电子音，则构建通话通道，所述通话通道用于接通所述第一对象端和所述第二对象端；

通话内容记录单元，用于记录所述第一对象端和所述第二对象端的通话内容，并将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值；

情绪波动阈值判断单元，用于判断所述第一情绪波动值和所述第二情绪波动值是否均小于预设的情绪波动阈值；

异常通话对象判定单元，用于若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，则判定所述第一对象端与所述第二对象端均为异常通话对象。
根据权利要求8所述的异常通话对象的判断装置，其特征在于，所述声音数据提取单元,包括：

声纹特征获取子单元，用于获取预存的第一用户端对应的第一声纹特征，以及获取预存的第二用户端对应的第二声纹特征；

第一声音数据获取子单元，用于根据预设的说话人聚类技术，对所述第一通话语音进行聚类处理，从而得到具有不同声纹特征的两个第一语音集，并将不符合所述第一声纹特征的所述第一语音集记为所述第一对象端的第一声音数据；

第二声音数据获取子单元，用于根据预设的说话人聚类技术，对所述第二通话语音进行聚类处理，从而得到具有不同声纹特征的两个第二语音集，并将不符合所述第二声纹特征的所述第二语音集记为所述第二对象端的第二声音数据；

声音数据提取子单元，用于提取所述第一声音数据和所述第二声音数据。
根据权利要求8所述的异常通话对象的判断装置，其特征在于，所述电子音判断单元,包括：

表达函数F(t)生成子单元，用于根据所述第一声音数据，生成所述第一声音数据对应的波形图的表达函数F(t)；

函数H(t)获取子单元，用于根据公式：

H(t)＝min(G(t),m),其中
获取函数H(t),其中f(t)为预设的电子音的波形图的表达函数，E(t)为所述函数F(t)与所述函数f(t)的差值函数，
为所述差值函数对时间的微分函数，t为时间，m为预设的大于0的误差参数值；

贴合程度值计算子单元，用于获取所述函数H(t)在时间轴上不等于m时的第一时间长度和等于m时的第二时间长度，根据公式：贴合程度值＝所述第一时间长度/(所述第一时间长度+所述第二时间长度)，计算出所述贴合程度值，并判断所述贴合程度值是否大于预设的贴合阈值；

电子音判定子单元，用于若所述贴合程度值大于预设的贴合阈值，则判定所述第一声音数据为电子音。
根据权利要求8所述的异常通话对象的判断装置，其特征在于，所述装置,包括：

嫌疑标记单元，用于若所述第一声音数据和所述第二声音数据中仅有一者为电子音，则将为电子音的第一声音数据或者第二声音数据记为嫌疑声音数据，所述嫌疑声音数据对应对象端记为嫌疑对象端；

构建通话通道单元，用于构建通话通道以接通所述嫌疑对象端与预设的应答机器人；

嫌疑情绪波动值获取单元，用于记录所述嫌疑对象端与预设的应答机器人的通话内容，并将通话内容输入预设的情绪波动识别模型中进行处理，得到所述嫌疑对象端的嫌疑情绪波动值；

嫌疑情绪波动值判断单元，用于判断嫌疑情绪波动值是否小于预设的情绪波动阈值；

嫌疑对象端判定单元，用于若嫌疑情绪波动值小于预设的情绪波动阈值，则判定所述嫌疑对象端为异常通话对象。
根据权利要求11所述的异常通话对象的判断装置，其特征在于，所述装置,包括：

刺激声音输入单元，用于利用所述应答机器人在通话通道中输入刺激声音，其中所述刺激声音包括噪音、音量大于预设音量阈值的声音或者频率高于预设频率阈值的声音；

通话记录指令生成单元，用于生成通话记录指令，其中所述通话记录指令用于指示记录所述嫌疑对象端与预设的应答机器人的通话内容，所述通话内容至少包括所述嫌疑对象端针对所述刺激声音的回复。
根据权利要求8所述的异常通话对象的判断装置，其特征在于，所述通话内容记录单元,包括：

语音片段集合获取子单元，用于从所述通话内容中分离出所述第一对象端的第一语音片段集合和所述第二对象端的第二语音片段集合；

声音特征数据采集子单元，用于采集所述第一语音片段集合的第一声音特征数据和所述第二语音片段集合中的第二声音特征数据；

情绪波动值计算子单元，用于根据公式：情绪波动值＝(声音特征数据的最大值-声音特征数据的最小值)/声音特征数据的平均值，计算得到所述第一对象端对应的第一情绪波动值和所述第二对象端对应的第二情绪波动值。
根据权利要求8所述的异常通话对象的判断装置，其特征在于，所述装置，包括：

电话号码获取单元，用于获取所述第一对象端和所述第二对象端的电话号码和电话号码激活时间；

非正常数据库判断单元，用于判断所述第一对象端和所述第二对象端的电话号码是否均属于预设的非正常数据库；

时间点判断单元，用于若所述第一对象端和所述第二对象端的电话号码均不属于预设的非正常数据库，则判断所述电话号码激活时间是否均晚于预设的时间点；

通话语音获取指令生成单元，用于若所述电话号码激活时间均晚于预设的时间点，则生成通话语音获取指令，所述通话语音获取指令用于指示获取第一通话语音，以及获取第二通话语音。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现异常通话对象的判断方法，所述异常通话对象的判断方法，包括：

获取第一通话语音，以及获取第二通话语音，其中所述第一通话语音是第一用户端与第一对象端的通话语音，所述第二通话语音是第二用户端与第二对象端的通话语音；

根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据；

根据预设的电子音判断方法，判断所述第一声音数据是否为电子音，并且判断所述第二声音数据是否为电子音；

若所述第一声音数据和所述第二声音数据均为电子音，则构建通话通道，所述通话通道用于接通所述第一对象端和所述第二对象端；

记录所述第一对象端和所述第二对象端的通话内容，并将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值；

判断所述第一情绪波动值和所述第二情绪波动值是否均小于预设的情绪波动阈值；

若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，则判定所述第一对象端与所述第二对象端均为异常通话对象。
根据权利要求15所述的计算机设备，其特征在于，所述根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据的步骤,包括：

获取预存的第一用户端对应的第一声纹特征，以及获取预存的第二用户端对应的第二声纹特征；

根据预设的说话人聚类技术，对所述第一通话语音进行聚类处理，从而得到具有不同声纹特征的两个第一语音集，并将不符合所述第一声纹特征的所述第一语音集记为所述第一对象端的第一声音数据；

根据预设的说话人聚类技术，对所述第二通话语音进行聚类处理，从而得到具有不同声纹特征的两个第二语音集，并将不符合所述第二声纹特征的所述第二语音集记为所述第二对象端的第二声音数据；

提取所述第一声音数据和所述第二声音数据。
根据权利要求15所述的计算机设备，其特征在于，所述根据预设的电子音判断方法，判断所述第一声音数据是否为电子音的步骤,包括：

根据所述第一声音数据，生成所述第一声音数据对应的波形图的表达函数F(t)；

根据公式：

H(t)＝min(G(t),m),其中
获取函数H(t),其中f(t)为预设的电子音的波形图的表达函数，E(t)为所述函数F(t)与所述函数f(t)的差值函数，
为所述差值函数对时间的微分函数，t为时间，m为预设的大于0的误差参数值；

获取所述函数H(t)在时间轴上不等于m时的第一时间长度和等于m时的第二时间长度，根据公式：贴合程度值＝所述第一时间长度/(所述第一时间长度+所述第二时间长度)，计算出所述贴合程度值，并判断所述贴合程度值是否大于预设的贴合阈值；

若所述贴合程度值大于预设的贴合阈值，则判定所述第一声音数据为电子音。
一种非易失性的计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现异常通话对象的判断方法，所述异常通话对象的判断方法，包括：

获取第一通话语音，以及获取第二通话语音，其中所述第一通话语音是第一用户端与第一对象端的通话语音，所述第二通话语音是第二用户端与第二对象端的通话语音；

根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据；

根据预设的电子音判断方法，判断所述第一声音数据是否为电子音，并且判断所述第二声音数据是否为电子音；

若所述第一声音数据和所述第二声音数据均为电子音，则构建通话通道，所述通话通道用于接通所述第一对象端和所述第二对象端；

记录所述第一对象端和所述第二对象端的通话内容，并将所述通话内容输入预设的情绪波动识别模型中进行处理，得到所述第一对象端的第一情绪波动值和所述第二对象端的第二情绪波动值；

判断所述第一情绪波动值和所述第二情绪波动值是否均小于预设的情绪波动阈值；

若所述第一情绪波动值和所述第二情绪波动值均小于预设的情绪波动阈值，则判定所述第一对象端与所述第二对象端均为异常通话对象。
根据权利要求18所述的非易失性的计算机可读存储介质，其特征在于，所述根据预设的声音数据提取方法，分别从所述第一通话语音和所述第二通话语音中提取出所述第一对象端的第一声音数据以及所述第二对象端的第二声音数据的步骤,包括：

获取预存的第一用户端对应的第一声纹特征，以及获取预存的第二用户端对应的第二声纹特征；

根据预设的说话人聚类技术，对所述第一通话语音进行聚类处理，从而得到具有不同声纹特征的两个第一语音集，并将不符合所述第一声纹特征的所述第一语音集记为所述第一对象端的第一声音数据；

根据预设的说话人聚类技术，对所述第二通话语音进行聚类处理，从而得到具有不同声纹特征的两个第二语音集，并将不符合所述第二声纹特征的所述第二语音集记为所述第二对象端的第二声音数据；

提取所述第一声音数据和所述第二声音数据。
根据权利要求18所述的非易失性的计算机可读存储介质，其特征在于，所述根据预设的电子音判断方法，判断所述第一声音数据是否为电子音的步骤,包括：

根据所述第一声音数据，生成所述第一声音数据对应的波形图的表达函数F(t)；

根据公式：

H(t)＝min(G(t),m),其中
获取函数H(t),其中f(t)为预设的电子音的波形图的表达函数，E(t)为所述函数F(t)与所述函数f(t)的差值函数，
为所述差值函数对时间的微分函数，t为时间，m为预设的大于0的误差参数值；

获取所述函数H(t)在时间轴上不等于m时的第一时间长度和等于m时的第二时间长度，根据公式：贴合程度值＝所述第一时间长度/(所述第一时间长度+所述第二时间长度)，计算出所述贴合程度值，并判断所述贴合程度值是否大于预设的贴合阈值；

若所述贴合程度值大于预设的贴合阈值，则判定所述第一声音数据为电子音。