CN112511698B

CN112511698B - 一种基于通用边界检测的实时通话分析方法

Info

Publication number: CN112511698B
Application number: CN202011396489.0A
Authority: CN
Inventors: 刘郁松; 何国涛; 蒲瑶; 李全忠
Original assignee: Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Current assignee: Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2022-04-01
Anticipated expiration: 2040-12-03
Also published as: CN112511698A

Abstract

本发明提供一种基于通用边界检测的实时通话分析方法，方法包括：第一步：通用边界检测；主要包括：判断此边界是否为开始边界，判断拥有该开始边界的角色是否已经记录了开始边界；判断该角色是否有其他角色的开始边界；判断该角色是否记录了开始边界；判断是否有其他角色的开始边界；判断是不是通话的最后一个边界。第二步：基于边界检测的静音分析、抢插话分析，主要包括：判断边界类型；判断一个人说话的时长是否大于最小静音下限；判断两个人说话的时长是否大于插话最小持续时间下限。本发明通过一套方法同时完成静音、抢话、插话、正常说话始终类型的边界检测，使得对时间边界进行一次分析即可完成全类别结果输出。

Description

一种基于通用边界检测的实时通话分析方法

技术领域

本发明属于通讯监听技术领域，具体涉及一种基于通用边界检测的实时通话分析方法。

背景技术

通讯监听技术领域中的实时通话分析主要包括静音分析、抢插话分析。静音分析指对通话过程中发生的超长静音事件进行分析。在业务应用中静音分析结果数据需要包含静音所属的角色信息，用于做不同的处理，例如坐席产生的静音用于评估坐席的服务质量，而客户的静音则往往忽略掉。呼叫中心场景下的静音分析基于“问题对话”模型，即假设说话结束时，说话方发出了一个提问，将说话结束作为静音的开始，当下一句话开始时，将说话开始作为静音的结束，其中静音的所属角色记为说话开始方。抢插话分析分为抢话分析和插话分析，其中抢话分析指一方说话开始和另一方说话结束的间隔太短，判定为发生了抢话。说话间隔太短，会被客户认为说话风格具有进攻性，且没有经过思考和理解，容易答非所问。在部分对坐席服务质量要求很高的呼叫中心坐席抢了客户的话被认定为服务态度不友好。插话分析指两方出现了同时说话的情况，这其中往往表现为争吵、故意打断客户说话，在呼叫中心发生插话被认定为严重服务质量问题。

现有技术中，独立的静音分析、抢话分析、插话分析、正常边界检测执行过程，需要在各自算法中完成边界扫描和比对，重复运算过多。以人工分配方式进行，存在以下不足：

1）实时通话检测采用独立的检测算法，独立的重复运算过多，运算性能低下；

2）离线边界分析技术，无法在通话进行中实时通话边界的检测，适用范围不广。

为此，本发明提供了一种基于通用边界检测的实时通话分析方法，用于解决电话系统接入实时分析系统后，通过一套方法同时完成静音、抢话、插话、正常说话始终类型的边界检测，使得对时间边界进行一次分析即可完成全类别结果输出。

发明内容

针对现有技术存在的问题为此，本发明提出了一种基于通用边界检测的实时通话分析方法，满足实时通话监听需要。所述方法包括如下步骤：

第一步：通用边界检测

step1，开始等待新的边界，输入一个边界，判断此边界是否为开始边界，如果是开始边界执行step2，如果是结束边界，执行step 4；

step2，对于开始边界，判断拥有该开始边界的角色是否已经记录了开始边界；当该角色已经记录了开始边界时，则此开始边界为异常边界，返回执行step1；当该角色没有记录开始边界时，则执行step 3；

step3，判断该角色是否有其他角色的开始边界；当有其他角色的开始边界时，则检测到一个人说话的片段，而后保存该角色说话的开始边界；当没有其他角色的开始边界时，检测到没有人说话片段，而后保存该角色说话的开始边界；而后执行step 6；

step4，判断该角色是否记录了开始边界；当该角色没有记录开始边界时，则认为此结束边界为异常边界，返回执行step1，等待新的边界输入；当该角色记录开始边界时，执行step5；

step5，判断是否有其他角色的开始边界；当没有其他角色的开始边界时，检测到一个人说话的片段，而后删除该角色说话的开始边界；当有其他角色的开始边界时，检测到两个人说话的片段，而后删除该角色说话的开始边界；而后执行step6；

step 6，判断是不是通话的最后一个边界；当是通话的最后一个边界时，检测结束；当不是通话的最后一个边界时，返回step 1，等待新的边界输入；

通过通用边界分析将整个通话中的事件片段分解为：没有人说话的片段、1个人说话的片段、2个人说话的片段；

第二步：基于边界检测的静音分析、抢插话分析

step 7，判断边界类型；当边界类型为无人说话的边界时，直接结束；当边界类型为一个人说话的边界时，执行step 8；当边界类型为两个人说话的边界时，执行step 9；

step 8，判断一个人说话的时长是否大于最小静音下限；当时长大于最小静音下限时，输出异常静音结果，然后结束；当时长小于或等于最小静音下限时，判断时长是否小于抢话间隔上限；当时长小于抢话间隔上限时，输出抢话结果，然后结束；当时长大于或等于抢话间隔上限时，执行结束；

step 9，判断两个人说话的时长是否大于插话最小持续时间下限；当时长大于插话最小持续时间下限时，则输出插话结果，然后结束；当时长小于或等于插话最小持续时间下限时，直接结束；

与现有方法相比，本发明具有以下优势：

（1）本发明一次分析即可完成全类别结果输出，其中时间边界只需要进行一次扫描，边界匹配和比对过程仅执行一次,本发明相比独立的检测算法具有2-4倍的性能提升。

（2）本发明提供算法可以同步执行,相比离线边界分析技术，适用范围更广。

附图说明

图1通用边界检测流程示意图；

图2基于边界检测的静音分析、抢插话分析流程示意图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细的说明。

第一步：通用边界检测，参见附图1所示：

step1，开始等待新的边界，输入一个边界，判断此边界是否为开始边界，如果是开始边界执行step 2，如果是结束边界，执行step 4；

step 2，对于开始边界，判断拥有该开始边界的角色是否已经记录了开始边界；当该角色已经记录了开始边界时，则此开始边界为异常边界，返回执行step 1；当该角色没有记录开始边界时，则执行step 3；

step 3，判断该角色是否有其他角色的开始边界；当有其他角色的开始边界时，则检测到一个人说话的片段，而后保存该角色说话的开始边界；当没有其他角色的开始边界时，检测到没有人说话片段，而后保存该角色说话的开始边界；而后执行step 6；

step 4，判断该角色是否记录了开始边界；当该角色没有记录开始边界时，则认为此结束边界为异常边界，返回执行step 1，等待新的边界输入；当该角色记录开始边界时，执行step 5；

step 5，判断是否有其他角色的开始边界；当没有其他角色的开始边界时，检测到一个人说话的片段，而后删除该角色说话的开始边界；当有其他角色的开始边界时，检测到两个人说话的片段，而后删除该角色说话的开始边界；而后执行step 6；

通过通用边界分析将整个通话中的事件片段分解为：没有人说话的片段、1个人说话的片段、2个人说话的片段。

第二步：基于边界检测的静音分析、抢插话分析，参见附图2所示：

step 9，判断两个人说话的时长是否大于插话最小持续时间下限；当时长大于插话最小持续时间下限时，则输出插话结果，然后结束；当时长小于或等于插话最小持续时间下限时，直接结束。

两种分析算法均基于句子边界，考虑到实时分析的高时效性要求，在一次边界分析过程中同时完成静音分析、抢插话分析有利于提高分析性能。

本发明提出一种通用的边界分析方法，通过将整个通话中的事件片段分解为：没有人说话的片段、1个人说话的片段、2个人说话的片段。其中没有人说话的片段中，当片段时长大于一个下限（如1秒），则可判定为静音片段，当片段时长小于一个上限（如500ms），则可判定为抢话片段，2个人说话的片段可判断为发生了插话。一个人说话的片段可忽略。

以上所述之实施例仅为本发明的较佳实施例，并非对本发明做任何形式上的限制。任何熟悉本领域的技术人员，在不脱离本发明技术方案范围情况下，利用上述揭示的技术内容对本发明技术方案作出更多可能的变动和润饰，或修改均为本发明的等效实施例。故凡未脱离本发明技术方案的内容，依据本发明之思路所作的等同等效变化，均应涵盖于本发明的保护范围内。

Claims

1.一种基于通用边界检测的实时通话分析方法，其特征在于，所述方法包括如下步骤：

第一步：通用边界检测

第二步：基于边界检测的静音分析、抢插话分析