CN112511698B - 一种基于通用边界检测的实时通话分析方法 - Google Patents
一种基于通用边界检测的实时通话分析方法 Download PDFInfo
- Publication number
- CN112511698B CN112511698B CN202011396489.0A CN202011396489A CN112511698B CN 112511698 B CN112511698 B CN 112511698B CN 202011396489 A CN202011396489 A CN 202011396489A CN 112511698 B CN112511698 B CN 112511698B
- Authority
- CN
- China
- Prior art keywords
- boundary
- starting
- call
- speaking
- judging whether
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 41
- 238000001514 detection method Methods 0.000 title claims abstract description 25
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000003780 insertion Methods 0.000 claims description 8
- 230000037431 insertion Effects 0.000 claims description 8
- 238000000034 method Methods 0.000 abstract description 12
- 238000012544 monitoring process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010223 real-time analysis Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2227—Quality of service monitoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5175—Call or contact centers supervision arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
本发明提供一种基于通用边界检测的实时通话分析方法,方法包括:第一步:通用边界检测;主要包括:判断此边界是否为开始边界,判断拥有该开始边界的角色是否已经记录了开始边界;判断该角色是否有其他角色的开始边界;判断该角色是否记录了开始边界;判断是否有其他角色的开始边界;判断是不是通话的最后一个边界。第二步:基于边界检测的静音分析、抢插话分析,主要包括:判断边界类型;判断一个人说话的时长是否大于最小静音下限;判断两个人说话的时长是否大于插话最小持续时间下限。本发明通过一套方法同时完成静音、抢话、插话、正常说话始终类型的边界检测,使得对时间边界进行一次分析即可完成全类别结果输出。
Description
技术领域
本发明属于通讯监听技术领域,具体涉及一种基于通用边界检测的实时通话分析方法。
背景技术
通讯监听技术领域中的实时通话分析主要包括静音分析、抢插话分析。静音分析指对通话过程中发生的超长静音事件进行分析。在业务应用中静音分析结果数据需要包含静音所属的角色信息,用于做不同的处理,例如坐席产生的静音用于评估坐席的服务质量,而客户的静音则往往忽略掉。呼叫中心场景下的静音分析基于“问题对话”模型,即假设说话结束时,说话方发出了一个提问,将说话结束作为静音的开始,当下一句话开始时,将说话开始作为静音的结束,其中静音的所属角色记为说话开始方。抢插话分析分为抢话分析和插话分析,其中抢话分析指一方说话开始和另一方说话结束的间隔太短,判定为发生了抢话。说话间隔太短,会被客户认为说话风格具有进攻性,且没有经过思考和理解,容易答非所问。在部分对坐席服务质量要求很高的呼叫中心坐席抢了客户的话被认定为服务态度不友好。插话分析指两方出现了同时说话的情况,这其中往往表现为争吵、故意打断客户说话,在呼叫中心发生插话被认定为严重服务质量问题。
现有技术中,独立的静音分析、抢话分析、插话分析、正常边界检测执行过程,需要在各自算法中完成边界扫描和比对,重复运算过多。以人工分配方式进行,存在以下不足:
1)实时通话检测采用独立的检测算法,独立的重复运算过多,运算性能低下;
2)离线边界分析技术,无法在通话进行中实时通话边界的检测,适用范围不广。
为此,本发明提供了一种基于通用边界检测的实时通话分析方法,用于解决电话系统接入实时分析系统后,通过一套方法同时完成静音、抢话、插话、正常说话始终类型的边界检测,使得对时间边界进行一次分析即可完成全类别结果输出。
发明内容
针对现有技术存在的问题为此,本发明提出了一种基于通用边界检测的实时通话分析方法,满足实时通话监听需要。所述方法包括如下步骤:
第一步:通用边界检测
step1,开始等待新的边界,输入一个边界,判断此边界是否为开始边界,如果是开始边界执行step2,如果是结束边界,执行step 4;
step2,对于开始边界,判断拥有该开始边界的角色是否已经记录了开始边界;当该角色已经记录了开始边界时,则此开始边界为异常边界,返回执行step1;当该角色没有记录开始边界时,则执行step 3;
step3,判断该角色是否有其他角色的开始边界;当有其他角色的开始边界时,则检测到一个人说话的片段,而后保存该角色说话的开始边界;当没有其他角色的开始边界时,检测到没有人说话片段,而后保存该角色说话的开始边界;而后执行step 6;
step4,判断该角色是否记录了开始边界;当该角色没有记录开始边界时,则认为此结束边界为异常边界,返回执行step1,等待新的边界输入;当该角色记录开始边界时,执行step5;
step5,判断是否有其他角色的开始边界;当没有其他角色的开始边界时,检测到一个人说话的片段,而后删除该角色说话的开始边界;当有其他角色的开始边界时,检测到两个人说话的片段,而后删除该角色说话的开始边界;而后执行step6;
step 6,判断是不是通话的最后一个边界;当是通话的最后一个边界时,检测结束;当不是通话的最后一个边界时,返回step 1,等待新的边界输入;
通过通用边界分析将整个通话中的事件片段分解为:没有人说话的片段、1个人说话的片段、2个人说话的片段;
第二步:基于边界检测的静音分析、抢插话分析
step 7,判断边界类型;当边界类型为无人说话的边界时,直接结束;当边界类型为一个人说话的边界时,执行step 8;当边界类型为两个人说话的边界时,执行step 9;
step 8,判断一个人说话的时长是否大于最小静音下限;当时长大于最小静音下限时,输出异常静音结果,然后结束;当时长小于或等于最小静音下限时,判断时长是否小于抢话间隔上限;当时长小于抢话间隔上限时,输出抢话结果,然后结束;当时长大于或等于抢话间隔上限时,执行结束;
step 9,判断两个人说话的时长是否大于插话最小持续时间下限;当时长大于插话最小持续时间下限时,则输出插话结果,然后结束;当时长小于或等于插话最小持续时间下限时,直接结束;
与现有方法相比,本发明具有以下优势:
(1)本发明一次分析即可完成全类别结果输出,其中时间边界只需要进行一次扫描,边界匹配和比对过程仅执行一次,本发明相比独立的检测算法具有2-4倍的性能提升。
(2)本发明提供算法可以同步执行,相比离线边界分析技术,适用范围更广。
附图说明
图1通用边界检测流程示意图;
图2基于边界检测的静音分析、抢插话分析流程示意图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
第一步:通用边界检测,参见附图1所示:
step1,开始等待新的边界,输入一个边界,判断此边界是否为开始边界,如果是开始边界执行step 2,如果是结束边界,执行step 4;
step 2,对于开始边界,判断拥有该开始边界的角色是否已经记录了开始边界;当该角色已经记录了开始边界时,则此开始边界为异常边界,返回执行step 1;当该角色没有记录开始边界时,则执行step 3;
step 3,判断该角色是否有其他角色的开始边界;当有其他角色的开始边界时,则检测到一个人说话的片段,而后保存该角色说话的开始边界;当没有其他角色的开始边界时,检测到没有人说话片段,而后保存该角色说话的开始边界;而后执行step 6;
step 4,判断该角色是否记录了开始边界;当该角色没有记录开始边界时,则认为此结束边界为异常边界,返回执行step 1,等待新的边界输入;当该角色记录开始边界时,执行step 5;
step 5,判断是否有其他角色的开始边界;当没有其他角色的开始边界时,检测到一个人说话的片段,而后删除该角色说话的开始边界;当有其他角色的开始边界时,检测到两个人说话的片段,而后删除该角色说话的开始边界;而后执行step 6;
step 6,判断是不是通话的最后一个边界;当是通话的最后一个边界时,检测结束;当不是通话的最后一个边界时,返回step 1,等待新的边界输入;
通过通用边界分析将整个通话中的事件片段分解为:没有人说话的片段、1个人说话的片段、2个人说话的片段。
第二步:基于边界检测的静音分析、抢插话分析,参见附图2所示:
step 7,判断边界类型;当边界类型为无人说话的边界时,直接结束;当边界类型为一个人说话的边界时,执行step 8;当边界类型为两个人说话的边界时,执行step 9;
step 8,判断一个人说话的时长是否大于最小静音下限;当时长大于最小静音下限时,输出异常静音结果,然后结束;当时长小于或等于最小静音下限时,判断时长是否小于抢话间隔上限;当时长小于抢话间隔上限时,输出抢话结果,然后结束;当时长大于或等于抢话间隔上限时,执行结束;
step 9,判断两个人说话的时长是否大于插话最小持续时间下限;当时长大于插话最小持续时间下限时,则输出插话结果,然后结束;当时长小于或等于插话最小持续时间下限时,直接结束。
两种分析算法均基于句子边界,考虑到实时分析的高时效性要求,在一次边界分析过程中同时完成静音分析、抢插话分析有利于提高分析性能。
本发明提出一种通用的边界分析方法,通过将整个通话中的事件片段分解为:没有人说话的片段、1个人说话的片段、2个人说话的片段。其中没有人说话的片段中,当片段时长大于一个下限(如1秒),则可判定为静音片段,当片段时长小于一个上限(如500ms),则可判定为抢话片段,2个人说话的片段可判断为发生了插话。一个人说话的片段可忽略。
以上所述之实施例仅为本发明的较佳实施例,并非对本发明做任何形式上的限制。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,利用上述揭示的技术内容对本发明技术方案作出更多可能的变动和润饰,或修改均为本发明的等效实施例。故凡未脱离本发明技术方案的内容,依据本发明之思路所作的等同等效变化,均应涵盖于本发明的保护范围内。
Claims (1)
1.一种基于通用边界检测的实时通话分析方法,其特征在于,所述方法包括如下步骤:
第一步:通用边界检测
step1,开始等待新的边界,输入一个边界,判断此边界是否为开始边界,如果是开始边界执行step 2,如果是结束边界,执行step 4;
step 2,对于开始边界,判断拥有该开始边界的角色是否已经记录了开始边界;当该角色已经记录了开始边界时,则此开始边界为异常边界,返回执行step 1;当该角色没有记录开始边界时,则执行step 3;
step 3,判断该角色是否有其他角色的开始边界;当有其他角色的开始边界时,则检测到一个人说话的片段,而后保存该角色说话的开始边界;当没有其他角色的开始边界时,检测到没有人说话片段,而后保存该角色说话的开始边界;而后执行step 6;
step 4,判断该角色是否记录了开始边界;当该角色没有记录开始边界时,则认为此结束边界为异常边界,返回执行step 1,等待新的边界输入;当该角色记录开始边界时,执行step 5;
step 5,判断是否有其他角色的开始边界;当没有其他角色的开始边界时,检测到一个人说话的片段,而后删除该角色说话的开始边界;当有其他角色的开始边界时,检测到两个人说话的片段,而后删除该角色说话的开始边界;而后执行step 6;
step 6,判断是不是通话的最后一个边界;当是通话的最后一个边界时,检测结束;当不是通话的最后一个边界时,返回step 1,等待新的边界输入;
通过通用边界分析将整个通话中的事件片段分解为:没有人说话的片段、1个人说话的片段、2个人说话的片段;
第二步:基于边界检测的静音分析、抢插话分析
step 7,判断边界类型;当边界类型为无人说话的边界时,直接结束;当边界类型为一个人说话的边界时,执行step 8;当边界类型为两个人说话的边界时,执行step 9;
step 8,判断一个人说话的时长是否大于最小静音下限;当时长大于最小静音下限时,输出异常静音结果,然后结束;当时长小于或等于最小静音下限时,判断时长是否小于抢话间隔上限;当时长小于抢话间隔上限时,输出抢话结果,然后结束;当时长大于或等于抢话间隔上限时,执行结束;
step 9,判断两个人说话的时长是否大于插话最小持续时间下限;当时长大于插话最小持续时间下限时,则输出插话结果,然后结束;当时长小于或等于插话最小持续时间下限时,直接结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011396489.0A CN112511698B (zh) | 2020-12-03 | 2020-12-03 | 一种基于通用边界检测的实时通话分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011396489.0A CN112511698B (zh) | 2020-12-03 | 2020-12-03 | 一种基于通用边界检测的实时通话分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112511698A CN112511698A (zh) | 2021-03-16 |
CN112511698B true CN112511698B (zh) | 2022-04-01 |
Family
ID=74969560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011396489.0A Active CN112511698B (zh) | 2020-12-03 | 2020-12-03 | 一种基于通用边界检测的实时通话分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112511698B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113066496A (zh) * | 2021-03-17 | 2021-07-02 | 浙江百应科技有限公司 | 一种音频中对话双方抢话分析方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4221537B2 (ja) * | 2000-06-02 | 2009-02-12 | 日本電気株式会社 | 音声検出方法及び装置とその記録媒体 |
JP5369055B2 (ja) * | 2010-06-08 | 2013-12-18 | 日本電信電話株式会社 | 通話単位検出装置、方法及びプログラム |
US8681950B2 (en) * | 2012-03-28 | 2014-03-25 | Interactive Intelligence, Inc. | System and method for fingerprinting datasets |
CN102982811B (zh) * | 2012-11-24 | 2015-01-14 | 安徽科大讯飞信息科技股份有限公司 | 一种基于实时解码的语音端点检测方法 |
US9596349B1 (en) * | 2015-06-29 | 2017-03-14 | State Farm Mutual Automobile Insurance Company | Voice and speech recognition for call center feedback and quality assurance |
CN105895116B (zh) * | 2016-04-06 | 2020-01-03 | 普强信息技术(北京)有限公司 | 一种双声道语音的抢插话分析方法 |
CN106847270B (zh) * | 2016-12-09 | 2020-08-18 | 华南理工大学 | 一种双门限地名语音端点检测方法 |
CN108630193B (zh) * | 2017-03-21 | 2020-10-02 | 北京嘀嘀无限科技发展有限公司 | 语音识别方法及装置 |
CN110400100A (zh) * | 2019-08-15 | 2019-11-01 | 圆通速递有限公司 | 一种客服质量实时监控系统和方法 |
CN111145782B (zh) * | 2019-12-20 | 2021-07-13 | 深圳追一科技有限公司 | 重叠语音识别方法、装置、计算机设备和存储介质 |
CN111210842B (zh) * | 2019-12-27 | 2023-04-28 | 中移(杭州)信息技术有限公司 | 语音质检方法、装置、终端及计算机可读存储介质 |
CN111147669A (zh) * | 2019-12-30 | 2020-05-12 | 科讯嘉联信息技术有限公司 | 一种全量实时自动服务质检系统和方法 |
CN111835925A (zh) * | 2020-06-16 | 2020-10-27 | 杭州云嘉云计算有限公司 | 一种面向呼叫中心的离线语音质检及分析系统 |
CN111881272A (zh) * | 2020-07-09 | 2020-11-03 | 普强时代(珠海横琴)信息技术有限公司 | 一种电话服务实时预警系统和预警方法 |
CN111951831A (zh) * | 2020-08-24 | 2020-11-17 | 浙江百应科技有限公司 | 一种基于ai实现音频质检的方法 |
-
2020
- 2020-12-03 CN CN202011396489.0A patent/CN112511698B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112511698A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108962282B (zh) | 语音检测分析方法、装置、计算机设备及存储介质 | |
US10410636B2 (en) | Methods and system for reducing false positive voice print matching | |
US9571638B1 (en) | Segment-based queueing for audio captioning | |
US9412371B2 (en) | Visualization interface of continuous waveform multi-speaker identification | |
US7069218B2 (en) | System and method for detection and analysis of audio recordings | |
CN110177182B (zh) | 敏感数据处理方法、装置、计算机设备及存储介质 | |
KR101795593B1 (ko) | 전화상담원 보호 장치 및 그 방법 | |
US20110218798A1 (en) | Obfuscating sensitive content in audio sources | |
CN108010513B (zh) | 语音处理方法及设备 | |
CN110995938B (zh) | 数据处理方法和装置 | |
US11375062B2 (en) | Systems for detecting harassing communication | |
CN112511698B (zh) | 一种基于通用边界检测的实时通话分析方法 | |
CN113011159A (zh) | 人工座席监听方法、装置、电子设备及存储介质 | |
US10924611B2 (en) | Voice recognition system and call evaluation setting method | |
CN113542509B (zh) | 一种应急处理方法、装置、存储介质和设备 | |
CN112565242B (zh) | 基于声纹识别的远程授权方法、系统、设备及存储介质 | |
CN107645613A (zh) | 服务转接的方法和装置 | |
CN111565254B (zh) | 通话数据质检方法、装置、计算机设备和存储介质 | |
CN113810548A (zh) | 基于iot的智能通话质检方法系统 | |
US20090144219A1 (en) | Rules collector system and method | |
CN111582708A (zh) | 医疗信息的检测方法、系统、电子设备及计算机可读存储介质 | |
CN113286035B (zh) | 异常呼叫检测方法、装置、设备及介质 | |
KR102472727B1 (ko) | 스마트 단말 통화 중 서버 비연동식 및 연동식 복합 감지를 통한 보이스피싱 방지 시스템 | |
CN113178196B (zh) | 音频数据提取方法、装置、计算机设备和存储介质 | |
CN115766943A (zh) | 通话未接通状态的确定方法及装置、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Real Time Call Analysis Method Based on Universal Boundary Detection Effective date of registration: 20230414 Granted publication date: 20220401 Pledgee: Hengqin Guangdong Macao Deep Cooperation Zone Branch of Guangdong Shunde Rural Commercial Bank Co.,Ltd. Pledgor: Puqiang times (Zhuhai Hengqin) Information Technology Co.,Ltd. Registration number: Y2023980038072 |