CN107886951B - 一种语音检测方法、装置及设备 - Google Patents
一种语音检测方法、装置及设备 Download PDFInfo
- Publication number
- CN107886951B CN107886951B CN201610865051.XA CN201610865051A CN107886951B CN 107886951 B CN107886951 B CN 107886951B CN 201610865051 A CN201610865051 A CN 201610865051A CN 107886951 B CN107886951 B CN 107886951B
- Authority
- CN
- China
- Prior art keywords
- voice
- user
- determining
- conversation
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 65
- 230000002159 abnormal effect Effects 0.000 claims abstract description 52
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 25
- 230000008451 emotion Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012076 audiometry Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008909 emotion recognition Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明实施例公开了一种语音检测方法、装置及设备。该方法包括:依据语音会话样本确定设定身份用户的语音内容;将所述设定身份用户的语音内容转化成文本内容;依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。本发明实施例提供的技术方案,实现了语音质量的自动检测,相比于现有的通过人工进行语音质量检测,提高了语音检测效率以及异常问题的检出率。
Description
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音检测方法、装置及设备。
背景技术
公司的发展往往是靠业务拉动的,销售和客服积累了公司的众多业务信息,销售/客服和客户的沟通电话,汇集了众多的动态业务信息,对于公司来说,如果能从这些录音中挖掘有用的商业线索数据,对于公司把握市场,洞察先机,能够赢得客户,至关重要。
电话销售是企业呼叫中心(Call Center)的核心业务。规范化的服务对于呼叫质量的提升意义重大。目前,企业呼叫中心对电话销售质量的运营管理还停留在人工阶段,虽然配备质检人员进行抽检,但由于是随机抽样,且抽样比例非常低,使得问题电话的检出率极低。同时,由于需要人工测听确认,质检员的工作效率也不高。
发明内容
有鉴于此,本发明实施例提供一种语音检测方法、装置及设备,以提高语音内容中包含的异常问题的检出率以及语音检测效率。
第一方面,本发明实施例提供了一种语音检测方法,包括:
依据语音会话样本确定设定身份用户的语音内容;
将所述设定身份用户的语音内容转化成文本内容;
依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。
第二方面,本发明实施例提供了一种语音检测装置,包括:
语音内容确定模块,用于依据语音会话样本确定设定身份用户的语音内容;
文本内容转化模块,用于将所述设定身份用户的语音内容转化成文本内容;
异常问题识别模块,用于依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。
第三方面,本发明实施例还提供了一种设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所述的方法。
本发明实施例提供的技术方案,通过依据语音会话样本确定设定身份用户的语音内容,随后,将设定身份用户的语音内容转化为文本内容,并依据问题识别模型确定文本内容中是否包含异常问题,从而依据确定结果能够检测设定身份用户的语音内容中是否包含异常问题,实现了语音质量的自动检测,相比于现有的通过人工进行语音质量检测,提高了语音检测效率以及异常问题的检出率。
附图说明
图1是本发明实施例一提供的一种语音检测方法的流程图;
图2是本发明实施例二提供的一种语音检测方法的流程图;
图3是本发明实施例三提供的一种语音检测方法的流程图;
图4是本发明实施例三提供的语音检测方法的示意图;
图5是本发明实施例四提供的一种语音检测装置的结构图;
图6是本发明实施例五提供的一种设备的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的一种语音检测方法的流程图。本实施例的方法可以由语音检测装置来执行,该装置可通过硬件和/或软件的方式实现。本实施例的方法一般可适用于对语音内容进行质量检测的情形。参考图1,本实施例提供的语音检测方法具体可以包括如下:
S11、依据语音会话样本确定设定身份用户的语音内容。
在本实施例中,语音会话样本指的是不同身份用户之间的语音会话内容,且不同身份用户的语音会话内容混杂在一起,例如,语音会话样本可以是企业呼叫中心收集的客户与销售或客服的电话沟通内容。设定身份用户指的是待对其语音内容进行语音检测的用户,其中设定身份用户可以是客户、销售或客服等,例如,若想要对客服类用户的语音内容进行检测,则设定身份用户是客服类用户;若想要对销售类用户的语音内容进行检测,则设定身份用户是销售类用户;若想要对客户类用户的语音内容进行检测,则设定身份用户是客户类用户。
具体的,从混杂有不同身份用户的语音内容的语音会话样本中筛选出属于设定身份用户的语音内容。
S12、将所述设定身份用户的语音内容转化成文本内容。
具体的,可以采用光学字符识别(Optical Character Recognition,OCR)技术将设定身份用户的语音语句转化成文本内容。
S13、依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题。
其中,所述问题识别模型可以是依据问题文本内容训练得到的,用于识别文本内容中是否包含异常问题。问题文本内容指的是包含异常问题的文本内容。
本实施例提供的技术方案,通过依据语音会话样本确定设定身份用户的语音内容,随后,将设定身份用户的语音内容转化为文本内容,并依据问题识别模型确定文本内容中是否包含异常问题,从而依据确定结果能够检测设定身份用户的语音内容中是否包含异常问题,实现了语音质量的自动检测,相比于现有的通过人工进行语音质量检测,提高了语音检测效率。并且,由于语音检测效率提高,能够将现有的“抽检方式”变为“全覆盖检测方式”,即能够对设定身份用户的所有语音内容进行自动检测,异常问题的检出率大大提高。
实施例二
本实施例在上述实施例一的基础上提供了一种新的语音检测方法。图2是本发明实施例二提供的一种语音检测方法的流程图。参考图2,本实施例提供的语音检测方法具体可以包括如下:
S21、依据语音会话样本确定设定身份用户的语音内容。
S22、将所述设定身份用户的语音内容转化成文本内容。
S23、依据问题识别模型中包含的问题词以及所述问题词的权重,确定所述文本内容的问题指数。
在本实施例中,问题识别模型可以通过如下方式训练得到:获取人工标注的问题文本;确定问题文本中包含的问题词以及问题词的权重,并依据确定结果得到问题识别模型。其中,问题词可以包括但不限于威胁词、辱骂词、虚假信息词和私自交易词。问题词的权重可以是依据检测需求设定的经验值。
具体的,将文本内容与问题识别模型进行匹配,依据问题识别模型中包含的问题词以及问题词的权重,确定文本内容的问题指数。例如,可以依据如下公式确定文本内容的问题指数:
λ=k1w1+k2w2+…+knwn,其中λ指的是文本内容的问题指数,w1,w2,…,wn指的是文本内容中包含的问题词,k1,k2,…,kn依次是问题词w1,w2,…,wn1的权重。
S24、若所述文本内容的问题指数大于问题指数阈值,则确定所述文本内容包含异常问题。
其中,问题指数阈值可以是依据检测需求确定的经验值,如问题指数阈值可以是65%或70%等。具体的,若文本内容的问题指数大于问题指数阈值,则确定文本内容包含异常问题;否则,确定文本内容不包含异常问题。
本实施例提供的技术方案,通过依据语音会话样本确定设定身份用户的语音内容,将设定身份用户的语音内容转化为文本内容,随后,依据问题识别模型中包含的问题词以及问题词的权重,确定文本内容的问题指数,若文本内容的问题指数大于问题指数阈值,则确定文本内容包含异常问题,即具体提供了基于问题识别模型识别异常问题的方式。
实施例三
本实施例在上述实施例一的基础上提供了一种新的语音检测方法。图3是本发明实施例三提供的一种语音检测方法的流程图。参考图3,本实施例提供的语音检测方法具体可以包括如下:
S31、确定语音会话样本中包含的不同用户的会话语句。
示例性的,S31可以包括:依据所述语音会话样本中会话语句对应的采集设备信息,确定不同用户的会话语句。其中,采集设备信息用于唯一性地标识采集设备,且可以将由同一采集设备采集的所有语句确定为同一用户的会话语句。
示例性的,S31也可以包括:识别所述语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的语句进行聚类,依据聚类结果确定不同用户的会话语句。
其中,声学特征可以包括时长、基频、能量、共振峰频率、宽带、频率微扰、振幅微扰、过零率和梅尔频率倒谱参数中的至少一种。具体的,依据语音会话文本的声学特征,对语音会话文本进行静音识别,并依据静音识别结果进行语音切分,得到语音会话文本中包含的会话语句。随后,由于不同用户的语音的声学特征不同,因而依据语音会话样本中包含的会话语句的时长、基频和能量等韵律特征,共振峰频率、宽带、频率微扰和振幅微扰等声音质量特征,梅尔倒谱参数等结合支持向量机(Support Vector Machine,SVM)对不同用户的会话语句进行聚类,得到不同用户的所有会话语句。
S32、将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份。
其中,身份分类器是依据不同预设身份用户的会话文本训练得到的,用于区分会话文本所属用户的身份信息。
S33、确定设定身份用户的语音内容。
具体的,确定每一用户的身份之后,依据检测需求确定设定身份用户的语音内容。
S34、将所述设定身份用户的语音内容转化成文本内容。
需要说明的是,由于S32已经将每一用户的会话语句翻译成会话文本,因而S34可以直接依据S32的翻译结果得到设定身份用户的文本内容。
S35、依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。
示例性的,依据语音会话样本确定设定身份用户的语音内容之后,可以包括:依据所述设定身份用户的语音内容的声学特征的变化信息,确定所述设定身份用户的情绪是否异常。具体的,可以依据语音内容的频率和/或强度特征的变化信息,确定设定身份用户的情绪是否异常。
示例性的,依据语音会话样本确定设定身份用户的语音内容之后,可以包括:识别所述设定身份用户的语音内容的语速;依据识别的语速以及预设的标准语速,确定所述设定身份用户的语速是否异常。
示例性的,依据语音会话样本确定设定身份用户的语音内容之后,可以包括:识别所述设定身份用户的静音时长;依据识别的静音时长以及预设的标准静音时长,确定所述设定身份用户是否存在超长静音。
综上,参考图4,本实施例通过电话录音获取语音会话文本,采用文字识别技术将语音会话文本转化成文字会话文本;通过对文字会话文本进行纠错处理,如对文字会话文本中包含的错别字进行纠正,以及通过采用声纹识别和聚类分析方法,对通话双方的语音会话样本加以区分确定不同用户的会话语句,即实现话者分离;随后,基于策略模型和业务规则对设定身份用户的语音会话内容进行问题识别、情绪识别、语速识别和静音检测等处理。
本实施例提供的技术方案,不仅能够对设定身份用户的语音内容进行异常问题检测,还能够进行情绪异常、语速异常和超长静音等检测,丰富了对语音的检测维度,进一步提高了语音检测效率。
实施例四
图5是本发明实施例四提供的一种语音检测装置的结构图。该装置一般可适用于对语音内容进行质量检测的情形。参见图5,本实施例提供的语音检测装置的具体结构如下:
语音内容确定模块41,用于依据语音会话样本确定设定身份用户的语音内容;
文本内容转化模块42,用于将所述设定身份用户的语音内容转化成文本内容;
异常问题识别模块43,用于依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。
示例性的,所述异常问题识别模块43可以包括:
问题指数确定单元,用于依据所述问题识别模型中包含的问题词以及所述问题词的权重,确定所述文本内容的问题指数;
异常问题确定单元,用于若所述文本内容的问题指数大于问题指数阈值,则确定所述文本内容包含异常问题。
示例性的,所述语音内容确定模块41可以包括:
会话语句确定单元,用于确定语音会话样本中包含的不同用户的会话语句;
身份确定单元,用于将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份;
语音内容确定单元,用于确定所述设定身份用户的语音内容。
示例性的,所述会话语句确定单元具体可以用于:
依据语音会话样本中会话语句对应的采集设备信息,确定不同用户的会话语句;或者,
识别所述语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;
依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的语句进行聚类,依据聚类结果确定不同用户的会话语句。
示例性的,上述语音检测装置可以包括:
声学特征确定模块,用于在依据语音会话样本确定设定身份用户的语音内容之后,依据所述设定身份用户的语音内容的声学特征的变化信息,确定所述设定身份用户的情绪是否异常。
示例性的,上述语音检测装置可以包括:
异常语速识别模块,用于在依据语音会话样本确定设定身份用户的语音内容之后,识别所述设定身份用户的语音内容的语速;依据识别的语速以及预设的标准语速,确定所述设定身份用户的语速是否异常。
示例性的,上述语音检测装置可以包括:
超长静音识别模块,用于在依据语音会话样本确定设定身份用户的语音内容之后,识别所述设定身份用户的静音时长;依据识别的静音时长以及预设的标准静音时长,确定所述设定身份用户是否存在超长静音。
本实施例提供的语音检测装置,与本发明任意实施例所提供的语音检测方法属于同一发明构思,可执行本发明任意实施例所提供的语音检测方法,具备执行语音检测方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的语音检测方法。
实施例五
如图6所示,为本申请实施例五提供的设备的硬件结构示意图,如图6所示,该电子设备包括:
一个或多个处理器510,图6中以一个处理器510为例;
存储器520;
所述电子设备还可以包括:输入装置530和输出装置540。
所述电子设备中的处理器510、存储器520、输入装置530和输出装置540可以通过总线或者其他方式连接,图6中以通过总线连接为例。
存储器520作为一种非暂态计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请实施例中的数据存储方法对应的程序指令/模块(例如,附图5所示的语音内容确定模块41、文本内容转化模块42和异常问题识别模块43)。处理器510通过运行存储在存储器520中的软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的语音检测方法。
存储器520可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器520可以包括高速随机存取存储器,还可以包括非暂态性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态性固态存储器件。在一些实施例中,存储器520可选包括相对于处理器510远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置530可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置540可包括显示屏等显示设备。
也即:上述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现时,进行如下操作:
依据语音会话样本确定设定身份用户的语音内容;
将所述设定身份用户的语音内容转化成文本内容;
依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。
进一步的,依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,包括:
依据所述问题识别模型中包含的问题词以及所述问题词的权重,确定所述文本内容的问题指数;
若所述文本内容的问题指数大于问题指数阈值,则确定所述文本内容包含异常问题。
进一步的,依据语音会话样本确定设定身份用户的语音内容,包括:
确定所述语音会话样本中包含的不同用户的会话语句;
将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份;
确定所述设定身份用户的语音内容。
进一步的,确定语音会话样本中包含的不同用户的会话语句,包括:
依据所述语音会话样本中会话语句对应的采集设备信息,确定不同用户的会话语句;或者,
识别所述语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;
依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的语句进行聚类,依据聚类结果确定不同用户的会话语句。
进一步的,依据语音会话样本确定设定身份用户的语音内容之后,包括:
依据所述设定身份用户的语音内容的声学特征的变化信息,确定所述设定身份用户的情绪是否异常。
进一步的,依据语音会话样本确定设定身份用户的语音内容之后,包括:
识别所述设定身份用户的语音内容的语速;
依据识别的语速以及预设的标准语速,确定所述设定身份用户的语速是否异常。
进一步的,依据语音会话样本确定设定身份用户的语音内容之后,包括:
识别所述设定身份用户的静音时长;
依据识别的静音时长以及预设的标准静音时长,确定所述设定身份用户是否存在超长静音。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (13)
1.一种语音检测方法,其特征在于,包括:
确定语音会话样本中包含的不同用户的会话语句;
将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份;
确定设定身份用户的语音内容;
将所述设定身份用户的语音内容转化成文本内容;
依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的;
其中,所述设定身份用户指的是待对其语音内容进行语音检测的用户。
2.根据权利要求1所述的方法,其特征在于,依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,包括:
依据所述问题识别模型中包含的问题词以及所述问题词的权重,确定所述文本内容的问题指数;
若所述文本内容的问题指数大于问题指数阈值,则确定所述文本内容包含异常问题。
3.根据权利要求2所述的方法,其特征在于,确定语音会话样本中包含的不同用户的会话语句,包括:
依据所述语音会话样本中会话语句对应的采集设备信息,确定不同用户的会话语句;或者,
识别所述语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;
依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的语句进行聚类,依据聚类结果确定不同用户的会话语句。
4.根据权利要求1所述的方法,其特征在于,确定设定身份用户的语音内容之后,包括:
依据所述设定身份用户的语音内容的声学特征的变化信息,确定所述设定身份用户的情绪是否异常。
5.根据权利要求1所述的方法,其特征在于,确定设定身份用户的语音内容之后,包括:
识别所述设定身份用户的语音内容的语速;
依据识别的语速以及预设的标准语速,确定所述设定身份用户的语速是否异常。
6.根据权利要求1所述的方法,其特征在于,确定设定身份用户的语音内容之后,包括:
识别所述设定身份用户的静音时长;
依据识别的静音时长以及预设的标准静音时长,确定所述设定身份用户是否存在超长静音。
7.一种语音检测装置,其特征在于,包括:
语音内容确定模块,用于依据语音会话样本确定设定身份用户的语音内容;
文本内容转化模块,用于将所述设定身份用户的语音内容转化成文本内容;
异常问题识别模块,用于依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的;
其中,所述设定身份用户指的是待对其语音内容进行语音检测的用户;
所述语音内容确定模块包括:
会话语句确定单元,用于确定语音会话样本中包含的不同用户的会话语句;
身份确定单元,用于将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份;
语音内容确定单元,用于确定设定身份用户的语音内容。
8.根据权利要求7所述的装置,其特征在于,所述异常问题识别模块包括:
问题指数确定单元,用于依据所述问题识别模型中包含的问题词以及所述问题词的权重,确定所述文本内容的问题指数;
异常问题确定单元,用于若所述文本内容的问题指数大于问题指数阈值,则确定所述文本内容包含异常问题。
9.根据权利要求8所述的装置,其特征在于,所述会话语句确定单元具体用于:
依据所述语音会话样本中会话语句对应的采集设备信息,确定不同用户的会话语句;或者,
识别所述语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;
依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的语句进行聚类,依据聚类结果确定不同用户的会话语句。
10.根据权利要求7所述的装置,其特征在于,包括:
声学特征确定模块,用于在确定设定身份用户的语音内容之后,依据所述设定身份用户的语音内容的声学特征的变化信息,确定所述设定身份用户的情绪是否异常。
11.根据权利要求7所述的装置,其特征在于,包括:
异常语速识别模块,用于在确定设定身份用户的语音内容之后,识别所述设定身份用户的语音内容的语速;依据识别的语速以及预设的标准语速,确定所述设定身份用户的语速是否异常。
12.根据权利要求7所述的装置,其特征在于,包括:
超长静音识别模块,用于在确定设定身份用户的语音内容之后,识别所述设定身份用户的静音时长;依据识别的静音时长以及预设的标准静音时长,确定所述设定身份用户是否存在超长静音。
13.一种语音检测设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610865051.XA CN107886951B (zh) | 2016-09-29 | 2016-09-29 | 一种语音检测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610865051.XA CN107886951B (zh) | 2016-09-29 | 2016-09-29 | 一种语音检测方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107886951A CN107886951A (zh) | 2018-04-06 |
CN107886951B true CN107886951B (zh) | 2021-07-23 |
Family
ID=61769085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610865051.XA Active CN107886951B (zh) | 2016-09-29 | 2016-09-29 | 一种语音检测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107886951B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108962282B (zh) * | 2018-06-19 | 2021-07-13 | 京北方信息技术股份有限公司 | 语音检测分析方法、装置、计算机设备及存储介质 |
CN109101801B (zh) * | 2018-07-12 | 2021-04-27 | 北京百度网讯科技有限公司 | 用于身份认证的方法、装置、设备和计算机可读存储介质 |
CN109658923B (zh) * | 2018-10-19 | 2024-01-30 | 平安科技(深圳)有限公司 | 基于人工智能的语音质检方法、设备、存储介质及装置 |
CN109979487B (zh) * | 2019-03-07 | 2021-07-30 | 百度在线网络技术(北京)有限公司 | 语音信号检测方法和装置 |
CN110062117B (zh) * | 2019-04-08 | 2021-01-08 | 商客通尚景科技(上海)股份有限公司 | 一种声波检测与预警方法 |
CN110675861B (zh) * | 2019-09-26 | 2022-11-01 | 深圳追一科技有限公司 | 语音断句方法、装置、设备及存储介质 |
CN110580899A (zh) * | 2019-10-12 | 2019-12-17 | 上海上湖信息技术有限公司 | 语音识别方法及装置、存储介质、计算设备 |
CN111580773B (zh) * | 2020-04-15 | 2023-11-14 | 北京小米松果电子有限公司 | 信息处理方法、装置及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298929A (zh) * | 2010-06-23 | 2011-12-28 | 上海博路信息技术有限公司 | 一种基于语音识别的呼叫中心用户识别方法 |
CN103269405A (zh) * | 2013-05-23 | 2013-08-28 | 深圳市中兴移动通信有限公司 | 友好提示的方法及装置 |
CN103793515A (zh) * | 2014-02-11 | 2014-05-14 | 安徽科大讯飞信息科技股份有限公司 | 一种客服语音智能搜索和分析系统及方法 |
CN105187674A (zh) * | 2015-08-14 | 2015-12-23 | 上海银天下科技有限公司 | 服务录音的合规检查方法及装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2518121A1 (en) * | 2003-03-03 | 2004-09-16 | America Online, Inc. | Source audio identifiers for digital communications |
ATE422090T1 (de) * | 2006-10-02 | 2009-02-15 | Harman Becker Automotive Sys | Nutzung von sprachidentifizierung von mediendateidaten in sprachdialogsystemen |
CN101626524A (zh) * | 2008-07-08 | 2010-01-13 | 中兴通讯股份有限公司 | 语音服务内容审核方法及装置 |
US8566088B2 (en) * | 2008-11-12 | 2013-10-22 | Scti Holdings, Inc. | System and method for automatic speech to text conversion |
CN101662549B (zh) * | 2009-09-09 | 2013-02-27 | 中兴通讯股份有限公司 | 一种基于语音的客户评价系统及客户评价方法 |
US8543402B1 (en) * | 2010-04-30 | 2013-09-24 | The Intellisis Corporation | Speaker segmentation in noisy conversational speech |
JP5573529B2 (ja) * | 2010-09-15 | 2014-08-20 | ヤマハ株式会社 | 音声処理装置およびプログラム |
CN102456344B (zh) * | 2010-10-22 | 2014-12-10 | 中国电信股份有限公司 | 基于语音识别技术分析客户行为特征的系统及方法 |
CN102074236B (zh) * | 2010-11-29 | 2012-06-06 | 清华大学 | 一种分布式麦克风的说话人聚类方法 |
WO2013015463A1 (ko) * | 2011-07-22 | 2013-01-31 | 엘지전자 주식회사 | 이동 단말기 및 그 제어방법 |
US9672825B2 (en) * | 2013-01-03 | 2017-06-06 | Sestek Ses Iletisim Bilgisayar Teknolojileri Sanayi Ve Ticaret Anonim Sirketi | Speech analytics system and methodology with accurate statistics |
CN203206395U (zh) * | 2013-04-19 | 2013-09-18 | 福建亿榕信息技术有限公司 | 一种智能犯罪监控系统 |
CN104427292A (zh) * | 2013-08-22 | 2015-03-18 | 中兴通讯股份有限公司 | 会议纪要的提取方法及装置 |
CN104867494B (zh) * | 2015-05-07 | 2017-10-24 | 广东欧珀移动通信有限公司 | 一种录音文件的命名分类方法及系统 |
CN105391708A (zh) * | 2015-11-02 | 2016-03-09 | 北京锐安科技有限公司 | 音频数据的检测方法及装置 |
CN105427858B (zh) * | 2015-11-06 | 2019-09-03 | 科大讯飞股份有限公司 | 实现语音自动分类的方法及系统 |
-
2016
- 2016-09-29 CN CN201610865051.XA patent/CN107886951B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298929A (zh) * | 2010-06-23 | 2011-12-28 | 上海博路信息技术有限公司 | 一种基于语音识别的呼叫中心用户识别方法 |
CN103269405A (zh) * | 2013-05-23 | 2013-08-28 | 深圳市中兴移动通信有限公司 | 友好提示的方法及装置 |
CN103793515A (zh) * | 2014-02-11 | 2014-05-14 | 安徽科大讯飞信息科技股份有限公司 | 一种客服语音智能搜索和分析系统及方法 |
CN105187674A (zh) * | 2015-08-14 | 2015-12-23 | 上海银天下科技有限公司 | 服务录音的合规检查方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107886951A (zh) | 2018-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107886951B (zh) | 一种语音检测方法、装置及设备 | |
CN112804400B (zh) | 客服呼叫语音质检方法、装置、电子设备及存储介质 | |
CN108962282B (zh) | 语音检测分析方法、装置、计算机设备及存储介质 | |
CN107886955B (zh) | 一种语音会话样本的身份识别方法、装置及设备 | |
CN107154257B (zh) | 基于客户语音情感的客服服务质量评价方法及系统 | |
WO2021128741A1 (zh) | 语音情绪波动分析方法、装置、计算机设备及存储介质 | |
US8311824B2 (en) | Methods and apparatus for language identification | |
US8731936B2 (en) | Energy-efficient unobtrusive identification of a speaker | |
US8417524B2 (en) | Analysis of the temporal evolution of emotions in an audio interaction in a service delivery environment | |
US20110004473A1 (en) | Apparatus and method for enhanced speech recognition | |
US20160171100A1 (en) | Voice Search System, Voice Search Method, and Computer-Readable Storage Medium | |
CN111489765A (zh) | 一种基于智能语音技术的话务服务质检方法 | |
CN105810205A (zh) | 一种语音处理方法及装置 | |
CN110890096A (zh) | 一种基于语音分析的智能语音系统及方法 | |
Kopparapu | Non-linguistic analysis of call center conversations | |
CN111128241A (zh) | 语音通话的智能质检方法及系统 | |
CN111049998A (zh) | 语音客服质检方法及客服质检设备、存储介质 | |
CN114449105A (zh) | 基于语音的电力客户服务话务质检系统 | |
CN110460798B (zh) | 视频访谈服务处理方法、装置、终端与存储介质 | |
CN113744742A (zh) | 对话场景下的角色识别方法、装置和系统 | |
Lee et al. | Intra‐and Inter‐frame Features for Automatic Speech Recognition | |
JP2014123813A (ja) | オペレータ対顧客会話自動採点装置およびその動作方法 | |
CN112087726B (zh) | 彩铃识别的方法及系统、电子设备及存储介质 | |
KR102407055B1 (ko) | 음성인식 후 자연어 처리를 통한 대화 품질지수 측정장치 및 그 방법 | |
GB2523577A (en) | Speaker recognition method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |