CN109658923B - 基于人工智能的语音质检方法、设备、存储介质及装置 - Google Patents
基于人工智能的语音质检方法、设备、存储介质及装置 Download PDFInfo
- Publication number
- CN109658923B CN109658923B CN201811227840.6A CN201811227840A CN109658923B CN 109658923 B CN109658923 B CN 109658923B CN 201811227840 A CN201811227840 A CN 201811227840A CN 109658923 B CN109658923 B CN 109658923B
- Authority
- CN
- China
- Prior art keywords
- quality inspection
- inspected
- preset
- sample
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007689 inspection Methods 0.000 title claims abstract description 236
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012549 training Methods 0.000 claims description 25
- 238000013507 mapping Methods 0.000 claims description 16
- 230000011218 segmentation Effects 0.000 claims description 16
- 238000012372 quality testing Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 210000003800 pharynx Anatomy 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 210000000515 tooth Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Abstract
本发明公开了一种基于人工智能的语音质检方法、设备、存储介质及装置,该方法包括:获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档,从所述待质检文档中提取待质检关键词,通过预设质检模型将所述待质检关键词与预设关键词进行比对,并根据比对结果输出目标质检结果。由于将待质检音频转化为待质检文档,能够更便捷地进行质检,通过将待质检文档中的待质检关键词输入预设质检模型,能够实时准确地输出目标质检结果,不需过多的人工参与,更加智能化,提高了语音质检的效率。
Description
技术领域
本发明涉及语音数据处理技术领域,尤其涉及一种基于人工智能的语音质检方法、设备、存储介质及装置。
背景技术
语音质检是指对语音内容进行质量管理与检测,检测客服或者销售人员是否使用规范用语、是否服务到位。一般通过对客服电话进行录音获得待质检音频,或者通过对销售过程进行双录获得待质检音频,对待质检音频进行语音质检,能够促进企业营销、市场开拓,提高客户满意度,完善客户服务。
目前的语音质检方案主要通过人工逐秒回放回听,根据业务规则进行人为判断,然而,人为判断难免存在疏漏,并且具有效率较低、耗时较长及成本较高等问题,无法有效地对语音进行质检。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于人工智能的语音质检方法、设备、存储介质及装置,旨在解决现有技术中无法有效地对语音进行质检的技术问题。
为实现上述目的,本发明提供一种基于人工智能的语音质检方法,所述基于人工智能的语音质检方法包括以下步骤:
获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档;
从所述待质检文档中提取待质检关键词;
通过预设质检模型将所述待质检关键词与预设关键词进行比对,并根据比对结果输出目标质检结果。
优选地,所述获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档之前,所述方法还包括:
采集样本质检文档以及所述样本质检文档对应的样本质检结果;
从所述样本质检文档中提取样本关键词,根据所述样本关键词及对应的样本质检结果生成预设质检模型。
优选地,所述从所述样本质检文档中提取样本关键词,根据所述样本关键词及对应的样本质检结果生成预设质检模型,包括:
根据预设关键词提取算法从所述样本质检文档中提取样本关键词,并根据所述样本关键词和所述样本质检结果建立关键词和质检结果之间的对应关系;
使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行训练,生成预设质检模型。
优选地,所述使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行训练,生成预设质检模型,包括:
使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行多次训练,在所述基础模型的质检准确率达到预设标准值时,生成预设质检模型;
其中,根据所述对应关系对所述基础模型进行训练,包括:
在所述对应关系中选取一组对应关系,将该组对应关系中的样本关键词输入至所述基础模型中,获取所述基础模型输出的当前质检结果;
将所述当前质检结果与该组对应关系中的样本质检结果进行对比,并根据对比结果调整所述基础模型的参数。
优选地,所述获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档,包括:
获取待质检音频,对所述待质检音频进行语音识别,获取文档内容;
对所述待质检音频进行声纹识别,获取客服身份信息和客户身份信息;
根据所述文档内容、所述客服身份信息和所述客户身份信息生成待质检文档。
优选地,所述对所述待质检音频进行声纹识别,获取客服身份信息和客户身份信息,包括:
从所述待质检音频中提取声纹特征信息;
将所述声纹特征信息输入到预设声纹模型中,以使所述预设声纹模型对所述声纹特征信息进行识别,获取所述声纹特征信息对应的客服身份信息和客户身份信息。
优选地,所述从所述待质检音频中提取声纹特征信息之前,所述方法还包括:
采集样本音频以及所述样本音频对应的样本身份信息;
从所述样本音频中提取样本声纹特征信息,根据所述样本声纹特征信息与所述样本身份信息建立声纹特征信息与身份信息之间的映射关系;
建立基础声纹模型,根据所述映射关系对所述基础声纹模型进行训练,生成预设声纹模型。
此外,为实现上述目的,本发明还提出一种基于人工智能的语音质检设备,所述基于人工智能的语音质检设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于人工智能的语音质检程序,所述基于人工智能的语音质检程序配置为实现如上文所述的基于人工智能的语音质检方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有基于人工智能的语音质检程序,所述基于人工智能的语音质检程序被处理器执行时实现如上文所述的基于人工智能的语音质检方法的步骤。
此外,为实现上述目的,本发明还提出一种基于人工智能的语音质检装置,所述基于人工智能的语音质检装置包括:
文档生成模块,用于获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档;
关键词输入模块,用于从所述待质检文档中提取待质检关键词;
结果获取模块,用于通过预设质检模型将所述待质检关键词与预设关键词进行比对,并根据比对结果输出目标质检结果。
本发明中,通过获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档,从所述待质检文档中提取待质检关键词,将所述待质检关键词输入至预设质检模型中,通过预设质检模型将所述待质检关键词与预设关键词进行比对,并根据比对结果输出目标质检结果。由于将待质检音频转化为待质检文档,能够更便捷地进行质检,通过将待质检文档中的待质检关键词输入预设质检模型,能够实时准确地输出目标质检结果,不需过多的人工参与,更加智能化,提高了语音质检的效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的基于人工智能的语音质检设备结构示意图;
图2为本发明基于人工智能的语音质检方法第一实施例的流程示意图;
图3为本发明基于人工智能的语音质检方法第二实施例的流程示意图;
图4为本发明基于人工智能的语音质检方法第三实施例的流程示意图;
图5为本发明基于人工智能的语音质检装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的基于人工智能的语音质检设备结构示意图。
如图1所示,该基于人工智能的语音质检设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口,对于用户接口1003的有线接口在本发明中可为USB接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的存储器(Non-volatileMemory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对基于人工智能的语音质检设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于人工智能的语音质检程序。
在图1所示的基于人工智能的语音质检设备中,网络接口1004主要用于连接后台服务器,与所述后台服务器进行数据通信;用户接口1003主要用于连接外设;所述基于人工智能的语音质检设备通过处理器1001调用存储器1005中存储的基于人工智能的语音质检程序,并执行本发明实施例提供的基于人工智能的语音质检方法。
基于上述硬件结构,提出本发明基于人工智能的语音质检方法的实施例。
参照图2,图2为本发明基于人工智能的语音质检方法第一实施例的流程示意图,提出本发明基于人工智能的语音质检方法第一实施例。
在第一实施例中,所述基于人工智能的语音质检方法包括以下步骤:
步骤S10:获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档。
需要说明的是,本实施例的执行主体是基于人工智能的语音质检设备,其中,所述基于人工智能的语音质检设备可为个人电脑、智能手机或者平板电脑等电子设备。在本实施例中,可以通过对客服电话进行录音获得所述待质检音频,也可以通过对销售过程进行双录获得待质检视频,从所述待质检视频中提取待质检音频,本实施例对此不加以限制。由于待质检音频的特性,不便对所述待质检音频进行质检,将对所述待质检音频进行语音识别,生成待质检文档,从而方便后续对待质检文档进行质检。
在具体实现中,将所述待质检音频输入至预设语音模型中,以使所述语音模型识别所述待质检音频中的发音,并根据所述发音确定文本信息,生成并输出待质检文档。在本实施例中,所述步骤S10之前,所述方法还包括:用户将词汇表中的每个词说一遍,提取每个词的特征矢量,建立词与特征矢量之间的映射关系,根据该映射关系进行训练,获得预设语音模型。
步骤S20:从所述待质检文档中提取待质检关键词。
需要说明的是,客服人员在与客户的对话过程中,须按照一定的话术进行发言,所述话术中包含固定的关键词,因而,将通过所述待质检关键词检测客服人员或销售人员的话术是否符合预设规则,所述预设质检模型中包含有关键词与质检结果之间的对应关系,因此,将所述待质检关键词输入至预设质检模型中,可用于根据所述待质检关键词进行预测所述待质检文档的质检结果。
步骤S30:通过预设质检模型将所述待质检关键词与预设关键词进行比对,并根据比对结果输出目标质检结果。在具体实现中,根据预设分词算法对所述待质检文档进行分词,所述预设算法可以是正向最大匹配算法(ForwardMM,FMM)、逆向最大匹配算法(Backward MM,BMM)或者其它分词算法,本实施例对此不加以限制,基于分词结果提取待质检关键词,并将所述待质检关键词输入至预设质检模型中。
需要说明的是,质检结果指的是音频中的话术是否符合预设规则,所述预设规则根据客服人员就职的单位所定,本实施例对此不加以限制,所述目标质检结果则指的是所述待质检音频中的话术是否符合所述预设规则。由于所述预设质检模型中包含有关键词与质检结果之间的对应关系,从所述待质检文档中提取待质检关键词后,将所述待质检关键词输入至所述质检模型中,所述质检模型将输出与所述待质检关键词对应的目标质检结果。
在第一实施例中,通过获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档,从所述待质检文档中提取待质检关键词,将所述待质检关键词输入至预设质检模型中,通过预设质检模型将所述待质检关键词与预设关键词进行比对,并根据比对结果输出目标质检结果。由于将待质检音频转化为待质检文档,能够更便捷地进行质检,通过将待质检文档中的待质检关键词输入预设质检模型,能够实时准确地输出目标质检结果,不需过多的人工参与,更加智能化,提高了语音质检的效率。
参照图3,图3为本发明基于人工智能的语音质检方法第二实施例的流程示意图,基于上述图2所示的第一实施例,提出本发明基于人工智能的语音质检方法的第二实施例。
在第二实施例中,所述步骤S10之前,所述方法还包括:
步骤S01:采集样本质检文档以及所述样本质检文档对应的样本质检结果。
步骤S02:从所述样本质检文档中提取样本关键词,根据所述样本关键词及对应的样本质检结果生成预设质检模型。
可以理解的是,在通过所述预设质检模型进行语音质检之前,将构造所述预设质检模型,首先采集大量样本,所述样本包含样本质检文档以及所述样本质检文档对应的样本质检结果,从所述样本质检文档中提取样本关键词,根据所述样本关键词及对应的样本质检结果生成预设质检模型。
进一步地,所述步骤S02,包括:
步骤S021:根据预设关键词提取算法从所述样本质检文档中提取样本关键词,并根据所述样本关键词和所述样本质检结果建立关键词和质检结果之间的对应关系。
步骤S022:使用预设有监督(Delta)学习规则建立基础模型,根据所述对应关系对所述基础模型进行训练,生成预设质检模型。
需要说明的是,为了从所述样本质检文档中提取样本关键词,将根据预设分词算法对所述样本质检文档进行分词,所述预设算法可以是正向最大匹配算法、逆向最大匹配算法或者其它分词算法,本实施例对此不加以限制。根据预设关键词提取算法从分词结果中提取样本关键词,由于样本质检文档与样本关键词具有对应关系,且样本质检文档与样本质检结果具有对应关系,因此,可获得样本关键词与样本质检结果之间的对应关系。
在具体实现中,根据所述样本关键词和所述样本质检结果建立关键词和质检结果之间的对应关系之后,使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行训练,生成预设质检模型;其中,预设有监督学习规则是一种简单的有导师学习算法,该算法根据神经元的实际输出与期望输出的差别来调整连接权。
进一步地,所述步骤S022,包括:
使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行多次训练,在所述基础模型的质检准确率达到预设标准值时,生成预设质检模型;
其中,根据所述对应关系对所述基础模型进行训练,包括:
在所述对应关系中选取一组对应关系,将该组对应关系中的样本关键词输入至所述基础模型中,获取所述基础模型输出的当前质检结果;
将所述当前质检结果与该组对应关系中的样本质检结果进行对比,并根据对比结果调整所述基础模型的参数。
可以理解的是,使用预设有监督学习规则建立基础模型,根据关键词和质检结果之间的对应关系对所述基础模型进行多次训练,在所述基础模型的质检准确率达到预设标准值时,将生成预设质检模型。
在具体实现中,在关键词和质检结果之间的对应关系中选取一组对应关系,将该组对应关系中的样本关键词输入至所述基础模型中,以使所述基础模型根据所述样本关键词获得当前质检结果,将所述当前质检结果与该组对应关系中的样本质检结果进行对比,若所述当前质检结果优于所述样本质检结果,则将所述基础模型的参数减小预设值,若所述当前质检结果并未优于所述样本质检结果,则将所述基础模型的参数增大所述预设值,实时检测基础模型的质检准确率,当所述质检准确率未达到预设标准值时,继续进行训练,当所述质检准确率达到预设标准值时,所述基础模型训练成为预设质检模型。
在第二实施例中,通过采集样本质检文档以及所述样本质检文档对应的样本质检结果,从所述样本质检文档中提取样本关键词,根据所述样本关键词及对应的样本质检结果生成预设质检模型。由于预先获取大量样本,建立了关键词与质检结果之间的对应关系,使得根据该对应关系训练获得的预设质检模型具有较高的识别准确率,从而提高了根据所述预设质检模型进行质检的质检准确率。
参照图4,图4为本发明基于人工智能的语音质检方法第三实施例的流程示意图,基于上述图3所示的第二实施例,提出本发明基于人工智能的语音质检方法的第三实施例。
在第三实施例中,所述步骤S10,包括:
步骤S101:获取待质检音频,对所述待质检音频进行语音识别,获取文档内容。
可以理解的是,由于待质检音频的特性,不便对所述待质检音频进行质检,将对所述待质检音频进行语音识别,生成文档内容。
在具体实现中,将所述待质检音频输入至预设语音模型中,以使所述语音模型识别所述待质检音频中的发音,并根据所述发音确定文本信息,生成并输出待质检文档。在本实施例中,所述步骤S101之前,所述方法还包括:用户将词汇表中的每个词说一遍,提取每个词的特征矢量,建立词与特征矢量之间的映射关系,根据该映射关系进行训练,获得预设语音模型。
步骤S102:对所述待质检音频进行声纹识别,获取客服身份信息和客户身份信息。
需要说明的是,每个人在讲话时使用的发声器官:舌、牙齿、喉头、肺和鼻腔在尺寸和形态方面的差异很大,所以任何两个人的声纹特征都有差异,因此,将对所述待质检音频进行声纹识别,区分所述待质检音频中的客服和客户,获得客服身份信息和客户身份信息。
步骤S103:根据所述文档内容、所述客服身份信息和所述客户身份信息生成待质检文档。
可以理解的是,将所述文档内容、所述客服身份信息和所述客户身份信息进行整合,具体地,对所述文档内容中每句话的发言人进行识别,判断每句话的发言人是客服还是客户,获得标明发言人与对话内容的待质检文档,便于更准确地对所述待质检文档进行质检,并且,由于所述待质检文档包含了客服身份信息,则所述目标质检结果中也包含了所述客服身份信息对应的客服的话术是否符合预设规则,从而实现对客服人员的话术进行评价。
进一步地,所述步骤S102,包括:
从所述待质检音频中提取声纹特征信息。
将所述声纹特征信息输入到预设声纹模型中,以使所述预设声纹模型输出所述声纹特征信息对应的客服身份信息和客户身份信息。
需要说明的是,所述预设声纹模型能够对声纹特征信息进行识别,并将与所述声纹特征信息匹配的身份信息进行输出。
进一步地,所述从所述待质检音频中提取声纹特征信息之前,所述方法还包括:
采集样本音频以及所述样本音频对应的样本身份信息,所述样本身份信息包含样本客服身份信息与样本客户身份信息;
从所述样本音频中提取样本声纹特征信息,根据所述样本声纹特征信息与所述样本身份信息建立声纹特征信息与身份信息之间的映射关系;
建立基础声纹模型,根据所述映射关系对所述基础声纹模型进行训练,生成预设声纹模型。
在具体实现中,在通过所述预设声纹模型进行声纹识别之前,将构造所述预设声纹模型,首先采集大量样本,该样本包含样本音频以及所述样本音频对应的样本身份信息,从所述样本音频中提取样本声纹特征信息,根据所述样本声纹特征信息及对应的样本身份信息生成预设质检模型。
在第三实施例中,通过获取待质检音频,对所述待质检音频进行语音识别,获取文档内容,对所述待质检音频进行声纹识别,获取客服身份信息和客户身份信息,根据所述文档内容、所述客服身份信息和所述客户身份信息生成待质检文档。由于采集了大量样本,建立声纹特征信息与身份信息之间的映射关系,使得根据该映射关系训练获得的预设声纹模型具有较高的识别准确率,从而实现对客服人员的话术进行评价,并提高了对客服人员评价的准确率。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于人工智能的语音质检程序,所述基于人工智能的语音质检程序被处理器执行时实现如上文所述的基于人工智能的语音质检方法的步骤。
此外,参照图5,本发明实施例还提出一种基于人工智能的语音质检装置,所述基于人工智能的语音质检装置包括:
文档生成模块10,用于获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档;
关键词输入模块20,用于从所述待质检文档中提取待质检关键词;
结果获取模块30,用于通过预设质检模型将所述待质检关键词与预设关键词进行比对,并根据比对结果输出目标质检结果。
需要说明的是,本实施例的执行主体是基于人工智能的语音质检设备,其中,所述基于人工智能的语音质检设备可为个人电脑、智能手机或者平板电脑等电子设备。在本实施例中,可以通过对客服电话进行录音获得所述待质检音频,也可以通过对销售过程进行双录获得待质检视频,从所述待质检视频中提取待质检音频,本实施例对此不加以限制。由于待质检音频的特性,不便对所述待质检音频进行质检,将对所述待质检音频进行语音识别,生成待质检文档,从而方便后续对待质检文档进行质检。
在具体实现中,将所述待质检音频输入至预设语音模型中,以使所述语音模型识别所述待质检音频中的发音,并根据所述发音确定文本信息,生成并输出待质检文档。在本实施例中,所述步骤S10之前,所述方法还包括:用户将词汇表中的每个词说一遍,提取每个词的特征矢量,建立词与特征矢量之间的映射关系,根据该映射关系进行训练,获得预设语音模型。
需要说明的是,客服人员在与客户的对话过程中,须按照一定的话术进行发言,所述话术中包含固定的关键词,因而,将通过所述待质检关键词检测客服人员或销售人员的话术是否符合预设规则,所述预设质检模型中包含有关键词与质检结果之间的对应关系,因此,将所述待质检关键词输入至预设质检模型中,可用于根据所述待质检关键词进行预测所述待质检文档的质检结果。
在具体实现中,根据预设分词算法对所述待质检文档进行分词,所述预设算法可以是正向最大匹配算法(Forward MM,FMM)、逆向最大匹配算法(Backward MM,BMM)或者其它分词算法,本实施例对此不加以限制,基于分词结果提取待质检关键词,并将所述待质检关键词输入至预设质检模型中。
需要说明的是,质检结果指的是音频中的话术是否符合预设规则,所述预设规则根据客服人员就职的单位所定,本实施例对此不加以限制,所述目标质检结果则指的是所述待质检音频中的话术是否符合所述预设规则。由于所述预设质检模型中包含有关键词与质检结果之间的对应关系,从所述待质检文档中提取待质检关键词后,将所述待质检关键词输入至所述质检模型中,所述质检模型将输出与所述待质检关键词对应的目标质检结果。
在本实施例中,通过获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档,从所述待质检文档中提取待质检关键词,将所述待质检关键词输入至预设质检模型中,通过预设质检模型将所述待质检关键词与预设关键词进行比对,并根据比对结果输出目标质检结果。由于将待质检音频转化为待质检文档,能够更便捷地进行质检,通过将待质检文档中的待质检关键词输入预设质检模型,能够实时准确地输出目标质检结果,不需过多的人工参与,更加智能化,提高了语音质检的效率。
在一实施例中,所述基于人工智能的语音质检装置还包括:
第一采集模块,用于采集样本质检文档以及所述样本质检文档对应的样本质检结果。
第一建模模块,用于从所述样本质检文档中提取样本关键词,根据所述样本关键词及对应的样本质检结果生成预设质检模型。
在一实施例中,所述第一建模模块,还用于根据预设关键词提取算法从所述样本质检文档中提取样本关键词,并根据所述样本关键词和所述样本质检结果建立关键词和质检结果之间的对应关系;
使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行训练,生成预设质检模型。
在一实施例中,所述第一建模模块,还用于使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行多次训练,在所述基础模型的质检准确率达到预设标准值时,生成预设质检模型;
其中,根据所述对应关系对所述基础模型进行训练,包括:
在所述对应关系中选取一组对应关系,将该组对应关系中的样本关键词输入至所述基础模型中,获取所述基础模型输出的当前质检结果;
将所述当前质检结果与该组对应关系中的样本质检结果进行对比,并根据对比结果调整所述基础模型的参数。
在一实施例中,所述文档生成模块10,还用于获取待质检音频,对所述待质检音频进行语音识别,获取文档内容;
对所述待质检音频进行声纹识别,获取客服身份信息和客户身份信息;
根据所述文档内容、所述客服身份信息和所述客户身份信息生成待质检文档。
在一实施例中,所述文档生成模块10,还用于从所述待质检音频中提取声纹特征信息;
将所述声纹特征信息输入到预设声纹模型中,以使所述预设声纹模型对所述声纹特征信息进行识别,获取所述声纹特征信息对应的客服身份信息和客户身份信息。
在一实施例中,所述基于人工智能的语音质检装置还包括:
第二采集模块,用于采集样本音频以及所述样本音频对应的样本身份信息
第二建模模块,用于从所述样本音频中提取样本声纹特征信息,根据所述样本声纹特征信息与所述样本身份信息建立声纹特征信息与身份信息之间的映射关系;
建立基础声纹模型,根据所述映射关系对所述基础声纹模型进行训练,生成预设声纹模型。
本发明所述基于人工智能的语音质检装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为名称。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器镜像(ReadOnly Memory image,ROM)/随机存取存储器(Random AccessMemory,RAM)、磁碟、光盘)中,包括若干指令用以使得一台终端用户设备(可以是手机,计算机,服务器,空调器,或者网络用户设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (6)
1.一种基于人工智能的语音质检方法,其特征在于,所述基于人工智能的语音质检方法包括以下步骤:
获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档;
从所述待质检文档中提取待质检关键词;
通过预设质检模型将所述待质检关键词与预设关键词进行比对,并根据比对结果输出目标质检结果,所述质检结果包括所述待质检音频中客服和客户的话术是否符合预设规则;
其中,所述获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档,包括:
获取待质检音频,将所述待质检音频输入至预设语音模型中,以使所述语音模型识别所述待质检音频中的发音;
根据所述发音确定文本信息,生成并输出文档内容;
对所述待质检音频进行声纹识别,获取客服身份信息和客户身份信息;
根据所述文档内容、所述客服身份信息和所述客户身份信息生成待质检文档;
其中,所述获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档之前,所述方法还包括:
采集样本质检文档以及所述样本质检文档对应的样本质检结果;
从所述样本质检文档中提取样本关键词,根据所述样本关键词及对应的样本质检结果生成预设质检模型;
其中,所述从所述样本质检文档中提取样本关键词,根据所述样本关键词及对应的样本质检结果生成预设质检模型,包括:
根据预设分词算法对所述样本质检文档进行分词,根据预设关键词提取算法从分词结果中提取样本关键词,并根据所述样本关键词和所述样本质检结果建立关键词和质检结果之间的对应关系;
使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行训练,生成预设质检模型,所述预设有监督学习规则为有导师学习算法,所述有导师学习算法根据神经元的实际输出与期望输出的差别来调整连接权;
其中,所述使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行训练,生成预设质检模型,包括:
使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行多次训练,在所述基础模型的质检准确率达到预设标准值时,生成预设质检模型;
其中,根据所述对应关系对所述基础模型进行训练,包括:
在所述对应关系中选取一组对应关系,将该组对应关系中的样本关键词输入至所述基础模型中,获取所述基础模型输出的当前质检结果;
将所述当前质检结果与该组对应关系中的样本质检结果进行对比,并根据对比结果调整所述基础模型的参数。
2.如权利要求1所述的基于人工智能的语音质检方法,其特征在于,所述对所述待质检音频进行声纹识别,获取客服身份信息和客户身份信息,包括:
从所述待质检音频中提取声纹特征信息;
将所述声纹特征信息输入到预设声纹模型中,以使所述预设声纹模型对所述声纹特征信息进行识别,获取所述声纹特征信息对应的客服身份信息和客户身份信息。
3.如权利要求2所述的基于人工智能的语音质检方法,其特征在于,所述从所述待质检音频中提取声纹特征信息之前,所述方法还包括:
采集样本音频以及所述样本音频对应的样本身份信息;
从所述样本音频中提取样本声纹特征信息,根据所述样本声纹特征信息与所述样本身份信息建立声纹特征信息与身份信息之间的映射关系;
建立基础声纹模型,根据所述映射关系对所述基础声纹模型进行训练,生成预设声纹模型。
4.一种基于人工智能的语音质检设备,其特征在于,所述基于人工智能的语音质检设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于人工智能的语音质检程序,所述基于人工智能的语音质检程序被所述处理器执行时实现如权利要求1至3中任一项所述的基于人工智能的语音质检方法的步骤。
5.一种存储介质,其特征在于,所述存储介质上存储有基于人工智能的语音质检程序,所述基于人工智能的语音质检程序被处理器执行时实现如权利要求1至3中任一项所述的基于人工智能的语音质检方法的步骤。
6.一种基于人工智能的语音质检装置,其特征在于,所述基于人工智能的语音质检装置包括:
文档生成模块,用于获取待质检音频,对所述待质检音频进行语音识别,生成待质检文档;
关键词输入模块,用于从所述待质检文档中提取待质检关键词;
结果获取模块,用于通过预设质检模型将所述待质检关键词与预设关键词进行比对,并根据比对结果输出目标质检结果,所述质检结果包括所述待质检音频中客服和客户的话术是否符合预设规则;
其中,所述文档生成模块,具体用于获取待质检音频,将所述待质检音频输入至预设语音模型中,以使所述语音模型识别所述待质检音频中的发音;
根据所述发音确定文本信息,生成并输出文档内容;
对所述待质检音频进行声纹识别,获取客服身份信息和客户身份信息;
根据所述文档内容、所述客服身份信息和所述客户身份信息生成待质检文档;
第一采集模块,用于采集样本质检文档以及所述样本质检文档对应的样本质检结果;
第一建模模块,用于从所述样本质检文档中提取样本关键词,根据所述样本关键词及对应的样本质检结果生成预设质检模型;
其中,所述从所述样本质检文档中提取样本关键词,根据所述样本关键词及对应的样本质检结果生成预设质检模型,包括:
根据预设分词算法对所述样本质检文档进行分词,根据预设关键词提取算法从分词结果中提取样本关键词,并根据所述样本关键词和所述样本质检结果建立关键词和质检结果之间的对应关系;
使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行训练,生成预设质检模型,所述预设有监督学习规则为有导师学习算法,所述有导师学习算法根据神经元的实际输出与期望输出的差别来调整连接权;
其中,所述使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行训练,生成预设质检模型,包括:
使用预设有监督学习规则建立基础模型,根据所述对应关系对所述基础模型进行多次训练,在所述基础模型的质检准确率达到预设标准值时,生成预设质检模型;
其中,根据所述对应关系对所述基础模型进行训练,包括:
在所述对应关系中选取一组对应关系,将该组对应关系中的样本关键词输入至所述基础模型中,获取所述基础模型输出的当前质检结果;
将所述当前质检结果与该组对应关系中的样本质检结果进行对比,并根据对比结果调整所述基础模型的参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811227840.6A CN109658923B (zh) | 2018-10-19 | 2018-10-19 | 基于人工智能的语音质检方法、设备、存储介质及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811227840.6A CN109658923B (zh) | 2018-10-19 | 2018-10-19 | 基于人工智能的语音质检方法、设备、存储介质及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109658923A CN109658923A (zh) | 2019-04-19 |
CN109658923B true CN109658923B (zh) | 2024-01-30 |
Family
ID=66110717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811227840.6A Active CN109658923B (zh) | 2018-10-19 | 2018-10-19 | 基于人工智能的语音质检方法、设备、存储介质及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109658923B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110176252A (zh) * | 2019-05-08 | 2019-08-27 | 江西尚通科技发展股份有限公司 | 基于风险管控模式的智能语音质检方法及系统 |
CN111953854B (zh) * | 2019-05-14 | 2021-08-06 | 新联协同通信技术(北京)有限公司 | 一种基于场景模型的智能客服辅助方法 |
CN110310663A (zh) * | 2019-05-16 | 2019-10-08 | 平安科技(深圳)有限公司 | 违规话术检测方法、装置、设备及计算机可读存储介质 |
CN110334241B (zh) * | 2019-07-10 | 2023-08-25 | 深圳前海微众银行股份有限公司 | 客服录音的质检方法、装置、设备及计算机可读存储介质 |
CN110519470A (zh) * | 2019-08-22 | 2019-11-29 | 徐菲 | 一种语音处理方法、服务器和语音接入装置 |
CN110634471B (zh) * | 2019-09-21 | 2020-10-02 | 龙马智芯(珠海横琴)科技有限公司 | 一种语音质检方法、装置、电子设备和存储介质 |
CN110572601B (zh) * | 2019-09-29 | 2022-08-05 | 青岛希望鸟科技有限公司 | 一种具有实时校验功能的双录音视频录制系统 |
CN111368130A (zh) * | 2020-02-26 | 2020-07-03 | 深圳前海微众银行股份有限公司 | 客服录音的质检方法、装置、设备及存储介质 |
CN111291162B (zh) * | 2020-02-26 | 2024-04-09 | 深圳前海微众银行股份有限公司 | 质检例句挖掘方法、装置、设备及计算机可读存储介质 |
CN111462783A (zh) * | 2020-03-05 | 2020-07-28 | 深圳壹账通智能科技有限公司 | 音视频录制引导方法、装置、计算机设备及存储介质 |
CN111523317B (zh) * | 2020-03-09 | 2023-04-07 | 平安科技(深圳)有限公司 | 语音质检方法、装置、电子设备及介质 |
CN112634903B (zh) * | 2020-12-15 | 2023-09-29 | 平安科技(深圳)有限公司 | 业务语音的质检方法、装置、设备及存储介质 |
CN112927699A (zh) * | 2021-02-02 | 2021-06-08 | 上海世茂物联网科技有限公司 | 一种语音通信方法、系统、设备及存储介质 |
CN112951275B (zh) * | 2021-02-26 | 2022-12-23 | 北京百度网讯科技有限公司 | 语音质检方法、装置、电子设备及介质 |
CN115148220A (zh) * | 2021-03-31 | 2022-10-04 | 广东高云半导体科技股份有限公司 | 一种音频检测系统及音频检测方法 |
CN113223532B (zh) * | 2021-04-30 | 2024-03-05 | 平安科技(深圳)有限公司 | 客服通话的质检方法、装置、计算机设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102625005A (zh) * | 2012-03-05 | 2012-08-01 | 广东天波信息技术股份有限公司 | 具有服务质量实时监督功能的呼叫中心系统及其实现方法 |
CN103811009A (zh) * | 2014-03-13 | 2014-05-21 | 华东理工大学 | 一种基于语音分析的智能电话客服系统 |
CN104680428A (zh) * | 2015-03-16 | 2015-06-03 | 朗新科技股份有限公司 | 一种电网客户满意度模型的构建方法 |
CN105975514A (zh) * | 2016-04-28 | 2016-09-28 | 朱宇光 | 一种自动质检方法及系统 |
CN107093431A (zh) * | 2016-02-18 | 2017-08-25 | 中国移动通信集团辽宁有限公司 | 一种对服务质量进行质检的方法及装置 |
CN107705807A (zh) * | 2017-08-24 | 2018-02-16 | 平安科技(深圳)有限公司 | 基于情绪识别的语音质检方法、装置、设备及存储介质 |
CN107886951A (zh) * | 2016-09-29 | 2018-04-06 | 百度在线网络技术(北京)有限公司 | 一种语音检测方法、装置及设备 |
CN108550050A (zh) * | 2018-03-27 | 2018-09-18 | 昆山和君纵达数据科技有限公司 | 一种基于呼叫中心数据的用户画像方法 |
-
2018
- 2018-10-19 CN CN201811227840.6A patent/CN109658923B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102625005A (zh) * | 2012-03-05 | 2012-08-01 | 广东天波信息技术股份有限公司 | 具有服务质量实时监督功能的呼叫中心系统及其实现方法 |
CN103811009A (zh) * | 2014-03-13 | 2014-05-21 | 华东理工大学 | 一种基于语音分析的智能电话客服系统 |
CN104680428A (zh) * | 2015-03-16 | 2015-06-03 | 朗新科技股份有限公司 | 一种电网客户满意度模型的构建方法 |
CN107093431A (zh) * | 2016-02-18 | 2017-08-25 | 中国移动通信集团辽宁有限公司 | 一种对服务质量进行质检的方法及装置 |
CN105975514A (zh) * | 2016-04-28 | 2016-09-28 | 朱宇光 | 一种自动质检方法及系统 |
CN107886951A (zh) * | 2016-09-29 | 2018-04-06 | 百度在线网络技术(北京)有限公司 | 一种语音检测方法、装置及设备 |
CN107705807A (zh) * | 2017-08-24 | 2018-02-16 | 平安科技(深圳)有限公司 | 基于情绪识别的语音质检方法、装置、设备及存储介质 |
CN108550050A (zh) * | 2018-03-27 | 2018-09-18 | 昆山和君纵达数据科技有限公司 | 一种基于呼叫中心数据的用户画像方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109658923A (zh) | 2019-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109658923B (zh) | 基于人工智能的语音质检方法、设备、存储介质及装置 | |
CN107818798B (zh) | 客服服务质量评价方法、装置、设备及存储介质 | |
CN108520741B (zh) | 一种耳语音恢复方法、装置、设备及可读存储介质 | |
US10438586B2 (en) | Voice dialog device and voice dialog method | |
CN109215632B (zh) | 一种语音评测方法、装置、设备及可读存储介质 | |
CN104598644B (zh) | 喜好标签挖掘方法和装置 | |
CN111081279A (zh) | 语音情绪波动分析方法及装置 | |
JP2016075740A (ja) | 音声処理装置、音声処理方法、およびプログラム | |
CN112712809B (zh) | 一种语音检测方法、装置、电子设备及存储介质 | |
CN113223560A (zh) | 情绪识别方法、装置、设备及存储介质 | |
CN109544104A (zh) | 一种招聘数据处理方法及装置 | |
CN111986675A (zh) | 语音对话方法、设备及计算机可读存储介质 | |
CN112232276B (zh) | 一种基于语音识别和图像识别的情绪检测方法和装置 | |
JPWO2018147193A1 (ja) | モデル学習装置、推定装置、それらの方法、およびプログラム | |
CN107766560B (zh) | 客服服务流程的评价方法和系统 | |
US10872615B1 (en) | ASR-enhanced speech compression/archiving | |
CN111312286A (zh) | 年龄识别方法、装置、设备及计算机可读存储介质 | |
KR20210071713A (ko) | 스피치 스킬 피드백 시스템 | |
CN108538292B (zh) | 一种语音识别方法、装置、设备及可读存储介质 | |
CN112183408B (zh) | 基于案场图像的客户画像系统及方法 | |
CN112183417A (zh) | 一种置业顾问服务能力评价系统及方法 | |
CN110111778B (zh) | 一种语音处理方法、装置、存储介质及电子设备 | |
CN110580899A (zh) | 语音识别方法及装置、存储介质、计算设备 | |
CN107886233B (zh) | 客服的服务质量评价方法和系统 | |
CN114220419A (zh) | 一种语音评价方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |