CN112053681A - 一种asr和nlu联合训练的电话客服质量评分技术及系统 - Google Patents
一种asr和nlu联合训练的电话客服质量评分技术及系统 Download PDFInfo
- Publication number
- CN112053681A CN112053681A CN202010884877.7A CN202010884877A CN112053681A CN 112053681 A CN112053681 A CN 112053681A CN 202010884877 A CN202010884877 A CN 202010884877A CN 112053681 A CN112053681 A CN 112053681A
- Authority
- CN
- China
- Prior art keywords
- voice
- vector
- semantic vector
- customer service
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 32
- 238000005516 engineering process Methods 0.000 title claims abstract description 7
- 239000013598 vector Substances 0.000 claims abstract description 178
- 238000000034 method Methods 0.000 claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 claims 1
- 238000007689 inspection Methods 0.000 abstract description 8
- 238000013077 scoring method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
Abstract
本发明提供了一种ASR和NLU联合训练的电话客服质量评分技术及系统,通过自动语音识别与自然语言理解联合训练,能够更有效的保留语音的原始特征,减少误差传播,解决了传统电话质检系统无法匹配语义层面软性指标等问题。所述方法包括:获取录音数据,基于说话人身份,将录音数据切分成n条语音;将n条语音分类标记;将标记后的n条语音经自动语音识别训练,获取n个高维向量;将n个高维向量按类别拼接,获取拼接向量;将拼接向量经过自然语言理解训练,得到语音‑语义向量V;对向量V做分类任务,获得每个任务场景类别的置信度C;对向量V进行编码得到语义向量P,将向量P标准化后,输入到一个全连接层里,然后与置信度C相乘,获得评分。
Description
技术领域
本发明涉及电话质检,尤其涉及一种ASR和NLU联合训练的电话客服质量评分技术及系统。
背景技术
现有的电话质检系统,通过将语音识别成文字后,评分规则大多基于正则匹配开展。如有没说脏话、有没说敬语等,正则匹配适用于硬性指标。但是对一些语义层面的软性指标,例如客服在特定场景的话术专业度评分等,现存的电话质检系统无法实现。从而无法为企业客户提供更细致的电话客服管理。
由于语音识别和正则规则是pipeline关系,语音识别的错误会积累到正则匹配。而且,从语音转成文字,除了积累误差外,还丢失了很多重要原始信息与语气情绪等。这使得现存的电话质检系统能力有限,无法覆盖更广的应用。
发明内容
为了解决上述技术问题,本发明提供了一种ASR和NLU联合训练的电话客服质量评分技术及系统,通过自动语音识别与自然语言理解联合训练,能够更有效的保留语音的原始特征,减少误差传播,解决了传统电话质检系统无法匹配语义层面软性指标等问题。
本发明的技术方案是这样实现的:
一种ASR和NLU联合训练的电话客服质量评分技术,包括:
获取录音数据;
根据所述录音数据,基于说话人身份,获取与说话人身份相对应的拼接向量;
对所述拼接向量进行自然语言理解训练,获取语音-语义向量V;
基于预设的N个任务场景,对语音-语义向量V做分类任务,获取每个任务场景类别的置信度C;N≥1;
对语音-语义向量V进行编码得到语义向量P,将语义向量P标准化后,输入到一个全连接层里,经全连接层整合后与置信度C相乘,获得评分。
进一步地,所述获取与说话人身份相对应的拼接向量包括:
将录音数据切分成n条语音;n≥2;
基于说话人身份,将n条所述语音分类标记;
将分类标记后的n条所述语音经自动语音识别训练,获取n个高维向量;
基于说话人身份分类,将n个高维向量按类别拼接,获取拼接向量。
进一步地,所述将n条所述语音分类标记包括:
将n条所述语音分类标记为客户语音和客服语音。
进一步地,获取n个高维向量的方法包括:
将n条分类标记后的所述语音输入到wave2vec模型,得到n个高维向量。
进一步地,所述基于说话人身份分类,将n高维向量按类别拼接,获取拼接向量包括:
基于说话人身份,将n个高维向量分为x个客户语音向量和y个客服语音向量;x+y=n,x≥1,y≥1;
将全部所述客户语音向量和全部所述客服语音向量拼接,得到的拼接向量V1;
将全部所述客户语音向量拼接,得到的拼接向量V2;
将全部所述客服语音向量拼接,得到的拼接向量V3。
进一步地,所述对所述拼接向量进行自然语言理解训练,得到语音-语义向量V,包括:
将所述拼接向量V1、所述拼接向量V2和所述拼接向量V3分别输入到双层的Transformer Block里,进行自注意力的编码,经过后接全连接层统一输出维度,拼接后得到一个语音-语义矩阵M;
对所述语音-语音矩阵M进行卷积神经网络、池化以及dropout、全连接得到语音-语义向量V。
进一步地,所述基于预设的N个任务场景,对语音-语义向量V做分类任务,包括:
将语音-语义向量V输入到electra1分类模块做分类任务。
进一步地,所述对语音-语义向量V进行编码得到语义向量P,包括:
将语音-语义向量V输入到electra2编码模块,编码后,得到语义向量P。
一种ASR和NLU联合训练的电话客服质量评分系统,包括:
获取模块,用于获取录音数据,基于说话人身份,将录音数据切分成n条语音,并基于说话人身份,将n条所述语音分类标记;
自动语音识别模块,用于将分类标记后的语音进行语音识别,获取n个高维向量;
自然语言理解模块,用于将n个高维向量按类别拼接,获取拼接向量,并对拼接向量进行自然语言理解训练,得到语音-语义向量V;其中所述类别为基于说话人身份分类;
评分模块,用于根据预设的N个任务场景,对语音-语义向量V做分类任务,获得每个任务场景类别的置信度C;对语音-语义向量V进行编码得到语义向量P,将语义向量P标准化后,经全连接层整合后与置信度C相乘,获得评分。
进一步地,所述自动语音识别模块包括wave2vec模型,用于将所述语音转换为高维向量。
进一步地,所述评分模块包括:
electra1分类模块,用于根据预设的N个任务场景对语音-语义向量V做分类任务,输出每个对话场景类别的置信度C;
electra2编码模块,用于对语音-语义向量V编码,得到语义向量P。
本发明的实施例一的一种ASR和NLU联合训练的电话客服质量评分方法,相比较现有技术,具有如下优点:
本发明通过把ASR和NLU在模型层面做联合训练。分析电话录音文本,透过自然语言理解,识别出对话的场景意图,和该场景下客服话术的专业程度从而进行评分。解决了传统电话质检系统无法匹配语义层面软性指标的问题。同时,联合训练避免了传电话质检系统的pipeline形式造成的误差传播。
附图说明
附图示出了本发明的示例性实施方式,并与其说明一起用于解释本发明的原理,其中包括了这些附图以提供对本发明的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。
图1是本发明的ASR和NLU联合训练的电话客服质量评分方法的流程示意图;
具体实施方式
下面结合附图和实施方式对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分。
需要说明的是,在不冲突的情况下,本发明中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本发明。
实施例一
参照图1,本实施例提供了一种ASR和NLU联合训练的电话客服质量评分方法,包括:
获取录音数据,基于说话人身份,将录音数据切分成n条语音;n≥2;
基于说话人身份,将n条所述语音分类标记;
将分类标记后的n条所述语音经自动语音识别训练,获取n个高维向量;
基于说话人身份分类,将n个高维向量按类别拼接,获取拼接向量;
将拼接向量经过自然语言理解训练,得到语音-语义向量V;
基于预设的N个任务场景,对语音-语义向量V做分类任务,获得每个任务场景类别的置信度C;N≥1;
对语音-语义向量V进行编码得到语义向量P,将语义向量P标准化后,输入到一个全连接层里,经全连接层整合后与置信度C相乘,获得评分。
在电话客服服务中,客服和客户之间的所有对话都是基于一些特定的任务场景,协助帮助客户解决一些特定的问题,因此在不同的任务场景下,一段对话的语音和语义,其置信度也不相同;因此,本公开根据常见对话场景和特定对话场景等,预先设置了N个任务场景,通过分类任务获取一段对话在这N个任务场景下的置信度。
作为上述实施方式的可选方案,所述基于预设的N个任务场景,对所述语音-语义向量V做分类任务,包括:
将所述语音-语义向量V输入到electra1分类模块做分类任务。
作为上述实施方式的可选方案,所述对所述语音-语义向量V进行编码得到语义向量P,包括:
将所述语音-语义向量V输入到electra2编码模块,编码后,得到语义向量P。
本实施例中,在获取录音数据后,通过对语音的识别,可以将将归属于不同说话人的语音进行分离,切分成n段语音,每一段语言仅包括一个说话人,相邻的语音说话人会切换。
作为上述实施方式的可选方案,所述将n条所述语音分类标记包括:
将n条所述语音分类标记为客户语音和客服语音。
其中,说话人是指录音数据中语音的发出人,在电话客服中,一般说话人包括客服和客人两个身份。
本实施例中,可按照录音时间顺序对语音进行顺序分割,并对每段语音打上说话人标记,例如:把整段语音分割并标记为:客服语音1、客户语音1、客服语音2、客户语音2……;
本实例中,在对录音数据分割并标记后,得到n条语音,通过自动语音识别训练获得n个高维向量;
其中,基于说话人身份分类,将n个高维向量按类别拼接,获取拼接向量:在电话客服应用场景中,即将n个高维向量分为x个客户语音向量和y个客服语音向量;x+y=n,其中x+y=n,x≥1,y≥1;
将全部所述客户语音向量和全部所述客服语音向量拼接,得到的拼接向量V1;
将全部所述客户语音向量拼接,得到的拼接向量V2;
将全部所述客服语音向量拼接,得到的拼接向量V3。
作为上述实施方式的可选方案,获取n个高维向量的方法包括:
将n条分类标记后的所述语音输入到wave2vec模型,得到n个高维向量。
作为上述实施方式的可选方案,所述将拼接向量经过自然语言理解训练,得到语音-语义向量V,包括:
将所述拼接向量V1、所述拼接向量V2和所述拼接向量V3分别输入到双层的Transformer Block里,进行自注意力的编码,经过后接全连接层统一输出维度,拼接后得到一个语音-语义矩阵M;
对所述语音-语音矩阵M进行卷积神经网络、池化以及dropout、全连接得到语音-语义向量V。
本实施例通过向量评价获得所述拼接向量V1、所述拼接向量V2和所述拼接向量V3,再进行注意力编码,能够得到信息量最全面的所述语音-语义矩阵M,不仅包含了整段录音的语义编码信息,还包含了不同说话人的录音的语义编码信息,能够更有效的保留语音的原始特征,有利于对录音数据内容进行语义分析。
实施例二
一种ASR和NLU联合训练的电话客服质量评分系统,包括:
获取模块,用于获取录音数据,基于说话人身份,将录音数据切分成n条语音,并基于说话人身份,将n条所述语音分类标记;
自动语音识别模块,用于将分类标记后的语音进行语音识别,获取n个高维向量;
自然语言理解模块,用于将n个高维向量按类别拼接,获取拼接向量,并对拼接向量进行自然语言理解训练,得到语音-语义向量V;其中所述类别为基于说话人身份分类;
评分模块,用于根据预设的N个任务场景,对语音-语义向量V做分类任务,获得每个任务场景类别的置信度C;对语音-语义向量V进行编码得到语义向量P,将语义向量P标准化后,经全连接层整合后与置信度C相乘,获得评分。
作为上述实施方式的可选方案,所述自动语音识别模块包括wave2vec模型,用于将所述语音转换为高维向量。
作为上述实施方式的可选方案,所述评分模块包括:
electra1分类模块,用于根据预设的N个任务场景对语音-语义向量V做分类任务,输出每个对话场景类别的置信度C;
electra2编码模块,用于对语音-语义向量V编码,得到语义向量P。
本实施例的原理和效果与实施例1中的一致,本实施例不再重复描述。
领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明本发明,而并非是对本发明的范围进行限定。对于所属领域的技术人员而言,在上述发明的基础上还可以做出其它变化或变型,并且这些变化或变型仍处于本发明的范围内。
Claims (11)
1.一种ASR和NLU联合训练的电话客服质量评分技术,其特征在于,包括:
获取录音数据;
根据所述录音数据,基于说话人身份,获取与说话人身份相对应的拼接向量;
对所述拼接向量进行自然语言理解训练,获取语音-语义向量V;
基于预设的N个任务场景,对语音-语义向量V做分类任务,获取每个任务场景类别的置信度C;N≥1;
对语音-语义向量V进行编码得到语义向量P,将语义向量P标准化后,输入到一个全连接层里,经全连接层整合后与置信度C相乘,获得评分。
2.如权利要求1所述的电话客服质量评分技术,其特征在于,
所述获取与说话人身份相对应的拼接向量包括:
将录音数据切分成n条语音;n≥2;
基于说话人身份,将n条所述语音分类标记;
将分类标记后的n条所述语音经自动语音识别训练,获取n个高维向量;
基于说话人身份分类,将n个高维向量按类别拼接,获取拼接向量。
3.如权利要求2所述的电话客服质量评分技术,其特征在于,
所述将n条所述语音分类标记包括:
将n条所述语音分类标记为客户语音和客服语音。
4.如权利要求2所述的电话客服质量评分技术,其特征在于,
获取n个高维向量的方法包括:
将n条分类标记后的所述语音输入到wave2vec模型,得到n个高维向量。
5.如权利要求2所述的电话客服质量评分技术,其特征在于,
所述基于说话人身份分类,将n高维向量按类别拼接,获取拼接向量包括:
基于说话人身份,将n个高维向量分为x个客户语音向量和y个客服语音向量;x+y=n,x≥1,y≥1;
将全部所述客户语音向量和全部所述客服语音向量拼接,得到的拼接向量V1;
将全部所述客户语音向量拼接,得到的拼接向量V2;
将全部所述客服语音向量拼接,得到的拼接向量V3。
6.如权利要求5所述的电话客服质量评分技术,其特征在于,
所述对所述拼接向量进行自然语言理解训练,得到语音-语义向量V,包括:
将所述拼接向量V1、所述拼接向量V2和所述拼接向量V3分别输入到双层的Transformer Block里,进行自注意力的编码,经过后接全连接层统一输出维度,拼接后得到一个语音-语义矩阵M;
对所述语音-语义矩阵M进行卷积神经网络、池化以及dropout、全连接得到语音-语义向量V。
7.如权利要求1-6任一项所述的电话客服质量评分技术,其特征在于,
所述基于预设的N个任务场景,对所述语音-语义向量V做分类任务,包括:
将所述语音-语义向量V输入到electra1分类模块做分类任务。
8.如权利要求1-6任一项所述的电话客服质量评分技术,其特征在于,
所述对语音-语义向量V进行编码得到语义向量P,包括:
将所述语音-语义向量V输入到electra2编码模块,编码后,得到语义向量P。
9.一种ASR和NLU联合训练的电话客服质量评分系统,其特征在于,包括:
获取模块,用于获取录音数据,基于说话人身份,将录音数据切分成n条语音,并基于说话人身份,将n条所述语音分类标记;
自动语音识别模块,用于将分类标记后的语音进行语音识别,获取n个高维向量;
自然语言理解模块,用于将n个高维向量按类别拼接,获取拼接向量,并对拼接向量进行自然语言理解训练,得到语音-语义向量V;其中所述类别为基于说话人身份分类;
评分模块,用于根据预设的N个任务场景,对语音-语义向量V做分类任务,获得每个任务场景类别的置信度C;对语音-语义向量V进行编码得到语义向量P,将语义向量P标准化后,经全连接层整合后与置信度C相乘,获得评分。
10.如权利要求9所述的系统,其特征在于,所述自动语音识别模块包括wave2vec模型,用于将所述语音转换为高维向量。
11.如权利要求9所述的系统,其特征在于,所述评分模块包括:
electra1分类模块,用于根据预设的N个任务场景对语音-语义向量V做分类任务,输出每个对话场景类别的置信度C;
electra2编码模块,用于对语音-语义向量V编码,得到语义向量P。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010884877.7A CN112053681B (zh) | 2020-08-28 | 2020-08-28 | Asr和nlu联合训练的电话客服质量评分方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010884877.7A CN112053681B (zh) | 2020-08-28 | 2020-08-28 | Asr和nlu联合训练的电话客服质量评分方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112053681A true CN112053681A (zh) | 2020-12-08 |
CN112053681B CN112053681B (zh) | 2024-04-16 |
Family
ID=73607829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010884877.7A Active CN112053681B (zh) | 2020-08-28 | 2020-08-28 | Asr和nlu联合训练的电话客服质量评分方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112053681B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580367A (zh) * | 2020-12-23 | 2021-03-30 | 潍柴动力股份有限公司 | 一种话务质检方法及装置 |
CN113223532A (zh) * | 2021-04-30 | 2021-08-06 | 平安科技(深圳)有限公司 | 客服通话的质检方法、装置、计算机设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040161096A1 (en) * | 2003-02-13 | 2004-08-19 | Sbc Properties, L.P. | Method for evaluating customer call center system designs |
CN103811009A (zh) * | 2014-03-13 | 2014-05-21 | 华东理工大学 | 一种基于语音分析的智能电话客服系统 |
CN105261362A (zh) * | 2015-09-07 | 2016-01-20 | 科大讯飞股份有限公司 | 一种通话语音监测方法及系统 |
CN109327632A (zh) * | 2018-11-23 | 2019-02-12 | 深圳前海微众银行股份有限公司 | 客服录音的智能质检系统、方法及计算机可读存储介质 |
CN109816106A (zh) * | 2017-11-20 | 2019-05-28 | 北京智合大方科技有限公司 | 一种基于语音识别和自然语言处理技术进行呼叫中心客服业务知识类应答质量评估系统 |
CN110069784A (zh) * | 2019-05-05 | 2019-07-30 | 广东电网有限责任公司 | 一种语音质检评分方法、装置、终端及可存储介质 |
CN110309216A (zh) * | 2019-05-10 | 2019-10-08 | 焦点科技股份有限公司 | 一种基于文本分类的客服语音质检方法 |
CN110705309A (zh) * | 2019-09-19 | 2020-01-17 | 苏州思必驰信息科技有限公司 | 服务质量评测方法及系统 |
CN111049998A (zh) * | 2018-10-11 | 2020-04-21 | 上海智臻智能网络科技股份有限公司 | 语音客服质检方法及客服质检设备、存储介质 |
CN111049999A (zh) * | 2018-10-11 | 2020-04-21 | 上海智臻智能网络科技股份有限公司 | 语音客服质检系统及客服质检设备 |
CN111128241A (zh) * | 2019-12-30 | 2020-05-08 | 上海浩琨信息科技有限公司 | 语音通话的智能质检方法及系统 |
-
2020
- 2020-08-28 CN CN202010884877.7A patent/CN112053681B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040161096A1 (en) * | 2003-02-13 | 2004-08-19 | Sbc Properties, L.P. | Method for evaluating customer call center system designs |
CN103811009A (zh) * | 2014-03-13 | 2014-05-21 | 华东理工大学 | 一种基于语音分析的智能电话客服系统 |
CN105261362A (zh) * | 2015-09-07 | 2016-01-20 | 科大讯飞股份有限公司 | 一种通话语音监测方法及系统 |
CN109816106A (zh) * | 2017-11-20 | 2019-05-28 | 北京智合大方科技有限公司 | 一种基于语音识别和自然语言处理技术进行呼叫中心客服业务知识类应答质量评估系统 |
CN111049998A (zh) * | 2018-10-11 | 2020-04-21 | 上海智臻智能网络科技股份有限公司 | 语音客服质检方法及客服质检设备、存储介质 |
CN111049999A (zh) * | 2018-10-11 | 2020-04-21 | 上海智臻智能网络科技股份有限公司 | 语音客服质检系统及客服质检设备 |
CN109327632A (zh) * | 2018-11-23 | 2019-02-12 | 深圳前海微众银行股份有限公司 | 客服录音的智能质检系统、方法及计算机可读存储介质 |
CN110069784A (zh) * | 2019-05-05 | 2019-07-30 | 广东电网有限责任公司 | 一种语音质检评分方法、装置、终端及可存储介质 |
CN110309216A (zh) * | 2019-05-10 | 2019-10-08 | 焦点科技股份有限公司 | 一种基于文本分类的客服语音质检方法 |
CN110705309A (zh) * | 2019-09-19 | 2020-01-17 | 苏州思必驰信息科技有限公司 | 服务质量评测方法及系统 |
CN111128241A (zh) * | 2019-12-30 | 2020-05-08 | 上海浩琨信息科技有限公司 | 语音通话的智能质检方法及系统 |
Non-Patent Citations (3)
Title |
---|
A. T. LIU: "Mockingjay: Unsupervised Speech Representation Learning with Deep Bidirectional Transformer Encoders", 《ICASSP 2020》 * |
P. WANG: "Large-Scale Unsupervised Pre-Training for End-to-End Spoken Language Understanding", 《ICASSP 2020》 * |
梁圣洁: "基于机器学习的客服语音智能质检系统的设计与实现", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580367A (zh) * | 2020-12-23 | 2021-03-30 | 潍柴动力股份有限公司 | 一种话务质检方法及装置 |
CN112580367B (zh) * | 2020-12-23 | 2023-10-27 | 潍柴动力股份有限公司 | 一种话务质检方法及装置 |
CN113223532A (zh) * | 2021-04-30 | 2021-08-06 | 平安科技(深圳)有限公司 | 客服通话的质检方法、装置、计算机设备及存储介质 |
CN113223532B (zh) * | 2021-04-30 | 2024-03-05 | 平安科技(深圳)有限公司 | 客服通话的质检方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112053681B (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112804400B (zh) | 客服呼叫语音质检方法、装置、电子设备及存储介质 | |
US20200234717A1 (en) | Speaker separation model training method, two-speaker separation method and computing device | |
Han et al. | Acoustic scene classification using convolutional neural network and multiple-width frequency-delta data augmentation | |
US10147438B2 (en) | Role modeling in call centers and work centers | |
CN113255755A (zh) | 一种基于异质融合网络的多模态情感分类方法 | |
CN112951240B (zh) | 模型训练、语音识别方法及装置、电子设备及存储介质 | |
CN114465737B (zh) | 一种数据处理方法、装置、计算机设备及存储介质 | |
CN111785275A (zh) | 语音识别方法及装置 | |
CN112053681A (zh) | 一种asr和nlu联合训练的电话客服质量评分技术及系统 | |
CN111048095A (zh) | 一种语音转写方法、设备及计算机可读存储介质 | |
CN112860871B (zh) | 自然语言理解模型训练方法、自然语言理解方法及装置 | |
CN113239147A (zh) | 基于图神经网络的智能会话方法、系统及介质 | |
CN116631412A (zh) | 一种通过声纹匹配判断语音机器人的方法 | |
US10872615B1 (en) | ASR-enhanced speech compression/archiving | |
CN117441165A (zh) | 减少生成语言模型的偏差 | |
WO2021169825A1 (zh) | 语音合成方法、装置、设备和存储介质 | |
CN109618067A (zh) | 外呼对话处理方法和系统 | |
CN111949777A (zh) | 一种基于人群分类的智能语音对话方法、装置及电子设备 | |
US11398239B1 (en) | ASR-enhanced speech compression | |
CN112002306B (zh) | 语音类别的识别方法、装置、电子设备及可读存储介质 | |
CN113393845A (zh) | 用于说话人识别的方法、装置、电子设备及可读存储介质 | |
CN113905135A (zh) | 一种智能外呼机器人的用户意向识别方法和装置 | |
Kinoshita et al. | Utterance-by-utterance overlap-aware neural diarization with Graph-PIT | |
CN110728145A (zh) | 一种基于录音对话的自然语言理解模型的建立方法 | |
CN113705186B (zh) | 一种留言语义分析下的自动回复方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |