CN109859760A - 基于深度学习的电话机器人语音识别结果校正方法 - Google Patents
基于深度学习的电话机器人语音识别结果校正方法 Download PDFInfo
- Publication number
- CN109859760A CN109859760A CN201910125823.XA CN201910125823A CN109859760A CN 109859760 A CN109859760 A CN 109859760A CN 201910125823 A CN201910125823 A CN 201910125823A CN 109859760 A CN109859760 A CN 109859760A
- Authority
- CN
- China
- Prior art keywords
- model
- data collection
- recognition result
- deep learning
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种基于深度学习的电话机器人语音识别结果校正方法,基于历史语音数据集得到拼音语句文本数据集Sp和正确的语句文本样本集Sc,采用深度学习建立校正模型,建立校正模型包括基于一个多头注意力模型和前馈神经网络的encoder部分构建和基于堆叠的两个多头注意力模型和前馈神经网络的decoder部分构建,基于正确的语句文本样本集Sc对建立的校正模型进行训练,将需要校正的语音识别结果经向量化过程处理后输入训练好的校正模型,得到校正后的文本。本发明充分利用历史录音数据资源,训练语音识别结果校正模型,对不安静环境和多种不同说话方式、发音准确度、收音能力等语音识别精度低情况的高效语音识别校正。
Description
技术领域
本发明属于语音识别技术领域,具体涉及基于深度学习的电话机器人语音识别结果校正方法。
背景技术
随着以客户为主导的市场的形成,以及电话的普及,越来越多的企业开始采用外呼系统来扩大和维护客户,增加企业效益。通过外呼系统与客户建立良好的沟通桥梁,了解客户情况、意见及需求,主动向客户宣传公司新政策、新优惠、推荐新业务,及时对新入网客户就服务态度、产品质量、使用情况等进行回访,在外拨回访的过程中达到保留客户及扩大客户数量的目的。
传统的外呼系统一般采用信息系统进行呼叫处理、控制、分配坐席终端,最终由人工坐席完成呼叫。这种方法有利于处理复杂多变的用户需求,可以获得较高的外呼效果。但是由于人力成本逐年增高,外呼成本也逐渐增高,并且随着外呼业务的扩展,合格的坐席人员也越来越紧缺。
智能电话机器人是解决上述问题的一个较好选项,电话机器人一般包括语音识别、意图识别、对话管理等模块,其中语音识别能力是电话机器人的基础,只有正确识别出客户所说的话语,才能进一步做意图识别、对话,从而驱动电话机器人与客户进行交流。
现阶段的语音识别技术,在近场、安静环境下针对比较清晰的普通话语音已经能够达到95%以上的识别精度,但是,对于电话机器人来说,接电话的客户大多会处于并不安静的环境,并且每个人的说话方式、发音准确度、手机的收音能力等等的区别,导致语音识别精度急剧下降,经常会出现一些不着边际的识别结果。这种情况下,电话机器人就无法正确识别客户的意图,无法返回正确的回答。
发明内容
本发明的目的在于:解决目前语音识别技术对于并不安静的环境和多种不同的说话方式、发音准确度、收音能力等情况存在语音识别精度急剧下降,识别结果不准确的问题,提出了一种基于深度学习的电话机器人语音识别结果校正方法。
本发明采用的技术方案如下:
基于深度学习的电话机器人语音识别结果校正方法,方法步骤如下:
步骤1、将对历史语音数据集语音识别得到的语句文本数据集S转换得到拼音语句文本数据集Sp,并对语句文本数据集S进行校正,得到正确的语句文本样本集Sc;
步骤2、采用深度学习建立校正模型,建立校正模型的步骤如下:
步骤2.1、校正模型的encoder部分构建:建立拼音词典,利用拼音词典将步骤1中所得拼音语句文本数据集Sp进行编码,得到输入样本So,对So进行词嵌入训练和位置编码,将所得位置编码与嵌入矩阵相加,得到输入样本集Si,将输入样本集Si输入多头注意力模型,将多头注意力模型的输出送入前馈神经网络,最终输出特征矩阵Sf,完成校正模型的encoder部分构建;
步骤2.2、校正模型的decoder部分构建:建立汉字词典,基于汉字词典采用与步骤2.1中由拼音语句文本数据集Sp得到输入样本集Si相同的处理方法来处理语句文本样本集Sc得到加有位置编码的标签的嵌入矩阵,使用两个堆叠的多头注意力模型,将加有位置编码的标签的嵌入矩阵作为第一个多头注意力模型的输入,将第一个多头注意力模型的输出和步骤2.1得到的输出Sf共同作为第二个多头注意力模型的输入,将堆叠后的多头注意力模型的输出送入前馈神经网络,将前馈神经网络的输出作为softmax函数的输入,输出一个概率,取概率最大者为预测结果,查找词典得到校正后的文本,完成校正模型的decoder部分构建:
步骤3、将正确的语句文本样本集Sc进行编码,得到输入样本Sohz,对Sohz进行词嵌入训练,得到标签的嵌入矩阵Sehz,将输入样本集Si作为输入,Sehz作为输出,训练步骤2得到的校正模型,得到训练好的校正模型。
步骤4、将需要校正的语音识别结果采用步骤2中的输入模型数据的处理方法进行向量化处理后输入训练好的校正模型,得到校正后的文本。
进一步,所述步骤1中历史语音数据集获得时,先将历史语音数据进行包括清洗和剪辑的预处理。
进一步,所述语句文本数据集S转换得到拼音语句文本数据集Sp的过程如下:先创建汉字-语音对照表,再利用二分法查找获取每个汉字对应的拼音,根据得到的每个汉字对应拼音的结果将语句文本数据集S转换为拼音语句文本数据集Sp。
进一步,所述步骤2.1中对输入样本So中的文字进行位置编码是采用正弦与余弦函数进行位置编码,公式如下:
PE(pos,2i)=sin(pos/100002i/dm)
PE(pos,2i+1)=cos(pos/100002i/dm)
其中:pos是文字所处位置,i是维度。
进一步,所述步骤2.2中概率最大者是采用贪心算法得到的。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1、本发明中,采用深度学习模型,充分利用历史录音数据资源,训练语音识别结果校正模型。以拼音语句文本数据集Sp和校正后的语句文本样本集Sc来构建校正模型,语音识别有个特点,识别出来的结果文字可能不一样,但是发音会类似,所以利用这特点将识别结果先转拼音,而标签对应的是正确的文字,通过拼音和标签对应文字来建立的校正模型能够快速准确地得到校正的结果。此种序列对序列的模型,采用其它非深度学习的方法需要非常复杂的方法,计算复杂度高,不实用,所以采用了基于深度学习的方法,能高效地实现模型。本发明可以适用于并不安静的环境和多种不同的说话方式、发音准确度、收音能力等语音识别精度急剧下降情况的语音识别校正,校正的准确率远远高于目前一些其它简单校正的方法,能够可以有效帮助电话机器人在外呼、客户服务等场景中能快速、精准地回答客户的业务问题。
2、本发明中,历史语音数据集获得时,可先对历史语音数据进行包括清洗和剪辑的预处理,再将音频文件格式转换为语音识别引擎所需的格式来获得语音数据集A,预处理可减少无效语音时长,提高后面数据处理的效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明校正方法流程示意图;
图2为本发明校正模型架构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以下结合实施例对本发明的特征和性能作进一步的详细描述。
实施例1
本发明较佳实施例提供的基于深度学习的电话机器人语音识别结果校正方法,如图1流程图所示,方法步骤如下:
步骤1、将对历史语音数据集语音识别得到的语句文本数据集S转换得到拼音语句文本数据集Sp,并对语句文本数据集S进行校正,得到正确的语句文本样本集Sc。具体过程如下:
步骤1.1、历史语音数据集获得时,可先对历史语音数据进行包括清洗和剪辑的预处理,再将音频文件格式转换为语音识别引擎所需的格式来获得语音数据集A,预处理可减少无效语音时长,提高后面数据处理的效率。
步骤1.2、将处理后的音频文件送入语音识别引擎,语音识别引擎返回所识别到的文本结果,并对这些文本进行断句处理,形成语句文本数据集:
S={s1,s2,s3,…sm},
其中,s为一个语句样本,其中包含了若干个汉字,m为样本数量。
步骤1.3、
步骤1.3.1:创建汉字-拼音对照表;
步骤1.3.2:利用二分法查找,获取每个汉字对应的拼音;
步骤1.3.3:将步骤二中所得的汉字语句文本数据集转换为拼音语句文本数据集:
Sp={sp1,sp2,sp3,…spm}。
步骤1.4、针对获得的语句文本数据集S,进行人工校正,获得正确的文本样本集Sc:
Sc={sc1,sc2,sc3,…scm}。
步骤2、采用深度学习建立校正模型,优选的,这里采用transformer模型,包括结构相同的encoder与decoder两个部分,模型架构如图1所示,也可采用其它能达到等同效果的模型。建立校正模型的步骤如下:
步骤2.1、校正模型的encoder部分(即输入部分)构建:
步骤2.1.1、词典创建:将所有拼音按照字母顺序排列,形成拼音词典DICT,共n行。
步骤2.1.2、利用DICT,将步骤1中所得拼音语句文本数据集Sp进行Onehot编码(一般都采用Onehot编码进行处理),得到输入样本So:
So={so1,so2,so3,…som}
其中每个样本为n×(句子字数)的稀疏矩阵。
步骤2.1.3、利用word2vec(或者等同替代的elmo、bert一类模型)对So进行词嵌入训练,得到输入样本的嵌入矩阵Se:
Se={se1,se2,se3,…sem},
其中,嵌入维度为dm。
步骤2.1.4、对输入样本So中的文字进行位置编码,利用正弦与余弦函数进行位置编码,公式如下:
PE(pos,2i)=sin(pos/100002i/dm)
PE(pos,2i+1)=cos(pos/100002i/dm)
其中:pos是文字所处位置,i是维度。
获得位置编码后,将位置编码与嵌入矩阵Se相加,得到输入样本集Si:
Si={si1,si2,si3,…sim}。
步骤2.1.5、将输入样本集Si输入多头注意力模型,其中,注意力模型如下所示
其中Q,K,V分别为query,keys,values矩阵,dk为注意力的维度,KT为K的转置。
多头注意力模型此处采用如下表示:
MultiHead(Q,K,V)=Concat(head1,...,headh)
其中
步骤2.1.6、再将多头注意力模型的输出送入前馈神经网络:
FFN(x)=max(0,xW1+b1)W2+b2
其中W,b分别为神经元的权重与偏移。
最终输出一个特征矩阵Sf,完成校正模型的encoder部分构建;
步骤2.2、校正模型的decoder部分(即输出部分)构建:
采用与步骤2.1中由拼音语句文本数据集Sp得到输入样本集Si相同的处理过程(即步骤2.1.1-步骤2.1.4的处理过程,先创建汉字词典,利用词典对Sc进行Onehot编码,对编码得到的结果进行词嵌入训练,和进行位置编码,将得到的位置编码和标签的嵌入矩阵相加)来处理语句文本样本集Sc得到加有位置编码的标签的嵌入矩阵,使用两个堆叠的多头注意力模型,将加有位置编码的标签的嵌入矩阵作为第一个多头注意力模型的输入,将第一个多头注意力模型的输出和步骤2.1得到的输出Sf共同作为第二个多头注意力模型的输入,将堆叠后的多头注意力模型的输出送入前馈神经网络,将前馈神经网络的输出作为softmax函数的输入,最终输出一个概率,取概率最大者为预测结果,通过查找词典,即可得到对应的文字,完成校正模型的decoder部分构建。
进一步,所述步骤2.2中概率最大者是采用贪心算法得到的。
步骤3、将正确的语句文本样本集Sc进行Onehot编码,得到输入样本Sohz,对Sohz进行词嵌入训练,得到标签的(这个标签指的是,这个Sc是人工校正的结果,作为有监督训练的label)嵌入矩阵Sehz,将输入样本集Si作为输入,Sehz作为输出,训练步骤2得到的校正模型,得到训练好的校正模型。其具体过程如下:
步骤3.1:创建标签序列
步骤3.1.1:词典创建
创建汉字词典DICThz,共nhz行
步骤3.1.2:Onehot编码
利用DICT,将所得Sc进行Onehot编码,可得输入样本:
Sohz={sohz1,sohz2,sohz3,…sohzm},
其中每个样本为nhz×(句子字数)的稀疏矩阵。
步骤3.2:标签序列词嵌入
利用word2vec对所得稀疏矩阵Sohz进行词嵌入训练,可得到标签的嵌入矩阵
Sehz={sehz1,sehz2,sehz3,…sehzm},
其中,嵌入维度为dmhz。
步骤3.3:训练
利用所得Si作为输入,所得Sehz作为输出,以交叉熵函数作为损失函数训练步骤2得到的校正模型,得到足够的评估精度后,可结束训练,并保存训练好的校正模型。
步骤4、将需要校正的语音识别结果采用步骤2中的输入模型数据的处理方法进行向量化处理后输入训练好的校正模型,得到校正后的文本。
本发明中,采用深度学习模型,充分利用历史录音数据资源,训练语音识别结果校正模型,使电话机器人能够准确识别客户的意图,以返回正确的应答。以拼音语句文本数据集Sp和校正后的语句文本样本集Sc来构建校正模型,语音识别有个特点,识别出来的结果文字可能不一样,但是发音会类似,所以用这特点将识别得到结果先转拼音,而标签对应的是正确的文字,能够快速准确地得到校正的结果,适用于并不安静的环境和多种不同的说话方式、发音准确度、收音能力等语音识别精度急剧下降情况的语音识别校正,校正的准确率远远高于目前一些其它简单校正的方法,能够可以有效帮助电话机器人在外呼、客户服务等场景中能快速、精准地回答客户的业务问题。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于深度学习的电话机器人语音识别结果校正方法,其特征在于:方法步骤如下:
步骤1、将对历史语音数据集语音识别得到的语句文本数据集S转换得到拼音语句文本数据集Sp,并对语句文本数据集S进行校正,得到正确的语句文本样本集Sc;
步骤2、采用深度学习建立校正模型,建立校正模型的步骤如下:
步骤2.1、校正模型的encoder部分构建:建立拼音词典,利用拼音词典将步骤1中所得拼音语句文本数据集Sp进行编码,得到输入样本So,对So进行词嵌入训练和位置编码,将所得位置编码与嵌入矩阵相加,得到输入样本集Si,将输入样本集si作为输入多头注意力模型,将多头注意力模型的输出送入前馈神经网络,最终输出特征矩阵Sf,完成校正模型的encoder部分构建;
步骤2.2、校正模型的decoder部分构建:建立汉字词典,基于汉字词典采用与步骤2.1中由拼音语句文本数据集Sp得到输入样本集Si相同的处理方法来处理语句文本样本集Sc得到加有位置编码的标签的嵌入矩阵,使用两个堆叠的多头注意力模型,将加有位置编码的标签的嵌入矩阵作为第一个多头注意力模型的输入,将第一个多头注意力模型的输出和步骤2.1得到的输出Sf共同作为第二个多头注意力模型的输入,将堆叠后的多头注意力模型的输出送入前馈神经网络,将前馈神经网络的输出作为softmax函数的输入,输出一个概率,取概率最大者为预测结果,查找词典得到校正后的文本,完成校正模型的decoder部分构建;
步骤3、将正确的语句文本样本集Sc进行编码,得到输入样本Sohz,对Sohz进行词嵌入训练,得到标签的嵌入矩阵Sehz,将输入样本集Si作为输入,Sehz作为输出,训练步骤2得到的校正模型,得到训练好的校正模型;
步骤4、将需要校正的语音识别结果采用步骤2中的输入模型数据处理方法进行向量化处理后输入训练好的校正模型,得到校正后的文本。
2.根据权利要求1所述的基于深度学习的电话机器人语音识别结果校正方法,其特征在于:所述步骤1中历史语音数据集获得时,先将历史语音数据进行包括清洗和剪辑的预处理。
3.根据权利要求1所述的基于深度学习的电话机器人语音识别结果校正方法,其特征在于:所述语句文本数据集S转换得到拼音语句文本数据集Sp的过程如下:先创建汉字-语音对照表,再利用二分法查找获取每个汉字对应的拼音,根据得到的每个汉字对应拼音的结果将语句文本数据集S转换为拼音语句文本数据集Sp。
4.根据权利要求1所述的基于深度学习的电话机器人语音识别结果校正方法,其特征在于:所述步骤2.1中对输入样本So中的文字进行位置编码是采用正弦与余弦函数进行位置编码,公式如下:
PE(pos,2i)=sin(pos/100002i/dm)
PE(pos,2i+1)=cos(pos/100002i/dm)
其中:pos是文字所处位置,i是维度。
5.根据权利要求1所述的基于深度学习的电话机器人语音识别结果校正方法,其特征在于:所述步骤2.2中概率最大者是采用贪心算法得到的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910125823.XA CN109859760A (zh) | 2019-02-19 | 2019-02-19 | 基于深度学习的电话机器人语音识别结果校正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910125823.XA CN109859760A (zh) | 2019-02-19 | 2019-02-19 | 基于深度学习的电话机器人语音识别结果校正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109859760A true CN109859760A (zh) | 2019-06-07 |
Family
ID=66898391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910125823.XA Pending CN109859760A (zh) | 2019-02-19 | 2019-02-19 | 基于深度学习的电话机器人语音识别结果校正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109859760A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110288980A (zh) * | 2019-06-17 | 2019-09-27 | 平安科技(深圳)有限公司 | 语音识别方法、模型的训练方法、装置、设备及存储介质 |
CN110321961A (zh) * | 2019-07-09 | 2019-10-11 | 北京金山数字娱乐科技有限公司 | 一种数据处理方法及装置 |
CN110598671A (zh) * | 2019-09-23 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 基于文本的虚拟形象行为控制方法、设备和介质 |
CN110600059A (zh) * | 2019-09-05 | 2019-12-20 | Oppo广东移动通信有限公司 | 声学事件检测方法、装置、电子设备及存储介质 |
CN110705218A (zh) * | 2019-10-11 | 2020-01-17 | 浙江百应科技有限公司 | 一种基于深度学习的外呼状态识别方式 |
CN110728145A (zh) * | 2019-10-11 | 2020-01-24 | 集奥聚合(北京)人工智能科技有限公司 | 一种基于录音对话的自然语言理解模型的建立方法 |
CN110728153A (zh) * | 2019-10-15 | 2020-01-24 | 天津理工大学 | 基于模型融合的多类别情感分类方法 |
CN110765772A (zh) * | 2019-10-12 | 2020-02-07 | 北京工商大学 | 拼音作为特征的中文语音识别后的文本神经网络纠错模型 |
CN111079416A (zh) * | 2019-12-03 | 2020-04-28 | 河海大学常州校区 | 基于共享控制门结构的中文文本校正方法 |
CN111091004A (zh) * | 2019-12-18 | 2020-05-01 | 上海风秩科技有限公司 | 一种语句实体标注模型的训练方法、训练装置及电子设备 |
CN111145728A (zh) * | 2019-12-05 | 2020-05-12 | 厦门快商通科技股份有限公司 | 语音识别模型训练方法、系统、移动终端及存储介质 |
CN111783477A (zh) * | 2020-05-13 | 2020-10-16 | 厦门快商通科技股份有限公司 | 一种语音翻译方法及系统 |
CN111916064A (zh) * | 2020-08-10 | 2020-11-10 | 北京睿科伦智能科技有限公司 | 一种端到端的神经网络语音识别模型的训练方法 |
CN112489632A (zh) * | 2019-09-11 | 2021-03-12 | 甲骨文国际公司 | 实施校正模型以减少自动语音识别错误的传播 |
CN112786014A (zh) * | 2019-10-23 | 2021-05-11 | 北京京东振世信息技术有限公司 | 一种识别数据的方法和装置 |
CN112949637A (zh) * | 2021-05-14 | 2021-06-11 | 中南大学 | 基于idcnn和注意力机制的招投标文本实体识别方法 |
CN112966496A (zh) * | 2021-05-19 | 2021-06-15 | 灯塔财经信息有限公司 | 一种基于拼音特征表征的中文纠错方法及系统 |
CN113378553A (zh) * | 2021-04-21 | 2021-09-10 | 广州博冠信息科技有限公司 | 文本处理方法、装置、电子设备和存储介质 |
CN114993677A (zh) * | 2022-05-11 | 2022-09-02 | 山东大学 | 不平衡小样本数据的滚动轴承故障诊断方法及系统 |
WO2023082931A1 (zh) * | 2021-11-11 | 2023-05-19 | 北京有竹居网络技术有限公司 | 用于语音识别标点恢复的方法、设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6058145A (en) * | 1996-12-24 | 2000-05-02 | Sharp Kabushiki Kaisha | Method of demodulating a multi-frequency quadrature modulated signal |
CN106126507A (zh) * | 2016-06-22 | 2016-11-16 | 哈尔滨工业大学深圳研究生院 | 一种基于字符编码的深度神经翻译方法及系统 |
CN107977356A (zh) * | 2017-11-21 | 2018-05-01 | 新疆科大讯飞信息科技有限责任公司 | 识别文本纠错方法及装置 |
CN109003608A (zh) * | 2018-08-07 | 2018-12-14 | 北京东土科技股份有限公司 | 庭审控制方法、系统、计算机设备及存储介质 |
-
2019
- 2019-02-19 CN CN201910125823.XA patent/CN109859760A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6058145A (en) * | 1996-12-24 | 2000-05-02 | Sharp Kabushiki Kaisha | Method of demodulating a multi-frequency quadrature modulated signal |
CN106126507A (zh) * | 2016-06-22 | 2016-11-16 | 哈尔滨工业大学深圳研究生院 | 一种基于字符编码的深度神经翻译方法及系统 |
CN107977356A (zh) * | 2017-11-21 | 2018-05-01 | 新疆科大讯飞信息科技有限责任公司 | 识别文本纠错方法及装置 |
CN109003608A (zh) * | 2018-08-07 | 2018-12-14 | 北京东土科技股份有限公司 | 庭审控制方法、系统、计算机设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
ANDREJ ZUKOV-GREGORIC ET AL.: "Neural Named Entity Recognition Using a Self-Attention Mechanism", 《2017 IEEE 29TH INTERNATIONAL CONFERENCE ON TOOLS WITH ARTIFICIAL INTELLIGENCE (ICTAI)》 * |
ASHISH VASWANI ET AL.: "Attention Is All You need", 《CORNELL UNIVERSITY 下载链接HTTPS://ARXIV.ORG/ABS/1706.03762》 * |
LIN DONG ET AL.: "Speech-Transformer: A No-Recurrence Sequence-to-Sequence Model for Speech Recognition", 《2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》 * |
YANGDELONG: "详解Transformer(Attention Is ALL You need)", 《CSDN博客HTTPS://BLOG.CSDN.NET/YANGDELONG/ARTICLE/DETAILS/85071072》 * |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020253060A1 (zh) * | 2019-06-17 | 2020-12-24 | 平安科技(深圳)有限公司 | 语音识别方法、模型的训练方法、装置、设备及存储介质 |
CN110288980A (zh) * | 2019-06-17 | 2019-09-27 | 平安科技(深圳)有限公司 | 语音识别方法、模型的训练方法、装置、设备及存储介质 |
CN110321961A (zh) * | 2019-07-09 | 2019-10-11 | 北京金山数字娱乐科技有限公司 | 一种数据处理方法及装置 |
CN110600059A (zh) * | 2019-09-05 | 2019-12-20 | Oppo广东移动通信有限公司 | 声学事件检测方法、装置、电子设备及存储介质 |
CN110600059B (zh) * | 2019-09-05 | 2022-03-15 | Oppo广东移动通信有限公司 | 声学事件检测方法、装置、电子设备及存储介质 |
CN112489632B (zh) * | 2019-09-11 | 2024-04-05 | 甲骨文国际公司 | 实施校正模型以减少自动语音识别错误的传播 |
CN112489632A (zh) * | 2019-09-11 | 2021-03-12 | 甲骨文国际公司 | 实施校正模型以减少自动语音识别错误的传播 |
CN110598671A (zh) * | 2019-09-23 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 基于文本的虚拟形象行为控制方法、设备和介质 |
CN110598671B (zh) * | 2019-09-23 | 2022-09-27 | 腾讯科技(深圳)有限公司 | 基于文本的虚拟形象行为控制方法、设备和介质 |
CN110705218A (zh) * | 2019-10-11 | 2020-01-17 | 浙江百应科技有限公司 | 一种基于深度学习的外呼状态识别方式 |
CN110728145A (zh) * | 2019-10-11 | 2020-01-24 | 集奥聚合(北京)人工智能科技有限公司 | 一种基于录音对话的自然语言理解模型的建立方法 |
CN110728145B (zh) * | 2019-10-11 | 2023-08-29 | 集奥聚合(北京)人工智能科技有限公司 | 一种基于录音对话的自然语言理解模型的建立方法 |
CN110765772A (zh) * | 2019-10-12 | 2020-02-07 | 北京工商大学 | 拼音作为特征的中文语音识别后的文本神经网络纠错模型 |
CN110728153A (zh) * | 2019-10-15 | 2020-01-24 | 天津理工大学 | 基于模型融合的多类别情感分类方法 |
CN112786014A (zh) * | 2019-10-23 | 2021-05-11 | 北京京东振世信息技术有限公司 | 一种识别数据的方法和装置 |
CN111079416A (zh) * | 2019-12-03 | 2020-04-28 | 河海大学常州校区 | 基于共享控制门结构的中文文本校正方法 |
CN111079416B (zh) * | 2019-12-03 | 2024-02-02 | 河海大学常州校区 | 基于共享控制门结构的中文文本校正方法 |
CN111145728B (zh) * | 2019-12-05 | 2022-10-28 | 厦门快商通科技股份有限公司 | 语音识别模型训练方法、系统、移动终端及存储介质 |
CN111145728A (zh) * | 2019-12-05 | 2020-05-12 | 厦门快商通科技股份有限公司 | 语音识别模型训练方法、系统、移动终端及存储介质 |
CN111091004A (zh) * | 2019-12-18 | 2020-05-01 | 上海风秩科技有限公司 | 一种语句实体标注模型的训练方法、训练装置及电子设备 |
CN111091004B (zh) * | 2019-12-18 | 2023-08-25 | 上海风秩科技有限公司 | 一种语句实体标注模型的训练方法、训练装置及电子设备 |
CN111783477A (zh) * | 2020-05-13 | 2020-10-16 | 厦门快商通科技股份有限公司 | 一种语音翻译方法及系统 |
CN111783477B (zh) * | 2020-05-13 | 2023-08-22 | 厦门快商通科技股份有限公司 | 一种语音翻译方法及系统 |
CN111916064A (zh) * | 2020-08-10 | 2020-11-10 | 北京睿科伦智能科技有限公司 | 一种端到端的神经网络语音识别模型的训练方法 |
CN113378553A (zh) * | 2021-04-21 | 2021-09-10 | 广州博冠信息科技有限公司 | 文本处理方法、装置、电子设备和存储介质 |
CN112949637A (zh) * | 2021-05-14 | 2021-06-11 | 中南大学 | 基于idcnn和注意力机制的招投标文本实体识别方法 |
CN112966496A (zh) * | 2021-05-19 | 2021-06-15 | 灯塔财经信息有限公司 | 一种基于拼音特征表征的中文纠错方法及系统 |
CN112966496B (zh) * | 2021-05-19 | 2021-09-14 | 灯塔财经信息有限公司 | 一种基于拼音特征表征的中文纠错方法及系统 |
WO2023082931A1 (zh) * | 2021-11-11 | 2023-05-19 | 北京有竹居网络技术有限公司 | 用于语音识别标点恢复的方法、设备和存储介质 |
CN114993677A (zh) * | 2022-05-11 | 2022-09-02 | 山东大学 | 不平衡小样本数据的滚动轴承故障诊断方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109859760A (zh) | 基于深度学习的电话机器人语音识别结果校正方法 | |
CN110472688A (zh) | 图像描述的方法及装置、图像描述模型的训练方法及装置 | |
CN107818164A (zh) | 一种智能问答方法及其系统 | |
CN112818691A (zh) | 命名实体识别模型训练方法及装置 | |
CN109979429A (zh) | 一种tts的方法及系统 | |
CN112000791A (zh) | 一种电机故障知识抽取系统及方法 | |
CN110781663B (zh) | 文本分析模型的训练方法及装置、文本分析方法及装置 | |
CN110413783B (zh) | 一种基于注意力机制的司法文本分类方法及系统 | |
CN114116994A (zh) | 一种迎宾机器人对话方法 | |
CN104462600A (zh) | 实现来电原因自动分类的方法及装置 | |
CN111858932A (zh) | 基于Transformer的多重特征中英文情感分类方法及系统 | |
CN110321564B (zh) | 一种多轮对话意图识别方法 | |
CN105354199A (zh) | 一种基于场景信息的实体含义识别方法和系统 | |
CN110781672A (zh) | 基于机器智能的题库生产方法及系统 | |
CN110266900A (zh) | 客户意图的识别方法、装置及客服系统 | |
CN111783423A (zh) | 解题模型的训练方法及装置、解题方法及装置 | |
CN115858758A (zh) | 一种多非结构化数据识别的智慧客服知识图谱系统 | |
CN116166688A (zh) | 基于自然语言交互的业务数据检索方法、系统及处理设备 | |
CN111553157A (zh) | 一种基于实体替换的对话意图识别方法 | |
CN113935331A (zh) | 异常语义截断检测方法、装置、设备及介质 | |
CN114003700A (zh) | 一种对话信息的处理方法、系统、电子设备及存储介质 | |
Deschamps-Berger et al. | Exploring attention mechanisms for multimodal emotion recognition in an emergency call center corpus | |
CN113326367A (zh) | 基于端到端文本生成的任务型对话方法和系统 | |
CN116204643A (zh) | 一种基于多任务学习知识增强的级联标签分类方法 | |
CN115934904A (zh) | 文本处理方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20220128 |
|
AD01 | Patent right deemed abandoned |