CN109872715A - 一种语音交互方法及装置 - Google Patents
一种语音交互方法及装置 Download PDFInfo
- Publication number
- CN109872715A CN109872715A CN201910157416.7A CN201910157416A CN109872715A CN 109872715 A CN109872715 A CN 109872715A CN 201910157416 A CN201910157416 A CN 201910157416A CN 109872715 A CN109872715 A CN 109872715A
- Authority
- CN
- China
- Prior art keywords
- word
- result
- decoding result
- group
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明涉及语音识别技术领域,公开了一种语音交互方法及装置,该方法包括:通过解码器解码音频信号,获得解码结果生成图;从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;根据所述置信度对对应的解码结果词进行过滤;对过滤后的解码结果词进行组词,并通过组词结果进行控制;通过置信度阈值过滤等方式降低了命令词误识别的概率,提高了组合命令词的准确率,提升了人机命令词的交互体验。
Description
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音交互方法及装置。
背景技术
目前由于深度学习技术的发展,使得语音识别结果的准确度越来越高,类似智能音箱的各种产品受到市场的广泛关注,智能音箱等产品采集用户语音上传至云端服务器,利用服务器的资源进行快速解码,获得语音识别结果。在嵌入式平台上,受限于处理器性能、内存资源的影响,本地离线大词汇量连续语音识别难以实现;在有限命令词的情况下,人机命令词交互性体验差。
发明内容
本发明的主要目的在于提出一种语音交互方法及装置,通过置信度阈值过滤等方式降低了命令词误识别的概率,提高了组合命令词的准确率,提升了人机命令词的交互体验。
为实现上述目的,本发明提供的一种语音交互方法,包括:
通过解码器解码音频信号,获得解码结果生成图;
从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;
根据所述置信度对对应的解码结果词进行过滤;
对过滤后的解码结果词进行组词,并通过组词结果进行控制。
可选地,所述通过解码器解码音频信号,获得解码结果生成图之前还包括:
对解码器进行初始化,设置应用场景,并加载场景词id重映射表、词与词的关联关系表及输出结果表。
可选地,所述根据所述置信度对对应的解码结果词进行过滤包括:
根据所述场景词id重映射表判断所述解码结果词是否为填充词,若是则删除所述解码结果词;
否则,判断所述解码结果词的置信度是否大于预设的置信度阈值,若是,则保留所述解码结果词作为命令词。
可选地,所述对过滤后的解码结果词进行组词,并通过组词结果进行控制包括:
根据所述词与词的关联关系表对过滤后的解码结果词进行组词,并得到组词结果;
判断所述组词结果是否为快捷控制命令词,若是,则进行快捷控制;
否则,所述组词结果为唤醒词,进行唤醒操作。
可选地,所述进行快捷控制之前还包括:
对所述组词结果进行动名词互换操作。
作为本发明的另一方面,提供的一种语音交互装置,包括:
解码模块,用于通过解码器解码音频信号,获得解码结果生成图;
置信度获取模块,用于从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;
过滤模块,用于根据所述置信度对对应的解码结果词进行过滤;
组词控制模块,用于对过滤后的解码结果词进行组词,并通过组词结果进行控制。
可选地,还包括:
初始化模块,用于对解码器进行初始化,设置应用场景,并加载场景词id重映射表、词与词的关联关系表及输出结果表。
可选地,所述过滤模块包括:
命令判断单元,用于根据所述场景词id重映射表判断所述解码结果词是否为填充词,若是则删除所述解码结果词;
阈值判断单元,用于当所述解码结果词为命令词时,判断所述解码结果词的置信度是否大于预设的置信度阈值,若是,则保留所述解码结果词作为命令词。
可选地,所述组词控制模块包括:
组词单元,用于根据所述词与词的关联关系表对过滤后的解码结果词进行组词,并得到组词结果;
控制单元,用于判断所述组词结果是否为快捷控制命令词,若是,则进行快捷控制;
唤醒单元,用于当所述组词结果为唤醒词时,进行唤醒操作。
可选地,所述组词控制模块还包括:
互换单元,用于对所述组词结果进行动名词互换操作。
本发明提出的一种语音交互方法及装置,该方法包括:通过解码器解码音频信号,获得解码结果生成图;从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;根据所述置信度对对应的解码结果词进行过滤;对过滤后的解码结果词进行组词,并通过组词结果进行控制;通过置信度阈值过滤等方式降低了命令词误识别的概率,提高了组合命令词的准确率,提升了人机命令词的交互体验。
附图说明
图1为本发明实施例一提供的一种语音交互方法的流程图;
图2为本发明实施例一提供的另一种语音交互方法的流程图;
图3为图1中步骤S30的方法流程图;
图4为本发明实施例二提供的一种语音交互装置的示范性结构框图;
图5为本发明实施例二提供的另一种语音交互装置的示范性结构框图;
图6为图4中过滤模块的示范性结构框图;
图7为图4中组词控制模块的一种示范性结构框图;
图8为图4中组词控制模块的另一种示范性结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。
实施例一
如图1所示,在本实施例中,一种语音交互方法,包括:
S10、通过解码器解码音频信号,获得解码结果生成图;
S20、从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;
S30、根据所述置信度对对应的解码结果词进行过滤;
S40、对过滤后的解码结果词进行组词,并通过组词结果进行控制。
在本实施例中,通过置信度阈值过滤等方式降低了命令词误识别的概率,提高了组合命令词的准确率,提升了人机命令词的交互体验。
在本实施例中,在解码前还需要对语音识别模型进行训练,对发音字典中的命令词进行拆分并添加部分填充词,训练得到分词的模型,其中,填充词为非命令词,用于降低误识别率,提升交互的准确性。
如图2所示,在本实施例中,所述步骤S10之前还包括:
S01、对解码器进行初始化,设置应用场景,并加载场景词id重映射表、词与词的关联关系表及输出结果表。
在本实施例中,应用场景为空调、微波炉、灯、网关等,不同应用场景拥有不同的控制命令词。场景选定后,其他场景的命令词被当作填充词看待。
在本实施例中,场景词id重映射表:因模型训练时,加入一些填充词,会导致每次训练后词的id发生变化,例如某次训练词“打开”在模型中的id是m,另外一次训练词“打开”会变成另外一个整数n;为了消除每次训练生成的模型中词的id不固定问题,需要重新映射到一个新的固定的id上。
在本实施例中,词与词的关联关系表:利用以上重新映射的id值,配置词与词的关联关系表,此表包含五个属性,分别为命令词映射后的id、词类型、自定义置信度阈值、关联关系、特殊关联关系,具体的说明如下:
词类型:用于区分命令词的类型。类型1代表未拆分的命令词,如“打开空调”;类型2代表有关联关系的拆分词,如“打开”、“关闭”;类型3代表一种特殊词,它本身是一个命令词或者可以组成命令词,但在解码序列中检出它之后,并不一定是解码结果,如“电加热关闭”,“电加热”本身是一个命令词,但是还需要检查后续是否存在动词“关闭”,否则会执行相反的控制操作;
自定义置信度阈值:用于调整每个拆分后的命令词的置信度阈值,使得整个系统的打分机制更加灵活,在一定程度上可以控制误识别率;
关联关系:用于存放与当前词有关联的词的id,比如当前词为“打开”,与之相关联的词有“灯”、“台灯”“书房灯”等等;
特殊关联关系:若词类型为3,当前词是拆分词,首先该词需要与关联关系表中的词进行组合,组合后的词属于命令词,此时在解码序列中检出它之后,并不一定是解码结果,例如“睡眠模式关闭”,当前词为“睡眠”,关联关系词为“模式”,如果组合成“睡眠模式”,会执行错误的控制操作,所以还需要检查后续解码序列中是否存在特殊关联关系词“关闭”。
在本实施例中,输出结果表:包括命令词,播放的语音路径及控制码。
如图3所示,在本实施例中,所述步骤S30包括:
S31、根据所述场景词id重映射表判断所述解码结果词是否为填充词,若是则S32、删除所述解码结果词;
否则,S33、判断所述解码结果词的置信度是否大于预设的置信度阈值,若是,则S34、保留所述解码结果词作为命令词;
否则,进入步骤S32、删除所述解码结果词。
在本实施例中,所述步骤S40包括:
根据所述词与词的关联关系表对过滤后的解码结果词进行组词,并得到组词结果;
判断所述组词结果是否为快捷控制命令词,若是,则进行快捷控制;
否则,所述组词结果为唤醒词,进行唤醒操作。
在本实施例中,循环过滤后的解码序列,在词与词的关联关系表中查询当前序列的信息(该词的自定义置信度阈值和关联词),利用自定义置信度阈值进一步过滤解码结果。如果该词大于阈值,则查询下一个解码序列(阈值检查)是否在其关联词中,若在,则当前词与下一个解码词进行组合;若不在,为了防止其他人声误识别带来的影响,还需再检查再下一个解码词;若还不在,循环索引加1并重复以上操作。
在本实施例中,所述快捷控制命令词为唤醒词+控制命令词的组合。
在本实施例中,所述进行快捷控制之前还包括:
对所述组词结果进行动名词互换操作。
在本实施例中,为了提升交互的灵活性,控制命令词会出现名词在前,动词在后的情况。举例:“请打开空调”,“请把空调打开”,同样的控制命令“打开空调”,出现了两种组合形式,所以需要对组词结果进行是否需要动名词互换的操作,最后在输出结果表中进一步确认。
实施例二
如图4所示,在本实施例中,一种语音交互装置,包括:
解码模块10,用于通过解码器解码音频信号,获得解码结果生成图;
置信度获取模块20,用于从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;
过滤模块30,用于根据所述置信度对对应的解码结果词进行过滤;
组词控制模块40,用于对过滤后的解码结果词进行组词,并通过组词结果进行控制。
在本实施例中,通过置信度阈值过滤等方式降低了命令词误识别的概率,提高了组合命令词的准确率,提升了人机命令词的交互体验。
在本实施例中,在解码前还需要对语音识别模型进行训练,对发音字典中的命令词进行拆分并添加部分填充词,训练得到分词的模型,其中,填充词为非命令词,用于降低误识别率,提升交互的准确性。
如图5所示,在本实施例中,一种语音交互装置还包括:
初始化模块50,用于对解码器进行初始化,设置应用场景,并加载场景词id重映射表、词与词的关联关系表及输出结果表。
在本实施例中,应用场景为空调、微波炉、灯、网关等,不同应用场景拥有不同的控制命令词。场景选定后,其他场景的命令词被当作填充词看待。
在本实施例中,场景词id重映射表:因模型训练时,加入一些填充词,会导致每次训练后词的id发生变化,例如某次训练词“打开”在模型中的id是m,另外一次训练词“打开”会变成另外一个整数n;为了消除每次训练生成的模型中词的id不固定问题,需要重新映射到一个新的固定的id上。
在本实施例中,词与词的关联关系表:利用以上重新映射的id值,配置词与词的关联关系表,此表包含五个属性,分别为命令词映射后的id、词类型、自定义置信度阈值、关联关系、特殊关联关系,具体的说明如下:
词类型:用于区分命令词的类型。类型1代表未拆分的命令词,如“打开空调”;类型2代表有关联关系的拆分词,如“打开”、“关闭”;类型3代表一种特殊词,它本身是一个命令词或者可以组成命令词,但在解码序列中检出它之后,并不一定是解码结果,如“电加热关闭”,“电加热”本身是一个命令词,但是还需要检查后续是否存在动词“关闭”,否则会执行相反的控制操作;
自定义置信度阈值:用于调整每个拆分后的命令词的置信度阈值,使得整个系统的打分机制更加灵活,在一定程度上可以控制误识别率;
关联关系:用于存放与当前词有关联的词的id,比如当前词为“打开”,与之相关联的词有“灯”、“台灯”“书房灯”等等;
特殊关联关系:若词类型为3,当前词是拆分词,首先该词需要与关联关系表中的词进行组合,组合后的词属于命令词,此时在解码序列中检出它之后,并不一定是解码结果,例如“睡眠模式关闭”,当前词为“睡眠”,关联关系词为“模式”,如果组合成“睡眠模式”,会执行错误的控制操作,所以还需要检查后续解码序列中是否存在特殊关联关系词“关闭”。
在本实施例中,输出结果表:包括命令词,播放的语音路径及控制码。
如图6所示,在本实施例中,所述过滤模块包括:
命令判断单元31,用于根据所述场景词id重映射表判断所述解码结果词是否为填充词,若是则删除所述解码结果词;
阈值判断单元32,用于当所述解码结果词为命令词时,判断所述解码结果词的置信度是否大于预设的置信度阈值,若是,则保留所述解码结果词作为命令词。
如图7所示,在本实施例中,所述组词控制模块包括:
组词单元41,用于根据所述词与词的关联关系表对过滤后的解码结果词进行组词,并得到组词结果;
控制单元42,用于判断所述组词结果是否为快捷控制命令词,若是,则进行快捷控制;
唤醒单元43,用于当所述组词结果为唤醒词时,进行唤醒操作。
在本实施例中,循环过滤后的解码序列,在词与词的关联关系表中查询当前序列的信息(该词的自定义置信度阈值和关联词),利用自定义置信度阈值进一步过滤解码结果。如果该词大于阈值,则查询下一个解码序列(阈值检查)是否在其关联词中,若在,则当前词与下一个解码词进行组合;若不在,为了防止其他人声误识别带来的影响,还需再检查再下一个解码词;若还不在,循环索引加1并重复以上操作。
在本实施例中,所述快捷控制命令词为唤醒词+控制命令词的组合。
如图8所示,在本实施例中,所述组词控制模块还包括:
互换单元44,用于对所述组词结果进行动名词互换操作。
在本实施例中,为了提升交互的灵活性,控制命令词会出现名词在前,动词在后的情况。举例:“请打开空调”,“请把空调打开”,同样的控制命令“打开空调”,出现了两种组合形式,所以需要对组词结果进行是否需要动名词互换的操作,最后在输出结果表中进一步确认。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种语音交互方法,其特征在于,包括:
通过解码器解码音频信号,获得解码结果生成图;
从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;
根据所述置信度对对应的解码结果词进行过滤;
对过滤后的解码结果词进行组词,并通过组词结果进行控制。
2.根据权利要求1所述的一种语音交互方法,其特征在于,所述通过解码器解码音频信号,获得解码结果生成图之前还包括:
对解码器进行初始化,设置应用场景,并加载场景词id重映射表、词与词的关联关系表及输出结果表。
3.根据权利要求2所述的一种语音交互方法,其特征在于,根据所述置信度对对应的解码结果词进行过滤包括:
根据所述场景词id重映射表判断所述解码结果词是否为填充词,若是则删除所述解码结果词;
否则,判断所述解码结果词的置信度是否大于预设的置信度阈值,若是,则保留所述解码结果词作为命令词。
4.根据权利要求3所述的一种语音交互方法,其特征在于,所述对过滤后的解码结果词进行组词,并通过组词结果进行控制包括:
根据所述词与词的关联关系表对过滤后的解码结果词进行组词,并得到组词结果;
判断所述组词结果是否为快捷控制命令词,若是,则进行快捷控制;
否则,所述组词结果为唤醒词,进行唤醒操作。
5.根据权利要求4所述的一种语音交互方法,其特征在于,所述进行快捷控制之前还包括:
对所述组词结果进行动名词互换操作。
6.一种语音交互装置,其特征在于,包括:
解码模块,用于通过解码器解码音频信号,获得解码结果生成图;
置信度获取模块,用于从所述解码结果生成图中获取解码结果序列,并获取序列中每个解码结果词的置信度;
过滤模块,用于根据所述置信度对对应的解码结果词进行过滤;
组词控制模块,用于对过滤后的解码结果词进行组词,并通过组词结果进行控制。
7.根据权利要求6所述的一种语音交互装置,其特征在于,还包括:
初始化模块,用于对解码器进行初始化,设置应用场景,并加载场景词id重映射表、词与词的关联关系表及输出结果表。
8.根据权利要求7所述的一种语音交互装置,其特征在于,所述过滤模块包括:
命令判断单元,用于根据所述场景词id重映射表判断所述解码结果词是否为填充词,若是则删除所述解码结果词;
阈值判断单元,用于当所述解码结果词为命令词时,判断所述解码结果词的置信度是否大于预设的置信度阈值,若是,则保留所述解码结果词作为命令词。
9.根据权利要求8所述的一种语音交互装置,其特征在于,所述组词控制模块包括:
组词单元,用于根据所述词与词的关联关系表对过滤后的解码结果词进行组词,并得到组词结果;
控制单元,用于判断所述组词结果是否为快捷控制命令词,若是,则进行快捷控制;
唤醒单元,用于当所述组词结果为唤醒词时,进行唤醒操作。
10.根据权利要求9所述的一种语音交互装置,其特征在于,所述组词控制模块还包括:
互换单元,用于对所述组词结果进行动名词互换操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910157416.7A CN109872715A (zh) | 2019-03-01 | 2019-03-01 | 一种语音交互方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910157416.7A CN109872715A (zh) | 2019-03-01 | 2019-03-01 | 一种语音交互方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109872715A true CN109872715A (zh) | 2019-06-11 |
Family
ID=66919685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910157416.7A Pending CN109872715A (zh) | 2019-03-01 | 2019-03-01 | 一种语音交互方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109872715A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724768A (zh) * | 2020-04-22 | 2020-09-29 | 深圳市伟文无线通讯技术有限公司 | 用于离线语音识别的实时生成解码文件的系统和方法 |
CN115497484A (zh) * | 2022-11-21 | 2022-12-20 | 深圳市友杰智新科技有限公司 | 语音解码结果处理方法、装置、设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101118745A (zh) * | 2006-08-04 | 2008-02-06 | 中国科学院声学研究所 | 语音识别系统中的置信度快速求取方法 |
CN101269638A (zh) * | 2008-04-10 | 2008-09-24 | 清华大学 | 基于命令词表的汽车电器语音控制方法 |
JP2010085522A (ja) * | 2008-09-30 | 2010-04-15 | Kddi Corp | 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法 |
CN102194454A (zh) * | 2010-03-05 | 2011-09-21 | 富士通株式会社 | 用于检测连续语音中的关键词的设备和方法 |
CN105489222A (zh) * | 2015-12-11 | 2016-04-13 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN106875936A (zh) * | 2017-04-18 | 2017-06-20 | 广州视源电子科技股份有限公司 | 语音识别方法及装置 |
CN107093425A (zh) * | 2017-03-30 | 2017-08-25 | 安徽继远软件有限公司 | 电力系统的语音导航系统、语音识别方法和语音交互方法 |
CN107871506A (zh) * | 2017-11-15 | 2018-04-03 | 北京云知声信息技术有限公司 | 语音识别功能的唤醒方法及装置 |
CN109273004A (zh) * | 2018-12-10 | 2019-01-25 | 苏州思必驰信息科技有限公司 | 基于大数据的预测性语音识别方法及装置 |
-
2019
- 2019-03-01 CN CN201910157416.7A patent/CN109872715A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101118745A (zh) * | 2006-08-04 | 2008-02-06 | 中国科学院声学研究所 | 语音识别系统中的置信度快速求取方法 |
CN101269638A (zh) * | 2008-04-10 | 2008-09-24 | 清华大学 | 基于命令词表的汽车电器语音控制方法 |
JP2010085522A (ja) * | 2008-09-30 | 2010-04-15 | Kddi Corp | 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法 |
CN102194454A (zh) * | 2010-03-05 | 2011-09-21 | 富士通株式会社 | 用于检测连续语音中的关键词的设备和方法 |
CN105489222A (zh) * | 2015-12-11 | 2016-04-13 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN107093425A (zh) * | 2017-03-30 | 2017-08-25 | 安徽继远软件有限公司 | 电力系统的语音导航系统、语音识别方法和语音交互方法 |
CN106875936A (zh) * | 2017-04-18 | 2017-06-20 | 广州视源电子科技股份有限公司 | 语音识别方法及装置 |
CN107871506A (zh) * | 2017-11-15 | 2018-04-03 | 北京云知声信息技术有限公司 | 语音识别功能的唤醒方法及装置 |
CN109273004A (zh) * | 2018-12-10 | 2019-01-25 | 苏州思必驰信息科技有限公司 | 基于大数据的预测性语音识别方法及装置 |
Non-Patent Citations (2)
Title |
---|
王炳锡等: "《实用语音识别基础》", 31 January 2005 * |
苏剑波等: "《应用模式识别技术导论 人脸识别与语音识别》", 31 May 2001 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724768A (zh) * | 2020-04-22 | 2020-09-29 | 深圳市伟文无线通讯技术有限公司 | 用于离线语音识别的实时生成解码文件的系统和方法 |
CN115497484A (zh) * | 2022-11-21 | 2022-12-20 | 深圳市友杰智新科技有限公司 | 语音解码结果处理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11074904B2 (en) | Speech synthesis method and apparatus based on emotion information | |
US10360899B2 (en) | Method and device for processing speech based on artificial intelligence | |
US10381017B2 (en) | Method and device for eliminating background sound, and terminal device | |
CN105719649B (zh) | 语音识别方法及装置 | |
CN109101545A (zh) | 基于人机交互的自然语言处理方法、装置、设备和介质 | |
CN106992001A (zh) | 语音指令的处理方法、装置和系统 | |
US20220076674A1 (en) | Cross-device voiceprint recognition | |
CN113539283A (zh) | 基于人工智能的音频处理方法、装置、电子设备及存储介质 | |
JP2006146182A (ja) | 音声コマンドを明瞭化する集中化された方法およびシステム | |
CN104115221A (zh) | 基于文本到语音转换以及语义的音频人类交互证明 | |
CN108269567A (zh) | 用于生成远场语音数据的方法、装置、计算设备以及计算机可读存储介质 | |
CN110706692A (zh) | 儿童语音识别模型的训练方法及系统 | |
US20180190314A1 (en) | Method and device for processing speech based on artificial intelligence | |
CN110444229A (zh) | 基于语音识别的通信服务方法、装置、计算机设备及存储介质 | |
CN110942763B (zh) | 语音识别方法及装置 | |
US10540973B2 (en) | Electronic device for performing operation corresponding to voice input | |
CN110349569B (zh) | 定制化产品语言模型的训练和识别方法及装置 | |
CN109872715A (zh) | 一种语音交互方法及装置 | |
CN105355194A (zh) | 语音合成方法和装置 | |
CN112837674A (zh) | 语音识别方法、装置及相关系统和设备 | |
KR102408455B1 (ko) | 음성 인식 학습을 위한 음성 데이터 합성 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
KR102389995B1 (ko) | 자연발화 음성 생성 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
KR102395399B1 (ko) | 음성 인식 학습을 위한 음성 데이터 분해 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
US11580974B2 (en) | Method for exiting a voice skill, apparatus, device and storage medium | |
CN114466106A (zh) | 外呼系统的测试数据生成方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190611 |
|
RJ01 | Rejection of invention patent application after publication |