CN109119071A - 一种语音识别模型的训练方法及装置 - Google Patents

一种语音识别模型的训练方法及装置 Download PDF

Info

Publication number
CN109119071A
CN109119071A CN201811122427.3A CN201811122427A CN109119071A CN 109119071 A CN109119071 A CN 109119071A CN 201811122427 A CN201811122427 A CN 201811122427A CN 109119071 A CN109119071 A CN 109119071A
Authority
CN
China
Prior art keywords
user
speech
voice signal
speech recognition
identification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811122427.3A
Other languages
English (en)
Inventor
廖海霖
王慧君
毛跃辉
王现林
陶梦春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201811122427.3A priority Critical patent/CN109119071A/zh
Publication of CN109119071A publication Critical patent/CN109119071A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种语音识别模型的训练方法及装置,该方法包括:采集用户语音信号,利用上述用户的用户语音识别模型对用户语音信号进行语音识别,语音识别成功时得到语音文本输出,语音识别失败时,将上述用户语音信号上传至服务器,利用上述用户语音信号及服务器下发的对应语音文本,对相应的用户语音识别模型进行训练,有效地解决了在进行语音识别时,对于一些带有个人口音以及方言的语音识别的准确率低的问题。

Description

一种语音识别模型的训练方法及装置
技术领域
本发明涉及语音识别研究领域,尤其涉及一种语音识别模型的训练方法及装置。
背景技术
随着计算机技术和人工智能技术的发展,让计算能听、能说,是未来人机交互的重要发展方向,其中语音成为最被看好的人机交互方式,而且利用语音技术进行人机交互比其他的交互方式有更多的优点;
目前的语音识别技术中,语音的输入以标准普通话输入为准,目前的语音识技术对于普通话输入的语音识别的准确率很好,但是对于带有一些个人口音以及方言的语音识别的准确率很低,目前针对上述语音的识别准确率急需解决,因此,研究一种应用于用户本人的语音识别模型训练方法相当重要;
在目前的语音识别技术中,所用的语音识别模型往往是已经创建好的,且不能被用户修改的,即不能根据用户个人情况,进行语音语义纠正。
发明内容
本发明提供一种语音识别模型的训练方法及装置,解决语音识别技术中对带有个人口音以及方言的语音识别的准确率低的问题。
为了解决上述的技术问题,本发明提供了一种语音识别模型的训练方法及装置,具体方法包括:
依照本发明第一方面,提供一种语音识别模型的训练方法,该方法包括:
采集任一用户输入的用户语音信号,确定该用户对应的用户语音识别模型;
利用所述用户语音识别模型对所述用户语音信号进行语音识别,确定语音识别成功时得到对应语音文本并输出,确定语音识别失败时,将所述用户语音信号上传至服务器;
获取所述服务器下发的根据所述用户语音信号从第三方语音识别平台获取的对应语音文本并输出;
利用所述用户语音信号及所述服务器下发的对应语音文本,对所述用户语音识别模型进行训练。
依照本发明第二方面,提供一种语音识别模型的训练装置,该装置包括:
语音信号采集单元,用于采集任一用户输入的用户语音信号,确定该用户对应的用户语音识别模型;
语音信号识别单元,用于利用所述用户语音识别模型对所述用户语音信号进行语音识别,确定语音识别成功时得到对应语音文本并输出,确定语音识别失败时,将所述用户语音信号上传至服务器;
语义获取单元,用于获取所述服务器下发的根据所述用户语音信号从第三方语音识别平台获取的对应语音文本并输出;
语音模型训练单元,用于利用所述用户语音信号及所述服务器下发的对应语音文本,对所述用户语音识别模型进行训练。
本发明提供的一种语音识别模型的训练方法及装置与现有技术相比,具有如下优点和有益效果:
1、在进行语音识别的过程中能有效的提高带有个人口音和方言的语音识别的准确率;
2、能根据用户个人的实际情况和需求,对语音进行训练,创建专属于用户本身的用户语音识别模型;
3、提供一种语音语义纠正的方法,能对创建的用户语音识别模型进行不断的修正,同时该发明可以对同一文本内容进行多次语音训练,及时修改语音语义,也可以对一个字或词进行训练。
附图说明
图1为一种语音识别模型的训练方法示意图;
图2为一种语音识别模型的训练方法的流程示意图;
图3为一种语音识别模型的训练装置图;
图4为一种语音识别模型的设备语音遥控器的平面示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一:
本发明提供一种语音识别模型的训练方法,步骤示意图如图1,包括:
步骤101,采集任一用户输入的用户语音信号,确定该用户对应的用户语音识别模型;
可选地,在实施中,采集任一用户输入的用户语音信号,并解析上述用户语音信号得到用户声纹特征;
可选地,可以采集同一用户输入的不同语义的用户语音信号,也可以多次采集同一用户输入的相同语义的用户语音信号,也可以采集不同用户输入的不同或相同语义的用户语音信号;
上述用户语音信号的语义内容可以是一个字或词语,也可以是一句话,上述用户可以根据自己的实际需求输入;
根据上述用户声纹特征在语音识别模型库中查找对应的用户语音识别模型,上述语音识别模型库包括与不同用户声纹特征对应的不同用户语音识别模型;
所谓声纹,是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。基于声纹的这两个特征,它同指纹一样具有身份识别(认定个人)的作用,在本发明提供的方法中,根据每个用户的用户语音信号对应的用户声纹特征不同的特点,用上述用户声纹特征唯一标识上述用户对应的用户语音识别模型;
可选地,确定在上述语音识别模型库中查找不到对应的用户语音识别模型时,根据所上用户声纹特征在上述语音识别模型库创建对应的用户语音识别模型;
在具体的实施方式中,当一个用户首次用本发明方法进行语音识别模型训练时,在上述语音识别模型库中查找不到该用户的用户语音识别模型,则根据该用户首次输入的用户语音信号解析出的用户声纹特征,在上述语音识别模型库创建该用户专属的用户识别模型;
可选地,上述语音识别模型库保存着所有使用本发明方法进行语音识别模型训练的所有用户的用户语音识别模型,以解析出的用户声纹特征识别上述用户对应的用户语音识别模型;可选的具体实施方式中,以上述用户声纹特征为标识,在上述语音识别模型库中建立上述用户专属的唯一的用户语音识别模型。
可选地,在实施的过程中,可以以同一个用户的用户声纹特征为标识,在上述语音识别模型库中,建立上述用户专属的针对不同场景的用户语音识别模型,在这种情况下可以根据用户声纹特征及一些关键字词在语音识别模型库中查找对应场景的用户语音识别模型,如下例:一个可进行语音训练的用于控制家电的智能遥控器,针对某一用户的用户声纹特征在语音识别模型库建立控制电视和控制空调场景下的用户语音识别模型,分别以上述用户声纹特征及关键字“电视”和“空调”在语音识别模型库建立两个用户语音识别模型,当使用上述智能遥控器进行控制家电或进行语音训练时,可根据用户声纹特征及上述关键字查找对应的用户语音识别模型。
步骤102,利用上述用户语音识别模型对上述用户语音信号进行语音识别,确定语音识别成功时得到对应语音文本并输出,确定语音识别失败时,将上述用户语音信号上传至服务器;
可选地,在具体的实施中,利用上述用户语音识别模型对上述用户语音信号进行语音识别时,根据上述用户语音信号在上述用户语音识别模型查找正确的对应语音文本,并将上述对应语音文本输出,让用户指示上述对应语音文本与上述用户语音信号的语义是否一致,用户指示上述语义一致时,即确定语音识别成功,将对应语音文本输出,否则,确定语音识别失败;
对上述对应语音文本输出的方式不做过多限制,本领域的技术人员可根据实际需求设置,可以将对应语音文本以文字形式或转化成音频形式输出,或者其他的可以让用户识别的形式;
确定语音识别失败时,包括:确定利用上述用户语音识别模型查找不到上述用户语音信号的对应语音文本时;或者
根据用户指示确定从上述用户语音识别模型得到的上述用户语音信号的对应语音文本错误时,确定语音识别失败。
在具体的实施方式中,由于上述用户输入的用户语音信号带有个人口音或者是地方方言时,或者上述用户专属的用户语音识别模型训练程度不够时,可能会出现利用上述用户语音识别模型查找不到上述用户语音信号的对应语音文本,此时会确定语音识别失败,将上述用户语音信号上传至服务器。
步骤103,获取上述服务器下发的根据上述用户语音信号从第三方语音识别平台获取的对应语音文本并输出;
服务器在获取上述用户语音信号后,会将其上传至第三方语音识别平台进行语音识别,上述第三方语音识别平台可以是百度语音识别平台,讯飞语音识别平台或其他可以进行语音识别的平台;
上述第三方语音识别平台对用户语音信号进行语音识别后得到对应的对应语音文本,并将对应语音文本输出;
对上述对应语音文本输出的方式不做过多限制,本领域的技术人员可根据实际需求设置,可以将对应语音文本以文字形式或转化成音频形式输出,或者其他的可以让用户识别的形式;
步骤104,利用上述用户语音信号及上述服务器下发的对应语音文本,对上述用户语音识别模型进行训练。
具体的实施方式中,根据输出的上述服务器下发的对应语音文本,对上述用户专属的用户语音识别进行训练;可选地,还包括,接收用户指示,根据上述用户指示确定上述服务器下发的对应语音文本与上述用户语音信号的语义是否一致;
确定用户指示上述服务器下发的对应语音文本与上述用户语音信号的语义不一致时,将上述对应语音文本丢弃;
确定用户指示上述服务器下发的对应语音文本与上述用户语音信号的语义一致时,将上述对应语音文本加入上述用户语音识别模型。
具体的实施方式中,用户输入的用户语音信号可能携带个人口音或方言,上述第三方语音识别平台对用户语音信号进行语音识别时可能会识别错误,即上述服务器下发的对应语音文本与上述用户语音信号的语义可能不一致,此时将上述对应语音文本与上述用户语音信号的语义一致的对应语音文本加入上述用户语音识别模型,将上述对应语音文本与上述用户语音信号的语义不一致的对应语音文本丢弃。
在上述的实施例中,上述的第三方语音识别平台具有强大的语音识别功能,在本发明的方法中,利用上述的第三方语音识别平台对上述用户语音信号进行识别,将其识别的对应语音文本输出给用户判断指示,可以辅助生成上述用户语音识别模型的训练样本,有效地解决了用户终端针对用户的个性化语音识别模型的训练。
可选地,在实施时,进行语音识别模型训练时,用户可以多次输入同一语义的用户语音信号进行语音识别模型训练,直到有正确的对应语音文本加入上述用户语音识别模型;也可以在训练完成后,也可以再次输入同一语义的用户语音信号进行语音识别模型的修正。
以下是一个语音识别模型训练的详细过程,流程图参见图2,具体过程如下:
步骤2010,采集用户语音信号,进入步骤2020;
采集可能带有个人口音的用户语音信号;
步骤2020,解析上述用户语音信号得到用户声纹特征,进入步骤2030;
利用声纹识别技术对用户语音信号解析,得到用户声纹特征;
步骤2030,根据上述用户声纹特征查找对应的用户语音识别模型,进入步骤2040;
根据上述用户声纹特征,在语音模型训练库中查找对应的用户语音识别模型;
步骤2040,判断根据上述用户声纹特征查找对应的用户语音识别模型是否成功;
确定查找成功时,进入步骤2050;确定查找不成功,进入步骤2041;
步骤2041,根据上述用户声纹特征在语音识别模型库中创建用户专属的用户语音识别模型,并进入步骤2050;
步骤2050,从上述用户语音识别模型查找用户语音信号的对应语音文本并输出,进入步骤2060;
步骤2060,确定用户指示对应语音文本与用户语音信号的语义是否一致;
确定用户指示对应语音文本与用户语音信号的语义一致时进入步骤2061,否则,进入步骤2070;
步骤2061,将对应语音文本输出,并进入步骤2100;
步骤2070,将上述用户语音信号上传至服务器;
步骤2080,获取上述服务器下发的根据上述用户语音信号从第三方语音识别平台获取的对应语音文本并输出;进入步骤2090;
步骤2090,确定用户指示上述服务器下发的对应语音文本与上述用户语音信号的语义是否一致;
确定用户指示上述服务器下发的对应语音文本与上述用户语音信号的语义不一致时,进入步骤2091,否则进入步骤2092;
步骤2091,将上述服务器下发的对应语音文本丢弃;进入步骤2100;
步骤2092,将上述对应语音文本加入上述用户语音识别模型,进入步骤2100;
步骤2100,结束语音识别模型训练。
实施例二:
在本实施例中,提供一种语音识别模型的训练装置,装置图如图3所述,包括:
语音信号采集单元301,用于采集任一用户输入的用户语音信号,确定该用户对应的用户语音识别模型;
可选地,在具体的实施方式中,采集任一用户输入的用户语音信号,解析上述用户语音信号得到用户声纹特征;
根据上述用户声纹特征在语音识别模型库中查找对应的用户语音识别模型,上述语音识别模型库包括与不同用户声纹特征对应的不同用户语音识别模型。
可选地,还包括,语音识别模型创建单元,用于确定在上述语音识别模型库中查找不到对应的用户语音识别模型时,根据上述用户声纹特征在上述语音识别模型库创建对应的用户语音识别模型。
语音信号识别单元302,用于利用上述用户语音识别模型对上述用户语音信号进行语音识别,确定语音识别成功时得到对应语音文本并输出,确定语音识别失败时,将上述用户语音信号上传至服务器;
可选地,在具体的实施方式中,确定利用上述用户语音识别模型查找不到上述用户语音信号的对应语音文本时;或者
根据用户指示确定从上述用户语音识别模型得到的上述用户语音信号的对应语音文本错误时,确定语音识别失败。
语义获取单元303,用于获取上述服务器下发的根据上述用户语音信号从第三方语音识别平台获取的对应语音文本并输出;
语音模型训练单元304,用于利用上述用户语音信号及上述服务器下发的对应语音文本,对上述用户语音识别模型进行训练。
可选地,还包括用于接收用户指示,根据上述用户指示确定上述服务器下发的对应语音文本与上述用户语音信号的语义是否一致;
确定用户指示上述服务器下发的对应语音文本与上述用户语音信号的语义不一致时,将上述对应语音文本丢弃;
确定用户指示上述服务器下发的对应语音文本与上述用户语音信号的语义一致时,将上述对应语音文本加入上述用户语音识别模型。
实施例三:
本发明提供一种语音识别模型的训练设备,包括:
上述存储器,用于存储可执行程序;
在具体的实施方式中,上述存储器还用于存储用户语音信号,对应语音文本和语音识别模型库;
上述处理器,用于执行上述可执行程序时实现上述实施例一到实施例四的任意一项上述的语音识别模型的训练方法。
一种计算机存储介质,其特征在于,上述计算机存储介质存储有计算机程序,该计算机程序被执行时实现上述实施例一到实施例四的任意一项上述的语音识别模型的训练方法。
可选地,在具体的实施中还包括,语音采集装置,用于采集上述用户语音信号;
对上述语音采集装置不做过多限制,本领域的技术人员可根据实际需求设定,优选的具体实施方式中,可以是麦克风;
可选地,还包括,语音文本输出装置,用于输出上述对应语音文本;
对上述语音文本输出装置不做过多限制,本领域的技术人员可根据实际需求设定,优选的具体实施方式中,可以是将语音文本转化成音频输出的扬声器,也可以是显示语音文本的液晶显示器;
可选地,还包括,指示装置,用于接收用户指示,根据上述用户指示确定上述对应语音文本与上述用户语音信号的语义是否一致;
对上述指示装置不做过多限制,本领域的技术人员可根据实际需求设定,在本实施例优选的具体实施方式中,上述指示装置可以是一个有不同操作形式的机械按钮,也可以是一组相关机械按键;
语音识别模型的训练设备可以为智能语音音响,智能语音空调遥控器等,在本实施例中,上述设备是一个控制空调的语音遥控器,上述语音遥控器的平面图如图4;
上述遥控器包括:麦克风、机械按钮、存储器、处理器、扬声器以及电源装置等;
在优选的具体实施方式中,上述麦克风用于接收用户语音信号;上述扬声器用于将上述对应语音文本以音频的形式播放出来;
上述机械按钮用于采集用户语音信号及用于确定用户指示语音识别是否成功,包括:
上述机械按钮被用户按压时,采集用户语音信号;以及上述按钮被用户向顺时针旋转时,确认上述扬声器播放的对应语音文本音频上述用户语音信号的语义一致;以及上述按钮被用户向逆时针旋转时,确认上述扬声器播放的对应语音文本音频上述用户语音信号的语义不一致;
对上述机械按钮的使用方式不做过多限制,本领域的技术人员可根据实际需求设定。
应当说明的是,本发明的各个实施例的技术方案可以相互结合,但是必须是以本领域的技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当人认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (12)

1.一种语音识别模型的训练方法,其特征在于,包括:
采集任一用户输入的用户语音信号,确定该用户对应的用户语音识别模型;
利用所述用户语音识别模型对所述用户语音信号进行语音识别,确定语音识别成功时得到对应语音文本并输出,确定语音识别失败时,将所述用户语音信号上传至服务器;
获取所述服务器下发的根据所述用户语音信号从第三方语音识别平台获取的对应语音文本并输出;
利用所述用户语音信号及所述服务器下发的对应语音文本,对所述用户语音识别模型进行训练。
2.如权利要求1所述的方法,其特征在于,利用所述用户语音信号及所述服务器下发的对应语音文本,对所述用户语音识别模型进行训练,包括:
接收用户指示,根据所述用户指示确定所述服务器下发的对应语音文本与所述用户语音信号的语义是否一致;
确定用户指示所述服务器下发的对应语音文本与所述用户语音信号的语义不一致时,将所述服务器下发的对应语音文本丢弃;
确定用户指示所述服务器下发的对应语音文本与所述用户语音信号的语义一致时,将所述对应语音文本加入所述用户语音识别模型。
3.如权利要求1所述的方法,其特征在于,采集任一用户输入的用户语音信号,确定该用户对应的用户语音识别模型,包括:
采集任一用户输入的用户语音信号,解析所述用户语音信号得到用户声纹特征;
根据所述用户声纹特征在语音识别模型库中查找对应的用户语音识别模型,所述语音识别模型库包括与不同用户声纹特征对应的不同用户语音识别模型。
4.如权利要求3所述的方法,其特征在于,还包括:
确定在所述语音识别模型库中查找不到对应的用户语音识别模型时,根据所述用户声纹特征在所述语音识别模型库创建对应的用户语音识别模型。
5.如权利要求1所述的方法,其特征在于,确定语音识别失败时,包括:
确定利用所述用户语音识别模型查找不到所述用户语音信号的对应语音文本时;或者
根据用户指示确定从所述用户语音识别模型得到的所述用户语音信号的对应语音文本错误时,确定语音识别失败。
6.一种语音识别模型的训练装置,其特征在于,包括:
语音信号采集单元,用于采集任一用户输入的用户语音信号,确定该用户对应的用户语音识别模型;
语音信号识别单元,用于利用所述用户语音识别模型对所述用户语音信号进行语音识别,确定语音识别成功时得到对应语音文本并输出,确定语音识别失败时,将所述用户语音信号上传至服务器;
语义获取单元,用于获取所述服务器下发的根据所述用户语音信号从第三方语音识别平台获取的对应语音文本并输出;
语音模型训练单元,用于利用所述用户语音信号及所述服务器下发的对应语音文本,对所述用户语音识别模型进行训练。
7.如权利要求6所述的装置,其特征在于,所述语音信号识别单元,用于利用所述用户语音信号及所述服务器下发的对应语音文本,对所述用户语音识别模型进行训练,包括:
用于接收用户指示,根据所述用户指示确定所述服务器下发的对应语音文本与所述用户语音信号的语义是否一致;
确定用户指示所述服务器下发的对应语音文本与所述用户语音信号的语义不一致时,将所述对应语音文本丢弃;
确定用户指示所述服务器下发的对应语音文本与所述用户语音信号的语义一致时,将所述对应语音文本加入所述用户语音识别模型。
8.如权利要求6所述的装置,其特征在于,所述语音信号采集单元,用于采集任一用户输入的用户语音信号,确定该用户对应的用户语音识别模型,包括:
采集任一用户输入的用户语音信号,解析所述用户语音信号得到用户声纹特征;
根据所述用户声纹特征在语音识别模型库中查找对应的用户语音识别模型,所述语音识别模型库包括与不同用户声纹特征对应的不同用户语音识别模型。
9.如权利要求8所述的装置,其特征在于,还包括:
语音识别模型创建单元,用于确定在所述语音识别模型库中查找不到对应的用户语音识别模型时,根据所述用户声纹特征在所述语音识别模型库创建对应的用户语音识别模型。
10.如权利要求6所述的装置,其特征在于,所述语音识别单元,用于确定语音识别失败时,包括:
确定利用所述用户语音识别模型查找不到所述用户语音信号的对应语音文本时;或者
根据用户指示确定从所述用户语音识别模型得到的所述用户语音信号的对应语音文本错误时,确定语音识别失败。
11.一种训练语音识别模型的设备,其特征在于,包括处理器和存储器,其中:
所述存储器,用于存储可执行程序;
所述处理器,用于执行所述可执行程序时实现权利要求1-5任意一项所述的视觉重定位方法。
12.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,该计算机程序被执行时实现权利要求1-5任意一项所述的视觉重定位方法。
CN201811122427.3A 2018-09-26 2018-09-26 一种语音识别模型的训练方法及装置 Pending CN109119071A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811122427.3A CN109119071A (zh) 2018-09-26 2018-09-26 一种语音识别模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811122427.3A CN109119071A (zh) 2018-09-26 2018-09-26 一种语音识别模型的训练方法及装置

Publications (1)

Publication Number Publication Date
CN109119071A true CN109119071A (zh) 2019-01-01

Family

ID=64856834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811122427.3A Pending CN109119071A (zh) 2018-09-26 2018-09-26 一种语音识别模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN109119071A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109410946A (zh) * 2019-01-11 2019-03-01 百度在线网络技术(北京)有限公司 一种识别语音信号的方法、装置、设备及存储介质
CN110544479A (zh) * 2019-08-30 2019-12-06 上海依图信息技术有限公司 一种去噪的语音识别方法及装置
CN111081262A (zh) * 2019-12-30 2020-04-28 杭州中科先进技术研究院有限公司 一种基于定制化模型的轻量级语音识别系统及方法
CN111951790A (zh) * 2020-08-21 2020-11-17 腾讯科技(深圳)有限公司 一种语音处理方法、装置、终端及存储介质
CN113205802A (zh) * 2021-05-10 2021-08-03 芜湖美的厨卫电器制造有限公司 语音识别模型的更新方法、家用电器及服务器
CN113643690A (zh) * 2021-10-18 2021-11-12 深圳市云创精密医疗科技有限公司 针对患者不规则声音的高精密医疗设备的语言识别方法
CN113779997A (zh) * 2021-09-03 2021-12-10 珠海格力电器股份有限公司 实体识别方法、装置、电子设备及存储介质
EP3923273A4 (en) * 2019-02-21 2022-07-13 Gree Electric Appliances, Inc. of Zhuhai METHOD AND DEVICE FOR VOICE RECOGNITION, STORAGE MEDIA AND CONDITIONING

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101950564A (zh) * 2010-10-13 2011-01-19 镇江华扬信息科技有限公司 一种远程数字化语音采集分析识别系统
CN102496364A (zh) * 2011-11-30 2012-06-13 苏州奇可思信息科技有限公司 基于云端网络的交互式语音识别方法
CN102779509A (zh) * 2011-05-11 2012-11-14 联想(北京)有限公司 语音处理设备和语音处理方法
CN102915731A (zh) * 2012-10-10 2013-02-06 百度在线网络技术(北京)有限公司 一种个性化的语音识别的方法及装置
CN103680495A (zh) * 2012-09-26 2014-03-26 中国移动通信集团公司 语音识别模型训练方法和装置及终端
CN103903613A (zh) * 2014-03-10 2014-07-02 联想(北京)有限公司 一种信息处理方法及电子设备
US20150161999A1 (en) * 2013-12-09 2015-06-11 Ravi Kalluri Media content consumption with individualized acoustic speech recognition
CN104778946A (zh) * 2014-01-10 2015-07-15 中国电信股份有限公司 语音控制方法和系统
CN105931645A (zh) * 2016-04-12 2016-09-07 深圳市京华信息技术有限公司 虚拟现实设备的控制方法、装置及虚拟现实设备、系统
CN106548773A (zh) * 2016-11-04 2017-03-29 百度在线网络技术(北京)有限公司 基于人工智能的儿童用户搜索方法及装置
CN106601254A (zh) * 2016-12-08 2017-04-26 广州神马移动信息科技有限公司 信息输入方法和装置及计算设备
US20170148430A1 (en) * 2015-11-25 2017-05-25 Samsung Electronics Co., Ltd. Method and device for recognition and method and device for constructing recognition model
CN106847283A (zh) * 2017-02-28 2017-06-13 广东美的制冷设备有限公司 智能家电控制方法和装置
CN106997762A (zh) * 2017-03-08 2017-08-01 广东美的制冷设备有限公司 家用电器的语音控制方法以及装置
CN107507612A (zh) * 2017-06-30 2017-12-22 百度在线网络技术(北京)有限公司 一种声纹识别方法及装置
CN108039174A (zh) * 2018-01-08 2018-05-15 珠海格力电器股份有限公司 语音识别系统、方法和装置

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101950564A (zh) * 2010-10-13 2011-01-19 镇江华扬信息科技有限公司 一种远程数字化语音采集分析识别系统
CN102779509A (zh) * 2011-05-11 2012-11-14 联想(北京)有限公司 语音处理设备和语音处理方法
CN102496364A (zh) * 2011-11-30 2012-06-13 苏州奇可思信息科技有限公司 基于云端网络的交互式语音识别方法
CN103680495A (zh) * 2012-09-26 2014-03-26 中国移动通信集团公司 语音识别模型训练方法和装置及终端
CN102915731A (zh) * 2012-10-10 2013-02-06 百度在线网络技术(北京)有限公司 一种个性化的语音识别的方法及装置
US20150161999A1 (en) * 2013-12-09 2015-06-11 Ravi Kalluri Media content consumption with individualized acoustic speech recognition
CN104778946A (zh) * 2014-01-10 2015-07-15 中国电信股份有限公司 语音控制方法和系统
CN103903613A (zh) * 2014-03-10 2014-07-02 联想(北京)有限公司 一种信息处理方法及电子设备
US20170148430A1 (en) * 2015-11-25 2017-05-25 Samsung Electronics Co., Ltd. Method and device for recognition and method and device for constructing recognition model
CN105931645A (zh) * 2016-04-12 2016-09-07 深圳市京华信息技术有限公司 虚拟现实设备的控制方法、装置及虚拟现实设备、系统
CN106548773A (zh) * 2016-11-04 2017-03-29 百度在线网络技术(北京)有限公司 基于人工智能的儿童用户搜索方法及装置
CN106601254A (zh) * 2016-12-08 2017-04-26 广州神马移动信息科技有限公司 信息输入方法和装置及计算设备
CN106847283A (zh) * 2017-02-28 2017-06-13 广东美的制冷设备有限公司 智能家电控制方法和装置
CN106997762A (zh) * 2017-03-08 2017-08-01 广东美的制冷设备有限公司 家用电器的语音控制方法以及装置
CN107507612A (zh) * 2017-06-30 2017-12-22 百度在线网络技术(北京)有限公司 一种声纹识别方法及装置
CN108039174A (zh) * 2018-01-08 2018-05-15 珠海格力电器股份有限公司 语音识别系统、方法和装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109410946A (zh) * 2019-01-11 2019-03-01 百度在线网络技术(北京)有限公司 一种识别语音信号的方法、装置、设备及存储介质
EP3923273A4 (en) * 2019-02-21 2022-07-13 Gree Electric Appliances, Inc. of Zhuhai METHOD AND DEVICE FOR VOICE RECOGNITION, STORAGE MEDIA AND CONDITIONING
US11830479B2 (en) 2019-02-21 2023-11-28 Gree Electric Appliances, Inc. Of Zhuhai Voice recognition method and apparatus, and air conditioner
CN110544479A (zh) * 2019-08-30 2019-12-06 上海依图信息技术有限公司 一种去噪的语音识别方法及装置
CN111081262A (zh) * 2019-12-30 2020-04-28 杭州中科先进技术研究院有限公司 一种基于定制化模型的轻量级语音识别系统及方法
CN111951790A (zh) * 2020-08-21 2020-11-17 腾讯科技(深圳)有限公司 一种语音处理方法、装置、终端及存储介质
CN113205802A (zh) * 2021-05-10 2021-08-03 芜湖美的厨卫电器制造有限公司 语音识别模型的更新方法、家用电器及服务器
CN113779997A (zh) * 2021-09-03 2021-12-10 珠海格力电器股份有限公司 实体识别方法、装置、电子设备及存储介质
CN113779997B (zh) * 2021-09-03 2023-10-10 珠海格力电器股份有限公司 实体识别方法、装置、电子设备及存储介质
CN113643690A (zh) * 2021-10-18 2021-11-12 深圳市云创精密医疗科技有限公司 针对患者不规则声音的高精密医疗设备的语言识别方法

Similar Documents

Publication Publication Date Title
CN109119071A (zh) 一种语音识别模型的训练方法及装置
US20200126566A1 (en) Method and apparatus for voice interaction
US10796696B2 (en) Tailoring an interactive dialog application based on creator provided content
CN110148427A (zh) 音频处理方法、装置、系统、存储介质、终端及服务器
CN110751943A (zh) 一种语音情绪识别方法、装置以及相关设备
CN109145123A (zh) 知识图谱模型的构建方法、智能交互方法、系统及电子设备
CN111833853B (zh) 语音处理方法及装置、电子设备、计算机可读存储介质
CN111199732B (zh) 一种基于情感的语音交互方法、存储介质及终端设备
CN105723360A (zh) 利用情感调节改进自然语言交互
CN109036374B (zh) 数据处理方法和装置
CN109147800A (zh) 应答方法和装置
CN106774845B (zh) 一种智能交互方法、装置及终端设备
CN109325091A (zh) 兴趣点属性信息的更新方法、装置、设备及介质
CN100585663C (zh) 语言学习系统
CN108140030A (zh) 对话系统、终端、控制对话的方法及使计算机发挥对话系统功能的程序
CN112837687A (zh) 一种答题方法、装置、计算机设备及存储介质
CN111553138B (zh) 用于规范内容结构文档的辅助写作方法及装置
JP2015036798A (ja) 情報処理装置及びその制御方法、コンピュータプログラム
CN112307166B (zh) 一种智能问答方法、装置、存储介质以及计算机设备
CN110164020A (zh) 投票创建方法、装置、计算机设备及计算机可读存储介质
CN113763962A (zh) 音频处理方法、装置、存储介质及计算机设备
CN112163084A (zh) 问题反馈方法、装置、介质以及电子设备
CN109948155A (zh) 一种多意图的选择方法及装置、终端设备
CN114999457A (zh) 语音系统的测试方法、装置、存储介质及电子设备
KR20190070682A (ko) 강의 콘텐츠 구성 및 제공을 위한 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190101

RJ01 Rejection of invention patent application after publication