CN106847273A - 语音识别的唤醒词选择方法及装置 - Google Patents

语音识别的唤醒词选择方法及装置 Download PDF

Info

Publication number
CN106847273A
CN106847273A CN201611208275.XA CN201611208275A CN106847273A CN 106847273 A CN106847273 A CN 106847273A CN 201611208275 A CN201611208275 A CN 201611208275A CN 106847273 A CN106847273 A CN 106847273A
Authority
CN
China
Prior art keywords
word
candidate
wake
pronunciation
wakes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611208275.XA
Other languages
English (en)
Other versions
CN106847273B (zh
Inventor
朱辉
王明明
闫子魁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201611208275.XA priority Critical patent/CN106847273B/zh
Publication of CN106847273A publication Critical patent/CN106847273A/zh
Application granted granted Critical
Publication of CN106847273B publication Critical patent/CN106847273B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

本发明是关于一种语音识别的唤醒词选择方法及装置,其中,方法包括:获取多个候选唤醒词;根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。通过该技术方案,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。

Description

语音识别的唤醒词选择方法及装置
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别的唤醒词选择方法及装置。
背景技术
目前,相关技术中可以通过语音对设备进行控制,设备不是实时录音并识别语音命令的,而是先识别是否收到唤醒词,如果收到唤醒词则激活,然后识别语音命令。唤醒效果的好坏依赖唤醒词的选择,唤醒词应具有较高的可区分性,从而能提高与非唤醒词语音以及环境音之间区分的正确性。
发明内容
本发明实施例提供一种语音识别的唤醒词选择方法及装置,用以选择可区分性高的唤醒词,从而提高唤醒词与非唤醒词以及环境音之间区分的正确性。
根据本发明实施例的第一方面,提供一种语音识别的唤醒词选择方法,包括:
获取多个候选唤醒词;
根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。
在该实施例中,在选择唤醒词时,根据唤醒词的发音计算每个候选唤醒词的可区分性得分,并根据可区分性得分确定目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述根据每个候选唤醒词的发音,计算出所述每个候选唤醒词对应的可区分性得分,包括:
将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。
在该实施例中,可以通过唤醒词发音来判断其可区分性,进而选择目标唤醒词,从而提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分,包括:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
discriP(wuw)表示唤醒词wuw的区分性,其值越大代表该唤醒词的区分性越好。
在一个实施例中,所述根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词,包括:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
在该实施例中,在选择唤醒词时,根据每个候选唤醒词的发音计算每个候选唤醒词的可区分性得分,并从中选择可区分性得分最高的唤醒词为目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述方法还包括:
接收用户输入的语音信息;
对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;
将所述可信程度分数与预设的阈值分数进行比较;
当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。
在该实施例中,如果用户输入的语音信息对应的文字信息的可信程度分数大于所述预设的阈值分数,则可以开启终端设备的语音识别功能,从而开始识别语音命令。
根据本发明实施例的第二方面,提供一种语音识别的唤醒词选择装置,包括:
获取模块,用于获取多个候选唤醒词;
计算模块,用于根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
确定模块,用于根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。
在一个实施例中,所述计算模块包括:
分解子模块,用于将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
计算子模块,用于根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。
在一个实施例中,所述计算子模块用于:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
在一个实施例中,所述确定模块用于:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
在一个实施例中,所述装置还包括:
接收模块,用于接收用户输入的语音信息;
识别模块,用于对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;
对比模块,用于将所述可信程度分数与预设的阈值分数进行比较;
处理模块,用于当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音识别的唤醒词选择方法的流程图。
图2是根据一示例性实施例示出的一种语音识别的唤醒词选择方法中步骤S102的流程图。
图3是根据一示例性实施例示出的又一种语音识别的唤醒词选择方法的流程图。
图4是根据一示例性实施例示出的另一种语音识别的唤醒词选择方法的流程图。
图5是根据一示例性实施例示出的一种语音识别的唤醒词选择装置的框图。
图6是根据一示例性实施例示出的一种语音识别的唤醒词选择装置中计算模块的框图。
图7是根据一示例性实施例示出的另一种语音识别的唤醒词选择装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种语音识别的唤醒词选择方法的流程图。该一种语音识别的唤醒词选择方法应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音控制功能的设备。如图1所示,该方法包括步骤S101-S103:
在步骤S101中,获取多个候选唤醒词;
在步骤S102中,根据每个候选唤醒词对应的发音,计算出每个候选唤醒词对应的可区分性得分;
在步骤S103中,根据每个候选唤醒词对应的可区分性得分确定目标唤醒词。
在该实施例中,在选择唤醒词时,根据唤醒词的发音计算每个候选唤醒词的可区分性得分,并根据可区分性得分确定目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
图2是根据一示例性实施例示出的一种语音识别的唤醒词选择方法中步骤S102的流程图。
如图2所示,在一个实施例中,上述步骤S102包括步骤S201-S202:
在步骤S201中,将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
在步骤S202中,根据每个候选唤醒词对应的至少一个单音素,计算出每个候选唤醒词对应的可区分性得分。
在该实施例中,可以通过唤醒词发音来判断其可区分性,进而选择目标唤醒词,从而提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,上述步骤S202包括:
从每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据发音不重复的单音素和预设计算公式,计算出每个候选唤醒词对应的可区分性得分,其中,预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量目标单音素与其他单音素的发音区分性的函数,f(Pi)取值范围为[0,1]。
discriP(wuw)表示唤醒词wuw的区分性,其值越大代表该唤醒词的区分性越好。
图3是根据一示例性实施例示出的又一种语音识别的唤醒词选择方法的流程图。
如图3所示,在一个实施例中,上述步骤S103包括步骤S301:
在步骤S301中,将可区分性得分最高的候选唤醒词确定为目标唤醒词。
在该实施例中,在选择唤醒词时,根据每个候选唤醒词的发音计算每个候选唤醒词的可区分性得分,并从中选择可区分性得分最高的唤醒词为目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
图4是根据一示例性实施例示出的另一种语音识别的唤醒词选择方法的流程图。
如图4所示,在一个实施例中,上述方法还包括步骤S401-S404:
在步骤S401中,接收用户输入的语音信息;
在步骤S402中,对语音信息进行识别,得到对应的文字信息及文字信息的可信程度分数;
在步骤S403中,将可信程度分数与预设的阈值分数进行比较;
在步骤S404中,当可信程度分数大于预设的阈值分数时,开启终端设备的语音识别功能。
在该实施例中,如果用户输入的语音信息对应的文字信息的可信程度分数大于所述预设的阈值分数,则可以开启终端设备的语音识别功能,从而开始识别语音命令。
下述为本发明装置实施例,可以用于执行本发明方法实施例。
图5是根据一示例性实施例示出的一种语音识别的唤醒词选择装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图5所示,该语音识别的唤醒词选择装置包括:
获取模块51,用于获取多个候选唤醒词;
计算模块52,用于根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
确定模块53,用于根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。
在该实施例中,在选择唤醒词时,根据唤醒词的发音计算每个候选唤醒词的可区分性得分,并根据可区分性得分确定目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
图6是根据一示例性实施例示出的一种语音识别的唤醒词选择装置中计算模块的框图。
如图6所示,在一个实施例中,所述计算模块52包括:
分解子模块61,用于将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
第一计算子模块62,用于根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。
在该实施例中,可以通过唤醒词发音来判断其可区分性,进而选择目标唤醒词,从而提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述第一计算子模块62用于:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
在一个实施例中,所述确定模块53用于:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
在该实施例中,在选择唤醒词时,根据每个候选唤醒词的发音计算每个候选唤醒词的可区分性得分,并从中选择可区分性得分最高的唤醒词为目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
图7是根据一示例性实施例示出的另一种语音识别的唤醒词选择装置的框图。
如图7所示,在一个实施例中,上述装置还包括:
接收模块71,用于接收用户输入的语音信息;
识别模块72,用于对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;
对比模块73,用于将所述可信程度分数与预设的阈值分数进行比较;
处理模块74,用于当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。
在该实施例中,如果用户输入的语音信息对应的文字信息的可信程度分数大于所述预设的阈值分数,则可以开启终端设备的语音识别功能,从而开始识别语音命令。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种语音识别的唤醒词选择方法,用于终端设备,其特征在于,包括:
获取多个候选唤醒词;
根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。
2.根据权利要求1所述的方法,其特征在于,所述根据每个候选唤醒词的发音,计算出所述每个候选唤醒词对应的可区分性得分,包括:
将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。
3.根据权利要求2所述的方法,其特征在于,所述根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分,包括:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
d i s c r i P ( w u w ) = Σ i = 1 K f ( P i )
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
4.根据权利要求1所述的方法,其特征在于,所述根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词,包括:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
接收用户输入的语音信息;
对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;
将所述可信程度分数与预设的阈值分数进行比较;
当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。
6.一种语音识别的唤醒词选择装置,用于终端设备,其特征在于,包括:
获取模块,用于获取多个候选唤醒词;
计算模块,用于根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
确定模块,用于根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。
7.根据权利要求6所述的装置,其特征在于,所述计算模块包括:
分解子模块,用于将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
计算子模块,用于根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。
8.根据权利要求7所述的装置,其特征在于,所述计算子模块用于:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
d i s c r i P ( w u w ) = Σ i = 1 K f ( P i )
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
9.根据权利要求6所述的装置,其特征在于,所述确定模块用于:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
10.根据权利要求6至10中任一项所述的装置,其特征在于,所述装置还包括:
接收模块,用于接收用户输入的语音信息;
识别模块,用于对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;
对比模块,用于将所述可信程度分数与预设的阈值分数进行比较;
处理模块,用于当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。
CN201611208275.XA 2016-12-23 2016-12-23 语音识别的唤醒词选择方法及装置 Active CN106847273B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611208275.XA CN106847273B (zh) 2016-12-23 2016-12-23 语音识别的唤醒词选择方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611208275.XA CN106847273B (zh) 2016-12-23 2016-12-23 语音识别的唤醒词选择方法及装置

Publications (2)

Publication Number Publication Date
CN106847273A true CN106847273A (zh) 2017-06-13
CN106847273B CN106847273B (zh) 2020-05-05

Family

ID=59135326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611208275.XA Active CN106847273B (zh) 2016-12-23 2016-12-23 语音识别的唤醒词选择方法及装置

Country Status (1)

Country Link
CN (1) CN106847273B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108039175A (zh) * 2018-01-29 2018-05-15 北京百度网讯科技有限公司 语音识别方法、装置及服务器
CN111048068A (zh) * 2018-10-11 2020-04-21 阿里巴巴集团控股有限公司 语音唤醒方法、装置、系统及电子设备
CN111128171A (zh) * 2019-12-31 2020-05-08 云知声智能科技股份有限公司 一种基于语音识别的设置方法及装置
CN111341317A (zh) * 2020-02-19 2020-06-26 Oppo广东移动通信有限公司 唤醒音频数据的评价方法、装置、电子设备及介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0834861A2 (de) * 1996-10-01 1998-04-08 Siemens Aktiengesellschaft Verfahren zur Berechnung eines Schwellenwertes für die Spracherkennung eines Schlüsselwortes
CN102243871A (zh) * 2010-05-14 2011-11-16 索尼计算机娱乐公司 作为语音识别错误预测器的用于语法适合度评估的方法和系统
CN102999161A (zh) * 2012-11-13 2013-03-27 安徽科大讯飞信息科技股份有限公司 一种语音唤醒模块的实现方法及应用
CN103021409A (zh) * 2012-11-13 2013-04-03 安徽科大讯飞信息科技股份有限公司 一种语音启动拍照系统
CN103971678A (zh) * 2013-01-29 2014-08-06 腾讯科技(深圳)有限公司 关键词检测方法和装置
CN104584119A (zh) * 2012-07-03 2015-04-29 谷歌公司 确定热词适合度
CN104575490A (zh) * 2014-12-30 2015-04-29 苏州驰声信息科技有限公司 基于深度神经网络后验概率算法的口语发音评测方法
CN104616653A (zh) * 2015-01-23 2015-05-13 北京云知声信息技术有限公司 唤醒词匹配方法、装置以及语音唤醒方法、装置
CN104681036A (zh) * 2014-11-20 2015-06-03 苏州驰声信息科技有限公司 一种语言音频的检测系统及方法
CN104978963A (zh) * 2014-04-08 2015-10-14 富士通株式会社 语音识别装置、方法以及电子设备
CN105654943A (zh) * 2015-10-26 2016-06-08 乐视致新电子科技(天津)有限公司 一种语音唤醒方法、装置及系统
CN105654949A (zh) * 2016-01-07 2016-06-08 北京云知声信息技术有限公司 一种语音唤醒方法及装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0834861A2 (de) * 1996-10-01 1998-04-08 Siemens Aktiengesellschaft Verfahren zur Berechnung eines Schwellenwertes für die Spracherkennung eines Schlüsselwortes
CN102243871A (zh) * 2010-05-14 2011-11-16 索尼计算机娱乐公司 作为语音识别错误预测器的用于语法适合度评估的方法和系统
CN104584119A (zh) * 2012-07-03 2015-04-29 谷歌公司 确定热词适合度
CN102999161A (zh) * 2012-11-13 2013-03-27 安徽科大讯飞信息科技股份有限公司 一种语音唤醒模块的实现方法及应用
CN103021409A (zh) * 2012-11-13 2013-04-03 安徽科大讯飞信息科技股份有限公司 一种语音启动拍照系统
CN103971678A (zh) * 2013-01-29 2014-08-06 腾讯科技(深圳)有限公司 关键词检测方法和装置
CN104978963A (zh) * 2014-04-08 2015-10-14 富士通株式会社 语音识别装置、方法以及电子设备
CN104681036A (zh) * 2014-11-20 2015-06-03 苏州驰声信息科技有限公司 一种语言音频的检测系统及方法
CN104575490A (zh) * 2014-12-30 2015-04-29 苏州驰声信息科技有限公司 基于深度神经网络后验概率算法的口语发音评测方法
CN104616653A (zh) * 2015-01-23 2015-05-13 北京云知声信息技术有限公司 唤醒词匹配方法、装置以及语音唤醒方法、装置
CN105654943A (zh) * 2015-10-26 2016-06-08 乐视致新电子科技(天津)有限公司 一种语音唤醒方法、装置及系统
CN105654949A (zh) * 2016-01-07 2016-06-08 北京云知声信息技术有限公司 一种语音唤醒方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108039175A (zh) * 2018-01-29 2018-05-15 北京百度网讯科技有限公司 语音识别方法、装置及服务器
US11398228B2 (en) 2018-01-29 2022-07-26 Beijing Baidu Netcom Science And Technology Co., Ltd. Voice recognition method, device and server
CN111048068A (zh) * 2018-10-11 2020-04-21 阿里巴巴集团控股有限公司 语音唤醒方法、装置、系统及电子设备
CN111048068B (zh) * 2018-10-11 2023-04-18 阿里巴巴集团控股有限公司 语音唤醒方法、装置、系统及电子设备
CN111128171A (zh) * 2019-12-31 2020-05-08 云知声智能科技股份有限公司 一种基于语音识别的设置方法及装置
CN111341317A (zh) * 2020-02-19 2020-06-26 Oppo广东移动通信有限公司 唤醒音频数据的评价方法、装置、电子设备及介质
CN111341317B (zh) * 2020-02-19 2023-09-01 Oppo广东移动通信有限公司 唤醒音频数据的评价方法、装置、电子设备及介质

Also Published As

Publication number Publication date
CN106847273B (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
US11749414B2 (en) Selecting speech features for building models for detecting medical conditions
CN106782529A (zh) 语音识别的唤醒词选择方法及装置
US10013977B2 (en) Smart home control method based on emotion recognition and the system thereof
Van Nuffelen et al. Speech technology‐based assessment of phoneme intelligibility in dysarthria
CN104217149B (zh) 基于语音的生物认证方法及设备
CN106782536A (zh) 一种语音唤醒方法及装置
CN107871506A (zh) 语音识别功能的唤醒方法及装置
CN105895105B (zh) 语音处理方法及装置
CN111951780B (zh) 语音合成的多任务模型训练方法及相关设备
CN110853617B (zh) 一种模型训练的方法、语种识别的方法、装置及设备
CN104240703B (zh) 语音信息处理方法和装置
CN107220235A (zh) 基于人工智能的语音识别纠错方法、装置及存储介质
CN106847273A (zh) 语音识别的唤醒词选择方法及装置
CN108630193A (zh) 语音识别方法及装置
CN108549662A (zh) 多轮会话中语义解析结果的补充消解方法及装置
CN106653030A (zh) 标点添加方法及装置
CN107170456A (zh) 语音处理方法及装置
CN110222331A (zh) 谎言识别方法及装置、存储介质、计算机设备
US11893813B2 (en) Electronic device and control method therefor
CN107910021A (zh) 一种符号插入方法及装置
US20180197535A1 (en) Systems and Methods for Human Speech Training
CN112562723B (zh) 发音准确度确定方法、装置、存储介质和电子设备
CN105786204A (zh) 信息处理方法和电子设备
EP3244408A1 (en) Method and electronic unit for adjusting playback speed of media files
CN107945802A (zh) 语音识别结果处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 101, 1st floor, building 1, Xisanqi building materials City, Haidian District, Beijing 100096

Patentee after: Yunzhisheng Intelligent Technology Co.,Ltd.

Address before: 100191 Beijing, Huayuan Road, Haidian District No. 2 peony technology building, 5 floor, A503

Patentee before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address