CN106847273B - 语音识别的唤醒词选择方法及装置 - Google Patents
语音识别的唤醒词选择方法及装置 Download PDFInfo
- Publication number
- CN106847273B CN106847273B CN201611208275.XA CN201611208275A CN106847273B CN 106847273 B CN106847273 B CN 106847273B CN 201611208275 A CN201611208275 A CN 201611208275A CN 106847273 B CN106847273 B CN 106847273B
- Authority
- CN
- China
- Prior art keywords
- candidate
- score
- awakening word
- word
- awakening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010187 selection method Methods 0.000 title description 3
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 16
- 230000004069 differentiation Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明是关于一种语音识别的唤醒词选择方法及装置,其中,方法包括:获取多个候选唤醒词;根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。通过该技术方案,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
Description
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别的唤醒词选择方法及装置。
背景技术
目前,相关技术中可以通过语音对设备进行控制,设备不是实时录音并识别语音命令的,而是先识别是否收到唤醒词,如果收到唤醒词则激活,然后识别语音命令。唤醒效果的好坏依赖唤醒词的选择,唤醒词应具有较高的可区分性,从而能提高与非唤醒词语音以及环境音之间区分的正确性。
发明内容
本发明实施例提供一种语音识别的唤醒词选择方法及装置,用以选择可区分性高的唤醒词,从而提高唤醒词与非唤醒词以及环境音之间区分的正确性。
根据本发明实施例的第一方面,提供一种语音识别的唤醒词选择方法,包括:
获取多个候选唤醒词;
根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。
在该实施例中,在选择唤醒词时,根据唤醒词的发音计算每个候选唤醒词的可区分性得分,并根据可区分性得分确定目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述根据每个候选唤醒词的发音,计算出所述每个候选唤醒词对应的可区分性得分,包括:
将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。
在该实施例中,可以通过唤醒词发音来判断其可区分性,进而选择目标唤醒词,从而提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分,包括:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
discriP(wuw)表示唤醒词wuw的区分性,其值越大代表该唤醒词的区分性越好。
在一个实施例中,所述根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词,包括:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
在该实施例中,在选择唤醒词时,根据每个候选唤醒词的发音计算每个候选唤醒词的可区分性得分,并从中选择可区分性得分最高的唤醒词为目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述方法还包括:
接收用户输入的语音信息;
对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;
将所述可信程度分数与预设的阈值分数进行比较;
当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。
在该实施例中,如果用户输入的语音信息对应的文字信息的可信程度分数大于所述预设的阈值分数,则可以开启终端设备的语音识别功能,从而开始识别语音命令。
根据本发明实施例的第二方面,提供一种语音识别的唤醒词选择装置,包括:
获取模块,用于获取多个候选唤醒词;
计算模块,用于根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
确定模块,用于根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。
在一个实施例中,所述计算模块包括:
分解子模块,用于将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
计算子模块,用于根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。
在一个实施例中,所述计算子模块用于:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
在一个实施例中,所述确定模块用于:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
在一个实施例中,所述装置还包括:
接收模块,用于接收用户输入的语音信息;
识别模块,用于对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;
对比模块,用于将所述可信程度分数与预设的阈值分数进行比较;
处理模块,用于当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音识别的唤醒词选择方法的流程图。
图2是根据一示例性实施例示出的一种语音识别的唤醒词选择方法中步骤S102的流程图。
图3是根据一示例性实施例示出的又一种语音识别的唤醒词选择方法的流程图。
图4是根据一示例性实施例示出的另一种语音识别的唤醒词选择方法的流程图。
图5是根据一示例性实施例示出的一种语音识别的唤醒词选择装置的框图。
图6是根据一示例性实施例示出的一种语音识别的唤醒词选择装置中计算模块的框图。
图7是根据一示例性实施例示出的另一种语音识别的唤醒词选择装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种语音识别的唤醒词选择方法的流程图。该一种语音识别的唤醒词选择方法应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音控制功能的设备。如图1所示,该方法包括步骤S101-S103:
在步骤S101中,获取多个候选唤醒词;
在步骤S102中,根据每个候选唤醒词对应的发音,计算出每个候选唤醒词对应的可区分性得分;
在步骤S103中,根据每个候选唤醒词对应的可区分性得分确定目标唤醒词。
在该实施例中,在选择唤醒词时,根据唤醒词的发音计算每个候选唤醒词的可区分性得分,并根据可区分性得分确定目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
图2是根据一示例性实施例示出的一种语音识别的唤醒词选择方法中步骤S102的流程图。
如图2所示,在一个实施例中,上述步骤S102包括步骤S201-S202:
在步骤S201中,将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
在步骤S202中,根据每个候选唤醒词对应的至少一个单音素,计算出每个候选唤醒词对应的可区分性得分。
在该实施例中,可以通过唤醒词发音来判断其可区分性,进而选择目标唤醒词,从而提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,上述步骤S202包括:
从每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据发音不重复的单音素和预设计算公式,计算出每个候选唤醒词对应的可区分性得分,其中,预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量目标单音素与其他单音素的发音区分性的函数,f(Pi)取值范围为[0,1]。
discriP(wuw)表示唤醒词wuw的区分性,其值越大代表该唤醒词的区分性越好。
图3是根据一示例性实施例示出的又一种语音识别的唤醒词选择方法的流程图。
如图3所示,在一个实施例中,上述步骤S103包括步骤S301:
在步骤S301中,将可区分性得分最高的候选唤醒词确定为目标唤醒词。
在该实施例中,在选择唤醒词时,根据每个候选唤醒词的发音计算每个候选唤醒词的可区分性得分,并从中选择可区分性得分最高的唤醒词为目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
图4是根据一示例性实施例示出的另一种语音识别的唤醒词选择方法的流程图。
如图4所示,在一个实施例中,上述方法还包括步骤S401-S404:
在步骤S401中,接收用户输入的语音信息;
在步骤S402中,对语音信息进行识别,得到对应的文字信息及文字信息的可信程度分数;
在步骤S403中,将可信程度分数与预设的阈值分数进行比较;
在步骤S404中,当可信程度分数大于预设的阈值分数时,开启终端设备的语音识别功能。
在该实施例中,如果用户输入的语音信息对应的文字信息的可信程度分数大于所述预设的阈值分数,则可以开启终端设备的语音识别功能,从而开始识别语音命令。
下述为本发明装置实施例,可以用于执行本发明方法实施例。
图5是根据一示例性实施例示出的一种语音识别的唤醒词选择装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图5所示,该语音识别的唤醒词选择装置包括:
获取模块51,用于获取多个候选唤醒词;
计算模块52,用于根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
确定模块53,用于根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词。
在该实施例中,在选择唤醒词时,根据唤醒词的发音计算每个候选唤醒词的可区分性得分,并根据可区分性得分确定目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
图6是根据一示例性实施例示出的一种语音识别的唤醒词选择装置中计算模块的框图。
如图6所示,在一个实施例中,所述计算模块52包括:
分解子模块61,用于将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
第一计算子模块62,用于根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分。
在该实施例中,可以通过唤醒词发音来判断其可区分性,进而选择目标唤醒词,从而提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
在一个实施例中,所述第一计算子模块62用于:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
在一个实施例中,所述确定模块53用于:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
在该实施例中,在选择唤醒词时,根据每个候选唤醒词的发音计算每个候选唤醒词的可区分性得分,并从中选择可区分性得分最高的唤醒词为目标唤醒词,这样,可以保证目标唤醒词具有良好的可区分性,从而可以提高唤醒词与非唤醒词语音以及环境音之间区分的正确性。
图7是根据一示例性实施例示出的另一种语音识别的唤醒词选择装置的框图。
如图7所示,在一个实施例中,上述装置还包括:
接收模块71,用于接收用户输入的语音信息;
识别模块72,用于对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;
对比模块73,用于将所述可信程度分数与预设的阈值分数进行比较;
处理模块74,用于当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。
在该实施例中,如果用户输入的语音信息对应的文字信息的可信程度分数大于所述预设的阈值分数,则可以开启终端设备的语音识别功能,从而开始识别语音命令。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (6)
1.一种语音识别的唤醒词选择方法,用于终端设备,其特征在于,包括:
获取多个候选唤醒词;
根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词;
所述根据每个候选唤醒词的发音,计算出所述每个候选唤醒词对应的可区分性得分,包括:
将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分;
所述根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分,包括:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词,包括:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
接收用户输入的语音信息;
对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;
将所述可信程度分数与预设的阈值分数进行比较;
当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。
4.一种语音识别的唤醒词选择装置,用于终端设备,其特征在于,包括:
获取模块,用于获取多个候选唤醒词;
计算模块,用于根据每个候选唤醒词对应的发音,计算出所述每个候选唤醒词对应的可区分性得分;
确定模块,用于根据所述每个候选唤醒词对应的可区分性得分确定目标唤醒词;
所述计算模块包括:
分解子模块,用于将每个候选唤醒词按照发音分解成至少一个单音素,以形成发音序列;
计算子模块,用于根据所述每个候选唤醒词对应的至少一个单音素,计算出所述每个候选唤醒词对应的可区分性得分;
所述计算子模块用于:
从所述每个候选唤醒词对应的至少一个单音素中选取出发音不重复的单音素;
根据所述发音不重复的单音素和预设计算公式,计算出所述每个候选唤醒词对应的可区分性得分,其中,所述预设计算公式包括:
其中,wuw表示候选唤醒词,discriP(wuw)表示候选唤醒词的可区分性得分,Pi表示所述发音不重复的单音素中的目标单音素,其中,i=1,2……K,f(Pi)为衡量所述目标单音素与其他单音素的发音区分性的函数,所述f(Pi)取值范围为[0,1]。
5.根据权利要求4所述的装置,其特征在于,所述确定模块用于:
将可区分性得分最高的候选唤醒词确定为目标唤醒词。
6.根据权利要求4或5所述的装置,其特征在于,所述装置还包括:
接收模块,用于接收用户输入的语音信息;
识别模块,用于对所述语音信息进行识别,得到对应的文字信息及所述文字信息的可信程度分数;
对比模块,用于将所述可信程度分数与预设的阈值分数进行比较;
处理模块,用于当所述可信程度分数大于所述预设的阈值分数时,开启所述终端设备的语音识别功能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611208275.XA CN106847273B (zh) | 2016-12-23 | 2016-12-23 | 语音识别的唤醒词选择方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611208275.XA CN106847273B (zh) | 2016-12-23 | 2016-12-23 | 语音识别的唤醒词选择方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106847273A CN106847273A (zh) | 2017-06-13 |
CN106847273B true CN106847273B (zh) | 2020-05-05 |
Family
ID=59135326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611208275.XA Active CN106847273B (zh) | 2016-12-23 | 2016-12-23 | 语音识别的唤醒词选择方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106847273B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108039175B (zh) | 2018-01-29 | 2021-03-26 | 北京百度网讯科技有限公司 | 语音识别方法、装置及服务器 |
CN111048068B (zh) * | 2018-10-11 | 2023-04-18 | 阿里巴巴集团控股有限公司 | 语音唤醒方法、装置、系统及电子设备 |
CN111128171A (zh) * | 2019-12-31 | 2020-05-08 | 云知声智能科技股份有限公司 | 一种基于语音识别的设置方法及装置 |
CN111341317B (zh) * | 2020-02-19 | 2023-09-01 | Oppo广东移动通信有限公司 | 唤醒音频数据的评价方法、装置、电子设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999161A (zh) * | 2012-11-13 | 2013-03-27 | 安徽科大讯飞信息科技股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
CN103021409A (zh) * | 2012-11-13 | 2013-04-03 | 安徽科大讯飞信息科技股份有限公司 | 一种语音启动拍照系统 |
CN104575490A (zh) * | 2014-12-30 | 2015-04-29 | 苏州驰声信息科技有限公司 | 基于深度神经网络后验概率算法的口语发音评测方法 |
CN104584119A (zh) * | 2012-07-03 | 2015-04-29 | 谷歌公司 | 确定热词适合度 |
CN104616653A (zh) * | 2015-01-23 | 2015-05-13 | 北京云知声信息技术有限公司 | 唤醒词匹配方法、装置以及语音唤醒方法、装置 |
CN104681036A (zh) * | 2014-11-20 | 2015-06-03 | 苏州驰声信息科技有限公司 | 一种语言音频的检测系统及方法 |
CN104978963A (zh) * | 2014-04-08 | 2015-10-14 | 富士通株式会社 | 语音识别装置、方法以及电子设备 |
CN105654949A (zh) * | 2016-01-07 | 2016-06-08 | 北京云知声信息技术有限公司 | 一种语音唤醒方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19640587A1 (de) * | 1996-10-01 | 1998-04-02 | Siemens Ag | Verfahren zur Berechnung eines Schwellenwertes für die Spracherkennung eines Schlüsselwortes |
US8560318B2 (en) * | 2010-05-14 | 2013-10-15 | Sony Computer Entertainment Inc. | Methods and system for evaluating potential confusion within grammar structure for set of statements to be used in speech recognition during computing event |
CN103971678B (zh) * | 2013-01-29 | 2015-08-12 | 腾讯科技(深圳)有限公司 | 关键词检测方法和装置 |
CN105654943A (zh) * | 2015-10-26 | 2016-06-08 | 乐视致新电子科技(天津)有限公司 | 一种语音唤醒方法、装置及系统 |
-
2016
- 2016-12-23 CN CN201611208275.XA patent/CN106847273B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104584119A (zh) * | 2012-07-03 | 2015-04-29 | 谷歌公司 | 确定热词适合度 |
CN102999161A (zh) * | 2012-11-13 | 2013-03-27 | 安徽科大讯飞信息科技股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
CN103021409A (zh) * | 2012-11-13 | 2013-04-03 | 安徽科大讯飞信息科技股份有限公司 | 一种语音启动拍照系统 |
CN104978963A (zh) * | 2014-04-08 | 2015-10-14 | 富士通株式会社 | 语音识别装置、方法以及电子设备 |
CN104681036A (zh) * | 2014-11-20 | 2015-06-03 | 苏州驰声信息科技有限公司 | 一种语言音频的检测系统及方法 |
CN104575490A (zh) * | 2014-12-30 | 2015-04-29 | 苏州驰声信息科技有限公司 | 基于深度神经网络后验概率算法的口语发音评测方法 |
CN104616653A (zh) * | 2015-01-23 | 2015-05-13 | 北京云知声信息技术有限公司 | 唤醒词匹配方法、装置以及语音唤醒方法、装置 |
CN105654949A (zh) * | 2016-01-07 | 2016-06-08 | 北京云知声信息技术有限公司 | 一种语音唤醒方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106847273A (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106782536B (zh) | 一种语音唤醒方法及装置 | |
CN106782529B (zh) | 语音识别的唤醒词选择方法及装置 | |
US11398236B2 (en) | Intent-specific automatic speech recognition result generation | |
CN106649694B (zh) | 语音交互中确定用户意图的方法及装置 | |
CN106658129B (zh) | 基于情绪的终端控制方法、装置及终端 | |
CN108694940B (zh) | 一种语音识别方法、装置及电子设备 | |
US8738375B2 (en) | System and method for optimizing speech recognition and natural language parameters with user feedback | |
US10706853B2 (en) | Speech dialogue device and speech dialogue method | |
US11455989B2 (en) | Electronic apparatus for processing user utterance and controlling method thereof | |
CN106847273B (zh) | 语音识别的唤醒词选择方法及装置 | |
CN109637521A (zh) | 一种基于深度学习的唇语识别方法及装置 | |
US9984679B2 (en) | System and method for optimizing speech recognition and natural language parameters with user feedback | |
CN110544473B (zh) | 语音交互方法和装置 | |
US9922650B1 (en) | Intent-specific automatic speech recognition result generation | |
CN105282332B (zh) | 语音拨号方法及装置 | |
JP2021105736A (ja) | 情報処理装置、方法及びプログラム | |
CN112735371B (zh) | 一种基于文本信息生成说话人视频的方法及装置 | |
CN110164416B (zh) | 一种语音识别方法及其装置、设备和存储介质 | |
EP3593346A1 (en) | Graphical data selection and presentation of digital content | |
CN114783424A (zh) | 文本语料筛选方法、装置、设备及存储介质 | |
CN111508497B (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN105786204A (zh) | 信息处理方法和电子设备 | |
CN114242047A (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
KR102409873B1 (ko) | 증강된 일관성 정규화를 이용한 음성 인식 모델 학습 방법 및 시스템 | |
CN109273004B (zh) | 基于大数据的预测性语音识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: Room 101, 1st floor, building 1, Xisanqi building materials City, Haidian District, Beijing 100096 Patentee after: Yunzhisheng Intelligent Technology Co.,Ltd. Address before: 100191 Beijing, Huayuan Road, Haidian District No. 2 peony technology building, 5 floor, A503 Patentee before: BEIJING UNISOUND INFORMATION TECHNOLOGY Co.,Ltd. |