CN111124512A - 智能设备的唤醒方法、装置、设备和介质 - Google Patents
智能设备的唤醒方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN111124512A CN111124512A CN201911258333.3A CN201911258333A CN111124512A CN 111124512 A CN111124512 A CN 111124512A CN 201911258333 A CN201911258333 A CN 201911258333A CN 111124512 A CN111124512 A CN 111124512A
- Authority
- CN
- China
- Prior art keywords
- information
- threshold
- attribute information
- voiceprint
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 13
- 230000002618 waking effect Effects 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
- G06F9/4418—Suspend and resume; Hibernate and awake
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了一种智能设备的唤醒方法、装置、设备和介质,用于解决现有的智能设备的唤醒率低的问题。由于本发明实施例在待识别的语音信息的第一声纹信息与保存的第二声纹信息的相似度小于第一阈值时,通过确定该待识别的语音信息的其他属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息时,且该第一声纹信息与保存的第二声纹信息的相似度大于第三阈值时,确定该智能设备被唤醒。该第三阈值小于该第一阈值,由于在存在目标属性信息时,降低了声纹信息比较的阈值,从而降低了第一声纹信息与保存的第二声纹信息的相似度的要求,提高了智能设备的唤醒率。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种智能设备的唤醒方法、装置、设备和介质。
背景技术
近年来,随着自然语言处理技术的发展,越来越多的领域开始应用语音识别技术,例如智能音箱、智能机器人和智能手机等领域,如何提高唤醒率成为近年来研究的一个热点。
现有技术中,智能设备一般是预先录制了目标用户的语音信息,通过声纹模型,获取该目标用户的语音信息的声纹信息,并将该声纹信息进行保存。在后续进行唤醒检测的时候,通过声纹模型,获取采集到的语音信息的声纹信息,判断该声纹信息与预先保存的声纹信息是否匹配,确定是否唤醒智能设备。
由于在预先录制目标用户的语音信息时,或者后续进行唤醒检测时,智能设备采集的语音信息可能会出现采样误差,导致采集的语音信息的声纹信息与预先保存的声纹信息不匹配,从而无法唤醒智能设备。又或者当目标用户生病时,目标用户的发声位置或发出的语音信息出现问题,也会导致采集的语音信息的声纹信息与预先保存的声纹信息不匹配,无法唤醒智能设备,从而降低了智能设备的唤醒率。
发明内容
本发明实施例提供了一种智能设备的唤醒方法、装置、设备和介质,用以解决现有的智能设备的唤醒率低的问题。
本发明实施例提供了一种智能设备的唤醒方法,所述方法包括:
若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度小于第一阈值,获取所述语音信息的除所述第一声纹信息之外的至少一个属性信息;
判断所述至少一个属性信息中是否存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息;
若是,且若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒,其中,所述第三阈值小于所述第一阈值。
进一步地,所述属性信息包括音量信息、频率信息和所述语音信息被输入的时间段的信息。
进一步地,所述若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒之前,所述方法还包括:
根据匹配的所述目标属性信息,确定所述第三阈值。
进一步地,所述根据匹配的所述目标属性信息,确定所述第三阈值包括:
根据匹配的所述目标属性信息的数量,确定所述第三阈值,其中数量越大,所述第三阈值越小;和/或
根据匹配的所述目标属性信息的权重,确定所述第三阈值,其中权重越大,所述第三阈值越小。
进一步地,根据获取的所述待识别的语音信息的至少一个属性信息,对保存的对应属性信息进行更新。
进一步地,若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度不小于第一阈值,则确定所述智能设备被唤醒。
进一步地,若所述至少一个属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息,且所述第一声纹信息与所述第二声纹信息的相似度不大于第三阈值,则确定不唤醒所述智能设备。
本发明实施例提供了一种智能设备的唤醒装置,所述装置包括:
获取模块,用于若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度小于第一阈值,获取所述语音信息的除所述第一声纹信息之外的至少一个属性信息;
判断模块,用于判断所述至少一个属性信息中是否存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息;
唤醒模块,用于若所述至少一个属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息,且若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒,其中,所述第三阈值小于所述第一阈值。
进一步地,所述装置还包括:
确定模块,用于根据匹配的所述目标属性信息,确定所述第三阈值。
进一步地,所述确定模块,具体用于根据匹配的所述目标属性信息的数量,确定所述第三阈值,其中数量越大,所述第三阈值越小;和/或,根据匹配的所述目标属性信息的权重,确定所述第三阈值,其中权重越大,所述第三阈值越小。
进一步地,所述装置还包括:
更新模块,用于根据获取的所述待识别的语音信息的至少一个属性信息,对保存的对应属性信息进行更新。
进一步地,所述唤醒模块,还用于若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度不小于第一阈值,则确定所述智能设备被唤醒。
进一步地,所述唤醒模块,还用于若所述至少一个属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息,且所述第一声纹信息与所述第二声纹信息的相似度不大于第三阈值,则确定不唤醒所述智能设备。
本发明实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现上述任一所述智能设备的唤醒方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述智能设备的唤醒方法的步骤。
由于本发明实施例在待识别的语音信息的第一声纹信息与保存的第二声纹信息的相似度小于第一阈值时,通过确定该待识别的语音信息的其他属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息时,且该第一声纹信息与保存的第二声纹信息的相似度大于第三阈值时,确定该智能设备被唤醒。该第三阈值小于该第一阈值,由于在存在目标属性信息时,降低了声纹信息比较的阈值,从而降低了第一声纹信息与保存的第二声纹信息的相似度的要求,提高了智能设备的唤醒率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种智能设备的唤醒方法过程示意图;
图2为本发明实施例提供的具体的智能设备的唤醒方法过程示意图;
图3为本发明实施例提供的一种智能设备的唤醒装置结构示意图;
图4为本发明实施例提供的一种电子设备结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为了提高智能设备的唤醒率,本发明实施例提供了一种智能设备的唤醒方法、装置、设备和介质。
实施例1:
图1为本发明实施例提供的一种智能设备的唤醒过程示意图,该过程包括以下步骤:
S101:若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度小于第一阈值,获取所述语音信息的除所述第一声纹信息之外的至少一个属性信息。
本发明实施例提供的智能设备的唤醒方法应用于电子设备,该电子设备可以是被唤醒的智能设备本身,也可以是除该智能设备外的,进行唤醒识别并控制该智能设备唤醒的其它设备,其中,该智能设备包括移动终端、智能音箱和智能空调等智能家居设备,进行唤醒识别并控制该智能设备唤醒的其它设备可以是服务器、移动终端等设备。
在获取到该待识别的语音信息后,电子设备对该待识别的语音信息进行处理,通过本地保存的声纹模型,确定该待识别的语音信息的第一声纹信息,并基于该第一声纹信息进行后续处理,从而根据处理结果确定是否唤醒智能设备。
如果控制智能设备唤醒的电子设备是智能设备本身,当智能设备获取到待识别的语音信息后,通过本地保存的声纹模型,确定该待识别的语音信息的第一声纹信息,并基于确定该第一声纹信息进行后续处理,从而根据处理结果确定是否唤醒智能设备。
如果控制智能设备唤醒的电子设备是其它设备,当其它设备获取到待识别的语音信息后,通过本地保存的声纹模型,确定该待识别的语音信息的第一声纹信息,并基于确定该第一声纹信息进行后续处理,从而根据处理结果确定是否向该智能设备发送唤醒指令。
需要说明的是,具体的确定声纹信息的方法属于现有技术,在此不再赘述。
为了实现对待识别的语音信息的判断,电子设备预先录制了目标用户唤醒智能设备的唤醒语音信息,电子设备基于该唤醒语音信息,通过声纹模型,确定该唤醒语音信息对应的第二声纹信息,并将该第二声纹信息进行保存。当电子设备获取到待识别语音信息的第一声纹信息后,判断该第一声纹信息与预先保存的第二声纹信息的相似度是否大于第一阈值,从而确定是否唤醒智能设备。其中,该第一阈值可以是用户预先设置的,也可以是电子设备的开发人员预先设置的。
该电子设备在获取到待识别语音信息的第一声纹信息后,判断该第一声纹信息与保存的第二声纹信息的相似度是否大于第一阈值,当该相似度大于第一阈值时,则确定唤醒智能设备;当该相似度小于第一阈值时,为了提高智能设备的唤醒率,在本发明实施例中并不直接不唤醒智能设备,而是获取该待识别的语音信息的除声纹信息外的至少一个属性特征,针对该至少一个属性信息进行后续判断。
其中,该属性信息是指反应该待识别的语音信息的属性特征的信息,例如音量、频率、音质、音长、音强、重音、韵律等信息。较佳的,在本发明实施例中,选择该获取的待识别的语音信息的至少一个属性特征中最能反映该待识别语音信息声音特征的属性信息,例如音量和频率。
另外,若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度不小于第一阈值,则确定所述智能设备被唤醒。
S102:判断所述至少一个属性信息中是否存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息。
为了实现对获取到的该待识别的语音信息的除声纹信息外的至少一个属性信息进行判断,该电子设备预先保存有根据目标用户的唤醒语音信息确定的各属性信息。
为了判断该待识别的语音信息是否可能为目标用户的语音信息,该电子设备在获取到该待识别的语音信息的至少一种属性信息后,判断该至少一种属性信息中是否存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息。
具体的,该电子设备判断获取到的该待识别的语音信息的至少一种属性信息中的每一种属性信息与保存的对应属性信息的相似度,针对该每一种属性信息,若该属性信息与保存的对应属性信息的相似度大于该属性信息对应的第二阈值,则该属性信息是目标属性信息。
其中,该第二阈值是预先设置的,每一种属性信息均有其对应的第二阈值,并且每一种属性信息对应的第二阈值可以相同。也可以不同。
例如,以该至少一个属性信息为频率信息和音量信息为例进行说明,该电子设备预先保存有目标用户唤醒智能设备的唤醒语音信息的频率信息,判断该待识别的语音信息的频率信息与预先保存的目标用户唤醒智能设备的唤醒语音信息的频率信息的相似度是否大于频率信息对应的第二阈值。
该电子设备预先保存有目标用户唤醒智能设备的唤醒语音信息的音量信息,判断该待识别的语音信息的音量信息与预先保存的目标用户唤醒智能设备的唤醒语音信息的音量信息的相似度是否大于音量信息对应的第二阈值。
S103:若是,且若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒,其中,所述第三阈值小于所述第一阈值。
当该待识别的语音信息的至少一种属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息时,说明该待识别的语音信息有可能是目标用户的语音信息;此时,为了提高智能设备的唤醒率,还需要判断该待识别的语音信息的第一声纹信息与该第二声纹信息的相似度是否大于第三阈值,其中,该第三阈值小于该第一阈值。
在该第一声纹信息与该第二声纹信息的相似度大于该第三阈值时,说明该待识别的语音信息的第一声纹信息与该第二声纹信息相似,此时,确定唤醒该智能设备。
如果控制智能设备唤醒的电子设备是智能设备,当确定该第一声纹信息与该第二声纹信息的相似度大于该第三阈值时,该智能设备唤醒。如果控制智能设备唤醒的电子设备是其它设备,当确定该第一声纹信息与该第二声纹信息的相似度大于该第三阈值时,该其它设备确定唤醒智能设备,向该智能设备发送唤醒指令。
另外,若所述第一声纹信息与所述第二声纹信息的相似度不大于第三阈值,则确定不唤醒所述智能设备。
由于本发明实施例在待识别的语音信息的第一声纹信息与保存的第二声纹信息的相似度小于第一阈值时,通过确定该待识别的语音信息的其他属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息时,且该第一声纹信息与保存的第二声纹信息的相似度大于第三阈值时,确定该智能设备被唤醒。该第三阈值小于该第一阈值,由于在存在目标属性信息时,降低了声纹信息比较的阈值,从而降低了第一声纹信息与保存的第二声纹信息的相似度的要求,提高了智能设备的唤醒率。
实施例2:
为了提高智能设备的唤醒率,在上述实施例的基础上,在本发明实施例中,所述属性信息包括音量信息、频率信息和所述语音信息被输入的时间段的信息。
为了提高智能设备的唤醒率,该电子设备获取的该待识别的语音信息的除第一声纹信息之外的至少一个属性信息包括音量信息、频率信息和该语音信息被输入的时间段的信息。
其中,该音量信息是指该获取到的待识别的语音信息的音量信息,该音量信息可以是该待识别的语音信息的平均音量,也可以是该待识别的语音信息的最高音量和最低音量;该频率信息是指该获取到的待识别的语音信息的频率信息,该频率信息可以是该待识别的语音信息的平均频率,也可以是该待识别的语音信息的最高频率和最低频率;该语音信息被输入的时间段的信息是指该语音信息输入到电子设备的时间所属的一天中的时间段,该时间段可以是具体到一天中的小时的时间段;例如,该语音信息输入到电子设备的时间为2019年11月28日的8点15分。则该时间段是指一天中的8点到9点的时间段。
其中,针对每一个属性信息,分别介绍相似度的确定过程:
1、确定待识别语音信息的音量信息的相似度:获取该待识别的语音信息的最高音量值和最低音量值,分别判断该待识别语音信息的最高音量值和最低音量值与预先保存的对应音量信息的最高音量值和最低音量值的差值的绝对值,确定该差值的绝对值的和,确定该差值的绝对值的和与根据预先保存的音量信息的最高音量值和最低音量值的差值的比值,1与该比值的差值即为该待识别语音信息的音量信息的相似度。
例如,当该待识别的语音信息的最高音量值与最低音量值分别为60分贝和40分贝,预先保存的对应音量信息的最高音量值和最低音量值分别为56分贝和42分贝时,判断该待识别语音信息的最高音量值与预先保存的音量信息的最高音量值差值的绝对值为4分贝,该待识别语音信息的最低音量值与预先保存的音量信息的最低音量值差值的绝对值为2分贝,该差值的绝对值的和为6分贝,该预先保存的音量信息的最高音量值和最低音量值的差值为14分贝,该差值的绝对值的和与预先保存的音量信息的最高音量值和最低音量值的差值的比值为0.43,1与该比值的差值为0.57,该0.57即为该待识别语音信息的音量信息与预先保存的音量信息的相似度。
2、确定待识别语音信息的频率信息的相似度:获取该待识别的语音信息的最高频率值和最低频率值,分别判断该待识别语音信息的最高频率值和最低频率值与预先保存的对应频率信息的最高频率值和最低频率值的差值的绝对值,确定该差值的绝对值的和,确定该差值的绝对值的和与根据预先保存的频率信息的最高频率值和最低频率值的差值的比值,1与该比值的差值即为该待识别语音信息的频率信息的相似度。
例如,当该待识别的语音信息的最高频率值与最低频率值分别为170赫兹和140赫兹,预先保存的对应频率信息的最高频率值和最低频率值分别为166赫兹和142赫兹时,该待识别语音信息的最高频率值与预先保存的频率信息的最高频率值的差值的绝对值为4赫兹,该待识别语音信息的最低频率值与预先保存的频率信息的最低频率值的差值的绝对值为2赫兹,该差值的绝对值的和为6赫兹,该预先保存的频率信息的最高频率值和最低频率值的差值为24赫兹,该差值的绝对值的和与根据预先保存的频率信息的最高频率值和最低频率值的差值的比值为0.25,1与该比值的差值为0.75,该0.75即为该待识别语音信息的频率信息与预先保存的频率信息的相似度。
3、确定该待识别语音信息的被输入的时间段的信息的相似度:获取该待识别的语音信息被输入的时间,确定该待识别的语音信息被输入的时间是否位于预先保存的每个预设时间段中的任意一个内,若是,则该待识别语音信息的被输入的时间段的信息的相似度为1,即完全相似;若否,则该待识别语音信息的被输入的时间段的信息的相似度为0,即完全不相似。
实施例3:
为了提高智能设备的唤醒率,在上述各实施例的基础上,在本发明实施例中,所述判断所述第一声纹信息与所述第二声纹信息的相似度是否大于第三阈值之前,所述方法还包括:
根据匹配的所述目标属性信息,确定所述第三阈值。
该电子设备在确定该待识别的语音信息的至少一个属性特征中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息时,说明该待识别的语音信息可能是目标用户的语音信息,为了提高智能设备的唤醒率,可以采用较第一阈值小的第三阈值继续进行声纹信息相似度的判断。
但是具体采用多大的第三阈值进行判断,可以是在第一阈值的基础上减小设定数值。但为了更准确的提高唤醒率,也可以根据匹配的目标属性信息,确定第三阈值。
在上述各实施例的基础上,在本发明实施例中,所述根据匹配的所述目标属性信息,确定所述第三阈值包括:
根据匹配的所述目标属性信息的数量,确定所述第三阈值,其中数量越大,所述第三阈值越小;和/或
根据匹配的所述目标属性信息的权重,确定所述第三阈值,其中权重越大,所述第三阈值越小。
由于该第三阈值的大小还与匹配的该目标属性信息有关,该匹配的目标属性信息的数量越多时,说明该待识别的语音信息是目标用户的语音信息的可能性越大,因此该第三阈值就可以越小。
当属性信息更能反映该待识别语音信息的声音特征的属性信息时,可以将该属性信息对应的权重就越大,在确定出该匹配的目标属性信息时,如果该目标属性信息的权重值比较大,说明该待识别的语音信息是目标用户的语音信息的可能性越大,因此该第三阈值就可以越小。
具体的,在根据匹配的该目标属性信息,确定该第三阈值时,首先需要确定该目标属性信息分别是何种属性信息。
该电子设备在确定该目标属性信息之后,为了提高智能设备的唤醒率,可以仅根据获取到的该目标属性信息的数量,确定该第三阈值;也可以仅根据获取到的目标属性信息的权重,确定该第三阈值;还可以根据获取到的目标属性信息的数量和权重,确定该第三阈值。
若仅根据获取到的该目标属性信息的数量,确定该第三阈值,具体的,可以预先设置每一个数量对应的第三阈值的大小,其中数量越多,第三阈值就越小。其中该数量不大于保存的目标用户的属性信息的总数量。例如,当匹配的目标属性信息包括音量信息、频率信息和该语音信息被输入的时间段的信息三个时,该第三阈值是最小的,例如可以是0.6;当匹配的目标属性信息包括音量信息、频率信息和所述语音信息被输入的时间段的信息中的任意两个时,该第三阈值较该匹配的目标属性信息的数量为三个时对应的第三阈值大,例如可以是0.7;当匹配的目标属性信息为音量信息、频率信息和该语音信息被输入的时间段的信息中的任意一个时,该第三阈值最大,例如可以是0.8。
若仅根据获取到的该目标属性信息的权重,确定该第三阈值时,具体的,预先设置不同的权重对应的第三阈值,并且预先设置每个属性信息对应的权重,每一种属性信息对应的权重可以相同,也可以不同,其中权重越大,第三阈值就越小。当确定了匹配的目标属性信息后,确定该目标属性信息对应的权重,并根据权重与第三阈值的对应关系,确定该目标属性信息的目标权重对应的第三阈值。
例如,频率信息的权重最大,可以是0.5,该权重值对应的第三阈值最小,例如可以是0.6。语音信息输入的时间段的信息的权重最小,例如可以是0.2,该权重值对应的第三阈值最大,例如可以为0.8。
若根据该目标属性信息的数量和权重,确定该第三阈值时,具体的,预先设置不同的权重对应的第三阈值,并且预先设置每个属性信息对应的权重;当确定了匹配的目标属性信息后,确定该目标属性信息对应的权重,并根据权重与第三阈值的对应关系,确定该目标属性信息的目标权重对应的第三阈值。
以该目标属性信息包括音量信息、频率信息和该语音信息输入的时间段的信息三个时,该音量信息对应的权重为0.3、该频率信息对应的权重为0.5、该语音信息输入的时间段的信息对应的权重为0.2时,该目标属性信息的权重之和为1,此时该权重之和是最大值,该权重之和对应的第三阈值最小,例如可以为0.5。
以该目标属性信息包括音量信息和该语音信息输入的时间段的信息为例,该目标属性信息对应的权重和为最小值,该权重和为0.5,该权重和对应的第三阈值最大的,例如可以为0.6。
实施例4:
为了提高智能设备的唤醒率,在上述各实施例的基础上,在本发明实施例中,所述方法还包括:
根据获取的所述待识别的语音信息的至少一个属性信息,对保存的对应属性信息进行更新。
保存的属性信息是根据目标用户的语音信息获取的,在待识别的语音信息成功唤醒该智能设备后,为了实现更准确地提高智能设备的唤醒率,还需要对该保存的属性信息进行更新。
具体的,该电子设备根据获取的该待识别的语音信息的至少一个属性信息,对保存的对应属性信息进行更新。
例如,该保存的属性信息为音量信息时,电子设备根据获取的该待识别的语音信息中的最高音量值和最低音量值,并确定已保存的语音信息中的最高音量值和获取的该待识别的语音信息中的最高音量值的平均值,并采用该平均值对保存的语音信息的最高音量值进行更新;确定已保存的语音信息中的最低音量值和获取的该待识别的语音信息中的最低音量值的平均值,并采用该平均值对保存的语音信息的最低音量值进行更新。
该保存的属性信息为频率信息时,电子设备根据获取的该待识别的语音信息中的最高频率值和最低频率值,确定已保存的语音信息中的最高频率值和获取的该待识别的语音信息中的最高频率值的平均值,并采用该平均值对保存的语音信息中的最高频率值进行更新;确定已保存的语音信息中的最低频率值和获取的该待识别的语音信息中的最低频率值的平均值,并采用该平均值对保存的语音信息中的最低频率值进行更新。
该保存的属性信息为语音信息被输入的时间段的信息时,对预先保存的该时间段对应的频次进行更新,根据更新后的频次,确定是否将该时间段更新到预设时间段内。例如预设时间段包括6个,如果该时间段更新后的频次按照大小排序,排列到了第6位及之前,则将该时间段更新到预设时间段内,也就是作为一个预设时间段,否则不将该时间段更新到预设时间段内。
实施例5:
图2为本发明实施例提供的具体的智能设备的唤醒方法过程示意图,以该执行主体为智能设备本身为例,该预先保存的根据目标用户的唤醒语音信息确定的各属性信息保存在该智能设备的数据库中。
S201:智能设备获取待识别的语音信息的第一声纹信息。
S202:判断该第一声纹信息与预先保存的第二声纹信息的相似度是否小于第一阈值,若是,则进入S203,若否,则进入S207。
S203:获取该待识别的语音信息的述第一声纹信息之外的至少一个属性信息。
S204:判断至少一个属性信息中是否存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息。若是,则进入S205,若否,则进入S208。
S205:根据匹配的目标属性信息的数量,确定第三阈值;和/或根据匹配的目标属性信息的权重,确定第三阈值。
S206:判断第一声纹信息与第二声纹信息的相似度是否大于第三阈值。若是,则进入S207,若否,则进入S208。
S207:唤醒智能设备。其中,成功唤醒智能设备的待识别的语音信息也会添加到该智能设备的数据库中。
S208:不唤醒智能设备。
实施例6:
图3为本发明实施例提供的一种智能设备的唤醒装置结构示意图,所述装置包括:
获取模块301,用于若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度小于第一阈值,获取所述语音信息的除所述第一声纹信息之外的至少一个属性信息;
判断模块302,用于判断所述至少一个属性信息中是否存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息;
唤醒模块303,用于若所述至少一个属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息,且若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒,其中,所述第三阈值小于所述第一阈值。
所述装置还包括:
确定模块304,根据匹配的所述目标属性信息,确定所述第三阈值。
所述确定模块304,具体用于根据匹配的所述目标属性信息的数量,确定所述第三阈值,其中数量越大,所述第三阈值越小;和/或根据匹配的所述目标属性信息的权重,确定所述第三阈值,其中权重越大,所述第三阈值越小。
所述装置还包括:
更新模块305,用于根据获取的所述待识别的语音信息的至少一个属性信息,对保存的对应属性信息进行更新。
所述唤醒模块303,还用于若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度不小于第一阈值,则确定所述智能设备被唤醒。
所述唤醒模块303,还用于若所述至少一个属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息,且所述第一声纹信息与所述第二声纹信息的相似度不大于第三阈值,则确定不唤醒所述智能设备。
由于本发明实施例在待识别的语音信息的第一声纹信息与保存的第二声纹信息的相似度小于第一阈值时,通过确定该待识别的语音信息的其他属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息时,且该第一声纹信息与保存的第二声纹信息的相似度大于第三阈值时,确定该智能设备被唤醒。该第三阈值小于该第一阈值,由于在存在目标属性信息时,降低了声纹信息比较的阈值,从而降低了第一声纹信息与保存的第二声纹信息的相似度的要求,提高了智能设备的唤醒率。
实施例7:
如图4为本发明实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本发明实施例中还提供了一种电子设备,包括处理器401和存储器402;
处理器401用于执行存储器402中存储的计算机程序时实现上述智能设备的唤醒方法的步骤。
可选的,处理器401可以是CPU(中央处埋器)、ASIC(Application SpecificIntegrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或CPLD(Complex Programmable Logic Device,复杂可编程逻辑器件)。
处理器401,用于按照存储器402中存储的计算机程序时执行如下步骤:
若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度小于第一阈值,获取所述语音信息的除所述第一声纹信息之外的至少一个属性信息;
判断所述至少一个属性信息中是否存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息;
若是,且若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒,其中,所述第三阈值小于所述第一阈值。
所述属性信息包括音量信息、频率信息和所述语音信息被输入的时间段的信息。
所述若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒之前,所述方法还包括:
根据匹配的所述目标属性信息,确定所述第三阈值。
所述根据匹配的所述目标属性信息,确定所述第三阈值包括:
根据匹配的所述目标属性信息的数量,确定所述第三阈值,其中数量越大,所述第三阈值越小;和/或
根据匹配的所述目标属性信息的权重,确定所述第三阈值,其中权重越大,所述第三阈值越小。
所述方法还包括:
根据获取的所述待识别的语音信息的至少一个属性信息,对保存的对应属性信息进行更新。
所述方法还包括:
若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度不小于第一阈值,则确定所述智能设备被唤醒。
所述方法还包括:
若所述至少一个属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息,且所述第一声纹信息与所述第二声纹信息的相似度不大于第三阈值,则确定不唤醒所述智能设备。
由于本发明实施例在待识别的语音信息的第一声纹信息与保存的第二声纹信息的相似度小于第一阈值时,通过确定该待识别的语音信息的其他属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息时,且该第一声纹信息与保存的第二声纹信息的相似度大于第三阈值时,确定该智能设备被唤醒。该第三阈值小于该第一阈值,由于在存在目标属性信息时,降低了声纹信息比较的阈值,从而降低了第一声纹信息与保存的第二声纹信息的相似度的要求,提高了智能设备的唤醒率。
实施例8:
在上述各实施例的基础上,本发明实施例提供的一种计算机可读存储介质,所述计算机可读存储介质内存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行时实现如下步骤:
若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度小于第一阈值,获取所述语音信息的除所述第一声纹信息之外的至少一个属性信息;
判断所述至少一个属性信息中是否存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息;
若是,且若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒,其中,所述第三阈值小于所述第一阈值。
所述属性信息包括音量信息、频率信息和所述语音信息被输入的时间段的信息。
所述若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒之前,所述方法还包括:
根据匹配的所述目标属性信息,确定所述第三阈值。
所述根据匹配的所述目标属性信息,确定所述第三阈值包括:
根据匹配的所述目标属性信息的数量,确定所述第三阈值,其中数量越大,所述第三阈值越小;和/或
根据匹配的所述目标属性信息的权重,确定所述第三阈值,其中权重越大,所述第三阈值越小。
所述方法还包括:
根据获取的所述待识别的语音信息的至少一个属性信息,对保存的对应属性信息进行更新。
所述方法还包括:
若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度不小于第一阈值,则确定所述智能设备被唤醒。
所述方法还包括:
若所述至少一个属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息,且所述第一声纹信息与所述第二声纹信息的相似度不大于第三阈值,则确定不唤醒所述智能设备。
由于本发明实施例在待识别的语音信息的第一声纹信息与保存的第二声纹信息的相似度小于第一阈值时,通过确定该待识别的语音信息的其他属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息时,且该第一声纹信息与保存的第二声纹信息的相似度大于第三阈值时,确定该智能设备被唤醒。该第三阈值小于该第一阈值,由于在存在目标属性信息时,降低了声纹信息比较的阈值,从而降低了第一声纹信息与保存的第二声纹信息的相似度的要求,提高了智能设备的唤醒率。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (15)
1.一种智能设备的唤醒方法,其特征在于,所述方法包括:
若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度小于第一阈值,获取所述语音信息的除所述第一声纹信息之外的至少一个属性信息;
判断所述至少一个属性信息中是否存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息;
若是,且若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒,其中,所述第三阈值小于所述第一阈值。
2.根据权利要求1所述的方法,其特征在于,所述属性信息包括音量信息、频率信息和所述语音信息被输入的时间段的信息。
3.根据权利要求1所述的方法,其特征在于,所述若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒之前,所述方法还包括:
根据匹配的所述目标属性信息,确定所述第三阈值。
4.根据权利要求3所述的方法,其特征在于,所述根据匹配的所述目标属性信息,确定所述第三阈值包括:
根据匹配的所述目标属性信息的数量,确定所述第三阈值,其中数量越大,所述第三阈值越小;和/或
根据匹配的所述目标属性信息的权重,确定所述第三阈值,其中权重越大,所述第三阈值越小。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据获取的所述待识别的语音信息的至少一个属性信息,对保存的对应属性信息进行更新。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度不小于第一阈值,则确定所述智能设备被唤醒。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述至少一个属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息,且所述第一声纹信息与所述第二声纹信息的相似度不大于第三阈值,则确定不唤醒所述智能设备。
8.一种智能设备的唤醒装置,其特征在于,所述装置包括:
获取模块,用于若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度小于第一阈值,获取所述语音信息的除所述第一声纹信息之外的至少一个属性信息;
判断模块,用于判断所述至少一个属性信息中是否存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息;
唤醒模块,用于若所述至少一个属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息,且若所述第一声纹信息与所述第二声纹信息的相似度大于第三阈值,则确定所述智能设备被唤醒,其中,所述第三阈值小于所述第一阈值。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
确定模块,用于根据匹配的所述目标属性信息,确定所述第三阈值。
10.根据权利要求9所述的装置,其特征在于,所述确定模块,具体用于根据匹配的所述目标属性信息的数量,确定所述第三阈值,其中数量越大,所述第三阈值越小;和/或,根据匹配的所述目标属性信息的权重,确定所述第三阈值,其中权重越大,所述第三阈值越小。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
更新模块,用于根据获取的所述待识别的语音信息的至少一个属性信息,对保存的对应属性信息进行更新。
12.根据权利要求8所述的装置,其特征在于,所述唤醒模块,还用于若获取待识别的语音信息的第一声纹信息与预先保存的第二声纹信息的相似度不小于第一阈值,则确定所述智能设备被唤醒。
13.根据权利要求8所述的装置,其特征在于,所述唤醒模块,还用于若所述至少一个属性信息中存在与保存的对应属性信息的相似度大于对应的第二阈值的目标属性信息,且所述第一声纹信息与所述第二声纹信息的相似度不大于第三阈值,则确定不唤醒所述智能设备。
14.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7中任一所述智能设备的唤醒方法的步骤。
15.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述智能设备的唤醒方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911258333.3A CN111124512B (zh) | 2019-12-10 | 2019-12-10 | 智能设备的唤醒方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911258333.3A CN111124512B (zh) | 2019-12-10 | 2019-12-10 | 智能设备的唤醒方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111124512A true CN111124512A (zh) | 2020-05-08 |
CN111124512B CN111124512B (zh) | 2020-12-08 |
Family
ID=70498041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911258333.3A Active CN111124512B (zh) | 2019-12-10 | 2019-12-10 | 智能设备的唤醒方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111124512B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724795A (zh) * | 2020-06-17 | 2020-09-29 | 海尔优家智能科技(北京)有限公司 | 一种相册播放方法及装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105183081A (zh) * | 2015-09-07 | 2015-12-23 | 北京君正集成电路股份有限公司 | 一种智能眼镜的语音控制方法及智能眼镜 |
CN105280180A (zh) * | 2014-06-11 | 2016-01-27 | 中兴通讯股份有限公司 | 一种终端控制方法、装置、语音控制装置及终端 |
CN105702253A (zh) * | 2016-01-07 | 2016-06-22 | 北京云知声信息技术有限公司 | 一种语音唤醒方法及装置 |
CN106446652A (zh) * | 2016-09-13 | 2017-02-22 | 青岛海信移动通信技术股份有限公司 | 移动终端的解锁方法及装置 |
CN108735209A (zh) * | 2018-04-28 | 2018-11-02 | 广东美的制冷设备有限公司 | 唤醒词绑定方法、智能设备及存储介质 |
CN108766446A (zh) * | 2018-04-18 | 2018-11-06 | 上海问之信息科技有限公司 | 声纹识别方法、装置、存储介质及音箱 |
CN108766438A (zh) * | 2018-06-21 | 2018-11-06 | Oppo广东移动通信有限公司 | 人机交互方法、装置、存储介质及智能终端 |
CN109235590A (zh) * | 2018-09-26 | 2019-01-18 | 深圳市博电电子技术有限公司 | 智能马桶控制方法与智能马桶 |
US20190214010A1 (en) * | 2016-08-15 | 2019-07-11 | Goertek Inc. | Method and apparatus for voice interaction control of smart device |
CN110459222A (zh) * | 2019-09-06 | 2019-11-15 | Oppo广东移动通信有限公司 | 语音控制方法、语音控制装置及终端设备 |
-
2019
- 2019-12-10 CN CN201911258333.3A patent/CN111124512B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105280180A (zh) * | 2014-06-11 | 2016-01-27 | 中兴通讯股份有限公司 | 一种终端控制方法、装置、语音控制装置及终端 |
CN105183081A (zh) * | 2015-09-07 | 2015-12-23 | 北京君正集成电路股份有限公司 | 一种智能眼镜的语音控制方法及智能眼镜 |
CN105702253A (zh) * | 2016-01-07 | 2016-06-22 | 北京云知声信息技术有限公司 | 一种语音唤醒方法及装置 |
US20190214010A1 (en) * | 2016-08-15 | 2019-07-11 | Goertek Inc. | Method and apparatus for voice interaction control of smart device |
CN106446652A (zh) * | 2016-09-13 | 2017-02-22 | 青岛海信移动通信技术股份有限公司 | 移动终端的解锁方法及装置 |
CN108766446A (zh) * | 2018-04-18 | 2018-11-06 | 上海问之信息科技有限公司 | 声纹识别方法、装置、存储介质及音箱 |
CN108735209A (zh) * | 2018-04-28 | 2018-11-02 | 广东美的制冷设备有限公司 | 唤醒词绑定方法、智能设备及存储介质 |
CN108766438A (zh) * | 2018-06-21 | 2018-11-06 | Oppo广东移动通信有限公司 | 人机交互方法、装置、存储介质及智能终端 |
CN109235590A (zh) * | 2018-09-26 | 2019-01-18 | 深圳市博电电子技术有限公司 | 智能马桶控制方法与智能马桶 |
CN110459222A (zh) * | 2019-09-06 | 2019-11-15 | Oppo广东移动通信有限公司 | 语音控制方法、语音控制装置及终端设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724795A (zh) * | 2020-06-17 | 2020-09-29 | 海尔优家智能科技(北京)有限公司 | 一种相册播放方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111124512B (zh) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106782536B (zh) | 一种语音唤醒方法及装置 | |
CN109427333B (zh) | 激活语音识别服务的方法和用于实现所述方法的电子装置 | |
US10332507B2 (en) | Method and device for waking up via speech based on artificial intelligence | |
CN107784357B (zh) | 基于多模态深度神经网络的个性化智能唤醒系统及方法 | |
CN108564951B (zh) | 智能降低语音控制设备误唤醒概率的方法 | |
CN105654949B (zh) | 一种语音唤醒方法及装置 | |
CN111161728B (zh) | 一种智能设备的唤醒方法、装置、设备及介质 | |
CN110782891B (zh) | 一种音频处理方法、装置、计算设备及存储介质 | |
CN111968644B (zh) | 智能设备唤醒方法、装置及电子设备 | |
CN103632667A (zh) | 声学模型优化方法、装置及语音唤醒方法、装置和终端 | |
CN111312222B (zh) | 一种唤醒、语音识别模型训练方法及装置 | |
CN110070857B (zh) | 语音唤醒模型的模型参数调整方法及装置、语音设备 | |
CN111128155B (zh) | 一种智能设备的唤醒方法、装置、设备及介质 | |
CN111091813B (zh) | 语音唤醒模型更新及唤醒方法、系统、装置、设备及介质 | |
CN108509225B (zh) | 一种信息处理方法及电子设备 | |
CN110544468B (zh) | 应用唤醒方法、装置、存储介质及电子设备 | |
CN111667818A (zh) | 一种训练唤醒模型的方法及装置 | |
CN110634468B (zh) | 语音唤醒方法、装置、设备及计算机可读存储介质 | |
CN110992962B (zh) | 语音设备的唤醒调整方法、装置、语音设备及存储介质 | |
CN108847243B (zh) | 声纹特征更新方法、装置、存储介质及电子设备 | |
CN111124512B (zh) | 智能设备的唤醒方法、装置、设备和介质 | |
CN111128174A (zh) | 一种语音信息的处理方法、装置、设备及介质 | |
CN112185382A (zh) | 一种唤醒模型的生成和更新方法、装置、设备及介质 | |
CN110580897A (zh) | 音频校验方法、装置、存储介质及电子设备 | |
CN111161745A (zh) | 一种智能设备的唤醒方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |