CN109036393A - 家电设备的唤醒词训练方法、装置及家电设备 - Google Patents
家电设备的唤醒词训练方法、装置及家电设备 Download PDFInfo
- Publication number
- CN109036393A CN109036393A CN201810628693.7A CN201810628693A CN109036393A CN 109036393 A CN109036393 A CN 109036393A CN 201810628693 A CN201810628693 A CN 201810628693A CN 109036393 A CN109036393 A CN 109036393A
- Authority
- CN
- China
- Prior art keywords
- word
- wake
- characteristic information
- voice messaging
- data sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000002618 waking effect Effects 0.000 claims abstract description 27
- 238000010606 normalization Methods 0.000 claims abstract description 15
- 238000004321 preservation Methods 0.000 claims abstract description 13
- 239000000284 extract Substances 0.000 claims abstract description 12
- 238000004590 computer program Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000032258 transport Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000238558 Eucarida Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 210000003733 optic disk Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明公开了一种家电设备的唤醒词训练方法、装置及家电设备,其中,该方法包括:以预设音频格式采集唤醒词的语音数据样本;提取语音数据样本的特征信息;对特征信息进行归一化,并判断归一化后的特征信息是否满足预设条件;如果满足预设条件,则将唤醒词的语音数据样本保存至自定义唤醒词库中。本发明实施例的家电设备的唤醒词训练方法、装置及家电设备,通过以预设音频格式采集唤醒词的语音数据样本,并提取语音数据样本的特征信息,以及对特征信息进行归一化,并判断归一化后的特征信息是否满足预设条件,如果满足预设条件,则将唤醒词的语音数据样本保存至自定义唤醒词库中,从而实现用户自定义唤醒词,满足用户的个性化需求。
Description
技术领域
本发明涉及家用电器技术领域,尤其涉及一种家电设备的唤醒词训练方法、装置及家电设备。
背景技术
随着科技的不断进步,语音识别技术开发出的产品应用领域越来越广泛,涉及车载系统、机器人、家庭服务、银行服务、医疗服务、工业控制等等。目前,语音识别技术主要分为两类,一类是云端语义识别,通过网络将语音信号传输到服务器进行语义分析和理解,再通过网络将结果传输。典型代表:苹果的Siri(语音助手)、亚马逊的echo音箱、微软小冰等等。但是该方法必须有网络才能使用,使用场景受限制。另一类是本地词条识别,无需使用网络,通过本机内嵌高性能处理器,能够实时处理语音控制命令词。但其只能识别预先设定好的语音控制命令词条,需识别到完整的语音控制命令词条以后才会响应,不能实现自由语义理解,用户体验感不高。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种家电设备的唤醒词训练方法,能够实现用户自定义唤醒词,满足用户的个性化需求。
本发明的第二个目的在于提出一种家电设备的唤醒词训练装置。
本发明的第三个目的在于提出一种非临时性计算机可读存储介质。
本发明的第四个目的在于提出一种家电设备。
为达上述目的,本发明第一方面实施例提出了一种家电设备的唤醒词训练方法,包括:
以预设音频格式采集唤醒词的语音数据样本;
提取所述语音数据样本的特征信息;
对所述特征信息进行归一化,并判断所述归一化后的特征信息是否满足预设条件;
如果满足所述预设条件,则将所述唤醒词的语音数据样本保存至自定义唤醒词库中。
可选的,方法还包括:
如果不满足所述预设条件,则重新采集所述唤醒词的语音数据样本。
可选的,方法还包括:
在以预设音频格式采集唤醒词的语音数据样本之后,对所述语音数据样本进行去躁处理。
可选的,方法还包括:
在以预设音频格式采集唤醒词的语音数据样本之前,控制家电设备进入自定义唤醒词模式。
可选的,方法还包括:
接收输入的语音信息;
基于所述自定义唤醒词库识别所述语音信息是否为自定义唤醒词;
如果所述语音信息为自定义唤醒词,则生成唤醒指令,并根据所述唤醒指令唤醒家电设备。
可选的,基于所述自定义唤醒词库识别所述语音信息是否为自定义唤醒词,包括:
提取所述语音信息的特征信息;
对所述语音信息的特征信息进行归一化,并采用动态时间规划算法,将所述语音信息的特征信息与所述自定义唤醒词库中的唤醒词的特征信息进行比对;
获取相似度最高的比对结果;
如果相似度最高的比对结果满足设定值,则确定所述语音信息为自定义唤醒词;
如果相似度最高的比对结果不满足设定值,则确定所述语音信息不为自定义唤醒词。
可选的,方法还包括:
如果所述语音信息不为自定义唤醒词,则提示重新输入语音信息。
本发明实施例的家电设备的唤醒词训练方法,通过以预设音频格式采集唤醒词的语音数据样本,并提取所述语音数据样本的特征信息,以及对所述特征信息进行归一化,并判断所述归一化后的特征信息是否满足预设条件,如果满足所述预设条件,则将所述唤醒词的语音数据样本保存至自定义唤醒词库中,从而实现用户自定义唤醒词,满足用户的个性化需求。
为达上述目的,本发明第二方面实施例提出了一种家电设备的唤醒词训练装置,包括:
采集模块,用于以预设音频格式采集唤醒词的语音数据样本;
提取模块,用于提取所述语音数据样本的特征信息;
判断模块,用于对所述特征信息进行归一化,并判断所述归一化后的特征信息是否满足预设条件;
保存模块,用于如果满足所述预设条件,则将所述唤醒词的语音数据样本保存至自定义唤醒词库中。
可选的,所述采集模块,还用于:
如果不满足所述预设条件,则重新采集所述唤醒词的语音数据样本。
可选的,所述装置还包括:
预处理模块,用于在以预设音频格式采集唤醒词的语音数据样本之后,对所述语音数据样本进行去躁处理。
可选的,所述装置还包括:
控制模块,用于在以预设音频格式采集唤醒词的语音数据样本之前,控制家电设备进入自定义唤醒词模式。
可选的,所述装置还包括:
接收模块,用于接收输入的语音信息;
识别模块,用于基于所述自定义唤醒词库识别所述语音信息是否为自定义唤醒词;
唤醒模块,用于如果所述语音信息为自定义唤醒词,则生成唤醒指令,并根据所述唤醒指令唤醒家电设备。
可选的,所述识别模块,用于:
提取所述语音信息的特征信息;
对所述语音信息的特征信息进行归一化,并采用动态时间规划算法,将所述语音信息的特征信息与所述自定义唤醒词库中的唤醒词的特征信息进行比对;
获取相似度最高的比对结果;
如果相似度最高的比对结果满足设定值,则确定所述语音信息为自定义唤醒词;
如果相似度最高的比对结果不满足设定值,则确定所述语音信息不为自定义唤醒词。
可选的,所述装置还包括:
提示模块,用于如果所述语音信息不为自定义唤醒词,则提示重新输入语音信息。
本发明实施例的家电设备的唤醒词训练装置,通过以预设音频格式采集唤醒词的语音数据样本,并提取所述语音数据样本的特征信息,以及对所述特征信息进行归一化,并判断所述归一化后的特征信息是否满足预设条件,如果满足所述预设条件,则将所述唤醒词的语音数据样本保存至自定义唤醒词库中,从而实现用户自定义唤醒词,满足用户的个性化需求。
为达上述目的,本发明第三方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面实施例所述的家电设备的唤醒词训练方法。
为达上述目的,本发明第四方面实施例提出了一种家电设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器用于执行如第一方面实施例所述的家电设备的唤醒词训练方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明一实施例提出的家电设备的唤醒词训练方法的流程图;
图2为本发明一实施例提出的多次训练相同的唤醒词的流程示意图;
图3为本发明另一实施例提出的家电设备的唤醒词训练方法的流程图;
图4为本发明又一实施例提出的家电设备的唤醒词训练方法的流程图;
图5为本发明一实施例提出的家电设备的唤醒词训练装置的结构框图;
图6为本发明另一实施例提出的家电设备的唤醒词训练装置的结构框图;
图7为本发明又一实施例提出的家电设备的唤醒词训练装置的结构框图;
图8为本发明再一实施例提出的家电设备的唤醒词训练装置的结构框图;
图9为本发明一具体实施例提出的家电设备的唤醒词训练装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
目前,语音识别技术主要是云端语义识别和本地词条识别两种方式。云端语义识别必须依靠网络才能使用,使用场景受限制。本地词条识别只能识别预先设定好的语音控制命令词条,不能实现自由语义理解。为此本发明提出一种家电设备的唤醒词训练方法,能够自定义本地唤醒词,满足个性化需求,且无需依靠网络,响应速度快,不受场景限制。
下面参考附图描述本发明实施例的家电设备的唤醒词训练方法、装置及家用电器。
图1为本发明一实施例提出的家电设备的唤醒词训练方法的流程图。
如图1所示,家电设备的唤醒词训练方法,包括:
S101,以预设音频格式采集唤醒词的语音数据样本。
在智能语音交互领域中,用户可通过唤醒词将处于休眠状态的设备唤醒。而该唤醒词通常为厂家预先定义的,无法更改,不能满足用户个性化的需求。因此,本实施例为家用电器设置一个自定义唤醒词模式,可以让用户训练出一个符合自身需求的自定义唤醒词。
在本发明的一个实施例中,用户在训练自定义唤醒词之前,可先控制家电设备进入自定义唤醒词模式。其中,进入的方式可以采用触发实体按键或者发出语音指令等方式。在家电设备进入自定义唤醒词模式之后,可提醒用户想要设置的唤醒词。在预定时间段内如5秒内,用户说出唤醒词。此时,家电设备可通过麦克风等语音输入装置以预设音频格式采集唤醒词的语音数据样本。例如,按照采样频率16Khz、传输速率16Bit的格式来采集声音信号。如果5秒内,用户没有说出唤醒词,则可提醒用户重新输入。
S102,提取语音数据样本的特征信息。
其中,特征信息的提取可以采用MFCC(Mel频率倒谱系数)或其他特征提取算法进行提取。而语音按照频率的高低,可分为低频、中频和高频。因此,在提取特征时,可在低频范围、中频范围和高频范围内,分别提取特征信息。且低频范围的特征信息、中频范围的特征信息和高频范围的特征信息所对应的权重值不同。其中,特征信息可包括声音强度大小、男声或女声等特征。
S103,对特征信息进行归一化,并判断归一化后的特征信息是否满足预设条件。
其中,归一化是将特征信息经过处理后(通过一定的算法)限制在一定范围内,从而使得归一化后的特征信息能够与预设条件进行比对判断。例如:长度特征与预设长度范围相比,是否过短或过长;或者强度特征与预设强度范围相比,是否过大或过小等等。
S104,如果满足预设条件,则将唤醒词的语音数据样本保存至自定义唤醒词库中。
如果归一化后的特征信息满足预设条件,则说明该唤醒词训练成功,即将唤醒词的语音数据样本保存至自定义唤醒词库中。
此外,家电设备的唤醒词训练方法还可包括:
S105,如果不满足预设条件,则重新采集唤醒词的语音数据样本。
如果归一化后的特征信息不满足预设条件,则家电设备可提醒用户重新输入唤醒词,从而重新采集唤醒词的语音数据样本。
当然,为了提高准确率,可进行多次的相同的唤醒词的训练。如图2所示,三次采集用户说出的相同的唤醒词,分别提取特征信息,经过归一化处理,然后对归一化后的特征信息进行过滤检测,筛选出满足条件的特征信息(训练成功的唤醒词)。最后将训练好的唤醒词存储在本地的自定义唤醒词库中。
本发明实施例的家电设备的唤醒词训练方法,通过以预设音频格式采集唤醒词的语音数据样本,并提取语音数据样本的特征信息,以及对特征信息进行归一化,并判断归一化后的特征信息是否满足预设条件,如果满足预设条件,则将唤醒词的语音数据样本保存至自定义唤醒词库中,从而实现用户自定义唤醒词,满足用户的个性化需求。
在本发明的另一个实施例中,如图3所示,家电设备的唤醒词训练方法还可包括:
S106,在以预设音频格式采集唤醒词的语音数据样本之后,对语音数据样本进行去躁处理。
由于环境噪声、其他干扰声音的影响,在采集用户说出的唤醒词时,需要先对采集到的语音数据样本进行去躁处理,从而避免噪声影响,提高精准度。
在本发明的又一个实施例中,如图4所示,家电设备的唤醒词训练方法还可包括:
S401,接收输入的语音信息。
在自定义唤醒词成功时候,便可以利用自定义唤醒词唤醒家电设备。
在本发明的一个实施例中,可接收用户输入的语音信息。
S402,基于自定义唤醒词库识别语音信息是否为自定义唤醒词。
在此之后,可基于自定义唤醒词库来识别语音信息是否为自定义唤醒词。
具体地,可提取语音信息的特征信息,对语音信息的特征信息进行归一化,然后采用动态时间规划算法,将语音信息的特征信息与自定义唤醒词库中的所有的唤醒词的特征信息进行比对。例如,分别计算语音信息的特征信息B与自定义唤醒词库中的唤醒词A1的特征信息、唤醒词A2的特征信息、唤醒词A3的特征信息的相似度。
之后,获取相似度最高的比对结果。如果相似度最高的比对结果满足设定值,则确定语音信息为自定义唤醒词;如果相似度最高的比对结果不满足设定值,则确定语音信息不为自定义唤醒词。
S403,如果语音信息为自定义唤醒词,则生成唤醒指令,并根据唤醒指令唤醒家电设备。
此外,S404,如果语音信息不为自定义唤醒词,则提示重新输入语音信息。
本实施例通过本地的自定义唤醒词库来识别用户输入的语音信息是否为自定义唤醒词,相比于传统的联网识别,响应速度更快,且不受网络限制,使用场景更丰富。
为实现上述实施例,本发明还提出一种家电设备的唤醒词训练装置。
图5为本发明一实施例提出的家电设备的唤醒词训练装置的结构框图。
如图5所示,家电设备的唤醒词训练装置可包括采集模块510、提取模块520、判断模块530和保存模块540。
其中,采集模块510,用于以预设音频格式采集唤醒词的语音数据样本。
提取模块520,用于提取语音数据样本的特征信息。
判断模块530,用于对特征信息进行归一化,并判断归一化后的特征信息是否满足预设条件。
保存模块540,用于如果满足预设条件,则将唤醒词的语音数据样本保存至自定义唤醒词库中。
在本发明的另一个实施例中,如图6所示,家电设备的唤醒词训练装置还可包括预处理模块550。
预处理模块550,用于在以预设音频格式采集唤醒词的语音数据样本之后,对语音数据样本进行去躁处理。
在本发明的又一个实施例中,如图7所示,家电设备的唤醒词训练装置还可包括控制模块560。
控制模块560,用于在以预设音频格式采集唤醒词的语音数据样本之前,控制家电设备进入自定义唤醒词模式。
在本发明的再一个实施例中,如图8所示,家电设备的唤醒词训练装置还可包括接收模块810、识别模块820和唤醒模块830。
接收模块810,用于接收输入的语音信息。
识别模块820,用于基于自定义唤醒词库识别语音信息是否为自定义唤醒词。
唤醒模块830,用于如果语音信息为自定义唤醒词,则生成唤醒指令,并根据唤醒指令唤醒家电设备。
在本发明的一个具体实施例中,如图9所示,家电设备的唤醒词训练装置还可包括提示模块840。
提示模块840,用于如果语音信息不为自定义唤醒词,则提示重新输入语音信息。
需要说明的是,前述对家电设备的唤醒词训练方法的解释说明,也适用于本发明实施例的家电设备的唤醒词训练装置,本发明实施例中未公布的细节,在此不再赘述。
本发明实施例的家电设备的唤醒词训练装置,通过以预设音频格式采集唤醒词的语音数据样本,并提取语音数据样本的特征信息,以及对特征信息进行归一化,并判断归一化后的特征信息是否满足预设条件,如果满足预设条件,则将唤醒词的语音数据样本保存至自定义唤醒词库中,从而实现用户自定义唤醒词,满足用户的个性化需求。
为实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面实施例的家电设备的唤醒词训练方法。
为实现上述实施例,本发明还提出一种家电设备,包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,处理器用于执行如第一方面实施例的家电设备的唤醒词训练方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (16)
1.一种家电设备的唤醒词训练方法,其特征在于,包括:
以预设音频格式采集唤醒词的语音数据样本;
提取所述语音数据样本的特征信息;
对所述特征信息进行归一化,并判断所述归一化后的特征信息是否满足预设条件;
如果满足所述预设条件,则将所述唤醒词的语音数据样本保存至自定义唤醒词库中。
2.如权利要求1所述的方法,其特征在于,还包括:
如果不满足所述预设条件,则重新采集所述唤醒词的语音数据样本。
3.如权利要求1所述的方法,其特征在于,还包括:
在以预设音频格式采集唤醒词的语音数据样本之后,对所述语音数据样本进行去躁处理。
4.如权利要求1所述的方法,其特征在于,在以预设音频格式采集唤醒词的语音数据样本之前,还包括:
控制家电设备进入自定义唤醒词模式。
5.如权利要求1所述的方法,其特征在于,还包括:
接收输入的语音信息;
基于所述自定义唤醒词库识别所述语音信息是否为自定义唤醒词;
如果所述语音信息为自定义唤醒词,则生成唤醒指令,并根据所述唤醒指令唤醒家电设备。
6.如权利要求5所述的方法,其特征在于,基于所述自定义唤醒词库识别所述语音信息是否为自定义唤醒词,包括:
提取所述语音信息的特征信息;
对所述语音信息的特征信息进行归一化,并采用动态时间规划算法,将所述语音信息的特征信息与所述自定义唤醒词库中的唤醒词的特征信息进行比对;
获取相似度最高的比对结果;
如果相似度最高的比对结果满足设定值,则确定所述语音信息为自定义唤醒词;
如果相似度最高的比对结果不满足设定值,则确定所述语音信息不为自定义唤醒词。
7.如权利要求5所述的方法,其特征在于,还包括:
如果所述语音信息不为自定义唤醒词,则提示重新输入语音信息。
8.一种家电设备的唤醒词训练装置,其特征在于,包括:
采集模块,用于以预设音频格式采集唤醒词的语音数据样本;
提取模块,用于提取所述语音数据样本的特征信息;
判断模块,用于对所述特征信息进行归一化,并判断所述归一化后的特征信息是否满足预设条件;
保存模块,用于如果满足所述预设条件,则将所述唤醒词的语音数据样本保存至自定义唤醒词库中。
9.如权利要求8所述的装置,其特征在于,所述采集模块,还用于:
如果不满足所述预设条件,则重新采集所述唤醒词的语音数据样本。
10.如权利要求8所述的装置,其特征在于,所述装置还包括:
预处理模块,用于在以预设音频格式采集唤醒词的语音数据样本之后,对所述语音数据样本进行去躁处理。
11.如权利要求8所述的装置,其特征在于,所述装置还包括:
控制模块,用于在以预设音频格式采集唤醒词的语音数据样本之前,控制家电设备进入自定义唤醒词模式。
12.如权利要求8所述的装置,其特征在于,所述装置还包括:
接收模块,用于接收输入的语音信息;
识别模块,用于基于所述自定义唤醒词库识别所述语音信息是否为自定义唤醒词;
唤醒模块,用于如果所述语音信息为自定义唤醒词,则生成唤醒指令,并根据所述唤醒指令唤醒家电设备。
13.如权利要求12所述的装置,其特征在于,所述识别模块,用于:
提取所述语音信息的特征信息;
对所述语音信息的特征信息进行归一化,并采用动态时间规划算法,将所述语音信息的特征信息与所述自定义唤醒词库中的唤醒词的特征信息进行比对;
获取相似度最高的比对结果;
如果相似度最高的比对结果满足设定值,则确定所述语音信息为自定义唤醒词;
如果相似度最高的比对结果不满足设定值,则确定所述语音信息不为自定义唤醒词。
14.如权利要求12所述的装置,其特征在于,所述装置还包括:
提示模块,用于如果所述语音信息不为自定义唤醒词,则提示重新输入语音信息。
15.一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如权利要求1-7任一项所述的家电设备的唤醒词训练方法。
16.一种家电设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器用于执行如权利要求1-7任一项所述的家电设备的唤醒词训练方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810628693.7A CN109036393A (zh) | 2018-06-19 | 2018-06-19 | 家电设备的唤醒词训练方法、装置及家电设备 |
PCT/CN2019/074317 WO2019242312A1 (zh) | 2018-06-19 | 2019-02-01 | 家电设备的唤醒词训练方法、装置及家电设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810628693.7A CN109036393A (zh) | 2018-06-19 | 2018-06-19 | 家电设备的唤醒词训练方法、装置及家电设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109036393A true CN109036393A (zh) | 2018-12-18 |
Family
ID=64609941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810628693.7A Pending CN109036393A (zh) | 2018-06-19 | 2018-06-19 | 家电设备的唤醒词训练方法、装置及家电设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109036393A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109671434A (zh) * | 2019-02-18 | 2019-04-23 | 成都启英泰伦科技有限公司 | 一种语音设备及自学习语音识别方法 |
CN110364147A (zh) * | 2019-08-29 | 2019-10-22 | 厦门市思芯微科技有限公司 | 一种唤醒训练词采集系统及方法 |
CN110414582A (zh) * | 2019-07-21 | 2019-11-05 | 珠海格力电器股份有限公司 | 一种模型训练方法、装置、计算设备及存储介质 |
CN110600029A (zh) * | 2019-09-17 | 2019-12-20 | 苏州思必驰信息科技有限公司 | 用于智能语音设备的自定义唤醒方法和装置 |
WO2019242312A1 (zh) * | 2018-06-19 | 2019-12-26 | 广东美的厨房电器制造有限公司 | 家电设备的唤醒词训练方法、装置及家电设备 |
CN111161731A (zh) * | 2019-12-30 | 2020-05-15 | 四川虹美智能科技有限公司 | 智能家电离线语音控制装置 |
CN112216274A (zh) * | 2019-07-09 | 2021-01-12 | 青岛海尔洗衣机有限公司 | 用于家用电器的控制指令自定义方法 |
CN112463102A (zh) * | 2019-09-06 | 2021-03-09 | 佛山市顺德区美的电热电器制造有限公司 | 家电设备及其交互方法和交互装置、电子设备 |
WO2021082572A1 (zh) * | 2019-10-28 | 2021-05-06 | 苏宁云计算有限公司 | 一种唤醒模型生成方法、智能终端唤醒方法及装置 |
CN113228170A (zh) * | 2019-12-05 | 2021-08-06 | 海信视像科技股份有限公司 | 信息处理装置及非易失性存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103021409A (zh) * | 2012-11-13 | 2013-04-03 | 安徽科大讯飞信息科技股份有限公司 | 一种语音启动拍照系统 |
CN103292437A (zh) * | 2013-06-17 | 2013-09-11 | 广东美的制冷设备有限公司 | 语音交互式空调器及其控制方法 |
CN104282307A (zh) * | 2014-09-05 | 2015-01-14 | 中兴通讯股份有限公司 | 唤醒语音控制系统的方法、装置及终端 |
CN105575395A (zh) * | 2014-10-14 | 2016-05-11 | 中兴通讯股份有限公司 | 语音唤醒方法及装置、终端及其处理方法 |
US20160293168A1 (en) * | 2015-03-30 | 2016-10-06 | Opah Intelligence Ltd. | Method of setting personal wake-up word by text for voice control |
US9697828B1 (en) * | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
CN107134279A (zh) * | 2017-06-30 | 2017-09-05 | 百度在线网络技术(北京)有限公司 | 一种语音唤醒方法、装置、终端和存储介质 |
CN107358954A (zh) * | 2017-08-29 | 2017-11-17 | 成都启英泰伦科技有限公司 | 一种实时更换唤醒词的设备及方法 |
CN107369439A (zh) * | 2017-07-31 | 2017-11-21 | 北京捷通华声科技股份有限公司 | 一种语音唤醒方法和装置 |
-
2018
- 2018-06-19 CN CN201810628693.7A patent/CN109036393A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103021409A (zh) * | 2012-11-13 | 2013-04-03 | 安徽科大讯飞信息科技股份有限公司 | 一种语音启动拍照系统 |
CN103292437A (zh) * | 2013-06-17 | 2013-09-11 | 广东美的制冷设备有限公司 | 语音交互式空调器及其控制方法 |
US9697828B1 (en) * | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
CN104282307A (zh) * | 2014-09-05 | 2015-01-14 | 中兴通讯股份有限公司 | 唤醒语音控制系统的方法、装置及终端 |
CN105575395A (zh) * | 2014-10-14 | 2016-05-11 | 中兴通讯股份有限公司 | 语音唤醒方法及装置、终端及其处理方法 |
US20160293168A1 (en) * | 2015-03-30 | 2016-10-06 | Opah Intelligence Ltd. | Method of setting personal wake-up word by text for voice control |
CN107134279A (zh) * | 2017-06-30 | 2017-09-05 | 百度在线网络技术(北京)有限公司 | 一种语音唤醒方法、装置、终端和存储介质 |
CN107369439A (zh) * | 2017-07-31 | 2017-11-21 | 北京捷通华声科技股份有限公司 | 一种语音唤醒方法和装置 |
CN107358954A (zh) * | 2017-08-29 | 2017-11-17 | 成都启英泰伦科技有限公司 | 一种实时更换唤醒词的设备及方法 |
Non-Patent Citations (1)
Title |
---|
曾义芳: "《DSP开发应用技术》", 31 January 2008 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019242312A1 (zh) * | 2018-06-19 | 2019-12-26 | 广东美的厨房电器制造有限公司 | 家电设备的唤醒词训练方法、装置及家电设备 |
CN109671434A (zh) * | 2019-02-18 | 2019-04-23 | 成都启英泰伦科技有限公司 | 一种语音设备及自学习语音识别方法 |
CN112216274A (zh) * | 2019-07-09 | 2021-01-12 | 青岛海尔洗衣机有限公司 | 用于家用电器的控制指令自定义方法 |
CN110414582A (zh) * | 2019-07-21 | 2019-11-05 | 珠海格力电器股份有限公司 | 一种模型训练方法、装置、计算设备及存储介质 |
CN110364147A (zh) * | 2019-08-29 | 2019-10-22 | 厦门市思芯微科技有限公司 | 一种唤醒训练词采集系统及方法 |
CN110364147B (zh) * | 2019-08-29 | 2021-08-20 | 厦门市思芯微科技有限公司 | 一种唤醒训练词采集系统及方法 |
CN112463102A (zh) * | 2019-09-06 | 2021-03-09 | 佛山市顺德区美的电热电器制造有限公司 | 家电设备及其交互方法和交互装置、电子设备 |
CN112463102B (zh) * | 2019-09-06 | 2024-03-22 | 佛山市顺德区美的电热电器制造有限公司 | 家电设备及其交互方法和交互装置、电子设备 |
CN110600029A (zh) * | 2019-09-17 | 2019-12-20 | 苏州思必驰信息科技有限公司 | 用于智能语音设备的自定义唤醒方法和装置 |
WO2021082572A1 (zh) * | 2019-10-28 | 2021-05-06 | 苏宁云计算有限公司 | 一种唤醒模型生成方法、智能终端唤醒方法及装置 |
CN113228170A (zh) * | 2019-12-05 | 2021-08-06 | 海信视像科技股份有限公司 | 信息处理装置及非易失性存储介质 |
CN111161731A (zh) * | 2019-12-30 | 2020-05-15 | 四川虹美智能科技有限公司 | 智能家电离线语音控制装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109036393A (zh) | 家电设备的唤醒词训练方法、装置及家电设备 | |
CN111508474B (zh) | 一种语音打断方法、电子设备及存储装置 | |
CN105741838B (zh) | 语音唤醒方法及装置 | |
CN105868827B (zh) | 一种智能机器人多模态交互方法和智能机器人 | |
CN107564518A (zh) | 智能设备控制方法、装置及计算机设备 | |
CN110148405B (zh) | 语音指令处理方法及装置、电子设备及存储介质 | |
CN110060685A (zh) | 语音唤醒方法和装置 | |
CN109448725A (zh) | 一种语音交互设备唤醒方法、装置、设备及存储介质 | |
CN108711429B (zh) | 电子设备及设备控制方法 | |
CN108074576A (zh) | 审讯场景下的说话人角色分离方法及系统 | |
CN109166571A (zh) | 家电设备的唤醒词训练方法、装置及家电设备 | |
CN109036395A (zh) | 个性化的音箱控制方法、系统、智能音箱及存储介质 | |
CN112634897B (zh) | 设备唤醒方法、装置和存储介质及电子装置 | |
CN103530912A (zh) | 一种具有情绪识别功能的考勤系统及方法 | |
CN110248021A (zh) | 一种智能设备音量控制方法及系统 | |
CN109272991A (zh) | 语音交互的方法、装置、设备和计算机可读存储介质 | |
KR102563817B1 (ko) | 사용자 음성 입력 처리 방법 및 이를 지원하는 전자 장치 | |
CN110956965A (zh) | 一种基于声纹识别的个性化智能家居安全控制系统及方法 | |
CN109373518A (zh) | 空调器及其语音控制装置和语音控制方法 | |
CN109147764A (zh) | 语音交互方法、装置、设备及计算机可读介质 | |
CN104282303B (zh) | 利用声纹识别进行语音辨识的方法及其电子装置 | |
JP2019124952A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN109841221A (zh) | 基于语音识别的参数调节方法、装置及健身设备 | |
CN109461448A (zh) | 语音交互方法及装置 | |
CN110473542B (zh) | 语音指令执行功能的唤醒方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |