CN109065056A - 一种语音控制空调的方法及装置 - Google Patents
一种语音控制空调的方法及装置 Download PDFInfo
- Publication number
- CN109065056A CN109065056A CN201811122566.6A CN201811122566A CN109065056A CN 109065056 A CN109065056 A CN 109065056A CN 201811122566 A CN201811122566 A CN 201811122566A CN 109065056 A CN109065056 A CN 109065056A
- Authority
- CN
- China
- Prior art keywords
- voice messaging
- user
- control instruction
- corresponding control
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000004378 air conditioning Methods 0.000 claims description 101
- 230000001755 vocal effect Effects 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 39
- 238000012937 correction Methods 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 6
- 238000004321 preservation Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000000151 deposition Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/50—Control or safety arrangements characterised by user interfaces or communication
- F24F11/52—Indication arrangements, e.g. displays
- F24F11/526—Indication arrangements, e.g. displays giving audible indications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Automation & Control Theory (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Selective Calling Equipment (AREA)
- Air Conditioning Control Device (AREA)
Abstract
本发明提供一种语音控制空调的方法及装置,用于提高空调语音识别的准确性,提高用户语音控制空调的体验度。方法包括:接收至少一个用户中每个用户录入的至少一段语音信息;为所述每个用户创建对应的语音库;接收第一用户录入第一语音信息;根据所述第一语音信息确定所述第一用户的声纹特征数据,并根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库;若存在,则根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令;否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
Description
技术领域
本发明涉及智能家居领域,特别涉及一种语音控制空调的方法及装置。
背景技术
近年来,语音识别技术不断在智能家居领域被应用,比如用户可以通过语音来控制空调按照指定功能运行。但是,目前语音识别的准确性却始终不如人意,这是因为不同用户在说话时的停顿、节奏、旋律等不同,导致空调经常误识别,无法正确响应用户的语音命令。
发明内容
本发明实施例提供一种语音控制空调的方法及装置,用于提高空调语音识别的准确性,提高用户语音控制空调的体验度。
第一方面,本发明实施例提供一种语音控制空调的方法,包括:
接收至少一个用户中每个用户录入的至少一段语音信息,所述至少一段语音信息中的每段语音信息对应于控制空调的一个控制指令;
为所述每个用户创建对应的语音库;所述每个用户对应的语音库中存储有该用户录入的至少一段语音信息、该用户录入的至少一段语音信息中每段语音信息对应的控制指令以及该用户的声纹特征数据;
接收第一用户录入第一语音信息;根据所述第一语音信息确定所述第一用户的声纹特征数据,并根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库;
若存在,则根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令;
否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
在本实施方式中,预先为至少一个用户中每个用户建立对应的语音库,每个用户的语音库中保存有该用户对应的语音特征数据,在收到任一用户输入的语音信息后,首先根据该用户输入的语音信息确定该用户的声纹特征,然后基于该用户的声纹特征确定是否存在该用户对应的语音库,若存在,则直接根据该用户对应的语音库获得对应的控制指令,若不存在,再解析该用户输入的语音信息获得对应的控制指令。通过预先为不同的用户建立不同的语音库的方式,使得在识别用户语音信息时,可根据该用户的声纹特征确定该用户的语音库并基于确定出的语音库对该用户的语音信息进行识别,有效提高空调语音识别的准确性和效率,进而提高用户语音控制空调的体验度。
可选的,为所述每个用户创建对应的语音库,包括:
在所述每个用户对应的语音库中将该用户录入的至少一段语音信息中的每段语音信息与所述每段语音信息对应的控制指令进行关联地存储;以及
对所述每个用户录入的至少一段语音信息进行声纹预处理及特征提取处理,得到该用户的声纹特征数据,在该用户对应的语音库中存储该用户的声纹特征数据。
本实施方式,通过在语音库中存储用户的声纹特征数据以及在语音库中将语音信息与控制指令进行关联地存储,使得在识别用户输入的语音信息时可以根据该用户的声纹特征迅速地确定出该用户对应的语音库,然后在该用户对应的语音库中迅速地确定出与该用户输入的语音信息对应的控制指令,有效提高空调语音识别的准确性和效率,提高用户语音控制空调的体验度。
可选的,根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令,包括:
判断所述第一用户对应的语音库中是否存储有所述第一语音信息;若为是,则从所述第一用户对应的语音库筛选出所述第一语音信息对应的控制指令;否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
本实施方式,如果第一用户对应的语音库中存储有第一语音信息,则从第一用户对应的语音库筛选出第一语音信息对应的控制指令,如果第一用户对应的语音库中存储没有第一语音信息,则解析第一语音信息获得对应的控制指令,保证了空调语音识别的可靠性。
可选的,在获得所述第一语音信息对应的控制指令之后,还包括:
将所述第一语音信息对应的控制指令发送给所述空调,以使所述空调执行所述第一语音信息对应的控制指令。
通过本实施方式,可以有效提高空调语音识别的准确性和效率,提高用户语音控制空调的体验度。
可选的,在将所述第一语音信息对应的控制指令发送给所述空调之后,还包括:
在确定所述空调执行所述第一语音信息对应的控制指令失败后,将所述第一语音信息对应的控制指令呈现在UI上,并播放所述第一语音信息;
接收用户输入的校正信息,基于所述校正信息校正所述第一语音信息对应的控制指令,并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中;
当再次接收到所述第一用户录入的第一语音信息时,根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。
本实施方式,通过判断语音信息对应的控制指令是否被空调成功执行确定语音识别是否准确,并对误识别的语音信息进行记录和校正,进一步提高语音识别的准确性,提高用户语音控制空调的体验度。
可选的,在将所述第一语音信息对应的控制指令发送给所述空调之后,还包括:
在确定所述空调执行所述第一语音信息对应的控制指令失败时,在错词库中保存所述第一语音信息预定期限;
在确定所述预定期限内所述空调执行所述第一语音信息对应的控制指令失败的次数达到预设次数时,将所述第一语音信息对应的控制指令呈现在UI上,并播放所述第一语音信息;
接收用户输入的校正信息,基于所述校正信息校正所述第一语音信息对应的控制指令,并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中;
当再次接收到所述第一用户录入的第一语音信息时,根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。
本实施方式,通过判断语音信息对应的控制指令是否被空调成功执行确定语音识别是否准确,对误识别的语音信息进行记录,在同一语音信息在预设期限内多次被误识别时,对其进行校正,进一步提高语音识别的准确性,提高用户语音控制空调的体验度。
可选的,在解析所述第一语音信息,获得所述第一语音信息对应的控制指令之后,还包括:
在确定所述空调执行所述第一语音信息对应的控制指令成功时,将所述第一语音信息以及解析获得的控制指令关联地存储到所述第一用户对应的语音库中。
本实施方式,可以自动对语音库缺少的语音信息和控制指令进行补充,进一步提高空调语音识别的准确性和效率,提高用户语音控制空调的体验度。
第二方面,本发明实施例提供一种语音控制空调的装置,包括:
接收单元,用于接收至少一个用户中每个用户录入的至少一段语音信息,所述至少一段语音信息中的每段语音信息对应于控制空调的一个控制指令;
处理单元,用于为所述每个用户创建对应的语音库;所述每个用户对应的语音库中存储有该用户录入的至少一段语音信息、该用户录入的至少一段语音信息中每段语音信息对应的控制指令以及该用户的声纹特征数据;
所述接收单元还用于:接收第一用户录入第一语音信息;
所述处理单元还用于:根据所述第一语音信息确定所述第一用户的声纹特征数据,并根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库;若存在,则根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令;否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
可选的,所述处理单元具体用于:
在所述每个用户对应的语音库中将该用户录入的至少一段语音信息中的每段语音信息与所述每段语音信息对应的控制指令进行关联地存储;以及
对所述每个用户录入的至少一段语音信息进行声纹预处理及特征提取处理,得到该用户的声纹特征数据,在该用户对应的语音库中存储该用户的声纹特征数据。
可选的,所述处理单元具体用于:
判断所述第一用户对应的语音库中是否存储有所述第一语音信息;若为是,则从所述第一用户对应的语音库筛选出所述第一语音信息对应的控制指令;否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
可选的,所述装置还包括:
发送单元,用于在所述处理单元获得所述第一语音信息对应的控制指令之后,将所述第一语音信息对应的控制指令发送给所述空调,以使所述空调执行所述第一语音信息对应的控制指令。
可选的,所述处理单元还用于:
在所述发送单元将所述第一语音信息对应的控制指令发送给所述空调之后,在确定所述空调执行所述第一语音信息对应的控制指令失败后,将所述第一语音信息对应的控制指令呈现在UI上,并播放所述第一语音信息;
所述接收单元还用于:接收用户输入的校正信息;
所述处理单元还用于:基于所述校正信息校正所述第一语音信息对应的控制指令,并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中;当所述接收单元再次接收到所述第一用户录入的第一语音信息时,根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。
可选的,所述处理单元还用于:
在所述发送单元将所述第一语音信息对应的控制指令发送给所述空调之后,在确定所述空调执行所述第一语音信息对应的控制指令失败时,在错词库中保存所述第一语音信息预定期限;在确定所述预定期限内所述空调执行所述第一语音信息对应的控制指令失败的次数达到预设次数时,将所述第一语音信息对应的控制指令呈现在UI上,并播放所述第一语音信息;
所述接收单元还用于:接收用户输入的校正信息;
所述处理单元还用于:基于所述校正信息校正所述第一语音信息对应的控制指令,并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中;当所述接收单元再次接收到所述第一用户录入的第一语音信息时,根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。
可选的,所述处理单元还用于:
在解析所述第一语音信息,获得所述第一语音信息对应的控制指令之后,在确定所述空调执行所述第一语音信息对应的控制指令成功时,将所述第一语音信息以及解析获得的控制指令关联地存储到所述第一用户对应的语音库中。
第三方面,本发明实施例提供一种语音控制空调的装置,包括:
存储器,用于存储计算机指令;
通信接口,用于与网络设备进行通信;
处理器,与所述存储器以及所述通信接口通信连接,用于执行所述存储器中的计算机指令,以在执行所述计算机指令时执行本发明实施例第一方面所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行本发明实施例第一方面所述的方法。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
预先为至少一个用户中每个用户建立对应的语音库,每个用户的语音库中保存有该用户对应的语音特征数据,在收到任一用户输入的语音信息后,首先根据该用户输入的语音信息确定该用户的声纹特征,然后基于该用户的声纹特征确定是否存在该用户对应的语音库,若存在,则直接根据该用户对应的语音库获得对应的控制指令,若不存在,再解析该用户输入的语音信息获得对应的控制指令。通过预先为不同的用户建立不同的语音库的方式,使得在识别用户语音信息时,可根据该用户的声纹特征确定该用户的语音库并基于确定出的语音库对该用户的语音信息进行识别,有效提高空调语音识别的准确性和效率,进而提高用户语音控制空调的体验度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种可能的应用场景示意图;
图2为本发明实施例中语音控制空调的方法的流程图;
图3为本发明实施例中语音控制空调的装置的结构示意图;
图4为本发明实施例中语音控制空调的装置的结构示意图。
具体实施方式
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
需要理解的是,在本发明实施例的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。在本发明实施例的描述中“多个”,是指两个或两个以上。
本发明实施例中的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本发明实施例提供一种语音控制空调的方法及装置,用于提高空调语音识别的准确性,提高用户语音控制空调的体验度。
其中,执行该语音控制空调的方法的设备可以是服务器、空调、手机、电脑、可穿戴式设备、音/视频播放设备等任何具有计算能力的电子设备,或者多个这样的电子设备组成的电子设备系统,本发明实施例不做具体限制。例如,图1为该语音控制空调的方法的一种可能的应用场景,其中服务器为执行该语音控制空调的方法的设备,移动设备为语音输入设备,移动设备在收到用户输入的语音信息后将收到的语音信息发送给服务器。当然,此处只是一种举例,本发明实施例对该语音控制空调的方法具体应用场景不做限制。
下面以执行主体为图1所示的服务器为例,对本发明实施例提供的语音控制空调的方法做详细的说明。参照图2,该方法具体包括:
S11:接收至少一个用户中每个用户录入的至少一段语音信息;
该至少一段语音信息中的每段语音信息对应于控制空调的一个控制指令,控制指令用于被空调执行以实现预设的功能。
服务器接收来自移动终端发送的至少一个用户中每个用户录入的至少一段语音信息。移动终端上安装有控制空调的应用程序(Application,APP),用户在安静环境下,打开APP,按照预设的次序依次录入控制指令对应的语音信息。下表为对控制指令的举例:
S12:为所述每个用户创建对应的语音库;
具体的,服务器在接收到移动终端发送的语音信息后,对每个用户录入的语音信息进行声纹预处理及特征提取处理,得到每个用户的声纹特征数据;根据声纹特征区分不同用户的语音信息,为每个用户创建对应的语音库;在每个用户对应的语音库中存储该用户的声纹特征数据,并将该用户录入的每段语音信息与每段语音信息对应的控制指令进行关联地存储。在此过程中,还可以为每个用户对应的语音库创建相应的用户标识,该用户标识可以是用户通过APP自定义的,也可以是服务器自动生成的,本发明实施例不做具体限制。
S13:接收第一用户录入第一语音信息;根据所述第一语音信息确定所述第一用户的声纹特征数据;
具体的,对第一语音信息进行声纹预处理及特征提取处理,得到第一用户的声纹特征数据。
S14:根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库;若存在,则执行S15;否则,执行S16;
具体的,将第一用户的声纹特征数据与所有语音库中的声纹数据进行比较,确定出相似度满足阈值的语音库作为第一用户对应的语音库,若不存在相似度满足阈值的语音库,则确定不存在与第一用户对应的语音库。
S15:根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令;
具体的,判断第一用户对应的语音库中是否存储有第一语音信息;若为是,则从第一用户对应的语音库筛选出第一语音信息对应的控制指令;否则,解析第一语音信息,获得第一语音信息对应的控制指令。
S16:解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
在这种情况下,在获得第一语音信息对应的控制指令之后,如果确定空调成功执行第一语音信息对应的控制指令,还可以进一步将第一语音信息以及解析获得的控制指令关联地存储到第一用户对应的语音库中,当再次接收到第一语音信息后,可直接根据语音库获得第一语音信息对应的控制指令。
在本发明实施例中,在服务器中预先为至少一个用户中每个用户建立对应的语音库,每个用户的语音库中保存有该用户对应的语音特征数据,在收到任一用户输入的语音信息后,首先根据该用户输入的语音信息确定该用户的声纹特征,然后基于该用户的声纹特征确定是否存在该用户对应的语音库,若存在,则直接根据该用户对应的语音库获得对应的控制指令,若不存在,再解析该用户输入的语音信息获得对应的控制指令。通过预先为不同的用户建立不同的语音库的方式,使得在识别用户语音信息时,可根据该用户的声纹特征确定该用户的语音库并基于确定出的语音库对该用户的语音信息进行识别,有效提高空调语音识别的准确性和效率,进而提高用户语音控制空调的体验度。
进一步的,为了进一步提高语音识别的准确性,还可以通过判断语音信息对应的控制指令是否被空调成功执行确定语音识别是否准确,并对误识别的语音信息进行记录和校正。
以上述第一语音信息为例:服务器在获得第一语音信息对应的控制指令之后,将第一语音信息对应的控制指令发送给空调,以使空调执行第一语音信息对应的控制指令;当空调执行第一语音信息对应的控制指令失败后,将执行失败的控制指令和第一语音信息发送用户终端,显示在APP的用户界面(User Interface,UI)上,用户听取第一语音信息,输入校正信息对第一语音信息对应的控制指令进行校正;服务器根据用户输入的校正信息校正第一语音信息对应的控制指令,将第一语音信息以及校正后的控制指令关联地存储到第一用户对应的错词库中,当再次接收到第一用户录入的第一语音信息时,根据第一用户对应的错词库获得第一语音信息对应的控制指令。
在具体实施过程中,为了节省服务器的功耗,保证服务器的运行效率,可以在同一语音信息在预设期限内多次被误识别时,再对其进行校正。
仍以上述第一语音信息为例:服务器在确定空调执行第一语音信息对应的控制指令失败时,在错词库中保存第一语音信息预定期限;在确定预定期限内空调执行第一语音信息对应的控制指令失败的次数达到预设次数时,将第一语音信息对应的控制指令呈现在UI上,并播放第一语音信息;接收用户输入的校正信息,基于校正信息校正第一语音信息对应的控制指令,并将第一语音信息以及校正后的控制指令关联地存储到第一用户对应的错词库中;当再次接收到第一用户录入的第一语音信息时,根据第一用户对应的错词库获得第一语音信息对应的控制指令。
在本发明实施例中,通过判断语音信息对应的控制指令是否被空调成功执行确定语音识别是否准确,并对误识别的语音信息进行记录和校正,进一步提高语音识别的准确性,提高用户语音控制空调的体验度。
基于同一发明构思,本发明实施例还提供一种语音控制空调的装置,参照图3,包括:
接收单元21,用于接收至少一个用户中每个用户录入的至少一段语音信息,所述至少一段语音信息中的每段语音信息对应于控制空调的一个控制指令;
处理单元22,用于为所述每个用户创建对应的语音库;所述每个用户对应的语音库中存储有该用户录入的至少一段语音信息、该用户录入的至少一段语音信息中每段语音信息对应的控制指令以及该用户的声纹特征数据;
所述接收单元21还用于:接收第一用户录入第一语音信息;
所述处理单元22还用于:根据所述第一语音信息确定所述第一用户的声纹特征数据,并根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库;若存在,则根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令;否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
可选的,所述处理单元22具体用于:
在所述每个用户对应的语音库中将该用户录入的至少一段语音信息中的每段语音信息与所述每段语音信息对应的控制指令进行关联地存储;以及
对所述每个用户录入的至少一段语音信息进行声纹预处理及特征提取处理,得到该用户的声纹特征数据,在该用户对应的语音库中存储该用户的声纹特征数据。
可选的,所述处理单元22具体用于:
判断所述第一用户对应的语音库中是否存储有所述第一语音信息;若为是,则从所述第一用户对应的语音库筛选出所述第一语音信息对应的控制指令;否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
可选的,所述装置还包括:
发送单元,用于在所述处理单元22获得所述第一语音信息对应的控制指令之后,将所述第一语音信息对应的控制指令发送给所述空调,以使所述空调执行所述第一语音信息对应的控制指令。
可选的,所述处理单元22还用于:
在所述发送单元将所述第一语音信息对应的控制指令发送给所述空调之后,在确定所述空调执行所述第一语音信息对应的控制指令失败后,将所述第一语音信息对应的控制指令呈现在UI上,并播放所述第一语音信息;
所述接收单元21还用于:接收用户输入的校正信息;
所述处理单元22还用于:基于所述校正信息校正所述第一语音信息对应的控制指令,并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中;当所述接收单元21再次接收到所述第一用户录入的第一语音信息时,根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。
可选的,所述处理单元22还用于:
在所述发送单元将所述第一语音信息对应的控制指令发送给所述空调之后,在确定所述空调执行所述第一语音信息对应的控制指令失败时,在错词库中保存所述第一语音信息预定期限;在确定所述预定期限内所述空调执行所述第一语音信息对应的控制指令失败的次数达到预设次数时,将所述第一语音信息对应的控制指令呈现在UI上,并播放所述第一语音信息;
所述接收单元21还用于:接收用户输入的校正信息;
所述处理单元22还用于:基于所述校正信息校正所述第一语音信息对应的控制指令,并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中;当所述接收单元21再次接收到所述第一用户录入的第一语音信息时,根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。
可选的,所述处理单元22还用于:
在解析所述第一语音信息,获得所述第一语音信息对应的控制指令之后,在确定所述空调执行所述第一语音信息对应的控制指令成功时,将所述第一语音信息以及解析获得的控制指令关联地存储到所述第一用户对应的语音库中。
基于同一发明构思,本发明实施例还提供一种语音控制空调的装置,参照图4,包括:
存储器31,用于存储计算机指令;
通信接口32,用于与网络设备进行通信;
处理器33,与所述存储器31以及所述通信接口32通信连接,用于执行所述存储器31中的计算机指令,以在执行所述计算机指令时执行本发明实施例所述的方法。
基于同一发明构思,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行本发明实施例所述的方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (16)
1.一种语音控制空调的方法,其特征在于,包括:
接收至少一个用户中每个用户录入的至少一段语音信息,所述至少一段语音信息中的每段语音信息对应于控制空调的一个控制指令;
为所述每个用户创建对应的语音库;所述每个用户对应的语音库中存储有该用户录入的至少一段语音信息、该用户录入的至少一段语音信息中每段语音信息对应的控制指令以及该用户的声纹特征数据;
接收第一用户录入第一语音信息;根据所述第一语音信息确定所述第一用户的声纹特征数据,并根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库;
若存在,则根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令;
否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
2.如权利要求1所述的方法,其特征在于,为所述每个用户创建对应的语音库,包括:
在所述每个用户对应的语音库中将该用户录入的至少一段语音信息中的每段语音信息与所述每段语音信息对应的控制指令进行关联地存储;以及
对所述每个用户录入的至少一段语音信息进行声纹预处理及特征提取处理,得到该用户的声纹特征数据,在该用户对应的语音库中存储该用户的声纹特征数据。
3.如权利要求1所述的方法,其特征在于,根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令,包括:
判断所述第一用户对应的语音库中是否存储有所述第一语音信息;若为是,则从所述第一用户对应的语音库筛选出所述第一语音信息对应的控制指令;否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
4.如权利要求1-3任一项所述的方法,其特征在于,在获得所述第一语音信息对应的控制指令之后,还包括:
将所述第一语音信息对应的控制指令发送给所述空调,以使所述空调执行所述第一语音信息对应的控制指令。
5.如权利要求4所述的方法,其特征在于,在将所述第一语音信息对应的控制指令发送给所述空调之后,还包括:
在确定所述空调执行所述第一语音信息对应的控制指令失败后,将所述第一语音信息对应的控制指令呈现在用户界面UI上,并播放所述第一语音信息;
接收用户输入的校正信息,基于所述校正信息校正所述第一语音信息对应的控制指令,并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中;
当再次接收到所述第一用户录入的第一语音信息时,根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。
6.如权利要求4所述的方法,其特征在于,在将所述第一语音信息对应的控制指令发送给所述空调之后,还包括:
在确定所述空调执行所述第一语音信息对应的控制指令失败时,在错词库中保存所述第一语音信息预定期限;
在确定所述预定期限内所述空调执行所述第一语音信息对应的控制指令失败的次数达到预设次数时,将所述第一语音信息对应的控制指令呈现在UI上,并播放所述第一语音信息;
接收用户输入的校正信息,基于所述校正信息校正所述第一语音信息对应的控制指令,并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中;
当再次接收到所述第一用户录入的第一语音信息时,根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。
7.如权利要求1所述的方法,其特征在于,在解析所述第一语音信息,获得所述第一语音信息对应的控制指令之后,还包括:
在确定所述空调执行所述第一语音信息对应的控制指令成功时,将所述第一语音信息以及解析获得的控制指令关联地存储到所述第一用户对应的语音库中。
8.一种语音控制空调的装置,其特征在于,包括:
接收单元,用于接收至少一个用户中每个用户录入的至少一段语音信息,所述至少一段语音信息中的每段语音信息对应于控制空调的一个控制指令;
处理单元,用于为所述每个用户创建对应的语音库;所述每个用户对应的语音库中存储有该用户录入的至少一段语音信息、该用户录入的至少一段语音信息中每段语音信息对应的控制指令以及该用户的声纹特征数据;
所述接收单元还用于:接收第一用户录入第一语音信息;
所述处理单元还用于:根据所述第一语音信息确定所述第一用户的声纹特征数据,并根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库;若存在,则根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令;否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
9.如权利要求8所述的装置,其特征在于,所述处理单元具体用于:
在所述每个用户对应的语音库中将该用户录入的至少一段语音信息中的每段语音信息与所述每段语音信息对应的控制指令进行关联地存储;以及
对所述每个用户录入的至少一段语音信息进行声纹预处理及特征提取处理,得到该用户的声纹特征数据,在该用户对应的语音库中存储该用户的声纹特征数据。
10.如权利要求8所述的装置,其特征在于,所述处理单元具体用于:
判断所述第一用户对应的语音库中是否存储有所述第一语音信息;若为是,则从所述第一用户对应的语音库筛选出所述第一语音信息对应的控制指令;否则,解析所述第一语音信息,获得所述第一语音信息对应的控制指令。
11.如权利要求8-10任一项所述的装置,其特征在于,所述装置还包括:
发送单元,用于在所述处理单元获得所述第一语音信息对应的控制指令之后,将所述第一语音信息对应的控制指令发送给所述空调,以使所述空调执行所述第一语音信息对应的控制指令。
12.如权利要求11所述的装置,其特征在于,所述处理单元还用于:
在所述发送单元将所述第一语音信息对应的控制指令发送给所述空调之后,在确定所述空调执行所述第一语音信息对应的控制指令失败后,将所述第一语音信息对应的控制指令呈现在UI上,并播放所述第一语音信息;
所述接收单元还用于:接收用户输入的校正信息;
所述处理单元还用于:基于所述校正信息校正所述第一语音信息对应的控制指令,并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中;当所述接收单元再次接收到所述第一用户录入的第一语音信息时,根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。
13.如权利要求11所述的装置,其特征在于,所述处理单元还用于:
在所述发送单元将所述第一语音信息对应的控制指令发送给所述空调之后,
在确定所述空调执行所述第一语音信息对应的控制指令失败时,在错词库中保存所述第一语音信息预定期限;在确定所述预定期限内所述空调执行所述第一语音信息对应的控制指令失败的次数达到预设次数时,将所述第一语音信息对应的控制指令呈现在UI上,并播放所述第一语音信息;
所述接收单元还用于:接收用户输入的校正信息;
所述处理单元还用于:基于所述校正信息校正所述第一语音信息对应的控制指令,并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中;当所述接收单元再次接收到所述第一用户录入的第一语音信息时,根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。
14.如权利要求8所述的装置,其特征在于,所述处理单元还用于:
在解析所述第一语音信息,获得所述第一语音信息对应的控制指令之后,在确定所述空调执行所述第一语音信息对应的控制指令成功时,将所述第一语音信息以及解析获得的控制指令关联地存储到所述第一用户对应的语音库中。
15.一种语音控制空调的装置,其特征在于,包括:
存储器,用于存储计算机指令;
通信接口,用于与网络设备进行通信;
处理器,与所述存储器以及所述通信接口通信连接,用于执行所述存储器中的计算机指令,以在执行所述计算机指令时执行如权利要求1至7中任一项所述的方法。
16.一种计算机可读存储介质,其特征在于:
所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811122566.6A CN109065056B (zh) | 2018-09-26 | 2018-09-26 | 一种语音控制空调的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811122566.6A CN109065056B (zh) | 2018-09-26 | 2018-09-26 | 一种语音控制空调的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109065056A true CN109065056A (zh) | 2018-12-21 |
CN109065056B CN109065056B (zh) | 2021-05-11 |
Family
ID=64765742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811122566.6A Active CN109065056B (zh) | 2018-09-26 | 2018-09-26 | 一种语音控制空调的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109065056B (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102842308A (zh) * | 2012-08-30 | 2012-12-26 | 四川长虹电器股份有限公司 | 家电设备语音控制方法 |
CN102945669A (zh) * | 2012-11-14 | 2013-02-27 | 四川长虹电器股份有限公司 | 一种家电设备语音控制方法 |
CN103730120A (zh) * | 2013-12-27 | 2014-04-16 | 深圳市亚略特生物识别科技有限公司 | 电子设备的语音控制方法及系统 |
CN104217152A (zh) * | 2014-09-23 | 2014-12-17 | 陈包容 | 一种移动终端在待机状态下进入应用程序的实现方法和装置 |
CN104778946A (zh) * | 2014-01-10 | 2015-07-15 | 中国电信股份有限公司 | 语音控制方法和系统 |
CN105302795A (zh) * | 2015-11-11 | 2016-02-03 | 河海大学 | 基于汉语模糊发音和语音识别的中文文本校验系统及方法 |
CN105355195A (zh) * | 2015-09-25 | 2016-02-24 | 小米科技有限责任公司 | 音频识别方法及装置 |
CN105546724A (zh) * | 2015-12-16 | 2016-05-04 | 芜湖美智空调设备有限公司 | 语音控制方法及系统、客户端、控制装置 |
CN105791931A (zh) * | 2016-02-26 | 2016-07-20 | 深圳Tcl数字技术有限公司 | 智能电视及其语音控制方法 |
CN105825848A (zh) * | 2015-01-08 | 2016-08-03 | 宇龙计算机通信科技(深圳)有限公司 | 一种语音识别方法、装置及终端 |
CN106228988A (zh) * | 2016-07-29 | 2016-12-14 | 珠海市魅族科技有限公司 | 一种基于声纹信息的习惯信息匹配方法及装置 |
CN106886162A (zh) * | 2017-01-13 | 2017-06-23 | 深圳前海勇艺达机器人有限公司 | 智能家居管理的方法及其机器人装置 |
CN106997763A (zh) * | 2017-03-17 | 2017-08-01 | 浙江大学 | 一种基于语音信号频域处理的空调控制装置 |
CN107305768A (zh) * | 2016-04-20 | 2017-10-31 | 上海交通大学 | 语音交互中的易错字校准方法 |
CN107331400A (zh) * | 2017-08-25 | 2017-11-07 | 百度在线网络技术(北京)有限公司 | 一种声纹识别性能提升方法、装置、终端及存储介质 |
CN107591150A (zh) * | 2017-08-16 | 2018-01-16 | 珠海市魅族科技有限公司 | 语音识别方法及装置、计算机装置及计算机可读存储介质 |
CN108460081A (zh) * | 2018-01-12 | 2018-08-28 | 平安科技(深圳)有限公司 | 语音数据库创建方法、声纹注册方法、装置、设备及介质 |
-
2018
- 2018-09-26 CN CN201811122566.6A patent/CN109065056B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102842308A (zh) * | 2012-08-30 | 2012-12-26 | 四川长虹电器股份有限公司 | 家电设备语音控制方法 |
CN102945669A (zh) * | 2012-11-14 | 2013-02-27 | 四川长虹电器股份有限公司 | 一种家电设备语音控制方法 |
CN103730120A (zh) * | 2013-12-27 | 2014-04-16 | 深圳市亚略特生物识别科技有限公司 | 电子设备的语音控制方法及系统 |
CN104778946A (zh) * | 2014-01-10 | 2015-07-15 | 中国电信股份有限公司 | 语音控制方法和系统 |
CN104217152A (zh) * | 2014-09-23 | 2014-12-17 | 陈包容 | 一种移动终端在待机状态下进入应用程序的实现方法和装置 |
CN105825848A (zh) * | 2015-01-08 | 2016-08-03 | 宇龙计算机通信科技(深圳)有限公司 | 一种语音识别方法、装置及终端 |
CN105355195A (zh) * | 2015-09-25 | 2016-02-24 | 小米科技有限责任公司 | 音频识别方法及装置 |
CN105302795A (zh) * | 2015-11-11 | 2016-02-03 | 河海大学 | 基于汉语模糊发音和语音识别的中文文本校验系统及方法 |
CN105546724A (zh) * | 2015-12-16 | 2016-05-04 | 芜湖美智空调设备有限公司 | 语音控制方法及系统、客户端、控制装置 |
CN105791931A (zh) * | 2016-02-26 | 2016-07-20 | 深圳Tcl数字技术有限公司 | 智能电视及其语音控制方法 |
CN107305768A (zh) * | 2016-04-20 | 2017-10-31 | 上海交通大学 | 语音交互中的易错字校准方法 |
CN106228988A (zh) * | 2016-07-29 | 2016-12-14 | 珠海市魅族科技有限公司 | 一种基于声纹信息的习惯信息匹配方法及装置 |
CN106886162A (zh) * | 2017-01-13 | 2017-06-23 | 深圳前海勇艺达机器人有限公司 | 智能家居管理的方法及其机器人装置 |
CN106997763A (zh) * | 2017-03-17 | 2017-08-01 | 浙江大学 | 一种基于语音信号频域处理的空调控制装置 |
CN107591150A (zh) * | 2017-08-16 | 2018-01-16 | 珠海市魅族科技有限公司 | 语音识别方法及装置、计算机装置及计算机可读存储介质 |
CN107331400A (zh) * | 2017-08-25 | 2017-11-07 | 百度在线网络技术(北京)有限公司 | 一种声纹识别性能提升方法、装置、终端及存储介质 |
CN108460081A (zh) * | 2018-01-12 | 2018-08-28 | 平安科技(深圳)有限公司 | 语音数据库创建方法、声纹注册方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109065056B (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11568876B2 (en) | Method and device for user registration, and electronic device | |
CN107818798B (zh) | 客服服务质量评价方法、装置、设备及存储介质 | |
JP6394709B2 (ja) | 話者識別装置および話者識別用の登録音声の特徴量登録方法 | |
EP3611724A1 (en) | Voice response method and device, and smart device | |
CN109378006B (zh) | 一种跨设备声纹识别方法及系统 | |
US20120179465A1 (en) | Real time generation of audio content summaries | |
US11355099B2 (en) | Word extraction device, related conference extraction system, and word extraction method | |
CN108075892A (zh) | 一种语音处理的方法、装置和设备 | |
US11749286B2 (en) | ASR training and adaptation | |
CN111261162B (zh) | 语音识别方法、语音识别装置及存储介质 | |
CN105869629A (zh) | 语音识别方法及装置 | |
CN109286848B (zh) | 一种终端视频信息的交互方法、装置及存储介质 | |
CN111768789A (zh) | 电子设备及其语音发出者身份确定方法、装置和介质 | |
CN113380229B (zh) | 语音响应速度确定方法、相关装置及计算机程序产品 | |
CN112700767A (zh) | 人机对话打断方法及装置 | |
CN110570838B (zh) | 语音流处理方法和装置 | |
CN109065056A (zh) | 一种语音控制空调的方法及装置 | |
CN110516043A (zh) | 用于问答系统的答案生成方法和装置 | |
CN108831473B (zh) | 一种音频处理方法及装置 | |
CN114466106A (zh) | 外呼系统的测试数据生成方法、装置、设备和介质 | |
US20190354884A1 (en) | Knowledge construction and utilization system and program | |
CN113056784A (zh) | 语音信息的处理方法、装置、存储介质及电子设备 | |
CN113938708B (zh) | 直播的音频纠错方法、装置、计算设备及存储介质 | |
CN113241061B (zh) | 语音识别结果的处理方法、装置、电子设备和存储介质 | |
CN106653057A (zh) | 一种数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |