CN108121528A - 语音控制方法、装置、服务器和计算机可读存储介质 - Google Patents
语音控制方法、装置、服务器和计算机可读存储介质 Download PDFInfo
- Publication number
- CN108121528A CN108121528A CN201711278623.5A CN201711278623A CN108121528A CN 108121528 A CN108121528 A CN 108121528A CN 201711278623 A CN201711278623 A CN 201711278623A CN 108121528 A CN108121528 A CN 108121528A
- Authority
- CN
- China
- Prior art keywords
- control command
- control
- instruction
- homonym
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000004378 air conditioning Methods 0.000 description 41
- 238000010438 heat treatment Methods 0.000 description 12
- 235000013399 edible fruits Nutrition 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种语音控制方法、装置、服务器和计算机可读存储介质,所述方法包括以下步骤:获取语音控制命令对应的文本信息;根据文本信息解析出原始的控制命令;当原始的控制命令不准确时,对原始的控制命令进行纠错处理,确定准确的控制命令;当确定准确的控制命令成功时,根据准确的控制命令控制相应的受控设备。从而大大增强了系统的语音识别能力和语义理解能力,提高了系统对语音控制命令的识别率,即使用户口音含糊不清或没有说出标准的语音控制命令,系统也能准确的理解用户的真实意图,进而提高了语音控制的准确率和效率,提升了用户体验。
Description
技术领域
本发明涉及智能家居技术领域,尤其是涉及一种语音控制方法、装置、服务器和计算机可读存储介质。
背景技术
随着语音分析技术的发展,语音控制在越来越多的领域得到了应用,包括智能家居领域。目前,在智能家居领域,针对电视、空调等智能设备的语音控制方案中,主要是单向无反馈的语音操控,具体流程为:由用户通过手机、平板等智能终端输入标准的语音控制命令,智能终端将语音控制命令发送给第三方进行语音识别,第三方将语音控制命令识别为文本信息后返回给智能终端,智能终端将文本信息发送给服务器,服务器根据文本信息解析出控制命令,并根据控制命令控制智能设备。
由于语音控制命令的语音识别由第三方提供,因此常常会出现当用户输入的语音控制命令不标准或模糊不清时,服务器无法通过第三方语音识别出的文本信息来解析出准确的控制命令,即无法确认用户的真实意图,导致系统不能准确、快速的响应用户,影响了语音控制的准确率和效率,用户体验不佳。
发明内容
本发明实施例的主要目的在于提供一种语音控制方法、装置、服务器和计算机可读存储介质,旨在提高语音控制的准确率和效率,提升用户体验。
为达以上目的,一方面提出一种语音控制方法,所述方法包括以下步骤:
获取语音控制命令对应的文本信息;
根据所述文本信息解析出原始的控制命令;
当所述原始的控制命令不准确时,对所述原始的控制命令进行纠错处理,确定准确的控制命令;
当确定准确的控制命令成功时,根据所述准确的控制命令控制相应的受控设备。
可选地,所述控制命令包括控制主体,所述对所述原始的控制命令进行纠错处理,确定准确的控制命令的步骤包括:
对所述原始的控制命令的控制主体进行同音词纠错,在预置的设备信息中查找所述控制主体的同音词;
当查找到所述同音词时,确定所述同音词为准确的控制主体。
可选地,所述设备信息包括设备类型和/或设备名称。
可选地,所述控制命令包括控制指令,所述对所述原始的控制命令进行纠错处理,确定准确的控制命令的步骤包括:
对所述原始的控制命令的控制指令进行同音词纠错,在预置的指令词汇表中查找所述控制指令的同音词;
当查找到的所述同音词为正常的指令时,确定所述同音词为准确的控制指令。
可选地,所述在预置的指令词汇表中查找所述控制指令的同音词的步骤之后还包括:
当没有查找到所述同音词或查找到的所述同音词为非正常的指令时,对所述控制指令进行同义词纠错,在预置的同义词词库中查找所述原始控制指令的同义词;
当查找到的所述同义词为正常的指令时,确定所述同义词为准确的控制指令。
可选地,所述在预置的同义词词库中查找所述控制指令的同义词的步骤之后还包括:
当没有查找到所述同义词或查找到的所述同义词为非正常的指令时,对所述控制指令进行模糊音纠错,在预置的模糊音纠错词库中查找与所述控制指令的发音相似的近音词;
当查找到的所述近音词为正常的指令时,确定所述近音词为准确的控制指令。
可选地,所述对所述原始的控制命令进行纠错处理,确定准确的控制命令的步骤之后还包括:当确定准确的控制命令失败时,提示错误信息。
另一方面提出一种语音控制装置,所述装置包括:
获取模块,用于获取语音控制命令对应的文本信息;
解析模块,用于根据所述文本信息解析出原始的控制命令;
纠错模块,用于当所述原始的控制命令不准确时,对所述原始的控制命令进行纠错处理,确定准确的控制命令;
控制模块,用于当确定准确的控制命令成功时,根据所述准确的控制命令控制相应的受控设备。
又一方面提出一种服务器,所述服务器包括存储器、处理器和至少一个被存储在所述存储器中并被配置为由所述处理器执行的应用程序,所述应用程序被配置为用于执行前述语音控制方法。
在一方面提出一种计算机可读存储介质,所述计算机可读存储介质上存储有语音控制程序,所述语音控制程序被处理器执行时,实现前述语音控制方法的步骤。
本发明实施例所提供的一种语音控制方法,通过在原始的控制命令不准确时对其进行纠错处理,确定准确的控制命令,并根据准确的控制命令控制相应的受控设备。从而大大增强了系统的语音识别能力和语义理解能力,提高了系统对语音控制命令的识别率,即使用户口音含糊不清或没有说出标准的语音控制命令,系统也能准确的理解用户的真实意图,进而提高了语音控制的准确率和效率,提升了用户体验。
附图说明
图1是本发明的语音控制方法一实施例的流程图;
图2是本发明的语音控制装置一实施例的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本发明实施例的语音控制方法和装置,主要应用于服务器,当然也可以应用于智能终端(如手机、平板等移动终端),本发明对此不作限定。以下以应用于服务器为例进行详细说明。
参见图1,提出本发明的语音控制方法一实施例,所述方法包括以下步骤:
S11、获取语音控制命令对应的文本信息。
本发明实施例中,智能终端采集用户的语音控制命令,并对语音控制命令进行语音识别,将声音转换为文字,得到该语音控制命令对应的文本信息,并将该文本信息发送给服务器,服务器接收该文本信息。
智能终端可以在本地进行语音识别,也可以通过第三方服务器进行语音识别,即:智能终端将语音控制命令发送给第三方服务器,第三方服务器对语音控制命令进行语音识别,得到该语音控制命令对应的文本信息,并将文本信息返回给智能终端。
在某些实施例中,智能终端也可以直接将语音控制命令发送给服务器,由服务器对该语音控制命令进行语音识别,获取该语音控制命令对应的文本信息。
S12、根据文本信息解析出原始的控制命令。
本步骤S12中,服务器对文本信息进行语义解析,将文本信息拆分为控制主体和控制指令,从而直接识别出原始的控制命令,该控制命令即由控制主体和控制指令组成。
当识别出原始的控制命令后,服务器随即判断原始的控制命令是否准确。具体的,服务器查找预置的设备信息和指令词汇表,判断设备信息中是否包含原始的控制命令的控制主体,指令词汇表中是否包含原始的控制命令的控制指令;当设备信息和指令词汇表中分别包含了原始的控制命令的控制主体和控制指令时,则判定原始的控制命令为准确的控制命令;当设备信息中不包含原始的控制命令的控制主体和/或者指令词汇表中不包含原始的控制命令的控制指令时,则判定原始的控制命令不准确。
设备信息包括设备类型和/或设备名称。设备类型如电视、空调、机顶盒、开关、灯光等,这些都属于控制主体。设备名称即为不同的设备定义的名称,如将空调命名为“温度调节小助手”,这些也属于控制主体。用户在智能终端上通过账号密码登录服务器时,服务器则自动保存该账号下关联的所有设备的设备名称,服务器可以将设备名称和设备类型放在一个词汇表里面予以存储。
指令词汇表中基本囊括了目前所有的受控设备的控制术语,比如送风、打开、关闭、减小、增大、升温、降温、送风、静音、暂停、songfeng、dakai、guanbi等等,这些都属于控制指令。
当原始的控制命令准确时,服务器则直接根据原始的控制命令控制相应的受控设备。例如,服务器将控制命令的控制指令发送给控制命令的控制主体所对应的受控设备,受控设备接收到控制指令后则执行该控制指令。服务器在发送控制指令时,可以直接向控制主体对应的受控设备发送控制指令,也可以通过智能终端发送控制指令,即将控制指令发送给智能终端,智能终端再将该控制指令转发给控制主体所对应的受控设备。所述受控设备如电视、空调、机顶盒等智能设备。
S13、当原始的控制命令不准确时,对原始的控制命令进行纠错处理,确定准确的控制命令。
本发明实施例中,当原始的控制命令不准确时,服务器则对原始的控制命令进行纠错处理,以确定准确的控制命令。其中,纠错处理方式包括同音词纠错、同义词纠错、模糊音纠错等,例如,当同音词纠错失败时,可以继续进行同义词纠错,当同义词纠错仍然失败时,还可以继续进行模糊音纠错。
可选地,当原始的控制命令的控制主体不准确时,服务器则对原始的控制命令的控制主体进行同音词纠错,在预置的设备信息中查找该控制主体的同音词;当查找到控制主体的同音词时,则确定该同音词为准确的控制主体,从而确定准确的控制命令成功;当没有查找到控制主体的同音词时,则确定准确的控制命令失败。
在查找同音词时,服务器首先解析出原始的控制命令的控制主体所对应的拼音,然后在设备信息中查找是否有与该拼音相对应的词汇;当查找到与该拼音相对应的词汇时,则提取该词汇作为该控制主体的同音词;当没有查找到与该拼音相对应的词汇时,则说明设备信息中没有该控制主体的同音词。
可选地,当原始的控制命令的控制指令不准确时,服务器则对原始的控制命令的控制指令进行同音词纠错,在预置的指令词汇表中查找该控制指令的同音词;当查找到的该控制指令的同音词为正常的指令时,则确定同音词为准确的控制指令。
在查找同音词时,服务器首先解析出原始的控制命令的控制指令所对应的拼音,然后在指令词汇表中查找是否有与该拼音相对应的词汇;当查找到与该拼音相对应的词汇时,则提取该词汇作为该控制指令的同音词;当没有查找到与该拼音相对应的词汇时,则说明指令词汇表中没有该控制指令的同音词。
例如,对于“空调送风”的语音控制命令,在对其进行语音识别时可能识别为“空调宋峰”。此时,服务器首先解析出“宋峰”对应的拼音为“songfeng”,然后在指令词汇表中查找到与该拼音相对应的词汇“送风”,提取“送风”作为“宋峰”的同义词,从而准确的识别出用户的真实意图是希望“空调送风”。
在判断控制指令的同音词是否为正常的指令时,服务器需要将同音词与控制主体结合起来综合判断。可选地,可以将同音词作为控制指令与控制主体相结合形成控制命令,判断该控制命令是否符合逻辑。例如,查找到控制指令的同音词为“暂停”,如果控制主体为“空调”,则“空调暂停”的控制命令就不符合逻辑,此时同音词“暂停”就是非正常的指令;如果控制主体为“电视”,则“电视暂停”的控制命令就符合逻辑,此时同音词“暂停”就是正常的指令。
在某些实施例中,当没有查找到控制指令的同音词或查找到的同音词为非正常的指令时,服务器则判定确定准确的控制命令失败。
在另一些实施例中,当没有查找到控制指令的同音词或查找到的同音词为非正常的指令时,服务器进一步对控制指令进行同义词纠错,在预置的同义词词库中查找原始控制指令的同义词,当查找到的同义词为正常的指令时,则确定同义词为准确的控制指令。
对于同义词纠错,可以预先基于控制指令词汇表生成一套同义词词库。例如,“打开”、“开”、“开启”、“启动”都是同义词,可以在同义词词库中将这些同义词形成多对一的对应关系,将“打开”、“开启”、“启动”都与“开”相对应。当原始的控制命令的控制指令为“启动”时,则可以在同义词词库中查找到其同义词为“开”,从而用户无论说“开空调”,还是“打开空调”、“开启空调”、“启动空调”,都能成功的把空调打开。
在判断控制指令的同义词是否为正常的指令时,服务器需要将同义词与控制主体结合起来综合判断。可选地,可以将同义词作为控制指令与控制主体相结合形成控制命令,判断该控制命令是否符合逻辑。例如,查找到控制指令的同义词为“升温”,如果控制主体为“电视”,则“电视升温”的控制命令就不符合逻辑,此时同义词“升温”就是非正常的指令;如果控制主体为“空调”,则“空调升温”的控制命令就符合逻辑,此时同义词“升温”就是正常的指令。
在某些实施例中,当没有查找到控制指令的同义词或查找到的同义词为非正常的指令时,服务器则判定确定准确的控制命令失败。
在另一些实施例中,当没有查找到控制指令的同义词或查找到的同义词为非正常的指令时,服务器进一步对控制指令进行模糊音纠错,在预置的模糊音纠错词库中查找与控制指令的发音相似的近音词;当查找到的近音词为正常的指令时,则确定近音词为准确的控制指令。
对于同义词纠错,可以预先基于控制指令词汇表和不同地方的方言(或口音)生成一套模糊音纠错词库。例如,某些地方的口音在说“关”时听起来像“光”,语音识别时就可能将“关空调”识别为“光空调”,故可以在模糊音纠错词库中建立“光”与“关”的对应关系。当原始的控制命令的控制指令为“光”时,则可以在模糊音纠错词库中查找到其近音词为“关”,从而即使用户说出的声音听起来像“光空调”,服务器也能够明白用户的真实意图为“关空调”,从而成功的把空调关闭。
在判断控制指令的近音词是否为正常的指令时,服务器需要将近音词与控制主体结合起来综合判断。可选地,可以将近音词作为控制指令与控制主体相结合形成控制命令,判断该控制命令是否符合逻辑。例如,查找到控制指令的近音词为“送风”,如果控制主体为“送风”,则“电视送风”的控制命令就不符合逻辑,此时近音词“送风”就是非正常的指令;如果控制主体为“空调”,则“空调送风”的控制命令就符合逻辑,此时近音词“送风”就是正常的指令。
当没有查找到控制指令的近音词或查找到的近音词为非正常的指令时,服务器则判定确定准确的控制命令失败。
可选地,当原始的控制命令的控制主体和控制指令均不准确时,服务器则需要分别对控制主体和控制指令进行纠错处理。对于控制主体的纠错,考虑需要精准控制,故本发明实施例只选择同音词纠错,当然在其它实施例中还可以选择同义词纠错、模糊音纠错,本发明对此不作限定。对于控制指令的纠错,可以首先进行同音词纠错,当纠错失败时,再进行同义词纠错,当纠错仍然失败时,再进行模糊音纠错,当然在其它实施例中,也可以只选择同音词纠错,或者只选择同音词、同义词纠错,本发明对此不作限定。
S14、当确定准确的控制命令成功时,根据准确的控制命令控制相应的受控设备。
本发明实施例中,当确定准确的控制命令成功时,服务器则根据确定的准确的控制命令控制相应的受控设备。例如,服务器将控制命令的控制指令发送给控制命令的控制主体所对应的受控设备,受控设备接收到控制指令后则执行该控制指令。服务器在发送控制指令时,可以直接向控制主体对应的受控设备发送控制指令,也可以通过智能终端发送控制指令,即将控制指令发送给智能终端,智能终端再将该控制指令转发给控制主体所对应的受控设备。
进一步地,当确定准确的控制命令失败时,服务器则提示错误信息。例如,服务器向智能终端发送“语音错误,请重新输入”的提示信息,智能终端接收到该提示信息后通过显示屏显示该提示信息和/或通过发声装置输出该提示信息。从而用户则及时知悉问题所在,立即重新发布语音控制命令。
在某些实施例中,当确定准确的控制命令失败时,服务器也可以不予响应。
本发明实施例的语音控制方法,通过在原始的控制命令不准确时对其进行纠错处理,确定准确的控制命令,并根据准确的控制命令控制相应的受控设备。从而大大增强了系统的语音识别能力和语义理解能力,提高了系统对语音控制命令的识别率,即使用户口音含糊不清或没有说出标准的语音控制命令,系统也能准确的理解用户的真实意图,进而提高了语音控制的准确率和效率,提升了用户体验。
参照图2,提出本发明的语音控制装置一实施例,所述装置包括获取模块10、解析模块20、纠错模块30和控制模块40,其中:获取模块10,用于获取语音控制命令对应的文本信息;解析模块20,用于根据文本信息解析出原始的控制命令;纠错模块30,用于当原始的控制命令不准确时,对原始的控制命令进行纠错处理,确定准确的控制命令;控制模块40,用于当确定准确的控制命令成功时,根据准确的控制命令控制相应的受控设备。
可选地,获取模块10接收智能终端的发送的语音控制命令对应的文本信息。
可选地,获取模块10接收智能终端发送的语音控制命令,对该语音控制命令进行语音识别,将声音转换为文字,获取该语音控制命令对应的文本信息。
当获取语音控制命令的文本信息后,解析模块20对文本信息进行语义解析,将文本信息拆分为控制主体和控制指令,从而直接识别出原始的控制命令,该控制命令即由控制主体和控制指令组成。
当识别出原始的控制命令后,解析模块20随即判断原始的控制命令是否准确。具体的,解析模块20查找预置的设备信息和指令词汇表,判断设备信息中是否包含原始的控制命令的控制主体,指令词汇表中是否包含原始的控制命令的控制指令;当设备信息和指令词汇表中分别包含了原始的控制命令的控制主体和控制指令时,则判定原始的控制命令为准确的控制命令;当设备信息中不包含原始的控制命令的控制主体和/或者指令词汇表中不包含原始的控制命令的控制指令时,则判定原始的控制命令不准确。
设备信息包括设备类型和/或设备名称。设备类型如电视、空调、机顶盒、开关、灯光等,这些都属于控制主体。设备名称即为不同的设备定义的名称,如将空调命名为“温度调节小助手”,这些也属于控制主体。用户在智能终端上通过账号密码登录服务器时,服务器则自动保存该账号下关联的所有设备的设备名称,服务器可以将设备名称和设备类型放在一个词汇表里面予以存储。
指令词汇表中基本囊括了目前所有的受控设备的控制术语,比如送风、打开、关闭、减小、增大、升温、降温、送风、静音、暂停、songfeng、dakai、guanbi等等,这些都属于控制指令。
当原始的控制命令不准确时,纠错模块30则对原始的控制命令进行纠错处理,以确定准确的控制命令。其中,纠错处理方式包括同音词纠错、同义词纠错、模糊音纠错等,例如,当同音词纠错失败时,可以继续进行同义词纠错,当同义词纠错仍然失败时,还可以继续进行模糊音纠错。
可选地,当原始的控制命令的控制主体不准确时,纠错模块30则对原始的控制命令的控制主体进行同音词纠错,在预置的设备信息中查找该控制主体的同音词;当查找到控制主体的同音词时,则确定该同音词为准确的控制主体,从而确定准确的控制命令成功;当没有查找到控制主体的同音词时,则确定准确的控制命令失败。
在查找同音词时,纠错模块30首先解析出原始的控制命令的控制主体所对应的拼音,然后在设备信息中查找是否有与该拼音相对应的词汇;当查找到与该拼音相对应的词汇时,则提取该词汇作为该控制主体的同音词;当没有查找到与该拼音相对应的词汇时,则说明设备信息中没有该控制主体的同音词。
可选地,当原始的控制命令的控制指令不准确时,纠错模块30则对原始的控制命令的控制指令进行同音词纠错,在预置的指令词汇表中查找该控制指令的同音词;当查找到的该控制指令的同音词为正常的指令时,则确定同音词为准确的控制指令。
在查找同音词时,纠错模块30首先解析出原始的控制命令的控制指令所对应的拼音,然后在指令词汇表中查找是否有与该拼音相对应的词汇;当查找到与该拼音相对应的词汇时,则提取该词汇作为该控制指令的同音词;当没有查找到与该拼音相对应的词汇时,则说明指令词汇表中没有该控制指令的同音词。
例如,对于“空调送风”的语音控制命令,在对其进行语音识别时可能识别为“空调宋峰”。此时,纠错模块30首先解析出“宋峰”对应的拼音为“songfeng”,然后在指令词汇表中查找到与该拼音相对应的词汇“送风”,提取“送风”作为“宋峰”的同义词,从而准确的识别出用户的真实意图是希望“空调送风”。
在判断控制指令的同音词是否为正常的指令时,纠错模块30需要将同音词与控制主体结合起来综合判断。可选地,可以将同音词作为控制指令与控制主体相结合形成控制命令,判断该控制命令是否符合逻辑。例如,查找到控制指令的同音词为“暂停”,如果控制主体为“空调”,则“空调暂停”的控制命令就不符合逻辑,此时同音词“暂停”就是非正常的指令;如果控制主体为“电视”,则“电视暂停”的控制命令就符合逻辑,此时同音词“暂停”就是正常的指令。
在某些实施例中,当没有查找到控制指令的同音词或查找到的同音词为非正常的指令时,纠错模块30则判定确定准确的控制命令失败。
在另一些实施例中,当没有查找到控制指令的同音词或查找到的同音词为非正常的指令时,纠错模块30进一步对控制指令进行同义词纠错,在预置的同义词词库中查找原始控制指令的同义词,当查找到的同义词为正常的指令时,则确定同义词为准确的控制指令。
对于同义词纠错,可以预先基于控制指令词汇表生成一套同义词词库。例如,“打开”、“开”、“开启”、“启动”都是同义词,可以在同义词词库中将这些同义词形成多对一的对应关系,将“打开”、“开启”、“启动”都与“开”相对应。当原始的控制命令的控制指令为“启动”时,则可以在同义词词库中查找到其同义词为“开”,从而用户无论说“开空调”,还是“打开空调”、“开启空调”、“启动空调”,都能成功的把空调打开。
在判断控制指令的同义词是否为正常的指令时,纠错模块30需要将同义词与控制主体结合起来综合判断。可选地,可以将同义词作为控制指令与控制主体相结合形成控制命令,判断该控制命令是否符合逻辑。例如,查找到控制指令的同义词为“升温”,如果控制主体为“电视”,则“电视升温”的控制命令就不符合逻辑,此时同义词“升温”就是非正常的指令;如果控制主体为“空调”,则“空调升温”的控制命令就符合逻辑,此时同义词“升温”就是正常的指令。
在某些实施例中,当没有查找到控制指令的同义词或查找到的同义词为非正常的指令时,纠错模块30则判定确定准确的控制命令失败。
在另一些实施例中,当没有查找到控制指令的同义词或查找到的同义词为非正常的指令时,纠错模块30进一步对控制指令进行模糊音纠错,在预置的模糊音纠错词库中查找与控制指令的发音相似的近音词;当查找到的近音词为正常的指令时,则确定近音词为准确的控制指令。
对于同义词纠错,可以预先基于控制指令词汇表和不同地方的方言(或口音)生成一套模糊音纠错词库。例如,某些地方的口音在说“关”时听起来像“光”,语音识别时就可能将“关空调”识别为“光空调”,故可以在模糊音纠错词库中建立“光”与“关”的对应关系。当原始的控制命令的控制指令为“光”时,则可以在模糊音纠错词库中查找到其近音词为“关”,从而即使用户说出的声音听起来像“光空调”,服务器也能够明白用户的真实意图为“关空调”,从而成功的把空调关闭。
在判断控制指令的近音词是否为正常的指令时,纠错模块30需要将近音词与控制主体结合起来综合判断。可选地,可以将近音词作为控制指令与控制主体相结合形成控制命令,判断该控制命令是否符合逻辑。例如,查找到控制指令的近音词为“送风”,如果控制主体为“送风”,则“电视送风”的控制命令就不符合逻辑,此时近音词“送风”就是非正常的指令;如果控制主体为“空调”,则“空调送风”的控制命令就符合逻辑,此时近音词“送风”就是正常的指令。
当没有查找到控制指令的近音词或查找到的近音词为非正常的指令时,纠错模块30则判定确定准确的控制命令失败。
可选地,当原始的控制命令的控制主体和控制指令均不准确时,纠错模块30则需要分别对控制主体和控制指令进行纠错处理。对于控制主体的纠错,考虑需要精准控制,故本发明实施例只选择同音词纠错,当然在其它实施例中还可以选择同义词纠错、模糊音纠错,本发明对此不作限定。对于控制指令的纠错,可以首先进行同音词纠错,当纠错失败时,再进行同义词纠错,当纠错仍然失败时,再进行模糊音纠错,当然在其它实施例中,也可以只选择同音词纠错,或者选择同音词、同义词纠错,本发明对此不作限定。
当确定准确的控制命令成功时,控制模块40则根据确定的准确的控制命令控制相应的受控设备。例如,控制模块40将控制命令的控制指令发送给控制命令的控制主体所对应的受控设备,受控设备接收到控制指令后则执行该控制指令。控制模块40在发送控制指令时,可以直接向控制主体对应的受控设备发送控制指令,也可以通过智能终端发送控制指令,即将控制指令发送给智能终端,智能终端再将该控制指令转发给控制主体所对应的受控设备。所述受控设备如电视、空调、机顶盒等智能设备。
进一步地,语音控制装置还可以包括提示模块,提示模块用于当确定准确的控制命令失败时,提示错误信息。例如,提示模块向智能终端发送“语音错误,请重新输入”的提示信息,智能终端接收到该提示信息后通过显示屏显示该提示信息和/或通过发声装置输出该提示信息。从而用户则及时知悉问题所在,立即重新发布语音控制命令。
在某些实施例中,当确定准确的控制命令失败时,也可以不予响应。
当原始的控制命令准确时,控制模块40则直接根据原始的控制命令控制相应的受控设备。例如,控制模块40将控制命令的控制指令发送给控制命令的控制主体所对应的受控设备,受控设备接收到控制指令后则执行该控制指令。控制模块40在发送控制指令时,可以直接向控制主体对应的受控设备发送控制指令,也可以通过智能终端发送控制指令,即将控制指令发送给智能终端,智能终端再将该控制指令转发给控制主体所对应的受控设备。
本发明实施例的语音控制装置,通过在原始的控制命令不准确时对其进行纠错处理,确定准确的控制命令,并根据准确的控制命令控制相应的受控设备。从而大大增强了系统的语音识别能力和语义理解能力,提高了系统对语音控制命令的识别率,即使用户口音含糊不清或没有说出标准的语音控制命令,系统也能准确的理解用户的真实意图,进而提高了语音控制的准确率和效率,提升了用户体验。
前述实施例以应用于服务器进行了详细说明,本领域技术人员可以理解,本发明实施例的语音控制方法和装置也可以应用于智能终端。即由智能终端根据语音控制命令对应的文本信息解析出原始的控制命令,当原始的控制命令不准确时,则对原始的控制命令进行纠错处理,确定准确的控制命令,最后通过准确的控制命令控制受控设备。具体流程与上述实施例类似,在此不再赘述。
本发明同时提出一种服务器,其包括存储器、处理器和至少一个被存储在存储器中并被配置为由处理器执行的应用程序,所述应用程序被配置为用于执行语音控制方法。所述语音控制方法包括以下步骤:获取语音控制命令对应的文本信息;根据文本信息解析出原始的控制命令;当原始的控制命令不准确时,对原始的控制命令进行纠错处理,确定准确的控制命令;当确定准确的控制命令成功时,根据准确的控制命令控制相应的受控设备。本实施例中所描述的语音控制方法为本发明中上述实施例所涉及的语音控制方法,在此不再赘述。
本发明同时提出一种计算机可读存储介质,所述计算机可读存储介质上存储有语音控制程序,所述语音控制程序被处理器执行时,实现一种语音控制方法的步骤。所述语音控制方法包括以下步骤:获取语音控制命令对应的文本信息;根据文本信息解析出原始的控制命令;当原始的控制命令不准确时,对原始的控制命令进行纠错处理,确定准确的控制命令;当确定准确的控制命令成功时,根据准确的控制命令控制相应的受控设备。本实施例中所描述的语音控制方法为本发明中上述实施例所涉及的语音控制方法,在此不再赘述。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
应当理解的是,以上仅为本发明的优选实施例,不能因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种语音控制方法,其特征在于,包括以下步骤:
获取语音控制命令对应的文本信息;
根据所述文本信息解析出原始的控制命令;
当所述原始的控制命令不准确时,对所述原始的控制命令进行纠错处理,确定准确的控制命令;
当确定准确的控制命令成功时,根据所述准确的控制命令控制相应的受控设备。
2.根据权利要求1所述的语音控制方法,其特征在于,所述控制命令包括控制主体,所述对所述原始的控制命令进行纠错处理,确定准确的控制命令的步骤包括:
对所述原始的控制命令的控制主体进行同音词纠错,在预置的设备信息中查找所述控制主体的同音词;
当查找到所述同音词时,确定所述同音词为准确的控制主体。
3.根据权利要求2所述的语音控制方法,其特征在于,所述设备信息包括设备类型和/或设备名称。
4.根据权利要求1所述的语音控制方法,其特征在于,所述控制命令包括控制指令,所述对所述原始的控制命令进行纠错处理,确定准确的控制命令的步骤包括:
对所述原始的控制命令的控制指令进行同音词纠错,在预置的指令词汇表中查找所述控制指令的同音词;
当查找到的所述同音词为正常的指令时,确定所述同音词为准确的控制指令。
5.根据权利要求4所述的语音控制方法,其特征在于,所述在预置的指令词汇表中查找所述控制指令的同音词的步骤之后还包括:
当没有查找到所述同音词或查找到的所述同音词为非正常的指令时,对所述控制指令进行同义词纠错,在预置的同义词词库中查找所述原始控制指令的同义词;
当查找到的所述同义词为正常的指令时,确定所述同义词为准确的控制指令。
6.根据权利要求5所述的语音控制方法,其特征在于,所述在预置的同义词词库中查找所述控制指令的同义词的步骤之后还包括:
当没有查找到所述同义词或查找到的所述同义词为非正常的指令时,对所述控制指令进行模糊音纠错,在预置的模糊音纠错词库中查找与所述控制指令的发音相似的近音词;
当查找到的所述近音词为正常的指令时,确定所述近音词为准确的控制指令。
7.根据权利要求1-6任一项所述的语音控制方法,其特征在于,所述对所述原始的控制命令进行纠错处理,确定准确的控制命令的步骤之后还包括:
当确定准确的控制命令失败时,提示错误信息。
8.一种语音控制装置,其特征在于,包括:
获取模块,用于获取语音控制命令对应的文本信息;
解析模块,用于根据所述文本信息解析出原始的控制命令;
纠错模块,用于当所述原始的控制命令不准确时,对所述原始的控制命令进行纠错处理,确定准确的控制命令;
控制模块,用于当确定准确的控制命令成功时,根据所述准确的控制命令控制相应的受控设备。
9.一种服务器,包括存储器、处理器和至少一个被存储在所述存储器中并被配置为由所述处理器执行的应用程序,其特征在于,所述应用程序被配置为用于执行权利要求1至8任一项所述的语音控制方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语音控制程序,所述语音控制程序被处理器执行时,实现如权利要求1至8中任一项所述的语音控制方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711278623.5A CN108121528A (zh) | 2017-12-06 | 2017-12-06 | 语音控制方法、装置、服务器和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711278623.5A CN108121528A (zh) | 2017-12-06 | 2017-12-06 | 语音控制方法、装置、服务器和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108121528A true CN108121528A (zh) | 2018-06-05 |
Family
ID=62229735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711278623.5A Pending CN108121528A (zh) | 2017-12-06 | 2017-12-06 | 语音控制方法、装置、服务器和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108121528A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108942925A (zh) * | 2018-06-25 | 2018-12-07 | 珠海格力智能装备有限公司 | 机器人的控制方法和装置 |
CN109450745A (zh) * | 2018-10-15 | 2019-03-08 | 深圳市欧瑞博科技有限公司 | 信息处理方法、装置、智能控制系统以及智能网关 |
CN109587019A (zh) * | 2018-12-12 | 2019-04-05 | 珠海格力电器股份有限公司 | 一种家电设备的语音控制方法、装置、存储介质及系统 |
CN109637534A (zh) * | 2018-12-25 | 2019-04-16 | 深圳创维-Rgb电子有限公司 | 语音遥控方法、系统、受控装置及计算机可读存储介质 |
CN109712617A (zh) * | 2018-12-06 | 2019-05-03 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN109817207A (zh) * | 2018-12-20 | 2019-05-28 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN110176252A (zh) * | 2019-05-08 | 2019-08-27 | 江西尚通科技发展股份有限公司 | 基于风险管控模式的智能语音质检方法及系统 |
CN110262273A (zh) * | 2019-07-12 | 2019-09-20 | 珠海格力电器股份有限公司 | 一种家居设备控制方法、装置、存储介质及智能家居系统 |
CN110767232A (zh) * | 2019-09-29 | 2020-02-07 | 深圳和而泰家居在线网络科技有限公司 | 语音识别控制方法及装置、计算机设备和计算机存储介质 |
CN111128173A (zh) * | 2019-12-31 | 2020-05-08 | 重庆和贯科技有限公司 | 基于语音识别技术的智能家居语音交互方法 |
CN111329677A (zh) * | 2020-03-23 | 2020-06-26 | 夏艳霞 | 一种基于语音识别的轮椅控制方法 |
CN111372110A (zh) * | 2020-04-13 | 2020-07-03 | 李小强 | 一种基于语音识别的电视控制方法 |
CN111415656A (zh) * | 2019-01-04 | 2020-07-14 | 上海擎感智能科技有限公司 | 语音语义识别方法、装置及车辆 |
CN111462754A (zh) * | 2020-04-16 | 2020-07-28 | 深圳航天科创实业有限公司 | 一种电力系统调度控制语音识别模型建立方法 |
CN112511882A (zh) * | 2020-11-13 | 2021-03-16 | 海信视像科技股份有限公司 | 一种显示设备及语音唤起方法 |
CN114091408A (zh) * | 2020-08-04 | 2022-02-25 | 科沃斯商用机器人有限公司 | 文本纠正、模型训练方法、纠正模型、设备及机器人 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103944983A (zh) * | 2014-04-14 | 2014-07-23 | 美的集团股份有限公司 | 语音控制指令纠错方法和系统 |
CN104122979A (zh) * | 2013-04-25 | 2014-10-29 | 深圳市快播科技有限公司 | 一种语音控制大屏幕的方法及装置 |
CN104978964A (zh) * | 2014-04-14 | 2015-10-14 | 美的集团股份有限公司 | 语音控制指令纠错方法和系统 |
CN105206272A (zh) * | 2015-09-06 | 2015-12-30 | 上海智臻智能网络科技股份有限公司 | 语音传输控制方法及系统 |
CN105810189A (zh) * | 2016-03-22 | 2016-07-27 | 北京京东尚科信息技术有限公司 | 设备的语音控制方法、装置及系统 |
CN105976818A (zh) * | 2016-04-26 | 2016-09-28 | Tcl集团股份有限公司 | 指令识别的处理方法及装置 |
-
2017
- 2017-12-06 CN CN201711278623.5A patent/CN108121528A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104122979A (zh) * | 2013-04-25 | 2014-10-29 | 深圳市快播科技有限公司 | 一种语音控制大屏幕的方法及装置 |
CN103944983A (zh) * | 2014-04-14 | 2014-07-23 | 美的集团股份有限公司 | 语音控制指令纠错方法和系统 |
CN104978964A (zh) * | 2014-04-14 | 2015-10-14 | 美的集团股份有限公司 | 语音控制指令纠错方法和系统 |
CN105206272A (zh) * | 2015-09-06 | 2015-12-30 | 上海智臻智能网络科技股份有限公司 | 语音传输控制方法及系统 |
CN105810189A (zh) * | 2016-03-22 | 2016-07-27 | 北京京东尚科信息技术有限公司 | 设备的语音控制方法、装置及系统 |
CN105976818A (zh) * | 2016-04-26 | 2016-09-28 | Tcl集团股份有限公司 | 指令识别的处理方法及装置 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108942925A (zh) * | 2018-06-25 | 2018-12-07 | 珠海格力智能装备有限公司 | 机器人的控制方法和装置 |
CN109450745A (zh) * | 2018-10-15 | 2019-03-08 | 深圳市欧瑞博科技有限公司 | 信息处理方法、装置、智能控制系统以及智能网关 |
CN109712617A (zh) * | 2018-12-06 | 2019-05-03 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN109587019A (zh) * | 2018-12-12 | 2019-04-05 | 珠海格力电器股份有限公司 | 一种家电设备的语音控制方法、装置、存储介质及系统 |
CN109817207A (zh) * | 2018-12-20 | 2019-05-28 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及空调 |
CN109637534A (zh) * | 2018-12-25 | 2019-04-16 | 深圳创维-Rgb电子有限公司 | 语音遥控方法、系统、受控装置及计算机可读存储介质 |
CN111415656A (zh) * | 2019-01-04 | 2020-07-14 | 上海擎感智能科技有限公司 | 语音语义识别方法、装置及车辆 |
CN111415656B (zh) * | 2019-01-04 | 2024-04-30 | 上海擎感智能科技有限公司 | 语音语义识别方法、装置及车辆 |
CN110176252A (zh) * | 2019-05-08 | 2019-08-27 | 江西尚通科技发展股份有限公司 | 基于风险管控模式的智能语音质检方法及系统 |
CN110262273A (zh) * | 2019-07-12 | 2019-09-20 | 珠海格力电器股份有限公司 | 一种家居设备控制方法、装置、存储介质及智能家居系统 |
CN110767232A (zh) * | 2019-09-29 | 2020-02-07 | 深圳和而泰家居在线网络科技有限公司 | 语音识别控制方法及装置、计算机设备和计算机存储介质 |
CN110767232B (zh) * | 2019-09-29 | 2022-03-29 | 深圳数联天下智能科技有限公司 | 语音识别控制方法及装置、计算机设备和计算机存储介质 |
CN111128173A (zh) * | 2019-12-31 | 2020-05-08 | 重庆和贯科技有限公司 | 基于语音识别技术的智能家居语音交互方法 |
CN111329677A (zh) * | 2020-03-23 | 2020-06-26 | 夏艳霞 | 一种基于语音识别的轮椅控制方法 |
CN111372110A (zh) * | 2020-04-13 | 2020-07-03 | 李小强 | 一种基于语音识别的电视控制方法 |
CN111462754A (zh) * | 2020-04-16 | 2020-07-28 | 深圳航天科创实业有限公司 | 一种电力系统调度控制语音识别模型建立方法 |
CN114091408A (zh) * | 2020-08-04 | 2022-02-25 | 科沃斯商用机器人有限公司 | 文本纠正、模型训练方法、纠正模型、设备及机器人 |
CN112511882A (zh) * | 2020-11-13 | 2021-03-16 | 海信视像科技股份有限公司 | 一种显示设备及语音唤起方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108121528A (zh) | 语音控制方法、装置、服务器和计算机可读存储介质 | |
CN107146612B (zh) | 语音引导方法、装置、智能设备及服务器 | |
US20200312329A1 (en) | Performing speech recognition using a local language context including a set of words with descriptions in terms of components smaller than the words | |
CN106250474B (zh) | 一种语音控制的处理方法及系统 | |
CN105592343B (zh) | 针对问题和回答的显示装置和方法 | |
US20190371329A1 (en) | Voice enablement and disablement of speech processing functionality | |
CN108172223A (zh) | 语音指令识别方法、装置及服务器和计算机可读存储介质 | |
CN106101789B (zh) | 终端的语音交互方法及装置 | |
EP3365890B1 (en) | Learning personalized entity pronunciations | |
US7103553B2 (en) | Assistive call center interface | |
KR100679043B1 (ko) | 음성 대화 인터페이스 장치 및 방법 | |
CN106796496B (zh) | 显示设备及其操作方法 | |
CN107430855B (zh) | 在支持语音的电子设备中对语音转文本模型的场境敏感动态更新 | |
EP4064713A1 (en) | Voice control method and apparatus, server, terminal device, and storage medium | |
CN108682419A (zh) | 语音控制方法及设备、计算机可读存储介质及设备 | |
CN107833574A (zh) | 用于提供语音服务的方法和装置 | |
CN108877792B (zh) | 用于处理语音对话的方法、装置、电子设备以及计算机可读存储介质 | |
EP3842939B1 (en) | Service data processing method and apparatus, and related device | |
CN111670471A (zh) | 基于对在线语音命令的使用来学习离线语音命令 | |
CN111522909A (zh) | 一种语音交互方法及服务器 | |
CN104699676A (zh) | 基于语音识别的信息搜索方法和系统 | |
CN111737987A (zh) | 意图识别方法、装置、设备及存储介质 | |
CN111178081B (zh) | 语义识别的方法、服务器、电子设备及计算机存储介质 | |
KR102140391B1 (ko) | 검색 방법 및 이 방법을 적용하는 전자 장치 | |
CN106239506A (zh) | 智能机器人的多模态输入数据处理方法及机器人操作系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Nanshan District Xueyuan Road in Shenzhen city of Guangdong province 518000 No. 1001 Nanshan Chi Park A7 building 7 floor Applicant after: Shenzhen euribo Technology Co., Ltd Address before: Nanshan District Xueyuan Road in Shenzhen city of Guangdong province 518000 No. 1001 Nanshan Chi Park A7 building 7 floor Applicant before: SHENZHEN ORVIBO TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180605 |
|
RJ01 | Rejection of invention patent application after publication |