CN110097885A - 一种语音控制方法及系统 - Google Patents

一种语音控制方法及系统 Download PDF

Info

Publication number
CN110097885A
CN110097885A CN201810098911.0A CN201810098911A CN110097885A CN 110097885 A CN110097885 A CN 110097885A CN 201810098911 A CN201810098911 A CN 201810098911A CN 110097885 A CN110097885 A CN 110097885A
Authority
CN
China
Prior art keywords
controlled entity
control
entity information
confirmation
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810098911.0A
Other languages
English (en)
Inventor
王连水
彭俊斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN RAYSGEM ELECTRONIC TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN RAYSGEM ELECTRONIC TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN RAYSGEM ELECTRONIC TECHNOLOGY Co Ltd filed Critical SHENZHEN RAYSGEM ELECTRONIC TECHNOLOGY Co Ltd
Priority to CN201810098911.0A priority Critical patent/CN110097885A/zh
Publication of CN110097885A publication Critical patent/CN110097885A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home

Abstract

本发明属于智能家居技术领域,提供了一种语音控制方法及系统,该方法包括:接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息;确认与第一控制实体信息匹配度最高的第二控制实体信息;当与所述第一控制实体信息匹配度最高的第二控制实体信息满足预设的确认提醒条件时,向用户输出控制语音确认提醒,控制语音确认提醒包括与第一控制实体信息匹配度最高的第二控制实体信息;接收、识别用户发出的确认语音,生成确认识别结果,确认识别结果包括用户确认的第二控制实体信息;根据控制动作信息与用户确认的第二控制实体信息,确认控制指令,并输出控制信号。通过本语音控制方法可以提高语音控制的精准度。

Description

一种语音控制方法及系统
技术领域
本发明属于智能家居技术领域,尤其涉及一种语音控制方法及系统。
背景技术
智能家居,又称智能住宅。一般来说,它是融合了自动化控制系统、计算机网络系统、有线或者无线通信技术于一体的智能化网络化的家居监控应用系统,智能家居可以让住户有着更加方便的手段来管理家用设备从而给住户带来最大程度上的便利、舒适及安全。
目前智能家居系统的控制方式还是处于比较传统的模式,主要有:语音控制、触摸屏控制、面板控制,或者通过智能手机等第三方面板控制等。其中语音控制已经凭借其控制方便等优势,越来越被广大用户所接受。然而,由于语音识别准确率的原因,降低了语音控制的精准度。
发明内容
本发明实施例提供一种语音控制方法及系统,旨在提高语音控制的精准度。
本发明实施例是这样实现的,一种语音控制方法,所述方法包括:
接收、识别用户发出的控制语音,生成控制识别结果,所述控制识别结果包括第一控制实体信息;
确认与所述控制识别结果匹配度最高的控制指令信息,所述控制指令信息包括第二控制实体信息;
当所述与所述控制识别结果匹配度最高的控制指令信息满足预设的确认提醒条件时,向用户输出控制语音确认提醒,所述控制语音确认提醒包括与所述控制识别结果匹配度最高的控制指令信息中的第二控制实体信息;
接收、识别用户发出的确认语音,生成确认识别结果,所述确认识别结果包括用户确认的第二控制实体信息;
根据所述控制识别结果与所述用户确认的第二控制实体信息,确认控制指令,并输出控制信号。
本发明实施例还提供了一种语音控制系统,所述系统包括:
第一语音识别单元,用于接收、识别用户发出的控制语音,生成控制识别结果,所述控制识别结果包括第一控制实体信息;
指令匹配单元,用于确认与所述控制识别结果匹配度最高的控制指令信息,所述控制指令信息包括第二控制实体信息;
语音输出单元,用于在所述确认与所述控制识别结果匹配度最高的控制指令信息中所包含的第二控制实体信息的个数与所述第一控制实体信息与所述第二控制实体信息的匹配度满足预设规则时,向用户输出控制语音确认提醒,所述控制语音确认提醒包括与所述控制识别结果匹配度最高的控制指令信息中的第二控制实体信息;
第二语音识别单元,用于接收、识别用户发出的确认语音,生成确认识别结果,所述确认识别结果包括用户确认的第二控制实体信息;
指令输出单元,用于根据所述控制识别结果与所述用户确认的第二控制实体信息,确认控制指令,并输出控制信号。
本发明提供的语音控制方法,在接收、识别用户发出的控制语音后,会提取出控制动作信息以及第一控制实体信息,并进而获取与第一控制实体信息匹配度最高的第二控制实体信息。其中,在该第二控制实体信息满足确认提醒条件时时,会向用户输出控制语音确认提醒,让用户再次确认,从而提高了语音控制的精准度。
附图说明
图1是本发明实施例提供的语音控制方法的实现流程图;
图2是本发明实施例提供的接入第三方语音识别系统的实现流程图;
图3是本发明实施例提供的存储确认识别结果以及与之对应的控制语音的实现流程图;
图4是本发明实施例提供的语音控制系统的功能模块图;
图5是本发明实施例提供的语音控制系统的另一种功能模块图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供的语音控制方法及系统,在得到的与第一控制实体信息匹配度最高的第二控制实体信息满足预设的确认提醒条件时,会向用户输出控制语音确认提醒,让用户再次确认,并在用户的确认后输出控制信息,提高了语音控制的精准度。
图1示出了本发明实施例提供的一种语音控制方法的实现流程图,详述如下。
在步骤S101中,接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息。
在本发明实施例中,该步骤包括:接收用户的控制语音,并将用户的控制语音识别成文本;随后根据预设的匹配模式提取出该文本中的控制动作信息以及第一实体信息。其中,控制动作信息是指“打开”、“调小”等执行动作的信息,实体信息是指具体实物的信息,比如智能家居系统中的灯、空调、电视等。另外,在本实施例中,预设的匹配模式可以采用正则匹配模式。
在步骤S102中,确认与所述第一控制实体信息匹配度最高的第二控制实体信息。
在本发明实施例中,第二控制实体信息是预先存储的实体信息,其中,第二实体信息可以是系统预设,也可以是用户自定义存储。可以理解的,一条控制指令中主要包括“打开”、“关闭”、“调大”、“调小”等控制动作信息,以及“灯”、“空调”、“电视”等实体信息,所以为了降低控制指令信息的存储内存,提高匹配效率,在存储控制指令信息时,可以将控制指令信息中的控制动作部分与实体信息部分分开存储,即执行动作部分存储在一个动作集内,实体信息部分存储在一个实体集内,比如存储一条“打开灯”的控制指令信息时,将“打开”存储在动作集中,“灯”存储在实体集中。
另外,在实际语音识别技术中,“打开”等代表动作信息的词语识别率很高,可以达到95%以上,而语音识别不准确主要是对实体信息的识别,这是由于实体信息的名词太多,且用户也喜欢根据自己的喜好更改实体信息的名字。因此,在本发明实施例中,为了提高匹对效率,默认控制动作信息的匹配度为100%,即默认控制动作信息是用户语义中想要执行的动作,所以匹配时只将第一控制实体信息与第二控制实体信息进行匹对,并获取匹配度最高的第二控制实体信息,则该匹配度最高的第二控制实体信息便是最接近用户语音中想要控制的目标。此时再结合提取的控制动作信息便可确认用户发出的控制语音所表达的控制指令。
第一控制实体信息与第二控制信息之间的匹对具体为关键字间的匹对,比如第一控制实体信息为“卧室灯”,则其中包含的关键字便是“卧”、“室”、“灯”这三个字,如果预存的控制指令中包含有“主卧室灯”这条第二控制实体信息,则与“卧室灯”这条第一控制实体信息有三个关键字匹配成功,此时二者有的匹配度为75%。
另外,这些实体信息还可以根据具体的应用场景进一步细分,比如:“厨房灯”、“客厅灯”、“卧室灯”、“客厅空调”、“卧室空调”等。所以为了进一步细化,实体集还分为“灯”类、“空调”类等不同的实体子集。
还有,当控制动作信息为“调大”、“调小”或者其他类似的动作时,其必然对应着某个实体信息的某项功能,比如,“调小空调温度”、“调大电视音量”等,而不能是“调大电视”等不完整的控制指令信息。所以动作集内还分为包含“打开”、“调小”等具体动作的动作子集,以及包含“温度”、“音量”、“亮度”等的功能子集。当提取出的控制动作信息为“调大”或者其他类似的词语时,默认为用户的控制语音所要表达的意思是要调大某个实体的“温度”、“音量”、“亮度”等。
在步骤S103中,当所述与所述第一控制实体信息匹配度最高的第二控制实体信息满足预设的确认提醒条件时,向用户输出控制语音确认提醒,所述控制语音确认提醒包括与所述第一控制实体信息匹配度最高的第二控制实体信息。
在本发明实施例中,当与第一控制实体信息匹配度最高的第二控制实体信息之间满足预设的确认提醒条件时,会向用户输出控制语音确认提醒,从而降低控制出错的概率。其中,确认提醒条件通常时指不能非常确定第二控制实体信息是什么。另外,向用户输出控制语音确认提醒具体为:根据提取的控制动作信息,以及与第一控制实体信息匹配度最高的第二控制实体信息,合成语音并输出给用户。比如第二实体信息为“调光灯”,控制信息为“打开”,则合成为语音“您是否要打开调光灯”输出给用户。
另外,应当理解的,与第一控制实体信息匹配度最高的第二控制实体信息的个数可能是一个、两个或者多个,比如,当第一控制实体信息为“卧室灯”,则与其匹配度最高的第二控制实体信息可能是“主卧室灯”、“次卧室灯”这两条。
在步骤S104中,接收、识别用户发出的确认语音,生成确认识别结果,所述确认识别结果包括用户确认的第二实体信息。
在本发明实施例中,向用户输出控制语音确认提醒后,还会接收、识别用户发出的确认语音,并生成确认识别结果,通过客户的再次确认提高了语音控制的准确度。
在步骤S105中,根据所述控制动作信息与所述用户确认的第二控制实体信息,确认控制指令,并输出控制信号。
在本发明实施例中,生成确认识别结果后,会根据控制动作信息,以及用户所确认的第二控制实体信息得出与用户发出的控制语音语义匹配度最高的控制指令,进而输出相应的控制信号。比如提取的控制动作信息为“打开”,用户确认第二控制信息为“卧室灯”,则输出语“打开卧室灯”这条预存控制指令相对应的控制信号。
在本发明实施例中,预设的确认提醒条件包括:
当所述与所述第一控制实体信息匹配度最高的第二控制实体信息的个数为1时,所述第二控制实体信息与所述第一控制实体信息的匹配度小于预设的阈值,即当与第一控制实体信息匹配度最高的第二控制实体信息的个数为一个,且二者之间的匹配度小于预设的阈值。
其中,在本实施例中,预设的阈值可以是80%—100%之间的任一数值,比如将预设的阈值设置为90%,则当匹配度小于90%时,会认为用户发出的控制语音模糊,不能确定用户想要执行的控制指令,需要向用户输出控制语音确认提醒,以进一步确认用户的目的。
另外,当与第一控制实体信息匹配度最高的第二控制实体信息的个数为一个,且二者之间的匹配度大于预设的阈值时,默认此时的第二控制实体信息是用户语义中想要执行的目标物体,会直接输出相应的控制信号。
此外,预设的确认提醒条件还包括:当所述与所述第一控制实体信息匹配度最高的第二控制实体信息的个数大于等于2。即,当与第一控制实体信息匹配度最高的第二控制实体信息的个数大于等于两个时,会认为用户发出的控制语音模糊,不能确定用户想要执行的控制指令,需要向用户输出控制语音确认提醒,以进一步确认用户的目的。
如图2所示,在本发明实施例中,其特征在于,所述方法还包括:
步骤S201,若所述第一控制实体信息与所述第二控制实体信息的匹配度小于预设的识别阈值,则接入第三方语音识别系统,通过所述第三方语音识别系统识别用户发出的控制语音。在本实施例中,预设的识别阈值可以是50%。
在本发明实施例中,还预先设置了识别阈值,当第一控制实体信息与第二控制实体信息的匹配度小于预设的识别的阈值时,会认为用户发出的控制语音中不包含想要控制的实体信息,此时会接入第三方语音识别系统与用户对话,通过第三方语音系统的庞大数据库来确定用户想要执行的命令。其中第三方语音识别系统可以是百度语音识别系统、阿里云语音识别系统等,本发明在此不做限制。
另外,在步骤S101中,未提取出控制动作信息或者第一控制实体信息时;以及在步骤S104中,未接收到用户发出的确认语音,或者未从用户发出的确认语音中识别出控制语音确认提醒中所包含的第二控制实体信息时,也会接入第三方语音识别系统。此外,接入第三方语音系统后,用户还可以与第三方语音机器人聊天对话,调节用户心情,降低用户的孤独感,使人们的生活更加舒适美满。
如图3所示,在本发明实施例中,在步骤S104,所述接收、识别用户发出的确认语音,生成确认识别结果后,还包括:
步骤S301,存储所述确认识别结果,以及与所述确认识别结果对应的所述用户发出的控制语音。
在本发明实施例中,接收用户发出的控制语音后,会进行暂时存储,在经后续的步骤102、步骤S103,以及S104处理生成确认识别结果后,会将这个识别结果以及与之对应用户发出的控制语音进行存储。当再次接收到的用发出控制语音中包含之前存储的控制语音中所包含的控制动作信息以及第一控制实体信息时,可以直接将该再次接收到的控制语音与之前存储的控制语音进行比对,当二者的相似度满足一定阈值时,则直接根据之前存储的用户控制语音所对应的确认识别结果,生成控制指令并输出控制信号,提高语音控制的效率,其中,二者的相似度满足一定阈值可以是二者的相似度大于某一阈值,比如大于80%。另外,在本实施例中,对控制语音的存储可以是以语音特征向量的方式进行存储,即将模拟量的控制语音处理转化为数字量的语音特征向量进行存储,再次接收到到控制指令与之前存储的控制指令之间的比对也是二者对应的语音特征向量之间的比对。
在本发明实施例中,步骤S101,所述接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息,包括:当接收到用户的唤醒指令时,接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息。
即,在本实施例中,只有接收到唤醒指令时,才能接收、识别用户发出的控制语音,进而提取控制动作信息以及第一控制实体信息,这样可以减少误触发的几率。其中,唤醒指令可以是一些包含某些关键字/词的语句,比如关键词为“工作”,则当接收到的用户的语音中包含“工作”时,便能起到唤醒作用。进一步的,这些唤醒指令的关键词可以由用户自己设置,使用户获取更好的使用体验。
应当理解的,上述实施例中涉及到的“控制动作信息”、“第一控制实体信息”、“第二控制实体信息”、“确认识别结果”等都是文本的形式,为了提高识别率,这些文本采用拼音文本。
综上所述,本发明提供的语音控制方法,在接收、识别用户发出的控制语音后,会提取出控制动作信息以及第一控制实体信息,并进而获取与第一控制实体信息匹配度最高的第二控制实体信息。其中,当二者的匹配度小于预设的阈值或者该第二控制实体的个数不唯一时,会向用户输出控制语音确认提醒,让用户再次确认,从而提高了语音控制的精准度。
图4示出了本发明实施例提供的语音控制系统的功能模块示意图,为了便于说明,仅出示了与本发明相关的部分,包括:第一语音识别单元401、指令匹配单元402、语音输出单元403、第二语音识别单元404、指令输出单元405。
第一语音识别单元401,用于接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息。
在本发明实施例中,第一语音识别单元在接收用户的控制语音后,会将用户的控制语音识别成文本;随后根据预设的匹配模式提取出文本中的控制动作信息,以及第一实体信息。其中,控制动作信息是指“打开”、“调小”等执行动作的信息,实体信息是指具体实物的信息,比如智能家居系统中的灯、空调、电视等。另外,在本实施例中,预设的匹配模式可以采用正则匹配模式。
指令匹配单元402,用于确认与所述第一控制实体信息匹配度最高的第二控制实体信息。
在本发明实施例中,第二控制实体信息是预先存储的实体信息,其中,第二实体信息可以是系统预设,也可以是用户自定义存储。可以理解的,一条控制指令中主要包括“打开”、“关闭”、“调大”、“调小”等控制动作信息,以及“灯”、“空调”、“电视”等实体信息。在存储控制指令信息时,可以将控制指令信息中的控制动作部分与实体信息部分分开存储,即执行动作部分存储在一个动作集内,实体信息部分存储在一个实体集内,比如存储一条“打开灯”的控制指令信息时,将“打开”存储在动作集中,“灯”存储在实体集中。
另外,在实际语音识别技术中,“打开”等代表动作信息的词语识别率很高,可以达到95%以上,而语音识别不准确主要是对实体信息的识别,这是由于实体信息的名词太多,且用户也喜欢根据自己的喜好更改实体信息的名字。因此,在本发明实施例中,默认控制动作信息的匹配度为100%,即默认控制动作信息是用户语义中想要执行的动作,所以匹配时只将第一控制实体信息与第二控制实体信息进行匹对,并获取匹配度最高的第二控制实体信息,则该匹配度最高的第二控制实体信息便是最接近用户语音中想要控制的目标。此时再结合提取的控制动作信息便可确认用户发出的控制语音所表达的控制指令。
第一控制实体信息与第二控制信息之间的匹对具体为关键字间的匹对,比如第一控制实体信息为“卧室灯”,则其中包含的关键字便是“卧”、“室”、“灯”这三个字,如果预存的控制指令中包含有“主卧室灯”这条第二控制实体信息,则与“卧室灯”这条第一控制实体信息有三个关键字匹配成功,此时二者有的匹配度为75%。
另外,这些实体信息还可以根据具体的应用场景进一步细分,比如:“厨房灯”、“客厅灯”、“卧室灯”、“客厅空调”、“卧室空调”等。所以为了进一步细化,实体集还分为“灯”类、“空调”类等不同的实体子集。
还有,当控制动作信息为“调大”、“调小”或者其他类似的动作时,其必然对应着某个实体信息的某项功能,比如,“调小空调温度”、“调大电视音量”等,而不能是“调大电视”等不完整的控制指令信息。所以动作集内还分为包含“打开”、“调小”等具体动作的动作子集,以及包含“温度”、“音量”、“亮度”等的功能子集。当提取出的控制动作信息为“调大”或者其他类似的词语时,默认为用户的控制语音所要表达的意思是要调大某个实体的“温度”、“音量”、“亮度”等。
语音输出单元403,用于在所述与所述第一控制实体信息匹配度最高的第二控制实体信息满足预设的确认提醒条件时,向用户输出控制语音确认提醒,所述控制语音确认提醒包括与所述第一控制实体信息匹配度最高的第二控制实体信息。
在本发明实施例中,当与第一控制实体信息匹配度最高的第二控制实体信息之间满足预设的确认提醒条件时,会通过语音输出单元403向用户输出控制语音确认提醒,从而降低控制出错的概率。其中,确认提醒条件通常时指不能非常确定第二控制实体信息是什么。另外,语音输出单元向用户输出控制语音确认提醒具体为:根据提取的控制动作信息,以及与第一控制实体信息匹配度最高的第二控制实体信息,合成语音并输出给用户。比如第二实体信息为“调光灯”,控制信息为“打开”,则合成为语音“您是否要打开调光灯”输出给用户。
另外,应当理解的,与第一控制实体信息匹配度最高的第二控制实体信息的个数可能是一个、两个或者多个,比如,当第一控制实体信息为“卧室灯”,则与其匹配度最高的第二控制实体信息可能是“主卧室灯”、“次卧室灯”这两条。
第二语音识别单元404,用于接收、识别用户发出的确认语音,生成确认识别结果,所述确认识别结果包括用户确认的第二控制实体信息。
在本发明实施例中,在语音输出单元403向用户输出控制语音确认提醒后,还会通过第二语音识别单元404接收、识别用户发出的确认语音,并生成确认识别结果,通过客户的再次确认提高了语音控制的准确度。其中,第二语音识别单元与第一识别单元可以是同一的功能模块,也可以是两个相互独立的功能模块。
指令输出单元405,用于根据所述控制动作信息与所述用户确认的第二控制实体信息,确认控制指令,并输出控制信号。
在本发明实施例中,在第二语音识别单元404生成确认识别结果后,指令输出单元405会根据控制动作信息,以及用户所确认的第二控制实体信息得出与用户发出的控制语音语义匹配度最高的控制指令,进而输出相应的控制信号。比如提取的控制动作信息为“打开”,用户确认第二控制信息为“卧室灯”,则输出语“打开卧室灯”这条预存控制指令相对应的控制信号。
另外在本发明实施例中,预设的确认提醒条件包括:
当所述与所述第一控制实体信息匹配度最高的第二控制实体信息的个数为1时,所述第二控制实体信息与所述第一控制实体信息的匹配度小于预设的阈值,即当与第一控制实体信息匹配度最高的第二控制实体信息的个数为一个,且二者之间的匹配度小于预设的阈值。
其中,在本实施例中,预设的阈值可以是80%—100%之间的任一数值,比如将预设的阈值设置为90%,则当匹配度小于90%时,会认为用户发出的控制语音模糊,不能确定用户想要执行的控制指令,需要向用户输出控制语音确认提醒,以进一步确认用户的目的。
另外,当与第一控制实体信息匹配度最高的第二控制实体信息的个数为一个,且二者之间的匹配度大于预设的阈值时,默认此时的第二控制实体信息是用户语义中想要执行的目标物体,会直接输出相应的控制信号。
此外,预设的确认提醒条件还包括:当所述与所述第一控制实体信息匹配度最高的第二控制实体信息的个数大于等于2。即,当与第一控制实体信息匹配度最高的第二控制实体信息的个数大于等于两个时,会认为用户发出的控制语音模糊,不能确定用户想要执行的控制指令,需要向用户输出控制语音确认提醒,以进一步确认用户的目的。
如图5所示,在本发明提供的实施例中,本系统还包括:第三方语音识别系统接入单元501,其中,第三方语音识别系统接入单元501用于在所述第一控制实体信息与所述第二控制实体信息的匹配度小于预设的识别阈值,则接入第三方语音识别系统,通过所述第三方语音识别系统识别用户发出的控制语音。其中,在本实施例中,预设的识别阈值可以设置为50%。
在本发明实施例中,还预先设置了识别阈值,当第一控制实体信息与第二控制实体信息的匹配度小于预设的识别的阈值时,会认为用户发出的控制语音中不包含想要控制的实体信息,此时会通过第三方语音识别系统接入单元501接入第三方语音识别系统与用户对话,通过第三方语音系统的庞大数据库来确定用户想要执行的命令。其中第三方语音识别系统可以是百度语音识别系统、阿里云语音识别系统等,本发明在此不做限制。
另外,第一语音识别单401元未提取出控制动作信息或者第一控制实体信息时;以及在第二语音识别单元,未接收到用户发出的确认语音,或者未从用户发出的确认语音中识别出控制语音确认提醒中所包含的第二控制实体信息时,也会通过第三方语音识别系统接入单元501接入第三方语音识别系统。此外,接入第三方语音系统后,用户还可以与第三方语音机器人聊天对话,调节用户心情,降低用户的孤独感,使人们的生活更加舒适美满。
在本发明实施例中,本系统还包括:自动存储单元,用于在所述第二语音识别单元404接收、识别用户发出的确认语音,生成确认识别结果后,存储所述确认识别结果,以及与所述确认识别结果对应的所述用户发出的控制语音。
在本发明实施例中,接收用户发出的控制语音后,会进行暂时存储,在经指令匹配单元402、语音输出单元403,以及第二语音识别单元404处理生成确认识别结果后,会将这个识别结果以及与之对应用户发出的控制语音进行存储。当再次接收到的用发出控制语音中包含之前存储的控制语音中所包含的控制动作信息以及第一控制实体信息时,可以直接将该再次接收到的控制语音与之前存储的控制语音进行比对,当二者的相似度满足一定阈值时,则直接根据之前存储的用户控制语音所对应的确认识别结果,生成控制指令并输出控制信号,提高语音控制的效率,其中,二者的相似度满足一定阈值可以是二者的相似度大于某一阈值,比如大于80%。另外,在本实施例中,对控制语音的存储可以是以语音特征向量的方式进行存储,即将模拟量的控制语音处理转化为数字量的语音特征向量进行存储,再次接收到到控制指令与之前存储的控制指令之间的比对也是二者对应的语音特征向量之间的比对。
在本发明实施例中,第一语音识别单元401包括:语音唤醒模块,在所述语音唤醒模块接收到用户的唤醒指令后,可以接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息。
在本实施例中,只有在语音唤醒模块接收到唤醒指令时,才能接收、识别用户发出的控制语音,进而提取控制动作信息以及第一控制实体信息,在语音唤醒模块接收到唤醒指令前,整个系统处于休眠状态,这样可以降低误动作的出现。其中,唤醒指令可以是一些包含某些关键字/词的语句,比如关键词为“工作”,则当接收到的用户的语音中包含“工作”时,便能起到唤醒作用。进一步的,这些唤醒指令的关键词可以由用户自己设置,使用户获取更好的使用体验。
上述的各单元模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信号以及软件分发介质等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种语音控制方法,其特征在于,所述方法包括:
接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息;
确认与所述第一控制实体信息匹配度最高的第二控制实体信息;
当所述与所述第一控制实体信息匹配度最高的第二控制实体信息满足预设的确认提醒条件时,向用户输出控制语音确认提醒,所述控制语音确认提醒包括与所述第一控制实体信息匹配度最高的第二控制实体信息;
接收、识别用户发出的确认语音,生成确认识别结果,所述确认识别结果包括用户确认的第二控制实体信息;
根据所述控制动作信息与所述用户确认的第二控制实体信息,确认控制指令,并输出控制信号。
2.如权利要求1所述的语音控制方法,其特征在于,所述预设的确认提醒条件包括:
当所述与所述第一控制实体信息匹配度最高的第二控制实体信息的个数为1时,所述第二控制实体信息与所述第一控制实体信息的匹配度小于预设的阈值;
当所述与所述第一控制实体信息匹配度最高的第二控制实体信息的个数大于等于2。
3.如权利要求1所述的语音控制方法,其特征在于,所述方法还包括:
若所述第一控制实体信息与所述第二控制实体信息的匹配度小于预设的识别阈值,则接入第三方语音识别系统,通过所述第三方语音识别系统识别用户发出的控制语音。
4.如权利要求1所述的语音控制方法,其特征在于,在所述接收、识别用户发出的确认语音,生成确认识别结果后,还包括:
存储所述确认识别结果,以及与所述确认识别结果对应的所述用户发出的控制语音。
5.如权利要求1所述的语音控制方法,其特征在于,所述接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息,包括:
当接收到用户的唤醒指令时,接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息。
6.一种语音控制系统,其特征在于,所述系统包括:
第一语音识别单元,用于接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息;
指令匹配单元,用于确认与所述第一控制实体信息匹配度最高的第二控制实体信息;
语音输出单元,用于在所述与所述第一控制实体信息匹配度最高的第二控制实体信息满足预设的确认提醒条件时,向用户输出控制语音确认提醒,所述控制语音确认提醒包括与所述第一控制实体信息匹配度最高的第二控制实体信息;
第二语音识别单元,用于接收、识别用户发出的确认语音,生成确认识别结果,所述确认识别结果包括用户确认的第二控制实体信息;
指令输出单元,用于根据所述控制动作信息与所述用户确认的第二控制实体信息,确认控制指令,并输出控制信号。
7.如权利要求6所述语音控制系统,其特征在于,所述预设的确认提醒条件包括:
当所述与所述第一控制实体信息匹配度最高的第二控制实体信息的个数为1时,所述第二控制实体信息与所述第一控制实体信息的匹配度小于预设的阈值;
当所述与所述第一控制实体信息匹配度最高的第二控制实体信息的个数大于等于2。
8.如权利要求6所述语音控制系统,其特征在于,所述系统还包括:
第三方语音识别系统接入单元,用于在所述第一控制实体信息与所述第二控制实体信息的匹配度小于预设的识别阈值,则接入第三方语音识别系统,通过所述第三方语音识别系统识别用户发出的控制语音。
9.如权利要求6所述语音控制系统,其特征在于,所述系统还包括:
自动存储单元,用于在所述第二语音识别单元接收、识别用户发出的确认语音,生成确认识别结果后,存储所述确认识别结果,以及与所述确认识别结果对应的所述用户发出的控制语音。
10.如权利要求6所述语音控制系统,其特征在于,所述第一语音识别单元还包括:
语音唤醒模块,在所述语音唤醒模块接收到用户的唤醒指令后,可以接收、识别用户发出的控制语音,提取控制动作信息以及第一控制实体信息。
CN201810098911.0A 2018-01-31 2018-01-31 一种语音控制方法及系统 Pending CN110097885A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810098911.0A CN110097885A (zh) 2018-01-31 2018-01-31 一种语音控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810098911.0A CN110097885A (zh) 2018-01-31 2018-01-31 一种语音控制方法及系统

Publications (1)

Publication Number Publication Date
CN110097885A true CN110097885A (zh) 2019-08-06

Family

ID=67443423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810098911.0A Pending CN110097885A (zh) 2018-01-31 2018-01-31 一种语音控制方法及系统

Country Status (1)

Country Link
CN (1) CN110097885A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737335A (zh) * 2019-10-11 2020-01-31 深圳追一科技有限公司 机器人的交互方法、装置、电子设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104020A (ja) * 2007-10-25 2009-05-14 Panasonic Electric Works Co Ltd 音声認識装置
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
CN103475551A (zh) * 2013-09-11 2013-12-25 厦门狄耐克电子科技有限公司 一种基于语音识别的智能家居系统
CN103578472A (zh) * 2012-08-10 2014-02-12 海尔集团公司 电器设备的控制方法和控制装置
CN105161099A (zh) * 2015-08-12 2015-12-16 恬家(上海)信息科技有限公司 一种语音控制的遥控装置及其实现方法
CN105308679A (zh) * 2013-05-28 2016-02-03 汤姆逊许可公司 用于识别与语音命令相关联的位置以控制家用电器的方法和系统
CN105810189A (zh) * 2016-03-22 2016-07-27 北京京东尚科信息技术有限公司 设备的语音控制方法、装置及系统
CN106921544A (zh) * 2016-06-20 2017-07-04 广州零号软件科技有限公司 预设语音交互命令词库的智能家居语音控制系统
CN107490971A (zh) * 2016-06-09 2017-12-19 苹果公司 家庭环境中的智能自动化助理

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104020A (ja) * 2007-10-25 2009-05-14 Panasonic Electric Works Co Ltd 音声認識装置
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
CN103578472A (zh) * 2012-08-10 2014-02-12 海尔集团公司 电器设备的控制方法和控制装置
CN105308679A (zh) * 2013-05-28 2016-02-03 汤姆逊许可公司 用于识别与语音命令相关联的位置以控制家用电器的方法和系统
CN103475551A (zh) * 2013-09-11 2013-12-25 厦门狄耐克电子科技有限公司 一种基于语音识别的智能家居系统
CN105161099A (zh) * 2015-08-12 2015-12-16 恬家(上海)信息科技有限公司 一种语音控制的遥控装置及其实现方法
CN105810189A (zh) * 2016-03-22 2016-07-27 北京京东尚科信息技术有限公司 设备的语音控制方法、装置及系统
CN107490971A (zh) * 2016-06-09 2017-12-19 苹果公司 家庭环境中的智能自动化助理
CN106921544A (zh) * 2016-06-20 2017-07-04 广州零号软件科技有限公司 预设语音交互命令词库的智能家居语音控制系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737335A (zh) * 2019-10-11 2020-01-31 深圳追一科技有限公司 机器人的交互方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US11948556B2 (en) Detection and/or enrollment of hot commands to trigger responsive action by automated assistant
US11289100B2 (en) Selective enrollment with an automated assistant
CN109410927B (zh) 离线命令词与云端解析结合的语音识别方法、装置和系统
CN110100447B (zh) 信息处理方法及装置、多媒体设备及存储介质
US20200395008A1 (en) Personality-Based Conversational Agents and Pragmatic Model, and Related Interfaces and Commercial Models
CN109656512A (zh) 基于语音助手的交互方法、装置、存储介质及终端
EP3631793B1 (en) Dynamic and/or context-specific hot words to invoke automated assistant
CN110188177A (zh) 对话生成方法及装置
TW202025138A (zh) 語音互動方法、裝置及系統
JP2004527809A (ja) 個人のインタラクションをシミュレートする環境反応型ユーザインタフェース/エンタテインメントデバイス
JP2004513445A (ja) 個人のインタラクションをシミュレートし、ユーザの情緒状態及び/又は性格に反応するユーザインタフェース/エンタテインメントデバイス
JP2004527808A (ja) 個人のインタラクションをシミュレートする自己更新式ユーザインタフェース/エンタテインメントデバイス
WO2020119569A1 (zh) 一种语音交互方法、装置及系统
TW202022849A (zh) 語音資料的識別方法、裝置及系統
JP2019012255A (ja) 人間−機械間の感情会話のための方法及びシステム
CN110047484A (zh) 一种语音识别交互方法、系统、设备和存储介质
CN110097885A (zh) 一种语音控制方法及系统
US11657095B1 (en) Supplemental content placement for natural language interfaces
CN116415590A (zh) 基于多轮次问询的意图识别方法及装置
CN113990312A (zh) 一种设备控制方法及装置、电子设备及存储介质
Xie et al. Research and Implementation of Intelligent Home Pension System Based on Speech and Semantic Recognition
US11908463B1 (en) Multi-session context
WO2019056700A1 (zh) 语音对话机器人的控制方法、装置、终端设备及介质
CN117634433A (zh) 文档编辑方法、装置、电子设备和存储介质
CN115312057A (zh) 会议交互方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190806