CN112002315B - 一种语音控制方法、装置、电器设备、存储介质及处理器 - Google Patents

一种语音控制方法、装置、电器设备、存储介质及处理器 Download PDF

Info

Publication number
CN112002315B
CN112002315B CN202010737340.8A CN202010737340A CN112002315B CN 112002315 B CN112002315 B CN 112002315B CN 202010737340 A CN202010737340 A CN 202010737340A CN 112002315 B CN112002315 B CN 112002315B
Authority
CN
China
Prior art keywords
voice
voice data
cloud
electrical equipment
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010737340.8A
Other languages
English (en)
Other versions
CN112002315A (zh
Inventor
文皓
汪进
毛跃辉
王慧君
刘健军
韩雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Green Refrigeration Technology Center Co Ltd of Zhuhai
Original Assignee
Gree Green Refrigeration Technology Center Co Ltd of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Green Refrigeration Technology Center Co Ltd of Zhuhai filed Critical Gree Green Refrigeration Technology Center Co Ltd of Zhuhai
Priority to CN202010737340.8A priority Critical patent/CN112002315B/zh
Publication of CN112002315A publication Critical patent/CN112002315A/zh
Application granted granted Critical
Publication of CN112002315B publication Critical patent/CN112002315B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Abstract

本发明公开了一种语音控制方法、装置、电器设备、存储介质及处理器,该方法包括:采集语音数据;对所述语音数据进行分析,得到所述语音数据的上下文关系;确定所述语音数据的上下文关系是否已达到当前领域下设定阈值;若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式;若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式。本发明的方案,可以解决语音控制的智能化程度仍然比较低从而影响用户的使用体验的问题,达到提升语音控制的智能化程度从而提升用户体验的效果。

Description

一种语音控制方法、装置、电器设备、存储介质及处理器
技术领域
本发明属于语音技术领域,具体涉及一种语音控制方法、装置、电器设备、存储介质及处理器,尤其涉及一种实现全双工和半双工结合的语音识别方法、装置、电器设备、存储介质及处理器。
背景技术
随着语音控制的电器设备(如语音空调)的普及推广,使用语音空调的用户数量持续增加。但语音空调的智能化程度仍然比较低,影响了用户的使用体验。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的目的在于,提供一种语音控制方法、装置、电器设备、存储介质及处理器,以解决语音控制的智能化程度仍然比较低从而影响用户的使用体验的问题,达到提升语音控制的智能化程度从而提升用户体验的效果。
本发明提供一种语音控制方法,包括:采集语音数据;对所述语音数据进行分析,得到所述语音数据的上下文关系;确定所述语音数据的上下文关系是否已达到当前领域下设定阈值;若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式;若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式。
可选地,所述当前领域,包括:信息获取领域、控制领域中的任一领域;其中,在所述信息获取领域下,电器设备在本地端通过语音板分析所述语音数据下发的信息获取指令、并调用本地端预先下载并存储的待获取信息,或接收由云端通过分析所述语音数据下发的信息获取指令、以及由云端通过互联网资源收集并下发的待获取信息,并控制电器设备按所述信息获取指令为使用者提供待获取信息;在所述控制领域下,电器设备在本地端通过语音板分析所述语音数据下发的控制指令,或接收由云端通过分析所述语音数据下发的控制指令,并按所述控制指令控制电器设备为用户提供服务。
可选地,所述语音数据,包括:语音指令和/或语音需求;所述采集语音数据,包括:通过麦克风模块,采集使用者发出的语音指令、和/或使用者说出的语音需求。
可选地,对所述语音数据进行分析,包括:对所述语音数据进行语义分析,以提取所述语音数据所包含的一个以上关键词;根据设定关键词与设定值之间的对应关系,将该对应关系中与每个关键词相同的设定关键词所对应的设定值确定为每个关键词的值;对一个以上关键词的值进行加权求平均值和归一化处理,得到一个以上关键词的平均值,将该平均值作为所述语音数据的上下文关系。
可选地,其中,对所述语音数据进行分析的执行端,包括:语音板或云端;在云端作为对所述语音数据进行分析的执行端的情况下,由电器设备的语音板在本地端将所述语音数据转换为文本信息后,将所述文本信息上传至云端;之后再由语音板接收云端对所述语音数据进行分析后下发的所述语音数据的上下文关系。
可选地,还包括:在确定电器设备在当前领域下的工作模式为全双工工作模式之后,根据所述语音数据确定使用者的使用习惯;根据接收由云端通过分析所述语音数据下发的信息获取指令和控制指令中任一指令,并结合所述使用习惯,调整电器设备在当前领域下的工作状态和/或工作时长。
可选地,还包括:在确定电器设备在当前领域下的工作模式为全双工工作模式之后,若所述语音数据所包含的控制指令为信息获取指令和控制指令中两个以上指令,则根据使用者的使用习惯确定两个以上指令的优先级,并按确定的优先级执行两个以上指令。
与上述方法相匹配,本发明另一方面提供一种语音控制装置,包括:采集单元,用于采集语音数据;分析单元,用于对所述语音数据进行分析,得到所述语音数据的上下文关系;控制单元,用于确定所述语音数据的上下文关系是否已达到当前领域下设定阈值;所述控制单元,还用于若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式;所述控制单元,还用于若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式。
可选地,所述当前领域,包括:信息获取领域、控制领域中的任一领域;其中,在所述信息获取领域下,电器设备在本地端通过语音板分析所述语音数据下发的信息获取指令、并调用本地端预先下载并存储的待获取信息,或接收由云端通过分析所述语音数据下发的信息获取指令、以及由云端通过互联网资源收集并下发的待获取信息,并控制电器设备按所述信息获取指令为使用者提供待获取信息;在所述控制领域下,电器设备在本地端通过语音板分析所述语音数据下发的控制指令,或接收由云端通过分析所述语音数据下发的控制指令,并按所述控制指令控制电器设备为用户提供服务。
可选地,所述语音数据,包括:语音指令和/或语音需求;所述采集单元采集语音数据,包括:通过麦克风模块,采集使用者发出的语音指令、和/或使用者说出的语音需求。
可选地,所述分析单元对所述语音数据进行分析,包括:对所述语音数据进行语义分析,以提取所述语音数据所包含的一个以上关键词;根据设定关键词与设定值之间的对应关系,将该对应关系中与每个关键词相同的设定关键词所对应的设定值确定为每个关键词的值;对一个以上关键词的值进行加权求平均值和归一化处理,得到一个以上关键词的平均值,将该平均值作为所述语音数据的上下文关系。
可选地,其中,所述分析单元对所述语音数据进行分析的执行端,包括:语音板或云端;在云端作为对所述语音数据进行分析的执行端的情况下,由电器设备的语音板在本地端将所述语音数据转换为文本信息后,将所述文本信息上传至云端;之后再由语音板接收云端对所述语音数据进行分析后下发的所述语音数据的上下文关系。
可选地,还包括:所述控制单元,还用于在确定电器设备在当前领域下的工作模式为全双工工作模式之后,根据所述语音数据确定使用者的使用习惯;所述控制单元,还用于根据接收由云端通过分析所述语音数据下发的信息获取指令和控制指令中任一指令,并结合所述使用习惯,调整电器设备在当前领域下的工作状态和/或工作时长。
可选地,还包括:所述控制单元,还用于在确定电器设备在当前领域下的工作模式为全双工工作模式之后,若所述语音数据所包含的控制指令为信息获取指令和控制指令中两个以上指令,则根据使用者的使用习惯确定两个以上指令的优先级,并按确定的优先级执行两个以上指令。
与上述装置相匹配,本发明再一方面提供一种电器设备,包括:以上所述的语音控制装置。
与上述方法相匹配,本发明再一方面提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以上所述的语音控制方法。
与上述方法相匹配,本发明再一方面提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行以上所述的语音控制方法。
由此,本发明的方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,可以避免所有的语音指令都工作于全双工工作模式,解决语音控制的智能化程度仍然比较低从而影响用户的使用体验的问题,达到提升语音控制的智能化程度从而提升用户体验的效果。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的语音控制方法的一实施例的流程示意图;
图2为本发明的方法中对所述语音数据进行分析的一实施例的流程示意图;
图3为本发明的方法中根据使用习惯对不同领域下的工作状态进行调整的一实施例的流程示意图;
图4为本发明的语音控制装置的一实施例的结构示意图;
图5为空调(如语音空调)的一实施例的实现全双工和半双工结合的语音识别的流程示意图。
结合附图,本发明实施例中附图标记如下:
102-采集单元;104-分析单元;106-控制单元。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种语音控制方法,如图1所示本发明的方法的一实施例的流程示意图。该语音控制方法可以应用在具有语音控制功能的电器设备如语音空调、语音电视等上,适用所有语音智能产品,语音工作模式可以在全双工模式和半双工模式之间自动选择切换,能够智能调节语音识别时长,以在特定领域下对语音识别时间进行智能判断和自动调整。其中,电器设备的语音控制方法,可以包括:步骤S110至步骤S150。
步骤S110,采集语音数据。例如:采集语音空调所在房间内的语音数据。
可选地,所述语音数据,可以包括:语音指令和/或语音需求。
步骤S110中所述采集语音数据,可以包括:通过麦克风模块,采集使用者发出的语音指令、和/或使用者说出的语音需求。
例如:可以通过空调麦克风采集用户的使用数据,具体可以是采集用户的说话习惯。如通过麦克风采集用户发出的指令或者用户说出的需求。
由此,通过麦克风采集多种形式的语音数据,可以提升对语音数据采集的全面性,进而可以根据全面采集到的语音数据进行语音控制,不仅保证了对用户需求的满足,还避免了对非用户需求语音的执行而浪费资源并给用户造成困扰。
步骤S120,对所述语音数据进行分析,得到所述语音数据的上下文关系。
可选地,可以结合图2所示本发明的方法中对所述语音数据进行分析的一实施例流程示意图,进一步说明步骤S120中对所述语音数据进行分析的具体过程,可以包括:步骤S210至步骤S230。
步骤S210,对所述语音数据进行语义分析,以提取所述语音数据所包含的一个以上关键词。
步骤S220,根据设定关键词与设定值之间的对应关系,将该对应关系中与每个关键词相同的设定关键词所对应的设定值确定为每个关键词的值。
例如:在新闻领域中,语音数据可以是“我想听热门新闻”,提取的关键词可以是“热门新闻”,以进入新闻领域并下发热门新闻链接到空调端。在设定的对应关系中,与“热门新闻”对应的设定值可以是一个数值范围比如3-5,也可以是一个具体的数值比如5。
例如:在笑话领域中,语音数据可以是“我想听笑话”,提取的关键词可以是“笑话”,以进入笑话领域并下发笑话链接到空调端。在设定的对应关系中,与“笑话”对应的设定值可以是一个数值范围比如6-8,也可以是一个具体的数值比如6。
例如:在控制领域中,语音数据可以是“打开上下扫风”,提取的关键词可以是“上下扫风”,以进入控制领域以及下发打开相关上下扫风的协议,通过协议下发到空调并控制空调。在设定的对应关系中,与“上下扫风”对应的设定值可以是一个数值范围比如10-15,也可以是一个具体的数值比如12。
步骤S230,对一个以上关键词的值进行加权求平均值和归一化处理,得到一个以上关键词的平均值,将该平均值作为所述语音数据的上下文关系,即作为所述语音数据所对应的值。
例如:用户语音指令的上下文关系,可以包括:提取指令的语义,可以通过自然语言模块处理得到。语音板采集到的用户数据为几个语句,每个语句中有关键词,每个关键词被赋予相应的值如数值。对这几个语句中的几个关键词的值进行加权平均值、归一化等处理,得到平均值,该平均值可以表示这几句话所包含的语音指令的上下文关系。若该平均值达到设定阈值,则表示这几句话所包含的语音指令的上下文关系的关系性强。
由此,通过语义分析来提取关键词,并确定关键词的平均值的方式确定语音数据的上下文关系,使得对某一时段采集的语音数据进行综合处理来准确把握用户需求,有利于提高语音控制的智能化程度。
其中,对所述语音数据进行分析的执行端,可以包括:语音板或云端。
在云端作为对所述语音数据进行分析的执行端的情况下,由电器设备的语音板在本地端将所述语音数据转换为文本信息后,将所述文本信息上传至云端;之后再由语音板接收云端对所述语音数据进行分析后下发的所述语音数据的上下文关系。
例如:在用户使用语音空调的时候,同步采集用户的使用数据,并把采集到的用户的使用数据发送到云端进行分析和处理。如可以通过麦克风采集数据,然后通过语音板中的语音模块生成文本上传到云端,云端分析文本,通过自然语音处理进行分析文本,分析出来的结果进行处理并下发到语音板。
由此,通过多个执行端对语音数据进行分析,可以在网络连接状态和网络断开状态下均实现语音控制,方便用户使用。
步骤S130,确定所述语音数据的上下文关系是否已达到当前领域下设定阈值。
其中,所述当前领域,可以包括:信息获取领域(如新闻领域、笑话领域等)、控制领域中的任一领域。每个领域下的设定阈值可以相同。
具体地,在所述信息获取领域下,电器设备在本地端通过语音板分析所述语音数据下发的信息获取指令、并调用本地端预先下载并存储的待获取信息,或接收由云端通过分析所述语音数据下发的信息获取指令、以及由云端通过互联网资源收集并下发的待获取信息,并控制电器设备按所述信息获取指令为使用者提供待获取信息。
例如:在所述新闻领域下,电器设备在本地端通过语音板分析所述语音数据下发的第一信息获取指令、并调用本地端预先下载并存储的新闻消息,或接收由云端通过分析所述语音数据下发的第一信息获取指令、以及由云端通过互联网资源收集并下发的新闻消息,并控制电器设备按所述第一信息获取指令为使用者提供新闻消息。
又如:在所述笑话领域下,电器设备在本地端通过语音板分析所述语音数据下发的第二信息获取指令、并调用本地端预先下载并存储的娱乐消息(如笑话消息),或接收由云端通过分析所述语音数据下发的第二信息获取指令、以及由云端通过互联网资源收集并下发的娱乐消息(如笑话消息),并控制电器设备按所述第二信息获取指令为使用者提供娱乐消息(如笑话消息)。
具体地,在所述控制领域下,电器设备在本地端通过语音板分析所述语音数据下发的控制指令,或接收由云端通过分析所述语音数据下发的控制指令,并按所述控制指令控制电器设备为用户提供服务。
例如:语音空调预先设定每个支持领域下的语音的工作模式。语音空调的支持领域,可以包括:按互联网资源类分为新闻领域、笑话领域、空调控制领域。工作模式:就是处在各领域下的运行状态,如全双工工作模式或半双工工作模式。
例如:通过用户的指令在语音板生成文本上传到云端,然后通过自然语音模块进行分析文本语义并判断用户需求,通过分析出的语义切换到不同的领域和需求并下发的空调端。
由此,通过对多个领域进行语音智能控制,可以方便不同控制需求的用户使用,适用范围广,用户体验好。
步骤S140,若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式。
步骤S150,若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式。
例如:采集语音空调所在环境中的语音数据,对采集到的语音数据进行识别,根据识别结果确定语音空调是工作在全双工工作模式还是半双工工作模式,可以避免误识别,有利于提升语音空调的智能化程度,进而提升用户的使用体验。
例如:在动态地调整语音空调工作在某个领域的全双工和半双工工作模式时,可以采用语音指令的上下文关系,若关系性强(如关系性达到某个阈值),通过设定的阈值动态设置全双工识别和半双工识别。这样,可以智能判断用户的语音指令数据,判断语音指令的上下文关系,若关系性强(如关系性达到某个阈值),则自动划分为全双工识别场景;否则若关系性不强(如关系性未达到某个阈值),则划分为半双工识别场景,从而达到动态调节识别场景工作模式的目的,可以减少误唤醒和误识别的情况发生,提高识别率。
由此,通过一种实现全双工和半双工结合的语音识别方案,能够实现语音空调工作模式的动态自动切换和选择,即动态地调整语音空调工作在某个领域的全双工和半双工工作模式,可以提高全领域下语音空调用户的识别率和提升语音空调的智能化水平。
在一个可选实施方式中,还可以包括:根据使用习惯对不同领域下的工作状态进行调整的过程。
下面结合图3所示本发明的方法中根据使用习惯对不同领域下的工作状态进行调整的一实施例流程示意图,进一步说明根据使用习惯对不同领域下的工作状态进行调整的具体过程,可以包括:步骤S310和步骤S320。
步骤S310,在确定电器设备在当前领域下的工作模式为全双工工作模式之后,根据所述语音数据确定使用者的使用习惯。
步骤S320,根据接收由云端通过分析所述语音数据下发的信息获取指令(如第一信息获取指令、第二信息获取指令等)和控制指令中任一指令,并结合所述使用习惯,调整电器设备在当前领域下的工作状态和/或工作时长,以按使用者的使用习惯为使用者提供服务。
例如:重新对每个领域工作模式进行调整。具体地,根据用户使用习惯数据,智能判断用户在该领域下的使用习惯。通过采集到的用户语音指令的上下文关系(即用户上下文语音指令的关联性关系),若关系性强(如达到某个阈值)则判断在该领域下该用户的使用习惯是适合于全双工工作模式,否则为半双工工作模式。如根据用户使用习惯数据,智能判断用户在该领域下的使用习惯,可以包括:可以通过用户指令通用自然语音处理进行上下文分析语义,并判断处于哪个领域,并对用户使用习惯进行统计。
例如:每个领域下全双工工作模式的识别时长,可以根据收集到的用户数据进行智能判断,之后再退出对该领域下全双工工作模式的时长识别过程。具体地,若语音空调工作在全双工工作模式下,可以根据实时采集到的用户使用数据,推测出用户的使用习惯、或判断用户的使用习惯,进而根据用户的使用习惯调整该领域下语音空调全双工工作的时长。其中,该领域,可以包括:新闻领域、笑话领域、空调控制领域等。
由此,通过根据使用习惯对不同领域下的工作状态进行调整,可以更加精准和可靠地为用户提供语音控制服务,提升用户体验。
在一个可选实施方式中,还可以包括:对多个语音指令的优先级进行调整的过程,具体可以包括:在确定电器设备在当前领域下的工作模式为全双工工作模式之后,若所述语音数据所包含的控制指令为信息获取指令(如第一信息获取指令、第二信息获取指令等)和控制指令中两个以上指令,则根据使用者的使用习惯确定两个以上指令的优先级,并按确定的优先级执行两个以上指令。
例如:在已经判定为全双工工作模式的领域下,继续分析采集到的用户数据。把用户上下文语音指令的关联性关系分级,根据得到的关联性级别,得出在该领域下语音工作模式的识别退出时机。在全领域下,语音的工作模式都是动态的(如可以动态从控制领域切换到音乐领域等),会根据不同时期采集到的用户数据来进行动态调整,从而使得语音空调更加智能,语音的唤醒和识别更加准确,能够有效分类出不同的领域,通过领域来缩小范围,这样能够减少误识别。
由此,通过对多个语音指令的优先级进行调整,可以按不同使用习惯满足不同用户的使用需求,控制方式更加灵活,也更加人性化。
经大量的试验验证,采用本实施例的技术方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,可以减少误唤醒和误识别的情况,提高识别率。
根据本发明的实施例,还提供了对应于语音控制方法的一种语音控制装置。参见图4所示本发明的装置的一实施例的结构示意图。该语音控制装置可以应用在具有语音控制功能的电器设备如语音空调、语音电视等上,适用所有语音智能产品,语音工作模式可以在全双工模式和半双工模式之间自动选择切换,能够智能调节语音识别时长,以在特定领域下对语音识别时间进行智能判断和自动调整。其中,电器设备的语音控制装置,可以包括:采集单元102、分析单元104和控制单元106。
在一个可选例子中,采集单元102,可以用于采集语音数据。例如:采集语音空调所在房间内的语音数据。该采集单元102的具体功能及处理参见步骤S110。
可选地,所述语音数据,可以包括:语音指令和/或语音需求。所述采集单元102采集语音数据,可以包括:通过麦克风模块,采集使用者发出的语音指令、和/或使用者说出的语音需求。
例如:可以通过空调麦克风采集用户的使用数据,具体可以是采集用户的说话习惯。如通过麦克风采集用户发出的指令或者用户说出的需求。
由此,通过麦克风采集多种形式的语音数据,可以提升对语音数据采集的全面性,进而可以根据全面采集到的语音数据进行语音控制,不仅保证了对用户需求的满足,还避免了对非用户需求语音的执行而浪费资源并给用户造成困扰。
在一个可选例子中,分析单元104,可以用于对所述语音数据进行分析,得到所述语音数据的上下文关系。该分析单元104的具体功能及处理参见步骤S120。
可选地,所述分析单元104对所述语音数据进行分析,可以包括:
所述控制单元106,具体还可以用于对所述语音数据进行语义分析,以提取所述语音数据所包含的一个以上关键词。该控制单元106的具体功能及处理还参见步骤S210。
所述控制单元106,具体还可以用于根据设定关键词与设定值之间的对应关系,将该对应关系中与每个关键词相同的设定关键词所对应的设定值确定为每个关键词的值。该控制单元106的具体功能及处理还参见步骤S220。
例如:在新闻领域中,语音数据可以是“我想听热门新闻”,提取的关键词可以是“热门新闻”,以进入新闻领域并下发热门新闻链接到空调端。在设定的对应关系中,与“热门新闻”对应的设定值可以是一个数值范围比如3-5,也可以是一个具体的数值比如5。
例如:在笑话领域中,语音数据可以是“我想听笑话”,提取的关键词可以是“笑话”,以进入笑话领域并下发笑话链接到空调端。在设定的对应关系中,与“笑话”对应的设定值可以是一个数值范围比如6-8,也可以是一个具体的数值比如6。
例如:在控制领域中,语音数据可以是“打开上下扫风”,提取的关键词可以是“上下扫风”,以进入控制领域以及下发打开相关上下扫风的协议,通过协议下发到空调并控制空调。在设定的对应关系中,与“上下扫风”对应的设定值可以是一个数值范围比如10-15,也可以是一个具体的数值比如12。
所述控制单元106,具体还可以用于对一个以上关键词的值进行加权求平均值和归一化处理,得到一个以上关键词的平均值,将该平均值作为所述语音数据的上下文关系,即作为所述语音数据所对应的值。该控制单元106的具体功能及处理还参见步骤S230。
例如:用户语音指令的上下文关系,可以包括:提取指令的语义,可以通过自然语言模块处理得到。语音板采集到的用户数据为几个语句,每个语句中有关键词,每个关键词被赋予相应的值如数值。对这几个语句中的几个关键词的值进行加权平均值、归一化等处理,得到平均值,该平均值可以表示这几句话所包含的语音指令的上下文关系。若该平均值达到设定阈值,则表示这几句话所包含的语音指令的上下文关系的关系性强。
由此,通过语义分析来提取关键词,并确定关键词的平均值的方式确定语音数据的上下文关系,使得对某一时段采集的语音数据进行综合处理来准确把握用户需求,有利于提高语音控制的智能化程度。
其中,所述分析单元104对所述语音数据进行分析的执行端,可以包括:语音板或云端。在云端作为对所述语音数据进行分析的执行端的情况下,由电器设备的语音板在本地端将所述语音数据转换为文本信息后,将所述文本信息上传至云端;之后再由语音板接收云端对所述语音数据进行分析后下发的所述语音数据的上下文关系。
例如:在用户使用语音空调的时候,同步采集用户的使用数据,并把采集到的用户的使用数据发送到云端进行分析和处理。如可以通过麦克风采集数据,然后通过语音板中的语音模块生成文本上传到云端,云端分析文本,通过自然语音处理进行分析文本,分析出来的结果进行处理并下发到语音板。
由此,通过多个执行端对语音数据进行分析,可以在网络连接状态和网络断开状态下均实现语音控制,方便用户使用。
在一个可选例子中,控制单元106,可以用于确定所述语音数据的上下文关系是否已达到当前领域下设定阈值。该控制单元106的具体功能及处理参见步骤S130。
其中,所述当前领域,可以包括:信息获取领域(如新闻领域、笑话领域等)、控制领域中的任一领域。
具体地,在所述信息获取领域下,电器设备在本地端通过语音板分析所述语音数据下发的信息获取指令、并调用本地端预先下载并存储的待获取信息,或接收由云端通过分析所述语音数据下发的信息获取指令、以及由云端通过互联网资源收集并下发的待获取信息,并控制电器设备按所述信息获取指令为使用者提供待获取信息。
例如:在所述新闻领域下,电器设备在本地端通过语音板分析所述语音数据下发的第一信息获取指令、并调用本地端预先下载并存储的新闻消息,或接收由云端通过分析所述语音数据下发的第一信息获取指令、以及由云端通过互联网资源收集并下发的新闻消息,并控制电器设备按所述第一信息获取指令为使用者提供新闻消息。
又如:在所述笑话领域下,电器设备在本地端通过语音板分析所述语音数据下发的第二信息获取指令、并调用本地端预先下载并存储的娱乐消息(如笑话消息),或接收由云端通过分析所述语音数据下发的第二信息获取指令、以及由云端通过互联网资源收集并下发的娱乐消息(如笑话消息),并控制电器设备按所述第二信息获取指令为使用者提供娱乐消息(如笑话消息)。
具体地,在所述控制领域下,电器设备在本地端通过语音板分析所述语音数据下发的控制指令,或接收由云端通过分析所述语音数据下发的控制指令,并按所述控制指令控制电器设备为用户提供服务。
例如:语音空调预先设定每个支持领域下的语音的工作模式。语音空调的支持领域,可以包括:按互联网资源类分为新闻领域、笑话领域、空调控制领域。工作模式:就是处在各领域下的运行状态,如全双工工作模式或半双工工作模式。
例如:通过用户的指令在语音板生成文本上传到云端,然后通过自然语音模块进行分析文本语义并判断用户需求,通过分析出的语义切换到不同的领域和需求并下发的空调端。
由此,通过对多个领域进行语音智能控制,可以方便不同控制需求的用户使用,适用范围广,用户体验好。
在一个可选例子中,所述控制单元106,还可以用于若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式。该控制单元106的具体功能及处理还参见步骤S140。
在一个可选例子中,所述控制单元106,还可以用于若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式。该控制单元106的具体功能及处理还参见步骤S150。
例如:采集语音空调所在环境中的语音数据,对采集到的语音数据进行识别,根据识别结果确定语音空调是工作在全双工工作模式还是半双工工作模式,可以避免误识别,有利于提升语音空调的智能化程度,进而提升用户的使用体验。
例如:在动态地调整语音空调工作在某个领域的全双工和半双工工作模式时,可以采用语音指令的上下文关系,若关系性强(如关系性达到某个阈值),通过设定的阈值动态设置全双工识别和半双工识别。这样,可以智能判断用户的语音指令数据,判断语音指令的上下文关系,若关系性强(如关系性达到某个阈值),则自动划分为全双工识别场景;否则若关系性不强(如关系性未达到某个阈值),则划分为半双工识别场景,从而达到动态调节识别场景工作模式的目的,可以减少误唤醒和误识别的情况发生,提高识别率。
由此,通过一种实现全双工和半双工结合的语音识别方案,能够实现语音空调工作模式的动态自动切换和选择,即动态地调整语音空调工作在某个领域的全双工和半双工工作模式,可以提高全领域下语音空调用户的识别率和提升语音空调的智能化水平。
在一个可选实施方式中,还可以包括:根据使用习惯对不同领域下的工作状态进行调整的过程,具体可以包括:
所述控制单元106,还可以用于在确定电器设备在当前领域下的工作模式为全双工工作模式之后,根据所述语音数据确定使用者的使用习惯。该控制单元106的具体功能及处理还参见步骤S310。
所述控制单元106,还可以用于根据接收由云端通过分析所述语音数据下发的信息获取指令(如第一信息获取指令、第二信息获取指令等)和控制指令中任一指令,并结合所述使用习惯,调整电器设备在当前领域下的工作状态和/或工作时长,以按使用者的使用习惯为使用者提供服务。该控制单元106的具体功能及处理还参见步骤S320。
例如:重新对每个领域工作模式进行调整。具体地,根据用户使用习惯数据,智能判断用户在该领域下的使用习惯。通过采集到的用户语音指令的上下文关系(即用户上下文语音指令的关联性关系),若关系性强(如达到某个阈值)则判断在该领域下该用户的使用习惯是适合于全双工工作模式,否则为半双工工作模式。如根据用户使用习惯数据,智能判断用户在该领域下的使用习惯,可以包括:可以通过用户指令通用自然语音处理进行上下文分析语义,并判断处于哪个领域,并对用户使用习惯进行统计。
例如:每个领域下全双工工作模式的识别时长,可以根据收集到的用户数据进行智能判断,之后再退出对该领域下全双工工作模式的时长识别过程。具体地,若语音空调工作在全双工工作模式下,可以根据实时采集到的用户使用数据,推测出用户的使用习惯、或判断用户的使用习惯,进而根据用户的使用习惯调整该领域下语音空调全双工工作的时长。其中,该领域,可以包括:新闻领域、笑话领域、空调控制领域等。
由此,通过根据使用习惯对不同领域下的工作状态进行调整,可以更加精准和可靠地为用户提供语音控制服务,提升用户体验。
在一个可选实施方式中,还可以包括:对多个语音指令的优先级进行调整的过程,具体可以包括:所述控制单元106,还可以用于在确定电器设备在当前领域下的工作模式为全双工工作模式之后,若所述语音数据所包含的控制指令为信息获取指令(如第一信息获取指令、第二信息获取指令等)和控制指令中两个以上指令,则根据使用者的使用习惯确定两个以上指令的优先级,并按确定的优先级执行两个以上指令。
例如:在已经判定为全双工工作模式的领域下,继续分析采集到的用户数据。把用户上下文语音指令的关联性关系分级,根据得到的关联性级别,得出在该领域下语音工作模式的识别退出时机。在全领域下,语音的工作模式都是动态的(如可以动态从控制领域切换到音乐领域等),会根据不同时期采集到的用户数据来进行动态调整,从而使得语音空调更加智能,语音的唤醒和识别更加准确,能够有效分类出不同的领域,通过领域来缩小范围,这样能够减少误识别。
由此,通过对多个语音指令的优先级进行调整,可以按不同使用习惯满足不同用户的使用需求,控制方式更加灵活,也更加人性化。
由于本实施例的装置所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,可以提升识别精度,提升用户体验。
根据本发明的实施例,还提供了对应于语音控制装置的一种电器设备。该电器设备可以包括:以上所述的语音控制装置。
在一些方案中,由于一些语音技术的壁垒导致的语音识别问题尤为严重,也是让用户头疼不已。例如:语音空调会对环境中用户发出的所有语音进行识别并执行,甚至对环境中并非用户发出的声音也进行识别并进行执行,当然,这种执行并不是用户所希望的,这样的话,不仅没有方便用户的使用,反而是给用户造成了干扰。
在一些方案中,采用语音全双工识别工作模式,语音空调支持的领域越多,会导致语音空调只有在接收到用户的数据后才能够答复用户,语音的误识别越严重;采用语音半双工识别工作模式,识别到的语音指令都会下发到语音板上,会导致语音空调只有在接收到用户的数据后才能够答复用户,会使用户出现语音空调不够智能的感觉。
其中,语音全双工识别工作模式,即一个实时的、双向的语音信息的交互方式。语音半双工识别工作模式,即一个实时的、单向的语音信息的交互方式。
在一个可选实施方式中,本发明的方案提出一种实现全双工和半双工结合的语音识别方法和系统,能够实现语音空调工作模式的动态自动切换和选择,即动态地调整语音空调工作在某个领域的全双工和半双工工作模式,可以提高全领域下语音空调用户的识别率和提升语音空调的智能化水平。例如:采集语音空调所在环境中的语音数据,对采集到的语音数据进行识别,根据识别结果确定语音空调是工作在全双工工作模式还是半双工工作模式,可以避免误识别,有利于提升语音空调的智能化程度,进而提升用户的使用体验。
可选地,在动态地调整语音空调工作在某个领域的全双工和半双工工作模式时,可以采用语音指令的上下文关系,若关系性强(如关系性达到某个阈值),通过设定的阈值动态设置全双工识别和半双工识别,全双工模式下通过在线上传语音指令并下发互联网资源。半双工模式下语音指令即使上传到云端但若不能达到设定的阈值也不下发到语音板上,表明语音指令不是用户希望发出的指令、或不是用户发出的,这样解决减少误唤醒和误识别的情况,提高识别率。
具体地,可以智能判断用户的语音指令数据,判断语音指令的上下文关系,若关系性强(如关系性达到某个阈值),则自动划分为全双工识别场景;否则若关系性不强(如关系性未达到某个阈值),则划分为半双工识别场景,从而达到动态调节识别场景工作模式的目的,可以减少误唤醒和误识别的情况发生,提高识别率。
例如:语音板采集到的用户数据为几个语句,每个语句中有关键词,每个关键词被赋予相应的值如数值。对这几个语句中的几个关键词的值进行加权平均值、归一化等处理,得到平均值,该平均值可以表示这几句话所包含的语音指令的上下文关系。若该平均值达到设定阈值,则表示这几句话所包含的语音指令的上下文关系的关系性强。
进一步可选地,每个领域下全双工工作模式的识别时长,可以根据收集到的用户数据进行智能判断,之后再退出对该领域下全双工工作模式的时长识别过程。具体地,若语音空调工作在全双工工作模式下,可以根据实时采集到的用户使用数据,推测出用户的使用习惯、或判断用户的使用习惯,进而根据用户的使用习惯调整该领域下语音空调全双工工作的时长。其中,该领域,可以包括:新闻领域、笑话领域、空调控制领域等。
下面可以参见图5所示的例子,对本发明的方案的具体实现过程进行示例性说明。
图5为语音空调实现全双工和半双工结合的语音识别的流程示意图。如图5所示,语音空调实现全双工和半双工结合的语音识别的过程,可以包括:
步骤1、语音空调预先设定每个支持领域下的语音的工作模式。
其中,语音空调的支持领域,可以包括:按互联网资源类分为新闻领域、笑话领域、空调控制领域。工作模式:就是处在各领域下的运行状态,如全双工工作模式或半双工工作模式。
步骤2、在用户使用语音空调的时候,同步采集用户的使用数据,并把采集到的用户的使用数据发送到云端进行分析和处理。
可选地,可以通过空调麦克风采集用户的使用数据,具体可以是采集用户的说话习惯。如通过麦克风采集用户发出的指令或者用户说出的需求。
例如:采集说话习惯,可以包括:通过麦克风记录用户说的某些话的频率并储存在云端,通过用户的使用数据并保存用户的习惯;当麦克风再次采集到该用户唤醒词就可以判断出用户的需求,通过用户的需求可以对空调或者获取相应云端资源。
可选地,可以通过麦克风采集数据,然后通过语音板中的语音模块生成文本上传到云端,云端分析文本,通过自然语音处理进行分析文本,分析出来的结果进行处理并下发到语音板。
步骤3、重新对每个领域工作模式进行调整。具体地,根据用户使用习惯数据,智能判断用户在该领域下的使用习惯。通过采集到的用户语音指令的上下文关系(即用户上下文语音指令的关联性关系),若关系性强(如达到某个阈值)则判断在该领域下该用户的使用习惯是适合于全双工工作模式,否则为半双工工作模式。
例如:确定工作模式之后的调整,可以包括:通过用户用词习惯,并提取用户的语义来判断空调处于什么领域,比如控制领域就开启空调相应功能或者音乐领域就播放相应的歌曲。
可选地,根据用户使用习惯数据,智能判断用户在该领域下的使用习惯,可以包括:可以通过用户指令通用自然语音处理进行上下文分析语义,并判断处于哪个领域,并对用户使用习惯进行统计。
可选地,用户语音指令的上下文关系,可以包括:提取指令的语义,可以通过自然语言模块处理得到。
步骤4、在已经判定为全双工工作模式的领域下,继续分析采集到的用户数据。把用户上下文语音指令的关联性关系分级,根据得到的关联性级别,得出在该领域下语音工作模式的识别退出时机。
步骤5、在全领域下,语音的工作模式都是动态的(如可以动态从控制领域切换到音乐领域等),会根据不同时期采集到的用户数据来进行动态调整,从而使得语音空调更加智能,语音的唤醒和识别更加准确,能够有效分类出不同的领域,通过领域来缩小范围,这样能够减少误识别。
例如:通过用户的指令在语音板生成文本上传到云端,然后通过自然语音模块进行分析文本语义并判断用户需求,通过分析出的语义切换到不同的领域和需求并下发的空调端。
其中,本发明的方案,适用所有语音智能产品,语音工作模式可以在全双工模式和半双工模式之间自动选择切换,能够智能调节语音识别时长,以在特定领域下对语音识别时间进行智能判断和自动调整。
由于本实施例的电器设备所实现的处理及功能基本相应于前述图4所示的装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,可以避免误识别,提升语音数据的识别精准性和可靠性。
根据本发明的实施例,还提供了对应于语音控制方法的一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以上所述的语音控制方法。
由于本实施例的存储介质所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,可以提升语音空调的智能化程度,进而提升用户的使用体验。
根据本发明的实施例,还提供了对应于语音控制方法的一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行以上所述的语音控制方法。
由于本实施例的处理器所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,能够智能调节语音识别时长,以在特定领域下对语音识别时间进行智能判断和自动调整。
综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (15)

1.一种语音控制方法,其特征在于,包括:
采集语音数据;
对所述语音数据进行分析,得到所述语音数据的上下文关系;
确定所述语音数据的上下文关系是否已达到当前领域下设定阈值;其中,所述当前领域,包括:信息获取领域和控制领域中的任一领域;
若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式;
若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式;
其中,对所述语音数据进行分析,包括:
对所述语音数据进行语义分析,以提取所述语音数据所包含的一个以上关键词;
根据设定关键词与设定值之间的对应关系,将该对应关系中与每个关键词相同的设定关键词所对应的设定值确定为每个关键词的值;
对一个以上关键词的值进行加权求平均值和归一化处理,得到一个以上关键词的平均值,将该平均值作为所述语音数据的上下文关系。
2.根据权利要求1所述的语音控制方法,其特征在于,
在所述信息获取领域下,电器设备在本地端通过语音板分析所述语音数据下发的信息获取指令,调用本地端预先下载并存储的待获取信息;或接收由云端下发的信息获取指令和待获取信息,并控制电器设备按所述信息获取指令为使用者提供待获取信息;其中,所述云端下发的信息获取指令是由云端通过分析所述语音数据得到的,所述云端下发的待获取信息是由云端通过互联网资源收集得到的;
在所述控制领域下,电器设备在本地端通过语音板分析所述语音数据下发的控制指令或接收由云端下发的控制指令,并按所述控制指令控制电器设备为用户提供服务;所述云端下发的控制指令是由云端通过分析所述语音数据得到的。
3.根据权利要求1或2所述的语音控制方法,其特征在于,所述语音数据,包括:语音指令和/或语音需求;
所述采集语音数据,包括:通过麦克风模块,采集使用者发出的语音指令、和/或使用者说出的语音需求。
4.根据权利要求1所述的语音控制方法,其特征在于,其中,对所述语音数据进行分析的执行端,包括:语音板或云端;
在云端作为对所述语音数据进行分析的执行端的情况下,由电器设备的语音板在本地端将所述语音数据转换为文本信息后,将所述文本信息上传至云端;之后再由语音板接收云端对所述语音数据进行分析后下发的所述语音数据的上下文关系。
5.根据权利要求1或2所述的语音控制方法,其特征在于,还包括:
在确定电器设备在当前领域下的工作模式为全双工工作模式之后,根据所述语音数据确定使用者的使用习惯;
根据接收由云端通过分析所述语音数据下发的信息获取指令和控制指令中任一指令,并结合所述使用习惯,调整电器设备在当前领域下的工作状态和/或工作时长。
6.根据权利要求1或2所述的语音控制方法,其特征在于,还包括:
在确定电器设备在当前领域下的工作模式为全双工工作模式之后,若所述语音数据所包含的控制指令为信息获取指令和控制指令中两个以上指令,则根据使用者的使用习惯确定两个以上指令的优先级,并按确定的优先级执行两个以上指令。
7.一种语音控制装置,其特征在于,包括:
采集单元,用于采集语音数据;
分析单元,用于对所述语音数据进行分析,得到所述语音数据的上下文关系;
控制单元,用于确定所述语音数据的上下文关系是否已达到当前领域下设定阈值;其中,所述当前领域,包括:信息获取领域和控制领域中的任一领域;
所述控制单元,还用于若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式;
所述控制单元,还用于若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式;
所述分析单元对所述语音数据进行分析,包括:
对所述语音数据进行语义分析,以提取所述语音数据所包含的一个以上关键词;
根据设定关键词与设定值之间的对应关系,将该对应关系中与每个关键词相同的设定关键词所对应的设定值确定为每个关键词的值;
对一个以上关键词的值进行加权求平均值和归一化处理,得到一个以上关键词的平均值,将该平均值作为所述语音数据的上下文关系。
8.根据权利要求7所述的语音控制装置,其特征在于,
在所述信息获取领域下,电器设备在本地端通过语音板分析所述语音数据下发的信息获取指令,调用本地端预先下载并存储的待获取信息;或接收由云端下发的信息获取指令和待获取信息,并控制电器设备按所述信息获取指令为使用者提供待获取信息;其中,所述云端下发的信息获取指令是由云端通过分析所述语音数据得到的,所述云端下发的待获取信息是由云端通过互联网资源收集得到的;
在所述控制领域下,电器设备在本地端通过语音板分析所述语音数据下发的控制指令或接收由云端下发的控制指令,并按所述控制指令控制电器设备为用户提供服务;所述云端下发的控制指令是由云端通过分析所述语音数据得到的。
9.根据权利要求7或8所述的语音控制装置,其特征在于,所述语音数据,包括:语音指令和/或语音需求;
所述采集单元采集语音数据,包括:通过麦克风模块,采集使用者发出的语音指令、和/或使用者说出的语音需求。
10.根据权利要求7所述的语音控制装置,其特征在于,其中,所述分析单元对所述语音数据进行分析的执行端,包括:语音板或云端;
在云端作为对所述语音数据进行分析的执行端的情况下,由电器设备的语音板在本地端将所述语音数据转换为文本信息后,将所述文本信息上传至云端;之后再由语音板接收云端对所述语音数据进行分析后下发的所述语音数据的上下文关系。
11.根据权利要求7或8所述的语音控制装置,其特征在于,还包括:
所述控制单元,还用于在确定电器设备在当前领域下的工作模式为全双工工作模式之后,根据所述语音数据确定使用者的使用习惯;
所述控制单元,还用于根据接收由云端通过分析所述语音数据下发的信息获取指令和控制指令中任一指令,并结合所述使用习惯,调整电器设备在当前领域下的工作状态和/或工作时长。
12.根据权利要求7或8所述的语音控制装置,其特征在于,还包括:
所述控制单元,还用于在确定电器设备在当前领域下的工作模式为全双工工作模式之后,若所述语音数据所包含的控制指令为信息获取指令和控制指令中两个以上指令,则根据使用者的使用习惯确定两个以上指令的优先级,并按确定的优先级执行两个以上指令。
13.一种电器设备,其特征在于,包括:如权利要求7至12中任一项所述的语音控制装置。
14.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至6中任一项所述的语音控制方法。
15.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任一项所述的语音控制方法。
CN202010737340.8A 2020-07-28 2020-07-28 一种语音控制方法、装置、电器设备、存储介质及处理器 Active CN112002315B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010737340.8A CN112002315B (zh) 2020-07-28 2020-07-28 一种语音控制方法、装置、电器设备、存储介质及处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010737340.8A CN112002315B (zh) 2020-07-28 2020-07-28 一种语音控制方法、装置、电器设备、存储介质及处理器

Publications (2)

Publication Number Publication Date
CN112002315A CN112002315A (zh) 2020-11-27
CN112002315B true CN112002315B (zh) 2023-12-29

Family

ID=73467291

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010737340.8A Active CN112002315B (zh) 2020-07-28 2020-07-28 一种语音控制方法、装置、电器设备、存储介质及处理器

Country Status (1)

Country Link
CN (1) CN112002315B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732340B (zh) 2019-10-14 2022-03-15 思必驰科技股份有限公司 人机对话处理方法及装置
CN112700775A (zh) * 2020-12-29 2021-04-23 维沃移动通信有限公司 语音接收周期的更新方法、装置和电子设备
CN112820290A (zh) * 2020-12-31 2021-05-18 广东美的制冷设备有限公司 家电设备及其语音控制方法、语音装置、计算机存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008048273A2 (en) * 2005-11-04 2008-04-24 Cisco Technology, Inc. Method and system for providing a push-to-talk communication session
KR20140115423A (ko) * 2013-03-19 2014-10-01 주식회사 비즈모델라인 반이중 음성 채팅을 전이중 음성 채팅으로 전환하는 방법
CN105012980A (zh) * 2014-04-24 2015-11-04 北京白象新技术有限公司 一种可以分区语音通信的清洗消毒器
CN109657091A (zh) * 2019-01-02 2019-04-19 百度在线网络技术(北京)有限公司 语音交互设备的状态呈现方法、装置、设备及存储介质
CN109671427A (zh) * 2018-12-10 2019-04-23 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及空调
WO2019133265A1 (en) * 2017-12-29 2019-07-04 Microsoft Technology Licensing, Llc Full duplex communication for conversation between chatbot and human
CN112735398A (zh) * 2019-10-28 2021-04-30 苏州思必驰信息科技有限公司 人机对话模式切换方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020178003A1 (en) * 2001-03-09 2002-11-28 Motorola, Inc. Method and apparatus for providing voice recognition service to a wireless communication device
US8369251B2 (en) * 2008-06-20 2013-02-05 Microsoft Corporation Timestamp quality assessment for assuring acoustic echo canceller operability
US10030878B2 (en) * 2013-08-21 2018-07-24 Honeywell International Inc. User interaction with building controller device using a remote server and a duplex connection
US20180364798A1 (en) * 2017-06-16 2018-12-20 Lenovo (Singapore) Pte. Ltd. Interactive sessions

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008048273A2 (en) * 2005-11-04 2008-04-24 Cisco Technology, Inc. Method and system for providing a push-to-talk communication session
KR20140115423A (ko) * 2013-03-19 2014-10-01 주식회사 비즈모델라인 반이중 음성 채팅을 전이중 음성 채팅으로 전환하는 방법
CN105012980A (zh) * 2014-04-24 2015-11-04 北京白象新技术有限公司 一种可以分区语音通信的清洗消毒器
WO2019133265A1 (en) * 2017-12-29 2019-07-04 Microsoft Technology Licensing, Llc Full duplex communication for conversation between chatbot and human
CN109671427A (zh) * 2018-12-10 2019-04-23 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及空调
CN109657091A (zh) * 2019-01-02 2019-04-19 百度在线网络技术(北京)有限公司 语音交互设备的状态呈现方法、装置、设备及存储介质
CN112735398A (zh) * 2019-10-28 2021-04-30 苏州思必驰信息科技有限公司 人机对话模式切换方法及系统

Also Published As

Publication number Publication date
CN112002315A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN112002315B (zh) 一种语音控制方法、装置、电器设备、存储介质及处理器
US10013977B2 (en) Smart home control method based on emotion recognition and the system thereof
WO2019134474A1 (zh) 语音控制方法及装置
CN109584876B (zh) 语音数据的处理方法、装置和语音空调
CN109147765B (zh) 音频质量综合评测方法及系统
CN107657950B (zh) 基于云端和多命令词的汽车语音控制方法、系统及装置
CN110914828B (zh) 语音翻译方法及翻译装置
CN107424607A (zh) 语音控制模式切换方法、装置及具有该装置的设备
CN107958668B (zh) 智能电视的声控选播方法、声控选播系统
US20160125880A1 (en) Method and system for identifying location associated with voice command to control home appliance
US7689424B2 (en) Distributed speech recognition method
CN108156497B (zh) 一种控制方法、控制设备及控制系统
EP2728576A1 (en) Method and apparatus for voice recognition
CN112201233A (zh) 一种智能家居设备的语音控制方法、系统、设备及计算机存储介质
CN112820290A (zh) 家电设备及其语音控制方法、语音装置、计算机存储介质
CN108932947B (zh) 语音控制方法及家电设备
CN106952645A (zh) 语音指令的识别方法、语音指令的识别装置和空调器
CN113132193B (zh) 智能设备的控制方法、装置、电子设备以及存储介质
CN115719592A (zh) 一种语音信息处理方法和装置
CN113763942A (zh) 语音家电的交互方法、交互系统及计算机设备
CN110262278B (zh) 智能家电设备的控制方法及装置、智能电器设备
CN113330513A (zh) 语音信息处理方法及设备
CN113053369A (zh) 智能家电的语音控制方法及装置、智能家电
CN110970019A (zh) 智能家居系统的控制方法和装置
CN114420103A (zh) 语音处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210317

Address after: 519070 9 Building (Science and technology building) 789 Jinji Road, Qianshan, Zhuhai, Guangdong

Applicant after: GREE GREEN REFRIGERATION TECHNOLOGY CENTER Co.,Ltd. OF ZHUHAI

Address before: 519070, Jinji Hill Road, front hill, Zhuhai, Guangdong

Applicant before: GREE ELECTRIC APPLIANCES Inc. OF ZHUHAI

GR01 Patent grant
GR01 Patent grant