CN113160808A - 一种语音控制方法及其系统、语音控制设备 - Google Patents

一种语音控制方法及其系统、语音控制设备 Download PDF

Info

Publication number
CN113160808A
CN113160808A CN202010073173.1A CN202010073173A CN113160808A CN 113160808 A CN113160808 A CN 113160808A CN 202010073173 A CN202010073173 A CN 202010073173A CN 113160808 A CN113160808 A CN 113160808A
Authority
CN
China
Prior art keywords
corpus
voice
information
user
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010073173.1A
Other languages
English (en)
Inventor
蔡吉晨
韩子天
冉光伟
李立标
张宗煜
邓贵中
刘子鸽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Angtong Technology Macau Co ltd
Guangzhou Automobile Group Co Ltd
Original Assignee
Angtong Technology Macau Co ltd
Guangzhou Automobile Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Angtong Technology Macau Co ltd, Guangzhou Automobile Group Co Ltd filed Critical Angtong Technology Macau Co ltd
Priority to CN202010073173.1A priority Critical patent/CN113160808A/zh
Publication of CN113160808A publication Critical patent/CN113160808A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明涉及一种语音控制方法及其系统、语音控制设备,所述方法包括:在第一模式时,获取用户输入的第一语音指令,并将第一语音指令转换为第一语音文本;对第一语音文本进行语义信息处理得到第一语料、若干第二语料、以及第一语料与若干第二语料之间的语料关系;输出第一提示信息;第一提示信息用于提示用户确认第一语料、若干第二语料、语料关系是否正确;在输出第一提示信息后,获取用户输入的确认信息,并根据确认信息和语料关系将语料关系和第一语料存储至本地语料库。实施本发明,能够实现语音指令的一对多自定义,并能够根据用户的语言表达习惯/方式进行个性化自定义语音指令,进行语音控制。

Description

一种语音控制方法及其系统、语音控制设备
技术领域
本发明涉及语义信息处理技术领域,具体涉及一种语音控制方法及其系统、语音控制设备。
背景技术
目前,用户通过车载语音助手可以完成各种车内设施控制,如车窗、天窗、空调、座椅、屏幕等的开关控制。车载语音助手需要通过序列式一问一答的方式或者通过一连串语音指令同时清晰表达的方式完成,即一种语音指令只对应系统已经定义好的对应任务,比如“打开天窗”这个语音指令,车载语音助手完成一项反馈和操作,对应的是天窗打开这个动作,再想完成其他动作,就需要重新发出一条语音指令,即使相关性很强的多个控制任务,如果系统没有预定义,用户并没有自我定义、修改的权限。
在实现本发明的过程中,发明人发现现有技术至少存在如下技术问题:
现有车载语音助手通过序列式一问一答的方式或者通过一连串语音指令的语音交互方式只能实现语音指令的一对一自定义,无法做到一对多,并且现有语音指令的自定义,是基于语音指令库将新增语音指令对应,不涉及自然语音理解和处理,用户换一种说法语音系统就无法进行响应。由于人类的口语是伴随思考进行,而且受到思维逻辑的影响,不同人的语言表达习惯/方式不同,因此,现有语音交互方式会导致用户体验不佳。
发明内容
本发明旨在提出一种语音控制方法及其系统、语音控制设备、计算机可读存储介质,以实现车载语音助手的语音指令一对多自定义,并能够根据用户的语言表达习惯/方式进行个性化自定义语音指令,进行语音控制。
第一方面,本发明实施例提出一种语音控制方法,包括:
在第一模式时,获取用户输入的第一语音指令,并根据所述第一语音指令获得第一语音文本;
对所述第一语音文本进行语义信息处理得到第一语料、若干第二语料、以及第一语料与若干第二语料之间的语料关系;
输出第一提示信息;所述第一提示信息用于提示用户确认所述第一语料、若干第二语料、语料关系是否正确;
在输出第一提示信息后,获取用户输入的确认信息,并根据所述确认信息和语料关系将所述语料关系和第一语料存储至本地语料库。
优选地,根据所述确认信息和语料关系将所述语料关系和第一语料存储至本地语料库具体包括:
当所述确认信息为确认正确时,根据所述语料关系将所述语料关系和第一语料存储至本地语料库;
若所述语料关系为执行第一语料所对应的任务等于同时执行至少两个第二语料所对应的至少两个任务,则将所述语料关系和第一语料存储至本地语料库;
若所述语料关系为执行第一语料所对应的任务的同时执行至少一个第二语料所对应的至少一个任务,则将所述语料关系存储至本地语料库。
优选地,所述方法还包括:
根据本地语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息。
优选地,所述方法还包括:
获取用户输入的语料修改信息或语料删除信息;
根据所述语料修改信息修改本地语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除本地语料库中的语料和/或语料关系。
优选地,所述方法还包括:
获取第一模式启动信号,并根据所述第一模式启动信号进入第一模式;所述第一模式启动信号为用户通过语音方式输入的第一启动信号或通过物理输入单元输入的第二启动信号;
输出第二提示信息;所述第二提示信息用于提示用户输入的需要进行自定义的第一语音指令。
优选地,所述方法还包括:
获取第二模式启动信号,并根据所述第二模式启动信号进入第二模式;所述第二模式启动信号为用户通过语音方式输入的第三启动信号或通过物理输入单元输入的第四启动信号;
获取用户输入的第二语音指令,并根据所述第二语音指令获得第二语音文本;
获取本地语料库中与所述第二语音文本对应的目标语料及其对应的语料关系;
根据所述目标语料及其对应的语料关系生成多个任务指令,并将所述多个任务指令分别发送至对应的多个执行单元;所述多个任务指令用于控制多个执行单元分别执行相应的任务。
需说明的是,识别语音文本时可以得到语音文本的意图,语音文本的意图与语料是对应的,本文中所指根据语料生成任务指令具体可以理解为是生成与意图对应的任务指令。
第二方面,本发明实施例提出一种语音控制系统,包括:
第一指令获取单元,用于在第一模式时,获取用户输入的第一语音指令,并根据所述第一语音指令获得第一语音文本;
第一语言处理单元,用于对所述第一语音文本进行语义信息处理得到第一语料、若干第二语料、以及第一语料与若干第二语料之间的语料关系;
第一提示单元,用于输出第一提示信息;所述第一提示信息用于提示用户确认所述第一语料、若干第二语料、语料关系是否正确;
更新单元,用于在输出第一提示信息后,获取用户输入的确认信息,并根据所述确认信息和语料关系将所述语料关系和第一语料存储至本地语料库。
优选地,所述更新单元具体包括:
确认信息获取单元,用于在输出第一提示信息后,获取用户输入的确认信息;
存储执行单元,用于当所述确认信息为确认正确时,根据所述语料关系将所述语料关系和第一语料存储至本地语料库;其中,若所述语料关系为执行第一语料所对应的任务等于同时执行至少两个第二语料所对应的至少两个任务,则存储执行单元将所述语料关系和第一语料存储至本地语料库;若所述语料关系为执行第一语料所对应的任务的同时执行至少一个第二语料所对应的至少一个任务,则存储执行单元将所述语料关系存储至本地语料库。
优选地,所述系统还包括:
确定单元,用于根据本地语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
显示信息生成单元,用于根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息。
优选地,所述系统还包括:
删改信息获取单元,用于获取用户输入的语料修改信息或语料删除信息;
删改处理单元,用于根据所述语料修改信息修改本地语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除本地语料库中的语料和/或语料关系。
优选地,所述系统还包括:
第一启动单元,用于获取第一模式启动信号,并根据所述第一模式启动信号进入第一模式;所述第一模式启动信号为用户通过语音方式输入的第一启动信号或通过物理输入单元输入的第二启动信号;
第二提示单元,用于输出第二提示信息;所述第二提示信息用于提示用户输入的需要进行自定义的第一语音指令。
优选地,所述系统还包括:
第二启动单元,用于获取第二模式启动信号,并根据所述第二模式启动信号进入第二模式;所述第二模式启动信号为用户通过语音方式输入的第三启动信号或通过物理输入单元输入的第四启动信号;
第二指令获取单元,用于获取用户输入的第二语音指令,并根据所述第二语音指令获得第二语音文本;
第二语言处理单元,用于获取本地语料库中与所述第二语音文本对应的目标语料及其对应的语料关系;
任务指令生成单元,用于根据所述目标语料及其对应的语料关系生成多个任务指令,并将所述多个任务指令分别发送至对应的多个执行单元;所述多个任务指令用于控制多个执行单元分别执行相应的任务。
第三方面,本发明实施例提出一种语音控制设备,包括:根据本发明实施例所述的语音控制系统;或者,存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行根据本发明实施例所述语音控制方法的步骤。
以上技术方案至少具有以下有益效果:在第一模式(自定义语音指令的模式)时,获取用户输入的第一语音指令,并根据所述第一语音指令获得第一语音文本;对所述第一语音文本进行语义信息处理可以得到第一语料、若干第二语料、以及第一语料与若干第二语料之间的语料关系;可以理解的是,第一语料为要进行自定义的目标语料。为了确保语义信息处理得到语料及语料关系与用户想要表达的意思一致,进一步输出第一提示信息提示用户确认所述第一语料、若干第二语料、语料关系是否正确;最后根据用户反馈的确认信息和语料关系将所述语料关系和第一语料存储至本地语料库。具体地,所述第一语音指令用于控制执行单元执行至少两个任务,通过上述原理,可以对第一语料所对应的任务进行自定义,在自定义成功之后,用户发出与所述第一语料对应语音指令时,即可根据第一语料及其对应的语料关系确定要执行的至少两个任务,从而实现语音指令的一对多自定义,并能够根据用户的语言表达习惯/方式进行个性化自定义语音指令,进行语音控制。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而得以体现。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例中一种语音控制方法第一模式的流程示意图。
图2为本发明另一实施例中一种语音控制方法第二模式的流程示意图。
图3为本发明一实施例中一种语音控制系统框架示意图。
图4为本发明另一实施例中一种语音控制系统框架示意图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
另外,为了更好的说明本发明,在下文的具体实施例中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的手段未作详细描述,以便于凸显本发明的主旨。
本发明一实施例提出一种语音控制方法,其可以应用于车载语音助手,图1为本实施例所述语音控制方法的流程图,参阅图1,本实施例所述方法包括如下步骤S101至S104:
步骤S101、在第一模式时,获取用户输入的第一语音指令,并根据所述第一语音指令获得第一语音文本;
具体而言,所述第一模式为进行语音指令自定义的工作模式,在第一模式下,用户可以通过麦克风输入语音指令,步骤中可以利用第三方自动语音识别(Automatic SpeechRecognition,ASR)系统对获取的第一语音指令进行处理转换为第一语音文本,本发明通过相应的接口从第三方自动语音识别系统获取到第一语音文本。
步骤S102、对所述第一语音文本进行语义信息处理得到第一语料、若干第二语料、以及第一语料与若干第二语料之间的语料关系;
具体而言,利用NLP引擎(Natural Language Processing,NLP)对所述第一语音文本进行语义信息处理包括进行切词和词性标注,提取出关键字,进行领域识别和意图识别等得到结构化信息,根据该结构化信息可以确定第一语料、若干第二语料、以及第一语料与若干第二语料之间的语料关系。
例如,第一语音文本为“打开空调的同时关闭车窗”,对文本“打开空调的同时关闭车窗”进行语义信息处理可以得到第一语料“打开空调”和第二语料“关闭车窗”,根据关键词“同时”可以确定二者的语料关系为执行第一语料“打开空调”所对应的任务的同时,执行第二语料“关闭车窗”所对应的任务。
可以理解的是,第一语音文本包括多个语料以及表征多个语料之间关系的关系词,关系词包括但不限于为“包括”、“等于”、
“同时”等等。
步骤S103、输出第一提示信息;所述第一提示信息用于提示用户确认所述第一语料、若干第二语料、语料关系是否正确;
具体而言,为了确保语义信息处理得到语料及语料关系与用户想要表达的意思一致,进一步输出第一提示信息提示用户确认所述第一语料、若干第二语料、语料关系是否正确。示例性地,所述第一提示信息的提示方式可以是语音方式和/或显示单元进行显示的方式。
步骤S104、在输出第一提示信息后,获取用户输入的确认信息,并根据所述确认信息和语料关系将所述语料关系和第一语料存储至本地语料库。
具体而言,用户在得到第一提示信息的提示之后,通过语音方式或通过物理输入单元输入确认信息或否认信息,当输入为确认信息时,根据所述语料关系将所述语料关系和第一语料存储至本地语料库,当输入为否认信息时,则不进行存储,表示本次语音指令自定义失败,需要重新进行语音指令的自定义,可以重新循环上述步骤S101-S104再次进行语音指令的自定义。
通过上述描述,可知本实施例方法可以实现对第一语料所对应的任务进行自定义,在自定义成功之后,用户发出与所述第一语料对应语音指令时,即可根据第一语料及其对应的语料关系确定要执行的至少两个任务,从而实现语音指令的一对多自定义,并能够根据用户的语言表达习惯/方式进行个性化自定义语音指令,进行语音控制。
在一些实施例中,所述步骤S104具体包括:
步骤S201、在输出第一提示信息后,获取用户输入的确认信息;
步骤S202、当所述确认信息为确认正确时,根据所述语料关系将所述语料关系和第一语料存储至本地语料库;
其中:
(1)若所述语料关系为执行第一语料所对应的任务等于同时执行至少两个第二语料所对应的至少两个任务,则将所述语料关系和第一语料存储至本地语料库;
举例而言,当第一语音文本为“开着空调唱着歌等于打开空调加上关闭车窗加上打开音乐”时,经过语义信息处理可以得到第一语料“开着空调唱着歌”,三个第二语料“打开空调”、“关闭车窗”以及“打开音乐”,语料关系为执行语料“开着空调唱着歌”所对应的任务等于同时执行语料“打开空调”、“关闭车窗”以及“打开音乐”所对应的三个任务。在本例中,用户对语料“开着空调唱着歌”进行自定义,其为新增的语料,而语料“打开空调”、“关闭车窗”以及“打开音乐”则为本地语料库中已经存储的语料,本例中进行语音指令自定义时,目的在于将新增语料与本地语料库中的三个语料建立映射关系,使得能够通过单一语音指令“开着空调唱着歌”控制三个任务“打开空调”、“关闭车窗”以及“打开音乐”的执行。
(2)若所述语料关系为执行第一语料所对应的任务的同时执行至少一个第二语料所对应的至少一个任务,则将所述语料关系存储至本地语料库;
举例而言,当第一语音文本为“打开空调的同时关闭车窗和关闭天窗”时,经过语义信息处理可以得到第一语料“打开空调”,三个第二语料“关闭车窗”和“关闭天窗”,语料关系为执行语料“打开空调”所对应的任务的同时执行语料“关闭车窗”和“关闭天窗”所对应的两个任务。在本例中,用户对语料“打开空调”进行重新定义,语料“打开空调”、“关闭车窗”和“关闭天窗”均为本地语料库中已经存储的语料,本例中进行语音指令自定义时,目的在于为本地语料库中的三个语料“打开空调”、“关闭车窗”和“关闭天窗”建立条件关系,使得能够通过单一语音指令“打开空调”控制“打开空调”、“关闭车窗”和“关闭天窗”三个任务的执行,即一种语料完成一连串相关性任务的控制,提高了语音交互的效率,更具有个性化特点。
在一些实施例中,所述方法还包括:
步骤S301、根据本地语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
步骤S302、根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息。
具体而言,本实施例中提供语料及其对应的任务的显示,以便于用户进行查看。在应用过程中,可以由用户通过语音方式或通过物理输入单元输入一查看请求信息,在获取到查看请求信息后,执行所述步骤S301-步骤S302,具体可以通过车载终端的显示单元进行显示。
在一些实施例中,所述方法还包括:
步骤S401、获取用户输入的语料修改信息或语料删除信息;
步骤S402、根据所述语料修改信息修改本地语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除本地语料库中的语料和/或语料关系。
具体而言,所述语料修改信息可以是对语料的用词或语料之间的映射、条件关系进行修改,所述语料删除信息可以是对语料的用词或语料之间的映射、条件关系进行删除,以便于用户对本地语料库中的指令进行删改。在应用过程中,车载终端的显示单元显示语料及其对应的任务,可以由用户通过语音方式或通过物理输入单元输入语料修改信息或语料删除信息,在获取到语料修改信息或语料删除信息后,执行所述步骤S401-步骤S402。
在一些实施例中,所述方法还包括:
步骤S501、获取第一模式启动信号,并根据所述第一模式启动信号进入第一模式;所述第一模式启动信号为用户通过语音方式输入的第一启动信号或通过物理输入单元输入的第二启动信号;
步骤S502、输出第二提示信息;所述第二提示信息用于提示用户输入的需要进行自定义的第一语音指令。
示例性地,所述第二提示信息的提示方式可以是语音方式和/或显示单元进行显示的方式。
在一些实施例中,如图2所示,所述方法还包括:
步骤S601、获取第二模式启动信号,并根据所述第二模式启动信号进入第二模式;所述第二模式启动信号为用户通过语音方式输入的第三启动信号或通过物理输入单元输入的第四启动信号;
具体而言,所述第二模式为进行语音识别控制的工作模式,其区别于所述第一模式。
步骤S602、获取用户输入的第二语音指令,并根据所述第二语音指令获得第二语音文本;
具体而言,在第二模式下,用户可以通过麦克风输入语音指令,步骤中可以利用通过自动语音识别(Automatic Speech Recognition,ASR)对获取的第二语音指令进行处理转换为第二语音文本,通过相应的接口可以获取已转化成功的所述第二语音文本。
步骤S603、获取本地语料库中与所述第二语音文本对应的目标语料及其对应的语料关系;
具体而言,例如第二语音文本为“打开空调唱着歌”,对所述第二语音文本进行语义信息处理(Natural Language Processing,NLP)得到语料“打开空调唱着歌”,语料“打开空调唱着歌”已事先经过用户自定义,自定义过程参阅前面实施例内容。通过搜索本地语料库,找到本地语料库中语料“打开空调唱着歌”及其对应的语料关系,即“打开空调唱着歌”等于“打开空调”加上“关闭车窗”
加上“打开音乐”。
又例如第二语音文本为“打开空调”,对所述第二语音文本进行语义信息处理(Natural Language Processing,NLP)得到语料“打开空调”,语料“打开空调”已事先经过用户自定义,自定义过程参阅前面实施例内容。通过搜索本地语料库,找到本地语料库中语料“打开空调”及其对应的语料关系,即执行“打开空调”的同时执行“关闭天窗”和“关闭车窗”。
步骤S604、根据所述目标语料及其对应的语料关系生成多个任务指令,并将所述多个任务指令分别发送至对应的多个执行单元;所述多个任务指令用于控制多个执行单元分别执行相应的任务。
具体而言,结合步骤S603中的两个例子,本步骤中,当第二语音文本为“打开空调唱着歌”时,根据所述目标语料及其对应的语料关系生成的多个任务指令即为执行“打开空调”、“关闭车窗”和“打开音乐”;当第二语音文本为“打开空调”时,根据所述目标语料及其对应的语料关系生成的多个任务指令即为执行“打开空调”、“关闭车窗”和“关闭天窗”。
需说明的是,识别语音文本时可以得到语音文本的意图,语音文本的意图与语料是对应的,本文中所指根据语料生成任务指令具体可以理解为是生成与意图对应的任务指令。
因此,本实施例方法在经过用户的语音指令个性化定义后,能够根据用户的语言表达习惯,通过发出单一语音指令,实现多个关联任务的控制执行。能够弥补现有车载语音交互方案不支持自主定义,多步骤任务控制低效或命中率低的问题,能够有效提升车载语音交互系统的体验和效率。
本发明的另一实施例提出一种语音控制系统,图3为本实施例所述语音控制系统的框架示意图,参阅图3,本实施例所述系统包括:
第一指令获取单元1,用于在第一模式时,获取用户输入的第一语音指令,并根据所述第一语音指令获得第一语音文本;
第一语言处理单元2,用于对所述第一语音文本进行语义信息处理得到第一语料、若干第二语料、以及第一语料与若干第二语料之间的语料关系;
第一提示单元3,用于输出第一提示信息;所述第一提示信息用于提示用户确认所述第一语料、若干第二语料、语料关系是否正确;
更新单元4,用于在输出第一提示信息后,获取用户输入的确认信息,并根据所述确认信息和语料关系将所述语料关系和第一语料存储至本地语料库。
在一具体实施例中,所述更新单元4具体包括:
确认信息获取单元41,用于在输出第一提示信息后,获取用户输入的确认信息;
存储执行单元42,用于当所述确认信息为确认正确时,根据所述语料关系将所述语料关系和第一语料存储至本地语料库;其中,若所述语料关系为执行第一语料所对应的任务等于同时执行至少两个第二语料所对应的至少两个任务,则存储执行单元将所述语料关系和第一语料存储至本地语料库;若所述语料关系为执行第一语料所对应的任务的同时执行至少一个第二语料所对应的至少一个任务,则存储执行单元将所述语料关系存储至本地语料库。
在一具体实施例中,所述系统还包括:
确定单元,用于根据本地语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
显示信息生成单元,用于根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息。
在一具体实施例中,所述系统还包括:
删改信息获取单元,用于获取用户输入的语料修改信息或语料删除信息;
删改处理单元,用于根据所述语料修改信息修改本地语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除本地语料库中的语料和/或语料关系。
在一具体实施例中,参阅图4,所述系统还包括:
第一启动单元5,用于获取第一模式启动信号,并根据所述第一模式启动信号进入第一模式;所述第一模式启动信号为用户通过语音方式输入的第一启动信号或通过物理输入单元输入的第二启动信号;
第二提示单元6,用于输出第二提示信息;所述第二提示信息用于提示用户输入的需要进行自定义的第一语音指令。
在一具体实施例中,参阅图4,所述系统还包括:
第二启动单元7,用于获取第二模式启动信号,并根据所述第二模式启动信号进入第二模式;所述第二模式启动信号为用户通过语音方式输入的第三启动信号或通过物理输入单元输入的第四启动信号;
第二指令获取单元8,用于获取用户输入的第二语音指令,并根据所述第二语音指令获得第二语音文本;
第二语言处理单元9,用于获取本地语料库中与所述第二语音文本对应的目标语料及其对应的语料关系;
任务指令生成单元10,用于根据所述目标语料及其对应的语料关系生成多个任务指令,并将所述多个任务指令分别发送至对应的多个执行单元;所述多个任务指令用于控制多个执行单元分别执行相应的任务。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
需说明的是,本实施例所述系统与前文的实施例所述方法对应,因此,本实施例所述系统未详述部分可以参阅前文的实施例所述方法的内容得到,此处不再赘述。
并且,本实施例所述语音控制系统如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
本发明的又一实施例还提出一种语音控制设备,包括:根据前文的实施例所述的语音控制系统;或者,存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行根据前文的实施例所述语音控制方法的步骤。
当然,所述语音控制设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该语音控制设备还可以包括其他用于实现设备功能的部件,在此不做赘述。
示例性的,所述计算机程序可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述语音控制设备中的执行过程。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述语音控制设备的控制中心,利用各种接口和线路连接整个所述语音控制设备的各个部分。
所述存储器可用于存储所述计算机程序和/或单元,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或单元,以及调用存储在存储器内的数据,实现所述语音控制设备的各种功能。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在本文中提及“在一些实施例中”意味着,结合实施例描述的特定特征或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。
本说明书中使用的“第一”、“第二”等包含序数的术语可用于说明各种构成要素,但是这些构成要素不受这些术语的限定。使用这些术语的目的仅在于将一个构成要素区别于其他构成要素。例如,在不脱离本发明的权利范围的前提下,第一构成要素可被命名为第二构成要素,类似地,第二构成要素也可以被命名为第一构成要素,等等。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (12)

1.一种语音控制方法,其特征在于,包括:
在第一模式时,获取用户输入的第一语音指令,并根据所述第一语音指令获得第一语音文本;
对所述第一语音文本进行语义信息处理得到第一语料、若干第二语料、以及第一语料与若干第二语料之间的语料关系;
输出第一提示信息;所述第一提示信息用于提示用户确认所述第一语料、若干第二语料、语料关系是否正确;
在输出第一提示信息后,获取用户输入的确认信息,并根据所述确认信息和语料关系将所述语料关系和第一语料存储至本地语料库。
2.根据权利要求1所述的语音控制方法,其特征在于,根据所述确认信息和语料关系将所述语料关系和第一语料存储至本地语料库,具体包括:
当所述确认信息为确认正确时,根据所述语料关系将所述语料关系和第一语料存储至本地语料库;
若所述语料关系为执行第一语料所对应的任务等于同时执行至少两个第二语料所对应的至少两个任务,则将所述语料关系和第一语料存储至本地语料库;
若所述语料关系为执行第一语料所对应的任务的同时执行至少一个第二语料所对应的至少一个任务,则将所述语料关系存储至本地语料库。
3.根据权利要求1所述的语音控制方法,其特征在于,所述方法还包括:
根据本地语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息。
4.根据权利要求3所述的语音控制方法,其特征在于,所述方法还包括:
获取用户输入的语料修改信息或语料删除信息;
根据所述语料修改信息修改本地语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除本地语料库中的语料和/或语料关系。
5.根据权利要求1所述的语音控制方法,其特征在于,所述方法还包括:
获取第一模式启动信号,并根据所述第一模式启动信号进入第一模式;所述第一模式启动信号为用户通过语音方式输入的第一启动信号或通过物理输入单元输入的第二启动信号;
输出第二提示信息;所述第二提示信息用于提示用户输入的需要进行自定义的第一语音指令。
6.根据权利要求1-5任一项所述的语音控制方法,其特征在于,所述方法还包括:
获取第二模式启动信号,并根据所述第二模式启动信号进入第二模式;所述第二模式启动信号为用户通过语音方式输入的第三启动信号或通过物理输入单元输入的第四启动信号;
获取用户输入的第二语音指令,并根据所述第二语音指令获得第二语音文本;
获取本地语料库中与所述第二语音文本对应的目标语料及其对应的语料关系;
根据所述目标语料及其对应的语料关系生成多个任务指令,并将所述多个任务指令分别发送至对应的多个执行单元;所述多个任务指令用于控制多个执行单元分别执行相应的任务。
7.一种语音控制系统,其特征在于,包括:
第一指令获取单元,用于在第一模式时,获取用户输入的第一语音指令,并根据所述第一语音指令获得第一语音文本;
第一语言处理单元,用于对所述第一语音文本进行语义信息处理得到第一语料、若干第二语料、以及第一语料与若干第二语料之间的语料关系;
第一提示单元,用于输出第一提示信息;所述第一提示信息用于提示用户确认所述第一语料、若干第二语料、语料关系是否正确;
更新单元,用于在输出第一提示信息后,获取用户输入的确认信息,并根据所述确认信息和语料关系将所述语料关系和第一语料存储至本地语料库。
8.根据权利要求7所述的语音控制系统,其特征在于,所述更新单元具体包括:
确认信息获取单元,用于在输出第一提示信息后,获取用户输入的确认信息;
存储执行单元,用于当所述确认信息为确认正确时,根据所述语料关系将所述语料关系和第一语料存储至本地语料库;其中,若所述语料关系为执行第一语料所对应的任务等于同时执行至少两个第二语料所对应的至少两个任务,则存储执行单元将所述语料关系和第一语料存储至本地语料库;若所述语料关系为执行第一语料所对应的任务的同时执行至少一个第二语料所对应的至少一个任务,则存储执行单元将所述语料关系存储至本地语料库。
9.根据权利要求7所述的语音控制系统,其特征在于,所述系统还包括:
确定单元,用于根据本地语料库的多个语料以及多个语料之间的语料关系确定每一语料所对应的任务;
显示信息生成单元,用于根据所述每一语料所对应的任务生成显示信息,并发送至显示单元;所述显示单元用于显示所述显示信息;
删改信息获取单元,用于获取用户输入的语料修改信息或语料删除信息;
删改处理单元,用于根据所述语料修改信息修改本地语料库中的语料和/或语料关系,或者,根据所述语料删除信息删除本地语料库中的语料和/或语料关系。
10.根据权利要求7所述的语音控制系统,其特征在于,所述系统还包括:
第一启动单元,用于获取第一模式启动信号,并根据所述第一模式启动信号进入第一模式;所述第一模式启动信号为用户通过语音方式输入的第一启动信号或通过物理输入单元输入的第二启动信号;
第二提示单元,用于输出第二提示信息;所述第二提示信息用于提示用户输入的需要进行自定义的第一语音指令。
11.根据权利要求7-10任一项所述的语音控制系统,其特征在于,所述系统还包括:
第二启动单元,用于获取第二模式启动信号,并根据所述第二模式启动信号进入第二模式;所述第二模式启动信号为用户通过语音方式输入的第三启动信号或通过物理输入单元输入的第四启动信号;
第二指令获取单元,用于获取用户输入的第二语音指令,并根据所述第二语音指令获得第二语音文本;
第二语言处理单元,用于获取本地语料库中与所述第二语音文本对应的目标语料及其对应的语料关系;
任务指令生成单元,用于根据所述目标语料及其对应的语料关系生成多个任务指令,并将所述多个任务指令分别发送至对应的多个执行单元;所述多个任务指令用于控制多个执行单元分别执行相应的任务。
12.一种语音控制设备,包括:根据权利要求7-11任一项所述的语音控制系统;或者,存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行根据权利要求1-6任一项所述语音控制方法的步骤。
CN202010073173.1A 2020-01-22 2020-01-22 一种语音控制方法及其系统、语音控制设备 Pending CN113160808A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010073173.1A CN113160808A (zh) 2020-01-22 2020-01-22 一种语音控制方法及其系统、语音控制设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010073173.1A CN113160808A (zh) 2020-01-22 2020-01-22 一种语音控制方法及其系统、语音控制设备

Publications (1)

Publication Number Publication Date
CN113160808A true CN113160808A (zh) 2021-07-23

Family

ID=76881707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010073173.1A Pending CN113160808A (zh) 2020-01-22 2020-01-22 一种语音控制方法及其系统、语音控制设备

Country Status (1)

Country Link
CN (1) CN113160808A (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103475551A (zh) * 2013-09-11 2013-12-25 厦门狄耐克电子科技有限公司 一种基于语音识别的智能家居系统
CN105161099A (zh) * 2015-08-12 2015-12-16 恬家(上海)信息科技有限公司 一种语音控制的遥控装置及其实现方法
CN105882572A (zh) * 2015-02-16 2016-08-24 现代自动车株式会社 车辆及其控制方法
KR20160132748A (ko) * 2015-05-11 2016-11-21 삼성전자주식회사 전자 장치 및 그 제어 방법
CN107490971A (zh) * 2016-06-09 2017-12-19 苹果公司 家庭环境中的智能自动化助理
CN108376544A (zh) * 2018-03-27 2018-08-07 京东方科技集团股份有限公司 一种信息处理方法、装置、设备及计算机可读存储介质
CN108536031A (zh) * 2018-06-12 2018-09-14 上海稼瑞智能科技有限公司 一种智能家居控制系统及其控制方法
US20190087152A1 (en) * 2017-09-19 2019-03-21 Google Inc. Virtual assistant configured to automatically customize groups of actions
CN109584875A (zh) * 2018-12-24 2019-04-05 珠海格力电器股份有限公司 一种语音设备控制方法、装置、存储介质及语音设备
KR20190092332A (ko) * 2019-07-19 2019-08-07 엘지전자 주식회사 스마트 조명 및 이의 동작방법
CN110459222A (zh) * 2019-09-06 2019-11-15 Oppo广东移动通信有限公司 语音控制方法、语音控制装置及终端设备
CN110535737A (zh) * 2019-09-26 2019-12-03 浪潮软件集团有限公司 一种智能家居控制系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103475551A (zh) * 2013-09-11 2013-12-25 厦门狄耐克电子科技有限公司 一种基于语音识别的智能家居系统
CN105882572A (zh) * 2015-02-16 2016-08-24 现代自动车株式会社 车辆及其控制方法
KR20160132748A (ko) * 2015-05-11 2016-11-21 삼성전자주식회사 전자 장치 및 그 제어 방법
CN105161099A (zh) * 2015-08-12 2015-12-16 恬家(上海)信息科技有限公司 一种语音控制的遥控装置及其实现方法
CN107490971A (zh) * 2016-06-09 2017-12-19 苹果公司 家庭环境中的智能自动化助理
US20190087152A1 (en) * 2017-09-19 2019-03-21 Google Inc. Virtual assistant configured to automatically customize groups of actions
CN108376544A (zh) * 2018-03-27 2018-08-07 京东方科技集团股份有限公司 一种信息处理方法、装置、设备及计算机可读存储介质
CN108536031A (zh) * 2018-06-12 2018-09-14 上海稼瑞智能科技有限公司 一种智能家居控制系统及其控制方法
CN109584875A (zh) * 2018-12-24 2019-04-05 珠海格力电器股份有限公司 一种语音设备控制方法、装置、存储介质及语音设备
KR20190092332A (ko) * 2019-07-19 2019-08-07 엘지전자 주식회사 스마트 조명 및 이의 동작방법
CN110459222A (zh) * 2019-09-06 2019-11-15 Oppo广东移动通信有限公司 语音控制方法、语音控制装置及终端设备
CN110535737A (zh) * 2019-09-26 2019-12-03 浪潮软件集团有限公司 一种智能家居控制系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KATTOJU, RK;: "Technological Evaluation of Gesture and Speech Interfaces for Enabling Dismounted Soldier-Robot Dialogue", 《CONFERENCE ON UNMANNED SYSTEMS TECHNOLOGY XVIII 2016 UNMANNED SYSTEMS TECHNOLOGY XVIII 9837》, 31 December 2016 (2016-12-31) *
李彦奇: "基于语音控制的车载娱乐系统的研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, 15 September 2015 (2015-09-15) *

Similar Documents

Publication Publication Date Title
CN108831469B (zh) 语音命令定制方法、装置和设备及计算机存储介质
US20220247701A1 (en) Chat management system
US10503470B2 (en) Method for user training of information dialogue system
US9953648B2 (en) Electronic device and method for controlling the same
TWI511125B (zh) 語音操控方法、行動終端裝置及語音操控系統
US10460024B2 (en) Interactive electronic form workflow assistant that guides interactions with electronic forms in a conversational manner
CN106098063B (zh) 一种语音控制方法、终端设备和服务器
KR102411619B1 (ko) 전자 장치 및 그 제어 방법
WO2017070522A1 (en) Parameter collection and automatic dialog generation in dialog systems
CN108279931A (zh) 场境粘贴目标预测
KR102446961B1 (ko) 원격으로 생성된 자동화된 어시스턴트 콘텐츠를 렌더링할 때 클라이언트 디바이스 지연 완화
CN109428968B (zh) 控制终端的方法、装置及存储介质
KR102076793B1 (ko) 음성을 통한 전자문서 제공 방법, 음성을 통한 전자문서 작성 방법 및 장치
CN110047484A (zh) 一种语音识别交互方法、系统、设备和存储介质
CN110767219A (zh) 语义更新方法、装置、服务器和存储介质
CN113160808A (zh) 一种语音控制方法及其系统、语音控制设备
CN113160807A (zh) 一种语料库更新方法及其系统、语音控制设备
CN110797012A (zh) 一种信息提取方法、设备及存储介质
US20220253596A1 (en) Method for providing electric document using chatbot, apparatus and method for writing electric document using chatbot
CN114144789A (zh) 图形用户界面中的内容的声控输入
CN113241067B (zh) 一种语音交互方法及其系统、语音交互设备
KR102185784B1 (ko) 음향 데이터 탐색 방법 및 장치
CN115440213A (zh) 语音控制方法、装置、设备、车辆及介质
US20140032224A1 (en) Method of controlling electronic apparatus and interactive server
CN117953886A (zh) 场景确定方法、场景确定装置、云平台及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination