CN112435663A - 命令语音管理方法、装置、设备及介质 - Google Patents

命令语音管理方法、装置、设备及介质 Download PDF

Info

Publication number
CN112435663A
CN112435663A CN202011252147.1A CN202011252147A CN112435663A CN 112435663 A CN112435663 A CN 112435663A CN 202011252147 A CN202011252147 A CN 202011252147A CN 112435663 A CN112435663 A CN 112435663A
Authority
CN
China
Prior art keywords
command
voice
user
identifier
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011252147.1A
Other languages
English (en)
Inventor
刘瑞凯
郭云星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Goertek Intelligent Sensor Co Ltd
Original Assignee
Qingdao Goertek Intelligent Sensor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Goertek Intelligent Sensor Co Ltd filed Critical Qingdao Goertek Intelligent Sensor Co Ltd
Priority to CN202011252147.1A priority Critical patent/CN112435663A/zh
Publication of CN112435663A publication Critical patent/CN112435663A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本发明公开了一种命令语音管理方法、装置、设备及存储介质,该方法通过在用户需要自定义设置命令语音时,用户可以向语音控制设备发送命令词设置指令,以使语音控制设备输出待设置命令标识,供用户根据个性化需求选择想要进行设置的目标待命令标识,并在接收到用户输入的自定义语音命令词时,将该自定义语音命令词与目标设置命令标识关联保存,从而实现了用户根据个性化需求进行命令语音的自定义,避免了现有技术中需要开发人员重新进行软件升级才能重新定制命令词的问题,简化了命令语音的修改流程,提升了修改效率,同时降低了语音命令管理的成本。

Description

命令语音管理方法、装置、设备及介质
技术领域
本发明涉及命令语音管理领域,尤其涉及一种命令语音管理方法、装置、设备及存储介质。
背景技术
随着智能家居的不断发展,人们对于语音解放双手的呼声也越来越高,各种语音遥控的方案层出不穷。
但是,现有的语音遥控设备都是提前固化命令词,用户只能根据设备出厂时设定的命令词进行语音控制,如果想要修改成自己想要的个性化命令词,例如,对于用于调大音量的“大声说话”命令词,用户想要使用自己喜欢的口语化、个性化的命令词“大点声”来代替“大声说话”,用户自己无法实现,只能通过开发人员重新进行软件升级以重新定制命令词,周期较长,过程繁琐,且成本高昂。
发明内容
本发明的主要目的在于提供一种命令语音管理方法、装置、设备及存储介质,旨在解决现有语音设备无法根据用户需要自定义命令词的技术问题。
为实现上述目的,本发明提供一种命令语音管理方法,所述命令语音管理方法应用于语音控制设备,所述命令语音管理方法包括以下步骤:
在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识;
根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识;
接收自定义语音命令词,将所述自定义语音命令词与所述目标设置命令标识关联保存。
可选地,所述在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识的步骤之前,还包括:
在检测到预设唤醒词时,控制所述语音控制设备执行唤醒操作,进入唤醒状态;
或者,在检测到所述语音控制设备的预设唤醒按键被按下时,控制所述语音控制设备执行唤醒操作,进入唤醒状态。
可选地,所述在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识的步骤包括:
在获取到包含预设设置命令词的第一语音信息时,控制所述语音控制设备语音输出待设置命令标识;
所述根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识的步骤包括:
检测第二语音信息,将检测到的第二语音信息中的待设置命令标识确定为目标设置命令标识。
可选地,所述在获取到包含预设设置命令词的第一语音信息时,控制所述语音控制设备语音输出待设置命令标识的步骤包括:
在获取到第一语音信息时,提取所述第一语音信息的声音特征;
根据所述声音特征确定输入所述第一语音信息的用户的身份信息;
根据所述身份信息获取对应的待设置命令标识,控制所述语音控制设备语音输出待设置命令标识。
可选地,在所述将所述自定义语音命令词与所述目标设置命令关联保存的步骤之后,还包括:
在检测到包含所述自定义语音命令词的语音信息时,控制所述语音控制设备执行所述目标设置命令。
可选地,所述根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识的步骤之后,还包括:
确定所述语音控制设备在接收到所述选择指令预设时长后是否接收到自定义语音命令词;
若否,则执行步骤:控制所述语音控制设备输出待设置命令标识;
若是,则执行步骤:根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识。
可选地,所述控制所述语音控制设备输出待设置命令标识的步骤之前,还包括:
在获取到第二语音信息时,提取所述第二语音信息的声音特征;
将所述声音特征输入预设语音模型,得到所述第二语音信息对应的命令词;
若所述第二语音信息对应的命令词为预设设置命令词,确定获取到所述命令词设置指令,执行步骤:控制所述语音控制设备输出待设置命令标识。
进一步地,为实现上述目的,本发明还提供一种命令语音管理装置,所述命令语音管理装置包括:
标识输出模块,用于在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识;
标识确定模块,用于根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识;
关联保存模块,用于接收自定义语音命令词,将所述自定义语音命令词与所述目标设置命令标识关联保存。
进一步地,为实现上述目的,本发明还提供一种命令语音管理设备,所述命令语音管理设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的命令语音管理程序,所述命令语音管理程序被所述处理器执行时实现如上述所述的命令语音管理方法的步骤。
进一步地,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有命令语音管理程序,所述命令语音管理程序被处理器执行时实现如上所述的命令语音管理方法的步骤。
本发明通过在用户需要自定义设置命令语音时,用户可以向语音控制设备发送命令词设置指令,以使语音控制设备输出待设置命令标识,供用户根据个性化需求选择想要进行设置的目标待命令标识,并在接收到用户输入的自定义语音命令词时,将该自定义语音命令词与目标设置命令标识关联保存,从而实现了用户根据个性化需求进行命令语音的自定义,避免了现有技术中需要开发人员重新进行软件升级才能重新定制命令词的问题,简化了命令语音的修改流程,提升了修改效率,同时降低了语音命令管理的成本。
附图说明
图1为本发明命令语音管理设备实施例方案涉及的设备硬件运行环境的结构示意图;
图2为本发明命令语音管理方法第一实施例的流程示意图;
图3为本发明命令语音管理装置较佳实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,现有的语音遥控设备都是提前固化命令词,用户只能根据设备出厂时设定的命令词进行语音控制,如果想要修改成自己想要的个性化命令词,例如,对于用于调大音量的“大声说话”命令词,用户想要使用自己喜欢的口语化、个性化的命令词“大点声”来代替“大声说话”,用户自己无法实现,只能通过开发人员重新进行软件升级以重新定制命令词,周期较长,过程繁琐,且成本高昂。
基于上述缺陷,本发明提供一种命令语音管理设备,参照图1,图1为本发明命令语音管理设备实施例方案涉及的设备硬件运行环境的结构示意图。
如图1所示,该命令语音管理设备可以包括:处理器1001,例如CPU,通信总线1002、待分析用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。待分析用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选待分析用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
本领域技术人员可以理解,图1中示出的命令语音管理设备的硬件结构并不构成对命令语音管理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、待分析用户接口模块以及命令语音管理程序。其中,操作系统是管理和控制命令语音管理设备与软件资源的程序,支持网络通信模块、待分析用户接口模块、命令语音管理程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1004;待分析用户接口模块用于管理和控制待分析用户接口1003。
在图1所示的命令语音管理设备硬件结构中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;待分析用户接口1003主要用于连接客户端,与客户端进行数据通信;处理器1001可以调用存储器1005中存储的命令语音管理程序,并执行以下操作:
在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识;
根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识;
接收自定义语音命令词,将所述自定义语音命令词与所述目标设置命令标识关联保存。
进一步地,所述在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识的步骤之前,还包括:
在检测到预设唤醒词时,控制所述语音控制设备执行唤醒操作,进入唤醒状态;
或者,在检测到所述语音控制设备的预设唤醒按键被按下时,控制所述语音控制设备执行唤醒操作,进入唤醒状态。
进一步地,所述在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识的步骤包括:
在获取到包含预设设置命令词的第一语音信息时,控制所述语音控制设备语音输出待设置命令标识;
所述根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识的步骤包括:
检测第二语音信息,将检测到的第二语音信息中的待设置命令标识确定为目标设置命令标识。
进一步地,所述在获取到包含预设设置命令词的第一语音信息时,控制所述语音控制设备语音输出待设置命令标识的步骤包括:
在获取到第一语音信息时,提取所述第一语音信息的声音特征;
根据所述声音特征确定输入所述第一语音信息的用户的身份信息;
根据所述身份信息获取对应的待设置命令标识,控制所述语音控制设备语音输出待设置命令标识。
进一步地,在所述将所述自定义语音命令词与所述目标设置命令关联保存的步骤之后,还包括:
在检测到包含所述自定义语音命令词的语音信息时,控制所述语音控制设备执行所述目标设置命令。
本发明命令语音管理设备的具体实施方式与下述命令语音管理方法各实施例基本相同,在此不再赘述。
本发明还提供一种基于上述命令语音管理设备的命令语音管理方法。
参照图2,图2为本发明命令语音管理方法第一实施例的流程示意图。
本发明实施例提供了命令语音管理方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在命令语音管理方法的各个实施例中,执行主体可以是命令语音管理装置,也可以是语音控制设备本身,还可以是控制器,为便于描述,本实施例以语音控制设备为执行主体进行描述。
所述命令语音管理方法应用于语音控制设备,所述命令语音管理方法包括:
步骤S10,在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识;
现有的语音遥控设备都是提前固化命令词,用户只能根据设备出厂时设定的命令词进行语音控制,如果想要修改成自己想要的个性化命令词,例如,对于用于调大音量的“大声说话”命令词,用户想要使用自己喜欢的口语化、个性化的命令词“大点声”来代替“大声说话”,用户自己无法实现,只能通过开发人员重新进行软件升级以重新定制命令词,周期较长,过程繁琐,且成本高昂。
为解决现有技术中无法根据用户需要自定义命令词的技术问题,在本发明实施例中提出一种命令语音管理方法,旨在通过在用户需要自定义设置命令语音时,用户可以向语音控制设备发送命令词设置指令,以使语音控制设备输出待设置命令标识,供用户根据个性化需求选择想要进行设置的目标待命令标识,并在接收到用户输入的自定义语音命令词时,将该自定义语音命令词与目标设置命令标识关联保存,从而实现了用户根据个性化需求进行命令语音的自定义,避免了现有技术中需要开发人员重新进行软件升级才能重新定制命令词的问题,简化了命令语音的修改流程,提升了修改效率,同时降低了语音命令管理的成本。
本实施例中的命令语音管理方法适用于具有语音控制功能的设备,该设备包括但不限于电视机、电脑、空调、洗衣机等,当然,该设备还可以是具有语音遥控功能的遥控装置,只要支持语音控制的设备都可以应用该命令语音管理方法。
在本实施例中,当用户需要自行设置命令语音时,可以向语音控制设备发送命令词设置指令,语音控制设备在获取到命令词设置指令时,输出带设置命令标识,待设置命令标识指的是该语音控制设备可以被语音触发的命令的标识,命令被触发后,语音控制设备将执行与该命令对应的操作。
可以理解的是,语音控制设备输出待设置命令标识的方式有多种,可以是将待设置命令标识显示在语音控制设备的显示屏幕或者是与语音控制设备关联的显示屏幕上,还可以是通过语音控制设备的麦克风语音输出待设置命令标识的,本实施例不做具体限制。
需要说明的是,在一实施场景中,该命令词设置指令可以是用户通过语音触发的,具体为,语音控制设备采集用户语音输入的语音信息,当该语音信息中包括预设设置命令词时,则触发该命令词设置指令。其中,预设设置命令词是用户根据需要预先设置好的或者设备出厂前预先设置好的,例如,该预设设置命令词可以为“定义命令词”、“设置命令词”或者“管理命令词”等。
在另一实施场景中,该命令词设置指令可以是用户通过语音控制设备的预设按键触发的,该预设按键可以是虚拟按键也可以是实体按键,本实施例不做具体限制。
步骤S20,根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识;
在语音控制设备输出待设置命令标识后,用户即可了解能够进行命令词自定义的命令有哪些,进而选择其想要自定义的命令。在本实施例中,用户输入选择指令的方式可以是在显示有待设置命令标识的显示屏幕上选择想要进行命令词自定义的命令标识,当命令标识被选中时,即触发选择指令,该选择指令包含被选中的命令标识,即目标设置命令标识。
当然,用户输入选择指令的方式还可以是语音输入的,例如,若待设置命令标识包括“唤醒语音”、“调大音量”、“调小音量”、“调高温度”、“调低温度”,用户可以语音输入“调小音量”,则“调小音量”被确定为目标设置命令标识;若用户语音输入“唤醒语音”,则“唤醒语音”被确定为目标设置命令标识。
步骤S30,接收自定义语音命令词,将所述自定义语音命令词与所述目标设置命令标识关联保存。
在确定目标设置命令标识后,用户即可针对该目标设置命令标识语音输入其想要命令词,即自定义语音命令词,在获取到自定义语音命令词后,语音控制设备将该自定义语音命令词与对应的目标设置命令标识关联,以完成对该目标设置命令的语音命令词自定义。
可以理解的是,语音控制设备在接收到用户针对该目标设置命令标识输入的语音信息后,会根据根据该语音信息是否满足设置条件来对用户进行相应的提示,其中,设置条件指的是语音信息中是否包含命令词、命令词是否能够被识别等,例如,若语音控制设备识别到用户输入的语音信息中不包括命令词,则可通过语音或屏幕提示“请输入包含命令词的语音”,以提示用户重新输入语音信息。
进一步地,在步骤S30之后,还可以包括:控制所述语音控制设备输出命令词设置成功的提示。该提示的输出方式可以是语音输出,也可以是显示屏输出。
进一步地,在步骤S30之后,还可以包括:在检测到包含所述自定义语音命令词的语音信息时,控制所述语音控制设备执行所述目标设置命令。即,在完成语音命令词自定义后,语音控制设备若检测到用户输入的包含自定义语音命令词的语音信息,则执行与该自定义语音命令词对应的命令,实现根据用户的自定义语音控制语音控制设备的目的。
本实施例通过在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识;根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识;接收自定义语音命令词,将所述自定义语音命令词与所述目标设置命令标识关联保存。实现了用户根据个性化需求进行命令语音的自定义,避免了现有技术中需要开发人员重新进行软件升级才能重新定制命令词的问题,简化了命令语音的修改流程,提升了修改效率,同时降低了语音命令管理的成本。
进一步地,提出本发明命令语音管理方法第二实施例,上述步骤S10之前,还包括:
步骤a1,在检测到预设唤醒词时,控制所述语音控制设备执行唤醒操作,进入唤醒状态;
或者,步骤a2,在检测到所述语音控制设备的预设唤醒按键被按下时,控制所述语音控制设备执行唤醒操作,进入唤醒状态。
在本实施例中,在对语音控制设备进行命令词自定义之前,首先要唤醒语音控制设备,而唤醒语音控制设备的方式可以是语音唤醒也可以是按键唤醒。语音唤醒具体为,语音控制设备检测用户输入的语音信息,若语音信息中包括预设唤醒词,例如“小王小王”,则控制语音控制设备执行唤醒操作,使上述语音控制设备从待机状态切换为唤醒状态,当语音控制设备处于唤醒状态时,可以与用户进行除唤醒以外的交互动作。
按键唤醒具体为,检测语音控制设备的预设唤醒按键被按下,则控制语音控制设备执行唤醒操作。其中,该预设唤醒按键可以是语音控制设备的任意按键,也可以是用户预先设置的指定按键,本实施例不做具体限制。
在本实施例通过在正式对语音控制设备进行命令词自定义前,唤醒语音控制设备,能够保证命令词自定义过程的有效性。
进一步地,上述步骤S10包括:
步骤b1,在获取到包含预设设置命令词的第一语音信息时,控制所述语音控制设备语音输出待设置命令标识。
在本实施例中,命令词设置指令是用户通过语音触发的,具体地,语音控制设备采集用户语音输入的语音信息,确定该语音信息是否包括预设设置命令词,若是,则语音控制设备语音输出待设置命令标识。
进一步地,上述步骤S20包括:
步骤c1,检测第二语音信息,将检测到的第二语音信息中的待设置命令标识确定为目标设置命令标识
在本实施例中,用户输入选择指令的方式可以是语音输入的,具体地,语音控制设备采集用户语音输入的语音信息,确定该语音信息是否包括待设置命令标识,若是,则将该语音信息中的待设置命令标识确定为目标设置命令标识。
进一步地,上述步骤b1包括:
步骤b11,在获取到第一语音信息时,提取所述第一语音信息的声音特征;
步骤b12,根据所述声音特征确定输入所述第一语音信息的用户的身份信息;
步骤b13,根据所述身份信息获取对应的待设置命令标识,控制所述语音控制设备语音输出待设置命令标识。
在本实施例中,语音控制设备在采集到用户语音输入的语音信息时,会提取该语音信息中的声音特征,由于不同用户的声音特征也不同,因此可以根据该声音特征确定触发该次命令词设置指令的用户的身份信息,管理人员预先为不同身份的用户设置了其可以进行自定义语音的待设置命令标识的权限,即不同权限的用户能够进行自定义的待设置命令标识也不同。
其中,声音特征包括但不限于音调、音色和响度中的一种或多种。
再根据用户的身份信息获取与该身份信息对应的待设置命令标识,控制语音控制设备语音输出待设置命令标识,以供该用户进行设置。
本实施例这种根据用户身份来确定待设置命令标识的方式,能够防止陌生用户或者小孩随意修改语音命令词,影响用户的正常使用。
进一步地,上述步骤S20之后,还包括:
步骤d1,确定所述语音控制设备在接收到所述选择指令预设时长后是否接收到自定义语音命令词;
若否,则执行步骤:控制所述语音控制设备输出待设置命令标识;
若是,则执行步骤:根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识。
在本实施例中,在根据用户输入的选择指令确定目标设置命令标识之后,若自语音控制设备在接收到选择指令预设时长,都未接收到用户语音输入的自定义语音命令词,则控制语音控制设备再次输出待设置命令标识,以供用户选择,并起到提示用户的作用。
进一步地,若再次输入待设置命令标识预设时长后,仍未接收到自定义语音命令词,则可退出当前的命令词设置模式,进入待机模式,从而避免用户长时间不与语音控制设备进行交互,而语音控制设备进行盲目等待造成的电量浪费。
若自语音控制设备在接收到选择指令预设时长,接收到自定义语音命令词,则控制语音控制设备根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识。
进一步地,上述步骤S10之前,还包括:
步骤e1,在获取到第二语音信息时,提取所述第二语音信息的声音特征;
步骤e2,将所述声音特征输入预设语音模型,得到所述第二语音信息对应的命令词;
若所述第二语音信息对应的命令词为预设设置命令词,确定获取到所述命令词设置指令,执行步骤:控制所述语音控制设备输出待设置命令标识。
在本实施例中,语音控制设备在获取到用户输入的语音信息时,提取该语音信息中的声音特征,将该声音特征输入预设语音模型进行识别,以得到与该语音信息对应的命令词,确定该命令词是否为预设设置命令词,若是,则执行步骤:控制所述语音控制设备输出待设置命令标识。
其中,预设语音模型可以为深度神经网络模型,该模型是预先根据大量的训练样本训练得到的,当然,在用户使用过程中,该模型能够不断进行自学习,完善识别效果。
本发明还提供一种命令语音管理装置。
参照图3,图3为本发明命令语音管理装置第一实施例的功能模块示意图。所述命令语音管理装置包括:
标识输出模块10,用于在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识;
标识确定模块20,用于根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识;
关联保存模块30,用于接收自定义语音命令词,将所述自定义语音命令词与所述目标设置命令标识关联保存。
此外,本发明实施例还提出一种存储介质。
存储介质上存储有命令语音管理程序,命令语音管理程序被处理器执行时实现如上所述的命令语音管理方法的步骤。
本发明存储介质具体实施方式与上述命令语音管理方法各实施例基本相同,在此不再赘述。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本发明的保护之内。

Claims (10)

1.一种命令语音管理方法,其特征在于,所述命令语音管理方法应用于语音控制设备,所述命令语音管理方法包括以下步骤:
在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识;
根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识;
接收自定义语音命令词,将所述自定义语音命令词与所述目标设置命令标识关联保存。
2.如权利要求1所述的命令语音管理方法,其特征在于,所述在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识的步骤之前,还包括:
在检测到预设唤醒词时,控制所述语音控制设备执行唤醒操作,进入唤醒状态;
或者,在检测到所述语音控制设备的预设唤醒按键被按下时,控制所述语音控制设备执行唤醒操作,进入唤醒状态。
3.如权利要求1所述的命令语音管理方法,其特征在于,所述在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识的步骤包括:
在获取到包含预设设置命令词的第一语音信息时,控制所述语音控制设备语音输出待设置命令标识;
所述根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识的步骤包括:
检测第二语音信息,将检测到的第二语音信息中的待设置命令标识确定为目标设置命令标识。
4.如权利要求3所述的命令语音管理方法,其特征在于,所述在获取到包含预设设置命令词的第一语音信息时,控制所述语音控制设备语音输出待设置命令标识的步骤包括:
在获取到第一语音信息时,提取所述第一语音信息的声音特征;
根据所述声音特征确定输入所述第一语音信息的用户的身份信息;
根据所述身份信息获取对应的待设置命令标识,控制所述语音控制设备语音输出待设置命令标识。
5.如权利要求1所述的命令语音管理方法,其特征在于,在所述将所述自定义语音命令词与所述目标设置命令关联保存的步骤之后,还包括:
在检测到包含所述自定义语音命令词的语音信息时,控制所述语音控制设备执行所述目标设置命令。
6.如权利要求1所述的命令语音管理方法,其特征在于,所述根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识的步骤之后,还包括:
确定所述语音控制设备在接收到所述选择指令预设时长后是否接收到自定义语音命令词;
若否,则执行步骤:控制所述语音控制设备输出待设置命令标识;
若是,则执行步骤:根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识。
7.如权利要求1至6任一项所述的命令语音管理方法,其特征在于,所述控制所述语音控制设备输出待设置命令标识的步骤之前,还包括:
在获取到第二语音信息时,提取所述第二语音信息的声音特征;
将所述声音特征输入预设语音模型,得到所述第二语音信息对应的命令词;
若所述第二语音信息对应的命令词为预设设置命令词,确定获取到所述命令词设置指令,执行步骤:控制所述语音控制设备输出待设置命令标识。
8.一种命令语音管理装置,其特征在于,所述命令语音管理装置包括:
标识输出模块,用于在获取到命令词设置指令时,控制所述语音控制设备输出待设置命令标识;
标识确定模块,用于根据用户输入的选择指令在所述待设置命令标识中确定目标设置命令标识;
关联保存模块,用于接收自定义语音命令词,将所述自定义语音命令词与所述目标设置命令标识关联保存。
9.一种命令语音管理设备,其特征在于,所述命令语音管理设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的命令语音管理程序,所述命令语音管理程序被所述处理器执行时实现如权利要求1-7中任一项所述的命令语音管理方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有命令语音管理程序,所述命令语音管理程序被处理器执行时实现如权利要求1-7中任一项所述的命令语音管理方法的步骤。
CN202011252147.1A 2020-11-11 2020-11-11 命令语音管理方法、装置、设备及介质 Pending CN112435663A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011252147.1A CN112435663A (zh) 2020-11-11 2020-11-11 命令语音管理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011252147.1A CN112435663A (zh) 2020-11-11 2020-11-11 命令语音管理方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN112435663A true CN112435663A (zh) 2021-03-02

Family

ID=74701251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011252147.1A Pending CN112435663A (zh) 2020-11-11 2020-11-11 命令语音管理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112435663A (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2127520A1 (en) * 1994-07-06 1996-01-07 Gordon J. Reesor Signal Processing Circuit
CA2308913A1 (en) * 1999-05-21 2000-11-21 Information Storage Devices, Inc. Method and apparatus for standard voice user interface and voice controlled devices
JPWO2009019768A1 (ja) * 2007-08-08 2010-10-28 パイオニア株式会社 音声入力型装置、音声入力制御方法及び音声入力制御プログラム
CN202413790U (zh) * 2011-12-15 2012-09-05 浙江吉利汽车研究院有限公司 一种汽车自适应性语音提示系统
CN102705880A (zh) * 2012-06-06 2012-10-03 广东美的微波电器制造有限公司 带语音录制模式的微波炉及其控制方法
CN103198831A (zh) * 2013-04-10 2013-07-10 威盛电子股份有限公司 语音操控方法与移动终端装置
CN103838504A (zh) * 2012-11-27 2014-06-04 英业达科技有限公司 备忘信息输入与提示系统及其方法
CN108172228A (zh) * 2018-01-25 2018-06-15 深圳阿凡达智控有限公司 语音命令词更换方法、装置、声控设备及计算机存储介质
CN108632653A (zh) * 2018-05-30 2018-10-09 腾讯科技(深圳)有限公司 语音管控方法、智能电视及计算机可读存储介质
CN108731183A (zh) * 2018-05-31 2018-11-02 奥克斯空调股份有限公司 一种智能空调系统及空调
US20190027138A1 (en) * 2017-07-24 2019-01-24 Midea Group Co., Ltd. Customizable Wake-up Voice Commands
KR20190094301A (ko) * 2019-03-27 2019-08-13 엘지전자 주식회사 인공 지능 기기 및 인공 지능 기기의 동작 방법
CN110931005A (zh) * 2019-11-20 2020-03-27 珠海格力电器股份有限公司 电器设备的语音自定义方法、装置、存储介质及电器设备
CN111128177A (zh) * 2020-03-10 2020-05-08 科通工业技术(深圳)有限公司 一种语音控制命令词动态加载系统及方法
CN111405105A (zh) * 2020-03-20 2020-07-10 深圳市未艾智能有限公司 用于控制蓝牙耳机的方法和装置、蓝牙耳机及存储介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2127520A1 (en) * 1994-07-06 1996-01-07 Gordon J. Reesor Signal Processing Circuit
CA2308913A1 (en) * 1999-05-21 2000-11-21 Information Storage Devices, Inc. Method and apparatus for standard voice user interface and voice controlled devices
JPWO2009019768A1 (ja) * 2007-08-08 2010-10-28 パイオニア株式会社 音声入力型装置、音声入力制御方法及び音声入力制御プログラム
CN202413790U (zh) * 2011-12-15 2012-09-05 浙江吉利汽车研究院有限公司 一种汽车自适应性语音提示系统
CN102705880A (zh) * 2012-06-06 2012-10-03 广东美的微波电器制造有限公司 带语音录制模式的微波炉及其控制方法
CN103838504A (zh) * 2012-11-27 2014-06-04 英业达科技有限公司 备忘信息输入与提示系统及其方法
CN103198831A (zh) * 2013-04-10 2013-07-10 威盛电子股份有限公司 语音操控方法与移动终端装置
US20190027138A1 (en) * 2017-07-24 2019-01-24 Midea Group Co., Ltd. Customizable Wake-up Voice Commands
CN108172228A (zh) * 2018-01-25 2018-06-15 深圳阿凡达智控有限公司 语音命令词更换方法、装置、声控设备及计算机存储介质
CN108632653A (zh) * 2018-05-30 2018-10-09 腾讯科技(深圳)有限公司 语音管控方法、智能电视及计算机可读存储介质
CN108731183A (zh) * 2018-05-31 2018-11-02 奥克斯空调股份有限公司 一种智能空调系统及空调
KR20190094301A (ko) * 2019-03-27 2019-08-13 엘지전자 주식회사 인공 지능 기기 및 인공 지능 기기의 동작 방법
CN110931005A (zh) * 2019-11-20 2020-03-27 珠海格力电器股份有限公司 电器设备的语音自定义方法、装置、存储介质及电器设备
CN111128177A (zh) * 2020-03-10 2020-05-08 科通工业技术(深圳)有限公司 一种语音控制命令词动态加载系统及方法
CN111405105A (zh) * 2020-03-20 2020-07-10 深圳市未艾智能有限公司 用于控制蓝牙耳机的方法和装置、蓝牙耳机及存储介质

Similar Documents

Publication Publication Date Title
CN108831469B (zh) 语音命令定制方法、装置和设备及计算机存储介质
JP7297836B2 (ja) アシスタントアプリケーションのための音声ユーザインタフェースショートカット
RU2627117C2 (ru) Электронное устройство, сервер и способ управления такими устройствами
CN109618202B (zh) 控制外设的方法、电视及可读存储介质
CN107199971B (zh) 车载语音交互方法、终端及计算机可读存储介质
CN110767220A (zh) 一种智能语音助手的交互方法、装置、设备及存储介质
CN107909998B (zh) 语音指令处理方法、装置、计算机设备和存储介质
KR102411619B1 (ko) 전자 장치 및 그 제어 방법
CN108172223A (zh) 语音指令识别方法、装置及服务器和计算机可读存储介质
CN108632653B (zh) 语音管控方法、智能电视及计算机可读存储介质
CN110992937B (zh) 语言离线识别方法、终端及可读存储介质
CN110751948A (zh) 一种语音识别方法、装置、存储介质及语音设备
CN110851221A (zh) 一种智慧家居场景配置的方法及装置
EP3714355B1 (en) Expanding physical motion gesture lexicon for an automated assistant
CN112399222A (zh) 智能电视的语音指令学习方法、装置、智能电视及介质
CN113672748A (zh) 多媒体信息播放方法及装置
CN111933135A (zh) 终端控制方法、装置、智能终端及计算机可读存储介质
CN111048083A (zh) 一种语音控制方法、装置及存储介质
CN110099295A (zh) 电视机语音控制方法、装置、设备及存储介质
CN113596529A (zh) 一种终端控制方法、装置、计算机设备和存储介质
CN105843642A (zh) 终端的升级方法、终端升级控制方法、终端及服务器
CN112435663A (zh) 命令语音管理方法、装置、设备及介质
WO2023024455A1 (zh) 语音交互方法及电子设备
CN108632069B (zh) 一种客户端配置方法、系统及相关设备
CN113270096A (zh) 语音响应方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210302

RJ01 Rejection of invention patent application after publication