CN109920419A - 语音控制方法和装置、电子设备及计算机可读介质 - Google Patents

语音控制方法和装置、电子设备及计算机可读介质 Download PDF

Info

Publication number
CN109920419A
CN109920419A CN201910164550.XA CN201910164550A CN109920419A CN 109920419 A CN109920419 A CN 109920419A CN 201910164550 A CN201910164550 A CN 201910164550A CN 109920419 A CN109920419 A CN 109920419A
Authority
CN
China
Prior art keywords
voice signal
speech processing
processing end
remote speech
intelligent appliance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910164550.XA
Other languages
English (en)
Other versions
CN109920419B (zh
Inventor
耿雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910164550.XA priority Critical patent/CN109920419B/zh
Publication of CN109920419A publication Critical patent/CN109920419A/zh
Application granted granted Critical
Publication of CN109920419B publication Critical patent/CN109920419B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本申请实施例公开了语音控制方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号;响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将语音信号发送至远程语音处理端进行识别,其中,远程语音处理端识别出语音信号所指示的对智能家电设备的目标控制操作;接收远程语音处理端的识别结果,根据识别结果生成对智能家电设备执行目标控制操作的操作指令。该实施方式实现了智能家电设备的语音控制,提供了更灵活、更便捷的智能家电控制方式。

Description

语音控制方法和装置、电子设备及计算机可读介质
技术领域
本申请实施例涉及计算机技术领域,具体涉及语音技术领域,尤其涉及语音控制方法和装置、电子设备及计算机可读介质。
背景技术
智能家居是基于网络通信、音视频处理和自动控制等技术家庭事务处理模式。智能家居为人们的生活提供了很多的便利。
目前的智能家居技术中,很多设备的智能化控制主要是基于操作面板或红外遥控器的操作控制,需要用户根据需求触控相应的按钮。例如,卫浴设备一般只能通过操作面板和遥控器来实现操控。在一些场景中,例如淋浴时,用户不方便对操作面板或遥控器进行操作。并且,操作面板和遥控器对于特定年龄段的用户(例如老人和小孩)来说具有较高的门槛,不易操作。
发明内容
本申请实施例提出了语音控制方法、装置、电子设备和计算机可读介质。
第一方面,本公开的实施例提供了一种语音控制方法,包括:对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号;响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将语音信号发送至远程语音处理端进行识别,其中,远程语音处理端识别出语音信号所指示的对智能家电设备的目标控制操作;接收远程语音处理端的识别结果,根据识别结果生成对智能家电设备执行目标控制操作的操作指令。
在一些实施例中,上述方法还包括:响应于确定与远程语音处理端的通信状态不满足预设的远程通信需求,对语音信号进行本地识别以识别出语音信号所指示的对智能家电设备的目标控制操作;生成执行目标控制操作的操作指令。
在一些实施例中,上述对语音信号进行本地识别以识别出语音信号所指示的对智能家电设备的目标控制操作,包括:基于预设的操作指令关键词库识别语音信号所指示的目标控制操作。
在一些实施例中,上述对获取到的声音信号进行预处理,包括:对声音信号进行回声消除处理;对消除回声后的声音信号进行去混响处理。
在一些实施例中,上述目标控制操作包括唤醒操作。
在一些实施例中,上述对获取到的声音信号进行预处理,还包括:对去混响后的声音信号进行音频幅度范围的调整和信号放大,得到表征用户发出的声音的语音信号。
第二方面,本公开的实施例提供了一种语音控制装置,包括:预处理单元,被配置为对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号;发送单元,被配置为响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将语音信号发送至远程语音处理端进行识别,其中,远程语音处理端识别出语音信号所指示的对智能家电设备的目标控制操作;接收单元,被配置为接收远程语音处理端的识别结果,根据识别结果生成对智能家电设备执行目标控制操作的操作指令。
在一些实施例中,上述装置还包括:识别单元,被配置为响应于确定与远程语音处理端的通信状态不满足预设的远程通信需求,对语音信号进行本地识别以识别出语音信号所指示的对智能家电设备的目标控制操作;生成单元,被配置为生成执行目标控制操作的操作指令。
在一些实施例中,上述识别单元被配置为按照如下方式对语音信号进行本地识别:基于预设的操作指令关键词库识别语音信号所指示的目标控制操作。
在一些实施例中,上述预处理单元被配置为按照如下方式对获取到的声音信号进行预处理:对声音信号进行回声消除处理;对消除回声后的声音信号进行去混响处理。
在一些实施例中,上述目标控制操作包括唤醒操作。
在一些实施例中,上述预处理单元还被配置为按照如下方式对获取到的声音信号进行预处理:对去混响后的声音信号进行音频幅度范围的调整和信号放大,得到表征用户发出的声音的语音信号。
第三方面,本公开的实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面提供的语音控制方法。
在一些实施例中,上述电子设备还包括:声音采集装置,用于获取声音信号;声音采集装置包括防水的麦克风。
第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现第一方面提供的语音控制方法。
本申请上述实施例的语音控制方法和装置、电子设备及计算机可读介质,通过对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号;响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将语音信号发送至远程语音处理端进行识别,其中,远程语音处理端识别出语音信号所指示的对智能家电设备的目标控制操作;接收远程语音处理端的识别结果,根据识别结果生成对智能家电设备执行目标控制操作的操作指令,实现了智能家电设备的语音控制,提供了更灵活、更便捷的智能家电控制方式。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的语音控制方法的一个实施例的流程图;
图3是图2所示实施例的一个应用场景的示意图;
图4是根据本申请的语音控制方法的另一个实施例的流程图;
图5是本申请的语音控制装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的语音控制方法或语音控制装置的示例性系统架构。
如图1所示,系统架构100中可以包括智能家电设备101、102,网络103和服务器104。网络103用以在智能家电设备101、102和服务器104之间提供通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
智能家电设备101、102可以是具有智慧化服务功能的家用电器。智能家电101、102可以设有传感器以感知家居环境和用户指令,还可以设有数据处理部件(例如微处理芯片)来处理感知到的数据。智能家电可例如是智能洗衣机、智能热水器、智能马桶、智能电视、智能音箱,等等。
在本申请实施例的一些应用场景中,用户110可以向智能家电设备101、102发出语音指令。智能家电设备101、102上可以设有声音传感器(例如麦克风或麦克风阵列),用于感知环境中的声音,并从中提取出用户的语音指令。
在本申请实施例的另一些应用场景中,智能家电设备101、102之间可以互相通信连接,智能家电设备101(例如智能洗衣机)可以获取设有声学传感器的智能家电设备102(例如智能音箱)感知到的声音数据。
服务器104可以是为智能家电设备提供后台服务的服务器,例如可以是提供语音识别服务的服务器。服务器104可以接收智能家电设备101、102发送的语音信号,对语音信号进行解码,识别出用户的语音指令,并将识别结果反馈至智能家电设备101、102。智能家电设备101、102在接收到识别结果后可以生成相应的指令,并执行相应的操作。
需要说明的是,服务器104可以是硬件,也可以是软件。当服务器104为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器104为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本申请实施例所提供的语音控制方法可以由智能家电设备101、102执行,相应地,语音控制装置可以设置于智能家电设备101、102中。
应该理解,图1中的智能家电设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的智能家电设备、网络和服务器。
继续参考图2,其示出了根据本申请的语音控制方法的一个实施例的流程200。该语音控制方法,包括以下步骤:
步骤201,对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号。
在本实施例中,语音控制方法的执行主体可以获取其所在家居环境中的声音信号。具体可以通过设置于该执行主体上的声学传感器获取声音信号,或者可以与其他具有声学传感器的智能设备连接来或其具有声学传感器的智能设备采集的声音信号。
在实践中,上述执行主体获取到的声音信号可以是家居环境中的声音信号。该声音信号可以是包含声学传感器的硬件模块远场拾音得到的信号,其中可能包含用户的语音信号和家居环境中的声学干扰信号。例如,获取的声学信号可以包含设备工作时震动的声音、淋浴时产生的混响音、墙壁反射造成的回声,等等。
可以对上述获取的声音信号进行预处理,提取出其中表征用户声音的语音信号。
通常,用户的语音信号与环境干扰音信号的频段不同,可以根据声音信号的频率分布特征区分语音信号和干扰音信号。
在一些实施例中,可以采用机器学习的方法提取出声音信号中表征用户声音的语音信号。例如可以将声音信号输入已训练的语音信号提取模型中,得到语音信号的提取结果。其中,已训练的语音信号提取模型可以基于训练样本训练得出,训练样本可以包括由用户语音和环境噪音合成的样本声音信号。
在一些实施例中,可以采用如下方式对获取到的声音信号进行预处理:对声音信号进行回声消除处理,对消除回声后的声音信号进行去混响处理。
可以采用多种算法进行回声消除处理,例如可以采用AEC(acoustic echocancellation,声学回声消除)算法按照如下方式去除回声:建立远端信号的语音模型,利用该语音模型对回声进行估计,不断迭代调整滤波器的系数,使得基于远端语音模型的回声估计值不断逼近真实的回声,之后将回声从声音信号中去除。
可以采用多种算法进行去混响处理。例如可以采用基于复倒谱域的滤波算法进行去混响。语音信号的复倒谱通常分布在靠近原点的附近,而混响的身声音信号的复倒谱主要分布在远离原点的地方。可以采用低通滤波器的滤除混响部分,再通过逆向操作,获得去混响的声音信号。或者可以采用基于概率模型类的算法,假定混响语音信号为房间传递函数和语音信号的自回归或者卷积传递函数模型,对语音信号建立零均值、时变方差的高斯分布,实现对去混响的语音信号的建模,利用最大似然等方法求解模型中的所有参数,以实现去混响得到语音信号。
上述回声消除处理和去混响处理还可以采用已有的各种算法,本申请对此不作限定。
通过对声音信号进行回声消除处理和去混响处理,能够有效消除声音信号中由于房间墙壁反射和环境噪声形成的回声和混响的干扰,更适用于智能家居场景。
在进一步的可选实现方式中,可以按照如下方式执行声音信号的预处理:首先采用回声消除算法消除回声,然后进行线性处理,之后利用波束成形算法对经过回声消除后的声音信号进行调整,之后进行去混响处理,对去混响后的声音信号进行非线性处理。其中非线性处理可以是根据输入输出信号的特性对比对声音信号进行一些强度和频率调整。
可选地,对获取到的声音信号进行预处理,还可以包括:对去混响后的声音信号进行音频幅度范围的调整和信号放大,得到表征用户发出的声音的语音信号。
其中,音频幅度范围的调整可以是对音频信号强度的均一化、局部放大、局部缩小等方式的调整,能够使声音信号的强度更符合语音识别的需求。信号放大则可以增强声音信号。由于在回声消除和去混响之后对信号进行放大,可以避免将干扰音放大,仅对用户的语音信号进行增强。
步骤202,响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将语音信号发送至远程语音处理端进行识别。
其中,远程语音处理端识别出语音信号所指示的对智能家电设备的目标控制操作。
在本实施例中,可以判断与远程语音处理端的通信状态是否满足预设的远程通信需求。其中远程语音处理端可以是与上述执行主体远程连接的用于执行语音信号处理的其他电子设备,例如语音服务器,或者内置语音处理芯片的终端。上述执行主体可以判断其所接入的网络的信号强度是否达到预设的与远程语音处理端稳定连接的强度需求,其中所接入的网络的信号强度可以是wifi(无线网络)信号强度。若上述执行主体所接入的网络的信号强度达到预设的与远程语音处理端稳定连接的强度需求,则确定其与远程语音处理端的通信状态满足预设的远程通信需求。或者还可以判断远程语音处理端当前的网络通信状态是否良好,是否可以正常提供语音信号处理服务。若远程语音处理端当前的网络通信状态良好,可以正常提供语音信号处理服务,则确定上述执行主体与远程语音处理端的通信状态满足预设的远程通信需求。
在上述执行主体与远程语音处理端的通信状态满足预设的远程通信需求时,可以将步骤201提取出的语音信号发送至远程语音处理端进行语音识别。远程语音处理端可以采用基于概率模型、基于语音识别模型等的识别算法执行语音识别操作,识别出上述执行主体发送的语音信号所指示的对智能家电设备的目标控制操作。
在智能家居场景中,用户发出的语音指令通常会指示对智能家电设备执行特定的操作。例如,用户可以对淋浴热水器发出“水温调高点”的语音指令。上述远程语音处理端可以基于常用的智能家电控制指令生成语音指令模板,将步骤201提取出的语音信号与语音指令模板进行匹配,根据匹配结果确定用户指示执行的操作。上述远程语音处理端也可以采用基于已标注对应的文本的自然语音信号训练得出的语音识别模型对用户的语音信号进行整句识别,同时判断用户的操控意图以确定所指示的目标控制操作。
可选地,在执行语音识别时,还可以根据用户的语音信号和各智能家电设备的操作能力确定操控的目标智能家电设备。例如识别出目标控制操作为调节水温时,热水器具有调节水温的能力,电视机则不具有调节水温的能力,则可以确定用户期望操控的目标智能家电设备为热水器。
可选地,步骤201中的预处理包括对上述目标控制操作可以包括唤醒操作。唤醒操作用于唤醒上述智能家电设备的语音操控功能。在唤醒后,智能家电设备可以对用户的语音信号进行响应,执行由用户的语音信号识别出的执行目标操作控制的操作指令。若智能家电设备当前处于未唤醒状态,则可以在对获取到的声音信号预处理时首先进行回声消除处理,然后对消除回声后的声音信号进行去混响处理。在步骤202中可以将去混响后的声音信号发送至远程语音处理端进行语音识别以识别出语音信号所指示的唤醒操作。
在根据语音指令控制智能家电设备执行功能操作之前,进行唤醒识别,可以避免误识别和误操作,提升语音控制方式的可靠性。
步骤203,接收远程语音处理端的识别结果,根据识别结果生成对智能家电设备执行目标控制操作的操作指令。
在本实施例中,上述执行主体可以接收上述远程语音处理端的语音识别结果,该识别结果包含语音信号所指示的对智能家电设备的目标控制操作。可以生成执行语音信号所指示的对智能家电设备的目标控制操作的操作指令。之后,可以执行该操作指令。这样,就实现了通过语音的智能家电控制。
请参考图3,其示出了图2所示实施例的一个应用场景的示意图。如图3所示,用户A可以对正在洗衣服的洗衣机W发出“洗完衣服以后烘干”的语音指令。洗衣机W可以内置主控芯片C和麦克风M,主控芯片C获取到由用户的语音指令对应的语音信号叠加洗衣机震动带来的噪声后生成的声音信号。之后主控芯片C可以对声音信号进行预处理,提取出用户的语音指令对应的语音信号,并检测wifi信号强度,若wifi信号强度大于阈值,将语音信号发送至服务器S进行识别。服务器S将识别结果“洗衣程序之后执行烘干操作”发送至洗衣机W的主控芯片C,洗衣机的主控芯片C生成执行对应的“洗衣程序之后执行烘干操作”的指令。
本申请上述实施例的语音控制方法,通过对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号;响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将语音信号发送至远程语音处理端进行识别,其中,远程语音处理端识别出语音信号所指示的对智能家电设备的目标控制操作;接收远程语音处理端的识别结果,根据识别结果生成对智能家电设备执行目标控制操作的操作指令,实现了智能家电设备的语音控制,提供了更灵活、更便捷的智能家电控制方式。
并且,在语音识别之前,通过预判与远程语音处理端的通信状态是否满足预设的远程通信需求,在满足预设的远程通信需求时才将语音信号发送至远程语音处理端进行识别,能够避免网络信号中断等通信状态不良时无法成功发送语音信号造成的响应延时。
继续参考图4,其示出了根据本申请的语音控制方法的另一个实施例的流程图。如图4所示,本实施例的语音控制方法的流程400,包括以下步骤:
步骤401,对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号。
在本实施例中,语音控制方法的执行主体可以获取其所在家居环境中的声音信号。具体可以通过设置于该执行主体上的声学传感器获取声音信号,或者可以与其他具有声学传感器的智能设备连接来或其具有声学传感器的智能设备采集的声音信号。然后,对采集的声音信号进行噪声抑制、回声消除、去混响等预处理,以提取出其中表征用户发出的声音的语音信号。
步骤402,响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将语音信号发送至远程语音处理端进行识别。
其中,远程语音处理端识别出语音信号所指示的对智能家电设备的目标控制操作。
在本实施例中,可以判断与远程语音处理端的通信状态是否满足预设的远程通信需求。其中远程语音处理端可以是与上述执行主体远程连接的用于执行语音信号处理的其他电子设备。如果满足,则将语音信号发送至远程语音处理端进行识别。
步骤403,接收远程语音处理端的识别结果,根据识别结果生成对智能家电设备执行目标控制操作的操作指令。
若步骤402中确定与远程语音处理端的通信状态满足预设的远程通信需求,远程语音处理端可以生成语音信号的识别结果。上述执行主体可以接收识别结果并生成相应的对智能家电设备执行目标操作控制的指令。
本实施例的步骤401、步骤402、步骤403分别与前述实施例的步骤201、步骤202、步骤203一致,步骤401、步骤402、步骤403的具体实施方式可以分别参考前述实施例中步骤201、步骤202、步骤203的描述,此处不再赘述。
步骤404,响应于确定与远程语音处理端的通信状态不满足预设的远程通信需求,对语音信号进行本地识别以识别出语音信号所指示的对智能家电设备的目标控制操作。
上述执行主体与远程语音处理端的通信状态不满足预设的远程通信需求可以包括以下至少一项:上述执行主体所接入的网络的信号强度未达到预设的与远程语音处理端稳定连接的强度需求,远程语音处理端的网络连接处于中断状态,远程处理端故障,等等。
如果确定上述执行主体与远程语音处理端的通信状态不满足预设的远程通信需求,即远程通信端无法实时地处理语音信号返回识别结果,则可以在本次对语音信号进行识别。可选地,上述执行主体本地可以对语音信号进行解析,采用概率估计方式确定语音信号中各帧对应的音素状态,然后基于语言模型进行语音到文本的转换,得到识别结果。可选地,上述执行主体本地也可以运行基于深度学习方式训练得到的语音识别模型,利用语音识别模型来进行语音识别。
可选地,上述对语音信号进行本地识别以识别出语音信号所指示的对智能家电设备的目标控制操作,可以包括:基于预设的操作指令关键词库识别语音信号所指示的目标控制操作。即上述执行主体本地可以存储有预设的操作指令关键词库,该操作指令关键词库包含了指示对智能家电设备的执行各项预设操作控制的关键词。以智能家电设备为智能电视为例,该预设的操作指令关键词库包括:音量调大、音量调小、静音、下一集、暂停、搜索、快进、返回上一级、全屏,等等。在本地识别时,可以利用语音识别得到的文本与预设的操作指令关键词库中的关键词进行精确匹配或模糊匹配,根据匹配结果确定语音信号所指示的目标控制操作。
步骤405,生成执行目标控制操作的操作指令。
在本地识别出语音信号所指示的对智能家电设备的目标控制操作之后,上述执行主体可以生成执行该目标控制操作的操作指令。之后,可以执行该操作指令。
本实施例的语音控制方法,通过在确定与远程语音处理端的通信状态不满足预设的远程通信需求,对语音信号进行本地识别以识别出语音信号所指示执行的目标控制操作,能够进一步在网络通信状态不良的情况下实现本地的语音识别,有利于保证用户的语音信号在各种场景下得到实时的反馈。该方法可以应用在卫生间、厨房等建筑墙体对网络信号屏蔽作用明显的场景中,拓展了智能家居的应用范围。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种语音控制装置的一个实施例,该装置实施例与图2和图4所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的语音控制装置500包括:预处理单元501、发送单元502以及接收单元503。其中,预处理单元501被配置为对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号;发送单元502被配置为响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将语音信号发送至远程语音处理端进行识别,其中,远程语音处理端识别出语音信号所指示的对智能家电设备的目标控制操作;接收单元503被配置为接收远程语音处理端的识别结果,根据识别结果生成对智能家电设备执行目标控制操作的操作指令。
在一些实施例中,上述装置500还可以包括:识别单元,被配置为响应于确定与远程语音处理端的通信状态不满足预设的远程通信需求,对语音信号进行本地识别以识别出语音信号所指示的对智能家电设备的目标控制操作;生成单元,被配置为生成执行目标控制操作的操作指令。
在一些实施例中,上述识别单元可以被配置为按照如下方式对语音信号进行本地识别:基于预设的操作指令关键词库识别语音信号所指示的目标控制操作。
在一些实施例中,上述预处理单元501可以被配置为按照如下方式对获取到的声音信号进行预处理:对声音信号进行回声消除处理;对消除回声后的声音信号进行去混响处理。
在一些实施例中,上述目标控制操作可以包括唤醒操作。
在一些实施例中,上述预处理单元还可以被配置为按照如下方式对获取到的声音信号进行预处理:对去混响后的声音信号进行音频幅度范围的调整和信号放大,得到表征用户发出的声音的语音信号。
应当理解,装置500中记载的诸单元与参考图2和图4描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于装置500及其中包含的单元,在此不再赘述。
本申请上述实施例的语音控制装置500,通过对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号;响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将语音信号发送至远程语音处理端进行识别,其中,远程语音处理端识别出语音信号所指示的对智能家电设备的目标控制操作;接收远程语音处理端的识别结果,根据识别结果生成对智能家电设备执行目标控制操作的操作指令,实现了智能家电设备的语音控制,提供了更灵活、更便捷的智能家电控制方式。
下面参考图6,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的服务器)600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
在一些实施例中,上述电子设备600的输入装置606可以包括声音采集装置,该声音采集装置用于获取声音信号,并且该声音采集装置包括放水的麦克风。这样,电子设备600可以应用于湿度较大的场景中,例如卫生间、厨房。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例所描述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号;响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将语音信号发送至远程语音处理端进行识别,其中,远程语音处理端识别出语音信号所指示的对智能家电设备的目标控制操作;接收远程语音处理端的识别结果,根据识别结果生成对智能家电设备执行目标控制操作的操作指令。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括预处理单元、发送单元和接收单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,预处理单元还可以被描述为“对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号的单元”。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (15)

1.一种语音控制方法,包括:
对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号;
响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将所述语音信号发送至所述远程语音处理端进行识别,其中,所述远程语音处理端识别出所述语音信号所指示的对智能家电设备的目标控制操作;
接收所述远程语音处理端的识别结果,根据所述识别结果生成对所述智能家电设备执行所述目标控制操作的操作指令。
2.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定与远程语音处理端的通信状态不满足预设的远程通信需求,对所述语音信号进行本地识别以识别出所述语音信号所指示的对智能家电设备的目标控制操作;
生成执行所述目标控制操作的操作指令。
3.根据权利要求2所述的方法,其中,所述对所述语音信号进行本地识别以识别出所述语音信号所指示的对智能家电设备的目标控制操作,包括:
基于预设的操作指令关键词库识别所述语音信号所指示的目标控制操作。
4.根据权利要求1-3任一项所述的方法,其中,所述对获取到的声音信号进行预处理,包括:
对所述声音信号进行回声消除处理;
对消除回声后的声音信号进行去混响处理。
5.根据权利要求4所述的方法,其中,所述目标控制操作包括唤醒操作。
6.根据权利要求4所述的方法,其中,所述对获取到的声音信号进行预处理,还包括:
对去混响后的声音信号进行音频幅度范围的调整和信号放大,得到所述表征用户发出的声音的语音信号。
7.一种语音控制装置,包括:
预处理单元,被配置为对获取到的声音信号进行预处理,提取出表征用户发出的声音的语音信号;
发送单元,被配置为响应于确定与远程语音处理端的通信状态满足预设的远程通信需求,将所述语音信号发送至所述远程语音处理端进行识别,其中,所述远程语音处理端识别出所述语音信号所指示的对智能家电设备的目标控制操作;
接收单元,被配置为接收所述远程语音处理端的识别结果,根据所述识别结果生成对所述智能家电设备执行所述目标控制操作的操作指令。
8.根据权利要求7所述的装置,其中,所述装置还包括:
识别单元,被配置为响应于确定与远程语音处理端的通信状态不满足预设的远程通信需求,对所述语音信号进行本地识别以识别出所述语音信号所指示的对智能家电设备的目标控制操作;
生成单元,被配置为生成执行所述目标控制操作的操作指令。
9.根据权利要求8所述的装置,其中,所述识别单元被配置为按照如下方式对所述语音信号进行本地识别:
基于预设的操作指令关键词库识别所述语音信号所指示的目标控制操作。
10.根据权利要求7-9任一项所述的装置,其中,所述预处理单元被配置为按照如下方式对获取到的声音信号进行预处理:
对所述声音信号进行回声消除处理;
对消除回声后的声音信号进行去混响处理。
11.根据权利要求10所述的装置,其中,所述目标控制操作包括唤醒操作。
12.根据权利要求10所述的装置,其中,所述预处理单元还被配置为按照如下方式对获取到的声音信号进行预处理:
对去混响后的声音信号进行音频幅度范围的调整和信号放大,得到所述表征用户发出的声音的语音信号。
13.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.根据权利要求13所述的电子设备,其中,所述电子设备还包括:
声音采集装置,用于获取所述声音信号;
所述声音采集装置包括防水的麦克风。
15.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201910164550.XA 2019-03-05 2019-03-05 语音控制方法和装置、电子设备及计算机可读介质 Active CN109920419B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910164550.XA CN109920419B (zh) 2019-03-05 2019-03-05 语音控制方法和装置、电子设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910164550.XA CN109920419B (zh) 2019-03-05 2019-03-05 语音控制方法和装置、电子设备及计算机可读介质

Publications (2)

Publication Number Publication Date
CN109920419A true CN109920419A (zh) 2019-06-21
CN109920419B CN109920419B (zh) 2021-08-03

Family

ID=66963423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910164550.XA Active CN109920419B (zh) 2019-03-05 2019-03-05 语音控制方法和装置、电子设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN109920419B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111354359A (zh) * 2020-03-11 2020-06-30 深圳市元征科技股份有限公司 一种车辆语音控制方法、装置、设备、系统及介质
CN111367488A (zh) * 2020-01-07 2020-07-03 百度在线网络技术(北京)有限公司 语音设备及语音设备的交互方法、设备、存储介质
CN111883160A (zh) * 2020-08-07 2020-11-03 上海茂声智能科技有限公司 一种定向麦克风阵列拾音降噪方法及装置
CN111965985A (zh) * 2020-08-04 2020-11-20 深圳市欧瑞博科技股份有限公司 智能家居设备控制方法、装置、电子设备以及存储介质
CN112309412A (zh) * 2020-02-26 2021-02-02 北京字节跳动网络技术有限公司 用于处理待处理信号的方法、装置和信号处理系统
CN112393314A (zh) * 2020-11-16 2021-02-23 湖南瑞奇电器有限公司 一种智能语音控制取暖桌
CN113380257A (zh) * 2021-06-08 2021-09-10 深圳市同行者科技有限公司 多端智能家居的响应方法、装置、设备及存储介质
CN114679202A (zh) * 2022-03-07 2022-06-28 深圳华瑞物联科技有限公司 通信中继系统、方法、中继设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103949072A (zh) * 2014-04-16 2014-07-30 上海元趣信息技术有限公司 智能玩具交互、传输方法及智能玩具
CN104575502A (zh) * 2014-11-25 2015-04-29 百度在线网络技术(北京)有限公司 智能玩具及智能玩具的语音交互方法
US9558757B1 (en) * 2015-02-20 2017-01-31 Amazon Technologies, Inc. Selective de-reverberation using blind estimation of reverberation level
CN106560892A (zh) * 2015-09-30 2017-04-12 深圳光启合众科技有限公司 智能机器人及其云端交互方法、云端交互系统
CN106847291A (zh) * 2017-02-20 2017-06-13 成都启英泰伦科技有限公司 一种本地和云端相结合的语音识别系统及方法
CN107481722A (zh) * 2017-08-21 2017-12-15 无锡小天鹅股份有限公司 语音控制方法、衣物处理装置及服务器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103949072A (zh) * 2014-04-16 2014-07-30 上海元趣信息技术有限公司 智能玩具交互、传输方法及智能玩具
CN104575502A (zh) * 2014-11-25 2015-04-29 百度在线网络技术(北京)有限公司 智能玩具及智能玩具的语音交互方法
US9558757B1 (en) * 2015-02-20 2017-01-31 Amazon Technologies, Inc. Selective de-reverberation using blind estimation of reverberation level
CN106560892A (zh) * 2015-09-30 2017-04-12 深圳光启合众科技有限公司 智能机器人及其云端交互方法、云端交互系统
CN106847291A (zh) * 2017-02-20 2017-06-13 成都启英泰伦科技有限公司 一种本地和云端相结合的语音识别系统及方法
CN107481722A (zh) * 2017-08-21 2017-12-15 无锡小天鹅股份有限公司 语音控制方法、衣物处理装置及服务器

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111367488A (zh) * 2020-01-07 2020-07-03 百度在线网络技术(北京)有限公司 语音设备及语音设备的交互方法、设备、存储介质
CN111367488B (zh) * 2020-01-07 2023-08-22 百度在线网络技术(北京)有限公司 语音设备及语音设备的交互方法、设备、存储介质
CN112309412A (zh) * 2020-02-26 2021-02-02 北京字节跳动网络技术有限公司 用于处理待处理信号的方法、装置和信号处理系统
CN111354359A (zh) * 2020-03-11 2020-06-30 深圳市元征科技股份有限公司 一种车辆语音控制方法、装置、设备、系统及介质
CN111965985A (zh) * 2020-08-04 2020-11-20 深圳市欧瑞博科技股份有限公司 智能家居设备控制方法、装置、电子设备以及存储介质
CN111965985B (zh) * 2020-08-04 2024-01-26 深圳市欧瑞博科技股份有限公司 智能家居设备控制方法、装置、电子设备以及存储介质
CN111883160A (zh) * 2020-08-07 2020-11-03 上海茂声智能科技有限公司 一种定向麦克风阵列拾音降噪方法及装置
CN111883160B (zh) * 2020-08-07 2024-04-16 上海茂声智能科技有限公司 一种定向麦克风阵列拾音降噪方法及装置
CN112393314A (zh) * 2020-11-16 2021-02-23 湖南瑞奇电器有限公司 一种智能语音控制取暖桌
CN113380257A (zh) * 2021-06-08 2021-09-10 深圳市同行者科技有限公司 多端智能家居的响应方法、装置、设备及存储介质
CN114679202A (zh) * 2022-03-07 2022-06-28 深圳华瑞物联科技有限公司 通信中继系统、方法、中继设备及计算机可读存储介质
CN114679202B (zh) * 2022-03-07 2023-12-01 深圳华瑞物联科技有限公司 通信中继系统、方法、中继设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN109920419B (zh) 2021-08-03

Similar Documents

Publication Publication Date Title
CN109920419A (zh) 语音控制方法和装置、电子设备及计算机可读介质
CN107454508B (zh) 麦克风阵列的电视机及电视系统
CN110268470A (zh) 音频设备滤波器修改
CN108681440A (zh) 一种智能设备音量控制方法及系统
CN108231079A (zh) 用于控制电子设备的方法、装置、设备以及计算机可读存储介质
JP2019204074A (ja) 音声対話方法、装置及びシステム
US11380326B2 (en) Method and apparatus for performing speech recognition with wake on voice (WoV)
CN103886861B (zh) 一种控制电子设备的方法及电子设备
CN108597507A (zh) 远场语音功能实现方法、设备、系统及存储介质
JP6355939B2 (ja) 音声サーバおよびその制御方法、並びに音声システム
Vanus et al. Testing of the voice communication in smart home care
KR102563817B1 (ko) 사용자 음성 입력 처리 방법 및 이를 지원하는 전자 장치
CN110248021A (zh) 一种智能设备音量控制方法及系统
CN112820291A (zh) 智能家居控制方法、系统和存储介质
Galván-Tejada et al. An analysis of audio features to develop a human activity recognition model using genetic algorithms, random forests, and neural networks
CN111863020B (zh) 语音信号处理方法、装置、设备及存储介质
CN105975063B (zh) 一种控制智能终端的方法和装置
KR20190026518A (ko) 인공지능 음성 인식 장치의 동작 방법
CN108388225A (zh) 智能家居语音交互智能终端
CN101436404A (zh) 可会话的类生物装置及其会话方法
CN112151013A (zh) 智能设备交互方法
US11908464B2 (en) Electronic device and method for controlling same
CN210667779U (zh) 一种可实现降噪的设备
CN116386623A (zh) 一种智能设备的语音交互方法、存储介质及电子装置
CN111724783A (zh) 智能设备的唤醒方法、装置、智能设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant