WO2019061382A1

WO2019061382A1 - 基于智能音箱的家电语音控制方法及相关产品

Info

Publication number: WO2019061382A1
Application number: PCT/CN2017/104722
Authority: WO
Inventors: 朱晨露; 张黎君; 田辉; 熊胜峰
Original assignee: 陈银芳
Priority date: 2017-09-30
Filing date: 2017-09-30
Publication date: 2019-04-04

Abstract

本发明提供了一种基于智能音箱的家电语音控制方法及相关产品，所述方法包括：智能音响接收语音数据；智能音响对该语音数据进行识别处理得到该语音数据对应的控制对象以及控制指令；智能音响依据该控制对象提取该控制对象的MAC地址，将该MAC地址以及控制指令发送至智能家居控制中心控制该控制对象。本发明提供的技术方案具有用户体验度高的优点。

Description

基于智能音箱的家电语音控制方法及相关产品

技术领域

本发明涉及终端设备技术领域，具体涉及一种基于智能音箱的家电语音控制方法及相关产品。

背景技术

智能家居（英文：smart home, home automation）是以住宅为平台，利用综合布线技术、网络通信技术、安全防范技术、自动控制技术、音视频技术将家居生活有关的设施集成，构建高效的住宅设施与家庭日程事务的管理系统，提升家居安全性、便利性、舒适性、艺术性，并实现环保节能的居住环境。

智能音响是智能家居中的一个部分，现有的智能音响一般为接收设备，即无法通过智能音响控制其他家居设备，使得用户体验度低。

技术问题

本发明实施例提供了一种基于智能音箱的家电语音控制方法及相关产品，可以提高用户体验度。

技术解决方案

第一方面，本发明实施例提供一种基于智能音箱的家电语音控制方法，所述方法包括：

智能音响接收语音数据；

智能音响对该语音数据进行识别处理得到该语音数据对应的控制对象以及控制指令；

智能音响依据该控制对象提取该控制对象的MAC地址，将该MAC地址以及控制指令发送至智能家居控制中心控制该控制对象。

可选的，所述方法在智能音响接收语音数据以后，还包括：

智能音响提取语音数据的波形信号，将所述波形信号中幅值大于最大幅值的波峰进行削峰处理，对该波形信号中幅值小于最小幅值的波谷进行补偿处理得到处于该最大幅值以及最小幅值之间的处理数据，将该处理数据发送至语音识别算法进行语意识别处理。

可选的，所述削峰方式的实现方法包括：

削除所述波形信号中大于所述最大幅值的波峰信号，将所述波峰信号以直线代替。

可选的，所述削峰方式的实现方法包括：

将波形信号按幅值最大值的比例划分为n个区域，采用Y=kn*x来对波形信号进行处理，其中，n个区域中，1＞k1＞k2 ＞k3…kn；其中，kn对应的区域为波形信号中包含幅值最大值的区域；

其中x为原始语音信号，Y为削峰处理后的信号。

第二方面，提供一种智能音箱，所述智能音箱包括：

接收单元，用于接收语音数据；

处理单元，用于对该语音数据进行识别处理得到该语音数据对应的控制对象以及控制指令；依据该控制对象提取该控制对象的MAC地址；

发送单元，用于将该MAC地址以及控制指令发送至智能家居控制中心控制该控制对象。

可选的，所述处理单元，还用于提取语音数据的波形信号，将所述波形信号中幅值大于最大幅值的波峰进行削峰处理，对该波形信号中幅值小于最小幅值的波谷进行补偿处理得到处于该最大幅值以及最小幅值之间的处理数据，将该处理数据发送至语音识别算法进行语意识别处理。

可选的，所述处理单元，具体用于削除所述波形信号中大于所述最大幅值的波峰信号，将所述波峰信号以直线代替。

可选的，所述处理单元，具体用于将波形信号按幅值最大值的比例划分为n个区域，采用Y=kn*x来对波形信号进行处理，其中，n个区域中，1＞k1＞k2 ＞k3…kn；其中，kn对应的区域为波形信号中包含幅值最大值的区域；

其中x为原始语音信号，Y为削峰处理后的信号。

第三方面，提供一种计算机可读存储介质，其存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行第一方面提供的所述的方法。

第四方面，提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序可操作来使计算机执行第一方面提供的方法。

有益效果

实施本发明实施例，具有如下有益效果：

可以看出，通过本发明实施例的技术方案通过智能音响接收语音数据，对该语音数据进行分析处理得到对应的控制对象以及控制指令，其具有方便用户对智能家居进行控制，方便用户使用的优点。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1A是一种基于智能音箱的家电语音控制方法的流程示意图。

图2a是一种智能家居的构架示意图。

图2b是一种智能家居的数据传输的流程示意图。

图2c是另一种智能家居的构架示意图。

图2d是削峰处理示意图。

图3是本发明实施例提供的一种智能音箱的结构示意图。

图4是本发明实施例公开的一种智能终端的结构示意图。

本发明的实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

参阅图1，图1提供了一种基于智能音箱的家电语音控制方法，该方法由智能音响执行，该方法如图1所示，包括如下步骤：

步骤S101、智能音响接收用户发送的语音数据。

上述步骤S101中的接收用户发送的语音数据的方式可以有多种，例如可以通过麦克来接收用户发送的语音数据，该麦克可以为智能音响内置的麦克设备的，当然在实际应用中，还可以是通过与该智能音响连接的麦克设备，例如唱K设备的麦克风等等设备。

步骤S102、智能音响对该语音数据进行识别处理得到该语音数据对应的控制对象以及控制指令。

上述步骤S102中的对该语音数据进行识别的方式可以采用现有的语音识别算法进行识别，例如自然语音识别算法，当然还可以为自定义的算法，本发明对上述语音数据的识别算法并不限定。具体自定义的算法可以参见下述描述，这里不再赘述。

步骤S103、智能音响依据该控制对象提取该控制对象的MAC地址，将该MAC地址以及控制指令发送至智能家居控制中心控制该控制对象。

需要说明的是，上述控制对象可以为多种，例如，该控制对象具体可以包括：智能电灯、智能电视、智能清扫设备、智能睡眠设备，智能监控设备等，其表现的形式可以为多种多样，例如对于智能电灯，该智能电灯包括但不限于：智能台灯，智能吸顶灯，智能壁灯等设备，例如对于智能电视来说，其可以为三星牌智能电视，当然其也可以为夏普牌智能电视，例如对于智能清扫设备来说，其可以为，智能扫地机器人，当然其还可以包括智能吸尘器、智能垃圾处理器等设备，例如对于智能睡眠设备来说，其可以为：智能床垫、智能沙发等设备，例如对智能监控设备来说或，其可以为，智能血压计，智能温度计等，本发明对上述智能音响的具体形式以及数量或种类并不限定。

本发明提供的技术方案通过智能音响接收语音数据，对该语音数据进行分析处理得到对应的控制对象以及控制指令，其具有方便用户对智能家居进行控制，方便用户使用的优点。

根据本发明的一个方面，提供了一种智能家居接入点AP接收数据的分时段加密方法。其中，该方法应用在如图2a或如2c所示的家居网络中，如图2a所示，该家居网络包括：智能终端10、智能家居接入点AP20以及网关30，上述智能终端根据不同的情况可以具有不同的表现形式，例如该智能音响具体可以为：智能终端、平板电脑、计算机等设备，当然其也可以包含带有联网功能的其他设备，例如智能电视、智能空调、智能水壶或一些智能家居的终端设备，上述智能音响10通过无线方式与AP20连接，AP20通过另一种方式（即与无线方式不同的连接方式）与网关30接入互联网，上述无线方式包括但不限于：蓝牙、WIFI等方式，上述另一种方式可以为，LTE或有线方式，上述网关具体可以为，移动基站、移动中继站、交换机等设备。图2a中以有线方式为示例，为了方便表示，这里仅以一根实线表示。

上述网关30根据智能家居的大小可以是一台个人电脑（英文：Personal computer，PC），当然在实际应用中，也可以是多台PC、服务器或服务器群组，本发明具体实施方式并不局限上述网关30的具体表现形式。

参阅图2b，图2b为智能家居AP的数据发送的传输流程图，如图2b所示，该流程包括：

步骤S201、智能音响10将需要发送的数据包通过无线方式发送至AP20；

步骤S202、AP20将该数据包转发给网关30；

步骤S203、网关30将数据包传输至控制对象。

通过上述图2a和图2b的表示，在数据包的实际传输中，如果AP20与网关30之间出现泄密，那么对于发送的数据包由于没有经过相应的加密处理，所以很容易导致数据的泄漏，容易出现安全性问题。

可选的，上述步骤S101与步骤S102的之间还可以包括：

智能音响提取语音数据的波形信号，将该波形信号中幅值大于最大幅值的波峰进行削峰处理，对该波形信号中幅值小于最小幅值的波谷进行补偿处理得到处于该最大幅值以及最小幅值之间的处理数据，将该处理数据发送至语音识别算法进行语意识别处理。

此技术方案对该语音数据的幅值进行处理，该幅值可以为多种，例如，可以为语音数据的频率，也可以为语音数据的音量的大小等等，此技术方案的处理是为了避免语音数据的波形信号过大或过小导致语音识别算法识别错误，对于语音识别算法来说，其输入的语音数据的效果越好，其识别的精度越高，所以对此对该原始的语音数据进行补偿处理或削峰处理即能够得到在设定范围的处理数据，对其识别就能够提高识别的精度。

可选的，上述削峰处理的方法可以有多种，具体的，

该削峰方式可以为，削除该波形信号中大于该最大幅值的波峰信号，将该波峰信号以直线代替，具体的图形如图2d所示。

该削峰方式还可以为：将波形信号按幅值的比例划分为n个区域，采用Y=kn*x来对波形信号进行处理，其中，n个区域中，1＞k1＞k2 ＞k3…kn；其中，kn对应的区域为波形信号中包含幅值最大值的区域；其中x为原始语音信号，Y为削峰处理后的信号。

此方式可以分区域将该峰值进行处理，这样能够使得语音数据更加的平滑，提高语音数据的质量。

参阅图3，图3提供一种智能音箱，所述智能音箱包括：

接收单元301，用于接收语音数据；

处理单元302，用于对该语音数据进行识别处理得到该语音数据对应的控制对象以及控制指令；依据该控制对象提取该控制对象的MAC地址；

发送单元303，用于将该MAC地址以及控制指令发送至智能家居控制中心控制该控制对象。

其中x为原始语音信号，Y为削峰处理后的信号。

图4示出的是与本发明实施例提供的移动终端相关的智能终端的部分结构的框图。参考图4，智能终端包括：射频（Radio Frequency，RF）电路910、存储器920、输入单元930、传感器950、音频电路960、无线保真（Wireless Fidelity，WiFi）模块970、应用处理器AP980、通信模块991以及电源990等部件。本领域技术人员可以理解，图4中示出的智能终端结构并不构成对智能终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图4对智能终端的各个构成部件进行具体的介绍：

上述通信模块991具体可以为LTE通信模块，当然上述通信模块还可以为其他的支持CSFB功能的通信模块。

输入单元930可用于接收输入的数字或字符信息，以及产生与智能终端的用户设置以及功能控制有关的键信号输入。具体地，输入单元930可包括触控显示屏933、指纹识别装置931以及其他输入设备932。指纹识别装置931结合至触控显示屏933。输入单元930还可以包括其他输入设备932。具体地，其他输入设备932可以包括但不限于物理按键、功能键（比如音量控制按键、开关按键等）、轨迹球、鼠标、操作杆等中的一种或多种。其中，所述触控显示屏933，用于在检测到用户在所述触控显示屏933上进行滑动操作时，采集触控参数集，并通知所述指纹识别装置931进行指纹采集，以及将所述触控参数集发送给所述AP980；所述指纹识别装置931，用于采集指纹图像，并将所述指纹图像发送给所述AP980；所述AP980，用于分别对所述触控参数集以及所述指纹图像进行验证。

AP980是智能终端的控制中心，利用各种接口和线路连接整个智能终端的各个部分，通过运行或执行存储在存储器920内的软件程序和/或模块，以及调用存储在存储器920内的数据，执行智能终端的各种功能和处理数据，从而对智能终端进行整体监控。可选的，AP980可包括一个或多个处理单元；可选的，AP980可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到AP980中。

此外，存储器920可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

RF电路910可用于信息的接收和发送。通常，RF电路910包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器（Low Noise Amplifier，LNA）、双工器等。此外，RF电路910还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统（Global System of Mobile communication，GSM）、通用分组无线服务（General Packet Radio Service，GPRS）、码分多址（Code Division Multiple Access，CDMA）、宽带码分多址（Wideband Code Division Multiple Access, WCDMA）、长期演进（Long Term Evolution，LTE）、电子邮件、短消息服务（Short Messaging Service，SMS）等。

智能终端还可包括至少一种传感器950，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节触控显示屏的亮度，接近传感器可在智能终端移动到耳边时，关闭触控显示屏和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上（一般为三轴）加速度的大小，静止时可检测出重力的大小及方向，可用于识别智能终端姿态的应用（比如横竖屏切换、相关游戏、磁力计姿态校准）、振动识别相关功能（比如计步器、敲击）等; 至于智能终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路960、扬声器961，传声器962可提供用户与智能终端之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号，传输到扬声器961，由扬声器961转换为声音信号播放；另一方面，传声器962将收集的声音信号转换为电信号，由音频电路960接收后转换为音频数据，再将音频数据播放AP980处理后，经RF电路910以发送给比如另一智能终端，或者将音频数据播放至存储器920以便进一步处理。

WiFi属于短距离无线传输技术，智能终端通过WiFi模块970可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块970，但是可以理解的是，其并不属于智能终端的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

智能终端还包括给各个部件供电的电源990（比如电池），可选的，电源可以通过电源管理系统与AP980逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，智能终端还可以包括摄像头、蓝牙模块、补光装置、光线传感器等，在此不再赘述。

前述图1所示的实施例中，各步骤方法流程可以基于该智能终端的结构实现。

可以看出，通过本发明实施例，移动终端通过对不同的生物识别的识别顺序来分配不同的优先级，并且在设定时间内，如用户启动的第二应用程序与第一应用程序的类型不同，需要用户重新执行多生物识别操作，避免了直接给不同类型的应用程序最高优先级，影响安全性的问题。

本发明实施例还提供一种计算机存储介质，其中，该计算机存储介质存储用于电子数据交换的计算机程序，该计算机程序使得计算机执行如上述方法实施例中记载的任何一种基于智能音箱的家电语音控制方法的部分或全部步骤。

本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种基于智能音箱的家电语音控制方法的部分或全部步骤。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备（可为个人计算机、服务器或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器（英文：Read-Only Memory ，简称：ROM）、随机存取器（英文：Random Access Memory，简称：RAM）、磁盘或光盘等。

以上对本发明实施例进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

一种基于智能音箱的家电语音控制方法，其特征在于，所述方法包括：

智能音响接收语音数据；

智能音响对该语音数据进行识别处理得到该语音数据对应的控制对象以及控制指令；

智能音响依据该控制对象提取该控制对象的MAC地址，将该MAC地址以及控制指令发送至智能家居控制中心控制该控制对象。
根据权利要求1所述的方法，其特征在于，所述方法在智能音响接收语音数据以后，还包括：

智能音响提取语音数据的波形信号，将所述波形信号中幅值大于最大幅值的波峰进行削峰处理，对该波形信号中幅值小于最小幅值的波谷进行补偿处理得到处于该最大幅值以及最小幅值之间的处理数据，将该处理数据发送至语音识别算法进行语意识别处理。
根据权利要求2所述的方法，其特征在于，所述削峰方式的实现方法包括：

削除所述波形信号中大于所述最大幅值的波峰信号，将所述波峰信号以直线代替。
根据权利要求2所述的方法，其特征在于，所述削峰方式的实现方法包括：

将波形信号按幅值最大值的比例划分为n个区域，采用Y=kn*x来对波形信号进行处理，其中，n个区域中，1＞k1＞k2 ＞k3…kn；其中，kn对应的区域为波形信号中包含幅值最大值的区域；

其中x为原始语音信号，Y为削峰处理后的信号。
一种智能音箱，其特征在于，所述智能音箱包括：

接收单元，用于接收语音数据；

处理单元，用于对该语音数据进行识别处理得到该语音数据对应的控制对象以及控制指令；依据该控制对象提取该控制对象的MAC地址；

发送单元，用于将该MAC地址以及控制指令发送至智能家居控制中心控制该控制对象。
根据权利要求5所述的智能音箱，其特征在于，

所述处理单元，还用于提取语音数据的波形信号，将所述波形信号中幅值大于最大幅值的波峰进行削峰处理，对该波形信号中幅值小于最小幅值的波谷进行补偿处理得到处于该最大幅值以及最小幅值之间的处理数据，将该处理数据发送至语音识别算法进行语意识别处理。
根据权利要求6所述的智能音箱，其特征在于，

所述处理单元，具体用于削除所述波形信号中大于所述最大幅值的波峰信号，将所述波峰信号以直线代替。
根据权利要求6所述的智能音箱，其特征在于，

所述处理单元，具体用于将波形信号按幅值最大值的比例划分为n个区域，采用Y=kn*x来对波形信号进行处理，其中，n个区域中，1＞k1＞k2 ＞k3…kn；其中，kn对应的区域为波形信号中包含幅值最大值的区域；

其中x为原始语音信号，Y为削峰处理后的信号。
一种计算机可读存储介质，其特征在于，其存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行如权利要求1-4任一所述的方法。
一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序可操作来使计算机执行如权利要求1-4任一所述的方法。