CN113314113A

CN113314113A - 一种智能插座控制方法、装置、设备及存储介质

Info

Publication number: CN113314113A
Application number: CN202110544585.3A
Authority: CN
Inventors: 张天乐; 田志宏; 黄育锟; 郭仁飞; 姚思安; 夏代玲; 吕思雨
Original assignee: Guangzhou University
Current assignee: Guangzhou University
Priority date: 2021-05-19
Filing date: 2021-05-19
Publication date: 2021-08-27
Anticipated expiration: 2041-05-19
Also published as: CN113314113B

Abstract

本发明公开了一种智能插座控制方法、装置、设备及存储介质，方法包括：构建终端设备与音频接收器之间的通讯连接；通过所述终端设备采集音频信号或者通过所述终端设备播放音频信号；通过音频接收器接收所述音频信号作为语音输入信号；通过智能插座的处理器对所述语音输入信息进行特征识别，提取得到音频信号的特征；根据所述音频信号的特征匹配插座的控制命令，根据匹配得到控制命令来控制插座的运行动作；或者对所述音频信号的特征进行语义识别，根据所述语义识别的结果来控制插座的运行动作。本发明提高了智能插座对声音信号识别的准确性，可广泛应用于智能设备控制技术领域。

Description

一种智能插座控制方法、装置、设备及存储介质

技术领域

本发明涉及智能设备控制技术领域，尤其是一种智能插座控制方法、装置、设备及存储介质。

背景技术

在现有的具有声音识别功能的智能插座的发明中，有的智能插座可以与用户进行语音交互，但是需要额外搭配其他器件。例如，搭配了天猫精灵音箱的智能插座可以与用户进行语音交互。用户只需要对天猫精灵音箱说带有“天猫精灵”字样的语句，就可以控制插座的开关等功能，确实是十分方便。但是，用户需要在购买智能插座后还需要单独再购买天猫精灵音箱，在一定程度增加了用户的使用成本。

有的智能插座不需要搭配其他器件，可直接语音控制插座的开关，但是此类插座只是简单的通过击掌的动作使开关打开或关闭，而实际上，它工作原理是通过从声音信号的波形中分辨出波峰和波谷了，识别到一个波峰就让插座通电。但是，掌声只是一段声音信号，环境噪声同样也只是一段声音信号，这些声音信号的波形有波峰和波谷，比如击一次掌的声音可以得到一个明显的波峰，敲一下门的声音同样也可认为是得到一个明显的波峰。因此，环境噪声或者随便的一个突发的声音都有可能会让插座进行误操作，因此，在实际的使用环境下，此类插座的实用性不高。

同类的声控、语音控制的智能插座、智能音响等智能设备，由于需要通过外部接收采集来自用户发出的声音震动，均存在声音传播距离、遮挡、衰减、干扰等造成的声音识别差错或者失效问题。同时，也存在用户为了提高识别率，而不得不迁就提升自己的声调，使用体验和形象不佳不雅，也造成了对他人的干扰或者隐私泄露等问题。

还有一类智能插座在原有掌声的基础上添加了一个看灯闪再击掌的动作，但是依然解决不了环境噪声带来的误操作。其它也采用了肢体识别、手势识别、瞳孔、眼动、按键辅助等识别方式，均存在视线距离、环境光线、能见度等影响，一定适用场景限制。

上述大多数智能家居设备，均需要网络、APP等安装使用条件和约束，造成使用不便、操作门槛等问题，用户群体受到限制。

发明内容

有鉴于此，本发明实施例提供一种智能插座控制方法、装置、设备及存储介质。

本发明的一方面提供了一种智能插座控制方法，包括：

构建终端设备与音频接收器之间的通讯连接；

通过所述终端设备采集音频信号或者通过所述终端设备播放音频信号；

通过音频接收器接收所述音频信号作为语音输入信号；

通过智能插座的处理器对所述语音输入信息进行特征识别，提取得到音频信号的特征；

根据所述音频信号的特征匹配插座的控制命令，根据匹配得到控制命令来控制插座的运行动作；或者对所述音频信号的特征进行语义识别，根据所述语义识别的结果来控制插座的运行动作；

其中，所述音频接收器包括蓝牙音频接收器；

所述语音输入信号包括终端设备或者应用程序获取的实时语音、录音或音频口令中至少一种；

所述语音输入信号通过无线传输、有线传输或点对点传输中至少一种来输入至所述音频接收器。

可选地，所述根据所述语义生成插座控制命令，包括：

通过微处理器采用声音处理识别有限状态自动机对所述语义进行识别处理，提取得到声音信号辨识特征；

获取所述声音信号辨识特征的编码；

将所述编码与预设的声音口令密钥码进行对比匹配，得到对比匹配成功后的插座控制命令。

可选地，所述方法还包括：

通过终端设备采集用户输入的语音音频；

预设声音口令的特征信息，并对所述预设的特征信息设置对应的语义命令。

可选地，所述方法还包括：

获取特定的音频素材，将所述音频素材作为声音口令；

根据所述声音口令训练智能插座，以使所述智能插座能够识别声音特征，并确定声音特征对应的声音口令；

生成所述声音口令的密钥码。

可选地，所述声音处理识别有限状态自动机的有限状态包括INI初始状态、RSS噪声统计状态、RD就绪状态、ACT激活状态、SC收集短片段状态、CC收集长片段状态以及BN结束状态。

可选地，所述方法还包括：

当智能插座处于开机状态时：

微处理器进入INI初始态；

启动噪声统计定时器并且进入RSS状态；

统计噪声均值；

当统计时长超过预设时长时，确认噪声均值统计完毕，进入RD状态，以识别有效声音指令；

当检测到环境中突变的时候，将第一突变信号作为用户的一个声音信号片段的起始标志，并将第二突变信号作为声音信号片段的结束标志；其中，所述第一突变信号声音信号的波峰超过环境噪声均值达到第一预设值，所述第二突变信号的波峰低于第二预设值且持续时间超过时间阈值；

当所述智能插座识别到有效声音指令后，所述微处理器进入ACT状态。

可选地，所述方法还包括，记录并分析有效声音输入的信息特征，并启动第一定时器、第二定时器、第三定时器和第四定时器；

其中，所述第一定时器，用于确定一个有效的短声音片段所需维持的时间长度；

所述第二定时器，用于确定一个有效的长声音片段所需维持的时间长度；

所述第三定时器，用于识别到音频信号强度持续维持在基础噪声水平的一段时间，进而确定声音片段的结束和间隔；

所述第四定时器，用于确定声音片段的特征识别过程的长度；

当所述微处理器进入所述ACT状态后，如果继续识别到突变的有效声音，则重新启动第一定时器，并且保持ACT状态；如果一段时间内没有检测到突变的有效声音，直至第一定时器超时，检测到静默片段，则进入Q状态；

当所述微处理器进入Q状态时，根据所述第一定时器、第二定时器、第三定时器和第四定时器的持续时长，确定环境中获取到的突变信号的类型，并对该突变信号进行过滤、分类或者存储处理；

其中，所述Q状态代表长时间的无声静默状态。

本发明实施例的另一方面还提供了一种智能插座控制装置，包括：

声音音频信号接收器，用于采集环境中或者其它设备通过通信媒介发送来的声音音频信号，并将所述声音信号发送到微处理器；

微处理器，用于分析接收到的声音信号特征，并提取所述声音信号的片段数量、各片段的时间长短、各片段的波峰数量以及片段之间的环境噪声时间间隔；以及根据所述声音信号的片段数量、各片段的时间长短以及片段之间的环境噪声时间间隔匹配对应预设的声音特征参数或声音口令密钥码，并将所述预设的声音口令密钥码对应的控制指令发送到控制单元；

存储器，用于存储预设的口令密钥码和控制指令，以及存储口令密钥码和控制指令之间的映射关系；

控制单元，用于根据微处理器发送的控制指令执行相应的控制操作。

本发明实施例的另一方面提供了一种电子设备，包括处理器以及存储器；

所述存储器用于存储程序；

所述处理器执行所述程序实现如前面所述的方法。

本发明实施例的另一方面提供了一种计算机可读存储介质，所述存储介质存储有程序，所述程序被处理器执行实现如前面所述的方法。

本发明实施例还公开了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行前面的方法。

本发明的实施例可以在无需网络(例如离线语音)、无需专用APP(可通过手机任何支持录音、放音功能的可产生音频输出的APP)、接收来自手机各类APP或各种终端设备产生的蓝牙音频信号，并智能提取、识别音频信号的声纹特征，记录形成声音特征编码，并与用户可定制的预设的声音口令密钥码进行匹配对比，成功匹配后执行相应控制指令操作，实现准确、可靠、便捷、人性化的智能电源、设备遥控控制。本发明能够减少智能插座对手机APP和网络、服务器服务商等设施、主体、条件的依赖，让用户无需安装特定的客户端软件APP、无需网络连接和通信，用户可直接口述声音口令，并通过手机的音频录音、采集等非专用APP功能直接产生声音音频，该音频再通过蓝牙发送到智能插座，由智能插座的进行识别，并触发相应控制动作，实现语音电源开关控制功能。通过改变声音的多维属性其组合也进一步提高了该智能插座的安全强度，降低了外界噪声对智能插座识别指令的影响，提高智能插座对声音信号识别的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的智能插座控制过程示意图；

图2为本发明实施例提供的声音信号识别状态自动机示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

针对现有技术存在的问题，本发明实施例提供了一种智能插座控制方法，包括：

构建终端设备与音频接收器之间的通讯连接；

通过音频接收器接收所述音频信号作为语音输入信号；

其中，所述音频接收器包括蓝牙音频接收器；

可选地，所述根据所述语义生成插座控制命令，包括：

获取所述声音信号辨识特征的编码；

可选地，所述方法还包括：

通过终端设备采集用户输入的语音音频；

可选地，所述方法还包括：

获取特定的音频素材，将所述音频素材作为声音口令；

生成所述声音口令的密钥码。

可选地，所述方法还包括：

当智能插座处于开机状态时：

微处理器进入INI初始态；

启动噪声统计定时器并且进入RSS状态；

统计噪声均值；

可选地所述方法还包括，记录并分析有效声音输入的信息特征，并启动第一定时器、第二定时器、第三定时器和第四定时器；

其中，所述Q状态代表长时间的无声静默状态。

声音音频信号接收器，用于采集环境中或者其它设备通过通信媒介发送来的声音音频信号，并将所述声音信号发送到微处理器

所述存储器用于存储程序；

所述处理器执行所述程序实现如前面所述的方法。

下面结合说明书附图，对本发明的实现方法进行详细描述：

本发明实施例的智能插座包括：具备点电源插孔的壳体，所述壳体内设有声音音频信号接收器(如蓝牙音频传输接收/发送适配器或者声音采集和传感器，如麦克风等)、微处理器、存储器和控制单元等电路器件模块。

如图1所示，本发明所述智能插座可以使用户通过手机非专用APP(非指定特定的通用第三方APP，可为各类支持录音、放音的各类通用APP，如录音机、助听器、拾音器、扩音器、微信语音等APP相应功能)，录制语音并播放，通过蓝牙等方式将音频信号发送给智能插座内置的声音音频信号接收器，如蓝牙音频接收器，并传递给内置微处理器，微处理器对音频信号的特征进行识别，可以使用各类适用的算法对通过音频接收模块的音频信号进行识别，进而能够通过识别用户语音中的语义，并将其转换为不同的控制命令，控制电器进行各种定时、延时、间歇、频次重复开关控制操作，实现智能家居、智能制造、智能办公等应用。微处理器使用各类适用的算法对通过音频接收模块的音频信号进行识别，转化为控制命令。

所述多维声音信号，可以为通过用户自然嗓音发声，经设备的麦克风采集获得，或者通过手机麦克采集语音，经过设备的蓝牙音频接收/发送器接收到的模拟或者数字的各类音频信号。

所述声音音频信号接收器，用于采集环境中或者其它设备通过通信媒介发送来的声音音频信号，并将所述声音信号发送到微处理器；

所述微处理器，用于分析接收到的声音信号特征，并提取所述声音信号的片段数量、各片段的时间长短、各片段的波峰数量以及片段之间的环境噪声时间间隔；

所述微处理器，还用于根据所述声音信号的片段数量、各片段的时间长短以及片段之间的环境噪声时间间隔匹配对应预设的声音特征参数(预设的声音口令密钥码)，并将所述预设的声音口令密钥码对应的控制指令发送到控制单元；其中，所述预设的口令密钥码和控制指令被存储到存储器中，并建立绑定映射关联；微处理器采用声音处理识别有限状态自动机对采集到的声音信号进行识别处理，提取和辨识声音信号的特征并设置相应状态和操作，记录其声音特征编码，并与预设的声音口令密钥码进行对比，成功匹配后执行相应控制指令操作。

所述控制单元，用于根据微处理器发送的控制指令执行相应的操作。

还包括通信单元，所述通信单元包括Wi-Fi模块和蓝牙模块；

所述通信单元，用于接收智能终端发送的指令，所述指令包括设定预设的声音口令密钥码以及该声音对应的要执行的控制指令，并将其存储到存储器中；

所述微处理器，还用于接收通信单元发送的控制指令，并将所述控制指令发送到控制单元，以使所述控制单元根据所述控制受控设备或者执行部件执行相应的操作。

本发明将有效的多维度声音信号作为输入声音口令，将其与预设的声音口令密钥码匹配后，方可授权认证并进行后续控制。声音口令为若干声音片段组成，声音片段分为长声音片段和短声音片段，片段间有间隔静默片段，也可区分长、短(可选，其识别类似与声音片段的处理，本发明省略)。预先存储在存储器中的声音特征参数和控制指令为通过智能终端发送到微处理器中，再由存储器进行存储的，或直接在存储器中预先存储。微处理器判断输入的声音信号特征与预设的声音口令音频密钥码对应的声音特征进行比对，如果成功匹配，则触发执行相对应的预设控制指令。

需要说明的是，用户可以预先定义声音、语音口令的特征信息，并赋予相应的语义命令，进行插座的自动控制操作。用户向设备输入一段语音音频，可以通过自然嗓音发声，经设备的麦克风采集获得，或者通过手机麦克采集语音，经过设备的蓝牙音频收发器接收到。插座语义命令可以为任何智能插座所支持的控制指令，例如：开灯、每天17：30打开，通电2小时候自动关闭、延迟5分钟后打开电源，或者为打开电源30分钟，然后关闭20分钟，周期重复3次等控制策略操作。则插座自动执行该操作。用户每次需要执行某个电源自动控制操作时，只需要发出语音口令，插座的声音采集模块采集并分析、提取、识别口令的特征。

除了上述直接采集用户发音，也可以通过手机APP等其它设备来源，现场即时或者预先录制一段语音口令录音，并播放该录音音频，音频可通过蓝牙等方式传送到插座，插座收到音频并进行分析识别，成功匹配后，即可完成相应控制动作。

用户可以将特定的音频素材(现场或者录音或者第三方音频片段)作为声音口令，并训练智能插座学习、识别并将其声音特征作为预设声音口令音频密钥码。用户可以设置智能插座进入学习模式，智能插座将新学习到的音频特征记录作为预设的声音口令密钥码。当用户再次播放或者设备采集到同样的用户该声音时，识别为预设的口令密钥码特征，匹配成功，后完成相应控制动作。

另外，本发明实施例设置INI初始、RSS噪声统计、RD就绪、ACT激活、SC收集短片段、CC收集长片段、BN结束等若干状态，作为声音处理识别有限状态自动机的有限状态。状态转移条件和相应执行动作如附图2所示。有限状态自动机对采集到的用户输入的声音信号进行识别处理，提取和辨识声音信号的特征，并记录为特征编码，并与预设的声音口令密钥码进行对比，成功匹配后执行相应控制指令操作。

本发明实施例的智能插座开机后，微处理器在程序控制下进入INI初始态，启动噪声统计定时器TM_N(通常为3-5秒，用于持续的采集到较为稳定的基础噪声水平)，并进入RSS状态，期间统计噪声均值NM，当定时器TM_N超时，噪声均值NM更新完毕，进入RD状态，准备识别突变的有效声音指令。具体的，若识别到突变信号的波峰比环境噪声NM的N倍或者预设T阈值以上，将所述突变信号作为用户一个声音信号片段的起始标志，并以小于所述突变信号N倍以上或者接近NM幅度的声音信号，且持续超过一定时间，作为用户一个声音信号片段的结束标志；其中，N大于1。

微处理器在进入RD状态后，如果没有识别到突变的有效声音，则保持再RD状态，若识别到突变的有效声音信号，则进入ACT状态。

微处理器在进入ACT状态后，开始记录并分析有效声音输入信息特征。同时启动TM_L、TM_Q、TM_S和TM_D定时器。其中，定时器TM_S表示一个有效的短声音片段所需维持的时间长度。定时器TM_L表示一个有效的长声音片段所需维持的时间长度。定时器TM_Q，表示识别到音频信号强度持续维持在基础噪声水平的一段时间，视为声音片段的结束和间隔，记为一个静默片段X。定时器TM_D，表示声音片段的特征识别过程的长度，超时后，结束当前语音口令识别过程，进入下一个口令的识别。

微处理器在进入ACT状态后，如果继续识别到突变的有效声音，重新启动TM_Q定时器，并保持ACT状态。如果一段时间没有监测到突变的有效声音，直至TM_Q超时，监测到静默片段X，则进入Q状态，其中，所述Q状态代表长时间的无声静默状态，长时间是指检测到的片段之间的间隔时长大于一定时长。

微处理器在进入Q状态后，若此时TM_S也已经超时，而TM_L还未超时，则进入SC状态，成功识别到一个完整的声音信号短片段S；若TM_L已经超时，则进入CC状态，成功识别到一个完整的长音片段C。将声音片段的长短、数量、振幅、时间戳等信息进行特征编码，例如短音片段S或者长音片段C标志分别为“S”、“C”，并追加到音频特征记录中(例如，记录到“SX”标志编码，或“CX”标志，分别表示一个短音片段S或者长音片段C后面跟着一个之前监测到的静默片段“X”，其中，标志X为声音片段的间隔符，对应表示一个静默片段，用于后续区分和比对)；若TM_S和TM_L均未超时，表示该监测到的声音不足以构成一个声音片段，视为尖锐信号被滤波去掉，仅记录一个之前监测到的静默片段“X”，可选的，也可视其为一个极短的有效声音片段，记录为“I”标志编码后续一个“X”，即“IX”，然后返回进入ACT状态，继续识别后续声音信号。作为可选的，处理器还可以区分声音片段的声强振幅等特征，如果监测到的突变有效声音的振幅超过基础噪音NM的XN倍或者预设XT阈值以上，XN、XT为高于N和T的值，则认为是一个强音片段，记录音频特征码：短强音片段SHX、长强音片段CHX。一个有效的声音片段序列对应记录到的特征码，可能为：“SXSHXSXCXCHXSX”等，表示一个由：短音片段、短强音片段、短强音片段、长音片段、长强音片段、短音片段等6个片段组成的片段序列的特征)。

开机后，微处理器在进入SC状态后，将识别到的特征记录到音频特征记录，记录完毕有效声音信号的特征信息后，返回ACT状态，继续后续声音片段和静默片段的识别和追加。系统可经历若干次从ACT到SC状态的迁移，记录多个有效短片段，最后返回ACT状态(例如识别到“SXSXSXCXCX”等、“SXXXSXSXXCXCX…”或“SXSHXXXSXCXCHXSX”等)。

所述预设的声音口令音频密钥码存储于设备的EEPROM等非易逝存储器中，该密钥码可以被认证的用户修改、变更。该密钥码内容可包括声音口令所包含的有效声音片段数量、各片段的时间长短、各片段的波峰数量以及片段之间的环境噪声时间间隔等信息。形式上例如可以为：“SXSXSXCXCX”，表示连续3个短声音片段，两个长片段，片段间都有静默片段作为间隔。如果用户输入(通过自然嗓音发声，经设备的麦克风采集获得，或者通过手机麦克采集语音，经过设备的蓝牙音频收发器接收到)。如果用户输入声音口令的记录特征和预设的口令密钥码匹配，则可以进行相应的控制操作。

所述预设的声音口令音频密钥码可为多个，且每一个对应一个预设的用户插座操作命令，如开关、定时开关、延时开关、间歇开关等动作。用户输入的声音口令与某个声音口令音频密钥码匹配，则执行相应的控制操作，实现多种语音控制功能。

开机后，微处理器处ACT状态，如果判断到定时器TM_D超时，则结束声音片段的特征识别过程，并进行声音片段识别结果的特征比对，比较该声音片段所记录的音频特征记录和预设的音频密钥码，如果用户输入声音口令和预设的口令密钥码匹配，则可以进行相应的控制操作。重新进入INI状态，开始新的检测识别。

开机后，微处理器状态转换过程中，持续维护各个定时器数值，为各个激活的定时器进行老化计时计数更新，并监测是否超时。

为了更形象的说明本发明实施例，下面列举一个例子进行说明：

以一个预设的声音特征参数控制灯的打开为例，

假设在一个预设的声音(自然嗓音发声)特征参数内的顺序为：

(1)用户声音信号片段1为长音，1秒内完成；

(2)环境噪声信号1的时间间隔为1秒；

(3)用户声音信号片段2为短音，0.5秒内完成；

(4)环境噪声信号2的时间间隔为1秒；

(5)用户声音信号片段3为长音，1.5秒内完成；

以超过5秒后未有突变信号为该用户声音信号的结束。

则识别的声音特征记录为“CXSXCX”，表示长、短、长三个声音片段，且片段间都有静默片段作为间隔。

相应的，声音除了上述可以为用户自然嗓音，也可为乐器或者其它物品发出有节奏的声音，以击掌为例，对应的动作步骤为：

(1)短促击掌3次，每次间隔1秒；

(2)停顿2秒；

(3)连续击掌多次，持续2秒。

操作过程主要包括以下实施步骤：

1.设置预设声音口令密钥码及绑定控制命令。

用户可以通过专用APP，通过红外、WiFi、蓝牙、互联网等方式，连接智能插座，设置智能插座进入学习模式，智能插座将新学习到的音频特征记录作为预设的声音口令密钥码。用户可将上述一段声音，如嗓音或者击掌声，作为声音口令，通过手机APP的录音软件等采集软件采集并播放(手机蓝牙已连接智能插座的蓝牙音频接收器)，则播放音频通过蓝牙传输到智能插座的蓝牙接收器。例如，用户将一段语音“我爱北京”或者一段歌曲片段，通过插座设备的麦克风或者蓝牙音频输入插座。蓝牙音频转接到智能插座处理器模块的模拟采样接口，智能插座处理器自动识别分析出其音频特征，例如识别到的特征记录为“CXSXCXSX”，表明该语音口令中，第一个字为长音、第二字短音，第三个字为长音、第四字短音，片段间都有静默片段作为间隔的特征信息。或者为击掌声音，长声音片段1次(连续多次击掌被识别为一个长声音片段)，短音1次、长音一次、短音1次，则智能插座记录“CXSXCXSX”特征码。智能插座记录声音的多维特征并作为预设的声音口令密钥码。用户再赋予该声音口令密钥码一个控制指令，例如打开电灯通电3分钟后关闭。

2.用户重放产生声音片段，与声音口令密码识别匹配。

当用户需要操作智能插座控制开关时，说出或者击奏出特定声音，该声音通过手机APP的录音软件等采集软件采集并播放，播放音频通过蓝牙传输到智能插座的蓝牙接收器，输入智能插座的处理器进行分析，例如采用状态机识别算法，智能插座的处理器识别的声音特征为用户将一段语音“我爱北京”或者一段歌曲片段的特征为“SXSXSXCX”，表示短音三次、长声音片段一次，或者击掌，长声音片段1次(连续多次击掌被识别为一个长声音片段)，短音1次、长音一次、短音1次被识别为“SXSXSXCX”。微处理器将上述声音特征识别，与预设的声音口令密钥码比较和匹配识别。与预设声音口令密钥码匹配，则通过验证，进行插座控制。

3.成功匹配后，执行智能插座控制命令。

微处理器经与预设的声音口令密钥码比较，若匹配，则识别该声音信号为控制开关的有效指令，并调用相应的智能插座控制指令，完成插座电源的打开、关闭等操作，从而能够使智能插座通过对电源转换单元进行接通，进而实现遥控操作。

在一个典型的实施例中，首先，用户将手机与本发明所述插座设备的蓝牙音频传输接收/发送适配器等蓝牙音频模块进行蓝牙连接。然后，用户通过手机的通用APP如录音机、微信语音等录制采集一段声音音频，或者使用音乐、多媒体播放器等音视频APP播放一段音乐等声音音频，则这些音频信号经过蓝牙传输输入本发明所述插座设备，插座的处理器经过状态机的分析识别，提取用户输入的音频信号的特征，例如识别到的特征记录为“SXSXCXCX”，表示连续2个短声音片段，两个长片段，片段间都有静默片段作为间隔。而预设的口令密钥码为“SXSXSXCXCX”，没有匹配成功，则插座不做任何操作。插座进入一个新的识别阶段，识别其后再次输入音频。如果用户输入音频特征为：“SXSXSXCXCX”，匹配成功，则插座查找口令密钥码对应的操作，例如为延迟5分钟后打开电源，则插座自动执行该操作。

具体的，用户可以通过手机的录音机APP录制一段语音口令，例如“开..开..灯..确....认....”。其中，前三个字发短促、清脆的声音，并在每个读音间保持1秒左右的间隔，最后两个字发延长、拖音的声音，该语音口令的经过插座的特征识别后，会生成“SXSXSXCXCX”，表示连续3个短声音片段，2个长片段，片段间都有静默片段作为间隔的特征信息。录音APP录制完毕后，用户在需要控制插座时，播放该录音音频，音频信号经过蓝牙传输输入本发明所述插座设备，插座的处理器经过状态机的分析识别，提取用户输入的音频信号的特征，例如识别到的特征记录为“SXSXSXCXCX”，与用户预设的口令密钥码匹配成功，则插座查找口令密钥码对应的操作，例如为延迟5分钟后打开电源，则插座自动执行该操作。用户每次需要执行该电源操作时，只需要播放该录音音频即可，插座收到音频并进行分析识别，成功匹配后完成相应控制动作。

在一个实施例中，包括：插脚和插孔的壳体，所述壳体内设有声音传感器、微处理器、存储器和控制单元；所述声音传感器，用于采集环境中的声音信号，并将所述声音信号发送到微处理器；所述微处理器，用于分析接收到的声音信号，并提取所述声音信号的片段数量、各片段的时间长短、各片段的波峰数量以及片段之间的环境噪声时间间隔；所述微处理器，还用于根据所述声音信号的片段数量、各片段的时间长短、各片段的波峰数量以及片段之间的环境噪声时间间隔匹配对应预设的声音特征参数，并将所述预设的声音特征参数对应的控制指令发送到控制单元；其中，所述预设的声音特征参数和控制指令已预先存储到存储器中；所述控制单元，用于根据微处理器发送的控制指令执行相应的操作。基于上述实施例，本发明能够减少智能插座对手机APP和网络的依赖，让用户直接与智能插座进行交互，并且所发出的声音信号不需要精确清晰的语音文字，只要有关声音信号的片段数量、各片段的时间长短、各片段的波峰数量(频率高低)以及片段之间的环境噪声时间间隔等声音属性值与预设的相同，即可控制智能插座进行相应的操作，并且声音的多维属性及其组合(不同数量、持续长短、间隔时长、声强振幅等声音片段序列组合)也进一步提高了该智能插座的安全强度，降低了外界噪声对智能插座识别指令的影响，提高智能插座对声音信号识别的准确性。

具体的，在另一个典型的实施例中，用户可以将特定的音频素材(现场或者录音或者第三方音频片段)作为声音口令，并训练智能插座学习、识别并将其声音特征作为预设声音口令音频密钥码，当该特定音频输入设备后，设备识别匹配后进行相对应的插座控制操作。例如，用户将一段语音“我爱北京”或者一段歌曲片段，通过插座设备的麦克风或者蓝牙音频输入，智能插座自动识别分析出其音频特征，例如识别到的特征记录为“CXSXCXSX”，表明该语音口令中，第一个字为长音、第二字短音，第三个字为长音、第四字短音，片段间都有静默片段作为间隔的特征信息。智能插座将该特征记录作为预设的声音口令密钥码。当用户再次播放或者设备采集到用户该声音时，识别为预设的口令密钥码特征，匹配成功，后完成相应控制动作。

本发明能够减少智能插座对智能终端APP和网络的依赖，让用户直接与智能插座进行交互。另外，由于本发明的智能插座工作在在无网络的条件下，可不用担心服务器宕机不能控制插座，不需要担忧厂家泄露用户的操作习惯等服务器数据。

此外，用户所发出的声音信号不需要精确清晰的语音文字，只要有关声音信号的片段数量、各片段的时间长短、各片段的波峰数量(频率高低)以及片段之间的环境噪声时间间隔等声音属性值与预设的相同，即可控制智能插座进行相应的操作，并且声音的可靠、快速的多维属性(不同数量、持续长短、间隔时长、声强振幅等声音片段序列组合)识别和比对，也进一步提高了该智能插座的安全强度，降低了外界噪声对智能插座识别指令的影响，提高智能插座对声音信号识别的准确性。

用户可以设置智能插座进入学习模式，智能插座将新学习到的音频特征记录作为预设的声音口令密钥码。例如，用户将一段语音“我爱北京”或者一段歌曲片段，通过插座设备的麦克风或者蓝牙音频输入，智能插座自动识别分析出其音频特征，例如识别到的特征记录为“CXSXCXSX”，表明该语音口令中，第一个字为长音、第二字短音，第三个字为长音、第四字短音，片段间都有静默片段作为间隔的特征信息。智能插座自动将“CXSXCXSX”作为预设的声音口令密钥码。用户再赋予该声音口令密钥码一个控制指令，例如打开电灯通电3分钟后关闭。

当用户再次播放或者设备采集到同样的用户该声音时，识别为预设的口令密钥码特征，匹配成功，后完成相应控制动作，例如打开电灯通电3分钟后关闭。

本发明实施例通过在由用户自主在智能终端的APP上设置多种声音特征参数和对应的控制指令，使用户能够根据自己的需求进行设置，进而能够控制多种不同电器的开关。

本发明实施例通过智能插座内置的蓝牙音频接收模块收到的来自手机APP(非指定特定app，可为各类支持录音、放音的APP，如录音机、助听器、拾音器、扩音器、微信语音等APP相应功能)的音频信号传递到智能插座内置微处理器，微处理器对音频信号的特征进行识别，本发明实施例以基于有限状态自动机的特征识别，也可采用基于隐马尔可夫模型、非参数模型的矢量量化、人工神经网络、卷积神经网络、梅尔频率倒谱系数、随机森林等多类预测、特征提取、分类识别等算法和方法，进而能够通过识别用户语音中的语义，并将其转换为不同的控制命令，控制电器进行各种定时、延时、间歇、频次重复开关控制操作，实现智能家居、智能制造、智能办公等应用。微处理器使用各类适用的算法对通过音频接收模块的音频信号进行识别，转化为控制命令，在此不做限定。

在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明，但本发明并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种智能插座控制方法，其特征在于，包括：

构建终端设备与音频接收器之间的通讯连接；

通过音频接收器接收所述音频信号作为语音输入信号；

其中，所述音频接收器包括蓝牙音频接收器；

2.根据权利要求1所述的一种智能插座控制方法，其特征在于，所述所述音频信号的特征进行语义识别，包括：

获取所述声音信号辨识特征的编码；

3.根据权利要求1所述的一种智能插座控制方法，其特征在于，所述方法还包括：

通过终端设备采集用户输入的语音音频；

4.根据权利要求1所述的一种智能插座控制方法，其特征在于，所述方法还包括：

获取特定的音频素材，将所述音频素材作为声音口令；

生成所述声音口令的密钥码。

5.根据权利要求2所述的一种智能插座控制方法，其特征在于，所述声音处理识别有限状态自动机的有限状态包括INI初始状态、RSS噪声统计状态、RD就绪状态、ACT激活状态、SC收集短片段状态、CC收集长片段状态以及BN结束状态。

6.根据权利要求1所述的一种智能插座控制方法，其特征在于，所述方法还包括：

当智能插座处于开机状态时：

微处理器进入INI初始态；

启动噪声统计定时器并且进入RSS状态；

统计噪声均值；

7.根据权利要求6所述的一种智能插座控制方法，其特征在于，所述方法还包括：记录并分析有效声音输入的信息特征，并启动第一定时器、第二定时器、第三定时器和第四定时器；

其中，所述Q状态代表长时间的无声静默状态。

8.一种智能插座控制装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括处理器以及存储器；

所述存储器用于存储程序；

所述处理器执行所述程序实现如权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述存储介质存储有程序，所述程序被处理器执行实现如权利要求1-7中任一项所述的方法。