WO2021008095A1

WO2021008095A1 - 线下远场语音控制系统、控制方法及设备

Info

Publication number: WO2021008095A1
Application number: PCT/CN2019/130505
Authority: WO
Inventors: 郭志俊; 熊跃平; 徐立
Original assignee: 深圳创维－Rgb电子有限公司
Priority date: 2019-07-16
Filing date: 2019-12-31
Publication date: 2021-01-21
Also published as: CN110379422A; CN110379422B

Abstract

一种线下远场语音系统、控制方法及设备。通过语音采集模块(100)对用户语音进行采集，获得对应的语音数据(S10)；语音识别模块(200)确定预设语音库中存在语音数据(S20)；编译压缩模块(300)对语音数据进行编译压缩，获得操作指令(S30)；控制芯片(400)根据操作指令控制电视机实现对应的操作(S40)。

Description

线下远场语音控制系统、控制方法及设备

本申请要求于2019年07月16日提交中国专利局、申请号为CN201910644412.1、发明名称为“线下远场语音控制系统、控制方法及设备”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及电子设备技术领域，尤其涉及一种线下远场语音控制系统、控制方法及设备。

背景技术

随着数字电视技术的发展和普及，电视机已成为家庭的娱乐中心，而电视机用户对电视的智能化和个性化要求也越来越高。

目前对于传统的无操作系统、不带网络功能的电视机，用户通常使用遥控器对电视机进行控制，并使电视机做出相对应的动作，例如，电视开机、增加频道、静音等相关操作，当用户需要对电视机进行控制时，需要先找到遥控器，再通过遥控器按钮给出控制指令，非常不方便。

上述内容仅用于辅助理解本申请的技术方案，并不代表承认上述内容是现有技术。

技术解决方案

本申请的主要目的在于提供一种线下远场语音控制系统、控制方法及设备，旨在解决现有技术中在没有网络的情况下使用遥控器控制电视机给用户带来不方便的技术问题。

为实现上述目的，本申请提供一种线下远场语音控制系统，所述线下远场语音控制系统包括语音采集模块、语音识别模块、编译压缩模块以及控制芯片；其中，

所述语音采集模块，被配置为对用户语音进行采集，获得对应的语音数据；

所述语音识别模块，被配置为确定预设语音库中存在所述语音数据；

所述编译压缩模块，被配置为对所述语音数据进行编译压缩，获得操作指令；

所述控制芯片，被配置为根据所述操作指令控制电视机实现对应的操作。

可选地，所述语音采集模块还包括麦克风、第一采集单元、第二采集单元及过滤单元；

所述第一采集单元，与所述麦克风连接，被配置为通过麦克风对语音进行采集以获得语音采集数据，并发送语音采集数据至所述过滤单元；

所述第二采集单元，与电视机的功放连接，被配置为对功放语音数据进行回采，并发送所述功放语音数据至过滤单元；

所述过滤单元，与所述语音识别模块连接，被配置为滤除语音采集数据中的功放语音数据，以将滤除后的语音采集数据作为用户语音对应的语音数据。

可选地，还包括触发模块，与所述语音采集模块连接，被配置为实时侦测用户发出的声音，并在确定用户发出的声音对应的声音数据包含预设激活指令时触发所述语音采集模块对用户语音进行采集。

可选地，所述麦克风至少有两个。

可选地，还包括显示器，与所述控制芯片连接，被配置为在电视机上显示所述操作对应的界面。

本申请还提出一种线下远场语音控制方法，所述方法包括以下步骤：

对用户语音进行采集，获得对应的语音数据；

确定预设语音库中存在所述语音数据；

对所述语音数据进行编译压缩，获得操作指令；以及，

根据所述操作指令控制电视机实现对应的操作。

可选地，所述根据所述操作指令控制电视机实现对应的操作的步骤，包括：

将所述操作指令与预设控制指令库进行匹配；以及，

确定匹配成功，根据所述预设控制指令库中所述操作指令对应匹配的控制指令实现对应的操作。

可选地，所述将所述操作指令与预设控制指令库进行匹配的步骤，包括：

将所述操作指令与所述预设控制指令库中的控制指令进行字符串相似度匹配；以及，

确定所述操作指令与控制指令的字符串相似度在第一预设范围内时匹配成功。

可选地，所述对用户语音进行采集，获得对应的语音数据的步骤，包括：

实时侦测用户发出的声音，并在确定用户发出的声音对应的声音数据包含预设激活指令时对用户语音进行采集，获得对应的语音数据。

本申请还提出一种线下远场语音控制设备，所述电子设备包括如上所述的线下远场语音控制系统，或者所述线下远场语音控制设备应用如上所述的线下远场语音控制方法。

本申请通过语音采集模块对用户语音进行采集，获得对应的语音数据；语音识别模块确定预设语音库中存在语音数据；编译压缩模块对语音数据进行编译压缩，获得操作指令；控制芯片根据操作指令控制电视机实现对应的操作。其中，在传统电视机无操作系统、不联网的情况下，通过对用户语音采集识别实现对电视机的控制，用户只需要发出语音指令即可实现与电视机的交互，不再依赖于遥控器，满足了电视机用户的个性化需求，使电视机更加智能化。

附图说明

图1是本申请一种线下远场语音系统一实施例的功能模块图；

图2是本申请一种线下远场语音系统一实施例的结构示意图；

图3是本申请一种线下远场语音方法一实施例的流程图。

附图标号说明：

标号	名称	标号	名称
100	语音采集模块	600	显示器
200	语音识别模块	110	麦克风
300	编译压缩模块	120	第一采集单元
400	控制芯片	130	第二采集单元
500	触发模块	140	过滤单元

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

本发明的实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明，若本申请实施例中有涉及方向性指示(诸如上、下、左、右、前、后……)，则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。

另外，若本申请实施例中有涉及“第一”、“第二”等的描述，则该“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

本申请提供一种线下远场语音控制系统。

参照图1，在一实施例中，所述线下远场语音控制系统包括语音采集模块100、语音识别模块200、编译压缩模块300以及控制芯片400；其中，所述语音采集模块100，被配置为对用户语音进行采集，获得对应的语音数据；所述语音识别模块200，被配置为确定预设语音库中存在所述语音数据；所述编译压缩模块300，被配置为对所述语音数据进行编译压缩，获得操作指令；所述控制芯片400，被配置为根据所述操作指令控制电视机实现对应的操作。

应当理解的是，传统的无操作系统不带网络功能的电视机，只能通过遥控器进行控制，本实施例在不用连接互联网的情况下就能够实现语音控制电视机的功能，解脱了电视机用户长期使用遥控器操作电视机的束缚，增强了用户的体验感和科技感。

需要说明的是，语音采集模块100与语音识别模块200连接，语音识别模块200与编译压缩模块300连接，编译压缩模块300与控制芯片400通过串口连接，将操作指令传输至电视机的控制芯片400，电视机在接收到操作指令后作出相应的操作，从而达到用户通过语音就能够完美控制电视机的目的。

在实现过程中，线下远场语音控制系统由电视机内部电源+5V_Standby供电，在电视机通电的状态下，无论电视机是否已经开机，都会有稳定的+5V_Standby输出，因此，即便电视机在待机状态下，线下远场语音控制系统也能正常运行，能够响应用户的语音控制。

当然，传统的无操作系统的电视机的不联网的情况下，通过数据库比对的方式确定预设语音库中存在语音数据，编译压缩模块对语音数据进行编译压缩，获得操作指令，并将操作指令通过串口RX/TX的形式传输到电视机的控制模块，控制模块对操作指令进行自动解析和比对，使电视机做出相应的动作，例如，电视开机、增加频道、静音等相关操作，实现用户的远场语音控制的目的。其中，预设语音库的设置可以如下表所示：

电视开机

电视关机

增加频道

减少频道

增大音量

减小音量

静音

取消静音

打开菜单

关闭菜单

切换到AV

切换到ATV

切换到DTV

切换到HDMI1

切换到HDMI2

切换到HDMI3

切换到USB

暂停播放

快进

快退

开始播放

停止播放

退出

向上移动

向下移动

向左移动

向右移动

左切换项目

右切换项目

返回

本实施例通过语音采集模块对用户语音进行采集，获得对应的语音数据；语音识别模块确定预设语音库中存在语音数据；编译压缩模块对语音数据进行编译压缩，获得操作指令；控制芯片根据操作指令控制电视机实现对应的操作。其中，在传统电视机无操作系统、不联网的情况下，通过对用户语音采集识别实现对电视机的控制，用户只需要发出语音指令即可实现与电视机的交互，不再依赖于遥控器，满足了电视机用户的个性化需求，使电视机更加智能化。

请参照图2，图2为线下远场语音系统一实施例的结构示意图。

本实施例中，所述语音采集模块100还包括麦克风110、第一采集单元120、第二采集单元130及过滤单元140；所述第一采集单元120，与所述麦克风110连接，被配置为通过麦克风110对语音进行采集以获得语音采集数据，并发送语音采集数据至所述过滤单元140；所述第二采集单元130，与电视机的功放连接，被配置为对功放语音数据进行回采，并发送所述功放语音数据至过滤单元140；所述过滤单元140，与所述语音识别模块200连接，被配置为滤除语音采集数据中的功放语音数据，以将滤除后的语音采集数据作为用户语音对应的语音数据。

需要说明的是，所述语音采集数据，包括用户语音及功放语音数据。由于电视机在播放状态下时环境噪音复杂，为了提高电视机的语音控制指令的准确识别，滤除电视机的功放发出的功放声音，特设计了回采功能，把电视机本身的音频信号反馈到语音采集模块100，使电视机发出的功放声音被识别，从而准确的识别到用户语音。

易于理解的是，由于通过麦克风110采集用户语音，为了进一步提升用户体验感，提高语音信号处理质量及真实环境下的语音识别率，增强用户语音识别的准确度，可以采用多个麦克风采集不同方向的用户语音。本实施例中，麦克风110可选地为至少两个。

进一步地，线下远场语音控制系统还包括触发模块500，与所述语音采集模块100连接，被配置为实时侦测用户发出的声音，并在确定用户发出的声音对应的声音数据包含预设激活指令时触发所述语音采集模块100对用户语音进行采集。

应当理解的是，为了防止误操作，触发模块500中保存有预设的激活指令库，只有当用户发出的声音对应的声音数据中有预设激活口令才能激活语音采集模块100在预设时间内持续对用户语音进行采集，当预设时间内没有采集到用户语音，线下远场语音控制系统进入休眠状态，只有收到激活口令才能再次激活。

进一步地，线下远场语音控制系统还包括显示器600，与所述控制芯片400连接，被配置为在电视机上显示所述操作对应的界面。

可理解的是，所述显示器600为电视机的显示器，被配置为显示操作对应的界面，如当采集到的用户语音为“打开菜单”时，在显示器上会显示菜单界面。

本实施通过语音采集模块的设计，对电视同本身的功放声音进行回采和滤除，并通过多个麦克风对多个方向的用户语音进行收集，实现了对真实用户语音的采集，并提高了对用户语音的识别度。

请参照图3，图3为基于线下远场语音系统提出的线下远场语音方法一实施例的流程图。

本实施例中，线下远场语音方法包括以下步骤：

S10：对用户语音进行采集，获得对应的语音数据；

易于理解的是，本实施例通过多个麦克风采集不同方向的用户语音，进一步提升了用户体验感，提高了语音信号处理质量及真实环境下的语音识别率，增强用户语音识别的准确度。

在实现过程中，在对用户语音进行采集之前，还需要实时侦测用户发出的声音，并在确定用户发出的声音对应的声音数据包含预设激活指令时才对用户语音进行采集。

应当理解的是，为了防止误操作，触发模块中保存有预设的激活指令库，只有当用户发出的声音对应的声音数据中有预设激活口令才能激活语音采集模块在预设时间内持续对用户语音进行采集，当预设时间内没有采集到用户语音，线下远场语音控制系统进入休眠状态，只有收到激活口令才能再次激活。

S20：确定预设语音库中存在所述语音数据；

需要说明的是，本实施例中，确定预设语音库中存在所述语音数据的方法有多种，比如将语音数据与预设语音库中的数据进行词向量相似度匹配或字符串相似度匹配等。预设语音库的设置可以如下表所示：

电视开机

电视关机

增加频道

减少频道

增大音量

减小音量

静音

取消静音

打开菜单

关闭菜单

切换到AV

切换到ATV

切换到DTV

切换到HDMI1

切换到HDMI2

切换到HDMI3

切换到USB

暂停播放

快进

快退

开始播放

停止播放

退出

向上移动

向下移动

向左移动

向右移动

左切换项目

右切换项目

返回

S30：对所述语音数据进行编译压缩，获得操作指令；

易于理解的是，当预设语音库中存在语音数据时，编译压缩模块对语音数据进行编译压缩，获得操作指令，并将操作指令通过串口RX/TX的形式传输到电视机的控制模块。

S40：根据所述操作指令控制电视机实现对应的操作。

在实现过程中，控制模块将操作指令与预设控制指令库进行匹配，在匹配成功时，根据所述预设控制指令库中所述操作指令对应匹配的控制指令实现对应的操作，例如，电视开机、增加频道、静音等相关操作，实现用户的远场语音控制的目的。

本实施例中，可以采用字符串相似度匹配的方式获得操作指令对应的控制指令。将所述操作指令与所述预设控制指令库中的控制指令进行字符串相似度匹配；在所述操作指令与控制指令的字符串相似度在第一预设范围内时，判定匹配成功。

本实施例通过对用户语音进行采集，获得对应的语音数据；确定所述预设语音库中存在所述语音数据；对所述语音数据进行编译压缩，获得操作指令；根据所述操作指令控制电视机实现对应的操作。其中，在传统电视机无操作系统、不联网的情况下，通过对用户语音采集识别实现对电视机的控制，用户只需要发出语音指令即可实现与电视机的交互，不再依赖于遥控器，满足了电视机用户的个性化需求，使电视机更加智能化。

此外，本申请还提出一种线下远场语音控制设备，该线下远场语音控制设备包括如上所述的线下远场语音控制系统，或者应用上述的线下远场语音控制方法。易于理解的是，该线下远场语音控制设备至少具有上述实施例所带来的效果。

以上仅为本申请的可选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种线下远场语音控制系统，其中，包括语音采集模块、语音识别模块、编译压缩模块以及控制芯片；其中，

所述语音采集模块，被配置为对用户语音进行采集，获得对应的语音数据；

所述语音识别模块，被配置为确定预设语音库中存在所述语音数据；

所述编译压缩模块，被配置为对所述语音数据进行编译压缩，获得操作指令；

所述控制芯片，被配置为根据所述操作指令控制电视机实现对应的操作。
如权利要求1所述的线下远场语音控制系统，其中，所述语音采集模块还包括麦克风、第一采集单元、第二采集单元及过滤单元；

所述第一采集单元，与所述麦克风连接，被配置为通过麦克风对语音进行采集以获得语音采集数据，并发送语音采集数据至所述过滤单元；

所述第二采集单元，与电视机的功放连接，被配置为对功放语音数据进行回采，并发送所述功放语音数据至过滤单元；

所述过滤单元，与所述语音识别模块连接，被配置为滤除语音采集数据中的功放语音数据，以将滤除后的语音采集数据作为用户语音对应的语音数据。
如权利要求2所述的线下远场语音控制系统，其中，还包括触发模块，与所述语音采集模块连接，被配置为实时侦测用户发出的声音，并在确定用户发出的声音对应的声音数据包含预设激活指令时触发所述语音采集模块对用户语音进行采集。
如权利要求2所述的线下远场语音控制系统，其中，所述麦克风至少有两个。
如权利要求1所述的线下远场语音控制系统，其中，还包括显示器，与所述控制芯片连接，被配置为显示所述操作对应的界面。
一种线下远场语音控制方法，其中，所述线下远场语音控制方法包括以下步骤：

对用户语音进行采集，获得对应的语音数据；

确定预设语音库中存在所述语音数据；

对所述语音数据进行编译压缩，获得操作指令；以及，

根据所述操作指令控制电视机实现对应的操作。
如权利要求6所述的线下远场语音控制方法，其中，所述根据所述操作指令控制电视机实现对应的操作的步骤，包括：

将所述操作指令与预设控制指令库进行匹配；以及，

确定匹配成功，根据所述预设控制指令库中所述操作指令对应匹配的控制指令实现对应的操作。
如权利要求7所述的线下远场语音控制方法，其中，所述将所述操作指令与预设控制指令库进行匹配的步骤，包括：

将所述操作指令与所述预设控制指令库中的控制指令进行字符串相似度匹配；以及，

确定所述操作指令与控制指令的字符串相似度在第一预设范围内时匹配成功。
如权利要求6所述的线下远场语音控制方法，其中，所述对用户语音进行采集，获得对应的语音数据的步骤，包括：

实时侦测用户发出的声音，并在确定用户发出的声音对应的声音数据包含预设激活指令时对用户语音进行采集，获得对应的语音数据。
一种线下远场语音控制设备，其中，所述线下远场语音控制设备包括线下远场语音控制系统，所述线下远场语音控制系统包括语音采集模块、语音识别模块、编译压缩模块以及控制芯片；其中，

所述语音采集模块，被配置为对用户语音进行采集，获得对应的语音数据；

所述语音识别模块，被配置为确定预设语音库中存在所述语音数据；

所述编译压缩模块，被配置为对所述语音数据进行编译压缩，获得操作指令；

所述控制芯片，被配置为根据所述操作指令控制电视机实现对应的操作。
如权利要求10所述的线下远场语音控制设备，其中，所述语音采集模块还包括麦克风、第一采集单元、第二采集单元及过滤单元；

所述第一采集单元，与所述麦克风连接，被配置为通过麦克风对语音进行采集以获得语音采集数据，并发送语音采集数据至所述过滤单元；

所述第二采集单元，与电视机的功放连接，被配置为对功放语音数据进行回采，并发送所述功放语音数据至过滤单元；

所述过滤单元，与所述语音识别模块连接，被配置为滤除语音采集数据中的功放语音数据，以将滤除后的语音采集数据作为用户语音对应的语音数据。
如权利要求11所述的线下远场语音控制设备，其中，所述线下远场语音控制系统还包括触发模块，与所述语音采集模块连接，被配置为实时侦测用户发出的声音，并在确定用户发出的声音对应的声音数据包含预设激活指令时触发所述语音采集模块对用户语音进行采集。
如权利要求11所述的线下远场语音控制设备，其中，所述麦克风至少有两个。
如权利要求11所述的线下远场语音控制设备，其中，所述线下远场语音控制系统还包括显示器，与所述控制芯片连接，被配置为显示所述操作对应的界面。
如权利要求10所述的线下远场语音控制设备，其中，所述线下远场语音控制系统还包括显示器，与所述控制芯片连接，被配置为显示所述操作对应的界面。
一种线下远场语音控制设备，其中，所述线下远场语音控制设备应用线下远场语音控制方法；所述线下远场语音控制方法包括以下步骤：

对用户语音进行采集，获得对应的语音数据；

确定预设语音库中存在所述语音数据；

对所述语音数据进行编译压缩，获得操作指令；以及，

根据所述操作指令控制电视机实现对应的操作。
如权利要求16所述的线下远场语音控制设备，其中，所述根据所述操作指令控制电视机实现对应的操作的步骤，包括：

将所述操作指令与预设控制指令库进行匹配；以及，

确定匹配成功，根据所述预设控制指令库中所述操作指令对应匹配的控制指令实现对应的操作。
如权利要求17所述的线下远场语音控制设备，其中，所述将所述操作指令与预设控制指令库进行匹配的步骤，包括：

将所述操作指令与所述预设控制指令库中的控制指令进行字符串相似度匹配；以及，

确定所述操作指令与控制指令的字符串相似度在第一预设范围内时匹配成功。
如权利要求17所述的线下远场语音控制设备，其中，所述对用户语音进行采集，获得对应的语音数据的步骤，包括：

实时侦测用户发出的声音，并在确定用户发出的声音对应的声音数据包含预设激活指令时对用户语音进行采集，获得对应的语音数据。
如权利要求16所述的线下远场语音控制设备，其中，所述对用户语音进行采集，获得对应的语音数据的步骤，包括：

实时侦测用户发出的声音，并在确定用户发出的声音对应的声音数据包含预设激活指令时对用户语音进行采集，获得对应的语音数据。