CN113014460B

CN113014460B - 语音处理方法、家居主控设备、语音系统及存储介质

Info

Publication number: CN113014460B
Application number: CN201911329273.XA
Authority: CN
Inventors: 陈小平; 熊德林; 陈国丞; 连根辉
Original assignee: Foshan Viomi Electrical Technology Co Ltd
Current assignee: Foshan Viomi Electrical Technology Co Ltd
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2023-03-14
Anticipated expiration: 2039-12-20
Also published as: CN113014460A

Abstract

本申请涉及智能家居技术领域，具体公开了一种语音处理方法、家居主控设备、语音系统及存储介质。该方法包括：接收多个家电设备的麦克风采集的语音数据，确定每个语音数据的采集来源信息；根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据，其中，所述采集距离为家电设备与语音来源物体之间的距离；将所述至少一个语音数据确定为待处理语音数据。本申请可以通过多个家电设备上的麦克风提高语音处理的效率。

Description

语音处理方法、家居主控设备、语音系统及存储介质

技术领域

本申请涉及智能家居技术领域，尤其涉及一种语音处理方法、家居主控设备、语音系统及存储介质。

背景技术

随着物联网技术的发展，智能家居的功能变得越来越丰富，家电设备上一般都带有麦克风，用户可以使用通过家电设备的麦克风实现不同的语音功能，例如，通过一个家电设备的麦克风控制其他家电设备执行相应的功能。但是现有的家电设备上语音控制功能还不够完善，导致语音处理效率较低，因此如何提高多个家电设备之间的语音处理效率成为亟需解决的问题。

发明内容

本申请提供了一种语音处理方法、家居主控设备、语音系统及存储介质，可以通过多个家电设备上的麦克风提高语音处理的效率。

第一方面，本申请提供了一种语音处理方法，所述方法包括：

接收多个家电设备的麦克风采集的语音数据，确定每个语音数据的采集来源信息；

根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据，其中，所述采集距离为家电设备与语音来源物体之间的距离；

将所述至少一个语音数据确定为待处理语音数据。

第二方面，本申请还提供了一种家居中控设备，所述家居中控设备包括存储器和处理器；所述存储器用于存储计算机程序；所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现如上述的语音处理方法。

第三方面，本申请还提供了一种语音系统，包括家居主控设备和多个家电设备，所述多个家电设备和所述家居主控设备通信连接；所述家电设备用于将麦克风采集的语音数据发送至所述家居主控设备；所述家居主控设备用于执行如上述的语音处理方法。

第四方面，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如上述的语音处理方法。

本申请公开了一种语音处理方法、家居中控设备、语音系统及存储介质，所述方法包括接收多个家电设备的麦克风采集的语音数据，确定每个语音数据的采集来源信息；根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据，其中，所述采集距离为家电设备与语音来源物体之间的距离；将所述至少一个语音数据确定为待处理语音数据。本申请提供的语音处理方法可以在家电设备的麦克风采集到的语音数据中选择采集质量较高的语音数据作为待处理语音数据，可以采集到更有效的语音数据，进一步可以提高后续对待处理语音数据进行处理的处理效率。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请的实施例提供的一种语音处理方法的示意流程图；

图2为本申请实施例提供的一种语音处理方法的一个场景示意；

图3为本申请实施例提供的另一种语音处理方法的示意流程图；

图4为本申请实施例提供的一种语音处理方法的另一个场景示意；

图5为本申请实施例提供的另一种语音处理方法的示意流程图；

图6为本申请实施例提供的一种语音处理方法的另一个场景示意；

图7为本申请实施例提供的另一种语音处理方法的示意流程图；

图8为本申请实施例提供的另一种语音处理方法的示意流程图；

图9是本申请的实施例提供的一种家居主控设备的结构示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。

应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

本申请的实施例提供了一种语音处理方法、家居中控设备、语音系统及存储介质。下面结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

请参阅图1，图1是本申请的实施例提供的一种语音处理方法的示意流程图。所述语音处理方法可以是应用在家居主控设备中，家居主控设备可以是智能家居中任一具备处理功能的家电设备。示例性地，家居主控设备可以是智能电视机。所述方法包括步骤S101至步骤S103。

S101、接收多个家电设备的麦克风采集的语音数据，确定每个语音数据的采集来源信息。

其中，家电设备可以是具备麦克风功能的电子设备，家电设备可以包括：智能冰箱、智能电视、智能洗衣机、智能音箱和智能手机等等。家电设备的麦克风可以采集家电设备的周围环境中的声音，例如，用户在家电设备的周围环境里说话，家电设备的麦克风可以采集用户说话的语音数据。

需要说明的是，智能家居中具有多个家电设备，可以从中任选一个家电设备作为家居中控设备。家居中控设备用于执行本申请提供的语音处理方法，家居中控设备同时也可以作为采集语音数据的家电设备。例如，家居中控设备中的麦克风采集到语音数据后，再把语音数据发送到家居中控设备的处理器中，以便家居中控设备可以执行本申请提供的语音处理方法。家居中控设备也可以是不具备麦克风的家电设备，仅用于接收其他家电设备发送给的语音数据，并进行处理。

其他家电设备与家居中控设备建立了连接，可以是通过家居网络与家居中控设备连接，也可以是通过短距离通信方式与家居中控设备连接。示例性地，短距离通信方式可以是蓝牙和ZigBee等。其他家电设备的麦克风在采集到语音数据后，将语音数据发送给家居中控设备。

所述采集来源信息包括语音来源物体和麦克风之间的位置关系，或体现所述位置关系的语音参数信息。例如，用户站在某处说话，距离用户较近的家电设备的麦克风所采集到的语音数据，以及距离用户较远的家电设备的麦克风所采集到的语音数据，两个语音数据存在一定区别，因为两个麦克风与用户的位置关系不同，导致两个麦克风采集的语音数据的采集来源信息有所不同。

在接收到语音数据时，确定每个语音数据的采集来源信息，进而可以确定每个麦克风与语音来源物体之间的位置关系。

S102、根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据，其中，所述采集距离为家电设备与语音来源物体之间的距离。

其中，在确定来源物体和麦克风之间的位置关系后就可以确定每个麦克风和语音来源物体之间的距离。根据麦克风采集原理，距离麦克风越近的麦克风可以采集到质量越高的语音数据，包括更多的实际语音数据以及更少的噪声。

在确定语音数据的采集来源信息后，根据每个语音数据的采集来源信息确定距离来源物体最近的语音数据，可以作为待处理语音数据。

图2为本申请实施例提供的一种语音处理方法的场景示意，如图2所示，用户10站在家庭内的某处进行说话，家庭内有多个具备麦克风11的家电设备，每个家电设备的麦克风11在用户10说话时，可以采集到用户10的语音数据。根据采集距离不同，每个麦克风采集到的语音数据的采集来源信息有所不同。可以将采集距离最短的一个语音数据确定为待处理语音数据。

还可以确定采集距离最短的多个语音数据作为待处理语音数据，可以是将多个语音数据依据采集距离依据长短进行排序，将排在最后的多个语音数据确定为待处理语音数据。以便可以根据多个的待处理语音数据进行多声道的语音处理，示例性地，可以根据采集方位不同的麦克风的采集的语音数据生成立体语音。

作为本申请的一个实施方式，所述采集来源信息包括语音幅值。

其中，采集距离不同的麦克风所采集到的语音数据的语音幅值有所不同。示例性地，可以预先设置不同采集距离和语音幅值的关系模型，如此可以根据采集到的每个语音数据的语音幅值，依据所述关系模型确定所述语音数据的采集距离。在得到所有语音数据的采集距离后，就可以确定采集距离最短的至少一个语音数据。

可选地，所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据还可以通过如下方式实施：

从多个语音数据中确定语音幅值最大的至少一个语音数据。

其中，可以无需计算语音数据的采集距离，而是直接从多个语音数据中选择语音幅值最大的语音数据作为待处理语音数据，语音幅值越大的语音数据表示采集距离越短，如此可以确定出采集距离最短的至少一个语音数据。

作为本申请的另一个实施方式，所述采集来源信息包括语音来源物体与家电设备的方位关系信息。

其中，语音来源物体和家电设备的方位关系信息，可以体现家电设备的麦克风与语音来源物体之间的位置关系。根据语音来源物体与家电设备的方位关系信息也可以确定语音来源物体与麦克风之间的采集距离。

示例性地，可以通过家电设备上的声波设备发送声波信号以检测语音来源物体的方位角和距离，将方位角和距离作为语音来源物体与家电设备的方位关系信息。

S103、将所述至少一个语音数据确定为待处理语音数据。

其中，在确定采集距离最短的至少一个语音数据未待处理语音数据后，可以根据实际应用需求对所述待处理语音数据进行相应的处理。示例性地，可以对待处理语音数据进行语音识别，或者将待处理语音数据作为通话语音数据发送到通信终端。

本申请提供的语音处理方法可以在家电设备的麦克风采集到的语音数据中选择采集质量较高的语音数据作为待处理语音数据，可以采集到更有效的语音数据，进一步可以提高后续对待处理语音数据进行处理的处理效率。

图3为本申请实施例提供的另一种语音处理方法的示意流程图。在上述实施例的基础上，所述采集来源信息包括语音来源物体与家电设备的方位关系信息，以及对所述接收多个家电设备的麦克风采集的语音数据，确定每个语音数据的采集来源信息的操作进行了优化，如图3所示，所述方法包括：

S201、接收多个家电设备的麦克风采集的语音数据，其中，每个家电设备包括多个麦克风。

其中，家电设备上可以设置有多个麦克风，所述多个麦克风设置在家电设备上的不同位置。示例性地，多个麦克风可以是环绕麦克风。如图4所示，家电设备12上设置有第一麦克风111，第二麦克风112，第三麦克风113和第四麦克风114，四个麦克风沿着家电设备12的边缘依次设置，用户10在进行说话时，四个麦克风均可以采集到用户10的语音数据，但是因为每个麦克风的设置位置不同，其相对于用户10的位置关系也有差别，所以家电设备12上的每个麦克风所采集到的语音数据都有差别。

S202、根据每个家电设备的多个麦克风采集的语音数据以及多个麦克风在所述每个家电设备上的位置，确定语音来源物体与所述每个家电设备的方位关系信息。

根据家电设备上的每个麦克风所采集到的语音数据，以及每个麦克风在家电设备上的位置，可以确定语音来源物体与该家电设备的方位关系信息；可选地，可以是根据家电设备上每个麦克风采集的语音数据的语音幅值以及每个麦克风在家电设备上的位置，来确定语音来源物体与家电设备的方位关系信息。

示例性地，以点钟方向为例，家电设备的7点钟方向到12点钟方向依次设置有六个麦克风，其中，9点钟方向的麦克风采集到的语音数据的语音幅值最大，7点钟方向的麦克风到9点钟方向到麦克风采集的语音数据的语音幅值依次升高，9点钟方向的麦克风到12点钟方向的麦克风采集的语音数据的语音幅值依次降低。由此可以确定语音来源物体在家电设备的9点钟方向。

S203、根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据，其中，所述采集距离为家电设备与语音来源物体之间的距离。

S204、将所述至少一个语音数据确定为待处理语音数据。

上述操作的具体实施方式可以参考上文的相关描述，在此不再赘述。

可选地，如图5所示，所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据的操作可以通过如下方式实施：

S2031、根据语音来源物体与至少两个家电设备的方位关系信息确定所述语音来源物体的来源位置；

S2032、根据所述语音来源物体的来源位置与每个家电设备的设备位置，确定每个家电设备与语音来源物体之间的距离，得到采集距离；

S2033、从多个语音数据中确定采集距离最短的至少一个语音数据。

其中，所述方位关系信息可以包括语音来源物体与家电设备的相位角，以及所述家电设备的设备位置。家电设备的设备位置可以是预设，还可以是通过家电设备上自带的定位模块所确定的定位信息。

示例性地，语音来源物体为用户10，如图6所示，在确定用户10与一个家电设备121的方位关系信息后，从该家电设备121到用户10可以假设为一个向量；而另一个家电设备122到用户10可以假设为另一个向量；两个向量相交的位置即用户10的来源位置。所以根据语音来源物体与至少两个家电设备的方位关系信息确定所述语音来源物体的来源位置。

确定了语音来源物体的来源位置，再根据每个家电设备的设备位置，即可以确定语音来源位置与每个家电设备之间的距离，得到采集距离。进而可以从多个语音数据中确定采集距离最短的至少一个语音数据。

其中，家电设备的设备位置可以是预设的，也可以是根据家电设备上的定位模块的定位信息进行确定的。

本申请实施例提供的语音处理方法通过家电设备上的多个麦克风确定语音来源物体与家电设备的方位关系信息，可以确定语音来源物体的来源位置，进而确定采集距离，根据采集距离选择采集质量较高的语音数据作为待处理语音数据，可以采集到更有效的语音数据，进一步可以提高后续对待处理语音数据进行处理的处理效率。

作为本申请实施例提供的另一种语音处理方法，如图7所示，在上述任一实施例的基础上，在所述将所述至少一个语音数据确定为待处理语音数据之后，还包括如下操作：

S301、对所述待处理语音数据进行噪声过滤处理，以得到目标语音数据；

S302、根据所述目标语音数据进行语音识别处理。

其中，噪声过滤处理可以是对待处理语音数据进行分析，确定待处理语音数据中的噪声部分，并将待处理语音数据中的噪声数据进行去除，得到较为干净的有用语音数据。示例性地，所述待处理语音数据可以是用户的说话声音，而麦克风采集到的待处理语音数据中除了包括用户实际的人声数据，同时还采集了环境中的背景噪声。如果要对用户的声音数据进行语音识别处理，可以对待处理语音数据进行噪声过滤处理，以得到去除掉背景噪声的较为干净的人声数据，如此可以对人声数据进行语音识别处理，可以提高语音识别处理的准确性。

可选地，如图8所示，所述对所述待处理语音数据进行噪声过滤处理，以得到目标语音数据，可以通过如下方式实施：

S3011、从所述多个语音数据中确定采集距离大于预设距离的语音数据；

S3012、确定所述采集距离大于预设距离的语音数据的语音特征信息；

S3013、根据所述语音特征信息对所述待处理语音数据中进行过滤处理，以得到目标语音数据。

其中，预设距离可以是用于衡量采集质量的距离，大于预设距离的采集距离去采集会得到较弱的实际语音数据，而较强的噪声数据。

在多个家庭设备的麦克风采集的多个语音数据中，与语音来源物体相距大于预设距离的家庭设备的麦克风采集的语音数据包括较强的噪声数据和较弱的有用语音数据。

通过采集距离大于预设距离的语音数据可以去除待处理语音数据中的噪声数据。通过确定所述采集距离大于预设距离的语音数据的语音特征信息，该语音特征信息中包括较强的噪声特征。进而可以根据该语音特征信息来去除待处理语音数据中和语音特征信息相近的声音，若语音特征信息中包括较强的噪声特征，则可以去除待处理语音数据中的噪声。

可选地，还可以将所述采集距离大于预设距离的语音数据进行反向处理，反向后与所述待处理语音数据进行叠加，叠加后生成的语音数据即目标语音数据。

本申请实施例通过对所述待处理语音数据进行噪声过滤处理，以得到目标语音数据，而后根据所述目标语音数据进行语音识别处理，可以提高对待处理语音数据进行语音识别处理的准确率。

请参阅图9，图9是本申请的实施例提供的一种家居中控设备的结构示意性框图。该家居中控设备100可以是智能电视、智能冰箱或智能手机。

参阅图9，该家居中控设备100包括通过系统总线连接的处理器110与存储器120。可选地，还包括网络接口，其中，存储器可以包括非易失性存储介质和内存储器。

非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令，该程序指令被执行时，可使得处理器执行任意一种语音处理方法。

处理器用于提供计算和控制能力，支撑整个家居中控设备的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境，该计算机程序被处理器执行时，可使得处理器执行任意一种语音处理方法。

该网络接口用于进行网络通信，如发送分配的任务等。本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的家居中控设备的限定，具体的家居中控设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

应当理解的是，处理器可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中，在一个实施例中，所述处理器用于运行存储在存储器中的计算机程序，以实现如下步骤：

将所述至少一个语音数据确定为待处理语音数据。

在一个实施例中，所述采集来源信息包括语音幅值。

在一个实施例中，所述处理器在实现所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据时，用于实现：

从多个语音数据中确定语音幅值最大的至少一个语音数据。

在一个实施例中，所述采集来源信息包括语音来源物体与家电设备的方位关系信息。

在一个实施例中，所述处理器在实现所述接收多个家电设备的麦克风采集的语音数据，确定每个语音数据的采集来源信息时，用于实现：

接收多个家电设备的麦克风采集的语音数据，其中，每个家电设备包括多个麦克风；

根据每个家电设备的多个麦克风采集的语音数据以及多个麦克风在所述每个家电设备上的位置，确定语音来源物体与每个家电设备的方位关系信息。

根据语音来源物体与至少两个家电设备的方位关系信息确定所述语音来源物体的来源位置；

根据所述语音来源物体的来源位置与每个家电设备的设备位置，确定每个家电设备与语音来源物体之间的距离，得到采集距离；

从多个语音数据中确定采集距离最短的至少一个语音数据。

在一个实施例中，所述处理器在实现所述将所述至少一个语音数据确定为待处理语音数据之后，还用于实现：

对所述待处理语音数据进行噪声过滤处理，以得到目标语音数据；

根据所述目标语音数据进行语音识别处理。

在一个实施例中，所述处理器在实现所述对所述待处理语音数据进行噪声过滤处理，以得到目标语音数据时，用于实现：

从所述多个语音数据中确定采集距离大于预设距离的语音数据；

确定所述采集距离大于预设距离的语音数据的语音特征信息；

根据所述语音特征信息对所述待处理语音数据中进行过滤处理，以得到目标语音数据。

本申请的实施例中还提供一种语音系统，包括家居主控设备和多个家电设备，所述多个家电设备和所述家居主控设备通信连接；所述家电设备用于将麦克风采集的语音数据发送至所述家居主控设备；所述家居主控设备用于执行如上述任意实施例提供的语音处理方法。

本申请的实施例中还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序中包括程序指令，所述处理器执行所述程序指令，实现本申请实施例提供的任一项语音处理方法。

其中，所述计算机可读存储介质可以是前述实施例所述的家居中控设备的内部存储单元，例如所述家居中控设备的硬盘或内存。所述计算机可读存储介质也可以是所述家居中控设备的外部存储设备，例如所述家居中控设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种语音处理方法，其特征在于，包括：

将所述至少一个语音数据确定为待处理语音数据；

2.根据权利要求1所述的方法，其特征在于，所述采集来源信息包括语音幅值。

3.根据权利要求2所述的方法，其特征在于，所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据，包括：

从多个语音数据中确定语音幅值最大的至少一个语音数据。

4.根据权利要求1所述的方法，其特征在于，所述采集来源信息包括语音来源物体与家电设备的方位关系信息。

5.根据权利要求4所述的方法，其特征在于，所述接收多个家电设备的麦克风采集的语音数据，确定每个语音数据的采集来源信息，包括：

6.根据权利要求4所述的方法，其特征在于，所述根据所述采集来源信息从多个语音数据中确定采集距离最短的至少一个语音数据，包括：

从多个语音数据中确定采集距离最短的至少一个语音数据。

7.一种家居主控设备，其特征在于，所述家居中控设备包括存储器和处理器；

所述存储器用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至6中任一项所述的语音处理方法。

8.一种语音系统，其特征在于，包括家居主控设备和多个家电设备，所述多个家电设备和所述家居主控设备通信连接；

所述家电设备用于将麦克风采集的语音数据发送至所述家居主控设备；

所述家居主控设备用于执行如权利要求1至6中任一项所述的语音处理方法。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如权利要求1至6中任一项所述的语音处理方法。