CN110797048A

CN110797048A - 语音信息的获取方法及装置

Info

Publication number: CN110797048A
Application number: CN201810866714.9A
Authority: CN
Inventors: 廖湖锋; 王子; 刘健军
Original assignee: Gree Electric Appliances Inc of Zhuhai
Current assignee: Gree Electric Appliances Inc of Zhuhai
Priority date: 2018-08-01
Filing date: 2018-08-01
Publication date: 2020-02-14
Anticipated expiration: 2038-08-01
Also published as: CN110797048B; WO2020024508A1

Abstract

本申请提供了一种语音信息的获取方法及装置，其中，该方法包括：设备采集该设备所处环境中的第一语音信息；该设备确定该第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率，其中，该第二语音信息为该设备自身播放的语音；依据该第一声音频率和该第二声音频率的相似度，确定该第一语音信息中的第三语音信息，并从该第一语音信息中删除第三语音信息，得到目标语音信息。采用上述技术方案，解决了相关技术中设备自身播报的声音与设备采集的语音信息难以区分的问题，依据声音频率准确的将二者进行分离，使得设备可以准确获取用户的语音信息，实现与设备的语音交互。

Description

语音信息的获取方法及装置

技术领域

本申请涉及但不限于电器领域，具体而言，涉及一种语音信息的获取方法及装置。

背景技术

在相关技术中，在线语音设备已在市场上占有相当比重，而且还会不断增大，而一般在线语音设备都支持语音交互和附加功能，比如唱歌，播报天气等，但在语音设备播报时，与其语音交流会受到语音设备本身发音的影响。

针对相关技术中设备自身播报的声音与设备采集的语音信息难以区分的问题，目前还没有有效的解决方案。

发明内容

本申请实施例提供了一种语音信息的获取方法及装置，以至少解决相关技术中设备自身播报的声音与设备采集的语音信息难以区分的问题。

根据本申请的一个实施例，提供了一种语音信息的获取方法，包括：设备采集所述设备所处环境中的第一语音信息；所述设备确定所述第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率，其中，所述第二语音信息为所述设备自身播放的语音；依据所述第一声音频率和所述第二声音频率的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

根据本申请文件的另一个实施例，还提供了一种语音信息的获取方法，包括：第一设备采集自身所处环境中的第一语音信息，以及从网络侧获取当前环境中所有语音播放设备当前播放的第二语音信息，其中，所述环境中包括所述多个语音播放设备；所述第一设备确定所述第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率；依据所述第一声音频率和所述第二声音频率的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

根据本申请文件的另一个实施例，还提供了一种语音信息的获取方法，包括：设备采集所述设备所处环境中的第一语音信息；所述设备确定所述第一语音信息对应的第一特征信息，和第二语音信息对应的第二特征信息，其中，所述第二语音信息为所述设备自身播放的语音；依据所述特征信息和第二特征信息的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

根据本申请文件的另一个实施例，还提供了一种语音信息的获取装置，包括：第一采集模块，用于采集所述设备所处环境中的第一语音信息；第一确定模块，用于确定所述第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率，其中，所述第二语音信息为所述设备自身播放的语音；第二确定模块，用于依据所述第一声音频率和所述第二声音频率的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

根据本申请文件的另一个实施例，还提供了一种语音信息的获取装置，包括：第二采集模块，用于采集所述设备所处环境中的第一语音信息，以及从网络侧获取当前环境中所有语音播放设备当前播放的第二语音信息，其中，所述环境中包括所述多个语音播放设备；第三确定模块，用于确定所述第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率；第四确定模块，用于依据所述第一声音频率和所述第二声音频率的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

根据本申请文件的另一个实施例，还提供了一种语音信息的获取装置，包括：第三采集模块，用于采集所述设备所处环境中的第一语音信息；第五确定模块，用于确定所述第一语音信息对应的第一特征信息，和第二语音信息对应的第二特征信息，其中，所述第二语音信息为所述设备自身播放的语音；第六确定模块，用于依据所述特征信息和第二特征信息的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

根据本申请的又一个实施例，还提供了一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本申请的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本申请，设备采集该设备所处环境中的第一语音信息；该设备确定该第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率，其中，该第二语音信息为该设备自身播放的语音；依据该第一声音频率和该第二声音频率的相似度，确定该第一语音信息中的第三语音信息，并从该第一语音信息中删除第三语音信息，得到目标语音信息。采用上述技术方案，解决了相关技术中设备自身播报的声音与设备采集的语音信息难以区分的问题，依据声音频率准确的将二者进行分离，使得设备可以准确获取用户的语音信息，实现与设备的语音交互。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本申请实施例的一种语音信息的获取方法的家电设备的硬件结构框图；

图2是根据本申请实施例的语音信息的获取方法的流程图；

图3是根据本申请的一种语音设备的结构示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本申请。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

实施例一

本申请实施例一所提供的方法实施例可以在家电设备、计算机终端或者类似的运算装置中执行。以运行在家电设备上为例，图1是本申请实施例的一种语音信息的获取方法的家电设备的硬件结构框图。如图1所示，家电设备10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，可选地，上述家电设备还可以包括用于通信功能的传输装置106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述家电设备的结构造成限定。例如，家电设备10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块，如本申请实施例中的语音信息的获取方法对应的程序指令/模块，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至家电设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括家电设备10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种运行于上述家电设备的语音信息的获取方法，图2是根据本申请实施例的语音信息的获取方法的流程图，如图2所示，该流程包括如下步骤：

步骤S202，设备采集该设备所处环境中的第一语音信息；

该第一语音信息中可能包括自身播放的音乐等信息，也包括用户对设备的控制指令。

步骤S204，该设备确定该第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率，其中，该第二语音信息为该设备自身播放的语音；

步骤S206，依据该第一声音频率和该第二声音频率的相似度，确定该第一语音信息中的第三语音信息，并从该第一语音信息中删除第三语音信息，得到目标语音信息。

得到目标语音信息之后，可以识别目标语音信息的语义，确定用户的控制指令。

通过上述步骤，设备采集该设备所处环境中的第一语音信息；该设备确定该第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率，其中，该第二语音信息为该设备自身播放的语音；依据该第一声音频率和该第二声音频率的相似度，确定该第一语音信息中的第三语音信息，并从该第一语音信息中删除第三语音信息，得到目标语音信息。采用上述技术方案，解决了相关技术中设备自身播报的声音与设备采集的语音信息难以区分的问题，依据声音频率准确的将二者进行分离，使得设备可以准确获取用户的语音信息，实现与设备的语音交互。

可选地，上述步骤的执行主体可以为空调，冰箱等家电设备等，但不限于此。

可选地，该第二声音频率通过以下方式确定：从该设备的缓存中获取该第二声音频率。设备自身播放的语音信息，一般来讲将预先在缓存中存放，也可能从其他连接的存储介质中获取，例如U盘。

可选地，依据该第一声音频率和该第二声音频率的相似度，确定该第一语音信息中的第三语音信息，并从该第一语音信息中删除第三语音信息，得到目标语音信息，包括：在该第一声音频率中，确定与该第二声音频率的相似度高于阈值的声音频率，并将确定的声音频率作为该第三声音频率；将该第三声音频率对应的第三语音信息从该第一语音信息中的删除，得到该目标语音信息。

第一声音频率中与第二声音频率相似度高的部分，可以确定是自身播放的那部分声音，将其删除掉，剩下的即为用户的语音信息。

可选地，设备采集该设备所处环境中的第一语音信息之后，在检测到该设备当前未播放语音时，确定该第一语音信息为该目标语音信息。

可选地，设备采集该设备所处环境中的第一语音信息，包括：该设备通过麦克风采集该第一语音信息。

根据本申请文件的另一个实施例，还提供了一种语音信息的获取方法，包括以下步骤：

步骤一，第一设备采集该设备所处环境中的第一语音信息，以及从网络侧获取当前环境中所有语音播放设备当前播放的第二语音信息，其中，该环境中包括该多个语音播放设备；

步骤二，该第一设备确定该第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率；

步骤三，依据该第一声音频率和该第二声音频率的相似度，确定该第一语音信息中的第三语音信息，并从该第一语音信息中删除第三语音信息，得到目标语音信息。

在当前环境中存在多个语音播放设备时，多个语音播放设备将自身播放的语音信息共享至网络侧设备，供其他设备在识别用户的控制命令时进行参考，以尽可能的留下用户的语音信息。

采用上述技术方案，解决了相关技术中设备自身播报的声音与设备采集的语音信息难以区分的问题，依据声音频率准确的将二者进行分离，使得设备可以准确获取用户的语音信息，实现与设备的语音交互。

步骤一，设备采集该设备所处环境中的第一语音信息；

步骤二，该设备确定该第一语音信息对应的第一特征信息，和第二语音信息对应的第二特征信息，其中，该第二语音信息为该设备自身播放的语音；

步骤三，依据该特征信息和第二特征信息的相似度，确定该第一语音信息中的第三语音信息，并从该第一语音信息中删除第三语音信息，得到目标语音信息。

可选地，该第一特征信息和第二特征信息均包括以下至少之一：声音频率、音调、音色、音量。

下面结合本申请文件的另一个实施例进行说明。

本申请文件中针对以下技术问题：在线语音设备接收的语音信号不受其播报的声音影响。

本申请文件中的设备支持在线语音功能，也支持语音播报和交互功能。

本申请文件中整个小系统包含语音采集部分、控制单元、语音播放部分，图3是根据本申请的一种语音设备的结构示意图，如图3所示，包括语音采集模块，控制单元与语音播放模块，在设备进行播报语音时，控制单元同时把播报声音的频率缓存下来；同时，控制单元接收到语音采集到音频；在控制单元内，将语音采集的音频与语音播报的音频缓存做一个比对，将语音采集到的音频内容删除掉与语音播报音频相似度极高的部分删除，剩余部分则为实际采集环境的音频内容。

采用上述技术方案，排除在线语音设备本身播报的声音的影响，提高了在线语音设备对声音采样的准确性。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

实施例二

在本实施例中还提供了一种语音信息的获取装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

根据本申请文件的另一个实施例，还提供了一种语音信息的获取装置，包括：

第一采集模块，用于采集该设备所处环境中的第一语音信息；

第一确定模块，用于确定该第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率，其中，该第二语音信息为该设备自身播放的语音；

第二确定模块，用于依据该第一声音频率和该第二声音频率的相似度，确定该第一语音信息中的第三语音信息，并从该第一语音信息中删除第三语音信息，得到目标语音信息。

第二采集模块，用于采集该设备所处环境中的第一语音信息，以及从网络侧获取当前环境中所有语音播放设备当前播放的第二语音信息，其中，该环境中包括该多个语音播放设备；

第三确定模块，用于确定该第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率；

第四确定模块，用于依据该第一声音频率和该第二声音频率的相似度，确定该第一语音信息中的第三语音信息，并从该第一语音信息中删除第三语音信息，得到目标语音信息。

第三采集模块，用于采集该设备所处环境中的第一语音信息；

第五确定模块，用于确定该第一语音信息对应的第一特征信息，和第二语音信息对应的第二特征信息，其中，该第二语音信息为该设备自身播放的语音；

第六确定模块，用于依据该特征信息和第二特征信息的相似度，确定该第一语音信息中的第三语音信息，并从该第一语音信息中删除第三语音信息，得到目标语音信息。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例三

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：

S1，设备采集所述设备所处环境中的第一语音信息；

S2，所述设备确定所述第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率，其中，所述第二语音信息为所述设备自身播放的语音；

S3，依据所述第一声音频率和所述第二声音频率的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本申请的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输装置以及输入输出设备，其中，该传输装置和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，设备采集所述设备所处环境中的第一语音信息；

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种语音信息的获取方法，其特征在于，包括：

设备采集所述设备所处环境中的第一语音信息；

所述设备确定所述第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率，其中，所述第二语音信息为所述设备自身播放的语音；

依据所述第一声音频率和所述第二声音频率的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

2.根据权利要求1所述的方法，其特征在于，所述第二声音频率通过以下方式确定：

从所述设备的缓存中获取所述第二声音频率。

3.根据权利要求1所述的方法，其特征在于，依据所述第一声音频率和所述第二声音频率的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息，包括：

在所述第一声音频率中，确定与所述第二声音频率的相似度高于阈值的声音频率，并将确定的声音频率作为第三声音频率；

将所述第三声音频率对应的第三语音信息从所述第一语音信息中的删除，得到所述目标语音信息。

4.根据权利要求1所述的方法，其特征在于，设备采集所述设备所处环境中的第一语音信息之后，所述方法还包括：

在检测到所述设备当前未播放语音时，确定所述第一语音信息为所述目标语音信息。

5.根据权利要求1所述的方法，其特征在于，设备采集所述设备所处环境中的第一语音信息，包括：

所述设备通过麦克风采集所述第一语音信息。

6.一种语音信息的获取方法，其特征在于，包括：

第一设备采集自身所处环境中的第一语音信息，以及从网络侧获取当前环境中所有语音播放设备当前播放的第二语音信息，其中，所述环境中包括多个语音播放设备；

所述第一设备确定所述第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率；

7.一种语音信息的获取方法，其特征在于，包括：

设备采集所述设备所处环境中的第一语音信息；

所述设备确定所述第一语音信息对应的第一特征信息，和第二语音信息对应的第二特征信息，其中，所述第二语音信息为所述设备自身播放的语音；

依据所述特征信息和第二特征信息的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

8.根据权利要求7所述的方法，其特征在于，所述第一特征信息和第二特征信息均包括以下至少之一：

声音频率、音调、音色、音量。

9.一种语音信息的获取装置，其特征在于，包括：

第一采集模块，用于采集设备所处环境中的第一语音信息；

第一确定模块，用于确定所述第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率，其中，所述第二语音信息为所述设备自身播放的语音；

第二确定模块，用于依据所述第一声音频率和所述第二声音频率的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

10.一种语音信息的获取装置，其特征在于，包括：

第二采集模块，用于采集设备所处环境中的第一语音信息，以及从网络侧获取当前环境中所有语音播放设备当前播放的第二语音信息，其中，所述环境中包括多个语音播放设备；

第三确定模块，用于确定所述第一语音信息对应的第一声音频率，和第二语音信息对应的第二声音频率；

第四确定模块，用于依据所述第一声音频率和所述第二声音频率的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

11.一种语音信息的获取装置，其特征在于，包括：

第三采集模块，用于采集设备所处环境中的第一语音信息；

第五确定模块，用于确定所述第一语音信息对应的第一特征信息，和第二语音信息对应的第二特征信息，其中，所述第二语音信息为所述设备自身播放的语音；

第六确定模块，用于依据所述特征信息和第二特征信息的相似度，确定所述第一语音信息中的第三语音信息，并从所述第一语音信息中删除第三语音信息，得到目标语音信息。

12.一种存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至8任一项中所述的方法。

13.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行所述权利要求1至8任一项中所述的方法。