CN107277690B

CN107277690B - 声音处理方法、装置和电子设备

Info

Publication number: CN107277690B
Application number: CN201710649801.4A
Authority: CN
Inventors: 徐荣强
Original assignee: Beijing Horizon Information Technology Co Ltd
Current assignee: Beijing Horizon Information Technology Co Ltd
Priority date: 2017-08-02
Filing date: 2017-08-02
Publication date: 2020-07-24
Anticipated expiration: 2037-08-02
Also published as: CN107277690A

Abstract

公开了一种声音处理方法、装置和电子设备。所述方法包括：获取目标设备上的声音采集器件采集的混合信号和所述声音采集器件的位置，所述混合信号包括声音源信号和噪声；获取来自非目标设备的噪声及所述噪声发生的位置；根据所述目标设备上的声音采集器件的位置、所述噪声及所述噪声发生的位置来计算所述噪声的拟合版本；以及从混合信号中去除所述噪声的拟合版本，从而提取所述声音源信号。因此，可以通过考虑噪声的特定属性，实现噪声的有效去除，更好地提取声音源信号。

Description

声音处理方法、装置和电子设备

技术领域

本申请涉及音频技术领域，且更具体地，涉及一种声音处理方法、装置和电子设备、计算机程序产品和计算机可读存储介质。

背景技术

在家居环境中，多个设备可装备有麦克风系统和/或扬声器系统，其扬声器系统发出的声音，如来自电视、音响的声音，对于其他设备都是噪声。另外，如洗衣机、空调、空气净化器、扫地机器人、移动机器人玩具等，其电机或者风扇转动的声音，对于其他设备也是噪声。

在现有技术中，为了对声音源信号(例如，语音)进行提取并对噪声进行去除，无论噪声来自何处、什么时候出现、具有什么属性，都是采用盲处理，即利用从时域和频域直接去除噪声的算法来提取语音。这种方法一定程度会损伤语音本身。由于家居环境声场分布愈发趋于复杂，传统的声音处理方法会对有用的语音损害更大。

因此，在不知道噪声的特定属性的情况下，盲处理不是一种有效的声音源信号提取方法。

发明内容

鉴于上述现有技术状况，提出了本申请。本申请的实施例提供了一种声音处理方法、装置、电子设备、计算机程序产品和计算机可读存储介质，其可以通过考虑噪声的空域属性，实现噪声的有效去除，更好地提取声音源信号。

根据本申请的一个方面，提供了一种声音处理方法，包括：获取目标设备上的声音采集器件采集的混合信号和所述声音采集器件的位置，所述混合信号包括声音源信号和噪声；获取来自非目标设备的噪声及所述噪声发生的位置；根据所述目标设备上的声音采集器件的位置、所述噪声及所述噪声发生的位置来计算所述噪声的拟合版本；以及从混合信号中去除所述噪声的拟合版本，从而提取所述声音源信号。

根据本申请的另一方面，提供了一种声音处理装置，包括：信号获取单元，用于获取目标设备上的声音采集器件采集的混合信号和所述声音采集器件的位置，所述混合信号包括声音源信号和噪声；噪声获取单元，用于获取来自非目标设备的噪声及所述噪声发生的位置；噪声拟合单元，用于根据所述目标设备上的声音采集器件的位置、所述噪声及所述噪声发生的位置来计算所述噪声的拟合版本；以及噪声去除单元，用于从混合信号中去除所述噪声的拟合版本，从而提取所述声音源信号。

根据本申请的另一方面，提供了一种电子设备，包括：处理器；存储器；以及存储在所述存储器中的计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行上述的声音处理方法。

根据本申请的另一方面，提供了一种计算机程序产品，包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行上述的声音处理方法。

根据本申请的另一方面，提供了一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行上述的声音处理方法。

与现有技术相比，采用根据本申请实施例的声音处理方法、装置、电子设备、计算机程序产品和计算机可读存储介质，可以通过考虑噪声的特定属性，例如空域属性(相对位置关系)，乃至时频域属性，有针对性地对噪声去除算法进行优化，实现噪声的有效去除，更好地提取声音源信号。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1A到1D图示了根据本申请实施例的声音处理操作的应用场景的示意图。

图2图示了根据本申请实施例的声音处理方法的流程图。

图3图示了根据本申请实施例的计算噪声的拟合版本的步骤的流程图。

图4图示了根据本申请实施例的噪声拟合的示意图。

图5图示了根据本申请实施例的从混合信号中去除噪声的拟合版本的流程图。

图6图示了根据本申请实施例的位置确定的流程图。

图7图示了根据本申请实施例的确定设备的基准位置的三维坐标的步骤的流程图。

图8图示了根据本申请实施例的声音处理装置的框图。

图9图示了根据本申请实施例的电子设备的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

申请概述

例如，在家居环境中，房间内可能有空调、冰箱、洗衣机、电视、音响、音箱等家电设备。每个设备可能装备有一个或多个麦克风和/或一个或多个扬声器。在现有技术中，各设备的资源无法相互共享。典型地，一个设备发出的声音会成为另一个设备的噪声，然而，由于缺乏信息共享，在另一个设备上进行噪声去除处理时，通常采用一般性的盲处理算法，而没有很好地利用这些设备之间的声噪转换特性。这导致难以有效去除噪声并提取有用的声音源信号。

针对现有技术中的上述缺陷，本申请的基本构思是通过共享各设备的资源，在设备之间交互信息，利用作为目标设备的噪声的非目标设备发出的声音的特定属性，在目标设备的噪声去除处理中，根据该声音的特定属性进行模拟，计算出目标设备收到的噪声的拟合版本，以便从目标设备的麦克风采集的包括声音源信号和噪声的混合信号中，有效去除噪声，从而提取声音源信号。声音源信号通常包括用户(声源)发出的语音控制命令，用于对目标设备进行控制。因此，本申请提出一种声音处理方法、装置、电子设备、计算机程序产品和计算机可读存储介质，其可以通过充分考虑噪声的特定属性，例如空域属性(相对位置关系)，乃至时频域属性，实现噪声的有效去除，更好地提取声音源信号。

需要说明的是，本申请的上述基本构思不但可以应用于家居或家庭环境中的声音控制应用中，还可以应用于其他系统应用中，只要其中联网的设备中的目标设备(收声设备)具有声音采集器件并且可以共享非目标设备(发声设备)发出的特定声音的声音属性即可。例如，本申请同样适用于工业环境中的声音处理和控制，其可以充分利用每个发声设备的特定声音属性，例如发声设备与收声设备之间的相对位置关系，乃至发出声音的时频域属性，提高噪声去除的有效性。此外，本申请的上述基本构思不但可以应用于提取语音的噪声去除处理场景中，还可以应用于诸如动物、机器人等其他各种声音源的声音提取处理场景中。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性系统

图1A为家庭应用环境的示意图，其中可能具有空调、电视、洗衣机、冰箱、音响(音箱)等家电设备。该家庭应用环境还具有控制中心，用于对所有设备进行协调控制。在一个示例中，控制中心的功能可以由某个具有足够计算处理能力的、能够与上述家电设备进行通信的单机设备完成。可替代地，该控制中心也可以集成到家庭环境中的上述某个家电设备中，或者，该控制中心也可以分布在多个家电设备之间。

由于智能家居声音控制的目的，大部分的家电设备都配备有麦克风(MIC)，如图1B所示的设备100和如图1C所示的设备300所代表的，电视、音响、空调、洗衣机、冰箱可能配备有一个或多个麦克风。如图1B所示，如电视、音响的设备可能还配备有一个或多个扬声器。如音响的设备配备的扬声器可与音响集成，或者可与音响分开布置在家庭应用环境中，如图1A中的音箱所示，其中配备的扬声器可由音响驱动。需要注意的是，图1B概括地图示了设备100，虽然如图1B所示的设备100配备了麦克风和扬声器，但是，设备100可以只配备麦克风，而不具有扬声器。如图1C所示，如空调、洗衣机、冰箱的设备300为了完成自身的特定功能，可能还配备有电机和/或风扇，此处的电机是独立电机，区别于驱动风扇的风扇电机，通常发出明显的声音，如洗衣机、冰箱的电机；而风扇及其电机发出的声音以风扇声音表示。

设备100和设备300可以是任何类型的电子设备，其还具有位置校准器，用于确定设备100、300乃至设备100、300上的麦克风和发声器件(扬声器、电机和/或风扇)在预定坐标系中的位置。图1D为目标设备上的麦克风采集声音的简化示意图，其中麦克风MIC 110接收声源105的声音源信号，而且接收来自其他设备(非目标设备)的扬声器SPK 210、电机MOT310和/或风扇FAN 410的声音，其他声音相对声音源信号都是噪声。例如，扬声器发出的声音由于随着播放节目内容的变化而不断变化，所以可以称为非稳态噪声；而电机和/或风扇发出的声音由于在工作模式固定的情况下通常保持不变，所以称为稳态噪声。

在本申请的基本构思下，在一个示例中，为了实现对于非目标设备的稳态噪声的消除，每个非目标设备上还可以配备有一个麦克风，用于采集来自自身电机MOT 310和/或风扇FAN 410的稳态噪声。在另一示例中，类似地，为了进一步实现对于目标设备自身稳态噪声的消除，目标设备上的麦克风还可以采集自身设备上的稳态噪声，一般是在声源105没有发出声音源信号的时间段，得到的稳态噪声可以推延到该麦克风采集混合信号时的情况。

上述麦克风，作为声音采集器件，例如可以是全向麦克风和/或指向麦克风。全向麦克风对于来自不同角度的声音，其灵敏度是基本相同的，其头部采用压力感应的原理设计，振膜只接受来自外界的压力。指向麦克风主要采用压力梯度的原理设计，通过头部腔体后面的小孔，振膜接受到正反两面的压力，因此振膜受不同方向的压力并不相同，麦克风具有了指向性。

该声源105可以是任何类型的声源，可以包括发出希望关注信号的信号源。例如，该声源可以是有生命的声源和无生命的声源。例如，有生命的声源可以包括人和动物等；而无生命的声源可以包括机器人、电视机、音响等。

需要注意的是，上述应用场景仅是为了便于理解本申请的精神和原理而示出，本申请的实施例不限于此。相反，本申请的实施例可以应用于可能适用的任何场景。例如，在诸如家庭、工业等的任何应用环境中可以包括两个或更多设备，该设备可以包括一个或多个声音采集器件，该声源也可以是一个或多个。

示例性方法

下面结合图1A到1D的应用场景，参考图2来描述根据本申请实施例的声音处理方法。

图2图示了根据本申请实施例的声音处理方法的流程图。

如图2所示，根据本申请实施例的声音处理方法可以包括步骤S100、步骤S200、步骤S300和步骤S400。

在步骤S100中，获取目标设备上的声音采集器件采集的混合信号和所述声音采集器件的位置。如上所述，所述混合信号包括声音源信号和噪声。

例如，为了对目标设备进行语音控制，该声源105发出语音命令，作为声音源信号传播到目标设备，由目标设备上的声音采集器件(例如，麦克风)采集。这时，该麦克风也会采集到其他设备发出的声音，作为相对声音源信号的噪声。因此，目标设备上的该麦克风采集了混合信号。

在步骤S200中，获取来自非目标设备的噪声及所述噪声发生的位置。

在一个示例中，步骤S200中的获取来自非目标设备的噪声可以包括获取所述噪声的时域属性，包括所述噪声发生的时间段和波形。

在步骤S300中，根据所述目标设备上的声音采集器件的位置、所述噪声及所述噪声发生的位置来计算所述噪声的拟合版本。例如，需要根据环境中的每种噪声来分别计算其拟合版本，可以由图3的流程图实施所述计算。

图4图示了根据本申请实施例的噪声拟合的示意图。

如图4所示，除了来自声源105的声音源信号之外，目标设备B上的麦克风MIC 110还采集从一个或多个非目标设备A发出的噪声，其可能包括稳态噪声和非稳态噪声。即，噪声传播经过非目标设备A的发出位置和目标设备B的麦克风MIC 110之间的距离，由MIC 110采集。对于稳态噪声，为了进行噪声拟合，利用非目标设备A上设置的麦克风MIC 120采集其电机和/或风扇(MOT/FAN)发出的声音，执行声电处理转化为电信号，再模拟声音传播到达MIC 110，因为已经转化为电信号，所以只由MIC 110相对MIC 120进行归一化调整(使得麦克风的不同声电转换参数归一化)。对于非稳态噪声，其音频内容由音量设置调整幅度，再被扬声器执行电声处理转化为声音发出；然后通过声音传播，由MIC 110采集。

根据图4所示的噪声拟合原理，如图3所示，计算噪声的拟合版本的步骤可以包括：

在步骤S310中，根据所述噪声发生的位置和所述目标设备上的所述声音采集器件的位置，确定所述噪声在所述目标设备上接收的衰减比率；以及

在步骤S320中，根据所述噪声发生的时间段和波形，以所述目标设备上的所述声音采集器件的声电转换参数，对所述衰减比率的噪声波形进行声电转换处理，得到所述噪声在对应时间段的拟合版本。

声波的幅度(或强度)随距离衰减。例如，在步骤S310中，所述噪声从其发生的位置传播到目标设备而被其上的麦克风采集，噪声的传播随着传播距离而衰减。因此，根据噪声的传播距离可以确定所述噪声到达所述目标设备上的麦克风发生的衰减比率。具体地，在正常情况下，声波与麦克风之间的距离增大一倍，能量衰减6dB，因此，可以根据该距离确定能量衰减，代表所述衰减比率。

接着，在步骤S320中，以目标设备上的麦克风的声电转换参数，按照所述噪声发生的时间段和波形，对以所述衰减比率衰减后的噪声波形进行声电转换处理，得到所述噪声在对应时间段的拟合版本。

例如，在特定的声电转换参数下，目标设备上的麦克风可将20dBSPL的音频声信号转换为-10dB的音频电信号，如果接收到的音频声信号具有更大的功率，比如26dBSPL，由于麦克风的声电转换参数是不变的，根据该参数，最终麦克风输出的音频电信号的强度将变为-4dB。

随后，在步骤S400中，从混合信号中去除所述噪声的拟合版本，从而提取所述声音源信号。

在一个示例中，例如，可以通过互相关将所述噪声的拟合版本波形和所述混合信号对齐，然后在所述噪声的对应时间段中从混合信号中去除所述噪声的拟合版本。通过互相关可以找到拟合后的噪声波形和混合信号波形的相关性，将两个波形对齐，即进行同步，以便实现准确的波形减除操作。

在另一个示例中，步骤S400可以由图5的流程图实施。

如图5所示，该步骤S400可以包括：

在步骤S520中，确定所述噪声到达所述目标设备的延迟；以及

在步骤S530中，通过对到达所述目标设备的所述噪声发生的时间段和波形进行延迟处理，将所述噪声的拟合版本波形和所述混合信号对齐，然后在所述噪声的对应时间段中从混合信号中去除所述噪声的拟合版本。

在一个示例中，例如，步骤S520可以包括以下步骤：

首先，根据所述噪声发生的位置和所述目标设备上的所述声音采集器件的位置之间的声程，确定所述噪声到达所述目标设备的声程延迟。

然后，根据所述噪声发生后直到所述目标设备上的所述声音采集器件的声电转换经历的拟合处理的时间，确定所述噪声到达所述目标设备的拟合处理延迟。

最后，可以将所述声程延迟减去所述拟合处理延迟，确定为所述噪声到达所述目标设备的延迟。

如上所述，所述噪声包括稳态噪声和非稳态噪声，噪声的拟合处理按照噪声的类型而存在区别。

如图4所示，例如，在噪声包括非稳态噪声的一个示例中，非稳态噪声与非目标设备播放的音频内容、当前音量设置和其扬声器的功率有关。那么，获取所述噪声的时域属性可以包括：获取所述非目标设备播放的音频内容、当前音量设置和其扬声器的功率；并且根据所述音频内容确定所述非稳态噪声的时域属性，包括所述非稳态噪声发生的时间段和波形。进一步，根据所述扬声器的功率可以确定其电声转换参数，并且根据所述当前音量设置和所述扬声器的电声转换参数，确定所述非稳态噪声的波形的幅度。例如，在特定的电声转换参数下，扬声器可将-10dB的音频电信号转换为20dBSPL的音频声信号，如果用户调整音量设置(当前音量设置)，比如将-10dB的音频电信号放大+6dB到-4dB，而扬声器的电声转换参数是不变的，根据该参数，最终扬声器输出的音频声信号的强度将变为26dBSPL。

在噪声包括稳态噪声的另一个示例中，如图4所示，稳态噪声由非目标设备上的麦克风MIC 120采集，因而，噪声的拟合处理与非目标设备上的麦克风的声电转换参数有关。那么，获取所述噪声的时域属性可以包括：以所述非目标设备上的麦克风的非目标声电转换参数对所述稳态噪声进行逆向声电转换处理，确定所述稳态噪声的时域属性，包括所述稳态噪声发生的时间段和波形，以便在从混合信号中去除噪声的拟合版本的后续处理中以所述目标设备上的麦克风的声电转换参数进行声电转换处理，即对两个声电转换参数进行归一化。

此外，在图2所示的步骤S100和步骤S200中，需要获取目标设备上的声音采集器件的位置以及获取来自非目标设备的噪声发生的位置(即噪声发生器件的位置)，其可以通过各种方式获得。例如，其可以默认地设置在控制中心中。替换地，在获取上述位置之前，也可以通过图6所示的流程图来确定上述位置。所述噪声发生器件可以包括发出非稳态噪声的电声转换器件(例如扬声器)；和/或发出稳态噪声的噪声源器件(例如电机和/或风扇)。

图6图示了根据本申请实施例的位置确定的流程图。

如图6所示，确定目标设备上的声音采集器件的位置以及噪声发生的位置可以包括：

在步骤S610中，确定每个设备的基准位置在预定坐标系中的三维坐标；以及

在步骤S620中，根据在每个所述设备上所述声音采集器件或者所述噪声发生器件与所述基准位置之间的预定位置关系，确定所述声音采集器件或者所述噪声发生器件的三维坐标。

可以通过多种方式实施步骤S610。

在一个示例中，如图7所示，步骤S610可以包括：

在步骤S612中，响应于与所述设备建立初始化连接，向所述设备发送定位触发信号。所述定位触发信号用于触发所述设备上的定位发射器发射定位信号到多个定位信号接收器，所述定位信号接收器在所述预定坐标系中具有已知的三维坐标；

在步骤S614中，从所述多个定位信号接收器接收定位信号；以及

在步骤S616中，根据接收的多个定位信号的延迟信息和所述定位信号接收器的三维坐标，确定所述设备上的定位发射器的三维坐标，作为所述基准位置的三维坐标。

更具体地，所述预定坐标系可以是对家庭环境建立的三维坐标系。例如，设备上可以设有定位发射器，如图1B和图1C中所示的位置校准器，而房间的已知位置处可以设有多个(例如，3个)定位接收器(例如，该定位接收器可以是WIFI、蓝牙、红外等传感器)。当如冰箱的设备布置在室内时，可以通过联网配置将冰箱接入控制中心，在两者之间建立初始化连接。此时，冰箱上的如红外发射装置的定位发射器发射红外信号，房间内的定位接收器(如红外传感器)接收红外信号。根据红外发射和接收的时间以及幅度，通过三角定位原理，可确定出该设备上的定位发射器在房间中的空间坐标，作为该设备的基准位置的三维坐标。

在另一示例中，也可以预先由控制中心对家庭环境系统建立坐标系，并且将坐标系反馈给用户。当设备被布置在家庭环境系统时，如用户将冰箱放在房间的角落，用户可以根据已知的该角落的位置坐标信息和冰箱的维度信息，手动输入冰箱的基准位置(例如，冰箱的底面左前角)的三维坐标，作为该设备的基准位置的三维坐标。

对于步骤S620的具体实施，在一个示例中，如图1B和图1C中所示，每个设备还可以在出厂时确定MIC和/或噪声源器件(例如电机和/或风扇)与基准位置(例如，位置校准器的位置或如设备的底面左前角等其它特定基准位置)之间的已知相对位置关系(例如放置在出厂文件中)，这样即可进一步得到该设备上的MIC和/或噪声源器件在房间中的空间坐标。

需要说明的是，上面的示例仅仅考虑了来自目标设备外部(即，非目标设备)的噪声，当然，如果目标设备自身也在发出声音，那么该声音也会作为噪声被该目标设备上的麦克风采集，并在随后的步骤中进行去除。

为此，在一个示例中，上述声音处理方法还可以包括获取来自所述目标设备的噪声及其时域属性，包括所述噪声发生的时间段和波形。

在一个示例中，所述从混合信号中去除所述噪声的拟合版本可以包括：

根据所述目标设备的噪声发生后直到所述目标设备上的所述声音采集器件的声电转换经历的拟合处理的时间，确定所述目标设备的噪声的拟合处理延迟；以及通过对到达所述目标设备的所述噪声发生的时间段和波形进行延迟处理，将所述噪声的拟合版本波形和所述混合信号对齐，然后在所述噪声的对应时间段中从混合信号中去除所述噪声的拟合版本。

除了以下不同之外，通过与上述去除非目标设备中的噪声类似的手段，可以从混合信号中去除掉目标设备本身的噪声：目标设备本身发出的噪声没有声程导致的衰减和延迟，可以只考虑拟合处理延迟；另外，采用相同的麦克风，使得可以免除麦克风的声电转换参数的归一化调整。

由此可见，采用根据本申请实施例的声音处理方法，可以通过考虑噪声的特定属性，例如空域属性(相对位置关系)，乃至时频域属性，有针对性地对噪声去除算法进行优化，实现噪声的有效去除，更好地提取声音源信号。在语音控制应用中，提高了提取语音控制命令的有效性，从而提升了用户体验。

具体来说，根据本申请实施例的声音处理方法具有以下好处：由于家居环境中所有声音的诸如时域、频域、和/或空域等特定属性已知，可以根据这些信息做有针对性的噪声去除处理，减少对声音源信号的损伤。

示例性装置

下面，参考图8来描述根据本申请实施例的声音处理装置。

图8图示了根据本申请实施例的声音处理装置的框图。

如图8所示，根据本申请实施例的所述声音处理装置800可以包括：信号获取单元810，用于获取目标设备上的声音采集器件采集的混合信号和所述声音采集器件的位置，所述混合信号包括声音源信号和噪声；噪声获取单元820，用于获取来自非目标设备的噪声及所述噪声发生的位置；噪声拟合单元830，用于根据所述目标设备上的声音采集器件的位置、所述噪声及所述噪声发生的位置来计算所述噪声的拟合版本；以及噪声去除单元840，用于从混合信号中去除所述噪声的拟合版本，从而提取所述声音源信号。

在一个示例中，所述噪声获取单元820可以获取所述噪声的时域属性，包括所述噪声发生的时间段和波形。

在一个示例中，所述噪声拟合单元830可以根据所述噪声发生的位置和所述目标设备上的所述声音采集器件的位置，确定所述噪声在所述目标设备上接收的衰减比率；以及根据所述噪声发生的时间段和波形，以所述目标设备上的所述声音采集器件的声电转换参数，对所述衰减比率的噪声波形进行声电转换处理，得到所述噪声在对应时间段的拟合版本。

在一个示例中，所述噪声去除单元840可以通过互相关将所述噪声的拟合版本波形和所述混合信号对齐，然后在所述噪声的对应时间段中从混合信号中去除所述噪声的拟合版本。

在一个示例中，所述噪声去除单元840可以确定所述噪声到达所述目标设备的延迟；以及通过对到达所述目标设备的所述噪声发生的时间段和波形进行延迟处理，将所述噪声的拟合版本波形和所述混合信号对齐，然后在所述噪声的对应时间段中从混合信号中去除所述噪声的拟合版本。

在一个示例中，所述确定所述噪声到达所述目标设备的延迟可以包括：根据所述噪声发生的位置和所述目标设备上的所述声音采集器件的位置之间的声程，确定所述噪声到达所述目标设备的声程延迟；根据所述噪声发生后直到所述目标设备上的所述声音采集器件的声电转换经历的拟合处理的时间，确定所述噪声到达所述目标设备的拟合处理延迟；以及将所述声程延迟减去所述拟合处理延迟，确定为所述噪声到达所述目标设备的延迟。

在一个示例中，所述噪声可以包括所述非目标设备上的声音采集器件采集的稳态噪声和/或所述非目标设备上的电声转换器件输出的非稳态噪声。

在一个示例中，如果所述噪声包括非稳态噪声，则所述噪声获取单元820可以获取所述非目标设备播放的音频内容、当前音量设置和其电声转换器件的功率；以及根据所述音频内容确定所述非稳态噪声的时域属性，包括所述非稳态噪声发生的时间段和波形。

在一个示例中，所述噪声获取单元820可以根据所述电声转换器件的功率确定其电声转换参数，并且根据所述当前音量设置和所述电声转换器件的电声转换参数，确定所述非稳态噪声的波形的幅度。

在一个示例中，如果所述噪声包括稳态噪声，则所述噪声获取单元820可以以所述非目标设备上的所述声音采集器件的非目标声电转换参数对所述稳态噪声进行逆向声电转换处理，确定所述稳态噪声的时域属性，包括所述稳态噪声发生的时间段和波形，以便在从混合信号中去除噪声的拟合版本的后续处理中以所述目标设备上的所述声音采集器件的声电转换参数进行声电转换处理。

在一个示例中，所述声音处理装置800还可以包括位置确定单元(未示出)，用于确定所述目标设备上的所述声音采集器件的位置以及所述噪声发生的位置，所述噪声发生的位置即所述非目标设备上的噪声发生器件的位置。

在一个示例中，所述噪声发生器件可以包括：发出非稳态噪声的电声转换器件；和/或发出稳态噪声的噪声源器件。

在一个示例中，所述位置确定单元可以确定每个设备的基准位置在预定坐标系中的三维坐标；以及根据在每个所述设备上所述声音采集器件或者所述噪声发生器件与所述基准位置之间的预定位置关系，确定所述声音采集器件或者所述噪声发生器件的三维坐标。

在一个示例中，所述位置确定单元可以响应于与所述设备建立初始化连接，向所述设备发送定位触发信号，所述定位触发信号用于触发所述设备上的定位发射器发射定位信号到多个定位信号接收器，所述定位信号接收器在所述预定坐标系中具有已知的三维坐标；从所述多个定位信号接收器接收定位信号；以及根据接收的多个定位信号的延迟信息和所述定位信号接收器的三维坐标，确定所述设备上的定位发射器的三维坐标，作为所述基准位置的三维坐标。

在一个示例中，所述定位信号包括WIFI、蓝牙或者红外信号，所述定位信号接收器可以包括对应的WIFI、蓝牙或者红外传感器。

上述声音处理装置800中的各个单元和模块的具体功能和操作已经在上面参考图2到图7描述的声音处理方法中进行了详细介绍，因此，这里将省略其重复描述。

如上所述，根据本申请实施例的声音处理装置800可以实现在声音处理设备中，如图1A所示，该声音处理设备可以是家电设备，也可以是与它们独立的控制中心，也可以分布在两个或多个设备之间。

在一个示例中，根据本申请实施例的声音处理装置800可以作为一个软件模块和/或硬件模块而集成到该声音处理设备中。例如，该声音处理装置800可以是该声音处理设备的操作系统中的一个软件模块，或者可以是针对该声音处理设备所开发的一个应用程序；当然，该声音处理装置800同样可以是该声音处理设备的众多硬件模块之一。

可替代地，在另一示例中，该声音处理装置800与该声音处理设备也可以是分立的设备，并且该声音处理装置800可以通过有线和/或无线网络连接到该声音处理设备，并且按照约定的数据格式来传输交互信息。

示例性电子设备

下面，参考图9来描述根据本申请实施例的电子设备。该电子设备可以是图1A中的家电设备、或与其独立的控制中心(单机设备)，该单机设备可以与家电设备进行通信，以从它们接收所采集到的输入信号。可替代地，该电子设备也可以是分布在两个或多个家电设备之间。

图9图示了根据本申请实施例的电子设备的框图。

如图9所示，电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申请的各个实施例的声音处理方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如噪声、声音源信号等各种内容。

在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如，在该电子设备是设备100、300时，该输入装置13可以是上述的麦克风，用于捕捉声音源信号和噪声，作为输入信号。在该电子设备是单机设备时，该输入装置13可以是通信网络连接器，用于从设备100、300接收所采集的输入信号。

此外，该输入设备13还可以包括例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息，包括确定出的距离信息、方向信息等。该输出设备14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图9中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的声音处理方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的声音处理方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种声音处理方法，包括：

获取目标设备上的声音采集器件采集的混合信号和所述声音采集器件的位置，所述混合信号包括声音源信号和噪声；

获取来自非目标设备的噪声及所述噪声发生的位置；

根据所述目标设备上的声音采集器件的位置、所述噪声及所述噪声发生的位置来计算所述噪声的拟合版本；以及

从混合信号中去除所述噪声的拟合版本，从而提取所述声音源信号，

其中，所述获取来自非目标设备的噪声包括：

获取所述噪声的时域属性，包括所述噪声发生的时间段和波形，

所述计算所述噪声的拟合版本包括：

根据所述噪声发生的位置和所述目标设备上的所述声音采集器件的位置，确定所述噪声在所述目标设备上接收的衰减比率；以及

根据所述噪声发生的时间段和波形，以所述目标设备上的所述声音采集器件的声电转换参数，对所述衰减比率的噪声波形进行声电转换处理，得到所述噪声在对应时间段的拟合版本。

2.如权利要求1所述的方法，其中，所述从混合信号中去除所述噪声的拟合版本包括：

通过互相关将所述噪声的拟合版本波形和所述混合信号对齐，然后在所述噪声的对应时间段中从混合信号中去除所述噪声的拟合版本。

3.如权利要求2所述的方法，其中，所述从混合信号中去除所述噪声的拟合版本包括：

确定所述噪声到达所述目标设备的延迟；以及

通过对到达所述目标设备的所述噪声发生的时间段和波形进行延迟处理，将所述噪声的拟合版本波形和所述混合信号对齐，然后在所述噪声的对应时间段中从混合信号中去除所述噪声的拟合版本。

4.如权利要求3所述的方法，其中，所述确定所述噪声到达所述目标设备的延迟包括：

根据所述噪声发生的位置和所述目标设备上的所述声音采集器件的位置之间的声程，确定所述噪声到达所述目标设备的声程延迟；

根据所述噪声发生后直到所述目标设备上的所述声音采集器件的声电转换经历的拟合处理的时间，确定所述噪声到达所述目标设备的拟合处理延迟；以及

将所述声程延迟减去所述拟合处理延迟，确定为所述噪声到达所述目标设备的延迟。

5.如权利要求1-4中任一项所述的方法，其中，所述噪声包括所述非目标设备上的声音采集器件采集的稳态噪声和/或所述非目标设备上的电声转换器件输出的非稳态噪声。

6.如权利要求5所述的方法，其中，所述获取来自非目标设备的噪声的时域属性包括：

如果所述噪声包括非稳态噪声，则获取所述非目标设备播放的音频内容、当前音量设置和其电声转换器件的功率；以及

根据所述音频内容确定所述非稳态噪声的时域属性，包括所述非稳态噪声发生的时间段和波形。

7.如权利要求6所述的方法，其中，所述确定所述非稳态噪声的时域属性包括：

根据所述电声转换器件的功率确定其电声转换参数，并且根据所述当前音量设置和所述电声转换器件的电声转换参数，确定所述非稳态噪声的波形的幅度。

8.如权利要求5所述的方法，其中，所述获取来自非目标设备的噪声的时域属性包括：

如果所述噪声包括稳态噪声，则以所述非目标设备上的所述声音采集器件的非目标声电转换参数对所述稳态噪声进行逆向声电转换处理，确定所述稳态噪声的时域属性，包括所述稳态噪声发生的时间段和波形，以便在从混合信号中去除噪声的拟合版本的后续处理中以所述目标设备上的所述声音采集器件的声电转换参数进行声电转换处理。

9.如权利要求1所述的方法，还包括：

确定所述目标设备上的所述声音采集器件的位置以及所述噪声发生的位置，所述噪声发生的位置即所述非目标设备上的噪声发生器件的位置。

10.如权利要求9所述的方法，其中，所述确定所述目标设备上的所述声音采集器件的位置以及所述噪声发生的位置包括：

确定每个设备的基准位置在预定坐标系中的三维坐标；以及

根据在每个所述设备上所述声音采集器件或者所述噪声发生器件与所述基准位置之间的预定位置关系，确定所述声音采集器件或者所述噪声发生器件的三维坐标。

11.如权利要求10所述的方法，其中，所述确定每个设备的基准位置在预定坐标系中的三维坐标包括：

响应于与所述设备建立初始化连接，向所述设备发送定位触发信号，所述定位触发信号用于触发所述设备上的定位发射器发射定位信号到多个定位信号接收器，所述定位信号接收器在所述预定坐标系中具有已知的三维坐标；

从所述多个定位信号接收器接收定位信号；以及

根据接收的多个定位信号的延迟信息和所述定位信号接收器的三维坐标，确定所述设备上的定位发射器的三维坐标，作为所述基准位置的三维坐标。

12.如权利要求11所述的方法，其中，所述定位信号包括WIFI、蓝牙或者红外信号，所述定位信号接收器包括对应的WIFI、蓝牙或者红外传感器。

13.如权利要求9-12中任一项所述的方法，其中，所述噪声发生器件包括：

发出非稳态噪声的电声转换器件；和/或

发出稳态噪声的噪声源器件。

14.一种声音处理装置，包括：

信号获取单元，用于获取目标设备上的声音采集器件采集的混合信号和所述声音采集器件的位置，所述混合信号包括声音源信号和噪声；

噪声获取单元，用于获取来自非目标设备的噪声及所述噪声发生的位置；

噪声拟合单元，用于根据所述目标设备上的声音采集器件的位置、所述噪声及所述噪声发生的位置来计算所述噪声的拟合版本；以及

噪声去除单元，用于从混合信号中去除所述噪声的拟合版本，从而提取所述声音源信号,

其中，所述获取来自非目标设备的噪声包括：

所述计算所述噪声的拟合版本包括：

15.一种电子设备，包括：

处理器；

存储器；以及

存储在所述存储器中的计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-13中任一项所述的方法。

16.一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求1-13中任一项所述的方法。