WO2018095400A1

WO2018095400A1 - 音频信号处理方法与相关设备

Info

Publication number: WO2018095400A1
Application number: PCT/CN2017/112803
Authority: WO
Inventors: 冯银华; 龚连银
Original assignee: 深圳市道通智能航空技术有限公司
Priority date: 2016-11-24
Filing date: 2017-11-24
Publication date: 2018-05-31
Also published as: CN106527478A

Abstract

一种音频信号处理方法及相关设备，该方法包括：采集无人机的环境声音，以得到第一音频信号（101）；从所述第一音频信号中滤除噪声信号，以得到第二音频信号（102）；将所述第二音频信号与采集的视频信号合成为音视频信号，并将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放（103）。能够实现无人机在执行航拍任务时，得到音视频信号，提升用户体验。

Description

音频信号处理方法与相关设备

本申请要求于2016年11月24日提交中国专利局、申请号为201611059030.5、申请名称为“无人机现场声音获取方法与有声视频实现方法及相关装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及无人机技术领域，特别是涉及一种音频信号处理方法与相关设备。

背景技术

当前，随着无人机技术的发展，无人飞行器(Unmanned Aerial Vehicle，UAV)，可以简称为无人机，可以实现多种飞行任务，例如，航拍、农业种植植保、载物运输、区域巡检等。无人机可以通过与其通信的遥控器或终端的控制来实现上述飞行任务。

其中，无人机在执行航拍任务时，如何得到音视频信号，成为本领域技术人员积极研究的课题。

发明内容

本申请实施例提供了一种音频信号处理方法及相关设备，能够实现无人机在执行航拍任务时，得到音视频信号，提升用户体验。

第一方面，本申请实施例提供了一种音频信号处理方法，包括：

采集无人机的环境声音，以得到第一音频信号；

从所述第一音频信号中滤除噪声信号，以得到第二音频信号；

将所述第二音频信号与采集的视频信号合成为音视频信号，并将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放。

第二方面，本申请实施例提供了一种音频信号处理装置，包括：

接收单元，用于采集无人机的环境声音，以得到第一音频信号；

处理单元，用于从所述第一音频信号中滤除噪声信号，以得到第二音频信号；

所述处理单元，还用于将所述第二音频信号与采集的视频信号合成为音视频信号；

发送单元，用于将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放。

第三方面，本申请实施例提供了一种无人机，包括：

中心机壳；

机臂，其中，所述机臂与所述中心机壳连接；

音视频采集装置，其中，所述音视频采集装置设置在所述中心机壳或机臂；

处理器；以及

通信接口；

其中，所述音视频采集装置、所述处理器与所述通信接口电耦合；

所述音视频采集装置用于采集无人机的环境声音，以得到第一音频信号；

所述处理器用于从所述第一音频信号中滤除噪声信号，以得到第二音频信号；

所述处理器还用于将所述第二音频信号与采集的视频信号合成为音视频信号；将所述音视频信号发送至所述通信接口；

所述通信接口用于将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于被处理器执行以实现第一方面的方法。

本申请实施例中，通过采集环境声音，可以得到第一音频信号；从第一音频信号中滤除噪声信号，可以得到第二音频信号；将第二音频信号与采集的视频信号合成为音视频信号，并将该音视频信号发送至终端，该终端可以对接收到的音视频信号进行播放，从而实现了无人机在执行航拍任务时，得到音视频信号，提升用户的现场沉浸感，用户体验较高。

附图说明

图1是本申请实施例提供的一种音频信号处理方法的流程示意图；

图2是本申请实施例提供的另一种音频信号处理方法的流程示意图；

图3是本申请实施例提供的一种音频信号处理装置的结构示意图；

图4是本申请实施例提供的一种无人机的结构示意图。

具体实施方式

下面结合附图对本申请实施例进行详细说明。

请参阅图1，图1是本申请实施例提供的一种音频信号处理方法的流程示意图。如图1所示，该方法可以至少包括以下步骤。

步骤101：采集无人机的环境声音，以得到第一音频信号。

其中，可以利用无人机所配置的声音采集装置，例如，麦克风、声音传感器等装置对无人机的环境声音进行采集。

其中，无人机的环境声音包括无人机所处的外部环境中的现场声音，以及噪声。

可选地，所采集的噪声可以包括无人机所处的外部环境的噪声以及无人机中内部环境的噪声。其中，外部环境的噪声可以是无人机螺旋浆旋转时发出的噪声，或者现场发出的噪声等。举例说明，若无人机所处的现场为演唱会现场时，歌唱者的声音或听众发出的欢呼声即为现场声音，人群发出的嘈杂的声音为外部环境的噪声。其中，无人机中内部环境的噪声是指配置在无人机的机壳内的部件在工作时发出的噪声，例如，机壳内风扇发出的噪声等。

可选的，无人机在利用声音采集装置采集声音的同时，利用无人机配置的相机采集图像以形成视频信号，从而实现无人机得到的音频信号和视频信号同步。

步骤102：从所述第一音频信号中滤除噪声信号，以得到第二音频信号。

可选地，不同的噪声信号匹配不同的噪声特征。噪声特征可以包括频段特征、响度特征、音色特征、音调特征等中的至少一种。无人机可以根据预设的噪声特征，确定预设的噪声特征所匹配的噪声信号。例如，可以根据上述特征确定频率、幅度和相位，确定出与其匹配的噪声信号。

例如，无人机内可预设螺旋桨旋转发出的噪声对应的噪声特征。无人机还可以根据无人机所处的环境，预设与环境对应的噪声特征，例如，若所处环境为演唱会，可以预设听众发出的嘈杂声音对应的噪声特征；若所处环境为自然环境，可以预设风声对应的噪声特征等等。

进一步地，可以将用以表征预设噪声特征的噪声名称发送至终端，由终端将噪声名称作为选项提供给用户进行选择，终端根据用户的选取操作确定用户选取的噪声名称，并可以向无人机发送用户选取的噪声名称，进而无人机从全部预设的噪声特征中确定出用户选取的噪声名称所表征的噪声特征。

示例性地，当无人机得到第一音频信号后，可以根据所处环境对应的预设噪声特征，或者用户选取的预设噪声特征，来确定出与预设噪声特征匹配的噪声信号。

一种实现方式中，若预设噪音特征包括某一频段，确定第一音频信号在该频段的信号即为与预设噪音特征匹配的噪声信号。或者，根据预设噪音特征确定频率、相位和幅度，确定是否可以从第一音频信号中解析出与该频率、相位和幅度对应的波形信号，若可以，则确定该波形信号即为噪声信号。

其中，对第一音频信号中的噪声信号进行滤除处理，可以包括：将第一音频信号中的该噪声信号全部滤除，使第一音频信号中无该噪声信号；或者，将该噪声信号进行减弱处理，使噪声信号变换为非噪声信号，例如，降低噪声信号的响度、音调等，在此不予限定。

可选地，对噪声信号进行滤除可以通过以下任意一种方式。

方式一、可以确定与该噪声信号对应的反噪声信号。其中，反噪声信号用于抵消上述确定的噪声信号。例如，将上述噪声信号全部抵消，或者，减弱上述噪声信号，在此不予限定。一种实现方式中，反噪声信号可以与噪声信号的幅度和频率相同，相位相反。当然，反噪声信号还可以通过其他方式实现，在此不予限定。

进而，可以将该反噪声信号与第一音频信号进行叠加，从而达到滤除上述噪声信号的效果。反噪声信号与第一音频信号叠加，可以得到第二音频信号，该第二音频信号可以用于表示无人机所处的外部环境的现场声音。

方式二、若噪声信号仅在某一频段内出现，则可以将第一音频信号通过频段滤波器，以得到第二音频信号，进而达到滤除噪声信号的效果。

当然还可以通过其他方式，或上述两种方式的结合，在此不予限定。

步骤103：将所述第二音频信号与采集的视频信号合成为音视频信号，并将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放。

示例性地，无人机可以将得到的第二音频信号与采集的视频信号实时合成为音视频信号，或者，将第二音频信号片段与采集的视频信号片段进行合成为音视频信号片段。具体地，确定每个时间点对应的音频信号与视频信号，合成每个时间点对应的音视频信号，进而得到音视频片段。

示例性地，无人机可以通过上述方式得到的音视频信号发送至终端，从而终端可以播放该音视频信号，提升用户的沉浸感。

请参阅图2，图2是本申请实施例提供的另一种音频信号处理方法的流程示意图。如图2所示，该方法可以至少包括以下步骤。

步骤201：采集无人机的环境声音，以得到第一音频信号。

步骤202：从所述第一音频信号中滤除噪声信号，以得到第二音频信号。

其中，步骤201～202的实现方式可以参见上述实施例，在此不予赘述。

步骤203：对所述第二音频信号进行优化处理。

示例性地，优化处理可以包括对第二音频信号的均衡处理等通用处理方式，在此不予限定。

可选地，还可以对第二音频信号中的部分音频信号进行增强处理。

具体实现方式中，可以根据声音特征，从第二音频信号中确定出与该声音特征匹配的第三音频信号。进而对第三音频信号进行增强处理，以突出第三音频信号的播放效果。

其中，若无人机预设置有多个声音特征，无人机可以依次确定第二音频信号中是否包括与声音特征匹配的音频信号；若包括，则该音频信号为第三音频信号。

可选地，无人机可以从多个声音特征中选取出一个或多个声音特征，再进一步确定第二音频信号中与这一个或多个声音特征各自对应的音频信号。

一种实现方式中，无人机可以首先从视频信号中识别出目标物体。其中，无人机可以依据预设的识别规则，或者根据终端发送的指示信息来识别目标物体。

进一步地，无人机识别出目标物体后，可以根据预设的发声物体与声音特征的对应关系，确定与目标物体对应的声音特征。

无人机在第二音频信号中确定是否与该声音特征匹配的音频信号，若包括，则确定该音频信号为第三音频信号，并对其进行加强。

或者，无人机识别出目标物体后，确定视频信号中，该目标物体出现的时间，进而在第二音频信号中，确定该时间上的音频信号即为目标物体对应的第三音频信号，并对该第三音频信号进行增强处理。

步骤204：将处理后的第二音频信号与所述采集的视频信号合成所述音视频信号。

步骤205：将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放。

其中，步骤204～步骤205的实现方式可以参见上述实施例，在此不予限定。

举例说明，无人机可以采集所处环境的环境声音，以得到第一音频信号。无人机可以从第一音频信号中滤除噪声信号，已得到第二音频信号。其中，滤除的噪声信号可以包括外部环境的噪声信号和无人机中的内部环境的噪声信号等。进一步地，可以对第二音频信号进行优化处理，例如，对第二音频信号进行均衡处理等。将处理后的第二音频信号与视频信号进行同步合成处理，以得到音视频信号。无人机可以将音视频信号发送至终端，由终端播放该音视频信号。

进一步地，终端可以接收用户的选取操作，并根据用户的选取操作确定用户选取的目标物体，并可以向无人机发送指示信息，该指示信息用于指示无人机通过拍摄的视频信号识别该目标物体。例如，指示信息可以包括目标物体的物体特征等信息，在此不予限定。

进一步地，无人机可以根据该指示信息从视频信号中识别出目标物体，并可以根据上述实现方式来确定第三音频信号，并对其进行增强处理。

例如，若终端向用户播放的画面中出现了多种动物，用户可以选取其中一种或多种动物作为目标物体。无人机可以预设多种动物的声音特征，通过确定目标物体的声音特征，确定与其相匹配的第三音频信号。或者，无人机可以在识别出目标物体后，根据目标物体在视频出现的时间，确定第三音频信号，在此不予限定。

进而，终端再次接收到无人机发送的音视频信号后，终端播放用户选取的动物声音相关的音频信号时，该音频信号已被增强，播放出的该动物声音的音效更好，提升用户体验。

请参阅图3，图3是本申请实施例提供的一种音频信号处理装置的结构示意图。如图3所示，该装置300可以包括接收单元310、处理单元320以及发送单元330。

其中，接收单元310，用于采集无人机的环境声音，以得到第一音频信号；

处理单元320，用于从所述第一音频信号中滤除噪声信号，以得到第二音频信号；

所述处理单元320，还用于将所述第二音频信号与采集的视频信号合成为音视频信号；

发送单元330，用于将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放。

当然，上述功能单元还用于执行上述实施例中无人机所执行的任意一种方法，在此不再赘述。

上述功能单元的功能可以由无人机的相关组件和存储器中存储的相关计算机指令结合实现，在此不予限定。

请参阅图4，图4是本申请实施例提供的一种无人机的结构示意图。如图4所示，无人机400包括：中心壳体401、机臂402、音视频采集装置403、处理器404、通信接口405、存储器406。

其中，中心壳体401与机臂402可以是一体连接的，也可以是以其他形式连接的，在此不予限定。中心壳体401或机臂402中可以内置有多个系统，如视觉系统，飞控系统等，上述系统可以由硬件和软件结合实现。

音视频采集装置403、处理器404、通信接口405、存储器406之间可以电耦合，例如通过通信总线实现耦合等，在此不予限定。

其中，音视频采集装置430可以设置于中心壳体401和/或机臂402内，或设置与中心壳体401和/或机臂402外。或者，音视频采集装置420可以与中心壳体401和/或机臂402连接，在此不予限定。音视频采集装置可以包括包括独立的音频采集装置，如麦克风、麦克风阵列、声音传感器等；以及独立的视频采集装置，如相机、摄像头等。或者，音视频采集装置可以对上述独立装置集成，实现同步采集声音和图像。

当然，该无人机400还可以包括其他组件，如可充电电池、图传系统、云台接口、或者各种用于采集信息的传感器(如红外传感器、障碍物传感器等)等，在此不予赘述。

其中，处理器404可能是一种集成电路芯片，具有信号的处理能力。或者，可以是通用处理器、专用音视频处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

无人机400还可以包括一个或多个存储器406。存储器可以包括只读存储器、随机存取存储器、非易失性随机存取存储器等，在此不予限定。存储器中可以包括计算机程序或计算机指令等，处理器404可以调取存储器406中存储的计算机程序，以实现上述方法。

通信接口405可以包括收发器、天线等组件，用于实现与外部设备进行通信连接，例如与终端进行通信连接。

下面结合上述结构，示例性地说明各组件对实现上述方法所起的作用。

例如，所述音视频采集装置403用于采集无人机的环境声音，以得到第一音频信号；

所述处理器404用于从所述第一音频信号中滤除噪声信号，以得到第二音频信号；

所述处理器404还用于将所述第二音频信号与采集的视频信号合成为音视频信号；将所述音视频信号发送至所述通信接口；

所述通信接口405用于将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放。

所属领域的技术人员可以理解地是，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考上述方法实施例中的对应过程，在此不再赘述。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

一种音频信号处理方法，其特征在于，包括：

采集无人机的环境声音，以得到第一音频信号；

从所述第一音频信号中滤除噪声信号，以得到第二音频信号；

将所述第二音频信号与采集的视频信号合成为音视频信号，并将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放。
根据权利要求1所述的方法，其特征在于，所述从所述第一音频信号中滤除噪声信号之前，所述方法还包括：

根据预设噪声特征，从所述第一音频信号中确定与所述预设噪声特征匹配的噪声信号。
根据权利要求2所述的方法，其特征在于，所述噪声信号包括所述无人机所处的外部环境的噪声信号和/或所述无人机中的内部环境的噪声信号。
根据权利要求2或3所述的方法，其特征在于，所述预设噪声特征包括预设频段特征、预设响度特征、预设音色特征、预设音调特征中的至少一种。
根据权利要求1至4任一项所述的方法，其特征在于，所述从所述第一音频信号中滤除噪声信号，包括：

确定与所述噪声信号对应的反噪声信号；

将所述反噪声信号与所述第一音频信号进行叠加，以得到所述第二音频信号。
根据权利要求1至5任一项所述的方法，其特征在于，所述方法还包括：

对所述第二音频信号进行优化处理；

所述将所述第二音频信号与采集的视频信号合成为音视频信号，包括：

将处理后的第二音频信号与所述采集的视频信号合成所述音视频信号。
根据权利要求6所述的方法，其特征在于，所述对所述第二音频信号进行优化处理，包括：

根据声音特征，从所述第二音频信号中确定与所述声音特征匹配的第三音频信号；

对所述第三音频信号进行增强处理。
根据权利要求7所述的方法，其特征在于，所述根据声音特征，从所述第二音频信号中确定与所述声音特征匹配的第三音频信号之前，所述方法还包括：

从所述视频信号中识别出目标物体；

确定与所述目标物体对应的所述声音特征。
根据权利要求8所述的方法，其特征在于，所述从视频信号中识别出目标物体，包括：

根据所述终端发送的指示信息，从所述视频信号中识别出所述指示信息所指示的所述目标物体。
一种音频信号处理装置，其特征在于，包括：

接收单元，用于采集无人机的环境声音，以得到第一音频信号；

处理单元，用于从所述第一音频信号中滤除噪声信号，以得到第二音频信号；

所述处理单元，还用于将所述第二音频信号与采集的视频信号合成为音视频信号；

发送单元，用于将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放。
根据权利要求10所述的装置，其特征在于，所述处理单元还用于：

根据预设噪声特征，从所述第一音频信号中确定与所述预设噪声特征匹配的噪声信号。
根据权利要求11所述的装置，其特征在于，所述噪声信号包括所述无人机所处的外部环境的噪声信号和/或所述无人机中的内部环境的噪声信号。
根据权利要求11或12所述的装置，其特征在于，所述预设噪声特征包括预设频段特征、预设响度特征、预设音色特征、预设音调特征中的至少一种。
根据权利要求10至13任一项所述的装置，其特征在于，所述处理单元还用于：

确定与所述噪声信号对应的反噪声信号；

将所述反噪声信号与所述第一音频信号进行叠加，以得到所述第二音频信号。
根据权利要求10至14任一项所述的装置，其特征在于，所述处理单元还用于：

对所述第二音频信号进行优化处理；

所述将所述第二音频信号与采集的视频信号合成为音视频信号，包括：

将处理后的第二音频信号与所述采集的视频信号合成所述音视频信号。
根据权利要求15所述的装置，其特征在于，所述处理单元还用于：

根据声音特征，从所述第二音频信号中确定与所述声音特征匹配的第三音频信号；

对所述第三音频信号进行增强处理。
根据权利要求16所述的装置，其特征在于，所述处理单元还用于：

从所述视频信号中识别出目标物体；

确定与所述目标物体对应的所述声音特征。
根据权利要求17所述的装置，其特征在于，所述处理单元还用于：

根据所述终端发送的指示信息，从所述视频信号中识别出所述指示信息所指示的所述目标物体。
一种无人机，其特征在于，包括：

中心机壳；

机臂，其中，所述机臂与所述中心机壳连接；

音视频采集装置，其中，所述音视频采集装置设置在所述中心机壳或机臂；

处理器；以及

通信接口；

其中，所述音视频采集装置、所述处理器与所述通信接口电耦合；

所述音视频采集装置用于采集无人机的环境声音，以得到第一音频信号；

所述处理器用于从所述第一音频信号中滤除噪声信号，以得到第二音频信号；

所述处理器还用于将所述第二音频信号与采集的视频信号合成为音视频信号；将所述音视频信号发送至所述通信接口；

所述通信接口用于将所述音视频信号发送至终端，所述音视频信号用于由所述终端进行播放。
根据权利要求19所述的无人机，其特征在于，所述处理器还用于：

根据预设噪声特征，从所述第一音频信号中确定与所述预设噪声特征匹配的噪声信号。
根据权利要求20所述的无人机，其特征在于，所述噪声信号包括所述无人机所处的外部环境的噪声信号和/或所述无人机中的内部环境的噪声信号。
根据权利要求20或21所述的无人机，其特征在于，所述预设噪声特征包括预设频段特征、预设响度特征、预设音色特征、预设音调特征中的至少一种。
根据权利要求19至22任一项所述的无人机，其特征在于，所述处理器还用于：

确定与所述噪声信号对应的反噪声信号；

将所述反噪声信号与所述第一音频信号进行叠加，以得到所述第二音频信号。
根据权利要求19至23任一项所述的无人机，其特征在于，所述处理器还用于：

对所述第二音频信号进行优化处理；

所述将所述第二音频信号与采集的视频信号合成为音视频信号，包括：

将处理后的第二音频信号与所述采集的视频信号合成所述音视频信号。
根据权利要求24所述的无人机，其特征在于，所述处理器还用于：

根据声音特征，从所述第二音频信号中确定与所述声音特征匹配的第三音频信号；

对所述第三音频信号进行增强处理。
根据权利要求25所述的方法，其特征在于，所述根据声音特征，所述处理器还用于：

从所述视频信号中识别出目标物体；

确定与所述目标物体对应的所述声音特征。
根据权利要求26所述的方法，其特征在于，所所述处理器还用于：

根据所述终端发送的指示信息，从所述视频信号中识别出所述指示信息所指示的所述目标物体。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于被处理器执行以实现如权利要求1至9任一项所述的方法。