CN112243064A

CN112243064A - 音频处理方法及装置

Info

Publication number: CN112243064A
Application number: CN202011120284.XA
Authority: CN
Inventors: 牛程
Original assignee: Vivo Mobile Communication Shenzhen Co Ltd
Current assignee: Vivo Mobile Communication Hangzhou Co Ltd; Vivo Mobile Communication Shenzhen Co Ltd
Priority date: 2020-10-19
Filing date: 2020-10-19
Publication date: 2021-01-19
Anticipated expiration: 2040-10-19
Also published as: CN112243064B

Abstract

本申请公开了一种音频处理方法及装置，属于移动通信领域。所述方法包括：在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作；在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频，实现第一媒体文件的播放操作的线程与第二目标操作的线程的融合交互，为用户提供丰富的使用功能。

Description

音频处理方法及装置

技术领域

本申请属于移动通信领域，具体涉及一种音频处理方法及装置。

背景技术

随着移动通信技术的迅速发展，以智能手机为首的电子设备已成为人们生活中各方面不可或缺的工具。电子设备的各种应用程序(Application，APP)的功能也逐渐完善，不再只是单纯地起到通信作用，较多的是为用户提供各种智能化服务，给用户工作、生活带来了极大的便利，特别是日渐多元化的多媒体功能，给用户带来了丰富的使用体验。

目前的电子设备多媒体功能，支持多线程操作。在进行媒体文件播放时，还可以同时进行其他操作，例如录制音视频、通话等；然而，在此过程中，媒体文件播放与其他操作通常为独立的线程，在运行过程中无法交互，为用户提供的使用体验较为单调。

发明内容

本申请实施例的目的是提供一种音频处理方法及装置，能够解决现有技术中媒体文件播放与其他操作通常为独立的线程，在运行过程中无法交互的问题。

为了解决上述技术问题，本申请是这样实现的：

第一方面，本申请实施例提供了一种音频处理方法，所述方法包括：

在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作；

在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频。

可选地，在所述电子设备处于视频录制状态的情况下，所述接收第一目标操作之后，所述方法还包括：

通过摄像头模组采集第一图像；

所述在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，包括：

在所述第一目标操作为第一媒体文件的音频播放操作的情况下，若所述第一图像满足第一预设条件，则启动第二目标操作。

可选地，所述若所述第一图像满足第一预设条件，则启动第二目标操作，包括：

识别所述第一图像中的对象的行为；

在所述行为包括目标行为的情况下，启动第二目标操作。

可选地，所述在电子设备处于音视频录制状态或通话状态之前，所述方法包括：

接收第三目标操作，所述第三目标操作为第二媒体文件的播放操作；

若所述第一目标操作包括录制所述第一媒体文件的第一音频，所述启动第二目标操作，包括：

过滤所述第二目标操作所录制的音频中，所述第二媒体文件的第二音频。

可选地，若所述第二目标操作包括录制所述第一媒体文件的第一音频，所述启动第二目标操作，包括：

将第三音频添加至所述音视频录制的录制文件中，或添加至所述通话状态对应的通话语音中；

其中，所述第三音频为响应于所述第二目标操作所录制的音频。

第二方面，本申请实施例还提供了一种音频处理装置，所述音频处理装置包括：

操作接收模块，用于在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作；

音频处理模块，用于在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频。

可选地，所述装置还包括：

图像采集模块，用于在所述电子设备处于视频录制状态的情况下，所述操作接收模块接收第一目标操作之后，通过摄像头模组采集第一图像；

所述音频处理模块包括：

第一启动子模块，用于在所述第一目标操作为第一媒体文件的音频播放操作的情况下，若所述第一图像满足第一预设条件，则启动第二目标操作。

可选地，所述第一启动子模块，用于：

识别所述第一图像中的对象的行为；

在所述行为包括目标行为的情况下，启动第二目标操作。

可选地，所述操作接收模块还用于：

在电子设备处于音视频录制状态或通话状态之前，接收第三目标操作，所述第三目标操作为第二媒体文件的播放操作；

所述音频处理模块包括：

过滤子模块，用于若所述第一目标操作包括录制所述第一媒体文件的第一音频，过滤所述第二目标操作所录制的音频中，所述第二媒体文件的第二音频。

可选地，所述音频处理模块包括：

添加子模块，用于若所述第二目标操作包括录制所述第一媒体文件的第一音频，将第三音频添加至所述音视频录制的录制文件中，或添加至所述通话状态对应的通话语音中；

第三方面，本申请实施例还提供了一种电子设备，该电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的程序或指令，所述处理器执行所述程序或指令时实现如上所述的音频处理方法中的步骤。

第四方面，本申请实施例还提供了一种可读存储介质，该可读存储介质上存储有程序或指令，所述程序或指令被处理器执行时实现如上所述的音频处理方法中的步骤。

第五方面，本申请实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法。

在本申请实施例中，在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作；在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频，智能采集第一目标操作所播放的声音，实现第一媒体文件的播放操作的线程与第二目标操作的线程的融合交互，为用户提供丰富的使用功能。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1表示本申请实施例提供的音频处理方法的流程图之一；

图2表示本申请实施例的第一示例的示意图；

图3表示本申请实施例的第二示例的流程图；

图4表示本申请实施例的第三示例的流程图；

图5表示本申请的实施例提供的音频处理装置的框图；

图6表示本申请的实施例提供的电子设备的框图之一；

图7表示本申请的实施例提供的电子设备的框图之二。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。在本申请的各种实施例中，应理解，下述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的音频处理方法进行详细地说明。

参见图1，本申请一实施例提供了一种音频处理方法，可选地，所述方法可应用于电子设备，所述电子设备包括各种手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备，以及各种形式的移动台(Mobile Station，MS)，终端设备(Terminal Device)等等。

所述方法包括：

步骤101，在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作；

音视频录制状态包括音频录制状态以及视频录制状态，比如通过电子设备录制音视频，音视频文件包括音频文件以及音视频文件中的至少一种。通话状态比如利用电子设备进行通话，本申请实施例中，通话状态包括电路交换域(Circuit Switch，CS)通话和分组交换域(Packet Switch，PS)通话，以及包括语音通话以及视频通话。

步骤102，在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频。

也就是说，在电子设备同时进行音视频播放操作(或通话操作)以及第一目标操作的情况下，启动第二目标操作，采集所述第一媒体文件的第一音频。

具体地，第一媒体文件可以是电子设备播放音频文件或音视频文件，比如通过娱乐类应用程序播放音乐或视频；在电子设备执行音视频录制操作或通话的过程中，用户启动播放音频文件或音视频文件，电子设备接收到第一目标操作，此时，响应于所述第一目标操作，启动第二目标操作，采集音频播放操作所播放的音频部分，即仅采集电子设备所播放的音频，而不采集环境中的声音；作为第一示例，参见图2，以电子设备为分屏设备为例，电子设备在同时进行音频播放操作以及目标操作时，分屏进行两个操作。L为分屏分界线，将显示界面分成S1界面和S2界面；其中，S1界面在进行音频播放操作，播放歌曲A，S2界面在进行音视频录制操作，则检测到在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作时，采集音视频录制期间内所播放的歌曲A的音频部分。

可选地，第二目标操作包括将所采集的第一音频添加到所录制的音视频文件的音频部分中；结合图2，S2界面所录制的视频为视频1，则将S1界面所采集的音频1添加到视频1的音频部分，实现音频播放线程与音视频录制线程的融合。

第二目标操作还包括传输所述第一音频，比如在电子设备处于通话状态作时，用户可在通话过程中，触发第一目标操作，电子设备启动第二操作，以将所采集的第一音频同步传输给通话对端，实现通话线程与音视频播放线程的融合。

本申请实施例中，在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作；在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频，智能采集第一目标操作所播放的声音，实现第一媒体文件的播放操作的线程与第二目标操作的线程的融合交互，为用户提供丰富的使用功能；本申请实施例解决了现有技术中媒体文件播放与其他操作通常为独立的线程，在运行过程中无法交互的问题。

在一个可选实施例中，在所述电子设备处于视频录制状态的情况下，所述接收第一目标操作之后，所述方法还包括：

通过摄像头模组采集第一图像；采集第一图像之后，识别第一图像中的对象以及对象的行为，

在所述第一目标操作为第一媒体文件的音频播放操作的情况下，若所述第一图像满足第一预设条件，则启动第二目标操作。第一预设条件为对第一图像中的对象的行为的限定；具体的，所述若所述第一图像满足第一预设条件，则启动第二目标操作，包括：

识别所述第一图像中的对象的行为；

在所述行为包括目标行为的情况下，启动第二目标操作。

在用户录制音视频时，通常需要用户手动操作控制录制开始以及录制停止。本申请实施例中，在电子设备处于音视频播放状态或通话状态时，若接收到第一媒体文件的播放操作，通过摄像头模组采集第一图像，并对音第一图像的对象进行行为识别，实时监测对象的行为，在所述行为包括目标行为的情况下，采集第一音频。

目标行为包括目标动作，比如对象做出目标动作时，启动第一音频的采集。比如目标动作包括连续的舞蹈动作、单一动作。

作为第二示例，参见图3，以电子设备处于视频录制状态、所述方法应用于一电子设备为例，介绍本申请实施例中提供的音频处理方法。

在用户使用电子设备的过程中，电子设备系统实时检测当前用户使用的场景是否存在接收声音的线程，若有则根据具体场景开始判断是否进行声音采集，所述电子设备具体包含如下模块：

实时监测模块：当外放声音线程运行时，电子设备系统需要对用户当前使用的场景进行监测，判断是否存在接收声音的线程在运行，通过该种方式确定是否启动声音采集。

自动识别模块：在确定需要启动声音采集时，自动识别模块基于对应的场景信息对用户行为进行分析，对于不同的场景有对应的判断策略，智能选择是否采集声音，并做出决策和执行。

声音采集模块：该模块主要作用于采集外放声音，并将该声音传进当前用户的使用场景，实现最终的声音采集。

具体地，本示例主要包括以下步骤：

步骤301，电子设备的音乐播放器播放歌曲，实时监测模块监测当前使用场景。

步骤302，电子设备启动视频录制。

比如，此时用户在进行跳舞，通过电子设备播放跳舞所用的舞曲。

步骤303，用户行为识别，用户开始跳舞后，声音采集模块进行声音采集。

当开启视频录制时，实时监测模块监测到需要进行声音采集，此时自动识别模块基于该视频录制场景，对于画面内容进行分析，当识别出人体时，综合分析人的肢体动作，做出决策，用户开始跳舞时开启声音采集，采集音乐播放器所播放的歌曲。

步骤304，跳舞结束，停止录制音频。

当用户跳舞结束，并离开画面时，此时自动识别模块检测到运动行为结束，并停止对于声音的采集，实现根据场景自动采集音频或停止采集音频。通过基于使用场景的自动化声音采集判断策略，对于录制跳舞视频的用户，实现了自动识别，并执行音频采集以及停止采集的能力，避免需要人为操作，而造成视频录制中出现用户因控制电子设备而离开画面的情况，破坏了视频完整性。

在一个可选实施例中，所述在电子设备处于音视频录制状态或通话状态之前，所述方法包括：

若所述第二目标操作包括录制所述第一媒体文件的第一音频，所述启动第二目标操作，包括：

若在接收到第一目标操作之前，电子设备已经在播放第二媒体文件，则在电子设备在启动第二目标操作时，仅采集第一媒体文件的第一音频，而不采集第二媒体文件的音频部分以及环境中的声音；作为第一示例，参见图2，以电子设备为分屏设备为例，电子设备在同时进行音频播放操作以及目标操作时，分屏进行两个操作。L为分屏分界线，将显示界面分成S1界面和S2界面；其中，S1界面在进行第三目标操作，播放歌曲A，S2界面在进行第二目标操作，则启动第二目标操作时，采集第二目标操作直选期间内所播放的歌曲A的音频部分。

在一个可选实施例中，若所述第二目标操作包括录制所述第一媒体文件的第一音频，所述启动第二目标操作，包括：

通话语音即实时发送至通话对端的音频信号文件；在用户与通话对端通话的过程中，若用户启动第一媒体文件的播放操，则将在通话期间所播放的第一音频部分实时发送给通话对端。这样，用户在与通话对端通话的过程中，可以像通话对端分享音视频文件的音频部分，用户在本地设备中播放音视频文件时，通话对端可以实时接收所播放的第一音频，实现通话线程与音视频播放线程的融合。

进一步地，在所述在电子设备处于通话状态的情况下，所述第一目标操作的开始时间晚于所述通话状态的开始时间。

可以理解的是，在所述在电子设备处于通话状态的情况下的情况下，第一目标操作的启动时刻应早于音视频播放操作的启动时刻，即在用户通话开始后，再启动第一目标操作，表明第一目标操作所播放的音视频中的音频部分为用户想要分享给对方的音频；若第一目标操作的启动时刻晚于音视频播放操作的启动时刻，即用户在播放音视频文件时，启动了通话操作，此时可以不采集第一音频，不启动第二目标操作。

作为第三示例，参见图4，以目标操作为通话操作、所述方法应用于一电子设备为例，介绍本申请实施例中提供的音频处理方法。

具体地，本示例主要包括以下步骤：

步骤401，电子设备的第一音乐播放器播放歌曲1，实时监测模块监测当前使用场景。

步骤402，电子设备启动通话过程。

比如，此时用户拨打电话或者接听电话，或者语音通话、视频通话。

步骤403，用户行为识别，用户在通话过程中，启动第二音乐播放器播放歌曲2。

当开始通话时，电子设备的自动识别模块监测到需要进行声音采集，识别为语音通话场景；那么依据音乐启用时间，该音频为通话接通前播放，则不进行声音采集，比如第一音乐播放器播放的歌曲1，可以防止对于通话的影响。若通话接通后播放，则进行声音采集，比如第二音乐播放器播放的歌曲2，使通话对端接收到该音频。

步骤404，通话结束，停止录制音频。

当用户通话结束，此时自动识别模块检测到运动行为结束，并停止对于声音的采集，实现根据场景自动采集音频或停止采集音频。通过基于使用场景的自动化声音采集判断策略，对于通话的用户，实现了自动识别，并执行音频采集以及停止采集的能力，避免需要人为操作。通过对于声音播放时间与语音通话功能启用时间的判断，实现了自动化的声音采集策略，降低了人工操作成本，同时防止在声音播放过程中，临时接受通话受到播放音频干扰的问题。

本申请实施例中，在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作；在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频，在目标操作执行的过程中，智能采集音频播放操作所播放的声音，并添加为目标操作的操作对象，实现第一媒体文件的播放操作的线程与第二目标操作的线程的融合交互，为用户提供丰富的使用功能。

以上介绍了本申请实施例提供的音频处理方法，下面将结合附图介绍本申请实施例提供的音频处理装置。

需要说明的是，本申请实施例提供的音频处理方法，执行主体可以为音频处理装置，或者该音频处理装置中的用于执行音频处理方法的控制模块。本申请实施例中以音频处理装置执行音频处理方法为例，说明本申请实施例提供的音频处理方法。

参见图5，本申请实施例还提供了一种音频处理装置500，包括：

操作接收模块501，用于在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作。

音频处理模块502，用于在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频。

可选地，本申请实施例中，所述装置500还包括：

图像采集模块，用于在所述电子设备处于视频录制状态的情况下，所述操作接收模块501接收第一目标操作之后，通过摄像头模组采集第一图像；

所述音频处理模块502包括：

可选地，本申请实施例中，所述第一启动子模块，用于：

识别所述第一图像中的对象的行为；

在所述行为包括目标行为的情况下，启动第二目标操作。

可选地，本申请实施例中，所述操作接收模块501还用于：

所述音频处理模块502包括：

可选地，本申请实施例中，所述音频处理模块502包括：

添加子模块，用于若所述第二目标操作包括录制所述第一媒体文件的第一音频，将第三音频添加至所述音视频录制的录制文件中，或添加至所述通话状态对应的通话语音中；其中，所述第三音频为响应于所述第二目标操作所录制的音频。

本申请实施例中，在电子设备处于音视频录制状态或通话状态的情况下，操作接收模块501接收第一目标操作；音频处理模块502在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频，智能采集第一目标操作所播放的声音，实现第一媒体文件的播放操作的线程与第二目标操作的线程的融合交互，为用户提供丰富的使用功能。

本申请实施例中的音频处理装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personaldigital assistant，PDA)等，非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

本申请实施例中的音频处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本申请实施例不作具体限定。

本申请实施例提供的音频处理装置能够实现图1至图4的方法实施例中音频处理装置实现的各个过程，为避免重复，这里不再赘述。

可选的，如图6所示，本申请实施例还提供一种电子设备600，包括处理器601，存储器602，存储在存储器602上并可在所述处理器601上运行的程序或指令，该程序或指令被处理器601执行时实现上述音频处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要注意的是，本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。

图7为实现本申请各个实施例的一种电子设备700的硬件结构示意图；

该电子设备700包括但不限于：射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、处理器710、以及电源711等部件。本领域技术人员可以理解，电子设备700还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器710逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

其中，输入单元704，用于在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作。

处理器710，用于在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频。

可选的，输入单元704用于通过摄像头模组采集第一图像；

处理器710，用于在所述第一目标操作为第一媒体文件的音频播放操作的情况下，若所述第一图像满足第一预设条件，则启动第二目标操作。

可选的，处理器710，用于识别所述第一图像中的对象的行为；

在所述行为包括目标行为的情况下，启动第二目标操作。

可选的，处理器710，用于接收第三目标操作，所述第三目标操作为第二媒体文件的播放操作；

可选的，处理器710，用于将第三音频添加至所述音视频录制的录制文件中，或添加至所述通话状态对应的通话语音中；

本申请实施例中，在电子设备处于音视频录制状态或通话状态的情况下，接收第一目标操作；在所述第一目标操作为第一媒体文件的播放操作的情况下，响应于所述第一目标操作，启动第二目标操作，所述第二目标操作用于录制所述第一媒体文件的第一音频或传输所述第一音频，智能采集第一目标操作所播放的声音，实现第一媒体文件的播放操作的线程与第二目标操作的线程的融合交互，为用户提供丰富的使用功能。

应理解的是，本申请实施例中，输入单元704可以包括图形处理器(GraphicsProcessing Unit，GPU)7041和麦克风7042，图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元706可包括显示面板7061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板7061。用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071，也称为触摸屏。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。存储器709可用于存储软件程序以及各种数据，包括但不限于应用程序和操作系统。处理器710可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器710中。

本申请实施例还提供一种可读存储介质，可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述音频处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述音频处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

1.一种音频处理方法，其特征在于，包括：

2.根据权利要求1所述的音频处理方法，其特征在于，在所述电子设备处于视频录制状态的情况下，所述接收第一目标操作之后，所述方法还包括：

通过摄像头模组采集第一图像；

3.根据权利要求2所述的音频处理方法，其特征在于，所述若所述第一图像满足第一预设条件，则启动第二目标操作，包括：

识别所述第一图像中的对象的行为；

在所述行为包括目标行为的情况下，启动第二目标操作。

4.根据权利要求1所述的音频处理方法，其特征在于，所述在电子设备处于音视频录制状态或通话状态之前，所述方法包括：

5.根据权利要求1所述的音频处理方法，其特征在于，若所述第二目标操作包括录制所述第一媒体文件的第一音频，所述启动第二目标操作，包括：

6.一种音频处理装置，其特征在于，所述装置包括：

7.根据权利要求6所述的音频处理装置，其特征在于，所述装置还包括：

所述音频处理模块包括：

8.根据权利要求7所述的音频处理装置，其特征在于，所述第一启动子模块，用于：

识别所述第一图像中的对象的行为；

在所述行为包括目标行为的情况下，启动第二目标操作。

9.根据权利要求6所述的音频处理装置，其特征在于，所述操作接收模块还用于：

所述音频处理模块包括：

10.根据权利要求6所述的音频处理装置，其特征在于，所述音频处理模块包括：