WO2022228377A1

WO2022228377A1 - 录音方法、装置、电子设备和可读存储介质

Info

Publication number: WO2022228377A1
Application number: PCT/CN2022/088952
Authority: WO
Inventors: 曹璟毅
Original assignee: 维沃移动通信（杭州）有限公司
Priority date: 2021-04-26
Filing date: 2022-04-25
Publication date: 2022-11-03
Also published as: CN113241097A

Abstract

本申请公开了一种录音方法、装置、电子设备和可读存储介质，该方法包括：在通过第一应用程序进行音频数据采集的情况下，接收用户的第一输入；响应于第一输入，播放目标应用程序中的目标音频数据，并通过第一应用程序得到第一录音文件；其中，第一录音文件至少包括目标音频数据。

Description

录音方法、装置、电子设备和可读存储介质

相关申请的交叉引用

本申请主张在2021年04月26日在中国提交的中国专利申请号202110455989.5的优先权，其全部内容通过引用包含于此。

技术领域

本申请属于录音技术领域，具体涉及一种录音方法、装置、电子设备和可读存储介质。

背景技术

随着通信技术的高速发展，电子设备的应用越来越广泛，用户对电子设备的性能要求也越来越高。

目前，用户可以通过社交类应用程序收发语音信息或者通过多媒体应用程序播放音频数据。通常，用户想要播放上述应用程序中的音频数据或者语音信心时，需要进入到相应的应用程序内，从而播放用户希望收听的音频内容。

然而，由于语音信息或者音频数据通常无法直接从上述应用程序中导出，用户希望收听上述应用程序中的音频内容时，需要通过上述播放过程，导致电子设备播放音频数据的受约束程度较高，播放应用程序内的音频数据的方式比较单一。

发明内容

本申请实施例的目的是提供一种录音方法、装置、电子设备和可读存储介质，能够解决应用程序内的音频数据无法通过其他方式播放或者存储，播放方式单一的问题。

第一方面，本申请实施例提供了一种录音方法，该方法包括：

在通过第一应用程序进行音频数据采集的情况下，接收用户的第一输入；

响应于第一输入，播放目标应用程序中的目标音频数据，并通过第一应用程序得到第一录音文件；

其中，第一录音文件至少包括目标音频数据。

第二方面，本申请实施例提供了一种录音装置，该装置包括：

接收模块，用于在通过第一应用程序进行音频数据采集的情况下，接收用户的第一输入；

处理模块，用于响应于接收模块接收到的第一输入，播放目标应用程序中的目标音频数据，并通过第一应用程序得到第一录音文件；

其中，第一录音文件至少包括目标音频数据。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序或指令，程序或指令被处理器执行时实现如第一方面的方法的步骤。

第四方面，本申请实施例提供了一种可读存储介质，可读存储介质上存储程序或指令，程序或指令被处理器执行时实现如第一方面的方法的步骤。

第五方面，本申请实施例提供了一种芯片，芯片包括处理器和通信接口，通信接口和处理器耦合，处理器用于运行程序或指令，实现如第一方面的方法。

在本申请实施例中，在电子设备通过第一应用程序进行音频数据采集的情况下，电子设备在接收到用户的第一输入(该第一输入用于播放目标应用程序中的目标音频数据)后，响应于该第一输入，播放该目标音频数据，并通过该第一应用程序得到第一录音文件(至少包括该目标音频数据的音频内容)。如此，在电子设备通过第一应用程序(例如：录音机、备忘录等具有录音功能的应用程序)录音的情况下，响应于用户的第一输入，电子设备切换至其他目标应用程序(例如：存储或者播放音频数据的多媒体应用程序和社交应用程序)中播放目标音频数据，在此过程中，电子设备持续进行录音，直至录音完成得到第一录音文件。

附图说明

图1为本申请实施例提供的一种录音方法的示意图；

图2为本申请实施例提供的录音方法的操作示意图之一；

图3为本申请实施例提供的录音方法的操作示意图之二；

图4为本申请实施例提供的录音方法的操作示意图之三；

图5为本申请实施例提供的录音方法的操作示意图之四；

图6为本申请实施例提供的录音方法的操作示意图之五；

图7为本申请实施例提供的录音方法的操作示意图之六；

图8为本申请实施例提供的录音装置的结构示意图；

图9为本申请实施例提供的电子设备的硬件示意图之一；

图10为本申请实施例提供的电子设备的硬件示意图之二。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

需要说明的是，本申请实施例中的标识用于指示信息的文字、符号、图像等，可以以控件或者其他容器作为显示信息的载体，包括但不限于文字标识、符号标识、图像标识。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的录音方法进行详细地说明。

如图1所示，本申请实施例提供一种录音方法，该方法包括下述的步骤101和步骤102。

步骤101、在通过第一应用程序进行音频数据采集的情况下，录音装置接收用户的第一输入。

本申请实施例中，上述第一应用程序为具有录音功能的应用程序，如录音机、备忘录等应用程序。

需要说明的是，本申请实施例中，在录音装置接收用户的第一输入之前，录音装置就已经控制第一应用程序处于音频数据采集状态，以便于在接收到用户用于播放目标应用程序中的目标音频数据的第一输入以后，能够及时响应该第一请求，以使录音装置可以完整的采集目标音频数据。

可选地，本申请实施例中，上述录音装置开始通过第一应用程序录制音频的时间点、到录音装置开始播放目标音频数据的时间点之间的初始过渡时段中，若录音装置在录制到的音频数据中未识别到用户讲话的语音内容时，录音装置可以自动将初始过度时段内的音频数据进行剪切，以减小录音文件的占用空间，也避免用户在后续播放过程中播放较长时段的空白内容。

示例性的，上述第一输入为用户触发录音装置通过进入目标应用程序并触发播放目标音频数据的输入。在一种示例中，上述第一输入可以为：用户在录音装置的屏幕上的输入，或者，用户输入的特定手势，具体的可以根据实际使用需求确定，本发明实施例不作限定。通常，在录音装置响应于用户通过手指或者触控笔等触控装置对目标应用程序中的目标音频数据(例如仅为音频格式的文件或音视频格式的文件)的虚拟播放按键的输入，或者，响应于用户对某个社交类应用程序中的语音信息的输入，录音装置会播放该音频或者视频文件，或者播放该语音信息。

步骤102、录音装置响应于第一输入，播放目标应用程序中的目标音频数据，并通过第一应用程序得到第一录音文件。

其中，上述第一录音文件至少包括目标音频数据。

本申请实施例中，上述录音装置响应于第一输入，播放目标音频数据，第一应用程序录制该目标音频数据为第一录音文件。

需要说明的是，在录音装置接收到第一输入后，第一应用程序处于后台运行状态，第一应用程序开始对处于前台运行的目标应用程序中的目标音频数据进行音频采集。录音装置使用跨应用录音的功能，需要使处于后台运行的第一应用程序获得目标应用程序的授权。本申请实施例中，均以第一应用程序获得目标应用程序的授权的前提下进行的说明。

示例性地，在本申请实施例中，上述第一应用程序的录音功能已经开启，第一应用程序处于后台运行过程中。

示例性的，上述第一输入包括：用于切换应用程序的第一子输入和用于播放目标音频数据的第二子输入。进一步的，录音装置通过响应于第一子输入，从而将录音装置当前的显示界面切换为目标应用程序的运行界面，以实现跨应用采集音频数据，同时，录音装置可以通过响应于第二子输入，从而在在该目标应用程序界面内找到目标音频数据，并播放该目标音频数据。

用户通过执行切换目标应用程序的第一子输入，录音装置响应于第一子输入将显示界面切换至目标应用程序的运行界面，实现跨应用选择需要采集的音频数据。用户通过执行第二子输入在该目标应用程序界面内找到目标音频数据，录音装置响应于该第二子输入播放该目标音频数据。

可以理解的是，上述第一录音文件中可以包括目标音频数据的全部音频内容，也可以包括目标音频数据的部分音频内容。当用户播放上述目标音频数据之后，即便目标音频数据未全部播放完而用户希望能够结束录音时，可以通过对录音装置的第一应用程序进行结束录制的操作，录音装置即形成第一录音文件。

可选地，上述第一录音文件中还可以包括录音装置录制的环境音频数据。示例性的，上述环境音频数据包括：用户的语音内容、用户为了配合目标音频数据的音频内容的场景而使用其他设备播放的配乐等。

可选地，上述第一录音文件中还可以包括目标片段标识，该目标片段标识用于指示第一录音文件的目标内容。例如：目标内容可以为陈述内容的总结、歌曲的副歌部分、两个目标音频数据中间的间隔段落等。该目标片段标识可以区别显示于播放第一录音文件时的进度条上，以便于用户可以直接播放该目标片段标识所指示的目标内容。

可选地，为了提示用户录音装置处于音频数据采集的状态，也便于用户对第一应用程序的录音功能进行操作，上述录音装置可以在目标应用程序的运行界面内显示指示第一应用程序的悬浮控件。示例性的，如图2所示，在目标应用程序的运行界面内，显示悬浮控件201。此时，悬浮控件201中显示正在录制音频，录音装置可以接收用户的第一输入。

可选地，播放目标音频数据的方式包括以下至少一项：

方式1、录音装置使用听筒播放目标音频数据。

需要说明的是，一般的录音装置为了降低语音通话过程中的降噪效果，一般会在听筒的位置配置听筒麦克风。如果录音装置检测到配置了听筒麦克风，则可以自动使用听筒播放目标音频数据。由于听筒的声音相较于外放扬声器的播放音量更低，在播放的目标音频数据的内容涉及隐私时，能够显著降低外放扬声器播放目标音频数据造成的隐私泄露。

示例性的，当录装置在检测到配置了听筒麦克风的情况下，为了能够提高第一录音文件的文件质量，减少第一录音文件中的噪声，录音装置可以控制第一应用程序使用听筒麦克风进行音频数据采集。

方式2、录音装置以目标音量播放目标音频数据，并对第一录音文件中相应的音频内容补偿音量。

在上述方式中，上述目标音量可以低于用户设定的播放音频数据的音量。示例性的，用户设定的播放媒体类文件的音量为音量8，目标音量适宜以较低于8的音量进行播放，以避免目标音频数据中的隐私性的内容泄露。

另外，录音装置以目标音量播放目标音频数据之后，可能会导致第一录音文件中相应的录音片段的音量较小，录音装置可以在将播放的目标音频数据的音频内容转化为第一录音文件的过程中进行音量放大补偿。示例性的，用户播放了多个目标音频数据，只有在播放目标音频数据1时是以目标音量播放的，则在形成第一录音文件的过程中，录音装置等效扩大第一录音文件中目标音频数据1对应的语音内容的音量，而对其他正常音量播放的目标音频数据不予补偿，从而降低了隐私信息泄露的可能，也保证了第一录音文件的文件质量。

示例性的，录音装置可以直接使用方式2播放目标音频数据，也可以在检测录音装置未配置听筒麦克风的情况下，才使用方式2播放目标音频数据。录音装置也可以在检测录音装置已配置听筒麦克风的情况下，结合使用方式1和方式2的播放方式。

方式3、录音装置静音播放目标音频数据，并获取目标音频数据中的音频流。

需要说明的是，如果目标应用程序支持第一应用程序进行音频流数据捕获，则在播放该目标音频数据时，录音装置使用静音播放的方式，将目标音频数据转化为第一应用程序可以存储的音频数据格式，以避免造成播放目标音频数据时的音频内容涉及隐私内容而造成的隐私泄露。

如此，上述录音装置在目标应用程序开放读取音频流数据时，可以优先选用上述播放方式。

可以理解的是，上述目标应用程序为社交类目标应用程序，由于社交类目标应用程序中存储的音频数据一般隐私性较强，在用户播放其中的目标音频数据时，录音装置可以对目标应用程序的类型进行识别，如果是社交类目标应用程序则使用上述方式1、方式2和/或方式3播放目标音频数据。

示例性的，如图2所示，录音装置处于音频采集的过程中，悬浮控件显示正在录制音频。此时，录音装置识别到社交类目标应用程序正在前台运行，录音装置响应于用户播放“张三”的语音的操作，以方式3播放“张三”的语音，并在目标应用程序的界面中显示：录音隐私保护，静音录制中，以提示用户虽然没有播放目标音频数据，但是仍在录音过程中，并且录音装置通过静音录制的方式保护用户隐私。

示例性的，如图3所示，录音装置处于音频采集的过程中，悬浮控件显示正在录制音频。此时，录音装置识别到社交类目标应用程序正在前台运行，录音装置响应于用户播放“李四”的语音的操作，以方式1结合方式2的播放方式播放“张三”的语音，并在目标应用程序的界面中显示：录音隐私保护：已智能调节外放音量；录音隐私保护：听过听筒播放中；以提示用户录音装置通过隐私播放方式1和方式2结合使用的方式录制目标音频数据，以保护用户隐私。

需要说明的是，上述步骤102是以通过方式1、方式2和/或方式3播放目标音频数据为例进行说明的，其并不对本申请实施例形成限定，录音装置也可以通过上述三种方式之外的其他方式播放目标音频数据。

本申请实施例提供的录音方法，录音装置可以实现跨应用程序录制音频，进而可以将目标应用程序中的无法导出的目标音频数据录制为第一录音文件，方便用户通过播放录制的第一录音文件以获得目标音频数据的音频内容，提高了录音装置播放目标音频数据的形式多样性。此外，通过上述方法可以将存储在目标应用程序中无法导出的目标音频数据作为第一录音文件进行存储，用户可以通过分享该第一录音文件的方式将目标音频数据中的音频内容分享给其他用户，突破了目标应用程序对其中存储的音频数据的使用限制。

可选地，在目标音频数据包括第一音频数据和第二音频数据的情况下，录音装置可以播放多个第一音频数据，以供用户将多个目标音频数据中的音频内容拼接为一个第一录音文件。

示例性地，在上述步骤102之后，本申请实施例提供的录音方法还可以包括步骤103。

步骤103、录音装置在从第一音频数据切换至第二音频数据进行播放的过程中，识别目标时段内的环境音频数据中的音频内容。

其中，目标时段为：第一音频数据的结束播放的时间点至第二音频数据的开始播放的时间点间的时段。

示例性的，上述第一音频数据和第二音频数据可以是同一个目标应用程序中存储的音频数据，用户可以通过第一输入播放第一音频数据之后，再同一个应用程序中继续播放第二音频数据。如图4中的(a)所示，在录音装置已经播放第一音频数据之后，悬浮控件中显示已经录制片段1，目标应用程序显示的是第二音频数据的播放界面，此时，如用户点击图4中的(a)中的播放键时，录音装置播放该第二音频数据，并且在图4中的(b)中的悬浮控件中显示正在录制片段2。在播放完成第一音频数据，到用户点击图4中的(a)中的播放键之间的时段即为目标时段。

示例性的，第一音频数据和第二音频数据也可以是不同的目标应用程序中存储的音频数据，用户可以在第一目标应用程序中播放完第一音频数据之后，切换至第二目标应用程序中播放第二音频数据。在切换应用程序的过程中，录音装置仍然通过第一应用程序进行音频数据采集。

可以理解的是，用户可以自由选择第一录音文件中录制的片段数量，即可以一次同时录制多个目标音频数据的音频内容，多个目标音频数据可以来源于不同的目标应用程序，也可以来源于同一个目标应用程序。

为了便于描述，第一音频数据的结束播放的时间点至第二音频数据的开始播放的时间点间的时段，可以称为目标时段。目标时段包括在同一个目标应用程序中播放的任意两个目标音频数据的间隔时段，目标时段也可以包括录音装置在第一目标应用程序中播放第一音频数据之后，切换至第二应用程序中播放第二音频数据的间隔时段。

可以理解的是，在目标时段中，由于录音装置保持音频数据采集状态，并且在目标时段内未播放目标音频数据，用户可以在目标时段内说话，以作为播放两个目标音频数据中间承上启下的转场。如此，录音装置可以识别目标时段内的环境音频数据的音频内容，并利用该音频内容标记第一录音文件，以对第一录音文件进行个性化处理。

示例性的，录音装置可以根据识别到的环境音频数据中的音频内容，设置第一录音文件中目标内容的目标片段标识。举例说明，录音设备识别目标时段内环境音频数据中的音频内容为“想听干货的请从这里开始听”，录音装置将根据该音频内容处理第一录音文件，以使第一录音文件在播放时的进度条的相应部分中显示目标片段标识，以便于用户可以直接播放该目标片段标识所指示的目标内容。

如此，录音装置在切换播放第一音频数据和第二音频数据的过程中，持续录制环境音频数据，用户可以在目标时段内讲话，用户的讲话作为播放两个目标音频数据之间的转场录制在第一录音文件中。录音装置将识别到的环境音频数据中的音频内容，用于标记第一录音文件，能够便于用户为第一录音文件进行者个性化处理。

可选地，在录音装置录制完成第一录音文件之后，示例性地，在上述步骤103之后，本申请实施例提供的录音方法还可以包括步骤104。

步骤104、录音装置为第一录音文件添加目标标签。

其中，目标标签是基于目标音频数据或者环境音频数据中的音频内容确定的。

本申请实施例中，上述录音装置在录制完成第一录音文件之后可以为第一录音文件添加目标标签，以便于用户对第一录音文件进行归类，便于后续用户能够快速搜索到希望播放的第一录音文件。

进一步可选地，上述目标标签可以基于目标音频数据的内容确定。例如：如录音装置通过播放目标音频数据时，录音装置通过语音识别装置对目标音频数据的内容进行语音识别。录音装置根据语音识别装置对目标音频数据的语音内容的识别结果中提取出多个关键词，以供用户对第一录音文件设置标签。

进一步可选地，上述目标标签可以基于环境音频数据的内容确定。例如：录音装置可以通过语音识别装置对上述目标时段内的语音内容进行语音识别，录音装置在目标时段内语音内容的识别结果中提取出多个关键词，以供用户对第一录音文件设置标签。

可选地，本申请实施例中，上述语音识别过程可以通过录音装置中的语音识别装置进行对环境音频数据的语音识别。该语音识别装置可以包括声学模型、字典模块、语言模型和解码模块，录音装置可以通过对环境音频数据进行特征提取处理，再将提取后的特征输入声学模型、字典模块和语言模型中，以得到多个概率值，从而录音装置可以根据该多个概率值和解码模块，对环境音频数据进行语音识别。

进一步可选地，录音装置在录制完成第一录音文件之后，可以在目标应用程序界面为第一录音文件添加自定义标签，也可以切换回第一应用程序内为第一录音文件添加自定义标签。

示例性的，如图5所示，在音频数据录制完成后，用户通过对悬浮控件中的录制完成功能键进行输入，录音装置切换至第一应用程序的运行界面，悬浮控件切换为结束录制并准备进行下一次录制的状态。录音装置得到第一录音文件后，弹出显示供用户选择对第一录音文件的自定义标签的控件“添加标签”，如果用户对“添加标签”控件进行输入，则录音装置进一步显示根据录音装置对目标时段内语音内容的识别结果中提取出的多个关键词“甜蜜时光”、“学生时代”、“高三九班”，根据用户对上述多个关键词的输入，为第一录音文件添加自定义标签(即上述目标标签)。

如此，录音装置在录制完成第一录音文件之后，录音装置可以根据用户在目标时段的语音内容作为标签关键词，以供用户为第一录音文件添加自定义标签，以便于用户对第一录音文件进行归类，便于后续用户能够快速搜索到希望播放的第一录音文件。

可选地，在录音装置录制完成第一录音文件之后，在上述步骤103之后，本申请实施例提供的录音方法还可以包括步骤105。

步骤105、录音装置显示滤镜功能控件，并响应于用户对滤镜种类的选择，处理第一录音文件。

示例性的，如图6所示，在第一录音文件录制完成之后，录音装置显示滤镜功能控件，滤镜功能控件中包括“AI智能设置”控件和“手动选择”控件。如果用户对“AI智能设置”控件进行输入，则录音装置响应于该操作，根据目标音频数据的音频内容，自动的为第一录音文件匹配声音滤镜。如果用户对“手动选择”控件进行输入，则录音装置响应于该操作，继续弹出“人生柔和”、“歌唱美化”、“回声模式”等种类的滤镜供用户选择，并根据用户对上述滤镜种类的选择结果，为第一录音文件配置声音滤镜，从而使第一录音文件在播放时，听起来更有层次、更加立体且具有声音质感。

示例性的，上述根据滤镜种类处理第一录音文件的过程可以是在第一录音文件录制完成之后，录音装置切换回第一应用程序中进行的。

可选地，在上述第一录音文件中包括N个目标音频数据的情况下，在上述步骤101之后，本申请实施例提供的录音方法还可以包括步骤106和步骤107。

步骤106、录音装置显示第一目标标识，第一目标标识用于指示N个目标音频数据的播放顺序。

其中，N为正整数。

本申请实施例中，在录音装置录制第一录音文件的过程中，该录音装置将相继播放N个目标音频数据，则上述录音装置上可以显示第一目标标识，以便于用户了解录制进程，该第一目标标识用于指示N个目标音频数据的录制顺序。

本申请实施例中，上述第一目标标识可以显示在指示第一应用程序的悬浮控件中。

步骤107、开始播放第i个目标音频数据时，录音装置更新一次第一目标标识。

其中，i为正整数，i≤N。

可以理解的是，录音装置在播放N个目标音频数据的过程中，可以不断第更新第一目标标识，以便于用户了解录音进程。示例性的，如图4中的(a)所示，如果录音装置开始录制第1个目标音频数据，则第一目标标识从片段0更新显示为“片段1”，直至当用户点击播放第2个目标音频数据按键时，录音装置开始播放下一个目标音频数据。如图4中的(b)所示，此时，录音装置响应于用户的点击操作，将该第一目标标识从“片段1”更新显示为“片段2”。

示例性的，上述第一目标标识的显示形式可以是汉字结合数字，也可以仅以数字的方式显示第一目标标识。

如此，录音装置在录制目标音频数据的过程中，可以显示目标音频数据的片段序号，有助于提示用户第一录音文件中已经录制的目标音频数据的数量，帮助用户随时了解录制进程，以控制第一录音文件的文件时长。

可选地，在上述步骤101之前，本申请实施例提供的录音方法还可以包括步骤107、步骤108和步骤109。

步骤107、录音装置接收第二输入。

示例性的，上述第二输入为用户触发录音装置使用第一应用程序开始进行音频数据采集的输入。

步骤108、录音装置响应于第二输入，显示第二目标标识。

其中，第二目标标识用于指示：录制应用程序中的音频。

可以理解的，用户在使用第一应用程序进行音频数据采集时，需要向录音装置发出录音指令，该录音指令通常情况下是用过用户触发第一应用程序中的录音按键的第二输入产生的。示例性的，如图7中的(a)所示，当用户通过第二输入触发第一应用程序的录音按键后，录音装置显示第二目标标识，第二目标标识用于指示录制应用程序中的音频的录音功能，也就是本申请实施例中的跨应用录音的功能。

示例性的，当用户触发第一应用程序的录音按键后，录音装置显示还可以显示其他标识，其他标识可以用于指示“录音”或者“录音转文字”。

步骤109、录音装置接收用户对第二目标标识的第三输入，录音装置响应于第三输入，控制第一应用程序开始音频数据采集。

本申请实施例中，只有在用户触发第二目标标识之后，录音装置才进入跨应用录音的功能，可以准备开始录制目标应用程序内的目标音频数据。

示例性的，如图7中的(b)所示，录音装置响应于第三输入，在第一应用程序的操作界面内显示“悬浮控件已开启，切换到需要录音的应用后，点击悬浮麦克风即可开始录音”。而当用户触发其他标识时，录音装置不启用跨应用录音功能，也即录音装置不启用通过第一引用程序录制目标应用程序中的目标音频数据的功能。

如此，录音装置提供用户多个使用第一应用程序进行录音的场景，在用户选择使用跨应用录音时，才启用跨应用录音的功能，能够满足用户的不同录音需求。

需要说明的是，本申请实施例提供的录音方法，执行主体可以为录音装置，或者该录音装置中的用于执行录音方法的控制模块。本申请实施例中以录音装置执行录音方法为例，说明本申请实施例提供的录音装置。

如图8所示，本申请实施例提供一种录音装置800。该录音装置包括接收模块801、处理模块802。

接收模块801，用于在通过第一应用程序进行音频数据采集的情况下，接收用户的第一输入；

处理模块802，用于响应于接收模块801接收到的第一输入，播放目标应用程序中的目标音频数据，并通过第一应用程序得到第一录音文件；其中，第一录音文件至少包括目标音频数据。

可选地，本申请实施例中，处理模块802，还用于在从第一音频数据切换至第二音频数据进行播放的过程中，识别目标时段内的环境音频数据中的音频内容；其中，目标时段为：第一音频数据的结束播放的时间点至第二音频数据的开始播放的时间点间的时段。

可选地，本申请实施例中，处理模块802，还用于为第一录音文件添加目标标签；其中，目标标签是基于目标音频数据或者环境音频数据中的音频内容确定的。

可选地，本申请实施例中，目标音频数据的数量为N个，录音装置800还包括：显示模块803，用于显示第一目标标识，第一目标标识用于指示N个目标音频数据的播放顺序。处理模块802，还用于开始播放第i个目标音频数据时，更新第一目标标识。

可选地，本申请实施例中，处理模块803，还用于使用听筒播放目标音频数据；或以目标音量播放目标音频数据，并对第一录音文件中相应的音频内容补偿音量；或静音播放目标音频数据，并获取目标音频数据中的音频流。

可选地，本申请实施例中，接收模块801，还用于接收用户的第二输入，显示模块803，还用于响应于第二输入，显示第二目标标识，第二目标标识用于指示：录制应用程序中的音频；接收模块801，还用于接收用户对第二目标标识的第三输入；处理模块802，还用于响应于第三输入，控制第一应用程序开始音频数据采集。

本申请实施例提供一种录音装置，录音装置通过第一应用程序进行音频数据采集的情况下，录音装置在接收到用户的第一输入(该第一输入用于播放目标应用程序中的目标音频数据)后，响应于该第一输入，播放目标音频数据，并通过该第一应用程序得到第一录音文件(至少包括该目标音频数据的音频内容)。如此，在录音装置通过第一应用程序(例如：录音机、备忘录等具有录音功能的应用程序)录音的情况下，响应于用户的第一输入，录音装置切换至其他目标应用程序(例如：存储或者播放音频数据的多媒体应用程序和社交应用程序)中播放目标音频数据，在此过程中，录音装置持续进行录音，直至录音完成得到第一录音文件。如此，录音装置可以实现跨应用程序录制音频，进而可以将目标应用程序中的无法导出的目标音频数据录制为第一录音文件，方便用户通过播放录制的第一录音文件以获得目标音频数据的音频内容，提高了录音装置播放目标音频数据的形式多样性。

本申请实施例中的录音装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等，非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

本申请实施例中的录音装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本申请实施例不作具体限定。

本申请实施例提供的录音装置能够实现图1至图7的方法实施例实现的各个过程，为避免重复，这里不再赘述。

可选地，如图9所示，本申请实施例还提供一种电子设备900，包括处理器901，存储器902，存储在存储器902上并可在处理器901上运行的程序或指令，该程序或指令被处理器901执行时实现上述录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。

图10为实现本申请实施例的一种电子设备的硬件结构示意图。

该电子设备1000包括但不限于：射频单元1001、网络模块1002、音频输出单元1003、输入单元1004、传感器1005、显示单元1006、用户输入单元107、接口单元1008、存储器1009、以及处理器1010等部件。

本领域技术人员可以理解，电子设备1000还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器1010逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图10中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

其中，用户输入单元1007，用于在通过第一应用程序进行音频数据采集的情况下，接收用户的第一输入。处理器1010，用于响应于用户输入单元1007接收到的第一输入，播放目标应用程序中的目标音频数据，并通过第一应用程序得到第一录音文件。其中，第一录音文件至少包括目标音频数据的音频内容。

可选地，目标音频数据包括第一音频数据和第二音频数据，处理器1010具体用于，在从第一音频数据切换至第二音频数据进行播放的过程中，识别目标时段内的环境音频数据中的音频内容；其中，目标时段为：第一音频数据的结束播放的时间点至第二音频数据的开始播放的时间点间的时段。

可选地，处理器1010还用于为第一录音文件添加目标标签；其中，目标标签是基于目标音频数据或者环境音频数据中的音频内容确定的。

可选地，第一录音文件中包括N个目标音频数据，显示单元1006用于显示第一目标标识，第一目标标识用于指示N个目标音频数据的录制顺序；处理器1010，还用于开始播放第i个目标音频数据时，则更新一次第一目标标识，其中，N和i为正整数，i≤N。

可选地，处理器1010具体还用于：使用听筒播放目标音频数据；或以目标音量播放目标音频数据，并对第一录音文件中相应的音频内容补偿音量；或静音播放目标音频数据，并获取目标音频数据中的音频流。

可选地，用户输入单元1007，还用于接收用户的第二输入，显示单元1006，还用于响应于第二输入，显示第二目标标识，第二目标标识用于指示：录制应用程序中的音频；用户输入单元1007，还用于接收用户对第二目标标识的第三输入；处理器1010，还用于响应于第三输入，控制第一应用程序开始音频数据采集。

在本申请实施例中，在电子设备通过第一应用程序进行音频数据采集的情况下，电子设备在接收到用户的第一输入(该第一输入用于播放目标应用程序中的目标音频数据)后，响应于该第一输入，播放目标音频数据，并通过该第一应用程序得到第一录音文件(至少包括该目标音频数据的音频内容)。如此，在电子设备通过第一应用程序(例如：录音机、备忘录等具有录音功能的应用程序)录音的情况下，响应于用户的第一输入，电子设备切换至其他目标应用程序(例如：存储或者播放音频数据的多媒体应用程序和社交应用程序)中播放目标音频数据，在此过程中，电子设备持续进行录音，直至录音完成得到第一录音文件。如此，电子设备可以实现跨应用程序录制音频，进而可以将目标应用程序中的无法导出的目标音频数据录制为第一录音文件，方便用户通过播放录制的第一录音文件以获得目标音频数据的音频内容，提高了电子设备播放目标音频数据的形式多样性。

应理解的是，本申请实施例中，输入单元1004可以包括图形处理器(Graphics Processing Unit，GPU)10041和麦克风10042，图形处理器10041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1006可包括显示面板10061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板10061。用户输入单元1007包括触控面板10071以及其他输入设备10072。触控面板10071，也称为触摸屏。触控面板10071可包括触摸检测装置和触摸控制器两个部分。其他输入设备10072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。存储器1009可用于存储软件程序以及各种数据，包括但不限于应用程序和操作系统。处理器1010可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1010中。

本申请实施例还提供一种可读存储介质，可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，处理器为上述实施例中的电子设备中的处理器。可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片，芯片包括处理器和通信接口，通信接口和处理器耦合，处理器用于运行程序或指令，实现上述录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

一种录音方法，所述方法包括：

在通过第一应用程序进行音频数据采集的情况下，接收用户的第一输入；

响应于所述第一输入，播放目标应用程序中的目标音频数据，并通过所述第一应用程序得到第一录音文件；

其中，所述第一录音文件至少包括所述目标音频数据。
根据权利要求1所述的方法，其中，所述目标音频数据包括第一音频数据和第二音频数据；

所述接收用户的第一输入之后，所述方法还包括：

在从所述第一音频数据切换至所述第二音频数据进行播放的过程中，识别目标时段内的环境音频数据中的音频内容；

其中，所述目标时段为：所述第一音频数据的结束播放的时间点至所述第二音频数据的开始播放的时间点间的时段。
根据权利要求2所述的方法，其中，所述通过所述第一应用程序得到第一录音文件之后，所述方法还包括：

为所述第一录音文件添加目标标签；

其中，所述目标标签是基于所述目标音频数据或者所述环境音频数据中的音频内容确定的。
根据权利要求1所述的方法，其中，所述第一录音文件中包括N个目标音频数据；

所述接收用户的第一输入之后，所述方法还包括：

显示第一目标标识，所述第一目标标识用于指示N个所述目标音频数据的播放顺序；

开始播放第i个所述目标音频数据时，更新一次所述第一目标标识；

其中，N和i为正整数，i≤N。
根据权利要求1至4中任一项所述的方法，其中，所述播放所述目标音频数据，包括：

使用听筒播放所述目标音频数据；或，

以目标音量播放所述目标音频数据，并对所述第一录音文件中相应的音频内容补偿音量；或，

静音播放所述目标音频数据，并获取所述目标音频数据中的音频流。
根据权利要求1至4中任一项所述的方法，其中，所述接收第一输入之前，所述方法还包括：

接收用户的第二输入；

响应于所述第二输入，显示第二目标标识，所述第二目标标识用于指示：录制应用程序中的音频；

接收用户对所述第二目标标识的第三输入；

响应于所述第三输入，控制所述第一应用程序开始音频数据采集。
一种录音装置，所述装置包括：

接收模块，用于在通过第一应用程序进行音频数据采集的情况下，接收用户的第一输入；

处理模块，用于响应于所述接收模块接收到的所述第一输入，播放目标应用程序中的目标音频数据，并通过所述第一应用程序得到第一录音文件；

其中，所述第一录音文件至少包括所述目标音频数据。
根据权利要求7所述的装置，其中，所述目标音频数据包括第一音频数据和第二音频数据，所述装置还包括：

所述处理模块，还具体用于在从所述第一音频数据切换至所述第二音频数据进行播放的过程中，识别目标时段内的环境音频数据中的音频内容；

其中，所述目标时段为：所述第一音频数据的结束播放的时间点至所述第二音频数据的开始播放的时间点间的时段。
根据权利要求8所述的装置，其中，所述装置还包括：

所述处理模块，还具体用于为所述第一录音文件添加目标标签；

其中，所述目标标签是基于所述目标音频数据或者所述环境音频数据中的音频内容确定的。
根据权利要求7所述的装置，其中，所述第一录音文件中包括N个目标音频数据，所述装置还包括：

显示模块，用于显示第一目标标识，所述第一目标标识用于指示N个所述目标音频数据的播放顺序；

所述处理模块，还具体用于开始播放第i个所述目标音频数据时，更新一次所述第一目标标识；

其中，N和i为正整数，i≤N。
根据权利要求7至10中任一项所述的装置，其中，所述处理模块具体用于：

使用听筒播放所述目标音频数据；或，

以目标音量播放所述目标音频数据，并对所述第一录音文件中相应的音频内容补偿音量；或，

静音播放所述目标音频数据，并获取所述目标音频数据中的音频流。
根据权利要求7至10中任一项所述的装置，其中，所述装置还包括：

所述接收模块，还用于接收第二输入；

所述处理模块，还用于响应于所述第二输入，显示第二目标标识，所述第二目标标识用于指示：录制应用程序中的音频；

所述接收模块，还用于接收用户对所述第二目标标识的第三输入；

所述处理模块，还用于响应于所述第三输入，控制所述第一应用程序开始音频数据采集。
一种电子设备，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至6中任一项所述的录音方法的步骤。
一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1至6中任一项所述的录音方法的步骤。
一种计算机程序产品，所述程序产品被至少一个处理器执行以实现如权利要求1至6中任一项所述的录音方法。
一种电子设备，包括所述电子设备被配置成用于执行如权利要求1至6中任一项所述的录音方法。