CN111968686B

CN111968686B - 录音方法、装置和电子设备

Info

Publication number: CN111968686B
Application number: CN202010783445.7A
Authority: CN
Inventors: 刘才权
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Software Technology Co Ltd
Priority date: 2020-08-06
Filing date: 2020-08-06
Publication date: 2022-09-30
Anticipated expiration: 2040-08-06
Also published as: CN111968686A

Abstract

本申请实施例公开一种录音方法、装置和电子设备，属于通信技术领域，能够解决电子设备的录音的便捷性较差的问题。其中，录音方法包括：对第一麦克风和第二麦克风在同一时间分别采集的环境声音信号进行语音识别；在识别到环境声音信号中存在语音信号的情况下，基于环境声音信号对应的第一时长和第二时长，在目标存储区保存该语音信号；目标存储区为第一存储区或第二存储区，第一时长为：第一麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长；第二时长为：第二麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长。本申请实施例应用于电子设备根据环境声音信号，录制语音信号的过程。

Description

录音方法、装置和电子设备

技术领域

本申请属于通信技术领域，具体涉及一种录音方法、装置和电子设备。

背景技术

目前，用户在进行对话交流的过程中，可以对电子设备进行录音输入，以使得电子设备可以控制电子设备的麦克风录制该对话交流中所有用户的对话内容，以实现对该对话内容的记录。

然而，由于电子设备会录制所有用户的对话内容，当用户需求收听部分对话内容(例如某个用户的对话内容)时，用户需要触发电子设备播放所有用户的对话内容，以收听该某个用户的对话内容。

如此，导致电子设备的录音的便捷性较差。

发明内容

本申请实施例的目的是提供一种录音方法、装置和电子设备，能够解决电子设备的录音的便捷性较差的问题。

为了解决上述技术问题，本申请是这样实现的：

第一方面，本申请实施例提供了一种录音方法，应用于电子设备，该电子设备包括第一麦克风和第二麦克风，该方法包括：对第一麦克风和第二麦克风在同一时间分别采集的环境声音信号进行语音识别；在识别到环境声音信号中存在语音信号的情况下，在目标存储区保存该语音信号；其中，目标存储区为第一存储区或第二存储区，第一时长为：第一麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长；第二时长为：第二麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长；第一存储区为存储第一麦克风采集的语音信号的区域；第二存储区为存储第二麦克风采集的语音信号的区域。

第二方面，本申请实施例提供了一种录音装置，该录音装置包括第一麦克风和第二麦克风，该录音装置还包括：语音识别模块和保存模块。其中，语音识别模块，用于对第一麦克风和第二麦克风在同一时间分别采集的环境声音信号进行语音识别。保存模块，用于在识别到环境声音信号中存在语音信号的情况下，基于环境声音信号对应的第一时长和第二时长，在目标存储区保存该语音信号；其中，目标存储区为第一存储区或第二存储区，第一时长为：第一麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长；第二时长为：第二麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长；第一存储区为存储第一麦克风采集的语音信号的区域；第二存储区为存储第二麦克风采集的语音信号的区域。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第四方面，本申请实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

第五方面，本申请实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法。

在本申请实施例中，电子设备可以对第一麦克风和第二麦克风分别采集的环境声音信号进行语音识别，以在识别到环境声音信号中存在语音信号的情况下，基于第一时长(即第一麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长)和第二时长(即第一麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长)，在目标存储区(即第一存储区或第二存储区)保存该语音信号。由于电子设备可以在识别到环境声音信号中存在语音信号的情况下，基于第一麦克风对应的第一时长和第二麦克风对应的第二时长，在不同的存储区保存该语音信号，即电子设备可以在某个用户开始对话交流时，基于第一时长和第二时长，确定该某个用户的位置是贴近第一麦克风的位置的，或者，是贴近第二麦克风的位置的，并根据确定的该某个用户的位置，对应地在目标存储区保存该语音信号，因此电子设备可以采集并对应地保存该某个用户的对话内容，而并非根据用户的输入，采集并保存所有用户的对话内容，从而当用户需求收听某个用户的对话内容时，用户可以直接收听该某个用户的对话内容，而无需收听所有用户的对话内容，如此可以提升电子设备的录音的便捷性。

附图说明

图1是本申请实施例提供的一种录音方法的示意图之一；

图2是本申请实施例提供的一种录音方法的示意图之二；

图3是本申请实施例提供的一种手机的界面的实例示意图之一；

图4是本申请实施例提供的一种手机的界面的实例示意图之二；

图5是本申请实施例提供的一种手机的界面的实例示意图之三；

图6是本申请实施例提供的一种手机的界面的实例示意图之四；

图7是本申请实施例提供的一种手机的界面的实例示意图之五；

图8是本申请实施例提供的一种录音方法的示意图之三；

图9是本申请实施例提供的一种录音装置的结构示意图之一；

图10是本申请实施例提供的一种录音装置的结构示意图之二；

图11是本申请实施例提供的一种录音装置的结构示意图之三；

图12是本申请实施例提供的一种录音装置的结构示意图之四；

图13是本申请实施例提供的一种录音装置的结构示意图之五；

图14是本申请实施例提供的一种电子设备的结构示意图；

图15是本申请实施例提供的一种电子设备的硬件示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的录音方法进行详细地说明。

目前，在相关技术中，用户在进行对话交流的过程中，若用户需求对该对话交流的交流内容进行记录，则用户可以对电子设备进行输入，以使得电子设备可以前台运行录音类应用程序，从而用户可以对该录音类应用程序的界面中的开始录音按钮进行输入，以使得电子设备可以麦克风开始录制该对话交流的过程中所有用户的对话内容。然而，由于电子设备会录制所有用户的对话内容，当用户需求收听对话交流中的某个用户的对话内容时，用户需要触发电子设备播放所有用户的对话内容，以收听该某个用户的对话内容，因此导致电子设备的录音的便捷性较差。

为解决上述相关技术中存在的技术问题，本申请实施例提供一种录音方法，用户在进行对话交流的过程中，若用户需求对该对话交流的交流内容进行记录，则用户可以对电子设备进行输入，以使得电子设备可以前台运行录音类应用程序，从而用户可以对该录音类应用程序的界面中的智能录音按钮进行输入，以使得电子设备可以对电子设备的麦克风1和麦克风2在同一时间分别采集环境声音信号进行语音识别，并在识别到环境声音信号中存在语音信号时(即某个用户开始对话交流)，基于麦克风1对应的时长1(即麦克风1开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长)和麦克风2对应的时长(即麦克风2开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长)，确定该用户的位置是贴近麦克风1的位置的，或者，是贴近麦克风2的位置的，并根据确定的该某个用户的位置，对应地在不同的存储区(即存储区1或存储区2)存储该语音信号(即某个用户进行对话交流的交流内容对应的语音信号)，以及在存储区1或存储区2保存该语音信号之后，若预设时长内未识别到环境声音信号中存在语音信号时(即某个用户结束对话交流)，停止保存语音信号，并继续对麦克风1和麦克风2采集的环境声音信号进行语音识别。可以理解，电子设备可以采集某个用户的对话内容，并在对应地目标存储区保存该对话内容，而并非根据用户的输入，采集并保存所有用户的对话内容，从而当用户需求收听某个用户的对话内容时，用户可以直接收听该某个用户的对话内容，而无需收听所有用户的对话内容，如此可以提升电子设备的录音的便捷性。

本申请实施例提供的一种录音方法，图1示出了本申请实施例提供的录音方法的流程图。如图1所示，本申请实施例提供的录音方法可以包括下述的步骤101和步骤102。

步骤101、电子设备对第一麦克风和第二麦克风在同一时间分别采集的环境声音信号进行语音识别。

本申请实施例中，电子设备包括第一麦克风和第二麦克风。

可选的，本申请实施例中，上述第一麦克风和第二麦克风可以均为设置于电子设备上的麦克风；或者，均为并不设置于电子设备上、且与电子设备连接(例如无线连接、有线连接等)的麦克风。

可选的，本申请实施例中，在第一麦克风和第二麦克风均为设置于电子设备上的麦克风的情况下，该第一麦克风可以设置于电子设备的一端，该第二麦克风可以设置于电子设备的另一端(即与该一端不相邻的一端)；在第一麦克风和第二麦克风均为并不设置于电子设备上、且与电子设备连接的麦克风的情况下，第一麦克风与电子设备之间的距离不等于第二麦克风与电子设备之间的距离。

需要说明的是，上述“麦克风与电子设备之间的距离”可以理解为：麦克风(例如第一麦克风)距离电子设备的中心点之间的距离。

可选的，本申请实施例中，在多个用户(例如至少两个用户)进行对话交流的情况下，若需求对该对话交流的对话内容进行记录保存，则用户可以先对电子设备进行移动输入，以使得第一麦克风的位置与该至少两个用户中的一个用户的位置相对，且第二麦克风的位置与该至少两个用户中的另一个用户的位置相对，然后再触发电子设备前台运行第一应用程序，并对该第一应用程序的目标界面中的“智能录音”控件进行输入，以使得电子设备的语音识别功能处于开启状态，从而电子设备可以控制第一麦克风和第二麦克风在同一时间分别采集环境声音信号。

需要说明的是，上述“第一麦克风和第二麦克风在同一时间分别采集”可以理解为：电子设备控制第一麦克风和第二麦克风同一时间开始获取声音信号。

可选的，本申请实施例中，上述第一应用程序具体可以为具有录音功能的应用程序。

需要说明的是，上述“电子设备的语音识别功能处于开启状态”可以理解为：电子设备可以通过麦克风采集声音信号，并对该声音信号进行语音识别的状态。

可选的，本申请实施例中，电子设备可以将第一麦克风采集的环境声音信号输入至电子设备的与该第一麦克风对应的一个语音识别引擎中，并将第二麦克风采集的环境声音信号输入至电子设备的与该第二麦克风对应的另一个语音识别引擎中，以通过电子设备的两个语音识别引擎对环境声音信号进行语音识别。

可选的，本申请实施例中，针对两个语音识别引擎中的每个语音识别引擎，一个语音识别引擎可以包括声学模型、字典模块、语言模型和解码模块，电子设备可以先对环境声音信号进行特征提取处理，以获取该环境声音特征的多个特征向量，然后再将该多个特征向量作为输入数据输入该声学模型中，以使得该声学模型可以对该多个特征向量进行计算，以得到多个音素信息，从而电子设备可以通过该字典模块对该多个音素信息进行处理，以得到多个文本内容，并将该多个文本内容作为输入数据输入该语言模型中，以使得该语言模型可以对该多个文本内容进行计算，以得到多个概率值(每个概率值分别为一个文本内容为环境声音信号的语音识别文本的概率值)，从而电子设备可以根据该多个概率值和解码模块，对环境声音信号进行语音识别。

步骤102、电子设备在识别到环境声音信号中存在语音信号的情况下，基于环境声音信号对应的第一时长和第二时长，在目标存储区保存语音信号。

本申请实施例中，上述目标存储区为第一存储区或第二存储区；第一存储区为存储第一麦克风采集的语音信号的区域，第二存储区为存储第二麦克风采集的语音信号的区域。

本申请实施例中，上述第一时长为：第一麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长；上述第二时长为：第二麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长。

可以理解，若电子设备识别到环境声音信号中存在语音信号，则可以认为多个用户中的某个用户开始进行对话交流，而该某个用户与第一麦克风的距离(即该某个用户的位置与第一麦克风的位置的距离)和该某个用户与第二麦克风的距离(即该某个用户的位置与第二麦克风的位置的距离)并不相同，因此该某个用户对应的语音信号传播至第一麦克风的时间和传播至第二麦克风的时间并不相同，从而电子设备可以基于第一麦克风对应的第一时长和第二麦克风对应的第二时长，确定该某个用户的位置为贴近第一麦克风的位置，或者，为贴近第二麦克风的位置，并在不同的存储区(即第一存储区或第二存储区)中对应地保存该语音信号。

可选的，本申请实施例中，在电子设备识别到任意麦克风(即第一麦克风，和/或第二麦克风)采集的环境声音信号中存在语音信号的情况下，电子设备可以基于第一时长和第二时长，在目标存储区保存语音信号。

可选的，本申请实施例中，在电子设备在目标存储区保存语音信号之后，若某个用户停止进行对话交流，则用户可以对电子设备进行输入，以使得电子设备可以保存语音信号，或者，电子设备可以在某个用户停止进行对话交流的持续时间(例如下述实施例中的第一时间)大于或等于第一预设阈值(例如第一阈值)的情况下，停止保存语音信号，以得到某个用户进行对话交流的交流内容对应的语音信号。

可选的，本申请实施例中，在电子设备停止保存语音信号之后，电子设备可以再次执行步骤101和步骤102，即电子设备可以再次对第一麦克风和第二麦克风在同一时间分别采集的环境声音信号进行语音识别，以在识别到环境声音信号中存在语音信号的情况下，再次基于第一麦克风对应的时长(即第一麦克风开始采集环境声音信号的时刻，到电子设备识别到该语音信号的时刻之间的时长)和第二麦克风对应的时长(即第二麦克风开始采集环境声音信号的时刻，到电子设备识别到该语音信号的时刻之间的时长)，对应地保存该语音信号。

可选的，本申请实施例中，电子设备在未识别到环境声音信号中存在语音信号的情况下，可以继续对第一麦克风和第二麦克风在同一时间分别采集的环境声音信号进行语音识别。

本申请实施例中，若未识别到环境声音信号中存在语音信号，则可以认为用户并没有开始进行对话交流，从而电子设备可以继续对环境声音信号进行语音识别，以在用户开始进行对话交流时，对某个用户的对话交流的交流内容进行录音。

本申请实施例中，在多个用户在进行对话交流的情况下，若需求对该对话交流的交流内容进行记录保存，则可以触发电子设备对第一麦克风和第二麦克风在同一时间分别采集的环境声音信号进行语音识别；若识别到环境声音信号中存在语音信号的情况下，则可以认为该多个用户中的某个用户开始进行对话交流，从而电子设备可以基于第一麦克风对应的第一时长和第二麦克风对应的第二时长，确定该某个用户的位置为贴近第一麦克风的位置，或者，为贴近第二麦克风的位置，并在不同的存储区(即第一存储区或第二存储区)对应地保存该某个用户的交流内容；若未识别到环境声音信号中存在语音信号，则可以认为并没有任何用户开始进行对话交流，从而电子设备可以继续对第一麦克风和第二麦克风采集的当前环境声音信号进行语音识别。

本申请实施例提供一种录音方法，电子设备可以对第一麦克风和第二麦克风分别采集的环境声音信号进行语音识别，以在识别到环境声音信号中存在语音信号的情况下，基于第一时长(即第一麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长)和第二时长(即第一麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长)，在目标存储区(即第一存储区或第二存储区)保存该语音信号。由于电子设备可以在识别到环境声音信号中存在语音信号的情况下，基于第一麦克风对应的第一时长和第二麦克风对应的第二时长，在不同的存储区(即第一存储区或第二存储区)保存该语音信号，即电子设备可以在某个用户开始对话交流时，基于第一时长和第二时长，确定该某个用户的位置是贴近第一麦克风的位置的，或者，是贴近第二麦克风的位置的，并根据确定的该某个用户的位置，对应地在第一存储区或第二存储区保存该语音信号，因此电子设备可以采集并对应地保存该某个用户的对话内容，而并非根据用户的输入，采集并保存所有用户的对话内容，从而当用户需求收听某个用户的对话内容时，用户可以直接收听该某个用户的对话内容，而无需收听所有用户的对话内容，如此可以提升电子设备的录音的便捷性。

可选的，本申请实施例中，上述第一麦克风对应的第一距离不等于第二麦克风对应的第二距离，该第一距离为第一麦克风与电子设备之间的距离，该第二距离为第二麦克风与电子设备之间的距离。具体的，结合图1，如图2所示，在上述步骤102中的“基于环境声音信号对应的第一时长和第二时长，在目标存储区保存语音信号”之前，本申请实施例提供的录音方法还可以包括下述的步骤201和步骤202，并且上述步骤102具体可以通过下述的步骤102a和102b(或步骤102c)实现。

步骤201、电子设备在识别到环境声音信号中存在语音信号、且显示目标界面的情况下，获取第一语音信号和第二语音信号。

本申请实施例中，上述第一语音信号为第一麦克风采集的环境声音信号中的语音信号，上述第二语音信号为第二麦克风采集的环境声音信号中的语音信号。

可选的，本申请实施例中，在识别到环境声音信号中存在语音信号的情况下，若电子设备显示目标界面，则电子设备可以获取并保存第一麦克风和第二麦克风在同一时间分别采集的第一语音信号和第二语音信号。

可以理解，若第一距离不等于第二距离，则当某个用户开始进行对话交流时，第一麦克风采集到第一语音信号的时间，与第二麦克风采集到第二语音信号的时间不相同。

可选的，本申请实施例中，在第一麦克风和第二麦克风均为设置于电子设备上的麦克风的情况下，上述第一麦克风具体可以设置于电子设备的第一端(例如上边缘线所在的一端)，上述第二麦克风具体可以设置于电子设备的第二端(例如下边缘线所在的一端)。

示例性的，以电子设备为手机为例进行说明。如图3所示，手机包括第一麦克风(例如麦克风10)和第二麦克风(例如麦克风11)，该麦克风10设置于手机的上边缘线12所在的一端，该麦克风11设置于手机的下边缘线13所在的一端，用户可以对手机进行移动输入，以使得麦克风10的位置与该至少两个用户中的一个用户(例如用户14)的位置相对，且麦克风11的位置与该至少两个用户中的另一个用户(例如用户15)的位置相对，从而手机在识别到环境声音信号中存在语音信号、且手机显示目标界面(例如界面16)的情况下，可以获取麦克风10和麦克风11在同一时间分别采集用户14对应的第一语音信号和第二语音信号。

可选的，本申请实施例中，在麦克风为并不设置于电子设备上、且与电子设备无线连接的麦克风的情况下，上述第一麦克风可以放置于电子设备的第三端(例如电子设备的贴近一个用户的一端)，上述第二麦克风可以放置于电子设备的第四端(例如电子设备的贴近另一个用户的一端)。

可选的，本申请实施例中，上述第一语音信号和第二语音信号可以均为多个用户中的某个用户对应的语音信号。

步骤202、电子设备将第一语音信号对应的语音信息转化为第一语音识别文本，并将第二语音信号对应的语音信息转化为第二语音识别文本。

可选的，本申请实施例中，电子设备可以先对第一语音信号(和第二语音信号)对应的语音信息进行特征提取处理，以获取该第一语音信号(和第二语音信号)对应的语音信息的多个特征向量，然后再将该多个特征向量作为输入数据输入该声学模型中，以使得该声学模型可以对该多个特征向量进行计算，以得到多个音素信息，从而电子设备可以通过该字典模块对该多个音素信息进行处理，以得到多个文本内容，并将该多个文本内容作为输入数据输入该语言模型中，以使得该语言模型可以对该多个文本内容进行计算，以得到多个概率值(每个概率值分别为一个文本内容为环境声音信号的语音识别文本的概率值)，从而电子设备可以根据该多个概率值，分别通过解码模块对多个概率值对应的多个文本内容进行文本转化处理，以将第一语音信号(和第二语音信号)对应的语音信息转化为第一语音识别文本(和第二语音识别文本)。

可选的，本申请实施例中，第一语音识别文本的内容与第二语音识别文本的内容可以相同。

步骤102a、电子设备确定第一语音信号对应的第一时长是否大于第二语音信号对应的第二时长。

可以理解，上述第一时长可以为：第一麦克风开始采集环境声音信号的时刻，到电子设备识别到第一语音识别文本的时刻之间的时长；上述第二时长为：第二麦克风开始采集环境声音信号的时刻，到电子设备识别到第二语音识别文本的时刻之间的时长。

可选的，本申请实施例中，电子设备在控制第一麦克风和第二麦克风开始采集环境声音信号时，可以获取电子设备当前的系统时间，以将该系统时间确定为第一麦克风(和第二麦克风)开始采集环境声音信号的时刻。

可选的，本申请实施例中，电子设备在第一麦克风对应的语音识别引擎转化得到第一语音识别文本时，可以获取电子设备的系统时间，以将该系统时间确定为电子设备识别到第一语音识别文本的时刻，且电子设备在第二麦克风对应的语音识别引擎转化得到第二语音识别文本时，可以获取电子设备的系统时间，以将该系统时间确定为电子设备识别到第二语音识别文本的时刻。

可以理解，电子设备识别到第一语音识别文本的时刻和第二语音识别文本的时刻并不相同，如此电子设备可以通过确定第一时长是否大于第二时长，以确定该某个用户的位置是否贴近第二麦克风的位置，从而确定该某个用户是否为多个用户中的贴近第二麦克风的位置的用户。

示例性的，假设多个用户(例如两个用户)进行对话交流时，该两个用户(例如用户1和用户2)分别位于电子设备的不同端(即用户1位于电子设备的第一端，用户2位于电子设备的第二端)，在电子设备识别到环境声音信号中存在语音信号、且显示目标界面的情况下，电子设备可以获取并保存第一麦克风采集的第一语音信号，且获取并保存第二麦克风采集的第二语音信号，以根据第一时长和第二时长，确定该第一语音信号和该第二语音信号对应的用户是否贴近第二麦克风的位置，即确定该第一语音信号和该第二语音信号对应的用户是否为用户2。

步骤102b、若第一时长大于第二时长，则电子设备在第二存储区保存第二语音信号，并在目标界面的第一区域，显示第二语音识别文本。

本申请实施例中，若第一时长大于第二时长，则可以认为第一语音信号和第二语音信号对应的用户的位置距离第二麦克风的位置较近(即该用户的位置和第二麦克风的位置之间的距离，小于该用户的位置和第一麦克风的位置之间的距离)，即第一语音信号和第二语音信号对应的用户为贴近第二麦克风的用户，从而电子设备可以在目标界面的第一区域，显示第二语音识别文本。

可选的，本申请实施例中，上述第一区域可以为目标界面中的贴近电子设备的第三端(例如右边缘线所在的一端)的区域。

示例性的，如图4所示，若第一时长大于第二时长，则手机可以在目标界面(例如界面16)的第一区域(例如区域17)，显示第二语音识别文本(例如“这个条款是什么意思”语音识别文本)。

可选的，本申请实施例中，电子设备在第一存储区保存第二语音信号之后，可以对第一语音信号进行删除处理，以删除该第一语音信号。

可以理解，由于第二语音信号对应的用户的位置距离第二麦克风的位置较近，因此该第二语音信号中包括的背景噪音可能较少(即该第二语音信号中的噪声值小于第一语音信号中的噪声值)，从而电子设备可以保存第二语音信号，以使得用户在需求收听交流内容时，可以触发电子设备播放背景噪音较少的语音信号(即第二语音信号)。

步骤102c、若第一时长小于第二时长，则电子设备在第一存储区保存第一语音信号，并在目标界面的第二区域，显示第一语音识别文本。

本申请实施例中，若第一时长小于第二时长，则可以认为第一语音信号和第二语音信号对应的用户的位置距离第二麦克风的位置较远(即该用户的位置和第二麦克风的位置之间的距离，大于该用户的位置和第一麦克风的位置之间的距离)，即第一语音信号和第二语音信号对应的用户为贴近第一麦克风的用户，从而电子设备可以在目标界面的第二区域，显示第一语音识别文本。

可选的，本申请实施例中，上述第二区域可以为目标界面中的贴近电子设备的第四端(例如左边缘线所在的一端)的区域。

示例性的，如图5所示，若第一时长小于第二时长，则手机可以在界面16的第二区域(例如区域18)，显示第一语音识别文本(例如“这个条款是什么意思”语音识别文本)。

可选的，本申请实施例中，电子设备在第一存储区保存第一语音信号之后，可以对第二语音信号进行删除处理，以删除该第二语音信号。

可以理解，由于第一语音信号对应的用户的位置距离第一麦克风的位置较近，因此该第一语音信号中包括的背景噪音可能较少(即该第一语音信号中的噪声值小于第二语音信号中的噪声值)，从而电子设备可以保存第一语音信号，以使得用户在需求收听交流内容时，可以触发电子设备播放背景噪音较少的语音信号(即第一语音信号)。

本申请实施例中，由于电子设备在显示目标界面的情况下，可以根据第一语音信号(即第一麦克风采集的语音信号)对应的第一时长和第二语音信号(即第二麦克风采集的语音信号)对应的第二时长，确定该第一语音信号和第二语音信号对应的用户与第一麦克风之间的距离、和该用户与第二麦克风之间的距离的大小关系，并根据不同的大小关系，在目标界面中的不同区域显示语音识别文本(即第一语音识别文本或第二语音识别文本)，即电子设备可以根据不同的用户的位置，在目标界面中的不同区域显示语音识别文本，从而用户可以根据需求，快速地在该不同区域中的某个区域中查找某个语音识别文本，而无需在目标界面中的全部区域逐一查找某个语音识别文本，如此可以减少用户查找语音识别文本的耗时。

可选的，本申请实施例中，在上述步骤102a之后，本申请实施例提供的录音方法还可以包括下述的步骤102d。

步骤102d、若第一时长等于第二时长、且环境声音信号包含至少两个用户的语音信号，则在目标界面上显示提示信息，或者，在目标区域上显示目标语音识别文本。

本申请实施例中，上述提示信息用于提示第一用户位于第一麦克风的第一侧，且第二用户位于第二麦克风的第二侧，上述至少两个用户包括第一用户和第二用户，该第一侧为远离第二麦克风的一侧，该第二侧为远离第一麦克风的一侧，上述目标区域为第一区域或第二区域，上述目标语音识别文本为第一语音识别文本或第二语音识别文本。

本申请实施例中，若第一时长等于第二时长、且环境声音信号包含至少两个用户的语音信号，则可以认为第一语音信号和第二语音信号对应的第一用户(或第二用户)的位置距离第二麦克风的位置、和该第一用户(或第二用户)的位置距离第二麦克风的位置相同(即该第一用户(或第二用户)的位置和第二麦克风的位置之间的距离，等于该第一用户(或第二用户)的位置和第一麦克风的位置之间的距离)，且该至少两个用户同时进行对话交流，从而电子设备可以在目标界面上显示提示信息，或者，在目标区域上显示目标语音识别文本。

需要说明的是，上述“第一时长等于第二时长”可以理解为：第一时长与第二时长相同，或者，第一时长与第二时长之间的差值小于或等于预设阈值。

可选的，本申请实施例中，电子设备可以在目标界面上悬浮显示提示信息，以提示至少两个用户位于两个麦克风的两侧。

可选的，本申请实施例中，在目标区域上显示目标语音识别文本之后，电子设备可以采用第一标记方式，标记该目标语音识别文本。

可选的，本申请实施例中，上述第一标记方式可以为以下任一项：虚线框标记方式、高亮标记方式、彩色标记方式、灰度标记方式、以预设透明度标记方式以及闪烁标记方式等。

示例性的，如图6所示，若第一时长等于第二时长、且环境声音信号包含至少两个用户的语音信号，则手机可以在目标界面(例如界面19)的目标区域(例如区域20)上显示目标语音识别文本(例如“这个条款是什么意思”语音识别文本)，并采用第一标记方式(例如虚线框标记方式)标记该“你看合同还有什么问题吗”语音识别文本。

本申请实施例中，由于电子设备可以在第一时长等于第二时长、且环境声音信号包含至少两个用户的语音信号的情况下，显示提示信息(或在目标区域显示目标语音识别文本)，以使得第一用户和第二用户可以根据提示信息(或目标区域中的语音识别文本)，调整第一用户和第二用户的位置(或调整第一麦克风和第二麦克风的位置)，以位于两个麦克风的两侧，如此可以使得电子设备在不同的区域，显示至少两个用户中的不同用户对应的语音识别文本，以提升用户的使用体验。

可选的，本申请实施例中，在上述步骤201之后，本申请实施例提供的录音方法还可以包括下述的步骤301至步骤303。

步骤301、电子设备在目标界面上显示音频标识。

本申请实施例中，上述音频标识指示目标语音信号，该目标语音信号为第一语音信号或第二语音信号。

可选的，本申请实施例中，在第一时长大于第二时长的情况下，电子设备可以在目标界面的第一区域，显示音频标识；或者，在第一时长小于第二时长的情况下，电子设备可以在目标界面的第二区域，显示音频标识；或者，在第一时长等于第二时长的情况下，电子设备可以在目标界面的目标区域上显示音频标识。

可选的，本申请实施例中，上述音频标识可以为以下任一项：目标语音信号的名称、目标语音信号的图标和目标语音信号的链接等。

示例性的，结合图4，如图7所示，若第一时长大于第二时长，则手机可以在界面16的区域17，显示音频标识(例如目标语音信号的图标21)，从而用户可以对该图标21进行输入，以使得手机可以播放目标语音信号。

步骤302、电子设备接收用户对音频标识的第一输入。

本申请实施例中，当用户需求收听目标语音信号时，用户可以对音频标识进行第一输入，以使得电子设备可以播放该目标语音信号。

可选的，本申请实施例中，上述第一输入具体可以为用户对音频标识的点击输入。

步骤303、电子设备响应于第一输入，播放目标语音信号。

本申请实施例中，由于电子设备可以目标界面上显示音频标识，从而用户可以根据需求，对该音频标识进行输入，以使得电子设备可以快速地播放目标语音信号，以提示用户的使用体验。

需要说明的是，针对步骤102b(或步骤102c)和步骤301的执行顺序，本申请实施例不做限制。在一种可能的实现方式，电子设备可以先执行步骤102b(或步骤102c)，再执行步骤301，即电子设备可以先在第二存储区(或第一存储区)保存第二语音信号(或第一语音信号)，并在第一区域显示第二语音识别文本(或第一语音识别文本)，再在目标界面上显示音频标识。在另一种可能的实现方式，电子设备可以先执行步骤301，再执行步骤102b(或步骤102c)，即电子设备可以在目标界面上显示音频标识，再在第二存储区(或第一存储区)保存第二语音信号(或第一语音信号)，并在第一区域显示第二语音识别文本(或第一语音识别文本)。在又一种可能的实现方式，电子设备可以同时执行步骤102b(或步骤102c)和步骤301，即电子设备在第二存储区(或第一存储区)保存第二语音信号(或第一语音信号)，并在第一区域显示第二语音识别文本(或第一语音识别文本)的同时，在目标界面上显示音频标识。

可选的，本申请实施例中，在上述步骤201之后，本申请实施例提供的录音方法还可以包括下述的步骤401。

步骤401、若第一时长等于第二时长，则删除目标语音信号。

本申请实施例中，上述目标语音信号为第一语音信号或第二语音信号。

本申请实施例中，若第一时长等于第二时长，则可以认为第一语音信号和第二语音信号对应的用户的位置距离第二麦克风的位置、和该用户的位置距离第二麦克风的位置相同，因此该第一语音信号中包括的背景噪音和该第二语音信号中包括的背景噪音可能相同，从而电子设备可以删除目标语音信号(即第一语音信号或第二语音信号)，以保存一个语音信号(即第二语音信号或第一语音信号)。

本申请实施例中，由于电子设备可以在第一时长等于第二时长的情况下，删除任意一个语音信号，如此可以节省语音信号的存储空间。

可选的，本申请实施例中，结合图1，如图8所示，在上述步骤102之后，本申请实施例提供的录音方法还包括下述的步骤103。

步骤103、在第一时间大于或等于第一阈值的情况下，电子设备停止保存语音信号。

本申请实施例中，上述第一时间为：在电子设备识别到环境声音信号中存在语音信号的开始时刻之后，电子设备未识别到环境声音信号中存在语音信号的持续时间。

本申请实施例中，若第一时间大于或等于第一阈值，则可以认为第一语音信号和第二语音信号对应的某个用户已经停止交流对话，从而电子设备可以停止保存语音信号。

可选的，本申请实施例中，在电子设备停止保存语音信号之后，电子设备可以控制电子设备继续对第一麦克风和第二麦克风在同一时间采集的环境声音信号进行语音识别。

可以理解，在多个用户中的一个用户停止交流对话之后，可能多个用户的另一个用户仍需求进行对话交流，从而电子设备可以再次对环境声音信号进行语音识别。

本申请实施例中，由于电子设备在第一时间大于或等于第一阈值的情况下，可以停止保存语音信号，即电子设备保存的语音信号中仅包括用户对应的语音信号，因此节省语音信号的存储空间。

需要说明的是，本申请实施例提供的录音方法，执行主体可以为录音装置，或者该录音装置中的用于执行录音方法的控制模块。本申请实施例中以录音装置执行录音的方法为例，说明本申请实施例提供的录音装置。

图9示出了本申请实施例中涉及的录音装置的一种可能的结构示意图。如图9所示，录音装置60包括第一麦克风和第二麦克风，该录音装置60可以包括：语音识别模块61和保存模块62。

其中，语音识别模块61，用于对第一麦克风和第二麦克风在同一时间分别采集的环境声音信号进行语音识别。保存模块62，用于在语音识别模块61识别到环境声音信号中存在语音信号的情况下，基于环境声音信号对应的第一时长和第二时长，在目标存储区保存语音信号，该目标存储区为第一存储区或第二存储区。其中，第一时长为：第一麦克风开始采集环境声音信号的时刻，到录音装置识别到语音信号的时刻之间的时长；第二时长为：第二麦克风开始采集环境声音信号的时刻，到录音装置识别到语音信号的时刻之间的时长，第一存储区为存储第一麦克风采集的语音信号的区域，第二存储区为存储第二麦克风采集的语音信号的区域。

在一种可能的实现方式中，上述保存模块62，还用于在目标存储区保存语音信号之后，在第一时间大于或等于第一阈值的情况下，停止保存语音信号。其中，第一时间为：在录音装置识别到环境声音信号中存在语音信号的开始时刻之后，录音装置未识别到环境声音信号中存在语音信号的持续时间。

在一种可能的实现方式中，上述第一麦克风对应的第一距离不等于第二麦克风对应的第二距离，该第一距离为第一麦克风与录音装置之间的距离，该第二距离为第二麦克风与录音装置之间的距离。结合图9，如图10所示，本申请实施例提供的录音装置60还可以包括：获取模块63、转化模块64和显示模块65。其中，获取模块63，用于在录音装置显示目标界面的情况下，获取第一语音信号和第二语音信号；该第一语音信号为第一麦克风采集的环境声音信号中的语音信号，该第二语音信号为第二麦克风采集的环境声音信号中的语音信号。转化模块64，用于将获取模块63获取的第一语音信号对应的语音信息转化为第一语音识别文本，并将获取模块63获取的第二语音信号对应的语音信息转化为第二语音识别文本。上述保存模块62，具体用于若第一时长大于第二时长，则在第一存储区保存第二语音信号。显示模块65，用于在目标界面的第一区域，显示转化模块64转化的第二语音识别文本。上述保存模块62，具体用于若第一时长小于第二时长，则在第二存储区保存第一语音信号。显示模块65，用于在目标界面的第二区域，显示转化模块64转化的第一语音识别文本。

在一种可能的实现方式中，上述显示模块65，还用于在获取模块63获取第一语音信号和第二语音信号之后，在目标界面上显示音频标识，该音频标识指示目标语音信号，该目标语音信号为第一语音信号或第二语音信号。结合图10，如图11所示，本申请实施例提供的录音装置60还可以包括：接收模块66和播放模块67。其中，接收模块66，用于接收用户对音频标识的第一输入。播放模块67，用于响应于接收模块66接收的第一输入，播放目标语音信号。

在一种可能的实现方式中，结合图10，如图12所示，本申请实施例提供的录音装置60还可以包括：提示模块68。其中，提示模块68，用于在获取模块63获取第一语音信号和第二语音信号之后，若第一时长等于第二时长、且环境声音信号包含至少两个用户的语音信号，则在目标界面上显示提示信息。或者，显示模块65，还用于若第一时长等于第二时长、且环境声音信号包含至少两个用户的语音信号，则在目标区域上显示目标语音识别文本。其中，提示信息用于提示第一用户位于第一麦克风的第一侧，且第二用户位于第二麦克风的第二侧；至少两个用户包括第一用户和第二用户；该第一侧为远离第二麦克风的一侧；该第二侧为远离第一麦克风的一侧；该目标区域为第一区域或第二区域；目标语音识别文本为第一语音识别文本或第二语音识别文本。

在一种可能的实现方式中，结合图10，如图13所示，本申请实施例提供的录音装置60还可以包括：删除模块69。其中，删除模块69，用于在获取模块63获取第一语音信号和第二语音信号之后，若第一时长等于第二时长，则删除目标语音信号。其中，目标语音信号为第一语音信号或第二语音信号。

本申请实施例提供一种录音装置，由于录音装置可以在识别到环境声音信号中存在语音信号的情况下，基于第一麦克风对应的第一时长和第二麦克风对应的第二时长，在不同的存储区(即第一存储区或第二存储区)保存该语音信号，即录音装置可以在某个用户开始对话交流时，基于第一时长和第二时长，确定该某个用户的位置是贴近第一麦克风的位置的，或者，是贴近第二麦克风的位置的，并根据确定的该某个用户的位置，对应地在第一存储区或第二存储区保存该语音信号，因此录音装置可以采集并对应地保存该某个用户的对话内容，而并非根据用户的输入，采集并保存所有用户的对话内容，从而当用户需求收听某个用户的对话内容时，用户可以直接收听该某个用户的对话内容，而无需收听所有用户的对话内容，如此可以提升录音装置的录音的便捷性。

本申请实施例中的录音装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personaldigital assistant，PDA)等，非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

本申请实施例中的录音装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本申请实施例不作具体限定。

本申请实施例提供的录音装置能够实现图1至图8的方法实施例实现的各个过程，为避免重复，这里不再赘述。

可选的，如图14所示，本申请实施例还提供一种电子设备70，包括处理器71，存储器72，存储在存储器72上并可在所述处理器71上运行的程序或指令，该程序或指令被处理器71执行时实现上述录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。

图15为实现本申请实施例的一种电子设备的硬件结构示意图。

该电子设备100包括但不限于：射频单元101、网络模块102、音频输出单元103、输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、以及处理器110等部件。

本领域技术人员可以理解，电子设备100还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器110逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图15中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

其中，处理器110，用于对第一麦克风和第二麦克风在同一时间分别采集的环境声音信号进行语音识别；并在识别到环境声音信号中存在语音信号的情况下，基于环境声音信号对应的第一时长和第二时长，在目标存储区保存语音信号，该目标存储区为第一存储区或第二存储区。其中，第一时长为：第一麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长；第二时长为：第二麦克风开始采集环境声音信号的时刻，到电子设备识别到语音信号的时刻之间的时长；第一存储区为存储第一麦克风采集的语音信号的区域，第二存储区为存储第二麦克风采集的语音信号的区域。

本申请实施例提供一种电子设备，由于电子设备可以在识别到环境声音信号中存在语音信号的情况下，基于第一麦克风对应的第一时长和第二麦克风对应的第二时长，在不同的存储区(即第一存储区或第二存储区)保存该语音信号，即电子设备可以在某个用户开始对话交流时，基于第一时长和第二时长，确定该某个用户的位置是贴近第一麦克风的位置的，或者，是贴近第二麦克风的位置的，并根据确定的该某个用户的位置，对应地在第一存储区或第二存储区保存该语音信号，因此电子设备可以采集并对应地保存该某个用户的对话内容，而并非根据用户的输入，采集并保存所有用户的对话内容，从而当用户需求收听某个用户的对话内容时，用户可以直接收听该某个用户的对话内容，而无需收听所有用户的对话内容，如此可以提升电子设备的录音的便捷性。

可选的，本申请实施例中，处理器110，还用于在目标存储区保存语音信号之后，在第一时间大于或等于第一阈值的情况下，停止保存语音信号。其中，第一时间为：在电子设备识别到环境声音信号中存在语音信号的开始时候之后，电子设备未识别到环境声音信号中存在语音信号的持续时间。

可选的，本申请实施例中，上述第一麦克风对应的第一距离不等于第二麦克风对应的第二距离，该第一距离为第一麦克风与电子设备之间的距离，该第二距离为第二麦克风与电子设备之间的距离。

处理器110，还用于在处理器110基于环境声音信号对应的第一时长和第二时长，在目标存储区保存语音信号之前，在电子设备显示目标界面的情况下，获取第一语音信号和第二语音信号；该第一语音信号为第一麦克风采集的环境声音信号中的语音信号，该第二语音信号为第二麦克风采集的环境声音信号中的语音信号；将第一语音信号对应的语音信息转化为第一语音识别文本，并将第二语音信号对应的语音信息转化为第二语音识别文本；以及，若第一时长大于第二时长，则在第一存储区保存第二语音信号，或者，若第一时长小于第二时长，则在第二存储区保存第一语音信号。

显示单元106，用于在目标界面的第一区域，显示第二语音识别文本，或者，在目标界面的第二区域，显示第一语音识别文本。

本申请实施例中，由于电子设备在显示目标界面的情况下，可以根据第一语音信号(即第一麦克风采集的语音信号)对应的第一时长和第二语音信号(即第二麦克风采集的语音信号)对应的第二时长，确定该第一语音信号和第二语音信号对应的用户与第一麦克风之间的距离、和该用户与第二麦克风之间的距离的大小关系，并根据不同的大小关系，在目标界面中的不同区域显示目标语音识别文本，即电子设备可以根据不同的用户的位置，在目标界面中的不同区域显示目标语音识别文本，从而用户可以根据需求，快速地在该不同区域中的某个区域中查找某个语音识别文本，而无需在目标界面中的全部区域逐一查找某个语音识别文本，如此可以减少用户查找语音识别文本的耗时。

可选的，本申请实施例中，显示单元106，还用于在处理器110获取第一语音信号和第二语音信号之后，在目标界面上显示音频标识，该音频标识指示目标语音信号，该目标语音信号为第一语音信号或第二语音信号。

用户输入单元107，用于接收用户对音频标识的第一输入。

音频输出单元103，用于响应于第一输入，播放目标语音信号。

可选的，本申请实施例中，显示单元106，还用于在处理器110获取第一语音信号和第二语音信号之后，若第一时长等于第二时长、且环境声音信号包含至少两个用户的语音信号，则在目标界面上显示提示信息；或者，在目标区域上显示目标语音识别文本。

其中，上述提示信息用于提示第一用户位于第一麦克风的第一侧，且第二用户位于第二麦克风的第二侧；该至少两个用户包括第一用户和第二用户；该第一侧为远离第二麦克风的一侧；该第二侧为远离第一麦克风的一侧；该目标区域为第一区域或第二区域；该目标语音识别文本为第一语音识别文本或第二语音识别文本。

可选的，本申请实施例中，处理器110，还用于在获取第一语音信号和第二语音信号之后，若第一时长等于第二时长，则删除目标语音信号。

其中，上述目标语音信号为第一语音信号或第二语音信号。

应理解的是，本申请实施例中，输入单元104可以包括图形处理器(GraphicsProcessing Unit，GPU)1041和麦克风1042，图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元106可包括显示面板1061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板1061。用户输入单元107包括触控面板1071以及其他输入设备1072。触控面板1071，也称为触摸屏。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。存储器109可用于存储软件程序以及各种数据，包括但不限于应用程序和操作系统。处理器110可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器110中。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

1.一种录音方法，应用于电子设备，其特征在于，所述电子设备包括第一麦克风和第二麦克风，所述方法包括：

对所述第一麦克风和所述第二麦克风在同一时间分别采集的环境声音信号进行语音识别；

在识别到所述环境声音信号中存在语音信号的情况下，基于所述环境声音信号对应的第一时长和第二时长，确定发出所述语音信号的用户的位置为贴近所述第一麦克风的位置或贴近所述第二麦克风的位置，并在对应的目标存储区保存所述语音信号，所述目标存储区为第一存储区或第二存储区；

其中，所述第一时长为：所述第一麦克风开始采集所述环境声音信号的时刻，到所述电子设备识别到所述语音信号的时刻之间的时长；

所述第二时长为：所述第二麦克风开始采集所述环境声音信号的时刻，到所述电子设备识别到所述语音信号的时刻之间的时长；

所述第一存储区为存储所述第一麦克风采集的语音信号的区域；

所述第二存储区为存储所述第二麦克风采集的语音信号的区域。

2.根据权利要求1所述的方法，其特征在于，在目标存储区保存所述语音信号之后，所述方法还包括：

在第一时间大于或等于第一阈值的情况下，停止保存所述语音信号；

其中，所述第一时间为：在所述电子设备识别到所述环境声音信号中存在所述语音信号的开始时刻之后，所述电子设备未识别到所述环境声音信号中存在语音信号的持续时间。

3.根据权利要求1所述的方法，其特征在于，所述第一麦克风对应的第一距离不等于所述第二麦克风对应的第二距离，所述第一距离为所述第一麦克风与所述电子设备之间的距离，所述第二距离为所述第二麦克风与所述电子设备之间的距离；

所述基于所述环境声音信号对应的第一时长和第二时长，确定发出所述语音信号的用户的位置为贴近所述第一麦克风的位置或贴近所述第二麦克风的位置，并在对应的目标存储区保存所述语音信号之前，所述方法还包括：

在显示目标界面的情况下，获取第一语音信号和第二语音信号；所述第一语音信号为所述第一麦克风采集的所述环境声音信号中的语音信号，所述第二语音信号为所述第二麦克风采集的所述环境声音信号中的语音信号；

将所述第一语音信号对应的语音信息转化为第一语音识别文本，并将所述第二语音信号对应的语音信息转化为第二语音识别文本；

所述基于所述环境声音信号对应的第一时长和第二时长，确定发出所述语音信号的用户的位置为贴近所述第一麦克风的位置或贴近所述第二麦克风的位置，并在对应的目标存储区保存所述语音信号，包括：

若所述第一时长大于所述第二时长，则确定发出所述语音信号的用户的位置为贴近所述第二麦克风的位置，并在所述第二存储区保存所述第二语音信号，并在所述目标界面的第一区域，显示所述第二语音识别文本；

若所述第一时长小于所述第二时长，则确定发出所述语音信号的用户的位置为贴近所述第一麦克风的位置，并在所述第一存储区保存所述第一语音信号，并在所述目标界面的第二区域，显示所述第一语音识别文本。

4.根据权利要求3所述的方法，其特征在于，所述获取第一语音信号和第二语音信号之后，所述方法还包括：

在所述目标界面上显示音频标识，所述音频标识用于指示目标语音信号，所述目标语音信号为所述第一语音信号或所述第二语音信号；

接收用户对所述音频标识的第一输入；

响应于所述第一输入，播放所述目标语音信号。

5.根据权利要求3所述的方法，其特征在于，所述获取第一语音信号和第二语音信号之后，所述方法还包括：

若所述第一时长等于所述第二时长、且所述环境声音信号包含至少两个用户的语音信号，则在所述目标界面上显示提示信息，或者，在目标区域上显示目标语音识别文本；

其中，所述提示信息用于提示第一用户位于所述第一麦克风的第一侧，且第二用户位于所述第二麦克风的第二侧；

所述至少两个用户包括所述第一用户和所述第二用户；

所述第一侧为远离所述第二麦克风的一侧；

所述第二侧为远离所述第一麦克风的一侧；

所述目标区域为所述第一区域或所述第二区域；

所述目标语音识别文本为所述第一语音识别文本或所述第二语音识别文本。

6.根据权利要求3所述的方法，其特征在于，所述获取第一语音信号和第二语音信号之后，所述方法还包括：

若所述第一时长等于所述第二时长，则删除目标语音信号；

其中，所述目标语音信号为所述第一语音信号或所述第二语音信号。

7.一种录音装置，其特征在于，所述录音装置包括第一麦克风和第二麦克风，所述录音装置还包括：语音识别模块和保存模块；

所述语音识别模块，用于对所述第一麦克风和所述第二麦克风在同一时间分别采集的环境声音信号进行语音识别；

所述保存模块，用于在所述语音识别模块识别到所述环境声音信号中存在语音信号的情况下，基于所述环境声音信号对应的第一时长和第二时长，确定发出所述语音信号的用户的位置为贴近所述第一麦克风的位置或贴近所述第二麦克风的位置，并在对应的目标存储区保存所述语音信号，所述目标存储区为第一存储区或第二存储区；

其中，所述第一时长为：所述第一麦克风开始采集所述环境声音信号的时刻，到电子设备识别到所述语音信号的时刻之间的时长；

所述第二时长为：所述第二麦克风开始采集所述环境声音信号的时刻，到电子设备识别到所述语音信号的时刻之间的时长；

8.根据权利要求7所述的录音装置，其特征在于，所述保存模块，还用于在目标存储区保存所述语音信号之后，在第一时间大于或等于第一阈值的情况下，停止保存所述语音信号；

9.根据权利要求7所述的录音装置，其特征在于，所述第一麦克风对应的第一距离不等于所述第二麦克风对应的第二距离，所述第一距离为所述第一麦克风与所述电子设备之间的距离，所述第二距离为所述第二麦克风与所述电子设备之间的距离；

所述录音装置还包括：获取模块、转化模块和显示模块；

所述获取模块，用于在显示目标界面的情况下，获取第一语音信号和第二语音信号；所述第一语音信号为所述第一麦克风采集的所述环境声音信号中的语音信号，所述第二语音信号为所述第二麦克风采集的所述环境声音信号中的语音信号；

所述转化模块，用于将所述获取模块获取的所述第一语音信号对应的语音信息转化为第一语音识别文本，并将所述获取模块获取的所述第二语音信号对应的语音信息转化为第二语音识别文本；

所述保存模块，具体用于若所述第一时长大于所述第二时长，则确定发出所述语音信号的用户的位置为贴近所述第二麦克风的位置，并在所述第二存储区保存所述第二语音信号；

所述显示模块，用于在所述目标界面的第一区域，显示所述转化模块转化的所述第二语音识别文本；

所述保存模块，具体用于若所述第一时长小于所述第二时长，则确定发出所述语音信号的用户的位置为贴近所述第一麦克风的位置，并在所述第一存储区保存所述第一语音信号；

所述显示模块，还用于在所述目标界面的第二区域，显示所述转化模块转化的所述第一语音识别文本。

10.根据权利要求9所述的录音装置，其特征在于，所述显示模块，还用于在所述获取模块获取第一语音信号和第二语音信号之后，在所述目标界面上显示音频标识，所述音频标识指示目标语音信号，所述目标语音信号为所述第一语音信号或所述第二语音信号；

所述录音装置还包括：接收模块和播放模块；

所述接收模块，用于接收用户对所述音频标识的第一输入；

所述播放模块，用于响应于所述接收模块接收的所述第一输入，播放所述目标语音信号。

11.根据权利要求9所述的录音装置，其特征在于，所述录音装置还包括：提示模块；

所述提示模块，用于在所述获取模块获取第一语音信号和第二语音信号之后，若所述第一时长等于所述第二时长、且所述环境声音信号包含至少两个用户的语音信号，则在所述目标界面上显示提示信息；

或者，

所述显示模块，还用于若所述第一时长等于所述第二时长、且所述环境声音信号包含至少两个用户的语音信号，则在目标区域上显示目标语音识别文本；

所述至少两个用户包括所述第一用户和所述第二用户；

所述第一侧为远离所述第二麦克风的一侧；

所述第二侧为远离所述第一麦克风的一侧；

所述目标区域为所述第一区域或所述第二区域；

12.根据权利要求9所述的录音装置，其特征在于，所述录音装置还包括：删除模块；

所述删除模块，用于在所述获取模块获取第一语音信号和第二语音信号之后，若所述第一时长等于所述第二时长，则删除目标语音信号；

13.一种电子设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至6中任一项所述的录音方法的步骤。