WO2016119370A1

WO2016119370A1 - 一种实现录音的方法、装置和移动终端

Info

Publication number: WO2016119370A1
Application number: PCT/CN2015/081454
Authority: WO
Inventors: 奚黎明
Original assignee: 中兴通讯股份有限公司
Priority date: 2015-01-27
Filing date: 2015-06-15
Publication date: 2016-08-04
Also published as: CN104657074A; CN104978145A

Abstract

一种实现录音的方法、装置和移动终端，包括移动终端获取录音标记信息；将获得的录音标记信息转换为语音信息；将转换后得到的语音信息插入到录音文件中形成录音合成文件。上述技术方案将标记信息作为最终的录音文件的一部分，简单地、快捷地实现了在录音过程中随时对录音文件的标记；并且，在后续播放录音文件的同时，实现了标记信息的同步播放，而不要用户手动查阅。进一步地，由于录音文件和标记信息是同时存储在同一个合成录音文件中的，因此，在将录音文件分享到其他设备，同时也将其标记信息共享给了其他设备。

Description

一种实现录音的方法、装置和移动终端

技术领域

本文涉及移动终端录播技术，尤指一种实现录音的方法、装置和移动终端。

背景技术

随着智能终端的应用越来越广泛，在很多场景下，人们使用智能终端替代了如照相机、MP3、MP4、录音笔等传统设备，方便地实现了拍照、音视频播录等功能。

目前，在会议场合经常会对会议内容进行录音。例如，在用户使用手机进行录音的过程中，手机必须一直停留在录音界面，使得手机屏幕一直处于点亮状态，非常耗电。并且在录音过程中无法对录音内容进行标记，需要在录音完成后，根据录音文件内容再进行标记，例如发言人身份信息及其他记录信息等。而且，这种标记信息只能通过手机屏幕上的显示来查看，使用非常不方便。另外，如果用户想要将录音文件分享到其他设备上播放，则无法正常查看所述标注信息。

发明内容

为了解决上述技术问题，本发明实施例提供一种实现录音的方法、装置和移动终端，能够简单地、快捷地实现对录音文件的标记，并在播放录音文件的同时播放标记信息。

为了达到本发明目的，本发明实施例提供了一种实现录音的方法，包括：移动终端获取录音标记信息；

将获得的录音标记信息转换为语音信息；

将转换后得到的语音信息插入到录音文件中形成录音合成文件。

所述获取录音标记信息包括：

在所述移动终端的屏幕处于黑屏状态时，识别手势信息，并按照预先设置的对应关系将识别出的手势信息转换为所述录音标记信息。

所述获取录音标记信息包括：

在所述移动终端的屏幕处于亮屏状态时，调用并显示所述移动终端的输入悬浮界面，并获取通过输入悬浮界面输入的信息作为所述录音标记信息。

所述将获得的标记信息转换为语音文件包括：

记录所述记录标记信息的获取时刻点，并在录音的第一音轨上标记该时刻；

建立记录的时刻点与获得的标记信息的对应关系；

将所述获得的标记信息转换为语音信息，并将得到的语音信息对应添加到对应关系中。

所述形成录音合成文件包括：

根据所述记录的时刻点顺序，将所述语音信息依次插入到对应标记有相应时刻点的第一音轨上；

完成录音时，将第一音轨与用于录制所述录音文件的第二音轨保存为所述录音合成文件。

该方法还包括：

在所述第一音轨对应的第一声道的所述时刻点播放所述语音文件，在所述第二声道播放所述录音文件。

本发明实施例又提供了一种实现录音的装置，至少包括获取模块、转换模块，以及合成处理模块；其中，

获取模块，设置为获取录音标记信息；

转换模块，设置为将获得的录音标记信息转换为语音信息；

合成处理模块，设置为将转换后得到的语音信息插入到录音文件中形成录音合成文件。

所述获取模块是设置为：在所述移动终端的屏幕处于黑屏状态时，识别手势信息，并按照预先设置的对应关系将识别出的手势信息转换为录音标记信息；或者，

所述获取模块是设置为：在所述移动终端的屏幕处于亮屏状态时，调用并显示所述移动终端的输入悬浮界面，并获取通过输入悬浮界面输入的信息作为所述录音标记信息。

所述转换模块是设置为：记录所述标记信息的获取时刻点，并在录音的第一音轨上标记该时刻；建立记录的时刻点与获得的录音标记信息的对应关系；将所述获得的标记信息转换为语音文件并将得到的语音文件对应添加到对应关系中。

所述合成处理模块是设置为：根据记录的时刻点顺序，将所述语音文件依次插入到对应标记有相应时刻点的第一音轨上；在完成录音时，将所述第一音轨与用于录制所述录音文件的所述第二音轨保存为录音合成文件。

所述合成处理模块还设置为：在所述第一音轨对应的第一声道的所述时刻点播放所述语音文件，在所述第二声道播放所述录音文件。

本发明实施例还提供了一种移动终端，至少包括显示屏及处理器，其中，

处理器，设置为在显示屏处于黑屏状态或亮屏状态时，获取录音标记信息；将获得的录音标记信息转换为语音信息；将转换后得到的语音信息插入到录音文件中形成录音合成文件。

本发明实施例又提供了一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行上述的方法。

与相关技术相比，本申请技术方案包括获取标记信息；将获得的标记信息转换为语音文件；将转换后的语音文件插入合并到录音文件中形成合成录音文件。本发明实施例将标记信息作为最终的录音文件的一部分，简单地、快捷地实现了在录音过程中随时对录音文件的标记；并且，在后续播放录音文件的同时，实现了标记信息的同步播放，而不要用户手动查阅。

进一步地，由于本发明实施例中的录音文件和标记信息是同时存储在同一个录音合成文件中的，因此，在将录音文件分享到其他设备，同时也将其标记信息共享给了其他设备。

附图概述

图1为本发明实施例实现录音的方法的流程图；

图2为本发明实施例实现录音的装置的组成结构示意图；

图3为本发明实施例实现录音的第一实施例的流程示意图；

图4为本发明实施例实现录音的第二实施例的流程示意图。

本发明的较佳实施方式

下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

图1为本发明实施例实现录音的方法的流程图，在录音过程中，如图1所示，包括以下步骤：

步骤100：移动终端获取录音标记信息并将其转换为语音信息。

在移动终端的屏幕处于黑屏状态时，本步骤中的获取录音标记信息包括：

识别手势信息，并按照预先设置的手势信息与录音标记信息的对应关系将识别出的手势信息转换为录音标记信息。其中，手势信息可以是预先设置的能够表示发言人身份信息或其他记录信息的动作信息等，比如可以用26个字母手势来代表发言人的姓和名的首字母，用以区分不同的发言人身份等。举例来看，假设预先存储有发言人姓名“张明”与输入的“Z”和“M”字母手势信息的对应关系；在张明发言时，用户通过在屏幕上分别输入“Z”和“M”字母的手势，移动终端便可将该手势信息转换为对应的发言人信息即张明。

需要说明的是，如何识别手势信息属于本领域技术人员的惯用技术手段，具体实现方式并不用于限定本发明的保护范围，这里不再赘述。

如果识别出的手势信息对应的录音标记信息不对，移动终端可以提示输入出错，或无法操作等，这里不做限定。

如果识别出的手势信息没有找到对应的标记信息，也可以点亮移动终端的屏幕。

在移动终端的屏幕处于亮屏状态时，本步骤中的获取录音标记信息包括：调用并显示移动终端输入悬浮界面，并获取通过输入悬浮界面输入的信息作为所述录音标记信息。举例来看，调出预先设置的输入悬浮界面，在输入区域内输入(如通过手写、拼音、笔画等方式)标记信息(不限于文字信息，也可以包括数字、字母及符号等)。比如“张明”发言时，用户可以在输入区域内输入“张明”，并点击预先设置的标记按钮确认输入完成即可。

需要说明的是，输入悬浮界面的设置属于本领域技术人员的惯用技术手段，其具体实现并不用于限定本发明的保护范围，这里不再赘述。

本步骤中的将获得的录音标记信息转换为语音信息包括：

记录获得的录音标记信息的获取时刻点，并在录音的第一音轨上标记该时刻；

建立记录的时刻点与获得的录音标记信息的对应关系；

将获得的录音标记信息转换为语音信息并将得到的语音信息对应添加到对应关系中。可选地，为将获得的录音标记信息转换为语音信息，可预先建立录音标记信息和语音信息的数据库，该数据库可更新；相关技术中已存在文字信息与语音信息的数据库，可本发明实施例可使用所述相关技术中的数据库；需要说明的是，本发明实施例中获得的语音信息可以是一个或一个以上语音文件，分别与不同的时刻点对应。

步骤101：将转换后的语音信息插入到录音文件中形成录音合成文件。本步骤包括：

根据记录的时刻点顺序，将语音信息依次插入合并到对应标记有相应时刻点的第一音轨上，这里，第一音轨只负责插入与录音标记信息匹配的语音信息，不录制发言人的声音；发言人的发言信息则正常录制在第二音轨上；在完成录音时，将第一音轨与第二音轨保存为录音合成文件即可。

可选地，将第一音轨和第二音轨做分离处理，使得第一音轨对应其中一个声道，第二音轨对应另一个声道。这样，在播放录音时，一个声道在标记的某一时刻点上会播放录音标记信息，而另一声道则仍然播放发言人的录音内容。

其中，关于不同音轨的应用及合成属于本领域技术人员的惯用技术手段，其具体实现并不用于限定本发明的保护范围，这里不再赘述。本发明实施例强调的是，将录音标记信息作为最终的录音文件的一部分，简单地、快捷地实现了在录音过程中随时对录音文件的标记。并且，在后续播放录音文件的同时，实现了标记信息的同步播放，而不要用户手动查阅。更进一步地，由于本发明实施例中的录音文件和标记信息是同时存储在同一个录音合成文件中的，因此，在将录音文件分享到其他设备，同时也将其标记信息共享给了其他设备。

图2为本发明实施例实现录音的装置的组成结构示意图，如图2所示，至少包括获取模块、转换模块，以及合成处理模块；其中，

获取模块，设置为获取录音标记信息；

转换模块，设置为将获得的录音标记信息转换为语音信息；

可选地，

获取模块是设置为：在移动终端的屏幕处于黑屏状态时，识别手势信息，并按照预先设置的对应关系将识别出的手势信息转换为录音标记信息；

或者，获取模块是设置为：在移动终端的屏幕处于亮屏状态时，调用并显示移动终端的输入悬浮界面，并获取通过输入悬浮界面输入的信息作为录音标记信息。

转换模块是设置为：记录标记信息的获取时刻点，并在录音的第一音轨上标记该时刻；建立记录的时刻点与获得的录音标记信息的对应关系；将获得的标记信息转换为语音文件并将得到的语音文件对应添加到对应关系中。

合成处理模块是设置为：根据记录的时刻点顺序，将语音文件依次插入到对应标记有相应时刻点的第一音轨上；在完成录音时，将第一音轨与用于录制发言人的发言信息的第二音轨保存为录音合成文件。

可选地，合成处理模块还设置为：在第一音轨对应的第一声道的时刻点播放语音文件，在第二声道播放录音文件。

本发明实施例装置可以设置在移动终端中。该移动终端至少包括显示屏及处理器，其中，

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，包括如下步骤：获取标记信息；将获得的标记信息转换为语音文件；将转换后的语音文件插入合并到录音文件中形成合成录音文件。所述的存储介质，如：ROM/RAM、磁碟、光盘等。

下面结合具体实施例对本发明方法进行详细描述。

图3为本发明第一实施例的实现录音的流程示意图，如图3所示，第一实施例中，假设手机处于黑屏状态，且后台已启动录音功能，所述流程包括：

步骤300～步骤301：手机黑屏且后台录音中，即用户启动手机录音机开始录音，并将录音应用处于后台运行，手机锁屏且屏幕背光熄灭后，手机的显示屏仍然可以通电工作。判断屏幕上是否输入字母手势，即是否识别到用户在显示屏上输入特定字母手势，如果识别到进入下一步，否者结束本流程。

步骤302：识别手势图像。触摸屏从字母手势图像的边缘信息中提取关键点对手势进行识别，显示屏上则会显示出相应的字母手势图像，此时屏幕背光不需要点亮。比如“张明”发言时，用户可以在屏幕上分别输入“Z”和“M”字母手势以表示。

步骤303：记录识别出的手势信号即记录标记信息，包括字母手势图像和输入时刻点信息。

可选地，手势信号输入时刻点信息记录的是手势输入完毕后的时刻点；

步骤304：记录手势输入的时刻点，并在音轨1上标记该时刻点。

步骤305：将匹配的语音文件插入到对应时刻点的音轨1上：记录输入的时刻点、手势图像，并生成对应关系列表。同时将记录的“Z”和“M”手势图像信息与本地语音库中对应的语音文件建立匹配关系，并将匹配关系信息新增到对应的关系列表中。调用建立好的关系列表，根据记录的时刻点，将已建立匹配关系的语音文件顺序依次插入合并到对应标记时刻的音轨1上。

步骤306：同时音轨2上仍然保持着正常的后台录音。

这里音轨1只负责录制插入的标记信息匹配的语音文件，不录制发言人的声音；音轨2则继续正常录音。

步骤307：录音完毕，将音轨1和音轨2保存生成一个新的录音文件。

步骤308：判断是否需要多声道设备播放录制的录音文件，如果是进入步骤309；如果不是，结束本流程。

步骤309：左声道播放音轨1手势语音，右声道正常播放录音。可选地，将音轨1和音轨2做分离处理，使得音轨1对应左声道，音轨2对应右声道。

这样，当用户插入耳机播放录音时，耳机的左声道在标记的某一时刻点上会播放对应手势信息“Z”和“M”的语音信息，右声道则播放发言人的录音内容。

图4为本发明第二实施例的实现录音的流程示意图，如图4所示，第二实施例中，假设手机处于亮屏状态，且后台已启动录音功能，包括：

步骤400：手机亮屏且后台录音中，即用户启动手机录音机开始录音，并将录音应用处于后台运行，手机处于待机界面且屏幕背光未熄灭。

步骤401：调用录音标记信息输入界面输入录音标记信息并确认，可选地，用户在手机待机界面调出标记输入悬浮界面，可以在输入区域内通过手写(也可以通过拼音、笔画等方式)输入标记信息(不限于文字信息，也可以包括数字、字母及符号等)。比如“张明”发言时，用户可以在输入区域内输入“张明”，并点击预先设置的标记按钮确认输入完成。

步骤402：记录获得的记录标记信息并将其转换为语音文件，可选地，记录获得的记录标记信息输入的时刻点，并在录音的音轨1上标记该时刻；并生成时刻点、标记文字之间的对应关系列表。同时将记录的“张明”标记文字信息转换为对应的语音文件，并将转换后的语音文件信息新增到建立好的关系列表中。

步骤403：将转换后的语音文件插入到对应时刻点的音轨1上，即调用建立好的关系列表，根据记录的时刻点，将转换后的语音文件顺序依次插入合并到对应标记时刻的音轨1上。

步骤404：同时音轨2上仍然保持着正常的后台录音。

步骤405：录音完毕，将音轨1和音轨2保存生成一个新的录音文件。

步骤406：判断是否需要多声道设备播放录制的录音文件，如果是进入步骤407；如果不是结束本流程。

步骤407：左声道播放音轨1手势语音，右声道正常播放录音。可选地，将音轨1和音轨2做分离处理，使得音轨1对应左声道，音轨2对应右声道。

这样，当用户插入耳机播放录音时，耳机的左声道在标记的某一时刻点上会播放“张明”标记文字对应的语音内容，右声道则播放发言人的录音内容。

以上所述，仅为本发明的较佳实例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

本领域普通技术人员可以理解上述实施例的全部或部分步骤可以使用计算机程序流程来实现，所述计算机程序可以存储于一计算机可读存储介质中，所述计算机程序在相应的硬件平台上(如系统、设备、装置、器件等)执行，在执行时，包括方法实施例的步骤之一或其组合。

可选地，上述实施例的全部或部分步骤也可以使用集成电路来实现，这些步骤可以被分别制作成一个个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。

上述实施例中的各装置/功能模块/功能单元可以采用通用的计算装置来实现，它们可以集中在单个的计算装置上，也可以分布在多个计算装置所组成的网络上。

上述实施例中的各装置/功能模块/功能单元以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。上述提到的计算机可读取存储介质可以是只读存储器，磁盘或光盘等。

工业实用性

上述技术方案简单、快捷地实现了在录音过程中随时对录音文件的标记；并且，在后续播放录音文件的同时，实现了标记信息的同步播放，不需要用户手动查阅。另外，上述技术方案能够实现在将录音文件分享到其他设备时，将其标记信息共享给了其他设备。

Claims

一种实现录音的方法，包括：

移动终端获取录音标记信息；

将获得的录音标记信息转换为语音信息；

将转换后得到的语音信息插入到录音文件中形成录音合成文件。
根据权利要求1所述的方法，其中，所述获取录音标记信息包括：

在所述移动终端的屏幕处于黑屏状态时，识别手势信息，并按照预先设置的手势信息与录音标记信息的对应关系将识别出的手势信息转换为所述录音标记信息。
根据权利要求1所述的方法，其中，所述获取录音标记信息包括：

在所述移动终端的屏幕处于亮屏状态时，调用并显示所述移动终端的输入悬浮界面，并获取通过输入悬浮界面输入的信息作为所述录音标记信息。
根据权利要求1、2或3所述的方法，其中，所述将获得的标记信息转换为语音文件包括：

记录所述记录标记信息的获取时刻点，并在录音的第一音轨上标记该时刻；

建立记录的时刻点与获得的标记信息的对应关系；

将所述获得的标记信息转换为语音信息，并将得到的语音信息对应添加到对应关系中。
根据权利要求4所述的方法，其中，所述形成录音合成文件包括：

根据所述记录的时刻点顺序，将所述语音信息依次插入到对应标记有相应时刻点的第一音轨上；

完成录音时，将第一音轨与用于录制所述录音文件的第二音轨保存为所述录音合成文件。
根据权利要求5所述的方法，该方法还包括：

在所述第一音轨对应的第一声道的所述时刻点播放所述语音文件，在所述第二声道播放所述录音文件。
一种实现录音的装置，包括获取模块、转换模块，以及合成处理模块；其中，

获取模块，设置为获取录音标记信息；

转换模块，设置为将获得的录音标记信息转换为语音信息；

合成处理模块，设置为将转换后得到的语音信息插入到录音文件中形成录音合成文件。
根据权利要求7所述的装置，其中，

所述获取模块是设置为：在所述移动终端的屏幕处于黑屏状态时，识别手势信息，并按照预先设置的手势信息与录音标记信息的对应关系将识别出的手势信息转换为录音标记信息；或者，

所述获取模块是设置为：在所述移动终端的屏幕处于亮屏状态时，调用并显示所述移动终端的输入悬浮界面，并获取通过输入悬浮界面输入的信息作为所述录音标记信息。
根据权利要求7或8所述的装置，其中，所述转换模块是设置为：记录所述标记信息的获取时刻点，并在录音的第一音轨上标记该时刻；建立记录的时刻点与获得的录音标记信息的对应关系；将所述获得的标记信息转换为语音文件并将得到的语音文件对应添加到对应关系中。
根据权利要求9所述的装置，其中，所述合成处理模块是设置为：根据记录的时刻点顺序，将所述语音文件依次插入到对应标记有相应时刻点的第一音轨上；在完成录音时，将所述第一音轨与用于录制所述录音文件的所述第二音轨保存为录音合成文件。
根据权利要求10所述的装置，所述合成处理模块还设置为：在所述第一音轨对应的第一声道的所述时刻点播放所述语音文件，在所述第二声道播放所述录音文件。
一种移动终端，包括显示屏及处理器，其中，

处理器，设置为在显示屏处于黑屏状态或亮屏状态时，获取录音标记信息；将获得的录音标记信息转换为语音信息；将转换后得到的语音信息插入到录音文件中形成录音合成文件。
一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1～6中任一项所述的方法。