CN108628815A

CN108628815A - 一种快速插入语音载体中文字的方法及装置

Info

Publication number: CN108628815A
Application number: CN201710165757.XA
Authority: CN
Inventors: 王峰; 区钺坚; 黄志军; 高延平; 杨松
Original assignee: Beijing Kingsoft Office Software Inc; Zhuhai Kingsoft Office Software Co Ltd; Guangzhou Jinshan Mobile Technology Co Ltd
Current assignee: Beijing Kingsoft Office Software Inc; Zhuhai Kingsoft Office Software Co Ltd; Guangzhou Kingsoft Mobile Technology Co Ltd; Guangzhou Jinshan Mobile Technology Co Ltd
Priority date: 2017-03-20
Filing date: 2017-03-20
Publication date: 2018-10-09
Also published as: SG11201908754YA; WO2018171561A1; US20200097528A1; JP2020514936A; EP3605356A1; EP3605356A4

Abstract

本发明实施例提供了一种快速插入语音载体中文字的方法及装置，所述方法包括：开启待编辑文档；获取用户的语音获取指令；根据所述语音获取指令，获得需求语音；在第一文档编辑软件中，识别出所述需求语音对应的文字；将所述文字移动至所述待编辑文档中。应用本发明实施例方法，能够提高工作效率。

Description

一种快速插入语音载体中文字的方法及装置

技术领域

本发明涉及电子文档编辑领域，特别是涉及一种快速插入语音载体中文字的方法及装置。

背景技术

用户在利用计算机、手机等终端设备中的文档编辑软件进行文档编辑时，有时候需要在文档中插入语音载体中的语音对应的文字，比如会议录音对应的文字、电影片段中语音对应的文字等等。现有方法需要先启动一个已有的语音识别程序识别出语音载体中语音对应的文字，然后将识别出的文字拷贝至待编辑文档中。

由此可见，现有技术需要人工启动多个软件、程序才能将语音载体中语音对应的文字插入待编辑文档中，而且需要人工将语音识别后的文字拷贝至待编辑文档中，工作效率较低。

发明内容

本发明实施例的目的在于提供一种快速插入语音载体中文字的方法及装置，能够提高工作效率。具体技术方案如下：

本发明实施例公开了一种快速插入语音载体中文字的方法，包括：

开启待编辑文档；

获取用户的语音获取指令；

根据所述语音获取指令，获得需求语音；

在第一文档编辑软件中，识别出所述需求语音对应的文字；

将所述文字移动至所述待编辑文档中。

可选的，包括：

选择已有语音的指令。

可选的，所述根据所述语音获取指令，获得需求语音，包括：

当所述语音获取指令为选择已有语音的指令时，获取已有的一语音载体文件作为需求语音。

可选的，所述语音获取指令，包括：

截取已有语音的指令。

当所述语音获取指令为截取已有语音的指令时，获取已有的一语音载体文件；

在所述语音载体文件中，获取一语音起始点和一语音终止点；

截取所述语音载体文件中，所述语音起始点和所述语音终止点之间的语音片段作为需求语音。

可选的，所述在所述语音载体文件中，获取一语音起始点和一语音终止点，包括：

在所述语音载体文件中，获取利用鼠标光标的位置确定的一语音起始点和一语音终止点，或

在所述语音载体文件中，获取利用触摸屏光标的位置确定的一语音起始点和一语音终止点。

可选的，所述语音获取指令，包括：

利用音频输入设备录制语音的指令。

当所述语音获取指令为利用音频输入设备录制语音的指令时，利用所述音频输入设备录制语音，将录制的语音作为需求语音。

可选的，所述将所述文字移动至所述待编辑文档中，包括：

将所述文字移动至所述待编辑文档中的待插入位置，其中，所述待插入位置为鼠标光标的位置，或，触摸屏光标的位置。

可选的，所述将所述文字移动至所述待编辑文档中之后，所述方法还包括：

将所述文字的格式修改为待编辑文档中文本的格式，所述格式包括字体、字号、颜色和行间距中的一种或多种。

本发明实施例还公开了一种快速插入语音载体中文字的装置，包括：

开启模块，用于开启待编辑文档；

指令获取模块，用于获取用户的语音获取指令；

语音获取模块，用于根据所述语音获取指令，获得需求语音；

识别模块，用于在第一文档编辑软件中，识别出所述需求语音对应的文字；

文字移动模块，用于将所述文字移动至所述待编辑文档中。

可选的，所述语音获取指令，包括：

选择已有语音的指令。

可选的，所述语音获取模块，具体用于：

可选的，所述语音获取指令，包括：

截取已有语音的指令。

可选的，所述语音获取模块，包括：

文件获取子模块，用于当所述语音获取指令为截取已有语音的指令时，获取已有的一语音载体文件；

区间获取子模块，用于在所述语音载体文件中，获取一语音起始点和一语音终止点；

截取子模块，用于截取所述语音载体文件中，所述语音起始点和所述语音终止点之间的语音片段作为需求语音。

可选的，所述在区间获取子模块，具体用于：

可选的，所述语音获取指令，包括：

利用音频输入设备录制语音的指令。

可选的，所述语音获取模块，具体用于：

可选的，所述文字移动模块，具体用于：

可选的，所述装置还包括：

格式修改模块，用于将所述文字移动至所述待编辑文档中之后，将所述文字的格式修改为待编辑文档中文本的格式，所述格式包括字体、字号、颜色和行间距中的一种或多种。

本发明实施例提供的快速插入语音载体中文字的方法及装置，首先开启待编辑文档。其次获取用户的语音获取指令。再次根据所述语音获取指令，获得需求语音。然后在第一文档编辑软件中，识别出所述需求语音对应的文字。最后将所述文字移动至所述待编辑文档中。本发明实施例仅利用第一文档编辑软件，自动实现识别并插入需求语音对应的文字，不同于现有技术需要开启多个软件、程序，并且人工拷贝识别后的需求语音对应的文字的方法，因此本发明实施例能够提高工作效率。

当然，实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的快速插入语音载体中文字的方法的一种流程图；

图2为本发明实施例的一语音载体文件预览界面示意图；

图3为基于图1所示方法的一实例的流程图；

图4为基于图1所示方法的又一实例的流程图；

图5为基于图1所示方法的再一实例的流程图；

图6为本发明实施例的快速插入语音载体中文字的装置的一种结构图；

图7为基于图6所示装置的一实例的结构图；

图8为基于图6所示装置的又一实例的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种快速插入语音载体中文字的方法及装置，能够提高工作效率。

参见图1，图1为本发明实施例的快速插入语音载体中文字的方法的一种流程图，包括如下步骤：

步骤101，开启待编辑文档。

本发明实施例由终端设备的处理器执行，终端设备包括计算机、手机、平板电脑、能够进行电子文档编辑的设备等。

第一文档编辑软件是安装在终端设备中的，用于编辑电子文档的软件，如金山办公软件WPS Office等。

本发明实施例中的第一文档编辑软件在一般的文档编辑功能基础上，集成有语音截取程序，能够对选择区间的语音进行截取，第一文档编辑软件还集成有语音识别程序，能够识别出语音对应的文字。

本发明实施例，利用第一文档编辑软件开启待编辑文档，后续步骤均是在第一文档编辑软件中完成的。

步骤102，获取用户的语音获取指令。

本发明实施例中，语音获取指令为用户选择的，获取语音方式的选择指令，本发明实施例可以预先在第一文档编辑软件中建立用户选择窗口，在其中提供多种获取语音方式的选择项供用户选择，然后获取用户对获取语音方式的选择项的点击操作。多种获取语音方式如选择已有语音、截取已有语音、利用音频输入设备录制语音等。

需要说明的是，本发明实施例中的步骤101和步骤102可以不分先后顺序。也就是说，本发明实施例可以利用第一文档编辑软件开启待编辑文档后，获取用户的语音获取指令，该种情况通常用于先对待编辑文档编辑，后获取需求语音的场景；也可以利用第一文档编辑软件获取用户的语音获取指令后，开启待编辑文档，该种情况通常用于已知需求语音所在的载体，需要先获取需求语音对应的文字的场景，在该种场景下，还可以开启多个待编辑文档，以将需求语音对应的文字插入多个待编辑文档，本发明实施例中步骤101和步骤102的先后顺序根据用户的使用习惯或者具体使用场景而定。

步骤103，根据语音获取指令，获得需求语音。

在实际应用中，需求语音可能存在于已有的一个电子载体中，如终端设备中已有的音乐、视频、录音等，面对已有的含有需求语音的电子载体，语音获取指令可以为选择已有语音的指令，直接获取已有的一语音载体文件作为需求语音，如选择会议记录的录音文件作为需求语音等。语音获取指令还可以为截取已有语音的指令，截取已有的一语音载体文件的部分片段作为需求语音，如截取电影中一段语音作为需求语音等。

在实际应用中，需求语音还可能存在于非已有的一个电子载体中，如室外广播中播放的语音、电视机中播放的电视节目的语音等等，这种情况下，用户无法获得或不便于获得该需求语音的电子载体，因此本发明实施例根据这种情况，语音获取指令可以为利用音频输入设备录制语音的指令，可以通过多种音频输入设备，如麦克风等，录制需求语音，如利用麦克风录制电视机中播放的电视节目的语音等。

由此可见，本发明实施例的需求语音的来源更广泛，普适性更强。

步骤104，在第一文档编辑软件中，识别出需求语音对应的文字。

本发明实施例中，利用集成在第一文档编辑软件中的语音识别程序，识别出需求语音对应的文字，其中，语音识别程序可以为现有的各种用于识别语音为文字的程序，本发明实施例可以在第一文档编辑软件中预先设置程序接口，以便于多种语音识别程序的替换使用。

步骤105，将文字移动至待编辑文档中。

本发明实施例将识别出的文字移动至待编辑文档中，可以移动至待编辑文档中预设的固定位置、随机位置，或者移动至待编辑文档中用户设置的待插入位置等。

文字移动方式可以为语音识别的同时进行文字移动，也就是说，一旦识别出一个文字就立即将该文字移动至待编辑文档中，这种同步移动方式有利于用户尽快利用、或编辑识别出的部分文字；或者本发明实施例可以在需求语音对应的文字全部识别出后，再进行文字的整体移动，这种整体移动方式有利于维持需求语音对应的文字的整体性，更适合对需求语音对应的文字整体内容的利用、或编辑的情况。

文字移动到待编辑文档的具体移动形式可以为滑动、滚动、跳动等多种方式，本发明实施例不对文字的具体移动形式进行限定。本发明实施例的文字移动到待编辑文档的多种具体移动形式，均实现将识别出的需求语音对应的文字，自动插入至待编辑文档中，并不需要人工对文字进行复制、粘贴、拖曳等移动操作。

因此，本发明实施例能够避免用户手动拷贝识别出的文字至待编辑文档中，能够实现自动插入，能够提高工作效率。

可见，本发明实施例提供的快速插入语音载体中文字的方法，首先开启待编辑文档。其次获取用户的语音获取指令。再次根据语音获取指令，获得需求语音。然后在第一文档编辑软件中，识别出需求语音对应的文字。最后将文字移动至待编辑文档中。本发明实施例在第一文档编辑软件中编辑文档时，能够获取需求语音，并识别出需求语音对应的文字，移动至待编辑文档中，实现将需求语音对应的文字识别并自动插入待编辑文档中。本发明实施例仅利用第一文档编辑软件自动实现插入识别文字，不同于现有技术需要开启多个软件、程序，并且进行人工拷贝识别出的文字的方法，因此本发明实施例能够提高工作效率。

以下举例说明本发明实施例的实现过程，参见图2，图2为本发明实施例的一语音载体文件预览界面示意图，具体来说，用户使用文档编辑软件进行文档编辑时，同时听取一份语音载体文件，如图2中所示的语音载体文件预览界面示意图，发现其中部分语音是需求语音，参见图2中AB区间内的语音，用户期望将该需求语音对应的文字插入待编辑文档中，如果采用现有技术，需要先用一个语音识别软件或者程序将该语音载体文件对应的文字全部识别出来，最后由用户在识别出的文字中寻找AB区间内的语音对应的文字，并手动将该对应的文字复制粘贴至待编辑文档中。该过程需要开启文档编辑软件、语音识别软件或者程序，并且将语音载体文件对应文字全部识别后，用户手动选择并拷贝需求文字，工作效率较低。

而采用本发明实施例方法，在使用第一文档编辑软件进行文档编辑时，可以获取用户的语音获取指令，比如，获取用户对第一文档编辑软件菜单栏的，多种获取语音方式的选择项的点击操作，并根据对应的获取语音方式，如截取已有语音的方式，在该语音载体文件中，利用第一文档编辑软件中集成的语音截取程序，获得AB区间内的语音作为需求语音，具体来说，本发明实施例可以在用户听取预览该语音载体文件时，先获取用户的鼠标单击A点的操作，再获取用户鼠标单击B点的操作，确认待截取的语音区间为AB之间的区间之后，利用第一文档编辑软件中集成的语音截取程序，截取AB区间内的语音作为需求语音，然后利用第一文档编辑软件中集成的语音识别程序，识别出需求语音对应的文字，也就是识别出AB区间内的语音对应的文字。最后将识别出的AB区间内的语音对应的文字，移动至待编辑文档中。本发明实施例仅利用第一文档编辑软件完成整个过程，并且能够针对语音载体文件中部分语音，实现自动识别对应的文字并插入待编辑文档，能够提高工作效率。

参见图3，图3为基于图1所示方法的一实例的流程图，包括如下步骤：

步骤301，开启待编辑文档。

本发明实施例利用第一文档编辑软件开启待编辑文档。具体可以为，终端设备接收到用户的开启文档的指令，如用户对第一文档编辑软件图标的点击操作、用户对待编辑文档图标的点击操作、用户的语音操作指令等。终端设备的处理器根据开启文档的指令开启待编辑文档。

比如，根据开启文档的指令为用户对第一文档编辑软件图标的点击操作，终端设备的处理器先开启第一文档编辑软件，再接收用户选择文档的指令，如获取到用户对一文档的选择操作后，开启该文档为待编辑文档，等等。

比如，根据开启文档的指令为用户对待编辑文档图标的点击操作，终端设备的处理器利用第一文档编辑软件开启该待编辑文档，等等。

比如，根据开启文档的指令为用户的语音操作指令，如用户的语音操作指令为开启名称为“文件1”的文档，终端设备的处理器查找到名称为“文件1”的文档，并利用第一文档编辑软件开启该名称为“文件1”的文档为待编辑文档，等等。

本发明实施例的开启待编辑文档的方式可以为多种，并可以相互结合，在此不一一举例。

步骤302，获取用户的选择已有语音的指令。

本发明实施例中，可以在第一文档编辑软件中预先设置的用户选择窗口中，添加用户的语音获取指令为选择已有语音的指令这一选项，用户选择窗口可以是第一编辑软件的工具菜单栏中的选项窗口，或者是第一编辑软件的工具菜单栏之外的一个用户对话窗口，本发明实施例获取用户的选择已有语音的指令的方式可以为，获取用户对选择已有语音的指令这一选项的点击操作等。

需要说明的是，本发明实施例中的步骤301和步骤302可以不分先后顺序。也就是说，本发明实施例可以利用第一文档编辑软件开启待编辑文档后，获取用户的选择已有语音的指令，也可以利用第一文档编辑软件获取用户的选择已有语音的指令后，开启待编辑文档，两者的先后顺序根据用户的使用习惯或者具体使用场景而定。

步骤303，获取已有的一语音载体文件作为需求语音。

本发明实施例可以在用户的终端设备中选择已有的一语音载体文件作为需求语音，可以选择多种音频格式的语音载体文件作为需求语音，如MP3(Moving PictureExperts Group Audio LayerⅢ，动态影像专家压缩标准音频层面3)、WMA(Windows MediaAudio，微软公司推出的一种新的音频格式)、微软公司开发的一种声音文件格式WAV、FLAC(Free Lossless Audio Codec，无损音频压缩编码)、OGG(OGG Vobis，一种新型音频压缩格式)、AAC(Advanced Audio Coding,，高级音频编码技术)等格式，或者可以选择多种视频格式的语音载体文件作为需求语音，如AVI(Audio Video Interleaved，音频视频交错格式)、MPEG(Moving Picture Expert Group，运动图像专家组格式)、WMV、RMVB(Real MediaVariable Bitrate，动态变速采样率的RM)等格式，多种语音载体文件如用户计算机中的电影、用户手机中的录音等；也可以利用互联网、局域网、蓝牙等获取其他终端设备中已有的一语音载体文件作为需求语音。

步骤304，在第一文档编辑软件中，识别出需求语音对应的文字。

本发明实施例中，利用第一文档编辑软件中的语音识别程序识别出需求语音对应的文字。

步骤305，将文字移动至待编辑文档中的待插入位置。

本发明实施例中，根据终端设备为使用鼠标的终端设备，如通常的台式计算机等，获取待插入位置为鼠标光标所在的位置；或者使用触摸屏的终端设备，如常用的触摸屏手机等，获取待插入位置为触摸屏光标所在的位置。

本发明实施例还可以提供确认环节，如设置用户对话窗口提示用户确认待插入位置等，以避免用户的误操作等。然后将需求语音对应的文字移动至待编辑文档中的待插入位置。

文字移动方式及文字移动至待编辑文档的具体移动形式可以如步骤105，在此不一一赘述。

本发明实施例也可以在步骤301之后，获取待插入位置，也就是说步骤301开启待编辑文档之后，本发明实施例可以检测鼠标光标所在的位置或触摸屏光标所在的位置作为待插入位置，当然本发明实施例在检测之后还可以提供确认环节，如设置用户对话窗口提示用户确认待插入位置等，以避免用户的误操作等。然后在步骤305时，直接将需求语音对应的文字移动至待编辑文档中的待插入位置。

将文字移动至待编辑文档中的待插入位置之后，本发明实施例方法还包括，步骤306，将文字的格式修改为待编辑文档中文本的格式。

本发明实施例将需求语音对应的文字移动至待编辑文档中后，可以先获取待编辑文档中原有文本的格式，格式包括字体、字号、颜色和行间距中的一种或多种，然后将需求语音对应的文字的格式修改为，与待编辑文档中原有文本的格式一致。以使得用户的待编辑文档的文本格式统一。

可见，本发明实施例提供的快速插入语音载体中文字的方法，首先在第一文档编辑软件中，开启待编辑文档。其次获取用户的选择已有语音的指令。再次获取已有的一语音载体文件作为需求语音。然后在第一文档编辑软件中，识别出需求语音对应的文字。最后将文字移动至待编辑文档中的待插入位置，并将文字的格式修改为待编辑文档中文本的格式。本发明实施例，在第一文档编辑软件中编辑文档时，能够选择已有的语音载体文件，并识别出语音对应的文字，自动插入待编辑文档中的待插入位置。本发明实施例仅利用第一文档编辑软件，自动实现插入需求语音对应的文字至待编辑文档中的待插入位置，不同于现有技术需要开启多个软件、程序，并且对识别文字人工选择、拷贝至待编辑文档中待插入位置的方法，因此本发明实施例能够提高工作效率。

参见图4，图4为基于图1所示方法的又一实例的流程图，包括如下步骤：

步骤401，开启待编辑文档。

步骤402，获取用户的截取已有语音的指令。

本发明实施例中，可以在第一文档编辑软件中预先设置的用户选择窗口中，添加用户的语音获取指令为截取已有语音的指令这一选项，用户选择窗口可以是第一编辑软件的工具菜单栏中的选项窗口，或者是第一编辑软件的工具菜单栏之外的一个用户对话窗口，本发明实施例获取用户的截取已有语音的指令的方式可以为，获取用户对截取已有语音的指令这一选项的点击操作等。

需要说明的是，本发明实施例中的步骤401和步骤402可以不分先后顺序。也就是说，本发明实施例可以利用第一文档编辑软件开启待编辑文档后，获取用户的截取已有语音的指令，也可以利用第一文档编辑软件获取用户的截取已有语音的指令后，开启待编辑文档，两者的先后顺序根据用户的使用习惯或者具体使用场景而定。

步骤403，获取已有的一语音载体文件。

本发明实施例可以在用户的终端设备中选择已有的一语音载体文件作为需求语音，如选择已有的音频格式、视频格式的一语音载体文件作为需求语音，如MP3、RMVB等格式的语音载体文件，如用户计算机中的电影、用户手机中的录音等；也可以利用互联网、局域网、蓝牙等获取其他终端设备中选择已有的一语音载体文件作为需求语音。

步骤404，在语音载体文件中，获取一语音起始点和一语音终止点。

本发明实施例可以提供语音载体文件的预览界面，如图2所示，在语音载体文件的预览界面中，用户可以预览，也就是试听该语音载体文件，本发明实施例获取用户在预览界面中选择的语音起始点A和语音终止点B。根据终端设备的不同类型，本发明实施例采用对应的获取语音起始点和语音终止点的方法，如使用鼠标的终端设备，在语音载体文件中，获取利用鼠标光标的位置确定的一语音起始点和一语音终止点，举例来说，常用的终端设备中，台式计算机通常使用鼠标，那么对应该使用鼠标的台式计算机，先获取用户利用鼠标光标的位置确定的语音起始点A，也就是获取用户的鼠标对A点的点击操作，再获取用户利用鼠标光标的位置确定的语音终止点B，也就是获取用户的鼠标对B点的点击操作，将该语音起始点A和语音终止点B之间的区间内的语音作为需求语音。

或，使用触摸屏的终端设备，在语音载体文件中，获取利用触摸屏光标的位置确定的一语音起始点和一语音终止点，举例来说，常用的终端设备中，智能手机通常使用触摸屏，那么对应该使用触摸屏的手机，先获取用户利用触摸屏光标的位置确定的语音起始点A，也就是获取用户的手指或其他工具在触摸屏上对A点的点击操作，再获取用户利用触摸屏光标的位置确定的语音起始点B，也就是获取用户的手指或其他工具在触摸屏上对B点的点击操作，将该语音起始点A和语音终止点B之间的区间内的语音作为需求语音。

当然，本发明实施例在获取一语音起始点和一语音终止点之后，还可以提供确认环节，如设置用户对话窗口提示用户确认语音起始点和语音终止点等等，以避免用户的误操作等。

步骤405，截取语音载体文件中，语音起始点和语音终止点之间的语音片段作为需求语音。

本发明实施例利用第一文档编辑软件中集成的语音截取程序，截取语音起始点和语音终止点之间的区间内的语音作为需求语音，如截取图2中AB区间内的语音作为需求语音。

步骤406，在第一文档编辑软件中，识别出需求语音对应的文字。

步骤407，将文字移动至待编辑文档中的待插入位置。

本发明实施例中，根据终端设备为使用鼠标的终端设备，或者使用触摸屏的终端设备，获取待插入位置为待编辑文档中鼠标光标所在的位置，或，待编辑文档中触摸屏光标所在的位置。

本发明实施例也可以在步骤401之后，获取待插入位置，也就是说步骤401开启待编辑文档之后，本发明实施例可以检测待编辑文档中鼠标光标所在的位置或触摸屏光标所在的位置作为待插入位置，当然本发明实施例在检测之后还可以提供确认环节，如设置用户对话窗口提示用户确认待插入位置等，以避免用户的误操作等。然后在步骤407时，直接将需求语音对应的文字移动至待编辑文档中的待插入位置。

将文字移动至待编辑文档中的待插入位置之后，本发明实施例方法还包括，步骤408，将文字的格式修改为待编辑文档中文本的格式。

可见，本发明实施例提供的快速插入语音载体中文字的方法，首先在第一文档编辑软件中，开启待编辑文档。其次获取用户的截取已有语音的指令。再次获取已有的一语音载体文件，在语音载体文件中，获取一语音起始点和一语音终止点，并截取语音载体文件中，语音起始点和语音终止点之间的语音片段作为需求语音。然后在第一文档编辑软件中，识别出需求语音对应的文字。最后将文字移动至待编辑文档中的待插入位置，并将文字的格式修改为待编辑文档中文本的格式。本发明实施例在第一文档编辑软件中编辑文档时，能够选择已有的语音载体文件并截取需要的部分语音作为需求语音，识别出需求语音对应的文字，自动插入待编辑文档中的待插入位置。本发明实施例仅利用第一文档编辑软件，自动实现插入需求语音对应的文字至待编辑文档中的待插入位置，不同于现有技术需要开启多个软件、程序，并且对识别文字人工选择、拷贝至待编辑文档中待插入位置的方法，因此本发明实施例能够提高工作效率。

参见图5，图5为基于图1所示方法的再一实例的流程图，包括如下步骤：

步骤501，开启待编辑文档。

步骤502，获取用户的利用音频输入设备录制语音的指令。

本发明实施例中，可以在第一文档编辑软件中预先设置的用户选择窗口中，添加用户的语音获取指令为利用音频输入设备录制语音的指令这一选项，用户选择窗口可以是第一编辑软件的工具菜单栏中的选项窗口，或者是第一编辑软件的工具菜单栏之外的一个用户对话窗口，本发明实施例获取用户的利用音频输入设备录制语音的指令的方式可以为，获取用户对利用音频输入设备录制语音的指令这一选项的点击操作等。

需要说明的是，本发明实施例中的步骤501和步骤502可以不分先后顺序。也就是说，本发明实施例可以利用第一文档编辑软件开启待编辑文档后，获取用户的利用音频输入设备录制语音的指令，也可以利用第一文档编辑软件获取用户的利用音频输入设备录制语音的指令后，开启待编辑文档，两者的先后顺序根据用户的使用习惯或者具体使用场景而定。

步骤503，利用音频输入设备录制语音，将录制的语音作为需求语音。

本发明实施例可以利用用户终端设备中的音频输入设备，录制语音作为需求语音，如录制广播中的语音、电视节目中的语音、人的语音等，当然本发明实施例也可以利用互联网、局域网、蓝牙等，连接其他音频输入设备，录制语音作为需求语音。本发明实施例可以根据需求设置录制语音的时长、格式等，可以提供语音预览，试听录制的语音，并采用多种语音处理技术对录制的语音进行处理，如过滤环境噪声、提高语音清晰度等。

步骤504，在第一文档编辑软件中，识别出需求语音对应的文字。

步骤505，将文字移动至待编辑文档中的待插入位置。

本发明实施例也可以在步骤501之后，获取待插入位置，也就是说步骤501开启待编辑文档之后，本发明实施例可以检测待编辑文档中鼠标光标所在的位置或触摸屏光标所在的位置作为待插入位置，当然本发明实施例在检测之后还可以提供确认环节，如设置用户对话窗口提示用户确认待插入位置等，以避免用户的误操作等。然后在步骤505时，直接将需求语音对应的文字移动至待编辑文档中的待插入位置。

将文字移动至待编辑文档中的待插入位置之后，本发明实施例方法还包括，步骤506，将文字的格式修改为待编辑文档中文本的格式。

可见，本发明实施例提供的快速插入语音载体中文字的方法，首先在第一文档编辑软件中，开启待编辑文档。其次获取用户的利用音频输入设备录制语音的指令。再次利用音频输入设备录制语音，将录制的语音作为需求语音。然后在第一文档编辑软件中，识别出需求语音对应的文字。最后将文字移动至待编辑文档中的待插入位置，并将文字的格式修改为待编辑文档中文本的格式。本发明实施例在第一文档编辑软件中编辑文档时，能够利用音频输入设备录制语音，将录制的语音作为需求语音，并识别出需求语音对应的文字，自动插入待编辑文档中的待插入位置。本发明实施例仅利用第一文档编辑软件，自动实现插入需求语音对应的文字至待编辑文档中的待插入位置，不同于现有技术需要开启多个软件、程序，并且对识别文字人工选择、拷贝至待编辑文档中待插入位置的方法，因此本发明实施例能够提高工作效率。

参见图6，图6为本发明实施例的快速插入语音载体中文字的装置的一种结构图，包括：

开启模块601，用于开启待编辑文档。

指令获取模块602，用于获取用户的语音获取指令。

语音获取模块603，用于根据语音获取指令，获得需求语音。

识别模块604，用于在第一文档编辑软件中，识别出需求语音对应的文字。

文字移动模块605，用于将文字移动至待编辑文档中。

可见，本发明实施例提供的快速插入语音载体中文字的装置，首先开启待编辑文档。其次获取用户的语音获取指令；再次根据语音获取指令，获得需求语音。然后在第一文档编辑软件中，识别出需求语音对应的文字。最后将文字移动至待编辑文档中。本发明实施例在第一文档编辑软件中编辑文档时，能够获取需求语音，并识别出需求语音对应的文字，移动至待编辑文档中，实现将需求语音对应的文字识别并自动插入待编辑文档中。本发明实施例仅利用第一文档编辑软件自动实现插入识别文字，不同于现有技术需要开启多个软件、程序，并且进行人工拷贝识别出的文字的方法，因此本发明实施例能够提高工作效率。

需要说明的是，本发明实施例的装置是应用上述快速插入语音载体中文字的方法的装置，则上述应用于快速插入语音载体中文字的方法的所有实施例均适用于该装置，且均能达到相同或相似的有益效果。

在图6的基础上，作为优选的实施例，与图3所示的方法对应，参见图7，图7为基于图6所示装置的一实例的结构图，包括：

本发明实施例中，语音获取指令，包括：

选择已有语音的指令。

本发明实施例中，语音获取模块703，具体用于：

当语音获取指令为选择已有语音的指令时，获取已有的一语音载体文件作为需求语音。

本发明实施例中，文字移动模块705，具体用于：

将文字移动至待编辑文档中的待插入位置，其中，待插入位置为待编辑文档中鼠标光标的位置，或，待编辑文档中触摸屏光标的位置。

本发明实施例装置还包括：

格式修改模块706，用于将文字移动至待编辑文档中之后，将文字的格式修改为待编辑文档中文本的格式，格式包括字体、字号、颜色和行间距中的一种或多种。

可见，本发明实施例提供的快速插入语音载体中文字的装置，首先在第一文档编辑软件中，开启待编辑文档。其次获取用户的选择已有语音的指令。再次获取已有的一语音载体文件作为需求语音。然后在第一文档编辑软件中，识别出需求语音对应的文字。最后将文字移动至待编辑文档中的待插入位置，并将文字的格式修改为待编辑文档中文本的格式。本发明实施例在第一文档编辑软件中编辑文档时，能够选择已有的语音载体文件，并识别出语音对应的文字，自动插入待编辑文档中的待插入位置。本发明实施例仅利用第一文档编辑软件，自动实现插入需求语音对应的文字至待编辑文档中的待插入位置，不同于现有技术需要开启多个软件、程序，并且对识别文字人工选择、拷贝至待编辑文档中待插入位置的方法，因此本发明实施例能够提高工作效率。

在图6的基础上，作为优选的实施例，与图4所示的方法对应，参见图8，图8为基于图6所示装置的又一实例的结构图，包括：

本发明实施例中，语音获取指令，包括：

截取已有语音的指令。

本发明实施例中，语音获取模块803，包括：

文件获取子模块8031，用于当语音获取指令为截取已有语音的指令时，获取已有的一语音载体文件；

区间获取子模块8032，用于在语音载体文件中，获取一语音起始点和一语音终止点；

截取子模块8033，用于截取语音载体文件中，语音起始点和语音终止点之间的语音片段作为需求语音。

本发明实施例中，在区间获取子模块8032，具体用于：

在语音载体文件中，获取利用鼠标光标的位置确定的一语音起始点和一语音终止点，或

在语音载体文件中，获取利用触摸屏光标的位置确定的一语音起始点和一语音终止点。

本发明实施例中，文字移动模块805，具体用于：

本发明实施例装置还包括：

格式修改模块806，用于将文字移动至待编辑文档中之后，将文字的格式修改为待编辑文档中文本的格式，格式包括字体、字号、颜色和行间距中的一种或多种。

可见，本发明实施例提供的快速插入语音载体中文字的装置，首先在第一文档编辑软件中，开启待编辑文档。其次获取用户的截取已有语音的指令。再次获取已有的一语音载体文件，在语音载体文件中，获取一语音起始点和一语音终止点，并截取语音载体文件中，语音起始点和语音终止点之间的语音片段作为需求语音。然后在第一文档编辑软件中，识别出需求语音对应的文字。最后将文字移动至待编辑文档中的待插入位置，并将文字的格式修改为待编辑文档中文本的格式。本发明实施例在第一文档编辑软件中编辑文档时，能够选择已有的语音载体文件并截取需要的部分语音作为需求语音，识别出需求语音对应的文字，自动插入待编辑文档中的待插入位置。本发明实施例仅利用第一文档编辑软件，自动实现插入需求语音对应的文字至待编辑文档中的待插入位置，不同于现有技术需要开启多个软件、程序，并且对识别文字人工选择、拷贝至待编辑文档中待插入位置的方法，因此本发明实施例能够提高工作效率。

在图6的基础上，作为优选的实施例，与图5所示的方法对应，本发明实施例装置包括：

本发明实施例中，语音获取指令，包括：

利用音频输入设备录制语音的指令。

本发明实施例中，语音获取模块，具体用于：

当语音获取指令为利用音频输入设备录制语音的指令时，利用音频输入设备录制语音，将录制的语音作为需求语音。

本发明实施例中，文字移动模块，具体用于：

将文字移动至待编辑文档中的待插入位置，其中，待插入位置为鼠标光标的位置，或，触摸屏光标的位置。

本发明实施例装置还包括：

格式修改模块，用于将文字移动至待编辑文档中之后，将文字的格式修改为待编辑文档中文本的格式，格式包括字体、字号、颜色和行间距中的一种或多种。

可见，本发明实施例提供的快速插入语音载体中文字的装置，首先在第一文档编辑软件中，开启待编辑文档。其次获取用户的利用音频输入设备录制语音的指令。再次利用音频输入设备录制语音，将录制的语音作为需求语音。然后在第一文档编辑软件中，识别出需求语音对应的文字。最后将文字移动至待编辑文档中的待插入位置，并将文字的格式修改为待编辑文档中文本的格式。本发明实施例针对在第一文档编辑软件中编辑文档时，能够利用音频输入设备录制语音，将录制的语音作为需求语音，并识别出需求语音对应的文字，自动插入待编辑文档中的待插入位置。本发明实施例仅利用第一文档编辑软件，自动实现插入需求语音对应的文字至待编辑文档中的待插入位置，不同于现有技术需要开启多个软件、程序，并且对识别文字人工选择、拷贝至待编辑文档中待插入位置的方法，因此本发明实施例能够提高工作效率。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种快速插入语音载体中文字的方法，其特征在于，包括：

开启待编辑文档；

获取用户的语音获取指令；

根据所述语音获取指令，获得需求语音；

在第一文档编辑软件中，识别出所述需求语音对应的文字；

将所述文字移动至所述待编辑文档中。

2.根据权利要求1所述的方法，其特征在于，所述语音获取指令，包括：

选择已有语音的指令。

3.根据权利要求2所述的方法，其特征在于，所述根据所述语音获取指令，获得需求语音，包括：

4.根据权利要求1所述的方法，其特征在于，所述语音获取指令，包括：

截取已有语音的指令。

5.根据权利要求4所述的方法，其特征在于，所述根据所述语音获取指令，获得需求语音，包括：

6.根据权利要求5所述的方法，其特征在于，所述在所述语音载体文件中，获取一语音起始点和一语音终止点，包括：

7.根据权利要求1所述的方法，其特征在于，所述语音获取指令，包括：

利用音频输入设备录制语音的指令。

8.根据权利要求7所述的方法，其特征在于，所述根据所述语音获取指令，获得需求语音，包括：

9.根据权利要求1所述的方法，其特征在于，所述将所述文字移动至所述待编辑文档中，包括：

10.根据权利要求9所述的方法，其特征在于，所述将所述文字移动至所述待编辑文档中之后，所述方法还包括：

11.一种快速插入语音载体中文字的装置，其特征在于，包括：

开启模块，用于开启待编辑文档；

指令获取模块，用于获取用户的语音获取指令；

文字移动模块，用于将所述文字移动至所述待编辑文档中。

12.根据权利要求11所述的装置，其特征在于，所述语音获取指令，包括：

选择已有语音的指令。

13.根据权利要求12所述的装置，其特征在于，所述语音获取模块，具体用于：

14.根据权利要求11所述的装置，其特征在于，所述语音获取指令，包括：

截取已有语音的指令。

15.根据权利要求14所述的装置，其特征在于，所述语音获取模块，包括：

16.根据权利要求15所述的装置，其特征在于，所述在区间获取子模块，具体用于：

17.根据权利要求11所述的装置，其特征在于，所述语音获取指令，包括：

利用音频输入设备录制语音的指令。

18.根据权利要求17所述的装置，其特征在于，所述语音获取模块，具体用于：

19.根据权利要求11所述的装置，其特征在于，所述文字移动模块，具体用于：

20.根据权利要求19所述的装置，其特征在于，所述装置还包括：