CN106531167A

CN106531167A - 一种语音信息的处理方法及装置

Info

Publication number: CN106531167A
Application number: CN201611020468.2A
Authority: CN
Inventors: 赵东阳
Original assignee: Beijing Yunzhisheng Information Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Priority date: 2016-11-18
Filing date: 2016-11-18
Publication date: 2017-03-22
Anticipated expiration: 2036-11-18
Also published as: CN106531167B

Abstract

本发明公开了一种语音信息的处理方法及装置。方法包括：当检测到语音输入触发操作时，控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态；通过录音线程录制在预设语音输入法被启用的过程中输入的第一语音信息；在第一语音信息的录制过程中不断进行缓存，得到第一预设时长的缓存数据。通过本发明的技术方案，通过在该第一语音信息的录制过程中不断进行缓存，得到第一预设时长的缓存数据，能够从该缓存数据中获取各录音过程中可能由于该预设录音按键被提前或延迟触发而被丢失的部分语音信息，以在补齐各录音过程中的语音信息的同时，使得各录音过程中的录音时间点实现对齐。

Description

一种语音信息的处理方法及装置

技术领域

本发明涉及终端技术领域，特别涉及一种语音信息的处理方法及装置。

背景技术

目前，在使用语音输入法进行语音识别时，都是在录音按键被按下时，才开始录音的，然后将录制的语音识别为文字后进行输出，而相关技术中的录音方案对应两个线程，一个录音线程和一个识别线程，具体的录音过程如下：当录音按键被按下后，启动语音输入法对应的录音线程和识别线程，而录音线程负责启动终端录音，以录制输入的语音信息，识别线程负责从录音线程处取语音信息，并发送给服务器识别，待识别完毕后，从服务器中获取识别的文字并输出，但由于录音线程启动终端录音时需要一定的时间，因而，相关技术中的录音方案可能会导致录音延迟，同时，相关技术中的录音线程并没有缓存所录制的语音信息，所以，如果在某次录音过程中用户按下/抬起录音按键时动作稍微有些延迟或提前，则会导致丢失该录音过程中的部分语音信息。

发明内容

本发明提供一种语音信息的处理方法及装置，用以当检测到语音输入触发操作时，通过控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态，不仅可以通过该录音线程录制在预设语音输入法被启用的过程中输入的第一语音信息，也可以在用户反复启动录音按键时，不需要反复启动录音线程，进而不需要反复启动终端的录音功能，使得终端在预设语音输入法被启用的过程中一直处于录音状态，以尽可能避免录音线程延迟启动终端录音的问题，尽可能避免了相关技术中的录音延迟问题；另外，通过在该第一语音信息的录制过程中不断进行缓存，得到第一预设时长的缓存数据，能够从该缓存数据中获取各录音过程中可能由于该预设录音按键被提前或延迟触发而被丢失的部分语音信息，以在补齐各录音过程中的语音信息的同时，使得各录音过程中的录音时间点实现对齐。

本发明提供一种语音信息的处理方法，包括：

当检测到语音输入触发操作时，控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态；

通过所述录音线程录制在所述预设语音输入法被启用的过程中输入的第一语音信息；

在所述第一语音信息的录制过程中不断进行缓存，得到第一预设时长的缓存数据。

在一个实施例中，所述方法还包括：

在所述预设语音输入法被启用的过程中，若接收到针对预设录音按键执行的录音过程开始触发操作，则从所述缓存数据中获取接收到所述录音过程开始触发操作之前的第二预设时长内录制的第一部分语音信息，其中，所述第二预设时长小于或等于所述第一预设时长；

将所述第一部分语音信息与自接收到所述录音过程开始触发操作起所录制的第二语音信息进行合成，得到目标语音信息，其中，所述第一语音信息包括所述第二语音信息；

通过所述终端中的识别线程识别目标语音信息，得到所述目标语音信息对应的文字信息。

在一个实施例中，所述方法还包括：

在所述预设语音输入法被启用的过程中，若接收到针对预设录音按键执行的录音过程结束触发操作，则判断接收到所述录音过程结束触发操作时所录制的第三语音信息对应的文字信息是否为语句末端，其中，所述第一语音信息包括所述第三语音信息；

当所述第三语音信息对应的文字信息不是所述语句末端时，从所述缓存数据中获取自接收到所述录音过程结束触发操作之后的第三预设时长内录制的第二部分语音信息，其中，所述第三预设时长小于或等于所述第一预设时长；

将所述第二部分语音信息识别为文字信息。

在一个实施例中，所述方法还包括：

在所述预设语音输入法被启用的过程中，当再次接收到录音过程开始触发操作时，判断所述录音过程开始触发操作的再次接收时间和与其紧邻的上一个所述录音过程结束触发操作的接收时间之间的时间间隔是否小于目标时长，其中，所述目标时长包括所述第三预设时长或所述第二预设时长；

当小于所述目标时长时，从所述缓存数据中获取自再次接收到所述录音过程开始触发操作之前的所述时间间隔内录制的第三部分语音信息；

将所述第三部分语音信息识别为文字信息。

在一个实施例中，所述语音输入触发操作包括：启用所述预设语音输入法。

本发明还提供一种语音信息的处理装置，包括：

控制模块，用于当检测到语音输入触发操作时，控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态；

录制模块，用于通过所述录音线程录制在所述预设语音输入法被启用的过程中输入的第一语音信息；

缓存模块，用于在所述第一语音信息的录制过程中不断进行缓存，得到第一预设时长的缓存数据。

在一个实施例中，所述装置还包括：

第一获取模块，用于在所述预设语音输入法被启用的过程中，若接收到针对预设录音按键执行的录音过程开始触发操作，则从所述缓存数据中获取接收到所述录音过程开始触发操作之前的第二预设时长内录制的第一部分语音信息，其中，所述第二预设时长小于或等于所述第一预设时长；

合成模块，用于将所述第一部分语音信息与自接收到所述录音过程开始触发操作起所录制的第二语音信息进行合成，得到目标语音信息，其中，所述第一语音信息包括所述第二语音信息；

第一识别模块，用于通过所述终端中的识别线程识别目标语音信息，得到所述目标语音信息对应的文字信息。

在一个实施例中，所述装置还包括：

第一判断模块，用于在所述预设语音输入法被启用的过程中，若接收到针对预设录音按键执行的录音过程结束触发操作，则判断接收到所述录音过程结束触发操作时所录制的第三语音信息对应的文字信息是否为语句末端，其中，所述第一语音信息包括所述第三语音信息；

第二获取模块，用于当所述第三语音信息对应的文字信息不是所述语句末端时，从所述缓存数据中获取自接收到所述录音过程结束触发操作之后的第三预设时长内录制的第二部分语音信息，其中，所述第三预设时长小于或等于所述第一预设时长；

第二识别模块，用于将所述第二部分语音信息识别为文字信息。

在一个实施例中，所述装置还包括：

第二判断模块，用于在所述预设语音输入法被启用的过程中，当再次接收到录音过程开始触发操作时，判断所述录音过程开始触发操作的再次接收时间和与其紧邻的上一个所述录音过程结束触发操作的接收时间之间的时间间隔是否小于目标时长，其中，所述目标时长包括所述第三预设时长或所述第二预设时长；

第三获取模块，用于当小于所述目标时长时，从所述缓存数据中获取自再次接收到所述录音过程开始触发操作之前的所述时间间隔内录制的第三部分语音信息；

第三识别模块，用于将所述第三部分语音信息识别为文字信息。

本公开的实施例提供的技术方案可以包括以下有益效果：

当检测到语音输入触发操作时，通过控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态，不仅可以通过该录音线程录制在预设语音输入法被启用的过程中输入的第一语音信息，也可以在用户反复启动录音按键时，不需要反复启动录音线程，进而不需要反复启动终端的录音功能，使得终端在该预设过程中一直处于录音状态，以尽可能避免录音线程延迟启动终端录音的问题，尽可能避免了相关技术中的录音延迟问题；同时，通过在该第一语音信息的录制过程中不断进行缓存，得到第一预设时长的缓存数据，能够从该缓存数据中获取各录音过程中可能由于该预设录音按键被提前或延迟触发而被丢失的部分语音信息，以在补齐各录音过程中的语音信息的同时，使得各录音过程中的录音时间点实现对齐。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是根据一示例性实施例示出的一种语音信息的处理方法的流程图。

图2是根据一示例性实施例示出的另一种语音信息的处理方法的流程图。

图3是根据一示例性实施例示出的一种语音信息的处理装置的框图。

图4是根据一示例性实施例示出的另一种语音信息的处理装置的框图。

图5是根据一示例性实施例示出的又一种语音信息的处理装置的框图。

图6是根据一示例性实施例示出的再一种语音信息的处理装置的框图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

相关技术中，在使用语音输入法进行语音识别时，都是在录音按键被按下时，才开始录音的，然后将录制的语音识别为文字后进行输出，而相关技术中的录音方案对应两个线程，一个录音线程和一个识别线程，具体的录音过程如下：当录音按键被按下后，启动语音输入法对应的录音线程和识别线程，而录音线程负责启动终端录音，以录制输入的语音信息，识别线程负责从录音线程处取语音信息，并发送给服务器识别，待识别完毕后，从服务器中获取识别的文字并输出，但由于录音线程启动终端录音时需要一定的时间，因而，相关技术中的录音方案可能会导致录音延迟，同时，相关技术中的录音线程并没有缓存所录制的语音信息，所以，如果在某次录音过程中用户按下/抬起录音按键时动作稍微有些延迟或提前，则会导致丢失该录音过程中的部分语音信息。

为了解决上述技术问题，本公开实施例提供了一种语音信息的处理方法，该方法适用于语音信息的处理程序、系统或装置中，其执行主体上安装有云知声、科大讯飞等能够将录制的语音信息转换为文字信息的预设语音输入法，如图1所示，该方法包括步骤S101至步骤S103，其中，

在步骤S101中，当检测到语音输入触发操作时，控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态；

该预设语音输入法可以是云知声、科大讯飞等能够将录制的语音信息转换为文字信息的输入法，而预设语音输入法被启用表示当前使用的输入法被切换至该预设语音输入法。

在步骤S102中，通过录音线程录制在预设语音输入法被启用的过程中输入的第一语音信息，其中，由于在预设语音输入法被启用的过程中录音线程一直保持启动状态，一直能够录制用户输入的语音信息，因而，该预设语音输入法被启用的过程每一时刻录制的语音均可称为第一语音信息，另外，每一时刻录制的语音均可携带有相应的当前录制时间，即第一语音信息可以携带有具体的实时录制时间，以便于之后可以将各录音过程中的录音时间点尽可能与用户期望的录音过程进行对齐、各录音过程的录音起点时间点和录音结束时间点更为准确；

当检测到语音输入触发操作时，通过控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态，不仅可以通过该录音线程录制在预设语音输入法被启用的过程中输入的第一语音信息，也可以在用户反复启动录音按键时，不需要反复启动录音线程，进而不需要反复启动终端的录音功能，使得终端在该预设过程中一直处于录音状态，以尽可能避免录音线程延迟启动终端录音的问题，尽可能避免了相关技术中的录音延迟问题。

另外，语音输入触发操作可以包括：启用预设语音输入法，这样，录音线程可以自当前输入法切换至预设语音输入法时就被开启且在停留在该预设语音输入法的过程中，一直处于开启状态，而不受在该预设语音输入法被启用的过程中用户对预设录音键的反复触发操作(其中，这些触发操作用于开启预设录音键或者关闭预设录音键，如可以是按下该预设录音键或者抬起该预设录音键等)的影响，即在该过程中无论是否接收到录音过程开始触发操作或录音过程结束触发操作，执行主体一直处于录音过程，一直在不断录制用户输入的语音信息，直至当前输入法由预设语音输入法被切换至其他输入法。

在步骤S103中，在第一语音信息的录制过程中不断进行缓存，得到第一预设时长的缓存数据。

通过在该第一语音信息的录制过程中不断进行缓存，得到第一预设时长的缓存数据，能够从该缓存数据中获取各录音过程中可能由于该预设录音按键被提前或延迟触发而被丢失的部分语音信息，以在补齐各录音过程中的语音信息的同时，使得各录音过程中的录音时间点实现对齐。

另外，在该第一语音信息的录制过程中不断进行缓存，得到第一预设时长的缓存数据的实现过程可以为：不断使用录制时间靠后的语音信息覆盖录制时间靠前的语音信息，这样，一直缓存第一预设时长(如2秒)的语音信息，同时缓存第一预设时长的缓存数据而非将完整的第一语音信息都进行缓存，可以在满足用户语音对齐需求的基础上，减少对缓存空间的占用，尽可能占用较少的缓存空间，当然，如果缓存空间较大，还可以缓存整个第一语音信息。

如图2所示，在一个实施例中，上述图1所示的方法还可包括步骤S201至步骤S203：

在步骤S201中，在预设语音输入法被启用的过程中，若接收到针对预设录音按键执行的录音过程开始触发操作，则从缓存数据中获取接收到录音过程开始触发操作之前的第二预设时长内录制的第一部分语音信息，其中，第二预设时长小于或等于第一预设时长，如该录音过程开始触发操作的接收时间为T0、第二预设时长为T1、第一预设时长为T2(T1≤T2)，则第一部分录音信息的时间起点为T0-T1，时间终点为T0，即第一部分录音信息为T0-T1至T0这一时间段内录制的语音信息；

该第二预设时长可以是200毫秒～500毫秒，而该第一预设时长可以是2秒或者1秒等。

该预设录音键可以是与安装有预设语音输入法的执行主体相连接的外设麦克风上的录音按键，或者

该预设录音键可以是与安装有预设语音输入法的执行主体相连接的外设键盘上的预设按键，或者

该预设录音键还可以是安装有预设语音输入法的执行主体上的虚拟录音按键。

录音过程开始触发操作用于指示正式开始一个用户期望的录音过程，且该录音触发操作可以是点击、长按该预设录音键，如该录音过程开始触发操作可以是按下该预设录音按键，而录音过程结束触发操作可以是抬起该预设录音按键。

在步骤S202中，将第一部分语音信息与自接收到录音过程开始触发操作起所录制的第二语音信息进行合成，得到目标语音信息，其中，第一语音信息包括第二语音信息，该第二语音信息为接收到该录音过程开始触发操作至接收到紧邻该录音过程开始触发操作的下一个录音过程结束触发操作这一录音过程中录制的语音信息(如当该录音过程开始触发操作为第M个录音过程开始触发操作时，紧邻该录音过程开始触发操作的下一个录音过程结束触发操作自然为第M个录音过程结束触发操作，其中，M为正整数)，相应地，该第二语音信息对应的时间起点为该录音过程开始触发操作的接收时间，该第二语音信息对应的时间终点为该录音过程开始触发操作之后紧邻的录音过程结束触发操作的接收时间；

在步骤S203中，通过终端中的识别线程识别目标语音信息，得到目标语音信息对应的文字信息。

在预设语音输入法被启动的过程中，若接收到录音过程开始触发操作，则说明用户期望开始一个录音过程(当然，每个录音过程均对应一个录音过程开始触发操作和一个录音过程结束操作操作，且每个录音过程均是以一个录音过程开始触发操作为本次录音过程的录音起点，以一个录音过程结束触发操作为本次录音过程的录音终点)，而用户又有很可能延迟触发该预设录音按键，因而如果以该录音过程开始触发操作的接收时间为本次录音过程的时间起点，则可能丢失部分本次录音过程所录音的语音信息，所以，可以自动地从该缓存数据中获取接收到该录音过程开始触发操作之前的第二预设时长内录制的第一部分语音信息，以将本次录音过程的录音起点时间进行对齐，使得本次录音过程的录音起点时间更为准确，然后将该第一部分语音信息与第二语音信息进行合成，以尽可能得到本次录音过程中的完整语音信息(即该目标语音信息)，以避免丢失本次录音过程中开头部分语音信息，并通过终端中的识别线程识别目标语音信息，从而尽可能获得该录音过程中的完整文字信息。

在一个实施例中，上述方法还可包括：

在预设语音输入法被启用的过程中，若接收到针对预设录音按键执行的录音过程结束触发操作，则判断接收到录音过程结束触发操作时所录制的第三语音信息对应的文字信息是否为语句末端，其中，第一语音信息包括第三语音信息，且该第三语音信息对应的文字信息有可能为空或者非空；

在判断第三语音信息对应的文字信息是否为语句末端时，可以根据该第三语音信息处是否有停顿、停顿的时长、以及该第三语音信息对应的文字信息所在的录音过程(其中，当该录音过程结束触发操作为第N个录音过程结束触发操作时，这个录音过程为第N个录音过程，且该录音过程中录制的语音信息为第N个录音过程开始触发操作至第N个录音过程结束触发操作这一时间段内录制的语音信息，而N为正整数，当然，这一录音过程中录制的语音信息包括了第三语音信息)中的最后一个语句(其中，该语句可以是一个词、一个句子、一个短语等)是否构成完整的语义来判断，例如，如果有停顿、或者停顿的时长大于预设时长、或者构成完整的语义，则可以确定该第三语音信息对应的文字信息为语句末端，反之，如果无停顿、或者未构成完整的语义(如结束位置为半句话)，则可以确定该第三语音信息对应的文字信息不为语句末端。

当第三语音信息对应的文字信息不是语句末端时，从缓存数据中获取自接收到录音过程结束触发操作之后的第三预设时长内录制的第二部分语音信息，其中，第三预设时长小于或等于第一预设时长；

其中，若该录音过程结束触发操作的接收时间为T3、第三预设时长为T4、第一预设时长为T2(T4≤T2)，则第二部分录音信息的时间起点为T3，时间终点为T3+T4，即第二部分录音信息为T3至T3+T4这一时间段内录制的语音信息。

另外，该第三预设时长可以个性化设定，例如：根据用户提前执行该录音过程结束触发操作的历史习惯可知，该第三预设时长可以是200毫秒～500毫秒，或者

该第三预设时长还可以是相对固定的，而该相对固定的时长为该录音过程结束触发操作的接收时间至语句末端的语音信息的录制时间这一时间段。

当然，该第三预设时长与该第二预设时长可以是相同的，或者是不同的。

将第二部分语音信息识别为文字信息，其中，在将第二部分语音信息识别为文字信息时，可以使用识别线程进行识别。

当该第三语音信息对应的文字信息不是语句末端时，说明用户可能提前执行了录音过程结束触发操作才导致本次录音过程结束的位置并非完整的语句而是半句话，因而，可以从缓存数据中获取自接收到该录音过程结束触发操作之后的第三预设时长内录制的第二部分语音信息，然后将第二部分语音信息与接收到该录音过程结束触发操作之前已录制的该录音过程中的其他语音信息进行合成，以补齐该录音过程结束触发操作所对应的录音过程中的最后一个语句，同时将本次录音过程的录音结束时间进行对齐，使得本次录音过程的录音结束时间更为准确，避免丢失该录音过程中的语音信息，然后将第二部分语音信息识别为文字信息，从而获取该录音过程中的完整文字信息。

在一个实施例中，方法还包括：

在预设语音输入法被启用的过程中，当再次接收到录音过程开始触发操作时，判断录音过程开始触发操作的再次接收时间和与其紧邻的上一个录音过程结束触发操作的接收时间之间的时间间隔是否小于目标时长，其中，目标时长包括第三预设时长或第二预设时长；

当再次接收到的录音过程开始触发操作为第N+1个录音过程开始触发操作时，说明用户期望开始第N+1个录音过程，也即本次的录音过程为第N+1个录音过程，该第N+1个录音过程自第N+1个录音过程开始触发操作开始至第N+1个录音过程结束触发操作结束，而与其紧邻的上一个录音过程结束触发操作为第N个录音过程结束触发操作。

当小于目标时长时(如该时间间隔小于200毫秒)，从缓存数据中获取自再次接收到录音过程开始触发操作之前的时间间隔内录制的第三部分语音信息；

其中，若该录音过程开始触发操作的再次接收时间为T5、该时间间隔为T6，则第三部分录音信息的时间起点为T5-T6，时间终点为T5，即第三部分录音信息为T5-T6至T5这一时间段内录制的语音信息。

将第三部分语音信息识别为文字信息，其中，在将第三部分语音信息识别为文字信息时，也可以使用该识别线程进行识别。

在预设语音输入法被启用的过程中，当再次接收到录音过程开始触发操作时，说明用户期望开始又一个新的录音过程，而如果该录音过程开始触发操作的再次接收时间和与其紧邻的上一个录音过程结束触发操作的接收时间之间的时间间隔小于目标时长，则说明两次紧邻的触发操作相距甚近，即便用户滞后执行了本次的录音过程开始触发操作而丢失了本次录音过程的部分录音信息，则该部分录音信息的时长也不足第三预设时长或者第二预设时长、最多为该时间间隔，因而，可以从该缓存数据中自动获取该再次接收时间之前的时间间隔内录制的第三部分语音信息，并将该第三部分语音信息识别为文字信息，从而尽可能使得本次录音过程的开始时间点实现对齐且更为准确，得到本次录音过程中完整的头部语音信息，避免丢失该录音过程中的部分头部语音信息。

另外，在将第三部分语音信息识别为文字信息之后，该第三部分语音信息对应的文字信息还可以与本次录音过程中的其他语音信息对应的文字信息进行合成，从而得到该录音过程中的完整文字信息。

在一个实施例中，语音输入触发操作包括：启用预设语音输入法。

如图3所示，本发明还提供一种语音信息的处理装置，包括：

控制模块301，被配置为当检测到语音输入触发操作时，控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态；

录制模块302，被配置为通过录音线程录制在预设语音输入法被启用的过程中输入的第一语音信息；

缓存模块303，被配置为在第一语音信息的录制过程中不断进行缓存，得到第一预设时长的缓存数据。

如图4所示，在一个实施例中，上述图3所示的装置还可包括：

第一获取模块401，被配置为在预设语音输入法被启用的过程中，若接收到针对预设录音按键执行的录音过程开始触发操作，则从缓存数据中获取接收到录音过程开始触发操作之前的第二预设时长内录制的第一部分语音信息，其中，第二预设时长小于或等于第一预设时长；

合成模块402，被配置为将第一部分语音信息与自接收到录音过程开始触发操作起所录制的第二语音信息进行合成，得到目标语音信息，其中，第一语音信息包括第二语音信息；

第一识别模块403，被配置为通过终端中的识别线程识别目标语音信息，得到目标语音信息对应的文字信息。

如图5所示，在一个实施例中，上述图3所示的装置还可包括：

第一判断模块501，被配置为在预设语音输入法被启用的过程中，若接收到针对预设录音按键执行的录音过程结束触发操作，则判断接收到录音过程结束触发操作时所录制的第三语音信息对应的文字信息是否为语句末端，其中，第一语音信息包括第三语音信息；

第二获取模块502，被配置为当第三语音信息对应的文字信息不是语句末端时，从缓存数据中获取自接收到录音过程结束触发操作之后的第三预设时长内录制的第二部分语音信息，其中，第三预设时长小于或等于第一预设时长；

第二识别模块503，被配置为将第二部分语音信息识别为文字信息。

如图6所示，在一个实施例中，上述图5所示的装置还可包括：

第二判断模块601，被配置为在预设语音输入法被启用的过程中，当再次接收到录音过程开始触发操作时，判断录音过程开始触发操作的再次接收时间和与其紧邻的上一个录音过程结束触发操作的接收时间之间的时间间隔是否小于目标时长，其中，目标时长包括第三预设时长或第二预设时长；

第三获取模块602，被配置为当小于目标时长时，从缓存数据中获取自再次接收到录音过程开始触发操作之前的时间间隔内录制的第三部分语音信息；

第三识别模块603，被配置为将第三部分语音信息识别为文字信息。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

最后，本发明中的语音信息的处理装置适用于终端设备。例如，可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音信息的处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将所述第二部分语音信息识别为文字信息。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

将所述第三部分语音信息识别为文字信息。

5.根据权利要求1至4中任一项所述的方法，其特征在于，

所述语音输入触发操作包括：启用所述预设语音输入法。

6.一种语音信息的处理装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述装置还包括：

8.根据权利要求6所述的装置，其特征在于，所述装置还包括：

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

10.根据权利要求6至9中任一项所述的装置，其特征在于，

所述语音输入触发操作包括：启用所述预设语音输入法。