CN106126080B

CN106126080B - 语音管理方法及装置

Info

Publication number: CN106126080B
Application number: CN201610460833.5A
Authority: CN
Inventors: 李鹏
Original assignee: Beijing Yunzhisheng Information Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Priority date: 2016-06-22
Filing date: 2016-06-22
Publication date: 2019-08-16
Anticipated expiration: 2036-06-22
Also published as: CN106126080A

Abstract

本发明是关于一种语音管理方法及装置，其中，方法包括：获取用户输入的通过应用程序处理消息的语音信息；对所述语音信息进行识别，以得到所述语音信息对应的文字内容信息；将所述文字内容信息划分为执行指令信息和执行内容信息；从所述执行指令信息中获取出执行应用程序和对应的目标处理操作，以及所述执行内容消息的消息类型，其中，所述消息类型包括语音类型和文字类型；根据所述消息类型和所述执行内容消息确定目标处理消息；控制所述执行应用程序对所述目标处理消息执行所述目标处理操作。通过该技术方案，可以根据用户输入的语音信息自动执行通过应用程序处理语音内容信息的操作，从而减少用户的操作，提升用户的使用体验。

Description

语音管理方法及装置

技术领域

本发明涉及语音管理技术领域，尤其涉及一种语音管理方法及装置。

背景技术

相关技术中，当用户发语音信息时，需要用户手动进行发送。如用户想发即时消息给朋友，通知朋友今天有雨，则用户需要找到该朋友的通讯方式，进而输入语音信息告诉朋友今天有雨，然后点击发送按钮进行发送。这样，用户操作起来繁琐，用户体验不佳。

发明内容

本发明实施例提供一种语音管理方法及装置，用以实现方便用户发送语音信息，简化用户发送语音信息的过程，提升用户的使用体验。

根据本发明实施例的第一方面，提供一种语音管理方法，包括：

获取用户输入的通过应用程序处理消息的语音信息；

对所述语音信息进行识别，以得到所述语音信息对应的文字内容信息；

将所述文字内容信息划分为执行指令信息和执行内容信息；

从所述执行指令信息中获取出执行应用程序和对应的目标处理操作，以及所述执行内容消息的消息类型，其中，所述消息类型包括语音类型和文字类型；

根据所述消息类型和所述执行内容消息确定目标处理消息；

控制所述执行应用程序对所述目标处理消息执行所述目标处理操作。

在一个实施例中，所述对所述语音信息进行识别，以得到所述语音信息对应的文字内容信息，包括：

对所述语音信息分别进行语音和语义识别，以得到所述语音信息对应的文字内容信息。

在一个实施例中，所述根据所述消息类型和所述执行内容消息确定目标处理消息，包括：

判断所述消息类型；

当所述消息类型为语音类型时，根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息；

当所述消息类型为文字类型时，将所述执行内容消息确定为所述目标处理消息。

在一个实施例中，所述将所述文字内容信息划分为执行指令信息和执行内容信息，包括：

获取所述语音信息对应的语音停顿信息；

对文字内容信息进行词义解析，以得到词义解析结果；

根据所述语音停顿信息和所述词义解析结果对所述文字内容信息进行分词操作，得到分词操作结果；

根据分词操作结果，将所述文字内容信息划分为执行指令信息和执行内容信息。

在一个实施例中，所述根据分词操作结果，将所述文字内容信息划分为执行指令信息和执行内容信息，包括：

根据分词操作结果确定所述执行指令信息和所述执行内容信息之间的分界点，以及所述执行内容信息的结束点。

在一个实施例中，所述根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息，包括：

根据所述执行指令信息和所述执行内容信息之间的分界点，以及所述执行内容信息的结束点，从所述语音信息中截取出所述目标处理消息。

根据本发明实施例的第二方面，提供一种语音管理装置，包括：

第一获取模块，用于获取用户输入的通过应用程序处理消息的语音信息；

识别模块，用于对所述语音信息进行识别，以得到所述语音信息对应的文字内容信息；

划分模块，用于将所述文字内容信息划分为执行指令信息和执行内容信息；

第二获取模块，用于从所述执行指令信息中获取出执行应用程序和对应的目标处理操作，以及所述执行内容消息的消息类型，其中，所述消息类型包括语音类型和文字类型；

确定模块，用于根据所述消息类型和所述执行内容消息确定目标处理消息；

执行模块，用于控制所述执行应用程序对所述目标处理消息执行所述目标处理操作。

在一个实施例中，所述确定模块包括：

判断子模块，用于判断所述消息类型；

截取子模块，用于当所述消息类型为语音类型时，根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息；

确定子模块，用于当所述消息类型为文字类型时，将所述执行内容消息确定为所述目标处理消息。

在一个实施例中，所述识别模块用于：

在一个实施例中，所述划分模块包括：

获取子模块，用于获取所述语音信息对应的语音停顿信息；

解析子模块，用于对文字内容信息进行词义解析，以得到词义解析结果；

分词子模块，用于根据所述语音停顿信息和所述词义解析结果对所述文字内容信息进行分词操作，得到分词操作结果；

划分子模块，用于根据分词操作结果，将所述文字内容信息划分为执行指令信息和执行内容信息。

在一个实施例中，所述划分子模块用于：

在一个实施例中，所述截取子模块用于：

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种语音管理方法的流程图。

图2是根据一示例性实施例示出的一种语音管理方法中步骤S102的流程图。

图3是根据一示例性实施例示出的一种语音管理方法中步骤S103的流程图。

图4是根据一示例性实施例示出的一种语音管理方法中步骤S304的流程图。

图5是根据一示例性实施例示出的一种语音管理方法中步骤S105的流程图。

图6A是根据一示例性实施例示出的一种语音管理装置的框图。

图6B是根据一示例性实施例示出的一种语音管理装置中确定模块的框图。

图7是根据一示例性实施例示出的一种语音管理装置中划分模块的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种语音管理方法的流程图。该语音管理方法可应用于终端设备中，该终端设备可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理、车载终端等任一具有语音管理功能的设备。如图1所示，该方法包括步骤S101-S106：

在步骤S101中，获取用户输入的通过应用程序处理消息的语音信息；

用户输入的通过应用程序处理内容消息的语音信息中，可以包括应用程序、处理动作、内容消息等，如用户输入语音信息“发语音微信给李雪，今天下雨”，则应用程序为微信，处理动作为发语音信息，语音内容为今天下雨。

在步骤S102中，对所述语音信息进行识别，以得到所述语音信息对应的文字内容信息；

在步骤S103中，将所述文字内容信息划分为执行指令信息和执行内容信息；

文字内容信息可以划分为执行指令信息和执行内容信息，如识别出用户输入的语音信息对应的文字内容为“发语音微信给李雪，今天下雨”，则发语音微信给李雪为执行指令信息，今天下雨为执行内容信息。

在步骤S104中，从所述执行指令信息中获取出执行应用程序和对应的目标处理操作，以及所述执行内容消息的消息类型，其中，所述消息类型包括语音类型和文字类型；

在执行指令信息中，包括执行应用程序和对应的目标处理操作，例如执行指令信息“发语音微信给李雪”，则执行应用程序为微信，对应的目标处理操作为“发语音给李雪，消息类型为语音”。

具体地，在划分文字内容信息和从执行指令信息中获取执行应用程序和对应的目标处理操作时，可以对文字内容信息中的词语进行分词，将其与各词典库匹配，从而根据匹配结果进行划分和获取操作。

在步骤S105中，根据所述消息类型和所述执行内容消息确定目标处理消息；

执行内容信息即应用程序需要处理的内容，执行内容信息是文字形式的，由于消息类型分为语音和文字两种，因此，针对不同的语音类型，处理方式也不同。例如，如果消息类型是语音形式的，可以根据执行内容信息从用户输入的语音信息中，截取出于执行内容对应的目标处理消息，而如果消息类型是文字形式的，则可以直接将执行内容信息作为目标处理消息。

例如，用户输入的语音信息为“发语音微信给李雪，今天下雨”，进行语音识别和划分后，确定发语音微信给李雪为执行指令信息，今天下雨为执行内容信息，则根据文字形式的“今天下雨”从用户输入的语音信息中截取出语音形式的“今天下雨”。

在步骤S106中，控制所述执行应用程序对所述目标处理消息执行所述目标处理操作。

在该实施例中，可以根据用户输入的语音信息自动执行通过应用程序处理语音内容信息的操作，从而减少用户的操作，提升用户的使用体验。

图2是根据一示例性实施例示出的一种语音管理方法中步骤S105的流程图。

如图2所示，在一个实施例中，上述步骤S105包括步骤S201-S203：

在步骤S201中，判断所述消息类型；

在步骤S202中，当所述消息类型为语音类型时，根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息；

在步骤S203中，当所述消息类型为文字类型时，将所述执行内容消息确定为所述目标处理消息。

在该实施例中，由于执行内容信息是文字形式的，而消息类型分为语音和文字两种，因此，针对不同的语音类型，处理方式也不同。例如，如果消息类型是语音形式的，可以根据执行内容信息从用户输入的语音信息中，截取出于执行内容对应的目标处理消息，而如果消息类型是文字形式的，则可以直接将执行内容信息作为目标处理消息。

例如，用户输入的语音信息为“发语音微信给李雪，今天下雨”，进行语音识别和划分后，确定发语音微信给李雪为执行指令信息，消息类型为语音类型，今天下雨为执行内容信息，则根据文字形式的“今天下雨”从用户输入的语音信息中截取出语音形式的“今天下雨”。

又例如，用户输入的语音信息为“发文字微信给李雪”，进行语音识别和划分后，确定发文字微信给李雪为执行指令信息，消息类型为文字类型，今天下雨为执行内容信息，则直接发送文字形式的“今天下雨”给李雪。

在该实施例中，可以通过语音识别模型和语义识别模块对语音信息进行处理，从而得到语音信息对应的文字内容信息，保证文字内容信息的准确性。

如图3所示，在一个实施例中，上述步骤S103包括步骤S301-S304：

在步骤S301中，获取所述语音信息对应的语音停顿信息；

语音停顿信息，可以是用户输入语音时，说的不同词语之间的时间间隔信息。

在步骤S302中，对文字内容信息进行词义解析，以得到词义解析结果；

对文字内容信息进行词义解析，如分析文字内容信息中词语的词性等，也可以将词语与不同的词典库进行匹配，从而根据匹配结果确定词义。如不同性质、词性的词语可以将其分为不同的词典库，从而，便于对文字内容信息进行词义解析。

在步骤S303中，根据所述语音停顿信息和所述词义解析结果对所述文字内容信息进行分词操作，得到分词操作结果；

根据语音停顿信息和词义解析结果，可以对完整的文字内容信息进行分词操作，如对于文字内容信息“发语音微信给李雪，今天下雨”，则根据语音停顿信息和词义解析结果，可以将其分为“发”“语音”“微信”“给”“李雪”“今天下雨”几个词。

在步骤S304中，根据分词操作结果，将所述文字内容信息划分为执行指令信息和执行内容信息。

根据分词操作结果，可以将文字内容信息划分为执行指令信息和执行内容信息，如执行指令信息为“发”“语音”“微信”“给”“李雪”，执行内容信息为“今天下雨”。

如图4所示，在一个实施例中，上述步骤S304包括步骤S401：

在步骤S401中，根据分词操作结果确定所述执行指令信息和所述执行内容信息之间的分界点，以及所述执行内容信息的结束点。

根据分词操作结果，可以确定每个词的属性，如“语音”为消息类型，“微信”为执行应用程序，“发”、“给”为操作动作，“李雪”为接收对象，“今天下雨”为执行内容。则根据上述分词结果，确定执行指令信息和执行内容信息之间的分界点，以及执行内容信息的结束点，从而便于从语音信息中截取出语音形式的执行内容。

如图5所示，在一个实施例中，上述步骤S201包括步骤S501：

在步骤S501中，根据所述执行指令信息和所述执行内容信息之间的分界点，以及所述执行内容信息的结束点，从所述语音信息中截取出所述目标处理消息。

在该实施例中，在执行指令信息和所述执行内容信息之间的分界点，以及所述执行内容信息的结束点确定后，可以根据该分界点和结束点从所述语音信息中截取出所述目标处理消息。

例如，用户输入的语音信息为“帮我给李雪发语音消息，内容是明天下雪不要开车，完毕发送”，则根据上述技术方案，截取出的目标处理消息为“明天下雪不要开车”。

上述技术方案，还可以采用另外一种方式实现，例如，对于语音信息“发语音微信给李雪，今天下雨”，先对语音进行声音识别，根据声音的停顿对语音进行分句。将第一句话识别成文字，判断从文字中是否可以识别出待处理应用程序、处理动作、接收对象、消息格式等信息。如果能够识别出，则生成相应的指令，后面的语音不再识别，将后面的语音作为语音消息内容直接发送。如果未识别出上述信息，说明上述信息是消息内容，则对下一句话进行识别。这样，可以缩短识别过程，从而加快处理速度。

下述为本发明装置实施例，可以用于执行本发明方法实施例。

图6A是根据一示例性实施例示出的一种语音管理装置的框图，该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图6A所示，该语音管理装置包括：

第一获取模块61，用于获取用户输入的通过应用程序处理消息的语音信息；

识别模块62，用于对所述语音信息进行识别，以得到所述语音信息对应的文字内容信息；

划分模块63，用于将所述文字内容信息划分为执行指令信息和执行内容信息；

第二获取模块64，用于从所述执行指令信息中获取出执行应用程序和对应的目标处理操作，以及所述执行内容消息的消息类型，其中，所述消息类型包括语音类型和文字类型；

确定模块65，用于根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息；

执行模块66，用于控制所述执行应用程序对所述目标处理消息执行所述目标处理操作。

如图6B所示，在一个实施例中，所述确定模块65包括：

判断子模块651，用于判断所述消息类型；

截取子模块652，用于当所述消息类型为语音类型时，根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息；

确定子模块653，用于当所述消息类型为文字类型时，将所述执行内容消息确定为所述目标处理消息。

在一个实施例中，所述识别模块62用于：

如图7所示，在一个实施例中，所述划分模块63包括：

获取子模块71，用于获取所述语音信息对应的语音停顿信息；

解析子模块72，用于对文字内容信息进行词义解析，以得到词义解析结果；

分词子模块73，用于根据所述语音停顿信息和所述词义解析结果对所述文字内容信息进行分词操作，得到分词操作结果；

划分子模块74，用于根据分词操作结果，将所述文字内容信息划分为执行指令信息和执行内容信息。

在一个实施例中，所述划分子模块74用于：

在一个实施例中，所述截取子模块652用于：

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音管理方法，其特征在于，包括：

获取用户输入的通过应用程序处理消息的语音信息；

将所述文字内容信息划分为执行指令信息和执行内容信息；

从所述执行指令信息中获取出执行应用程序和对应的目标处理操作，以及所述执行内容信息的消息类型，其中，所述消息类型包括语音类型和文字类型；

根据所述消息类型和所述执行内容信息确定目标处理消息；

控制所述执行应用程序对所述目标处理消息执行所述目标处理操作；

所述根据所述消息类型和所述执行内容信息确定目标处理消息，包括：

判断所述消息类型；

当所述消息类型为语音类型时，根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息；或者

当所述消息类型为语音类型时，所述对所述语音信息进行识别，以得到所述语音信息对应的文字内容信息，包括：

对所述语音信息进行声音识别，根据声音的停顿对所述语音信息进行分句；

对所述语音信息中的第一句进行识别；

所述将所述文字内容信息划分为执行指令信息和执行内容信息，包括：

判断是否识别出执行指令信息；

当识别出执行指令信息时，不再识别除所述第一句之外的剩余语音信息，并将剩余语音信息确定为执行内容。

2.根据权利要求1所述的方法，其特征在于，所述将所述文字内容信息划分为执行指令信息和执行内容信息，包括：

获取所述语音信息对应的语音停顿信息；

对文字内容信息进行词义解析，以得到词义解析结果；

3.根据权利要求2所述的方法，其特征在于，所述根据分词操作结果，将所述文字内容信息划分为执行指令信息和执行内容信息，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息，包括：

5.一种语音管理装置，其特征在于，包括：

第二获取模块，用于从所述执行指令信息中获取出执行应用程序和对应的目标处理操作，以及所述执行内容信息的消息类型，其中，所述消息类型包括语音类型和文字类型；

确定模块，用于根据所述消息类型和所述执行内容信息确定目标处理消息；

执行模块，用于控制所述执行应用程序对所述目标处理消息执行所述目标处理操作；

所述确定模块包括：

判断子模块，用于判断所述消息类型；

截取子模块，用于当所述消息类型为语音类型时，根据所述执行内容信息从所述语音信息中截取出待处理的目标处理消息；或者

当所述消息类型为语音类型时，所述识别模块还用于：

对所述语音信息中的第一句进行识别；

所述划分模块还用于：

判断是否识别出执行指令信息；

6.根据权利要求5所述的装置，其特征在于，所述划分模块包括：

获取子模块，用于获取所述语音信息对应的语音停顿信息；

7.根据权利要求6所述的装置，其特征在于，所述划分子模块用于：

8.根据权利要求7所述的装置，其特征在于，所述截取子模块用于：