CN106328145A

CN106328145A - 语音修正方法及装置

Info

Publication number: CN106328145A
Application number: CN201610696696.5A
Authority: CN
Inventors: 黄丽丰
Original assignee: Beijing Yunzhisheng Information Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Priority date: 2016-08-19
Filing date: 2016-08-19
Publication date: 2017-01-11
Anticipated expiration: 2036-08-19
Also published as: CN106328145B

Abstract

本发明是关于一种语音修正方法及装置，其中，方法包括：获取用户输入的语音信息；对所述语音信息进行识别，以得到所述语音信息对应的文本内容；当所述文本内容中包含第一预设关键词时，根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本，其中，所述编辑文本用于对所述原始文本进行修改；根据所述编辑文本从所述原始文本中提取出待修改文本；根据所述编辑文本和所述待修改文本修改所述原始文本，以得到修改后的文本。通过该技术方案，可以根据编辑文本对原始文本进行修改。用户只要语音输入修改内容就可以实现对文本内容的修改，方便用户的操作，提升了用户的使用体验。

Description

语音修正方法及装置

技术领域

本发明涉及语音纠错技术领域，尤其涉及一种语音修正方法及装置。

背景技术

语音处理的过程中，在通过语义进行理解的时候，依赖于语音识别的效果。如果语音识别效果较差，则会影响语义分析的效果。并且，在识别出语音对应的文字后，如果用户想要修改其中的某些文字，则可能需要手动进行修改，或者取消已输入的语音，重新进行输入，用户体验不佳。

发明内容

本发明实施例提供一种语音修正方法及装置，用以实现方便用户进行语音修正，提升用户的使用体验。

根据本发明实施例的第一方面，提供一种语音修正方法，用于终端设备，包括：

获取用户输入的语音信息；

对所述语音信息进行识别，以得到所述语音信息对应的文本内容；

当所述文本内容中包含第一预设关键词时，根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本，其中，所述编辑文本用于对所述原始文本进行修改；

根据所述编辑文本从所述原始文本中提取出待修改文本；

根据所述编辑文本和所述待修改文本修改所述原始文本，以得到修改后的文本。

在该实施例中，用户在输入语音信息时，如果部分语音信息需要进行修改，则可以直接输入需修改的语音信息，其中，在这部分信息中，包含第一预设关键词，第一预设关键词相当于一个语音开关，只要检测到这个第一预设关键词，就可以对语音信息对应的文字内容进行划分，从而确定用户输入的原始文本，和修改内容对应的编辑文本，这样，可以根据编辑文本对原始文本进行修改。通过该技术方案，用户只要语音输入修改内容就可以实现对文本内容的修改，方便用户的操作，提升了用户的使用体验。

在一个实施例中，所述根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本，包括：

确定所述第一预设关键词在所述文本内容中所处的位置；

将所述第一预设关键词之前的文本内容确定为原始文本，将所述第一预设关键词之后的文本内容确定为编辑文本。

在该实施例中，可以根据第一预设关键词的位置，对文本内容进行划分，其中，可以将第一预设关键词作为划分标记，该关键词前边的文本内容，都划分为原始文本，该关键词后边的文本，都划分为编辑文本。这样，方便对文本内容进行划分。

在一个实施例中，所述根据所述编辑文本从所述原始文本中提取出待修改文本，包括：

根据所述编辑文本的起始字符和终止字符，从所述原始文本中查找出与所述编辑文本对应的相似度大于预设相似度的目标文本；

将所述目标文本与所述编辑文本进行对比，将所述目标文本中与所述编辑文本中的内容不同的文本确定为所述待修改文本。

在该实施例中，可以根据编辑文本的起始字符和终止字符，从原始文本中查找出与编辑文本对应的相似度大于预设相似度的目标文本，例如，根据编辑文本的起始字符和终止字符，在原始文本中查找与起始字符和终止字符相同或相似的字符，将起始到终止字符这段的文本确定为目标文本，并从目标文本中，查找出与编辑文本中内容不同的修改文本，这个修改文本即为需要进行修改的内容。

在一个实施例中，所述根据所述编辑文本和所述待修改文本修改所述原始文本，包括：

使用所述编辑文本中与所述待修改文本对应的文本替换所述原始文本中的待修改文本。

在该实施例中，使用编辑文本中与待修改文本对应的文本替换原始文本中的待修改文本，从而实现对原始文本的修改。

在一个实施例中，所述方法还包括：

检测所述文本内容中是否包含预设字符替换库中的第二预设关键词；

当所述文本内容中包含所述第二预设关键词时，从所述预设字符替换库中获取与所述第二预设关键词对应的目标预设关键词；

使用所述目标预设关键词替换所述文本内容中的第二预设关键词。

在该实施例中，还可以检测文字内容中是否包含预设字符替换中的第二预设关键词，如果包含，则获取预设字符替换库中第二预设关键词对应的目标预设关键词，从而使用该目标预设关键词替换第二预设关键词，从而使得文本内容更符合要求，更准确。

根据本发明实施例的第二方面，提供一种语音修正装置，包括：

第一获取模块，用于获取用户输入的语音信息；

识别模块，用于对所述语音信息进行识别，以得到所述语音信息对应的文本内容；

划分模块，用于当所述文本内容中包含第一预设关键词时，根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本，其中，所述编辑文本用于对所述原始文本进行修改；

提取模块，用于根据所述编辑文本从所述原始文本中提取出待修改文本；

修正模块，用于根据所述编辑文本和所述待修改文本修改所述原始文本，以得到修改后的文本。

在一个实施例中，所述划分模块包括：

第一确定子模块，用于确定所述第一预设关键词在所述文本内容中所处的位置；

第二确定子模块，用于将所述第一预设关键词之前的文本内容确定为原始文本，将所述第一预设关键词之后的文本内容确定为编辑文本。

在一个实施例中，所述提取模块包括：

查找子模块，用于根据所述编辑文本的起始字符和终止字符，从所述原始文本中查找出与所述编辑文本对应的相似度大于预设相似度的目标文本；

对比子模块，用于将所述目标文本与所述编辑文本进行对比，将所述目标文本中与所述编辑文本中的内容不同的文本确定为所述待修改文本。

在一个实施例中，所述修正模块用于：

在一个实施例中，所述装置还包括：

检测模块，用于检测所述文本内容中是否包含预设字符替换库中的第二预设关键词；

第二获取模块，用于当所述文本内容中包含所述第二预设关键词时，从所述预设字符替换库中获取与所述第二预设关键词对应的目标预设关键词；

替换模块，用于使用所述目标预设关键词替换所述文本内容中的第二预设关键词。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种语音修正方法的流程图。

图2是根据一示例性实施例示出的一种语音修正方法中步骤S103的流程图。

图3是根据一示例性实施例示出的一种语音修正方法中步骤S104的流程图。

图4是根据一示例性实施例示出的一种语音修正方法中步骤S105的流程图。

图5是根据一示例性实施例示出的另一种语音修正方法的流程图。

图6是根据一示例性实施例示出的一种语音修正装置的框图。

图7是根据一示例性实施例示出的一种语音修正装置中划分模块的框图。

图8是根据一示例性实施例示出的一种语音修正装置中提取模块的框图。

图9是根据一示例性实施例示出的另一种语音修正装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种语音修正方法的流程图。该语音修正方法应用于终端设备中，该终端设备可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等任一具有语音控制功能的设备。如图1所示，该方法包括步骤S101-S105：

在步骤S101中，获取用户输入的语音信息；

在步骤S102中，对语音信息进行识别，以得到语音信息对应的文本内容；

在步骤S103中，当文本内容中包含第一预设关键词时，根据第一预设关键词将文本内容划分为原始文本和编辑文本，其中，编辑文本用于对原始文本进行修改；

其中，第一预设关键词可以根据需要自行设置，如设置“不对”为第一预设关键词。

在步骤S104中，根据编辑文本从原始文本中提取出待修改文本；

例如，识别出用户输入的语音信息对应的文字内容为“患者体温是37度，不对是36度”，此时，检测到第一预设关键词“不对”，根据该关键词，确定“患者体温是37度”为原始文本，“是36度”为编辑文本，根据编辑文本和原始文本，确定待修改文本为“37”。

在步骤S105中，根据编辑文本和待修改文本修改原始文本，以得到修改后的文本。

如上述例子，根据编辑文本“是36度”和待修改文本“37”，将原始文本中的“37”修改为“36”，则修改后的文本为“患者体温是36度”。

如图2所示，在一个实施例中，上述步骤S103包括步骤S201-S202：

在步骤S201中，确定第一预设关键词在文本内容中所处的位置；

在步骤S202中，将第一预设关键词之前的文本内容确定为原始文本，将第一预设关键词之后的文本内容确定为编辑文本。

例如，识别出用户输入的语音信息对应的文字内容为“患者体温是37度，不对是36度”，此时，检测到第一预设关键词“不对”，根据该关键词，确定“患者体温是37度”为原始文本，“是36度”为编辑文本。

如图3所示，在一个实施例中，上述步骤S104包括步骤S301-S302：

在步骤S301中，根据编辑文本的起始字符和终止字符，从原始文本中查找出与编辑文本对应的相似度大于预设相似度的目标文本；

例如，识别出用户输入的语音信息对应的文字内容为“患者体温是37度，不对是36度”，此时，检测到第一预设关键词“不对”，根据该关键词，确定“患者体温是37度”为原始文本，“是36度”为编辑文本。其中编辑文本“是36度”中“是”为起始字符，“度”为终止字符，则根据该起始字符和终止字符，从原始字符中查找出与编辑文本对应的相似度大于预设相似度的目标文本为“是37度”。

在步骤S302中，将目标文本与编辑文本进行对比，将目标文本中与编辑文本中的内容不同的文本确定为待修改文本。

如上例，将编辑文本“是36度”与目标文本“是37度”进行对比，将目标文本中与编辑文本中的内容不同的文本确定为待修改文本，即将“37”确定为待修改文本。

如图4所示，在一个实施例中，上述步骤S105包括步骤S401：

在步骤S401中，使用编辑文本中与待修改文本对应的文本替换原始文本中的待修改文本。

如图5所示，在一个实施例中，在步骤S102之后，上述方法还包括步骤S501-S503：

在步骤S501中，检测文本内容中是否包含预设字符替换库中的第二预设关键词；

其中，预设字符替换库中可以预置一些第二预设关键词和与其对应的目标预设关键词，其中，目标预设关键词比第二预设关键词更精准，如，第二预设关键词为“度”，对应的目标预设关键词为“摄氏度”，第二关键词为“12指肠”，对应的目标预设关键词为“十二指肠”等。

在步骤S502中，当文本内容中包含第二预设关键词时，从预设字符替换库中获取与第二预设关键词对应的目标预设关键词；

在步骤S503中，使用目标预设关键词替换文本内容中的第二预设关键词。

下述为本发明装置实施例，可以用于执行本发明方法实施例。

图6是根据一示例性实施例示出的一种语音修正装置的框图，该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图6所示，该语音修正装置包括：

第一获取模块61，用于获取用户输入的语音信息；

识别模块62，用于对所述语音信息进行识别，以得到所述语音信息对应的文本内容；

划分模块63，用于当所述文本内容中包含第一预设关键词时，根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本，其中，所述编辑文本用于对所述原始文本进行修改；

提取模块64，用于根据所述编辑文本从所述原始文本中提取出待修改文本；

修正模块65，用于根据所述编辑文本和所述待修改文本修改所述原始文本，以得到修改后的文本。

如图7所示，在一个实施例中，所述划分模块63包括：

第一确定子模块71，用于确定所述第一预设关键词在所述文本内容中所处的位置；

第二确定子模块72，用于将所述第一预设关键词之前的文本内容确定为原始文本，将所述第一预设关键词之后的文本内容确定为编辑文本。

如图8所示，在一个实施例中，所述提取模块64包括：

查找子模块81，用于根据所述编辑文本的起始字符和终止字符，从所述原始文本中查找出与所述编辑文本对应的相似度大于预设相似度的目标文本；

对比子模块82，用于将所述目标文本与所述编辑文本进行对比，将所述目标文本中与所述编辑文本中的内容不同的文本确定为所述待修改文本。

在一个实施例中，所述修正模块65用于：

如图9所示，在一个实施例中，上述装置还包括：

检测模块91，用于检测所述文本内容中是否包含预设字符替换库中的第二预设关键词；

第二获取模块92，用于当所述文本内容中包含所述第二预设关键词时，从所述预设字符替换库中获取与所述第二预设关键词对应的目标预设关键词；

替换模块93，用于使用所述目标预设关键词替换所述文本内容中的第二预设关键词。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音修正方法，用于终端设备，其特征在于，包括：

获取用户输入的语音信息；

根据所述编辑文本从所述原始文本中提取出待修改文本；

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一预设关键词将所述文本内容划分为原始文本和编辑文本，包括：

确定所述第一预设关键词在所述文本内容中所处的位置；

3.根据权利要求1所述的方法，其特征在于，所述根据所述编辑文本从所述原始文本中提取出待修改文本，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述编辑文本和所述待修改文本修改所述原始文本，包括：

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.一种语音修正装置，用于终端设备，其特征在于，包括：

第一获取模块，用于获取用户输入的语音信息；

7.根据权利要求6所述的装置，其特征在于，所述划分模块包括：

8.根据权利要求6所述的装置，其特征在于，所述提取模块包括：

9.根据权利要求8所述的装置，其特征在于，所述修正模块用于：

10.根据权利要求6所述的装置，其特征在于，所述装置还包括：