CN110826301A

CN110826301A - 标点符号添加方法、系统、移动终端及存储介质

Info

Publication number: CN110826301A
Application number: CN201910888380.XA
Authority: CN
Inventors: 张广学; 肖龙源; 李稀敏; 蔡振华; 刘晓葳; 王静
Original assignee: Xiamen Kuaishangtong Technology Co Ltd
Current assignee: Xiamen Kuaishangtong Technology Co Ltd
Priority date: 2019-09-19
Filing date: 2019-09-19
Publication date: 2020-02-21
Anticipated expiration: 2039-09-19
Also published as: CN110826301B

Abstract

本发明适用于语音识别技术领域，提供了一种标点符号添加方法、系统、移动终端及存储介质，该方法包括：获取待识别语音进行语音识别，以得到目标文本；对目标文本进行特征词的提取和标注，并将特征词的标注结果与语言表达习惯进行匹配；当标注结果与语言表达习惯匹配成功时，对提取后的目标文本进行修正条件的判断，根据判断结果对目标文本进行标点符号修正，并输出目标文本；当标注结果与语言表达习惯未匹配成功时，根据语言表达习惯对目标文本进行标点符号添加，并输出目标文本。本发明通过基于停顿检测、特征词的标注结果和语言表达习惯，以对应对文本进行标点符号的辅助修正，防止了由于仅根据3‑gram方式进行标点添加所导致的准确率低下的现象。

Description

标点符号添加方法、系统、移动终端及存储介质

技术领域

本发明属于语音识别技术领域，尤其涉及一种标点符号添加方法、系统、移动终端及存储介质。

背景技术

近年来，随着语音技术的飞速发展，语音识别技术凭借其智能、高效和人性化的优势，被广泛应用于生产、生活的各个领域，越来越受到大众的欢迎，但目前来说，语音在经过语音识别模型之后，输出的均为无符号文本。这严重影响了语音识别技术在会议记录、语音转文本、操作和应用记录等方面的应用，因此，语音识别过程中标点符号的添加问题越来越受人们所重视。

现有的标点符号添加过程中，只是依据3-gram方式对应进行标点的添加，这样往往导致标点符号添加错误，且只能添加逗号等分隔符进行分句，使得标点添加准确率低下，且使得转化后的文本往往需要大量的人工干预以进行标点的校正，导致标点符号添加效率低下。

发明内容

本发明实施例要解决的技术问题是，由于现有的标点符号添加只是依据3-gram方式对应进行标点的添加，所导致的标点符号添加准确率低下的问题。

本发明实施例是这样实现的，一种标点符号添加方法，所述方法包括：

获取待识别语音，并对所述待识别语音进行语音识别，以得到目标文本；

对所述目标文本进行特征词的提取和标注，并将所述特征词的标注结果与本地预存储的语言表达习惯进行匹配，所述特征词包括名词、动词、状态词、程度词和辅助词；

当所述标注结果与所述语言表达习惯匹配成功时，对提取后的所述目标文本进行修正条件的判断，根据判断结果对所述目标文本进行标点符号修正，并输出所述目标文本；

当所述标注结果与所述语言表达习惯未匹配成功时，根据所述语言表达习惯对所述目标文本进行标点符号修正，并输出所述目标文本。

更进一步的，所述将所述特征词的标注结果与本地预存储的语言表达习惯进行匹配的步骤之前，所述方法还包括：

对所述目标文本进行停顿检测，并根据检测结果和所述语言表达习惯判断所述目标文本是否断句正确；

当判断到所述目标文本断句正确时，则触发所述标注结果与所述语言表达习惯之间的匹配；

当判断到所述目标文本断句未正确时，则直接对所述目标文本进行所述修正条件的判断，并根据判断结果对所述目标文本进行标点符号添加。

更进一步的，所述对提取后的所述目标文本进行修正条件的判断的步骤包括：

判断所述目标文本中的文本语句内是否存在停顿；

当判断到所述文本语句内存在停顿时，则在停顿对应位置添加逗号；

判断所述目标文本中相邻所述特征词之间是否存在并列关系；

当判断到相邻所述特征词之间存在并列关系时，则在相邻所述特征词之间添加顿号；

判断相邻所述文本语句的句式之间是否存在并列关系；

当判断到相邻所述文本语句的句式之间存在并列关系时，则在相邻所述文本语句之间添加分号；

判断所述文本语句内是否存在专有词；

当判断到所述文本语句内存在所述专有词时，对所述专有词添加引号。

更进一步的，所述对提取后的所述目标文本进行修正条件的判断的步骤还包括：

判断所述文本语句是否为解释说明语句；

当判断到所述文本语句为所述解释说明书语句时，则在所述文本语句的末端添加冒号；

判断所述文本语句是否为疑问句；

当判断到所述文本语句为疑问句时，则在所述文本语句的末端添加问号；

判断所述文本语句是否为感叹句；

当判断到所述文本语句为所述感叹句时，则在所述文本语句的末端添加感叹号；

判断所述文本语句是否为陈述句；

当判断到所述文本语句为所述陈述句时，则在所述陈述句的末端添加句号。

更进一步的，所述判断所述文本语句是否为解释说明语句的步骤包括：

判断所述文本语句的后段语句结构是否为名词+主语+谓语结构；

若是，则判断订所述文本语句为所述解释说明语句。

更进一步的，所述对所述待识别语音进行语音识别的步骤包括：

对所述待识别语音进行音素识别，以得到音素数据；

对所述音素数据进行解码，以得到所述目标文本。

本发明实施例的另一目的在于提供一种标点符号添加系统，所述系统包括：

语音识别模块，用于获取待识别语音，并对所述待识别语音进行语音识别，以得到目标文本；

特征标记模块，用于对所述目标文本进行特征词的提取和标注，并将所述特征词的标注结果与本地预存储的语言表达习惯进行匹配，所述特征词包括名词、动词、状态词、程度词和辅助词；

第一标点添加模块，用于当所述标注结果与所述语言表达习惯匹配成功时，对提取后的所述目标文本进行修正条件的判断，根据判断结果对所述目标文本进行标点符号修正，并输出所述目标文本；

第二标点添加模块，用于当所述标注结果与所述语言表达习惯未匹配成功时，根据所述语言表达习惯对所述目标文本进行标点符号修正，并输出所述目标文本。

更进一步的，所述标点符号添加系统还包括：

停顿检测模块，用于对所述目标文本进行停顿检测，并根据检测结果和所述语言表达习惯判断所述目标文本是否断句正确；当判断到所述目标文本断句正确时，则触发所述标注结果与所述语言表达习惯之间的匹配；当判断到所述目标文本断句未正确时，则直接对所述目标文本进行所述修正条件的判断，并根据判断结果对所述目标文本进行标点符号添加。

本发明实施例的另一目的在于提供一种移动终端，包括存储设备以及处理器，所述存储设备用于存储计算机程序，所述处理器运行所述计算机程序以使所述移动终端执行上述的标点符号添加方法。

本发明实施例的另一目的在于提供一种存储介质，其存储有上述的移动终端中所使用的计算机程序，该计算机程序被处理器执行时实现上述的标点符号添加方法的步骤。

本发明实施例，通过基于停顿检测、特征词的标注结果和语言表达习惯，以对应对文本进行标点符号的辅助修正，防止了由于仅根据3-gram方式进行标点添加所导致的准确率低下的现象，通过对提取后的所述目标文本进行修正条件的判断的设计，以使在满足修正条件处对应进行标点符号的修正，且通过当判断到所述标注结果与所述语言表达习惯未匹配成功时，直接根据所述语言表达习惯进行标点符号添加的设计，有效的对目标文本的标点添加起到了辅助校正效果，提高了标点添加的准确性。

附图说明

图1是本发明第一实施例提供的标点符号添加方法的流程图；

图2是本发明第二实施例提供的标点符号添加方法的流程图；

图3是本发明第三实施例提供的标点符号添加系统的结构示意图；

图4是本发明第四实施例提供的移动终端的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。

现有的标点符号添加过程中，只是依据3-gram方式对应进行标点的添加，使得标点添加准确率低下，且使得转化后的文本往往需要大量的人工干预以进行标点的校正，因此，本发明的目的在于通过基于特征词的标注结果和语言表达习惯，以对应对文本进行标点符号的添加，防止了由于仅根据语音停顿进行标点添加所导致的准确率低下的现象。

实施例一

请参阅图1，是本发明第一实施例提供的标点符号添加方法的流程图，包括步骤：

步骤S10，获取待识别语音，并对所述待识别语音进行语音识别，以得到目标文本；

其中，该待识别语音的获取可以采用拾音器、手机或平板等具有拾音效果的设备进行提取，且该步骤中，通过对该待识别语音进行语音识别的设计，有效的方便了后续针对该待识别语音的语音分析；

具体的，该步骤中，可以采用语音模型的方式对待识别语音进行语音识别，以使将语音信息转换为文字信息，优选的，本实施例中是采用3-gram模块的方式对待识别语音进行处理，以得到目标文本，而后续步骤用于对该目标文本进行标点符号的校正，以提高标点符号添加的准确性；

步骤S20，对所述目标文本进行特征词的提取和标注，并将所述特征词的标注结果与本地预存储的语言表达习惯进行匹配；

其中，所述特征词包括名词、动词、状态词、程度词和辅助词，该步骤中，可以采用词语匹配的方式以对应进行特征词的提取，即通过将所述目标文本中的词语依序与本地预存储的特征词表进行匹配，以依序对所述目标文本中的词语进行特征判断，并当判断到对应词语为特征词时，对其进行标注；

优选的，该步骤中可以采用数值的方式对不同特征词之间进行标注，例如将提取到的名词进行数值1的标注，将提取到的动词进行数值2的标注，将提取到的状态词进行数值3的标注，将提取到的程度词进行数值4的标注，将提取到的辅助词进行数值5的标注，需要说明的是，本实施例中还可以采用字母、字母与数字的组合或文字等方式对应进行标注，以达到对不同特征词之间的标注效果，进而有效的方便了后续针对不同特征词之间的识别；

具体的，所述语言表达习惯的类型包括：主语+谓语+宾语(例如：我拿了那本书)；主语+谓语(例如：我走了)；谓语+宾语(例如：洗碗)；宾补(例如：漂亮的、在桌子上的)；状补(例如：快、但是)；

此外，本实施例在所述语言表达习惯建立过程中，还存储了可做谓语的动词及其组合、可做主语的名字及其组合、可做宾语的词组、可做状语的词汇(状态词、程度词等)。另外，统计了感叹号、问号的常见表达句式(例如：揍他们！是这样吗？)

步骤S30，当所述标注结果与所述语言表达习惯匹配成功时，对提取后的所述目标文本进行修正条件的判断，根据判断结果对所述目标文本进行标点符号修正，并输出所述目标文本；

其中，通过对提取后的所述目标文本进行修正条件的判断设计，以使在满足修正条件处对应进行标点符号的添加，例如判断目标文本中是否需要添加顿号，判断目标文本中是否需要添加引号，判断目标文本中是否需要添加分号，判断目标文本中是否需要添加冒号，判断目标文本中是否需要添加问号，判断目标文本中是否需要添加感叹号等；

步骤S40，当所述标注结果与所述语言表达习惯未匹配成功时，根据所述语言表达习惯对所述目标文本进行标点符号修正，并输出所述目标文本；

其中，当判断到所述标注结果与所述语言表达习惯未匹配成功时，则判定该目标文本的输出格式存在错误，因此，通过所述语言表达习惯直接对所述目标文本进行标点符号添加，并输出所述目标文本；

本实施例，通过基于停顿检测、特征词的标注结果和语言表达习惯，以对应对文本进行标点符号的辅助修正，防止了由于仅根据3-gram方式进行标点添加所导致的准确率低下的现象，通过对提取后的所述目标文本进行修正条件的判断的设计，以使在满足修正条件处对应进行标点符号的修正，且通过当判断到所述标注结果与所述语言表达习惯未匹配成功时，直接根据所述语言表达习惯进行标点符号添加的设计，有效的对目标文本的标点添加起到了辅助校正效果，提高了标点添加的准确性。

实施例二

请参阅图2，是本发明第二实施例提供的标点符号添加方法的流程图，包括步骤：

步骤S11，获取待识别语音，对所述待识别语音进行音素识别，以得到音素数据；对所述音素数据进行解码，以得到所述目标文本；

其中，通过将待识别语音输入至声学模型，以使进行音素识别，并通过将音素识别结果输入至语言模型进行解码，以得到该目标文本，优选的，该步骤中，通过采用基于有标点符号的3-gram模型，将音素解码到相应有标点符号文本；

步骤S21，对所述目标文本进行特征词的提取和标注，并所述目标文本进行停顿检测；

具体的，该步骤中，通过依序判断目标文本中相邻词之间的时间间隔是否大于时间阈值，以判定相邻词之间是否存在停顿，并当判断到相邻词之间存在停顿时，在该相邻词之间进行停顿标记；

步骤S31，根据检测结果和所述语言表达习惯判断所述目标文本是否断句正确；

根据所记录的停顿检测时间，对相应位置的文本进行检查。

若停顿标记处的前后文本内容都符合表达习惯，但待检测文本未添加标点符号，则进行标点符号添加；

若停顿处处于表达句式中，但待检测文本已添加标点符号，则进行表达标点符号的去除。

其中，由于3-gram模型的标点符号文本可能存在一些问题，因此，该步骤中通过所述语言表达习惯对该目标文本进行标点校正；

当步骤S31判断到所述目标文本断句正确时，执行步骤S41；

步骤S41，将所述特征词的标注结果与语言表达习惯进行匹配；

首先，对所标注的名词、动词、形容词等进行表达习惯匹配。

例如：主+谓+宾，对应于名词+动词+名词；

主+状+谓，对应于名词+状语+动词；

谓+宾，对应于动词+名词等。

步骤S51，当所述标注结果与所述语言表达习惯匹配成功时，对提取后的所述目标文本进行修正条件的判断；

其中，通过对提取后的所述目标文本进行修正条件的判断设计，以使在满足修正条件处对应进行标点符号的修正，例如判断目标文本中是否需要添加顿号，判断目标文本中是否需要添加引号，判断目标文本中是否需要添加分号，判断目标文本中是否需要添加冒号，判断目标文本中是否需要添加问号，判断目标文本中是否需要添加感叹号等；

步骤S61，当判断到所述目标文本中的文本语句内存在停顿时，则在停顿对应位置添加逗号；当判断到所述目标文本中相邻所述特征词之间存在并列关系时，则在相邻所述特征词之间添加顿号；

其中，通过判断所述目标文本中的文本语句内是否存在停顿，以判定是否对应进行逗号的添加，通过判断所述目标文本中相邻所述特征词之间是否存在并列关系，以判定是否对应进行顿号的添加；

步骤S71，当判断到相邻所述文本语句的句式之间存在并列关系时，则在相邻所述文本语句之间添加分号；当判断到所述文本语句内存在专有词时，对所述专有词添加引号；

其中，通过判断相邻所述文本语句的句式之间是否存在并列关系，以判定是否进行分号的添加，通过判断所述文本语句内是否存在专有词，以判定是否进行引号的添加；

步骤S81，当判断到所述文本语句为解释说明书语句时，则在所述文本语句的末端添加冒号；当判断到所述文本语句为疑问句时，则在所述文本语句的末端添加问号；

其中，通过判断所述文本语句是否为解释说明语句，以判定是否对应进行冒号的添加，通过判断所述文本语句是否为疑问句，以判定是否对应进行问号的添加；

具体的，该步骤中，判断所述文本语句是否为解释说明语句的步骤包括：

若是，则判断订所述文本语句为所述解释说明语句；

步骤S91，当判断到所述文本语句为所述感叹句时，则在所述文本语句的末端添加感叹号；当判断到所述文本语句为陈述句时，则在所述陈述句的末端添加句号；

其中，通过判断所述文本语句是否为感叹句，以判定是否对应进行感叹号的添加，通过判断所述文本语句是否为陈述句，以判定是否对应进行句号的添加；

当步骤S31判断到所述目标文本未断句正确，或步骤S41中所述标注结果与所述语言表达习惯未匹配成功时，执行步骤S101；

步骤S101，根据所述语言表达习惯对所述目标文本进行标点符号修正，通过停顿检测结果进行断句，并输出所述目标文本；

首先，根据停顿标记前后句子结构，判断停顿处是否为两个句子；

若是，则依据规则对前后句子进行标点符号的添加，并确定句子之间是否为并列等关系。

否则，判断是否为解释说明等句式，若是则对后段语句进行标点符号添加；

否则，作为单独一个句子进行标点符号添加，依据规则相应添加逗号、顿号、破折号等符号。

实施例三

请参阅图3，是本发明第三实施例提供的标点符号添加系统100的结构示意图，包括：语音识别模块10、特征标记模块11、第一标点添加模块12和第二标点添加模块13，其中：

语音识别模块10，用于获取待识别语音，并对所述待识别语音进行语音识别，以得到目标文本。

其中，所述语音识别模块10还用于：对所述待识别语音进行音素识别，以得到音素数据；对所述音素数据进行解码，以得到所述目标文本。

特征标记模块11，用于对所述目标文本进行特征词的提取和标注，并将所述特征词的标注结果与本地预存储的语言表达习惯进行匹配，所述特征词包括名词、动词、状态词、程度词和辅助词，所述语言表达习惯的类型包括：主语+谓语+宾语；主语+谓语；谓语+宾语；宾补；状补。

第一标点添加模块12，用于当所述标注结果与所述语言表达习惯匹配成功时，对提取后的所述目标文本进行修正条件的判断，根据判断结果对所述目标文本进行标点符号修正，并输出所述目标文本。

其中，所述第一标点添加模块12还用于：判断所述目标文本中的文本语句内是否存在停顿；当判断到所述文本语句内存在停顿时，则在停顿对应位置添加逗号；判断所述目标文本中相邻所述特征词之间是否存在并列关系；当判断到相邻所述特征词之间存在并列关系时，则在相邻所述特征词之间添加顿号；判断相邻所述文本语句的句式之间是否存在并列关系；当判断到相邻所述文本语句的句式之间存在并列关系时，则在相邻所述文本语句之间添加分号；判断所述文本语句内是否存在专有词；当判断到所述文本语句内存在所述专有词时，对所述专有词添加引号。

优选的，所述第一标点添加模块12还用于：判断所述文本语句是否为解释说明语句；当判断到所述文本语句为所述解释说明书语句时，则在所述文本语句的末端添加冒号；判断所述文本语句是否为疑问句；当判断到所述文本语句为疑问句时，则在所述文本语句的末端添加问号；判断所述文本语句是否为感叹句；当判断到所述文本语句为所述感叹句时，则在所述文本语句的末端添加感叹号；判断所述文本语句是否为陈述句；当判断到所述文本语句为所述陈述句时，则在所述陈述句的末端添加句号。

此外，所述第一标点添加模块12还用于：判断所述文本语句的后段语句结构是否为名词+主语+谓语结构；若是，则判断订所述文本语句为所述解释说明语句。

第二标点添加模块13，用于当所述标注结果与所述语言表达习惯未匹配成功时，根据所述语言表达习惯对所述目标文本进行标点符号修正，并输出所述目标文本。

优选的，所述标点符号添加系统100还包括：

停顿检测模块14，用于对所述目标文本进行停顿检测，并根据检测结果和所述语言表达习惯判断所述目标文本是否断句正确；当判断到所述目标文本断句正确时，则触发所述标注结果与所述语言表达习惯之间的匹配；当判断到所述目标文本断句未正确时，则直接对所述目标文本进行所述修正条件的判断，并根据判断结果对所述目标文本进行标点符号添加。

实施例四

请参阅图4，是本发明第四实施例提供的移动终端101，包括存储设备以及处理器，所述存储设备用于存储计算机程序，所述处理器运行所述计算机程序以使所述移动终端101执行上述的标点符号添加方法。

本实施例还提供了一种存储介质，其上存储有上述移动终端101中所使用的计算机程序，该程序在执行时，包括如下步骤：

当所述标注结果与所述语言表达习惯未匹配成功时，根据所述语言表达习惯对所述目标文本进行标点符号修正，并输出所述目标文本。所述的存储介质，如：ROM/RAM、磁碟、光盘等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元或模块完成，即将存储装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施方式中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。

本领域技术人员可以理解，图3中示出的组成结构并不构成对本发明的标点符号添加系统的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，而图1-2中的标点符号添加方法亦采用图3中所示的更多或更少的部件，或者组合某些部件，或者不同的部件布置来实现。本发明所称的单元、模块等是指一种能够被所述目标标点符号添加系统中的处理器(图未示)所执行并功能够完成特定功能的一系列计算机程序，其均可存储于所述目标标点符号添加系统的存储设备(图未示)内。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种标点符号添加方法，其特征在于，所述方法包括：

2.如权利要求1所述的标点符号添加方法，其特征在于，所述将所述特征词的标注结果与本地预存储的语言表达习惯进行匹配的步骤之前，所述方法还包括：

3.如权利要求1所述的标点符号添加方法，其特征在于，所述对提取后的所述目标文本进行修正条件的判断的步骤包括：

判断所述目标文本中的文本语句内是否存在停顿；

判断相邻所述文本语句的句式之间是否存在并列关系；

判断所述文本语句内是否存在专有词；

4.如权利要求3所述的标点符号添加方法，其特征在于，所述对提取后的所述目标文本进行修正条件的判断的步骤还包括：

判断所述文本语句是否为解释说明语句；

判断所述文本语句是否为疑问句；

判断所述文本语句是否为感叹句；

判断所述文本语句是否为陈述句；

5.如权利要求4所述的标点符号添加方法，其特征在于，所述判断所述文本语句是否为解释说明语句的步骤包括：

若是，则判断所述文本语句为所述解释说明语句。

6.如权利要求1所述的标点符号添加方法，其特征在于，所述对所述待识别语音进行语音识别的步骤包括：

对所述待识别语音进行音素识别，以得到音素数据；

对所述音素数据进行解码，以得到所述目标文本。

7.一种标点符号添加系统，其特征在于，所述系统包括：

8.如权利要求7所述的标点符号添加系统，其特征在于，所述标点符号添加系统还包括：

9.一种移动终端，其特征在于，包括存储设备以及处理器，所述存储设备用于存储计算机程序，所述处理器运行所述计算机程序以使所述移动终端执行根据权利要求1至6任一项所述的标点符号添加方法。

10.一种存储介质，其特征在于，其存储有权利要求9所述的移动终端中所使用的计算机程序，该计算机程序被处理器执行时实现权利要求1至6任一项所述的标点符号添加方法的步骤。