CN109977412B

CN109977412B - 语音识别文本的字段值纠错方法、装置及存储控制器

Info

Publication number: CN109977412B
Application number: CN201910247910.2A
Authority: CN
Inventors: 陈钊; 赵炜
Original assignee: Beijing Forestry University
Current assignee: Beijing Forestry University
Priority date: 2019-03-29
Filing date: 2019-03-29
Publication date: 2022-12-27
Anticipated expiration: 2039-03-29
Also published as: CN109977412A

Abstract

本发明提供了一种字段值纠错方法、装置、可读介质及存储控制器，该方法包括：确定包括有若干韵母及其算法编码的汉字音形编码规则；确定包括有若干标准字段值及其韵母编码向量的标准字段值集合，字段值的韵母编码向量包括字段值中各汉字的韵母的算法编码；根据汉字音形编码规则确定待纠错字段值的韵母编码向量；根据待纠错字段值及各个具有相同汉字个数的目标标准字段值的韵母编码向量，分别计算待纠错字段值和各个目标标准字段值的韵母相似度；有且仅有一标准字段值，待纠错字段值和该标准字段值的韵母相似度符合相似度条件时，将待纠错字段值纠正为该标准字段值。本方案是基于预设的标准字段值以实现字段值纠错，故能够适用于没有上下文的情况。

Description

语音识别文本的字段值纠错方法、装置及存储控制器

技术领域

本发明涉及计算机技术领域，特别涉及一种字段值纠错方法、装置、可读介质及存储控制器。

背景技术

语音识别的研究是人工智能领域重要的研究分支。语音识别技术是实现如何把语音变成机器能理解的文字或命令的技术。比如，用户输入语音后，基于语音识别技术，可以对语音进行识别以将其转换为文字。但是，初步转换出的文字所代表的意思，可能与用户的本意存在一定差距，故可以将初步转换出的文字进行进一步地纠错处理，并将纠错后的文字展示给用户，以提高语音与文字间的转换准确率。

目前语音识别后的文本纠错技术，大多数聚焦于借助于上下文的文本纠错技术。

不过，这一纠错实现方式不适用于没有上下文的情况。比如，在林业应用领域，户外工作人员需要当场往手机中输入树种名时，由于手动输入较为不便，故易选择语音输入树种名，但转换出的结果大多差强人意。

发明内容

本发明提供了一种字段值纠错方法、装置、可读介质及存储控制器，能够适用于没有上下文的情况。

为了达到上述目的，本发明是通过如下技术方案实现的：

第一方面，本发明提供了一种字段值纠错方法，确定预设的汉字音形编码规则，所述汉字音形编码规则包括至少一个韵母，以及每一个所述韵母的算法编码；

确定预设的标准字段值集合，所述标准字段值集合包括至少一个标准字段值，以及每一个所述标准字段值的韵母编码向量，其中，字段值的韵母编码向量包括字段值中每一个汉字的韵母的算法编码；

还包括：

获取待纠错字段值；

根据所述汉字音形编码规则，确定所述待纠错字段值的韵母编码向量；

根据所述待纠错字段值的韵母编码向量和各个目标标准字段值的韵母编码向量，分别计算所述待纠错字段值和各个所述目标标准字段值的韵母相似度，所述目标标准字段值的汉字个数等于所述待纠错字段值的汉字个数；

判断全部所述目标标准字段值中是否有且仅有一个第一标准字段值，所述待纠错字段值和所述第一标准字段值的韵母相似度符合预设的相似度条件，若是，将所述待纠错字段值纠正为所述第一标准字段值。

进一步地，所述汉字音形编码规则还包括至少一个声母，以及每一个所述声母的算法编码；

所述标准字段值集合还包括每一个所述标准字段值的声母韵母编码向量，其中，字段值的声母编码向量包括字段值中每一个汉字的声母的算法编码，字段值的声母韵母编码向量包括字段值的韵母编码向量和字段值的声母编码向量；

在所述判断全部所述目标标准字段值中是否有且仅有一个第一标准字段值之后，进一步包括：

若否，根据所述汉字音形编码规则，确定所述待纠错字段值的声母韵母编码向量；

根据所述待纠错字段值的声母韵母编码向量和各个所述目标标准字段值的声母韵母编码向量，分别计算所述待纠错字段值和各个所述目标标准字段值的声母韵母相似度；

根据第二标准字段值对所述待纠错字段值进行纠错，所述待纠错字段值和所述第二标准字段值的声母韵母相似度不小于任一其他所述声母韵母相似度。

进一步地，字段值的汉字个数小于预设个数时，字段值的韵母编码向量还包括：排序在后的一定数量的0值算法编码，以使韵母编码向量的算法编码个数等于所述预设个数；

字段值的汉字个数小于所述预设个数时，字段值的声母编码向量还包括：排序在后的一定数量的0值算法编码，以使声母编码向量的算法编码个数等于所述预设个数；

其中，所述预设个数为所述标准字段值集合中第三标准字段值的汉字个数，所述第三标准字段值的汉字个数不小于任一其他所述标准字段值的汉字个数。

进一步地，所述相似度条件包括：韵母相似度为1；

所述分别计算所述待纠错字段值和各个目标标准字段值的韵母相似度，包括：利用公式一，分别计算所述待纠错字段值和各个目标标准字段值的韵母相似度；

所述分别计算所述待纠错字段值和各个所述目标标准字段值的声母韵母相似度，包括：利用公式二，分别计算所述待纠错字段值和各个所述目标标准字段值的声母韵母相似度；

所述公式一包括：

所述公式二包括：

其中，对于全部所述目标标准字段值中的任一第四标准字段值，S₁为所述待纠错字段值和所述第四标准字段值的韵母相似度，A_i为所述第四标准字段值的韵母编码向量中的第i个算法编码，B_i为所述待纠错字段值的韵母编码向量中的第i个算法编码，n为所述预设个数，S₂为所述待纠错字段值和所述第四标准字段值的声母韵母相似度，C_j为所述第四标准字段值的声母韵母编码向量中的第j个算法编码，D_j为所述待纠错字段值的声母韵母编码向量中的第j个算法编码。

进一步地，在所述将所述待纠错字段值纠正为所述第一标准字段值之后，进一步包括：展示所述第一标准字段值；

以及，所述根据第二标准字段值对所述待纠错字段值进行纠错，包括：将所述待纠错字段值纠正为所述第二标准字段值，并展示所述第二标准字段值。

以及，所述根据第二标准字段值对所述待纠错字段值进行纠错，包括：

判断所述待纠错字段值和所述第二标准字段值的声母韵母相似度，是否不小于预设的相似度阈值；

若是，将所述待纠错字段值纠正为所述第二标准字段值，展示所述第二标准字段值，并结束当前流程；

若否，展示至少两个第五标准字段值，所述待纠错字段值和任一所述第五标准字段值的声母韵母相似度不小于任一其他所述声母韵母相似度；在监测到外部针对一所述第五标准字段值的触发操作时，将所述待纠错字段值纠正为该第五标准字段值并展示该第五标准字段值。

进一步地，对于所述至少一个声母中的任一第一声母和任一第二声母，基于预先获得的声母间关联程度试验结果，所述第一声母的第一算法编码和所述第二声母的第二算法编码满足：

所述第一声母和所述第二声母的关联程度为关联时，所述第一算法编码和所述第二算法编码的差值不大于第一数值；

所述第一声母和所述第二声母的关联程度为不关联时，所述第一算法编码和所述第二算法编码的差值不小于第二数值；

所述第一数值小于所述第二数值。

进一步地，对于所述至少一个韵母中的任一第一韵母和任一第二韵母，基于预先获得的韵母间关联程度试验结果，所述第一韵母的第三算法编码和所述第二韵母的第四算法编码满足：

所述第一韵母和所述第二韵母的关联程度为紧密关联时，所述第三算法编码和所述第四算法编码的差值不大于第三数值；

所述第一韵母和所述第二韵母的关联程度为轻度关联时，所述第三算法编码和所述第四算法编码的差值大于所述第三数值但不大于第四数值；

所述第一韵母和所述第二韵母的关联程度为不关联时，所述第三算法编码和所述第四算法编码的差值不小于第五数值；

所述第三数值小于所述第四数值，所述第四数值小于所述第五数值。

进一步地，所述获取待纠错字段值，包括：

接收外部输入的语音，并利用预设的语音识别引擎将所述语音转换为字段值，以作为待纠错字段值。

进一步地，所述获取待纠错字段值，包括：

接收外部输入的字段值，以作为待纠错字段值。

第二方面，本发明提供了一种执行上述任一所述字段值纠错方法的字段值纠错装置，包括：

确定单元，用于确定预设的汉字音形编码规则，所述汉字音形编码规则包括至少一个韵母，以及每一个所述韵母的算法编码；以及，确定预设的标准字段值集合，所述标准字段值集合包括至少一个标准字段值，以及每一个所述标准字段值的韵母编码向量，其中，字段值的韵母编码向量包括字段值中每一个汉字的韵母的算法编码；

获取单元，用于获取待纠错字段值；

编码向量确定单元，用于根据所述汉字音形编码规则，确定所述待纠错字段值的韵母编码向量；

韵母相似度计算单元，用于根据所述待纠错字段值的韵母编码向量和各个目标标准字段值的韵母编码向量，分别计算所述待纠错字段值和各个所述目标标准字段值的韵母相似度，所述目标标准字段值的汉字个数等于所述待纠错字段值的汉字个数；

相似度判断单元，用于判断全部所述标准字段值中是否有且仅有一个第一标准字段值，所述待纠错字段值和所述第一标准字段值的韵母相似度符合预设的相似度条件，若是，触发纠错单元；

所述纠错单元，用于将所述待纠错字段值纠正为所述第一标准字段值。

第三方面，本发明提供了一种可读介质，包括执行指令，当存储控制器的处理器执行所述执行指令时，所述存储控制器执行上述任一所述的字段值纠错方法。

第四方面，本发明提供了一种存储控制器，其特征在于，包括：处理器、存储器和总线；

所述存储器用于存储执行指令，所述处理器与所述存储器通过所述总线连接，当所述存储控制器运行时，所述处理器执行所述存储器存储的所述执行指令，以使所述存储控制器执行上述任一所述的字段值纠错方法。

本发明提供了一种字段值纠错方法、装置、可读介质及存储控制器，该方法包括：确定包括有若干韵母及其算法编码的汉字音形编码规则；确定包括有若干标准字段值及其韵母编码向量的标准字段值集合，字段值的韵母编码向量包括字段值中各汉字的韵母的算法编码；根据汉字音形编码规则，确定待纠错字段值的韵母编码向量；根据待纠错字段值及各个目标标准字段值的韵母编码向量，分别计算待纠错字段值和各个目标标准字段值的韵母相似度，目标标准字段值和待纠错字段值的汉字个数相等；有且仅有一标准字段值，待纠错字段值和该标准字段值的韵母相似度符合相似度条件时，将待纠错字段值纠正为该标准字段值。本发明是基于预设的标准字段值以实现字段值纠错，故能够适用于没有上下文的情况。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的一种字段值纠错方法的流程图；

图2是本发明一实施例提供的另一种字段值纠错方法的流程图；

图3是本发明一实施例提供的一种字段值纠错装置的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例提供了一种字段值纠错方法，可以包括如下步骤：

步骤101：确定预设的汉字音形编码规则，所述汉字音形编码规则包括至少一个韵母，以及每一个所述韵母的算法编码。

步骤102：确定预设的标准字段值集合，所述标准字段值集合包括至少一个标准字段值，以及每一个所述标准字段值的韵母编码向量，其中，字段值的韵母编码向量包括字段值中每一个汉字的韵母的算法编码。

步骤103：获取待纠错字段值。

步骤104：根据所述汉字音形编码规则，确定所述待纠错字段值的韵母编码向量。

步骤105：根据所述待纠错字段值的韵母编码向量和各个目标标准字段值的韵母编码向量，分别计算所述待纠错字段值和各个所述目标标准字段值的韵母相似度，所述目标标准字段值的汉字个数等于所述待纠错字段值的汉字个数。

步骤106：判断全部所述目标标准字段值中是否有且仅有一个第一标准字段值，所述待纠错字段值和所述第一标准字段值的韵母相似度符合预设的相似度条件，若是，将所述待纠错字段值纠正为所述第一标准字段值。

本发明实施例提供了一种字段值纠错方法，该方法包括：确定包括有若干韵母及其算法编码的汉字音形编码规则；确定包括有若干标准字段值及其韵母编码向量的标准字段值集合，字段值的韵母编码向量包括字段值中各汉字的韵母的算法编码；根据汉字音形编码规则，确定待纠错字段值的韵母编码向量；根据待纠错字段值及各个目标标准字段值的韵母编码向量，分别计算待纠错字段值和各个目标标准字段值的韵母相似度，目标标准字段值和待纠错字段值的汉字个数相等；有且仅有一标准字段值，待纠错字段值和该标准字段值的韵母相似度符合相似度条件时，将待纠错字段值纠正为该标准字段值。本发明实施例是基于预设的标准字段值以实现字段值纠错，故能够适用于没有上下文的情况。

字段，即数据项，每个字段均包含某一专题的信息。比如，通讯录中的联系人姓名、林业数据库中的树种名，以及草本名、灌木名等，均可以为一个个的字段。

举例来说，若字段为“姓名”，该字段可以有多个字段值，比如可以为“张三”、“李四”这样的字段值；若字段为“体重”，该字段同样可以有多个字段值，比如可以为“60”、“70”这样的字段值。

再比如，针对“草本名”这一字段，“铁杆蒿”、“菅草”即可以为两个不同的标准字段值。以“菅草”为例，系统将用户读“菅草”的语音进行语音转换，转换出的文字结果即为待纠错字段值。比如转换出了“尖草”，由于不存在“尖草”这一草本名，故经相似度分析，通常可以将“尖草”这一待纠错字段值纠正为“菅草”这一标准字段值。

通常情况下，韵母的问题远多于声母的问题，故本发明实施例中，可基于韵母编码向量来反映字段值间的相似度。本发明实施例中，是基于待纠错字段值的韵母编码向量与各个目标标准字段值的韵母编码向量，来计算两向量间的相似度，以反映待纠错字段值和各个目标标准字段值的韵母相似度。根据计算出的韵母相似度，即可找出是否存在待纠错字段值可转化成的正确字段值，存在该正确字段值时即可将正确字段值替换掉待纠错字段值，从而完成字段值纠错。

由上述步骤106可知，还可以存在判断结果为否的情况，比如不存在任一满足相似度条件的标准字段值，或者存在至少两个满足相似度条件的标准字段值。如此，可以执行进一步的纠错处理。

基于此，在本发明一个实施例中，为了说明一种不存在上述第一标准字词的情况下，执行进一步纠错处理的可能实现方式，所以，所述汉字音形编码规则还包括至少一个声母，以及每一个所述声母的算法编码；

本发明实施例中，步骤106中的判断结果为否时，说明单纯的依靠韵母，不足以实现准确纠错，故可将声母韵母相结合，以再次根据声母韵母来执行纠错。

请参考上述步骤105，为计算韵母相似度，需要获知待纠错字段值及各目标标准字段值的韵母编码向量。如此，如步骤101所示，首先需要确定一汉字音形编码规则，以及如步骤102所示，还需提前确定标准字段值集合。

本发明一个实施例中，汉字音形编码规则还以规则表的形式存在，且表中罗列有各个声母和韵母。

比如，声母可以有p、m、f、h、t、n、l、r、y、j、q、x、d、b、g、k、z、zh、c、ch、s、sh、w；韵母可以有a、ua、ia、ei、ai、uai、o、an、ian、uan、ang、iang、uang、ao、iao、ou、iu、uo、e、er、u、i、ü、ie、ue、ui、en、un、eng、in、ing、ong、iong。

详细地，设置各个声母和韵母的算法编码之前，可以预先进行声母间关联程度试验及韵母间关联程度试验，并根据试验结果来设置算法编码。比如，各个试验人员可以依次对各个标准字段值发音，经语音识别以转换成字段值后，来分析标准字段值和相应转换出的字段值。

详细地，设置的各个算法编码均为正值。

举例来说，工作人员说“回奶”时因发音不准，转换出的文字为“回来”。因为回奶的拼音为huinai，而回来的拼音为huilai，则可认为声母n和声母l易混淆。两者的混淆次数较多时，可以认为两者间相关联，否则可认为两者间不关联。因此，经这一关联度试验，即可根据获得的试验结果来设置算法编码。

基于上述内容，在本发明一个实施例中，对于所述至少一个声母中的任一第一声母和任一第二声母，基于预先获得的声母间关联程度试验结果，所述第一声母的第一算法编码和所述第二声母的第二算法编码满足：

所述第一数值小于所述第二数值。

通常情况下，算法编码的数值越大，进行相似度计算时，系统处理压力越大，故优选地，两声母不关联时，两者算法编码差值在保证不小于第二数值的前提下，应尽可能的取最小值。

优选地，第一数值可以为2，第二数值可以为6。

比如，首先可以令p的算法编码为1，假设不存在与p关联的声母，故可令另一个声母的算法编码为7，比如令m的算法编码为7。

假设不存在与m关联的声母，故可令另一个声母的算法编码为13，比如令f的算法编码为13。

假设f与h关联，故可令h的算法编码为14。

假设n、l、r均相互关联，故可令n、l、r的算法编码分别为20、21、22。

以此类推，可以设置各个声母的算法编码。

当然，在本发明一个实施例中，在满足上述编码规则的前提下，工作人员还可根据具体的纠错试验结果，对一些算法编码进而进一步地优化调整，以期达到更高的纠错精度。

基于相类似的实现原理，在本发明一个实施例中，对于所述至少一个韵母中的任一第一韵母和任一第二韵母，基于预先获得的韵母间关联程度试验结果，所述第一韵母的第三算法编码和所述第二韵母的第四算法编码满足：

优选地，第三数值可以为1，第四数值可以为3，第五数值可以为6。

由于韵母算法编码的设置思路，可以与上述声母算法编码的设置思路相类似，故本发明实施例在此不做赘述。

如步骤102所示，进行字段值纠错前，还需提前确定标准字段值集合。详细地，可以根据步骤101中的汉字音形编码规则，来确定各个标准字段值的韵母编码向量。

比如，在林业领域，这一标准字段值集合，即可以为树种名数据库，该树种名数据库中包括有林业内已知的每一个树种名，每一个树种名即为一个标准字段值。

通常情况下，不同树种名的汉字个数会有所不同，如此，在本发明一个实施例中，为便于代码编写、数据库存储、规范整理等，可以把所有的韵母编码向量补齐成同一维度的编码向量。当然，在涉及韵母相似度计算和声母韵母相似度计算的实现方案中，同样可以把所有的声母韵母编码向量补齐成同一维度的编码向量。优选地，可以以补零的方式进行同一维度的补充。

比如，在林业领域，最长树种名有9个字，则可以将各个韵母编码向量补齐成9位，即任一韵母编码向量均包括9个算法编码，对应地，可以将各个声母韵母编码向量补齐成18位，即任一声母韵母编码向量均包括18个算法编码。

比如，落叶松的拼音为luoyesong，假设l的算法编码为25，y的算法编码为30，s的算法编码为65，uo的算法编码为25，e的算法编码为31，ong的算法编码为77，如此，落叶松的韵母编码向量可以为(25，31，77，0，0，0，0，0，0)，落叶松的声母韵母编码向量可以为(25，30，65，0，0，0，0，0，0，25，31，77，0，0，0，0，0，0)或(25，31，77，0，0，0，0，0，0，25，30，65，0，0，0，0，0，0)。

当然，字段值的汉字个数为9时，无需补0。

基于上述内容，在本发明一个实施例中，字段值的汉字个数小于预设个数时，字段值的韵母编码向量还包括：排序在后的一定数量的0值算法编码，以使韵母编码向量的算法编码个数等于所述预设个数；

详细地，请参考上述步骤105，在得到韵母编码向量后，即可进行韵母相似度计算。同理，在得到声母韵母编码向量后，即可进行声母韵母相似度计算。

优选地，可以计算两向量的空间余弦相似度，该相似度在(0,1]范围内取值。若两个向量的空间指向相同，即两向量的空间夹角为0，则其余弦相似度为1。其中，两向量指向相同包括两向量完全重合、两向量同指向但不重合这两种情况。由于不同韵母的算法编码不同，不同声母的算法编码不同，故韵母相似度越高，相当于两字段值的韵母相同的可能性越大，声母韵母相似度越高，相当于两字段值的拼音相同的可能性越大。

由于韵母相似度仅对比了韵母，故如果仅存在一个与待纠错字段值韵母一致的标准字段值时，那么该唯一存在的标准字段值即为待纠错字段值的正确值。否则，可进一步计算声母韵母相似度。

基于上述内容，在本发明一个实施例中，为了说明一种基于空间余弦相似度以计算韵母相似度和声母韵母相似度的可能实现方式，所以，所述相似度条件包括：韵母相似度为1；

所述公式一包括：

所述公式二包括：

当然，在本发明其他实施例中，同样可以采用其他相似度计算方式来计算韵母相似度、声母韵母相似度。比如，两字段值越接近，对应地，两韵母编码向量的长度差值应越小，两声母韵母编码向量的长度差值同样应越小。

基于上述内容可知，在进行声母韵母相似度对比后，可以根据计算出的最大声母韵母相似度所对应的标准字段值，即上述第二标准字段值来纠正待纠错字段值。本发明实施例中，根据第二标准字段值来纠正待纠错字段值时，至少可以存在下述两种实现方式：

方式1：将待纠错字段值纠正为第二标准字段值；

方式2：第二标准字段值对应的声母韵母相似度足够大时，将待纠错字段值纠正为第二标准字段值，否则，提供相对较大的若干声母韵母相似度所对应的各个标准字段值，以供用户人为选择，并将待纠错字段值纠正为用户选定的标准字段值。

详细地，对应于上述方式1：

在本发明一个实施例中，在所述将所述待纠错字段值纠正为所述第一标准字段值之后，进一步包括：展示所述第一标准字段值；

通常情况下，用户可以利用手机端的语音录入软件，以录入语音。比如用户想输入“黄杉”这一树种名，故可录入相应语音。假设经语音转换引擎，将语音转换成了“黄山”，则“黄山”即为待纠错语音。经与各个树种名对比后，假设上述第一标准字段值即为“黄杉”，如此，可将“黄山”纠正为“黄杉”，并在手机端展示“黄杉”，以使用户明确自身录入的字段值即为“黄杉”，以达到人为确认的目的。

在另一情况下，经与各个树种名对比后，假设存在“黄杉”和“黄檀”这两个标准字段值，其相应韵母相似度均为1，则需进一步进行声母韵母相似度的计算，以进一步筛除掉“黄檀”这一标准字段值，如此，可将“黄山”纠正为“黄杉”，并在手机端展示“黄杉”。

详细地，对应于上述方式2：

在本发明一个实施例中，这一相似度阈值可以按需设定，比如可以设置为0.9、0.95等数值。

在本发明一个实施例中，系统还可以具有自学习功能。比如，分析待纠错字段值：字段值1时，若在手机端展示了3个标准字段值，且用户点选了其中的一标准字段值：字段值2，故可将字段值1纠正为字段值2并记录。

假设分析又一待纠错字段值：字段值X时，若经两次相似度计算后，若最大声母韵母相似度不大于相似度阈值，故可先进行自学习，假设字段值X与字段值1相同，故可直接展示字段值2，若自学习中记录的任一字段值均不与字段值X相同，才执行展示多个标准字段值以使用户人工纠错的实现过程。

基于上述内容，在本发明一个实施例中，所述获取待纠错字段值，包括：接收外部输入的语音，并利用预设的语音识别引擎将所述语音转换为字段值，以作为待纠错字段值。

本发明实施例中，手机端可以安装有一特定应用软件，该应用软件可以执行这一字段值纠错方法。用户打开软件后，即可通过语音录入接口，以录入语音。当然，该应用软件通常还可利用语音转换引擎，以实现语音向字段值的转换，转换出的字段值即被作为待纠错字段值。

详细地，这一语音转换引擎，可以为在安卓移动端平台上内嵌的讯飞语音引擎。

对应地，在本发明一个实施例中，所述获取待纠错字段值，包括：接收外部输入的字段值，以作为待纠错字段值。

基于上述内容，上述应用软件中还可以设置有字段值录入接口，以录入字段值。用户经该字段值录入接口所录入的字段值，即被作为待纠错字段值。因此，本发明实施例中可以适用于语音识别后的文本纠错相关领域。

比如，林业工作人员需要记录一树种名，但不确定自己认为的写法是否正确，故可从字段值录入接口以录入字段值。假设用户需要录入“思茅松”这一树种名，但实际录入的是“思毛松”，故经上述字段值纠错方法，可将“思毛松”纠正为“思茅松”，并通过手机端展示“思茅松”这一树种名的正确写法。

在本发明一个实施例中，在上述步骤103之后、步骤104之前，还可以进一步包括：判断待纠错字段值是否均为汉字，若是，才执行步骤104，否则，可执行异常处理并结束。比如，可直接显示该待纠错字段值，以使用户人工纠错，或者执行相应异常提醒，以使用户再次输入待纠错字段值。

本发明实施例中，上述标准字段值集合可以是针对特定行业和领域的。比如，由于林业领域的树种名通常较为孤僻，使用语音转换引擎将语音转换成文本时，通常不宜得到正确的树种名，还需用户再次人为纠错，降低用户体验。而通过本方法实施例所述的这一字段值纠错方法，在林业领域即可将标准字段值集合设置为林业树种名集合，以缩小应用语境，便于在特定行业准确、快速执行字段值纠错，向用户显示正确字段值，减少用户操作，提高用户工作效率，提高用户体验。

本发明实施例可以用于各类特定的行业内部，只需更改上述标准字段值集合以使其针对所应用的特定行业，即可识别纠错其行业内的、语音引擎识别后的字段值，可移植性强。通过语音引擎来输入数据并进行识别后的字段值纠错，用户只需通过语音即可完成数据的输入工作，故本发明实施例可以方便用户单手操作及大大提高了用户的工作效率，尤其提高了户外用户的工作效率。

如图2所示，本发明实施例提供了另一种字段值纠错方法，可以包括以下步骤：

步骤201：确定预设的汉字音形编码规则，汉字音形编码规则包括至少一个声母和至少一个韵母，以及每一个声母的算法编码、每一个韵母的算法编码。

步骤202：确定预设的标准字段值集合，标准字段值集合包括至少一个标准字段值，以及每一个标准字段值的韵母编码向量和声母韵母编码向量。

本发明实施例中，字段值的韵母编码向量包括字段值中每一个汉字的韵母的算法编码，以及在字段值的汉字个数小于预设个数时，字段值的韵母编码向量还包括排序在后的一定数量的0值算法编码，以使韵母编码向量的算法编码个数等于预设个数。

本发明实施例中，字段值的声母编码向量包括字段值中每一个汉字的声母的算法编码，以及在字段值的汉字个数小于预设个数时，字段值的声母编码向量还包括排序在后的一定数量的0值算法编码，以使声母编码向量的算法编码个数等于预设个数。

本发明实施例中，这一预设个数为标准字段值集合中第三标准字段值的汉字个数，第三标准字段值的汉字个数不小于任一其他标准字段值的汉字个数。

本发明实施例中，字段值的声母韵母编码向量包括字段值的韵母编码向量和字段值的声母编码向量。

步骤203：接收外部输入的语音。

步骤204：利用预设的语音识别引擎将语音转换为字段值，以作为待纠错字段值。

步骤205：根据汉字音形编码规则，确定待纠错字段值的韵母编码向量。

步骤206：根据待纠错字段值的韵母编码向量和各个目标标准字段值的韵母编码向量，利用上述公式一，分别计算待纠错字段值和各个标准字段值的韵母相似度，所述目标标准字段值的汉字个数等于所述待纠错字段值的汉字个数。

步骤207：判断全部目标标准字段值中是否有且仅有一个第一标准字段值，待纠错字段值和第一标准字段值的韵母相似度为1，若是，将待纠错字段值纠正为第一标准字段值并展示第一标准字段值，并结束当前流程，否则，执行步骤208。

步骤208：根据汉字音形编码规则，确定待纠错字段值的声母韵母编码向量。

步骤209：根据待纠错字段值的声母韵母编码向量和各个目标标准字段值的声母韵母编码向量，利用上述公式二，分别计算待纠错字段值和各个目标标准字段值的声母韵母相似度。

步骤210：将待纠错字段值纠正为第二标准字段值，并展示第二标准字段值，其中，待纠错字段值和第二标准字段值的声母韵母相似度不小于任一其他声母韵母相似度。

如图3所示，本发明实施例提供了一种执行上述任一所述字段值纠错方法的字段值纠错装置，可以包括：

确定单元301，用于确定预设的汉字音形编码规则，所述汉字音形编码规则包括至少一个韵母，以及每一个所述韵母的算法编码；以及，确定预设的标准字段值集合，所述标准字段值集合包括至少一个标准字段值，以及每一个所述标准字段值的韵母编码向量，其中，字段值的韵母编码向量包括字段值中每一个汉字的韵母的算法编码；

获取单元302，用于获取待纠错字段值；

编码向量确定单元303，用于根据所述汉字音形编码规则，确定所述待纠错字段值的韵母编码向量；

韵母相似度计算单元304，用于根据所述待纠错字段值的韵母编码向量和各个目标标准字段值的韵母编码向量，分别计算所述待纠错字段值和各个所述目标标准字段值的韵母相似度，所述目标标准字段值的汉字个数等于所述待纠错字段值的汉字个数；

相似度判断单元305，用于判断全部所述标准字段值中是否有且仅有一个第一标准字段值，所述待纠错字段值和所述第一标准字段值的韵母相似度符合预设的相似度条件，若是，触发纠错单元306；

所述纠错单元306，用于将所述待纠错字段值纠正为所述第一标准字段值。

上述装置内的各单元之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

此外，本发明一个实施例提供了一种可读介质，包括执行指令，当存储控制器的处理器执行所述执行指令时，所述存储控制器执行上述任一所述的字段值纠错方法。

此外，本发明一个实施例提供了一种存储控制器，包括：处理器、存储器和总线；

综上所述，本发明的实施例具有至少如下有益效果：

1、本发明实施例中，确定包括有若干韵母及其算法编码的汉字音形编码规则；确定包括有若干标准字段值及其韵母编码向量的标准字段值集合，字段值的韵母编码向量包括字段值中各汉字的韵母的算法编码；根据汉字音形编码规则，确定待纠错字段值的韵母编码向量；根据待纠错字段值及各个目标标准字段值的韵母编码向量，分别计算待纠错字段值和各个目标标准字段值的韵母相似度，目标标准字段值和待纠错字段值的汉字个数相等；有且仅有一标准字段值，待纠错字段值和该标准字段值的韵母相似度符合相似度条件时，将待纠错字段值纠正为该标准字段值。本发明实施例是基于预设的标准字段值以实现字段值纠错，故能够适用于没有上下文的情况。

2、本发明实施例中，上述标准字段值集合可以是针对特定行业和领域的。比如，由于林业领域的树种名通常较为孤僻，使用语音转换引擎将语音转换成文本时，通常不宜得到正确的树种名，还需用户再次人为纠错，降低用户体验。而通过本方法实施例所述的这一字段值纠错方法，在林业领域即可将标准字段值集合设置为林业树种名集合，以缩小应用语境，便于在特定行业准确、快速执行字段值纠错，向用户显示正确字段值，减少用户操作，提高用户工作效率，提高用户体验。

3、本发明实施例可以用于各类特定的行业内部，只需更改上述标准字段值集合以使其针对所应用的特定行业即可，就可识别纠错其行业内的语音引擎识别后的字段值，可移植性强。通过语音引擎来输入数据并进行识别后的字段值纠错，用户只需通过语音即可完成数据的输入工作，故本发明实施例可以方便用户单手操作及大大提高了用户的工作效率，尤其提高了户外用户的工作效率。

需要说明的是，在本文中，诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个······”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储在计算机可读取的存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。

最后需要说明的是：以上所述仅为本发明的较佳实施例，仅用于说明本发明的技术方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种语音识别文本的字段值纠错方法，其特征在于，确定预设的汉字音形编码规则，所述汉字音形编码规则包括至少一个韵母，以及每一个所述韵母的算法编码；

还包括：

获取待纠错字段值；

判断全部所述目标标准字段值中是否有且仅有一个第一标准字段值，所述待纠错字段值和所述第一标准字段值的韵母相似度符合预设的相似度条件，若是，将所述待纠错字段值纠正为所述第一标准字段值；

所述汉字音形编码规则还包括至少一个声母，以及每一个所述声母的算法编码；

2.根据权利要求1所述的方法，其特征在于，

字段值的汉字个数小于预设个数时，字段值的韵母编码向量还包括：排序在后的一定数量的0值算法编码，以使韵母编码向量的算法编码个数等于所述预设个数；

3.根据权利要求2所述的方法，其特征在于，

所述相似度条件包括：韵母相似度为1；

所述公式一包括：

所述公式二包括：

4.根据权利要求1所述的方法，其特征在于，

在所述将所述待纠错字段值纠正为所述第一标准字段值之后，进一步包括：展示所述第一标准字段值；

A1：将所述待纠错字段值纠正为所述第二标准字段值，并展示所述第二标准字段值；

或，

B1：判断所述待纠错字段值和所述第二标准字段值的声母韵母相似度，是否不小于预设的相似度阈值；

5.根据权利要求1所述的方法，其特征在于，

对于所述至少一个声母中的任一第一声母和任一第二声母，基于预先获得的声母间关联程度试验结果，所述第一声母的第一算法编码和所述第二声母的第二算法编码满足：

所述第一数值小于所述第二数值；

和/或，

对于所述至少一个韵母中的任一第一韵母和任一第二韵母，基于预先获得的韵母间关联程度试验结果，所述第一韵母的第三算法编码和所述第二韵母的第四算法编码满足：

6.根据权利要求1至5中任一所述的方法，其特征在于，

所述获取待纠错字段值，包括：

接收外部输入的语音，并利用预设的语音识别引擎将所述语音转换为字段值，以作为待纠错字段值；

或，

接收外部输入的字段值，以作为待纠错字段值。

7.一种执行如权利要求1至6中任一所述语音识别文本的字段值纠错方法的语音识别文本的字段值纠错装置，其特征在于，包括：

获取单元，用于获取待纠错字段值；

8.一种可读介质，其特征在于，包括执行指令，当存储控制器的处理器执行所述执行指令时，所述存储控制器执行如权利要求1至6中任一所述语音识别文本的字段值纠错方法。

9.一种存储控制器，其特征在于，包括：处理器、存储器和总线；

所述存储器用于存储执行指令，所述处理器与所述存储器通过所述总线连接，当所述存储控制器运行时，所述处理器执行所述存储器存储的所述执行指令，以使所述存储控制器执行如权利要求1至6中任一所述语音识别文本的字段值纠错方法。