CN116580402A

CN116580402A - 一种词典笔的文本识别方法及装置

Info

Publication number: CN116580402A
Application number: CN202310604317.5A
Authority: CN
Inventors: 詹晓沛; 谢振辉
Original assignee: Readboy Education Technology Co Ltd
Current assignee: Readboy Education Technology Co Ltd
Priority date: 2023-05-26
Filing date: 2023-05-26
Publication date: 2023-08-11
Anticipated expiration: 2043-05-26

Abstract

本发明涉及文字识别技术领域，尤其涉及一种词典笔的文本识别方法及装置，本发明通过识别词典笔在扫描过程中获取的文本图像内的词语内容，在词语内容与词典笔词库内的信息不能匹配时，对词语内容进行字符信息比对，并判定字符状态，在字符完整状态下确定文本错误，在字符残缺状态下通过识别的完整字符内容与词典笔词库内的信息进行匹配，并判定对残缺字符的处置方式，包括将残缺字符丢弃或确定词语内容的关键字，基于关键字与残余字符的语义关联关系替换残余字符与词典笔词库内的信息进行匹配识别，进而，实现了对文本识别起始点以及终止点处的不完整字符进行丢弃或者识别补全，更好地适用对大密度文本的识别，提高了文本识别的准确率以及效率。

Description

一种词典笔的文本识别方法及装置

技术领域

本发明涉及文字识别技术领域，尤其涉及一种词典笔的文本识别方法及装置。

背景技术

词典笔通过快速扫描识别词汇并进行检索查询的方式正在替代传统字典以及按键式电子词典，满足了人们在工作学习中对于高效的追求，而且，由于词典笔的功能性以及便捷性，受到越来越多学生以及上班族的喜爱，市场应用规模越来越大，采用各种文本识别方法的词典笔层出不穷，在语言翻译以及陌生词汇查询中发挥着越来越重要的作用。

中国专利公开号：CN113642584A，公开了一种文字识别方法，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于光学字符识别OCR等场景，具体实现方案为：获取针对文档连续扫描得到的多个图像序列，基于多个图像序列进行图像拼接，得到对应的多个连续拼接图像帧，其中，两两连续拼接图像帧之间存在重叠区域，基于多个连续拼接图像帧进行文字识别，得到对应的多个识别结果，以及基于多个连续拼接图像帧中两两连续拼接图像帧间的重叠区域，对多个识别结果进行去重处理，得到针对文档的文字识别结果。

可见，现有技术中还存在以下问题；

1、现有技术中未考虑文本识别过程中是人为操作的，大密度文本由于字符间距小，容易在文本识别的起始点以及终止点造成字符识别不完整的问题；

2、现有技术中未考虑识别的残缺字符对文本识别的影响，造成文本识别准确率低，影响文本识别的效率。

发明内容

为解决现有技术中容易在文本识别的起始点以及终止点造成字符识别不完整的问题以及现有技术中未考虑识别的残缺字符对文本识别的影响，造成文本识别准确率低，影响文本识别的效率的问题，本发明提供一种词典笔的文本识别方法，其包括，

步骤S1，获取词典笔在扫描过程中的文本图像，并基于所述文本图像获取所述文本图像内的词语内容，所述词语内容包括文本图像中全部字符轮廓；

步骤S2，将所述词语内容与词典笔词库内的信息进行匹配识别，根据匹配的结果确定词语内容的匹配状态，在第一匹配状态输出识别内容，在第二匹配状态下对词语内容进行字符信息的比对，所述字符信息包括所述词语内容中各字符的字号值；

步骤S3，根据字符信息的比对结果判定所述词语内容的字符状态，在字符完整状态下确定所述词语内容为文本错误，在字符残缺状态下将完整字符内容与所述词典笔词库内的信息进行匹配识别，基于匹配识别结果判定对残缺字符的处置方式；

步骤S4，在第一处置方式下将所述词语内容中的残缺字符丢弃，将剩余字符与词典笔词库内的信息进行匹配识别，在第二处置方式下确定所述词语内容的关键字，并基于所述关键字与残余字符的语义关联关系替换残余字符后，将包含已替换残余字符的词语内容与词典笔词库内的信息进行匹配识别，并输出识别内容。

进一步地，所述步骤S2中，将所述词语内容与所述词典笔词库内的信息进行匹配，根据匹配的结果确定匹配状态，其中，

若所述词语内容与所述词典笔词库内的信息可以匹配，则确定所述匹配状态为第一匹配状态；

若所述词语内容与所述词典笔词库内的信息不可以匹配，则确定所述匹配状态为第二匹配状态。

进一步地，所述步骤S2中，在第二匹配状态下对词语内容进行字符信息比对，其中，

基于所述文本图像获取所述词语内容中各字符字号值，基于字符字号最大值与所述词语内容中各字符的字号值计算字号差值。

进一步地，所述步骤S3中，根据所述字符信息比对结果判定所述词语内容中的字符状态，其中，

将所述字号差值与预设的字号差值阈值进行对比，根据对比结果判定所述词语内容中的字符状态，

若各所述字号差值小于等于所述差值阈值，则判定所述字符状态为字符完整状态；

若存在所述字号差值大于所述差值阈值，则判定所述字符状态为字符残缺状态。

进一步地，所述步骤S3中，在字符残缺状态下通过识别的完整字符内容与所述词典笔词库内的信息进行匹配，根据信息匹配结果判定对残缺字符的处置方式，其中，

若所述完整字符内容与所述词典笔词库内的信息可以匹配，则判定对残缺字符的处置方式为第一处置方式；

若所述完整字符内容与所述词典笔词库内的信息不能匹配，则判定对残缺字符的处置方式为第二处置方式。

进一步地，所述步骤S3中，所述完整字符内容由字号差值小于等于所述字号差值阈值的字符组成，所述残缺字符为字号差值大于所述字号差值阈值的字符。

进一步地，所述步骤S4中，在第二处置方式下确定所述词语内容的关键字，其中，

在所述词语内容中，将与所述残缺字符相邻的完整字符确定为所述关键字。

进一步地，还包括构建语义关联关系，其中，选取所述词典笔词库中任一字符，获取与所述字符构成词语关系的其他字符，将各所述其他字符确定为所述字符的关联字符。

进一步地，所述步骤S4中，基于所述关键字与残余字符的语义关联关系替换残余字符，其中，

确定所述残余字符的偏旁部首以及残余字符的各笔画，获取与所述关键字存在关联关系的全部字符，构建对照字符集合，

将所述对照字符集合中偏旁部首与残余字符的偏旁部首相同的字符筛选出，并按照公式(1)计算残余字符与已筛选出字符的关联度，并将关联度最高的字符替换所述残余字符，

公式(1)中E表示关联度，NE0表示已筛选出字符中笔画的数量，NE表示残余字符与所述已筛选出字符中相同笔画的数量。

进一步地，本发明还提供了一种应用于词典笔的文本识别方法的词典笔装置，包括：

笔体，用于手持；

图像采集模块，其设置在所述笔体一端用以采集所述文本图像；

词库模块，其设置在笔体内部，用以储存字、词语等内容；

处理模组，其设置在所述笔体内与所述词库以及图像采集模块连接，包括识别模块、数据分析模块以及匹配模块，所述识别模块用于识别所述文本图像内的词语内容、字符字号值以及字符轮廓面积，所述数据分析模块用于对所述字符字号值以及字符轮廓面积进行数值对比，所述匹配模块用以将所述图像采集模块采集的信息与所述词库进行匹配比对；

无线模块，其与所述词库连接，用以更新所述词库的内容；

显示模块，其与所述处理模组以及词库连接，用以显示数据分析模块确定的文本错误提示、显示匹配的待检索内容以及显示检索的信息。

与现有技术相比，本发明通过识别词典笔在扫描过程中获取的文本图像内的词语内容，在词语内容与词典笔词库内的信息不能匹配时，对词语内容进行字符信息比对，并判定字符状态，在字符完整状态下确定文本错误，在字符残缺状态下通过识别的完整字符内容与词典笔词库内的信息进行匹配，并判定对残缺字符的处置方式，在第一处置方式下将残缺字符丢弃，在第二处置方式下确定词语内容的关键字，基于关键字与残余字符的语义关联关系替换残余字符与词典笔词库内的信息进行匹配识别，进而，实现了对文本识别起始点以及终止点处的不完整字符进行丢弃或者识别补全，更好地适用对大密度文本的识别，提高了文本识别的准确率以及效率。

尤其，本发明通过识别的词语内容与词典笔词库内的信息进行匹配，根据匹配的结果确定匹配状态，在实际情况中，对文本识别的起始点以及终止点可能有不完整的字符被扫描识别，干扰文字识别的准确性，在识别的内容与词典笔词库内的信息可以匹配时，识别的内容是完整的，在识别的内容与词典笔词库内的信息不能匹配时，识别的内容是有残缺字符的，本发明根据匹配的结果区分了词语内容的匹配状态，便于对不同匹配状态的词语内容进行进一步的识别判断。

尤其，本发明在第二匹配状态下对词语内容进行字符信息比对，并根据字符信息的比对结果判定词语内容中的字符状态，在实际情况中，若词语内容无法直接与词库内的信息进行匹配的情况下，可以根据识别的各字符的字号值与最大字号值进行对比，如果各字号值的差值没有超过设定的差值阈值，则各字符没有残缺的字符但不能被匹配，这种情况可以判定为文本错误，如果各字号值的差值超过了设定的差值阈值，则词语内容中存在明显残缺的字符，这种情况需要对残缺字符做进一步的判定，进而，更加细致地区分了不能匹配的词语内容的情况，提高了文本识别的准确率。

尤其，本发明在字符残缺状态下通过识别的完整字符内容与所述词典笔词库内的信息进行匹配，根据信息匹配结果判定对残缺字符的处置方式，在实际情况中，扫描到的残缺字符可能是多余的字符，也可能是待检索文本中的字符的一部分，可以根据识别到的完整字符内容与词典笔词库进行匹配，若能匹配，则扫描的文本内容是完整的，可将多余的残缺字符丢弃，若不能匹配，则扫描的文本内容是不完整的，需要将残缺的字符进行补充替换并加入扫描文本中，进而，实现了对文本识别起始点以及终止点处的不完整字符进行丢弃或者补全的逻辑判定，提高了文本识别的准确率。

尤其，本发明在需要对残缺字符进行识别时，基于所述关键字与残余字符的语义关联关系替换残余字符后，将包含已替换残余字符的词语内容与词典笔词库内的信息进行匹配识别，并输出识别内容，在实际情况中，残缺字符可以能完整字符所构成词语的一部分，所以更加关键字与参与字符的语义关联关系结合偏旁部首以及笔画数较为准确的预设残余字符的实际完整字符内容，进而，实现了对文本识别起始点以及终止点处的不完整字符进行丢弃或者识别补全，更好地适用对大密度文本的识别，提高了文本识别的准确率以及效率。

附图说明

图1为本发明实施例的词典笔的文本识别方法的步骤示意图；

图2为本发明实施例的词典笔的文本识别方法的流程示意图。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明做进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

需要说明的是，在本发明的描述中，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系，这仅仅是为了便于描述，而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体的连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

请参阅图1以及图2所示，图1为本发明实施例的词典笔的文本识别方法的步骤示意图，图2为本发明实施例的词典笔的文本识别方法的流程示意图，本发明的一种词典笔的文本识别方法包括：

具体而言，本发明对识别文本图像中字符轮廓面积的具体方式不做限定，其可以是通过预先训练的能够识别文字轮廓以及轮廓面积的模型，相关的识别算法以及计算模型为现有成熟技术，此处不再赘述。

具体而言，进行匹配识别时基于字符轮廓识别字符内容，将字符内容构成的文字组合与词典笔词库中的词语进行对比，若词典笔词库中存在与所述文字组合相同的词语则判定匹配，若词典笔词库中不存在与所述文字组合相同的词语则判定不匹配。

具体而言，词典笔词库可以为基于开源词典语料数据库构建所得，此为现有技术，不再赘述。

具体而言，所述步骤S2中，将所述词语内容与所述词典笔词库内的信息进行匹配，根据匹配的结果确定匹配状态，其中，

具体而言，本发明通过识别的词语内容与词典笔词库内的信息进行匹配，根据匹配的结果确定匹配状态，在实际情况中，对文本识别的起始点以及终止点可能有不完整的字符被扫描识别，干扰文字识别的准确性，在识别的内容与词典笔词库内的信息可以匹配时，识别的内容是完整的，在识别的内容与词典笔词库内的信息不能匹配时，识别的内容是有残缺字符的，本发明根据匹配的结果区分了词语内容的匹配状态，便于对不同匹配状态的词语内容进行进一步的识别判断。

具体而言，所述步骤S2中，在第二匹配状态下对词语内容进行字符信息比对，其中，

基于所述文本图像获取所述词语内容中各字符字号值，基于字符字号最大值Tmax与所述词语内容中各字符的字号值计算字号差值T。

具体而言，所述步骤S3中，根据所述字符信息比对结果判定所述词语内容中的字符状态，其中，

将所述字号差值T与预设的字号差值阈值T0进行对比，根据对比结果判定所述词语内容中的字符状态，

若各所述字号差值T小于等于所述差值阈值T0，则判定所述字符状态为字符完整状态；

若存在所述字号差值T大于所述差值阈值T0，则判定所述字符状态为字符残缺状态。

具体而言，本领域技术人员应当明白，上述判定过程中，字号差值能够表征各字符的字号的大小关系，预设字号差值阈值T0的目的在于区分各字符的字号是否存在明显区别，进而，判断字符的状态是完整的还是残缺的，作为可实施的具体方式，优选的，可以预设字号差值阈值T0＝0.1×Tmax，预设字号差值阈值T0的值既要区分出残缺的字符，也要避免各字符的微弱误差造成误识别的问题，本领域技术人员可以根据这一设定逻辑对字号差值阈值T0进行设定。

具体而言，本发明在第二匹配状态下对词语内容进行字符信息比对，并根据字符信息的比对结果判定词语内容中的字符状态，在实际情况中，若词语内容无法直接与词库内的信息进行匹配的情况下，可以根据识别的各字符的字号值与最大字号值进行对比，如果各字号值的差值没有超过设定的差值阈值，则各字符没有残缺的字符但不能被匹配，这种情况可以判定为文本错误，如果各字号值的差值超过了设定的差值阈值，则词语内容中存在明显残缺的字符，这种情况需要对残缺字符做进一步的判定，进而，更加细致地区分了不能匹配的词语内容的情况，提高了文本识别的准确率。

具体而言，所述步骤S3中，在字符残缺状态下通过识别的完整字符内容与所述词典笔词库内的信息进行匹配，根据信息匹配结果判定对残缺字符的处置方式，其中，

具体而言，本发明在字符残缺状态下通过识别的完整字符内容与所述词典笔词库内的信息进行匹配，根据信息匹配结果判定对残缺字符的处置方式，在实际情况中，扫描到的残缺字符可能是多余的字符，也可能是待检索文本中的字符的一部分，可以根据识别到的完整字符内容与词典笔词库进行匹配，若能匹配，则扫描的文本内容是完整的，可将多余的残缺字符丢弃，若不能匹配，则扫描的文本内容是不完整的，需要将残缺的字符进行补充替换并加入扫描文本中，进而，实现了对文本识别起始点以及终止点处的不完整字符进行丢弃或者补全的逻辑判定，提高了文本识别的准确率。

具体而言，所述步骤S3中，所述完整字符内容由字号差值T小于等于所述字号差值阈值T0的字符组成，所述残缺字符为字号差值T大于所述字号差值阈值T0的字符。

具体而言，所述步骤S4中，在第二处置方式下确定所述词语内容的关键字，其中，

具体而言，步骤S4中，还包括构建语义关联关系，其中，选取所述词典笔词库中任一字符，获取与所述字符构成词语关系的其他字符，将各所述其他字符确定为所述字符的关联字符。

具体而言，所述步骤S4中，基于所述关键字与残余字符的语义关联关系替换残余字符，其中，

具体而言，本发明在需要对残缺字符进行识别时，基于所述关键字与残余字符的语义关联关系替换残余字符后，将包含已替换残余字符的词语内容与词典笔词库内的信息进行匹配识别，并输出识别内容，在实际情况中，残缺字符可以能完整字符所构成词语的一部分，所以更加关键字与参与字符的语义关联关系结合偏旁部首以及笔画数较为准确的预设残余字符的实际完整字符内容，进而，实现了对文本识别起始点以及终止点处的不完整字符进行丢弃或者识别补全，更好地适用对大密度文本的识别，提高了文本识别的准确率以及效率。

具体而言，本发明还提供了一种应用于词典笔的文本识别方法的词典笔装置，包括：

笔体，用于手持；

词库模块，其设置在笔体内部，用以储存字、词语等内容；

无线模块，其与所述词库连接，用以更新所述词库的内容；

具体而言，本发明对图像采集模块的具体结构不作限定，只需能满足对应的图像采集要求即可，在本实施例中图像采集单元可以为一个高精度摄像头采集扫描区域文本图像，以完成对扫描内容的高精度采集，其为现有技术此处不再赘述。

具体而言，本发明对处理模组的具体结构不作限定，其本身或其中的各模块可使用逻辑部件构成，逻辑部件可以为现场可编程逻辑部件、微处理器、计算机中使用的处理器等，此处不再赘述。

具体而言，本发明对显示模块的具体结构不作限定，只需能够显示处理模组发出的信息即可，在本实施例中显示模块可以为LCD显示器，以显示词典笔的提示信息以及检索信息，其为现有技术此处不再赘述。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述仅为本发明的优选实施例，并不用于限制本发明；对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种词典笔的文本识别方法，其特征在于，包括：

2.根据权利要求1所述的词典笔的文本识别方法，其特征在于，所述步骤S2中，将所述词语内容与所述词典笔词库内的信息进行匹配，根据匹配的结果确定匹配状态，其中，

3.根据权利要求1所述的词典笔的文本识别方法，其特征在于，所述步骤S2中，在第二匹配状态下对词语内容进行字符信息比对，其中，

4.根据权利要求3所述的词典笔的文本识别方法，其特征在于，所述步骤S3中，根据所述字符信息比对结果判定所述词语内容的字符状态，其中，

5.根据权利要求1所述的词典笔的文本识别方法，其特征在于，所述步骤S3中，在字符残缺状态下通过识别的完整字符内容与所述词典笔词库内的信息进行匹配，根据信息匹配结果判定对残缺字符的处置方式，其中，

6.根据权利要求5所述的词典笔的文本识别方法，其特征在于，所述步骤S3中，所述完整字符内容由字号差值小于等于所述字号差值阈值的字符组成，所述残缺字符为字号差值大于所述字号差值阈值的字符。

7.根据权利要求1所述的词典笔的文本识别方法，其特征在于，所述步骤S4中，在第二处置方式下确定所述词语内容的关键字，其中，

8.根据权利要求7所述的词典笔的文本识别方法，其特征在于，所述步骤S4中，还包括构建语义关联关系，其中，选取所述词典笔词库中任一字符，获取与所述字符构成词语关系的其他字符，将各所述其他字符确定为所述字符的关联字符。

9.根据权利要求8所述的词典笔的文本识别方法，其特征在于，所述步骤S4中，基于所述关键字与残余字符的语义关联关系替换残余字符，其中，

10.一种词典笔装置，适用于根据权利要求1-9任一项所述词典笔的文本识别方法，其特征在于，包括：

笔体，用于手持；

词库模块，其设置在笔体内部，用以储存字、词语等内容；

无线模块，其与所述词库连接，用以更新所述词库的内容；