CN113885711A

CN113885711A - 一种字符输入方法及装置

Info

Publication number: CN113885711A
Application number: CN202111144506.6A
Authority: CN
Inventors: 冯志全
Original assignee: University of Jinan
Current assignee: University of Jinan
Priority date: 2021-09-28
Filing date: 2021-09-28
Publication date: 2022-01-04

Abstract

本发明提供了一种字符输入方法及装置，所述的方法包括：S1：选择需要识别的字符样本；S2：在字符样本处设置标记符；S3：基于标记符识别字符样本。所述的装置包括：标记模块，用于设置标记符；识别模块，用于基于标记符识别字符样本。本发明通过设置标记符，基于标记符缺分待识别的字符样本，实现对指定字符的精准识别。

Description

一种字符输入方法及装置

技术领域

本发明涉及字符识别技术领域，具体涉及一种字符输入方法及装置。

背景技术

字符识别(Optical Character Recognise，OCR)技术是指用于对纸上的印刷及打印文字字符进行识别，将识别结果以文本方式存储在计算机器中。OCR已经逐步进入了人们日常学习、生活、工作等各个应用领域，目前的印刷及打印文字字符识别软件及设备能阅读各类中西文字符，且准确率可达90％以上。

在现有的字符识别技术中，对于训练阶段的字符输入，一般采用单独印刷或打印的方式，即将需要识别的对象按照一定的间隔印刷或打印到纸面上，将整个纸面作为识别对象进行读入，然后再进行下一步的训练和学习。

然而，针对一张写满字符的纸张时，有时仅需要输入其中几个不相邻的字符，但是现有技术中却无法有效区分哪些属于需要识别的字符，哪些属于不需要识别的字符，如果全部识别，则会造成重复或无效的训练，造成资源的浪费。

发明内容

为了解决上述问题，本申请提供了一种字符输入方法及装置，通过标记符实现对指定字符的精准识别。

本发明公开了如下技术方案：

本发明实施例提供了一种字符输入方法，所述的方法包括：

S1：选择需要识别的字符样本；

S2：在字符样本处设置标记符；

S3：基于标记符识别字符样本。

进一步的，步骤S1中，需要识别的字符样本为单个字符或多个字符的组合。

进一步的，步骤S1中，字符样本可以为一组或多组。

进一步的，步骤S2中，当需要识别的字符样本为多个字符的组合时，组成该字符样本的每个字符处均设置一个标记符。

优选的，步骤S2中，当字符样本为多组时，为了区分不同组的字符样本，不同组的字符样本采用不同的标记符，同一组字符样本内的字符采用同一种标记符。

进一步的，步骤S2中，一种设置标记符的方法为：按照||P,C||≤ρ在C的外围进行标记以产生标记字符，其中，C是字符的最大外接圆，P是标记符的重心位置，||P,C||表示P与C之间的最小欧式距离，ρ是一个阈值，其取值范围一般在[0mm,10mm]的范围内。

进一步的，步骤S3中，当字符样本包含多个字符时，根据标记符的形态自动将字符合并为完整的字符样本。

为了实现上述的字符输入方法，本申请还提供了一种字符输入装置，所述的装置包括：

标记模块，用于设置标记符；

识别模块，用于基于标记符识别字符样本。

进一步的，标记模块设置标记符的方法为：按照||P,C||≤ρ在C的外围进行标记以产生标记字符，其中，C是字符的最大外接圆，P是标记符的重心位置，||P,C||表示P与C之间的最小欧式距离，ρ是一个阈值，其取值范围一般在[0mm,10mm]的范围内。

本发明的有益效果：

相比于现有技术中的字符输入法，本申请通过设置标记符，可以精准识别标记符所对应的待识别字符，可以选择性的从全部字符中精准识别需要识别的字符。

对于多组不同的字符样本，基于标记符的不同形状，本申请可有效区分，因此能够同时全部识别，提高了输入的效率。而且，由于标记符的形状任意定义，因此可以标记的字符样本数量理论上没有上限。

附图说明

图1为本发明方法实施例的流程图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。本领域技术人员应当知晓，下述具体实施例或具体实施方式，是本发明为进一步解释具体的发明内容而列举的一系列优化的设置方式，而该些设置方式之间均是可以相互结合或者相互关联使用的，除非在本发明明确提出了其中某些或某一具体实施例或实施方式无法与其他的实施例或实施方式进行关联设置或共同使用。同时，下述的具体实施例或实施方式仅作为最优化的设置方式，而不作为限定本发明的保护范围的理解。

如图1所示，本发明实施例提供了一种字符输入方法，所述的方法包括：

S1：选择需要识别的字符样本，需要识别的字符样本可以是单个字符，例如A；也可以是多个字符的组合，例如A1。

同样的，字符样本可以只有一组，也可以有多组，当有多组时，字符样本没有限制，例如A、B1、CX3。

S2：在字符样本处设置标记符，一种设置标记符的方法为：按照||P,C||≤ρ在C的外围进行标记以产生标记字符，其中，C是字符的最大外接圆，P是标记符的重心位置，||P,C||表示P与C之间的最小欧式距离，ρ是一个阈值，其取值范围一般在[0mm,10mm]的范围内。

上述设置标记符的方法，仅仅定义了标记符与字符之间的位置关系，并没有限定标记符的形状，因此可以随意设计，既可以是普通的√、×等常见字符，也可以任意形状的点、线段、曲线的组合。

需要注意的是，当需要识别的字符样本为多个字符的组合时，组成该字符样本的每个字符处均设置一个标记符。当字符样本为多组时，为了区分不同组的字符样本，不同组的字符样本采用不同的标记符，同一组字符样本内的字符采用同一种标记符。

S3：基于标记符识别字符样本。由于步骤S2设置标记符时，定义了标记符和字符的位置关系，因此基于该位置关系来识别标记符所对应的字符，当字符样本包含多个字符时，根据标记符的形态自动将字符合并为完整的字符样本。

为了更好的实现上述方法，利用神经网络对带标记符的样本进行训练，得到识别模型，以实现对标记符更好的识别效果。

为了实现上述的字符输入方法，本申请还提供了一种字符输入装置，所述的装置包括用于设置标记符的标记模块，以及用于基于标记符识别字符样本的识别模块。

在实际操作中，标记模块可以为手写输入设备，由普通纸笔或电子纸笔等构成，识别设备可以是穿戴式摄像机设备，穿戴式摄像机设备由可以固定于人体身上的载体、固定于载体上的摄像头、通信设备以及电源等附件所构成。

基于上述技术，本领域技术人员可以实现以下操作：

实施例1

训练。将纸上的第一个字符、最后一个字符和标记符作为训练的对象，构建识别模型；

测试。首先，识别标记符的位置。然后，根据标记符的位置、第一个字符的位置、最后一个字符的位置得到标记所在位置的字符。

使用。使用者将摄像机戴在头部，用笔在纸上的某一个字符的上方位置打上一个标记，识别出标记所在位置的字符。

返回标记所对应的字符。

实施例2

将0到9等10个字符打印在一张打印纸上，分别在每个字符下面5mm左右位置打一个标记X，再通过头戴式摄像机采集样本，将样本放入yolov5的train.py中进行训练，得到识别模块。

实施例3

把0与A组成一个“字符”，1与B组合成一个“字符”，2与C组合为一个“字符”，…9与J组合为一个复杂“字符”。采用穿戴式摄像机采集“字符”样本，利用神经网络模型对这些样本进行训练，得到识别模块。

实施例4

获取样本：采用头戴式摄像头进行数据的采样样本标签：tihao_1,tihao_2,tihao_3,tihao_4,tihao_5,tihao_6,tihao_7,tihao_8,tihao_9,xuanxiang_A,xuanxiang_B,xuanxiang_C,xuanxiang_D,duigou

训练：放入yolov5的train.py中进行训练。

测试步骤：

系统同时识别出tihao_1、xuanxiang_A、xuanxiang_B、xuanxiang_C、xuanxiang_D和duigou时表明学生已经做完选择题一，可以选项选择的判断。

如果duigou与ABCD四个选项中某一个选项的距离小于设定的阈值，表明选定当前选项。

应当指出，以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明的具体结构，但不以任何方式限制本发明创造。因此，尽管说明书及附图和实施例对本发明创造已进行了详细的说明，但是，本领域技术人员应当理解，仍然可以对本发明创造进行修改或者等同替换；而一切不脱离本发明创造的精神和范围的技术方案及其改进，其均涵盖在本发明创造专利的保护范围当中。

Claims

1.一种字符输入方法，其特征在于，所述的方法包括：

S1：选择需要识别的字符样本；

S2：在字符样本处设置标记符；

S3：基于标记符识别字符样本。

2.根据权利要求1所述的一种字符输入方法，其特征在于，步骤S1中，需要识别的字符样本为单个字符或多个字符的组合。

3.根据权利要求1所述的一种字符输入方法，其特征在于，步骤S1中，字符样本为一组或多组。

4.根据权利要求2所述的一种字符输入方法，其特征在于，步骤S2中，当需要识别的字符样本为多个字符的组合时，组成该字符样本的每个字符处均设置一个标记符。

5.根据权利要求3所述的一种字符输入方法，其特征在于，步骤S2中，当字符样本为多组时，不同组的字符样本采用不同的标记符，同一组字符样本内的字符采用同一种标记符。

6.根据权利要求1所述的一种字符输入方法，其特征在于，步骤S2中，设置标记符的方法为：按照||P,C||≤ρ在C的外围进行标记以产生标记字符，其中，C是字符的最大外接圆，P是标记符的重心位置，||P,C||表示P与C之间的最小欧式距离，ρ是一个阈值，其取值范围一般在[0mm,10mm]的范围内。

7.根据权利要求4所述的一种字符输入方法，其特征在于，步骤S3中，当字符样本包含多个字符时，根据标记符的形态自动将字符合并为完整的字符样本。

8.一种字符输入装置，其特征在于，所述的装置用于实现权利要求1所述的方法，所述的装置包括：

标记模块，用于设置标记符；

识别模块，用于基于标记符识别字符样本。

9.根据权利要求8所述的一种字符输入装置，其特征在于，标记模块设置标记符的方法为：按照||P,C||≤ρ在C的外围进行标记以产生标记字符，其中，C是字符的最大外接圆，P是标记符的重心位置，||P,C||表示P与C之间的最小欧式距离，ρ是一个阈值，其取值范围一般在[0mm,10mm]的范围内。