CN113885711A - 一种字符输入方法及装置 - Google Patents

一种字符输入方法及装置 Download PDF

Info

Publication number
CN113885711A
CN113885711A CN202111144506.6A CN202111144506A CN113885711A CN 113885711 A CN113885711 A CN 113885711A CN 202111144506 A CN202111144506 A CN 202111144506A CN 113885711 A CN113885711 A CN 113885711A
Authority
CN
China
Prior art keywords
character
marker
sample
characters
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111144506.6A
Other languages
English (en)
Inventor
冯志全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Jinan
Original Assignee
University of Jinan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Jinan filed Critical University of Jinan
Priority to CN202111144506.6A priority Critical patent/CN113885711A/zh
Publication of CN113885711A publication Critical patent/CN113885711A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明提供了一种字符输入方法及装置,所述的方法包括:S1:选择需要识别的字符样本;S2:在字符样本处设置标记符;S3:基于标记符识别字符样本。所述的装置包括:标记模块,用于设置标记符;识别模块,用于基于标记符识别字符样本。本发明通过设置标记符,基于标记符缺分待识别的字符样本,实现对指定字符的精准识别。

Description

一种字符输入方法及装置
技术领域
本发明涉及字符识别技术领域,具体涉及一种字符输入方法及装置。
背景技术
字符识别(Optical Character Recognise,OCR)技术是指用于对纸上的印刷及打印文字字符进行识别,将识别结果以文本方式存储在计算机器中。OCR已经逐步进入了人们日常学习、生活、工作等各个应用领域,目前的印刷及打印文字字符识别软件及设备能阅读各类中西文字符,且准确率可达90%以上。
在现有的字符识别技术中,对于训练阶段的字符输入,一般采用单独印刷或打印的方式,即将需要识别的对象按照一定的间隔印刷或打印到纸面上,将整个纸面作为识别对象进行读入,然后再进行下一步的训练和学习。
然而,针对一张写满字符的纸张时,有时仅需要输入其中几个不相邻的字符,但是现有技术中却无法有效区分哪些属于需要识别的字符,哪些属于不需要识别的字符,如果全部识别,则会造成重复或无效的训练,造成资源的浪费。
发明内容
为了解决上述问题,本申请提供了一种字符输入方法及装置,通过标记符实现对指定字符的精准识别。
本发明公开了如下技术方案:
本发明实施例提供了一种字符输入方法,所述的方法包括:
S1:选择需要识别的字符样本;
S2:在字符样本处设置标记符;
S3:基于标记符识别字符样本。
进一步的,步骤S1中,需要识别的字符样本为单个字符或多个字符的组合。
进一步的,步骤S1中,字符样本可以为一组或多组。
进一步的,步骤S2中,当需要识别的字符样本为多个字符的组合时,组成该字符样本的每个字符处均设置一个标记符。
优选的,步骤S2中,当字符样本为多组时,为了区分不同组的字符样本,不同组的字符样本采用不同的标记符,同一组字符样本内的字符采用同一种标记符。
进一步的,步骤S2中,一种设置标记符的方法为:按照||P,C||≤ρ在C的外围进行标记以产生标记字符,其中,C是字符的最大外接圆,P是标记符的重心位置,||P,C||表示P与C之间的最小欧式距离,ρ是一个阈值,其取值范围一般在[0mm,10mm]的范围内。
进一步的,步骤S3中,当字符样本包含多个字符时,根据标记符的形态自动将字符合并为完整的字符样本。
为了实现上述的字符输入方法,本申请还提供了一种字符输入装置,所述的装置包括:
标记模块,用于设置标记符;
识别模块,用于基于标记符识别字符样本。
进一步的,标记模块设置标记符的方法为:按照||P,C||≤ρ在C的外围进行标记以产生标记字符,其中,C是字符的最大外接圆,P是标记符的重心位置,||P,C||表示P与C之间的最小欧式距离,ρ是一个阈值,其取值范围一般在[0mm,10mm]的范围内。
本发明的有益效果:
相比于现有技术中的字符输入法,本申请通过设置标记符,可以精准识别标记符所对应的待识别字符,可以选择性的从全部字符中精准识别需要识别的字符。
对于多组不同的字符样本,基于标记符的不同形状,本申请可有效区分,因此能够同时全部识别,提高了输入的效率。而且,由于标记符的形状任意定义,因此可以标记的字符样本数量理论上没有上限。
附图说明
图1为本发明方法实施例的流程图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。本领域技术人员应当知晓,下述具体实施例或具体实施方式,是本发明为进一步解释具体的发明内容而列举的一系列优化的设置方式,而该些设置方式之间均是可以相互结合或者相互关联使用的,除非在本发明明确提出了其中某些或某一具体实施例或实施方式无法与其他的实施例或实施方式进行关联设置或共同使用。同时,下述的具体实施例或实施方式仅作为最优化的设置方式,而不作为限定本发明的保护范围的理解。
如图1所示,本发明实施例提供了一种字符输入方法,所述的方法包括:
S1:选择需要识别的字符样本,需要识别的字符样本可以是单个字符,例如A;也可以是多个字符的组合,例如A1。
同样的,字符样本可以只有一组,也可以有多组,当有多组时,字符样本没有限制,例如A、B1、CX3。
S2:在字符样本处设置标记符,一种设置标记符的方法为:按照||P,C||≤ρ在C的外围进行标记以产生标记字符,其中,C是字符的最大外接圆,P是标记符的重心位置,||P,C||表示P与C之间的最小欧式距离,ρ是一个阈值,其取值范围一般在[0mm,10mm]的范围内。
上述设置标记符的方法,仅仅定义了标记符与字符之间的位置关系,并没有限定标记符的形状,因此可以随意设计,既可以是普通的√、×等常见字符,也可以任意形状的点、线段、曲线的组合。
需要注意的是,当需要识别的字符样本为多个字符的组合时,组成该字符样本的每个字符处均设置一个标记符。当字符样本为多组时,为了区分不同组的字符样本,不同组的字符样本采用不同的标记符,同一组字符样本内的字符采用同一种标记符。
S3:基于标记符识别字符样本。由于步骤S2设置标记符时,定义了标记符和字符的位置关系,因此基于该位置关系来识别标记符所对应的字符,当字符样本包含多个字符时,根据标记符的形态自动将字符合并为完整的字符样本。
为了更好的实现上述方法,利用神经网络对带标记符的样本进行训练,得到识别模型,以实现对标记符更好的识别效果。
为了实现上述的字符输入方法,本申请还提供了一种字符输入装置,所述的装置包括用于设置标记符的标记模块,以及用于基于标记符识别字符样本的识别模块。
在实际操作中,标记模块可以为手写输入设备,由普通纸笔或电子纸笔等构成,识别设备可以是穿戴式摄像机设备,穿戴式摄像机设备由可以固定于人体身上的载体、固定于载体上的摄像头、通信设备以及电源等附件所构成。
基于上述技术,本领域技术人员可以实现以下操作:
实施例1
训练。将纸上的第一个字符、最后一个字符和标记符作为训练的对象,构建识别模型;
测试。首先,识别标记符的位置。然后,根据标记符的位置、第一个字符的位置、最后一个字符的位置得到标记所在位置的字符。
使用。使用者将摄像机戴在头部,用笔在纸上的某一个字符的上方位置打上一个标记,识别出标记所在位置的字符。
返回标记所对应的字符。
实施例2
将0到9等10个字符打印在一张打印纸上,分别在每个字符下面5mm左右位置打一个标记X,再通过头戴式摄像机采集样本,将样本放入yolov5的train.py中进行训练,得到识别模块。
实施例3
把0与A组成一个“字符”,1与B组合成一个“字符”,2与C组合为一个“字符”,…9与J组合为一个复杂“字符”。采用穿戴式摄像机采集“字符”样本,利用神经网络模型对这些样本进行训练,得到识别模块。
实施例4
获取样本:采用头戴式摄像头进行数据的采样样本标签:tihao_1,tihao_2,tihao_3,tihao_4,tihao_5,tihao_6,tihao_7,tihao_8,tihao_9,xuanxiang_A,xuanxiang_B,xuanxiang_C,xuanxiang_D,duigou
训练:放入yolov5的train.py中进行训练。
测试步骤:
系统同时识别出tihao_1、xuanxiang_A、xuanxiang_B、xuanxiang_C、xuanxiang_D和duigou时表明学生已经做完选择题一,可以选项选择的判断。
如果duigou与ABCD四个选项中某一个选项的距离小于设定的阈值,表明选定当前选项。
应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明的具体结构,但不以任何方式限制本发明创造。因此,尽管说明书及附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换;而一切不脱离本发明创造的精神和范围的技术方案及其改进,其均涵盖在本发明创造专利的保护范围当中。

Claims (9)

1.一种字符输入方法,其特征在于,所述的方法包括:
S1:选择需要识别的字符样本;
S2:在字符样本处设置标记符;
S3:基于标记符识别字符样本。
2.根据权利要求1所述的一种字符输入方法,其特征在于,步骤S1中,需要识别的字符样本为单个字符或多个字符的组合。
3.根据权利要求1所述的一种字符输入方法,其特征在于,步骤S1中,字符样本为一组或多组。
4.根据权利要求2所述的一种字符输入方法,其特征在于,步骤S2中,当需要识别的字符样本为多个字符的组合时,组成该字符样本的每个字符处均设置一个标记符。
5.根据权利要求3所述的一种字符输入方法,其特征在于,步骤S2中,当字符样本为多组时,不同组的字符样本采用不同的标记符,同一组字符样本内的字符采用同一种标记符。
6.根据权利要求1所述的一种字符输入方法,其特征在于,步骤S2中,设置标记符的方法为:按照||P,C||≤ρ在C的外围进行标记以产生标记字符,其中,C是字符的最大外接圆,P是标记符的重心位置,||P,C||表示P与C之间的最小欧式距离,ρ是一个阈值,其取值范围一般在[0mm,10mm]的范围内。
7.根据权利要求4所述的一种字符输入方法,其特征在于,步骤S3中,当字符样本包含多个字符时,根据标记符的形态自动将字符合并为完整的字符样本。
8.一种字符输入装置,其特征在于,所述的装置用于实现权利要求1所述的方法,所述的装置包括:
标记模块,用于设置标记符;
识别模块,用于基于标记符识别字符样本。
9.根据权利要求8所述的一种字符输入装置,其特征在于,标记模块设置标记符的方法为:按照||P,C||≤ρ在C的外围进行标记以产生标记字符,其中,C是字符的最大外接圆,P是标记符的重心位置,||P,C||表示P与C之间的最小欧式距离,ρ是一个阈值,其取值范围一般在[0mm,10mm]的范围内。
CN202111144506.6A 2021-09-28 2021-09-28 一种字符输入方法及装置 Pending CN113885711A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111144506.6A CN113885711A (zh) 2021-09-28 2021-09-28 一种字符输入方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111144506.6A CN113885711A (zh) 2021-09-28 2021-09-28 一种字符输入方法及装置

Publications (1)

Publication Number Publication Date
CN113885711A true CN113885711A (zh) 2022-01-04

Family

ID=79007612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111144506.6A Pending CN113885711A (zh) 2021-09-28 2021-09-28 一种字符输入方法及装置

Country Status (1)

Country Link
CN (1) CN113885711A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101661465A (zh) * 2008-08-28 2010-03-03 富士施乐株式会社 图像处理装置及图像处理方法
CN104978577A (zh) * 2014-04-04 2015-10-14 联想(北京)有限公司 信息处理方法、装置及电子设备
CN107358227A (zh) * 2017-06-29 2017-11-17 努比亚技术有限公司 一种标记识别方法、移动终端以及计算机可读存储介质
CN110858307A (zh) * 2018-08-24 2020-03-03 国信优易数据有限公司 字符识别模型训练方法及装置、识别字符的方法及装置
CN111444907A (zh) * 2020-03-24 2020-07-24 上海东普信息科技有限公司 文字识别的方法、装置、设备及存储介质
US20200342172A1 (en) * 2019-04-26 2020-10-29 Wangsu Science & Technology Co., Ltd. Method and apparatus for tagging text based on adversarial learning

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101661465A (zh) * 2008-08-28 2010-03-03 富士施乐株式会社 图像处理装置及图像处理方法
CN104978577A (zh) * 2014-04-04 2015-10-14 联想(北京)有限公司 信息处理方法、装置及电子设备
CN107358227A (zh) * 2017-06-29 2017-11-17 努比亚技术有限公司 一种标记识别方法、移动终端以及计算机可读存储介质
CN110858307A (zh) * 2018-08-24 2020-03-03 国信优易数据有限公司 字符识别模型训练方法及装置、识别字符的方法及装置
US20200342172A1 (en) * 2019-04-26 2020-10-29 Wangsu Science & Technology Co., Ltd. Method and apparatus for tagging text based on adversarial learning
CN111444907A (zh) * 2020-03-24 2020-07-24 上海东普信息科技有限公司 文字识别的方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN107168955B (zh) 利用基于词上下文的字嵌入与神经网络的中文分词方法
CN105512692B (zh) 基于blstm的联机手写数学公式符号识别方法
CN109308476A (zh) 票据信息处理方法、系统及计算机可读存储介质
CN106781784A (zh) 一种智能批改系统
CN107622463A (zh) 一种出卷及自动阅卷系统及方法
CN111047933A (zh) 一种教辅自动批改系统
CN105488544A (zh) 一种描红临摹笔迹识别的方法及系统
CN106354252A (zh) 一种基于stdw的连续字符手势轨迹识别方法
CN1018092B (zh) 表意文字的处理方法及装置
CN103154974A (zh) 字符识别装置、字符识别方法、字符识别系统以及字符识别程序
CN110516554A (zh) 一种多场景多字体中文文字检测识别方法
CN104199834A (zh) 从信息载体表面交互式获取远程资源并输出的方法及系统
CN104376336B (zh) 一种手写识别的方法及手写笔
US20090242639A1 (en) Optical mark reading that uses a disregard state as part of an unambiguous symbology of marks to fill into response bubbles
CN106777336A (zh) 一种基于深度学习的公司名成分抽取系统和方法
CN111814779A (zh) 一种票据文本识别方法、装置、设备及存储介质
CN116724341A (zh) 用于识别在线手写的系统
CN113885711A (zh) 一种字符输入方法及装置
CN101901348A (zh) 一种基于归一化的手写识别方法和识别装置
CN107315553A (zh) 一种个性化打印控制方法、装置及系统
CN109240549B (zh) 一种基于外接数位设备和大数据智能分析的书法矫正器
JPH07146918A (ja) 手書き文字認識装置
Lu et al. Automatic scoring system for handwritten examination papers based on YOLO algorithm
CN109859565A (zh) 一种生成书法字帖的方法及装置
US20150227786A1 (en) Apparatus for Recognizing Handwritten Notes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination