CN115240210A - 一种用于手写汉字辅助练习的系统及方法 - Google Patents

一种用于手写汉字辅助练习的系统及方法 Download PDF

Info

Publication number
CN115240210A
CN115240210A CN202210872187.9A CN202210872187A CN115240210A CN 115240210 A CN115240210 A CN 115240210A CN 202210872187 A CN202210872187 A CN 202210872187A CN 115240210 A CN115240210 A CN 115240210A
Authority
CN
China
Prior art keywords
character
chinese character
handwritten
stroke
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210872187.9A
Other languages
English (en)
Inventor
栾兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202210872187.9A priority Critical patent/CN115240210A/zh
Publication of CN115240210A publication Critical patent/CN115240210A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19013Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19093Proximity measures, i.e. similarity or distance measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种用于手写汉字辅助练习的系统及方法,图像获取模块获取练习者手写的汉字图像,利用手写汉字定位识别模块识别文字内容与定位文字位置,并使用相应数据结构进行保存;篇章评价模块根据文字位置进行分行处理,分离成单个汉字;笔画分离模块提取每个汉字的笔画,笔画评价模块将分离出的笔画与笔画库中的对应笔画进行比较,得出笔画评分;由标准字体识别模型将单个汉字与标准字体库中对应汉字进行比较,由整字评价模块得出整字评分;由手写汉字识别模型将单个汉字与手写字体库中对应汉字进行比较,由整字评价模块得出整字评分;手写汉字或标准字体的整字评分比较,以评分较高者,判断为该练习者手写的汉字与之相似。

Description

一种用于手写汉字辅助练习的系统及方法
技术领域
本发明涉及辅助写字技术领域,尤其涉及一种手写汉字辅助练习方法。
背景技术
随着计算机技术的发展,人们致力于使用技术手段对手写汉字进行识别与评判。手写汉字识别技术属于模式识别技术,大体分为联机手写汉字识别与脱机手写汉字识别。其中联机手写汉字识别需要获取书写者的笔画顺序等书写时的实时信息,对于书写设备有一定的要求,因此为书法练习者的练习带来了一定的限制。脱机手写汉字识别由于获取信息的方式有限,对于识别过程拥有一定难度,同时,对于手写汉字的评判,现行的大多数评判方法针对汉字单字进行骨架提取,字体风格识别等评价方法,极少数能同时关注单个汉字与多个汉字之间的书写评判。
发明内容
为了解决现有技术存在的不足,本发明的目的在于提供一种手写汉字辅助练习的方法,建立手写汉字识别模型、标准字体库、笔画库和标准字体识别模型,再通过对篇章、单个汉字、单个笔画分别进行评分并最后汇总,达到准确评价汉字练习者手写汉字水平的目的,并给予联系建议,最终辅助练习者练习汉字。
为实现上述目的,本发明采用如下技术手段:
一种用于手写汉字辅助练习的系统,包括数据库、识别模型、评价模块和数据处理模块,其中:
数据库包括笔画库、手写字体库和标准字体库,
识别模型包括手写汉字识别模型与标准字体识别模型,
评价模块包括篇章评价模块、整字评价模块和笔画评价模块,
数据处理模块包括图像获取模块、手写汉字定位识别模块和笔画分离模块;
图像获取模块获取练习者手写的汉字图像,利用手写汉字定位识别模块识别文字内容与定位文字位置,并使用相应数据结构进行保存;篇章评价模块根据文字位置进行分行处理,分离成单个汉字;笔画分离模块提取每个汉字的笔画,笔画评价模块将分离出的笔画与笔画库中的对应笔画进行比较,得出笔画评分;
由标准字体识别模型将单个汉字与标准字体库中对应汉字进行比较,由整字评价模块得出整字评分;由手写汉字识别模型将单个汉字与手写字体库中对应汉字进行比较,由整字评价模块得出整字评分;手写汉字或标准字体的整字评分比较,以评分较高者,判断为该练习者手写的汉字与之相似。
优选地,图像获取模块为摄像机、摄像头。图像获取模块将练习者书写的汉字拍摄成图像并传输给手写汉字定位识别模块。
优选地,一种用于手写汉字辅助练习的系统还包括个人模板库,用于存放评分较高或练习者自己想要存放的手写汉字图像。
一种手写汉字辅助练习方法,包括以下步骤:
步骤101,收集汉字图像建立数据库;包括收集手写汉字图像与标准字体图像,分别构建手写字体库和标准字体库;对标准字体库中的字体分离笔画,构建笔画库;
步骤102,利用YOLOv5算法对手写汉字图像与标准字体图像进行内容识别,构建并训练深度学习分类模型,分别获得手写汉字识别模型与标准字体识别模型;
步骤103,通过图像获取模块获取练习者手写的汉字图像;
步骤104,将练习者手写的汉字图像输入手写汉字定位识别模块中,识别文字内容与定位文字位置,并使用相应数据结构进行保存;
步骤105,将步骤104识别后的汉字图像输入篇章评价模块中,根据文字位置进行分行处理,对每一行的文字分析文字间的间距均匀程度;对于不同的行,分析行间距的均匀程度,将汉字图像分离成单个汉字;
步骤106,将分离成单个汉字的图像扩展到指定大小,并使汉字处于画布中间位置;
步骤107,将处理后的单个汉字图像输入标准字体识别模型中,与标准字体库中对应汉字进行比较,由整字评价模块得出整字评分;
步骤108,将处理后的单个汉字图像输入手写汉字识别模型中,与手写字体库中对应汉字进行比较,由整字评价模块得出整字评分;
步骤109,将处理后的单个汉字图像输入笔画分离模块中,提取每个汉字的笔画,笔画评价模块将分离出的笔画与笔画库中的对应笔画进行比较,得出笔画评分;
步骤110,比较步骤107和步骤108的评分,以评分较高者,判断为该练习者手写的汉字与之越相似。
优选地,步骤103中对获取的练习者手写的汉字图像要进行二值化处理,利用高斯滤波器过滤图像噪声。
优选地,步骤110之后还包括:
步骤111,如果步骤110中评分高于预设值,则选择将练习者的该手写汉字图像存入个人模板库中。
具体地,步骤109中,使用Z-S骨架提取算法完成对汉字图像的骨架提取,Z-S骨架提取算法针对二值化图像进行计算,对所有像素点进行扫描,通过对其八邻域像素的逻辑运算确定是否删除该像素,将分离出的笔画与笔画库中的对应笔画进行比较,得出笔画得分。
与现有技术相比较,本发明具有以下有益效果:
本发明将获取的汉字图像,使用人工智能的算法进行汉字内容识别,通过分析整个篇章的文字排列整齐度,单个字与模板的相似度以及笔画是否标准,对手写汉字给出评分,实现帮助汉字练习者自主练习的目的。
附图说明
图1为本发明的手写汉字辅助练习方法流程图;
图2为本发明的辅助手写汉字练习系统的框架结构示意图;
图3为标准字体库的图像示例以及标准字体笔画库的构建过程;
图4为手写字体识别示例;
图5为单字分离与画布扩展示例;
图6为手写汉字骨架提取示例。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为根据本发明的手写汉字辅助练习方法流程图,下面将参考图1,对本发明的手写汉字辅助练习方法进行详细描述。
步骤101,收集汉字图像,包括手写汉字图像与标准字体图像,其中,
1)手写汉字图像:收集汉字图像在网络上使用爬虫技术或者由实施者自行拍摄收集手写汉字图像,其中汉字内容尽可能清晰但不强制要求工整与美观,采集完成后对其中的汉字内容进行标注,构建手写字体数据库。本实施例中采用CASIA提供的HWDB1.0数据集,其中共有1556675个图像样本。
2)标准字体图像:在网络上搜索多种不同书法的标准字帖,对图像进行标注整理,形成多个字体的标准字体库。其中隶书、宋体、楷体三种字体各收集3740张字体图像作为标准字体库。
对于标准字体库,使用图2中的笔画分离模块对标准字体进行笔画分离,构建标准笔画库,如图3。
步骤102,利用YOLOv5算法对手写汉字图像与标准字体图像进行内容识别,构建并训练深度学习分类模型,分别获得手写汉字识别模型与标准字体识别模型。
本发明实施例中,由于卷积神经网络相较于其他模型有其独特优势,算法可以自行提取对象特征进行识别,从而使得图像识别对于光线强度等图像质量要求不高。采用YOLOv5算法不仅能够识别对象,而且可以划定对象范围,包括:
1)图像预处理:对采集的汉字图像进行图像处理,锐化去噪等。
2)目标定位:定位图像中所有汉字的区域(bounding box),生成感兴趣的区域(ROIs Region of Interests)。
3)细粒度分类:构建并训练深度学习分类模型,得到高准确率的汉字识别模型。
其中,步骤2)与3)可在同一阶段完成,提高了目标识别的速度。
构建好深度学习分类模型后,通过在大量有标注数据上进行训练,可以得到高准确率的手写汉字识别模型与标准字体识别模型。
步骤103,通过图像获取模块获取练习者手写的汉字图像,对该图像进行二值化处理,利用高斯滤波器过滤图像噪声。
步骤104,将经过处理后的练习者手写的汉字图像输入手写汉字识别模块中,识别文字内容与定位文字位置,并使用相应数据结构进行保存,如图4。
步骤105,将识别后的文字位置输入图二中的篇章评价模块中,根据文字位置进行分行处理,对每一行的文字分析文字间的间距均匀程度;对于不同的行,分析行间距的均匀程度,将汉字图像分离成单个汉字;
步骤106,将分离成单个汉字的图像扩展到指定大小,并使汉字处于画布中间位置,如图5。
步骤107,将处理后的单个汉字图像输入图2中的标准字体识别模型中,与标准字体库中对应汉字进行比较,由整字评价模块得出整字评分;
本发明实施例中,识别出的汉字,经由标准字体识别模型识别,根据识别结果与置信度计算整字评分,识别结果与汉字内容一致,置信度越高,则该练习者手写的汉字与标准字体库中的相应汉字越相似,整字评分越高。最后获得均分最低的5个手写汉字内容,给出练习建议。
步骤108,将处理后的单个汉字图像输入手写汉字识别模型中,与手写字体库中对应汉字进行比较,由整字评价模块得出整字评分;
步骤109,将处理后的单个汉字图像输入笔画分离模块中,提取每个汉字的笔画,对于每个手写汉字识别内容,使用算法提取文字骨架,并对骨架像素进行分析,提取单个笔画骨架,如图6。本发明实施例中,使用Z-S骨架提取算法完成对汉字图像的骨架提取。Z-S骨架提取算法针对二值化图像进行计算,对所有像素点进行扫描,通过对其八邻域像素的逻辑运算确定是否删除该像素。
本发明实施例中,在提取完骨架后可对骨架分离汉字笔画,对笔画上的每个像素,若八邻域中只与不高于2个方向联通则视为单一笔画的像素,反之则视为像素位于笔画交叉点。分离出笔画后与笔画库通过欧氏距离进行对比,得出笔画得分。对于整字评分较低的手写汉字,选则笔画评分均分最低的笔画给出练习建议。
在步骤110,汇总步骤107与步骤108中的评分,以评分较高者,判断为该练习者手写的汉字与越之相似。
在步骤111,如果步骤110中评分高于预设值,则可以选择存入个人模板库,方便联系者在后期练习中查阅自己的手写稿。
本领域普通技术人员可以理解:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种用于手写汉字辅助练习的系统,其特征在于,包括数据库、识别模型、评价模块和数据处理模块,其中:
数据库包括笔画库、手写字体库和标准字体库,
识别模型包括手写汉字识别模型与标准字体识别模型,
评价模块包括篇章评价模块、整字评价模块和笔画评价模块,
数据处理模块包括图像获取模块、手写汉字定位识别模块和笔画分离模块;
图像获取模块获取练习者手写的汉字图像,利用手写汉字定位识别模块识别文字内容与定位文字位置,并使用相应数据结构进行保存;篇章评价模块根据文字位置进行分行处理,分离成单个汉字;笔画分离模块提取每个汉字的笔画,笔画评价模块将分离出的笔画与笔画库中的对应笔画进行比较,得出笔画评分;
由标准字体识别模型将单个汉字与标准字体库中对应汉字进行比较,由整字评价模块得出整字评分;由手写汉字识别模型将单个汉字与手写字体库中对应汉字进行比较,由整字评价模块得出整字评分;手写汉字或标准字体的整字评分比较,以评分较高者,判断为该练习者手写的汉字与之相似。
2.根据权利要求1所述的一种用于手写汉字辅助练习的系统,其特征在于,图像获取模块为摄像机、摄像头。
3.根据权利要求1所述的一种用于手写汉字辅助练习的系统,其特征在于,还包括个人模板库,用于存放评分较高或练习者自己想要存放的手写汉字图像。
4.一种手写汉字辅助练习方法,其特征在于,包括以下步骤:
步骤101,收集汉字图像建立数据库;包括收集手写汉字图像与标准字体图像,分别构建手写字体库和标准字体库;对标准字体库中的字体分离笔画,构建笔画库;
步骤102,利用YOLOv5算法对手写汉字图像与标准字体图像进行内容识别,构建并训练深度学习分类模型,分别获得手写汉字识别模型与标准字体识别模型;
步骤103,通过图像获取模块获取练习者手写的汉字图像;
步骤104,将练习者手写的汉字图像输入手写汉字定位识别模块中,识别文字内容与定位文字位置,并使用相应数据结构进行保存;
步骤105,将步骤104识别后的汉字图像输入篇章评价模块中,根据文字位置进行分行处理,对每一行的文字分析文字间的间距均匀程度;对于不同的行,分析行间距的均匀程度,将汉字图像分离成单个汉字;
步骤106,将分离成单个汉字的图像扩展到指定大小,并使汉字处于画布中间位置;
步骤107,将处理后的单个汉字图像输入标准字体识别模型中,与标准字体库中对应汉字进行比较,由整字评价模块得出整字评分;
步骤108,将处理后的单个汉字图像输入手写汉字识别模型中,与手写字体库中对应汉字进行比较,由整字评价模块得出整字评分;
步骤109,将处理后的单个汉字图像输入笔画分离模块中,提取每个汉字的笔画,笔画评价模块将分离出的笔画与笔画库中的对应笔画进行比较,得出笔画评分;
步骤110,比较步骤107和步骤108的评分,以评分较高者,判断为该练习者手写的汉字与越之相似。
5.根据权利要求4所述的一种手写汉字辅助练习方法,其特征在于,步骤103中对获取的练习者手写的汉字图像要进行二值化处理,利用高斯滤波器过滤图像噪声。
6.根据权利要求4所述的一种手写汉字辅助练习方法,其特征在于,步骤110之后还包括:
步骤111,如果步骤110中评分高于预设值,则选择将练习者的该手写汉字图像存入个人模板库中。
7.根据权利要求4所述的一种手写汉字辅助练习方法,其特征在于,步骤109中,使用Z-S骨架提取算法完成对汉字图像的骨架提取,Z-S骨架提取算法针对二值化图像进行计算,对所有像素点进行扫描,通过对其八邻域像素的逻辑运算确定是否删除该像素,将分离出的笔画与笔画库中的对应笔画进行比较,得出笔画得分。
CN202210872187.9A 2022-07-22 2022-07-22 一种用于手写汉字辅助练习的系统及方法 Pending CN115240210A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210872187.9A CN115240210A (zh) 2022-07-22 2022-07-22 一种用于手写汉字辅助练习的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210872187.9A CN115240210A (zh) 2022-07-22 2022-07-22 一种用于手写汉字辅助练习的系统及方法

Publications (1)

Publication Number Publication Date
CN115240210A true CN115240210A (zh) 2022-10-25

Family

ID=83675113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210872187.9A Pending CN115240210A (zh) 2022-07-22 2022-07-22 一种用于手写汉字辅助练习的系统及方法

Country Status (1)

Country Link
CN (1) CN115240210A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434243A (zh) * 2023-02-25 2023-07-14 江苏乐易智慧科技有限公司 一种笔迹练习系统的练习笔迹自动评测方法
CN117037186A (zh) * 2023-10-09 2023-11-10 山东维克特信息技术有限公司 一种患者数据管理系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434243A (zh) * 2023-02-25 2023-07-14 江苏乐易智慧科技有限公司 一种笔迹练习系统的练习笔迹自动评测方法
CN116434243B (zh) * 2023-02-25 2023-10-24 江苏乐易智慧科技有限公司 一种笔迹练习系统的练习笔迹自动评测方法
CN117037186A (zh) * 2023-10-09 2023-11-10 山东维克特信息技术有限公司 一种患者数据管理系统
CN117037186B (zh) * 2023-10-09 2024-01-30 山东维克特信息技术有限公司 一种患者数据管理系统

Similar Documents

Publication Publication Date Title
CN109241894B (zh) 一种基于表格定位和深度学习的票据内容识别系统和方法
Busta et al. Deep textspotter: An end-to-end trainable scene text localization and recognition framework
Shahab et al. ICDAR 2011 robust reading competition challenge 2: Reading text in scene images
Pan et al. A robust system to detect and localize texts in natural scene images
CN108664996A (zh) 一种基于深度学习的古文字识别方法及系统
CN115240210A (zh) 一种用于手写汉字辅助练习的系统及方法
CN110298343A (zh) 一种手写黑板板书识别方法
CN113537227B (zh) 一种结构化文本识别方法及系统
CN111091124B (zh) 一种书脊文字识别方法
CN113128442A (zh) 基于卷积神经网络的汉字书法风格识别方法和评分方法
CN112307919B (zh) 一种基于改进YOLOv3的单证图像中数字信息区域识别方法
CN111401353A (zh) 一种数学公式的识别方法、装置及设备
CN112651323B (zh) 一种基于文本行检测的中文手写体识别方法及系统
CN108509950B (zh) 基于概率特征加权融合的铁路接触网支柱号牌检测识别法
CN112446259A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN109508716B (zh) 一种图像文字的定位方法及装置
CN109635808A (zh) 一种在自然场景图像中对中文关键词及上下文的提取方法
CN109409227A (zh) 一种基于多通道cnn的手指静脉图质量评估方法及其装置
CN110781898A (zh) 一种中文ocr后处理的无监督学习方法
CN113901952A (zh) 一种基于深度学习的印刷体与手写体分开文字识别方法
Lyu et al. The early japanese books text line segmentation base on image processing and deep learning
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
CN110766001B (zh) 基于cnn和rnn的银行卡卡号定位与端到端识别方法
CN112364687A (zh) 一种基于改进的Faster R-CNN加油站静电标志识别方法及系统
CN115471849B (zh) 一种手写汉字图像评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination