CN111881310B - 一种汉字硬笔书写智能指导和评分方法及指导评分系统 - Google Patents

一种汉字硬笔书写智能指导和评分方法及指导评分系统 Download PDF

Info

Publication number
CN111881310B
CN111881310B CN201911246837.3A CN201911246837A CN111881310B CN 111881310 B CN111881310 B CN 111881310B CN 201911246837 A CN201911246837 A CN 201911246837A CN 111881310 B CN111881310 B CN 111881310B
Authority
CN
China
Prior art keywords
writing
chinese character
skeleton
chinese
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911246837.3A
Other languages
English (en)
Other versions
CN111881310A (zh
Inventor
张冬青
王建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Huadong Artificial Intelligence Co ltd
Original Assignee
Hangzhou Huadong Artificial Intelligence Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Huadong Artificial Intelligence Co ltd filed Critical Hangzhou Huadong Artificial Intelligence Co ltd
Priority to CN201911246837.3A priority Critical patent/CN111881310B/zh
Publication of CN111881310A publication Critical patent/CN111881310A/zh
Application granted granted Critical
Publication of CN111881310B publication Critical patent/CN111881310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/535Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B11/00Teaching hand-writing, shorthand, drawing, or painting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及一种汉字硬笔书写智能指导和评分方法及指导评分系统,构建字库数据存储单元,以手写汉字采集单元采集若干汉字的全幅图像或视频流,获得单个汉字图像或其队列,识别每个汉字,在字库数据存储单元检索成功,则对汉字逐层分析,确定汉字的结构信息,以书写评分单元对其评分、以汉字书写指导单元对用户指导,直至所有的全幅图像识别完毕。本发明基于不同的字模规范硬笔书写用户的书写,利用硬笔书法中笔画骨架明确的特征对用户书写的汉字进行分解,并从独立的笔画和整体的架构上对用户的书写进行校正,使用户专注于某种或某几种字模、不混淆,笔画、架构遵循标准,拆解笔画辅导用户,让用户更直观看到问题并加以改正。

Description

一种汉字硬笔书写智能指导和评分方法及指导评分系统
技术领域
本发明涉及用于阅读或识别印刷或书写字符或者用于识别图形的技术领域,特别涉及一种汉字硬笔书写智能指导和评分方法及指导评分系统。
背景技术
硬笔书法是书法中的一种,其上能称为艺术,下是我们日常生活中执笔书写的基石,学好硬笔书法或硬笔书写是汉语言文字学习的重要环节。
硬笔书法的书写工具包括钢笔、中性笔、美工笔、铅笔、粉笔等,以墨水或者粉状介质为主要载体来表现汉字和其他文字的书写技巧,其与毛笔书法的视觉区别主要在于笔画的粗壮或纤细,成像的原理和运动技巧有很大的不同,是两种不同的书写模式。
判断一个汉字撰写的好坏,主要需要考察它的线条与间架结构,且除了单个字要写得好看外,还要看它的布局章法,单独的一个字写得好只能被局部观赏,而间架结构,即一个字的笔画搭配,如笔画的长短、曲直、摆放的角度,笔画间的间距、粗细(轻重)、前后照应关系等才是显示撰写人基本功的内容。
现有技术中,学习硬笔书写一般通过于描、摹、临的方式,辅以教师或家长的评价和指点,描即是用笔直接在范字上描着写,摹是用透明纸蒙在范字上、在透明纸上描着范字写,而临则是比着范字,边看边写;在掌握了单个字的临写与书写后,就应当加强整篇的摹写与临写,在整篇临摹时,应当注意观察范字的大小、形状、排列的位置与摆放的角度、上下左右的照应关系等。
总的来说,在硬笔书法的学习过程中,首先要提高审美意识,其次要有运笔基本功,最后要多练、多看;直接对字帖进行临摹是一种非常快速的上手方式,但实际的独立执笔撰写却非临摹般简单,很多学习者往往学到最终写出了自己独特的字型,虽有自身特色,但笔画、架构不遵循合规的要求,并非优质的硬笔书法;进一步来说,不管是哪种书法,字模(字帖)繁多,在学习者的硬笔书写规范没有成型时,若没有及时加以干涉,将在极大程度上写成“四不像”。
发明内容
本发明解决了现有技术中存在的问题,提供了一种优化的汉字硬笔书写智能指导和评分方法及指导评分系统。
本发明所采用的技术方案是,一种汉字硬笔书写智能指导和评分方法,所述方法包括以下步骤:
步骤1:构建字库数据存储单元;
步骤2:采集书写视频流和/或用户书写的若干汉字的全幅图像,获得单个汉字图像或单个汉字图像队列;
步骤3:基于单个汉字图像或单个汉字图像队列识别得到用户书写的每个汉字,在字库数据存储单元进行检索;若检索成功,则对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息,进行下一步;否则,返回步骤3;
步骤4:对于书写的汉字进行评分及指导;
步骤5:若所有的全幅图像已经识别完毕,则结束,否则,返回步骤3。
优选地,所述字库数据存储单元包括:
一练习字模库,用于存放相同汉字的若干不同的练习字帖;
一字模书写规范信息库,用于存放对应每个不同的练习字帖中的每个汉字的书写规范,所述书写规范包括笔画的规范及笔画组合规范、偏旁部首规范信息;
一字模书写评分库,用于存放对应每个不同的练习字帖中的每个汉字的书写评分信息,所述书写评分信息包括汉字的结构评分信息、笔画评分信息。
优选地,所述步骤2包括以下步骤:
步骤2.1:采集书写视频流和/或用户书写的若干汉字的全幅图像;
步骤2.2:若采集到视频流,则进行步骤2.3,否则直接进行步骤2.4;
步骤2.3:检测用户书写截止点,若用户停止书写时间大于预设时间或用户另起一行进行书写,则分割用户当前书写的1个或多个单个汉字全幅图像;
步骤2.4:对所有的全幅图像进行单字分割;
步骤2.5:获得单个汉字图像或单个汉字图像队列。
优选地,所述步骤3中,确定当前手写汉字的结构信息包括以下步骤:
步骤3.1:取用户书写的任一汉字图像;
步骤3.2:对步骤3.1得到的图像,以RGB的3个通道像素值进行二值化处理,将像素值为预设范围的部分进行分离,获得书写部分;
步骤3.3:对书写部分进行重心计算,得到
Figure BDA0002307647230000031
其中,第i点的坐标为(xi,yi),
Figure BDA0002307647230000032
将书写部分调整到以重心为中心、预设像素点数为半径的标准范围内;n为像素点的个数;
步骤3.4:对书写部分的汉字进行识别,在字库数据存储单元中检索当前汉字对应的书写规范信息和书写评分信息;所述书写规范信息是由不同笔画骨架组成的标准骨架集合;
步骤3.5:若检索成功,对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息,进行步骤4;否则,返回步骤3.1。
优选地,所述步骤3.5中,对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息包括以下步骤:
步骤3.5.1:获取步骤3.3的标准范围内的汉字,对规范后的汉字进行骨架提取;得到任意两笔间交叉点的信息;
步骤3.5.2:以交叉点为切割依据,对整个汉字骨架进行切割,对交叉点间、交叉点与端点间、端点和端点间的骨架进行分离,形成骨架线段集合并保存;
步骤3.5.3:对交叉点的分叉形态进行分类,标记为丁字形和十字形,分类后的交叉点的分叉形态结合骨架线段集合,组成待评分汉字的笔画的骨架集合并保存;
步骤3.5.4:基于所述步骤3.4的标准骨架集合,对待评分汉字的笔画的骨架集合中的每个像素点与标准骨架集合的对应像素点进行距离计算,得到距离集合,距离集合中的每个元素
Figure BDA0002307647230000041
其中,nix和niy分别为待评分汉字的笔画的骨架集合中的第n笔画骨架的第i像素点的x轴和y轴坐标,mix和miy分别为标准骨架集合中对应第m笔画骨架第i像素点的x轴和y轴坐标,g为待评分汉字的笔画的骨架相对于标准骨架的方位,
Figure BDA0002307647230000042
步骤3.5.5:基于所述距离集合,得到待评分汉字的笔画的骨架集合像素点与标准骨架集合的最小距离集合,最小距离集合中的每个元素
Figure BDA0002307647230000043
步骤3.5.6:基于所述最小距离集合,形成待评分汉字的笔画的骨架集合与标准骨架间的距离函数
Figure BDA0002307647230000044
步骤3.5.7:根据距离函数,得到笔画骨架的第一个像素的距离值Dbgn、最后一个像素的距离值Dend、最大距离Dmax和最小距离Dmin,基于Dbgn、Dend、Dmax和Dmin得到待评分汉字的笔画的骨架与标准骨架之间的笔画平移关系T、笔画旋转关系A、笔画缩放比S;
步骤3.5.8:根据所述字库数据存储单元组合不同的笔画骨架构成偏旁部首,得到待评分汉字的骨架的偏旁部首与标准骨架的偏旁部首之间的相对位置信息,其中,偏旁部首平移关系
Figure BDA0002307647230000045
偏旁部首旋转关系
Figure BDA0002307647230000051
偏旁部首缩放比
Figure BDA0002307647230000052
n为笔画的个数,wi为对应的权值。
优选地,步骤4中,将待评分汉字的笔画及偏旁部首的平移、旋转、缩放信息,分别匹配字库数据存储单元中的评分信息,获得汉字的笔画分、偏旁部首分;
根据步骤3中得到重心坐标,计算待评分汉字的笔画骨架X轴的离散度
Figure BDA0002307647230000053
和Y轴的离散度
Figure BDA0002307647230000054
计算标准汉字的骨架X轴的离散度
Figure BDA0002307647230000055
和Y轴的离散度
Figure BDA0002307647230000056
得到离散度系数
Figure BDA0002307647230000057
基于离散度系数λx和λy,匹配字库数据存储单元中的评分信息,获得汉字的结构分。
优选地,所述步骤4中,指导为采集字库数据存储单元中的信息,播放当前对应的汉字的书写规范。
优选地,所述汉字的书写规范通过视频和音频的方式播放。
优选地,若书写的汉字中任一笔画与所有字帖中的对应笔画间的距离和/或夹角大于阈值,则对待评汉字中对应的笔画进行突出显示,同时将当前规范书写的汉字的对应笔画进行突出显示。
一种采用所述的汉字硬笔书写智能指导和评分方法的指导评分系统,所述系统包括:
一字库数据存储单元,用于采集信息并构建练习字模库、字模书写规范信息库和字模书写评分库,进而形成练习字模库、字模书写规范信息库和字模书写评分库间的对应关系;
一手写汉字采集单元,用于采集用户书写的汉字;
一识别单元,用于识别书写的汉字并根据识别信息从字库数据存储单元获得汉字对应的字模书写规范信息和字模书写评分信息;
一书写笔画分析单元,用于分析用户所写的汉字;
一书写评分单元,用于根据书写笔画分析单元的分析结果、结合字模书写评分库的评分规则、对用户书写的汉字评分;
一汉字书写指导单元,用于向用户展示书写中需要关注的书写规范。
本发明提供了一种优化的汉字硬笔书写智能指导和评分方法及指导评分系统,通过构建字库数据存储单元,组建练习字模库、字模书写规范信息库和字模书写评分库并形成对应关系,以手写汉字采集单元采集用户书写的若干汉字的全幅图像或视频流,获得单个汉字图像的队列,识别得到用户书写的每个汉字,在字库数据存储单元进行检索,检索成功,则对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息,以书写评分单元对于书写的汉字进行评分、以汉字书写指导单元对用户进行指导,直至所有的全幅图像识别完毕。
本发明基于不同的字模规范硬笔书写用户的书写范围,利用硬笔书法中笔画骨架明确的特征对用户书写的汉字进行分解,并从独立的笔画和整体的架构上对用户的书写进行校正,使得用户能专注于某种或某几种字模、不发生混淆,笔画、架构遵循标准,以汉字笔画拆解的方式对用户进行辅导,让用户能更直观的看到自己的书写存在的问题并加以改正。
附图说明
图1为本发明的方法流程图;
图2为本发明的系统结构示意图,其中,箭头表示数据传输的方向。
具体实施方式
下面结合实施例对本发明做进一步的详细描述,但本发明的保护范围并不限于此。
本发明涉及一种汉字硬笔书写智能指导和评分方法,所述方法包括以下步骤。
步骤1:构建字库数据存储单元。
所述字库数据存储单元包括:
一练习字模库,用于存放相同汉字的若干不同的练习字帖;
一字模书写规范信息库,用于存放对应每个不同的练习字帖中的每个汉字的书写规范,所述书写规范包括笔画的规范及笔画组合规范、偏旁部首规范信息;
一字模书写评分库,用于存放对应每个不同的练习字帖中的每个汉字的书写评分信息,所述书写评分信息包括汉字的结构评分信息、笔画评分信息。
本发明中,字库数据存储单元即为一数据库,用于存放所有涉及到字模(字帖)、字模规范及评分标准的内容。
本发明中,练习字模库即是存放了大量的字帖中的汉字信息,一般来说,其以具体的汉字、字模为特征,建立索引。
本发明中,字模书写规范信息库首先是以汉字本身进行索引、与练习字模库进行对接,即在确认某个汉字的前提下,就可以基于索引,在字模书写规范信息库中采集对应这个汉字的规范信息,规范信息包括但不限于笔画的规范及笔画组合规范、偏旁部首规范信息。
本发明中,字模书写评分库同理,首先以汉字本身进行索引、与练习字模库进行对接,在确认某个汉字的前提下,基于索引,在字模书写评分库中采集对应这个汉字的评分信息,评分信息包括但不限于汉字的结构评分信息、笔画评分信息。
本发明中,主要关注结构和笔画方面的规范及评分信息。
步骤2:采集书写视频流和/或用户书写的若干汉字的全幅图像,获得单个汉字图像或单个汉字图像队列。
所述步骤2包括以下步骤:
步骤2.1:采集书写视频流和/或用户书写的若干汉字的全幅图像;
步骤2.2:若采集到视频流,则进行步骤2.3,否则直接进行步骤2.4;
步骤2.3:检测用户书写截止点,若用户停止书写时间大于预设时间或用户另起一行进行书写,则分割用户当前书写的1个或多个单个汉字全幅图像;
步骤2.4:对所有的全幅图像进行单字分割;
步骤2.5:获得单个汉字图像或单个汉字图像队列。
本发明中,前提是用户应当预先选择适合的字模,便于文字识别后的对应。
本发明中,采集用户书写的视频流、1幅或多幅汉字的全幅图像,在这个过程中,可以要求用户在标准练字帖,如米字格的字帖上进行书写,同时只截取标准练字帖的基准点内的汉字,如米字格区域,其目的主要在于规范用户书写的幅度,而如果存在部分笔画在基准点外,当前笔画则属于需要被纠正的笔画,不会影响后续识别及分析的结果。
本发明中,主要也允许了用户直接在普通纸上进行书写,此时采取的视频流需要判断内容采集时刻,一般需要判断用户书写的截止点,如用户停止书写时间大于5秒,此可以由用户跟踪算法进行处理,具体来说,对视频中的手部图像进行框选,若手部持续移动,则表示用户仍在书写中,选框停止超过预设时间则表示用户停止书写;另一种情况是用户书写换行,此时的视频采集近似于全幅图像采集,采集的为已完结的一行的图像。
本发明中,对全幅画像进行单字分割可以采用现有的图像分割技术,通过识别字与字之间的空隙进行,此为本领域技术人员容易理解的内容,本领域技术人员可以依据需求自行设置,最后得到单个汉字图像或是图像的队列。
步骤3:基于单个汉字图像或单个汉字图像队列识别得到用户书写的每个汉字,在字库数据存储单元进行检索;若检索成功,则对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息,进行下一步;否则,返回步骤3。
所述步骤3中,确定当前手写汉字的结构信息包括以下步骤:
步骤3.1:取用户书写的任一汉字图像;
步骤3.2:对步骤3.1得到的图像,以RGB的3个通道像素值进行二值化处理,将像素值为预设范围的部分进行分离,获得书写部分;
步骤3.3:对书写部分进行重心计算,得到
Figure BDA0002307647230000091
其中,第i点的坐标为(xi,yi),
Figure BDA0002307647230000092
将书写部分调整到以重心为中心、预设像素点数为半径的标准范围内;n为像素点的个数;
步骤3.4:对书写部分的汉字进行识别,在字库数据存储单元中检索当前汉字对应的书写规范信息和书写评分信息;所述书写规范信息是由不同笔画骨架组成的标准骨架集合;
步骤3.5:若检索成功,对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息,进行步骤4;否则,返回步骤3.1。
所述步骤3.5中,对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息包括以下步骤:
步骤3.5.1:获取步骤3.3的标准范围内的汉字,对规范后的汉字进行骨架提取;得到任意两笔间交叉点的信息;
步骤3.5.2:以交叉点为切割依据,对整个汉字骨架进行切割,对交叉点间、交叉点与端点间、端点和端点间的骨架进行分离,形成骨架线段集合并保存;
步骤3.5.3:对交叉点的分叉形态进行分类,标记为丁字形和十字形,分类后的交叉点的分叉形态结合骨架线段集合,组成待评分汉字的笔画的骨架集合并保存;
步骤3.5.4:基于所述步骤3.4的标准骨架集合,对待评分汉字的笔画的骨架集合中的每个像素点与标准骨架集合的对应像素点进行距离计算,得到距离集合,距离集合中的每个元素
Figure BDA0002307647230000101
其中,nix和niy分别为待评分汉字的笔画的骨架集合中的第n笔画骨架的第i像素点的x轴和y轴坐标,mix和miy分别为标准骨架集合中对应第m笔画骨架第i像素点的x轴和y轴坐标,g为待评分汉字的笔画的骨架相对于标准骨架的方位,
Figure BDA0002307647230000102
步骤3.5.5:基于所述距离集合,得到待评分汉字的笔画的骨架集合像素点与标准骨架集合的最小距离集合,最小距离集合中的每个元素
Figure BDA0002307647230000103
步骤3.5.6:基于所述最小距离集合,形成待评分汉字的笔画的骨架集合与标准骨架间的距离函数
Figure BDA0002307647230000104
步骤3.5.7:根据距离函数,得到笔画骨架的第一个像素的距离值Dbgn、最后一个像素的距离值Dend、最大距离Dmax和最小距离Dmin,基于Dbgn、Dend、Dmax和Dmin得到待评分汉字的笔画的骨架与标准骨架之间的笔画平移关系T、笔画旋转关系A、笔画缩放比S;
步骤3.5.8:根据所述字库数据存储单元组合不同的笔画骨架构成偏旁部首,得到待评分汉字的骨架的偏旁部首与标准骨架的偏旁部首之间的相对位置信息,其中,偏旁部首平移关系
Figure BDA0002307647230000105
偏旁部首旋转关系
Figure BDA0002307647230000106
偏旁部首缩放比
Figure BDA0002307647230000107
n为笔画的个数,wi为对应的权值。
本发明中,步骤3.1得到的图像还包括了纸张本身的颜色、基准点(或线)的颜色,故需要对其进行处理,具体来说,步骤3.2基于RGB向量,对3个通道内的像素值进行二值化处理、并取出预设范围内的部分作为书写部分;考虑到硬笔书法实际上本身就是骨架比较明确的书法种类,故周围噪点可以直接排除。
本发明中,步骤3.3主要将书写部分进行对中心处理,保证后续的拆解及比对能以重心为基准进行。
本发明中,步骤3.4中,对书写部分的汉字进行识别可以采用多种内置软件完成,如OCR文字识别软件,在识别到文字后,即对用户选定的字模中当前文字的书写规范信息和书写评分信息进行调取,准备后续的步骤。
本发明中,书写规范信息首先摘取出当前汉字在当前字模中的标准骨架集合,其中,骨架是指硬笔书法中每一笔的结构,其包括了每一笔画的端点、拐点信息。
本发明中,步骤3.5对汉字进行分解,从笔画、结构和偏旁部首的角度对汉字进行解析。
本发明中,步骤3.5中,首先基于同样的逻辑提取待评分汉字的骨架,以当前汉字中每两笔的交叉点进行骨架切割,形成的将是不包括交叉点的骨架线段集合;此时,基于交叉点的分叉形态将交叉点进行分类,与骨架线段集合共同形成笔画的骨架集合;随后,计算对应像素点的距离、得到表示笔画接近的最小距离集合及基于其的距离函数。
本发明中,基于距离函数,得到待评分汉字的笔画的骨架与标准骨架之间的笔画平移关系T、笔画旋转关系A、笔画缩放比S:
若Dbgn≈Dend≈Dmax≈Dmin,则T为四者之和的平均值;
若Dbgn≈Dmin且Dend≈Dmax,则A为
Figure BDA0002307647230000111
Figure BDA0002307647230000112
其中,Pbgn和Pend分别表示起点和终点。
本发明中,得到笔画的基础信息后,将笔画组成偏旁部首,即构建较大的结构体,以求平均值的方式进一步判定汉字整体的偏移、旋转或缩放信息。
本发明中,偏旁部首平移关系、偏旁部首旋转关系、偏旁部首缩放比中,Ti表示第i个笔画的笔画平移关系,Ai表示第i个笔画的笔画旋转关系,Si表示第i个笔画的笔画缩放比,对应赋以权值,最后以乘积之和与总笔画数取平均值,即可以较好的表达偏旁部首整体的平移关系、旋转关系和缩放比。
步骤4:对于书写的汉字进行评分及指导。
步骤4中,将待评分汉字的笔画及偏旁部首的平移、旋转、缩放信息,分别匹配字库数据存储单元中的评分信息,获得汉字的笔画分、偏旁部首分;
根据步骤3中得到重心坐标,计算待评分汉字的笔画骨架X轴的离散度
Figure BDA0002307647230000121
和Y轴的离散度
Figure BDA0002307647230000122
计算标准汉字的骨架X轴的离散度
Figure BDA0002307647230000123
和Y轴的离散度
Figure BDA0002307647230000124
得到离散度系数
Figure BDA0002307647230000125
基于离散度系数λx和λy,匹配字库数据存储单元中的评分信息,获得汉字的结构分。
所述步骤4中,指导为采集字库数据存储单元中的信息,播放当前对应的汉字的书写规范。
所述汉字的书写规范通过视频和音频的方式播放。
若书写的汉字中任一笔画与所有字帖中的对应笔画间的距离和/或夹角大于阈值,则对待评汉字中对应的笔画进行突出显示,同时将当前规范书写的汉字的对应笔画进行突出显示。
本发明中,步骤4中,将待评分汉字的笔画及偏旁部首的平移、旋转、缩放信息分别匹配字库数据存储单元中的评分信息,获得汉字的笔画分、偏旁部首的结构分和整个字的整体结构分,分别附权值,得到对于待评分汉字的总体评分,权值的赋值可以由本领域技术人员对于设备及方法的侧重点自行设置。
本发明中,对于偏旁部首的结构分和整个字的整体结构分,举例来说,可以基于以上汉字的偏移、旋转和缩放信息进行综合评价,得到
Figure BDA0002307647230000131
其中,w1+w2+w3=1;进一步地,可以设置待评分汉字与标准汉字的离散度系数,系数越大表示差距越远,则权值赋值越低,反之权值高。此为本领域技术人员容易理解的内容,本领域技术人员可以依据需求自行设置。
本发明中,指导可以通过视频或音频的形式进行,音频满足了视弱或视障群体的教学需求,一般来说,可以由内置讲师通过分析每一笔画的位置、结构等信息,进行指导。
本发明中,较优的指导方式为通过视频播放教学视频,同时,当存在较大的书写偏差时,对于出现问题的笔画,将投射到视频中对应的汉字的笔画上,进行双向高亮,帮助用户进行了解。此为本领域技术人员容易理解的内容,本领域技术人员可以依据需求自行设置。
步骤5:若所有的全幅图像已经识别完毕,则结束,否则,返回步骤3。
本发明还涉及一种采用所述的汉字硬笔书写智能指导和评分方法的指导评分系统,所述系统包括:
一字库数据存储单元,用于采集信息并构建练习字模库、字模书写规范信息库和字模书写评分库,进而形成练习字模库、字模书写规范信息库和字模书写评分库间的对应关系;
一手写汉字采集单元,用于采集用户书写的汉字;
一识别单元,用于识别书写的汉字并根据识别信息从字库数据存储单元获得汉字对应的字模书写规范信息和字模书写评分信息;
一书写笔画分析单元,用于分析用户所写的汉字;
一书写评分单元,用于根据书写笔画分析单元的分析结果、结合字模书写评分库的评分规则、对用户书写的汉字评分;
一汉字书写指导单元,用于向用户展示书写中需要关注的书写规范。
本发明中,当前系统中,手写汉字采集单元主要为摄像头等图像或视频采集设备,其主要用于采集用户书写的汉字;当采用视频进行采集时,由于采集的为视频流,故还需要对采集的每一帧视频图像进行调整,包括校正及扭曲。
本发明中,字库数据存储单元、识别单元、书写笔画分析单元和书写评分单元均为内置在控制端内的执行单元,可以直接安装在PC机中,或是通过远程服务器提供服务。
本发明中,汉字书写指导单元一般采用播放设备进行播放,可以是视频播放器或音频播放器。
本发明通过构建字库数据存储单元,组建练习字模库、字模书写规范信息库和字模书写评分库并形成对应关系,以手写汉字采集单元采集用户书写的若干汉字的全幅图像或视频流,获得单个汉字图像的队列,识别得到用户书写的每个汉字,在字库数据存储单元进行检索,检索成功,则对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息,以书写评分单元对于书写的汉字进行评分、以汉字书写指导单元对用户进行指导,直至所有的全幅图像识别完毕。
本发明基于不同的字模规范硬笔书写用户的书写范围,利用硬笔书法中笔画骨架明确的特征对用户书写的汉字进行分解,并从独立的笔画和整体的架构上对用户的书写进行校正,使得用户能专注于某种或某几种字模、不发生混淆,笔画、架构遵循标准,以汉字笔画拆解的方式对用户进行辅导,让用户能更直观的看到自己的书写存在的问题并加以改正。

Claims (9)

1.一种汉字硬笔书写智能指导和评分方法,其特征在于:所述方法包括以下步骤:
步骤1:构建字库数据存储单元;
步骤2:采集书写视频流和/或用户书写的若干汉字的全幅图像,获得单个汉字图像或单个汉字图像队列;
步骤3:基于单个汉字图像或单个汉字图像队列识别得到用户书写的每个汉字,在字库数据存储单元进行检索;若检索成功,则对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息,进行下一步;否则,返回步骤3;
对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息包括以下步骤:
步骤3.5.1:获取标准范围内的汉字,对规范后的汉字进行骨架提取;得到任意两笔间交叉点的信息;
步骤3.5.2:以交叉点为切割依据,对整个汉字骨架进行切割,对交叉点间、交叉点与端点间、端点和端点间的骨架进行分离,形成骨架线段集合并保存;
步骤3.5.3:对交叉点的分叉形态进行分类,标记为丁字形和十字形,分类后的交叉点的分叉形态结合骨架线段集合,组成待评分汉字的笔画的骨架集合并保存;
步骤3.5.4:基于标准骨架集合,对待评分汉字的笔画的骨架集合中的每个像素点与标准骨架集合的对应像素点进行距离计算,得到距离集合,距离集合中的每个元素
Figure FDA0003576787980000021
其中,nix和niy分别为待评分汉字的笔画的骨架集合中的第n笔画骨架的第i像素点的x轴和y轴坐标,mix和miy分别为标准骨架集合中对应第m笔画骨架第i像素点的x轴和y轴坐标,g为待评分汉字的笔画的骨架相对于标准骨架的方位,
Figure FDA0003576787980000022
步骤3.5.5:基于所述距离集合,得到待评分汉字的笔画的骨架集合像素点与标准骨架集合的最小距离集合,最小距离集合中的每个元素
Figure FDA0003576787980000023
步骤3.5.6:基于所述最小距离集合,形成待评分汉字的笔画的骨架集合与标准骨架间的距离函数
Figure FDA0003576787980000024
步骤3.5.7:根据距离函数,得到笔画骨架的第一个像素的距离值Dbgn、最后一个像素的距离值Dend、最大距离Dmax和最小距离Dmin,基于Dbgn、Dend、Dmax和Dmin得到待评分汉字的笔画的骨架与标准骨架之间的笔画平移关系T、笔画旋转关系A、笔画缩放比S;
步骤3.5.8:根据所述字库数据存储单元组合不同的笔画骨架构成偏旁部首,得到待评分汉字的骨架的偏旁部首与标准骨架的偏旁部首之间的相对位置信息,其中,偏旁部首平移关系
Figure FDA0003576787980000025
偏旁部首旋转关系
Figure FDA0003576787980000026
偏旁部首缩放比
Figure FDA0003576787980000027
n为笔画的个数,wi为对应的权值;
步骤4:对于书写的汉字进行评分及指导;
步骤5:若所有的全幅图像已经识别完毕,则结束,否则,返回步骤3。
2.根据权利要求1所述的一种汉字硬笔书写智能指导和评分方法,其特征在于:所述字库数据存储单元包括:
一练习字模库,用于存放相同汉字的若干不同的练习字帖;
一字模书写规范信息库,用于存放对应每个不同的练习字帖中的每个汉字的书写规范,所述书写规范包括笔画的规范及笔画组合规范、偏旁部首规范信息;
一字模书写评分库,用于存放对应每个不同的练习字帖中的每个汉字的书写评分信息,所述书写评分信息包括汉字的结构评分信息、笔画评分信息。
3.根据权利要求1所述的一种汉字硬笔书写智能指导和评分方法,其特征在于:所述步骤2包括以下步骤:
步骤2.1:采集书写视频流和/或用户书写的若干汉字的全幅图像;
步骤2.2:若采集到视频流,则进行步骤2.3,否则直接进行步骤2.4;
步骤2.3:检测用户书写截止点,若用户停止书写时间大于预设时间或用户另起一行进行书写,则分割用户当前书写的1个或多个单个汉字全幅图像;
步骤2.4:对所有的全幅图像进行单字分割;
步骤2.5:获得单个汉字图像或单个汉字图像队列。
4.根据权利要求1所述的一种汉字硬笔书写智能指导和评分方法,其特征在于:所述步骤3中,确定当前手写汉字的结构信息包括以下步骤:
步骤3.1:取用户书写的任一汉字图像;
步骤3.2:对步骤3.1得到的图像,以RGB的3个通道像素值进行二值化处理,将像素值为预设范围的部分进行分离,获得书写部分;
步骤3.3:对书写部分进行重心计算,得到
Figure FDA0003576787980000041
其中,第i点的坐标为(xi,yi),
Figure FDA0003576787980000042
将书写部分调整到以重心为中心、预设像素点数为半径的标准范围内;n为像素点的个数;
步骤3.4:对书写部分的汉字进行识别,在字库数据存储单元中检索当前汉字对应的书写规范信息和书写评分信息;所述书写规范信息是由不同笔画骨架组成的标准骨架集合;
步骤3.5:若检索成功,对用户所写的汉字进行逐层分析,确定当前手写汉字的结构信息,进行步骤4;否则,返回步骤3.1。
5.根据权利要求1所述的一种汉字硬笔书写智能指导和评分方法,其特征在于:步骤4中,将待评分汉字的笔画及偏旁部首的平移、旋转、缩放信息,分别匹配字库数据存储单元中的评分信息,获得汉字的笔画分、偏旁部首分;
根据步骤3中得到重心坐标,计算待评分汉字的笔画骨架X轴的离散度
Figure FDA0003576787980000043
和Y轴的离散度
Figure FDA0003576787980000044
计算标准汉字的骨架X轴的离散度
Figure FDA0003576787980000051
和Y轴的离散度
Figure FDA0003576787980000052
得到离散度系数
Figure FDA0003576787980000053
基于离散度系数λx和λy,匹配字库数据存储单元中的评分信息,获得汉字的结构分。
6.根据权利要求1所述的一种汉字硬笔书写智能指导和评分方法,其特征在于:所述步骤4中,指导为采集字库数据存储单元中的信息,播放当前对应的汉字的书写规范。
7.根据权利要求6所述的一种汉字硬笔书写智能指导和评分方法,其特征在于:所述汉字的书写规范通过视频和音频的方式播放。
8.根据权利要求7所述的一种汉字硬笔书写智能指导和评分方法,其特征在于:若书写的汉字中任一笔画与所有字帖中的对应笔画间的距离和/或夹角大于阈值,则对待评汉字中对应的笔画进行突出显示,同时将当前规范书写的汉字的对应笔画进行突出显示。
9.一种采用权利要求1~8之一所述的汉字硬笔书写智能指导和评分方法的指导评分系统,其特征在于:所述系统包括:
一字库数据存储单元,用于采集信息并构建练习字模库、字模书写规范信息库和字模书写评分库,进而形成练习字模库、字模书写规范信息库和字模书写评分库间的对应关系;
一手写汉字采集单元,用于采集用户书写的汉字;
一识别单元,用于识别书写的汉字并根据识别信息从字库数据存储单元获得汉字对应的字模书写规范信息和字模书写评分信息;
一书写笔画分析单元,用于分析用户所写的汉字;
一书写评分单元,用于根据书写笔画分析单元的分析结果、结合字模书写评分库的评分规则、对用户书写的汉字评分;
一汉字书写指导单元,用于向用户展示书写中需要关注的书写规范。
CN201911246837.3A 2019-12-07 2019-12-07 一种汉字硬笔书写智能指导和评分方法及指导评分系统 Active CN111881310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911246837.3A CN111881310B (zh) 2019-12-07 2019-12-07 一种汉字硬笔书写智能指导和评分方法及指导评分系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911246837.3A CN111881310B (zh) 2019-12-07 2019-12-07 一种汉字硬笔书写智能指导和评分方法及指导评分系统

Publications (2)

Publication Number Publication Date
CN111881310A CN111881310A (zh) 2020-11-03
CN111881310B true CN111881310B (zh) 2022-05-06

Family

ID=73154202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911246837.3A Active CN111881310B (zh) 2019-12-07 2019-12-07 一种汉字硬笔书写智能指导和评分方法及指导评分系统

Country Status (1)

Country Link
CN (1) CN111881310B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597876B (zh) * 2020-12-20 2024-03-26 湖北工业大学 基于特征融合的书法汉字评判方法
CN112580574A (zh) * 2020-12-28 2021-03-30 北京翰立教育科技有限公司 一种基于识别手写文字的智能学习方法及装置
CN112634262A (zh) * 2020-12-31 2021-04-09 浙江优学智能科技有限公司 一种基于互联网的写字质量评价方法
CN114141099A (zh) * 2021-03-12 2022-03-04 上海指通信息科技有限公司 用于书法练习的标靶格和临摹字帖、基于标靶格的书法临摹字比对评价系统及比对评价步骤
CN113191309A (zh) * 2021-05-19 2021-07-30 杭州点望科技有限公司 一种手写汉字的识别、评分、纠错方法及系统
CN113591743B (zh) * 2021-08-04 2023-11-24 中国人民大学 书法视频识别方法、系统、存储介质及计算设备
CN113642561A (zh) * 2021-08-25 2021-11-12 广东知乐技术有限公司 一种书法作品智能评分方法和装置
CN114549993B (zh) * 2022-02-28 2022-11-11 成都西交智汇大数据科技有限公司 实验中线段图像的评分方法、系统、设备及可读存储介质
CN114801552A (zh) * 2022-05-17 2022-07-29 江苏大学 智能毛笔书写与评价系统及应用方法
CN115471849B (zh) * 2022-11-03 2023-06-06 南京信息工程大学 一种手写汉字图像评估方法及系统
CN115841671B (zh) * 2023-02-21 2023-06-06 南京信息工程大学 一种书法字骨架矫正方法、系统及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102842046B (zh) * 2012-08-07 2015-09-23 天津大学 一种基于全局特征提取和训练的书法风格识别方法
CN104821005B (zh) * 2015-05-12 2017-10-10 南京师范大学 可模拟笔势风格的汉字书法作品书写过程动态复现的方法
CN104966096A (zh) * 2015-06-10 2015-10-07 南京师范大学 一种基于重要书写特征标注的手写汉字工整性评价方法
JP6586055B2 (ja) * 2016-07-13 2019-10-02 日本電信電話株式会社 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム
CN108734165A (zh) * 2018-05-07 2018-11-02 百度在线网络技术(北京)有限公司 基于人工智能的书法质量检测方法、装置和电子设备
CN110189579A (zh) * 2019-06-21 2019-08-30 洪克 一种国学练字教学系统及方法

Also Published As

Publication number Publication date
CN111881310A (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
CN111881310B (zh) 一种汉字硬笔书写智能指导和评分方法及指导评分系统
CN109271945B (zh) 一种在线实现作业批改的方法和系统
CN110348400B (zh) 一种评分获取方法、装置及电子设备
WO2021051024A1 (en) Editable notetaking resource with optional overlay
CN110275987B (zh) 智能教学顾问生成方法、系统、设备及存储介质
CN110085068A (zh) 一种基于图像识别的学习辅导方法及装置
CN103632169A (zh) 一种文字书写自动纠错方法和设备
Yadav et al. Content-driven multi-modal techniques for non-linear video navigation
CN113537801B (zh) 板书处理方法、装置、终端和存储介质
KR102101496B1 (ko) Ar 기반의 글씨 쓰기 연습 방법 및 프로그램
CN111985184A (zh) 基于ai视觉下的书写字体临摹辅助方法、系统、装置
CN112699840A (zh) 书写过程评价与反馈方法、及其系统、计算机存储介质
CN112836542B (zh) 基于点阵码的练字方法、系统及计算机可读介质
CN114821620A (zh) 基于行文本框纵向合并的文本内容提取识别方法
CN117095414A (zh) 一种基于点阵纸笔的手写识别系统及识别方法
CN113360608A (zh) 人机结合的中文作文批改系统和方法
Ouali et al. Real-time application for recognition and visualization of arabic words with vowels based dl and ar
Thiengtham et al. Improve template matching method in mobile augmented reality for thai alphabet learning
CN110910290A (zh) 基于点阵笔技术进行错题管理的方法
CN115294573A (zh) 作业批改方法、装置、设备及介质
Gandhi et al. Topic Transition in Educational Videos Using Visually Salient Words.
CN114792425A (zh) 一种基于人工智能算法的考生试卷照片错题自动整理方法及相关算法
CN107886808B (zh) 一种盲文方辅助标注方法及系统
CN111461019B (zh) 一种汉字书写质量的评价方法、系统及设备
TWI710969B (zh) 語言字彙學習之分析統計系統及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant