CN115240206A - 手写字迹鉴别方法及系统 - Google Patents

手写字迹鉴别方法及系统 Download PDF

Info

Publication number
CN115240206A
CN115240206A CN202210900388.5A CN202210900388A CN115240206A CN 115240206 A CN115240206 A CN 115240206A CN 202210900388 A CN202210900388 A CN 202210900388A CN 115240206 A CN115240206 A CN 115240206A
Authority
CN
China
Prior art keywords
basic configuration
handwriting
writing
unit
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210900388.5A
Other languages
English (en)
Inventor
谷朝臣
官同坤
王臻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202210900388.5A priority Critical patent/CN115240206A/zh
Publication of CN115240206A publication Critical patent/CN115240206A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19013Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/164Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/186Extraction of features or characteristics of the image by deriving mathematical or geometrical properties from the whole image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明涉及字迹鉴别技术领域内的一种手写字迹鉴别方法及系统,包括:基础构型建库步骤:对待鉴别字迹进行字迹背景处理后,将待鉴别字迹进行书写模块化处理,提取基础构型鉴别单元,所述基础构型鉴别单元作为待鉴别确定的对象,并通过二值化图像进行存储;真实字迹基础构型拆分步骤:对待鉴别字迹假设书写者的在先书写字迹进行字迹背景处理后拆分形成基础构型比对单元,并以二值化的字迹模块图像进行存储,所述基础构型比对单元与所述基础构型鉴别单元中的基础构型相匹配;字迹真伪鉴别步骤:将所述基础构型鉴别单元和所述基础构型比对单元进行比对分析,确定书写者的身份。本发明通过新型的特征比对方法,克服了需召集专家进行打分和对比的问题。

Description

手写字迹鉴别方法及系统
技术领域
本发明涉及字迹鉴别技术领域,具体地,涉及一种手写字迹鉴别方法及系统。
背景技术
在企业管理、刑侦领域经常遇到关键人物字迹真伪鉴别的问题,目前的鉴别手段主要依靠专家完成,无法做到经常性使用。
例如,中国发明专利公开号为CN104077604B,公开了一种文本内容无关的褶皱中文手写体鉴别方法,该方法包括:1)将手写体文本扫描后输入到计算机,对得到的手写体图像进行预处理;2)根据手写体图像建立图片数据库;3)对图片数据库中的每张图片进行散射变换,得到其散射系数;4)对散射系数进行拟合,并建立统计模型;5)查找与待鉴别的手写体图像相对应的统计模型;6)计算待鉴别的手写体图像与候选图片之间的KL距离;7)计算识别准确率;8)对实验结果进行对比分析和统计。该发明虽然是通过计算机进行识别,但主要是用于解决褶皱对字体所带来的影响,且算法程序较为复杂,计算量较大。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种手写字迹鉴别方法及系统。
根据本发明提供的一种手写字迹鉴别方法,包括如下步骤:
基础构型建库步骤:对待鉴别字迹进行字迹背景处理后,将待鉴别字迹进行书写模块化处理,提取基础构型鉴别单元,所述基础构型鉴别单元作为待鉴别确定的对象,并通过二值化图像进行存储;
真实字迹基础构型拆分步骤:对待鉴别字迹假设书写者的在先书写字迹进行字迹背景处理后拆分形成基础构型比对单元,并以二值化的字迹模块图像进行存储,所述基础构型比对单元与所述基础构型鉴别单元中的基础构型相匹配;
字迹真伪鉴别步骤:将所述基础构型鉴别单元和所述基础构型比对单元进行比对分析,确定书写者的身份。
一些实施方式中,所述字迹背景处理通过对字迹进行降噪、水平矫正以及表格线删除获取纯净手写字迹,并对纯净手写字迹的书写主方向进行提取操作。
一些实施方式中,所述书写主方向为通过多个不连续字迹块的形心连线平均值性,所述不连续字迹块通过连通域提取方法进行字迹块分离,并通过基础构型外接长方形的中心作为每个字迹块的形心;
预设外接长方形中心坐标为(x1,y1),(x2,y2),…,(xn,yn),书写主方向的斜率为:
Figure BDA0003770725870000021
其中,n为字数。
一些实施方式中,所述基础构型鉴别单元与所述基础构型比对单元通过离断笔划提取、连续笔划分裂和转折过渡笔划形成的基础构型。
一些实施方式中,所述基础构型比对单元通过与所述基础构型鉴别单元进行多尺度模板匹配,采用降尺度像素重合比例进行相同基础构型的筛选和提取。
一些实施方式中,通过对基础构型外接矩形长宽比、像素中心位置偏移量和笔划起收角度对所述基础构型鉴别单元和所述基础构型比对单元中的基础构型进行比对分析。
一些实施方式中,所述基础构型外接矩形长宽比为:基础构型的外接矩形中分别与书写主方向平行和垂直的两条边的比值。
一些实施方式中,所述基础构型像素中心位置偏移量为:基础构型的外接矩形的中心坐标(xI1,yI1)与像素重心坐标(xI2,yI2)的连线矢量
Figure BDA0003770725870000022
由基础构型外接矩形与书写主方向平行的边
Figure BDA0003770725870000023
的夹角斜率q和长度比值α确定:
Figure BDA0003770725870000024
Figure BDA0003770725870000025
一些实施方式中,所述笔划起收角度为基础构型的起笔拟合直线与终笔拟合直线的夹角。
与现有技术相比,本发明具有如下的有益效果:
本发明采用基础构型的比对,通过待大量真实字迹库基础构型的提取、比对,解决了字迹鉴别真伪需要寻求本人进行同样文字书写的问题,同时通过新型的特征比对方法,克服了需要召集专家进行打分和对比的问题,能够由非专业人员独立完成。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明字迹鉴别流程图;
图2为本发明书写主方向的提取示意图;
图3为本发明基础构型提取示意图;
图4为本发明基础构型外接矩形长宽比以及像素中心位置偏移量示意图;
图5为本发明笔划起收角度示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1
本发明提供了一种基于基础构型的手写字迹鉴别方法,通过字迹的基础构型拆析、大量以往字迹的比对,解决了目前需要召集专家的问题,能够做到经常性应用。本发明提供的手写字迹鉴别方法,参见图1所示,具体包括如下步骤:
基础构型建库步骤:对待鉴别字迹进行字迹背景处理后,将待鉴别字迹进行书写模块化处理,提取基础构型鉴别单元,所述基础构型鉴别单元作为待鉴别确定的对象,并通过二值化图像进行存储。其中:
字迹背景处理程序中,通过对字迹进行降噪、水平矫正以及表格线删除获取纯净手写字迹,并对纯净手写字迹的书写主方向进行提取操作。相应地,字迹的书写主方向的提取操作是通过所述书写主方向为通过多个不连续字迹块的形心连线平均值,所述不连续字迹块通过连通域提取方法进行字迹块分离,并通过基础构型外接长方形的中心作为每个字迹块的形心,参见图2所示。
预设外接长方形中心坐标为(x1,y1),(x2,y2),…,(xn,yn),书写主方向的斜率为:
Figure BDA0003770725870000031
其中,n为字数。
基础构型鉴别单元提取中,参见图3所示,包括基于连通域的离断笔划自动推荐、人机交互连续笔划分裂以及转折过渡笔划等步骤提取出的字迹的基础构型,其基础构型鉴别单元中包括多组用于鉴别的不同基础构型,且基础构型鉴别单元中的基础构型通过二值化图像进行存储。
真实字迹基础构型拆分步骤:对待鉴别字迹假设书写者的在先书写字迹进行字迹背景处理后拆分形成基础构型比对单元,并以二值化的字迹模块图像进行存储,所述基础构型比对单元与所述基础构型鉴别单元中的基础构型相匹配。其中:
字迹背景处理程序与基础构型建库步骤中字迹背景处理程序相同,经处理后获得现在先书写的纯净手写字迹并以二值化的字迹模块图像进行存储,再将字迹模块与基础构型鉴别单元进行多尺度模板匹配,并通过降尺度像素重合比例进行相同基础构型的筛选和提取,其提取的程序同样是基于连通域的离断笔划自动推荐、人机交互连续笔划分裂以及转折过渡笔划等步骤提取出的字迹的基础构型。
字迹真伪鉴别步骤:通过对基础构型外接矩形长宽比、像素中心位置偏移量和笔划起收角度对所述基础构型鉴别单元和所述基础构型比对单元中的基础构型进行比对分析,根据笔划起收角度一致性、邻近构型比例判断以及转折形状一致性对字迹真伪进行综合判断。其中:
参见图4所示,所述基础构型外接矩形长宽比为:基础构型的外接矩形中分别与书写主方向平行和垂直的两条边的比值。所述基础构型像素中心位置偏移量为:基础构型的外接矩形的中心坐标(xI1,yI1)与像素重心坐标(xI2,yI2)的连线矢量
Figure BDA0003770725870000041
由基础构型外接矩形与书写主方向平行的边
Figure BDA0003770725870000042
的夹角斜率q和长度比值α确定:
Figure BDA0003770725870000043
Figure BDA0003770725870000044
参见图5所示,所述笔划起收角度为基础构型的起笔拟合直线与终笔拟合直线的夹角。
实施例2
本实施例2是在实施例1的基础上形成的一种手写字迹鉴别系统,包括如下步骤:
基础构型建库模块:对待鉴别字迹进行字迹背景处理后,将待鉴别字迹进行书写模块化处理,提取基础构型鉴别单元,所述基础构型鉴别单元作为待鉴别确定的对象,并通过二值化图像进行存储;
真实字迹基础构型拆分模块:对待鉴别字迹假设书写者的在先书写字迹进行字迹背景处理后拆分形成基础构型比对单元,并以二值化的字迹模块图像进行存储,所述基础构型比对单元与所述基础构型鉴别单元中的基础构型相匹配;
字迹真伪鉴别模块:将所述基础构型鉴别单元和所述基础构型比对单元进行比对分析,确定书写者的身份。
各模块的运行方法同实施例1。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种手写字迹鉴别方法,其特征在于,包括如下步骤:
基础构型建库步骤:对待鉴别字迹进行字迹背景处理后,将待鉴别字迹进行书写模块化处理,提取基础构型鉴别单元,所述基础构型鉴别单元作为待鉴别确定的对象,并通过二值化图像进行存储;
真实字迹基础构型拆分步骤:对待鉴别字迹假设书写者的在先书写字迹进行字迹背景处理后拆分形成基础构型比对单元,并以二值化的字迹模块图像进行存储,所述基础构型比对单元与所述基础构型鉴别单元中的基础构型相匹配;
字迹真伪鉴别步骤:将所述基础构型鉴别单元和所述基础构型比对单元进行比对分析,确定书写者的身份。
2.根据权利要求1所述的手写字迹鉴别方法,其特征在于,所述字迹背景处理通过对字迹进行降噪、水平矫正以及表格线删除获取纯净手写字迹,并对纯净手写字迹的书写主方向进行提取操作。
3.根据权利要求1所述的手写字迹鉴别方法,其特征在于,所述书写主方向为通过多个不连续字迹块的形心连线平均值,所述不连续字迹块通过连通域提取方法进行字迹块分离,并通过基础构型外接长方形的中心作为每个字迹块的形心;
预设外接长方形中心坐标为(x1,y1),(x2,y2),…,(xn,yn),书写主方向的斜率为:
Figure FDA0003770725860000011
其中,n为字数。
4.根据权利要求1所述的手写字迹鉴别方法,其特征在于,所述基础构型鉴别单元与所述基础构型比对单元通过离断笔划提取、连续笔划分裂和转折过渡笔划形成的基础构型。
5.根据权利要求1所述的手写字迹鉴别方法,其特征在于,所述基础构型比对单元通过与所述基础构型鉴别单元进行多尺度模板匹配,采用降尺度像素重合比例进行相同基础构型的筛选和提取。
6.根据权利要求1所述的手写字迹鉴别方法,其特征在于,通过对基础构型外接矩形长宽比、像素中心位置偏移量和笔划起收角度对所述基础构型鉴别单元和所述基础构型比对单元中的基础构型进行比对分析。
7.根据权利要求1所述的手写字迹鉴别方法,其特征在于,所述基础构型外接矩形长宽比为:基础构型的外接矩形中分别与书写主方向平行和垂直的两条边的比值。
8.根据权利要求1所述的手写字迹鉴别方法,其特征在于,所述基础构型像素中心位置偏移量为:基础构型的外接矩形的中心坐标(xI1,yI1)与像素重心坐标(xI2,yI2)的连线矢量
Figure FDA0003770725860000021
由基础构型外接矩形与书写主方向平行的边
Figure FDA0003770725860000022
的夹角斜率q和长度比值α确定:
Figure FDA0003770725860000023
Figure FDA0003770725860000024
9.根据权利要求1所述的手写字迹鉴别方法,其特征在于,所述笔划起收角度为基础构型的起笔拟合直线与终笔拟合直线的夹角。
10.一种手写字迹鉴别系统,其特征在于,包括如下步骤:
基础构型建库模块:对待鉴别字迹进行字迹背景处理后,将待鉴别字迹进行书写模块化处理,提取基础构型鉴别单元,所述基础构型鉴别单元作为待鉴别确定的对象,并通过二值化图像进行存储;
真实字迹基础构型拆分模块:对待鉴别字迹假设书写者的在先书写字迹进行字迹背景处理后拆分形成基础构型比对单元,并以二值化的字迹模块图像进行存储,所述基础构型比对单元与所述基础构型鉴别单元中的基础构型相匹配;
字迹真伪鉴别模块:将所述基础构型鉴别单元和所述基础构型比对单元进行比对分析,确定书写者的身份。
CN202210900388.5A 2022-07-28 2022-07-28 手写字迹鉴别方法及系统 Pending CN115240206A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210900388.5A CN115240206A (zh) 2022-07-28 2022-07-28 手写字迹鉴别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210900388.5A CN115240206A (zh) 2022-07-28 2022-07-28 手写字迹鉴别方法及系统

Publications (1)

Publication Number Publication Date
CN115240206A true CN115240206A (zh) 2022-10-25

Family

ID=83677981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210900388.5A Pending CN115240206A (zh) 2022-07-28 2022-07-28 手写字迹鉴别方法及系统

Country Status (1)

Country Link
CN (1) CN115240206A (zh)

Similar Documents

Publication Publication Date Title
Namboodiri et al. Document structure and layout analysis
CN111626146B (zh) 一种基于模板匹配的合并单元格表格分割识别方法
Arai et al. Method for real time text extraction of digital manga comic
Boukharouba A new algorithm for skew correction and baseline detection based on the randomized Hough Transform
Dave Segmentation methods for hand written character recognition
CN111753706B (zh) 一种基于图像统计学的复杂表格交点聚类提取方法
US20100189316A1 (en) Systems and methods for graph-based pattern recognition technology applied to the automated identification of fingerprints
Journet et al. Document image characterization using a multiresolution analysis of the texture: application to old documents
Mehul et al. Text-based image segmentation methodology
CN114004204B (zh) 基于计算机视觉的表格结构重建与文字提取方法和系统
Rosyda et al. A review of various handwriting recognition methods
JP2019102061A5 (zh)
JP2019102061A (ja) テキスト線の区分化方法
WO2019019250A1 (zh) 倾斜图像的倾斜值获取方法、装置、终端及存储介质
Ayesh et al. A robust line segmentation algorithm for Arabic printed text with diacritics
Bai et al. Chinese image text recognition on grayscale pixels
CN109389050A (zh) 一种流程图连接关系识别方法
Dhanikonda et al. An efficient deep learning model with interrelated tagging prototype with segmentation for telugu optical character recognition
Chen et al. Efficient text localization in born-digital images by local contrast-based segmentation
CN110378337B (zh) 金属切削刀具图纸标识信息视觉输入方法及系统
CN109101973B (zh) 文字识别方法、电子设备、存储介质
Basa et al. Handwritten Odia character recognition
Firdaus et al. Arabic letter segmentation using modified connected component labeling
CN115240206A (zh) 手写字迹鉴别方法及系统
Fan et al. A robust proposal generation method for text lines in natural scene images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination