CN116434250B - 一种手写字符图像相似度确定模型训练方法 - Google Patents
一种手写字符图像相似度确定模型训练方法 Download PDFInfo
- Publication number
- CN116434250B CN116434250B CN202310694599.2A CN202310694599A CN116434250B CN 116434250 B CN116434250 B CN 116434250B CN 202310694599 A CN202310694599 A CN 202310694599A CN 116434250 B CN116434250 B CN 116434250B
- Authority
- CN
- China
- Prior art keywords
- similarity
- characters
- database
- character
- handwritten
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012795 verification Methods 0.000 claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 52
- 238000005457 optimization Methods 0.000 claims abstract description 48
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 44
- 238000011156 evaluation Methods 0.000 claims abstract description 32
- 239000013598 vector Substances 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011524 similarity measure Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19093—Proximity measures, i.e. similarity or distance measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明涉及图像处理技术领域,尤其涉及一种手写字符图像相似度确定模型训练方法,该方法包括数据识别模块识别手写字符图像,数据处理模块确定各手写字符图像中的手写字符复杂度并确定与数据库中的字符的匹配方式,等级评价模块确定手写字符与数据库中各字符的相似度等级并判断手写字符与数据库中各字符是否匹配,建模模块建立卷积神经网络模型,训练模块将训练集输入卷积神经网络模型进行训练,验证模块确定模型的验证准确率,数据调整模块确定对匹配方式的优化方式,这种方法通过多个模块的协同作用,实现了模型训练过程的自动优化,提高了手写字符识别的准确率和效率,具有较好的实用性和普适性。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种手写字符图像相似度确定模型训练方法。
背景技术
高维数据例如图像、音频等在日常生活中愈发普遍,因而可对其提取有用信息的特征学习方法显得尤为重要。手写体识别即是对其中某种高维信息进行特征提取并利用的一个实例。它通过电子专用设备将纸质手写文本电子化,得到计算机存储的字符图像,之后通过一系列特征学习的方法提取图像特征、分类等操作得到最终识别的字符。一旦得出高效准确识别字符的方法,可应用到办公自动化、机器翻译等领域,即可带来巨大的社会和经济效益。但是有效地抽取手写体图像特征的过程具有一定难度,到目前为止,手写体字符识别距实用要求还有一定距离。目前的大部分研究工作都集中在处理手写体图像特征提取问题,且也已取得一定的成果。但是从真实世界中采集的图像通常存在包含噪声、数据缺失等问题,因此需要提出一种更鲁棒的算法来进行特征提取。
中国专利公开号:CN102982330A公开了一种文字图像中字符识别方法和识别装置,包括:对所述文字图像中切割出的字符,以设定单位进行划分;并对每个设定单位内的字符进行识别;其中,对于一个设定单位,确定该设定单位内的字符的识别结果的方法流程,具体包括如下步骤:对所述设定单位内的每个字符进行特征提取和特征匹配后,确定每个字符的候选字;针对所述设定单位内的每个字符,确定该字符的每个候选字的相似度、以及该字符的每个候选字与该字符相邻的字符的候选字之间的转移概率;根据确定出的相似度和转移概率,确定出所述设定单位内的字符的识别结果;其中,所述识别结果还根据所述设定单位内的每个字符的每个候选字的出现概率确定;以及所述根据确定出的相似度和转移概率,确定出所述设定单位内的字符的识别结果,以及所述识别结果还根据所述设定单位内的每个字符的每个候选字的出现概率确定,具体包括:对于该设定单位内的第1个字符的候选字的维特比概率,根据该候选字的相似度和/或该候选字的出现概率确定;从该设定单位内的第2个字符起,对于当前字符的每个候选字,根据该候选字的相似度、出现概率、以及该候选字与该当前字符相邻的字符中的在前字符的候选字之间的转移概率,确定出所述当前字符的每个候选字与所述在前字符的各候选字之间的维特比概率;在确定出当前候选字与各在前候选字之间的维特比概率后,比较各维特比概率,从中选择最大的维特比概率作为当前候选字的维特比概率;其中,所述当前候选字为所述当前字符的候选字之一,所述在前候选字为所述在前字符的候选字之一;以所述当前候选字作为当前节点,选择与该当前候选字之间的维特比概率最大的在前候选字作为与该当前候选字相邻的在前节点;确定候选路径;其中,所述候选路径中的每个节点为分别针对所述设定单位内的每个字符选择出的候选字,同一候选路径中的相邻节点是根据每个候选字的在前节点确定的;比较各候选路径的最后节点的维特比概率,以最后节点的维特比概率最大的候选路径作为所述识别结果。
由此可见,现有技术存在以下问题:字符相似度识别准确率不高,鲁棒性差。
发明内容
为此,本发明提供一种手写字符图像相似度确定模型训练方法,用以克服现有技术中字符相似度识别准确率不高,鲁棒性差的问题。
为实现上述目的,一方面,本发明提供一种手写字符图像相似度确定模型训练方法,包括:
步骤S1、数据识别模块识别若干手写字符图像;
步骤S2、数据处理模块提取各所述手写字符图像中手写字符以确定所述手写字符的复杂度;
步骤S3、所述数据处理模块根据所述手写字符的复杂度所处复杂度水平确定所述手写字符与数据库中的若干字符的匹配方式;
步骤S4、所述等级评价模块在相应匹配方式下确定所述手写字符与数据库中的各字符的相似度等级;
步骤S5、所述等级评价模块根据所述相似度等级确定所述手写字符与数据库中的各字符是否匹配;
步骤S6、建模模块建立卷积神经网络模型,并将各所述手写字符图像和对应匹配完成的所述数据库中的字符作为单个数据集并将若干数据集以预设比例划分为训练集和验证集;
步骤S7、所述训练模块将所述训练集输入所述卷积神经网络模型以训练所述卷积神经网络模型;
步骤S8、所述验证模块将所述验证集输入训练完成的所述卷积神经网络模型并确定所述卷积神经网络模型的验证准确率;
步骤S9、所述数据调整模块在所述验证准确率低于准确率标准时,确定对所述匹配方式的优化方式;
其中,当所述复杂度处于第一复杂度水平,所述数据处理模块根据皮尔逊相关系数确定所述手写字符与相应数据库中的字符是否匹配;或当所述复杂度处于第二复杂度水平,所述数据处理模块计算所述手写字符与所述数据库中的字符的相似度,并确定所述数据库中的字符的相似度等级,以在相似度等级为第三相似度等级时,计算所述手写字符与所述第三相似度等级的字符的平均曲率差值以确定手写字符与所述数据库中的字符是否匹配。
进一步地,在所述步骤S3中,当所述数据处理模块在所述复杂度处于第一复杂度水平时,所述数据处理模块将所述手写字符与数据库中的若干字符的匹配方式设置为第一匹配方式,所述第一匹配方式包括计算所述手写字符基于空间分布的特征向量,并计算所述特征向量与数据库中的各字符的特征向量的皮尔逊相关系数,以根据皮尔逊相关系数与预设皮尔逊相关系数的比对结果确定所述手写字符与相应数据库中的字符是否匹配。
进一步地,在所述步骤S3中,当所述数据处理模块在所述复杂度处于第二复杂度水平下,所述数据处理模块将所述手写字符与数据库中的若干字符的匹配方式设置为第二匹配方式,所述第二匹配方式包括计算所述手写字符与所述数据库中的字符的相似度W,设定:
W=B×N×Z
B=1-|B1-B2|/△Bmax
Z=1-(H/Z0)
其中,B为笔画数相似度,B1为手写字符的笔画数,B2为数据库中的字符的笔画数,△Bmax为数据库中最多笔画数字符与最少笔画数字符的笔画数差值,N为结构相似度,Z为形状相似度,H为衡量两个字符轮廓点集之间的Hausdorff距离,Z0为字符图像的对角线长度。
进一步地,当所述数据处理模块计算所述相似度完成时,所述等级评价模块根据相似度与预设相似度的比对结果对数据库中的字符的相似等级进行判定,相似等级包括第一相似度等级、第二相似度等级和第三相似度等级,所述预设相似度包括用以划分所述数据库中的第一相似度等级的字符和第二相似度等级的字符的第一预设相似度以及用以划分第二相似度等级的字符和第三相似度等级的字符的第二预设相似度,其中第一预设相似度小于第二预设相似度。
进一步地,当所述等级评价模块在数据库中的字符被确定为第三相似度等级的字符时,计算手写字符与所述第三相似度等级的字符的平均曲率差值,根据平均曲率差值与预设平均曲率差值的比对结果确定手写字符与相应数据库中的字符是否匹配。
进一步地,当确定所述卷积神经网络模型的准确率时,所述数据处理模块确定所述验证集验证所述卷积神经网络模型时的验证准确率,并将该验证准确率与准确率标准进行比对,以根据比对结果确定所述匹配方式是否合格,并在不合格时确定对所述匹配方式的优化方式。
进一步地,当确定对所述匹配方式的优化方式时,所述数据调整模块计算所述验证准确率和准确率标准的准确率百分比,以根据该准确率百分比确定所述匹配方式的优化方式,所述优化方式包括第一优化方式和第二优化方式。
进一步地,当所述数据调整模块将优化方式设置为第一优化方式时,所述数据处理模块统计所述数据库中的字符被确定为第一相似度等级的字符的数量以及被确定为第二相似度等级的字符的数量,根据第一相似度等级的字符的数量与第二相似度等级的字符的数量的比对结果确定第一预设相似度的调整系数;
当所述数据调整模块调整第一预设相似度完成时,计算所述手写字符与所述第二相似度等级的字符的相似度与第一预设相似度的相似度差值,并根据该相似度差值与预设相似度差值的比对结果确定所述相似度W中形状相似度Z的权重系数,以根据所述权重系数重新计算所述手写字符与第二相似度等级的字符的相似度,并重新确定所述第二相似度等级的字符的相似等级。
进一步地,当所述数据调整模块将优化方式设置为第二优化方式时,统计数据库中的字符被确定为第三相似度等级的字符的数量,根据第三相似度等级的字符的数量与数据库中的字符数量的比值P与预设比值的比对结果确定第二预设相似度的调节系数,以调节第二预设相似度。
进一步地,数据识别模块,用以是被若干手写字符图像;
数据处理模块,其与所述数据识别模块连接,用以提取各所述手写字符图像中手写字符以确定所述手写字符的复杂度,根据所述手写字符的复杂度所处复杂度水平确定所述手写字符与数据库中的若干字符的匹配方式;
等级评价模块,其与所述数据处理模块连接,用以在相应匹配方式下确定所述手写字符与数据库中的各字符的相似度等级,根据所述相似度等级确定所述手写字符与数据库中的各字符是否匹配;
建模模块,其分别与所述数据处理模块和等级评价模块连接,用以建立卷积神经网络模型,并将各所述手写字符图像和对应匹配完成的所述数据库中的字符作为单个数据集并将若干数据集以预设比例划分为训练集和验证集;
训练模块,其与建模模块连接,用以将所述训练集输入所述卷积神经网络模型以训练所述卷积神经网络模型;
验证模块,其分别与所述建模模块和训练模块连接,用以将所述验证集输入训练完成的所述卷积神经网络模型并确定所述卷积神经网络模型的验证准确率;
数据调整模块,其分别与所述验证模块、数据处理模块和等级评价模块连接,用以在所述验证准确率低于准确率标准时,确定对所述匹配方式的优化方式。
与现有技术相比,本发明的有益效果在于,本发明通过计算手写字符的复杂度并与预设复杂度进行比较,将手写字符分为不同复杂度水平,针对不同复杂度的字符采用不同的相似度计算方法,减轻计算量,提高匹配的准确性和效率。
进一步地,本发明使用皮尔逊相关系数作为相似度度量,可以有效地衡量手写字符特征向量与数据库中的字符特征向量之间的线性相关程度,皮尔逊相关系数越接近1,表示两个字符的空间分布越相似;越接近0,表示两个字符的空间分布越不相似,有助于提高匹配的准确性。
进一步地,本发明通过计算笔画数相似度、结构相似度和形状相似度,从多个方面衡量手写字符与数据库中的字符的相似程度有助于提高识别的准确性和鲁棒性,将数据库中的字符分为第一相似度等级、第二相似度等级和第三相似度等级,更加精确地判断手写字符与数据库中的字符之间的相似程度,提高匹配的准确性。
进一步地,本发明对于第三相似度等级的字符,使用平均曲率差值作为补充特征进行匹配判断,在一定程度上提高匹配的准确性,第三相似度等级的字符在相似度计算中可能存在一定程度的不匹配,通过引入曲率特征可以进一步区分这些字符。
进一步地,本发明通过通过在验证集上进行准确率评估,在一定程度上避免卷积神经网络模型过拟合的问题,提高卷积神经网络模型的泛化能力。
进一步地,本发明通过设置准确率百分比标准,根据模型在验证集上的表现选择不同的优化方式,使得优化过程更加灵活,更好地适应不同的模型和数据集特点,根据准确率百分比与准确率百分比标准的比对结果,自动确定合适的优化方式,从而减少人工干预,实现模型训练过程的自适应优化。
进一步地,本发明通过调整第一预设相似度,使第一相似度等级与第二相似度等级均匀分布,以降低误判率提升识别分类的鲁棒性与准确性。
进一步地,本发明根据相似度差值动态调整形状相似度的权重系数,使得在不同程度的相似性情况下,形状相似度在相似度计算中的影响程度得以调整,有助于提高匹配的准确性和鲁棒性。
进一步地,本发明根据数据库中的字符的相似度比值调整第二预设相似度能够自适应不同的数据库和字符分布,在面对不同的手写字符样本时,可以自动调整相似度阈值,避免待分类数据过多造成计算量增大或待分类数据过少导致分类结果鲁棒性差,从而提高识别准确性,通过调整第二预设相似度,平衡第三相似度等级的字符的数量,避免模型在训练过程中过于偏向某一类相似字符,从而提高模型的泛化能力。
附图说明
图1为本发明实施例手写字符图像相似度确定模型训练方法的流程图;
图2为本发明实施例应用手写字符图像相似度确定模型训练方法的装置的结构图;
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
请参阅图1所示,图1为本发明实施例手写字符图像相似度确定模型训练方法的流程图;
本发明实施例手写字符图像相似度确定模型训练方法,包括:
步骤S1、数据识别模块识别若干手写字符图像;
步骤S2、数据处理模块提取各所述手写字符图像中手写字符以确定所述手写字符的复杂度;
步骤S3、所述数据处理模块根据所述手写字符的复杂度所处复杂度水平确定所述手写字符与数据库中的若干字符的匹配方式;
步骤S4、所述等级评价模块在相应匹配方式下确定所述手写字符与数据库中的各字符的相似度等级;
步骤S5、所述等级评价模块根据所述相似度等级确定所述手写字符与数据库中的各字符是否匹配;
步骤S6、建模模块建立卷积神经网络模型,并将各所述手写字符图像和对应匹配完成的所述数据库中的字符作为单个数据集并将若干数据集以预设比例划分为训练集和验证集;
步骤S7、所述训练模块将所述训练集输入所述卷积神经网络模型以训练所述卷积神经网络模型;
步骤S8、所述验证模块将所述验证集输入训练完成的所述卷积神经网络模型并确定所述卷积神经网络模型的验证准确率;
步骤S9、所述数据调整模块在所述验证准确率低于准确率标准时,确定对所述匹配方式的优化方式。
具体而言,在所述步骤S2中,当所述数据处理模块确定手写字符复杂度时,根据以下公式计算所述手写字符的复杂度F,设定:
其中,D为手写字符端点数量,J为手写字符中交叉点数量,M为手写字符的笔画数。
具体而言,本发明通过计算手写字符的复杂度并与预设复杂度进行比较,将手写字符分为不同复杂度水平,针对不同复杂度的字符采用不同的相似度计算方法,减轻计算量,提高匹配的准确性和效率。
具体而言,在所述步骤S3中,当所述数据处理模块在所述复杂度处于第一复杂度水平时,所述数据处理模块将所述手写字符与数据库中的若干字符的匹配方式设置为第一匹配方式,所述第一匹配方式包括计算所述手写字符基于空间分布的特征向量G,并计算所述特征向量与数据库中的各字符的特征向量的皮尔逊相关系数X,以根据皮尔逊相关系数X与预设皮尔逊相关系数X0的比对结果确定所述手写字符与相应数据库中的字符是否匹配,
当X≤X0时,所述数据处理模块确定所述手写字符与相应数据库中的字符不匹配;
当X>X0时,所述数据处理模块确定所述手写字符与相应数据库中的字符匹配;
其中,第一复杂度水平满足所述复杂度小于等于预设复杂度。
本发明实施例中,预设复杂度取值为3,预设复杂度是统计100人的手写字符,并分别计算该100人的手写字符的复杂度,求平均得到复杂度平均值,并将该平均值作为预设复杂度。
本发明实施例中,设定手写字符端点数量D>5、手写字符中交叉点数量J>5且手写字符的笔画数N打>8的手写字符为复杂字符,通过计算得到此种状况下,F的取值为3.2,则将此种状况下的复杂度F的取值作为划分简单字符与复杂字符的界限,因此设置预设复杂度为3.2。
具体而言,所述数据处理模块计算所述手写字符基于空间分布的特征向量G,设定:
G=[g1,g2,...,gn^2]
其中,gi 表示第 i 个网格的归一化像素值之和。
具体而言,所述特征向量与数据库中的字符特征向量之间的皮尔逊相关系数X通过以下公式计算,设定
X= cov(G1,G2)/(σ(G1)×σ(G2))
其中,cov(G1, G2) 表示手写字符特征向量与数据库集字符特征向量的协方差,σ(G1)和σ(G2)分别表示手写字符特征向量与数据库字符特征向量的标准差。
本发明实施例中,预设皮尔逊相关系数的取值为为0.9,皮尔逊相关系数越接近1,表示两个字符的空间分布越相似,本领域技术人员可以根据具体需求对预设皮尔逊相关系数调整。
具体而言,本发明使用皮尔逊相关系数作为相似度度量,可以有效地衡量手写字符特征向量与数据库中的字符特征向量之间的线性相关程度,皮尔逊相关系数越接近1,表示两个字符的空间分布越相似;越接近0,表示两个字符的空间分布越不相似,有助于提高匹配的准确性。
具体而言,在所述步骤S3中,当所述数据处理模块在所述复杂度处于第二复杂度水平下,所述数据处理模块将所述手写字符与数据库中的若干字符的匹配方式设置为第二匹配方式,所述第二匹配方式包括计算所述手写字符与所述数据库中的字符的相似度W,设定:
W=B×N×Z
B=1-|B1-B2|/△Bmax
Z=1-(H/Z0)
其中,B为笔画数相似度,B1为手写字符的笔画数,B2为数据库中的字符的笔画数,△Bmax为数据库中最多笔画数字符与最少笔画数字符的笔画数差值,N为结构相似度,Z为形状相似度,H为衡量两个字符轮廓点集之间的Hausdorff距离,Z0为字符图像的对角线长度。
具体而言,在所述步骤S4中,所述等级评价模块根据相似度W与预设相似度的比对结果确定数据库中的字符相似等级;
当W≤W1时,所述等级评价模块确定数据库中的字符为第一相似度等级;
当W1<W≤W2时,所述等级评价模块确定数据库中的字符为第二相似度等级;
当W>W2时,所述等级评价模块确定数据库中的字符为第三相似度等级;
其中,W1为第一预设相似度,W2为第二预设相似度,且W1<W2。
本发明实施例中,预设相似度为通过计算数据库中不同字符之间的相似度均值,取均值的50%为第一预设相似度,取均值的60%为第二预设相似度,本领域技术人员可以根据具体需求对预设相似度调整。
具体而言,本发明通过计算笔画数相似度、结构相似度和形状相似度,从多个方面衡量手写字符与数据库中的字符的相似程度有助于提高识别的准确性和鲁棒性,将数据库中的字符分为第一相似度等级、第二相似度等级和第三相似度等级,更加精确地判断手写字符与数据库中的字符之间的相似程度,提高匹配的准确性。
具体而言,在所述步骤S5中,当所述等级评价模块在数据库中的字符被确定为第三相似度等级时,计算手写字符与所述第三相似度等级的字符的平均曲率差值C,根据平均曲率差值C与预设平均曲率差值C0的比对结果确定手写字符与相应数据库中的字符是否匹配;
当C≤C0时,所述等级评价模块确定手写字符与相应数据库中的字符匹配;
当C>C0时,所述等级评价模块确定手写字符与相应数据库中的字符不匹配;
本发明实施例中,通过对数据库中的字符进行曲率计算,得到各个字符之间的平均曲率差值,选择平均曲率差值分布的四分位数作为预设平均曲率差值,本领域技术人员可以根据具体需求对预设平均曲率差值调整。
具体而言,所述等级评价模块计算所述手写字符与所述第三相似度等级的字符的平均曲率差值C,设定:
C=((Σκi)-(Σli))/n
Σκi为手写字符曲率之和,Σli为相应数据库中的字符曲率之和,n为字符轮廓上计算曲率的点数。
具体而言,本发明对于第三相似度等级的字符,使用平均曲率差值作为补充特征进行匹配判断,在一定程度上提高匹配的准确性,第三相似度等级的字符在相似度计算中可能存在一定程度的不匹配,通过引入曲率特征可以进一步区分这些字符。
具体而言,在所述步骤S8中,当确定所述卷积神经网络模型的准确率时,所述数据处理模块确定所述验证集验证所述卷积神经网络模型时的验证准确率γ,并将该验证准确率γ与准确率标准γb进行比对,以根据比对结果确定所述匹配方式是否合格;
若γ≥γb,所述数据处理模块确定所述匹配方式合格;
若γ<γb,所述数据处理模块确定所述匹配方式不合格,同时确定对所述匹配方式的优化方式。
本发明实施例中,准确率标准γb取值为0.98,本领域技术人员可以根据具体需求对准确率标准进行调整。
具体而言,本发明通过通过在验证集上进行准确率评估,在一定程度上避免卷积神经网络模型过拟合的问题,提高卷积神经网络模型的泛化能力。
具体而言,当确定对所述匹配方式的优化方式时,所述数据调整模块计算所述验证准确率γ和准确率标准γb的准确率百分比β,设定β=(γ/γb)×100%,并根据该准确率百分比β与准确率百分比标准β0的比对结果确定所述匹配方式的优化方式;
若β≤β0,所述数据调整模块将优化方式设置为第一优化方式;
若β>β0,所述数据调整模块将优化方式设置为第二优化方式。
本发明实施例中,准确率百分比标准取值为0.82,本领域技术人员可以根据具体情况对准确率百分比标准进行调整。
具体而言,本发明通过设置准确率百分比标准,根据模型在验证集上的表现选择不同的优化方式,使得优化过程更加灵活,更好地适应不同的模型和数据集特点,根据准确率百分比与准确率百分比标准的比对结果,自动确定合适的优化方式,从而减少人工干预,实现模型训练过程的自适应优化。
具体而言,当所述数据调整模块将优化方式设置为第一优化方式时,所述数据处理模块统计所述数据库中的字符被确定为第一相似度等级的字符的数量Q1以及被确定为第二相似度等级的字符的数量Q2,根据第一相似度等级的字符的数量Q1与第二相似度等级的字符的数量Q2的比对结果确定第一预设相似度的调整系数,以调整第一预设相似度,所述第一预设相似度的调整系数设有第一调整系数t1和第二调整系数t2,t1>t2,
若Q1<Q2,则确定以第一调整系数t1调整第一预设相似度;
若Q1>Q2,则确定以第二调整系数t2调整第一预设相似度;
调整后的第一预设相似度W01=ti×W1,i=1,2。
本发明实施例中,t1取值1.2,t2取值0.8,本领域技术人员可以根据具体需求对调整系数调整。
具体而言,本发明通过调整第一预设相似度,使第一相似度等级的字符与第二相似度等级的字符均匀分布,以降低误判率提升识别分类的鲁棒性与准确性。
当所述数据调整模块调整第一预设相似度完成时,计算所述手写字符与所述第二相似度等级的字符的相似度W与第一预设相似度W1的相似度差值△W,并根据该相似度差值△W与预设相似度差值的比对结果确定所述相似度W中形状相似度Z的权重系数,以根据所述权重系数重新计算所述手写字符与第二相似度等级的字符的相似度,并重新确定所述第二相似度等级的字符的相似等级,所述预设相似度差值包括第一预设相似度差值△W10和第二预设相似度差值△W20,所述权重系数包括第一权重系数γ1,第二权重系数γ2,第三权重系数γ3,其中△W10<△W20,0<γ1<γ2<γ3<2;
若△W≤△W10,则确定以第一权重系数γ1重新计算第二相似度等级的字符的相似度;
若△W10<△W≤△W20,则确定以第二权重系数γ2重新计算第二相似度等级的字符的相似度;
若△W>△W20,则确定以第三权重系数γ3重新计算第二相似度等级的字符的相似度;
所述等级评价模块将重新计算的相似度设置为Wj,设定Wj=W=B+N+Z×γi。
本发明实施例中,第一权重系数γ1为0.8,第二权重系数γ2为1.0,第三权重系数γ3为1.2,预设相似度差值是对数据库中的字符进行相似度计算,得到各个字符之间的相似度差值。然后分析相似度差值的分布情况,根据分布情况选择相似度差值分布的中位数作为第一预设相似度差值,选择相似度差值分布的四分位数作为第二预设相似度差值。本领域技术人员可以根据具体需求对权重系数,预设相似度差值调整。
具体而言,本发明根据相似度差值动态调整形状相似度的权重系数,使得在不同程度的相似性情况下,形状相似度在相似度计算中的影响程度得以调整,有助于提高匹配的准确性和鲁棒性。
具体而言,当所述数据调整模块将优化方式设置为第二优化方式时,统计数据库中的字符被确定为第三相似度等级的字符的数量,根据第三相似度等级的字符的数量与数据库中的字符数量的比值P与预设比值的比对结果确定第二预设相似度的调节系数,以调节第二预设相似度,所述第二预设相似度的调节系数设有第一调节系数r1,第二调节系数r2,第三调节系数r3,所述预设比值设有第一预设比值P1和第二预设比值P2,其中P1<P2,0<r3<r2<r1<2,
若P≤P1,则确定以第一调节系数r1调节第二预设相似度;
若P1<P≤P2,则确定以第二调节系数r2调节第二预设相似度;
若P> P2,则确定以第三调节系数r3调节第二预设相似度;
调节后的第二预设相似度W02=ri×W2,i=1,2,3。
本发明实施例中,r1取值1.2,r2取值1.0,r3取值0.8,第一预设比值为0.95,第二预设比值为0.98,预设比值根据对第三相似度等级的字符的数量的需求确定,本领域技术人员可以根据具体需求对调节系数,预设比值进行调整。
具体而言,本发明根据数据库中的字符的相似度比值调整第二预设相似度能够自适应不同的数据库和字符分布,在面对不同的手写字符样本时,可以自动调整相似度阈值,避免待分类数据过多造成计算量增大或待分类数据过少导致分类结果鲁棒性差,从而提高识别准确性,通过调整第二预设相似度,平衡第三相似度等级的字符的数量,避免模型在训练过程中过于偏向某一类相似字符,从而提高模型的泛化能力。
请参阅图2所示,其为本发明实施例应用手写字符图像相似度确定模型训练方法的装置。
本发明实施例应用手写字符图像相似度确定模型训练方法的装置,包括:
数据识别模块,用以是被若干手写字符图像;
数据处理模块,其与所述数据识别模块连接,用以提取各所述手写字符图像中手写字符以确定所述手写字符的复杂度,根据所述手写字符的复杂度所处复杂度水平确定所述手写字符与数据库中的若干字符的匹配方式;
等级评价模块,其与所述数据处理模块连接,用以在相应匹配方式下确定所述手写字符与数据库中的各字符的相似度等级,根据所述相似度等级确定所述手写字符与数据库中的各字符是否匹配;
建模模块,其分别与所述数据处理模块和等级评价模块连接,用以建立卷积神经网络模型,并将各所述手写字符图像和对应匹配完成的所述数据库中的字符作为单个数据集并将若干数据集以预设比例划分为训练集和验证集;
训练模块,其与建模模块连接,用以将所述训练集输入所述卷积神经网络模型以训练所述卷积神经网络模型;
验证模块,其分别与所述建模模块和训练模块连接,用以将所述验证集输入训练完成的所述卷积神经网络模型并确定所述卷积神经网络模型的验证准确率;
数据调整模块,其分别与所述验证模块、数据处理模块和等级评价模块连接,用以在所述验证准确率低于准确率标准时,确定对所述匹配方式的优化方式。
具体而言,本发明通过使用卷积神经网络模型,可以在一定程度上提高手写字符识别的准确率和效率,使得系统能够更好地处理复杂的手写字符图像,根据手写字符的复杂度水平确定匹配方式,使得匹配过程更加灵活,根据不同的手写字符特点选择合适的匹配方式,提高匹配效果,通过等级评价模块确定手写字符与数据库中的字符的相似度等级,更好地反映手写字符与数据库中的字符之间的相似程度,有助于提高模型的泛化能力,通过数据调整模块在验证准确率低于准确率标准时,确定对匹配方式的优化方式,实现模型训练过程的自动优化,提高训练效率,通过将数据集划分为训练集和验证集,在一定程度上避免模型过拟合的问题,提高模型在实际应用中的泛化能力,该装置根据不同的手写字符图像和数据库进行调整和优化,具有较好的可扩展性,可以应用于不同的应用场景和需求,本发明实施例中的装置可以应用于手写字符图像相似度确定及模型训练的各个领域,具有较强的实用性和普适性。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种手写字符图像相似度确定模型训练方法,其特征在于,包括:
步骤S1、数据识别模块识别若干手写字符图像;
步骤S2、数据处理模块提取各所述手写字符图像中手写字符以确定所述手写字符的复杂度;
步骤S3、所述数据处理模块根据所述手写字符的复杂度所处复杂度水平确定所述手写字符与数据库中的若干字符的匹配方式;
步骤S4、等级评价模块在相应匹配方式下确定所述手写字符与数据库中的各字符的相似度等级;
步骤S5、所述等级评价模块根据所述相似度等级确定所述手写字符与数据库中的各字符是否匹配;
步骤S6、建模模块建立卷积神经网络模型,并将各所述手写字符图像和对应匹配完成的所述数据库中的字符作为单个数据集并将若干数据集以预设比例划分为训练集和验证集;
步骤S7、训练模块将所述训练集输入所述卷积神经网络模型以训练所述卷积神经网络模型;
步骤S8、验证模块将所述验证集输入训练完成的所述卷积神经网络模型并确定所述卷积神经网络模型的验证准确率;
步骤S9、数据调整模块在所述验证准确率低于准确率标准时,确定对所述匹配方式的优化方式;
其中,当所述复杂度处于第一复杂度水平,所述数据处理模块根据皮尔逊相关系数确定所述手写字符与相应数据库中的字符是否匹配,当所述复杂度处于第二复杂度水平,所述数据处理模块计算所述手写字符与所述数据库中的字符的相似度,并确定所述数据库中的字符的所述相似度等级,以在所述相似度等级为第三相似度等级时,计算所述手写字符与所述第三相似度等级的字符的平均曲率差值以确定手写字符与所述数据库中的字符是否匹配。
2.根据权利要求1所述的手写字符图像相似度确定模型训练方法,其特征在于,在所述步骤S3中,当所述数据处理模块在所述复杂度处于第一复杂度水平时,所述数据处理模块将所述手写字符与数据库中的若干字符的匹配方式设置为第一匹配方式,所述第一匹配方式包括计算所述手写字符基于空间分布的特征向量,并计算所述特征向量与数据库中的各字符的特征向量的皮尔逊相关系数,以根据皮尔逊相关系数与预设皮尔逊相关系数的比对结果确定所述手写字符与相应数据库中的字符是否匹配。
3. 根据权利要求1所述的手写字符图像相似度确定模型训练方法,其特征在于,在所述步骤S3中,当所述数据处理模块在所述复杂度处于第二复杂度水平下,所述数据处理模块将所述手写字符与数据库中的若干字符的匹配方式设置为第二匹配方式,所述第二匹配方式包括计算所述手写字符与所述数据库中的字符的相似度W,设定:
W=B×N×Z
B=1-|B1-B2|/△Bmax
Z=1-(H/Z0)
其中,B为笔画数相似度,B1为手写字符的笔画数,B2为数据库中的字符的笔画数,△Bmax为数据库中最多笔画数字符与最少笔画数字符的笔画数差值,N为结构相似度,Z为形状相似度,H为衡量两个字符轮廓点集之间的Hausdorff距离,Z0为字符图像的对角线长度。
4.根据权利要求3所述的手写字符图像相似度确定模型训练方法,其特征在于,当所述数据处理模块计算所述相似度完成时,所述等级评价模块根据相似度与预设相似度的比对结果对数据库中的字符的相似等级进行判定,相似等级包括第一相似度等级、第二相似度等级和第三相似度等级,所述预设相似度包括用以划分所述数据库中的第一相似度等级的字符和第二相似度等级的字符的第一预设相似度以及用以划分第二相似度等级的字符和第三相似度等级的字符的第二预设相似度,其中第一预设相似度小于第二预设相似度。
5.根据权利要求4所述的手写字符图像相似度确定模型训练方法,其特征在于,当所述等级评价模块在数据库中的字符被确定为第三相似度等级时,计算手写字符与所述第三相似度等级的字符的平均曲率差值,根据平均曲率差值与预设平均曲率差值的比对结果确定手写字符与相应数据库中的字符是否匹配。
6.根据权利要求5所述的手写字符图像相似度确定模型训练方法,其特征在于,当确定所述卷积神经网络模型的准确率时,所述数据处理模块确定所述验证集验证所述卷积神经网络模型时的验证准确率,并将该验证准确率与准确率标准进行比对,以根据比对结果确定所述匹配方式是否合格,并在不合格时确定对所述匹配方式的优化方式。
7.根据权利要求6所述的手写字符图像相似度确定模型训练方法,其特征在于,当确定对所述匹配方式的优化方式时,数据调整模块计算所述验证准确率和准确率标准的准确率百分比,以根据该准确率百分比确定所述匹配方式的优化方式,所述优化方式包括所述数据处理模块根据第一相似度等级的字符的数量与第二相似度等级的字符的数量的比对结果确定第一预设相似度的调整系数以调整第一预设相似度的第一优化方式和所述数据调整模块根据第三相似度等级的字符的数量与数据库中的字符数量的比值与预设比值的比对结果确定第二预设相似度的调节系数以调节第二预设相似度的第二优化方式。
8.根据权利要求7所述的手写字符图像相似度确定模型训练方法,其特征在于,当所述数据调整模块将优化方式设置为第一优化方式时,所述数据处理模块统计所述数据库中的字符被确定为第一相似度等级的字符的数量以及被确定为第二相似度等级的字符的数量,根据第一相似度等级的字符的数量与第二相似度等级的字符的数量的比对结果确定第一预设相似度的调整系数;
当所述数据调整模块调整第一预设相似度完成时,计算所述手写字符与所述第二相似度等级的字符的相似度W与第一预设相似度的相似度差值,并根据该相似度差值与预设相似度差值的比对结果确定所述相似度W中形状相似度Z的权重系数,以根据所述权重系数重新计算所述手写字符与第二相似度等级的字符的相似度,并重新确定所述第二相似度等级的字符的相似等级。
9.根据权利要求8所述的手写字符图像相似度确定模型训练方法,其特征在于,当所述数据调整模块将优化方式设置为第二优化方式时,统计数据库中的字符被确定为第三相似度等级的字符的数量,根据第三相似度等级的字符的数量与数据库中的字符数量的比值P与预设比值的比对结果确定第二预设相似度的调节系数,以调节第二预设相似度。
10.一种应用权利要求1-9任一项所述的手写字符图像相似度确定模型训练方法的装置,其特征在于,数据识别模块,用以是被若干手写字符图像;
数据处理模块,其与所述数据识别模块连接,用以提取各所述手写字符图像中手写字符以确定所述手写字符的复杂度,根据所述手写字符的复杂度所处复杂度水平确定所述手写字符与数据库中的若干字符的匹配方式;
等级评价模块,其与所述数据处理模块连接,用以在相应匹配方式下确定所述手写字符与数据库中的各字符的相似度等级,根据所述相似度等级确定所述手写字符与数据库中的各字符是否匹配;
建模模块,其分别与所述数据处理模块和等级评价模块连接,用以建立卷积神经网络模型,并将各所述手写字符图像和对应匹配完成的所述数据库中的字符作为单个数据集并将若干数据集以预设比例划分为训练集和验证集;
训练模块,其与建模模块连接,用以将所述训练集输入所述卷积神经网络模型以训练所述卷积神经网络模型;
验证模块,其分别与所述建模模块和训练模块连接,用以将所述验证集输入训练完成的所述卷积神经网络模型并确定所述卷积神经网络模型的验证准确率;
数据调整模块,其分别与所述验证模块、数据处理模块和等级评价模块连接,用以在所述验证准确率低于准确率标准时,确定对所述匹配方式的优化方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310694599.2A CN116434250B (zh) | 2023-06-13 | 2023-06-13 | 一种手写字符图像相似度确定模型训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310694599.2A CN116434250B (zh) | 2023-06-13 | 2023-06-13 | 一种手写字符图像相似度确定模型训练方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116434250A CN116434250A (zh) | 2023-07-14 |
CN116434250B true CN116434250B (zh) | 2023-08-25 |
Family
ID=87091093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310694599.2A Active CN116434250B (zh) | 2023-06-13 | 2023-06-13 | 一种手写字符图像相似度确定模型训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116434250B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6643401B1 (en) * | 1998-12-16 | 2003-11-04 | Fujitsu Limited | Apparatus and method for recognizing character |
CN109871847A (zh) * | 2019-03-13 | 2019-06-11 | 厦门商集网络科技有限责任公司 | 一种ocr识别方法及终端 |
CN112016419A (zh) * | 2020-08-19 | 2020-12-01 | 浙江无极互联科技有限公司 | 一种智能手写汉字平测算法 |
CN115565182A (zh) * | 2022-09-30 | 2023-01-03 | 芜湖职业技术学院 | 一种基于复杂度分组的手写汉字识别方法 |
CN115937873A (zh) * | 2022-09-09 | 2023-04-07 | 重庆傲雄在线信息技术有限公司 | 一种基于可辨识单字字符的在线笔迹验证系统及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020019220A1 (zh) * | 2018-07-25 | 2020-01-30 | 华为技术有限公司 | 在预览界面中显示业务信息的方法及电子设备 |
-
2023
- 2023-06-13 CN CN202310694599.2A patent/CN116434250B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6643401B1 (en) * | 1998-12-16 | 2003-11-04 | Fujitsu Limited | Apparatus and method for recognizing character |
CN109871847A (zh) * | 2019-03-13 | 2019-06-11 | 厦门商集网络科技有限责任公司 | 一种ocr识别方法及终端 |
CN112016419A (zh) * | 2020-08-19 | 2020-12-01 | 浙江无极互联科技有限公司 | 一种智能手写汉字平测算法 |
CN115937873A (zh) * | 2022-09-09 | 2023-04-07 | 重庆傲雄在线信息技术有限公司 | 一种基于可辨识单字字符的在线笔迹验证系统及方法 |
CN115565182A (zh) * | 2022-09-30 | 2023-01-03 | 芜湖职业技术学院 | 一种基于复杂度分组的手写汉字识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116434250A (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10013636B2 (en) | Image object category recognition method and device | |
CN111339990B (zh) | 一种基于人脸特征动态更新的人脸识别系统和方法 | |
CN101937513B (zh) | 信息处理设备、信息处理方法 | |
WO2021051598A1 (zh) | 文本情感分析模型训练方法、装置、设备及可读存储介质 | |
CN106372624B (zh) | 人脸识别方法及系统 | |
CN110046634B (zh) | 聚类结果的解释方法和装置 | |
US6385339B1 (en) | Collaborative learning system and pattern recognition method | |
Lerner et al. | A classification-driven partially occluded object segmentation (CPOOS) method with application to chromosome analysis | |
CN110826618A (zh) | 一种基于随机森林的个人信用风险评估方法 | |
CN115578248B (zh) | 一种基于风格引导的泛化增强图像分类算法 | |
WO2020024444A1 (zh) | 人群绩效等级识别方法、装置、存储介质及计算机设备 | |
CN111401171A (zh) | 一种人脸图像的识别方法、装置、电子设备和存储介质 | |
CN110751278A (zh) | 一种神经网络比特量化方法和系统 | |
CN111368867A (zh) | 档案归类方法及系统、计算机可读存储介质 | |
CN116434250B (zh) | 一种手写字符图像相似度确定模型训练方法 | |
CN112149052A (zh) | 一种基于plr-dtw的日负荷曲线聚类方法 | |
JP2009129253A (ja) | パターン認識装置、パターン認識プログラム及びパターン認識方法 | |
CN108960347B (zh) | 一种卷积神经网络手写体识别排序稳定性的效果评估系统及方法 | |
CN116662832A (zh) | 一种基于聚类和主动学习的训练样本选择方法 | |
CN110348323B (zh) | 一种基于神经网络优化的穿戴式设备手势识别方法 | |
CN111931757A (zh) | 基于mdlbp分块直方图和pca降维的指静脉快速排序方法及装置 | |
CN112200216A (zh) | 汉字识别方法、装置、计算机设备和存储介质 | |
CN113743443B (zh) | 一种图像证据分类和识别方法及装置 | |
CN113298632B (zh) | 一种基于移动互联网和数据特征分析的智能财务管理系统 | |
CN111340239B (zh) | 多模态机器学习目标识别的犹豫迭代计算方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |