CN114863574A - 手写签名识别方法、装置、设备、介质及程序产品 - Google Patents
手写签名识别方法、装置、设备、介质及程序产品 Download PDFInfo
- Publication number
- CN114863574A CN114863574A CN202210372758.2A CN202210372758A CN114863574A CN 114863574 A CN114863574 A CN 114863574A CN 202210372758 A CN202210372758 A CN 202210372758A CN 114863574 A CN114863574 A CN 114863574A
- Authority
- CN
- China
- Prior art keywords
- image
- signature
- recognition model
- single character
- cutting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本申请实施例提供一种手写签名识别方法、装置、设备、介质及程序产品。其中,方法包括:获取待识别签名图像中的笔画轨迹,笔画轨迹包括多个位点;计算笔画轨迹中每一位点的切割概率;根据切割概率确定待识别签名图像的目标切割位点;根据目标切割位点对待识别签名图像进行切割,得到多个切割后的单字图像;将多个切割后的单字图像输入训练好的单字识别模型,通过单字识别模型得到与每个单字图像对应的候选单字;根据候选单字确定待识别签名图像对应的签名。如此,实现了对手写签名的单字识别,提高了手写签名识别的准确度。
Description
技术领域
本申请属于图像识别技术领域,尤其涉及一种手写签名识别方法、装置、设备、计算机存储介质及计算机程序产品。
背景技术
随着科技的发展,手写电子签名在支票、表单表格、证件、邮政信封、票据、手稿文书等方面已得到广泛应用。
目前,对于手写签名的识别,多是采用整体识别的方法,即,将签名图像作为一个整体,通过卷积神经网络模型,直接识别出对应的签名。这种整体识别的方法对于手写签名的识别场景来说,存在准确度低的问题。
发明内容
本申请实施例提供一种手写签名识别方法、装置、设备、计算机可读存储介质及计算机程序产品,能够提高手写签名的识别准确度。
第一方面,本申请实施例提供一种手写签名识别方法,该方法包括:
获取待识别签名图像中的笔画轨迹,笔画轨迹包括多个位点;
计算笔画轨迹中每一位点的切割概率;
根据切割概率确定待识别签名图像的目标切割位点;
根据目标切割位点对待识别签名图像进行切割,得到多个切割后的单字图像;
将多个切割后的单字图像输入训练好的单字识别模型,通过单字识别模型得到与每个单字图像对应的候选单字;
根据候选单字确定待识别签名图像对应的签名。
在一种可选的实施方式中,计算笔画轨迹中每一位点的切割概率;根据切割概率确定待识别签名图像的目标切割位点,包括:
通过水滴算法计算笔画轨迹中每一位点的第一切割概率;
在第一切割概率不符合预设条件的情况下,通过隐马尔可夫模型计算笔画轨迹中每一位点的第二切割概率,第二切割概率包括位点为目标切割位点的条件概率;
根据第二切割概率,采用维特比算法确定目标切割位点。
在一种可选的实施方式中,根据候选单字确定待识别签名图像对应的签名,包括:
基于候选单字组合得到多个候选签名;
根据候选签名与预设的姓名集合中姓名的距离相似度,确定待识别签名图像对应的签名。
在一种可选的实施方式中,获取待识别签名图像中的笔画轨迹,包括:
对待识别签名图像进行图像预处理,图像预处理包括图像去噪、图像二值化处理、笔画宽度变换;
从预处理后的待识别签名图像中获取笔画轨迹。
在一种可选的实施方式中,在将多个切割后的单字图像输入训练好的单字识别模型,通过单字识别模型得到与每个单字图像对应的候选单字之前,方法还包括:
获取多个样本单字图像以及多个样本单字图像对应的第一特征向量;
分别将每个样本单字图像以及每个样本单字图像对应的第一特征向量创建单字识别模型训练样本;
根据多个单字识别模型训练样本,训练单字识别模型,得到训练好的单字识别模型。
在一种可选的实施方式中,根据多个单字识别模型训练样本,训练单字识别模型,得到训练好的单字识别模型,包括:
对每个单字识别模型训练样本,分别执行如下步骤:
将单字识别模型训练样本输入至预设的单字识别模型中,得到与单字识别模型训练样本中的样本单字图像对应的至少一个样本候选单字;
基于样本候选单字,得到与单字识别模型训练样本中的样本单字图像对应的至少一个第二特征向量;
根据各个单字识别模型训练样本的第二特征向量和单字识别模型训练样本对应的样本单字图像的第一特征向量,确定单字识别模型的损失函数值;
在损失函数值满足第二训练停止条件的情况下,得到训练好的单字识别模型。
在一种可选的实施方式中,根据各个单字识别模型训练样本的第二特征向量和单字识别模型训练样本对应的样本单字图像的第一特征向量,确定单字识别模型的损失函数值,包括:
计算第二特征向量与第一特征向量的差值;
将差值经Sigmoid函数处理,得到交叉熵损失函数值。
本申请第二方面提供一种手写签名识别装置,该装置包括:
获取模块,用于获取待识别签名图像中的笔画轨迹,笔画轨迹包括多个位点;
计算模块,用于计算笔画轨迹中每一位点的切割概率;
确定模块,用于根据切割概率确定待识别签名图像的目标切割位点;
切割模块,用于根据目标切割位点对待识别签名图像进行切割,得到多个切割后的单字图像;
输入模块,用于将多个切割后的单字图像输入训练好的单字识别模型,通过单字识别模型得到与每个单字图像对应的候选单字;
确定模块,还用于根据候选单字确定待识别签名图像对应的签名。
第三方面,本申请实施例提供一种手写签名识别设备,设备包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现如本申请第一方面任一实施方式的手写签名识别方法。
第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如本申请第一方面任一实施方式的手写签名识别方法。
第五方面,本申请实施例提供一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行如本申请第一方面任一实施方式的手写签名识别方法。
本申请实施例的手写签名识别方法、装置、设备、计算机存储介质、计算机程序产品,能够计算待识别签名图像的笔画轨迹中,每一位点的切割概率,再根据切割概率确定切割位点,从而切割得到单字图像。如此,能够通过量化的指标对签名图像进行字符切割,从而提高字符切割的准确度。然后,再将单字图像输入训练好的单字识别模型,得到与每个单字图像对应的候选单字,并根据候选单字确定待识别签名图像对应的签名。这样,能够准确地将签名图像切割成多个单字图像,从而对签名图像进行单字识别,并根据单字识别得到的候选单字,确定签名图像对应的签名。如此,实现了对手写签名的单字识别,提高了手写签名识别的准确度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的手写签名识别方法的流程示意图;
图2是本申请另一个实施例提供的手写签名识别方法的流程示意图;
图3是本申请又一个实施例提供的手写签名识别方法的流程示意图;
图4是本申请再一个实施例提供的手写签名识别方法的流程示意图;
图5是本申请再一个实施例提供的手写签名识别装置的结构示意图;
图6是本申请再一个实施例提供的手写签名识别设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
如背景技术所述,现有技术中,对于手写签名的识别,多是采用整体识别的方法,即,将签名图像作为一个整体,通过卷积神经网络模型,直接识别出对应的签名。这种整体识别的方法对于手写签名的识别场景来说,存在准确度低的问题。
另外,由于汉字种类繁多,且汉字姓名的规律难以掌握,如果采用整体识别机制,需要庞大的训练集对手写签名识别模型进行训练。
发明人经深入研究,提出了一种基于单字识别的手写签名识别方法,能够有效提高手写签名识别的准确度。
鉴于此,本申请实施例提供了一种手写签名识别方法、装置、设备、计算机可读存储介质及计算机程序产品。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例所提供的手写签名方法进行介绍。本申请提供的手写签名识别方法,执行主体可以是手写签名识别装置,或是该手写签名识别装置中用于执行手写签名识别方法的部分模块。本申请实施例中以手写签名是被装置执行手写签名识别方法为例,详细说明本申请实施例提供的手写签名识别方法。
另外,需要说明的是,本申请实施例提供的手写签名识别方法,在通对待识别签名图像进行切割,得到单字图像之后,需要通过训练好的单字识别模型对单字图像进行识别。因此,在通过单字识别模型对单字图像进行识别之前,需要先训练好单字识别模型。因此,下面结合附图1对本申请实施例提供的手写签名识别方法中所采用的单字识别模型的训练方法的具体实施方式进行说明。
图1示出了本申请一个实施例提供的手写签名识别方法的流程示意图,具体的可以是本申请实施例提供的手写签名识别方法中所采用的单字识别模型的训练方法。
如图1所示,本申请实施例提供的手写签名识别方法中所采用的单字识别模型的训练可以包括步骤S110~S130。
S110,获取多个样本单字图像以及多个样本单字图像对应的第一特征向量。
其中,样本单字图像可以是对手写签名图像切割得到的切割后的单字图像,也可以是直接获取的样本单字图像,例如,直接获取的手写单字图像。第一特征向量可以为样本单字图像对应的基准单字图像的特征向量。在一个示例中,基准单字图像可以是从预设的汉字数据库中获取的单字图像,例如,可以是从新华字典数据库中获取的单字图像。
S120,分别将每个样本单字图像以及每个样本单字图像对应的第一特征向量创建单字识别模型训练样本。
S130,根据多个单字识别模型训练样本,训练单字识别模型,得到训练好的单字识别模型。
其中,单字识别模型可以通过多种方式创建。在一个实施例中,可以采用基于对比学习的孪生网络架构方式创建。在一个示例中,可以在孪生模型结构上,采用TripleNet的网络架构。具体地,在该网络架构中,对于输入的图像,可以基于检索的方法从庞大的基准单字图像存储库中检索多个候选单字,并选择最佳的一个或多个作为识别得到的候选单字。如此,不仅能够提高模型中网络架构的灵活性,还能够以基准单字图像存储库中的单字图像为基准,从而实现以较少的单字识别模型训练样本,训练得到单字识别准确度高的单字识别模型,进而提高单字识别的效率和准确度。
本申请实施例通过获取多个样本单字图像以及多个样本单字图像对应的第一特征向量,分别将每个样本单字图像以及每个样本单字图像对应的第一特征向量创建单字识别模型训练样本,根据多个单字识别模型训练样本,训练单字识别模型,能够得到训练好的单字识别模型。如此,基于训练好的单字识别模型准确、高效地识别出单字图像对应的候选单字。
在一个实施例中,如图2所示,根据多个单字识别模型训练样本,训练单字识别模型,得到训练好的单字识别模型,具体可以包括:
对每个单字识别模型训练样本,分别执行如下步骤S131~S134。
S131,将单字识别模型训练样本输入至预设的单字识别模型中,得到与单字识别模型训练样本中的样本单字图像对应的至少一个样本候选单字。
其中,样本候选单字可以是一个,也可以是多个。
S132,基于样本候选单字,得到与单字识别模型训练样本中的样本单字图像对应的至少一个第二特征向量。
其中,第二特征向量可以为样本单字图像通过单字识别模型得到的样本候选单字对应的基准单字图像的特征向量。在一个示例中,在通过单字识别模型得到样本候选单字后,可以从预设的汉字数据库中获取的样本候选单字对应的单字图像,例如,可以是从新华字典数据库中获取样本候选单字对应的单字图像。
S133,根据各个单字识别模型训练样本的第二特征向量和单字识别模型训练样本对应的样本单字图像的第一特征向量,确定单字识别模型的损失函数值。
在一个实施例中,在候选单字为多个的情况下,上述根据各个单字识别模型训练样本的第二特征向量和单字识别模型训练样本对应的样本单字图像的第一特征向量,确定单字识别模型的损失函数值,可以包括:对各个单字识别模型训练样本中的每个第二特征向量,分别与单字识别模型训练样本对应的样本单字图像的第一特征向量进行计算,确定与每个第二特征向量对应的损失函数值,将每个第二特征向量中对应的损失函数值中的最小值或最大值确定为该单字识别模型训练样本对应的损失函数值。在一个示例中,在候选单字为多个的情况下,还可以将每个第二特征向量中对应的损失函数值的集合作为单字识别模型的损失函数值。
S134,在损失函数值满足训练停止条件的情况下,得到训练好的单字识别模型。
上述训练停止条件可以是预先设置的单字识别模型训练停止的条件。作为一个示例,训练停止条件可以是单字识别模型的损失函数小于某一个阈值。作为另一个示例,在候选单字为多个的情况下,训练停止条件还可以包括每个第二特征向量中对应的损失函数值的集合中,各个损失函数值的分布情况满足预设条件。具体的训练停止条件可以根据用户需求自行选取,在此不做限定。
如此,能够通过单字识别模型训练样本对预设的单字识别模型进训练,从而能够基于训练好的单字识别模型对单字图像进行准确的识别。
在一个实施例中,根据各个单字识别模型训练样本的第二特征向量和单字识别模型训练样本对应的样本单字图像第一特征向量,确定单字识别模型的损失函数值,可以包括:
计算第二特征向量与第一特征向量的差值。
将差值经Sigmoid函数处理,得到交叉熵损失函数值。
上述计算第二特征向量与第一特征向量的差值可以通过本领域公知的方法计算得到,在此不再赘述。
该实施例中,计算第二特征向量与第一特征向量的差值经Sigmoid函数处理,得到交叉熵损失函数值,如此,能够将第二特征向量与第一特征向量的差值映射到[0,1]的数值区间,从而能够根据交叉熵损失函数调整单字识别模型的参数,进而提高单字识别模型的准确度。
下面结合附图3对本申请实施例提供的手写签名识别方法进行详细说明。
图3示出了本申请实施例提供的一种手写签名识别方法的流程示意图,如图3所示,本申请实施例提供的手写签名识别方法可以包括步骤S210~S260。
S210,获取待识别签名图像中的笔画轨迹,笔画轨迹包括多个位点。
步骤S210中,笔画轨迹可以包括待识别签名图像中,用于组成多个单字的所有笔画形成的轨迹。获取待识别签名图像中的笔画轨迹可以通过本领域公知的方法实现,在此不作限定。在一个示例中,获取待识别签名图像中的笔画轨迹可以包括:对待识别签名图像进行灰度化处理,在经灰度化处理的待识别签名图片中获取笔画轨迹。
S220,计算笔画轨迹中每一位点的切割概率。
步骤S220中,切割概率可以包括位点为目标切割位点的概率,目标切割位点可以表示为笔画末端且为两个单字之间的界线的位点。
S230,根据切割概率确定待识别签名图像的目标切割位点。
在一个实施例中,可以筛选出切割概率大于预设阈值的多个候选切割位点,根据这些候选切割位点之间的距离,确定目标切割位点。
S240,根据目标切割位点对待识别签名图像进行切割,得到多个切割后的单字图像。
在一个示例中,可以根据签名图像中单字的位置,得到各个单字栏位对应的切割后的单字图像。
S250,将多个切割后的单字图像输入训练好的单字识别模型,通过单字识别模型得到与每个单字图像对应的候选单字。
在一个示例中,可以根据各个切割后的单字图像对应的单字栏位,得到各个单字栏位对应的候选单字,每个单字单位对应的候选单字可以为一个或多个。
S260,根据候选单字确定待识别签名图像对应的签名。
其中,根据候选单字确定待识别签名图像对应的签名可以包括:根据候选单字的多种组合形式得到的候选签名,确定待识别签名图像对应的签名。在一个示例中,根据候选单字确定待识别签名图像对应的签名可以包括:对各单字栏位的候选单字进行排列组合,得到多个候选签名,从多个候选签名中确定待识别签名图像对应的签名。
本申请实施例的手写签名识别方法,能够计算待识别签名图像的笔画轨迹中,每一位点的切割概率,再根据切割概率确定切割位点,从而切割得到单字图像。如此,能够通过量化的指标对签名图像进行字符切割,从而提高字符切割的准确度。然后,再将单字图像输入训练好的单字识别模型,得到与每个单字图像对应的候选单字,并根据候选单字确定签名图像对应的签名。这样,能够准确地将签名图像切割成多个单字图像,从而对签名图像进行单字识别,并根据单字识别得到的候选单字,确定签名图像对应的签名。如此,实现了对手写签名的单字识别,提高了手写签名识别的准确度。
本申请中,步骤S210~S240可以通过多种方法实现,在此不作限制。在一个实施例中,步骤S210~S240可以由字符切割算法执行。因此,在通过字符切割算法执行以上步骤S210~S240之前,需要先确定字符切割算法的参数。因此,下面结合附图4对本申请实施例提供的手写签名识别方法中所采用的字符切割算法的参数确定过程的具体实施方式进行说明。
如图4所示,本申请实施例提供的手写签名识别方法中所采用的字符切割算法的参数确定过程可以包括步骤S310~S340。
S310,获取多个样本签名图像。
其中,样本签名图像可以为手写签名图像。
S320,对于每一样本签名图像,通过预设的字符切割算法对样本签名图像切割,得到多个切割后的样本单字图像。
其中,预设的字符切割算法可以通过多种方法设置。在一个实施例中,预设的字符切割算法可以包括水滴算法以及隐马尔可夫模型与维特比算法的结合算法(HMM-Viterbialgorithm)中的至少一者。水滴算法的流程简单、效率高,但是只适用于无字符粘连的情况,由于手写签名常常有不同字符间的笔画粘连,无法准确的确定水滴渗漏处,有时不能有效地对字符进行正确分割。HMM-Viterbi algorithm的流程较为复杂,但是具有更高的准确度。
具体地,水滴算法可以模拟水滴从高处向低处滴落的过程对字符进行划分,水滴从字符顶部在重力的作用下,沿着字符轮廓向下滴落,当水滴陷在轮廓的凹处时,将渗透到字符笔画中,最终,可以根据水滴经过的轨迹确定签名图像中笔画轨迹上的位点为目标切割位点的概率,从而确定字符的分割路径。
当字符切割算法包括HMM-Viterbi algorithm时,上述通过预设的字符切割算法对样本签名图像切割,得到多个切割后的样本单字图像,可以包括:
获取样本签名图像中的笔画轨迹,得到多个观测向量;
对字符笔画的轨迹进行分段切分,得到多个可能存在笔画粘连的位置信息,该多个可能存在笔画粘连的位置信息即为多个可能的切割位点信息;
基于多个观测向量以及多个可能的切割位点信息,计算隐马尔可夫模型(HMM)模型的输出概率以及概率转移概率,由此得到多种切割方式的条件概率;
采用维特比算法计算条件概率最大的情况下对应的目标切割位点信息,根据该目标切割位点信息对样本签名图像进行切割。
由此,HMM模型可以将签名图像的笔画轨迹分割为若干个互不重叠的区域网格图像,如果将每个区域网格图像当做一个节点,则整个图像可以看成是多行、每行多个节点构成,各个节点之间都可以建立相互连接,从0行的初始节点到最后一行的结束节点之间可以有多种路径走通。通过维特比算法(Viterbi algorithm)采用动态规划的方法能够搜索得到一条最优路径,这条路径就是对签名图像的一个潜在的合适分割结果,如此,能够提高字符切割的准确度。
S330,根据多个切割后的样本单字图像,确定字符切割算法的切割评价指标。
S340,在切割评价指标符合预设条件的情况下,确定当前字符切割算法参数为最终的字符切割算法参数。
上述切割评价指标可以包括基于字符切割算法得到的样本单字图像确定的切割评价评分,或者基于字符切割算法得到的样本单字图像是否符合预设要求。作为一个示例,切割评价指标可以包括切割后的样本单字图像的数量是否符合预设要求。例如,在非少数民族地区,汉语姓名基本由2~4个字组成,则对于每一样本签名图像,若切割的样本单字图像为2~4个,则认为切割后的样本单字图像的数量符合预设要求,相应地可以认为切割评价指标符合预设条件。在作为另一个示例,切割评价指标可以包括切割后的样本单字图像的识别结果是否符合预设要求。例如,可以通过单字识别模型对切割后的样本单字图像进行识别,得到样本单字图像对应的签名,在样本单字图像对应的签名符合汉语姓名的取名习惯的情况下,可认为切割后的样本单字图像的识别结果符合预设要求,相应地可以认为切割评价指标符合预设条件。
容易理解的,在切割评价指标不符合预设条件的情况下,可以调整字符切割算法的参数,再执行上述S310~S340,直至切割评价指标符合预设条件。
在一个实施例中,预设的字符切割算法可以包括水滴算法以及HMM-Viterbialgorithm。由此得到的字符切割算法能够更准确地对手写签名图像进行切割。
此时,可以分别针对水滴算法以及HMM-Viterbi algorithm执行以上S310~S340,也可以合并执行以上S310~S340。作为合并执行以上S310~S340的一个示例,上述对于每一样本签名图像,通过预设的字符切割算法对样本签名图像切割,得到多个切割后的样本单字图像,可以包括:
对于每一样本签名图像,通过水滴算法切割得多个切割后的第一样本单字图像,通过HMM-Viterbi algorithm切割得到多个切割后的第二样本单字图像;
在第一样本单字图像与第二样本单字图像的相似度小于预设阈值的情况下,将第一样本单字图像或者第二样本单字图像确定为样本单字图像。
容易理解的,在第一样本单字图像与第二样本单字图像的相似度大于或等于预设阈值的情况下,可以调整水滴算法以及HMM-Viterbi algorithm的参数,直至第一样本单字图像与第二样本单字图像的相似度小于预设阈值。
如此,能够通过样本签名图像对预设的字符切割算法的参数进行调整,得到能够对签名图像进行准确分割的字符切割算法。
在一个实施例中,计算笔画轨迹中每一位点的切割概率;根据切割概率确定待识别签名图像的目标切割位点,可以通过字符切割算法执行。其具体可以包括:
通过水滴算法计算笔画轨迹中每一位点的第一切割概率。
在第一切割概率不符合预设条件的情况下,通过隐马尔可夫模型计算笔画轨迹中每一位点的第二切割概率,第二切割概率包括位点为目标切割位点的条件概率。
根据第二切割概率,采用维特比算法确定目标切割位点。
上述预设条件可以根据实际情况自行设置,在此不作特别限定。作为一个示例,预设条件可以是预期根据第一切割概率进行切割后,图像的数量在预设的范围内,例如为2~4个。
上述根据第二切割概率,采用维特比算法确定目标切割位点,可以包括:采用维特比算法确定采用哪些位点为目标切割位点时,条件概率最大,将条件概率最大的切割位点确定为待识别签名图像的切割位点。
容易理解的,在通过水滴算法对待识别签名图像切割得到的多个切割后的图像符合预设条件的情况下,可以将该多个切割后的图像确定为多个切割后的单字图像。
这样,在水滴算法对待识别签名图像进行准确切割的情况下,能够仅使用相对简单的水滴算法进行待识别签名图像的切割,从而简化签名图像的切割流程、提高签名图像的切割效率;在水滴算法对待识别签名图像切割的准确度不足的情况下,能够通过HMM-Viterbi algorithm对待识别签名图像进行切割,从而能够保证待识别签名图像的切割具有较高的准确度,进而提高手写签名识别的准确度。
在一个实施例中,根据候选单字确定待识别签名图像对应的签名,具体可以包括:
基于候选单字组合得到多个候选签名。
根据候选签名与预设的姓名集合中姓名的距离相似度,确定待识别签名图像对应的签名。
其中,预设的姓名集合可以为根据有关文献,例如《中文姓名大全》,或者现有的中文姓名数据得到的姓名集合。距离相似度可以包括候选签名与预设的姓名集合中姓名之间的最小编辑距离。在一个示例中,可以根据多个候选签名与预设的姓名集合中姓名之间的最小编辑距离,确定最小编辑距离在预设范围内的一个或多个候选签名,再从中确定出签名图像对应的签名。
如此,能够使识别到的签名图像对应的签名更符合中文姓名规范和起名习惯,从而提高手写签名识别的准确度。
在一个实施例中,获取待识别签名图像中的笔画轨迹,可以包括:
对签名图像进行图像预处理,图像预处理包括图像去噪、图像二值化处理、笔画宽度变换。
从预处理后的待识别签名图像中获取笔画轨迹。
其中,图像预处理可以通过多种算法实现,在此不做特别限定。在一个示例中,图像去噪可以通过平滑空间域滤波器算法,对图像进行噪声点去除;图像二值化处理可以为通过OTSU算法对签名图像中的文字和背景进行分离;笔画宽度变换可以为通过游程长度法估计笔画的宽度,并根据估计结果对笔画进行膨胀、腐蚀等处理,从而实现对笔画宽度的增大或缩小。如此,能够提高字符切割及单字识别的准确度,从而提高手写签名识别的准确度。
基于同样的发明构思,本申请实施例还提供了一种手写签名识别装置400。
如图5所示,手写签名识别装置400可以包括获取模块401、计算模块402、确定模块403、切割模块404和输入模块405。
获取模块401,用于获取待识别签名图像中的笔画轨迹,笔画轨迹包括多个位点。
计算模块402,用于计算笔画轨迹中每一位点的切割概率。
确定模块403,用于根据切割概率确定待识别签名图像的目标切割位点。
切割模块404,用于根据目标切割位点对待识别签名图像进行切割,得到多个切割后的单字图像。
输入模块405,用于将多个切割后的单字图像输入训练好的单字识别模型,通过单字识别模型得到与每个单字图像对应的候选单字。
确定模块403,还用于根据候选单字确定待识别签名图像对应的签名。
本申请实施例的手写签名识别装置,能够计算待识别签名图像的笔画轨迹中,每一位点的切割概率,再根据切割概率确定切割位点,从而切割得到单字图像。如此,能够通过量化的指标对签名图像进行字符切割,从而提高字符切割的准确度。然后,再将单字图像输入训练好的单字识别模型,得到与每个单字图像对应的候选单字,并根据候选单字确定签名图像对应的签名。这样,能够准确地将签名图像切割成多个单字图像,从而对签名图像进行单字识别,并根据单字识别得到的候选单字,确定签名图像对应的签名。如此,实现了对手写签名的单字识别,提高了手写签名识别的准确度。
在一个实施例中,上述计算模块用于计算笔画轨迹中每一位点的切割概率;上述确定模块用于根据切割概率确定待识别签名图像的目标切割位点,具体可以包括:
上述计算模块,用于通过水滴算法计算笔画轨迹中每一位点的第一切割概率。
上述计算模块,还用于在第一切割概率不符合预设条件的情况下,通过隐马尔可夫模型计算笔画轨迹中每一位点的第二切割概率,第二切割概率包括位点为目标切割位点的条件概率。
上述确定模块,还用于根据第二切割概率,采用维特比算法确定目标切割位点。
切割模块,用于根据切割位点对签名图像进行切割,得到多个切割后的单字图像。
在一个实施例中,确定模块用于根据候选单字确定待识别签名图像对应的签名,可以包括:
组合模块,用于基于候选单字组合得到多个候选签名。
上述确定模块,用于根据候选签名与预设的姓名集合中姓名的距离相似度,确定待识别签名图像对应的签名。
在一个实施例中,上述获取模块用于获取待识别签名图像中的笔画轨迹,具体可以包括:
预处理模块,用于对待识别签名图像进行图像预处理,图像预处理包括图像去噪、图像二值化处理、笔画宽度变换。
上述获取模块,用于从预处理后的待识别签名图像中获取笔画轨迹。
在一个实施例中,装置400还可以包括:
获取模块,用于获取多个样本单字图像以及多个样本单字图像对应的第一特征向量。
创建模块,用于分别将每个样本单字图像以及每个样本单字图像对应的第一特征向量创建单字识别模型训练样本。
训练模块,用于根据多个单字识别模型训练样本,训练单字识别模型,得到训练好的单字识别模型。
在一个实施例中,上述训练模块用于根据多个单字识别模型训练样本,训练单字识别模型,得到训练好的单字识别模型,具体可以包括:
对每个单字识别模型训练样本,分别执行如下步骤:
将单字识别模型训练样本输入至预设的单字识别模型中,得到与单字识别模型训练样本中的样本单字图像对应的至少一个样本候选单字。
基于样本候选单字,得到与单字识别模型训练样本中的样本单字图像对应的至少一个第二特征向量。
根据各个单字识别模型训练样本的第二特征向量和单字识别模型训练样本对应的样本单字图像的第一特征向量,确定单字识别模型的损失函数值。
在损失函数值满足第二训练停止条件的情况下,得到训练好的单字识别模型。
在一个实施例中,根据各个单字识别模型训练样本的第二特征向量和单字识别模型训练样本对应的样本单字图像第一特征向量,确定单字识别模型的损失函数值,可以包括:
计算第二特征向量与第一特征向量的差值;
将差值经Sigmoid函数处理,得到交叉熵损失函数值。
本申请实施例提供的手写签名识别装置能够实现图3的方法实施例实现的各个过程,为避免重复,这里不再赘述。
图6示出了本申请实施例提供的手写签名识别设备的硬件结构示意图。
手写签名识别设备可以包括处理器501以及存储有计算机程序指令的存储器502。
具体地,上述处理器501可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关容灾设备的内部或外部。在特定实施例中,存储器502是非易失性固态存储器。
存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本申请的一方面的方法所描述的操作。
处理器501通过读取并执行存储器502中存储的计算机程序指令,以实现上述实施例中的任意一种手写签名识别方法。
在一个示例中,手写签名识别设备还可包括通信接口503和总线510。其中,如图6所示,处理器501、存储器502、通信接口503通过总线510连接并完成相互间的通信。
通信接口503,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线510包括硬件、软件或两者,将手写签名识别设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该手写签名识别设备可以执行本申请实施例中的手写签名识别方法,从而实现结合图3和图5描述的手写签名识别方法和装置。
另外,结合上述实施例中的手写签名识别方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种手写签名识别方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (11)
1.一种手写签名识别方法,其特征在于,包括:
获取待识别签名图像中的笔画轨迹,所述笔画轨迹包括多个位点;
计算所述笔画轨迹中每一所述位点的切割概率;
根据所述切割概率确定所述待识别签名图像的目标切割位点;
根据所述目标切割位点对所述待识别签名图像进行切割,得到多个切割后的单字图像;
将所述多个切割后的单字图像输入训练好的单字识别模型,通过所述单字识别模型得到与每个所述单字图像对应的候选单字;
根据所述候选单字确定所述待识别签名图像对应的签名。
2.根据权利要求1所述的方法,其特征在于,所述计算所述笔画轨迹中每一所述位点的切割概率;根据所述切割概率确定所述待识别签名图像的目标切割位点,包括:
通过水滴算法计算所述笔画轨迹中每一所述位点的第一切割概率;
在所述第一切割概率不符合预设条件的情况下,通过隐马尔可夫模型计算所述笔画轨迹中每一所述位点的第二切割概率,所述第二切割概率包括所述位点为目标切割位点的条件概率;
根据所述第二切割概率,采用维特比算法确定所述目标切割位点。
3.根据权利要求1所述的方法,其特征在于,根据所述候选单字确定所述待识别签名图像对应的签名包括:
基于所述候选单字组合得到多个候选签名;
根据所述候选签名与预设的姓名集合中姓名的距离相似度,确定所述待识别签名图像对应的签名。
4.根据权利要求1所述的方法,其特征在于,所述获取待识别签名图像中的笔画轨迹,包括:
对所述待识别签名图像进行图像预处理,所述图像预处理包括图像去噪、图像二值化处理、笔画宽度变换;
从预处理后的待识别签名图像中获取笔画轨迹。
5.根据权利要求1所述的方法,其特征在于,在所述将所述多个切割后的单字图像输入训练好的单字识别模型,通过所述单字识别模型得到与每个所述单字图像对应的候选单字之前,所述方法还包括:
获取多个样本单字图像以及所述多个样本单字图像对应的第一特征向量;
分别将每个所述样本单字图像以及每个所述样本单字图像对应的第一特征向量创建单字识别模型训练样本;
根据多个所述单字识别模型训练样本,训练所述单字识别模型,得到所述训练好的单字识别模型。
6.根据权利要求5所述的方法,其特征在于,所述根据多个所述单字识别模型训练样本,训练所述单字识别模型,得到所述训练好的单字识别模型,包括:
对每个所述单字识别模型训练样本,分别执行如下步骤:
将所述单字识别模型训练样本输入至预设的单字识别模型中,得到与所述单字识别模型训练样本中的样本单字图像对应的至少一个样本候选单字;
基于所述样本候选单字,得到与所述单字识别模型训练样本中的样本单字图像对应的至少一个第二特征向量;
根据各个所述单字识别模型训练样本的第二特征向量和所述单字识别模型训练样本对应的样本单字图像的第一特征向量,确定所述单字识别模型的损失函数值;
在所述损失函数值满足所述第二训练停止条件的情况下,得到所述训练好的单字识别模型。
7.根据权利要求6所述的方法,其特征在于,所述根据各个所述单字识别模型训练样本的第二特征向量和所述单字识别模型训练样本对应的样本单字图像的第一特征向量,确定所述单字识别模型的损失函数值,包括:
计算所述第二特征向量与所述第一特征向量的差值;
将所述差值经Sigmoid函数处理,得到交叉熵损失函数值。
8.一种手写签名识别装置,其特征在于,所述装置包括:
获取模块,用于获取待识别签名图像中的笔画轨迹,所述笔画轨迹包括多个位点;
计算模块,用于计算所述笔画轨迹中每一所述位点的切割概率;
确定模块,用于根据所述切割概率确定所述待识别签名图像的目标切割位点;
切割模块,用于根据所述目标切割位点对所述待识别签名图像进行切割,得到多个切割后的单字图像;
输入模块,用于将所述多个切割后的单字图像输入训练好的单字识别模型,通过所述单字识别模型得到与每个所述单字图像对应的候选单字;
所述确定模块,还用于根据所述候选单字确定所述待识别签名图像对应的签名。
9.一种手写签名识别设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的手写签名识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的手写签名识别方法。
11.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-7任意一项所述的手写签名识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210372758.2A CN114863574A (zh) | 2022-04-11 | 2022-04-11 | 手写签名识别方法、装置、设备、介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210372758.2A CN114863574A (zh) | 2022-04-11 | 2022-04-11 | 手写签名识别方法、装置、设备、介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114863574A true CN114863574A (zh) | 2022-08-05 |
Family
ID=82630156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210372758.2A Pending CN114863574A (zh) | 2022-04-11 | 2022-04-11 | 手写签名识别方法、装置、设备、介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114863574A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117728960A (zh) * | 2024-02-07 | 2024-03-19 | 中国标准化研究院 | 一种基于电子签名的标准数据数字化转换验证方法和系统 |
-
2022
- 2022-04-11 CN CN202210372758.2A patent/CN114863574A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117728960A (zh) * | 2024-02-07 | 2024-03-19 | 中国标准化研究院 | 一种基于电子签名的标准数据数字化转换验证方法和系统 |
CN117728960B (zh) * | 2024-02-07 | 2024-05-07 | 中国标准化研究院 | 一种基于电子签名的标准数据数字化转换验证方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108595410B (zh) | 手写作文的自动批改方法及装置 | |
US10515265B2 (en) | Generating variations of a known shred | |
CN111126396A (zh) | 图像识别方法、装置、计算机设备以及存储介质 | |
CN107577702B (zh) | 一种社交媒体中交通信息的辨别方法 | |
KR19990010210A (ko) | 대용량 패턴 정합 장치 및 방법 | |
JP6558863B2 (ja) | モデル作成装置、推定装置、方法、及びプログラム | |
CN111538823A (zh) | 信息处理方法、模型训练方法、装置、设备及介质 | |
CN115937873A (zh) | 一种基于可辨识单字字符的在线笔迹验证系统及方法 | |
US10373028B2 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
CN115953123A (zh) | 机器人自动化流程的生成方法、装置、设备及存储介质 | |
CN114863574A (zh) | 手写签名识别方法、装置、设备、介质及程序产品 | |
CN112711944B (zh) | 一种分词方法、系统、分词器生成方法及系统 | |
CN112560856B (zh) | 车牌检测识别方法、装置、设备及存储介质 | |
CN115861659A (zh) | 对象匹配方法、装置、设备及计算机存储介质 | |
CN114117031A (zh) | 名单筛查方法、装置、设备及计算机存储介质 | |
CN113064497A (zh) | 语句识别的方法、装置、设备及计算机存储介质 | |
CN114358096A (zh) | 一种基于逐级门限判决的深度学习摩尔斯码识别方法及装置 | |
CN115204166A (zh) | 文本校对方法、装置、设备、介质及程序产品 | |
CN115309891A (zh) | 一种文本分类方法、装置、设备及计算机存储介质 | |
Boukharouba et al. | Recognition of handwritten Arabic literal amounts using a hybrid approach | |
CN113934833A (zh) | 训练数据的获取方法、装置、系统及存储介质 | |
CN112633243B (zh) | 信息识别方法、装置、设备及计算机存储介质 | |
CN112348049A (zh) | 一种基于自动编码的图像识别模型训练方法及装置 | |
CN114139541B (zh) | 命名实体识别方法、装置、设备及介质 | |
CN111540363B (zh) | 关键词模型及解码网络构建方法、检测方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |