CN115083024A - 基于区域划分的签名识别方法、装置、介质及设备 - Google Patents
基于区域划分的签名识别方法、装置、介质及设备 Download PDFInfo
- Publication number
- CN115083024A CN115083024A CN202210692173.9A CN202210692173A CN115083024A CN 115083024 A CN115083024 A CN 115083024A CN 202210692173 A CN202210692173 A CN 202210692173A CN 115083024 A CN115083024 A CN 115083024A
- Authority
- CN
- China
- Prior art keywords
- character
- signature
- image
- region
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012545 processing Methods 0.000 claims description 48
- 238000004590 computer program Methods 0.000 claims description 17
- 238000005192 partition Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
- G06V40/33—Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Character Input (AREA)
Abstract
本申请提供了一种基于区域划分的签名识别方法、装置、存储介质及电子设备,方法包括:获取待处理图像;识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像;根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像;将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。本申请实施例将签名打散为字符,通过模型对字符进行分别识别后,可以根据各字符的识别结果得到签名的识别结果,实现对签名的自动识别。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种基于区域划分的签名识别方法、装置、存储介质及电子设备。
背景技术
随着信息技术的飞速发展,有效鉴别一个人的身份在信息安全领域非常重要,手写签名是一种具有强烈个人特色的特征,是一种重要的个人身份认证手段。然而,这些签名五花八门,时常难以辨认。
发明内容
本申请实施例提供一种基于区域划分的签名识别方法、装置、存储介质及电子设备,能够对签名进行自动识别。
本申请实施例提供一种基于区域划分的签名识别方法,包括:
获取待处理图像;
识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像;
根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像;
将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;
根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。
本申请实施例还提供了一种基于区域划分的签名识别装置,包括:
第一获取模块,用于获取待处理图像;
识别模块,用于识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像;
分割模块,用于根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像;
输入模块,用于将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;
第二获取模块,用于根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。
本申请实施例还提供一种计算机可读的存储介质,存储介质中存储有计算机程序,计算机程序被处理器执行以实现上述的基于区域划分的签名识别方法中的步骤。
本申请实施例还提供一种电子设备,电子设备包括处理器和存储器,存储器中存储有计算机程序,处理器执行计算机程序以实现上述的基于区域划分的签名识别方法中的步骤。
本申请实施例中,获取待处理图像;识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像;根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像;将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。本申请实施例将签名打散为字符,通过模型对字符进行分别识别后,可以根据各字符的识别结果得到签名的识别结果,实现对签名的自动识别。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的基于区域划分的签名识别方法的场景示意图。
图2为本申请实施例提供的基于区域划分的签名识别方法的第一种流程示意图。
图3为本申请实施例提供的基于区域划分的签名识别方法的第二种流程示意图。
图4为本申请实施例提供的基于区域划分的签名识别装置的第一种结构示意图。
图5为本申请实施例提供的基于区域划分的签名识别装置的第二种结构示意图。
图6为本申请实施例提供的电子设备的第一种结构示意图。
图7是本申请实施例提供的电子设备的第二种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书以及上述附图中的术语“第一”、“第二”、“第三”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应当理解,这样描述的对象在适当情况下可以互换。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤的过程、方法或包含了一系列模块或单元的装置、终端、系统不必限于清楚地列出的那些步骤或模块和单元,还可以包括没有清楚地列出的步骤或模块或单元,也可以包括对于这些过程、方法、装置、终端或系统固有的其它步骤或模块或单元。
手写签名由于具有鲜明的个人特色,因而可以作为一种重要的个人身份认证手段。在金融领域,用户在银行办理业务时,常常涉及到需要手写签名的场合。例如,在处理转账后用户对转账回执进行签名确认,或者对开卡进行确认等。银行留存这些含有客户手写签名的业务单,可以方便进行业务核查。
为了实现业务核查,银行对这些业务单进行留档时,需要对其中的手写签名进行整理。而由于手写签名一般具有很鲜明的个人特色,这些手写签名时常五花八门,有的签名字形端正很好辨认,也有的用户习惯连笔,签名比较潦草。有时甚至还有定制的艺术签名,难以辨认,给银行的签名整理工作带来困难。
基于此,本申请实施例提供一种基于区域划分的签名识别方法,该基于区域划分的签名识别方法的执行主体可以是本申请实施例提供的基于区域划分的签名识别装置,也可以是电子设备。其中,基于区域划分的签名识别装置可以集成在电子设备中。电子设备可以是计算机设备,该计算机设备可以是诸如智能手机、平板电脑、个人计算机之类的终端设备,也可以是服务器。以下进行具体分析说明。
请参阅图1,图1为本申请实施例提供的基于区域划分的签名识别方法的场景示意图。其中,服务器100中集成有基于区域划分的签名识别装置。基于区域划分的签名识别装置执行本申请实施例提供的基于区域划分的签名识别方法,首先获取待处理图像,识别待处理图像中的字符位置,并根据字符位置从待处理图像中分割出签名区域图像。然后,根据签名区域图像中的字符位置,将签名区域图像分割为多个(图1中以3个为例)字符区域图像。将每个字符区域图像分别输入训练好的字符识别模型,各自得到每个字符图像的字符识别结果。进而,根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果,实现对签名的自动识别,有效解决签名识别难的问题。
请参阅图2,图2为本申请实施例提供的基于区域划分的签名识别方法的第一种流程示意图。该基于区域划分的签名识别方法可以包括:
110、获取待处理图像。
本申请实施例中,获取待处理图像进行签名识别,其中,待处理图像中包含有手写体的待识别签名。
本申请实施例对待处理图像的来源不做限制。例如,待处理图像可以来源于对包含手写签名的纸张进行扫描时得到的扫描图像,又例如,来源于电子版的签名照片,或者来源于采集用户信息时用户在电子设备上进行手写签名得到的图像,等等。
在一实施例中,可以通过各种来源获取原始签名图像,然后,对原始签名图像进行预处理,得到该待处理图像。图像预处理是识别过程的先行步骤,能够提升后续识别签名的效率和准确率。
其中,数据增强处理是一种强化数据的预处理手段,对图像而言,经过数据增强处理的图像更加清晰,处理起来也更加容易。
在一实施例中,可以对原始签名图像进行的数据增强处理,得到待处理图像。其中,数据增强处理可以包括灰度化处理、降噪处理、二值化处理中的至少一项:
(1)灰度化处理
图像所呈现的颜色是由R(Red,红)、G(Green,绿)、B(Blue,蓝)三种颜色分量决定的。对设备而言,每个颜色分量的取值范围为[0,255],图像的颜色共有2563种取值可能。而灰度化处理即是使得R=G=B,图像的灰度值共有256种取值可能。通过将取值可能从2563种变为256种,能够大大减少在图像处理过程中的计算量。
本申请实施例中,由于图像的色彩对识别结果的影响微乎其微,因而,可以通过对原始签名图像进行灰度处理的方式,减少图像处理过程中的计算量,加快整个图像识别进程。
(2)降噪处理
图像降噪处理是指减少图像中噪声的过程,有时候又称为图像去噪。
由于原始签名图像的来源多种多样,其质量可能参差不齐。因而,为了获取高质量的数字图像,可以对图像进行降噪处理,尽可能的保持签名信息完整性(即签名特征)的同时,又能够去除原始签名图像中无用的信息。
(3)二值化处理
沿用之前灰度值的相关描述,二值化处理即是将图像上像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白化效果的过程。
以RGB格式的原始签名图像为例,原始签名图像中像素有2563种取值可能,若是进行灰度值处理,灰度值则有256种取值可能,而若是进行二值化处理,每个像素点的灰度值只有2种取值可能,即0或256。相对灰度值处理,二值化处理更进一步减少了图像处理过程中的计算量。
除上述例举的数据预处理方式外,本领域技术人员也可以采用本申请未例举的其他数据预处理方式对原始签名图像进行预处理,得到待处理图像。
需要说明的是,图像预处理的步骤并不是严格按照流程固定不变的。可以根据不同的识别需求做出步骤的调整。而一般对于扫描的PDF、WORD文件等所需的预处理较为简单,而对于环境复杂的图像,则需要较为繁琐的步骤。
120、识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像。
对于待处理图像,其中可能既包含手写体文本,也包含印刷体文本,还可能包含没有任何文本的空白区域。本申请所指字符,为手写体文本的字符。
为对待处理图像中可能存在的签名进行准确识别,获取到待处理图像后,可以首先识别待处理图像中的字符位置。字符位置可以包括字符坐标和不同字符的字符间距。具体的,可以通过识别待处理图像中各文本的字体,识别出待处理图像的字符位置。
例如,整个待处理图像中可以有银行告知用户的一些条款,中间靠下位置有客户的手写签名,则通过识别待处理图像中各文本的字体,可以知道条款所在区域为印刷体文本,手写签名所在区域为手写体文本,从而,可以识别出待处理图像的字符位置在中间靠下的位置。
可以理解的是,由于字符位置处包含有手写体文本,因而可以将字符位置处确定为待识别签名所在的区域。识别出待处理图像中的字符位置后,可以根据字符位置,从待处理图像中分割出签名区域图像,以便对待识别签名进行识别。
在一实施例中,待处理图像中可能包含有多个待识别签名,在分割签名区域图像时,可以对每个待识别签名分别分割出一个签名区域图像,从而,分割出的每个签名区域图像中都包含一个待识别签名。
在一实施例中,可以根据待处理图像中识别出的字符位置,从待处理图像中分割出多个签名区域图像。在识别出的字符中,可能有的字符之间相隔较近,有的字符之间相隔较远,甚至之间间隔大片空白区域。根据识别出的字符的远近位置关系,可以将相隔较近的字符(如字符间距小于或等于预设距离)划分为同一个待识别签名的字符,将相隔较远(如字符间距大于预设距离)的字符划分为不同待识别签名的字符,从而可以根据识别出的字符位置确定出不同待识别签名的位置。
在一实施例中,可以根据预设字符位数,从待处理图像中分割出多个签名区域图像。其中,预设字符位数为预先设置的签名可能包含的字符位数。例如,预设字符位数可以设置为3,则可以根据字符位置从左到右,每3个字符划分为一个签名区域,从而在待处理图像中划分出多个签名区域,并从待处理图像中将每个签名区域分割为一个签名区域图像,得到多个签名区域图像。
在一实施例中,可以根据字符位置和预设字符位数共同划分签名区域,根据字符位置和预设字符位数,从待处理图像中分割出多个签名区域图像。
可选的,可以先根据字符位置,在待处理图像中划分出多个待识别区域。例如,将字符间距小于或等于预设距离的连续字符所在区域确定为一个待识别区域,将字符间距大于预设距离的字符划分至不同的待识别区域。
其中,每个待识别区域中的字符都相隔较近。然而,每个待识别区域中的字符位数可能并不符合预设字符位数。例如,中文签名的字符位数一般是2至4个,但当待处理图像中的待识别签名相隔较近时,可能出现有待识别区域中包含不止一个待识别签名的情况。
因而,进一步的,可以根据预设字符位数从待识别区域中划分出签名区域。例如,当待识别区域中的字符位数为9,大于预设字符位数3时,可以将待识别区域中的9个字符,每3个连续字符划分至一个签名区域,从而将待识别区域划分为3个签名区域。
在一实施例中,为减少后续参与签名识别时的数据量,提高识别效率,签名区域的形状可以为包含相应字符的最小矩形框。即在将连续字符划分为签名区域时,使区域中包含尽可能少的其它内容。
130、根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像。
每个签名区域图像中包含一个待识别签名,每个待识别签名包含有多个字符。得到签名区域图像后,根据签名区域图像中的字符位置,将签名区域划分为多个字符区域,其中每个字符区域包含一个字符,从而,将签名区域图像分割为多个字符区域图像,每个字符区域图像中包含一个字符。签名区域图像分割出的字符区域图像的数量等于签名区域图像中包含的字符数量。
140、将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果。
在一实施例中,本申请实施例提供一种字符识别模型,该字符识别模型可以用于对字符区域图像进行识别,得到各字符区域图像的字符识别结果。
其中,可以事先用字符训练集对该字符识别模型进行训练,得到训练连号的字符训练模型。用于训练该字符识别模型的字符训练集中,可以包含多对一一对应的手写体的字符样本和字符样本的标准识别结果。
可选的,字符样本除了可以包含手写体的完整文字,也可以包含手写体的偏旁部首。例如,用于训练字符识别模型的字符样本中,既可以包含完整文字“沐”的字符,也可以包含偏旁“氵”和部首“木”的字符。从而使得训练出好的字符识别模型除了能识别完整文字,也能识别偏旁部首。
对字符识别模型训练完成后,将每个字符区域图像分别输入训练好的字符识别模型,对每个字符进行分别识别,得到每个字符区域图像的字符识别结果。
在一实施例中,字符区域图像的字符识别结果包括根据该字符区域图像转换成的标准文字。
在一实施例中,本申请实施例提供的训练好字符识别模型可以根据字符区域图像的字符特征,将字符区域图像转换成标准文字。该字符识别模型可以包括特征提取模块和识别转换模块。将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果的步骤,可以包括:
将字符区域图像输入特征提取模块,得到字符区域图像的字符特征;
将字符区域图像的字符特征输入识别转换模块,得到根据字符区域图像转换成的标准文字。
其中,字符区域图像的字符特征,可以为其中字符的偏旁、部首、笔画走向等。
150、根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。
根据训练好的字符识别模型得到多个字符区域图像的字符识别结果后,可以根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。
由于签名区域图像被分割为了多个字符区域图像,因而,根据签名区域图像分割出的所有字符区域图像的字符识别结果,即该签名区域图像中所有字符的字符识别结果。根据各字符的字符识别结果,结合各字符的位置,可以组合出签名区域图像的签名识别结果。
可以理解的,若从待处理图像中分割出多个签名区域图像,则可以根据每个签名区域图像分割出的所有字符区域图像,得到该签名区域图像的签名识别结果。从而,可以根据多个签名区域图像得到多个签名识别结果,从待处理图像中识别出多个签名。
本申请实施例还提供一种基于区域划分的签名识别方法。请参阅图3,图3为本申请实施例提供的基于区域划分的签名识别方法的第二种流程示意图。该基于区域划分的签名识别方法可以包括:
201、获取银行业务单。
本申请获取的银行业务单中,包含有手写体的签名。
在金融领域中,银行在处理业务时,常涉及到许多需要用户手写签名的场景。例如,银行业务单可以为转账回执,用户对转账回执进行签名确认,在转账回执上留下手写签名;例如,银行业务单也可以为电子账单,用户直接在电子设备的屏幕上使用触控笔对电子账单进行签名;等等。
202、从银行业务单中截取包含手写体文本的初始签名图像。
这些银行业务单中包含有手写体的签名,从银行业务单中,可以截取包含手写体文本的初始签名图像。
203、对初始签名图像进行数据增强处理,得到待处理图像,数据增强处理包括灰度化处理、降噪处理、二值化处理中的至少一项。
在一实施例中,可以对原始签名图像进行数据增强处理,得到待处理图像。数据增强处理是一种强化数据的预处理手段,对图像而言,经过数据增强处理的图像更加清晰,处理起来也更加容易。
其中,数据增强处理可以包括灰度化处理、降噪处理、二值化处理中的至少一项。
而除上述例举的数据预处理方式外,本领域技术人员也可以采用本申请未例举的其他数据预处理方式对原始签名图像进行预处理,得到待处理图像。
需要说明的是,图像预处理的步骤并不是严格按照流程固定不变的。可以根据不同的识别需求做出步骤的调整。而一般对于扫描的PDF、WORD文件等所需的预处理较为简单,而对于环境复杂的图像,则需要较为繁琐的步骤。
204、识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像。
对于待处理图像,其中可能既包含手写体文本,也包含印刷体文本,还可能包含没有任何文本的空白区域。本申请所指字符,为手写体文本的字符。
为对待处理图像中可能存在的签名进行准确识别,获取到待处理图像后,可以首先识别待处理图像中的字符位置。字符位置可以包括字符坐标和不同字符的字符间距。具体的,可以通过识别待处理图像中各文本的字体,识别出待处理图像的字符位置。
例如,整个待处理图像中可以有银行告知用户的一些条款,中间靠下位置有客户的手写签名,则通过识别待处理图像中各文本的字体,可以知道条款所在区域为印刷体文本,手写签名所在区域为手写体文本,从而,可以识别出待处理图像的字符位置在中间靠下的位置。
当待处理图像中包含有多个待识别签名时,在分割签名区域图像时,可以对每个待识别签名分别分割出一个签名区域图像,从而,分割出的每个签名区域图像中都包含一个待识别签名。
可选的,可以先根据字符位置,在待处理图像中划分出多个待识别区域。例如,将字符间距小于或等于预设距离的连续字符所在区域确定为一个待识别区域,将字符间距大于预设距离的字符划分至不同的待识别区域。
其中,每个待识别区域中的字符都相隔较近。然而,每个待识别区域中的字符位数可能并不符合预设字符位数。例如,中文签名的字符位数一般是2至4个,但当待处理图像中的待识别签名相隔较近时,可能出现有待识别区域中包含不止一个待识别签名的情况。
因而,进一步的,可以根据预设字符位数从待识别区域中划分出签名区域。例如,当待识别区域中的字符位数为9,大于预设字符位数3时,可以将待识别区域中的9个字符,每3个连续字符划分至一个签名区域,从而将待识别区域划分为3个签名区域。
205、根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像。
每个签名区域图像中包含一个待识别签名,每个待识别签名包含有多个字符。得到签名区域图像后,根据签名区域图像中的字符位置,将签名区域划分为多个字符区域,其中每个字符区域包含一个字符,从而,将签名区域图像分割为多个字符区域图像,每个字符区域图像中包含一个字符。签名区域图像分割出的字符区域图像的数量等于签名区域图像中包含的字符数量。
206、将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果。
本申请实施例提供一种字符识别模型,该字符识别模型可以用于对字符区域图像进行识别,得到各字符区域图像的字符识别结果。
本申请实施例提供的训练好字符识别模型可以根据字符区域图像的字符特征,将字符区域图像转换成字符识别结果。
该字符识别模型中可以包含有特征提取模块。其中,特征提取模块用于根据图像提取字符特征。将字符区域图像输入特征提取模块后,可以得到字符区域图像的字符特征。
除特征提取模块外,字符识别模型中还可以包含有识别转换模块,可以将字符特征转换为字符识别结果。通过将字符区域图像的字符特征输入字符识别模型的识别转换模块,可以得到根据字符区域图像转换成的字符识别结果。
其中,字符识别结果可以为标准文字。
207、将首个字符识别结果与姓氏库中的姓氏进行匹配。
在得到的字符识别结果中,以每个签名区域图像的所有字符区域图像识别出的字符识别结果为一组,每组字符识别结果可区分为首个字符识别结果和非首个字符识别结果。例如,以3个字符识别结果为一组,则第1个字符识别结果为首个字符识别结果,第2个和第3个字符识别结果为非首个字符识别结果。
在一实施例中,得到字符识别结果后,可以对字符识别结果进行校准,以验证字符区域图像中的字符是否识别正确,提高字符识别的准确度。
可选的,在对首个字符识别结果进行校准时,可以将首个字符识别结果与姓氏库中的姓氏进行匹配。该姓氏库预先存储在电子设备中,其中包含有各种姓氏。例如,可以事先从网络上下载《百家姓》,根据《百家姓》中的中文姓氏建立姓氏库,并将姓氏库存储在电子设备中。
208、判断是否匹配出与首个字符识别结果相匹配的姓氏。若是则转入步骤209,若否则转入步骤211。
每组字符识别结果对应于一个待识别签名,每组字符识别结果的首个字符识别结果,可以认为是该待识别签名的姓氏。将首个字符识别结果与姓氏库中的形式进行匹配后,若匹配出与首个字符识别结果相匹配的姓氏,则说明该待识别签名的首个字符区域图像识别出的首个字符识别结果刚好是一个姓氏,可以认为识别正确;而若未匹配出与该首个字符识别结果相匹配的形式,则说明识别出的这个首个字符识别结果可能并不是一个姓氏,识别错误的可能性高,需要进一步分析或校准。
209、输出识别成功的提示信息。
可选的,若匹配出与首个字符识别结果相匹配的姓氏,则可以输出识别成功的提示信息,用于提示用户识别出的这一组字符识别结果是准确的,可以组成一个正确的签名。
210、将与首个字符识别结果匹配度最高的姓氏确定为待验证姓氏,并获取首个字符识别结果与待验证姓氏的匹配度。
若未匹配出与首个字符识别结果相匹配的姓氏,则对该首个字符识别结果进行进一步验证。
首先,虽然未匹配出与首个字符识别结果相匹配的姓氏,但是根据该首个字符识别结果与各个姓氏的匹配情况,可以获取到姓氏库中与首个字符识别结果匹配度最高的姓氏。将该匹配度最高的姓氏确定为待验证姓氏,并获取首个字符识别结果与该待验证姓氏的匹配度。
211、判断首个字符识别结果与待验证姓氏的匹配度是否高于预设匹配度,若是则转入步骤212,若否则转入步骤214。
对首个字符识别结果与待验证姓氏的匹配度进行判断,判断其是否高于预设匹配度。该预设匹配度可以根据需求设置。具体的,若对准确度要求较高,则该预设匹配度可以设置得较高,若对准确度要求没那么高,该预设匹配度也可以设置得低一些。
判断首个字符识别结果与待验证姓氏的匹配度是否高于预设匹配度的过程,即判断首个字符识别结果与待验证姓氏的相似程度的过程。
212、根据首个字符区域图像中字符的笔画走向对首个字符区域图像进行截断处理,并将截断处理后的首个字符区域图像输入训练好的字符识别模型,重新得到首个字符区域图像的字符识别结果。
若判断出首个字符识别结果与待验证姓氏的匹配度高于预设匹配度,则说明该首个字符识别结果虽然没有从姓氏库中匹配出对应的姓氏,但是至少有字形相近的姓氏,可能由于识别不够准确,导致未能在姓氏库中准确匹配。因而,可以对首个字符区域图像进行进一步处理后,重新对首个字符区域图像进行识别。
可选的,可以根据首个字符区域图像中字符的笔画走向对首个字符区域图像进行截断处理,并将截断处理后的首个字符区域图像输入训练好的字符识别模型,重新得到首个字符区域图像的字符识别结果。
213、根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。
将重新得到的首个字符区域图像的字符识别结果,与签名区域图像的非首个字符区域图像的字符识别结果,进行组合,可以得到签名区域图像的签名识别结果。具体的,可以根据签名区域图像的各字符区域图像中字符的字符位置,从前至后依次组合对应的字符识别结果,得到签名区域图像的签名识别结果。
214、输出识别失败的提示信息。
若判断出首个字符识别结果与待验证姓氏的匹配度不高于预设匹配度,则说明该首个字符识别结果不仅没有从姓氏库中匹配出对应的姓氏,也没有字形相近的姓氏,该首个字符识别结果识别得不正确。可以输出识别失败的提示信息,用于提示用户识别出的这一组字符识别结果不准确。
由上述可知,本申请实施例所提供的基于区域划分的签名识别方法首先获取待处理图像;然后识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像;根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像;进而将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。本申请实施例将签名打散为字符,通过模型对字符进行分别识别后,可以根据各字符的识别结果得到签名的识别结果,实现对签名的自动识别。
请参阅图4,图4为本申请实施例提供的基于区域划分的签名识别装置300的第一种结构示意图。该基于区域划分的签名识别装置300包括第一获取模块301、识别模块302、分割模块303、输入模块304和第二获取模块305:
第一获取模块301,用于获取待处理图像;
识别模块302,用于识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像;
分割模块303,用于根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像;
输入模块304,用于将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;
第二获取模块305,用于根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。
在一实施例中,在获取待处理图像时,第一获取模块301具体用于:
获取初始签名图像;
对初始签名图像进行数据增强处理,得到待处理图像。
在一实施例中,数据增强处理包括灰度化处理、降噪处理、二值化处理中的至少一项。在一实施例中,在获取初始签名图像时,第一获取模块301具体用于:
获取银行业务单;
从银行业务单中截取包含手写体文本的初始签名图像。
请参阅图5,图5为本申请实施例提供的基于区域划分的签名识别装置的第二种结构示意图。在一实施例中,基于区域划分的签名识别装置300还包括匹配模块306,在根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果之前,匹配模块306具体用于:
将首个字符识别结果与姓氏库中的姓氏进行匹配;
第二获取模块305具体用于:
若匹配出与首个字符识别结果相匹配的姓氏,则根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。
请继续参阅图5,在一实施例中,基于区域划分的签名识别装置300还包括重识别模块307,在一实施例中,在将首个字符识别结果与姓氏库中的姓氏进行匹配之后,重识别模块307具体用于:
若未匹配出与首个字符识别结果相匹配的姓氏,则将与首个字符识别结果匹配度最高的姓氏确定为待验证姓氏,并获取首个字符识别结果与待验证姓氏的匹配度;
当首个字符识别结果与待验证姓氏的匹配度高于预设匹配度时,根据首个字符区域图像中字符的笔画走向对首个字符区域图像进行截断处理,并将截断处理后的首个字符区域图像输入训练好的字符识别模型,重新得到首个字符区域图像的字符识别结果。
在一实施例中,字符区域图像的字符识别结果包括根据字符区域图像转换成的标准文字,字符识别模型包括特征提取模块和识别转换模块,在将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果时,输入模块304具体用于:
将字符区域图像输入特征提取模块,得到字符区域图像的字符特征;
将字符区域图像的字符特征输入识别转换模块,得到根据字符区域图像转换成的标准文字。
由上述可知,本申请实施例提供了一种基于区域划分的签名识别装置300,其中第一获取模块301首先获取待处理图像;然后识别模块302识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像;分割模块303根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像;进而输入模块304将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;第二获取模块305根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。本申请实施例将签名打散为字符,通过模型对字符进行分别识别后,可以根据各字符的识别结果得到签名的识别结果,实现对签名的自动识别。
本申请实施例还提供一种电子设备400。请参阅图6,图6为本申请实施例提供的电子设备的第一种结构示意图。电子设备400包括处理器401以及存储器402。其中,处理器401与存储器402电性连接。
该处理器401是电子设备400的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器402内的计算机程序,以及通过存储在存储器402内的数据,执行电子设备400的各种功能并处理数据,从而对电子设备400进行整体监控。
该存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
在本申请实施例中,电子设备400中的处理器401会按照如下的步骤,将可在处理器401上执行的计算机程序存储在存储器402中,并由处理器401执行存储在存储器402中的计算机程序,从而实现各种功能,如下:
获取待处理图像;
识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像;
根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像;
将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;
根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。
请一并参阅图7,图7为本申请实施例提供的电子设备的第二种结构示意图。在某些实施方式中,电子设备400还可以包括:显示屏403、射频电路404、音频电路405以及电源406。其中,其中,显示屏403、射频电路404、音频电路405以及电源406分别与处理器401电性连接。
该显示屏403可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示屏403可以包括显示面板,在某些实施方式中,可以采用液晶显示屏(Liquid CrystalDisplay,LCD)、或者有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。
该射频电路404可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
该音频电路405可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。
该电源406可以用于给电子设备400的各个部件供电。在一些实施例中,电源406可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图6和图7中未示出,电子设备400还可以包括摄像头、蓝牙模块等,在此不再赘述。
本申请实施例还提供一种计算机可读的存储介质,该存储介质存储有计算机程序,该计算机程序被处理器执行以实现上述任一实施例中的基于区域划分的签名识别方法中的步骤,比如:获取待处理图像;识别待处理图像中的字符位置,并根据字符位置以及预设字符位数从待识别图像中分割出多个签名区域图像;根据签名区域图像中的字符位置,将签名区域图像分割为多个字符区域图像;将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;根据多个字符区域图像的字符识别结果,得到签名区域图像的签名识别结果。
在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM)、或者随机存取记忆体(Random Access Memory,RAM)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对本申请实施例的基于区域划分的签名识别方法而言,本领域普通测试人员可以理解实现本申请实施例的基于区域划分的签名识别方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,该计算机程序可存储于一计算机可读的存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如基于区域划分的签名识别方法的实施例的流程。其中,该计算机可读的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。
对本申请实施例的基于区域划分的签名识别装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。该集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读的存储介质中,该计算机可读的存储介质譬如为只读存储器,磁盘或光盘等。
本文所使用的术语「模块」可看做为在该运算系统上执行的软件对象。本文该的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文该的装置及方法优选的以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。
以上对本申请实施例所提供的一种基于区域划分的签名识别方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种基于区域划分的签名识别方法,其特征在于,包括:
获取待处理图像;
识别所述待处理图像中的字符位置,并根据所述字符位置以及预设字符位数从所述待识别图像中分割出多个签名区域图像;
根据所述签名区域图像中的字符位置,将所述签名区域图像分割为多个字符区域图像;
将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;
根据所述多个字符区域图像的字符识别结果,得到所述签名区域图像的签名识别结果。
2.根据权利要求1所述的基于区域划分的签名识别方法,其特征在于,所述获取待处理图像包括:
获取初始签名图像;
对初始签名图像进行数据增强处理,得到所述待处理图像。
3.根据权利要求2所述的基于区域划分的签名识别方法,其特征在于,所述数据增强处理包括灰度化处理、降噪处理、二值化处理中的至少一项。
4.根据权利要求2所述的基于区域划分的签名识别方法,其特征在于,所述获取初始签名图像包括:
获取银行业务单;
从所述银行业务单中截取包含手写体文本的初始签名图像。
5.根据权利要求1所述的基于区域划分的签名识别方法,其特征在于,所述根据所述多个字符区域图像的字符识别结果,得到所述签名区域图像的签名识别结果之前,还包括:
将首个字符识别结果与姓氏库中的姓氏进行匹配;
若匹配出与所述首个字符识别结果相匹配的姓氏,则根据所述多个字符区域图像的字符识别结果,得到所述签名区域图像的签名识别结果。
6.根据权利要求5所述的基于区域划分的签名识别方法,其特征在于,所述将首个字符识别结果与姓氏库中的姓氏进行匹配之后,还包括:
若未匹配出与所述首个字符识别结果相匹配的姓氏,则将与所述首个字符识别结果匹配度最高的姓氏确定为待验证姓氏,并获取所述首个字符识别结果与所述待验证姓氏的匹配度;
当所述首个字符识别结果与所述待验证姓氏的匹配度高于预设匹配度时,根据首个字符区域图像中字符的笔画走向对所述首个字符区域图像进行截断处理,并将截断处理后的首个字符区域图像输入所述训练好的字符识别模型,重新得到所述首个字符区域图像的字符识别结果。
7.根据权利要求1-6任一项所述的基于区域划分的签名识别方法,其特征在于,所述字符区域图像的字符识别结果包括根据所述字符区域图像转换成的标准文字,所述字符识别模型包括特征提取模块和识别转换模块,所述将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果包括:
将所述字符区域图像输入所述特征提取模块,得到所述字符区域图像的字符特征;
将所述字符区域图像的字符特征输入所述识别转换模块,得到根据所述字符区域图像转换成的标准文字。
8.一种基于区域划分的签名识别装置,其特征在于,包括:
第一获取模块,用于获取待处理图像;
识别模块,用于识别所述待处理图像中的字符位置,并根据所述字符位置以及预设字符位数从所述待识别图像中分割出多个签名区域图像;
分割模块,用于根据所述签名区域图像中的字符位置,将所述签名区域图像分割为多个字符区域图像;
输入模块,用于将每个字符区域图像分别输入训练好的字符识别模型,得到每个字符区域图像的字符识别结果;
第二获取模块,用于根据所述多个字符区域图像的字符识别结果,得到所述签名区域图像的签名识别结果。
9.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1至7任一项所述的基于区域划分的签名识别方法中的步骤。
10.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序以实现如权利要求1至7任一项所述的基于区域划分的签名识别方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210692173.9A CN115083024A (zh) | 2022-06-17 | 2022-06-17 | 基于区域划分的签名识别方法、装置、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210692173.9A CN115083024A (zh) | 2022-06-17 | 2022-06-17 | 基于区域划分的签名识别方法、装置、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115083024A true CN115083024A (zh) | 2022-09-20 |
Family
ID=83253291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210692173.9A Pending CN115083024A (zh) | 2022-06-17 | 2022-06-17 | 基于区域划分的签名识别方法、装置、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115083024A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116092099A (zh) * | 2023-01-18 | 2023-05-09 | 黑龙江省公安厅 | 一种多目标行政执法文书信息完整性识别检测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111368632A (zh) * | 2019-12-27 | 2020-07-03 | 上海眼控科技股份有限公司 | 一种签名识别方法及设备 |
CN113554033A (zh) * | 2021-09-18 | 2021-10-26 | 深圳市一号互联科技有限公司 | 智能文本机器人的文本识别方法、装置及系统 |
CN114241463A (zh) * | 2021-11-12 | 2022-03-25 | 中国南方电网有限责任公司 | 签名验证方法、装置、计算机设备和存储介质 |
-
2022
- 2022-06-17 CN CN202210692173.9A patent/CN115083024A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111368632A (zh) * | 2019-12-27 | 2020-07-03 | 上海眼控科技股份有限公司 | 一种签名识别方法及设备 |
CN113554033A (zh) * | 2021-09-18 | 2021-10-26 | 深圳市一号互联科技有限公司 | 智能文本机器人的文本识别方法、装置及系统 |
CN114241463A (zh) * | 2021-11-12 | 2022-03-25 | 中国南方电网有限责任公司 | 签名验证方法、装置、计算机设备和存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116092099A (zh) * | 2023-01-18 | 2023-05-09 | 黑龙江省公安厅 | 一种多目标行政执法文书信息完整性识别检测方法及系统 |
CN116092099B (zh) * | 2023-01-18 | 2023-08-18 | 黑龙江省公安厅 | 一种多目标行政执法文书信息完整性识别检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10140511B2 (en) | Building classification and extraction models based on electronic forms | |
US10467465B2 (en) | Range and/or polarity-based thresholding for improved data extraction | |
US10635946B2 (en) | Eyeglass positioning method, apparatus and storage medium | |
US8494273B2 (en) | Adaptive optical character recognition on a document with distorted characters | |
CN111046879B (zh) | 证件图像分类方法、装置、计算机设备及可读存储介质 | |
US9659213B2 (en) | System and method for efficient recognition of handwritten characters in documents | |
CN112508011A (zh) | 一种基于神经网络的ocr识别方法及设备 | |
CN109635805B (zh) | 图像文本定位方法及装置、图像文本识别方法及装置 | |
CN111898520B (zh) | 证件真伪识别方法、装置、计算机可读介质及电子设备 | |
US11341739B2 (en) | Image processing device, image processing method, and program recording medium | |
US9542756B2 (en) | Note recognition and management using multi-color channel non-marker detection | |
CN111462388A (zh) | 一种票据检验方法、装置、终端设备及存储介质 | |
CN112528998B (zh) | 证件图像处理方法、装置、电子设备及可读存储介质 | |
CN112669515A (zh) | 票据图像识别方法、装置、电子设备和存储介质 | |
CN110263616A (zh) | 一种文字识别方法、装置、电子设备及存储介质 | |
CN110321881B (zh) | 识别包含身份证明证件的图像的系统和方法 | |
CN109388935B (zh) | 单证验证方法及装置、电子设备及可读存储介质 | |
CN113901952A (zh) | 一种基于深度学习的印刷体与手写体分开文字识别方法 | |
CN112232336A (zh) | 一种证件识别方法、装置、设备及存储介质 | |
CN115083024A (zh) | 基于区域划分的签名识别方法、装置、介质及设备 | |
CN111213157A (zh) | 一种基于智能终端的快递信息录入方法及录入系统 | |
CN111062377A (zh) | 一种题号检测方法、系统、存储介质及电子设备 | |
CN108090728B (zh) | 一种基于智能终端的快递信息录入方法及录入系统 | |
CN103617423B (zh) | 基于色彩参数的图像拆分识别方法 | |
CN112508000A (zh) | 一种用于ocr图像识别模型训练数据生成的方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |