CN111291636A - 电子签章有效识别方法、装置、系统及存储介质 - Google Patents
电子签章有效识别方法、装置、系统及存储介质 Download PDFInfo
- Publication number
- CN111291636A CN111291636A CN202010058314.2A CN202010058314A CN111291636A CN 111291636 A CN111291636 A CN 111291636A CN 202010058314 A CN202010058314 A CN 202010058314A CN 111291636 A CN111291636 A CN 111291636A
- Authority
- CN
- China
- Prior art keywords
- signature
- criterion value
- stroke
- analyzed
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 239000013598 vector Substances 0.000 claims abstract description 74
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 239000002131 composite material Substances 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 description 46
- 230000008569 process Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
- G06V40/37—Writer recognition; Reading and verifying signatures based only on signature signals such as velocity or pressure, e.g. dynamic signature recognition
- G06V40/382—Preprocessing; Feature extraction
- G06V40/388—Sampling; Contour coding; Stroke extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
本发明提出一种电子签章有效识别方法、电子装置及存储介质,其中,该方法包括:分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,模板签章为经确认有效的签章,待分析签章为无法经确认的可疑签章;根据多维特征向量组合集,获取待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值;若笔画判据值达标,则为DTW判据值、CNN判据值、笔速判据值以及笔顺判据值分别赋予相应的权重值;根据各判据值的权重值计算待分析签章与模板签章之间的相似度,并根据该相似度判断待分析签章是否为有效签章。本发明提供技术方案能够解决传统的人工审核签章,效率低下,浪费大量人力财力,且人工审核时经常出现误判的问题。
Description
技术领域
本发明涉及机器识别技术领域,尤其涉及一种电子签章有效识别方法、装置及计算机可读存储介质。
背景技术
目前,随着互联网的发展,电子签章已经越来越常见,各种业务场景中都会见到电子签名的功能。但是,目前电子签名更多是实现了签名的“留档”,利用第三方CA机构,如CFCA实现了电子加签。可以证明这个“签名”的具体签署时间,具有一定法律效应。但是,对于签名的内容,是缺乏真正校验的。例如,用户进行签章时,书写的字是否为期望的字:如姓名写的是否正确。或者如果签名要求写同意,用户写的是否真的是“同意”两个字,而不是“不同意”,这种具体签章内容的校验是目前的电子签名产品无法实现的。
再例如,对于同一个流程中,书写的签名或者文字是否为同一个人书写的,如贷款场景中,贷前会要求签署征信授权书,额度批准下来后,会要求签贷款合同,在这两个节点下,经常会遇到明显的字迹不一致。通常此类客户会有严重的欺诈倾向。
目前业内做法还停留在人工阶段,通常设置专职的“合同审核岗”解决此类问题,这种人工的方式不仅浪费大量的人力物力,更重要的是人工的审核往往会出现误判的现象,出现一些欺诈行为,严重损害公司的利益。
基于上述问题,亟需一种能够高效地、精准地电子签章识别方法。
发明内容
本发明提供一种电子签章有效识别方法、电子装置以及计算机存储介质,其主要目的在于解决人工审核签章时,效率低下,浪费大量人力财力,且人工审核时经常出现误判的问题。
为实现上述目的,本发明提供一种电子装置,该电子装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的种虚拟机异步创建内部快照程序,所述电子签章有效识别程序被所述处理器执行时实现如下步骤:
分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,所述模板签章为确认有效的电子签章,所述待分析签章为无法确认是否有效的可疑签章;
根据所述多维特征向量组合集,获取所述待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值;
若所述笔画判据值达标,则根据预设规则为所述DTW判据值、所述CNN判据值、所述笔速判据值以及所述笔顺判据值分别赋予相应的权重值;
根据各判据值的权重值计算所述待分析签章与所述模板签章之间的相似度,并根据所述相似度与预设的相似度阈值判断所述待分析签章是否为有效签章。
优选地,分别获取所述模板签章以及所述待分析签章的每个汉字的所述多维特征向量组合集charn的过程包括:
根据预设时间间隔将所述待分析签章的每个汉字的每一笔画划分为n个像素点,并提取各像素点的初始特征信息,其中,所述初始特征信息包括:时间timen、x方向坐标xn、y方向坐标yn、力度forcen以及触点半径radiusn;
根据所述初始特征信息通过预设公式集计算各像素点的复合特征信息,其中,所述复合特征信息包括:书写速度vn、书写角度degn以及拐点属性turnn;
根据各像素点的初始特征信息以及复合特征信息创建各像素点的多维特征向量,记为tn=(timen,xn,yn,forcen,radiusn,vn,degn,turnn),并根据各笔画的所有像素点的多维特征向量tn创建各笔画的多维特征向量集,记为linen=(t1……tn);
将每一个汉字的所有笔画的多维特征向量集进行组合以获取所述多维特征向量组合集,记为charn。
优选地,所述预设公式集包括:
计算书写速度的公式:vn=((xn-xn-1)2–(yn–yn-1)2)1/2/(tn-tn-1);
计算书写角度的公式:degn=arctg((yn–yn-1)/(xn–xn-1));
计算拐点属性的公式为:turnn=1 if(degn–degn-1)>拐点阈值,turnn=0 if(degn–degn-1)≤拐点阈值,其中,所述拐点阈值根据前后两个像素点的角度差有关预先设定。
优选地,根据多维特征向量组合集获取所述DTW判据值的过程包括:
通过DTW算法对所述模板签章和所述待分析签章对应的同一个汉字的同一个笔画的多维特征向量集linei以及linej进行动态规整,以获取两个笔画的最小欧式距离dtw(linei,linej);
根据预设的dtw阈值计算所述待分析签章的所述笔画的DTW判据值;
其中,计算所述DTW判据值的公式为:
res_dtw=1 if dtw(linei,linej)<dtw阈值,
res_dtw=0 if dtw(linei,linej)≥dtw阈值。
优选地,根据所述多维特征向量组合集获取所述CNN判据值的过程包括:
将所述待分析签章的各笔画的多维特征向量集依次输入至预设的CNN模型内,通过所述CNN模型计算所述待分析签章的各笔画的CNN判据值;其中,所述CNN模型为预先经过多重训练得到的CNN模型,所述CNN模型输出的CNN判据值分为两种情况,即res_cnn=0||1。
优选地,根据所述多维特征向量组合集获取所述笔速判据值的过程包括:
将所述模板签章以及所述待分析签章对应的同一笔画按照书写顺序划分为起笔、承笔以及合笔三部分;
对每一部分包含的所有像素点的书写速度vn进行平均,以获取每一部分的平均速度;
根据所述模板签章以及所述待分析签章对应的同一笔画的各部分的平局速度,分别建立所述模板签章以及所述待分析签章对应的同一笔画的速度向量,即(vi1,vi2,vi3)&(vj1,vj2,vj3);
计算两个所述速度向量之间的距离,即std=(vi1-vj1)2+(vi2-vj2)2+(vi3-vj3)2;
根据预设的std阈值计算所述笔速判据值res v,其中,计算所述笔速判据值的计算公式为:res_v=1 if std(linei,linej)<std阈值,res_v=0 if std(linei,linej)>=std阈值。
优选地,根据所述多维特征向量组合集获取所述笔顺判据值的过程包括:
根据所述模板签章以及所述待分析签章对应的同一笔画的各像素点的书写角度值degn,分别计算所述模板签章以及所述待分析签章对应的同一笔画的书写角度的平均值,即avg_degi与avg_degi,其中,
计算公式为:avg_deg=avg(deg1,deg2,…degn);
根据预设的角度误差阈值计算所述笔顺判据值,其中,计算所述笔顺判据值的公式为:
res_deg=1 if|avg_degi–avg_degi|≤角度误差阈值
res_deg=0 if|avg_degi–avg_degj|>角度误差阈值。
此外,为实现上述目的,本发明还提供一电子签章有效识别方法,该方法包括:
分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,所述模板签章为确认有效的电子签章,所述待分析签章为无法确认是否有效的可疑签章;
根据所述多维特征向量组合集,获取所述待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值;
若所述笔画判据值达标,则根据预设规则为所述DTW判据值、所述CNN判据值、所述笔速判据值以及所述笔顺判据值分别赋予相应的权重值;
根据各判据值的权重值计算所述待分析签章与所述模板签章之间的相似度,并根据所述相似度与预设的相似度阈值判断所述待分析签章是否为有效签章。
另外,为实现上述目的,本发明还提供一种电子签章有效识别系统,该系统包括:
多维特征向量集获取单元,用于分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,模板签章为确认有效的电子签章,待分析签章为无法确认是否有效的可疑签章;
判据值获取单元,用于根据多维特征向量组合集,获取待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值;
权重值赋予单元,若笔画判据值达标,则根据预设规则为DTW判据值、CNN判据值、笔速判据值以及笔顺判据值分别赋予相应的权重值;
签章有效判定单元,根据各判据值的权重值计算待分析签章与模板签章之间的相似度,并根据相似度与预设相似度阈值的关系判断待分析签章是否为有效签章。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,计算机可读存储介质中存储有电子签章有效识别程序,电子签章有效识别程序被处理器执行时,实现前述电子签章有效识别方法的步骤。
本发明提出电子签章有效识别方法、电子装置及计算机可读存储介质,先通过获取模板签章以及待分析签章的每个汉字的多维特征向量组合集;然后根据多维特征向量组合集获取各判据值以及各判据值的权重值;最后根据各判据值的权重值计算待分析签章与模板签章之间的相似度,能够显著提高电子签章的识别精度,此外通过系统实现电子签章的自动识别,还能够显著提高签章识别的效率,节省大量人力物力。
附图说明
图1为根据本发明实施例的电子装置的较佳实施例结构示意图;
图2为根据本发明实施例的电子签章有效识别方法的较佳实施例流程图;
图3为根据本发明实施例的获取模板签章以及待分析签章的每个汉字的多维特征向量组合集过程的流程图;
图4为根据本发明实施例的电子签章有效识别程序的内部逻辑示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种电子签章有效识别方法,应用于一种电子装置70。参照图1所示,该图为本发明提供的电子装置70的较佳实施例结构示意图。
在本实施例中,电子装置70可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有运算功能的终端设备。
该电子装置70包括:处理器71以及存储器72。
存储器72包括至少一种类型的可读存储介质。至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中,可读存储介质可以是该电子装置70的内部存储单元,例如该电子装置70的硬盘。在另一些实施例中,可读存储介质也可以是电子装置1的外部存储器,例如电子装置70上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
在本实施例中,存储器72的可读存储介质通常用于存储安装于电子装置70的虚拟机异步创建内部快照程序73。存储器72还可以用于暂时地存储已经输出或者将要输出的数据。
处理器72在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器72中存储的程序代码或处理数据,例如电子签章有效识别程序73等。
在一些实施例中,电子装置70为智能手机、平板电脑、便携计算机等的终端设备。在其他实施例中,电子装置70可以为服务器。
图1仅示出了具有组件71-73的电子装置70,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该电子装置70还可以包括用户接口,用户接口可以包括输入单元比如键盘(Keyboard)、语音输入装置比如麦克风(microphone)等具有语音识别功能的设备、语音输出装置比如音响、耳机等,可选地用户接口还可以包括标准的有线接口、无线接口。
可选地,该电子装置70还可以包括显示器,显示器也可以称为显示屏或显示单元。在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。显示器用于显示在电子装置70中处理的信息以及用于显示可视化的用户界面。
可选地,该电子装置70还可以包括触摸传感器。触摸传感器所提供的供用户进行触摸操作的区域称为触控区域。此外,这里的触摸传感器可以为电阻式触摸传感器、电容式触摸传感器等。而且,触摸传感器不仅包括接触式的触摸传感器,也可包括接近式的触摸传感器等。此外,触摸传感器可以为单个传感器,也可以为例如阵列布置的多个传感器。
此外,该电子装置70的显示器的面积可以与触摸传感器的面积相同,也可以不同。可选地,将显示器与触摸传感器层叠设置,以形成触摸显示屏。该装置基于触摸显示屏侦测用户触发的触控操作。
可选地,该电子装置70还可以包括射频(Radio Frequency,RF)电路,传感器、音频电路等等,在此不再赘述。
在图1所示的装置实施例中,作为一种计算机存储介质的存储器72中可以包括操作系统、以及电子签章有效识别程序73;处理器71执行存储器72中存储虚拟机电子签章有效识别程序73时,实现图2所示的本发明实施例的电子签章有效识别方法的较佳实施例流程图中的如下步骤:
S110:分别获取模板签章以及待分析签章的对应的每个汉字的多维特征向量组合集,记为charn,其中,模板签章为经专业人士、专业设备或者现场确定的真实签名人作出有效的签章,待分析签章为无法确认是否为真实签名人作出的可疑签章。
在本发明的一个具体的实施方式中,图3为根据本发明实施例的获取模板签章以及待分析签章的每个汉字的多维特征向量组合集过程的流程图,如图3所示,模板签章或者待分析签章的每个汉字的多维特征向量组合集charn的获取过程还可以包括如下步骤:
S111:根据预设时间隔将待分析的电子签章的每个汉字的每一笔画划分为n个像素点,并提取各像素点的初始特征信息。
其中,该初始特征信息至少包括:时间timen、x方向坐标xn、y方向坐标yn、力度forcen以及触点半径radiusn。
需要说明的是,本发明是通过识别签章书写过程中的特征信息对电子签章进行欺诈识别的,而签章的书写过程各特征信息均随着时间的变化而变化,因此,将待分析的电子签章的每个汉字的每一笔画按预设时间间隔划分为多个像素点,能够清楚的表述该笔画的书写过程,此外,也便于计算一些复合技术特征,比如书写速度vn。
S112:根据初始特征信息计算每一像素点的复合特征信息。
其中,该复合特征信息至少包括:书写速度vn、书写角度degn以及拐点属性turnn。
具体地,各复合特征信息可以根据预设公式集进行计算,其中,
计算每个像素点的书写速度的公式为:
vn=((xn-xn-1)2–(yn–yn-1)2)1/2/(tn-tn-1);
计算每一个像素点的书写角度的公式为:
degn=arctg((yn–yn-1)/(xn–xn-1));
计算拐点属性的公式为:
turnn=1 if(degn–degn-1)>拐点阈值;
turnn=0 if(degn–degn-1)<=拐点阈值。
其中,拐点阈值与前后两个像素点的角度差有关,经多次训练,拐点阈值的设置范围为15至25,本发明选用较为优先的20。
S113:根据像素点的初始特征信息以及符合特征信息创建该像素点的多维特征向量,记为:
tn=(timen,xn,yn,forcen,radiusn,vn,degn,turnn),
并根据每一个笔画的所有像素点的多维特征向量创建该笔画的多维特征向量集,记为linen=(t1……tn)。
S114:将每一个汉字的所有笔画的多维特征向量集进行组合,记为charn。
S120:根据模板签章以及待分析签章的每个汉字的多维特征向量组合集charn,获取待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值。
其中,该DTW判据值由DTW算法获取,用于判断模板签章与待分析签章对应同一笔画的相似度;该CNN判据值由CNN模型获取,用于进一步判断模板签章与待分析签章对应同一笔画的相似度;该笔速判据值用于判断模板签章与待分析签章对应同一笔画的平均书写速度的相似度;该笔画判据值用于判断模板签章与待分析签章对应同一汉字的笔画是否相同,该笔画判据值为1,表示笔画相同,即该笔画判据值达标;该笔画判据值为0,表示笔画不同,即该笔画判据值不达标;该笔顺判据值用于判断模板签章与待分析签章对应同一笔画的平均书写角度的相似度。
具体地,DTW判据值的获取过程为:
应用DTW算法,对进行对模板签章和待分析签章的同一个汉字的同一个笔画linei以及linej进行动态规整。经过DTW的计算,可以得到两个笔画曲线的最小欧式距离值。
DTW算法,主要运用在语音识别中,工作原理主要是现将参考模板以及测试模板分成M个语音帧和N个语音帧,从而将参考模板表示为R={R(1),R(2),……,R(m),……,R(M)},将测试模板表示为T={T(1),T(2),……,T(n),……,T(N)},然后通过计算参考模板与测试模板之间的欧式距离D[T,R],并根据得到的欧式距离判断参考模板和测试模板这两段语音的相似度。
本发明在DTW算法运用到语音识别的基础上,结合模板签章和待分析签章的特性,将DTW算法运用值各笔画相似度的判断中,先计算模板签章以及待分析签章对应笔画之间的欧式距离dtw(linei,linej),然后根据预设的dtw阈值计算待分析签章该笔画的DTW判据值。其中,计算待分析签章该笔画的DTW判据值的公式为:
res_dtw=1 if dtw(linei,linej)<dtw阈值;
res_dtw=0 if dtw(linei,linej)≥dtw阈值;
需要说明的是,dtw阈值由欧式距离dtw与相似度之间的关系而定,经多次训练和计算,该dtw阈值的最优值设置为1300。
具体地,CNN判据值的获取过程为:
将收集到的待分析签章的某一笔画的多维特征向量集,输入预设的CNN模型中,通过CNN模型的计算,将会输出两种结果,相似与不相似,将相似记为1,不相似记为0,即可得到本发明所需的CNN判据值,记为:
res_cnn=0||1
CNN模型,又称卷积神经网络,是一种现有的通过监督学习进行的深度学习算法,卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类本方案正是运用卷积神经网分类这一特性对待分析签章的所有笔画进行0||1分类;在运用CNN模型之前,我们使用了2000个样本,其中,包括1000个正样本(即非欺诈样本),1000个负样本(即欺诈样本)进行模型训练,通过三层神经元的计算,训练15000次左右就可以达到较好识别效果,然后将待分析签章的某一笔画的多维特征向量集输入CNN模型中,即可得到相应的CNN判据值。
需要说明的是,CNN模型是一种现有的运用十分普遍的深度学习算法,本方案的重点并不在于CNN模型的构建,仅仅只是运用CNN模型获取所需的CNN判据值,因此,关于CNN模型的构建,在此不在赘述。
此外,为防范高明的“仿照者”,本发明还利用了书写速度的特征,因为再高明的仿造者,也无法完全模仿用户的书写速度与节奏。因此,通过每一笔画中的速度值笔速判据值即可有效地防范高明的“仿照者”。其中,笔速判据值的获取过程为:将模板签章以及待分析签章的对应的同一笔画按照书写顺序的20%,60%,20%的比例切为3段,分别对应书写时的起笔,承笔,合笔。然后分别计算三段中的平均速度。由此,即可分别得到模板签章与待分析签章对应同一笔画的速度向量:
(vi1,vi2,vi3)&(vj1,vj2,vj3)
然后即可计算出两者之间的距离
std=(vi1-vj1)2+(vi2-vj2)2+(vi3-vj3)2
最后根据std阈值即可计算出笔速判据值res v,其中,判断标准为
res_v=1 if std(linei,linej)<std阈值
res_v=0 if std(linei,linej)>=std阈值
需要说明的是,std阈值由std的取值范围以及std和笔速相似度之间的关系来确定,经多次训练,本申请的std阈值优选为800。
具体地,笔划判据值的获取过程包括:
利用模板签章以及待分析签章在书写时的前端触屏事件响应(触屏起始,触屏结束),将待分析签章进行笔划切分;笔划规整程序。
在实践过程中,发现存在一些事件的误判,一个笔划会存在被割裂开的可能性。因此我们增加了笔划规整程序,判断前一笔结束点与后一笔开始点的距离,距离<100,且事件间隔<0.1秒,则视为同一笔。
得到文字的笔划后,通过对笔画数判断,就可以得到笔画判据值:
res_cnt=1 if count(charn1)-count(charn2)=0
res_cnt=0 if count(charn1)-count(charn2)≠0
其中,count(charn1)为模板签章中某一汉字的笔画数,count(charn2)为待分析签章对应的该汉字的笔画数。
具体地,笔顺判据值的获取过程为:
获取笔划角度的平均值avg_deg=avg(deg1,deg2,…degn)
根据预设的角度误差阈值获取笔顺判据值,其中,具体判断过程为:
res_deg=1 if|avg_degi–avg_degj|≤角度误差阈值
res_deg=0 if|avg_degi–avg_degj|>角度误差阈值
其中,角度误差阈值根据实际经验自行设定,优选为15度。
S130:若所述笔画判据为0,则说明待分析签章与模板签章所对应的汉字的笔画不同,则判定待分析签章书写的字并不是我们期望其书写的字,将其记录为错误签章,并要求签章人重新签章。若所述笔画判据值达标,则说明待分析签章与模板签章所对应汉字的笔画相同,此时,根据各判据值重要程度对待分析签章每一个汉字的每一个笔画对应的DTW判据值、CNN判据值、笔速判据值、以及笔顺判据值分别赋予相应的权重值,其中,权重值的总和为1。
例如,DTW判据值的权重值为0.25、CNN判据值的权重值0.35、笔速判据值权重值为0.2、笔顺判据值的权重值为0.2。
此外,为更加准确地分配各判据值的权重值,可以使用线性回归算法对各判据值进行训练,通过线性回归算法获取各判据值的权重值。
S140:根据各判据值的权重值计算待分析签章每一个汉字的每一个笔画与模板签章之间的相似度,并根据所述相似度与预设的相似度阈值判断该待分析签章是否为有效签章。
具体地,计算待分析签章每一个汉字的每一个笔画的各判据值的权重值之和作为该笔画的相似度,若该相似度大于百分之八十,则认定待分析签章的该汉字的该笔画为非欺诈笔画;
若待分析签章所有汉字的所有笔画与模板签章之间的相似度均大于百分之八十,则认定该待分析签章为有效签章,否则,认定为欺诈签章。
此外,为便于该电子签章方法的实现,可以将上述电子签章反欺诈方法应用于SDK中,后台提供云服务,通过这种方式可以随着数据量的提升,重新进行训练,进一步提升模型的准确性。
在其他实施例中,图4为根据本发明实施例的电子签章有效识别程序的内部逻辑示意图,如图4所示,电子签章有效识别程序73还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器72中,并由处理器71执行,以完成本发明。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。参照图4所示,为图1中电子签章有效识别程序73较佳实施例的程序模块图。电子签章有效识别程序73可以被分割为:多维特征向量组合集获取模块74、判据值获取模块75、权重值赋予模块76以及签章判定模块77。模块74-77所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如,其中:
多维特征向量组合集获取模块74,用于分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,模板签章为确认有效的电子签章,待分析签章为无法确认是否有效的可疑签章。
判据值获取模块75,用于根据多维特征向量组合集,获取待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值。
权重值赋予模块76,用于若笔画判据值达标,则根据预设规则为DTW判据值、CNN判据值、笔速判据值以及笔顺判据值分别赋予相应的权重值。
签章判定模块77,用于根据各判据值的权重值计算待分析签章与模板签章之间的相似度,并根据预设的相似度阈值判断待分析签章是否为有效签章。
此外,本发明还提供一种电子签章有效识别方法。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,电子签章有效识别方法包括:步骤S110-步骤S140。
S110:分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,模板签章为确认有效的电子签章,待分析签章为无法确认是否有效的可疑签章;
S120:根据多维特征向量组合集,获取待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值;
S130:若笔画判据值达标,则根据预设规则为DTW判据值、CNN判据值、笔速判据值以及笔顺判据值分别赋予相应的权重值;
S140:根据各判据值的权重值计算待分析签章与模板签章之间的相似度,并根据预设的相似度阈值判断待分析签章是否为有效签章。
本发明提供的电子签章有效识别方法的具体实施方式与上述电子装置的具体实施方式大致相同,在此不再赘述。
另外,本发明还提供一种电子签章有效识别系统,该系统包括:
多维特征向量集获取单元,用于分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,模板签章为确认有效的电子签章,待分析签章为无法确认是否有效的可疑签章;
判据值获取单元,用于根据多维特征向量组合集,获取待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值;
权重值赋予单元,若笔画判据值达标,则根据预设规则为DTW判据值、CNN判据值、笔速判据值以及笔顺判据值分别赋予相应的权重值;
签章有效判定单元,根据各判据值的权重值计算待分析签章与模板签章之间的相似度,并根据相似度与预设相似度阈值的关系判断待分析签章是否为有效签章。
本发明提供的电子签章有效识别系统的具体实施方式与上述电子装置的具体实施方式大致相同,在此不再赘述。
此外,本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有电子签章有效识别程序73,虚电子签章有效识别程序73被处理器执行时实现如下操作:
S110:分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,模板签章为确认有效的电子签章,待分析签章为无法确认是否有效的可疑签章;
S120:根据多维特征向量组合集,获取待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值;
S130:若笔画判据值达标,则根据预设规则为DTW判据值、CNN判据值、笔速判据值以及笔顺判据值分别赋予相应的权重值;
S140:根据各判据值的权重值计算待分析签章与模板签章之间的相似度,并根据该相似度与预设的相似度阈值判断待分析签章是否为有效签章。
本发明提供的计算机可读存储介质的具体实施方式与上述电子签章有效识别方法、电子装置的具体实施方式大致相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种电子签章有效识别方法,应用于电子装置,其特征在于,所述方法包括:
分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,所述模板签章为确认有效的电子签章,所述待分析签章为无法确认是否有效的可疑签章;
根据所述多维特征向量组合集,获取所述待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值;
若所述笔画判据值达标,则根据预设规则为所述DTW判据值、所述CNN判据值、所述笔速判据值以及所述笔顺判据值分别赋予相应的权重值;
根据各判据值的权重值计算所述待分析签章与所述模板签章之间的相似度,并根据所述相似度与预设相似度阈值的关系判断所述待分析签章是否为有效签章。
2.根据权利要求1所述的电子签章有效识别方法,其特征在于,分别获取所述模板签章以及所述待分析签章的每个汉字的所述多维特征向量组合集的过程包括:
根据预设时间间隔将所述待分析签章中每个汉字的每一笔画划分为n个像素点,并提取各像素点的初始特征信息,其中,所述初始特征信息包括:时间timen、x方向坐标xn、y方向坐标yn、力度forcen以及触点半径radiusn;
根据所述初始特征信息通过预设公式集计算各像素点的复合特征信息,其中,所述复合特征信息包括:书写速度vn、书写角度degn以及拐点属性turnn;
根据各像素点的初始特征信息以及复合特征信息创建各像素点的多维特征向量,记为tn=(timen,xn,yn,forcen,radiusn,vn,degn,turnn),并根据各笔画的所有像素点的多维特征向量tn创建各笔画的多维特征向量集,记为linen=(t1……tn);
将每一个汉字的所有笔画的多维特征向量集进行组合以获取所述多维特征向量组合集,记为charn。
3.根据权利要求2所述的电子签章有效识别方法,其特征在于,所述预设公式集包括:
计算书写速度的公式:vn=((xn-xn-1)2–(yn–yn-1)2)1/2/(tn-tn-1);
计算书写角度的公式:degn=arctg((yn–yn-1)/(xn–xn-1));
计算拐点属性的公式为:turnn=1 if(degn–degn-1)>拐点阈值,turnn=0 if(degn–degn-1)≤拐点阈值,其中,所述拐点阈值根据前后两个像素点的角度差有关预先设定。
4.根据权利要求2所述的电子签章有效识别方法,其特征在于,根据所述多维特征向量组合集获取所述DTW判据值的过程包括:
通过DTW算法对所述模板签章和所述待分析签章对应的同一个汉字的同一个笔画的多维特征向量集linei以及linej进行动态规整,以获取两个笔画的最小欧式距离dtw(linei,linej);
根据预设的dtw阈值计算所述待分析签章的所述笔画的DTW判据值;
其中,计算所述DTW判据值的公式为:
res_dtw=1 if dtw(linei,linej)<dtw阈值;
res_dtw=0 if dtw(linei,linej)≥dtw阈值。
5.根据权利要求2所述的电子签章有效识别方法,其特征在于,根据所述多维特征向量组合集获取所述CNN判据值的过程包括:
将所述待分析签章的各笔画的多维特征向量集依次输入至预设的CNN模型内,通过所述CNN模型计算所述待分析签章的各笔画的CNN判据值;其中,所述CNN模型为预先经过多重训练得到的计算模型,所述CNN模型输出的CNN判据值分为两种情况,即res_cnn=0||1。
6.根据权利要求2所述的电子签章有效识别方法,其特征在于,根据所述多维特征向量组合集获取所述笔速判据值的过程包括:
将所述模板签章以及所述待分析签章对应的同一笔画按照书写顺序划分为起笔、承笔以及合笔三部分;
对每一部分包含的所有像素点的书写速度vn进行平均,以获取每一部分的平均速度;
根据所述模板签章以及所述待分析签章对应的同一笔画的各部分的平局速度,分别建立所述模板签章以及所述待分析签章对应的同一笔画的速度向量,即(vi1,vi2,vi3)&(vj1,vj2,vj3);
计算两个所述速度向量之间的距离,即
std=(vi1- vj1)2+(vi2- vj2)2+(vi3- vj3)2;
根据预设的std阈值计算所述笔速判据值res v,其中,计算所述笔速判据值的计算公式为:
res_v=1 if std(linei,linej)<std阈值,
res_v=0 if std(linei,linej)>=std阈值。
7.根据权利要求2所述的电子签章有效识别方法,其特征在于,根据所述多维特征向量组合集获取所述笔顺判据值的过程包括:
根据所述模板签章以及所述待分析签章对应的同一笔画的各像素点的书写角度值degn,分别计算所述模板签章以及所述待分析签章对应的同一笔画的书写角度的平均值,即avg_degi与avg_degi,其中,
计算公式为:avg_deg=avg(deg1,deg2,…degn);
根据预设的角度误差阈值计算所述笔顺判据值,其中,计算所述笔顺判据值的公式为:
res_deg=1 if|avg_degi–avg_degi|≤角度误差阈值,
res_deg=0 if|avg_degi–avg_degj|>角度误差阈值。
8.一种电子装置,其特征在于,该电子装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的电子签章有效识别程序,所述电子签章有效识别程序被所述处理器执行时实现如下步骤:
分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,模板签章为确认有效的电子签章,待分析签章为无法确认是否有效的可疑签章;
根据所述多维特征向量组合集,获取所述待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值;
若所述笔画判据值达标,则根据预设规则为所述DTW判据值、所述CNN判据值、所述笔速判据值以及所述笔顺判据值分别赋予相应的权重值;
根据各判据值的权重值计算所述待分析签章与所述模板签章之间的相似度,并根据所述相似度与预设的相似度阈值判断所述待分析签章是否为有效签章。
9.一种电子签章有效识别系统,其特征在于,所述系统包括:
多维特征向量集获取单元,用于分别获取模板签章以及待分析签章的每个汉字的多维特征向量组合集,其中,所述模板签章为确认有效的电子签章,所述待分析签章为无法确认是否有效的可疑签章;
判据值获取单元,用于根据所述多维特征向量组合集,获取所述待分析签章的DTW判据值、CNN判据值、笔速判据值、笔画判据值以及笔顺判据值;
权重值赋予单元,若所述笔画判据值达标,则根据预设规则为所述DTW判据值、所述CNN判据值、所述笔速判据值以及所述笔顺判据值分别赋予相应的权重值;
签章有效判定单元,根据各判据值的权重值计算所述待分析签章与所述模板签章之间的相似度,并根据所述相似度与预设相似度阈值的关系判断所述待分析签章是否为有效签章。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有电子签章有效识别程序,所述虚拟机异步创建内部快照程序被处理器执行时,实现如权利要求1至7中任一项所述的电子签章有效识别程序方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010058314.2A CN111291636A (zh) | 2020-01-19 | 2020-01-19 | 电子签章有效识别方法、装置、系统及存储介质 |
PCT/CN2020/087663 WO2021142973A1 (zh) | 2020-01-19 | 2020-04-29 | 电子签章有效识别方法、装置、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010058314.2A CN111291636A (zh) | 2020-01-19 | 2020-01-19 | 电子签章有效识别方法、装置、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111291636A true CN111291636A (zh) | 2020-06-16 |
Family
ID=71022284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010058314.2A Pending CN111291636A (zh) | 2020-01-19 | 2020-01-19 | 电子签章有效识别方法、装置、系统及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111291636A (zh) |
WO (1) | WO2021142973A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115035527B (zh) * | 2022-08-10 | 2022-11-11 | 北京佳萌锐普科技发展有限公司 | 一种识别电子签章位置的方法、装置及设备 |
CN115758476B (zh) * | 2022-11-11 | 2024-02-09 | 重庆亲笔签数字科技有限公司 | 基于手写签名的电子名章制作方法、设备及介质 |
CN117171817B (zh) * | 2023-11-03 | 2024-01-19 | 北京点聚信息技术有限公司 | 基于区块链的电子签章安全管理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593673A (zh) * | 2013-10-27 | 2014-02-19 | 沈阳建筑大学 | 一种基于动态阈值的在线手写签名认证方法 |
CN104281831A (zh) * | 2013-07-02 | 2015-01-14 | 阿里巴巴集团控股有限公司 | 一种笔迹验证的方法和装置 |
CN104820924A (zh) * | 2015-05-13 | 2015-08-05 | 重庆邮电大学 | 一种基于笔迹鉴定的网上安全支付系统 |
DE102017110048A1 (de) * | 2017-05-10 | 2018-11-15 | Matthias Olschowy | Verfahren zur handschriftlichen elektronischen Signatur |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101526992A (zh) * | 2008-03-03 | 2009-09-09 | 汉王科技股份有限公司 | 手写签名识别的方法、装置及手写签名开机系统 |
US9159321B2 (en) * | 2012-02-27 | 2015-10-13 | Hong Kong Baptist University | Lip-password based speaker verification system |
-
2020
- 2020-01-19 CN CN202010058314.2A patent/CN111291636A/zh active Pending
- 2020-04-29 WO PCT/CN2020/087663 patent/WO2021142973A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281831A (zh) * | 2013-07-02 | 2015-01-14 | 阿里巴巴集团控股有限公司 | 一种笔迹验证的方法和装置 |
CN103593673A (zh) * | 2013-10-27 | 2014-02-19 | 沈阳建筑大学 | 一种基于动态阈值的在线手写签名认证方法 |
CN104820924A (zh) * | 2015-05-13 | 2015-08-05 | 重庆邮电大学 | 一种基于笔迹鉴定的网上安全支付系统 |
DE102017110048A1 (de) * | 2017-05-10 | 2018-11-15 | Matthias Olschowy | Verfahren zur handschriftlichen elektronischen Signatur |
Also Published As
Publication number | Publication date |
---|---|
WO2021142973A1 (zh) | 2021-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019184217A1 (zh) | 热点事件分类方法、装置及存储介质 | |
US10846474B2 (en) | Methods, devices and systems for data augmentation to improve fraud detection | |
CN111291636A (zh) | 电子签章有效识别方法、装置、系统及存储介质 | |
CN108805583B (zh) | 基于地址映射的电商欺诈检测方法、装置、设备及介质 | |
TW202119288A (zh) | 圖像分類模型訓練方法、影像處理方法、資料分類模型訓練方法、資料處理方法、電腦設備、儲存媒介 | |
CN106951832A (zh) | 一种基于手写字符识别的验证方法及装置 | |
CN103473492A (zh) | 权限识别方法和用户终端 | |
CN107644106B (zh) | 自动挖掘业务中间人的方法、终端设备及存储介质 | |
CN111488732B (zh) | 一种变形关键词检测方法、系统及相关设备 | |
WO2022087847A1 (zh) | 手写文本识别方法、装置和系统,手写文本搜索方法和系统,以及计算机可读存储介质 | |
CN110070045A (zh) | 一种营业执照的文本识别方法、系统及相关组件 | |
CN113486664A (zh) | 文本数据可视化分析方法、装置、设备及存储介质 | |
CN112580108A (zh) | 签名和印章完整性验证方法及计算机设备 | |
CN113094478A (zh) | 表情回复方法、装置、设备及存储介质 | |
CN110414622B (zh) | 基于半监督学习的分类器训练方法及装置 | |
CN113887202A (zh) | 文本纠错方法、装置、计算机设备及存储介质 | |
CN112579781A (zh) | 文本归类方法、装置、电子设备及介质 | |
CN107665442A (zh) | 获取目标用户的方法及装置 | |
WO2022242032A1 (zh) | 数据分类方法及装置、电子设备、存储介质和计算机程序产品 | |
CN116245630A (zh) | 一种反欺诈检测方法、装置、电子设备及介质 | |
CN112395450B (zh) | 图片文字检测方法、装置、计算机设备及存储介质 | |
CN111309850B (zh) | 一种数据特征提取方法、装置、终端设备及介质 | |
CN114359918A (zh) | 提货单信息提取方法、装置及计算机设备 | |
CN112733645A (zh) | 手写签名校验方法、装置、计算机设备及存储介质 | |
CN112381458A (zh) | 项目评审方法、项目评审装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |