CN116824597A - 动态图像分割及并行学习手写身份证数字及身份识别方法 - Google Patents
动态图像分割及并行学习手写身份证数字及身份识别方法 Download PDFInfo
- Publication number
- CN116824597A CN116824597A CN202310801232.6A CN202310801232A CN116824597A CN 116824597 A CN116824597 A CN 116824597A CN 202310801232 A CN202310801232 A CN 202310801232A CN 116824597 A CN116824597 A CN 116824597A
- Authority
- CN
- China
- Prior art keywords
- digital
- segmentation
- image segmentation
- code
- handwriting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000003709 image segmentation Methods 0.000 title claims abstract description 41
- 238000013135 deep learning Methods 0.000 claims abstract description 27
- 230000011218 segmentation Effects 0.000 claims description 22
- 238000010586 diagram Methods 0.000 claims description 14
- 238000013527 convolutional neural network Methods 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000013461 design Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000012795 verification Methods 0.000 abstract 2
- 239000010410 layer Substances 0.000 description 26
- 230000006870 function Effects 0.000 description 10
- 230000004913 activation Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
Abstract
基于动态图像分割及深度学习的手写身份证数字识别方法,首先提出一种动态的图像分割方法,对于手写身份证人们习惯在地址码、生日码、顺序码、效验码之间存在更大的数字间隔,因此在第一次图像分割时,采用一种较大间距进行图像分割,区别出地址码、生日码、顺序码以及效验码。然后第二次图像分割时采用小间距区分出单个数字。此外本次申请在深度学习识别手写身份证数字时,基于上述地址码、生日码、顺序码、校验码被区分开,对各区域最大可能存在的数字以及其中关联进行加权判定,并且各区域模型采用并行运算,区域本身采用顺序模型运算,进而整体提升手写身份证数字识别速度与准确性。
Description
技术领域
本发明涉及图像分割领域及数字识别领域,,具体为基于动态图像分割及深度学习的手写身份证数字识别方法。
背景技术
近些年来,随着线下登记和填写表格申请的需求增加,手写身份证号码成为常见情景。然而,传统的图像分割方法只能单独对每个数字进行分割和识别,容易受到个人书写风格的主观因素影响,并未充分利用身份证上的书写风格和逻辑关系。因此,迫切需要一种新的识别方法,以提高手写身份证号码的识别速度和准确性,并充分发掘手写身份证号码中存在的特点和潜力。
发明内容
为了解决以上问题,本发明提出了基于动态图像分割及深度学习的手写身份证数字识别方法,,能够较快并且高精度的实现手写身份证号码的识别。
为实现上述目的,本发明采取的技术方案是:
基于动态图像分割及深度学习的手写身份证数字识别方法,包括如下步骤,其特征在于:
1)图像前置处理;
在进行图像分割前,对输入的图片资源进行前置处理,包括统一大小、灰度化、二值化、确定位置边界以及提取轮廓;
2)基于手写身份证风格图像初次分割;
首先对手写身份证号码风格的图像按照初次分割公式进行分割,其中初次分割的依据为分析水平投影图其间最大的三个间距;
3)图像小间距二次分割;
对初次分割完毕的图像进行单个数字划分,其分割依照S集合排除最大三个间距外的各间隔值所处位置即可。
4)分区域多模型加权数字识别;
对每个区域单独建立卷积神经网络模型进行加权数字识别,并充分利用各区域本身信息以及前后文联系来提升运行速度与准确性;
5)区域加权识别;
针对区域码本身所拥有的特性进行特定加权识别,其中对高概率以及低概率数字按照阈值调整公式进行分类阈值调整;
6)前后加权识别;
各区域自身存在前后文逻辑关系,因此根据置信度调整公式进行模型分类置信度调节,进行数字识别;
7)算法层级设计;
此次对一般卷积分类神经网络最后一层SoftMax分类层,进行重新设计,设计内容为加一层置信度调整网络结果在SoftMax网络层后,并延伸一层S5步骤中的阈值设定层,其中后续置信度调整层以及阈值设定层不参与权重更新和反向迭代;
8)模型运行结构设定;
设计并采用并行网络结构与顺序网络结构共存的方式运行,统筹兼顾识别速度与准确性。
作为本发明进一步改进,所述步骤2)中初次分割公式表示为:
首先提出基于手写身份证风格进行图像分割,其中初次分割公式如下所示:
y1=max(S) (1)
y2=max(S\{y1}) (2)
y3=max(S\{y1,y2}) (3)
S={x1,x2,x3,…,x17} (4)
其中,S为利用水平投影并进行分析水平投影图,18位身份证号码间的17割间隔大小的集合x1,x2,…,x17,y1,y2,y3则表示S集合中前三个最大值,即身份证号码中最大的三个间隔;
初次分割便采用上述y1,y2,y3所在位置,将18位身份证号码划分出地址码、生日码、顺序码和校验码。
作为本发明进一步改进,所述步骤5)中阈值调整公式表示为:
针对这些区域码所拥有的特性进行阈值调整:
θ1=α*P,0<α<1 (5)
θ2=β*P,1<β (6)
其中,θ1与θ2分别为高概率数字的分类阈值与低概率数字分类阈值,P为原设定阈值,α为高概率数字的分类阈值调定参数,β则为低概率数字的分类阈值调定参数。
作为本发明进一步改进,所述步骤6)中置信度调整公式表示为:
利用前后文逻辑关系,调整模型分类置信度,进行数字识别。
其中调整模型分类置信度公式如下:
其中,K为可能出现手写数字的最终输出置信度,k为可能出现的手写数字算法模型置信度,M为较低可能出现手写数字的最终输出置信度,m为较低可能出现的手写数字算法模型置信度,t为前文值确定后,较低可能或者不可能出现的手写数字的数量。通过该方法可以达到利用前后文关系对高概率的数字进行加权识别。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本申请提供的一种的基于动态图像分割及深度学习的手写身份证数字识别方法采用卷积神经网络进行数字识别,能够快速且精确的识别出手写身份证号码;
本申请提供的一种的基于动态图像分割及深度学习的手写身份证数字识别方法,采用基于手写身份证风格的图像初次分割划分多区域,并进行按区域加权数字识别,提高了识别的准确性与速度。
本申请提供的一种的基于动态图像分割及深度学习的手写身份证数字识别方法充分利用身份证号码中存在的上下文信息进行数字识别,大大提高识别的准确性。
本申请提供的一种的基于动态图像分割及深度学习的手写身份证数字识别方法采用多模型并行运行,单模型顺序运行结构,能在提升速度与保证准确性之间达到较好的平衡。
附图说明
图1根据本申请实施例提供的基于动态图像分割及深度学习的手写身份证数字识别方法流程图;
图2根据本申请实施例提供的基于动态图像分割及深度学习的手写身份证数字识别方法一般卷积网络结构示意图。
图3根据本申请实施例提供的基于动态图像分割及深度学习的手写身份证数字识别方法卷积网络层级示意图。
图4根据本申请实施例提供的基于动态图像分割及深度学习的手写身份证数字识别方法各激活函数示意图。
图5根据本申请实施例提供的基于动态图像分割及深度学习的手写身份证数字识别方法身份证号码区域分割以及特定标识数字示意图;
图6根据本申请实施例提供的基于动态图像分割及深度学习的手写身份证数字识别方法算法层级示意图;
图7根据本申请实施例提供的基于动态图像分割及深度学习的手写身份证数字识别方法模型运行结构示意图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
如图1所示为本申请提供的基于动态图像分割及深度学习的手写身份证数字识别方法流程图。
步骤S1:图像前置处理。
在进行图像分割前,需要对输入的图片资源进行前置处理。首先将图像统一大小,并进行灰度化以及二值化操作。此外本次申请中利用Canny边缘检测来确定数字的位置和边界,并利用OpenCV进行轮廓提取,为了确保数字的轮廓被保留,根据数字的形状和尺寸特征,对提取的轮廓进行过滤和筛选。
步骤S2:基于手写身份证风格图像初次分割。
本次申请首先提出基于手写身份证风格进行图像分割,其中初次分割公式如下所示:
y1=max(S) (1)
y2=max(S\{y1}) (2)
y3=max(S\{y1,y2}) (3)
S={x1,x2,x3,…,x17} (4)
其中,S为利用水平投影并进行分析水平投影图,18位身份证号码间的17割间隔大小的集合(x1,x2,…,x17),y1,y2,y3则表示S集合中前三个最大值,即身份证号码中最大的三个间隔。
初次分割便采用上述y1,y2,y3所在位置,将18位身份证号码划分出地址码、生日码、顺序码、校验码。
步骤S3:图像小间距二次分割。
在步骤S2中依照S集合中前三个最大值进行初次分割,在本步骤S3中则需要对每个区域进行单个数字划分,便于后续进行图像识别,其中图像分割依据依照S集合各间隔值所处位置即可。
步骤S4:分区域多模型加权数字识别。
如图2所示为本申请提供的基于动态图像分割及深度学习的手写身份证数字识别方法一般卷积网络结构示意图。
如图3所示为本申请提供的基于动态图像分割及深度学习的手写身份证数字识别方法卷积网络层级示意图。
在步骤S2以及步骤S3中完成了图像的初次分割以及二次分割。但各个区域本身以及各个区域前后文都存在着内在逻辑关系以及可以利用的信息,因此在本次申请中,将对每个区域单独建立卷积神经网络模型进行加权数字识别,以提高模型的运行速度与准确性。
其中卷积神经网络(Convolutional Neural Networks,简称CNN)是一种具有局部连接、权值共享等特点的深层前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一,擅长处理图像特别是图像识别等相关机器学习问题,比如图像分类、目标检测、图像分割等各种视觉任务中都有显著的提升效果,是目前应用最广泛的模型之一。并且卷积神经网络具有表征学习(representation learning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariant classification),可以进行监督学习和非监督学习,其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化(grid-like topology)特征,例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程(feature engineering)要求,并被大量应用于计算机视觉领域。
卷积神经网络的基本结构大致包括:卷积层、激活函数、池化层、全连接层、输出层等。
卷积层(Convolutional layer),这一层就是卷积神经网络最重要的一个层次,也是“卷积神经网络”的名字来源。卷积神经网路中每层卷积层由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法优化得到的。
步骤S5:区域加权识别。
如图4所示为本申请提供的基于动态图像分割及深度学习的手写身份证数字识别方法各激活函数示意图。
首先,针对区域本身所存在的特性需要设定特定的加权卷积算法模型。例如在地址码450481中,其中45是省级行政区域地址,04,81则分别代表地级行政区域与县级行政区域在目前行政区域地址码中,有些数字出现的概率是远远高于其他数字的。此外亦如生日码19780423中,前四个代表年份,后四位分别代表月份与日期,1978中第一位只可能出现1和2,第二位只可能出现9和0,第三位中2和3出现在手写身份证号码中的可能性较低,0423中第一位只可能有0和1,第三位只可能存在0,1,2以及3。因此可以针对这些区域码所拥有的特性进行阈值调整:
θ1=α*P,0<α<1 (5)
θ2=β*P,1<β (6)
其中,θ1与θ2分别为高概率数字的分类阈值与低概率数字分类阈值,P为原设定阈值,α为高概率数字的分类阈值调定参数,β则为低概率数字的分类阈值调定参数。
通过该公式,我们可以做到针对各区域自身所具备的一些特性进行数字加权识别,让高概率的数字能够更容易的通过算法识别模型被输出,低概率或者不可能出现的数字难以输出。
步骤S6:前后加权识别。
如图5所示为本申请提供的基于动态图像分割及深度学习的手写身份证数字识别方法流程图。
在此次手写身份证识别算法模型中,除了区域本身存在一些特性,我们通过算法模型利用来提升识别准确性。上下文信息也被利用来提升模型识别性能。例如在省级行政地址码当中,当第一个开头为6时,第二位数字为1,2,3,4,5的概率远高于其余手写数字。在生日码当中,当第一位数字为1的时候,第二位仅可能为9。因此我们可以利用这种前后文逻辑关系,调整模型分类置信度,进行数字识别。
本次申请在中间隐藏层主要用的是Relu函数(即线性整流层(Rectified LinearUnits layer,简称ReLU layer)),Relu函数是一个线性函数,它对负数取0,正数则为y=x(即输入等于输出),即f(x)=max(0,x),它的特点是收敛快,求梯度简单,但较脆弱。
由于经过Relu函数激活后的数据0值一下都变成0,而这部分数据难免有一些我们需要的数据被强制取消,所以为了尽可能的降低损失,我们就在激活层的前面,卷积层的后面加上一个偏置向量,对数据进行一次简单的线性加法,使得数据的值产生一个横向的偏移,避免被激活函数过滤掉更多的信息。
此外对于最终SoftMax分类后的结果本次申请采用一种新的激活函数进行调整。
其中调整模型分类置信度公式如下:
其中,K为可能出现手写数字的最终输出置信度,k为可能出现的手写数字算法模型置信度,M为较低可能出现手写数字的最终输出置信度,m为较低可能出现的手写数字算法模型置信度,t为前文值确定后,较低可能或者不可能出现的手写数字的数量。通过该方法可以达到利用前后文关系对高概率的数字进行加权识别。
步骤S7:算法层级设计。
如图6所示为本申请提供的基于动态图像分割及深度学习的手写身份证数字识别方法算法层级示意图。
在步骤S5中,对区域码所拥有的特性进行特定加权识别以及,而在步骤S6中对上下文信息联系进行了利用并对最终置信度进行了调整。这两种方式在许多区域可以共同赋能并进行加持运行,例如在生日码中1978,在步骤S5中对第二位数字进行了阈值调整,在步骤S6中则对第二位进行了则对置信度调整,因此可以在算法模型中同时应用上述方法。具体可以表现为,在最后一层SoftMax分类层后,再加一层置信度调整网络结果,并延伸一层S5步骤中的阈值设定层。其中后续置信度调整层以及阈值设定层不参与权重更新,反向迭代等。
步骤S8:模型运行结构设定。
如图7所示为本申请提供的基于动态图像分割及深度学习的手写身份证数字识别方法模型运行结构示意图。
在本次申请中,对各区域进行了划分,因此本次可将整个模型运行结构先划分为四个区域,这四个区域并行运行,互不干扰,待所有区域结果识别完毕,便可一起组合直接输出。此外本次申请在步骤S6中利用区域内部前后文信息,进行加权模式识别,因此存在一种串联关系在模型内部,故对于各区域模型本身,此次运行结构采用顺序进行,从左往右依次进行手写数字识别。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或者等同变化,仍属于本发明所要求保护的范围。
Claims (4)
1.基于动态图像分割及深度学习的手写身份证数字识别方法,包括如下步骤,其特征在于:
1)图像前置处理;
在进行图像分割前,对输入的图片资源进行前置处理,包括统一大小、灰度化、二值化、确定位置边界以及提取轮廓;
2)基于手写身份证风格图像初次分割;
首先对手写身份证号码风格的图像按照初次分割公式进行分割,其中初次分割的依据为分析水平投影图其间最大的三个间距;
3)图像小间距二次分割;
对初次分割完毕的图像进行单个数字划分,其分割依照S集合排除最大三个间距外的各间隔值所处位置即可。
4)分区域多模型加权数字识别;
对每个区域单独建立卷积神经网络模型进行加权数字识别,并充分利用各区域本身信息以及前后文联系来提升运行速度与准确性;
5)区域加权识别;
针对区域码本身所拥有的特性进行特定加权识别,其中对高概率以及低概率数字按照阈值调整公式进行分类阈值调整;
6)前后加权识别;
各区域自身存在前后文逻辑关系,因此根据置信度调整公式进行模型分类置信度调节,进行数字识别;
7)算法层级设计;
此次对一般卷积分类神经网络最后一层SoftMax分类层,进行重新设计,设计内容为加一层置信度调整网络结果在SoftMax网络层后,并延伸一层S5步骤中的阈值设定层,其中后续置信度调整层以及阈值设定层不参与权重更新和反向迭代;
8)模型运行结构设定;
设计并采用并行网络结构与顺序网络结构共存的方式运行,统筹兼顾识别速度与准确性。
2.根据权利要求1所述的基于动态图像分割及深度学习的手写身份证数字识别方法,其特征在于:
所述步骤2)中初次分割公式表示为:
首先提出基于手写身份证风格进行图像分割,其中初次分割公式如下所示:
y1=max(S) (1)
y2=max(S\{y1}) (2)
y3=max(S\{y1,y2}) (3)
S={x1,x2,x3,…,x17} (4)
其中,S为利用水平投影并进行分析水平投影图,18位身份证号码间的17割间隔大小的集合x1,x2,…,x17,y1,y2,y3则表示S集合中前三个最大值,即身份证号码中最大的三个间隔;
初次分割便采用上述y1,y2,y3所在位置,将18位身份证号码划分出地址码、生日码、顺序码和校验码。
3.根据权利要求1所述的基于动态图像分割及深度学习的手写身份证数字识别方法,其特征在于:
所述步骤5)中阈值调整公式表示为:
针对这些区域码所拥有的特性进行阈值调整:
θ1=α*P,0<α<1 (5)
θ2=β*P,1<β (6)
其中,θ1与θ2分别为高概率数字的分类阈值与低概率数字分类阈值,P为原设定阈值,α为高概率数字的分类阈值调定参数,β则为低概率数字的分类阈值调定参数。
4.根据权利要求1所述的基于动态图像分割及深度学习的手写身份证数字识别方法,其特征在于:
所述步骤6)中置信度调整公式表示为:
利用前后文逻辑关系,调整模型分类置信度,进行数字识别。
其中调整模型分类置信度公式如下:
其中,K为可能出现手写数字的最终输出置信度,k为可能出现的手写数字算法模型置信度,M为较低可能出现手写数字的最终输出置信度,m为较低可能出现的手写数字算法模型置信度,t为前文值确定后,较低可能或者不可能出现的手写数字的数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310801232.6A CN116824597B (zh) | 2023-07-03 | 2023-07-03 | 动态图像分割及并行学习手写身份证数字及身份识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310801232.6A CN116824597B (zh) | 2023-07-03 | 2023-07-03 | 动态图像分割及并行学习手写身份证数字及身份识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116824597A true CN116824597A (zh) | 2023-09-29 |
CN116824597B CN116824597B (zh) | 2024-05-24 |
Family
ID=88115265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310801232.6A Active CN116824597B (zh) | 2023-07-03 | 2023-07-03 | 动态图像分割及并行学习手写身份证数字及身份识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116824597B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104504385A (zh) * | 2014-12-10 | 2015-04-08 | 上海大学 | 手写粘连数字串的识别方法 |
CN107704859A (zh) * | 2017-11-01 | 2018-02-16 | 哈尔滨工业大学深圳研究生院 | 一种基于深度学习训练框架的文字识别方法 |
CN109033954A (zh) * | 2018-06-15 | 2018-12-18 | 西安科技大学 | 一种基于机器视觉的空中手写识别系统及方法 |
CN109727363A (zh) * | 2018-11-16 | 2019-05-07 | 恒银金融科技股份有限公司 | 一种在票据中识别大写金额的方法 |
CN110084327A (zh) * | 2019-04-30 | 2019-08-02 | 福州大学 | 基于视角自适应深度网络的票据手写数字识别方法及系统 |
CN110414592A (zh) * | 2019-07-24 | 2019-11-05 | 西安工业大学 | 一种基于多任务学习的数字验证码识别方法 |
CN110516592A (zh) * | 2019-08-26 | 2019-11-29 | 广东世纪晟科技有限公司 | 一种基于手写数字字符的识别方法 |
CN111539330A (zh) * | 2020-04-17 | 2020-08-14 | 西安英诺视通信息技术有限公司 | 一种基于双svm多分类器的变电站数显仪表识别方法 |
CN113435441A (zh) * | 2021-07-22 | 2021-09-24 | 广州华腾教育科技股份有限公司 | 基于Bi-LSTM机制的四则运算算式图像智能批改方法 |
CN113609984A (zh) * | 2021-08-05 | 2021-11-05 | 国网山东省电力公司德州市陵城区供电公司 | 一种指针式仪表读数识别方法、装置及电子设备 |
CN113723413A (zh) * | 2021-08-01 | 2021-11-30 | 北京工业大学 | 一种基于贪吃蛇的手写中文文本切分方法 |
CN114048735A (zh) * | 2021-10-19 | 2022-02-15 | 南京信息职业技术学院 | 一种针对手写连写字符串的识别方法及装置 |
CN114898151A (zh) * | 2022-05-13 | 2022-08-12 | 重庆理工大学 | 一种基于深度学习与支持向量机融合的图像分类方法 |
CN114973228A (zh) * | 2022-05-31 | 2022-08-30 | 上海交通大学 | 基于轮廓特征增强的金属零件表面文本识别方法及系统 |
CN115797952A (zh) * | 2023-02-09 | 2023-03-14 | 山东山大鸥玛软件股份有限公司 | 基于深度学习的手写英文行识别方法及系统 |
CN116110058A (zh) * | 2023-03-16 | 2023-05-12 | 许倩倩 | 一种基于手写数字识别的虚拟人交互方法及系统 |
-
2023
- 2023-07-03 CN CN202310801232.6A patent/CN116824597B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104504385A (zh) * | 2014-12-10 | 2015-04-08 | 上海大学 | 手写粘连数字串的识别方法 |
CN107704859A (zh) * | 2017-11-01 | 2018-02-16 | 哈尔滨工业大学深圳研究生院 | 一种基于深度学习训练框架的文字识别方法 |
CN109033954A (zh) * | 2018-06-15 | 2018-12-18 | 西安科技大学 | 一种基于机器视觉的空中手写识别系统及方法 |
CN109727363A (zh) * | 2018-11-16 | 2019-05-07 | 恒银金融科技股份有限公司 | 一种在票据中识别大写金额的方法 |
CN110084327A (zh) * | 2019-04-30 | 2019-08-02 | 福州大学 | 基于视角自适应深度网络的票据手写数字识别方法及系统 |
CN110414592A (zh) * | 2019-07-24 | 2019-11-05 | 西安工业大学 | 一种基于多任务学习的数字验证码识别方法 |
CN110516592A (zh) * | 2019-08-26 | 2019-11-29 | 广东世纪晟科技有限公司 | 一种基于手写数字字符的识别方法 |
CN111539330A (zh) * | 2020-04-17 | 2020-08-14 | 西安英诺视通信息技术有限公司 | 一种基于双svm多分类器的变电站数显仪表识别方法 |
CN113435441A (zh) * | 2021-07-22 | 2021-09-24 | 广州华腾教育科技股份有限公司 | 基于Bi-LSTM机制的四则运算算式图像智能批改方法 |
CN113723413A (zh) * | 2021-08-01 | 2021-11-30 | 北京工业大学 | 一种基于贪吃蛇的手写中文文本切分方法 |
CN113609984A (zh) * | 2021-08-05 | 2021-11-05 | 国网山东省电力公司德州市陵城区供电公司 | 一种指针式仪表读数识别方法、装置及电子设备 |
CN114048735A (zh) * | 2021-10-19 | 2022-02-15 | 南京信息职业技术学院 | 一种针对手写连写字符串的识别方法及装置 |
CN114898151A (zh) * | 2022-05-13 | 2022-08-12 | 重庆理工大学 | 一种基于深度学习与支持向量机融合的图像分类方法 |
CN114973228A (zh) * | 2022-05-31 | 2022-08-30 | 上海交通大学 | 基于轮廓特征增强的金属零件表面文本识别方法及系统 |
CN115797952A (zh) * | 2023-02-09 | 2023-03-14 | 山东山大鸥玛软件股份有限公司 | 基于深度学习的手写英文行识别方法及系统 |
CN116110058A (zh) * | 2023-03-16 | 2023-05-12 | 许倩倩 | 一种基于手写数字识别的虚拟人交互方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116824597B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109255344B (zh) | 一种基于机器视觉的数显式仪表定位与读数识别方法 | |
WO2019232853A1 (zh) | 中文模型训练、中文图像识别方法、装置、设备及介质 | |
CN108710866B (zh) | 汉字模型训练方法、汉字识别方法、装置、设备及介质 | |
CN111753828B (zh) | 一种基于深度卷积神经网络的自然场景水平文字检测方法 | |
CN113408605B (zh) | 基于小样本学习的高光谱图像半监督分类方法 | |
CN110321967B (zh) | 基于卷积神经网络的图像分类改进方法 | |
Zhang | A survey of unsupervised domain adaptation for visual recognition | |
CN107609549A (zh) | 一种自然场景下证件图像的文本检测方法 | |
CN107967456A (zh) | 一种基于人脸关键点的多神经网络级联识别人脸方法 | |
CN107516316B (zh) | 一种在fcn中引入聚焦机制对静态人体图像进行分割的方法 | |
CN111652317B (zh) | 基于贝叶斯深度学习的超参数图像分割方法 | |
CN109033978B (zh) | 一种基于纠错策略的cnn-svm混合模型手势识别方法 | |
CN111191583A (zh) | 基于卷积神经网络的空间目标识别系统及方法 | |
US9224207B2 (en) | Segmentation co-clustering | |
CN111401145B (zh) | 一种基于深度学习与ds证据理论的可见光虹膜识别方法 | |
Björklund et al. | Automatic license plate recognition with convolutional neural networks trained on synthetic data | |
CN111652273B (zh) | 一种基于深度学习的rgb-d图像分类方法 | |
CN109472209A (zh) | 一种图像识别方法、装置和存储介质 | |
CN107392105B (zh) | 一种基于反向协同显著区域特征的表情识别方法 | |
CN113221956B (zh) | 基于改进的多尺度深度模型的目标识别方法及装置 | |
CN110008899B (zh) | 一种可见光遥感图像候选目标提取与分类方法 | |
CN114387592B (zh) | 一种复杂背景下字符定位和识别方法 | |
CN111339932B (zh) | 一种掌纹图像预处理方法和系统 | |
CN111340032A (zh) | 一种基于金融领域应用场景的字符识别方法 | |
CN110188864B (zh) | 基于分布表示和分布度量的小样本学习方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |