CN114373178A - 一种图片文字检测与识别方法及系统 - Google Patents
一种图片文字检测与识别方法及系统 Download PDFInfo
- Publication number
- CN114373178A CN114373178A CN202111607416.6A CN202111607416A CN114373178A CN 114373178 A CN114373178 A CN 114373178A CN 202111607416 A CN202111607416 A CN 202111607416A CN 114373178 A CN114373178 A CN 114373178A
- Authority
- CN
- China
- Prior art keywords
- picture
- text
- transformation
- identified
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 19
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims abstract description 6
- 230000004927 fusion Effects 0.000 claims abstract description 4
- 230000009466 transformation Effects 0.000 claims description 48
- 238000001914 filtration Methods 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 10
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 5
- 238000013527 convolutional neural network Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 8
- 238000000605 extraction Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种图片文字检测与识别方法及系统,该方法包括:采集图片训练模型的数据集;将待识别图片进行预处理去除噪声,输入至第一CNN模型提取图片特征;使用RPN网络处理第一CNN模型提取的最后一层特征图,生成K个文本框;将K个文本框输入到第一双向LSTM网络,同时将第一双向LSTM网络的输出与全连接层连接进行特征融合,预测每个文本预测框的分类和位置回归,得到文本区域;将文本区域输入至第二CNN模型提取图片特征,输出特征中间向量,之后连接到第二双向LSTM网络生成的中间状态,再输入到注意力模型,最后通过一层LSTM解码器网络得到最终输出文字。本发明能够提升了对图片文字的检测效果,同时能够识别背景复杂的图片文字。
Description
技术领域
本发明涉及图像文本检测识别技术领域,尤其涉及一种图片文字检测与识别方法及系统。
背景技术
传统的文本检测方法主要通过纹理、基于区域等提取特征的方法从图片中分离文本数据,这种传统的方法需要大量的文本检测和识别区域,并只适用于文本排列规则,背景单调等较为简单的图像文件。
随看深度学习的快速发展,深度学习被广泛应用在文本检测领域。将卷积神经网络(Convolutional Neural Network,CNN)作为检测器进行文本区域预测,比传统方法的检测精确度有所提升,但是由于特征提取采用的是传统图像处理方法使得图像特征提取能力较弱,文本检测效果较差。
传统的文字识别方法往往通过图片预处理去除图片干扰并对文字进行字符分割,采用主成分分析算法提取文字特征,再利用常见的支持向量机、隐马尔科夫模型、K近邻等分类器进行文字分类。然而,该方法采用手动提取特征的方式难以获取丰富的图片特征,使得无法应对字体变化多样、背景复杂多变等场景的文字识别。而使用DCNN实现对单个字符的检测与识别,需要裁剪图像中的每个字符,这样会使得裁剪积累误差引起较大的识别误差。如果将RNN应用到手写文字识别中,然而仅支持背景简单的图片。
发明内容
鉴于背景技术中存在的问题,本发明的目的在于提供一种图片文字检测与识别方法及系统,能够很好的提升图片文本的检测效果,同时能够识别背景复杂的图片文字。
为了实现上述目的,本发明采用以下技术方案:
第一方面,本发明公开了一种图片文字检测与识别方法,包括:
步骤1、采集图片训练模型的数据集;
步骤2、将待识别图片进行预处理去除噪声;
步骤3、将经过预处理的所述识别图片输入至第一CNN模型提取图片特征;
步骤4、使用RPN网络处理所述第一CNN模型提取的最后一层特征图,在所述最后一层特征图生成中心点大小不等的K个文本框;
步骤5、将K个所述文本框输入到第一双向LSTM网络,同时将所述第一双向LSTM网络的输出与全连接层连接进行特征融合,预测每个所述文本预测框的分类和位置回归,得到文本区域;
步骤6、将所述文本区域输入至第二CNN模型提取图片特征,输出特征中间向量,之后连接到第二双向LSTM网络生成的中间状态,再输入到注意力模型,最后通过一层LSTM解码器网络得到最终输出文字。
本发明的有益效果如下:首先,本发明通过将待识别图片进行预处理,去除待识别图片的噪声,进而减少了噪声对后续图片文本的检测与识别的影响;其次,通过RPN网络对第一CNN模型的最后一层特征图的处理,在最后一层特征图生成中心点大小不等的K个文本框,一次性回归整个文本所在位置,能够避免检测一些类似文字的噪声;再次,通过加入第一双向LSTM网络将K个文本框按序列连接构成一个完整的文本区域,从而能够提高后续图片识别的识别率;最后,将文本区域的图片传输至第二CNN模型提取图片特征,输出特征中间向量,之后连接到第二双向LSTM网络生成的中间状态,再输入到注意力模型,通过加入注意力机制有效解决固定长度向量限制问题,提升图片文本识别准确率,最后通过一层LSTM解码器网络得到最终输出文字,不需要对一行文本拆分成单字,而是直接识别整个文本区域。
具体的,在所述步骤1中包括:
步骤1-1、在互联网上获取包含文字的图片用作图片文本数据集;
步骤1-2、对部分所述图片的类别进行人工标注;
步骤1-3、所述图片文本数据集分为训练集和测试集,所述训练集与所述测试集用于训练与验证。
具体的,在所述步骤1-3中,所述训练集包括包含文字的所述图片与部分进行人工标注的所述图片,所述测试集包括剩余的进行人工标注的所述图片。
具体的,在所述步骤2中,将所述待识别图片进行预处理去除噪声包括:将所述待识别图片进行中值滤波。
具体的,在所述步骤2中,将所述待识别图片进行预处理去除噪声还包括:对所述待识别图片进行旋转变换、放大变换、缩小变换、倾斜变换、镜像变换、仿射变换、透视变换以及色彩变换。
具体的,在所述步骤5中,所述文本预测框的分类包括文本区域与非文本区域。
具体的,在所述步骤5中,使用分类损失函数来预测所述文本预测框是否为所述文本区域,计算公式如下:
L1(si,g(i))=-log(sig(i)+(1-si)(1-g(i)))
其中,L1(si,g(i))为所述分类损失函数,si为第i个所述文本预测框的概率,g(i)为第i个文本标注框,g(i)=1表示所述文本预测框为所述文本区域,g(i)=0表示该框为所述非文本区域。
具体的,在所述步骤5中,使用回归损失函数来预测所述文本预测框的位置,计算公式如下:
其中,L2(y,f(j))为回归损失函数,y为预测第j个所述文本预测框的真实值,f(j)表示第j个所述文本框的预测值。
第二方面,本发明公开了一种图片文字检测与识别系统,包括:
图片输入模块,被配置为在获取到待识别图片的情况下,将所述待识别图片输出至预处理模块;
所述预处理模块,被配置为将所述待识别图片进行去噪,并将去噪后的所述待识别图片输出至图片文字检测模块;
所述图片文字检测模块,被配置为对预处理后的所述待识别图片进行文本检测,检测所述待识别图片的文本区域,并将所述文本区域至输出图片文字识别模块;
所述图片文字识别模块,被配置为对所述文本区域进行文本识别,识别文字;
文字输出模块,被配置为将识别出的文字进行输出。
具体的,所述预处理模块包括:
滤波子模块,所述滤波子模块用于对所述待识别图片进行中值滤波;
图片矫正子模块,所述图片矫正子模块用于对所述待识别图片进行旋转变换、放大变换、缩小变换、倾斜变换、镜像变换、仿射变换、透视变换以及色彩变换。
本发明的有益效果如下:本发明的图片文字检测与识别系统通过先对待识别图片进行预处理,去除待识别图片的噪声,减少噪声对图片文字检测模块影响,进而使图片文字检测模块能够更加准确的检测出图片中的文字区域,进而将图片的文字区域传输给图片文字识别模块,减少图片文字识别模块对图片的非文字区域的识别,提高文字识别的效率与准度,同时通过图片文字识别模块将图片文字区域的文字进行识别,并将识别的文字排好顺序,由文字输出模块进行输出。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的图片文字检测与识别方法的流程框图。
图2为本发明实施例的图片文字检测与识别系统的结构框图。
具体实施方式
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
本发明实施例提供一种基于深度学习的证件图像文本识别方法及系统,用于解决如何提高图片文本的检测效果与识别背景复杂的图片的技术问题。
下面结合附图对本发明进一步说明。
如图1所示,本实施例提供了一种图片文字检测与识别方法,包括:
S1、采集图片训练模型的数据集;
S2、将待识别图片进行预处理去除噪声;
S3、将经过预处理的所述待识别图片输入至第一CNN模型提取图片特征;
S4、使用RPN网络处理第一CNN模型提取的最后一层特征图,在所述最后一层特征图生成中心点大小不等的K个文本框;
S5、将K个所述文本框输入到第一双向LSTM网络,同时将第一双向LSTM网络的输出与全连接层连接进行特征融合,预测每个文本预测框的分类和位置回归,得到文本区域;
S6、将文本区域输入至第二CNN模型提取图片特征,输出特征中间向量,之后连接到第二双向LSTM网络生成的中间状态,再输入到注意力模型,最后通过一层LSTM解码器网络得到最终输出文字。
首先,本发明通过将待识别图片进行预处理,去除待识别图片的噪声,进而减少了噪声对后续图片文本的检测与识别的影响;其次,通过RPN网络对第一CNN模型的最后一层特征图的处理,在最后一层特征图生成中心点大小不等的K个文本框,一次性回归整个文本所在位置,能够避免检测一些类似文字的噪声;再次,通过加入第一双向LSTM网络将K个文本框按序列连接构成一个完整的文本区域,从而能够提高后续图片识别的识别率;最后,将文本区域的图片传输至第二CNN模型提取图片特征,输出特征中间向量,之后连接到第二双向LSTM网络生成的中间状态,再输入到注意力模型,通过加入注意力机制有效解决固定长度向量限制问题,提升图片文本识别准确率,最后通过一层LSTM解码器网络得到最终输出文字,不需要对一行文本拆分成单字,而是直接识别整个文本区域。其中,在本实施例中,第一CNN模型与第二CNN模型采用VGG-16。
上述步骤S1的具体操作过程如下:
S1-1、在互联网上获取包含文字的图片用作图片文本数据集;
S1-2、对部分图片的类别进行人工标注;
S1-3、图片文本数据集分为训练集和测试集,训练集与测试集用于训练与验证。
其中,在本实施例中,人工标注的图片占图片文本数据集的40%,训练集与测试集的比例为8:2。
具体的,在S1-3中,训练集包括包含文字的所述图片与部分进行人工标注的图片,测试集包括剩余的进行人工标注的图片。
其中,上述训练集中的人工标注图片占总的人工标注图片的40%。
通过将训练集中加入部分人工标注的图片使CNN模型能够更好的进行学习,从而提升CNN模型对特征的提取,进而提升检测效果。
上述步骤S2的具体操作过程如下:
S2-1、将待识别图片进行中值滤波;
S2-2、对待识别图片进行旋转变换、放大变换、缩小变换、倾斜变换、镜像变换、仿射变换、透视变换以及色彩变换。
通过对待识别图片进行中值滤波去除待识别图片的噪声,减少噪声对图片文字检测的影响,减少图片检测的误差。同时,由于图片的在采集时可能出现扭曲、失真、变形等不正常损耗,使得采集的图片与原有图片相差很大,因此进行上述操作能够对图片中的文字大小、文字方向、文字形状以及文字颜色的校正。
具体的,在S5中,文本预测框的分类包括文本区域与非文本区域。由于本实施例是将图片中的文字区域检测排列出来,因此只需要将文本预测框分类为文本区域与非文本区域。
具体的,在所述S5中,使用分类损失函数来预测所述文本预测框是否为所述文本区域,计算公式如下:
L1(si,g(i))=-log(sig(i)+(1-si)(1-g(i)))
其中,L1(si,g(i))为所述分类损失函数,si为第i个所述文本预测框的概率,g(i)为第i个文本标注框,g(i)=1表示所述文本预测框为所述文本区域,g(i)=0表示该框为所述非文本区域。
具体的,在所述S5中,使用回归损失函数来预测所述文本预测框的位置,计算公式如下:
其中,L2(y,f(j))为回归损失函数,y为预测第j个所述文本预测框的真实值,f(j)表示第j个所述文本框的预测值。
如图2所示,本实施例还提供了一种图片文字检测与识别系统,包括:图片输入模块、预处理模块、图片文字检测模块、图片文字识别模块、文字输出模块。
图片输入模块被配置为在获取到待识别图片的情况下,将待识别图片输出至预处理模块;
预处理模块被配置为将待识别图片进行去噪,并将去噪后的待识别图片输出至图片文字检测模块;
图片文字检测模块被配置为对预处理后的待识别图片进行文本检测,检测待识别图片的文本区域,并将文本区域至输出图片文字识别模块;
图片文字识别模块被配置为对文本区域进行文本识别,识别出文字;
文字输出模块被配置为将文字进行输出。
上述图片文字检测与识别系统通过先对待识别图片进行预处理,去除待识别图片的噪声,减少噪声对图片文字检测模块影响,进而使图片文字检测模块能够更加准确的检测出图片中的文字区域,进而将图片的文字区域传输给图片文字识别模块,减少图片文字识别模块对图片的非文字区域的识别,提高文字识别的效率与准度,同时通过图片文字识别模块将图片文字区域的文字进行识别,并将识别的文字排好顺序,由文字输出模块进行输出。
在本实施例中上述预处理模块包括:滤波子模块与图片矫正子模块。滤波子模块用于对所述待识别图片进行中值滤波;图片矫正子模块用于对所述待识别图片进行旋转变换、放大变换、缩小变换、倾斜变换、镜像变换、仿射变换、透视变换以及色彩变换。
通过对待识别图片进行中值滤波去除待识别图片的噪声,减少噪声对图片文字检测的影响,减少图片检测的误差。同时,由于图片的在采集时可能出现扭曲、失真、变形等不正常损耗,使得采集的图片与原有图片相差很大,因此进行上述操作能够对图片中的文字大小、文字方向、文字形状以及文字颜色的校正。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。
Claims (10)
1.一种图片文字检测与识别方法,其特征在于,包括:
步骤1、采集图片训练模型的数据集;
步骤2、将待识别图片进行预处理去除噪声;
步骤3、将经过预处理的所述待识别图片输入至第一CNN模型提取图片特征;
步骤4、使用RPN网络处理所述第一CNN模型提取的最后一层特征图,在所述最后一层特征图生成中心点大小不等的K个文本框;
步骤5、将K个所述文本框输入到第一双向LSTM网络,同时将所述第一双向LSTM网络的输出与全连接层连接进行特征融合,预测每个所述文本预测框的分类和位置回归,得到文本区域;
步骤6、将所述文本区域输入至第二CNN模型提取图片特征,输出特征中间向量,之后连接到第二双向LSTM网络生成的中间状态,再输入到注意力模型,最后通过一层LSTM解码器网络得到最终输出文字。
2.根据权利要求1所述的图片文字检测与识别方法,其特征在于,在所述步骤1中包括:
步骤1-1、在互联网上获取包含文字的图片用作图片文本数据集;
步骤1-2、对部分所述图片的类别进行人工标注;
步骤1-3、所述图片文本数据集分为训练集和测试集,所述训练集与所述测试集用于训练与验证。
3.根据权利要求2所述的图片文字检测与识别方法,其特征在于,在所述步骤1-3中,所述训练集包括包含文字的所述图片与部分进行人工标注的所述图片,所述测试集包括剩余的进行人工标注的所述图片。
4.根据权利要求1所述的图片文字检测与识别方法,其特征在于,在所述步骤2中,将所述待识别图片进行预处理去除噪声包括:将所述待识别图片进行中值滤波。
5.根据权利要求4所述的图片文字检测与识别方法,其特征在于,在所述步骤2中,将所述待识别图片进行预处理去除噪声还包括:对所述待识别图片进行旋转变换、放大变换、缩小变换、倾斜变换、镜像变换、仿射变换、透视变换以及色彩变换。
6.根据权利要求1所述的图片文字检测与识别方法,其特征在于,在所述步骤5中,所述文本预测框的分类包括文本区域与非文本区域。
7.根据权利要求6所述的图片文字检测与识别方法,其特征在于,在所述步骤5中,使用分类损失函数来预测所述文本预测框是否为所述文本区域,计算公式如下:
L1(si,g(i))=-log(sig(i)+(1-si)(1-g(i)))
其中,L1(si,g(i))为所述分类损失函数,si为第i个所述文本预测框的概率,g(i)为第i个文本标注框,g(i)=1表示所述文本预测框为所述文本区域,g(i)=0表示该框为所述非文本区域。
9.一种图片文字检测与识别系统,其特征在于,包括:
图片输入模块,被配置为在获取到待识别图片的情况下,将所述待识别图片输出至预处理模块;
所述预处理模块,被配置为将所述待识别图片进行去噪,并将去噪后的所述待识别图片输出至图片文字检测模块;
所述图片文字检测模块,被配置为对预处理后的所述待识别图片进行文本检测,检测所述待识别图片的文本区域,并将所述文本区域至输出图片文字识别模块;
所述图片文字识别模块,被配置为对所述文本区域进行文本识别,识别出文字;
文字输出模块,被配置为将识别的所述文字进行输出。
10.根据权利要求9所述的图片文字检测与识别系统,其特征在于,所述预处理模块包括:
滤波子模块,所述滤波子模块用于对所述待识别图片进行中值滤波;
图片矫正子模块,所述图片矫正子模块用于对所述待识别图片进行旋转变换、放大变换、缩小变换、倾斜变换、镜像变换、仿射变换、透视变换以及色彩变换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111607416.6A CN114373178A (zh) | 2021-12-27 | 2021-12-27 | 一种图片文字检测与识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111607416.6A CN114373178A (zh) | 2021-12-27 | 2021-12-27 | 一种图片文字检测与识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114373178A true CN114373178A (zh) | 2022-04-19 |
Family
ID=81141904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111607416.6A Pending CN114373178A (zh) | 2021-12-27 | 2021-12-27 | 一种图片文字检测与识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114373178A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724144A (zh) * | 2022-05-16 | 2022-07-08 | 北京百度网讯科技有限公司 | 文本识别方法、模型的训练方法、装置、设备及介质 |
-
2021
- 2021-12-27 CN CN202111607416.6A patent/CN114373178A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724144A (zh) * | 2022-05-16 | 2022-07-08 | 北京百度网讯科技有限公司 | 文本识别方法、模型的训练方法、装置、设备及介质 |
CN114724144B (zh) * | 2022-05-16 | 2024-02-09 | 北京百度网讯科技有限公司 | 文本识别方法、模型的训练方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020221298A1 (zh) | 文本检测模型训练方法、文本区域、内容确定方法和装置 | |
CN109299274B (zh) | 一种基于全卷积神经网络的自然场景文本检测方法 | |
CN109241894B (zh) | 一种基于表格定位和深度学习的票据内容识别系统和方法 | |
CN108898137B (zh) | 一种基于深度神经网络的自然图像字符识别方法及系统 | |
CN107133622B (zh) | 一种单词的分割方法和装置 | |
CN109919147A (zh) | 服装吊牌图像中文本识别的方法 | |
Rehman et al. | Performance analysis of character segmentation approach for cursive script recognition on benchmark database | |
CN112070649B (zh) | 一种去除特定字符串水印的方法及系统 | |
CN113537227B (zh) | 一种结构化文本识别方法及系统 | |
CN112818951A (zh) | 一种票证识别的方法 | |
CN111401099A (zh) | 文本识别方法、装置以及存储介质 | |
CN111008576A (zh) | 行人检测及其模型训练、更新方法、设备及可读存储介质 | |
CN111476232A (zh) | 一种洗水唛检测方法、设备和存储介质 | |
CN111027456A (zh) | 基于图像识别的机械水表读数识别方法 | |
CN113658206B (zh) | 一种植物叶片分割方法 | |
CN115171138A (zh) | 一种身份证图片文本检测方法、系统及设备 | |
CN114373178A (zh) | 一种图片文字检测与识别方法及系统 | |
CN116704526B (zh) | 工尺谱扫描机器人及其方法 | |
CN110674802A (zh) | 一种改进的平行四边形候选框的文本检测方法 | |
CN111767919B (zh) | 一种多层双向特征提取与融合的目标检测方法 | |
WO2024051427A1 (zh) | 硬币识别方法、系统及存储介质 | |
CN111444876A (zh) | 一种图文处理方法、系统以及计算机可读存储介质 | |
CN116645683A (zh) | 基于提示学习的签名笔迹鉴别方法、系统及存储介质 | |
CN114581911B (zh) | 一种钢卷标号识别方法及系统 | |
CN110674678A (zh) | 视频中敏感标志的识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |