CN115424280A - 基于改进Faster-RCNN的手写数字检测方法 - Google Patents

基于改进Faster-RCNN的手写数字检测方法 Download PDF

Info

Publication number
CN115424280A
CN115424280A CN202211082323.0A CN202211082323A CN115424280A CN 115424280 A CN115424280 A CN 115424280A CN 202211082323 A CN202211082323 A CN 202211082323A CN 115424280 A CN115424280 A CN 115424280A
Authority
CN
China
Prior art keywords
network
rcnn
handwritten
data set
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211082323.0A
Other languages
English (en)
Inventor
翁佳成
张新娜
项雄标
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Jiliang University
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN202211082323.0A priority Critical patent/CN115424280A/zh
Publication of CN115424280A publication Critical patent/CN115424280A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/766Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1918Fusion techniques, i.e. combining data from various sources, e.g. sensor fusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种基于改进Faster‑RCNN的手写数字检测方法,所述方法包括:S1,获取手写数字字符串图像数据集;S2,制作Faster‑RCNN模型的数据集,具体以PASCAL VOC2012的标准格式为模板;S3,搭建Faster‑RCNN网络模型,通过综合研判手写数字字符串特性,对网络模型进行优化处理;S4,将训练集和测试集的手写数字字符串数据加载到改进后的Faster‑RCNN网络进行训练,并保存训练好的网络;S5,输入测试图像,利用训练好的改进Faster‑RCNN模型进行手写数字识别检测。本发明引用Faster‑RCNN模型并对手写数字检测过程中的困难样本,采用多种方法进行改进,解决手写数字因手写数字字符串字体风格多变、字符粘连等问题导致识别准确率低与可靠性差的问题。

Description

基于改进Faster-RCNN的手写数字检测方法
技术领域
本发明涉及计算机视觉、模式识别与深度学习等领域,尤其涉及一种基于改进Faster-RCNN模型的手写数字检测方法。
背景技术
手写数字识别技术是机器视觉和模式识别研究的主要领域之一,在表单数据录入、大规模数据统计、邮件分拣、光学字符识别和银行支票处理等方面中起着重要的作用。传统纸质手写数据存储转化为电子表格时,大多采用人工录入,存在工作量大、工序繁琐和人工识别准确率低等问题。伴随着人工智能和大数据的快速发展,需要加快手写数字识别技术的发展,以实现信息的数字化管理。
手写数字图像在图像处理技术和深度学习网络实现数字化的过程中,面对手写数字检测研究至少存在以下问题:1、因不同人书写数字方式的差异性,存在字体风格多变问题;2、面对书写数字字符串,存在数字字符串粘连问题。
发明内容
本发明提出一种手写数字检测方法,引用Faster-RCNN模型并对手写数字检测过程中的困难样本,采用多种方法进行改进,解决手写数字因手写数字字符串字体风格多变、字符粘连等问题导致识别准确率低与可靠性差的问题。
为实现上述目的,本发明采用以下技术方案来实现,具体包括以下步骤:
步骤S1:获取手写数字字符串图像数据集;
步骤S2:制作Faster-RCNN模型的数据集,具体以PASCAL VOC2012的标准格式为模板;
步骤S3:搭建Faster-RCNN网络模型,通过综合研判手写数字字符串特性,对网络模型进行优化处理;
步骤S4:将训练集和测试集的手写数字字符串数据加载到改进后的Faster-RCNN网络进行训练,并保存训练好的网络;
步骤S5:输入测试图像,利用训练好的改进Faster-RCNN模型进行手写数字识别检测。
进一步地,所述步骤S1具体包括:
步骤S11:通过制定15行12列的纸质表格,并将该表格随机分派至100人手中,每人要求填写1位数、2位数、3位数与4位数,每种类型的数字需要填写45个;
步骤S12:获取拍摄的纸质表格图像;
步骤S13:将包含手写数字的表格框从表格图像中裁剪出来并标号,并制作成数据集。
进一步地,所述步骤S2具体包括:
步骤S21:制作数据集样本,并按比例划分为训练数据集与测试数据集;
步骤S22:利用标注工具labelImg获取图像数据集样本的图片名称、数字类别、数字的左上角坐标、右下角坐标,并按照PASCAL VOC2012数据集Annotations文件中的xml格式制作成xml文件;
步骤S23:通过数据集样本,并按比例划分为训练数据集与测试数据集,并生成对应的训练集train.txt文件和测试集val.txt文件。
进一步地,所述步骤S3具体包括:
步骤S31:以pytorch为网络框架,对Faster-RCNN网络模型进行搭建,采用残差网络ResNet50与特征金字塔FPN相结合作为网络主干;
步骤S32:图像输入网络主干生成多尺度融合特征图,使用目标区域推荐网络RPN生成候选框,将生成的候选框投影到特征图上,获得特征矩阵;
步骤S33:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S34:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置。
进一步地,所述步骤S4具体包括:
步骤S41:根据数据集样本类别,设置Faster-RCNN训练模型的类别标签;
步骤S42:设置模型训练参数配置,包括迭代次数、步长和学习率等相关参数;
步骤S43:利用ImageNet预训练分类模型,初始化前置卷积网络层参数,并开始单独训练RPN网络参数;
步骤S44:固定RPN网路独有的卷积层以及全连接层参数,并通过ImageNet预训练分类模型初始化前置卷积网络参数,利用RPN网络生成目标建议框去训练Fast-RCNN网络参数;
步骤S45:固定Fast-RCNN训练好的前置卷积网络层参数,去微调RPN网络独有的卷积层以及全连接层;
步骤S46:保持固定前置卷积网络层参数,去微调Fast-RCNN网络的全连接层参数,使得RPN网络与Fast-RCNN网络共享前置卷积网络层参数,构成一个统一网络;
步骤S47:将训练好的Faster-RCNN网络模型保存好。
进一步地,所述步骤S5具体包括:
步骤S51:输入测试图像,并调整图像大小至指定范围;
步骤S52:将调整后的图像输入残差网络ResNet50与特征金字塔FPN组成的网络主干,生成多尺度融合的特征图;
步骤S53:将特征图输入目标区域推荐网络RPN,生成的候选框投影到特征图上,获得特征矩阵;
步骤S54:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S55:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置。
总结上述步骤:本发明手写数字检测方法研究,通过对手写数字字符串特性综合研判,针对待识别的手写数字字符串在实际应用中所需的高精确性,引入双阶段目标检测Faster-RCNN网络模型,对传统的Faster-RCNN网络模型进行改进;针对手写数字字符串字体风格多变现象,提出残差网络ResNet50与特征金字塔FPN组成网络模型的主干网络,通过特征金字塔FPN生成多尺度融合特征图,减少因字体风格多变所带来的少检和漏检;采用双线性插值的方法,通过采用ROIAlign替代ROIPooling,提高对目标的识别和定位。
根据本发明提供的手写数字检测方法研究,具有本发明具有以下优势:
1、与传统基于竖线直方图和过分割的手写数字字符串分割方式相比,本发明通过无分割的方式对手写数字字符串进行目标检测,能够对粘连严重且背景复杂的数字字符串图像进行精准分割,从而提高手写数字识别的准确率。
2、本发明利用残差网络ResNet50与特征金字塔FPN组成网络模型的主干网络,通过特征金字塔FPN生成多尺度融合特征图,从而减少因字体风格多变所带来的少检和漏检。
3、本发明通过对手写数字字符串特性综合研判,采用双线性插值的方法,利用ROIAlign替代ROIPooling,从而提高对手写数字目标的识别和定位。
附图说明
图1为本发明的整体流程图;
图2为本发明手写数字识别流程图;
图3为本发明手写数字识别效果图。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的阐述。
如图1所示,本发明提出一种基于改进Faster-RCNN的手写数字检测方法,包括以下步骤:
步骤S1:获取手写数字字符串图像数据集:
所述步骤S1具体包括:
步骤S11:通过制定15行12列的纸质表格,并将该表格随机分派至100人手中,每人要求填写1位数、2位数、3位数与4位数,每种类型的数字需要填写45个;
步骤S12:获取拍摄的纸质表格图像;
步骤S13:将包含手写数字的表格框从表格图像中裁剪出来并标号,并制作成数据集。
步骤S2:制作Faster-RCNN模型的数据集,具体以PASCAL VOC2012的标准格式为模板:
所述步骤S2具体包括:
步骤S21:制作数据集样本,并按比例划分为训练数据集与测试数据集;
步骤S22:利用标注工具labelImg获取图像数据集样本的图片名称、数字类别、数字的左上角坐标、右下角坐标,并按照PASCAL VOC2012数据集Annotations文件中的xml格式制作成xml文件;
步骤S23:通过数据集样本,并按比例划分为训练数据集与测试数据集,并生成对应的训练集train.txt文件和测试集val.txt文件。
步骤S3:搭建Faster-RCNN网络模型,通过综合研判手写数字字符串特性,对网络模型进行优化处理:
所述步骤S3具体包括:
步骤S31:以pytorch为网络框架,对Faster-RCNN网络模型进行搭建,采用残差网络ResNet50与特征金字塔FPN相结合作为网络主干;
步骤S32:图像输入网络主干生成多尺度融合特征图,使用目标区域推荐网络RPN生成候选框,将生成的候选框投影到特征图上,获得特征矩阵;
步骤S33:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S34:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置。
步骤S4:将训练集和测试集的手写数字字符串数据加载到改进后的Faster-RCNN网络模型进行训练,并保存训练好的网络:
所述步骤S4具体包括:
步骤S41:根据数据集样本类别,设置Faster-RCNN训练模型的类别标签;
步骤S42:设置模型训练参数配置,包括迭代次数、步长和学习率等相关参数;
步骤S43:利用ImageNet预训练分类模型,初始化前置卷积网络层参数,并开始单独训练RPN网络参数;
步骤S44:固定RPN网路独有的卷积层以及全连接层参数,并通过ImageNet预训练分类模型初始化前置卷积网络参数,利用RPN网络生成目标建议框去训练Fast-RCNN网络参数;
步骤S45:固定Fast-RCNN训练好的前置卷积网络层参数,去微调RPN网络独有的卷积层以及全连接层;
步骤S46:保持固定前置卷积网络层参数,去微调Fast-RCNN网络的全连接层参数,使得RPN网络与Fast-RCNN网络共享前置卷积网络层参数,构成一个统一网络;
步骤S47:将训练好的Faster-RCNN网络模型保存好。
步骤S5:输入测试图像,利用训练好的改进Faster-RCNN模型进行检测:
所述步骤S5具体包括:
步骤S51:如图2所示,输入测试图像,并调整图像大小至指定范围;
步骤S52:将调整后的图像输入残差网络ResNet50与特征金字塔FPN组成的网络主干,生成多尺度融合的特征图;
步骤S53:将特征图输入目标区域推荐网络RPN,生成的候选框投影到特征图上,获得特征矩阵;
步骤S54:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S55:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置,如图3所示。

Claims (6)

1.基于改进Faster-RCNN的手写数字检测方法,其特征在于,包括以下步骤:
S1:获取手写数字字符串图像数据集;
S2:制作Faster-RCNN模型的数据集,具体以PASCALVOC2012的标准格式为模板;
S3:搭建Faster-RCNN网络模型,通过综合研判手写数字字符串特性,对网络模型进行优化处理;
S4:将训练集和测试集的手写数字字符串数据加载到改进后的Faster-RCNN网络进行训练,并保存训练好的网络;
S5:输入测试图像,利用训练好的改进Faster-RCNN模型进行手写数字识别检测。
2.根据权利1中所述基于改进Faster-RCNN的手写数字检测方法,其特征在于,步骤S1具体包括:
步骤S11:通过制定15行12列的纸质表格,并将该表格随机分派至100人手中,每人要求填写1位数、2位数、3位数与4位数,每种类型的数字需要填写45个;
步骤S12:获取拍摄的纸质表格图像;
步骤S13:将包含手写数字的表格框从表格图像中裁剪出来并标号,并制作成数据集。
3.根据权利1中所述基于改进Faster-RCNN的手写数字检测方法,其特征在于,步骤S2具体包括:
步骤S21:制作数据集样本,并按比例划分为训练数据集与测试数据集;
步骤S22:利用标注工具labelImg获取图像数据集样本的图片名称、数字类别、数字的左上角坐标、右下角坐标,并按照PASCAL VOC2012数据集Annotations文件中的xml格式制作成xml文件;
步骤S23:通过数据集样本,并按比例划分为训练数据集与测试数据集,并生成对应的训练集train.txt文件和测试集val.txt文件。
4.根据权利1中所述基于改进Faster-RCNN的手写数字检测方法,其特征在于,步骤S3具体包括:
步骤S31:以pytorch为网络框架,对Faster-RCNN网络模型进行搭建,采用残差网络ResNet50与特征金字塔FPN相结合作为网络主干;
步骤S32:图像输入网络主干生成多尺度融合特征图,使用目标区域推荐网络RPN生成候选框,将生成的候选框投影到特征图上,获得特征矩阵;
步骤S33:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S34:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置。
5.根据权利1中所述基于改进Faster-RCNN的手写数字检测方法,其特征在于,步骤S4具体包括:
步骤S41:根据数据集样本类别,设置Faster-RCNN训练模型的类别标签;
步骤S42:设置模型训练参数配置,包括迭代次数、步长和学习率等相关参数;
步骤S43:利用ImageNet预训练分类模型,初始化前置卷积网络层参数,并开始单独训练RPN网络参数;
步骤S44:固定RPN网路独有的卷积层以及全连接层参数,并通过ImageNet预训练分类模型初始化前置卷积网络参数,利用RPN网络生成目标建议框去训练Fast-RCNN网络参数;
步骤S45:固定Fast-RCNN训练好的前置卷积网络层参数,去微调RPN网络独有的卷积层以及全连接层;
步骤S46:保持固定前置卷积网络层参数,去微调Fast-RCNN网络的全连接层参数,使得RPN网络与Fast-RCNN网络共享前置卷积网络层参数,构成一个统一网络;
步骤S47:将训练好的Faster-RCNN网络模型保存好。
6.根据权利1中所述基于改进Faster-RCNN的手写数字检测方法,其特征在于,步骤S5具体包括:
步骤S51:输入测试图像,并调整图像大小至指定范围;
步骤S52:将调整后的图像输入残差网络ResNet50与特征金字塔FPN组成的网络主干,生成多尺度融合的特征图;
步骤S53:将特征图输入目标区域推荐网络RPN,生成的候选框投影到特征图上,获得特征矩阵;
步骤S54:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S55:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置。
CN202211082323.0A 2022-09-02 2022-09-02 基于改进Faster-RCNN的手写数字检测方法 Pending CN115424280A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211082323.0A CN115424280A (zh) 2022-09-02 2022-09-02 基于改进Faster-RCNN的手写数字检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211082323.0A CN115424280A (zh) 2022-09-02 2022-09-02 基于改进Faster-RCNN的手写数字检测方法

Publications (1)

Publication Number Publication Date
CN115424280A true CN115424280A (zh) 2022-12-02

Family

ID=84203241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211082323.0A Pending CN115424280A (zh) 2022-09-02 2022-09-02 基于改进Faster-RCNN的手写数字检测方法

Country Status (1)

Country Link
CN (1) CN115424280A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117115195A (zh) * 2023-10-24 2023-11-24 成都信息工程大学 基于区块链的防篡改识别方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117115195A (zh) * 2023-10-24 2023-11-24 成都信息工程大学 基于区块链的防篡改识别方法及系统

Similar Documents

Publication Publication Date Title
CN111325203B (zh) 一种基于图像校正的美式车牌识别方法及系统
CN108681752B (zh) 一种基于深度学习的图像场景标注方法
Clausner et al. Scenario driven in-depth performance evaluation of document layout analysis methods
CN113762269B (zh) 基于神经网络的中文字符ocr识别方法、系统及介质
CN109858414A (zh) 一种发票分块检测方法
CN110929795B (zh) 高速焊线机焊点快速识别与定位方法
CN108664975A (zh) 一种维吾尔文手写字母识别方法、系统及电子设备
CN113158977B (zh) 改进FANnet生成网络的图像字符编辑方法
CN110516676A (zh) 一种基于图像处理的银行卡号识别系统
CN112861842A (zh) 基于ocr的案件文本识别方法及电子设备
CN111368682A (zh) 一种基于faster RCNN台标检测与识别的方法及系统
CN115424280A (zh) 基于改进Faster-RCNN的手写数字检测方法
CN113657377B (zh) 一种机打票据图像结构化识别方法
CN114220178A (zh) 基于通道注意力机制的签名鉴别系统及方法
CN111914706B (zh) 一种文字检测输出结果质量检测和控制的方法与装置
CN111046770B (zh) 一种照片档案人物自动标注方法
CN117152768A (zh) 用于扫读笔的离线识别方法及系统
CN115393875B (zh) 基于MobileNetV3的五线谱识别与简谱转换的方法及系统
CN113569940B (zh) 一种基于知识迁移和概率校正的少样本目标检测方法
CN112348922B (zh) 一种测井曲线自动绘制方法、系统、装置及存储介质
CN111046883B (zh) 一种基于古钱币图像的智能评估方法及系统
CN114399754A (zh) 一种基于sw-fssd的数字仪表字符检测方法
CN114708462A (zh) 多数据训练的检测模型生成方法、系统、设备及存储介质
CN114120057A (zh) 一种基于PaddleDetection的混淆矩阵生成方法
CN114241495B (zh) 一种用于脱机手写文本识别的数据增强方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication