CN115424280A - 基于改进Faster-RCNN的手写数字检测方法 - Google Patents
基于改进Faster-RCNN的手写数字检测方法 Download PDFInfo
- Publication number
- CN115424280A CN115424280A CN202211082323.0A CN202211082323A CN115424280A CN 115424280 A CN115424280 A CN 115424280A CN 202211082323 A CN202211082323 A CN 202211082323A CN 115424280 A CN115424280 A CN 115424280A
- Authority
- CN
- China
- Prior art keywords
- network
- rcnn
- handwritten
- data set
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/766—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1918—Fusion techniques, i.e. combining data from various sources, e.g. sensor fusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于改进Faster‑RCNN的手写数字检测方法,所述方法包括:S1,获取手写数字字符串图像数据集;S2,制作Faster‑RCNN模型的数据集,具体以PASCAL VOC2012的标准格式为模板;S3,搭建Faster‑RCNN网络模型,通过综合研判手写数字字符串特性,对网络模型进行优化处理;S4,将训练集和测试集的手写数字字符串数据加载到改进后的Faster‑RCNN网络进行训练,并保存训练好的网络;S5,输入测试图像,利用训练好的改进Faster‑RCNN模型进行手写数字识别检测。本发明引用Faster‑RCNN模型并对手写数字检测过程中的困难样本,采用多种方法进行改进,解决手写数字因手写数字字符串字体风格多变、字符粘连等问题导致识别准确率低与可靠性差的问题。
Description
技术领域
本发明涉及计算机视觉、模式识别与深度学习等领域,尤其涉及一种基于改进Faster-RCNN模型的手写数字检测方法。
背景技术
手写数字识别技术是机器视觉和模式识别研究的主要领域之一,在表单数据录入、大规模数据统计、邮件分拣、光学字符识别和银行支票处理等方面中起着重要的作用。传统纸质手写数据存储转化为电子表格时,大多采用人工录入,存在工作量大、工序繁琐和人工识别准确率低等问题。伴随着人工智能和大数据的快速发展,需要加快手写数字识别技术的发展,以实现信息的数字化管理。
手写数字图像在图像处理技术和深度学习网络实现数字化的过程中,面对手写数字检测研究至少存在以下问题:1、因不同人书写数字方式的差异性,存在字体风格多变问题;2、面对书写数字字符串,存在数字字符串粘连问题。
发明内容
本发明提出一种手写数字检测方法,引用Faster-RCNN模型并对手写数字检测过程中的困难样本,采用多种方法进行改进,解决手写数字因手写数字字符串字体风格多变、字符粘连等问题导致识别准确率低与可靠性差的问题。
为实现上述目的,本发明采用以下技术方案来实现,具体包括以下步骤:
步骤S1:获取手写数字字符串图像数据集;
步骤S2:制作Faster-RCNN模型的数据集,具体以PASCAL VOC2012的标准格式为模板;
步骤S3:搭建Faster-RCNN网络模型,通过综合研判手写数字字符串特性,对网络模型进行优化处理;
步骤S4:将训练集和测试集的手写数字字符串数据加载到改进后的Faster-RCNN网络进行训练,并保存训练好的网络;
步骤S5:输入测试图像,利用训练好的改进Faster-RCNN模型进行手写数字识别检测。
进一步地,所述步骤S1具体包括:
步骤S11:通过制定15行12列的纸质表格,并将该表格随机分派至100人手中,每人要求填写1位数、2位数、3位数与4位数,每种类型的数字需要填写45个;
步骤S12:获取拍摄的纸质表格图像;
步骤S13:将包含手写数字的表格框从表格图像中裁剪出来并标号,并制作成数据集。
进一步地,所述步骤S2具体包括:
步骤S21:制作数据集样本,并按比例划分为训练数据集与测试数据集;
步骤S22:利用标注工具labelImg获取图像数据集样本的图片名称、数字类别、数字的左上角坐标、右下角坐标,并按照PASCAL VOC2012数据集Annotations文件中的xml格式制作成xml文件;
步骤S23:通过数据集样本,并按比例划分为训练数据集与测试数据集,并生成对应的训练集train.txt文件和测试集val.txt文件。
进一步地,所述步骤S3具体包括:
步骤S31:以pytorch为网络框架,对Faster-RCNN网络模型进行搭建,采用残差网络ResNet50与特征金字塔FPN相结合作为网络主干;
步骤S32:图像输入网络主干生成多尺度融合特征图,使用目标区域推荐网络RPN生成候选框,将生成的候选框投影到特征图上,获得特征矩阵;
步骤S33:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S34:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置。
进一步地,所述步骤S4具体包括:
步骤S41:根据数据集样本类别,设置Faster-RCNN训练模型的类别标签;
步骤S42:设置模型训练参数配置,包括迭代次数、步长和学习率等相关参数;
步骤S43:利用ImageNet预训练分类模型,初始化前置卷积网络层参数,并开始单独训练RPN网络参数;
步骤S44:固定RPN网路独有的卷积层以及全连接层参数,并通过ImageNet预训练分类模型初始化前置卷积网络参数,利用RPN网络生成目标建议框去训练Fast-RCNN网络参数;
步骤S45:固定Fast-RCNN训练好的前置卷积网络层参数,去微调RPN网络独有的卷积层以及全连接层;
步骤S46:保持固定前置卷积网络层参数,去微调Fast-RCNN网络的全连接层参数,使得RPN网络与Fast-RCNN网络共享前置卷积网络层参数,构成一个统一网络;
步骤S47:将训练好的Faster-RCNN网络模型保存好。
进一步地,所述步骤S5具体包括:
步骤S51:输入测试图像,并调整图像大小至指定范围;
步骤S52:将调整后的图像输入残差网络ResNet50与特征金字塔FPN组成的网络主干,生成多尺度融合的特征图;
步骤S53:将特征图输入目标区域推荐网络RPN,生成的候选框投影到特征图上,获得特征矩阵;
步骤S54:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S55:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置。
总结上述步骤:本发明手写数字检测方法研究,通过对手写数字字符串特性综合研判,针对待识别的手写数字字符串在实际应用中所需的高精确性,引入双阶段目标检测Faster-RCNN网络模型,对传统的Faster-RCNN网络模型进行改进;针对手写数字字符串字体风格多变现象,提出残差网络ResNet50与特征金字塔FPN组成网络模型的主干网络,通过特征金字塔FPN生成多尺度融合特征图,减少因字体风格多变所带来的少检和漏检;采用双线性插值的方法,通过采用ROIAlign替代ROIPooling,提高对目标的识别和定位。
根据本发明提供的手写数字检测方法研究,具有本发明具有以下优势:
1、与传统基于竖线直方图和过分割的手写数字字符串分割方式相比,本发明通过无分割的方式对手写数字字符串进行目标检测,能够对粘连严重且背景复杂的数字字符串图像进行精准分割,从而提高手写数字识别的准确率。
2、本发明利用残差网络ResNet50与特征金字塔FPN组成网络模型的主干网络,通过特征金字塔FPN生成多尺度融合特征图,从而减少因字体风格多变所带来的少检和漏检。
3、本发明通过对手写数字字符串特性综合研判,采用双线性插值的方法,利用ROIAlign替代ROIPooling,从而提高对手写数字目标的识别和定位。
附图说明
图1为本发明的整体流程图;
图2为本发明手写数字识别流程图;
图3为本发明手写数字识别效果图。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的阐述。
如图1所示,本发明提出一种基于改进Faster-RCNN的手写数字检测方法,包括以下步骤:
步骤S1:获取手写数字字符串图像数据集:
所述步骤S1具体包括:
步骤S11:通过制定15行12列的纸质表格,并将该表格随机分派至100人手中,每人要求填写1位数、2位数、3位数与4位数,每种类型的数字需要填写45个;
步骤S12:获取拍摄的纸质表格图像;
步骤S13:将包含手写数字的表格框从表格图像中裁剪出来并标号,并制作成数据集。
步骤S2:制作Faster-RCNN模型的数据集,具体以PASCAL VOC2012的标准格式为模板:
所述步骤S2具体包括:
步骤S21:制作数据集样本,并按比例划分为训练数据集与测试数据集;
步骤S22:利用标注工具labelImg获取图像数据集样本的图片名称、数字类别、数字的左上角坐标、右下角坐标,并按照PASCAL VOC2012数据集Annotations文件中的xml格式制作成xml文件;
步骤S23:通过数据集样本,并按比例划分为训练数据集与测试数据集,并生成对应的训练集train.txt文件和测试集val.txt文件。
步骤S3:搭建Faster-RCNN网络模型,通过综合研判手写数字字符串特性,对网络模型进行优化处理:
所述步骤S3具体包括:
步骤S31:以pytorch为网络框架,对Faster-RCNN网络模型进行搭建,采用残差网络ResNet50与特征金字塔FPN相结合作为网络主干;
步骤S32:图像输入网络主干生成多尺度融合特征图,使用目标区域推荐网络RPN生成候选框,将生成的候选框投影到特征图上,获得特征矩阵;
步骤S33:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S34:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置。
步骤S4:将训练集和测试集的手写数字字符串数据加载到改进后的Faster-RCNN网络模型进行训练,并保存训练好的网络:
所述步骤S4具体包括:
步骤S41:根据数据集样本类别,设置Faster-RCNN训练模型的类别标签;
步骤S42:设置模型训练参数配置,包括迭代次数、步长和学习率等相关参数;
步骤S43:利用ImageNet预训练分类模型,初始化前置卷积网络层参数,并开始单独训练RPN网络参数;
步骤S44:固定RPN网路独有的卷积层以及全连接层参数,并通过ImageNet预训练分类模型初始化前置卷积网络参数,利用RPN网络生成目标建议框去训练Fast-RCNN网络参数;
步骤S45:固定Fast-RCNN训练好的前置卷积网络层参数,去微调RPN网络独有的卷积层以及全连接层;
步骤S46:保持固定前置卷积网络层参数,去微调Fast-RCNN网络的全连接层参数,使得RPN网络与Fast-RCNN网络共享前置卷积网络层参数,构成一个统一网络;
步骤S47:将训练好的Faster-RCNN网络模型保存好。
步骤S5:输入测试图像,利用训练好的改进Faster-RCNN模型进行检测:
所述步骤S5具体包括:
步骤S51:如图2所示,输入测试图像,并调整图像大小至指定范围;
步骤S52:将调整后的图像输入残差网络ResNet50与特征金字塔FPN组成的网络主干,生成多尺度融合的特征图;
步骤S53:将特征图输入目标区域推荐网络RPN,生成的候选框投影到特征图上,获得特征矩阵;
步骤S54:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S55:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置,如图3所示。
Claims (6)
1.基于改进Faster-RCNN的手写数字检测方法,其特征在于,包括以下步骤:
S1:获取手写数字字符串图像数据集;
S2:制作Faster-RCNN模型的数据集,具体以PASCALVOC2012的标准格式为模板;
S3:搭建Faster-RCNN网络模型,通过综合研判手写数字字符串特性,对网络模型进行优化处理;
S4:将训练集和测试集的手写数字字符串数据加载到改进后的Faster-RCNN网络进行训练,并保存训练好的网络;
S5:输入测试图像,利用训练好的改进Faster-RCNN模型进行手写数字识别检测。
2.根据权利1中所述基于改进Faster-RCNN的手写数字检测方法,其特征在于,步骤S1具体包括:
步骤S11:通过制定15行12列的纸质表格,并将该表格随机分派至100人手中,每人要求填写1位数、2位数、3位数与4位数,每种类型的数字需要填写45个;
步骤S12:获取拍摄的纸质表格图像;
步骤S13:将包含手写数字的表格框从表格图像中裁剪出来并标号,并制作成数据集。
3.根据权利1中所述基于改进Faster-RCNN的手写数字检测方法,其特征在于,步骤S2具体包括:
步骤S21:制作数据集样本,并按比例划分为训练数据集与测试数据集;
步骤S22:利用标注工具labelImg获取图像数据集样本的图片名称、数字类别、数字的左上角坐标、右下角坐标,并按照PASCAL VOC2012数据集Annotations文件中的xml格式制作成xml文件;
步骤S23:通过数据集样本,并按比例划分为训练数据集与测试数据集,并生成对应的训练集train.txt文件和测试集val.txt文件。
4.根据权利1中所述基于改进Faster-RCNN的手写数字检测方法,其特征在于,步骤S3具体包括:
步骤S31:以pytorch为网络框架,对Faster-RCNN网络模型进行搭建,采用残差网络ResNet50与特征金字塔FPN相结合作为网络主干;
步骤S32:图像输入网络主干生成多尺度融合特征图,使用目标区域推荐网络RPN生成候选框,将生成的候选框投影到特征图上,获得特征矩阵;
步骤S33:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S34:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置。
5.根据权利1中所述基于改进Faster-RCNN的手写数字检测方法,其特征在于,步骤S4具体包括:
步骤S41:根据数据集样本类别,设置Faster-RCNN训练模型的类别标签;
步骤S42:设置模型训练参数配置,包括迭代次数、步长和学习率等相关参数;
步骤S43:利用ImageNet预训练分类模型,初始化前置卷积网络层参数,并开始单独训练RPN网络参数;
步骤S44:固定RPN网路独有的卷积层以及全连接层参数,并通过ImageNet预训练分类模型初始化前置卷积网络参数,利用RPN网络生成目标建议框去训练Fast-RCNN网络参数;
步骤S45:固定Fast-RCNN训练好的前置卷积网络层参数,去微调RPN网络独有的卷积层以及全连接层;
步骤S46:保持固定前置卷积网络层参数,去微调Fast-RCNN网络的全连接层参数,使得RPN网络与Fast-RCNN网络共享前置卷积网络层参数,构成一个统一网络;
步骤S47:将训练好的Faster-RCNN网络模型保存好。
6.根据权利1中所述基于改进Faster-RCNN的手写数字检测方法,其特征在于,步骤S5具体包括:
步骤S51:输入测试图像,并调整图像大小至指定范围;
步骤S52:将调整后的图像输入残差网络ResNet50与特征金字塔FPN组成的网络主干,生成多尺度融合的特征图;
步骤S53:将特征图输入目标区域推荐网络RPN,生成的候选框投影到特征图上,获得特征矩阵;
步骤S54:利用双线性插值方法,将每个特征矩阵连接RoIAlign,生成7*7的特征图;
步骤S55:通过将候选框特征图展平和全连接层操作,计算出候选框的类别,并利用边界框回归获得目标精确位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211082323.0A CN115424280A (zh) | 2022-09-02 | 2022-09-02 | 基于改进Faster-RCNN的手写数字检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211082323.0A CN115424280A (zh) | 2022-09-02 | 2022-09-02 | 基于改进Faster-RCNN的手写数字检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115424280A true CN115424280A (zh) | 2022-12-02 |
Family
ID=84203241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211082323.0A Pending CN115424280A (zh) | 2022-09-02 | 2022-09-02 | 基于改进Faster-RCNN的手写数字检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115424280A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117115195A (zh) * | 2023-10-24 | 2023-11-24 | 成都信息工程大学 | 基于区块链的防篡改识别方法及系统 |
-
2022
- 2022-09-02 CN CN202211082323.0A patent/CN115424280A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117115195A (zh) * | 2023-10-24 | 2023-11-24 | 成都信息工程大学 | 基于区块链的防篡改识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111325203B (zh) | 一种基于图像校正的美式车牌识别方法及系统 | |
CN108681752B (zh) | 一种基于深度学习的图像场景标注方法 | |
Clausner et al. | Scenario driven in-depth performance evaluation of document layout analysis methods | |
CN113762269B (zh) | 基于神经网络的中文字符ocr识别方法、系统及介质 | |
CN109858414A (zh) | 一种发票分块检测方法 | |
CN110929795B (zh) | 高速焊线机焊点快速识别与定位方法 | |
CN108664975A (zh) | 一种维吾尔文手写字母识别方法、系统及电子设备 | |
CN113158977B (zh) | 改进FANnet生成网络的图像字符编辑方法 | |
CN110516676A (zh) | 一种基于图像处理的银行卡号识别系统 | |
CN112861842A (zh) | 基于ocr的案件文本识别方法及电子设备 | |
CN111368682A (zh) | 一种基于faster RCNN台标检测与识别的方法及系统 | |
CN115424280A (zh) | 基于改进Faster-RCNN的手写数字检测方法 | |
CN113657377B (zh) | 一种机打票据图像结构化识别方法 | |
CN114220178A (zh) | 基于通道注意力机制的签名鉴别系统及方法 | |
CN111914706B (zh) | 一种文字检测输出结果质量检测和控制的方法与装置 | |
CN111046770B (zh) | 一种照片档案人物自动标注方法 | |
CN117152768A (zh) | 用于扫读笔的离线识别方法及系统 | |
CN115393875B (zh) | 基于MobileNetV3的五线谱识别与简谱转换的方法及系统 | |
CN113569940B (zh) | 一种基于知识迁移和概率校正的少样本目标检测方法 | |
CN112348922B (zh) | 一种测井曲线自动绘制方法、系统、装置及存储介质 | |
CN111046883B (zh) | 一种基于古钱币图像的智能评估方法及系统 | |
CN114399754A (zh) | 一种基于sw-fssd的数字仪表字符检测方法 | |
CN114708462A (zh) | 多数据训练的检测模型生成方法、系统、设备及存储介质 | |
CN114120057A (zh) | 一种基于PaddleDetection的混淆矩阵生成方法 | |
CN114241495B (zh) | 一种用于脱机手写文本识别的数据增强方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |