CN115331114A - 基于船号深度学习的船舶身份识别方法 - Google Patents

基于船号深度学习的船舶身份识别方法 Download PDF

Info

Publication number
CN115331114A
CN115331114A CN202211256298.3A CN202211256298A CN115331114A CN 115331114 A CN115331114 A CN 115331114A CN 202211256298 A CN202211256298 A CN 202211256298A CN 115331114 A CN115331114 A CN 115331114A
Authority
CN
China
Prior art keywords
ship
layer
deep learning
neural network
ship number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211256298.3A
Other languages
English (en)
Inventor
张念华
付晓鹏
王光峻
张骏
刘洋
邱亮
邢永超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Hengtianyi Information Technology Co ltd
Original Assignee
Qingdao Hengtianyi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Hengtianyi Information Technology Co ltd filed Critical Qingdao Hengtianyi Information Technology Co ltd
Priority to CN202211256298.3A priority Critical patent/CN115331114A/zh
Publication of CN115331114A publication Critical patent/CN115331114A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于船号深度学习的船舶身份识别方法,属于渔港智能识别领域;包括以下步骤:S1、海岸边架设摄像头,对航行的船舶进行自动跟踪及抓拍,并将抓拍的渔船及船号的图像进行保存;S2、将步骤S1收集的渔船图像进行预处理,将分辨率低、船号肉眼看不清、有遮挡和缺失的图像剔除;S3、将步骤S2预处理的数据集进行数据标注,标注船号位置边框和船号文字;S4、使用深度学习CRNN模型进行船号识别。本发明的优点是:减少了计算量,提高了速度;加入残差网络结构Resnet,测试取得更好的结果;在CTC损失函数中引入blank字符,解决有些位置没有字符的问题,通过递推,快速计算梯度,降低了损失函数。

Description

基于船号深度学习的船舶身份识别方法
技术领域
本发明涉及一种基于船号深度学习的船舶身份识别方法,属于渔港智能识别领域。
背景技术
随着人工智能技术的飞速发展,ocr(Optical character recognition)技术在日常生活中有广泛的应用,如:文字提取、翻译等。船号识别是计算机视频图像识别技术在渔船牌照识别中的一种应用。船号识别技术要求能够将运动中的渔船牌照从复杂背景中提取并识别出来,在闸口进出渔船管理和渔港管理中有广泛应用。
但现有识别模型缺少在渔港这种特定场景中的优化算法,并且现有的识别算法对渔船场景的船号有识别准确率低的问题。随着船龄越来越大,渔船经过风吹雨淋,船号难免受到一定程度的磨损,这样就会造成识别的难度。比如船号图像的倾斜、船号自身的磨损、光线的干扰都会影响到定位精度,因此难以保证船号最终识别结果的准确性。
一种基于船号深度学习的船舶身份识别方法,实现了渔港场景下的船号识别,解决了渔船运动状态中船号模糊、遮挡时识别难的问题,且识别速度快,准确率高。
发明内容
为克服现有技术的缺陷,本发明提供一种基于船号深度学习的船舶身份识别方法,本发明的技术方案是:
一种基于船号深度学习的船舶身份识别方法,包括以下步骤:
S1、海岸边架设摄像头,对航行的船舶进行自动跟踪及抓拍,并将抓拍的渔船及船号的图像进行保存;
S2、将步骤S1收集的渔船图像进行预处理,将分辨率低、船号肉眼看不清、有遮挡和缺失的图像剔除;
S3、将步骤S2预处理的数据集进行数据标注,标注船号位置边框和船号文字;
S4、使用深度学习CRNN模型进行船号识别。
所述步骤S3使用PPOCRLabel进行数据半自动化数据标注,具体步骤包括:
S31、进行字符识别之前,对检测出的文字区域进行透视变换,以便对字符进行矫正,形成数据训练集;
S32、对数据训练集进行渔船船号区域裁切,得到相应的船号识别数据集,并将所有出现的字符存为一个字符文件,供模型作为自定义字典使用。
所述步骤S4 具体步骤包括:
S41、将输入的二维图像,先经过两个卷积层到池化层,然后经过全连接层,最后使用Softmax激活函数进行分类,以作为输出层;
通过卷积运算提取不同的图像特征;池化层主要用于聚合特征相近的特征,降低特征图的尺寸来减少训练参数和加快训练速度;
S42、采用双向LSTM作为循环神经网络,将梯度直接返回浅层神经元,缓解RNN网络中梯度消失的能力;循环神经网络挖掘出数据背后时序和语义的信息,并且处理和预测序列数据;利用BLSTM将特征向量进行融合以提取字符序列的上下文特征,然后得到每列特征的概率分布;
S43、使用CTC损失函数把获取的预测结果转录成最终的标签序列;为了避免网络模型训练出现过拟合现象,把惩罚因子加进损失函数里面,减少输出的值与预期的真实值之间的差距。
所述步骤S41具体步骤包括:
S411、卷积部分限制输入图像为的大小为Width x 32,即该指定图像高度为32,宽度为任意值;
S412、构建卷积神经网络CNN;
S413、将统一高度后的图像输入卷积神经网络CNN中,经过CNN计算后输出特征序列,从而获得双向循环神经网络RNN待输入的特征序列;由于卷积池化具有平移不变性,因此,每一个输出与输入的对应的两列直接相关,并在原图像上有对应的感受野。
所述步骤S42具体步骤为:
S421、在卷积层的上部建立一个深度双向递归神经网络,称为递归层,递归层对特征序列x = x1......xT中每帧的标签分布进行预测;
S422、在CRNN网络结构中增加可变尺度机制,使用滑动窗口和步长来动态的提取图像不同大小的卷积特征, 最后使用池化函数将卷积特征对应的二维矩阵转化为相同尺度;
S423、采用双向循环神经网络RNN结合ResNet网络,能够将梯度直接返回浅层神经元。
所述步骤S43具体为:
S431、采用在CTC损失函数中加入惩罚因子避免网络模型训练出现过拟合现象,如果CTC损失函数的值就应该越小,则说明数据拟合的越好;
S432、引入blank字符,解决有些位置没有字符的问题,通过递推,计算梯度;将双向循环神经网络RNN输出的每帧预测标签分布转录成标签序列,其中转录模式包括无词典转录和基于词典转录,基于词典转录模式中,通过选择具有最高概率的标签序列进行预测。
在所述步骤S411中,将所有测试图片的高度均归一化到32,以便加速测试图片训练的过程。
在所述步骤S412中,卷积神经网络CNN结构使用VGG网络结构提取图像特征;第一层与第二层均采取DW卷积,将第三层最大池化Max Pooling和第四层最大池化Max Pooling的核大小设置为设为1× 2;第五层卷积到第六层卷积引入BatchNormalization(BN)模块,BN层可以加快网络的训练和收敛的速度;控制梯度爆炸防止梯度消失,防止过拟合。
本发明的优点是:该基于船号深度学习的船舶身份识别方法通过改进了数据字典的获取方法,实现了字符字典聚焦,减少不必要的字符匹配,提升速度、构造自定义字典,实现多分辨率船号字典匹配支持; 通过优化的深度学习模型CRNN,即卷积神经网络CNN的前两层采取DW卷积,取代了原有卷积层前两层,减少了计算量,提高了速度; 加入残差网络结构Resnet,测试取得更好的结果;在CTC损失函数中引入blank字符,解决有些位置没有字符的问题,通过递推,快速计算梯度,降低了损失函数。
附图说明
图1为本发明的基于船号深度学习的船舶身份识别方法的流程图;
图2为本发明的CRNN网络结构图。
图3是本发明的CNN结构图。
具体实施方式
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
参见图1至图3,本发明涉及一种基于船号深度学习的船舶身份识别方法,包括以下步骤:
S1、海岸边架设摄像头,对航行的船舶进行自动跟踪及抓拍,并将抓拍的渔船及船号的图像进行保存;
S2、将步骤S1收集的渔船图像进行预处理,将分辨率低、船号肉眼看不清、有遮挡和缺失的图像剔除;
S3、将步骤S2预处理的数据集进行数据标注,标注船号位置边框和船号文字;
S4、使用深度学习CRNN模型进行船号识别。构建优化卷积神经网络CNN,使用优化后的卷积神经网络CNN对步骤3中得的图像数据集进行图像特征提取,得到特征图。使用双向RNN(BLSTM)对特征序列进行预测,对序列中的每个特征向量进行学习,并输出预测标签(真实值)分布;使用CTC损失函数,把从循环层获取的一系列标签分布转换成最终的标签序列。
所述步骤S3使用PPOCRLabel进行数据半自动化数据标注,具体步骤包括:
S31、进行字符识别之前,对检测出的文字区域进行透视变换(透视变换是以一点为视角对原平面进行观察得到的新的投影。其本质是将图像投影到一个新的视平面图),以便对字符进行矫正,形成数据训练集;
S32、对训练集进行渔船船号区域裁切,得到相应的船号识别数据集,并将所有出现的字符存为一个字符文件,供模型作为自定义字典使用。
所述步骤S4 具体步骤包括:
S41、将输入的二维图像,先经过两个卷积层到池化层,然后经过全连接层,最后使用Softmax激活函数进行分类,以作为输出层;
通过卷积运算提取不同的图像特征;池化层主要用于聚合特征相近的特征,降低特征图的尺寸来减少训练参数和加快训练速度;
S42、采用双向LSTM作为循环神经网络,将梯度直接返回浅层神经元,缓解RNN网络中梯度消失的能力;循环神经网络挖掘出数据背后时序和语义的信息,并且处理和预测序列数据;利用BLSTM将特征向量进行融合以提取字符序列的上下文特征,然后得到每列特征的概率分布;
S43、使用CTC损失函数把获取的预测结果转录成最终的标签序列;为了避免网络模型训练出现过拟合现象,把惩罚因子加进损失函数里面,减少输出的值与预期的真实值之间的差距。
所述步骤S4 1具体步骤包括:
S411、卷积部分限制输入图像为的大小为Width x 32,即该指定图像高度为32,宽度为任意值;
S412、构建卷积神经网络CNN;
S413、将统一高度后的图像输入卷积神经网络CNN中,经过CNN计算后输出特征序列,从而获得双向循环神经网络RNN待输入的特征序列。由于卷积池化具有平移不变性,因此,每一个输出与输入的对应的两列直接相关,并在原图像上有对应的感受野。
所述步骤S42具体步骤为:
S421、在卷积层的上部建立一个深度双向递归神经网络,称为递归层,递归层对特征序列x = x1......xT中每帧的标签分布进行预测;
S422、在CRNN网络结构中增加可变尺度机制,使用滑动窗口和步长来动态的提取图像不同大小的卷积特征, 最后使用池化函数将卷积特征对应的二维矩阵转化为相同尺度;
S423、采用双向循环神经网络RNN结合ResNet网络,能够将梯度直接返回浅层神经元。该结构的优点有三方面。首先,RNN具有很强的序列上下文信息捕获能力。使用上下文线索进行基于图像的序列识别比单独处理每个符号更加稳定和有用。以场景文本识别为例,宽字符可能需要几个连续帧来充分描述。此外,有些歧义字在观察其上下文时更容易区分,例如“il”通过字高对比比单独识别更容易识别。其次,RNN可以将误差微分反向传播到它的输入,即卷积层,让我们在一个统一的网络中共同训练递归层和卷积层。第三,RNN能够对任意长度的序列进行操作,从开始到结束进行遍历。
所述步骤S43具体为:
S431、采用在CTC损失函数中加入惩罚因子避免网络模型训练出现过拟合现象,如果CTC损失函数的值就应该越小,则说明数据拟合的越好;
S432、引入blank字符,解决有些位置没有字符的问题,通过递推,计算梯度;将双向循环神经网络RNN输出的每帧预测标签分布转录成标签序列,其中转录模式包括无词典转录和基于词典转录,基于词典转录模式中,通过选择具有最高概率的标签序列进行预测。
在所述步骤S411中,将所有测试图片的高度均归一化到32,以便加速测试图片训练的过程。
在所述步骤S412中,卷积神经网络CNN结构使用VGG网络结构提取图像特征;第一层与第二层均采取DW卷积,将第三层最大池化Max Pooling和第四层最大池化Max Pooling的核大小设置为设为1× 2;第五层卷积到第六层卷积引入BatchNormalization(BN)模块,BN层可以加快网络的训练和收敛的速度;控制梯度爆炸防止梯度消失;防止过拟合。
本发明通过优化的深度学习模型CRNN,即卷积神经网络CNN的前两层采取DW卷积,取代了原有卷积层前两层,减少了计算量,提高了速度; 加入残差网络结构Resnet,测试取得更好的结果;在CTC损失函数中引入blank字符,解决有些位置没有字符的问题,通过递推,快速计算梯度,降低了损失函数。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (8)

1.一种基于船号深度学习的船舶身份识别方法,其特征在于,包括以下步骤:
S1、海岸边架设摄像头,对航行的船舶进行自动跟踪及抓拍,并将抓拍的渔船及船号的图像进行保存;
S2、将步骤S1收集的渔船图像进行预处理,将分辨率低、船号肉眼看不清、有遮挡和缺失的图像剔除;
S3、将步骤S2预处理的数据集进行数据标注,标注船号位置边框和船号文字;
S4、使用深度学习CRNN模型进行船号识别。
2.根据权利要求1所述的一种基于船号深度学习的船舶身份识别方法,其特征在于,所述步骤S3使用PPOCRLabel进行数据半自动化数据标注,具体步骤包括:
S31、进行字符识别之前,对检测出的文字区域进行透视变换,以便对字符进行矫正,形成数据训练集;
S32、对数据训练集进行渔船船号区域裁切,得到相应的船号识别数据集,并将所有出现的字符存为一个字符文件,供模型作为自定义字典使用。
3.根据权利要求1所述的一种基于船号深度学习的船舶身份识别方法,其特征在于,所述步骤S4 具体步骤包括:
S41、将输入的二维图像,先经过两个卷积层到池化层,然后经过全连接层,最后使用Softmax激活函数进行分类,以作为输出层;
通过卷积运算提取不同的图像特征;池化层主要用于聚合特征相近的特征,降低特征图的尺寸来减少训练参数和加快训练速度;
S42、采用双向LSTM作为循环神经网络,将梯度直接返回浅层神经元,缓解RNN网络中梯度消失的能力;循环神经网络挖掘出数据背后时序和语义的信息,并且处理和预测序列数据;利用BLSTM将特征向量进行融合以提取字符序列的上下文特征,然后得到每列特征的概率分布;
S43、使用CTC损失函数把获取的预测结果转录成最终的标签序列;为了避免网络模型训练出现过拟合现象,把惩罚因子加进损失函数里面,减少输出的值与预期的真实值之间的差距。
4.根据权利要求3所述的一种基于船号深度学习的船舶身份识别方法,其特征在于,所述步骤S41具体步骤包括:
S411、卷积部分限制输入图像为的大小为Width x 32,即该指定图像高度为32,宽度为任意值;
S412、构建卷积神经网络CNN;
S413、将统一高度后的图像输入卷积神经网络CNN中,经过CNN计算后输出特征序列,从而获得双向循环神经网络RNN待输入的特征序列;由于卷积池化具有平移不变性,因此,每一个输出与输入的对应的两列直接相关,并在原图像上有对应的感受野。
5.根据权利要求3所述的一种基于船号深度学习的船舶身份识别方法,其特征在于,所述步骤S42具体步骤为:
S421、在卷积层的上部建立一个深度双向递归神经网络,称为递归层,递归层对特征序列x = x1......xT中每帧的标签分布进行预测;
S422、在CRNN网络结构中增加可变尺度机制,使用滑动窗口和步长来动态的提取图像不同大小的卷积特征, 最后使用池化函数将卷积特征对应的二维矩阵转化为相同尺度;
S423、采用双向循环神经网络RNN结合ResNet网络,能够将梯度直接返回浅层神经元。
6.根据权利要求3所述的一种基于船号深度学习的船舶身份识别方法,其特征在于,所述步骤S43具体为:
S431、采用在CTC损失函数中加入惩罚因子避免网络模型训练出现过拟合现象,如果CTC损失函数的值就应该越小,则说明数据拟合的越好;
S432、引入blank字符,解决有些位置没有字符的问题,通过递推,计算梯度;将双向循环神经网络RNN输出的每帧预测标签分布转录成标签序列,其中转录模式包括无词典转录和基于词典转录,基于词典转录模式中,通过选择具有最高概率的标签序列进行预测。
7.根据权利要求4所述的一种基于船号深度学习的船舶身份识别方法,其特征在于,在所述步骤S411中,将所有测试图片的高度均归一化到32,以便加速测试图片训练的过程。
8.根据权利要求4所述的一种基于船号深度学习的船舶身份识别方法,其特征在于,在所述步骤S412中,卷积神经网络CNN结构使用VGG网络结构提取图像特征;第一层与第二层均采取DW卷积,将第三层最大池化Max Pooling和第四层最大池化Max Pooling的核大小设置为设为1× 2;第五层卷积到第六层卷积引入BN模块,BN层加快网络的训练和收敛的速度,控制梯度爆炸防止梯度消失,防止过拟合。
CN202211256298.3A 2022-10-14 2022-10-14 基于船号深度学习的船舶身份识别方法 Pending CN115331114A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211256298.3A CN115331114A (zh) 2022-10-14 2022-10-14 基于船号深度学习的船舶身份识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211256298.3A CN115331114A (zh) 2022-10-14 2022-10-14 基于船号深度学习的船舶身份识别方法

Publications (1)

Publication Number Publication Date
CN115331114A true CN115331114A (zh) 2022-11-11

Family

ID=83914229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211256298.3A Pending CN115331114A (zh) 2022-10-14 2022-10-14 基于船号深度学习的船舶身份识别方法

Country Status (1)

Country Link
CN (1) CN115331114A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116453105A (zh) * 2023-06-20 2023-07-18 青岛国实科技集团有限公司 基于知识蒸馏深度神经网络的船牌号识别方法及系统
CN117975434A (zh) * 2024-04-01 2024-05-03 泉州装备制造研究所 一种基于光度立体的包装盒压印信息识别方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680684A (zh) * 2020-03-16 2020-09-18 广东技术师范大学 一种基于深度学习的书脊文本识别方法、设备及存储介质
CN112183233A (zh) * 2020-09-09 2021-01-05 上海鹰觉科技有限公司 基于深度学习的船牌识别方法及系统
CN112633277A (zh) * 2020-12-30 2021-04-09 杭州电子科技大学 基于深度学习的航道船牌检测、定位及识别方法
CN114694133A (zh) * 2022-05-30 2022-07-01 南京华苏科技有限公司 一种基于图像处理与深度学习相结合的文本识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680684A (zh) * 2020-03-16 2020-09-18 广东技术师范大学 一种基于深度学习的书脊文本识别方法、设备及存储介质
CN112183233A (zh) * 2020-09-09 2021-01-05 上海鹰觉科技有限公司 基于深度学习的船牌识别方法及系统
CN112633277A (zh) * 2020-12-30 2021-04-09 杭州电子科技大学 基于深度学习的航道船牌检测、定位及识别方法
CN114694133A (zh) * 2022-05-30 2022-07-01 南京华苏科技有限公司 一种基于图像处理与深度学习相结合的文本识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
林日光: "基于深度学习的渔船牌号识别研究与应用", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 *
顾佼佼等: "基于改进 Faster R-CNN 的红外舰船目标检测算法", 《红外技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116453105A (zh) * 2023-06-20 2023-07-18 青岛国实科技集团有限公司 基于知识蒸馏深度神经网络的船牌号识别方法及系统
CN116453105B (zh) * 2023-06-20 2023-08-18 青岛国实科技集团有限公司 基于知识蒸馏深度神经网络的船牌号识别方法及系统
CN117975434A (zh) * 2024-04-01 2024-05-03 泉州装备制造研究所 一种基于光度立体的包装盒压印信息识别方法及装置

Similar Documents

Publication Publication Date Title
Li et al. Toward end-to-end car license plate detection and recognition with deep neural networks
Ma et al. Text prior guided scene text image super-resolution
CN115331114A (zh) 基于船号深度学习的船舶身份识别方法
CN111275046B (zh) 一种字符图像识别方法、装置、电子设备及存储介质
Chandio et al. Cursive text recognition in natural scene images using deep convolutional recurrent neural network
CN112818951B (zh) 一种票证识别的方法
CN111738169B (zh) 一种基于端对端网络模型的手写公式识别方法
Peng et al. A fast and accurate fully convolutional network for end-to-end handwritten Chinese text segmentation and recognition
Saqib et al. Person head detection in multiple scales using deep convolutional neural networks
Wang et al. A novel scene text recognition method based on deep learning
CN112257513B (zh) 一种手语视频翻译模型的训练方法、翻译方法及系统
Wang et al. From object detection to text detection and recognition: A brief evolution history of optical character recognition
CN114973222A (zh) 基于显式监督注意力机制的场景文本识别方法
Katper et al. Deep neural networks combined with STN for multi-oriented text detection and recognition
Xiao et al. Robust license plate detection and recognition with automatic rectification
Liu et al. SLPR: A deep learning based Chinese ship license plate recognition framework
Khallouli et al. Leveraging transfer learning and gan models for OCR from engineering documents
Jiang et al. An efficient and unified recognition method for multiple license plates in unconstrained scenarios
CN110942463B (zh) 一种基于生成对抗网络的视频目标分割方法
CN115797952B (zh) 基于深度学习的手写英文行识别方法及系统
Wang et al. Summary of object detection based on convolutional neural network
CN114694133B (zh) 一种基于图像处理与深度学习相结合的文本识别方法
CN115953744A (zh) 一种基于深度学习的车辆识别追踪方法
Zhang et al. Fused confidence for scene text detection via intersection-over-union
Wang et al. ReELFA: A scene text recognizer with encoded location and focused attention

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20221111

RJ01 Rejection of invention patent application after publication