CN115359451A - 一种百米标数字识别方法 - Google Patents

一种百米标数字识别方法 Download PDF

Info

Publication number
CN115359451A
CN115359451A CN202210826332.XA CN202210826332A CN115359451A CN 115359451 A CN115359451 A CN 115359451A CN 202210826332 A CN202210826332 A CN 202210826332A CN 115359451 A CN115359451 A CN 115359451A
Authority
CN
China
Prior art keywords
layer
image
hectometer
images
target detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210826332.XA
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zegao Electronic Engineering Technology Co ltd
Original Assignee
Shanghai Zegao Electronic Engineering Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zegao Electronic Engineering Technology Co ltd filed Critical Shanghai Zegao Electronic Engineering Technology Co ltd
Priority to CN202210826332.XA priority Critical patent/CN115359451A/zh
Publication of CN115359451A publication Critical patent/CN115359451A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/582Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种百米标数字识别方法,包括以下步骤:图像采集设备采集关于百米标的图像,对图像进行预处理;训练目标检测网络,对百米标图像进行目标检测,获取百米标检测框;利用数字识别方法对目标检测框中的百米标数字进行识别,获取百米标数字。

Description

一种百米标数字识别方法
技术领域
本发明属于交通工程领域,涉及一种百米标数字识别方法。
背景技术
国内外轨道车辆现有定位需要在地面安装定位信标,车辆底部安装阅读器,当车辆驶过定位信标时,车载的阅读器读取到定位信标的数据,从而确定车辆当前的位置。该方法需要在整条线路安装大量的定位信标,工程量浩大且难以维护,此外,阅读器和定位信标之间通过电磁场耦合,当车辆行驶速度较快时,二者的通信交互时间短暂,容易产生丢码。当新增系统要与信号系统互联时,需要信号厂商的授权和认可,由于涉及核心安全,在工程实践上往往难以获得实施。
发明内容
基于此,针对现有技术的不足,本发明的第一个目的在于提供一种百米标识别方法,实现对百米标的精确识别,从而使通过识别百米标对车辆进行精确定位。
为了达到上述目的,本发明的解决方案是:
一种百米标数字识别方法,包括以下步骤:通过图像采集设备采集关于百米标的图像,对图像进行预处理;训练目标识别网络,对百米标图像进行识别,获取百米标检测框;利用数字识别方法对目标识别检测框中的百米标数字进行识别,由此,获取百米标数字。
较佳地,对关于百米标的图像进行预处理,包括:
S10、规则分幅裁剪:通过图像采集设备采集的关于百米标的图像,对图像进行规则分幅裁剪,确定图像裁剪位置的左下角坐标为通过图像采集设备采集的关于百米标的图像左下角坐标,右上角坐标为通过图像采集设备采集的关于百米标的图像中心点坐标,所述变换公式如下:
Figure BDA0003744088380000021
Figure BDA0003744088380000022
其中,(xmin,ymin)为原始图像左下角坐标,(xmax,ymax)为原始图像右上角坐标,(x′max,y′max)为规则分幅裁剪处理后的图像右上角坐标。
S20、去模糊处理:采用去模糊算法对裁剪后的图像进行去模糊处理,具体步骤为:
S21、设置对抗损失函数,对抗损失函数计算公式如下:
Figure BDA0003744088380000023
其中,LGAN为对抗损失函数;
Figure BDA0003744088380000025
为网络;
Figure BDA0003744088380000026
为训练好的卷积神经网络;IB为原始图像。
S22、设置内容损失函数,内容损失函数的计算公式如下:
Figure BDA0003744088380000024
其中,LX为内容损失函数,φi,j为网络中第i个最大池化层之前的第j次卷积获得的特征图,Wi,j和Hi,j为特征图的维度,IS是去模糊后的清晰图像;
Figure BDA0003744088380000033
为训练好的卷积神经网络;IB为原始图像。
S23、定义总损失函数,计算公式如下:
L=LGAN+λ·LX
其中,L为总损失函数,LGAN为对抗损失函数,LX为内容损失函数,λ为内容损失函数的参数。
S24、采用运动轨迹随机生成方法,对运动轨迹矢量进行子像素插值。假设点扩散函数hT服从生成分布
Figure BDA0003744088380000034
。m个运动点扩散函数的集合HT被认为独立于
Figure BDA0003744088380000035
,其计算公式为:
Figure BDA0003744088380000031
点扩散函数运动轨迹计算公式如下:
Figure BDA0003744088380000032
其中,zT为图像,T为时间,λ为代表量子效率的参数,θ1,...,θn为点扩散函数描述子。
较佳地,训练目标检测网络,对百米标图像进行识别,具体步骤为:
S21、采集百米标图像,建立样本数据库,包含海量的百米标的图像;
S22、将样本数据库中的百米标图像按照10:1的比例随机分为训练集和测试集,再对训练集中的百米标图像标注目标区域的边界框参数;
S23、建立目标检测网络,并根据标注好目标区域边界框的百米标图像训练所述目标检测网络,不断调整网络的结构和参数,直到训练参数满足要求;
S24、基于目标检测网络检测结果,裁剪目标检测矩形框。
较佳地,所述的训练好的目标检测网络的结构如下:
目标检测网络包括卷积层、最大池化层、融合层、上采样层、目标检测层,一共24层;
所述卷积层通过3×3和1×1的卷积核提取原始图像的基本特征,步长为1;所述最大池化层采用最大池化的方法,对前一层进行最大采样,滑窗大小为2×2,步长为2;所述融合层将深层的特征图与浅层的特征图进行拼接,同时学习深层和浅层的特征;所述上采样层对图像进行上采样;所述目标检测层指定缺口图像类别数等参数,计算训练的平均损失值,并进行输出;
第0至11层为6个卷积核大小为3×3的所述卷积层,每个所述卷积层之后是所述最大池化层;第12至15层是4个所述卷积层,卷积核大小分别为
3×3、1×1、3×3、1×1;第16层是所述目标检测层;第17层是所述融合层,拼接所述第13层的特征图;第18层是卷积核大小为1 ×1的所述卷积层;第19层是所述上采样层;第20层是所述融合层,将第19层的特征图与所述第8层的特征图进行拼接;第21至22层是两个卷积核大小分别为3×3、1×1的所述卷积层;第23层是所述目标检测层,输出最后的检测结果。
较佳地,所述训练数字识别网络对目标识别检测框中的百米标数字进行识别,获取百米标数字,具体步骤为:
S31、图像灰度化。具体计算公式为:
Figure BDA0003744088380000041
其中,Igray为图像转换后的灰度图,矩阵
Figure BDA0003744088380000042
为对应的彩色图像,Imn为该彩色图像中第m行、第n列对应的像素点,R、G和B分别代表图符图像在RGB三个色彩通道上的分量,参数D1、D2、D3为各色彩分量对应的权重系数,根据经验确定权重系数使图像与背景具有更大的灰度差。
S32、图像二值化、重采样成规定尺寸的像素图。
S33、图像分割。将像素图竖向三等分,各自生成子图Sij,与预设的衡量模板T(m,n)进行匹配,计算两个图像的相似性,模板匹配相关系数R(i,j)计算公式如下:
Figure BDA0003744088380000051
其中,M为模板的长,N为模板的宽;m,n分别为模板的横、纵坐标;i为子图的长,j为子图的宽。
在被搜索图S中完成全部搜索后,选取最大值,其对应的子图即为匹配目标。三个数字排列后,即为百米标序号。
附图说明
图1是本发明的工作原理框图。
图2是本发明提及的百米标示意图。
图3是本发明提及的经过对目标检测框进行裁剪处理的百米标示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
<一种百米标数字识别方法>
在本实施例中提供了一种百米标数字识别方法,图1是根据本发明实施例的百米标数字识别方法流程图,如图1所示,包括以下步骤:通过图像采集设备采集关于百米标的图像,对图像进行预处理;训练目标识别网络,对百米标图像进行识别,获取百米标检测框;利用数字识别网络对目标识别检测框中的百米标数字进行识别,由此,获取百米标数字。
通过上述步骤,本申请将自动识别铁路运行线路上的百米标区域,并对百米标区域内的数字进行识别,得到百米标号码。相比于现有技术,通过对图像进行裁剪和去模糊的预处理,训练所述目标检测网络对百米标进行识别,本系统解决了现有技术中,无法适用于复杂恶劣环境、检测速率慢等问题,从而实现了对铁路运行线路上的百米标数字的准确识别。
现以一个实施例对关于图像进行预处理进行说明。图2是采集到的原始百米标图像,该图像左下角坐标为(0,0),右上角坐标为(599,387)。在一个实施例中,对关于百米标的图像进行预处理,包括:
S10、规则分幅裁剪:通过图像采集设备采集的关于百米标的图像,对图像进行规则分幅裁剪,确定图像裁剪位置的左下角坐标为通过图像采集设备采集的关于百米标的图像左下角坐标,右上角坐标为通过图像采集设备采集的关于百米标的图像中心点坐标,所述变换公式如下:
Figure BDA0003744088380000071
Figure BDA0003744088380000072
其中,(xmin,ymin)为原始图像左下角坐标,(xmax,ymax)为原始图像右上角坐标,(x′max,y′max)为规则分幅裁剪处理后的图像右上角坐标。
经计算,裁剪后图像左下角坐标为(0,0),右上角坐标为(299.5,193.5)。
较佳地,采用去模糊算法对裁剪后的图像进行去模糊处理。
现以一个实施例对训练目标检测网络对百米标图像进行识别进行说明,具体步骤为:
S21、采集百米标图像,建立样本数据库,包含海量的百米标的图像,共10000张;
S22、将样本数据库中的百米标图像按照10∶1的比例随机分为训练集和测试集,再对训练集中的百米标图像标注目标区域的边界框参数;
S23、建立目标检测网络,并根据标注好目标区域边界框的百米标图像训练所述目标检测网络,不断调整网络的结构和参数,直至训练的平均损失值loss小于0.6,且不再明显下降、识别的目标区域与真实的目标区域的重叠率IOU大于90%、分类准确率大于99%,得到训练好的目标检测网络。
S24、将百米标图像输入训练好的目标检测网络进行识别;输出目标区域的边界框参数,本次实例输出四维位置参数为{44,42,90,88},一维置信度
ω=0.9
S25、基于目标检测的边界框参数,对目标检测框进行裁剪,裁剪后图像如图3所示。
现以一个实施例对训练数字识别网络识别目标识别检测框中的百米标数字识别进行说明,具体步骤为:
S31、图像灰度化。参数D1、D2、D3为各色彩分量对应的权重系数,本实验例中选取D1=0.3,D2=0.59,D3=0.11。
S32、图像二值化、重采样成规定尺寸的像素图。
S33、图像分割。分割后,本实例结果求得三个数字分别为2、3、0。三个数字排列后得到该百米标序号为230。
以上所述仅为本发明的优选实例,并不仅限于本发明,尽管参照前述实例对本发明进行了详细的说明,对于本领域的技术人员来说,依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行同等替换。凡在本发明的精神和原则之内,所作的任何修改、同等替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种百米标数字识别方法,其特征在于,包括以下步骤:
利用图像采集设备采集关于百米标的图像,对图像进行预处理;
训练目标识别网络,对百米标图像进行识别,获取百米标检测框;
利用数字识别方法对目标识别检测框中的百米标数字进行识别,获取百米标数字。
2.根据权利要求1所述的百米标数字识别方法,其特征在于,所述对关于百米标的图像进行预处理,包括:
S21、规则分幅裁剪:通过图像采集设备采集的关于百米标的图像,对图像进行规则分幅裁剪,确定图像裁剪位置的左下角坐标为通过图像采集设备采集的关于百米标的图像左下角坐标,右上角坐标为通过图像采集设备采集的关于百米标的图像中心点坐标,所述变换公式如下:
Figure RE-FDA0003880215780000011
Figure RE-FDA0003880215780000012
其中,(xmin,ymin)为原始图像左下角坐标,(xmax,ymax)为原始图像右上角坐标,(x'max,y'max)为规则分幅裁剪处理后的图像右上角坐标。
S22、去模糊处理:采用去模糊算法对裁剪后的图像进行去模糊处理,具体步骤为:
(1)设置对抗损失函数,对抗损失函数计算公式如下:
Figure RE-FDA0003880215780000021
其中,LGAN为对抗损失函数;
Figure RE-FDA0003880215780000022
为网络;
Figure RE-FDA0003880215780000023
为训练好的卷积神经网络;IB为原始图像。
(2)设置内容损失函数,内容损失函数的计算公式如下:
Figure RE-FDA0003880215780000024
其中,LX为内容损失函数,φi,j为网络中第i个最大池化层之前的第j次卷积获得的特征图,Wi,j和Hi,j为特征图的维度,IS是去模糊后的清晰图像;
Figure RE-FDA0003880215780000025
为训练好的卷积神经网络;IB为原始图像。
(3)定义总损失函数,计算公式如下:
L=LGAN+λ·LX
其中,L为总损失函数,LGAN为对抗损失函数,LX为内容损失函数,λ为内容损失函数的参数。
(4)采用运动轨迹随机生成方法,对运动轨迹矢量进行子像素插值。假设点扩散函数hT服从生成分布
Figure RE-FDA0003880215780000026
m个运动点扩散函数的集合HT被认为独立于
Figure RE-FDA0003880215780000027
其计算公式为:
Figure RE-FDA0003880215780000028
点扩散函数运动轨迹计算公式如下:
Figure RE-FDA0003880215780000029
其中,zT为图像,T为时间,λ为代表量子效率的参数,θ1,…,θn为点扩散函数描述子。
3.根据权利要求1所述的百米标数字识别方法,其特征在于,训练目标检测网络,对百米标图像进行识别,获取百米标检测框,具体步骤为:
S31、采集百米标图像,建立样本数据库,包含海量的百米标的图像;
S32、将样本数据库中的百米标图像按照10:1的比例随机分为训练集和测试集,再对训练集中的百米标图像标注目标区域的边界框参数;
S33、建立目标检测网络,并根据标注好目标区域边界框的百米标图像训练所述目标检测网络,不断调整网络的结构和参数,直到训练参数满足要求;
S34、基于目标检测网络检测结果,裁剪目标检测矩形框。
4.根据权利要求1所属的百米标数字识别方法,其特征在于,步骤2所述的训练好的目标检测网络的结构如下:
目标检测网络包括卷积层、最大池化层、融合层、上采样层、目标检测层,一共24层;
所述卷积层通过3×3和1×1的卷积核提取原始图像的基本特征,步长为1;所述最大池化层采用最大池化的方法,对前一层进行最大采样,滑窗大小为2×2,步长为2;所述融合层将深层的特征图与浅层的特征图进行拼接,同时学习深层和浅层的特征;所述上采样层对图像进行上采样;所述目标检测层指定缺口图像类别数等参数,计算训练的平均损失值,并进行输出;
第0至11层为6个卷积核大小为3×3的所述卷积层,每个所述卷积层之后是所述最大池化层;第12至15层是4个所述卷积层,卷积核大小分别为3×3、1×1、3×3、1×1;第16层是所述目标检测层;第17层是所述融合层,拼接所述第13层的特征图;第18层是卷积核大小为1×1的所述卷积层;第19层是所述上采样层;第20层是所述融合层,将第19层的特征图与所述第8层的特征图进行拼接;第21至22层是两个卷积核大小分别为3×3、1×1的所述卷积层;第23层是所述目标检测层,输出最后的检测结果。
5.根据权利要求1的百米标数字识别方法,其特征在于,所述数字识别方法,具体步骤为:
S51、图像灰度化。具体计算公式为:
Figure RE-FDA0003880215780000041
其中,Igray为图像转换后的灰度图,矩阵
Figure RE-FDA0003880215780000042
为对应的彩色图像,Imn为该彩色图像中第m行、第n列对应的像素点,R、G和B分别代表图符图像在RGB三个色彩通道上的分量,参数D1、D2、D3为各色彩分量对应的权重系数,根据经验确定权重系数使图像与背景具有更大的灰度差。
S52、图像二值化、重采样成规定尺寸的像素图。
S53、图像分割。将像素图竖向三等分,各自生成子图Sij,与预设的衡量模板T(m,n)进行匹配,计算两个图像的相似性,模板匹配相关系数R(i,j)计算公式如下:
Figure RE-FDA0003880215780000051
其中,M为模板的长,N为模板的宽;m,n分别为模板的横、纵坐标;i为子图的长,j为子图的宽。
在被搜索图S中完成全部搜索后,选取最大值,其对应的子图即为匹配目标。三个数字排列后,即为百米标序号。
CN202210826332.XA 2022-07-13 2022-07-13 一种百米标数字识别方法 Pending CN115359451A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210826332.XA CN115359451A (zh) 2022-07-13 2022-07-13 一种百米标数字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210826332.XA CN115359451A (zh) 2022-07-13 2022-07-13 一种百米标数字识别方法

Publications (1)

Publication Number Publication Date
CN115359451A true CN115359451A (zh) 2022-11-18

Family

ID=84032124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210826332.XA Pending CN115359451A (zh) 2022-07-13 2022-07-13 一种百米标数字识别方法

Country Status (1)

Country Link
CN (1) CN115359451A (zh)

Similar Documents

Publication Publication Date Title
CN113160192B (zh) 复杂背景下基于视觉的压雪车外观缺陷检测方法及装置
CN104778721B (zh) 一种双目图像中显著性目标的距离测量方法
CN103049763B (zh) 一种基于上下文约束的目标识别方法
CN109657632B (zh) 一种车道线检测识别方法
CN111626277B (zh) 一种基于治超站交调指标分析的车辆跟踪方法及装置
CN111461134A (zh) 一种基于生成对抗网络的低分辨率车牌识别方法
CN110033002A (zh) 基于多任务级联卷积神经网络的车牌检测方法
CN110619258B (zh) 一种基于高分辨率遥感影像的道路轨迹核查方法
CN113269040A (zh) 结合图象识别与激光雷达点云分割的驾驶环境感知方法
CN114359181B (zh) 一种基于图像和点云的智慧交通目标融合检测方法及系统
CN114549981A (zh) 一种基于深度学习的智能巡检指针式仪表识别及读数方法
CN115717894A (zh) 一种基于gps和普通导航地图的车辆高精度定位方法
CN113592839B (zh) 基于改进Faster RCNN的配网线路典型缺陷诊断方法及系统
CN113920436A (zh) 一种基于改进YOLOv4算法的遥感图像海上船舶识别系统及其方法
CN111915583A (zh) 复杂场景中基于车载红外热像仪的车辆和行人检测方法
CN111768417A (zh) 基于单目视觉3d重建技术的铁路货车超限检测方法
CN114241469A (zh) 一种面向电表轮换过程的信息识别方法和装置
CN115841633A (zh) 一种电力塔和电力线关联矫正的电力塔和电力线检测方法
CN113538585B (zh) 基于无人机的高精度多目标智能识别定位追踪方法及系统
CN116110006B (zh) 一种用于智慧旅游系统的景区游客异常行为识别方法
CN117197019A (zh) 一种车辆三维点云图像融合方法及系统
CN113033363A (zh) 一种基于深度学习的车辆稠密目标检测方法
CN117576394A (zh) 一种利用全局信息提升地类语义分割的方法
CN117037132A (zh) 一种基于机器视觉的船舶水尺读数检测和识别方法
CN115359451A (zh) 一种百米标数字识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination