CN115359451A - 一种百米标数字识别方法 - Google Patents
一种百米标数字识别方法 Download PDFInfo
- Publication number
- CN115359451A CN115359451A CN202210826332.XA CN202210826332A CN115359451A CN 115359451 A CN115359451 A CN 115359451A CN 202210826332 A CN202210826332 A CN 202210826332A CN 115359451 A CN115359451 A CN 115359451A
- Authority
- CN
- China
- Prior art keywords
- layer
- image
- hectometer
- images
- target detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000001514 detection method Methods 0.000 claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 claims description 11
- 238000011176 pooling Methods 0.000 claims description 10
- 230000004927 fusion Effects 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 238000009432 framing Methods 0.000 claims description 4
- 238000012952 Resampling Methods 0.000 claims description 3
- 238000003709 image segmentation Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000005672 electromagnetic field Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/582—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种百米标数字识别方法,包括以下步骤:图像采集设备采集关于百米标的图像,对图像进行预处理;训练目标检测网络,对百米标图像进行目标检测,获取百米标检测框;利用数字识别方法对目标检测框中的百米标数字进行识别,获取百米标数字。
Description
技术领域
本发明属于交通工程领域,涉及一种百米标数字识别方法。
背景技术
国内外轨道车辆现有定位需要在地面安装定位信标,车辆底部安装阅读器,当车辆驶过定位信标时,车载的阅读器读取到定位信标的数据,从而确定车辆当前的位置。该方法需要在整条线路安装大量的定位信标,工程量浩大且难以维护,此外,阅读器和定位信标之间通过电磁场耦合,当车辆行驶速度较快时,二者的通信交互时间短暂,容易产生丢码。当新增系统要与信号系统互联时,需要信号厂商的授权和认可,由于涉及核心安全,在工程实践上往往难以获得实施。
发明内容
基于此,针对现有技术的不足,本发明的第一个目的在于提供一种百米标识别方法,实现对百米标的精确识别,从而使通过识别百米标对车辆进行精确定位。
为了达到上述目的,本发明的解决方案是:
一种百米标数字识别方法,包括以下步骤:通过图像采集设备采集关于百米标的图像,对图像进行预处理;训练目标识别网络,对百米标图像进行识别,获取百米标检测框;利用数字识别方法对目标识别检测框中的百米标数字进行识别,由此,获取百米标数字。
较佳地,对关于百米标的图像进行预处理,包括:
S10、规则分幅裁剪:通过图像采集设备采集的关于百米标的图像,对图像进行规则分幅裁剪,确定图像裁剪位置的左下角坐标为通过图像采集设备采集的关于百米标的图像左下角坐标,右上角坐标为通过图像采集设备采集的关于百米标的图像中心点坐标,所述变换公式如下:
其中,(xmin,ymin)为原始图像左下角坐标,(xmax,ymax)为原始图像右上角坐标,(x′max,y′max)为规则分幅裁剪处理后的图像右上角坐标。
S20、去模糊处理:采用去模糊算法对裁剪后的图像进行去模糊处理,具体步骤为:
S21、设置对抗损失函数,对抗损失函数计算公式如下:
S22、设置内容损失函数,内容损失函数的计算公式如下:
S23、定义总损失函数,计算公式如下:
L=LGAN+λ·LX
其中,L为总损失函数,LGAN为对抗损失函数,LX为内容损失函数,λ为内容损失函数的参数。
点扩散函数运动轨迹计算公式如下:
其中,zT为图像,T为时间,λ为代表量子效率的参数,θ1,...,θn为点扩散函数描述子。
较佳地,训练目标检测网络,对百米标图像进行识别,具体步骤为:
S21、采集百米标图像,建立样本数据库,包含海量的百米标的图像;
S22、将样本数据库中的百米标图像按照10:1的比例随机分为训练集和测试集,再对训练集中的百米标图像标注目标区域的边界框参数;
S23、建立目标检测网络,并根据标注好目标区域边界框的百米标图像训练所述目标检测网络,不断调整网络的结构和参数,直到训练参数满足要求;
S24、基于目标检测网络检测结果,裁剪目标检测矩形框。
较佳地,所述的训练好的目标检测网络的结构如下:
目标检测网络包括卷积层、最大池化层、融合层、上采样层、目标检测层,一共24层;
所述卷积层通过3×3和1×1的卷积核提取原始图像的基本特征,步长为1;所述最大池化层采用最大池化的方法,对前一层进行最大采样,滑窗大小为2×2,步长为2;所述融合层将深层的特征图与浅层的特征图进行拼接,同时学习深层和浅层的特征;所述上采样层对图像进行上采样;所述目标检测层指定缺口图像类别数等参数,计算训练的平均损失值,并进行输出;
第0至11层为6个卷积核大小为3×3的所述卷积层,每个所述卷积层之后是所述最大池化层;第12至15层是4个所述卷积层,卷积核大小分别为
3×3、1×1、3×3、1×1;第16层是所述目标检测层;第17层是所述融合层,拼接所述第13层的特征图;第18层是卷积核大小为1 ×1的所述卷积层;第19层是所述上采样层;第20层是所述融合层,将第19层的特征图与所述第8层的特征图进行拼接;第21至22层是两个卷积核大小分别为3×3、1×1的所述卷积层;第23层是所述目标检测层,输出最后的检测结果。
较佳地,所述训练数字识别网络对目标识别检测框中的百米标数字进行识别,获取百米标数字,具体步骤为:
S31、图像灰度化。具体计算公式为:
其中,Igray为图像转换后的灰度图,矩阵为对应的彩色图像,Imn为该彩色图像中第m行、第n列对应的像素点,R、G和B分别代表图符图像在RGB三个色彩通道上的分量,参数D1、D2、D3为各色彩分量对应的权重系数,根据经验确定权重系数使图像与背景具有更大的灰度差。
S32、图像二值化、重采样成规定尺寸的像素图。
S33、图像分割。将像素图竖向三等分,各自生成子图Sij,与预设的衡量模板T(m,n)进行匹配,计算两个图像的相似性,模板匹配相关系数R(i,j)计算公式如下:
其中,M为模板的长,N为模板的宽;m,n分别为模板的横、纵坐标;i为子图的长,j为子图的宽。
在被搜索图S中完成全部搜索后,选取最大值,其对应的子图即为匹配目标。三个数字排列后,即为百米标序号。
附图说明
图1是本发明的工作原理框图。
图2是本发明提及的百米标示意图。
图3是本发明提及的经过对目标检测框进行裁剪处理的百米标示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
<一种百米标数字识别方法>
在本实施例中提供了一种百米标数字识别方法,图1是根据本发明实施例的百米标数字识别方法流程图,如图1所示,包括以下步骤:通过图像采集设备采集关于百米标的图像,对图像进行预处理;训练目标识别网络,对百米标图像进行识别,获取百米标检测框;利用数字识别网络对目标识别检测框中的百米标数字进行识别,由此,获取百米标数字。
通过上述步骤,本申请将自动识别铁路运行线路上的百米标区域,并对百米标区域内的数字进行识别,得到百米标号码。相比于现有技术,通过对图像进行裁剪和去模糊的预处理,训练所述目标检测网络对百米标进行识别,本系统解决了现有技术中,无法适用于复杂恶劣环境、检测速率慢等问题,从而实现了对铁路运行线路上的百米标数字的准确识别。
现以一个实施例对关于图像进行预处理进行说明。图2是采集到的原始百米标图像,该图像左下角坐标为(0,0),右上角坐标为(599,387)。在一个实施例中,对关于百米标的图像进行预处理,包括:
S10、规则分幅裁剪:通过图像采集设备采集的关于百米标的图像,对图像进行规则分幅裁剪,确定图像裁剪位置的左下角坐标为通过图像采集设备采集的关于百米标的图像左下角坐标,右上角坐标为通过图像采集设备采集的关于百米标的图像中心点坐标,所述变换公式如下:
其中,(xmin,ymin)为原始图像左下角坐标,(xmax,ymax)为原始图像右上角坐标,(x′max,y′max)为规则分幅裁剪处理后的图像右上角坐标。
经计算,裁剪后图像左下角坐标为(0,0),右上角坐标为(299.5,193.5)。
较佳地,采用去模糊算法对裁剪后的图像进行去模糊处理。
现以一个实施例对训练目标检测网络对百米标图像进行识别进行说明,具体步骤为:
S21、采集百米标图像,建立样本数据库,包含海量的百米标的图像,共10000张;
S22、将样本数据库中的百米标图像按照10∶1的比例随机分为训练集和测试集,再对训练集中的百米标图像标注目标区域的边界框参数;
S23、建立目标检测网络,并根据标注好目标区域边界框的百米标图像训练所述目标检测网络,不断调整网络的结构和参数,直至训练的平均损失值loss小于0.6,且不再明显下降、识别的目标区域与真实的目标区域的重叠率IOU大于90%、分类准确率大于99%,得到训练好的目标检测网络。
S24、将百米标图像输入训练好的目标检测网络进行识别;输出目标区域的边界框参数,本次实例输出四维位置参数为{44,42,90,88},一维置信度
ω=0.9
S25、基于目标检测的边界框参数,对目标检测框进行裁剪,裁剪后图像如图3所示。
现以一个实施例对训练数字识别网络识别目标识别检测框中的百米标数字识别进行说明,具体步骤为:
S31、图像灰度化。参数D1、D2、D3为各色彩分量对应的权重系数,本实验例中选取D1=0.3,D2=0.59,D3=0.11。
S32、图像二值化、重采样成规定尺寸的像素图。
S33、图像分割。分割后,本实例结果求得三个数字分别为2、3、0。三个数字排列后得到该百米标序号为230。
以上所述仅为本发明的优选实例,并不仅限于本发明,尽管参照前述实例对本发明进行了详细的说明,对于本领域的技术人员来说,依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行同等替换。凡在本发明的精神和原则之内,所作的任何修改、同等替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种百米标数字识别方法,其特征在于,包括以下步骤:
利用图像采集设备采集关于百米标的图像,对图像进行预处理;
训练目标识别网络,对百米标图像进行识别,获取百米标检测框;
利用数字识别方法对目标识别检测框中的百米标数字进行识别,获取百米标数字。
2.根据权利要求1所述的百米标数字识别方法,其特征在于,所述对关于百米标的图像进行预处理,包括:
S21、规则分幅裁剪:通过图像采集设备采集的关于百米标的图像,对图像进行规则分幅裁剪,确定图像裁剪位置的左下角坐标为通过图像采集设备采集的关于百米标的图像左下角坐标,右上角坐标为通过图像采集设备采集的关于百米标的图像中心点坐标,所述变换公式如下:
其中,(xmin,ymin)为原始图像左下角坐标,(xmax,ymax)为原始图像右上角坐标,(x'max,y'max)为规则分幅裁剪处理后的图像右上角坐标。
S22、去模糊处理:采用去模糊算法对裁剪后的图像进行去模糊处理,具体步骤为:
(1)设置对抗损失函数,对抗损失函数计算公式如下:
(2)设置内容损失函数,内容损失函数的计算公式如下:
(3)定义总损失函数,计算公式如下:
L=LGAN+λ·LX
其中,L为总损失函数,LGAN为对抗损失函数,LX为内容损失函数,λ为内容损失函数的参数。
点扩散函数运动轨迹计算公式如下:
其中,zT为图像,T为时间,λ为代表量子效率的参数,θ1,…,θn为点扩散函数描述子。
3.根据权利要求1所述的百米标数字识别方法,其特征在于,训练目标检测网络,对百米标图像进行识别,获取百米标检测框,具体步骤为:
S31、采集百米标图像,建立样本数据库,包含海量的百米标的图像;
S32、将样本数据库中的百米标图像按照10:1的比例随机分为训练集和测试集,再对训练集中的百米标图像标注目标区域的边界框参数;
S33、建立目标检测网络,并根据标注好目标区域边界框的百米标图像训练所述目标检测网络,不断调整网络的结构和参数,直到训练参数满足要求;
S34、基于目标检测网络检测结果,裁剪目标检测矩形框。
4.根据权利要求1所属的百米标数字识别方法,其特征在于,步骤2所述的训练好的目标检测网络的结构如下:
目标检测网络包括卷积层、最大池化层、融合层、上采样层、目标检测层,一共24层;
所述卷积层通过3×3和1×1的卷积核提取原始图像的基本特征,步长为1;所述最大池化层采用最大池化的方法,对前一层进行最大采样,滑窗大小为2×2,步长为2;所述融合层将深层的特征图与浅层的特征图进行拼接,同时学习深层和浅层的特征;所述上采样层对图像进行上采样;所述目标检测层指定缺口图像类别数等参数,计算训练的平均损失值,并进行输出;
第0至11层为6个卷积核大小为3×3的所述卷积层,每个所述卷积层之后是所述最大池化层;第12至15层是4个所述卷积层,卷积核大小分别为3×3、1×1、3×3、1×1;第16层是所述目标检测层;第17层是所述融合层,拼接所述第13层的特征图;第18层是卷积核大小为1×1的所述卷积层;第19层是所述上采样层;第20层是所述融合层,将第19层的特征图与所述第8层的特征图进行拼接;第21至22层是两个卷积核大小分别为3×3、1×1的所述卷积层;第23层是所述目标检测层,输出最后的检测结果。
5.根据权利要求1的百米标数字识别方法,其特征在于,所述数字识别方法,具体步骤为:
S51、图像灰度化。具体计算公式为:
其中,Igray为图像转换后的灰度图,矩阵为对应的彩色图像,Imn为该彩色图像中第m行、第n列对应的像素点,R、G和B分别代表图符图像在RGB三个色彩通道上的分量,参数D1、D2、D3为各色彩分量对应的权重系数,根据经验确定权重系数使图像与背景具有更大的灰度差。
S52、图像二值化、重采样成规定尺寸的像素图。
S53、图像分割。将像素图竖向三等分,各自生成子图Sij,与预设的衡量模板T(m,n)进行匹配,计算两个图像的相似性,模板匹配相关系数R(i,j)计算公式如下:
其中,M为模板的长,N为模板的宽;m,n分别为模板的横、纵坐标;i为子图的长,j为子图的宽。
在被搜索图S中完成全部搜索后,选取最大值,其对应的子图即为匹配目标。三个数字排列后,即为百米标序号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210826332.XA CN115359451A (zh) | 2022-07-13 | 2022-07-13 | 一种百米标数字识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210826332.XA CN115359451A (zh) | 2022-07-13 | 2022-07-13 | 一种百米标数字识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115359451A true CN115359451A (zh) | 2022-11-18 |
Family
ID=84032124
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210826332.XA Pending CN115359451A (zh) | 2022-07-13 | 2022-07-13 | 一种百米标数字识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115359451A (zh) |
-
2022
- 2022-07-13 CN CN202210826332.XA patent/CN115359451A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113160192B (zh) | 复杂背景下基于视觉的压雪车外观缺陷检测方法及装置 | |
CN104778721B (zh) | 一种双目图像中显著性目标的距离测量方法 | |
CN103049763B (zh) | 一种基于上下文约束的目标识别方法 | |
CN109657632B (zh) | 一种车道线检测识别方法 | |
CN111626277B (zh) | 一种基于治超站交调指标分析的车辆跟踪方法及装置 | |
CN111461134A (zh) | 一种基于生成对抗网络的低分辨率车牌识别方法 | |
CN110033002A (zh) | 基于多任务级联卷积神经网络的车牌检测方法 | |
CN110619258B (zh) | 一种基于高分辨率遥感影像的道路轨迹核查方法 | |
CN113269040A (zh) | 结合图象识别与激光雷达点云分割的驾驶环境感知方法 | |
CN114359181B (zh) | 一种基于图像和点云的智慧交通目标融合检测方法及系统 | |
CN114549981A (zh) | 一种基于深度学习的智能巡检指针式仪表识别及读数方法 | |
CN115717894A (zh) | 一种基于gps和普通导航地图的车辆高精度定位方法 | |
CN113592839B (zh) | 基于改进Faster RCNN的配网线路典型缺陷诊断方法及系统 | |
CN113920436A (zh) | 一种基于改进YOLOv4算法的遥感图像海上船舶识别系统及其方法 | |
CN111915583A (zh) | 复杂场景中基于车载红外热像仪的车辆和行人检测方法 | |
CN111768417A (zh) | 基于单目视觉3d重建技术的铁路货车超限检测方法 | |
CN114241469A (zh) | 一种面向电表轮换过程的信息识别方法和装置 | |
CN115841633A (zh) | 一种电力塔和电力线关联矫正的电力塔和电力线检测方法 | |
CN113538585B (zh) | 基于无人机的高精度多目标智能识别定位追踪方法及系统 | |
CN116110006B (zh) | 一种用于智慧旅游系统的景区游客异常行为识别方法 | |
CN117197019A (zh) | 一种车辆三维点云图像融合方法及系统 | |
CN113033363A (zh) | 一种基于深度学习的车辆稠密目标检测方法 | |
CN117576394A (zh) | 一种利用全局信息提升地类语义分割的方法 | |
CN117037132A (zh) | 一种基于机器视觉的船舶水尺读数检测和识别方法 | |
CN115359451A (zh) | 一种百米标数字识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |