CN111612087B - 动车组teds系统图像特征字典生成方法 - Google Patents

动车组teds系统图像特征字典生成方法 Download PDF

Info

Publication number
CN111612087B
CN111612087B CN202010466620.XA CN202010466620A CN111612087B CN 111612087 B CN111612087 B CN 111612087B CN 202010466620 A CN202010466620 A CN 202010466620A CN 111612087 B CN111612087 B CN 111612087B
Authority
CN
China
Prior art keywords
image
vector
images
dictionary
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010466620.XA
Other languages
English (en)
Other versions
CN111612087A (zh
Inventor
刘希龙
李丹勇
尤嘉
杨德文
蔡文明
赵晓明
王锐
张友印
李若澜
许倩倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yijia Sunshine Technology Development Co ltd
Beijing EMU Depot of China Railway Beijing Group Co Ltd
Original Assignee
Beijing Yijia Sunshine Technology Development Co ltd
Beijing EMU Depot of China Railway Beijing Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yijia Sunshine Technology Development Co ltd, Beijing EMU Depot of China Railway Beijing Group Co Ltd filed Critical Beijing Yijia Sunshine Technology Development Co ltd
Priority to CN202010466620.XA priority Critical patent/CN111612087B/zh
Publication of CN111612087A publication Critical patent/CN111612087A/zh
Application granted granted Critical
Publication of CN111612087B publication Critical patent/CN111612087B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

一种动车组TEDS系统图像特征字典生成方法。该方法的输入是高铁检测图像数据集和给定字符数D,输出是对应给定字符数D的字典。该方法包括:输入图像数据集,构建图像序列,构造标量值函数获取图像标量场,奇点检测及奇点特征提取,统计向量个数并计算均值向量,有效字符挖掘并生成特征字符,最后输出特征字典。该方法通过建立特征字典的形式将多个图像特征提取算子进行融合,打破了传统使用的单一图像特征提检测的方法,从而结合了每个算子的长处,大大提高了后续的图像识别工作效率与准确率。

Description

动车组TEDS系统图像特征字典生成方法
技术领域
本发明属于动车组运行图像检测与分析技术领域,具体涉及一种动车组TEDS系统图像特征字典生成方法。
背景技术
在动车组运行过程中,目前主要采用人工图像判别方式对动车组进行实时图像检测与分析,每天全路有近三千多名工作人员围绕系统产生的实时图像进行人工图像评判,该工作劳动强度大,易产生视觉疲劳,进而造成漏报、误报。同时,图像识别有较高时效性的要求,图像采集后要求在规定时间内发现并定位缺陷以及故障问题,从而保证列车安全运行,以目前的人工评判是难以实现的,容易受到人工的经验和疲劳度影响。
随着机器视觉技术的飞速发展,模拟人工检测原理,基于视觉的产品质量高速自动化检测技术引起了相关行业的广泛关注。它具有适应性好、标准统一、检测结果一致性高等特性。目前主流的算法可以分为两类:基于区域建议的目标检测算法和基于回归的目标检测算法。但其均采用单一的特征提取算法,仅适用于一类图像,存在一定的局限性。特别是对于高铁底部和侧面这类复杂图像,现有的目标检测算法并不能直接应用。因此,如何构造能反应多图像特征的字典,从而融合多个特征提取算法共同检测,是需要重点解决的技术问题。
发明内容
本发明目的是解决现有技术存在的上述问题,提供一种动车组TEDS系统图像特征字典生成方法。
本发明的技术方案
一种动车组TEDS系统图像特征字典生成方法,该方法的输入是高铁检测图像数据集和给定字符数D,输出是对应给定字符数D的字典。所述方法包括:
第1步、构建图像序列
对于输入的包含A幅图像的数据集,设定比例系数K1<1,利用利用数据集中图像jI1构造由M幅图像构成的图像序列,图像序列中所有图像的长宽比与图像jI1相同,Li+1/Li=K1,i=1,2,…,M-1,其中Li表示序列中第i幅图像jIi的长边长度,对数据集中j=1,2,…A的所有图像进行上述操作,得到A×M幅图像。
第2步、构造标量值函数
构造标量值函数S(I,u,v),其中I为输入图像,(u,v)为图像坐标;函数的主要功能是构建一个与输入图像尺寸相同的标量场,提取输入图像中各个坐标点的灰度值并存于标量场中。对于第1步得到的所有A×M幅图像中的每一幅,遍历计算每个像素的函数值,得到与输入图像尺寸相同的标量场。
标量值函数S(I,u,v)的获取方法是:将图像灰度化并提取灰度值存于标量场。
第3步、检测奇点
对于每幅标量场图,逐个判断每个像素,如果一个像素在以自身为中心的T×T邻域内具有最大值,则认为该像素为奇点,记所有A×M幅图像中检测到的全部奇点的数量为N,给每个奇点一个编号q,第q个奇点表示为Pq,q=1,2,…,N。
第4步、对奇点提取特征
对于奇点Pq,利用G种不同的特征提取算子(包括:ORB,SIFT和HOG等)提取特征。可以根据工程问题的情况灵活设计算子的具体内容。但在逻辑层面上,该步骤中的算子包含作用域和编码规则两个部分。其中作用域是以奇点Pq为参照的,大小为mj×nj的图像区域iΩj,编码规则rj是一个以作用域内像素为输入的向量值函数。根据所定义的符号Ji,利用第j个算子处理第i个奇点的过程可以写成如下函数形式:
iRj=rj(iΩj)
其中iRj是一个Dj维的向量,j=1,2,…,G。如果在图像上,算子的作用域超出了图像边界,则认为该算子无效,将输出向量规定为Dj维0向量。
第5步、统计向量个数
在下标j=1的所有向量中随机选取一个非零向量iR1,如果与该向量欧式距离小于给定阈值Tj的非零向量个数小于阈值TE,则认为无效,重新随机选取非零向量。否则,计算包括向量iR1本身在内所有欧式距离小于给定阈值Tj向量的均值向量
Figure GDA0004266521440000021
第6步、计算均值向量
计算所有与iR1欧式距离小于给定阈值Tj的非零向量的均值向量,并用新的均值向量更新
Figure GDA0004266521440000022
不断重复该过程,直到更新前后/>
Figure GDA0004266521440000023
的值不再改变为止。
第7步、有效字符挖掘
确定半径d1,使得在以
Figure GDA0004266521440000024
为球心,d1为半径的Dj球体中,指标|C2/d1 Dj|取得最大值,C为球体内非零向量的个数。如果球体内非零向量的个数超过阈值Ts,认为挖掘出第一个有效字符w1,按照如下格式记录该球体的球心、半径以及特征提取算子的句柄作为字符w1的信息:/>
Figure GDA0004266521440000031
并将该字符保存于特征字典中。
第8步、记录字符w1的球体内所有非零向量的左上标,对于j=1,2,…,G,将所有相应左上标的向量置为零向量。
第9步、重复第5步至第8步,直到没有新的有效字符产生。
第10步、将j的值加1,重复第5步至第9步,直到没有新的有效字符产生。
第11步、重复第10步,直到j=G,输出特征字符字典D,D=[w1...wk...wG],1≦k≦G,
Figure GDA0004266521440000032
本发明的优点和有益效果:
本发明通过建立特征字典的形式将多个图像特征提取算子进行融合,打破了传统使用的单一图像特征提检测的方法,从而结合了每个算子的长处,大大提高了后续的图像识别工作效率与准确率。
附图说明
图1是本发明方法的算法模块图。
图2是本发明方法的整体流程图。
具体实施方式
实施例1:
一种动车组TEDS系统图像特征字典生成方法,该方法的输入是高铁检测图像数据集和给定字符数D=10,输出是对应给定字符数D=10的字典。所述方法流程参见图2,具体包括如下步骤:
Step1、对于包含输入的A=100幅图像的数据集,设定比例系数K1=0.74,对其中图像jI1使用图像金字塔的方法构造M=5幅图像构成的图像序列,其中图像序列中所有图像的长宽比与图像jI1相同,Li+1/Li=K1,i=1,2,…,M-1=4,其中Li表示序列中第i幅图像jIi的长边长度。对数据集中j=1,2,…100的所有图像进行上述操作,得到500幅图像。
Step2、构造标量值函数S(I,u,v)(具体方法是,将图像灰度化并提取灰度值存于标量场),其中I为输入图像,(u,v)为图像坐标。对于上一步得到的所有500幅图像中的每一幅,遍历计算每个像素的函数值(也就是每个点的灰度值)。得到与输入图像尺寸相同的标量场。
Step3、对于每幅标量场图,逐个判断每个像素,如果一个像素在以其本身为中心的15×15(T=15)邻域内具有最大值,则认为该像素为奇点。记所有500幅图像中检测到的全部奇点的数量为11129,给每个奇点一个编号q,第q个奇点表示为Pq,q=1,2,…,11129。
Step4、对于奇点Pq,利用2种不同的特征提取算子提取特征,即HOG特征与ORB特征。在逻辑层面上,该步骤中的算子包含作用域和编码规则两个部分。其中HOG特征的作用域是以奇点Pq为参照的,大小为mj×nj的图像区域iΩj,mj=32,nj=32。而ORB特征的作用域是奇点Pq圆圈范围中的16个像素。编码规则rj是一个以作用域内像素为输入的向量值函数,r1为HOG特征提取编码函数,r2为ORB特征提取编码函数,根据所定义的符号Ji,利用第j个算子处理第q个奇点的过程可以写成如下函数形式:
iRj=rj(iΩj)
其中iRj是一个Dj维的向量,j=1,2,D1=36,D2=32。如果在图像上,算子的作用域超出了图像边界,则认为该算子无效,将输出向量规定为Dj=0维向量。
Step5、在下标j=1的所有向量中即所有由HOG特征编码的向量中,随机选取一个非零向量iR1,如果与该向量欧式距离小于给定阈值Tj=644245348的非零向量个数小于阈值TE=100,则认为无效,重新随机选取非零向量。否则,计算包括向量iR1本身在内所有欧式距离小于给定阈值Tj向量的均值向量iR1。在下标j=2的所有向量中即所有由ORB特征编码的向量中,随机选取一个非零向量iR1,如果与该向量汉明距离小于给定阈值Tj=544的非零向量个数小于阈值TE=110,则认为无效,重新随机选取非零向量。否则,计算包括向量iR1本身在内所有欧式距离小于给定阈值Tj向量的均值向量
Figure GDA0004266521440000041
Step6、计算所有与
Figure GDA0004266521440000042
欧式距离/汉明距离小于给定阈值Tj的非零向量的均值向量,并用新的均值向量更新/>
Figure GDA0004266521440000043
不断重复该过程,直到更新前后/>
Figure GDA0004266521440000044
的值三次不再改变为止。
Step7、确定半径d1,使得在以
Figure GDA0004266521440000045
为球心,d1为半径的Dj球体中,指标|C2/d1 Dj|取得最大值,C为球体内非零向量的个数,HOG特征:C=100,d1=644245348;ORB特征:C=100,d1=544。如果球体内非零向量的个数超过阈值Ts=100,认为挖掘出第一个有效字符w1=’A’,按照如下格式记录该球体的球心、半径以及特征提取算子的句柄作为字符w1的信息:
Figure GDA0004266521440000046
并将该字符保存于特征字典中。
Step8、记录w1的球体内所有非零向量的左上标,对于j=1,2,将所有相应左上标的向量置为零向量。
Step9、重复step5至step8,直到没有新的有效字符产生。
Step10、将j的值加1,重复step5至step9,直到没有新的有效字符产生。
Step11、重复step10,直到j=2。输出特征字符字典D,D=[w1...wk...w10],1≦k≦10,
Figure GDA0004266521440000047
详见下表。
Figure GDA0004266521440000051

Claims (3)

1.一种动车组TEDS系统图像特征字典生成方法,该方法的输入是高铁检测图像数据集和给定字符数D,输出是对应给定字符数D的字典,所述方法包括:
第1步、构建图像序列
对于输入的包含A幅图像的数据集,设定比例系数K1<1,利用数据集中图像jI1构造由M幅图像构成的图像序列,图像序列中所有图像的长宽比与图像jI1相同,Li+1/Li=K1,i=1,2,…,M-1,其中Li表示序列中第i幅图像jIi的长边长度,对数据集中j=1,2,…A的所有图像进行上述操作,得到A×M幅图像;
第2步、构造标量值函数
构造标量值函数S(I,u,v),其中I为输入图像,(u,v)为图像坐标;函数的主要功能是构建一个与输入图像尺寸相同的标量场,提取输入图像中各个坐标点的灰度值并存于标量场中;对于第1步得到的所有A×M幅图像中的每一幅图像,遍历计算每个像素的函数值,得到与输入图像尺寸相同的标量场;
第3步、检测奇点
对于每幅标量场图,逐个判断每个像素,如果一个像素在以本身为中心的T×T邻域内具有最大值,则认为该像素为奇点,记所有A×M幅图像中检测到的全部奇点的数量为N,给每个奇点一个编号q,第q个奇点表示为Pq,q=1,2,…,N;
第4步、对奇点提取特征
对于奇点Pq,利用G种不同的特征提取算子提取特征;特征提取算子根据工程问题的情况灵活设计,但在逻辑层面上,该步骤中的算子包含作用域和编码规则两个部分;其中作用域是以奇点Pq为参照的,大小为mk×nk的图像区域Ωkq,编码规则rk是一个以作用域内像素为输入的向量值函数,k=1,2,…,G;利用第k个特征提取算子处理第q个奇点的过程写成如下函数形式:
Rkq=rkkq))
其中Rkq是一个Dk维的向量;如果在图像上,算子的作用域超出了图像边界,则认为该算子无效,将输出向量规定为Dk维0向量;
第5步、统计向量个数
在下标k=1的所有向量中随机选取一个非零向量R1q,如果与该向量欧式距离小于给定阈值Tk的非零向量个数小于阈值TE,则认为该向量无效,重新随机选取非零向量;否则,计算包括向量R1q本身在内所有欧式距离小于给定阈值Tk向量的均值向量
Figure QLYQS_1
第6步、计算均值向量
计算所有与
Figure QLYQS_2
欧式距离小于给定阈值Tk的非零向量的均值向量,并用新的均值向量更新/>
Figure QLYQS_3
不断重复该过程,直到更新前后/>
Figure QLYQS_4
的值不再改变为止;
第7步、有效字符挖掘
确定半径d1,使得在以
Figure QLYQS_5
为球心,d1为半径的Dk维球体中,指标/>
Figure QLYQS_6
取得最大值,C为球体内非零向量的个数;如果球体内非零向量的个数超过阈值Ts,认为挖掘出第一个有效字符w1,按照如下格式记录该球体的球心、半径以及特征提取算子的句柄作为字符w1的信息:/>
Figure QLYQS_7
并将该字符保存于特征字典中;
第8步、记录字符w1的球体内所有非零向量的左上标,对于k=1,2,…,G,将所有相应左上标的向量置为零向量;
第9步、重复第5步至第8步,直到没有新的有效字符产生;
第10步、将k的值加1,重复第5步至第9步,直到没有新的有效字符产生;
第11步、重复第10步,直到k=G,输出特征字符字典D,D=[w1...wk...wG],1≦k≦G,
Figure QLYQS_8
2.根据权利要求1所述的动车组TEDS系统图像特征字典生成方法,其特征在于,第2步中的标量值函数S(I,u,v)的获取方法是:将图像的灰度化并提取灰度值存于标量场。
3.根据权利要求1所述的动车组TEDS系统图像特征字典生成方法,其特征在于,第4步中的G种不同的特征提取算子包括:ORB,SIFT和HOG。
CN202010466620.XA 2020-05-28 2020-05-28 动车组teds系统图像特征字典生成方法 Active CN111612087B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010466620.XA CN111612087B (zh) 2020-05-28 2020-05-28 动车组teds系统图像特征字典生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010466620.XA CN111612087B (zh) 2020-05-28 2020-05-28 动车组teds系统图像特征字典生成方法

Publications (2)

Publication Number Publication Date
CN111612087A CN111612087A (zh) 2020-09-01
CN111612087B true CN111612087B (zh) 2023-07-14

Family

ID=72199806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010466620.XA Active CN111612087B (zh) 2020-05-28 2020-05-28 动车组teds系统图像特征字典生成方法

Country Status (1)

Country Link
CN (1) CN111612087B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116681935B (zh) * 2023-05-31 2024-01-23 国家深海基地管理中心 一种深海热液喷口自主识别定位方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886557A (zh) * 2014-03-28 2014-06-25 北京工业大学 一种深度图像的去噪方法
CN104598928A (zh) * 2015-01-30 2015-05-06 南京邮电大学 一种基于类字典稀疏识别的车辆分类方法
CN104732492A (zh) * 2015-03-09 2015-06-24 北京工业大学 一种深度图像的去噪方法
JP2015153340A (ja) * 2014-02-19 2015-08-24 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN106056611A (zh) * 2016-06-03 2016-10-26 上海交通大学 基于区域信息和边缘信息的水平集图像分割方法及其系统
CN106682087A (zh) * 2016-11-28 2017-05-17 东南大学 一种基于车载装饰品特征稀疏编码的车辆检索方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015153340A (ja) * 2014-02-19 2015-08-24 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN103886557A (zh) * 2014-03-28 2014-06-25 北京工业大学 一种深度图像的去噪方法
CN104598928A (zh) * 2015-01-30 2015-05-06 南京邮电大学 一种基于类字典稀疏识别的车辆分类方法
CN104732492A (zh) * 2015-03-09 2015-06-24 北京工业大学 一种深度图像的去噪方法
CN106056611A (zh) * 2016-06-03 2016-10-26 上海交通大学 基于区域信息和边缘信息的水平集图像分割方法及其系统
CN106682087A (zh) * 2016-11-28 2017-05-17 东南大学 一种基于车载装饰品特征稀疏编码的车辆检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Hongteng Xu等.Dictionary Learning with Mutually Reinforcing Group-Graph Structures.Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence.2015,第3101-3107页. *
王成钢等.基于奇异点的字典模型指纹方向场去噪方法.计算机应用研究.2016,第1570-1575页. *

Also Published As

Publication number Publication date
CN111612087A (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
Bai et al. An optimized railway fastener detection method based on modified Faster R-CNN
CN110264448B (zh) 一种基于机器视觉的绝缘子故障检测方法
CN112581463A (zh) 图像缺陷的检测方法、装置、电子设备、存储介质及产品
CN113284109B (zh) 管道缺陷识别方法、装置、终端设备及存储介质
CN108389256A (zh) 二三维交互式无人机电力杆塔巡检辅助方法
CN111859805B (zh) 基于人工智能的电力图纸拓扑关系的检测方法
CN111582294A (zh) 一种构建用于表面缺陷检测的卷积神经网络模型的方法及其利用
CN112070135A (zh) 电力设备图像检测方法、装置、电力设备及存储介质
CN104992429A (zh) 一种基于图像局部增强的山体裂缝检测方法
CN110567383A (zh) 基于结构森林和亚像素的受电弓磨耗预警系统及检测方法
CN112926556B (zh) 一种基于语义分割的航拍输电线路散断股识别方法及系统
CN107016394A (zh) 一种交叉纤维特征点匹配方法
CN111612087B (zh) 动车组teds系统图像特征字典生成方法
CN111222447A (zh) 基于神经网络及多通道融合lbp特征的活体检测方法
CN112308855A (zh) 钢轨伤损识别模型生成装置、伤损检测装置及系统
CN112465027A (zh) 钢轨伤损检测方法
CN114092478B (zh) 一种异常检测方法
CN114882494B (zh) 一种基于多模态注意力驱动的三维点云特征提取方法
CN106780577B (zh) 一种基于组特征的直线匹配方法
CN116452604A (zh) 一种复杂变电站场景分割方法、设备及存储介质
CN110807416A (zh) 适用于移动检测装置的数字式仪表智能识别装置及方法
CN111415320A (zh) 一种基于双目立体视觉的隔离开关开闭状态检测方法
Wijaya et al. Building crack due to lombok earthquake classification based on glcm features and svm classifier
Zhou et al. DSANet-KD: Dual Semantic Approximation Network via Knowledge Distillation for Rail Surface Defect Detection
de Gélis et al. Beyond Siamese KPConv: Early Encoding and Less Supervision

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant