CN111612087B

CN111612087B - 动车组teds系统图像特征字典生成方法

Info

Publication number: CN111612087B
Application number: CN202010466620.XA
Authority: CN
Inventors: 刘希龙; 李丹勇; 尤嘉; 杨德文; 蔡文明; 赵晓明; 王锐; 张友印; 李若澜; 许倩倩
Original assignee: Beijing Yijia Sunshine Technology Development Co ltd; Beijing EMU Depot of China Railway Beijing Group Co Ltd
Current assignee: Beijing Yijia Sunshine Technology Development Co ltd; Beijing EMU Depot of China Railway Beijing Group Co Ltd
Priority date: 2020-05-28
Filing date: 2020-05-28
Publication date: 2023-07-14
Anticipated expiration: 2040-05-28
Also published as: CN111612087A

Abstract

一种动车组TEDS系统图像特征字典生成方法。该方法的输入是高铁检测图像数据集和给定字符数D，输出是对应给定字符数D的字典。该方法包括：输入图像数据集，构建图像序列，构造标量值函数获取图像标量场，奇点检测及奇点特征提取，统计向量个数并计算均值向量，有效字符挖掘并生成特征字符，最后输出特征字典。该方法通过建立特征字典的形式将多个图像特征提取算子进行融合，打破了传统使用的单一图像特征提检测的方法，从而结合了每个算子的长处，大大提高了后续的图像识别工作效率与准确率。

Description

动车组TEDS系统图像特征字典生成方法

技术领域

本发明属于动车组运行图像检测与分析技术领域，具体涉及一种动车组TEDS系统图像特征字典生成方法。

背景技术

在动车组运行过程中，目前主要采用人工图像判别方式对动车组进行实时图像检测与分析，每天全路有近三千多名工作人员围绕系统产生的实时图像进行人工图像评判，该工作劳动强度大，易产生视觉疲劳，进而造成漏报、误报。同时，图像识别有较高时效性的要求，图像采集后要求在规定时间内发现并定位缺陷以及故障问题，从而保证列车安全运行，以目前的人工评判是难以实现的，容易受到人工的经验和疲劳度影响。

随着机器视觉技术的飞速发展，模拟人工检测原理，基于视觉的产品质量高速自动化检测技术引起了相关行业的广泛关注。它具有适应性好、标准统一、检测结果一致性高等特性。目前主流的算法可以分为两类：基于区域建议的目标检测算法和基于回归的目标检测算法。但其均采用单一的特征提取算法，仅适用于一类图像，存在一定的局限性。特别是对于高铁底部和侧面这类复杂图像，现有的目标检测算法并不能直接应用。因此，如何构造能反应多图像特征的字典，从而融合多个特征提取算法共同检测，是需要重点解决的技术问题。

发明内容

本发明目的是解决现有技术存在的上述问题，提供一种动车组TEDS系统图像特征字典生成方法。

本发明的技术方案

一种动车组TEDS系统图像特征字典生成方法，该方法的输入是高铁检测图像数据集和给定字符数D，输出是对应给定字符数D的字典。所述方法包括：

第1步、构建图像序列

对于输入的包含A幅图像的数据集，设定比例系数K₁<1，利用利用数据集中图像^jI₁构造由M幅图像构成的图像序列，图像序列中所有图像的长宽比与图像^jI₁相同，L_i+1/L_i＝K₁，i＝1,2,…,M-1，其中L_i表示序列中第i幅图像^jI_i的长边长度，对数据集中j＝1,2,…A的所有图像进行上述操作，得到A×M幅图像。

第2步、构造标量值函数

构造标量值函数S(I,u,v)，其中I为输入图像，(u,v)为图像坐标；函数的主要功能是构建一个与输入图像尺寸相同的标量场，提取输入图像中各个坐标点的灰度值并存于标量场中。对于第1步得到的所有A×M幅图像中的每一幅，遍历计算每个像素的函数值，得到与输入图像尺寸相同的标量场。

标量值函数S(I,u,v)的获取方法是：将图像灰度化并提取灰度值存于标量场。

第3步、检测奇点

对于每幅标量场图，逐个判断每个像素，如果一个像素在以自身为中心的T×T邻域内具有最大值，则认为该像素为奇点，记所有A×M幅图像中检测到的全部奇点的数量为N，给每个奇点一个编号q，第q个奇点表示为P_q，q＝1,2,…,N。

第4步、对奇点提取特征

对于奇点P_q，利用G种不同的特征提取算子(包括：ORB，SIFT和HOG等)提取特征。可以根据工程问题的情况灵活设计算子的具体内容。但在逻辑层面上，该步骤中的算子包含作用域和编码规则两个部分。其中作用域是以奇点P_q为参照的，大小为m_j×n_j的图像区域ⁱΩ_j，编码规则r_j是一个以作用域内像素为输入的向量值函数。根据所定义的符号J_i，利用第j个算子处理第i个奇点的过程可以写成如下函数形式：

ⁱR_j＝r_j(ⁱΩ_j)

其中ⁱR_j是一个D_j维的向量，j＝1,2,…,G。如果在图像上，算子的作用域超出了图像边界，则认为该算子无效，将输出向量规定为D_j维0向量。

第5步、统计向量个数

在下标j＝1的所有向量中随机选取一个非零向量ⁱR₁，如果与该向量欧式距离小于给定阈值T_j的非零向量个数小于阈值T_E，则认为无效，重新随机选取非零向量。否则，计算包括向量ⁱR₁本身在内所有欧式距离小于给定阈值T_j向量的均值向量

第6步、计算均值向量

计算所有与ⁱR₁欧式距离小于给定阈值T_j的非零向量的均值向量，并用新的均值向量更新

不断重复该过程，直到更新前后/>

的值不再改变为止。

第7步、有效字符挖掘

确定半径d₁，使得在以

为球心，d₁为半径的D_j球体中，指标|C²/d₁ ^Dj|取得最大值，C为球体内非零向量的个数。如果球体内非零向量的个数超过阈值T_s，认为挖掘出第一个有效字符w₁，按照如下格式记录该球体的球心、半径以及特征提取算子的句柄作为字符w₁的信息:/>

并将该字符保存于特征字典中。

第8步、记录字符w₁的球体内所有非零向量的左上标，对于j＝1,2,…,G，将所有相应左上标的向量置为零向量。

第9步、重复第5步至第8步，直到没有新的有效字符产生。

第10步、将j的值加1，重复第5步至第9步，直到没有新的有效字符产生。

第11步、重复第10步，直到j＝G，输出特征字符字典D，D＝[w₁...w_k...w_G]，1≦k≦G，

本发明的优点和有益效果：

本发明通过建立特征字典的形式将多个图像特征提取算子进行融合，打破了传统使用的单一图像特征提检测的方法，从而结合了每个算子的长处，大大提高了后续的图像识别工作效率与准确率。

附图说明

图1是本发明方法的算法模块图。

图2是本发明方法的整体流程图。

具体实施方式

实施例1：

一种动车组TEDS系统图像特征字典生成方法，该方法的输入是高铁检测图像数据集和给定字符数D＝10，输出是对应给定字符数D＝10的字典。所述方法流程参见图2，具体包括如下步骤：

Step1、对于包含输入的A＝100幅图像的数据集，设定比例系数K₁＝0.74，对其中图像^jI₁使用图像金字塔的方法构造M＝5幅图像构成的图像序列，其中图像序列中所有图像的长宽比与图像^jI₁相同，L_i+1/L_i＝K₁，i＝1,2,…,M-1＝4，其中L_i表示序列中第i幅图像^jI_i的长边长度。对数据集中j＝1,2,…100的所有图像进行上述操作，得到500幅图像。

Step2、构造标量值函数S(I,u,v)(具体方法是，将图像灰度化并提取灰度值存于标量场)，其中I为输入图像，(u,v)为图像坐标。对于上一步得到的所有500幅图像中的每一幅，遍历计算每个像素的函数值(也就是每个点的灰度值)。得到与输入图像尺寸相同的标量场。

Step3、对于每幅标量场图，逐个判断每个像素，如果一个像素在以其本身为中心的15×15(T＝15)邻域内具有最大值，则认为该像素为奇点。记所有500幅图像中检测到的全部奇点的数量为11129，给每个奇点一个编号q，第q个奇点表示为P_q，q＝1,2,…,11129。

Step4、对于奇点P_q，利用2种不同的特征提取算子提取特征，即HOG特征与ORB特征。在逻辑层面上，该步骤中的算子包含作用域和编码规则两个部分。其中HOG特征的作用域是以奇点P_q为参照的，大小为m_j×n_j的图像区域ⁱΩ_j，m_j＝32，n_j＝32。而ORB特征的作用域是奇点P_q圆圈范围中的16个像素。编码规则r_j是一个以作用域内像素为输入的向量值函数，r₁为HOG特征提取编码函数，r₂为ORB特征提取编码函数，根据所定义的符号J_i，利用第j个算子处理第q个奇点的过程可以写成如下函数形式：

ⁱR_j＝r_j(ⁱΩ_j)

其中ⁱR_j是一个D_j维的向量，j＝1,2，D₁＝36，D₂＝32。如果在图像上，算子的作用域超出了图像边界，则认为该算子无效，将输出向量规定为D_j＝0维向量。

Step5、在下标j＝1的所有向量中即所有由HOG特征编码的向量中，随机选取一个非零向量ⁱR₁，如果与该向量欧式距离小于给定阈值T_j＝644245348的非零向量个数小于阈值T_E＝100，则认为无效，重新随机选取非零向量。否则，计算包括向量ⁱR₁本身在内所有欧式距离小于给定阈值T_j向量的均值向量ⁱR₁。在下标j＝2的所有向量中即所有由ORB特征编码的向量中，随机选取一个非零向量ⁱR₁，如果与该向量汉明距离小于给定阈值T_j＝544的非零向量个数小于阈值T_E＝110，则认为无效，重新随机选取非零向量。否则，计算包括向量ⁱR₁本身在内所有欧式距离小于给定阈值T_j向量的均值向量

Step6、计算所有与

欧式距离/汉明距离小于给定阈值T_j的非零向量的均值向量，并用新的均值向量更新/>

不断重复该过程，直到更新前后/>

的值三次不再改变为止。

Step7、确定半径d₁，使得在以

为球心，d₁为半径的D_j球体中，指标|C²/d₁ ^Dj|取得最大值,C为球体内非零向量的个数，HOG特征：C＝100，d₁＝644245348；ORB特征：C＝100，d₁＝544。如果球体内非零向量的个数超过阈值T_s＝100，认为挖掘出第一个有效字符w₁＝’A’，按照如下格式记录该球体的球心、半径以及特征提取算子的句柄作为字符w₁的信息：

并将该字符保存于特征字典中。

Step8、记录w₁的球体内所有非零向量的左上标，对于j＝1,2，将所有相应左上标的向量置为零向量。

Step9、重复step5至step8，直到没有新的有效字符产生。

Step10、将j的值加1，重复step5至step9，直到没有新的有效字符产生。

Step11、重复step10，直到j＝2。输出特征字符字典D，D＝[w₁...w_k...w₁₀]，1≦k≦10，

详见下表。

Claims

1.一种动车组TEDS系统图像特征字典生成方法，该方法的输入是高铁检测图像数据集和给定字符数D，输出是对应给定字符数D的字典，所述方法包括：

第1步、构建图像序列

对于输入的包含A幅图像的数据集，设定比例系数K₁<1，利用数据集中图像^jI₁构造由M幅图像构成的图像序列，图像序列中所有图像的长宽比与图像^jI₁相同，L_i+1/L_i＝K₁，i＝1,2,…,M-1，其中L_i表示序列中第i幅图像^jI_i的长边长度，对数据集中j＝1,2,…A的所有图像进行上述操作，得到A×M幅图像；

第2步、构造标量值函数

构造标量值函数S(I,u,v)，其中I为输入图像，(u,v)为图像坐标；函数的主要功能是构建一个与输入图像尺寸相同的标量场，提取输入图像中各个坐标点的灰度值并存于标量场中；对于第1步得到的所有A×M幅图像中的每一幅图像，遍历计算每个像素的函数值，得到与输入图像尺寸相同的标量场；

第3步、检测奇点

对于每幅标量场图，逐个判断每个像素，如果一个像素在以本身为中心的T×T邻域内具有最大值，则认为该像素为奇点，记所有A×M幅图像中检测到的全部奇点的数量为N，给每个奇点一个编号q，第q个奇点表示为P_q，q＝1,2,…,N；

第4步、对奇点提取特征

对于奇点P_q，利用G种不同的特征提取算子提取特征；特征提取算子根据工程问题的情况灵活设计，但在逻辑层面上，该步骤中的算子包含作用域和编码规则两个部分；其中作用域是以奇点P_q为参照的，大小为m_k×n_k的图像区域Ω_kq，编码规则r_k是一个以作用域内像素为输入的向量值函数，k＝1,2,…,G；利用第k个特征提取算子处理第q个奇点的过程写成如下函数形式：

R_kq＝r_k(Ω_kq))

其中R_kq是一个D_k维的向量；如果在图像上，算子的作用域超出了图像边界，则认为该算子无效，将输出向量规定为D_k维0向量；

第5步、统计向量个数

在下标k＝1的所有向量中随机选取一个非零向量R_1q，如果与该向量欧式距离小于给定阈值T_k的非零向量个数小于阈值T_E，则认为该向量无效，重新随机选取非零向量；否则，计算包括向量R_1q本身在内所有欧式距离小于给定阈值T_k向量的均值向量