CN111985479B - 一种用于列车综合线路图的智能识别系统 - Google Patents
一种用于列车综合线路图的智能识别系统 Download PDFInfo
- Publication number
- CN111985479B CN111985479B CN202010557825.9A CN202010557825A CN111985479B CN 111985479 B CN111985479 B CN 111985479B CN 202010557825 A CN202010557825 A CN 202010557825A CN 111985479 B CN111985479 B CN 111985479B
- Authority
- CN
- China
- Prior art keywords
- module
- line path
- character
- train
- electronic image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Character Input (AREA)
Abstract
本发明属于轨交设备的技术领域,公开了一种用于列车综合线路图的智能识别系统,包括用于对纸质版线路图进行电子录入的录入模块;用于对线路图的电子图像进行预处理的预处理模块;用于采用分割匹配法对字符进行识别,开窗投影法对元器件进行识别,区域跟踪法对线路径进行识别,完成初步识别的初步识别模块;用于以初步识别的输出结果作为输入,利用BP遗传神经网络模型进行优化处理,完成最终识别的最终识别模块;用于对电子图像中的各个字符、元器件和线路径进行流水线式显示的动态显示模块;与列车电气诊断系统相连的故障诊断及检修模块,用于将电子图像中的各个字符、元器件和线路径进行3D模型展示,并根据诊断和检修结果进行区别显示。
Description
技术领域
本发明涉及轨交设备的技术领域,尤其涉及一种用于列车综合线路图的智能识别系统。
背景技术
随着国家的快速发展,城市化建设的加快使得城乡差距近一步缩小,轨道交通逐渐成为人们出行的首要选择,列车作为轨道交通运输的设施,其运行的安全性和可靠性关乎到整个轨道交通系统。电气系统是列车的重要组成部分,其结构十分复杂,与机械系统结构不同,电气系统的检修难度很大,现有的列车电气系统检修技术完全依赖于纸质版列车综合线路图。目前纸质版列车综合线路图的静态识别技术存在一定的困难,其中包括在进行识别时容易受到工作环境、设备等客观因素和人的判断决定等主观因素的影响从而很难展开,降低了检修效率,列车综合线路图的识别工作在列车故障诊断、运行检修等实际的项目工程中都起到了至关重要的作用。
针对上述困难和问题,国内已经有公司开发出来了城市轨道交通电气仿真系统软件,这种软件可以将静态的电路图进行仿真,当列车运行出现故障时会有提示。电气仿真系统软件最重要的一个环节是对城市轨道车辆综合线路图进行数据采集并进行识别,当前数据采集工作的进行还是以人工采集为主,对列车综合线路图中的元素提取的工作量很大,存在着耗时长、效率低、容易受外界因素影响等弊端。因此,针对上述问题,拥有一套现代化、科学化的城市轨道车辆综合线路图智能识别系统,是城市轨道交通系统有效开展电气仿真的基础。
发明内容
本发明提供了一种用于列车综合线路图的智能识别系统,解决了现有列车电气仿真系统对线路图的零件元素提取的工作量很大,存在着耗时长、效率低、容易受外界因素影响等问题。
本发明可通过以下技术方案实现:
一种用于列车综合线路图的智能识别系统,包括录入模块、预处理模块、初步识别模块、最终识别模块、动态显示模块和故障诊断及检修模块,
所述录入模块用于对纸质版线路图进行电子录入;所述预处理模块用于对线路图的电子图像进行预处理;所述初步识别模块用于分别采用分割匹配法对字符进行识别,开窗投影法对元器件进行识别,区域跟踪法对线路径进行识别,完成对预处理后电子图像的初步识别;所述最终识别模块用于以初步识别的输出结果作为输入,利用BP遗传神经网络模型进行优化处理,完成对预处理后电子图像的最终识别;所述动态显示模块用于对最终识别后电子图像中的各个字符、元器件和线路径进行流水线式显示;所述故障诊断及检修模块与列车电气诊断系统相连,用于将电子图像中的各个字符、元器件和线路径进行3D模型展示,并根据诊断和检修结果进行区别显示。
进一步,所述初步识别模块包括字符识别模块、元器件识别模块和线路径识别模块,
所述字符识别模块用于先进行行切分再进行字切分,将待识别字符从预处理后的电子图像中分离出来,计算待识别字符对应的多维特征向量及位置坐标,将所述多维特征向量与字符特征库中各个字符对应的多维特征向量做类比,完成对待识别字符的初步识别;
所述元器件识别模块用于对待识别元器件人工进行开窗操作,再进行细化处理,通过边缘扫描确定待识别元器件的方向和位置坐标,然后根据待识别元器件的方向进行对应方向的投影并提取投影特征,将所述投影特征与元器件特征库中多个元器件对应的投影特征做类比,完成对待识别元器件的初步识别;
所述线路径识别模块用于除去初步识别出的所有字符和元器件,计算电子图像对应的平均线宽,再对整个电子图像进行细化处理,然后利用3*3模板从左到右、从右到左、从上到下、从下到上对整个电子图像进行跟踪扫描,判断所述3*3模板是否为线路径的起点,再根据扫描结果结合所述平均线宽,确定线路径的终点,记录其对应的起点和终点的位置坐标,完成对各个线路径的初步识别。
进一步,所述字符识别模块还用于建立包括可能出现在列车综合线路图上的所有类型字符的字符特征库,各个所述字符均设置有对应的64维特征向量,所述64维特征向量设置将对应字符的灰度图像的长宽值扩大八倍后再进行二值化处理,然后进行均匀划分形成64个方格,计算每个方格内黑色像素总值与对应方格面积的比值,从而形成64维特征向量;计算分离出来的待识别字符对应的64维特征向量及位置坐标,将所述64维特征向量与字符特征库中的每个字符对应的64维特征向量做类比,完成对待识别字符的初步识别;
所述线路径识别模块还用于记所述3*3模板的具体位置布置如下表所示,其中,中心点为N,其八个领域点按顺时针排列分别为E1、E2、E3、E4、E5、E6、E7、E8,若sum=E1+E2…+E8=255*7,则此时的中心点N即为某条线路径的起点并记录其位置坐标,利用3*3模板从左到右进行跟踪扫描,直至E1=E2=E3=255,则此时的中心点即为所述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则所述起点和终点之间对应一条线路径;或者利用3*3模板从右到左进行跟踪扫描,直至E5=E6=E7=255,则此时的中心点即为所述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则所述起点和终点之间对应一条线路径;利用3*3模板从上到下进行跟踪扫描,直至E3=E4=E5=255,则此时的中心点即为所述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则所述起点和终点之间对应一条线路径;利用3*3模板从下到上进行跟踪扫描,直至E7=E8=E1=255,则此时的中心点即为所述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则所述起点和终点之间对应一条线路径。
E7 | E8 | E1 |
E6 | N | E2 |
E5 | E4 | E3 |
进一步,采用线性插值法对所述灰度图像的长宽值进行扩大处理。
进一步,所述最终识别模块用于统计可能出现在列车综合线路图上的字符、元器件和线路径类型个数,对应为64、108和14,分别采用六位、七位和四位二进制编码进行逐一对应编码,从而确定遗传算法的参数集合及参数编码处理;
设置变量l和E分别为学习样本的个数和学习误差值,对于第m个染色体有:
hmn代表第m个染色体对第n个学习样本的理想学习输出,则其误差极限为:
设立δ1、δ2、δ3为不同情况下的误差极限参数,且δ1<<δ2<<δ3。对任一训练样本,当g(R)≥δ3时,选用遗传算法中的多个算子来计算权值的收敛解;当δ2≤g(R)<δ3时,采用小范围的遗传编译算法计算权值的收敛解;当δ1≤g(R)<δ2时,采用神经网络计算权值的收敛解;当g(R)<δ1时,除阈值外,所有权值均不小于零,此时即为权值的收敛解。
进一步,所述预处理模块用于对电子图像分区域进行二值化操作,对应区域的阈值通过K-均值分类算法计算获得,然后利用两组3*3模板分别对二值化后的电子图像进行去噪和平滑滤波,每组3*3模板均包括四个3*3模板,第一组3*3模板中的每个模板均设置有成T字状的黑色像素点群,所述T字状的黑色像素点群在第一组的四个3*3模板上成彼此相隔顺时针旋转90度设置,第二组3*3模板中的每个模板均设置有成T字状的白色像素点群,所述T字状的白色像素点群在第二组的四个3*3模板上成彼此相隔顺时针旋转90度设置。
进一步,所述故障诊断和及检修模块用于将电子图像中的各个字符、元器件和线路径由2D模型转换为3D模型,根据列车电气诊断系统的诊断和检修结果,将正常导通的元器件及线路径以绿色进行显示,而处于故障的元器件及线路径以红色进行显示。
本发明有益的技术效果在于:
首先,运用数字图像处理理论,包括二值化算法、模板降噪和平滑滤波技术以及图片细化算法对图像进行预处理,然后对列车综合线路图图片采用混合识别的方法,先对图片上的字符进行分割识别、元器件进行人工开窗识别和线路径进行八邻域识别,模板匹配法将识别的准确率由人工识别的70%左右提高到了78%,解决了纸质版线路图破损等实际问题。
然后对遗传算法和BP神经网络进行改进结合后建立识别模型,将模板匹配识别的结果作为识别模型的输入层信息,利用设计的分类器按照特质将其与建立的字符、元器件和线路径样本训练集进行智能识别,识别过程中将各元素用二进制编码数来表示,并将识别结果储存到数据库中,智能识别的准确率可高达85%以上,解决了列车综合线路图识别准确率不高的实际问题。
最后,选用基于JavaScript、HTML5+CSS3等语言,SQL Sever数据库等软件对列车综合电路信息智能识别系统进行了设计与开发,在对地铁公司维修人员进行列车电气系统故障诊断时提供了有效的帮助,并且在地铁公司进行相关电气仿真和学习培训等方面提供了支持,解决了地铁公司实际的项目工程问题。
附图说明
图1为本发明的总体结构示意图;
图2为本发明的用户登录的界面示意图;
图3为本发明的线路图查询模块的界面示意图;
图4为本发明的电子版线路图的预处理前后的对比示意图;
图5为本发明的电子版线路图的二值化处理后的示意图;
图6为本发明的待识别字符的特征提取过程示意图;
图7为本发明电子版线路图中各个元素的流水线式显示示意图;
图8为本发明的故障诊断及检修模块的界面显示示意图;
图9为本发明的去噪模板示意图;
图10为本发明中对待识别电路图进行平滑滤波时,用于清除毛刺的一组模板示意图;
图11为本发明中对待识别电路图进行平滑滤波时,用于填补凹坑的一组模板示意图;
具体实施方式
下面结合附图及较佳实施例详细说明本发明的具体实施方式。
如图1所示,本发明提供了一种用于列车综合线路图的智能识别系统,包括录入模块、预处理模块、初步识别模块、最终识别模块、动态显示模块和故障诊断及检修模块,该录入模块用于对纸质版线路图进行电子录入;该预处理模块用于对线路图的电子图像进行预处理;该初步识别模块用于分别采用分割匹配法对字符进行识别,开窗投影法对元器件进行识别,区域跟踪法对线路径进行识别,完成对预处理后电子图像的初步识别;该最终识别模块用于以初步识别的输出结果作为输入,利用BP遗传神经网络模型进行优化处理,完成对预处理后电子图像的最终识别;该动态显示模块用于对最终识别后电子图像中的各个字符、元器件和线路径进行流水线式显示;该故障诊断与检修模块与列车电气诊断与检修系统相连,用于将电子图像中的各个字符、元器件和线路径进行3D模型展示,并根据诊断和检修结果进行区别显示。还包括注册模块和线路图查询模块,该注册模块用于采集使用者的个人信息进行系统登录注册,该线路图查询模块用于对电子版线路图的查询选择和缩放操作。
该智能识别系统选择了Bootstrap开源开发框架作为系统的前端,在后端使用Navicat对数据库进行可视化管理,可以与扫描仪和打印机进行连接,并设置了防火墙来提高安全性,系统具备很强的兼容性,可以对操作系统进行更新,并支持跨平台操作,包括Windows系统、PC端、Ipad平台和手机端口多种平台,以保证不同用户随时操作本系统。
该注册模块用于系统用户的个人信息采集和身份验证,登录账号具有唯一性,如图2所示,一般为工作人员的员工卡卡号,每一个账号都拥有其独特的权限设置,分为1级和2级,只有1级的用户才可以进入到系统后台管理模块。系统在用户登录时将进行验证,任何一项验证不通过,系统都会有相应的提示,若用户忘记密码导致多次登陆错误,则账户锁定,只能联系管理员进行解锁。
该线路图查询模块主要是为地铁公司工作人员提供列车综合线路图查询功能,也是通过录入模块将纸质版综合线路图上传到系统后所保存的模块,如图3所示,点开后为线路图展示,可采用白底蓝线的设计,完全复原如庞巴迪车型列车综合线路图样式,右上角为列车电气子系统选择按钮,下拉共有15个系统,可以选择想要查看的电气综合线路图,实现列车综合线路图中各元素的交互操作,下方的两个按钮为放大缩小控制按钮,可对线路图进行无限的放大与缩小操作,不同缩放比例下所展现的内容不一样,以达到查看不同内容的效果。
国内地铁公司的综合线路图一般分为两种:纸质版和PDF版。纸质版综合线路图存在易破损、易污染等问题,纸质版综合线路图图片一般是人工拍摄,受限于拍摄设备与技术,上传的图片可能存在模糊和倾斜等情况,而PDF版综合线路图受限于电脑屏幕,需要对图片进行放大和缩小,容易导致图片失真。所以,纸质版和PDF版电路图均不利于工作人员的直接识别。
预处理模块主要对待识别线路图的电子图像进行二值化处理、模板降噪和平滑滤波处理,经过预处理后,就可以得到一张清晰的、便于识别的电子版线路图,其处理后的结果如图4所示,主要采用局部阈值法对电子版的线路图进行二值化处理,其最大的优势就是可以大幅度的将数据量进行缩减,并且将处理分析的过程简化,再通过建立模板的方法来搜索二值化处理后电子图片中的像素点来对噪音和毛刺进行消除,具体如下:
上传的列车综合信息线路图图片中最重要的三种元素是字符、元器件与导线,由于这三种元素的灰度值是极其相似的,这样就会和背景产生较大的对比度,便于进行二值化处理,而全局阈值法由于使用统一阈值,会产生灰度分布不均的现象,所以对于电子版的线路图更适合使用局部阈值方法,即对图片采用局部开窗方式,对不同的区域使用不同的阈值,可通过K-均值分类算法计算获得对于区域的阈值,完成二值化操作,具体结果如图5所示,从图中不难发现,二值化处理后的图片中无论是字符还是元器件均存在毛刺,这样就会对下一步的识别工作产生影响,如将图5中第一组中的数字0识别成大写字母O,因此需要对此时的图片进行降噪和平滑滤波操作。
本发明采用了如图9所示的去噪模板,并且将去噪模板中的阴影部分的像素值全部设为零。利用该去噪模板在待识别图像上进行扫描,如果扫描到了连续的黑色像素点,就可确定此区域存在噪音,消除噪音的方法就是对该像素点的八邻域边界和去噪模板边界进行数学上的异或运算。如果计算出的结果为0,则证明模板去噪完成,此时图像中的黑色像素均变为白色像素。
而应用模板的平滑滤波时,需采用8个3×3模板,将4个模板划为1组,分为两组,第一组的作用是清除毛刺,如图10所示,每个模板均设置有T字状的黑色像素点群,在四个模板上成彼此相隔顺时针旋转90度设置,第二组的作用是填补凹坑,如图11所示,每个模板均设置有T字状的白色像素点群,在四个模板上成彼此相隔顺时针旋转90度设置,从图中也可以发现,如果选取八个模板中的任何一个模板,将其进行旋转或者变换,均可以变成其余模板中的一个。
首先确定前景色和背景色,设白色为背景色并赋值为1,将黑色设为前景色并赋值为0,然后对图像进行平滑滤波时,需要找到一个矩阵g,该矩阵包含九个元素,分别是匹配到的平滑点像素和其八邻域像素,如果计算出的矩阵值为0,就使用第一组模板来清除毛刺,如果矩阵值为1,就用第二组模板来填补凹坑。全部像素点被扫描完成后,此时第一组模板中的数值要从0变为1,第二组模板中的数值从1变为0,若数值不为0,则记录这一像素值。经过去噪平滑滤波后,此时图像中没有单像素的毛刺和裂缝的存在,相比之下是光滑的。
该初步识别模块用于分别采用分割匹配法对字符进行识别,开窗投影法对元器件进行识别,区域跟踪法对线路径进行识别,完成对预处理后电子图像的初步识别,包括字符识别模块、元器件识别模块和线路径识别模块。
该字符识别模块用于先进行行切分再进行字切分,将待识别字符从预处理后的电子图像中分离出来,计算待识别字符对应的多维特征向量及位置坐标,将所述多维特征向量与字符特征库中各个字符对应的多维特征向量做类比,完成对待识别字符的初步识别;具体如下:
字符分割处理后得到一个块状整体,该整体由两部分空白元素组成,第一部分是横向的字符空白,第二部分是纵向的行间空白,字符元素分割操作就是需要将待识别的字符从这个整体中进行分离,这样可以提高字符识别的准确率,通常分为两种,即行切分和字切分,完成字切分后,获取对应的位置坐标。
根据纸质版综合线路图上绘制字符的特征和字符所存在的某种规律,本发明采用了模板匹配的识别方法,即设置一个标准的图像模板,并将此模板与待识别图像进行匹配,看两者是否匹配或相似,而使用这种方法时一定要找到一个数值作为特征向量,这个数值的存在直接影响着识别字符操作的准确率。本发明中提取的特征向量模板是8×8的模板,字符图像完成二值化后,将其划分为8×8的网格,并计算所有小格内的黑色象素所占比例,依此得到特征向量,任何字符均可以得到一个64维的特征向量,从而进行识别。
为使综合线路图上的字符可以根据图片的大小进行平均划分,本发明采用一种新的平均划分方法,具体过程如图6所示,首先需要利用已分割的二值化字符,获取该字符在原灰度图的位置和长宽灰度的数据;然后对其进行灰度放大,灰度放大的方法为线性插值法。举个例子,存在一个待识别的字符图像是矩阵块,设其宽为24,高为30,将其长宽值均扩大为8倍后再进行二值化操作,对处理后的图像再进行平均分割并计算比率,此时区域内有64个方格,每一个方格内都存在黑色像素,将每个方格内的所有黑色像素值和该方格面积做比值计算,计算后的值就是该图像的64维特征向量。按照上述方法对可能出现在列车综合信息线路图上的所有字符进行提取特征向量,要建立一个字符特征库,作为样本库,待识别字符对应的64维特征向量可以与样本库中的各个字符进行类比,从而完成待识别字符的初步识别。这种改进后的操作利用了区域中的网格,特征向量在提取时可以最大程度的减少特征量,同时不用考虑字符大小,可以对其像素进行累加,增加了识别效率和准确率。
该元器件识别模块用于对待识别元器件人工进行开窗操作,再进行细化处理,通过边缘扫描确定待识别元器件的方向和位置坐标,然后根据待识别元器件的方向进行对应方向的投影并提取投影特征,将该投影特征与元器件特征库中多个元器件对应的投影特征做类比,完成对待识别元器件的初步识别。
以识别电阻为例,自动识别的信息包括识别电阻的上下左右方向,该电阻的端点坐标值和该电阻的类型。判断该电阻走向的方法是对细化图像进行边缘扫描,若该电阻的左右边缘出现了黑色色素,则该电阻是水平方向,若黑色色素出现在上下边界,则该电阻为竖直方向。在进行扫描时,对于出现黑色色素的区域,要进行坐标记录,结合一开始的起点开窗坐标值来确定该元器件的位置坐标,且该坐标值以元器件的左下方数值为准。
电阻的类型判断是自动识别的难点,可以将电阻投影作为依据进行判断。首先根据已有的电阻信息,如果该电阻是横向就作水平投影,否则作竖直投影,然后将投影后的长度数值和该区域内的黑色像素数值做比值计算,从而确定电阻类型。根据普通电阻和可变电阻的投影及比值计算结果,比值超过3/4时,较大概率为可变电阻,因此可将3/4作为一个固定的阈值,用于判断电阻的类型。
该线路径识别模块用于除去初步识别出的所有字符和元器件,计算电子图像对应的平均线宽,再对整个电子图像进行细化处理,然后利用3*3模板从左到右、从右到左、从上到下、从下到上对整个电子图像进行跟踪扫描,判断所述3*3模板是否为线路径的起点,再根据扫描结果结合所述平均线宽,确定线路径的终点,记录其对应的起点和终点的位置坐标,完成对各个线路径的初步识别,具体如下:
记3*3模板的具体位置布置如下表所示,其中,中心点为N,其八个领域点按顺时针排列分别为E1、E2、E3、E4、E5、E6、E7、E8,若sum=E1+E2…+E8=255*7,则此时的中心点N即为某条线路径的起点并记录其位置坐标,利用3*3模板从左到右进行跟踪扫描,直至E1=E2=E3=255,则此时的中心点即为上述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则起点和终点之间对应一条线路径;或者利用3*3模板从右到左进行跟踪扫描,直至E5=E6=E7=255,则此时的中心点即为所述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则起点和终点之间对应一条线路径;利用3*3模板从上到下进行跟踪扫描,直至E3=E4=E5=255,则此时的中心点即为上述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则起点和终点之间对应一条线路径;利用3*3模板从下到上进行跟踪扫描,直至E7=E8=E1=255,则此时的中心点即为上述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则起点和终点之间对应一条线路径。
E7 | E8 | E1 |
E6 | N | E2 |
E5 | E4 | E3 |
因此,只有从上述四个方向识别才能保证待识别的所有线路径都被扫描到,如上步骤的扫描识别方法不仅可以识别图片上的竖直、倾斜和水平上的线段,而且将识别完成后的线路径用相应的坐标表示出来,同时全面展示了线路径和元器件是否处于连接状态。
列车综合线路图中的元素类型适合使用遗传算法来进行多方向搜索,而神经网络算法通过训练学习可提高识别准确率,因此本发明利用遗传神经网络对初步识别结果进行优化处理,首先对遗传算法和BP神经网络进行改进并相结合后建立了模型,并将初步识别结果作为模型的输入层,然后建立了字符库、元器件库和线路径库,利用二进制编码数对输入信息进行匹配并智能识别,最后设计了实验对结果进行了抽取和对比分析。
该最终识别模块用于统计可能出现在列车综合线路图上的字符、元器件和线路径类型个数,对应为64、108和14,分别采用六位、七位和四位二进制编码进行逐一对应编码,如表1、2、3所示,从而确定遗传算法的参数集合及参数编码处理。
表1字符与二进制数值关系表
表2元器件与二进制数值关系表
表3输出线路径与二进制数值关系表
如表3所示,可得列车综合线路图中共14种线路类型。按照规律在样本库中完成排序后,第一种线路类型用编码0001所示,最后一种线路类型的编码为1110,即0×20+1×21+1×22+1×23=14,从而完成每种线路类型与二进制编码的一一匹配。同理可得字符库和元器件库中各元素的二进制编码数,如大写字母A为0011011,即1×20+1×21+0×22+1×23+1×24+0×25+0×26=27;元器件跳转符为1101100,即0×20+0×21+1×22+1×23+0×24+1×25+1×26=108,即跳转符为最后一种元器件。
字符向量的特征值为64,输入结点为符号/,输出结果为A~Z的大小写字母、0~9的阿拉伯数字、斜线和小数点,用六位二进制数表示;元器件向量特征值为108,输入结点为跳转符,输出结果为各种不同类型的元器件,用七位二进制数表示;线段向量特征值为14,输入结点为T型线,输出结果为统计好的线段模型,用四位二进制数表示,其中L为统一的染色体组数,则遗传神经网络训练算法为:
(1)计算淘汰样本,将剩余的样本作为学习样本记为O,并设定算法供给所需要的各层结点数量。
(2)随机生成H组权值和阈值,规定前者值为正,后者值不作要求,进行数编码并存放于A0,使L=H,X=Y=0。
(3)若L<H/2,转到(4)。否则计算A0中的L组染色体的适应值并进行复制,对其采取杂交和高位变异计算得到误差F1,若F1<δ1则进入(4);若δ1<F1<δ2,取L=L-1,X=X+1后转回(3);若δ2<F1<δ3,取L=L-1,Y=Y+1后转回(3)。
(4)进入BP算法,此时判断X是否为0,如果是转入(5),否则在L1中选取X=X-1的字符串做译码计算,选择全部为负数的字符串作为最优初始化权值。
(5)进入训练,如果失败则将染色体串增长后转回(1),如果成功则通过译码计算出连接权值并结束训练。
为保证最终的识别准确率,本发明对算法中的误差模型进行了改进。设置变量l和E分别为学习样本的个数和学习误差值,对于第m个染色体有:
hmn代表第m个染色体对第n个学习样本的理想学习输出,则其误差极限为:
设立δ1、δ2、δ3为不同情况下的误差极限参数,且δ1<<δ2<<δ3。对任一训练样本,当g(R)≥δ3时,选用遗传算法中的多个算子来计算权值的收敛解;当δ2≤g(R)<δ3时,采用小范围的遗传编译算法计算权值的收敛解;当δ1≤g(R)<δ2时,采用神经网络计算权值的收敛解;当g(R)<δ1时,除阈值外,所有权值均不小于零,此时即为权值的收敛解。
优化后的算法流程如下所示:
(1)确定参数,设立自编码字符串长度、种群大小F、交叉变异概率N等初始参数的变量数值。
(2)生成实数初始编码种群。
(4)计算下一代产生的新个体并插入种群中。
(5)若寻找到满意个体则结束运算,否则依照预设标准反复循环(3)和(4)。
将初步识别后的列车综合线路图中各个元素的识别结果作为输入信息,利用BP遗传神经网络模块进行优化处理,并在优化处理结果和初步识别结果中对不同集合中的不同元素进行随机抽样统计,单一元素的抽样识别结果如表4所示。
表4抽样识别结果
由表1可知,所有测试样本的平均准确率为87.40%。线路径由于总体的数量类型较少,所以识别准确率都很高,均在90%以上。而在字符识别中,标点符号由于特征明显,识别率达到了98%,数字由于总体数量远远小于字母的数量,因此识别准确率较高,而字母的识别准确率比较平均,相差不大,并没有受限于大小写的问题。
对于元器件识别,可以看到由于电阻是由长方形和线段组成的,其结构简单,所以电阻识别率达到了84%,而复杂元器件的识别率仅仅为76%,是抽样中唯一识别准确率低于80%的,并且远远低于平均准确率。
动态显示模块对识别完成后的字符、元器件和线路径将会以流水线的形式重新将列车综合线路图展示出来,如图7所示,以达到静态电路图动态化的目的。
识别完成后的列车综合线路图上的各个字符、元器件和线路径等元素信息以坐标的形式存储在数据库中,系统通过唯一值ID锁定指定的坐标信息,即(x,y)信息,再通过SQL语句从数据库获取出来,动态化电路图可以看到重组后的电路图不仅显示了电流的走向,而且电气元器件之间的逻辑关系和控制过程也更明确,这些信息都在纸质版静态电路图上无法体现。
随着虚拟现实技术的快速发展,电气仿真对于电气系统的故障诊断和检修有着极大的需求,而模型搭建是电气仿真的基础,而故障诊断和检修模块与列车电气故障诊断和检修系统相连,用于将上述输出的动态电路图进行3D建模,完成图像从二维到三维的转化,从而可以更直观的了解到电气系统的实物形状。图8为列车综合线路图的模型搭建,在实际的列车电气故障诊断和检修系统中,其中,圆柱体为LBDR电阻,该电阻电流经过为绿色,证明线路正常,而元器件电阻变红表明发生故障,为故障元器件。
本发明的系统对列车综合线路图中的字符、元器件和线路径等元素进行智能识别,在缩短识别时间的同时提高了识别的准确率,并开发了智能识别系统软件,进行这些工作的主要原因是将其应用在实际的工程中。
首先,可应用在实际的列车电气系统发生故障时,可以使软件以流水的形式直观显示列车电气控制的逻辑过程,在控制逻辑过程显示完毕后,同样以图形化的形式显示列车终端动作以实现结果,从而快速的进行故障诊断并指导进行检修的工作;其次,随着电子化、智能化的发展,很多地铁工作人员都需要接触新兴的技术,很多进公司的新员工也需要快速掌握工作要领,因此可以用本软件对其进行学习培训。本发明的系统在培训中的主要优点有:(1)电路图读图识图,适用于新人培训;(2)在岗人员通过排故测试巩固提升能力;(3)故障库与电路图结合,在实际工作中辅助处理问题、帮助排除故障;(4)通过2D图片或3D建模指导,快速定位故障线路或故障元器件的位置。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,因此,本发明的保护范围由所附权利要求书限定。
Claims (7)
1.一种用于列车综合线路图的智能识别系统,其特征在于:包括录入模块、预处理模块、初步识别模块、最终识别模块、动态显示模块和故障诊断及检修模块,
所述录入模块用于对纸质版线路图进行电子录入;所述预处理模块用于对线路图的电子图像进行预处理;所述初步识别模块用于分别采用分割匹配法对字符进行识别,开窗投影法对元器件进行识别,区域跟踪法对线路径进行识别,完成对预处理后电子图像的初步识别;所述最终识别模块用于以初步识别的输出结果作为输入,利用BP遗传神经网络模型进行优化处理,完成对预处理后电子图像的最终识别;所述动态显示模块用于对最终识别后电子图像中的各个字符、元器件和线路径进行流水线式显示;所述故障诊断及检修模块与列车电气诊断系统相连,用于将电子图像中的各个字符、元器件和线路径进行3D模型展示,并根据诊断和检修结果进行区别显示;
所述元器件识别模块用于对待识别元器件人工进行开窗操作,再进行细化处理,通过边缘扫描确定待识别元器件的方向和位置坐标,然后根据待识别元器件的方向进行对应方向的投影并提取投影特征,将所述投影特征与元器件特征库中多个元器件对应的投影特征做类比,完成对待识别元器件的初步识别。
2.根据权利要求1所述的用于列车综合线路图的智能识别系统,其特征在于:所述初步识别模块包括字符识别模块、元器件识别模块和线路径识别模块,
所述字符识别模块用于先进行行切分再进行字切分,将待识别字符从预处理后的电子图像中分离出来,计算待识别字符对应的多维特征向量及位置坐标,将所述多维特征向量与字符特征库中各个字符对应的多维特征向量做类比,完成对待识别字符的初步识别;
所述线路径识别模块用于除去初步识别出的所有字符和元器件,计算电子图像对应的平均线宽,再对整个电子图像进行细化处理,然后利用3*3模板从左到右、从右到左、从上到下、从下到上对整个电子图像进行跟踪扫描,判断所述3*3模板是否为线路径的起点,再根据扫描结果结合所述平均线宽,确定线路径的终点,记录其对应的起点和终点的位置坐标,完成对各个线路径的初步识别。
3.根据权利要求2所述的用于列车综合线路图的智能识别系统,其特征在于:所述字符识别模块还用于建立包括可能出现在列车综合线路图上的所有类型字符的字符特征库,各个所述字符均设置有对应的64维特征向量,所述64维特征向量设置将对应字符的灰度图像的长宽值扩大八倍后再进行二值化处理,然后进行均匀划分形成64个方格,计算每个方格内黑色像素总值与对应方格面积的比值,从而形成64维特征向量;计算分离出来的待识别字符对应的64维特征向量及位置坐标,将所述64维特征向量与字符特征库中的每个字符对应的64维特征向量做类比,完成对待识别字符的初步识别;
所述线路径识别模块还用于记所述3*3模板的具体位置布置如下表 所示,其中,中心点为N,其八个领域点按顺时针排列分别为F1、E2、E3、E4、E5、E6、E7、E8,若sum=E1+E2…+E8=255*7,则此时的中心点N即为某条线路径的起点并记录其位置坐标,利用3*3模板从左到右进行跟踪扫描,直至E1=E2=E3=255,则此时的中心点即为所述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则所述起点和终点之间对应一条线路径;或者利用3*3模板从右到左进行跟踪扫描,直至E5=E6=E7=255,则此时的中心点即为所述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则所述起点和终点之间对应一条线路径;利用3*3模板从上到下进行跟踪扫描,直至E3=E4=E5=255,则此时的中心点即为所述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则所述起点和终点之间对应一条线路径;利用3*3模板从下到上进行跟踪扫描,直至E7=E8=E1=255,则此时的中心点即为所述某条线路径的终点并记录其位置坐标,若发现连续黑色像素点且其个数大于平均线宽的三倍,则所述起点和终点之间对应一条线路径
。
4.根据权利要求3所述的用于列车综合线路图的智能识别系统,其特征在于:采用线性插值法对所述灰度图像的长宽值进行扩大处理。
5.根据权利要求1所述的用于列车综合线路图的智能识别系统,其特征在于:所述最终识别模块用于统计可能出现在列车综合线路图上的字符、元器件和线路径类型个数,对应为64、108和14,分别采用六位、七位和四位二进制编码进行逐一对应编码,从而确定遗传算法的参数集合及参数编码处理;
设置变量1和E分别为学习样本的个数和学习误差值,对于第m个染色体有:
hmn代表第m个染色体对第n个学习样本的理想学习输出,则其误差极限为:
设立δ1、δ2、δ3为不同情况下的误差极限参数,且δ1<<δ2<<δ3,对任一训练样本,当g(R)≥δ3时,选用遗传算法中的多个算子来计算权值的收敛解;当δ2≤g(R)<δ3时,采用小范围的遗传编译算法计算权值的收敛解;当δ1≤g(R)<δ2时,采用神经网络计算权值的收敛解;当g(R)<δ1时,除阈值外,所有权值均不小于零,此时即为权值的收敛解。
6.根据权利要求1所述的用于列车综合线路图的智能识别系统,其特征在于:所述预处理模块用于对电子图像分区域进行二值化操作,对应区域的阈值通过K-均值分类算法计算获得,然后利用两组3*3模板分别对二值化后的电子图像进行去噪和平滑滤波,每组3*3模板均包括四个3*3模板,第一组3*3模板中的每个模板均设置有成T字状的黑色像素点群,所述T字状的黑色像素点群在第一组的四个3*3模板上成彼此相隔顺时针旋转90度设置,第二组3*3模板中的每个模板均设置有成T字状的白色像素点群,所述T字状的白色像素点群在第二组的四个3*3模板上成彼此相隔顺时针旋转90度设置。
7.根据权利要求1所述的用于列车综合线路图的智能识别系统,其特征在于:所述故障诊断及检修模块用于将电子图像中的各个字符、元器件和线路径由2D模型转换为3D模型,根据列车电气诊断系统的诊断结果,将正常导通的元器件及线路径以绿色进行显示,而处于故障的元器件及线路径以红色进行显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010557825.9A CN111985479B (zh) | 2020-06-18 | 2020-06-18 | 一种用于列车综合线路图的智能识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010557825.9A CN111985479B (zh) | 2020-06-18 | 2020-06-18 | 一种用于列车综合线路图的智能识别系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111985479A CN111985479A (zh) | 2020-11-24 |
CN111985479B true CN111985479B (zh) | 2022-09-30 |
Family
ID=73442257
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010557825.9A Active CN111985479B (zh) | 2020-06-18 | 2020-06-18 | 一种用于列车综合线路图的智能识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111985479B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117420480A (zh) * | 2023-08-08 | 2024-01-19 | 南京航空航天大学 | 大容量线束网络的线路导通性测试方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127169A (zh) * | 2016-06-28 | 2016-11-16 | 广州地铁集团有限公司 | 列车运行信息分析系统及其方法 |
CN106156387A (zh) * | 2015-04-14 | 2016-11-23 | 上海申通地铁集团有限公司 | 轨道交通线路图纸数据的自动导出方法 |
CN109376758A (zh) * | 2018-09-07 | 2019-02-22 | 广州算易软件科技有限公司 | 一种基于图形的元器件识别方法、系统、装置和存储介质 |
CN110728260A (zh) * | 2019-10-23 | 2020-01-24 | 北京天工矩阵信息技术有限公司 | 一种电气施工图的识别方法及装置 |
-
2020
- 2020-06-18 CN CN202010557825.9A patent/CN111985479B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156387A (zh) * | 2015-04-14 | 2016-11-23 | 上海申通地铁集团有限公司 | 轨道交通线路图纸数据的自动导出方法 |
CN106127169A (zh) * | 2016-06-28 | 2016-11-16 | 广州地铁集团有限公司 | 列车运行信息分析系统及其方法 |
CN109376758A (zh) * | 2018-09-07 | 2019-02-22 | 广州算易软件科技有限公司 | 一种基于图形的元器件识别方法、系统、装置和存储介质 |
CN110728260A (zh) * | 2019-10-23 | 2020-01-24 | 北京天工矩阵信息技术有限公司 | 一种电气施工图的识别方法及装置 |
Non-Patent Citations (2)
Title |
---|
城市轨道车辆综合线路图处理系统设计与开发;王帅等;《智能计算机与应用》;20200531;第10卷(第05期);第172-175页 * |
手绘模拟电路图识别技术研究;刘玉军等;《系统工程理论与实践》;19990930(第09期);第92-99页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111985479A (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106951832B (zh) | 一种基于手写字符识别的验证方法及装置 | |
CN108288075A (zh) | 一种改进ssd的轻量化小目标检测方法 | |
CN112597876B (zh) | 基于特征融合的书法汉字评判方法 | |
CN108038484B (zh) | 空心验证码快速识别方法 | |
CN111401156B (zh) | 基于Gabor卷积神经网络的图像识别方法 | |
CN115620322B (zh) | 一种基于关键点检测的全线表表格结构识别方法 | |
CN106446885A (zh) | 纸介盲文识别方法和系统 | |
CN112949455B (zh) | 一种增值税发票识别系统及方法 | |
CN110516676A (zh) | 一种基于图像处理的银行卡号识别系统 | |
CN113591866A (zh) | 基于db与crnn的特种作业证件检测方法及系统 | |
JP3228938B2 (ja) | 分布マップを用いる画像の分類方法及び装置 | |
CN112241730A (zh) | 一种基于机器学习的表格提取方法和系统 | |
CN111523622A (zh) | 基于特征图像自学习的机械臂模拟手写笔迹方法 | |
CN112784531A (zh) | 一种基于深度学习和部件拼接的中文字形及字库生成方法 | |
CN112016481A (zh) | 基于ocr的财务报表信息检测和识别方法 | |
CN111985479B (zh) | 一种用于列车综合线路图的智能识别系统 | |
CN104881668B (zh) | 一种基于代表性局部模式的图像指纹提取方法及系统 | |
CN116824608A (zh) | 基于目标检测技术的答题卡版面分析方法 | |
Obaidullah et al. | Structural feature based approach for script identification from printed Indian document | |
CN113657377A (zh) | 一种机打票据图像结构化识别方法 | |
CN106503706B (zh) | 汉字字形切割结果正确性的判别方法 | |
CN116823983A (zh) | 基于风格收集机制的一对多风格书法图片生成方法 | |
CN115457581A (zh) | 表格提取方法、装置及计算机设备 | |
KR20230029206A (ko) | 인공지능 문자인식을 위한 학습 데이터 구축 장치 | |
CN114926842A (zh) | 东巴象形文字识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |