CN107066997B

CN107066997B - 一种基于图像识别的电气元件报价方法

Info

Publication number: CN107066997B
Application number: CN201611168652.1A
Authority: CN
Inventors: 高飞; 葛一粟; 杨程光; 金一鸣; 徐云静; 卢书芳; 毛家发; 肖刚
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2016-12-16
Filing date: 2016-12-16
Publication date: 2019-07-30
Anticipated expiration: 2036-12-16
Also published as: CN107066997A

Abstract

本发明涉及一种基于图像识别的电气元件报价方法，它是利用图像识别技术对电气设计图的表格进行分割、元件名称识别、数据库匹配报价，本发明通过自动实现图像矫正，识别电气元件报价单中表格位置，自动提取表格中文字信息，得出具体每个电气元件的报价，减少了繁琐的人工信息输入过程，且大大降低了因人工输入信息造成的输入错误率问题。

Description

一种基于图像识别的电气元件报价方法

技术领域

本发明涉及一种基于图像识别的电气元件报价方法，尤其涉及利用图像识别技术对电气设计图的表格进行分割、元件名称识别、数据库匹配报价的电气元件报价方法。

背景技术

近年来，随着现代化技术的发展，曾经的纸质化办公方式正渐渐被“无纸化办公”所替代。由于现在处于新旧交替的特殊时期，仍有许多纸质信息需要通过人工将数据导入到计算机系统中，而大量的纸质数据信息和人工输入不可避免的错误率，使得自动化信息采集系统具有非常重要的意义。

为了解决自动化纸质信息提取的问题，国内外学术界、工业界提出了很多方案。其中与本发明较为接近的技术方案包括：谢亮(表格识别预处理技术与表格字符提取算法的研究[D].中山大学,2005)该系统在图像二值化算法的基础上，针对手写表格文档提出了一种基于非线性对比度增强及LOG算子的混合二值化方法，针对表格文档图像，在Hough变换的基础上提出了一种带参数约束条件的Hough变换——HTPC，实现了对表格文档图像的快速倾斜角检测及校正，通过CTF过程准确地定位并提取出表格的所有单元格，再通过ECCEA方法完整地提取出表格中的字符，然后利用基于连通区域检测的去噪算法对图像进行去噪，最后对字符图像进行平滑化处理，解决表格文档中手写字符经常重叠表格边框线的问题，该系统针对阿拉伯数字具有良好的识别率，但在中文字符识别效率上没有太多的说明，且实验样本噪音较少；王科俊(印刷体表格识别的研究[D].哈尔滨工程大学,2013)将灰度图像转化为二值图像，并采用改进的Hough变换完成倾斜校正，利用文档图像的版面分析提取图像中的表格区域，采用了传统的投影法与基于直线搜索相结合的算法完成表格线的检测与提取，将图像中的横向与纵向表格线重组成表格框架，最后，利用OCR技术完成数据的识别，并将其写入已经提取的表格框架中，完成表格图像的重绘。该系统对印刷体简单表格的识别上有较好的识别率，图像样本文件噪声较少，文字识别上较为简单；周壮(表格识别系统中框线检测与去除的算法研究[D].辽宁科技大学,2015)在表格识别的基础上，实现在原图像上去除表格框线，该系统实现字符与笔画叠加的情况下去除框线同时保留字符笔画，但该系统样本图像噪声较少，在噪声处理方面涉及较少；发明专利(申请号：CN201610057218.X，名称：图像超高密度椒盐噪声的降除方法)公开了一种图像超高密度椒盐噪声的降除方法，主要解决现有方法无法滤除超高密度椒盐噪声的问题，与本发明不同的地方在于，其用极值方法检测噪声点，用均值的方法处理噪声点，这样处理会造成原本图像部分信息的丢失，特别是文字中的边缘信息的丢失，严重影响文字识别效果。

综上所述，当前表格识别处理技术方案中，存在如下不足：(1)并未考虑到像电气元件报价单这样有高噪声情况下的识别效率，采用的图像样本噪声处理较为简单；

(2)系统在阿拉伯数字上的识别上较成熟，但在高噪声样本中的汉字识别方面的工作较少有涉及；

(3)在降噪处理技术方案上，未权衡噪声点去除和文字信息保留之间的平衡关系，在处理噪声点的时候会同时消除部分关键的文字边缘信息。

在电气元件报价方法中，控制高密度椒盐噪声处理粒度和文字边缘信息保留之间的平衡关系非常重要，高密度椒盐噪声会造成文字识别率过低，但在处理噪声的同时会影响文字边缘信息，而降低文字识别率。而本发明中的降噪策略，针对电气元件报价单这种有高密度噪声点的印刷体表格文件，能较好的对其进行处理。

发明内容

为了克服现有纸质电气元件报价单信息录入的问题，本发明提供了一种基于图像识别的电气元件报价方法。

所述的一种基于图像识别的电气元件报价方法，其特征在于包括如下步骤：

步骤1：读入电气设计图的扫描图像F₁；

步骤2：对扫描图像F₁进行倾斜校正，为倾斜校正后的图像F₂；

步骤3：对校正图像F₂进行表格切割，具体为：

步骤3.1：采用Hough方法对校正图像F₂再次进行直线检测，并分类得到垂直直线集合LV＝{(lv_i,x_i)|i＝1,2,…,n_v}和水平直线集合LH＝{(lh_j,y_j)|j＝1,2,…,n_h}，其中x_i表示垂直直线lv_i的横坐标，n_v表示集合LV中的元素数量，y_j表示水平直线lh_j的纵坐标，n_h表示集合LH中的元素数量；

步骤3.2：垂直直线合并，具体为：若垂直直线集合LV中存在n_vs条直线，记为集合LVS＝{(lv_i,x_i)|i＝1,2,…,n_vs,(lv_i,x_i)∈LV}，且这n_vs条直线中的任意两条直线lv_i与lv_j满足|x_i-x_j|≤λ，则将这n_vs条直线合并成为一条直线(lv_k,x_k)加入到集合LV中，并将集合LV中对应的n_vs条直线去除，其中横坐标x_k根据式(3)计算，λ表示事先给定的直线合并阈值；重复这一过程直到LV中无直线可合并，得到新的垂直直线集合LV；

步骤3.3：根据步骤3.2相同的原理对水平直线进行合并，得到新的水平直线集合LH；

步骤3.4：将新的垂直直线集合LV划分为q个子集，记为LVT_k＝{(lv_ki,x_ki)|i＝1,2,…,n_k,(lv_ki,x_ki)∈LV}，k＝1,2,…,q,且每个子集需满足条件：(1)子集LVT_k中的n_k条直线连续相邻；(2)计算LVT_k中相邻直线的间距，得到间距集合LVA_k＝{a_ki|i＝1,2,…,n_k-1,a_ki＝|x_ki-x_ki+1|}，须满足|a_p-a_r|≤μ且p∈{1,2,…,n_k-1}且r∈{1,2,…,n_k-1}且|p-r|＝1；其中，LVT_k表示第k个子集，lv_ki表示子集LVT_k中第i条直线，x_ki表示直线lv_ki对应的横坐标，n_k表示第k个子集的直线数量，μ表示事先选定的间距阈值；将这q个子集中n_k最大的子集记为LVT_max＝{(lv_maxi,x_maxi)|i＝1,2,…,n_vmax,(lv_maxi,x_maxi)∈LV}；

步骤3.5：根据步骤3.4相同的原理找到水平直线集合LH中的子集LHT_max＝{(lh_{max j},y_{max j})|j＝1,2,…,n_hmax,(lh_{max j},y_{max j})∈LH}；

步骤3.6：计算得到包含H行W列的单元格集合C＝{R_ij＝(x_ij,y_ij,w_ij,h_ij)|i＝1,2,…,H,j＝1,2,…,W}，具体为：

式中，H＝n_hmax-1,W＝n_vmax-1，x_ij表示第i行第j列单元格左上角的横坐标，y_ij表示第i行第j列单元格左上角的纵坐标，w_ij表示第i行第j列单元格的宽度，h_ij表示第i行第j列单元格的高度，x_maxj表示垂直直线lv_maxj的横坐标，且(lv_maxj,x_maxj)∈LVA_max，y_maxi表示水平直线lh_maxi的纵坐标，且(lh_maxi,y_maxi)∈LHA_max；

步骤3.7：根据单元格集合C进行表格切割；

步骤4：针对每个单元格R_ij进行降噪与文字识别处理，得到对应的文字t_ij；

步骤5：每个单元格文字t_ij与价格表TB＝{(type_i,p_i)|i＝1,2,…,T}进行匹配，得到该单元格对应元件的价格，具体策略为：若存在k使t_ij＝type_k，则p_k即为该元件的报价；否则，从任意type_k对应的语义库TBS_k＝{w_kq|q＝1,2,…,T_k}中去匹配，若存在k使w_k＝t_ij，则p_k即为该元件的报价，若仍无法匹配，则手工输入t_ij对应的价格p_i′，同时将(t_ij,p_i′)添加到价格表TB中；其中，TB表示事先录入到数据库中的价格表，T表示已经录入的元件数量，type_i表示价格表TB中第i类元件的名称，p_i表示价格表TB中第i类元件的价格，TBS_k表示与第k类元件type_k对应的语义库，w_kq表示语义库TBS_k中第k个元件名称，T_k表示语义库TBS_k中的语义数量。

所述的一种基于图像识别的电气元件报价方法，其特征在于步骤2)对扫描图像F₁进行倾斜校正的具体过程为：

步骤2.1：采用Hough方法进行直线检测，提取扫描图像F₁中的直线，得到直线集合L＝{l_i|i＝1,2,…,n}，n表示直线数量；

步骤2.2：求直线l_i与水平线的夹角，记为a_i，从L取得那些a_i满足式(1)的直线构成子集LS＝{(ls_j,b_j)|j＝1,2,…,m,ls_j∈L}，其中b_j表示直线ls_j与水平线的夹角，m表示子集LS中的元素数量；根据式(2)计算得到扫描图像F₁的倾斜角A：

|a_i|≤a₀ (1)

其中a₀表示事先选定的倾斜角阈值；

步骤2.3：根据倾斜角度A，利用旋转矩阵对图像进行旋转，旋转后的图像即为倾斜校正后的图像F₂。

所述的一种基于图像识别的电气元件报价方法，其特征在于步骤2.2)中的提取出的直线需要进行分类，分为水平直线和垂直直线两类；水平提取直线和水平线的角度在0°～30°或150°～180°之间，垂直提取直线和水平线的角度在60°～120°之间，根据其直线的类型，计算出所有直线的倾斜角度，取其中间值作为倾斜角度：

所述的一种基于图像识别的电气元件报价方法，其特征在于步骤4)的针对每个单元格R_ij进行降噪与文字识别处理具体为：

步骤4.1：从图像F₂截取与单元格R_ij对应的彩色子图S_ij，并将其拆分分别对应于红、绿、蓝三个单通道的灰度图像SR_ij,SG_ij和SB_ij；

步骤4.2：对每个通道图像SR_ij,SG_ij和SB_ij都进行半径为R_median的自适应中值滤波，R_median为事先给定的滤波器半径；

步骤4.3：在每个通道图像中都存在W_Sij*H_Sij个像素点，通道图像SR_ij中，存在集合P_SRij＝{(x_Smn,y_Smn,v_SRmn)|m＝1,2,…,W_Sij,n＝1,2,…,H_Sij}，其中W_Sij为单元格R_ij的宽度，H_Sij为单元格R_ij的高度，x_Smn为图像SR_ij中坐标点的横坐标，y_Smn为图像SR_ij中坐标点的纵坐标，v_SRmn为通道图像SR_ij中坐标点(x_Smn,y_Smn)的像素值；同理，通道图像SG_ij中存在集合P_SGij＝{(x_Smn,y_Smn,v_SGmn)|m＝1,2,…,W_Sij,n＝1,2,…,H_Sij}，通道图像SB_ij中存在集合P_SBij＝{(x_Smn,y_Smn,v_SBmn)|m＝1,2,…,W_Sij,n＝1,2,…,H_Sij}，其中v_SGmn和v_SBmn分别为通道图像SG_ij和SB_ij在坐标点(x_Smny_Smn)的像素值；若满足在坐标点(x_Smn,y_Smn)上，三通道的像素值满足v_SRmn>ε∨v_SGmn>ε∨v_SBmn>ε，则将该坐标点的三通道像素值v_SRmn、v_SGmn和v_SBmn都设置为V_back，其中ε和V_back分别为事先给定的降噪阈值和背景像素值；

步骤4.4：对各通道再次进行半径为R_median的自适应中值滤波；

步骤4.5：对三个通道图像SR_ij,SG_ij和SB_ij进行合并，得到新的彩色子图S_ij；

步骤4.6：对彩色子图S_ij进行高斯核半径为R_Gauss的高斯滤波；

步骤4.7：利用OCR技术对彩色子图S_ij进行文字识别，得到文字t_ij。通过采用上述技术，与现有技术相比，本发明的有益效果如下：本发明通过自动实现图像矫正，识别电气元件报价单中表格位置，自动提取表格中文字信息，得出具体每个电气元件的报价，减少了繁琐的人工信息输入过程，且大大降低了因人工输入信息造成的输入错误率问题。

附图说明

图1为本发明的实施样例选取的电气元件报价单图像像灰度图；

图2为本发明的经过步骤1.1处理后获取直线的报价单图像灰度图；

图3为本发明的经过步骤1.3旋转矫正后的报价单图像灰度图；

图4为本发明的经过步骤2.4表格分割后的报价单中单元格图像灰度图；

图5为本发明的经过步骤3.2第一次分通道适应性平滑处理后的单元格图像灰度图；

图6为本发明的经过步骤3.4第二次分通道适应性平滑处理后的单元格图像灰度图；

图7为本发明的经过步骤3.5合并通道图像的单元格图像灰度图；

图8为本发明的经过步骤3.6高斯滤波之后的单元格图像灰度图。

具体实施方法

下面结合实施实例来详细阐述本发明电气元件报价系统的具体实施方式，但本发明的保护范围并不仅限于此。

本发明的一种基于图像识别的电气元件报价方法，包括如下步骤：

步骤1：读入电气设计图的扫描图像F₁，原图灰度图如图1所示；

步骤2：对扫描图像F₁进行倾斜校正，具体为：

步骤2.1：采用Hough方法进行直线检测，提取扫描图像F₁中的直线，得到直线集合L＝{l_i|i＝1,2,…,n}，n表示直线数量，图像直线获取图灰度图如图2所示；由于电气元件报价单中利用了表格进行信息排版，图像中较长的直线都来自于表格中的各条边，因此，确定图像中的各条边的位置便能找到图中表格的位置；

步骤2.2：求直线l_i与水平线的夹角，记为a_i，从L取得那些a_i满足式(1)的直线构成子集LS＝{(ls_j,b_j)|j＝1,2,…,m,ls_j∈L}，其中b_j表示直线ls_j与水平线的夹角，m表示子集LS的数量；根据式(2)计算得到扫描图像F₁的倾斜角A根据直线和水平线之间的夹角，判断表格倾斜角度，由于提取出的直线皆为表格中的各条边，因此直线之间的关系，不是互相平行就是相互垂直，因此需要将直线进行分类，分为水平直线和垂直直线两类；水平提取直线和水平线的角度在0°～30°和150°～180°之间，垂直提取直线和水平线的角度在60°～120°之间，根据其直线的类型，计算出所有直线的倾斜角度；考虑到部分直线的误差情况，统计出所有直线的倾斜角度，取其中间值作为倾斜角度：

|a_i|≤a₀ (1)

其中a₀表示倾斜角阈值，在本实例中，a₀＝20°；

步骤2.3：根据倾斜角度A，利用旋转矩阵对图像进行旋转，旋转后的图像即为倾斜校正后的图像F₂，旋转矫正后图像灰度图如图3所示；

步骤3：对校正图像F₂进行表格切割，具体为：

步骤3.1：采用Hough方法对校正图像F₂再次进行直线检测，并分类得到垂直直线集合LV＝{(lv_i,x_i)|i＝1,2,…,n_v}和水平直线集合LH＝{(lh_j,y_j)|j＝1,2,…,n_h}，其中x_i表示垂直直线lv_i的横坐标，n_v表示集合LV中的数量，y_j表示水平直线lh_j的纵坐标，n_h表示集合LH中的数量；

步骤3.2：垂直直线合并，具体为：若垂直直线集合LV中存在任意n_vs条直线，记为集合LVS＝{(lv_i,x_i)|i＝1,2,…,n_vs,(lv_i,x_i)∈LV}，且LVS中的任意两条直线lv_i与lv_j满足|x_i-x_j|≤λ，则将这n_vs条直线合并成为一条直线(lv_k,x_k)加入到集合LV中，并将集合LV中对应的n_vs条直线去除，其中横坐标x_k根据式(3)计算，λ表示事先给定的直线合并阈值，在本实例中λ＝5；重复这一过程直到LV中无直线可合并，得到新的垂直直线集合LV，第一次分通道适应性平滑处理后的单元格图像灰度图如图5所示；

步骤3.4：进一步，将新的垂直直线集合LV划分为q个子集，记为LVT_k＝{(lv_ki,x_ki)|i＝1,2,…,n_k,(lv_ki,x_ki)∈LV}，k＝1,2,…,q,且每个子集需满足条件：(1)子集LVT_q中的n_q条直线连续相邻；(2)计算LVT_k中相邻直线的间距，得到间距集合LVA_k＝{a_ki|i＝1,2,…,n_k-1,a_ki＝|x_ki-x_ki+1|}，须满足|a_p-a_r|≤μ且p∈{1,2,…,n_k-1}且r∈{1,2,…,n_k-1}且|p-r|＝1；其中，LVT_k表示第k个子集，lv_ki表示子集LVT_k中第i条直线，x_ki表示直线lv_ki对应的横坐标，n_k表示第k个子集的直线数量，μ表示事先选定的间距阈值；将这q个子集中n_k最大的子集记为LVT_max＝{(lv_maxi,x_maxi)|i＝1,2,…,n_vmax,(lv_maxi,x_maxi)∈LV}；在本实例中，间距阈值μ＝5；

步骤3.6：

计算得到包含H行W列的单元格集合C＝{R_ij＝(x_ij,y_ij,w_ij,h_ij)|i＝1,2,…,H,j＝1,2,…,W}，具体为：

步骤3.7：根据单元格C对表格进行切割，切割后图像灰度图如图4所示；

步骤4：针对每个单元格R_ij进行降噪与文字识别处理，得到对应的文字t_ij，具体为：

步骤4.3：在每个通道图像中都存在W_Sij*H_Sij个像素点，通道图像SR_ij中，存在集合P_SRij＝{(x_Smn,y_Smn,v_SRmn)|m＝1,2,…,W_Sij,n＝1,2,…,H_Sij}，其中W_Sij为单元格R_ij的宽度，H_Sij为单元格R_ij的高度，x_Smn为图像SR_ij中坐标点的横坐标，y_Smn为图像SR_ij中坐标点的纵坐标，v_SRmn为通道图像SR_ij中坐标点(x_Smn,y_Smn)的像素值；同理可知，通道图像SG_ij中存在集合P_SGij＝{(x_Smn,y_Smn,v_SGmn)|m＝1,2,…,W_Sij,n＝1,2,…,H_Sij}，通道图像SB_ij中存在集合P_SBij＝{(x_Smn,yS_mn,v_SBmn)|m＝1,2,…,W_Sij,n＝1,2,…,H_Sij}，其中v_SGmn和v_SBmn分别为通道图像SG_ij和SB_ij在坐标点(x_Smny_Smn)的像素值；若满足在坐标点(x_Smn,y_Smn)上，三通道的像素值满足v_SRmn>ε∨v_SGmn>ε∨v_SBmn>ε，则将该坐标点的三通道像素值v_SRmn、v_SGmn和v_SBmn都设置为V_back，其中ε和V_back分别为事先给定的降噪阈值和背景像素值；步骤4.4：对各通道再次进行半径R_median＝1的自适应中值滤波；第二次平滑处理后的图像灰度图如图6所示；

步骤4.5：对三个通道图像SR_ij,SG_ij和SB_ij进行合并，得到新的彩色子图S_ij，处理后合并图像，其灰度图如图7所示；

步骤4.6：对彩色子图S_ij进行高斯滤波，在本实例中，高斯核半径取R_Gauss＝3，高斯滤波后图像灰度图如图8所示；

步骤4.7：利用OCR技术对彩色子图S_ij进行文字识别，得到文字t_ij；

步骤5：每个单元格文字t_ij与价格表TB＝{(type_i,p_i)|i＝1,2,…,T}进行匹配，得到该单元格对应元件的价格，具体策略为：若存在k使t_ij＝type_k，则p_k即为该元件的报价；否则，从任意type_k对应的语义库TBS_k＝{w_kq|q＝1,2,…,T_k}中去匹配，若存在k使w_k＝t_ij，则p_k即为该元件的报价，若仍无法匹配，则手工输入t_ij对应的价格p′_i，同时将(t_ij,p′_i)添加到TB中e；其中，TB表示事先录入到数据库e中的价格表，T表示已经录入的元件数量，type_e表示价格表TB中第i类元件的名称，p_i表示价格表TB中第i类元件的价格，TBS_e表示与第k类元件type_e对应的语义库，w_kq表示语义库TBS_k中第e个元件名称，T_k表示语义库TBS_k中的语义数量。

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims

1.一种基于图像识别的电气元件报价方法，其特征在于包括如下步骤：

步骤1：读入电气设计图的扫描图像F₁；

步骤3：对校正图像F₂进行表格切割，具体为：

步骤3.5：根据步骤3.4相同的原理找到水平直线集合LH中的子集LHT_max＝{(lh_maxj,y_maxj)|j＝1,2,…,n_hmax,(lh_maxj,y_maxj)∈LH}；

步骤3.7：根据单元格集合C进行表格切割；

步骤5：每个单元格文字t_ij与价格表TB＝{(type_i,p_i)|i＝1,2,…,T}进行匹配，得到该单元格对应元件的价格，具体策略为：若存在k使t_ij＝type_k，则p_k即为该元件的报价；否则，从任意type_k对应的语义库TBS_k＝{w_kq|q＝1,2,…,T_k}中去匹配，若存在q使w_kq＝t_ij，则p_k即为该元件的报价，若仍无法匹配，则手工输入t_ij对应的价格p′_i，同时将(t_ij,p′_i)添加到价格表TB中；其中，TB表示事先录入到数据库中的价格表，T表示已经录入的元件数量，type_i表示价格表TB中第i类元件的名称，p_i表示价格表TB中第i类元件的价格，TBS_k表示与第k类元件type_k对应的语义库，w_kq表示元件type_k在语义库TBS_k中第q个元件名称，T_k表示语义库TBS_k中的语义数量。

2.根据权利要求1所述的一种基于图像识别的电气元件报价方法，其特征在于步骤2)对扫描图像F₁进行倾斜校正的具体过程为：

|a_i|≤a₀ (1)

其中a₀表示事先选定的倾斜角阈值；

3.根据权利要求2所述的一种基于图像识别的电气元件报价方法，其特征在于步骤2.2)中的提取出的直线需要进行分类，分为水平直线和垂直直线两类；水平提取直线和水平线的角度在0°～30°或150°～180°之间，垂直提取直线和水平线的角度在60°～120°之间，根据其直线的类型，计算出所有直线的倾斜角度，取其中间值作为倾斜角度。

4.根据权利要求1所述的一种基于图像识别的电气元件报价方法，其特征在于步骤4)的针对每个单元格R_ij进行降噪与文字识别处理具体为：

步骤4.7：利用OCR技术对彩色子图S_ij进行文字识别，得到文字t_ij。