CN110060260B - 一种图像处理方法及系统 - Google Patents

一种图像处理方法及系统 Download PDF

Info

Publication number
CN110060260B
CN110060260B CN201910291683.3A CN201910291683A CN110060260B CN 110060260 B CN110060260 B CN 110060260B CN 201910291683 A CN201910291683 A CN 201910291683A CN 110060260 B CN110060260 B CN 110060260B
Authority
CN
China
Prior art keywords
image
curve
point
region
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910291683.3A
Other languages
English (en)
Other versions
CN110060260A (zh
Inventor
徐占洋
施昊阳
陈天宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201910291683.3A priority Critical patent/CN110060260B/zh
Publication of CN110060260A publication Critical patent/CN110060260A/zh
Application granted granted Critical
Publication of CN110060260B publication Critical patent/CN110060260B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/168Segmentation; Edge detection involving transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20061Hough transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像处理方法包括:将待处理图像转换为灰度图像,进而对所述灰度图像进行二值化;对所述二值化图像进行有效区域图像的提取,并对所述有效区域图像去噪;采用概率学方法对所述去噪后的图像进行曲线提取,得到对应的曲线数据,输出曲线区域。本发明采用概率学方法对图像进行曲线提取,能够有效识别实线曲线与虚线曲线,对噪声具有良好的抗性;本发明和现有技术相比,处理速度较快,识别出的曲线数据与原数据具有较高的拟合度,具有良好的效果。

Description

一种图像处理方法及系统
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于概率学方法的图像处理方法及系统。
背景技术
旧书、期刊论文中常常包含着重要的实验图表,尤其是材料性质图像或实验结果。在科研工作中,有时需要对这些实验图表进行测量识别,将图表转化为数字,以便与新的实验结果进行比较,如在工程设计中图表的矢量化研究。通过扫描仪等设备,将手绘图表扫描后输入计算机中,通过人工处理,将数据点重绘后,导出矢量化的曲线图像。
由上述可知,人工处理耗费时间过长,而且原始图像中可能存在噪声过多、清晰度不足的情况,导致矢量化后的曲线数据与原始数据存在较大差异。
发明内容
发明目的:为了克服现有技术的不足,本发明提供一种图像处理方法,该方法可以解决矢量化的曲线数据与原始数据拟合度差以及矢量过程速度慢的问题,另外本发明还提供一种图像处理系统。
技术方案:本发明所述的图像处理方法,该方法包括:
(1)将待处理图像转换为灰度图像,进而对所述灰度图像进行二值化;
(2)对所述二值化图像进行有效区域图像的提取,并对所述有效区域图像去噪;
(3)采用概率学方法对所述去噪后的图像进行曲线提取,得到对应的曲线数据,输出曲线区域。
优选的,所述步骤(2)中,对所述二值化图像进行有效区域图像的提取具体包括:
若所述二值化图像为包括横轴与纵轴两条坐标轴两条直线的标准曲线图像,则采用霍夫变换提取横轴与纵轴的像素点集合,并根据像素点集合提取有效区域图像;
若所述二值化图像中存在闭合矩形图像的部分图像,采用最大联通区域法提取有效区域图像。
优选的,所述步骤(2)中,对所述有效区域图像去噪,具体包括:
(21)对所述有效区域图像逐行、逐列进行扫描,将其中像素值为黑的点加入临时区;
(22)若临时区中像素点的个数大于第一设定阈值,则这些像素点为干扰值区域;否则重复步骤(21);
(23)扫描所述干扰值区域中的曲线上的点,并扫描其8邻域中的点,如果某个点中像素值为黑的点的个数大于所述第一设定阈值,则认为该点为曲线上的点,将其在干扰值区域中去除,否则,将干扰值区域中的点在有效区域图像中的像素值置为白;
(24)重复步骤(21),直至扫描完成有效区域图像,输出初步去噪图像;
(25)对于所述初步去噪图像,扫描图像中的每个点,如果其24邻域中黑像素点小于所述第一设定阈值,认为其为孤立噪声点,将其在有效区域图像中的像素值置为白,得到去噪图像。
优选的,所述步骤(3)中,采用概率学方法对所述去噪后的图像进行曲线提取,具体步骤包括:
(31)分割所述去噪图像为局部图像,利用最大联通区域法寻找最大连通区域集合;
(32)若最大连通区域集合的元素个数大于第二设定阈值,认为局部图像中存在某一曲线I的起始部分,将集合中的像素点加入曲线区域;否则,认为局部图像中不存在某一曲线I的起始部分,重复步骤(31);
(33)选择曲线区域中一点PS(x,y),将x作为分割下一局部图像的起始点,以第二设定阈值为步长,分割去噪图像为当前局部图像;
(34)计算曲线区域的条件概率Px,计算曲线I在当前局部图像的概率分布;
(35)选择条件概率最高的联通区域,若联通区域中的元素个数大于第二设定阈值,则将联通区域加入曲线区域,重复步骤(33);否则认为曲线I在当前局部图像的部分不存在,即曲线I识别完成,输出曲线I的曲线区域;
(36)迭代上述步骤,直到所有曲线提取完成。
优选的,所述步骤(35)中,联通区域是曲线I在当前局部图像的区域的概率PN满足:选择联通区域集合中一点PN(xN,yN),满足公式
xN→min(x1,x2,...,xn)
其中,x1,x2,...,xn为联通区域中像素点横坐标值构成的无序序列,对这样的PN(xN,yN)求与其点PS(x,y)的欧式距离
Figure GDA0004125523900000021
LNS的值越小,该联通区域作为曲线I在当前局部图像的区域的条件概率P越高。
另一方面,本发明还提供一种图像处理系统,所述系统包括:
图像预处理模块,用于将待处理图像转换为灰度图像,进而对所述灰度图像进行二值化;
图像去噪模块,用于对所述二值化图像进行有效区域图像的提取,并对所述有效区域图像去噪;
曲线提取模块,用于采用概率学方法对所述去噪后的图像进行曲线提取,得到对应的曲线数据,输出曲线区域。
优选的,所述图像去噪模块,具体包括:
有效区域提取单元,用于进行判断所述二值化图像的性质,并进行有效区域图像提取,若所述二值化图像为包括横轴与纵轴两条坐标轴两条直线的标准曲线图像,则采用霍夫变换提取横轴与纵轴的像素点集合,并根据像素点集合提取有效区域图像;
若所述二值化图像中存在闭合矩形图像的部分图像,采用最大联通区域法提取有效区域图像。
优选的,所述图像去噪模块还包括有效区域去噪单元,用于对所述有效区域图像去噪,具体包括:
像素点扫描单元,用于对所述有效区域图像逐行、逐列进行扫描,将其中像素值为黑的点加入临时区;
干扰值区域判断单元,用于判断像素点是否为干扰值区域,若临时区中像素点的个数大于第一设定阈值,则这些像素点为干扰值区域;否则重复像素点扫描单元;
干扰值区域扫描单元,用于扫描所述干扰值区域中的曲线上的点,并扫描其8邻域中的点,如果某个点中像素值为黑的点的个数大于所述第一设定阈值,则认为该点为曲线上的点,将其在干扰值区域中去除,否则,将干扰值区域中的点在有效区域图像中的像素值置为白;
重复单元,重复像素点扫描单元,直至扫描完成有效区域图像,输出初步去噪图像;
去噪图像生成单元,用于扫描所述初步去噪图像中的每个点,如果其24邻域中黑像素点小于所述第一设定阈值,认为其为孤立噪声点,将其在有效区域图像中的像素值置为白,得到去噪图像。
优选的,所述曲线提取模块,还包括:
局部图像分割单元,用于分割所述去噪图像为局部图像,利用最大联通区域法寻找最大连通区域集合;
起始区域判断单元,若最大连通区域集合的元素个数大于第二设定阈值,认为局部图像中存在某一曲线I的起始部分,将集合中的像素点加入曲线区域;否则,认为局部图像中不存在某一曲线I的起始部分,转入局部图像分割单元;
下一区域选择单元,用于选择曲线区域中一点PS(x,y),将x作为分割下一局部图像的起始点,以第二设定阈值为步长,分割去噪图像为当前局部图像;
概率分布计算单元,用于计算曲线区域的条件概率Px,计算曲线I在当前局部图像的概率分布;
联通区域判断单元,用于选择条件概率最高的联通区域,若联通区域中的元素个数大于第二设定阈值,则将联通区域加入曲线区域,转入下一区域选择单元;否则认为曲线I在当前局部图像的部分不存在,即曲线I识别完成,输出曲线区域;
迭代上述单元,直到所有曲线提取完成。
优选的,所述联通区域判断单元中,联通区域是曲线I在当前局部图像的区域的概率PN满足:选择联通区域集合中一点PN(xN,yN),满足公式
xN→min(x1,x2,...,xn)
其中,x1,x2,...,xn为联通区域中像素点横坐标值构成的无序序列,对这样的PN(xN,yN)求与其点PS(x,y)的欧式距离
Figure GDA0004125523900000041
LNS的值越小,该联通区域作为曲线I在当前局部图像的区域的条件概率P越高。
有益效果:本发明与现有技术相比,其显著优点是:1、本发明采用概率学方法对图像进行曲线提取,能够有效识别实线曲线与虚线曲线,对噪声具有良好的抗性;2、本发明和现有技术相比,处理速度较快,识别出的曲线数据与原数据具有较高的拟合度,具有良好的效果。
附图说明
图1为本发明其中一个实施例所述的图像处理方法流程图;
图2为本发明其中一种实施例所述的采用空域方法对二值化图像进行有效区域的提取的流程图;
图3为本发明其中一种实施例所述的采用邻域扫描法对有效区域图像去噪的流程图;
图4为本发明其中一种实施例所述的采用概率学方法对去噪图像进行曲线提取的流程图;
图5为本发明其中一种实施例所述的系统结构示意图;
图6为本发明其中一种实施例所述的图像去噪模块的结构示意图;
图7为本发明其中一种实施例所述的曲线提取模块的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。
实施例1
如图1-4所示,该方法包括以下步骤:
步骤1,将目标图像转换为灰度图像;
步骤2,将灰度图像二值化;
步骤3,采用空域或频域方法对二值化图像进行有效区域的提取;
步骤4,采用邻域扫描法对有效区域图像去噪;
步骤5,采用概率学方法对去噪图像进行曲线提取,得到曲线数据。
本发明一个较佳的实施例中,步骤1具体包括:
步骤11,扫描目标图像,将目标图像中像素点的值用公式表示为Irgb=(FR,FG,FB)。
步骤12,对于目标图像中的曲线部分,其视觉表现为黑色联通像素点构成的有限集合,为了更好的对曲线进行提取,仅需保留目标图像中的主要成分,即视觉效果较暗的像素点。将步骤1011中得到的像素值变换为灰度像素值,其变换过程可用公式表示为:
Iy=0.333*FR+0.5*FG+0.1666*FB
本发明一个较佳的实施例中,步骤12具体包括:
步骤121,去除在目标图像中表现为较暗成分的噪点。对于这些噪点,根据大津法求出灰度图像的阈值t,其公式表示如下:
Figure GDA0004125523900000061
其中,权重wi是被阈值t分开的两个类的概率,而
Figure GDA0004125523900000062
是这两个类的方差。
步骤122,求出图像阈值t后,根据方程式
Figure GDA0004125523900000063
对灰度图像中的像素点进行变换,得到二值化图像。
本发明一个较佳的实施例中,步骤13具体包括:
对于标准的曲线图像,一般包括横轴与纵轴两条坐标轴两条直线。
步骤131,在频域上,采用霍夫变换提取横轴与纵轴的像素点集合。
步骤132,对于步骤131中提取到的横轴与纵轴像素点集合,取坐标中的极值点xmin,xmax,ymin,ymax,其公式表示如下
xmin=min(xy1,xy2,...,xyn),xmax=max(xx1,xx2,...,xxn)
ymin=min(yy1,yy2,...,yyn),ymax=max(yx1,yx2,...,yxn)
其中,xx1,xx2,...,xxn为横轴像素点集合中所有像素点的横轴坐标值构成的无序序列,yx1,yx2,...,yxn为横轴像素点集合中所有像素点的纵轴坐标值构成的无序序列,xy1,xy2,...,xyn为纵轴像素点集合中所有像素点的横轴坐标值构成的无序序列,yy1,yy2,...,yyn为纵轴像素点集合中所有像素点的纵轴坐标值构成的无序序列。
步骤133,以点(xmin,ymin)为起点,以点(xmax,ymax)为终点,在二值化图像中提取有效区域图像。
在空域上,对于部分图像,具有上下两条横轴与上下两条纵轴共四条直线,即其二值化图像中存在闭合矩形图像,为有效区域图像。对于该类图像,如图2所示,采用最大联通区域法提取有效区域图像,具体步骤如下:
步骤1331,新建大小与二值化图像相同的访问图像,用于记录二值化图像的扫描情况。在访问图像中,像素值为黑的点表示该点二值化图像已被扫描过,像素值为白的点表示该点在二值化图像中未被扫描过。新建访问临时区,用于存放后续步骤中访问到的像素点。
步骤1332,新建区域坐标区,扫描二值化图像中的点,取点Pbegin(x,y)满足公式x=min(x1,x2,...,xn)
其中,xx1,xx2,...,xxn为二值化图像中,所有像素点值为黑的点,其横轴坐标值构成的无序序列。
步骤1333,将点Pbegin放入访问临时区,将访问图像中点Pbegin所对应点的像素值置为黑。
步骤1334,取出访问临时区中的点Ptop,将其放入区域坐标区;扫描点Ptop8邻域中的点P1,P2,...,P8,对于点Pi,如果其访问图像所对应的点的像素值为白,将点Pi加入访问临时区,并且将访问图像中点Pi所对应点的像素值置为黑。
步骤1335,如果访问临时区不为空,则重复步骤1334;否则记录区域坐标区中像素点的个数。
步骤1336,如果访问图像中仍存在像素值为黑的点,则重复步骤1332;否则取像素点个数最大的区域坐标区。
步骤1337,取区域坐标区中的极值点xmin,xmax,ymin,ymax,其公式表示如下
xmin=min(x1,x2,...,xn),xmax=max(x1,x2,...,xn)
ymin=min(y1,y2,...,yn),ymax=max(y1,y2,...,yn)
其中,x1,x2,...,xn为区域坐标区中所有像素点的横轴坐标值构成的无序序列,y1,y2,...,yn为区域坐标区中所有像素点的纵轴坐标值构成的无序序列,
步骤1338,以点(xmin,ymin)为起点,以点(xmax,ymax)为终点,在二值化图像中提取有效区域图像。
本发明一个较佳的实施例中,步骤14具体包括:
步骤141,步骤13得到的有效区域图像中仍存在坐标轴、刻度线,网格线以及噪声点等干扰值。在一般的曲线图像中,坐标轴、刻度线、网格线等垂直于横轴方向或纵轴方向,利用该特性,可对部分干扰点去除,如图3所示,具体步骤如下:
步骤1411,对有效区域图像逐行、逐列进行扫描,将其中像素值为黑的点加入临时区。
步骤1412,若临时区中像素点的个数大于第一设定阈值,认为这些像素点疑似干扰值区域;否则重复步骤1411。
步骤1413,对于步骤1412中的得到的干扰值区域,其中可能存在曲线上的点。对于每个点Pt,扫描其8邻域中的点P1,P2,...,P8,如果这些点中像素值为黑的点的个数大于第一设定阈值,认为该点为曲线上的点,将其在干扰值区域中去除。
步骤1414,如果干扰值区域未扫描完,则重复步骤1413;否则将干扰值区域中的点在有效区域图像中的像素值置为白。
步骤1415,如果图像未扫描完成,则重复步骤1411;否则输出初步去噪图像。
步骤142,对于初步去噪图像,仍存在部分孤立噪声点,扫描图像中的每个点,如果其24邻域中黑像素点小于第一设定阈值,认为其为孤立噪声点,将其在有效区域图像中的像素值置为白,得到去噪图像。
本发明一个较佳的实施例中,如图4所示,步骤15具体包括:
对于去噪图像,图像中曲线的起始点均位于有效区域图像中相对靠左的位置。设曲线I的起始点为
Figure GDA0004125523900000084
满足公式:
Figure GDA0004125523900000081
其中,x1,x2,...,xn为曲线I上点
Figure GDA0004125523900000082
的横坐标值构成的无序序列,y1,y2,...,yn为曲线I上点/>
Figure GDA0004125523900000083
的纵坐标值构成的无序序列。
设曲线I的终点为
Figure GDA0004125523900000085
满足公式:
Figure GDA0004125523900000091
在去噪图像中找出n个点
Figure GDA0004125523900000092
使得这些点构成曲线I的条件概率argmaxlP最大,认为这些点是对曲线I最可能的识别,满足全概率公式
Figure GDA0004125523900000093
步骤151,寻找曲线I的起始部分,即寻找
Figure GDA0004125523900000094
在局部区域中的聚类。创建曲线区域,以第二设定阈值为步长,分割去噪图像为局部图像。在局部图像中,利用最大联通区域法寻找最大连通区域集合,若集合的元素个数大于第二设定阈值,认为局部图像中存在某一曲线I的起始部分,将集合中的像素点加入曲线区域;否则,认为局部图像中不存在某一曲线的起始部分,则重复步骤151;若无法继续分割图像,则认为去噪图像中所有曲线均识别完成,方法结束。
步骤152,选择曲线区域中一点PS(x,y),满足公式:
y→max(y1,y2,...,yn)
其中,y1,y2,...,yn为曲线区域中像素点纵坐标值构成的无序序列。将x作为分割下一局部图像的起始点,以第二设定阈值为步长,分割去噪图像为当前局部图像。
步骤153,计算曲线区域的条件概率Px,计算曲线I在当前局部图像的概率分布。联通区域N是曲线I在当前局部图像的区域的概率PN满足:选择联通区域集合中一点PN(xN,yN),满足公式:
xN→min(x1,x2,...,xn)
其中,x1,x2,...,xn为联通区域中像素点横坐标值构成的无序序列,对这样的PN(xN,yN)求与其点PS(x,y)的欧式距离
Figure GDA0004125523900000095
LNS的值越小,该联通区域作为曲线I在当前局部图像的区域的条件概率P越高。
步骤154,选择条件概率最高的联通区域,若联通区域中的元素个数大于第二设定阈值,则将联通区域加入曲线区域,重复步骤152;否则认为曲线I在当前局部图像的部分不存在,即曲线I识别完成。
步骤155,输出曲线区域,将曲线区域在去噪图像中对应的像素点置为白,重复步骤151,直至图像中的所有曲线提取完成。
综上,该方法通过上述技术方案,采用公式变换将目标图像转换为灰度图像;采用大津法将灰度图像二值化;采用空域或频域方法对二值化图像进行有效区域的提取;采用邻域扫描法对有效区域图像去噪;采用概率学方法对去噪图像进行曲线识别,得到曲线数据,本方法能够有效识别实线曲线与虚线曲线,对噪声具有良好的抗性;本发明和现有技术相比,处理速度较快,识别出的曲线数据与原数据具有较高的拟合度,具有良好的效果。
实施例2
本发明还提供一种图像处理系统,如图5-7所示,所述系统包括:
图像预处理模块1,用于将待处理图像转换为灰度图像,进而对所述灰度图像进行二值化;预处理模块包括:
灰度图像生成单元11,用于扫描目标图像,将目标图像中像素点的值用公式表示为Irgb=(FR,FG,FB)。对于目标图像中的曲线部分,其视觉表现为黑色联通像素点构成的有限集合,为了更好的对曲线进行提取,仅需保留目标图像中的主要成分,即视觉效果较暗的像素点。将步骤1011中得到的像素值变换为灰度像素值,其变换过程可用公式表示为Iy=0.333*FR+0.5*FG+0.1666*FB
首先,去除在目标图像中表现为较暗成分的噪点。对于这些噪点,根据大津法求出灰度图像的阈值t,其公式表示如下:
Figure GDA0004125523900000101
其中,权重wi是被阈值t分开的两个类的概率,而
Figure GDA0004125523900000102
是这两个类的方差。
二值化图像生成单元12,用于求出图像阈值t后,根据方程式
Figure GDA0004125523900000111
对灰度图像中的像素点进行变换,得到二值化图像。
图像去噪模块2,用于对所述二值化图像进行有效区域图像的提取,并对所述有效区域图像去噪;
所述图像去噪模块2,具体包括:
有效区域提取单元21,用于进行判断所述二值化图像的性质,并进行有效区域图像提取,若所述二值化图像为包括横轴与纵轴两条坐标轴两条直线的标准曲线图像,则采用霍夫变换提取横轴与纵轴的像素点集合,并根据像素点集合提取有效区域图像;
具体的,在频域上,采用霍夫变换提取横轴与纵轴的像素点集合。
对提取到的横轴与纵轴像素点集合,取坐标中的极值点xmin,xmax,ymin,ymax,其公式表示如下:
xmin=min(xy1,xy2,...,xyn),xmax=max(xx1,xx2,...,xxn)
ymin=min(yy1,yy2,...,yyn),ymax=max(yx1,yx2,...,yxn)
其中,xx1,xx2,...,xxn为横轴像素点集合中所有像素点的横轴坐标值构成的无序序列,yx1,yx2,...,yxn为横轴像素点集合中所有像素点的纵轴坐标值构成的无序序列,xy1,xy2,...,xyn为纵轴像素点集合中所有像素点的横轴坐标值构成的无序序列,yy1,yy2,...,yyn为纵轴像素点集合中所有像素点的纵轴坐标值构成的无序序列。
以点(xmin,ymin)为起点,以点(xmax,ymax)为终点,在二值化图像中提取有效区域图像。
在空域上,若所述二值化图像中存在闭合矩形图像的部分图像,采用最大联通区域法提取有效区域图像。具体的,
S1首先新建大小与二值化图像相同的访问图像,用于记录二值化图像的扫描情况。在访问图像中,像素值为黑的点表示该点二值化图像已被扫描过,像素值为白的点表示该点在二值化图像中未被扫描过。新建访问临时区,用于存放后续步骤中访问到的像素点。
S2新建区域坐标区,扫描二值化图像中的点,取点Pbegin(x,y)满足公式x=min(x1,x2,...,xn)
其中xx1,xx2,...,xxn为二值化图像中,所有像素点值为黑的点,其横轴坐标值构成的无序序列。
S3将点Pbegin放入访问临时区,将访问图像中点Pbegin所对应点的像素值置为黑。
S4取出访问临时区中的点Ptop,将其放入区域坐标区;扫描点Ptop 8邻域中的点P1,P2,...,P8,对于点Pi,如果其访问图像所对应的点的像素值为白,将点Pi加入访问临时区,并且将访问图像中点Pi所对应点的像素值置为黑。
S5,如果访问临时区不为空,则重复步骤S4;否则记录区域坐标区中像素点的个数。
S6,如果访问图像中仍存在像素值为黑的点,则重复步骤S2;否则取像素点个数最大的区域坐标区。
S7,取区域坐标区中的极值点xmin,xmax,ymin,ymax,其公式表示如下
xmin=min(x1,x2,...,xn),xmax=max(x1,x2,...,xn)
ymin=min(y1,y2,...,yn),ymax=max(y1,y2,...,yn)
其中,x1,x2,...,xn为区域坐标区中所有像素点的横轴坐标值构成的无序序列,y1,y2,...,yn为区域坐标区中所有像素点的纵轴坐标值构成的无序序列。
以点(xmin,ymin)为起点,以点(xmax,ymax)为终点,在二值化图像中提取有效区域图像。
有效区域提取单元得到的有效区域图像中仍存在坐标轴、刻度线,网格线以及噪声点等干扰值。在一般的曲线图像中,坐标轴、刻度线、网格线等垂直于横轴方向或纵轴方向,利用该特性,可对部分干扰点去除。
因此,图像去噪模块2还包括有效区域去噪单元22,用于对所述有效区域图像去噪,具体包括:
像素点扫描单元221,用于对所述有效区域图像逐行、逐列进行扫描,将其中像素值为黑的点加入临时区;
干扰值区域判断单元222,用于判断像素点是否为干扰值区域,若临时区中像素点的个数大于第一设定阈值,则这些像素点为干扰值区域;否则重复像素点扫描单元;
干扰值区域扫描单元223,用于扫描所述干扰值区域中的曲线上的点,并扫描其中可能存在曲线上的点。对于每个点Pt,扫描其8邻域中的点P1,P2,...,P8,如果这些点中像素值为黑的点的个数大于第一设定阈值,认为该点为曲线上的点,将其在干扰值区域中去除。
重复单元224,如果干扰值区域未扫描完,则重复干扰值区域扫描单元223;否则将干扰值区域中的点在有效区域图像中的像素值置为白,如果图像未扫描完成,则重复像素点扫描单元221;否则输出初步去噪图像;
去噪图像生成单元225,用于扫描所述初步去噪图像中的每个点,如果其24邻域中黑像素点小于所述第一设定阈值,认为其为孤立噪声点,将其在有效区域图像中的像素值置为白,得到去噪图像。
曲线提取模块3,用于采用概率学方法对所述去噪后的图像进行曲线提取,得到对应的曲线数据,输出曲线区域。
具体包括:
局部图像分割单元31,寻找曲线I的起始部分,即寻找
Figure GDA0004125523900000131
在局部区域中的聚类。创建曲线区域,以第二设定阈值为步长,分割去噪图像为局部图像。在局部图像中,利用最大联通区域法寻找最大连通区域集合;
首先,对于去噪图像,图像中曲线的起始点均位于有效区域图像中相对靠左的位置。设曲线I的起始点为
Figure GDA0004125523900000132
满足公式:
Figure GDA0004125523900000133
其中,x1,x2,...,xn为曲线I上点
Figure GDA0004125523900000134
的横坐标值构成的无序序列,y1,y2,...,yn为曲线I上点/>
Figure GDA0004125523900000141
的纵坐标值构成的无序序列。
设曲线I的终点为
Figure GDA0004125523900000142
满足公式:
Figure GDA0004125523900000143
在去噪图像中找出n个点
Figure GDA0004125523900000144
使得这些点构成曲线I的条件概率argmaxIP最大,认为这些点是对曲线I最可能的识别,满足全概率公式:
Figure GDA0004125523900000145
起始区域判断单元32,若集合的元素个数大于第二设定阈值,认为局部图像中存在某一曲线I的起始部分,将集合中的像素点加入曲线区域;否则,认为局部图像中不存在某一曲线的起始部分,则重复局部图像分割单元,若无法继续分割图像,则认为去噪图像中所有曲线均识别完成,结束。
下一区域选择单元33,用于选择曲线区域中一点PS(x,y),将x作为分割下一局部图像的起始点,以第二设定阈值为步长,分割去噪图像为当前局部图像;
选择曲线区域中一点PS(x,y),满足公式:
y→max(y1,y2,...,yn)
其中,y1,y2,...,yn为曲线区域中像素点纵坐标值构成的无序序列。将x作为分割下一局部图像的起始点,以第二设定阈值为步长,分割去噪图像为当前局部图像。
概率分布计算单元34,用于计算曲线区域的条件概率Px,计算曲线I在当前局部图像的概率分布;
计算曲线区域的条件概率Px,计算曲线I在当前局部图像的概率分布。联通区域N是曲线I在当前局部图像的区域的概率PN满足:选择联通区域集合中一点PN(xN,yN),满足公式:
xN→min(x1,x2,...,xn)
其中,x1,x2,...,xn为联通区域中像素点横坐标值构成的无序序列,对这样的PN(xN,yN)求与其点PS(x,y)的欧式距离
Figure GDA0004125523900000151
LNS的值越小,该联通区域作为曲线I在当前局部图像的区域的条件概率P越高。
联通区域判断单元35,用于选择条件概率最高的联通区域,若联通区域中的元素个数大于第二设定阈值,则将联通区域加入曲线区域,转入下一区域选择单元;否则认为曲线I在当前局部图像的部分不存在,即曲线I识别完成,输出曲线区域;
将曲线区域在去噪图像中对应的像素点置为白,迭代上述单元,直到所有曲线提取完成。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (4)

1.一种图像处理方法,其特征在于,该方法包括:
(1)将待处理图像转换为灰度图像,进而对所述灰度图像进行二值化;
(2)对所述二值化图像进行有效区域图像的提取,并对所述有效区域图像去噪;
(3)采用概率学方法对所述去噪后的图像进行曲线提取,得到对应的曲线数据,输出曲线区域;
所述步骤(2)中,对所述二值化图像进行有效区域图像的提取具体包括:
若所述二值化图像为包括横轴与纵轴两条坐标轴两条直线的标准曲线图像,则采用霍夫变换提取横轴与纵轴的像素点集合,并根据像素点集合提取有效区域图像;
若所述二值化图像中存在闭合矩形图像的部分图像,采用最大联通区域法提取有效区域图像;
对所述有效区域图像去噪,具体包括:
(21)对所述有效区域图像逐行、逐列进行扫描,将其中像素值为黑的点加入临时区;
(22)若临时区中像素点的个数大于第一设定阈值,则这些像素点为干扰值区域;否则重复步骤(21);
(23)扫描所述干扰值区域中的曲线上的点,并扫描其8邻域中的点,如果某个点中像素值为黑的点的个数大于所述第一设定阈值,则认为该点为曲线上的点,将其在干扰值区域中去除,否则,将干扰值区域中的点在有效区域图像中的像素值置为白;
(24)重复步骤(21),直至扫描完成有效区域图像,输出初步去噪图像;
(25)对于所述初步去噪图像,扫描图像中的每个点,如果其24邻域中黑像素点小于所述第一设定阈值,认为其为孤立噪声点,将其在有效区域图像中的像素值置为白,得到去噪图像;
所述步骤(3)中,采用概率学方法对所述去噪后的图像进行曲线提取,具体步骤包括:
(31)分割所述去噪图像为局部图像,利用最大联通区域法寻找最大连通区域集合;
(32)若最大连通区域集合的元素个数大于第二设定阈值,认为局部图像中存在某一曲线I的起始部分,将集合中的像素点加入曲线区域;否则,认为局部图像中不存在某一曲线I的起始部分,重复步骤(31);
(33)选择曲线区域中一点Ps(x,y),将x作为分割下一局部图像的起始点,以第二设定阈值为步长,分割去噪图像为当前局部图像;
且y→max(y1,y2,...,yn)
其中,y1,y2,...,yn为曲线区域中像素点纵坐标值构成的无序序列;(34)计算曲线区域的条件概率Px,计算曲线I在当前局部图像的概率分布;
(35)选择条件概率最高的联通区域,若联通区域中的元素个数大于第二设定阈值,则将联通区域加入曲线区域,重复步骤(33);否则认为曲线I在当前局部图像的部分不存在,即曲线I识别完成,输出曲线I的曲线区域;
(36)迭代上述步骤,直到所有曲线提取完成。
2.根据权利要求1所述的图像处理方法,其特征在于,所述步骤(35)中,联通区域是曲线I在当前局部图像的区域的概率RN满足:选择联通区域集合中一点PN(xN,yN),满足公式
xN→min(x1,x2,...,xn)
其中,x1,x2,...,xn为联通区域中像素点横坐标值构成的无序序列,对这样的PN(xN,yN)求与其点PS(x,y)的欧式距离
Figure QLYQS_1
LNS的值越小,该联通区域作为曲线I在当前局部图像的区域的条件概率P越高。
3.一种根据权利要求1或2所述的图像处理方法实现的图像处理系统,其特征在于,所述系统包括:
图像预处理模块,用于将待处理图像转换为灰度图像,进而对所述灰度图像进行二值化;
图像去噪模块,用于对所述二值化图像进行有效区域图像的提取,并对所述有效区域图像去噪;
曲线提取模块,用于采用概率学方法对所述去噪后的图像进行曲线提取,得到对应的曲线数据,输出曲线区域;
所述图像去噪模块,具体包括:有效区域提取单元,用于进行判断所述二值化图像的性质,并进行有效区域图像提取,若所述二值化图像为包括横轴与纵轴两条坐标轴两条直线的标准曲线图像,则采用霍夫变换提取横轴与纵轴的像素点集合,并根据像素点集合提取有效区域图像;
若所述二值化图像中存在闭合矩形图像的部分图像,采用最大联通区域法提取有效区域图像;
所述图像去噪模块还包括有效区域去噪单元,用于对所述有效区域图像去噪,具体包括:
像素点扫描单元,用于对所述有效区域图像逐行、逐列进行扫描,将其中像素值为黑的点加入临时区;
干扰值区域判断单元,用于判断像素点是否为干扰值区域,若临时区中像素点的个数大于第一设定阈值,则这些像素点为干扰值区域;否则重复像素点扫描单元;
干扰值区域扫描单元,用于扫描所述干扰值区域中的曲线上的点,并扫描其8邻域中的点,如果某个点中像素值为黑的点的个数大于所述第一设定阈值,则认为该点为曲线上的点,将其在干扰值区域中去除,否则,将干扰值区域中的点在有效区域图像中的像素值置为白;
重复单元,用重复像素点扫描单元,直至扫描完成有效区域图像,输出初步去噪图像;
去噪图像生成单元,用于扫描所述初步去噪图像中的每个点,如果其24邻域中黑像素点小于所述第一设定阈值,认为其为孤立噪声点,将其在有效区域图像中的像素值置为白,得到去噪图像;
所述曲线提取模块,还包括:
局部图像分割单元,用于分割所述去噪图像为局部图像,利用最大联通区域法寻找最大连通区域集合;
起始区域判断单元,若最大连通区域集合的元素个数大于第二设定阈值,认为局部图像中存在某一曲线I的起始部分,将集合中的像素点加入曲线区域;否则,认为局部图像中不存在某一曲线I的起始部分,转入局部图像分割单元;
下一区域选择单元,用于选择曲线区域中一点PS(x,y),将x作为分割下一局部图像的起始点,以第二设定阈值为步长,分割去噪图像为当前局部图像;
概率分布计算单元,用于计算曲线区域的条件概率Px,计算曲线I在当前局部图像的概率分布;
联通区域判断单元,用于选择条件概率最高的联通区域,若联通区域中的元素个数大于第二设定阈值,则将联通区域加入曲线区域,转入下一区域选择单元;否则认为曲线I在当前局部图像的部分不存在,即曲线I识别完成,输出曲线区域;
迭代上述单元,直到所有曲线提取完成。
4.根据权利要求3所述的图像处理系统,其特征在于,所述联通区域判断单元中,联通区域是曲线I在当前局部图像的区域的概率PN满足:选择联通区域集合中一点PN(xN,yN),满足公式
xN→min(x1,x2,...,xn)
其中,x1,x2,...,xn为联通区域中像素点横坐标值构成的无序序列,对这样的PN(xN,yN)求与其点Ps(x,y)的欧式距离
Figure QLYQS_2
LNS的值越小,该联通区域作为曲线I在当前局部图像的区域的条件概率P越高。
CN201910291683.3A 2019-04-12 2019-04-12 一种图像处理方法及系统 Active CN110060260B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910291683.3A CN110060260B (zh) 2019-04-12 2019-04-12 一种图像处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910291683.3A CN110060260B (zh) 2019-04-12 2019-04-12 一种图像处理方法及系统

Publications (2)

Publication Number Publication Date
CN110060260A CN110060260A (zh) 2019-07-26
CN110060260B true CN110060260B (zh) 2023-06-20

Family

ID=67318843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910291683.3A Active CN110060260B (zh) 2019-04-12 2019-04-12 一种图像处理方法及系统

Country Status (1)

Country Link
CN (1) CN110060260B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569774B (zh) * 2019-08-30 2022-07-05 武汉大学 基于图像处理与模式识别的折线图图像自动数字化方法
CN112927288B (zh) * 2019-11-21 2024-03-29 北京配天技术有限公司 图像坐标提取方法、图像处理设备及存储装置
CN112750136B (zh) * 2020-12-30 2023-12-05 深圳英集芯科技股份有限公司 一种图像处理方法和系统
CN113359216A (zh) * 2021-06-03 2021-09-07 山东捷瑞数字科技股份有限公司 用于翻斗式雨量计记录数据识别的方法、系统和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4608927B2 (ja) * 2004-03-31 2011-01-12 コニカミノルタエムジー株式会社 画像処理方法及び画像処理装置並びに画像処理プログラム
JP2006065452A (ja) * 2004-08-25 2006-03-09 Takeshi Hashimoto n次元のハフ変換による画像データ処理方法及び装置
CN103488986B (zh) * 2013-09-18 2016-01-27 西安理工大学 自适应字符切分及提取方法
CN106228159A (zh) * 2016-07-29 2016-12-14 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN106156761B (zh) * 2016-08-10 2020-01-10 北京交通大学 面向移动终端拍摄的图像表格检测与识别方法
CN109101974B (zh) * 2018-08-06 2020-09-01 京东数字科技控股有限公司 针对线状干扰的去噪方法和去噪装置

Also Published As

Publication number Publication date
CN110060260A (zh) 2019-07-26

Similar Documents

Publication Publication Date Title
CN110060260B (zh) 一种图像处理方法及系统
US8200012B2 (en) Image determination apparatus, image search apparatus and computer readable recording medium storing an image search program
US6347156B1 (en) Device, method and storage medium for recognizing a document image
CN107045634B (zh) 一种基于最大稳定极值区域与笔画宽度的文本定位方法
US9275279B2 (en) Image processing apparatus and image processing method
CN105469026B (zh) 针对文档图像的水平和垂直线检测和移除
CN107871319B (zh) 限束器区域的检测方法、装置、x射线系统和存储介质
US8300939B2 (en) Image processing method, image processing apparatus, and program
CN114529459B (zh) 一种对图像边缘进行增强处理的方法和系统及介质
JP4772819B2 (ja) 画像検索装置および画像検索方法
CN111915628B (zh) 一种基于预测目标密集边界点的单阶段实例分割方法
JP2009246930A (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
CN115578741A (zh) 一种基于Mask R-cnn算法和类型分割的扫描文件版面分析方法
CN102136074A (zh) 一种基于mmi的木材图像纹理分析与识别方法
CN110826360A (zh) Ocr图像预处理与文字识别
CN110766708B (zh) 基于轮廓相似度的图像比较方法
Ling et al. Quality assessment for synthesized view based on variable-length context tree
CN111179289A (zh) 一种适用于网页长图宽图的图像分割方法
CN114511862B (zh) 表格识别方法、装置及电子设备
CN107818579B (zh) 基于四元数Gabor滤波的彩色纹理特征提取方法
CN113486881B (zh) 一种文本识别方法、装置、设备及介质
CN110705568B (zh) 一种图像特征点提取的优化方法
CN114648751A (zh) 一种处理视频字幕的方法、装置、终端及存储介质
Vinod et al. Camera captured document de-warping and de-skewing
CN111476800A (zh) 一种基于形态学操作的文字区域检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant