CN116342638A - 基于相变和扩散神经网络的图像元素提取方法 - Google Patents
基于相变和扩散神经网络的图像元素提取方法 Download PDFInfo
- Publication number
- CN116342638A CN116342638A CN202310336320.3A CN202310336320A CN116342638A CN 116342638 A CN116342638 A CN 116342638A CN 202310336320 A CN202310336320 A CN 202310336320A CN 116342638 A CN116342638 A CN 116342638A
- Authority
- CN
- China
- Prior art keywords
- image
- similarity
- level
- preset
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 51
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 18
- 238000009792 diffusion process Methods 0.000 title claims abstract description 18
- 230000008859 change Effects 0.000 title claims abstract description 10
- 238000012937 correction Methods 0.000 claims abstract description 108
- 238000003062 neural network model Methods 0.000 claims abstract description 9
- 238000009499 grossing Methods 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 23
- 238000001514 detection method Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 12
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种基于相变和扩散神经网络的图像元素提取方法,包括获取原始图像并识别原始图像中的物体轮廓;获取原始图像的灰度图像;将灰度图像平均分为设定数量的局部图像,并确定任一局部图像的最佳阈值,以区分背景图和目标图;计算任一目标图轮廓与原始图像中相应的物体轮廓的图形相似度,在第二相似度水平下确定对相应的最佳阈值的校正方式;检测任一局部图像中提取出的目标图的噪声点数量,在第二数量水平下确定对划分的局部图像的数量的修正方式;合并重建目标图以输出二值图,对二值图进行平滑处理以得到特征图像;将所述特征图像输入至神经网络模型,以输出图像元素提取结果。本发明提高了图像元素提取的清晰度和提取精度。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于相变和扩散神经网络的图像元素提取方法。
背景技术
图像元素提取是指从图像中提取图像中包含的元素的过程,图像元素包括图形元素和文字元素。
中国专利申请公开号:CN114202602A公开了一种图像设计元素的提取方法、提取装置和电子设备,图像设计元素的提取方法,包括:获取目标图像;将目标图像输入至目标神经网络模型,根据目标神经网络模型的输出结果,获得目标图像对应的多个第一元素图像块;接收用户的第一输入;响应于第一输入,从多个第一元素图像块中确定目标第一元素图像块,目标第一元素图像块用于对目标神经网络模型进行后续优化。
然而,现有技术中,对图像元素提取的清晰度和提取精度还有待提高。
发明内容
为此,本发明提供一种基于相变和扩散神经网络的图像元素提取方法,用以克服现有技术中对图像元素提取的清晰度和提取精度较差的问题。
为实现上述目的,本发明提供一种基于相变和扩散神经网络的图像元素提取方法,包括:
步骤S1,图像获取模块获取原始图像并识别原始图像中的物体轮廓;
步骤S2,图像处理模块对所述原始图像进行灰度化处理以获取灰度图像;
步骤S3,区域划分模块将所述灰度图像平均分为设定数量的局部图像,并确定任一所述局部图像的最佳阈值,以区分局部图像的背景图和目标图;
步骤S4,所述区域划分模块计算任一所述目标图轮廓与原始图像中相应的所述物体轮廓的图形相似度,在第二相似度水平下确定对相应的所述最佳阈值的校正方式并跳转至所述步骤S3,在第一相似度水平下进入步骤S5;
步骤S5,图像检测模块检测任一所述局部图像中提取出的目标图的噪声点数量,在第二数量水平下确定对划分的局部图像的数量的修正方式并跳转至所述步骤S3,在第一数量水平下进入步骤S6;
步骤S6,合并重建所述目标图以输出二值图,对所述二值图进行平滑处理以得到特征图像;
步骤S7,将所述特征图像输入至神经网络模型,以输出图像元素提取结果。
进一步地,在所述步骤S3中,所述区域划分模块中设有将所述灰度图像划分为局部图像的划分方式;
第一划分方式为将所述灰度图像划分为第一数量的局部图像;
第二划分方式为将所述灰度图像划分为第二数量的局部图像;
第三划分方式为将所述灰度图像划分为第三数量的局部图像;
其中,第一数量<第二数量<第三数量。
进一步地,所述区域划分模块计算灰度图像的像素与预设像素的像素比值,设定像素比值=灰度图像的像素/预设像素,并根据像素比值确定将所述灰度图像划分为局部图像的划分方式;
若像素比值处于第一像素比值水平,所述区域划分模块判定选用第一划分方式;
若像素比值处于第二像素比值水平,所述区域划分模块判定选用第二划分方式;
若像素比值处于第三像素比值水平,所述区域划分模块判定选用第三划分方式;
所述第一划分方式满足像素比值大于等于第二预设像素比值,所述第二划分方式满足像素比值小于第二预设像素比值且大于等于第一预设像素比值,所述第三划分方式满足像素比值小于第一预设像素比值。
进一步地,在所述步骤S3中,所述区域划分模块采用最大类间方差法确定任一局部图像的最佳阈值,并对局部图像的所有像素进行遍历;
若像素的灰度值处于第一灰度值水平,所述区域划分模块将该像素点记为背景图,并将背景图的灰度值设为0;
若像素的灰度值处于第二灰度值水平,所述区域划分模块将该像素点记为目标图,并将目标图的灰度值设为255;
所述第一灰度值水平满足像素的灰度值小于最佳阈值,所述第二灰度值水平满足像素的灰度值大于等于最佳阈值。
进一步地,在所述步骤S4中,所述区域划分模块计算任一所述目标图轮廓与原始图像中相应的所述物体轮廓的图形相似度以判定是否对该目标图所处的局部图像的最佳阈值进行校正;
若图形相似度处于第一相似度水平,所述区域划分模块判定无需对最佳阈值进行校正;
若图形相似度处于第二相似度水平,所述区域划分模块判定需对最佳阈值进行校正;
所述第一相似度水平满足图形相似度大于等于预设相似度标准,所述第二相似度水平满足图形相似度小于预设相似度标准。
进一步地,所述区域划分模块中设有对所述最佳阈值的校正方式;
第一校正方式为,所述区域划分模块将所述最佳阈值校正至第一阈值;
第二校正方式为,所述区域划分模块将所述最佳阈值校正至第二阈值;
第三校正方式为,所述区域划分模块将所述最佳阈值校正至第三阈值;
其中,第一阈值<第二阈值<第三阈值<最佳阈值;
所述区域划分模块以校正后的阈值重新区分局部图像的背景图和目标图。
进一步地,所述区域划分模块计算图形相似度与预设相似度标准的相似度差值,设定相似度差值=预设相似度标准-图形相似度,区域划分模块根据相似度差值确定对所述最佳阈值进行校正的调节方式;
若相似度差值处于第一相似度差值水平,所述区域划分模块判定选用第一校正方式;
若相似度差值处于第二相似度差值水平,所述区域划分模块判定选用第二校正方式;
若相似度差值处于第三相似度差值水平,所述区域划分模块判定选用第三校正方式;
所述第一相似度差值水平满足相似度差值大于等于第二预设相似度差值,所述第二相似度差值水平满足相似度差值小于第二预设相似度差值且大于等于第一预设相似度差值,所述第三相似度差值水平满足相似度差值小于第一预设相似度差值。
进一步地,在所述步骤S5中,所述图像检测模块检测任一所述局部图像中提取出的目标图的噪声点数量,所述图像检测模块根据噪声点数量判定是否对划分的局部图像的数量进行修正,
若目标图的噪声点数量处于第一数量水平,所述图像检测模块判定目标图的噪声点数量符合标准,无需对划分的局部图像的数量进行修正;
若目标图的噪声点数量处于第二数量水平,所述图像检测模块判定目标图的噪声点数量不符合标准,需对划分的局部图像的数量进行修正;
所述第一数量水平满足目标图的噪声点数量小于等于预设噪声点数量,所述第二数量水平满足目标图的噪声点数量大于预设噪声点数量。
进一步地,所述区域划分模块中设有对所述局部图像的数量的修正方式;
第一修正方式为,所述区域划分模块将所述局部图像的数量修正至第一修正数量;
第二修正方式为,所述区域划分模块将所述局部图像的数量修正至第二修正数量;
第三修正方式为,所述区域划分模块将所述局部图像的数量修正至第三修正数量;
其中,第一修正数量>第二修正数量>第三修正数量。
进一步地,所述区域划分模块计算目标图的噪声点数量与预设噪声点数量的噪声点比值,设定噪声点比值=目标图的噪声点数量/预设噪声点数量,并根据噪声点比值确定选用的修正方式;
若噪声点比值处于第一噪声点比值水平,所述区域划分模块判定选用第一修正方式;
若噪声点比值处于第二噪声点比值水平,所述区域划分模块判定选用第二修正方式;
若噪声点比值处于第三噪声点比值水平,所述区域划分模块判定选用第三修正方式;
所述第一修正方式满足噪声点比值大于等于第二预设噪声点比值,所述第二修正方式满足噪声点比值小于第二预设噪声点比值且大于等于第一预设噪声点比值,所述第三修正方式满足噪声点比值小于第一预设噪声点比值。
与现有技术相比,本发明的有益效果在于,不同于以往的对全局图像进行二值化以区分背景图和目标图的方法,本发明将获取的灰度图像划分为若干局部图像,以对局部图像单独进行区分背景图和目标图,通过以上技术方案,提高了图像元素提取的清晰度和提取精度。
进一步地,本发明区域划分模块计算灰度图像的像素与预设像素的像素比值,若像素比值越大,则说明灰度图像的分辨率越高,此时,可将局部图像的划分数量设定为一个较小的值,即可实现高提取精度和清晰度,同时提高了图像元素的提取速度;若像素比值越小,则说明灰度图像的分辨率较低,此时,可将局部图像的划分数量设定为一个较大的值,以高提取精度和清晰度。
进一步地,本发明区域划分模块计算任一所述目标图轮廓与原始图像中相应的所述物体轮廓的图形相似度,若相似度较高,则说明目标图提取的较为准确,此时,无需对最佳阈值进行校正,若相似度较低,则说明目标图提取的准确性较差,此时,对最佳阈值进行校正,以减小阈值,从而扩大目标图提取的轮廓,避免图像元素的遗失,之后通过训练好的神经网络模型对输入的特征图像进行识别以输出图像元素提取结果,进一步提高了图像元素提取的清晰度和提取精度。
进一步地,本发明图像检测模块在检测到目标图的噪声点数量处于第二数量水平时,对划分的局部图像的数量进行修正,以降低目标图的噪声,提高了目标图的清晰度,进而提高了图像元素提取的清晰度和提取精度。
附图说明
图1为本发明实施例基于相变和扩散神经网络的图像元素提取方法的流程图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
请参阅图1所示,其为本发明实施例基于相变和扩散神经网络的图像元素提取方法的流程图,本发明所述基于相变和扩散神经网络的图像元素提取方法包括:
步骤S1,图像获取模块获取原始图像并识别原始图像中的物体轮廓;
步骤S2,图像处理模块对所述原始图像进行灰度化处理以获取灰度图像;
步骤S3,区域划分模块将所述灰度图像平均分为设定数量的局部图像,并确定任一所述局部图像的最佳阈值,以区分局部图像的背景图和目标图;
步骤S4,所述区域划分模块计算任一所述目标图轮廓与原始图像中相应的所述物体轮廓的图形相似度,在第二相似度水平下确定对相应的所述最佳阈值的校正方式并跳转至所述步骤S3,在第一相似度水平下进入步骤S5;
步骤S5,图像检测模块检测任一所述局部图像中提取出的目标图的噪声点数量,在第二数量水平下确定对划分的局部图像的数量的修正方式并跳转至所述步骤S3,在第一数量水平下进入步骤S6;
步骤S6,合并重建所述目标图以输出二值图,对所述二值图进行平滑处理以得到特征图像;
步骤S7,将所述特征图像输入至神经网络模型,以输出图像元素提取结果。
在所述步骤S2中,常见的图像灰度化处理方法有最大值法、平均值法、加权平均值法等三种,本实施例中,优选加权平均值法对原始图像进行灰度化处理。灰度图像能用较少的数据信息表示图像的大部分特征,这样不仅能够增加后续算法的处理速度,而且能够增强图像对比度。
在所述步骤S6中,本实施例采用中值滤波的方法对二值图进行平滑处理,中值滤波在消除孤立的噪声像素点的同时,能够很好的保护图像信号的边缘。
不同于以往的对全局图像进行二值化以区分背景图和目标图的方法,本发明将获取的灰度图像划分为若干局部图像,以对局部图像单独进行区分背景图和目标图,通过以上技术方案,提高了图像元素提取的清晰度和提取精度。
在所述步骤S3中,所述区域划分模块将所述灰度图像平均分为设定数量的局部图像之前,将灰度图像的像素V与预设像素V0进行比对以判定灰度图像的像素是否符合标准;
若灰度图像的像素处于第一像素水平,所述区域划分模块判定灰度图像的像素符合标准并对灰度图像进行划分;
若灰度图像的像素处于第二像素水平,所述区域划分模块判定灰度图像的像素不符合标准并重新获取原始图像;
所述第一像素水平满足灰度图像的像素V大于预设像素V0,所述第二像素水平满足灰度图像的像素V小于等于预设像素V0。
在所述步骤S3中,所述区域划分模块中设有将所述灰度图像划分为局部图像的划分方式;
第一划分方式为将所述灰度图像划分为第一数量的局部图像;
第二划分方式为将所述灰度图像划分为第二数量的局部图像;
第三划分方式为将所述灰度图像划分为第三数量的局部图像;
其中,第一数量<第二数量<第三数量。
所述区域划分模块计算灰度图像的像素V与预设像素V0的像素比值B,设定像素比值B=灰度图像的像素V/预设像素V0,并根据像素比值B确定将所述灰度图像划分为局部图像的划分方式;
若像素比值B处于第一像素比值水平,所述区域划分模块判定选用第一划分方式;
若像素比值B处于第二像素比值水平,所述区域划分模块判定选用第二划分方式;
若像素比值B处于第三像素比值水平,所述区域划分模块判定选用第三划分方式;
所述第一划分方式满足像素比值B大于等于第二预设像素比值B2,所述第二划分方式满足像素比值B小于第二预设像素比值B2且大于等于第一预设像素比值B1,所述第三划分方式满足像素比值B小于第一预设像素比值B1。
本实施例提供一种优选的实施方式,采用调节系数的方式确定局部图像的划分数量;
所述区域划分模块中设有第一预设数量调节系数α1、第二预设数量调节系数α2以及第三预设数量调节系数α3,
第一划分方式为使用第一预设数量调节系数α1将灰度图像划分为第一数量N1的局部图像,设定N1=N0×α1;
第二划分方式为使用第一预设数量调节系数α2将灰度图像划分为第二数量N2的局部图像,设定N2=N0×α2;
第三划分方式为使用第一预设数量调节系数α3将灰度图像划分为第三数量N3的局部图像,设定N3=N0×α3;
N0为灰度图像的像素V等于预设像素V0时的局部图像的初始数量,N0<N1<N2<N3;
本实施例限定2<α1<α2<α3<6,优选α1=3,α2=4,α3=5。
第一预设像素比值B1<第二预设像素比值B2,本实施例限定10<B1<B2<100,优选B1=30,B2=70。本实施例中优选预设像素V0为1000万像素。
本实施例提供另一种可实施方式,采用增量的方式确定局部图像的划分数量。
本发明区域划分模块计算灰度图像的像素与预设像素的像素比值,若像素比值越大,则说明灰度图像的分辨率越高,此时,可将局部图像的划分数量设定为一个较小的值,即可实现高提取精度和清晰度,同时提高了图像元素的提取速度;若像素比值越小,则说明灰度图像的分辨率较低,此时,可将局部图像的划分数量设定为一个较大的值,以高提取精度和清晰度。
在所述步骤S3中,所述区域划分模块采用最大类间方差法确定任一局部图像的最佳阈值Y0,并对局部图像的所有像素进行遍历;
若像素的灰度值处于第一灰度值水平,所述区域划分模块将该像素点记为背景图,并将背景图的灰度值设为0;
若像素的灰度值处于第二灰度值水平,所述区域划分模块将该像素点记为目标图,并将目标图的灰度值设为255;
所述第一灰度值水平满足像素的灰度值小于最佳阈值Y0,所述第二灰度值水平满足像素的灰度值大于等于最佳阈值Y0。
在所述步骤S3中,最大类间方差法是一种图像二值化算法,它对输入图像进行全局搜索,当各个像素点灰度的方差达到最大时,对应的灰度值即为最佳阈值,此时目标图与背景图的差距最大。根据图像中像素点的灰度大小是否大于该阈值,将图像中的像素点分为两大类:一类为图像的前景图,另一类为图像的背景图,本实施例中,将灰度图像平均分为若干局部图像,寻找每一块局部图像的最大类间方差,其对应的灰度值即为该块局部图像对应的最佳阈值。接下来,对局部图像的所有像素进行遍历,灰度值低于阈值的像素点被分割为背景图,灰度值高于阈值的像素点被分割为目标图。通过将灰度图像平均分为若干局部图像的方法,明显降低了目标图的噪声,提高了目标图的清晰度,进而提高了图像元素提取的准确性和清晰度。
在所述步骤S4中,所述区域划分模块计算任一所述目标图轮廓与原始图像中相应的所述物体轮廓的图形相似度Q以判定是否对该目标图所处的局部图像的最佳阈值Y0进行校正;
若图形相似度Q处于第一相似度水平,所述区域划分模块判定无需对最佳阈值Y0进行校正;
若图形相似度Q处于第二相似度水平,所述区域划分模块判定需对最佳阈值Y0进行校正;
所述第一相似度水平满足图形相似度Q大于等于预设相似度标准Q0,所述第二相似度水平满足图形相似度Q小于预设相似度标准Q0。
所述区域划分模块中设有对所述最佳阈值Y0的校正方式;
第一校正方式为,所述区域划分模块将所述最佳阈值校正至第一阈值;
第二校正方式为,所述区域划分模块将所述最佳阈值校正至第二阈值;
第三校正方式为,所述区域划分模块将所述最佳阈值校正至第三阈值;
其中,第一阈值<第二阈值<第三阈值<最佳阈值;
所述区域划分模块以校正后的阈值重新区分局部图像的背景图和目标图。
所述区域划分模块计算图形相似度Q与预设相似度标准Q0的相似度差值ΔQ,设定相似度差值ΔQ=预设相似度标准Q0-图形相似度Q,区域划分模块根据相似度差值ΔQ确定对所述最佳阈值Y0进行校正的调节方式;
若相似度差值ΔQ处于第一相似度差值水平,所述区域划分模块判定选用第一校正方式;
若相似度差值ΔQ处于第二相似度差值水平,所述区域划分模块判定选用第二校正方式;
若相似度差值ΔQ处于第三相似度差值水平,所述区域划分模块判定选用第三校正方式;
所述第一相似度差值水平满足相似度差值ΔQ大于等于第二预设相似度差值ΔQ2,所述第二相似度差值水平满足相似度差值ΔQ小于第二预设相似度差值ΔQ2且大于等于第一预设相似度差值ΔQ1,所述第三相似度差值水平满足相似度差值ΔQ小于第一预设相似度差值ΔQ1。
本实施例提供一种优选的实施方式,采用校正系数的方式对所述最佳阈值Y0进行校正;所述区域划分模块中设有第一预设校正系数γ1、第二预设校正系数γ2以及第三预设校正系数γ3;
第一校正方式为使用第一预设校正系数γ1将所述最佳阈值校正为第一阈值Y1,设定Y1=Y0×γ1;
第二校正方式为使用第二预设校正系数γ2将所述最佳阈值校正为第二阈值Y2,设定Y2=Y0×γ2;
第三校正方式为使用第三预设校正系数γ3将所述最佳阈值校正为第三阈值Y3,设定Y3=Y0×γ3;
其中,第一阈值Y1<第二阈值Y2<第三阈值Y3<最佳阈值Y0。
本实施例限定0.8<γ1<γ2<γ3<1,优选γ1=0.85,γ2=0.9,γ3=0.95。
第一预设相似度差值ΔQ1<第二预设相似度差值ΔQ2,本实施例限定5%<ΔQ1<ΔQ2<20%,优选ΔQ1=10%,ΔQ2=18%。
本发明区域划分模块计算任一所述目标图轮廓与原始图像中相应的所述物体轮廓的图形相似度,若相似度较高,则说明目标图提取的较为准确,此时,无需对最佳阈值进行校正,若相似度较低,则说明目标图提取的准确性较差,此时,对最佳阈值进行校正,以减小阈值,从而扩大目标图提取的轮廓,避免图像元素的遗失,之后通过训练好的神经网络模型对输入的特征图像进行识别以输出图像元素提取结果,进一步提高了图像元素提取的清晰度和提取精度。
在所述步骤S5中,所述图像检测模块检测任一所述局部图像中提取出的目标图的噪声点数量M,所述图像检测模块根据噪声点数量M判定是否对划分的局部图像的数量进行修正,
若目标图的噪声点数量M处于第一数量水平,所述图像检测模块判定目标图的噪声点数量符合标准,无需对划分的局部图像的数量进行修正;
若目标图的噪声点数量M处于第二数量水平,所述图像检测模块判定目标图的噪声点数量不符合标准,需对划分的局部图像的数量进行修正;
所述第一数量水平满足目标图的噪声点数量M小于等于预设噪声点数量M0,所述第二数量水平满足目标图的噪声点数量M大于预设噪声点数量M0。
在本实施例中,采用专利公开号CN109598723B公开的一种图像噪声检测方法及装置中的方法进行噪声点检测。
所述区域划分模块中设有对所述局部图像的数量的修正方式;
第一修正方式为,所述区域划分模块将所述局部图像的数量修正至第一修正数量;
第二修正方式为,所述区域划分模块将所述局部图像的数量修正至第二修正数量;
第三修正方式为,所述区域划分模块将所述局部图像的数量修正至第三修正数量;
其中,第一修正数量>第二修正数量>第三修正数量。
所述区域划分模块计算目标图的噪声点数量M与预设噪声点数量M0的噪声点比值D,设定噪声点比值D=目标图的噪声点数量M/预设噪声点数量M0,并根据噪声点比值D确定选用的修正方式;
若噪声点比值D处于第一噪声点比值水平,所述区域划分模块判定选用第一修正方式;
若噪声点比值D处于第二噪声点比值水平,所述区域划分模块判定选用第二修正方式;
若噪声点比值D处于第三噪声点比值水平,所述区域划分模块判定选用第三修正方式;
所述第一修正方式满足噪声点比值D大于等于第二预设噪声点比值D2,所述第二修正方式满足噪声点比值D小于第二预设噪声点比值D2且大于等于第一预设噪声点比值D1,所述第三修正方式满足噪声点比值D小于第一预设噪声点比值D1。
本实施例提供一种优选的实施方式,采用修正系数的方式对所述局部图像的数量进行修正;
所述区域划分模块中设有第一预设修正系数β1、第二预设修正系数β2以及第三预设修正系数β3,
第一修正方式为使用第一预设修正系数β1将所述局部图像的数量修正为第一修正数量W1的局部图像,设定W1=Ni×β1;
第二修正方式为使用第一预设修正系数β2将所述局部图像的数量修正为第二修正数量W2的局部图像,设定W2=Ni×β2;
第三修正方式为使用第一预设修正系数β3将所述局部图像的数量修正为第三修正数量W3的局部图像,设定W3=Ni×β3;
Ni为划分的所述局部图像的数量,i=1,2,3,W1>W2>W3;
本实施例限定1<β3<β2<β1<3,优选β1=2.5,β2=2,β3=1.5,当计算的修正后的数量不为正整数时,取大于修正后的数量的最小正整数;
第一预设噪声点比值D1<第二预设噪声点比值D2,本实施例限定5<D1<D2<20,优选D1=10,D2=15。
本发明图像检测模块在检测到目标图的噪声点数量处于第二数量水平时,对划分的局部图像的数量进行修正,以降低目标图的噪声,提高了目标图的清晰度,进而提高了图像元素提取的清晰度和提取精度。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于相变和扩散神经网络的图像元素提取方法,其特征在于,包括:
步骤S1,图像获取模块获取原始图像并识别原始图像中的物体轮廓;
步骤S2,图像处理模块对所述原始图像进行灰度化处理以获取灰度图像;
步骤S3,区域划分模块将所述灰度图像平均分为设定数量的局部图像,并确定任一所述局部图像的最佳阈值,以区分局部图像的背景图和目标图;
步骤S4,所述区域划分模块计算任一所述目标图轮廓与原始图像中相应的所述物体轮廓的图形相似度,在第二相似度水平下确定对相应的所述最佳阈值的校正方式并跳转至所述步骤S3,在第一相似度水平下进入步骤S5;
步骤S5,图像检测模块检测任一所述局部图像中提取出的目标图的噪声点数量,在第二数量水平下确定对划分的局部图像的数量的修正方式并跳转至所述步骤S3,在第一数量水平下进入步骤S6;
步骤S6,合并重建所述目标图以输出二值图,对所述二值图进行平滑处理以得到特征图像;
步骤S7,将所述特征图像输入至神经网络模型,以输出图像元素提取结果。
2.根据权利要求1所述的基于相变和扩散神经网络的图像元素提取方法,其特征在于,在所述步骤S3中,所述区域划分模块中设有将所述灰度图像划分为局部图像的划分方式;
第一划分方式为将所述灰度图像划分为第一数量的局部图像;
第二划分方式为将所述灰度图像划分为第二数量的局部图像;
第三划分方式为将所述灰度图像划分为第三数量的局部图像;
其中,第一数量<第二数量<第三数量。
3.根据权利要求2所述的基于相变和扩散神经网络的图像元素提取方法,其特征在于,所述区域划分模块计算灰度图像的像素与预设像素的像素比值,设定像素比值=灰度图像的像素/预设像素,并根据像素比值确定将所述灰度图像划分为局部图像的划分方式;
若像素比值处于第一像素比值水平,所述区域划分模块判定选用第一划分方式;
若像素比值处于第二像素比值水平,所述区域划分模块判定选用第二划分方式;
若像素比值处于第三像素比值水平,所述区域划分模块判定选用第三划分方式;
所述第一划分方式满足像素比值大于等于第二预设像素比值,所述第二划分方式满足像素比值小于第二预设像素比值且大于等于第一预设像素比值,所述第三划分方式满足像素比值小于第一预设像素比值。
4.根据权利要求3所述的基于相变和扩散神经网络的图像元素提取方法,其特征在于,在所述步骤S3中,所述区域划分模块采用最大类间方差法确定任一局部图像的最佳阈值,并对局部图像的所有像素进行遍历;
若像素的灰度值处于第一灰度值水平,所述区域划分模块将该像素点记为背景图,并将背景图的灰度值设为0;
若像素的灰度值处于第二灰度值水平,所述区域划分模块将该像素点记为目标图,并将目标图的灰度值设为255;
所述第一灰度值水平满足像素的灰度值小于最佳阈值,所述第二灰度值水平满足像素的灰度值大于等于最佳阈值。
5.根据权利要求4所述的基于相变和扩散神经网络的图像元素提取方法,其特征在于,在所述步骤S4中,所述区域划分模块计算任一所述目标图轮廓与原始图像中相应的所述物体轮廓的图形相似度以判定是否对该目标图所处的局部图像的最佳阈值进行校正;
若图形相似度处于第一相似度水平,所述区域划分模块判定无需对最佳阈值进行校正;
若图形相似度处于第二相似度水平,所述区域划分模块判定需对最佳阈值进行校正;
所述第一相似度水平满足图形相似度大于等于预设相似度标准,所述第二相似度水平满足图形相似度小于预设相似度标准。
6.根据权利要求5所述的基于相变和扩散神经网络的图像元素提取方法,其特征在于,所述区域划分模块中设有对所述最佳阈值的校正方式;
第一校正方式为,所述区域划分模块将所述最佳阈值校正至第一阈值;
第二校正方式为,所述区域划分模块将所述最佳阈值校正至第二阈值;
第三校正方式为,所述区域划分模块将所述最佳阈值校正至第三阈值;
其中,第一阈值<第二阈值<第三阈值<最佳阈值;
所述区域划分模块以校正后的阈值重新区分局部图像的背景图和目标图。
7.根据权利要求6所述的基于相变和扩散神经网络的图像元素提取方法,其特征在于,所述区域划分模块计算图形相似度与预设相似度标准的相似度差值,设定相似度差值=预设相似度标准-图形相似度,区域划分模块根据相似度差值确定对所述最佳阈值进行校正的调节方式;
若相似度差值处于第一相似度差值水平,所述区域划分模块判定选用第一校正方式;
若相似度差值处于第二相似度差值水平,所述区域划分模块判定选用第二校正方式;
若相似度差值处于第三相似度差值水平,所述区域划分模块判定选用第三校正方式;
所述第一相似度差值水平满足相似度差值大于等于第二预设相似度差值,所述第二相似度差值水平满足相似度差值小于第二预设相似度差值且大于等于第一预设相似度差值,所述第三相似度差值水平满足相似度差值小于第一预设相似度差值。
8.根据权利要求7所述的基于相变和扩散神经网络的图像元素提取方法,其特征在于,在所述步骤S5中,所述图像检测模块检测任一所述局部图像中提取出的目标图的噪声点数量,所述图像检测模块根据噪声点数量判定是否对划分的局部图像的数量进行修正,
若目标图的噪声点数量处于第一数量水平,所述图像检测模块判定目标图的噪声点数量符合标准,无需对划分的局部图像的数量进行修正;
若目标图的噪声点数量处于第二数量水平,所述图像检测模块判定目标图的噪声点数量不符合标准,需对划分的局部图像的数量进行修正;
所述第一数量水平满足目标图的噪声点数量小于等于预设噪声点数量,所述第二数量水平满足目标图的噪声点数量大于预设噪声点数量。
9.根据权利要求8所述的基于相变和扩散神经网络的图像元素提取方法,其特征在于,所述区域划分模块中设有对所述局部图像的数量的修正方式;
第一修正方式为,所述区域划分模块将所述局部图像的数量修正至第一修正数量;
第二修正方式为,所述区域划分模块将所述局部图像的数量修正至第二修正数量;
第三修正方式为,所述区域划分模块将所述局部图像的数量修正至第三修正数量;
其中,第一修正数量>第二修正数量>第三修正数量。
10.根据权利要求9所述的基于相变和扩散神经网络的图像元素提取方法,其特征在于,所述区域划分模块计算目标图的噪声点数量与预设噪声点数量的噪声点比值,设定噪声点比值=目标图的噪声点数量/预设噪声点数量,并根据噪声点比值确定选用的修正方式;
若噪声点比值处于第一噪声点比值水平,所述区域划分模块判定选用第一修正方式;
若噪声点比值处于第二噪声点比值水平,所述区域划分模块判定选用第二修正方式;
若噪声点比值处于第三噪声点比值水平,所述区域划分模块判定选用第三修正方式;
所述第一修正方式满足噪声点比值大于等于第二预设噪声点比值,所述第二修正方式满足噪声点比值小于第二预设噪声点比值且大于等于第一预设噪声点比值,所述第三修正方式满足噪声点比值小于第一预设噪声点比值。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310336320.3A CN116342638B (zh) | 2023-03-31 | 2023-03-31 | 一种图像元素提取方法 |
ZA2023/09984A ZA202309984B (en) | 2023-03-31 | 2023-10-26 | A reaction-diffusion phase-changed neural network-based method for extracting image elements |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310336320.3A CN116342638B (zh) | 2023-03-31 | 2023-03-31 | 一种图像元素提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116342638A true CN116342638A (zh) | 2023-06-27 |
CN116342638B CN116342638B (zh) | 2023-10-31 |
Family
ID=86878606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310336320.3A Active CN116342638B (zh) | 2023-03-31 | 2023-03-31 | 一种图像元素提取方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116342638B (zh) |
ZA (1) | ZA202309984B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6167167A (en) * | 1996-07-05 | 2000-12-26 | Canon Kabushiki Kaisha | Image extractions apparatus and method |
US20160042242A1 (en) * | 2014-08-11 | 2016-02-11 | Sony Corporation | Information processor, information processing method, and computer program |
CN109360207A (zh) * | 2018-09-26 | 2019-02-19 | 江南大学 | 一种融合邻域信息的模糊聚类方法 |
WO2019062092A1 (zh) * | 2017-09-30 | 2019-04-04 | 深圳市颐通科技有限公司 | 基于超像素-多色彩空间的人体轮廓提取方法 |
WO2022110804A1 (zh) * | 2020-11-24 | 2022-06-02 | 海南大学 | 一种基于局部统计信息的图像噪声检测方法、装置 |
-
2023
- 2023-03-31 CN CN202310336320.3A patent/CN116342638B/zh active Active
- 2023-10-26 ZA ZA2023/09984A patent/ZA202309984B/en unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6167167A (en) * | 1996-07-05 | 2000-12-26 | Canon Kabushiki Kaisha | Image extractions apparatus and method |
US20160042242A1 (en) * | 2014-08-11 | 2016-02-11 | Sony Corporation | Information processor, information processing method, and computer program |
WO2019062092A1 (zh) * | 2017-09-30 | 2019-04-04 | 深圳市颐通科技有限公司 | 基于超像素-多色彩空间的人体轮廓提取方法 |
CN109360207A (zh) * | 2018-09-26 | 2019-02-19 | 江南大学 | 一种融合邻域信息的模糊聚类方法 |
WO2022110804A1 (zh) * | 2020-11-24 | 2022-06-02 | 海南大学 | 一种基于局部统计信息的图像噪声检测方法、装置 |
Non-Patent Citations (1)
Title |
---|
吴莉婷等: "深度图像中基于轮廓曲线和局部区域 特征的3 维物体识别", 《中国图象图形学报》, pages 269 - 278 * |
Also Published As
Publication number | Publication date |
---|---|
ZA202309984B (en) | 2024-05-30 |
CN116342638B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Garg et al. | Binarization techniques used for grey scale images | |
US20180157927A1 (en) | Character Segmentation Method, Apparatus and Electronic Device | |
JP4628882B2 (ja) | 判別器の学習方法、顔判別方法および装置並びにプログラム | |
CN115018828A (zh) | 一种电子元器件的缺陷检测方法 | |
CN109844809B (zh) | 一种图像处理方法及装置、计算机可读存储介质 | |
EP0712094A2 (en) | A multi-windowing technique for threshholding an image using local image properties | |
US11810293B2 (en) | Information processing device, information processing method, and computer program | |
CN115546203B (zh) | 基于图像数据算法的生产监测分析方法 | |
CN116758059A (zh) | 一种用于路基路面的视觉无损检测方法 | |
CN111354047B (zh) | 一种基于计算机视觉的摄像模组定位方法及系统 | |
CN116071763B (zh) | 基于文字识别的教辅图书智能校编系统 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN116391204A (zh) | 线宽测量方法、装置、计算处理设备、计算机程序及计算机可读介质 | |
CN111738256A (zh) | 基于改进分水岭算法的复合材料ct图像分割方法 | |
US20110110595A1 (en) | Image correction apparatus and method for eliminating lighting component | |
Hassan et al. | Image enhancement technique at different distance for iris recognition | |
CN107545259A (zh) | 一种基于大津法的二维码重构方法 | |
Sindhuri et al. | Text separation in document images through Otsu's method | |
CN116342638B (zh) | 一种图像元素提取方法 | |
CN112258532B (zh) | 一种超声图像中胼胝体的定位及分割方法 | |
CN109858484A (zh) | 一种基于偏斜评价的多类别变换车牌校正算法 | |
CN112017163B (zh) | 图像模糊度检测的方法、装置、电子设备及存储介质 | |
TW201810115A (zh) | 指紋影像偵測裝置及其方法 | |
CN113221696A (zh) | 一种图像识别方法、系统、设备及存储介质 | |
JPS62267889A (ja) | 文字読取方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |