CN116342519A - 一种基于机器学习的图像处理方法 - Google Patents
一种基于机器学习的图像处理方法 Download PDFInfo
- Publication number
- CN116342519A CN116342519A CN202310276242.2A CN202310276242A CN116342519A CN 116342519 A CN116342519 A CN 116342519A CN 202310276242 A CN202310276242 A CN 202310276242A CN 116342519 A CN116342519 A CN 116342519A
- Authority
- CN
- China
- Prior art keywords
- image
- machine learning
- pixel
- target object
- contour
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 93
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 230000007547 defect Effects 0.000 claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 41
- 230000000877 morphologic effect Effects 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 23
- 230000008859 change Effects 0.000 claims description 4
- 238000007499 fusion processing Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 15
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 206010052143 Ocular discomfort Diseases 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10012—Stereo images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
- G06T2207/20032—Median filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20224—Image subtraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于机器学习的图像处理方法,包括:在接收到处理基于机器学习图像的处理指令时,获取图像的选定区域;选定图像的待处理轮廓以及范围;使用预训练的网络对目标对象的图像特征信息进行分析,以对初始轮廓图像进行扩选,得到目标对象的轮廓图像;根据轮廓图像的景深信息将轮廓图像分割为多个子区域图像,并获取每一个子区域图像对应的三维信息,构建得到基于机器学习目标对象对应的三维图像;针对轮廓图像进行去噪处理;针对去噪图像进行二值化处理;对二值化模糊缺陷特征图进行形态学处理;遍历经过形态学处理后的二值化模糊缺陷特征图中的各个像素,确定所述目标对象是否存在模糊缺陷。本发明可以减少错误检测,提高检测准确度。
Description
技术领域
本发明属于电力设备图像处理技术领域,具体涉及一种基于机器学习的图像处理方法。
背景技术
针对图像存在噪声多、对比度低、模糊区域与背景区域的灰度值分布较为相近、图像不同区域光照差异大等问题,这样的图像首先给人带来视觉上的不舒适,使得处理人员需耗费大量的时间手动进行图像增强工作,以使图像质量最接近人眼判定程度。大量的图像增强工作易导致处理人员的疲劳,极易导致模糊质量出现误判、漏判等情况。尽管模糊的图像捕获设备获得极大的改进,但仍然存在各种干扰因素,导致图像质量较差。因此,对于原始图像的视觉效果和质量改进是图像预处理必不可少的部分。
然而,传统的模糊检测方案是拍摄目标物的图像,对图像进行各种基于视觉技术的处理,当目标物所在的环境情况复杂时,检测目标物是否存在模糊缺陷的准确度较低。
发明内容
本发明所要解决的技术问题在于,提供一种基于机器学习的图像处理方法,以减少错误检测,提高检测准确度。
为解决上述技术问题,本发明提供一种基于机器学习的图像处理方法,包括:
步骤S1,在接收到处理基于机器学习图像的处理指令时,获取基于机器学习图像的选定区域;
步骤S2,选定图像的待处理轮廓以及范围;
步骤S3,使用预训练的机器学习模型对目标对象的图像特征信息进行分析,以对初始轮廓图像进行扩选,得到基于机器学习目标对象的轮廓图像;
步骤S4,根据轮廓图像的景深信息将轮廓图像分割为多个子区域图像,并获取每一个子区域图像对应的三维信息,构建得到基于机器学习目标对象对应的三维图像;
步骤S5,针对轮廓图像进行去噪处理;
步骤S6,针对去噪图像进行二值化处理;
步骤S7,对二值化模糊缺陷特征图进行形态学处理;
步骤S8,遍历经过形态学处理后的二值化模糊缺陷特征图中的各个像素,确定所述目标对象是否存在模糊缺陷。
进一步地,所述步骤S1还包括:在接收到处理基于机器学习图像的处理指令后,在预设时间段内未获取到用户在基于机器学习图像的选定区域,则将基于机器学习图像的整个区域作为选定区域。
进一步地,所述步骤S2中,基于机器学习目标对象是位于限定区域内的物体对象或者人物对象;通过不同的基于机器学习目标对象对应像素点的RGB颜色通道确定基于机器学习目标对象的初始轮廓图像。
进一步地,所述步骤S3中,在得到基于机器学习目标对象的初始轮廓图像后,将初始轮廓图像和基于机器学习图像分别输入预训练的机器学习模型中,通过机器学习模型对初始轮廓图像中的特征信息进行分析,并在基于机器学习图像上将初始轮廓图像进行扩选,从而得到基于机器学习目标对象的轮廓图像。
进一步地,所述步骤S4具体包括:
根据每一个像素的景深信息对轮廓图像的像素点进行分类,根据对轮廓图像的像素点的分类对轮廓图像进行分割,以得到多个子区域图像;
根据每一个子区域图像对应的三维信息构建得到基于机器学习目标对象对应的三维图像,其中,三维信息是指每一个子区域图像在三维图像中的三维坐标位置。
进一步地,所述步骤S5具体包括:
对初次去噪后的图像进行中值滤波,其次遍历图像的所有像素点,计算每一个像素的对比度,得到一幅对比度图像,然后使用大津法Otsu对该对比度图进行二值化处理,得到高对比度图;
通过在初次去噪后的图像上迭代执行灰度形态学闭操作以及开操作得到背景图像,然后从初次去噪后的图像减去背景图像,得到低对比度图;
对得到的高对比度图和低对比度图进行融合处理,获得去噪后的图像。
进一步地,按照下式计算每一个像素的对比度:
其中,D(x,y)表示某个像素点(x,y)的对比度,l表示水平向位置的变化量,n表示竖直向位置的变化量,maxD(x+l,y+n)表示像素点(x,y)在水平向和竖直向l和n的范围内邻近像素点的最大对比度。
进一步地,所述步骤S6中,图像二值化方法如下所示::
其中,bw(x,y)表示二值化后的像素点的灰度值,g(x,y)代表当前像素点的灰度值,T为局部阈值,Ne代表当前像素点邻域范围内的边缘点的数目,r表示像素点的外扩散半径;遍历图像上的所有点,计算局部阈值并统计邻域范围中边缘点的数目,完成图像的二值化,并得到二值化模糊缺陷特征图。
进一步地,局部阈值T计算方式如下:
其中,m和s分别表示当前邻域范围内像素的灰度均值和标准差,k是用于控制算法对图像对比度的响应的调节系数,R是对用于调节灰度标准差的调节系数。
进一步地,所述步骤S8具体包括:当遍历到的像素符合预设模糊缺陷条件时,将符合所述预设模糊缺陷条件的像素作为种子像素,并将所述种子像素的坐标进行入栈;将所述种子像素的邻域内符合所述预设模糊缺陷条件的像素作为可填充像素,并将所述可填充像素的坐标进行入栈;弹出位于栈顶的坐标;将弹出的坐标所对应的像素作为种子像素继续查找可填充像素,直至栈内为空;在一次种子填充结束后,将弹出的各坐标所对应的像素区域确定为模糊缺陷连通域;其中,所述种子像素的坐标入栈时,给所述坐标添加标签;在根据所述种子像素进行种子填充时,将全部入栈的坐标均添加相同的标签,将具有相同标签的坐标对应的像素区域确定为模糊缺陷连通域;当遍历像素时,若遍历到的所述像素已经存在标签,则不再对所述像素进行处理;通过所述模糊缺陷连通域确定所述目标物体是否存在模糊缺陷。
实施本发明具有如下有益效果:本发明对模糊缺陷特征图像进行二值化处理,得到二值化模糊缺陷特征图像,从二值化模糊缺陷特征图像中提取模糊缺陷连通域;通过模糊缺陷连通域进行第二次检测,确定目标物是否存在模糊缺陷,在检测过程中结合机器学习模型和连通域进行两次检测以减少错误检测,提高了检测准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一种基于机器学习的图像处理方法的流程示意图。
具体实施方式
以下各实施例的说明是参考附图,用以示例本发明可以用以实施的特定实施例。
请参照图1所示,本发明实施例提供一种基于机器学习的图像处理方法,包括:
步骤S1,在接收到处理基于机器学习图像的处理指令时,获取在基于机器学习图像的选定区域;
步骤S2,选定图像的待处理轮廓以及范围;
步骤S3,使用预训练的机器学习模型对目标对象的图像特征信息进行分析,以对初始轮廓图像进行扩选,得到基于机器学习目标对象的轮廓图像;
步骤S4,根据轮廓图像的景深信息将轮廓图像分割为多个子区域图像,并获取每一个子区域图像对应的三维信息,构建得到基于机器学习目标对象对应的三维图像;
步骤S5,针对轮廓图像进行去噪处理;
步骤S6,针对去噪图像进行二值化处理;
步骤S7,对二值化模糊缺陷特征图进行形态学处理;
步骤S8,遍历经过形态学处理后的二值化模糊缺陷特征图中的各个像素,确定所述目标对象是否存在模糊缺陷。
具体地,本发明实施例提供的基于机器学习的图像处理方法应用于图像处理装置中;其中,图像处理装置可设置于任意具有图像处理能力的电子设备中。在一些示例中,电子设备可以是电脑、手机、虚拟现实(VR,VirtualReality)设备、增强现实(AR,AugmentedReality)设备等终端设备;在另一些实例中,电子设备也可以是服务器等设备。本发明实施例中均以电子设备作为执行主体为例说明。
需要说明的是,在电子设备采用本申请实施例提供的基于机器学习的图像处理方法对图像进行处理时,待处理图像可以是通过内置于电子设备内部或者通过外接的方式与电子设备相连接的图像采集设备采集得到。作为一种示例性的实例,图像采集设备可以是深度摄像头、3D光速摄影组件或者激光雷达组件中的一种或多种组件。
可以理解的是,本发明实施例提供的基于机器学习的图像处理方法应用在电子设备中时,电子设备可以是拍摄的单张图像,也可以是通过摄像功能拍摄连续的多张图像或者通过图像采集设备采集的多帧图像。在待处理图像为多张图像或者多帧图像时,本发明实施例提供的基于机器学习的图像处理方法可以仅针对其中的某一张/某一帧图像进行处理,当然,也可以是对某几张/某几帧图像进行处理。
步骤S1进行图像预处理,本实施例中,基于机器学习图像可以是前述的需要处理的待处理图像。在一种具体应用场景中,例如用户通过手机进行自拍或者摄像后,需要对拍摄的图像进行处理,电子设备在接收到用户通过手机屏幕或者语音等处理指令后,电子设备获取在基于机器学习图像上的选定区域。
例如,在用户发出三维图像的生成指令后,电子设备通过显示屏或者语音播报的方式提示用户在待处理图像上指定待处理区域,即提示用户选出需要处理的部分图像。例如,用户需要对图像中的人物对象生成三维图像,则用户在基于机器学习图像上对人物对象进行选择,从而确定出用户在基于机器学习图像的选定区域。
需要说明的是,在一些具体应用场景中,用户可能想要将整张/正帧的图像均生成三维图像,而针对一些曲面屏的电子设备,用户难以指定基于机器学习图像的整个图像区域。针对前述情况,本发明实施例提供的基于机器学习的图像处理方法,在接收到处理基于机器学习图像的处理指令后,在预设时间段内未获取到用户在基于机器学习图像的选定区域,则将基于机器学习图像的整个区域作为选定区域。
这样,能够方便的将基于机器学习图像的整个区域进行处理。
步骤S2中,基于机器学习目标对象可以是指位于限定区域内的物体对象或者人物对象,例如人像、人体、汽车、桌椅等等对象。在具体实现时,电子设备可以通过不同的基于机器学习目标对象对应像素点的RGB颜色通道确定基于机器学习目标对象的初始轮廓。例如,人像或者人体的RGB颜色通道与汽车或者桌椅的RGB颜色通道存在一定的差异,根据该RGB颜色通道差异确定基于机器学习目标对象的初始轮廓图像。
步骤S3预训练的机器学习模型包括一个全连接层和九个卷积层,卷积层的基于机器学习层至第九层依次位于全连接层之后,卷积层用于提高图像的重构精度,获得一个高分辨率的输出;卷积神经网络的初始输入是将一幅图像压缩为M的维矢量,并记为ΦX,其中Φ是大小为M×N维观测矩阵,M是测量数据,X是向量化的输入图像块;中间重建图像因分块量化后的量化误差的平均值记为损失函数,选择MSE作为损失函数,MSE是真实值与预测值的差值的平方求和平均;给定一组高分辨率图像{Xi}及其相应的低分辨率图像{yi},则MSE的计算公式是其中,m是训练集中的图像块总数,xi是第i个补丁,yi是第i个补丁的模型输出。
其中,机器学习模型为使用多组图形数据通过机器学习训练得出,多组图形数据中每组数据包括第二图像和标识第二图像中第二目标对象的标签。
具体的,用于机器学习的多组图形数据可以是由不同用户提供的。例如,不同用户在拍摄完成后,需要进行三维处理的目标对象可能存在不同,部分用户可能需要对人像进行三维处理,部分用户可能需要对桌椅等静物进行处理。在用户每次处理,对第二图像中的第二目标对象进行选择时,可以对第二目标对象添加对应的标签(例如人像/人物、桌椅或者汽车等),添加标签后,电子设备对添加有标签的第二目标对象中的特征信息进行识别。例如,人物对象是否有眼睛、鼻子、嘴巴等面部特征,汽车是否有车轮、后视镜或者车窗等特征信息。
在得到基于机器学习目标对象的初始轮廓图像后,将初始轮廓图像和基于机器学习图像分别输入模型中,通过模型对初始轮廓图像中的特征信息进行分析,并在基于机器学习图像上将初始轮廓图像进行扩选,从而得到基于机器学习目标对象的轮廓图像。
这样,通过机器学习得到的模型来对初始轮廓图像进行扩选,使得对基于机器学习目标对象的选择更加准确精准,提高了对图像进行三维处理的准确性。
步骤S4中,电子设备获取的基于机器学习图像为景深图像,具体可以通过深度摄像头、3D光速摄影组件或者激光雷达组件中的一种或多种组件拍摄得到。
在得到基于机器学习目标对象的轮廓图像后,对轮廓图像的景深信息对轮廓图像进行分割。本领域技术人员能够理解,景深图像的每一个像素或者图像区域均具有不同的景深信息。在根据景深信息对轮廓图像进行分割时,可以设定一定的景深阈值,在一定景深阈值范围内的图像区域分割在同一个子区域图像中。大于该预设的景深阈值的图像区域分割在不同的子区域图像中。
即,可以根据每一个像素的景深信息对轮廓图像的像素点进行分类,根据对轮廓图像的像素点的分类对轮廓图像进行分割,以得到多个子区域图像。
然后根据每一个子区域图像对应的三维信息进行构建,其中,三维信息可以是指每一个子区域图像在三维图像中的三维坐标位置,从而能够得到基于机器学习目标对象的三维图像。
通过本发明实施例提供的基于机器学习的图像处理方法,能够使得用户方便的对拍摄的图像中各个目标对象进行三维处理,等到需要的三维图像;另外,也能够使得用户方便的对选定区域的多个目标对象进行三维处理,能够提高用户获得单张/单帧图像中多个目标对象的三维图像的效率,从而能够有效提高用户使用体验效果。
在用户点击基于机器学习图像上的基于机器学习位置时,获取基于机器学习点击位置在基于机器学习图像上对应的基于机器学习二维坐标值。这里,基于机器学习二维坐标值可以是根据电子设备的显示屏上的像素点位置来确定,例如,将电子设备左上角的像素点位置的二维坐标值确定为(0,0),用户在基于机器学习点击位置的基于机器学习二维坐标值可以为(x1,y1)。
然后,获取第二点击位置在基于机器学习图像上对应的第二二维坐标值。可以理解的是,第二二维坐标值的确定可以与基于机器学习二维坐标值的确定方式相同,例如第二二维坐标值为(x2,y2)。
在获得基于机器学习点击位置的基于机器学习二维坐标值和第二点击位置的第二二维坐标值后,本发明实施例中,可以通过如下方式来确定选定区域。
以基于机器学习二维坐标值和第二二维坐标值之间的连线为直径在基于机器学习图像上做圆,位于圆形区域内的区域为选定区域。或者,以基于机器学习二维坐标值和第二二维坐标值之间的连线为对角线在基于机器学习图像上确定矩形区域,位于矩形区域内的区域为选定区域。这样,能够方便快捷的确定出用户在基于机器学习图像上的选定区域,能够提高选定区域的指定效率。
可以理解的是,在一些可能的设计方式中,用户也可以在基于机器学习图像上点击更多个位置,例如三个、四个或者五个;通过更多个点击位置来确定选定区域,能够使得选定区域的指定更加准确,提高选定区域选定的准确性。
步骤S5针对轮廓图像进行去噪:去噪的步骤包括图像高低对比区域的融合处理,首先包括高对比度区域的获取:对初次去噪后的图像进行中值滤波,其次遍历图像的所有像素点,使用式(1)计算每一个像素的对比度,得到一幅对比度图像,然后使用Otsu方法对该对比度图进行二值化处理,得到一幅高对比度图,该图描述了图像上对比度较高的区域,这些区域包含了图像的边缘;
其中,D(x,y)表示某个像素点(x,y)的对比度,l表示水平向位置的变化量,n表示竖直向位置的变化量,maxD(x+l,y+n)表示像素点(x,y)在水平向和竖直向l和n的范围内邻近像素点的最大对比度;
随后再进行低对比度区域获取,通过在初次去噪后的图像上迭代执行灰度形态学闭操作以及开操作得到背景图像,然后从初次去噪后的图像减去背景图像,得到低对比度图,这些边缘中包含了图像的高、低对比度边缘;
高低对比区域的融合处理,直接高低对比图取交集,得到的边缘图像在滤除背景噪音的同时也滤除了低对比度部分,获得去噪后的图像;
步骤S6对去噪图像二值化:图像二值化方法如式(2)所示:
其中,g(x,y)代表当前像素点的灰度值,T为局部阈值,Ne代表当前像素点邻域范围内的边缘点的数目,r表示像素点的外扩散半径;;遍历图像上的所有点,计算局部阈值并统计邻域范围中边缘点的数目,使用式(2)完成图像的二值化,并得到二值化模糊缺陷特征图;
局部阈值T计算:基于式(3)计算得到;
其中,T表示当前像素的局部阈值,m和s分别表示当前邻域范围内像素的灰度均值和标准差,k是一个调节系数,用于控制算法对图像对比度的响应,R是对灰度标准差的一个调节系数,和图像的灰度阶数有关,对于本发明的位灰度图像,该值示例性地设为128。
步骤S8中,遍历经过形态学处理后的二值化模糊缺陷特征图中的各个像素,当遍历到的像素符合预设模糊缺陷条件时,将符合所述预设模糊缺陷条件的像素作为种子像素,并将所述种子像素的坐标进行入栈;将所述种子像素的邻域内符合所述预设模糊缺陷条件的像素作为可填充像素,并将所述可填充像素的坐标进行入栈;弹出位于栈顶的坐标;将弹出的坐标所对应的像素作为种子像素继续查找可填充像素,直至栈内为空;在一次种子填充结束后,将弹出的各坐标所对应的像素区域确定为模糊缺陷连通域;其中,所述种子像素的坐标入栈时,给所述坐标添加标签;在根据所述种子像素进行种子填充时,将全部入栈的坐标均添加相同的标签,将具有相同标签的坐标对应的像素区域确定为模糊缺陷连通域;当遍历像素时,若遍历到的所述像素已经存在标签,则不再对所述像素进行处理;通过所述模糊缺陷连通域确定所述目标物体是否存在模糊缺陷。
通过上述说明可知,与现有技术相比,本发明的有益效果在于:本发明对模糊缺陷特征图像进行二值化处理,得到二值化模糊缺陷特征图像,从二值化模糊缺陷特征图像中提取模糊缺陷连通域;通过模糊缺陷连通域进行第二次检测,确定目标物是否存在模糊缺陷,在检测过程中结合机器学习模型和连通域进行两次检测以减少错误检测,提高了检测准确度。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明的权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (10)
1.一种基于机器学习的图像处理方法,其特征在于,包括:
步骤S1,在接收到处理基于机器学习图像的处理指令时,获取基于机器学习图像的选定区域;
步骤S2,选定图像的待处理轮廓以及范围;
步骤S3,使用预训练的机器学习模型对目标对象的图像特征信息进行分析,以对初始轮廓图像进行扩选,得到基于机器学习目标对象的轮廓图像;
步骤S4,根据轮廓图像的景深信息将轮廓图像分割为多个子区域图像,并获取每一个子区域图像对应的三维信息,构建得到基于机器学习目标对象对应的三维图像;
步骤S5,针对轮廓图像进行去噪处理;
步骤S6,针对去噪图像进行二值化处理;
步骤S7,对二值化模糊缺陷特征图进行形态学处理;
步骤S8,遍历经过形态学处理后的二值化模糊缺陷特征图中的各个像素,确定所述目标对象是否存在模糊缺陷。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1还包括:在接收到处理基于机器学习图像的处理指令后,在预设时间段内未获取到用户在基于机器学习图像的选定区域,则将基于机器学习图像的整个区域作为选定区域。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2中,基于机器学习目标对象是位于限定区域内的物体对象或者人物对象;通过不同的基于机器学习目标对象对应像素点的RGB颜色通道确定基于机器学习目标对象的初始轮廓图像。
4.根据权利要求3所述的方法,其特征在于,所述步骤S3中,在得到基于机器学习目标对象的初始轮廓图像后,将初始轮廓图像和基于机器学习图像分别输入预训练的机器学习模型中,通过机器学习模型对初始轮廓图像中的特征信息进行分析,并在基于机器学习图像上将初始轮廓图像进行扩选,从而得到基于机器学习目标对象的轮廓图像。
5.根据权利要求1所述的方法,其特征在于,所述步骤S4具体包括:
根据每一个像素的景深信息对轮廓图像的像素点进行分类,根据对轮廓图像的像素点的分类对轮廓图像进行分割,以得到多个子区域图像;
根据每一个子区域图像对应的三维信息构建得到基于机器学习目标对象对应的三维图像,其中,三维信息是指每一个子区域图像在三维图像中的三维坐标位置。
6.根据权利要求1所述的方法,其特征在于,所述步骤S5具体包括:
对初次去噪后的图像进行中值滤波,其次遍历图像的所有像素点,计算每一个像素的对比度,得到一幅对比度图像,然后使用大津法Otsu对该对比度图进行二值化处理,得到高对比度图;
通过在初次去噪后的图像上迭代执行灰度形态学闭操作以及开操作得到背景图像,然后从初次去噪后的图像减去背景图像,得到低对比度图;
对得到的高对比度图和低对比度图进行融合处理,获得去噪后的图像。
10.根据权利要求1所述的方法,其特征在于,所述步骤S8具体包括:当遍历到的像素符合预设模糊缺陷条件时,将符合所述预设模糊缺陷条件的像素作为种子像素,并将所述种子像素的坐标进行入栈;将所述种子像素的邻域内符合所述预设模糊缺陷条件的像素作为可填充像素,并将所述可填充像素的坐标进行入栈;弹出位于栈顶的坐标;将弹出的坐标所对应的像素作为种子像素继续查找可填充像素,直至栈内为空;在一次种子填充结束后,将弹出的各坐标所对应的像素区域确定为模糊缺陷连通域;其中,所述种子像素的坐标入栈时,给所述坐标添加标签;在根据所述种子像素进行种子填充时,将全部入栈的坐标均添加相同的标签,将具有相同标签的坐标对应的像素区域确定为模糊缺陷连通域;当遍历像素时,若遍历到的所述像素已经存在标签,则不再对所述像素进行处理;通过所述模糊缺陷连通域确定所述目标物体是否存在模糊缺陷。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310276242.2A CN116342519A (zh) | 2023-03-10 | 2023-03-10 | 一种基于机器学习的图像处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310276242.2A CN116342519A (zh) | 2023-03-10 | 2023-03-10 | 一种基于机器学习的图像处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116342519A true CN116342519A (zh) | 2023-06-27 |
Family
ID=86878338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310276242.2A Pending CN116342519A (zh) | 2023-03-10 | 2023-03-10 | 一种基于机器学习的图像处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116342519A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117148378A (zh) * | 2023-08-30 | 2023-12-01 | 上海频准激光科技有限公司 | 一种基于激光器的光学成像系统 |
CN118072289A (zh) * | 2024-04-18 | 2024-05-24 | 智联信通科技股份有限公司 | 用于智能驾驶的图像采集优化方法 |
-
2023
- 2023-03-10 CN CN202310276242.2A patent/CN116342519A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117148378A (zh) * | 2023-08-30 | 2023-12-01 | 上海频准激光科技有限公司 | 一种基于激光器的光学成像系统 |
CN117148378B (zh) * | 2023-08-30 | 2024-05-10 | 上海频准激光科技有限公司 | 一种基于激光器的光学成像系统 |
CN118072289A (zh) * | 2024-04-18 | 2024-05-24 | 智联信通科技股份有限公司 | 用于智能驾驶的图像采集优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598610B (zh) | 一种基于神经选择注意的目标显著性检测方法 | |
Li et al. | Multi-scale single image dehazing using Laplacian and Gaussian pyramids | |
CN110363116B (zh) | 基于gld-gan的不规则人脸矫正方法、系统及介质 | |
CN111445410B (zh) | 基于纹理图像的纹理增强方法、装置、设备和存储介质 | |
CN112819772B (zh) | 一种高精度快速图形检测识别方法 | |
CN109948566B (zh) | 一种基于权重融合与特征选择的双流人脸反欺诈检测方法 | |
CN107452010A (zh) | 一种自动抠图算法和装置 | |
CN109087261B (zh) | 基于非受限采集场景的人脸矫正方法 | |
CN116342519A (zh) | 一种基于机器学习的图像处理方法 | |
CN109711268B (zh) | 一种人脸图像筛选方法及设备 | |
KR20050022306A (ko) | 영상에 기반한 사실감 있는 3차원 얼굴 모델링 방법 및 장치 | |
KR20110014067A (ko) | 스테레오 컨텐트의 변환 방법 및 시스템 | |
Sahu et al. | Trends and prospects of techniques for haze removal from degraded images: A survey | |
CN116385316B (zh) | 多目标图像动态捕捉方法及相关装置 | |
Liu et al. | Texture filtering based physically plausible image dehazing | |
CN116580028A (zh) | 一种物体表面缺陷检测方法、装置、设备及存储介质 | |
CN115631210A (zh) | 一种边缘检测方法及装置 | |
CN117496019B (zh) | 一种驱动静态图像的图像动画处理方法及系统 | |
CN114913463A (zh) | 一种图像识别方法、装置、电子设备及存储介质 | |
CN111027637A (zh) | 一种文字检测方法及计算机可读存储介质 | |
CN114674826A (zh) | 基于布匹的视觉检测方法及检测系统 | |
CN111274851A (zh) | 一种活体检测方法及装置 | |
CN113159158A (zh) | 一种基于生成对抗网络的车牌矫正与重构方法及系统 | |
CN113362221A (zh) | 用于门禁的人脸识别系统与人脸识别方法 | |
CN110717910B (zh) | 基于卷积神经网络的ct图像目标检测方法及ct扫描仪 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |