CN113255683B - 一种基于神经网络的图像分割方法、系统及存储介质 - Google Patents

一种基于神经网络的图像分割方法、系统及存储介质 Download PDF

Info

Publication number
CN113255683B
CN113255683B CN202110708841.8A CN202110708841A CN113255683B CN 113255683 B CN113255683 B CN 113255683B CN 202110708841 A CN202110708841 A CN 202110708841A CN 113255683 B CN113255683 B CN 113255683B
Authority
CN
China
Prior art keywords
image segmentation
image
neural network
pixel
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110708841.8A
Other languages
English (en)
Other versions
CN113255683A (zh
Inventor
张晶
蓝金桃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Yongwang Practical New Technology Research Institute
Original Assignee
Guangdong Xingrui Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Xingrui Technology Co ltd filed Critical Guangdong Xingrui Technology Co ltd
Priority to CN202110708841.8A priority Critical patent/CN113255683B/zh
Publication of CN113255683A publication Critical patent/CN113255683A/zh
Application granted granted Critical
Publication of CN113255683B publication Critical patent/CN113255683B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于神经网络的图像分割方法、系统及存储介质,包括以下步骤:将图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域,根据所述判别性目标区域获取目标位置特征;建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果。本发明在图像分割过程中还对分割效果进行修正,使得图像分割准确性更高。

Description

一种基于神经网络的图像分割方法、系统及存储介质
技术领域
本发明涉及一种图像分割方法,更具体的,涉及一种基于神经网络的图像分割方法、系统及存储介质。
背景技术
随着计算机技术、互联网技术及传感器技术的迅猛发展,可以轻易获取海量的图像信息,但有时获得的图像信息不是我们最理想的。这是由于成像设备的物理特性和图像传输时的链路特点,图像有时会对比度较差,并因不同程度的损坏而造成各种噪音或模糊不清。为了从数字图像中获取更多有价值的信息,通常会使用一系列图像处理手段进行实现。在图像处理方法中,图像分割是用于计算机视觉领域中检测对象和分析图像最重要的技术之一,但由于现实中的图像存在颜色丰富,灰度不均匀及纹理复杂等问题,准确的图像分割仍然是一项巨大的挑战。
为了能够对给定图像实现精准的图像分割,需要开发一款系统与之进行匹配,该系统基于神经网络,将图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域,根据所述判别性目标区域获取目标位置特征;建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果。在系统实现过程中如何通过目标位置特征进行精确的图像分割及如何对图像分割模型进行参数优化都输亟不可待需要解决的问题。
发明内容
为了解决上述至少一个技术问题,本发明提出了一种基于神经网络的图像分割方法、系统及存储介质。
本发明第一方面提供了一种基于神经网络的图像分割方法,包括:
将给定图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域;
根据所述判别性目标区域获取目标位置特征;
建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;
将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果;
同时利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数。
本方案中,所述的将给定图像进行预处理,通过卷积神经网络模型获取所述图像中目标位置特征,具体为:
构建卷积神经网络模型,将所述卷积神经网络模型进行初始化训练,得到预训练好的卷积神经网络模型;
设置卷积神经网络模型的输入图像尺寸信息,同时设置输出节点参数,匹配图像数据集的类别数目;
将所述卷积神经网络模型中的卷积特征矩阵及全连接层的权值矩阵结合,计算生成类别激活图信息;
通过所述激活图信息生成激活值,所述激活值对应类别目标在图像中的位置信息,根据所述位置信息获取目标位置特征。
本方案中,所述的建立图像分割模型,具体为:
获取目标位置特征,结合所述目标位置特征初始化图像分割模型的参数;
获取训练数据,将训练数据整合为训练集,通过所述训练集对所述图像分割模型进行训练;
通过训练获取最终图像分割模型参数,得到训练后图像分割模型。
本方案中,所述的根据目标位置特征及图像分割模型参数估算像素标签,具体为:
通过所述卷积神经网络模型获取图像中目标位置特征,根据所述目标位置特征将给定图像分为明确类别像素集合及未明确类别像素集合;
明确类别像素集合运用所述目标位置特征确定像素标签;
预设图像分割模型的参数,将未明确类别像素集合导入获取模型输出;
通过归一化指数函数计算像素属于各语义类别的概率,通过所述概率确定像素标签。
本方案中,所述的利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数,具体为:
将图像分割模型训练数据分为第一训练集和第二训练集;
将第一训练集中的每个像素分配类别标签的条件概率分布,计算图像分割模型的第一损失函数;
获取第二训练集进行多次迭代后的图像分割模型参数,根据所述参数计算像素标签的期望;
根据所述像素标签的期望最大化损失函数,生成第二损失函数;
预设损失权重,将所述第一损失函数和所述第二损失函数结合计算生成最终损失函数;
通过随机梯度下降方法处理最终损失函数对图像分割模型的参数进行更新优化;
所述最终损失函数的计算公式具体为:
Figure 250485DEST_PATH_IMAGE001
其中,
Figure DEST_PATH_IMAGE002
表示所求的最终损失函数,
Figure 596015DEST_PATH_IMAGE003
表示损失权重,
Figure DEST_PATH_IMAGE004
表示第一损失函数,
Figure 746374DEST_PATH_IMAGE005
表示第二损失函数,
Figure DEST_PATH_IMAGE006
表示噪声函数。
本方案中,还包括运用真实标注信息对所述目标位置特征进行有效性验证,同时对卷积神经网络模型进行修正,具体为:
将图像中前景与背景进行区分,并将目标位置信息进行标注,生成真实标注信息;
使用不同数量的训练集对所述卷积神经网络模型进行训练获取图像的分割结果信息;
将所述真实标注信息与所述分割结果信息进行比较,获取偏差率;
预设偏差率阈值,判断所述偏差率是否小于所述偏差率阈值;
若小于,则说明所述目标位置特征对卷积神经网络模型提供了有效的标注及位置信息;
若大于,则对激活图阈值进行重新确定,并生成修正信息,根据所述修正信息对模型进行修正。
本发明第二方面还提供了一种基于神经网络的图像分割系统,该系统包括:存储器、处理器,所述存储器中包括一种基于神经网络的图像分割方法程序,所述一种基于神经网络的图像分割方法程序被所述处理器执行时实现如下步骤:
本发明第一方面提供了一种基于神经网络的图像分割方法,包括:
将给定图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域;
根据所述判别性目标区域获取目标位置特征;
建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;
将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果;
同时利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数。
本方案中,所述的将给定图像进行预处理,通过卷积神经网络模型获取所述图像中目标位置特征,具体为:
构建卷积神经网络模型,将所述卷积神经网络模型进行初始化训练,得到预训练好的卷积神经网络模型;
设置卷积神经网络模型的输入图像尺寸信息,同时设置输出节点参数,匹配图像数据集的类别数目;
将所述卷积神经网络模型中的卷积特征矩阵及全连接层的权值矩阵结合,计算生成类别激活图信息;
通过所述激活图信息生成激活值,所述激活值对应类别目标在图像中的位置信息,根据所述位置信息获取目标位置特征。
本方案中,所述的建立图像分割模型,具体为:
获取目标位置特征,结合所述目标位置特征初始化图像分割模型的参数;
获取训练数据,将训练数据整合为训练集,通过所述训练集对所述图像分割模型进行训练;
通过训练获取最终图像分割模型参数,得到训练后图像分割模型。
本方案中,所述的根据目标位置特征及图像分割模型参数估算像素标签,具体为:
通过所述卷积神经网络模型获取图像中目标位置特征,根据所述目标位置特征将给定图像分为明确类别像素集合及未明确类别像素集合;
明确类别像素集合运用所述目标位置特征确定像素标签;
预设图像分割模型的参数,将未明确类别像素集合导入获取模型输出;
通过归一化指数函数计算像素属于各语义类别的概率,通过所述概率确定像素标签。
本方案中,所述的利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数,具体为:
将图像分割模型训练数据分为第一训练集和第二训练集;
将第一训练集中的每个像素分配类别标签的条件概率分布,计算图像分割模型的第一损失函数;
获取第二训练集进行多次迭代后的图像分割模型参数,根据所述参数计算像素标签的期望;
根据所述像素标签的期望最大化损失函数,生成第二损失函数;
预设损失权重,将所述第一损失函数和所述第二损失函数结合计算生成最终损失函数;
通过随机梯度下降方法处理最终损失函数对图像分割模型的参数进行更新优化;
所述最终损失函数的计算公式具体为:
Figure 565470DEST_PATH_IMAGE001
其中,
Figure 357846DEST_PATH_IMAGE002
表示所求的最终损失函数,
Figure 495566DEST_PATH_IMAGE003
表示损失权重,
Figure 82405DEST_PATH_IMAGE004
表示第一损失函数,
Figure 633472DEST_PATH_IMAGE005
表示第二损失函数,
Figure 839326DEST_PATH_IMAGE006
表示噪声函数。
本方案中,还包括运用真实标注信息对所述目标位置特征进行有效性验证,同时对卷积神经网络模型进行修正,具体为:
将图像中前景与背景进行区分,并将目标位置信息进行标注,生成真实标注信息;
使用不同数量的训练集对所述卷积神经网络模型进行训练获取图像的分割结果信息;
将所述真实标注信息与所述分割结果信息进行比较,获取偏差率;
预设偏差率阈值,判断所述偏差率是否小于所述偏差率阈值;
若小于,则说明所述目标位置特征对卷积神经网络模型提供了有效的标注及位置信息;
若大于,则对激活图阈值进行重新确定,并生成修正信息,根据所述修正信息对模型进行修正。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于神经网络的图像分割方法程序,所述一种基于神经网络的图像分割方法程序被处理器执行时,实现如上述任一项所述的一种基于神经网络的图像分割方法的步骤。
本发明公开了一种基于神经网络的图像分割方法、系统及存储介质,包括以下步骤:将图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域,根据所述判别性目标区域获取目标位置特征;建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果。本申请通过对图像分割模型进行混合训练,将目标位置特征以两种方式引导参数学习过程,提升了分割准确率,同时本发明在图像分割过程中还对分割效果进行修正,使得图像分割准确性更高。
附图说明
图1示出了本发明一种基于神经网络的图像分割方法的流程图;
图2示出了本发明通过卷积神经网络模型获取目标位置特征的方法流程图;
图3示出了本发明运用真实标注信息对所述目标位置特征进行有效性验证方法流程图;
图4示出了本发明一种基于神经网络的图像分割系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种基于神经网络的图像分割方法的流程图。
如图1所示,本发明第一方面提供了一种基于神经网络的图像分割方法,包括:
S102,将给定图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域;
S104,根据所述判别性目标区域获取目标位置特征;
S106,建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;
S108,将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果;
S110,同时利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数。
需要说明的是,为了确保获取给定图像中目标的完整区域,在目标位置特征与所述像素标签匹配过程中还进行图像级标注,所述图像级标注无法为给定图像中的目标进行精确地定位,将没有被目标位置特征包含的区域分配给图像级标签中的任意标签,将所述给定图像中目标的全部区域进行最大程度标注。
图2示出了本发明通过卷积神经网络模型获取目标位置特征的方法流程图。
根据本发明实施例,所述的将给定图像进行预处理,通过卷积神经网络模型获取所述图像中目标位置特征,具体为:
S202,构建卷积神经网络模型,将所述卷积神经网络模型进行初始化训练,得到预训练好的卷积神经网络模型;
S204,设置卷积神经网络模型的输入图像尺寸信息,同时设置输出节点参数,匹配图像数据集的类别数目;
S206,将所述卷积神经网络模型中的卷积特征矩阵及全连接层的权值矩阵结合,计算生成类别激活图信息;
S208,通过所述激活图信息生成激活值,所述激活值对应类别目标在图像中的位置信息,根据所述位置信息获取目标位置特征。
需要说明的是,所述的建立图像分割模型,具体为:
获取目标位置特征,结合所述目标位置特征初始化图像分割模型的参数;
获取训练数据,将训练数据整合为训练集,通过所述训练集对所述图像分割模型进行训练;
通过训练获取最终图像分割模型参数,得到训练后图像分割模型。
需要说明的是,所述的根据目标位置特征及图像分割模型参数估算像素标签,具体为:
通过所述卷积神经网络模型获取图像中目标位置特征,根据所述目标位置特征将给定图像分为明确类别像素集合及未明确类别像素集合;
明确类别像素集合运用所述目标位置特征确定像素标签;
预设图像分割模型的参数,将未明确类别像素集合导入获取模型输出;
通过归一化指数函数计算像素属于各语义类别的概率,通过所述概率确定像素标签。
需要说明的是,所述的利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数,具体为:
将图像分割模型训练数据分为第一训练集和第二训练集;
将第一训练集中的每个像素分配类别标签的条件概率分布,计算图像分割模型的第一损失函数;
获取第二训练集进行多次迭代后的图像分割模型参数,根据所述参数计算像素标签的期望;
根据所述像素标签的期望最大化损失函数,生成第二损失函数;
预设损失权重,将所述第一损失函数和所述第二损失函数结合计算生成最终损失函数;
通过随机梯度下降方法处理最终损失函数对图像分割模型的参数进行更新优化;
所述最终损失函数的计算公式具体为:
Figure 457651DEST_PATH_IMAGE001
其中,
Figure 356337DEST_PATH_IMAGE002
表示所求的最终损失函数,
Figure 191438DEST_PATH_IMAGE003
表示损失权重,
Figure 935403DEST_PATH_IMAGE004
表示第一损失函数,
Figure 172349DEST_PATH_IMAGE005
表示第二损失函数,
Figure 569832DEST_PATH_IMAGE006
表示噪声函数。
图3示出了本发明运用真实标注信息对所述目标位置特征进行有效性验证方法流程图。
根据本发明实施例,还包括运用真实标注信息对所述目标位置特征进行有效性验证,同时对卷积神经网络模型进行修正,具体为:
S302,将图像中前景与背景进行区分,并将目标位置信息进行标注,生成真实标注信息;
S304,使用不同数量的训练集对所述卷积神经网络模型进行训练获取图像的分割结果信息;
S306,将所述真实标注信息与所述分割结果信息进行比较,获取偏差率;
S308,预设偏差率阈值,判断所述偏差率是否小于所述偏差率阈值;
S310,若小于,则说明所述目标位置特征对卷积神经网络模型提供了有效的标注及位置信息;
S312,若大于,则对激活图阈值进行重新确定,并生成修正信息,根据所述修正信息对模型进行修正。
根据本发明实施例,在所述图像分割模型对给定图像进行分割的过程中还引入影响因子,通过所述影响因子用来分析目标位置特征对未标注像素的影响,具体为:
在图像分割模型中引入影响因子,根据影响因子权重计算生成所述影响因子的影响信息;
预设所述影响信息阈值,将所述影响信息与影响信息阈值进行比较;
当所述影响信息大于影响信息阈值时,所述目标位置特征未标注像素的影响较弱;
当所述影响信息小于影响信息阈值时,所述目标位置特征未标注像素的影响增强,确保目标位置特征完整标注目标像素;
若目标像素未被目标位置特征标注及标注的标签不属于所属类别时,则通过影响因子调整图像分割模型参数降低标注为所属类别的可能性;
其中,通过影响因子调整图像分割模型参数,具体为:
Figure 33175DEST_PATH_IMAGE007
其中,
Figure DEST_PATH_IMAGE008
表示调整后图像分割模型参数,
Figure 675771DEST_PATH_IMAGE009
表示影响信息,
Figure DEST_PATH_IMAGE010
表示原始图像分割模型参数。
图4示出了本发明一种基于神经网络的图像分割系统的框图。
本发明第二方面还提供了一种基于神经网络的图像分割系统4,该系统包括:存储器41、处理器42,所述存储器中包括一种基于神经网络的图像分割方法程序,所述一种基于神经网络的图像分割方法程序被所述处理器执行时实现如下步骤:
将给定图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域;
根据所述判别性目标区域获取目标位置特征;
建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;
将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果;
同时利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数。
需要说明的是,为了确保获取给定图像中目标的完整区域,在目标位置特征与所述像素标签匹配过程中还进行图像级标注,所述图像级标注无法为给定图像中的目标进行精确地定位,将没有被目标位置特征包含的区域分配给图像级标签中的任意标签,将所述给定图像中目标的全部区域进行最大程度标注。
根据本发明实施例,所述的将给定图像进行预处理,通过卷积神经网络模型获取所述图像中目标位置特征,具体为:
构建卷积神经网络模型,将所述卷积神经网络模型进行初始化训练,得到预训练好的卷积神经网络模型;
设置卷积神经网络模型的输入图像尺寸信息,同时设置输出节点参数,匹配图像数据集的类别数目;
将所述卷积神经网络模型中的卷积特征矩阵及全连接层的权值矩阵结合,计算生成类别激活图信息;
通过所述激活图信息生成激活值,所述激活值对应类别目标在图像中的位置信息,根据所述位置信息获取目标位置特征。
需要说明的是,所述的建立图像分割模型,具体为:
获取目标位置特征,结合所述目标位置特征初始化图像分割模型的参数;
获取训练数据,将训练数据整合为训练集,通过所述训练集对所述图像分割模型进行训练;
通过训练获取最终图像分割模型参数,得到训练后图像分割模型。
需要说明的是,所述的根据目标位置特征及图像分割模型参数估算像素标签,具体为:
通过所述卷积神经网络模型获取图像中目标位置特征,根据所述目标位置特征将给定图像分为明确类别像素集合及未明确类别像素集合;
明确类别像素集合运用所述目标位置特征确定像素标签;
预设图像分割模型的参数,将未明确类别像素集合导入获取模型输出;
通过归一化指数函数计算像素属于各语义类别的概率,通过所述概率确定像素标签。
需要说明的是,所述的利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数,具体为:
将图像分割模型训练数据分为第一训练集和第二训练集;
将第一训练集中的每个像素分配类别标签的条件概率分布,计算图像分割模型的第一损失函数;
获取第二训练集进行多次迭代后的图像分割模型参数,根据所述参数计算像素标签的期望;
根据所述像素标签的期望最大化损失函数,生成第二损失函数;
预设损失权重,将所述第一损失函数和所述第二损失函数结合计算生成最终损失函数;
通过随机梯度下降方法处理最终损失函数对图像分割模型的参数进行更新优化;
所述最终损失函数的计算公式具体为:
Figure 236065DEST_PATH_IMAGE001
其中,
Figure 601188DEST_PATH_IMAGE002
表示所求的最终损失函数,
Figure 348564DEST_PATH_IMAGE003
表示损失权重,
Figure 699911DEST_PATH_IMAGE004
表示第一损失函数,
Figure 147335DEST_PATH_IMAGE005
表示第二损失函数,
Figure 824304DEST_PATH_IMAGE006
表示噪声函数。
根据本发明实施例,还包括运用真实标注信息对所述目标位置特征进行有效性验证,同时对卷积神经网络模型进行修正,具体为:
将图像中前景与背景进行区分,并将目标位置信息进行标注,生成真实标注信息;
使用不同数量的训练集对所述卷积神经网络模型进行训练获取图像的分割结果信息;
将所述真实标注信息与所述分割结果信息进行比较,获取偏差率;
预设偏差率阈值,判断所述偏差率是否小于所述偏差率阈值;
若小于,则说明所述目标位置特征对卷积神经网络模型提供了有效的标注及位置信息;
若大于,则对激活图阈值进行重新确定,并生成修正信息,根据所述修正信息对模型进行修正。
根据本发明实施例,在所述图像分割模型对给定图像进行分割的过程中还引入影响因子,通过所述影响因子用来分析目标位置特征对未标注像素的影响,具体为:
在图像分割模型中引入影响因子,根据影响因子权重计算生成所述影响因子的影响信息;
预设所述影响信息阈值,将所述影响信息与影响信息阈值进行比较;
当所述影响信息大于影响信息阈值时,所述目标位置特征未标注像素的影响较弱;
当所述影响信息小于影响信息阈值时,所述目标位置特征未标注像素的影响增强,确保目标位置特征完整标注目标像素;
若目标像素未被目标位置特征标注及标注的标签不属于所属类别时,则通过影响因子调整图像分割模型参数降低标注为所属类别的可能性;
其中,通过影响因子调整图像分割模型参数,具体为:
Figure 855714DEST_PATH_IMAGE007
其中,
Figure 745172DEST_PATH_IMAGE008
表示调整后图像分割模型参数,
Figure 811217DEST_PATH_IMAGE009
表示影响信息,
Figure 393508DEST_PATH_IMAGE010
表示原始图像分割模型参数。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于神经网络的图像分割方法程序,所述一种基于神经网络的图像分割方法程序被处理器执行时,实现如上述任一项所述的一种基于神经网络的图像分割方法的步骤。
本发明公开了一种基于神经网络的图像分割方法、系统及存储介质,包括以下步骤:将图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域,根据所述判别性目标区域获取目标位置特征;建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果。本申请通过对图像分割模型进行混合训练,将目标位置特征以两种方式引导参数学习过程,提升了分割准确率,同时本发明在图像分割过程中还对分割效果进行修正,使得图像分割准确性更高。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种基于神经网络的图像分割方法,其特征在于,包括:
将给定图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域;
根据所述判别性目标区域获取目标位置特征;
建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;
将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果;
同时利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数;
所述的利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数,具体为:
将图像分割模型训练数据分为第一训练集和第二训练集;
将第一训练集中的每个像素分配类别标签的条件概率分布,计算图像分割模型的第一损失函数;
获取第二训练集进行多次迭代后的图像分割模型参数,根据所述参数计算像素标签的期望;
根据所述像素标签的期望最大化损失函数,生成第二损失函数;
预设损失权重,将所述第一损失函数和所述第二损失函数结合计算生成最终损失函数;
通过随机梯度下降方法处理最终损失函数对图像分割模型的参数进行更新优化;
所述最终损失函数的计算公式具体为:
Figure 807302DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
表示所求的最终损失函数,
Figure 402232DEST_PATH_IMAGE004
表示损失权重,
Figure DEST_PATH_IMAGE005
表示第一损失函数,
Figure 164914DEST_PATH_IMAGE006
表示第二损失函数,
Figure DEST_PATH_IMAGE007
表示噪声函数。
2.根据权利要求1所述的一种基于神经网络的图像分割方法,其特征在于,所述的将图像进行预处理,通过卷积神经网络模型获取所述图像中目标位置特征,具体为:
构建卷积神经网络模型,将所述卷积神经网络模型进行初始化训练,得到预训练好的卷积神经网络模型;
设置卷积神经网络模型的输入图像尺寸信息,同时设置输出节点参数,匹配图像数据集的类别数目;
将所述卷积神经网络模型中的卷积特征矩阵及全连接层的权值矩阵结合,计算生成类别激活图信息;
通过所述激活图信息生成激活值,所述激活值对应类别目标在图像中的位置信息,根据所述位置信息获取目标位置特征。
3.根据权利要求1所述的一种基于神经网络的图像分割方法,其特征在于,所述的建立图像分割模型,具体为:
获取目标位置特征,结合所述目标位置特征初始化图像分割模型的参数;
获取训练数据,将训练数据整合为训练集,通过所述训练集对初始图像分割模型进行训练;
通过训练获取最终图像分割模型参数,得到训练后图像分割模型。
4.根据权利要求1所述的一种基于神经网络的图像分割方法,其特征在于,所述的根据目标位置特征及图像分割模型参数估算像素标签,具体为:
通过所述卷积神经网络模型获取图像中目标位置特征,根据所述目标位置特征将给定图像分为明确类别像素集合及未明确类别像素集合;
明确类别像素集合运用所述目标位置特征确定像素标签;
预设图像分割模型的参数,将未明确类别像素集合导入获取模型输出;
通过归一化指数函数计算像素属于各语义类别的概率,通过所述概率确定像素标签。
5.根据权利要求1所述的一种基于神经网络的图像分割方法,其特征在于,还包括运用真实标注信息对所述目标位置特征进行有效性验证,同时对卷积神经网络模型进行修正,具体为:
将图像中前景与背景进行区分,并将目标位置信息进行标注,生成真实标注信息;
使用不同数量的训练集对所述卷积神经网络模型进行训练获取图像的分割结果信息;
将所述真实标注信息与所述分割结果信息进行比较,获取偏差率;
预设偏差率阈值,判断所述偏差率是否小于所述偏差率阈值;
若小于,则说明所述目标位置特征对卷积神经网络模型提供了有效的标注及位置信息;
若大于,则对激活图阈值进行重新确定,并生成修正信息,根据所述修正信息对模型进行修正。
6.一种基于神经网络的图像分割系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括一种基于神经网络的图像分割方法程序,所述一种基于神经网络的图像分割方法程序被所述处理器执行时实现如下步骤:
将给定图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域;
根据所述判别性目标区域获取目标位置特征;
建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;
将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果;
同时利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数;
所述的利用随机梯度下降方法根据所述像素标签优化所述图像分割模型的参数,具体为:
将图像分割模型训练数据分为第一训练集和第二训练集;
将第一训练集中的每个像素分配类别标签的条件概率分布,计算图像分割模型的第一损失函数;
获取第二训练集进行多次迭代后的图像分割模型参数,根据所述参数计算像素标签的期望;
根据所述像素标签的期望最大化损失函数,生成第二损失函数;
预设损失权重,将所述第一损失函数和所述第二损失函数结合计算生成最终损失函数;
通过随机梯度下降方法处理最终损失函数对图像分割模型的参数进行更新优化;
所述最终损失函数的计算公式具体为:
Figure 37055DEST_PATH_IMAGE002
其中,
Figure 623894DEST_PATH_IMAGE003
表示所求的最终损失函数,
Figure 847065DEST_PATH_IMAGE004
表示损失权重,
Figure 177552DEST_PATH_IMAGE005
表示第一损失函数,
Figure 169779DEST_PATH_IMAGE006
表示第二损失函数,
Figure 458678DEST_PATH_IMAGE007
表示噪声函数。
7.根据权利要求6所述的一种基于神经网络的图像分割系统,其特征在于,所述的将图像进行预处理,通过卷积神经网络模型获取所述图像中目标位置特征,具体为:
将给定图像进行预处理,通过卷积神经网络模型获取所述图像的判别性目标区域;
根据所述判别性目标区域获取目标位置特征;
建立图像分割模型,根据所述目标位置特征及图像分割模型参数估算像素标签;
将目标位置特征与所述像素标签进行匹配,通过图像分割模型得到给定图像的分割结果。
8.根据权利要求6所述的一种基于神经网络的图像分割系统,其特征在于,所述的根据目标位置特征及图像分割模型参数估算像素标签,具体为:
通过所述卷积神经网络模型获取图像中目标位置特征,根据所述目标位置特征将给定图像分为明确类别像素集合及未明确类别像素集合;
明确类别像素集合运用所述目标位置特征确定像素标签;
预设图像分割模型的参数,将未明确类别像素集合导入获取模型输出;
通过归一化指数函数计算像素属于各语义类别的概率,通过所述概率确定像素标签。
9.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中包括一种基于神经网络的图像分割方法程序,所述一种基于神经网络的图像分割方法程序被处理器执行时,实现如权利要求1至5中任一项所述的一种基于神经网络的图像分割方法的步骤。
CN202110708841.8A 2021-06-25 2021-06-25 一种基于神经网络的图像分割方法、系统及存储介质 Active CN113255683B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110708841.8A CN113255683B (zh) 2021-06-25 2021-06-25 一种基于神经网络的图像分割方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110708841.8A CN113255683B (zh) 2021-06-25 2021-06-25 一种基于神经网络的图像分割方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN113255683A CN113255683A (zh) 2021-08-13
CN113255683B true CN113255683B (zh) 2021-10-01

Family

ID=77189779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110708841.8A Active CN113255683B (zh) 2021-06-25 2021-06-25 一种基于神经网络的图像分割方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN113255683B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109410211A (zh) * 2017-08-18 2019-03-01 北京猎户星空科技有限公司 一种图像中目标物体的分割方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108335313A (zh) * 2018-02-26 2018-07-27 阿博茨德(北京)科技有限公司 图像分割方法及装置
CN110751633A (zh) * 2019-10-11 2020-02-04 上海眼控科技股份有限公司 基于深度学习的多轴大车制动检测方法、装置、系统
CN112200810B (zh) * 2020-09-30 2023-11-14 深圳市第二人民医院(深圳市转化医学研究院) 多模态的自动化脑室分割系统及其使用方法
CN112288026B (zh) * 2020-11-04 2022-09-20 南京理工大学 一种基于类激活图的红外弱小目标检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109410211A (zh) * 2017-08-18 2019-03-01 北京猎户星空科技有限公司 一种图像中目标物体的分割方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Geometric Segmentation Method for Traffic Scenes Using Super-Pixel Label Matching;Hu Jiangce et al;《Jounal of Xi"an Jiaotong University》;20181010;第52卷(第8期);74-79 *
基于深度神经网络的移动端人像分割;杨坚伟 等;《计算机应用》;20201231;第40卷(第12期);3644-3650 *

Also Published As

Publication number Publication date
CN113255683A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
CN107798299B (zh) 票据信息识别方法、电子装置及可读存储介质
WO2020098250A1 (zh) 字符识别方法、服务器及计算机可读存储介质
US9152860B2 (en) Methods and apparatus for capturing, processing, training, and detecting patterns using pattern recognition classifiers
CN111291629A (zh) 图像中文本的识别方法、装置、计算机设备及计算机存储介质
US11392800B2 (en) Computer vision systems and methods for blind localization of image forgery
CN113283446B (zh) 图像中目标物识别方法、装置、电子设备及存储介质
CN112634170B (zh) 一种模糊图像修正的方法、装置、计算机设备及存储介质
CN111340028A (zh) 一种文本定位方法、装置、电子设备及存储介质
CN113569863B (zh) 一种单据稽查的方法、系统、电子设备及存储介质
CN111931783A (zh) 一种训练样本生成方法、机读码识别方法及装置
CN116311214B (zh) 车牌识别方法和装置
CN110826581A (zh) 一种动物数量识别方法、装置、介质及电子设备
CN113627576B (zh) 扫码信息检测方法、装置、设备及存储介质
CN115984930A (zh) 微表情识别方法、装置、微表情识别模型的训练方法
CN112070793A (zh) 一种目标提取方法及装置
CN110414522A (zh) 一种字符识别方法及装置
CN113255683B (zh) 一种基于神经网络的图像分割方法、系统及存储介质
CN115115552B (zh) 图像矫正模型训练及图像矫正方法、装置和计算机设备
CN111563462A (zh) 图像元素的检测方法及装置
CN116452802A (zh) 车损检测方法、装置、设备及存储介质
CN113177543B (zh) 证件识别方法、装置、设备及存储介质
CN112084874B (zh) 一种物体检测方法、装置及终端设备
CN113688834A (zh) 车票识别方法、车票识别系统及计算机可读存储介质
CN114913513A (zh) 一种公章图像的相似度计算方法、装置、电子设备和介质
CN113723359A (zh) 用户情绪识别方法、装置、计算机设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230706

Address after: 1101, 1102, 1103, 1104-A159, Building 12, Phase I, China Resources Land Plaza, 266 Dongliu Road, Changsha Economic and Technological Development Zone, Changsha City, 410000, Hunan Province

Patentee after: Hunan Yongwang Practical New Technology Research Institute

Address before: 528000 building 4, No. 28, Jiangwan Third Road, Chancheng District, Foshan City, Guangdong Province

Patentee before: Guangdong Xingrui Technology Co.,Ltd.