CN112598686A - 图像分割方法、装置、计算机设备及存储介质 - Google Patents

图像分割方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112598686A
CN112598686A CN202110234267.7A CN202110234267A CN112598686A CN 112598686 A CN112598686 A CN 112598686A CN 202110234267 A CN202110234267 A CN 202110234267A CN 112598686 A CN112598686 A CN 112598686A
Authority
CN
China
Prior art keywords
image
segmentation
sample
model
segmented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110234267.7A
Other languages
English (en)
Other versions
CN112598686B (zh
Inventor
余双
冀炜
马锴
郑冶枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110234267.7A priority Critical patent/CN112598686B/zh
Publication of CN112598686A publication Critical patent/CN112598686A/zh
Application granted granted Critical
Publication of CN112598686B publication Critical patent/CN112598686B/zh
Priority to PCT/CN2022/077951 priority patent/WO2022183984A1/zh
Priority to EP22762449.1A priority patent/EP4287117A1/en
Priority to US18/074,906 priority patent/US20230106468A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20224Image subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30041Eye; Retina; Ophthalmic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种图像分割方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:根据先验知识向量对原始图像进行编码处理,得到目标特征图,对目标特征图进行解码处理,得到原始图像的第一分割图像,根据先验知识向量,对第一分割图像进行图像重构,得到多个标注分割图像,基于多个标注分割图像对目标特征图进行处理,得到原始图像的第二分割图像。本申请实施例提供的方法,通过引入用于表示多个标注者的标注准确度的先验知识权重,重构出与多个标注者相匹配的标注分割图像,通过多个标注分割图像及目标特征图来获取原始图像的第二分割图像,使得第二分割图像中融入了多个标注者对应的标注结果,提高了图像分割的准确性。

Description

图像分割方法、装置、计算机设备及存储介质
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种图像分割方法、装置、计算机设备及存储介质。
背景技术
随着计算机技术的发展,图像分割技术的应用越来越广泛,在很多领域中都需要进行图像分割。例如,在医疗领域能够采用图像分割技术从图像中提取某个身体部位的图像。
通常在对原始图像进行分割处理时,会先对原始图像进行编码处理,得到原始图像的特征图,再对该特征图进行解码处理,得到分割图像,该分割图像能够指示原始图像中的目标物体所在的区域。但这种图像分割方式简单,图像分割的准确性差。
发明内容
本申请实施例提供了一种图像分割方法、装置、计算机设备及存储介质,能够提高图像分割的准确性。所述技术方案包括如下内容。
一方面,提供了一种图像分割方法,所述方法包括:
根据先验知识向量对原始图像进行编码处理,得到目标特征图,所述原始图像中包括目标物体,所述先验知识向量包括多个先验知识权重,每个先验知识权重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度;
对所述目标特征图进行解码处理,得到所述原始图像的第一分割图像,所述第一分割图像用于指示所述目标物体在所述原始图像中所处的目标区域;
根据所述先验知识向量,对所述第一分割图像进行图像重构,得到多个标注分割图像,每个标注分割图像与一个先验知识权重对应,所述每个标注分割图像用于指示对应的标注者所标注的所述目标区域;
基于所述多个标注分割图像对所述目标特征图进行处理,得到所述原始图像的第二分割图像。
在一种可能实现方式中,所述根据所述先验知识向量,对所述第一分割图像进行图像重构,得到多个标注分割图像,包括:
将所述原始图像及所述第一分割图像进行拼接,得到拼接图像;
对所述拼接图像进行编码处理,得到第三特征图;
将所述先验知识向量与所述第三特征图进行融合,得到第四特征图;
对所述第四特征图进行解码处理,得到所述多个标注分割图像。
另一方面,提供了一种图像分割装置,所述装置包括:
编码模块,用于根据先验知识向量对原始图像进行编码处理,得到目标特征图,所述原始图像中包括目标物体,所述先验知识向量包括多个先验知识权重,每个先验知识权重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度;
解码模块,用于对所述目标特征图进行解码处理,得到所述原始图像的第一分割图像,所述第一分割图像用于指示所述目标物体在所述原始图像中所处的目标区域;
重构模块,用于根据所述先验知识向量,对所述第一分割图像进行图像重构,得到多个标注分割图像,每个标注分割图像与一个先验知识权重对应,所述每个标注分割图像用于指示对应的标注者所标注的所述目标区域;
处理模块,用于基于所述多个标注分割图像对所述目标特征图进行处理,得到所述原始图像的第二分割图像。
在一种可能实现方式中,所述处理模块,包括:
第一确定单元,用于根据所述多个标注分割图像之间的差异,确定不确定性图像,所述不确定性图像用于指示所述多个标注分割图像指示的目标区域之间的差异;
第一融合单元,用于将所述目标特征图与所述不确定性图像进行融合,得到所述第二分割图像。
在另一种可能实现方式中,所述每个标注分割图像包括所述原始图像中的多个像素点对应的第一权重,所述第一权重用于表示对应的像素点在所述目标区域内的可能性;
所述第一确定单元,用于确定所述多个标注分割图像与所述多个标注分割图像的平均值图像之间的差值图像;确定多个差值图像中位于相同位置的像素点的像素值的平方和;将每个位置对应的平方和与所述多个标注分割图像的个数之间的比值的开方,分别确定为所述每个位置的第二权重;根据多个位置的第二权重构建所述不确定性图像。
在另一种可能实现方式中,所述第一融合单元,用于确定所述多个标注分割图像的平均值图像;将所述目标特征图与所述不确定性图像的乘积与所述目标特征图之和,确定为第一融合特征图;将所述目标特征图与所述平均值图像的乘积与所述目标特征图之和,确定为第二融合特征图;将所述第一融合特征图及所述第二融合特征图进行拼接,得到拼接融合特征图;对所述拼接融合特征图进行卷积处理,得到所述第二分割图像。
在另一种可能实现方式中,所述编码模块,包括:
第一编码单元,用于对所述原始图像进行编码处理,得到所述原始图像的第一特征图;
第二融合单元,用于将所述先验知识向量与所述第一特征图进行融合,得到第二特征图;
第一解码单元,用于对所述第二特征图进行解码处理,得到所述目标特征图。
在另一种可能实现方式中,所述重构模块,包括:
拼接单元,用于将所述原始图像及所述第一分割图像进行拼接,得到拼接图像;
第二编码单元,用于对所述拼接图像进行编码处理,得到第三特征图;
第三融合单元,用于将所述先验知识向量与所述第三特征图进行融合,得到第四特征图;
第二解码单元,用于对所述第四特征图进行解码处理,得到所述多个标注分割图像。
在另一种可能实现方式中,
所述根据先验知识向量对原始图像进行编码处理,得到目标特征图的步骤由第一图像分割模型执行;
所述对所述目标特征图进行解码处理,得到所述原始图像的第一分割图像的步骤由所述第一图像分割模型执行;
所述根据所述先验知识向量,对所述第一分割图像进行图像重构,得到多个标注分割图像的步骤由图像重构模型执行;
所述基于所述多个标注分割图像对所述目标特征图进行处理,得到所述原始图像的第二分割图像的步骤由第二图像分割模型执行。
在另一种可能实现方式中,所述装置还包括:
获取模块,用于获取样本原始图像、多个样本标注分割图像及所述先验知识向量,所述样本原始图像中包括样本物体,每个样本标注分割图像与一个先验知识权重对应,所述每个样本标注分割图像用于指示对应的标注者所标注的所述样本物体在所述样本原始图像中所处的样本区域;
所述编码模块,还用于调用所述第一图像分割模型,根据所述先验知识向量对所述样本原始图像进行编码处理,得到目标样本特征图;
所述解码模块,还用于调用所述第一图像分割模型,对所述目标样本特征图进行解码处理,得到所述样本原始图像的第一样本分割图像,所述第一样本分割图像用于指示所述样本物体在所述样本原始图像中所处的样本区域;
所述重构模块,还用于调用所述图像重构模型,根据所述先验知识向量,对所述第一样本分割图像进行图像重构,得到多个预测标注分割图像,每个预测标注分割图像与一个先验知识权重对应,所述每个预测标注分割图像用于指示预测到的对应的标注者所标注的所述样本区域;
所述处理模块,还用于调用所述第二图像分割模型,基于所述多个预测标注分割图像对所述目标样本特征图进行处理,得到所述样本原始图像的预测分割图像;
加权融合模块,用于根据所述先验知识向量,对所述多个样本标注分割图像进行加权融合,得到融合标注分割图像;
训练模块,用于根据所述预测分割图像与所述融合标注分割图像之间的差异,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。
在另一种可能实现方式中,所述训练模块,包括:
第二确定单元,用于根据所述预测分割图像与所述融合标注分割图像之间的差异,确定第一损失值;
训练单元,用于根据所述第一损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。
在另一种可能实现方式中,所述训练单元,用于根据所述第一样本分割图像与所述融合标注分割图像之间的差异,确定第二损失值;根据所述第一损失值及所述第二损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。
在另一种可能实现方式中,所述训练单元,用于根据所述多个预测标注分割图像与对应的样本标注分割图像之间的差异,确定第三损失值;根据所述第一损失值及所述第三损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。
在另一种可能实现方式中,所述图像重构模型包括编码子模型、融合子模型及解码子模型;
所述重构模块,用于将所述样本原始图像及所述第一样本分割图像进行拼接,得到第一样本拼接图像;调用所述编码子模型,对所述第一样本拼接图像进行编码处理,得到第一样本特征图;调用所述融合子模型,将所述先验知识向量与所述第一样本特征图进行融合,得到第二样本特征图;调用所述解码子模型,对所述第二样本特征图进行解码处理,得到所述多个预测标注分割图像。
在另一种可能实现方式中,所述装置还包括:
拼接模块,用于将所述样本原始图像及所述融合标注分割图像进行拼接,得到第二样本拼接图像;
所述重构模块,还用于调用所述编码子模型,对所述第二样本拼接图像进行编码处理,得到第三样本特征图;
所述训练单元,用于根据所述第三样本特征图与所述第一样本特征图之间的差异,确定第四损失值;根据所述第一损失值及所述第四损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如上述方面所述的图像分割方法中所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如上述方面所述的图像分割方法中所执行的操作。
再一方面,提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机程序代码,所述计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行所述计算机程序代码,使得所述计算机设备实现如上述方面所述的图像分割方法中所执行的操作。
本申请实施例提供的技术方案带来的有益效果至少包括:
本申请实施例提供的方法、装置、计算机设备及存储介质,在对原始图像进行分割的过程中,通过引入用于表示多个标注者的标注准确度的先验知识权重,重构出与多个标注者相匹配的标注分割图像,以指示目标物体在原始图像中所处的目标区域,即重构出了多个标注者对原始图像的多种标注结果,之后,通过多个标注分割图像及原始图像的目标特征图来获取原始图像的第二分割图像,使得第二分割图像中融入了多个标注者对应的标注结果,保证第二分割图像的准确性,从而提高了图像分割的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的结构示意图;
图2是本申请实施例提供的一种图像分割方法的流程图;
图3是本申请实施例提供的一种图像分割方法的流程图;
图4是本申请实施例提供的一种获取第二特征图方法的流程图;
图5是本申请实施例提供的一种多个标注者的标注图像的示意图;
图6是本申请实施例提供的一种图像分割方法的流程图;
图7是本申请实施例提供的一种多种方式的分割图像的对比图;
图8是本申请实施例提供的一种多种方式的分割图像的对比图;
图9是本申请实施例提供的一种模型训练方法的流程图;
图10是本申请实施例提供的一种获取预测分割图像的流程图;
图11是本申请实施例提供的一种模型训练过程的流程图;
图12是本申请实施例提供的一种图像分割装置的结构示意图;
图13是本申请实施例提供的一种图像分割装置的结构示意图;
图14是本申请实施例提供的一种终端的结构示意图;
图15是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请所使用的术语“第一”、“第二”、“第三”、“第四”、“第五”、“第六”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,能够将第一特征图称为第二特征图,且类似地,能够将第二特征图称为第一特征图。
本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”,至少一个包括一个、两个或两个以上,多个包括两个或两个以上,而每个是指对应的多个中的每一个,任一是指多个中的任意一个。举例来说,多个先验知识权重包括3个先验知识权重,而每个是指这3个先验知识权重中的每一个先验知识权重,任一是指这3个先验知识权重中的任意一个先验知识权重,能够是第一个,或者,是第二个,或者,是第三个。
人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision, CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
本申请实施例提供的方案,基于人工智能的机器学习技术,能够训练第一图像分割模型、图像重构模型及第二图像分割模型,利用训练后的第一图像分割模型、图像重构模型及第二图像分割模型,实现了图像分割方法。
本申请实施例提供的图像分割方法,能够用于计算机设备中。可选地,该计算机设备为终端或服务器。可选地,该服务器是独立的物理服务器,或者,是多个物理服务器构成的服务器集群或者分布式系统,或者,是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
在一种可能实现方式中,多个服务器可组成为一区块链,服务器为区块链上的节点,且本申请实施例提供的图像分割方法,能够应用于该区块链中的任一服务器。该服务器采用本申请实施例提供的图像分割方法,能够对任一图像进行分割,将得到的分割图像存储于区块链中,从而与区块链中的其他服务器进行共享。
图1是本申请实施例提供的一种实施环境的示意图。参见图1,该实施环境包括终端101和服务器102。终端101和服务器102之间通过无线或者有线网络连接。终端101上安装由服务器102提供服务的目标应用,终端101能够通过该目标应用实现例如数据传输、消息交互等功能。可选地,目标应用为终端101操作系统中的目标应用,或者为第三方提供的目标应用。例如,目标应用为医疗诊断应用,该医疗诊断应用具有图像分割的功能,当然,该医疗诊断应用还能够具有其他功能,例如,点评功能、导航功能等。
终端101用于基于用户标识登录目标应用,通过目标应用将原始图像发送至服务器102,服务器102用于接收终端101发送的原始图像,对该原始图像进行图像分割,获取该原始图像的分割图像,并将获取到的分割图像返回至终端101,终端101能够显示接收到的分割图像。
本申请实施例提供的方法,可用于多种场景。
例如,医疗场景下:
终端拍摄用户眼部,得到用户的眼部图像,将该眼部图像发送至具有图像分割功能的服务器,该服务器在接收到该眼部图像后,采用本申请实施例提供的图像分割方法,获取该眼部图像的分割图像,以确定该眼部图像中视杯和视盘所处的区域,之后医生能够根据该分割图像中视杯和视盘所处的区域,确定该用户的眼部状态。
图2是本申请实施例提供的一种图像分割方法的流程图,应用于计算机设备中,如图2所示,该方法包括以下步骤。
201、计算机设备根据先验知识向量对原始图像进行编码处理,得到目标特征图。
其中,原始图像中包括目标物体,该原始图像为任意的图像,例如,在医疗场景下,该原始图像为医学图像,该目标物体为某一身体部位,如,该原始图像为眼部图像,该目标物体为眼部中的视杯或视盘;或者,该原始图像为人体肺部图像,该目标物体为人体肺部的病变物体。先验知识向量包括多个先验知识权重,每个先验知识权重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度,目标特征图用于表示该原始图像中包含的特征信息。
202、计算机设备对目标特征图进行解码处理,得到原始图像的第一分割图像。
其中,第一分割图像用于指示目标物体在原始图像中所处的目标区域。由于目标特征图中包含了原始图像的特征信息,且该目标特征图中融入了先验知识向量,采用解码的方式来获取的第一分割图像,相当于是多个先验知识权重所对应的标注者的标注结果融合后的分割图像。
203、计算机设备根据先验知识向量,对第一分割图像进行图像重构,得到多个标注分割图像。
其中,每个标注分割图像与一个先验知识权重对应,每个标注分割图像用于指示对应的标注者所标注的目标区域,由于不同的标注者的标注水平不同,则多个标注分割图像中所指示的目标区域可能存在差异。第一分割图像相当于是多个标注者的标注结果融合后的分割图像,通过该先验知识向量中的多个先验知识权重及第一分割图像,重构出与多个标注者相匹配的标注分割图像,以指示目标物体在原始图像中所处的目标区域,以便后续能够基于重构出的多个标注分割图像来更新原始图像的分割图像,提高分割图像的准确性。
204、计算机设备基于多个标注分割图像对目标特征图进行处理,得到原始图像的第二分割图像。
由于每个标注分割图像对应于一个先验知识权重,每个标注分割图像表示对应的标注者对原始图像进行标注的标注结果,则基于该多个标注分割图像对目标特征图进行处理,以提高第二分割图像的准确性。
本申请实施例提供的方法,在对原始图像进行分割的过程中,通过引入用于表示多个标注者的标注准确度的先验知识权重,重构出与多个标注者相匹配的标注分割图像,以指示目标物体在原始图像中所处的目标区域,即重构出了多个标注者对原始图像的多种标注结果,之后,通过多个标注分割图像及原始图像的目标特征图来获取原始图像的第二分割图像,使得第二分割图像中融入了多个标注者对应的标注结果,保证第二分割图像的准确性,从而提高了图像分割的准确性。
图3是本申请实施例提供的一种图像分割方法的流程图,应用于计算机设备中,如图3所示,该方法包括以下步骤。
301、计算机设备对原始图像进行编码处理,得到原始图像的第一特征图。
其中,该第一特征图用于表示该原始图像中包含的特征信息,该原始图像中包括目标物体,该原始图像为任意的图像,例如,在医疗场景下,该原始图像为医学图像,该目标物体为某一身体部位,如,该原始图像为眼部图像,该目标物体为眼部中的视杯或视盘;或者,该原始图像为人体肺部图像,该目标物体为人体肺部的病变物体。
在一种可能实现方式中,该步骤301包括:调用第一图像分割模型中的第一编码子模型,对该原始图像进行编码处理,得到该原始图像的第一特征图。
其中,第一图像分割模型用于获取原始图像的分割图像的模型,例如,该第一图像分割模型为U-Net(一种二维图像分割的卷积神经网络)。该第一编码子模型用于获取原始图像的特征图,例如,该第一编码子模型为U-Net中的编码器。通过第一图像分割模型中的第一编码子模型对原始图像进行编码处理,使第一特征图中包含了原始图像的特征信息,以保证获取到的第一特征图的准确性。
可选地,该第一编码子模型包括多个第一卷积模块,则获取第一特征图的过程包括:按照多个第一卷积模块的排列顺序,调用第一个第一卷积模块,对该原始图像进行编码处理,得到第一个第一参考特征图,调用当前的第一卷积模块对上一个第一卷积模块输出的参考特征图进行编码处理,得到当前的第一卷积模块对应的第一参考特征图,直至得到最后一个第一卷积模块输出第一参考特征图,将最后一个第一卷积模块输出的第一参考特征图确定为该第一特征图。
其中,在该第一编码子模型中包括的多个第一卷积模块中,按照多个第一卷积模块的排列顺序,多个第一卷积模块输出的参考特征图的尺寸逐渐减小。通过编码子模型中的多个第一卷积模块,按照多个尺度对原始图像进行编码处理,即该编码子模型采用一种下采样的方式,逐渐增强特征图包含的特征,以提高第一特征图的准确性。
302、计算机设备将先验知识向量与第一特征图进行融合,得到第二特征图。
其中,先验知识向量包括多个先验知识权重,每个先验知识权重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度,该先验知识权重能够体现出对应的标注者的标注水平。由于多个标注者的标注水平有高低之分,则每个标注者对应的先验知识权重也有大小之分,先验知识权重越大,表示对应的标注者的标注水平越高,即该标注者在图像中标注物体所在区域的准确度越高;先验知识权重越小,表示对应的标注者的标注水平越低,即该标注者在图像中标注物体所在区域的准确度越低。
可选地,该先验知识向量是由任意设置的,例如,该先验知识向量为[0.1,01,0.4,0.4],即该先验知识向量包括了4个标注者对应的先验知识权重,两个标注者对应的先验知识权重为0.1,两个标注者对应的先验知识权重为0.4。
通过将先验知识向量与第一特征图进行融合,以使第二特征图中不仅包括了原始图像中的特征,还融入了多个标注者对应的先验知识权重,使得第二特征图中包含的特征与该先验知识向量之间动态关联,且第二特征图中包含的特征受到该先验知识向量的影响,增强了第二特征图中包含的特征的动态表征能力,提高了第二特征图包含的特征的准确性。
在一种可能实现方式中,该步骤302包括:调用第一图像分割模型中的知识推断子模型,将先验知识向量与第一特征图进行融合,得到第二特征图。
其中,该知识推断子模型用于将先验知识向量融合第一特征图,例如,该知识推断子模型为ConvLSTM(Convolutional Long Short-Term Memory,长短期注意力模型)。通过该知识推断子模型,将先验知识向量与原始图像的第一特征图进行融合,增强了第二特征图中包含的特征的动态表征能力。如图4所示,对先验知识向量进行尺寸扩张,以使尺寸扩张后的先验知识向量与第一特征图的尺寸相同,之后,通过长短期注意力模型,将扩张后的先验知识向量与第一特征图进行融合,以增强第一特征图中包含的特征,得到融合后的第二特征图。
可选地,第一特征图、先验知识向量及第二特征图满足以下关系:
Figure DEST_PATH_IMAGE001
其中,
Figure DEST_PATH_IMAGE002
用于表示增强后的特征图,
Figure DEST_PATH_IMAGE003
用于表示第一特征图,
Figure DEST_PATH_IMAGE004
用于表示长短期注意力模型,
Figure DEST_PATH_IMAGE005
表示增强前的特征图,
Figure DEST_PATH_IMAGE006
表示特征增强迭代轮次,该
Figure DEST_PATH_IMAGE007
为不小于2的正整数;当
Figure DEST_PATH_IMAGE008
时,
Figure DEST_PATH_IMAGE009
为该先验知识向量;当
Figure DEST_PATH_IMAGE010
时,
Figure DEST_PATH_IMAGE011
为该第二特征图。
303、计算机设备对第二特征图进行解码处理,得到目标特征图。
其中,目标特征图用于表示该原始图像中包含的特征信息。在得到第二特征图后,采用解码的方式,以细化特征图中包含的特征,提高了目标特征图中包含的特征的准确性。
在一种可能实现方式中,该步骤303包括:调用第一图像分割模型中的第一解码子模型,对该第二特征图进行解码处理,得到该目标特征图。
其中,该第一解码子模型用于增强特征图中包含的特征,例如,该第一解码子模型为U-Net中的解码器。
可选地,第一图像分割模型包括第一编码子模型,该第一编码子模型包括多个第一卷积模块,该第一解码子模型包括多个第二卷积模块,则获取目标特征图的过程包括:按照多个第二卷积模块的排列顺序,调用第一个第二卷积模块,对该第二特征图进行解码处理,得到第一个第二参考特征图,调用当前的第二卷积模块,对上一个第二卷积模块输出的参考特征图及当前的第二卷积模块对应的第一卷积模块输出的参考特征图进行解码处理,得到当前的第二卷积模块对应的第二参考特征图,直至得到最后一个第二卷积模块输出第二参考特征图,将最后一个第二卷积模块输出的第二参考特征图确定为目标特征图。
其中,在该第一解码子模型中包括的多个第二卷积模块中,按照多个第二卷积模块的排列顺序,多个第二卷积模块输出的参考特征图的尺寸逐渐增大。通过解码子模型中的多个第二卷积模块,采用一种上采样的方式,逐渐细化特征图中包含的特征,以提高目标特征图中包含的特征的准确性。
需要说明的是,本申请实施例是将原始图像编码处理后的第一特征图与先验知识向量融合后,对得到的第二特征图进行解码处理来获取目标特征图的,而在另一实施例中,无需执行上述步骤301-303,能够采取其他方式,根据先验知识向量对原始图像进行编码处理,得到目标特征图。
在一种可能实现方式中,调用第一图像分割模型,根据先验知识向量对原始图像进行编码处理,得到目标特征图。通过第一图像分割模型,来获取目标特征图,以提高目标特征图的准确性。
304、计算机设备对目标特征图进行解码处理,得到原始图像的第一分割图像。
其中,第一分割图像用于指示目标物体在原始图像中所处的目标区域。可选地,该第一分割图像中包括原始图像中的多个像素点对应的权重,该权重用于表示对应的像素点在该目标区域内的可能性。在该第一分割图像中包括多个像素点,每个像素点的像素值表示原始图像中位于相同位置的像素点对应的权重,对于原始图像中的任一位置的像素点,在该第一分割图像中位于相同位置的像素点的像素值,即为该原始图像中该位置的像素点的权重。
可选地,该第一分割图像以热力图的形式表示,在该第一分割图像中,像素点对应的权重越大,该像素点对应的颜色越深,像素点对应的权重越小,该像素点对应的颜色越浅。例如,在该第一分割图像中,权重为0时,该权重对应的像素点所对应的颜色为蓝色,权重为1时,该权重对应的像素点所对应的颜色为红色,权重介于0至1之间时,该权重对应的像素点所对应的颜色为蓝色变为红色之间的过渡色,例如,权重由0变为1,该权重对应的像素点所对应的颜色由蓝色逐渐变为红色。
由于目标特征图中不仅包含了原始图像的特征信息,并且该目标特征图中还融入了先验知识向量,对目标特征图采用解码的方式来获取第一分割图像,该第一分割图像相当于是多个先验知识权重所对应的标注者的标注结果融合后的分割图像。
在一种可能实现方式中,该步骤304包括:调用第一图像分割模型,对目标特征图进行解码处理,得到原始图像的第一分割图像。
可选地,调用该第一图像分割模型中的卷积子模型,对该目标特征图进行卷积处理,得到该第一分割图像。
305、计算机设备将原始图像及第一分割图像进行拼接,得到拼接图像。
由于第一分割图像用于指示目标物体在原始图像中所处的目标区域,通过将原始图像与第一分割图像进行拼接,使得拼接图像中不仅包含了原始图像所包含的信息,还包含了用于指示目标物体在原始图像中所处的目标区域的信息,丰富了拼接图像中包含的信息,以便后续能够重构出多个标注分割图像。
306、计算机设备对拼接图像进行编码处理,得到第三特征图。
其中,第三特征图用于表示原始图像中包含的特征信息及用于指示目标物体在原始图像中所处的目标区域的特征信息。
在一种可能实现方式中,该步骤306包括:调用图像重构模型中的编码子模型,对该拼接图像进行编码处理,得到该第三特征图。
其中,图像重构模型用于重构多个先验知识权重所对应的标注分割图像,该编码子模型用于获取拼接图像的特征图,例如,该编码子模型为U-Net中的编码器。该图像重构模型中的编码子模型与上述步骤301中的第一图像分割模型中的第一编码子模型同理,在此不再赘述。
307、计算机设备将先验知识向量与第三特征图进行融合,得到第四特征图。
通过将先验知识向量与第三特征图融合,使得第四特征图中不仅包括原始图像中包含的特征信息,还融入了多个标注者对应的先验知识权重,以便后续能够根据第四特征图来重构出每个先验知识权重对应的标注分割图像。
在一种可能实现方式中,该步骤307包括:调用图像重构模型中的融合子模型,将先验知识向量与第三特征图进行融合,得到第四特征图。
其中,融合子模型与上述步骤302中的知识推断子模型类似,在此不再赘述。
308、计算机设备对第四特征图进行解码处理,得到多个标注分割图像。
其中,每个标注分割图像与一个先验知识权重对应,每个标注分割图像用于指示对应的标注者所标注的目标区域,由于不同的标注者的标注水平不同,则多个标注分割图像中所指示的目标区域可能存在差异。如图5所示,以原始图像为眼部图像为例,3个标注者对眼部图像中的视杯和视盘进行标注,由于3个标注者的标注水平不同,则标注得到的视杯标注图像和视盘标注图像所指示的目标区域存在差异。
可选地,每个标注分割图像包括原始图像中的多个像素点对应的第一权重,第一权重用于表示对应的像素点在目标区域内的可能性,则通过该标注图像中包括的多个第一权重,能够确定对应的标注者所标注的目标物体在原始图像中所处的目标区域。在该任一标注分割图像中包括多个像素点,每个像素点的像素值即为包含的第一权重,对于原始图像中的任一位置的像素点,在该标注分割图像中位于相同位置的像素点的像素值,即为该原始图像中该位置的像素点的第一权重。
在本申请实施例中,第四特征图中不仅包含了第一分割图像的特征信息、原始图像的特征信息,还融入了先验知识向量,并且该第一分割图像相当于是多个先验知识权重所对应的标注者的标注结果融合后的分割图像,则通过采用解码的方式,对第四特征图进行处理,能够重构出多个先验知识权重所对应的标注分割图像,还原出多个标注者对原始图像的标注结果,即每个标注者对应的标注分割图像,以便后续更新原始图像的分割图像。
在一种可能实现方式中,该步骤308包括:调用图像重构模型中的解码子模型,对第四特征图进行解码处理,得到多个标注分割图像。
其中,该解码子模型与上述步骤303中的第一图像分割模型中的第一解码子模型类似,在此不再赘述。
需要说明的是,本申请实施例是通过引入原始图像,将原始图像及先验知识向量进行融合,来重构出多个标注分割图像的,而在另一实施例中,无需执行上述步骤305-308,能够采取其他方式,根据先验知识向量,对第一分割图像进行图像重构,得到多个标注分割图像。
在一种可能实现方式中,调用图像重构模型,根据先验知识向量,对第一分割图像进行图像重构,得到多个标注分割图像。通过图像重构模型,根据先验知识向量和第一分割图像,来重构多个先验知识权重对应的标注分割图像,以保证标注分割图像的准确性。
309、计算机设备根据多个标注分割图像之间的差异,确定不确定性图像。
其中,不确定性图像用于指示多个标注分割图像指示的目标区域之间的差异。由于每个标注分割图像对应一个先验知识权重,即每个标注分割图像相当于对应的先验知识权重所对应的标注者对原始图像进行标注的标注结果,由于多个标注者的标注水平不同,多个标注分割图像所指示的目标区域会存在差异,因此,通过多个标注分割图像之间的差异,能够确定出不确定性图像,该不确定性图像能够指示出多个标注者所标注的多个目标区域中存在争议的区域。
在一种可能实现方式中,该步骤309包括以下步骤3091-3094。
3091、确定多个标注分割图像与多个标注分割图像的平均值图像之间的差值图像。
其中,每个标注分割图像包括原始图像中的多个像素点对应的第一权重,该平均值图像包括原始图像中的每个像素点在多个标注分割图像中对应的第一权重的平均值,该平均值图像能够体现出多个标注分割图像所指示的目标区域之间的一致性,每个差值图像包括对应的标注分割图像中的每个第一权重与平均值图像中对应的平均值之间的差值。通过确定多个标注分割图像的平均值图像,之后,在确定每个标注分割图像与该平均值图像之间的差值图像,从而得到多个差值图像。
在一种可能实现方式中,该步骤3091包括:确定多个标注分割图像中位于相同位置的像素点对应的第一权重的平均值,根据得到的多个平均值构建该差值图像,对于每个标注分割图像,确定该标注分割图像中的多个第一权重与该差值图像中的对应的平均值之间的差值,将得到的多个差值构成该标注分割图像对应的差值图像。
3092、确定多个差值图像中位于相同位置的像素点的像素值的平方和。
其中,在任一差值图像中的任一像素点的像素值,即为该差值图像对应的标注分割图像与该像素点位于相同位置的像素点的所对应的第一权重,与平均值图像中与该像素点位于相同位置的像素点所对应的平均值之间的差值。
对于任一位置,确定该多个差值图像中位于该位置的像素点的像素值的平方,将多个差值图像对应的像素值的平方之和,确定为该位置对应的像素值的平方和,重复上述方式,即可得到多个位置对应的像素值的平方和。
3093、将每个位置对应的平方和与多个标注分割图像的个数之间的比值的开方,分别确定为每个位置的第二权重。
其中,第二权重用于表示对应的位置在多个标注分割图像中的标注结果的差异,标注结果表示是位于对应的位置的像素点是否在目标区域。
3094、根据多个位置的第二权重构建不确定性图像。
其中,该不确定性图像包括原始图像中的多个像素点对应的第二权重。
在一种可能实现方式中,该多个标注分割图像及该不确定性图像满足以下关系:
Figure DEST_PATH_IMAGE012
其中,
Figure DEST_PATH_IMAGE013
表示不确定性图像,
Figure DEST_PATH_IMAGE014
表示多个标注分割图像的个数,
Figure 202969DEST_PATH_IMAGE014
为不小于2的正整数;
Figure DEST_PATH_IMAGE015
表示多个标注分割图像中标注分割图像的序号,
Figure 775901DEST_PATH_IMAGE015
大于等于1,且小于等于
Figure 821218DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE016
表示第
Figure 622952DEST_PATH_IMAGE015
个标注分割图像。
310、计算机设备将目标特征图与不确定性图像进行融合,得到第二分割图像。
由于不确定性图像能够指示多个标注分割图像指示的目标区域之间的差异,目标特征图中不仅包含了原始图像的特征信息,还融合了先验知识向量,因此,通过将目标特征图与不确定性图像进行融合,能够将多个标注分割图像中不确定的区域进行区分开,以提高第二分割图像所指示的目标区域的准确性。
在一种可能实现方式中,该步骤310包括以下步骤3101-3105。
3101、确定多个标注分割图像的平均值图像。
该步骤与上述步骤3091中确定平均值图像的方式同理,在此不再赘述。
3102、将目标特征图与不确定性图像的乘积与目标特征图之和,确定为第一融合特征图。
其中,该第一融合特征图用于表示多个先验知识权重对应的标注分割图像之间的不一致信息。通过确定目标特征图与不确定性图像的乘积,之后,将确定的乘积与该目标特征图之和,确定为该第一融合特征图。通过获取第一融合特征图,使得目标特征图在该不确定性图像所指示的不确定区域中的特征得到增强,以提高第一融合特征图的准确性。
在一种可能实现方式中,该步骤3102包括:确定目标特征图与不确定性图像的像素级乘积,将得到的乘积与该目标特征图的像素级之和,确定为该第一融合特征图。其中,像素级乘积是指目标特征图与不确定性图像中位于相同位置的像素点的像素值的乘积,像素级之和是指得到的乘积与目标特征图中位于相同位置的像素点的像素值的和值。
在一种可能实现方式中,在步骤3102之前,该方法还包括:对不确定性图像进行平滑处理,对平滑处理后的不确定性图像进行最大值处理。
其中,平滑处理能够采用高斯平滑处理的方式。对于平滑处理后的不确定性图像中包含的多个权重值可能会发生改变,因此,通过最大值处理,将平滑处理后的不确定性图像与平滑处理前的不确定性图像进行比对,对于平滑处理后的不确定性图像与平滑处理前的不确定性图像中的任一相同位置,将该位置对应的两个权重中的最大值,确定为该位置最大操作后的权重,重复上述方式,得到最大值处理后的不确定性图像。通过采用平滑处理的方式,以使不确定性图像中包含的多个权重趋于平滑,实现过度的效果,以扩大不确定区域的覆盖范围,从而有效地感知和捕捉多个标注分割图像之间的不一致区域,并且通过最大值处理,以保证不确定性图像中包含的权重的准确性,提高了不确定性图像的准确性。
可选地,对不确定性图像进行平滑处理,对平滑处理后的不确定性图像进行最大值处理,满足以下关系:
Figure DEST_PATH_IMAGE017
其中,
Figure DEST_PATH_IMAGE018
表示最大值处理后的不确定性图像,
Figure DEST_PATH_IMAGE019
表示最大函数,用于保留平滑处理后的不确定性图像和原始的不确定性图像中相同位置的较高像素值;
Figure DEST_PATH_IMAGE020
用于表示具有高斯核为
Figure DEST_PATH_IMAGE021
的卷积运算,
Figure DEST_PATH_IMAGE022
表示原始的不确定性图像。
3103、将目标特征图与平均值图像的乘积与目标特征图之和,确定为第二融合特征图。
其中,该第二融合特征图用于表示多个先验知识权重对应的标注分割图像之间的一致信息。通过确定目标特征图与平均值图像的乘积,之后,将确定的乘积与该目标特征图之和,确定为该第二融合特征图。通过获取第二融合特征图,使得目标特征图中多个标注分割图像均标注为目标区域的区域中的特征得到增强,提高了第二融合特征的准确性。
在一种可能实现方式中,该步骤3103包括:确定目标特征图与平均值图像的像素级乘积,将得到的乘积与该目标特征图的像素级之和,确定为该第二融合特征图。其中,像素级乘积是指目标特征图与平均值图像中位于相同位置的像素点的像素值的乘积,像素级之和是指得到的乘积与目标特征图中位于相同位置的像素点的像素值的和值。
在一种可能实现方式中,在步骤3103之前,该方法还包括:对平均值图像进行平滑处理,对平滑处理后的平均值图像进行最大值处理。
该步骤与上述步骤3102中对不确定性图像进行平滑处理,并对平滑处理后的不确定性图像进行最大值处理的过程同理,在此不再赘述。
需要说明的是,在本申请实施例中,在执行上述步骤3102和3103获取第一融合特征图和第二融合特征图之前,均能够对不确定性图像及平均值图像进行平滑处理和最大值处理,则对于上述步骤3012和3013获取到的获取第一融合特征图和第二融合特征图,能够满足以下关系式:
Figure DEST_PATH_IMAGE023
其中,
Figure DEST_PATH_IMAGE024
用于表示代号,
Figure 358695DEST_PATH_IMAGE024
的取值为1和2;
Figure DEST_PATH_IMAGE025
表示融合特征图;当
Figure 836950DEST_PATH_IMAGE024
为1时,
Figure DEST_PATH_IMAGE026
表示第一融合特征图;当
Figure 776087DEST_PATH_IMAGE024
为2时,
Figure DEST_PATH_IMAGE027
表示第二融合特征图;
Figure DEST_PATH_IMAGE028
表示目标特征图,
Figure DEST_PATH_IMAGE029
表示不确定性图像或者平均值图像;当
Figure 439236DEST_PATH_IMAGE024
为1时,
Figure DEST_PATH_IMAGE030
表示不确定性图像;当
Figure 780219DEST_PATH_IMAGE024
为2时,
Figure DEST_PATH_IMAGE031
表示平均值图像;
Figure DEST_PATH_IMAGE032
用于表示像素级乘积。
3104、将第一融合特征图及第二融合特征图进行拼接,得到拼接融合特征图。
例如,该第一融合特征图的尺寸为B*C1*H*W,第二融合特征图的尺寸为B*C2*H*W,拼接后为拼接融合特征图的尺寸为B*(C1+C2)*H*W。
3105、对拼接融合特征图进行卷积处理,得到第二分割图像。
由于拼接融合特征图中包含了目标特征图在高度确定区域中的增强的特征,及在不确定性区域中的增强的特征,则通过对拼接融合特征进行卷积处理时,能够将拼接特征图中的确定的目标区域与其他区域区分开,以提高第二分割图像所指示的目标区域的准确性,也即是提高了第二分割图像的准确性。
另外,以原始图像为眼部图像,目标物体为眼部中的视杯和视盘,则获取的第二分割图像用于指示视杯在眼部图像中所处的区域,及视盘在眼部图像中所处的区域。则第二分割图像满足以下关系:
Figure DEST_PATH_IMAGE033
其中,
Figure DEST_PATH_IMAGE034
表示第二分割图像,
Figure DEST_PATH_IMAGE035
表示卷积处理,
Figure DEST_PATH_IMAGE036
表示拼接处理;视杯对应的第一融合特征图为
Figure DEST_PATH_IMAGE037
;视盘对应的第一融合特征图为
Figure DEST_PATH_IMAGE038
;视杯对应的第二融合特征图为
Figure DEST_PATH_IMAGE039
;视盘对应的第二融合特征图为
Figure DEST_PATH_IMAGE040
需要说明的是,本申请实施例是先获取不确定性图像,之后基于目标特征图及不确定性图像来获取第二分割图像的,而在另一实施例中,无需执行上述步骤309-310,能够采取其他方式,基于多个标注分割图像对目标特征图进行处理,得到原始图像的第二分割图像。
在一种可能实现方式中,调用第二图像分割模型,基于多个标注分割图像对目标特征图进行处理,得到原始图像的第二分割图像。其中,第二图像分割模型用于获取第二分割图像。通过第二图像分割模型,利用多个标注分割图像对应的不一致信息和一致信息,以保证第二分割图像的准确性。如图6所示,以原始图像为眼部图像为例,通过第一图像分割模型、图像重构模型及第二图像分割模型对原始图像进行图像分割,得到第二分割图像。
本申请实施例提供的方法,在对原始图像进行分割的过程中,通过引入用于表示多个标注者的标注准确度的先验知识权重,重构出与多个标注者相匹配的标注分割图像,以指示目标物体在原始图像中所处的目标区域,即重构出了多个标注者对原始图像的多种标注结果,之后,通过多个标注分割图像及原始图像的目标特征图来获取原始图像的第二分割图像,使得第二分割图像中融入了多个标注者对应的标注结果,保证第二分割图像的准确性,从而提高了图像分割的准确性。
并且,通过第一分割图像模型中的知识推断子模型及图像重构模型中的融合子模型,在获取原始图像的分割图像的过程中,能够引入先验知识向量,使先验知识向量嵌入到原始图像的特征融合,提高模型的动态表示能力。
并且,本申请提供的提供了一种软注意力机制,对不确定图像进行平滑处理和最大值处理,以扩大不确定区域的覆盖范围,从而有效地感知和捕捉多个标注分割图像之间的不一致区域,并且通过最大值处理,以保证不确定性图像中包含的权重的准确性,提高了不确定性图像的准确性,从而提高后续图像分割的性能。
如图7所示,通过本申请提供的图像分割方法及相关技术中提供的其他图像分割模型,对原始图像进行图像分割,并对得到的分割图像进行对比。通过对比可知,本申请实施例提供的图像分割方法得到的分割图像更准确。
本申请实施例提供的方法,能够应用于医疗领域,能够医疗领域中的图像进行图像分割。如图8所示,在医疗领域的不同数据集上,将本申请实施例提供的图像分割方法,与其他相关技术中的其他分割模型得到的分割图像进行对比。通过对比可知,本申请实施例提供的图像分割方法得到的分割图像更准确。
基于上述图3所示实施例可知,对原始图像进行图像分割的过程,能够采用第一图像分割模型、图像重构模型及第二图像分割模型来执行,在调用第一图像分割模型、图像重构模型及第二图像分割模型之前,需要对第一图像分割模型、图像重构模型及第二图像分割模型进行训练,训练过程详见下述实施例。
图9是本申请实施例提供的一种模型训练方法的流程图,应用于计算机设备中,如图9所示,该方法包括以下步骤。
901、计算机设备获取样本原始图像、多个样本标注分割图像及先验知识向量。
其中,样本原始图像中包括样本物体,每个样本标注分割图像与一个先验知识权重对应,每个样本标注分割图像用于指示对应的标注者所标注的样本物体在样本原始图像中所处的样本区域,每个样本标注分割图像为对应的标注者对该样本原始图像的真实标注结果。例如,在医疗领域,该样本原始图像为眼部图像,该多个标注者为多个眼部医生。
902、计算机设备调用第一图像分割模型,根据先验知识向量对样本原始图像进行编码处理,得到目标样本特征图。
该步骤与上述步骤301-303同理,在此不再赘述。
903、计算机设备调用第一图像分割模型,对目标样本特征图进行解码处理,得到样本原始图像的第一样本分割图像。
其中,第一样本分割图像用于指示样本物体在样本原始图像中所处的样本区域。
该步骤与上述步骤304同理,在此不再赘述。
904、计算机设备将样本原始图像及第一样本分割图像进行拼接,得到第一样本拼接图像。
该步骤与上述步骤305同理,在此不再赘述。
905、计算机设备调用编码子模型,对第一样本拼接图像进行编码处理,得到第一样本特征图。
在本申请实施例中,图像重构模型包括编码子模型、融合子模型及解码子模型。该步骤与上述步骤306同理,在此不再赘述。
906、计算机设备调用融合子模型,将先验知识向量与第一样本特征图进行融合,得到第二样本特征图。
该步骤与上述步骤307同理,在此不再赘述。
907、计算机设备调用解码子模型,对第二样本特征图进行解码处理,得到多个预测标注分割图像。
其中,每个预测标注分割图像与一个先验知识权重对应,每个预测标注分割图像用于指示预测到的对应的标注者所标注的样本区域。
该步骤与上述步骤308同理,在此不再赘述。
需要说明的是,本申请实施例是先将样本原始图像及第一样本分割图像进行拼接,之后调用图像重构模型中的编码子模型、融合子模型及解码子模型,来获取多个预测标注分割图像的,而在另一实施例中,无需执行步骤904-907,能够采取其他方式,调用图像重构模型,根据先验知识向量,对第一样本分割图像进行图像重构,得到多个预测标注分割图像。
908、计算机设备调用第二图像分割模型,基于多个预测标注分割图像对目标样本特征图进行处理,得到样本原始图像的预测分割图像。
该步骤与上述步骤309-310同理,在此不再赘述。如图10所示,以样本原始图像为眼部图像为例,通过图像重构模型获取到的预测标注分割图像中包括视杯预测标注分割图像和视盘预测标注分割图像,则在获取到不确定性图像包括视杯不确定性图像和视盘不确定性图像,并将多个视杯预测标注分割图像的平均值图像,确定为视杯一致性图像,将多个视盘预测标注分割图像的平均值图像,确定为视盘一致性图像,之后,通过第二图像分割模型,将目标样本图像特征分别与视杯不确定性图像、视盘不确定性图像、视杯一致性图像及视盘一致性图像进行融合,并将融合后的多个特征图进行拼接,并对拼接得到的特征图进行卷及处理,得到该预测分割图像。
909、计算机设备根据先验知识向量,对多个样本标注分割图像进行加权融合,得到融合标注分割图像。
由于该先验知识向量包括多个先验知识权重,多个先验知识权重与多个样本标注分割图像一一对应,则通过先验知识向量中的多个先验知识权重,将多个样本标注分割图像进行加权融合,将得到的融合标注分割图像,作为多个标注者所标注的最终结果,以便后续将该融合标注分割图像作为监督值,训练第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
在一种可能实现方式中,该多个先验知识权重、多个样本标注分割图像及融合标注分割图像满足以下关系:
Figure DEST_PATH_IMAGE041
Figure DEST_PATH_IMAGE042
其中,
Figure DEST_PATH_IMAGE043
表示融合标注分割图像;
Figure DEST_PATH_IMAGE044
表示多个先验知识权重的总个数,
Figure DEST_PATH_IMAGE045
为大于等于2的正整数;
Figure DEST_PATH_IMAGE046
用于表示先验知识权重及样本标注分割图像的序号,
Figure 475380DEST_PATH_IMAGE046
为大于等于1、且小于等于
Figure DEST_PATH_IMAGE047
的正整数;
Figure DEST_PATH_IMAGE048
表示第
Figure 432972DEST_PATH_IMAGE046
个样本标注分割图像;
Figure DEST_PATH_IMAGE049
表示第
Figure 825776DEST_PATH_IMAGE046
个先验知识权重,且第
Figure 880320DEST_PATH_IMAGE046
个样本标注分割图像
Figure 575743DEST_PATH_IMAGE048
与第
Figure 958314DEST_PATH_IMAGE046
个先验知识权重
Figure 764596DEST_PATH_IMAGE049
对应。
在一种可能实现方式中,每个样本标注分割图像包括原始图像中多个像素点对应的权重,则该步骤909包括:根据先验知识向量,将多个样本标注分割图像中位于相同位置的像素点的像素值进行加权融合,得到每个位置的融合权重,根据多个位置的融合权重构成该融合标注分割图像。其中,对于任一样本标注分割图像中任一位置的像素点的像素值,即为该原始图像中位于相同位置的像素点对应的权重。
910、计算机设备根据预测分割图像与融合标注分割图像之间的差异,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
由于融合标注分割图像相当于样本原始图像的真实标注分割图像,即该融合标注分割图像所指示的样本物体在样本原始图像中所处的样本区域,为该样本物体在样本原始图像中所处的真实区域,该预测分割图像是通过第一图像分割模型、图像重构模型及第二图像分割模型预测到的,则根据预测分割图像与融合标注分割图像之间的差异,能够确定第一图像分割模型、图像重构模型及第二图像分割模型的不准确度,以便后续对第一图像分割模型、图像重构模型及第二图像分割模型进行调整。
在一种可能实现方式中,该步骤910包括以下步骤9101-9102。
9101、根据预测分割图像与融合标注分割图像之间的差异,确定第一损失值。
其中,该第一损失值用于表示预测分割与融合标注分割图像之间的差异,损失值越大,表示第一图像分割模型、图像重构模型及第二图像分割模型的准确度越低,损失值越小,表示第一图像分割模型、图像重构模型及第二图像分割模型的准确度越高。
9102、根据第一损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
通过第一损失值对第一图像分割模型、图像重构模型及第二图像分割模型进行训练,以减小第一损失值,提高第一图像分割模型、图像重构模型及第二图像分割模型的准确度。如图11所示,通过第一图像分割模型、图像重构模型及第二个分割模型,来获取预测分割图像,其中,该知识推断子模型为第一图像分割模型中的子模型。通过对多个样本标注分割图像进行加权融合,得到融合标注分割图像,之后,通过根据预测分割图像与融合标注分割图像之间的差异,确定第一损失值,并根据确定的第一损失值对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
在一种可能实现方式中,该步骤9102包括以下三种方式。
第一种方式:根据第一样本分割图像与融合标注分割图像之间的差异,确定第二损失值,根据第一损失值及第二损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
其中,该第二损失值用于表示第一样本分割图像与融合标注分割图像之间的差异,第一样本分割图像与融合标注分割图像之间的差异越大,该第二损失值越大,第一样本分割图像与融合标注分割图像之间的差异越小,该第二损失值越小。
通过第一损失值及第二损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练,以减小第一损失值及第二损失值,提高第一图像分割模型、图像重构模型及第二图像分割模型的准确度。
在一种可能实现方式中,根据第一损失值及第二损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练的过程,包括:确定第一损失值与第二损失值的第一和值,根据第一和值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
第二种方式:根据多个预测标注分割图像与对应的样本标注分割图像之间的差异,确定第三损失值,根据第一损失值及第三损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
其中,该第三损失值为重构损失,用于表示多个预测标注分割图像与对应的样本标注分割图像之间的差异。
在一种可能实现方式中,多个预测标注分割图像、多个样本标注分割图像及第三损失值,满足以下关系:
Figure DEST_PATH_IMAGE050
Figure DEST_PATH_IMAGE051
其中,
Figure DEST_PATH_IMAGE052
表示第三损失值;
Figure 860597DEST_PATH_IMAGE044
表示多个先验知识权重的总个数,也即是多个预测标注分割图像的个数,
Figure 336709DEST_PATH_IMAGE044
为大于等于2的正整数;
Figure DEST_PATH_IMAGE053
表示预测标注分割图像及样本标注分割图像的序号;
Figure DEST_PATH_IMAGE054
为二元交叉熵损失函数;
Figure DEST_PATH_IMAGE055
表示第
Figure 252581DEST_PATH_IMAGE053
个样本标注分割图像;
Figure DEST_PATH_IMAGE056
表示第
Figure 128133DEST_PATH_IMAGE053
个预测标注分割图像。
在一种可能实现方式中,根据第一损失值及第三损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练的过程,包括:确定第一损失值与第三损失值的第二和值,根据第二和值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
第三种方式:将样本原始图像及融合标注分割图像进行拼接,得到第二样本拼接图像,调用编码子模型,对第二样本拼接图像进行编码处理,得到第三样本特征图,根据第三样本特征图与第一样本特征图之间的差异,确定第四损失值,根据第一损失值及第四损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
其中,第四损失值为一致性损失,用于表示第三样本特征图与第一样本特征图之间的差异。获取第二样本拼接图像的过程,与上述步骤305同理,在此不再赘述。调用编码子模型获取第三样本特征图的过程,与上述步骤905同理在此不再赘述。
由于第一样本特征图是调用图像重构模型中的编码子模型,对样本原始图像及第一样本分割图像拼接后的第一样本拼接图像进行编码处理得到的,该第三样本特征图是调用相同的编码子模型,对样本原始图像及融合标注分割图像拼接后的第二样本拼接图像进行编码处理得到的,该第一样本分割图像是预测得到的,该融合标注分割图像是多个标注者标注的真实结果,则通过第四损失值,以确定同一个编码子模型输出的预测结果对应的第一样本特征图与真实结果对应的第三样本特征图之间的差异。
在一种可能实现方式中,根据第一损失值及第四损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练的过程,包括:确定第一损失值与第四损失值的第三和值,根据第三和值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
在一种可能实现方式中,该编码子模型包括多个第三卷积模块,在调用多个第三卷积模块对第一样本拼接图像进行编码处理的过程中,调用第一个第三卷积模块对第一样本拼接图像进行编码处理,得到第一个第三参考特征图,调用当前的第三卷积模块对上一个第三卷积模块输出的第三参考特征图进行编码处理,得到当前的第三卷积模块对应的第三参考特征图,直至得到最后一个第三卷积模块输出第三参考特征图,将最后一个第三卷积模块输出的第三参考特征图确定为该第一样本特征图。同理,在调用多个第三卷积模块对第二样本拼接图像进行编码处理的过程中,按照上述方式,也能够得到第二样本拼接图像对应的多个第四参考特征图,并将最后一个第三卷积模块输出的第四参考特征图确定为该第二样本拼接图像;则第四损失值,满足以下关系:
Figure DEST_PATH_IMAGE057
其中,
Figure DEST_PATH_IMAGE058
表示第四损失值;
Figure DEST_PATH_IMAGE059
表示编码子模型包括多个第三卷积模块的个数,
Figure 954007DEST_PATH_IMAGE059
为大于等于2的正整数;
Figure DEST_PATH_IMAGE060
表示第三卷积模块的序号,
Figure 522391DEST_PATH_IMAGE060
为大于等于1、且小于等于
Figure 613975DEST_PATH_IMAGE059
的正整数;
Figure DEST_PATH_IMAGE061
表示第
Figure 293218DEST_PATH_IMAGE060
个第三卷积模块输出的第三参考特征图;
Figure DEST_PATH_IMAGE062
表示第
Figure 301494DEST_PATH_IMAGE060
个第三卷积模块输出的第四参考特征图。
需要说明的是,上述仅是以三种方式分别对第一图像分割模型、图像重构模型及第二图像分割模型进行训练进行说明的,而在另一实施例中,上述三种方式能够两两结合,例如,第一种方式与第二种方式结合,第二种方式与第三种方式结合;或者,上述三种方式结合。
在一种可能实现方式中,该步骤9102包括:根据第一样本分割图像与融合标注分割图像之间的差异,确定第二损失值,根据多个预测标注分割图像与对应的样本标注分割图像之间的差异,确定第三损失值,将样本原始图像及融合标注分割图像进行拼接,得到第二样本拼接图像,调用编码子模型,对第二样本拼接图像进行编码处理,得到第三样本特征图,根据第三样本特征图与第一样本特征图之间的差异,确定第四损失值,根据第一损失值、第二损失值、第三损失值及第四损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
可选地,根据第一损失值、第二损失值、第三损失值及第四损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练的过程包括:根据第一损失值、第二损失值、第三损失值及第四损失值,确定总损失值,根据总损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
可选地,第一损失值、第二损失值、第三损失值、第四损失值及总损失值,满足以下关系:
Figure DEST_PATH_IMAGE063
其中,
Figure DEST_PATH_IMAGE064
表示总损失值;
Figure DEST_PATH_IMAGE065
为二元交叉熵损失函数;
Figure DEST_PATH_IMAGE066
表示第二损失值;
Figure DEST_PATH_IMAGE067
表示融合标注分割图像;
Figure DEST_PATH_IMAGE068
表示预测分割图像;
Figure DEST_PATH_IMAGE069
表示超参数,用于平衡第三损失值和第二损失值,能够设置为0.7;
Figure DEST_PATH_IMAGE070
表示第三损失值;
Figure DEST_PATH_IMAGE071
表示第四损失值。
本申请实施例提供的模型训练方式,在对原始图像进行分割的过程中,通过引入用于表示多个标注者的标注准确度的先验知识权重,重构出与多个标注者相匹配的标注分割图像,以指示目标物体在原始图像中所处的目标区域,即重构出了多个标注者对原始图像的多种标注结果,之后,通过多个标注分割图像及原始图像的目标特征图来获取原始图像的第二分割图像,使得第二分割图像中融入了多个标注者对应的标注结果,保证第二分割图像的准确性,从而提高了图像分割的准确性。
并且,通过考虑到重构的多个预测标注分割图像与多个样本标注分割图像之间的差异、第三样本特征图与第一样本特征图之间的差异及第一样本分割图像与融合标注分割图像之间的差异,以提高第一图像分割模型、图像重构模型及第二图像分割模型的准确性。
本申请实施例提供的模型训练方法,是基于多个样本标注分割图像对模型进行训练的。相关技术在模型训练过程中,能够采用单个标注者的样本标注分割图像对模型进行训练。表1中包括了采用不同的标注者标注的样本标注分割图像,对多种模型训练后的模型准确率,如表1所示,通过表1中的准确率可知,采用多个标注者的样本标注分割图像对模型训练后的模型的准确率高。
并且,通过提供的图像重构模型,能够重构出多个标注者的标注分割图像,能够增强得到的预测分割图像与样本标注分割图像之间的相关系,能够估计出标注者之间的不确定性。
Figure DEST_PATH_IMAGE072
本申请实施例提供的方法,能够通过第一分割图像模型、图像重构模型和第二图像分割模型来对原始图像进行图像分割。表2和3均为以医学图像为例,通过本申请提供的模型及相关技术提供的图像分割模型,对医学图像进行图像分割的准确率进行比对。表2是以眼部图像为例,通过对眼部图像进行图像分割,以确定眼部中的视杯对应的分割图像及眼部中的视盘对应的分割图像。通过表2中的数据可知,无论是获取视杯对应的分割图像,还是获取视盘对应的分割图像,本申请实施例提供的模型的准确率均最高。表3是以医学图像中的肾部图像、脑部图像、肿瘤图像等为例,通过表3中的数据可知,无论是获取任一种医学图像的分割图像,本申请实施例提供的模型的准确率均最高。即表明了,本申请提供的图像分割方法获取到的分割图像的准确率高,且图像分割的效果好。
Figure DEST_PATH_IMAGE073
表4验证了本申请提供的图像分割方法能够在不同的先验知识权重条件下生成更好的校正分割结果。其中模型1-模型6分别表示为采用标注者1-标注者6的标注分割图像作为训练样本训练得到的模型。通过采用不同的先验知识向量对多种模型进行评估,多种不同的先验知识向量包括单一标注者、随机标注者的先验知识权重和平均先验知识权重。如表4所示,对于单一标注者的先验知识向量,选择的标注者的先验知识向量为1,其他的标注者的先验知识向量为0。以眼部图像为例,通过多种模型对眼部图像进行分割,得到眼部图像的分割图像,每种模型得到视杯的分割图像的准确率及视盘的分割图像的准确率如表4所示,通过表4可知,本申请提供的图像分割方法在不同先验知识向量条件下始终取得优越的性能。
Figure DEST_PATH_IMAGE074
图12是本申请实施例提供的一种图像分割装置的结构示意图,如图12所示,该装置包括:
编码模块1201,用于根据先验知识向量对原始图像进行编码处理,得到目标特征图,原始图像中包括目标物体,先验知识向量包括多个先验知识权重,每个先验知识权重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度;
解码模块1202,用于对目标特征图进行解码处理,得到原始图像的第一分割图像,第一分割图像用于指示目标物体在原始图像中所处的目标区域;
重构模块1203,用于根据先验知识向量,对第一分割图像进行图像重构,得到多个标注分割图像,每个标注分割图像与一个先验知识权重对应,每个标注分割图像用于指示对应的标注者所标注的目标区域;
处理模块1204,用于基于多个标注分割图像对目标特征图进行处理,得到原始图像的第二分割图像。
在一种可能实现方式中,如图13所示,处理模块1204,包括:
第一确定单元1241,用于根据多个标注分割图像之间的差异,确定不确定性图像,不确定性图像用于指示多个标注分割图像指示的目标区域之间的差异;
第一融合单元1242,用于将目标特征图与不确定性图像进行融合,得到第二分割图像。
在另一种可能实现方式中,每个标注分割图像包括原始图像中的多个像素点对应的第一权重,第一权重用于表示对应的像素点在目标区域内的可能性;
第一确定单元1241,用于确定多个标注分割图像与多个标注分割图像的平均值图像之间的差值图像;确定多个差值图像中位于相同位置的像素点的像素值的平方和;将每个位置对应的平方和与多个标注分割图像的个数之间的比值的开方,分别确定为每个位置的第二权重;根据多个位置的第二权重构建不确定性图像。
在另一种可能实现方式中,第一融合单元1242,用于确定多个标注分割图像的平均值图像;将目标特征图与不确定性图像的乘积与目标特征图之和,确定为第一融合特征图;将目标特征图与平均值图像的乘积与目标特征图之和,确定为第二融合特征图;将第一融合特征图及第二融合特征图进行拼接,得到拼接融合特征图;对拼接融合特征图进行卷积处理,得到第二分割图像。
在另一种可能实现方式中,如图13所示,编码模块1201,包括:
第一编码单元1211,用于对原始图像进行编码处理,得到原始图像的第一特征图;
第二融合单元1212,用于将先验知识向量与第一特征图进行融合,得到第二特征图;
第一解码单元1213,用于对第二特征图进行解码处理,得到目标特征图。
在另一种可能实现方式中,如图13所示,重构模块1203,包括:
拼接单元,用于将原始图像及第一分割图像进行拼接,得到拼接图像;
第二编码单元1231,用于对拼接图像进行编码处理,得到第三特征图;
第三融合单元1232,用于将先验知识向量与第三特征图进行融合,得到第四特征图;
第二解码单元1233,用于对第四特征图进行解码处理,得到多个标注分割图像。
在另一种可能实现方式中,
根据先验知识向量对原始图像进行编码处理,得到目标特征图的步骤由第一图像分割模型执行;
对目标特征图进行解码处理,得到原始图像的第一分割图像的步骤由第一图像分割模型执行;
根据先验知识向量,对第一分割图像进行图像重构,得到多个标注分割图像的步骤由图像重构模型执行;
基于多个标注分割图像对目标特征图进行处理,得到原始图像的第二分割图像的步骤由第二图像分割模型执行。
在另一种可能实现方式中,如图13所示,装置还包括:
获取模块1205,用于获取样本原始图像、多个样本标注分割图像及先验知识向量,样本原始图像中包括样本物体,每个样本标注分割图像与一个先验知识权重对应,每个样本标注分割图像用于指示对应的标注者所标注的样本物体在样本原始图像中所处的样本区域;
编码模块1201,还用于调用第一图像分割模型,根据先验知识向量对样本原始图像进行编码处理,得到目标样本特征图;
解码模块1202,还用于调用第一图像分割模型,对目标样本特征图进行解码处理,得到样本原始图像的第一样本分割图像,第一样本分割图像用于指示样本物体在样本原始图像中所处的样本区域;
重构模块1203,还用于调用图像重构模型,根据先验知识向量,对第一样本分割图像进行图像重构,得到多个预测标注分割图像,每个预测标注分割图像与一个先验知识权重对应,每个预测标注分割图像用于指示预测到的对应的标注者所标注的样本区域;
处理模块1204,还用于调用第二图像分割模型,基于多个预测标注分割图像对目标样本特征图进行处理,得到样本原始图像的预测分割图像;
加权融合模块1206,用于根据先验知识向量,对多个样本标注分割图像进行加权融合,得到融合标注分割图像;
训练模块1207,用于根据预测分割图像与融合标注分割图像之间的差异,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
在另一种可能实现方式中,如图13所示,训练模块1207,包括:
第二确定单元1271,用于根据预测分割图像与融合标注分割图像之间的差异,确定第一损失值;
训练单元1272,用于根据第一损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
在另一种可能实现方式中,训练单元1272,用于根据第一样本分割图像与融合标注分割图像之间的差异,确定第二损失值;根据第一损失值及第二损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
在另一种可能实现方式中,训练单元1272,用于根据多个预测标注分割图像与对应的样本标注分割图像之间的差异,确定第三损失值;根据第一损失值及第三损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
在另一种可能实现方式中,图像重构模型包括编码子模型、融合子模型及解码子模型;
重构模块1203,用于将样本原始图像及第一样本分割图像进行拼接,得到第一样本拼接图像;调用编码子模型,对第一样本拼接图像进行编码处理,得到第一样本特征图;调用融合子模型,将先验知识向量与第一样本特征图进行融合,得到第二样本特征图;调用解码子模型,对第二样本特征图进行解码处理,得到多个预测标注分割图像。
在另一种可能实现方式中,如图13所示,装置还包括:
拼接模块1208,用于将样本原始图像及融合标注分割图像进行拼接,得到第二样本拼接图像;
重构模块1203,还用于调用编码子模型,对第二样本拼接图像进行编码处理,得到第三样本特征图;
训练单元1272,用于根据第三样本特征图与第一样本特征图之间的差异,确定第四损失值;根据第一损失值及第四损失值,对第一图像分割模型、图像重构模型及第二图像分割模型进行训练。
需要说明的是:上述实施例提供的图像分割装置,仅以上述各功能模块的划分进行举例说明,实际应用中,能够根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像分割装置与图像分割方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述实施例的图像分割方法中所执行的操作。
可选地,计算机设备提供为终端。图14示出了本申请一个示例性实施例提供的终端1400的结构框图。该终端1400可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1400还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
终端1400包括有:处理器1401和存储器1402。
处理器1401可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1401可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1401也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1401可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1401还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1402可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1402还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1402中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器1401所执行以实现本申请中方法实施例提供的图像分割方法。
在一些实施例中,终端1400还可选包括有:外围设备接口1403和至少一个外围设备。处理器1401、存储器1402和外围设备接口1403之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1403相连。具体地,外围设备包括:射频电路1404、显示屏1405、摄像头组件1406、音频电路1407、定位组件1408和电源1409中的至少一种。
外围设备接口1403可被用于将I/O(Input /Output,输入/输出)相关的至少一个外围设备连接到处理器1401和存储器1402。在一些实施例中,处理器1401、存储器1402和外围设备接口1403被集成在同一芯片或电路板上;在一些其他实施例中,处理器1401、存储器1402和外围设备接口1403中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1404用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1404将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1404包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1404可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1404还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1405用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1405是触摸显示屏时,显示屏1405还具有采集在显示屏1405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1401进行处理。此时,显示屏1405还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1405可以为一个,设置在终端1400的前面板;在另一些实施例中,显示屏1405可以为至少两个,分别设置在终端1400的不同表面或呈折叠设计;在另一些实施例中,显示屏1405可以是柔性显示屏,设置在终端1400的弯曲表面上或折叠面上。甚至,显示屏1405还可以设置成非矩形的不规则图形,也即异形屏。显示屏1405可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。
摄像头组件1406用于采集图像或视频。可选地,摄像头组件1406包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1406还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1407可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1401进行处理,或者输入至射频电路1404以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1400的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1401或射频电路1404的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1407还可以包括耳机插孔。
定位组件1408用于定位终端1400的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件1408可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源1409用于为终端1400中的各个组件进行供电。电源1409可以是交流电、直流电、一次性电池或可充电电池。当电源1409包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1400还包括有一个或多个传感器1410。该一个或多个传感器1410包括但不限于:加速度传感器1411、陀螺仪传感器1412、压力传感器1413、指纹传感器1414、光学传感器1415以及接近传感器1416。
加速度传感器1411可以检测以终端1400建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1411可以用于检测重力加速度在三个坐标轴上的分量。处理器1401可以根据加速度传感器1411采集的重力加速度信号,控制显示屏1405以横向视图或纵向视图进行用户界面的显示。加速度传感器1411还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1412可以检测终端1400的机体方向及转动角度,陀螺仪传感器1412可以与加速度传感器1411协同采集用户对终端1400的3D动作。处理器1401根据陀螺仪传感器1412采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1413可以设置在终端1400的侧边框和/或显示屏1405的下层。当压力传感器1413设置在终端1400的侧边框时,可以检测用户对终端1400的握持信号,由处理器1401根据压力传感器1413采集的握持信号进行左右手识别或快捷操作。当压力传感器1413设置在显示屏1405的下层时,由处理器1401根据用户对显示屏1405的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1414用于采集用户的指纹,由处理器1401根据指纹传感器1414采集到的指纹识别用户的身份,或者,由指纹传感器1414根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1401授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1414可以被设置在终端1400的正面、背面或侧面。当终端1400上设置有物理按键或厂商Logo时,指纹传感器1414可以与物理按键或厂商Logo集成在一起。
光学传感器1415用于采集环境光强度。在一个实施例中,处理器1401可以根据光学传感器1415采集的环境光强度,控制显示屏1405的显示亮度。具体地,当环境光强度较高时,调高显示屏1405的显示亮度;当环境光强度较低时,调低显示屏1405的显示亮度。在另一个实施例中,处理器1401还可以根据光学传感器1415采集的环境光强度,动态调整摄像头组件1406的拍摄参数。
接近传感器1416,也称距离传感器,设置在终端1400的前面板。接近传感器1416用于采集用户与终端1400的正面之间的距离。在一个实施例中,当接近传感器1416检测到用户与终端1400的正面之间的距离逐渐变小时,由处理器1401控制显示屏1405从亮屏状态切换为息屏状态;当接近传感器1416检测到用户与终端1400的正面之间的距离逐渐变大时,由处理器1401控制显示屏1405从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图14中示出的结构并不构成对终端1400的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
可选地,计算机设备提供为服务器。图15是本申请实施例提供的一种服务器的结构示意图,该服务器1500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)1501和一个或一个以上的存储器1502,其中,存储器1502中存储有至少一条计算机程序,至少一条计算机程序由处理器1501加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述实施例的图像分割方法中所执行的操作。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得该计算机设备实现如上述实施例的图像分割方法中所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请实施例的可选实施例,并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种图像分割方法,其特征在于,所述方法包括:
根据先验知识向量对原始图像进行编码处理,得到目标特征图,所述原始图像中包括目标物体,所述先验知识向量包括多个先验知识权重,每个先验知识权重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度;
对所述目标特征图进行解码处理,得到所述原始图像的第一分割图像,所述第一分割图像用于指示所述目标物体在所述原始图像中所处的目标区域;
根据所述先验知识向量,对所述第一分割图像进行图像重构,得到多个标注分割图像,每个标注分割图像与一个先验知识权重对应,所述每个标注分割图像用于指示对应的标注者所标注的所述目标区域;
基于所述多个标注分割图像对所述目标特征图进行处理,得到所述原始图像的第二分割图像。
2.根据权利要求1所述的方法,其特征在于,所述基于所述多个标注分割图像对所述目标特征图进行处理,得到所述原始图像的第二分割图像,包括:
根据所述多个标注分割图像之间的差异,确定不确定性图像,所述不确定性图像用于指示所述多个标注分割图像指示的所述目标区域之间的差异;
将所述目标特征图与所述不确定性图像进行融合,得到所述第二分割图像。
3.根据权利要求2所述的方法,其特征在于,所述每个标注分割图像包括所述原始图像中的多个像素点对应的第一权重,所述第一权重用于表示对应的像素点在所述目标区域内的可能性;
所述根据所述多个标注分割图像之间的差异,确定不确定性图像,包括:
确定所述多个标注分割图像与所述多个标注分割图像的平均值图像之间的差值图像;
确定多个差值图像中位于相同位置的像素点的像素值的平方和;
将每个位置对应的平方和与所述多个标注分割图像的个数之间的比值的开方,分别确定为所述每个位置的第二权重;
根据多个位置的第二权重构建所述不确定性图像。
4.根据权利要求2所述的方法,其特征在于,所述将所述目标特征图与所述不确定性图像进行融合,得到所述第二分割图像,包括:
确定所述多个标注分割图像的平均值图像;
将所述目标特征图与所述不确定性图像的乘积与所述目标特征图之和,确定为第一融合特征图;
将所述目标特征图与所述平均值图像的乘积与所述目标特征图之和,确定为第二融合特征图;
将所述第一融合特征图及所述第二融合特征图进行拼接,得到拼接融合特征图;
对所述拼接融合特征图进行卷积处理,得到所述第二分割图像。
5.根据权利要求1所述的方法,其特征在于,所述根据先验知识向量对原始图像进行编码处理,得到目标特征图,包括:
对所述原始图像进行编码处理,得到所述原始图像的第一特征图;
将所述先验知识向量与所述第一特征图进行融合,得到第二特征图;
对所述第二特征图进行解码处理,得到所述目标特征图。
6.根据权利要求1所述的方法,其特征在于,
所述根据先验知识向量对原始图像进行编码处理,得到目标特征图的步骤由第一图像分割模型执行;
所述对所述目标特征图进行解码处理,得到所述原始图像的第一分割图像的步骤由所述第一图像分割模型执行;
所述根据所述先验知识向量,对所述第一分割图像进行图像重构,得到多个标注分割图像的步骤由图像重构模型执行;
所述基于所述多个标注分割图像对所述目标特征图进行处理,得到所述原始图像的第二分割图像的步骤由第二图像分割模型执行。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取样本原始图像、多个样本标注分割图像及所述先验知识向量,所述样本原始图像中包括样本物体,每个样本标注分割图像与一个先验知识权重对应,所述每个样本标注分割图像用于指示对应的标注者所标注的所述样本物体在所述样本原始图像中所处的样本区域;
调用所述第一图像分割模型,根据所述先验知识向量对所述样本原始图像进行编码处理,得到目标样本特征图;
调用所述第一图像分割模型,对所述目标样本特征图进行解码处理,得到所述样本原始图像的第一样本分割图像,所述第一样本分割图像用于指示所述样本物体在所述样本原始图像中所处的所述样本区域;
调用所述图像重构模型,根据所述先验知识向量,对所述第一样本分割图像进行图像重构,得到多个预测标注分割图像,每个预测标注分割图像与一个先验知识权重对应,所述每个预测标注分割图像用于指示预测到的对应的标注者所标注的所述样本区域;
调用所述第二图像分割模型,基于所述多个预测标注分割图像对所述目标样本特征图进行处理,得到所述样本原始图像的预测分割图像;
根据所述先验知识向量,对所述多个样本标注分割图像进行加权融合,得到融合标注分割图像;
根据所述预测分割图像与所述融合标注分割图像之间的差异,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。
8.根据权利要求7所述的方法,其特征在于,所述根据所述预测分割图像与所述融合标注分割图像之间的差异,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练,包括:
根据所述预测分割图像与所述融合标注分割图像之间的差异,确定第一损失值;
根据所述第一损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。
9.根据权利要求8所述的方法,其特征在于,所述根据所述第一损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练,包括:
根据所述第一样本分割图像与所述融合标注分割图像之间的差异,确定第二损失值;
根据所述第一损失值及所述第二损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。
10.根据权利要求8所述的方法,其特征在于,所述根据所述第一损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练,包括:
根据所述多个预测标注分割图像与对应的样本标注分割图像之间的差异,确定第三损失值;
根据所述第一损失值及所述第三损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。
11.根据权利要求8所述的方法,其特征在于,所述图像重构模型包括编码子模型、融合子模型及解码子模型;
所述调用所述图像重构模型,根据所述先验知识向量,对所述第一样本分割图像进行图像重构,得到多个预测标注分割图像,包括:
将所述样本原始图像及所述第一样本分割图像进行拼接,得到第一样本拼接图像;
调用所述编码子模型,对所述第一样本拼接图像进行编码处理,得到第一样本特征图;
调用所述融合子模型,将所述先验知识向量与所述第一样本特征图进行融合,得到第二样本特征图;
调用所述解码子模型,对所述第二样本特征图进行解码处理,得到所述多个预测标注分割图像。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
将所述样本原始图像及所述融合标注分割图像进行拼接,得到第二样本拼接图像;
调用所述编码子模型,对所述第二样本拼接图像进行编码处理,得到第三样本特征图;
所述根据所述第一损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练,包括:
根据所述第三样本特征图与所述第一样本特征图之间的差异,确定第四损失值;
根据所述第一损失值及所述第四损失值,对所述第一图像分割模型、所述图像重构模型及所述第二图像分割模型进行训练。
13.一种图像分割装置,其特征在于,所述装置包括:
编码模块,用于根据先验知识向量对原始图像进行编码处理,得到目标特征图,所述原始图像中包括目标物体,所述先验知识向量包括多个先验知识权重,每个先验知识权重用于表示一个标注者在任一图像中标注任一物体所在区域的准确度;
解码模块,用于对所述目标特征图进行解码处理,得到所述原始图像的第一分割图像,所述第一分割图像用于指示所述目标物体在所述原始图像中所处的目标区域;
重构模块,用于根据所述先验知识向量,对所述第一分割图像进行图像重构,得到多个标注分割图像,每个标注分割图像与一个先验知识权重对应,所述每个标注分割图像用于指示对应的标注者所标注的所述目标区域;
处理模块,用于基于所述多个标注分割图像对所述目标特征图进行处理,得到所述原始图像的第二分割图像。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如权利要求1至12任一权利要求所述的图像分割方法中所执行的操作。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至12任一权利要求所述的图像分割方法中所执行的操作。
CN202110234267.7A 2021-03-03 2021-03-03 图像分割方法、装置、计算机设备及存储介质 Active CN112598686B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202110234267.7A CN112598686B (zh) 2021-03-03 2021-03-03 图像分割方法、装置、计算机设备及存储介质
PCT/CN2022/077951 WO2022183984A1 (zh) 2021-03-03 2022-02-25 图像分割方法、装置、计算机设备及存储介质
EP22762449.1A EP4287117A1 (en) 2021-03-03 2022-02-25 Image segmentation method and apparatus, computer device and storage medium
US18/074,906 US20230106468A1 (en) 2021-03-03 2022-12-05 Image segmentation method and apparatus, computer device, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110234267.7A CN112598686B (zh) 2021-03-03 2021-03-03 图像分割方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN112598686A true CN112598686A (zh) 2021-04-02
CN112598686B CN112598686B (zh) 2021-06-04

Family

ID=75210146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110234267.7A Active CN112598686B (zh) 2021-03-03 2021-03-03 图像分割方法、装置、计算机设备及存储介质

Country Status (4)

Country Link
US (1) US20230106468A1 (zh)
EP (1) EP4287117A1 (zh)
CN (1) CN112598686B (zh)
WO (1) WO2022183984A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113705691A (zh) * 2021-08-30 2021-11-26 平安国际智慧城市科技股份有限公司 基于人工智能的图像标注校验方法、装置、设备及介质
CN114399640A (zh) * 2022-03-24 2022-04-26 之江实验室 一种不确定区域发现与模型改进的道路分割方法及装置
CN114742807A (zh) * 2022-04-24 2022-07-12 北京医准智能科技有限公司 基于x光图像的胸片识别方法、装置、电子设备和介质
WO2022183984A1 (zh) * 2021-03-03 2022-09-09 腾讯科技(深圳)有限公司 图像分割方法、装置、计算机设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116580194B (zh) * 2023-05-04 2024-02-06 山东省人工智能研究院 融合几何信息的软注意力网络的血管分割方法
CN116524206B (zh) * 2023-06-30 2023-10-03 深圳须弥云图空间科技有限公司 目标图像的识别方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050163373A1 (en) * 2004-01-26 2005-07-28 Lee Shih-Jong J. Method for adaptive image region partition and morphologic processing
CN102298605A (zh) * 2011-06-01 2011-12-28 清华大学 基于有向图非等概率随机搜索的图像自动标注方法及装置
CN110599491A (zh) * 2019-09-04 2019-12-20 腾讯医疗健康(深圳)有限公司 基于先验信息的眼部图像分割方法、装置、设备及介质
CN111563910A (zh) * 2020-05-13 2020-08-21 上海鹰瞳医疗科技有限公司 眼底图像分割方法及设备
CN111652887A (zh) * 2020-05-13 2020-09-11 腾讯科技(深圳)有限公司 图像分割模型训练方法、装置、计算机设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109598727B (zh) * 2018-11-28 2021-09-14 北京工业大学 一种基于深度神经网络的ct图像肺实质三维语义分割方法
US11062459B2 (en) * 2019-02-07 2021-07-13 Vysioneer INC. Method and apparatus for automated target and tissue segmentation using multi-modal imaging and ensemble machine learning models
CN111583282B (zh) * 2020-05-18 2024-04-23 联想(北京)有限公司 图像分割方法、装置、设备及存储介质
CN112365512B (zh) * 2020-11-18 2023-03-24 南开大学 训练图像分割模型的方法、图像分割的方法及其装置
CN112598686B (zh) * 2021-03-03 2021-06-04 腾讯科技(深圳)有限公司 图像分割方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050163373A1 (en) * 2004-01-26 2005-07-28 Lee Shih-Jong J. Method for adaptive image region partition and morphologic processing
CN102298605A (zh) * 2011-06-01 2011-12-28 清华大学 基于有向图非等概率随机搜索的图像自动标注方法及装置
CN110599491A (zh) * 2019-09-04 2019-12-20 腾讯医疗健康(深圳)有限公司 基于先验信息的眼部图像分割方法、装置、设备及介质
CN111563910A (zh) * 2020-05-13 2020-08-21 上海鹰瞳医疗科技有限公司 眼底图像分割方法及设备
CN111652887A (zh) * 2020-05-13 2020-09-11 腾讯科技(深圳)有限公司 图像分割模型训练方法、装置、计算机设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022183984A1 (zh) * 2021-03-03 2022-09-09 腾讯科技(深圳)有限公司 图像分割方法、装置、计算机设备及存储介质
CN113705691A (zh) * 2021-08-30 2021-11-26 平安国际智慧城市科技股份有限公司 基于人工智能的图像标注校验方法、装置、设备及介质
CN113705691B (zh) * 2021-08-30 2024-04-09 深圳平安智慧医健科技有限公司 基于人工智能的图像标注校验方法、装置、设备及介质
CN114399640A (zh) * 2022-03-24 2022-04-26 之江实验室 一种不确定区域发现与模型改进的道路分割方法及装置
CN114399640B (zh) * 2022-03-24 2022-07-15 之江实验室 一种不确定区域发现与模型改进的道路分割方法及装置
CN114742807A (zh) * 2022-04-24 2022-07-12 北京医准智能科技有限公司 基于x光图像的胸片识别方法、装置、电子设备和介质

Also Published As

Publication number Publication date
WO2022183984A1 (zh) 2022-09-09
EP4287117A1 (en) 2023-12-06
US20230106468A1 (en) 2023-04-06
CN112598686B (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
CN112598686B (zh) 图像分割方法、装置、计算机设备及存储介质
CN110136136B (zh) 场景分割方法、装置、计算机设备及存储介质
CN109086709B (zh) 特征提取模型训练方法、装置及存储介质
WO2020224479A1 (zh) 目标的位置获取方法、装置、计算机设备及存储介质
CN111739035B (zh) 基于人工智能的图像处理方法、装置、设备及存储介质
CN111476783B (zh) 基于人工智能的图像处理方法、装置、设备及存储介质
CN111091166B (zh) 图像处理模型训练方法、图像处理方法、设备及存储介质
CN110544272A (zh) 脸部跟踪方法、装置、计算机设备及存储介质
CN114332530A (zh) 图像分类方法、装置、计算机设备及存储介质
CN113395542A (zh) 基于人工智能的视频生成方法、装置、计算机设备及介质
CN111368116B (zh) 图像分类方法、装置、计算机设备及存储介质
CN112991494A (zh) 图像生成方法、装置、计算机设备及计算机可读存储介质
CN113610750A (zh) 对象识别方法、装置、计算机设备及存储介质
CN111242090A (zh) 基于人工智能的人脸识别方法、装置、设备及介质
CN113705302A (zh) 图像生成模型的训练方法、装置、计算机设备及存储介质
CN112272311A (zh) 花屏修复方法、装置、终端、服务器及介质
CN111836073B (zh) 视频清晰度的确定方法、装置、设备及存储介质
CN113706440A (zh) 图像处理方法、装置、计算机设备及存储介质
CN113918767A (zh) 视频片段定位方法、装置、设备及存储介质
CN113763931B (zh) 波形特征提取方法、装置、计算机设备及存储介质
CN114283299A (zh) 图像聚类方法、装置、计算机设备及存储介质
CN113822263A (zh) 图像标注方法、装置、计算机设备及存储介质
CN113570510A (zh) 图像处理方法、装置、设备及存储介质
CN113569822B (zh) 图像分割方法、装置、计算机设备及存储介质
CN112528760B (zh) 图像处理方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40042442

Country of ref document: HK