CN112017189A - 图像分割方法、装置、计算机设备和存储介质 - Google Patents

图像分割方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112017189A
CN112017189A CN202011152220.8A CN202011152220A CN112017189A CN 112017189 A CN112017189 A CN 112017189A CN 202011152220 A CN202011152220 A CN 202011152220A CN 112017189 A CN112017189 A CN 112017189A
Authority
CN
China
Prior art keywords
image
target object
segmentation
segmentation result
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011152220.8A
Other languages
English (en)
Other versions
CN112017189B (zh
Inventor
柳露艳
马锴
郑冶枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011152220.8A priority Critical patent/CN112017189B/zh
Publication of CN112017189A publication Critical patent/CN112017189A/zh
Application granted granted Critical
Publication of CN112017189B publication Critical patent/CN112017189B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及基于人工智能的一种图像分割方法、装置、计算机设备和存储介质。所述方法包括:获取三维图像中不同切面下的二维的切面图像;对各所述切面图像中的目标对象进行语义分割;对各所述切面图像中的所述目标对象进行实例分割;根据所述目标对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各所述切面图像中所述目标对象对应的初始分割结果;对各所述切面图像对应的所述初始分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果。采用本方法能够有效提高三维图像数据中的目标对象的分割效率和分割准确度。

Description

图像分割方法、装置、计算机设备和存储介质
技术领域
本申请涉人工智能技术及图像处理技术领域,特别是涉及一种图像分割方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的不断发展,基于人工智能的图像处理技术也越来越成熟。图像分割是图像识别和计算机视觉至关重要的预处理,被广泛应用于各个领域,例如能够有效用于辅助各种场景图像中的图像分类、物体检测、物体跟踪等任务。
传统的方式中,通常是采用基于形态匹配、模板匹配等方式对二维图像进行分割。对于三维图像数据,则需要手动分割及标注出三维图像数据中的目标对象的轮廓。对于目标对象较多的图像数据,人工标注的人力成本较大,且非常耗时,导致图像分割的效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够有效提高三维图像数据中的目标对象的分割效率的图像分割方法、装置、计算机设备和存储介质。
一种图像分割方法,所述方法包括:
获取三维图像中不同切面下的二维的切面图像;
对各所述切面图像中的目标对象进行语义分割;
对各所述切面图像中的所述目标对象进行实例分割;
根据所述目标对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各所述切面图像中所述目标对象对应的初始分割结果;
对各所述切面图像对应的所述初始分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果。
一种图像分割装置,所述装置包括:
图像获取模块,用于获取三维图像中不同切面下的二维的切面图像;
语义分割模块,用于对各所述切面图像中的目标对象进行语义分割;
实例分割模块,用于对各所述切面图像中的所述目标对象进行实例分割;
融合模块,用于将所述目标对象在同一切面图像中对应的语义分割结果和实例分割结果进行融合,分别得到各所述切面图像中所述目标对象对应的初始分割结果;对各所述切面图像对应的所述初始分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果。
在一个实施例中,所述语义分割模块还用于提取各所述切面图像对应的图像语义特征;根据各所述切面图像对应的图像语义特征,识别属于各所述切面图像中的所述目标对象的像素点;根据各所述切面图像中的所述目标对象的像素点,确定各所述切面图像中所述目标对象对应的轮廓,得到各所述切面图像中所述目标对象对应的语义分割结果。
在一个实施例中,所述语义分割模块还用于通过预先训练的语义分割网络的编码层,对各所述切面图像对应的特征图进行特征提取和卷积操作,得到各所述切面图像对应的局部多尺度特征;通过所述语义分割网络的空洞卷积层,对各所述切面图像对应的局部多尺度特征进行空洞卷积处理,得到各所述切面图像对应的上下文多尺度特征;通过所述语义分割网络的解码层,对各所述切面图像对应的局部多尺度特征和上下文多尺度特征进行卷积处理,将卷积处理后的特征进行连接,得到各所述切面图像对应的图像语义特征。
在一个实施例中,所述实例分割模块还用于针对每个目标对象,提取各所述切面图像中与所述目标对象对应的候选兴趣区域;分别提取各所述候选兴趣区域中属于所述目标对象的像素点;根据所述像素点,生成所述目标对象对应的轮廓分割图,得到所述目标对象分别对应于各所述切面图像的实例分割结果。
在一个实施例中,所述实例分割模块还用于对各所述切面图像进行特征提取,得到各所述切面图像的特征图;对各所述切面图像的特征图进行卷积操作,得到多个不同尺度的特征信息;根据所述多个不同尺度的特征信息,识别各所述切面图像中的兴趣区域;预测各所述兴趣区域的实例类别,并选取实例类别为所述目标对象的兴趣区域,得到各所述切面图像中与每个所述目标对象对应的候选兴趣区域。
在一个实施例中,所述融合模块还用于将所述目标对象在同一切面图像中对应的语义分割结果和实例分割结果进行比对,识别所述同一切面图像中的漏检的目标对象;对所述漏检的目标对象对应的区域进行连通域提取,得到所述漏检的目标对象对应的分割结果;将所述同一切面图像中所述漏检的目标对象对应的分割结果与所述实例分割结果进行融合,得到各所述切面图像中所述目标对象对应的初始分割结果。
在一个实施例中,所述装置还包括矫正模块,用于对各所述初始分割结果进行矫正,得到的各所述切面图像对应的矫正后的分割结果;所述融合模块还用于对各所述切面图像对应的所述矫正后的分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果。
在一个实施例中,所述切面图像包括第一切面图像和第二切面图像;所述融合模块还用于将各所述第一切面图像中所述目标对象对应的初始分割结果进行两两匹配,获得各所述目标对象在各所述第一切面图像中的重叠率;将所述重叠率达到重叠率阈值的目标对象,确定为相匹配的目标对象;对各所述切面图像中相匹配的目标对象对应的所述初始分割结果进行融合,生成所述三维图像中所述目标对象的分割结果。
在一个实施例中,所述融合模块还用于当所述目标对象的重叠率未达到重叠率阈值时,针对每个目标对象,确定所述目标对象分别在各所述第一切面图像和各所述第二切面图像中的重叠区域,并根据所述重叠区域确定所述目标对象对应的一致率;将所述一致率达到一致率阈值的目标对象,确定为相匹配的目标对象。
在一个实施例中,所述语义分割结果是通过语义分割网络获得的;所述语义分割网络通过训练步骤训练获得,所述装置还包括第一模型训练模块,用于获取二维的第一样本图像和第一训练标签;所述第一训练标签是所述第一样本图像中针对样本目标对象的语义标注标签;将所述第一样本图像输入待训练的语义分割网络,通过所述语义分割网络对所述第一样本图像对应的特征图进行特征提取,得到所述第一样本图像的图像语义特征;根据所述第一样本图像的图像语义特征,识别出所述第一样本图像中所述目标对象对应的轮廓,得到所述第一样本图像中所述目标对象对应的样本语义分割结果;基于所述样本语义分割结果与所述第一训练标签的差异,调整所述语义分割网络的参数,并继续训练,直至满足训练条件时停止训练。
在一个实施例中,所述实例分割结果是通过实例分割网络获得的;所述实例分割网络通过训练步骤训练获得,所述装置还包括第二模型训练模块,用于获取二维的第二样本图像和第二训练标签;所述第二训练标签是所述样本图像中针对样本目标对象的实例标注标签;将所述第二样本图像输入待训练的实例分割网络,通过所述实例分割网络,针对每个目标对象,提取所述第二样本图像中的样本候选兴趣区域;对所述样本候选兴趣区域进行卷积操作和池化操作,根据提取的所述样本候选兴趣区域中属于所述目标对象对应的样本像素点;根据所述样本像素点,生成所述目标对象对应的样本轮廓分割图,得到所述目标对象对应于所述第二样本图像的样本实例分割结果;基于所述样本实例分割结果与所述第二训练标签的差异,调整所述实例分割网络的参数,并继续训练,直至满足训练条件时停止训练。
在一个实施例中,所述三维图像为三维医学影像,所述目标对象是所述三维医学影像中的医学检测对象。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取三维图像中不同切面下的二维的切面图像;
对各所述切面图像中的目标对象进行语义分割;
对各所述切面图像中的所述目标对象进行实例分割;
根据所述目标对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各所述切面图像中所述目标对象对应的初始分割结果;
对各所述切面图像对应的所述初始分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取三维图像中不同切面下的二维的切面图像;
对各所述切面图像中的目标对象进行语义分割;
对各所述切面图像中的所述目标对象进行实例分割;
根据所述目标对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各所述切面图像中所述目标对象对应的初始分割结果;
对各所述切面图像对应的所述初始分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果。
上述图像分割方法、装置、计算机设备和存储介质,获取三维图像中不同切面下的二维的切面图像后,通过对各切面图像中的目标对象进行语义分割,能够精准有效地获取各切面图像中目标对象对应的语义分割结果。通过对各切面图像中的目标对象进行实例分割,从而能够精准地获取各切面图像中目标对象对应的实例分割结果。将目标对象在同一切面图像中对应的语义分割结果和实例分割结果结合,由此能够分别得到各切面图像中目标对象对应的完备的初始分割结果。最后通过对各切面图像对应的初始分割结果进行融合处理,从而能够对不同切面的各切面图像对应的初始分割结果进行多视角融合,由此能够精准地得到三维图像中目标对象的分割结果。通过自动识别出各切面图像中的目标对象对应的语义分割结果和实例分割结果,并进一步进行融合处理,获得最终的三维图像中目标对象的分割结果,极大的提高了三维图像中目标对象的分割处理效率,同时有效提高了三维图像中目标对象的分割准确度。
附图说明
图1为一个实施例中图像分割方法的应用环境图。
图2为一个实施例中图像分割方法的流程示意图。
图3为一个实施例中对各切面图像中的目标对象进行语义分割的步骤的流程示意图。
图4为一个实施例中语义分割网络的结构示意图。
图5为一个实施例中对各切面图像中的目标对象进行实例分割的步骤的流程示意图。
图6为一个实施例中实例分割网络的结构示意图。
图7为另一个实施例中图像分割方法的流程示意图。
图8为一个实施例中语义分割网络的训练步骤的流程示意图。
图9为一个实施例中实例分割网络的训练步骤的流程示意图。
图10为一个实施例中三维细胞图像的示意图。
图11为一个实施例中三维细胞图像中XY切面图像和XZ切面图像的示意图。
图12为一个实施例中分别为二维的XY切面图像和XZ切面图像中细胞对应的初始分割结果的示意图。
图13为一个实施例中三维细胞图像中细胞的分割结果的示意图。
图14为一个实施例中图像分割装置的结构框图。
图15为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的图像分割方法,可以应用于计算机设备中。计算机设备可以为终端或服务器。可以理解的是,本申请提供的图像分割方法可以应用于终端,也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。
本申请提供的图像分割方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。其中,终端102可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。服务器104可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端102以及服务器104可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
其中,云计算(cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。作为云计算的基础能力提供商,会建立云计算资源池(简称云平台,一般称为IaaS(Infrastructure as a Service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。
具体地,终端102采集三维图像后,将三维图像发送至服务器104。服务器104获取三维图像中不同切面下的二维的切面图像,对各切面图像中的目标对象进行语义分割,并对各切面图像中的目标对象进行实例分割;服务器104根据目标对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各切面图像中目标对象对应的初始分割结果;对各切面图像对应的初始分割结果进行融合处理,得到三维图像中目标对象的分割结果,并将三维图像中目标对象的分割结果返回至终端102,并在终端102的界面上进行展示。
可以理解,本申请各实施例中的图像分割方法,采用人工智能技术中的计算机视觉技术以及机器学习技术等,能够有效实现自动检测并分割出三维图像中的目标对象。人工智能(Artificial Intelligence ,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
计算机视觉技术(Computer Vision, CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。可以理解,本申请正是使用计算机视觉技术,从三维图像中检测并分割出目标对象。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。可以理解,在本申请一些实施例中使用到的语义分割网络和实例分割网络,就是使用机器学习技术训练得到的,基于该机器学习技术训练得到的语义分割网络和实例分割网络,能够更加准确地从二维的切面图像中提取出目标对象对应的分割结果。
在一个实施例中,如图2所示,提供了一种图像分割方法,以该方法应用于计算机设备为例进行说明,该计算机设备具体可以是图1中的终端或服务器,包括以下步骤:
S202,获取三维图像中不同切面下的二维的切面图像。
其中,三维图像即三维立体图像,三维图像主要是运用光影、虚实、明暗对比来体现,通过模拟人眼看世界的原理,利用光学折射制作出来,并利用重叠图案之间的差异来产生立体感。可以使人眼感观上看到物体的上下、左右、前后三维关系,是真正视觉意义上的立体图像。通过计算机设备展示三维图像时,可以从多个角度进行观察,例如可以通过调节视线焦点进行观察,不同角度下能够展示不同的图像信息。
二维图像是指不包含深度信息的平面图像,一般只能看到物体的两个面,即物体的长和宽,例如仅包括X轴方向和Y轴方向的信息,也就是二维平面。对于三维图像,通过给视角增加一个方向,即Z轴方向,也就是物体的深度,并给这个深度一定的数值,就是三维立体图像。
可以理解,三维图像中的二维的切面图像,也就是三维图像的切片。切面图像是指三维图像中的一个切面对应的图像。切面可以是过图像内部一点且平行于XY、YZ、XZ平面的平面,也可以是任意的过三维图像内部一点任意方向的平面。通过提取切片可以方便的浏览和分析图像内部组织结构,是医学图像浏览软件中的一个重要的功能。
同一物体的三维图像,可以视为由该物体的各个二维的切面图像堆叠而成。
具体地,计算机设备获取待处理的三维图像后,首先按照不同切面对三维图像进行切割,得到不同切面下的二维的切面图像。
其中,不同切面可以是多个切面。多个,即至少两个。同一切面下的切面图像,可以为多个。在一个实施例中,不同切面下的二维的切面图像,可以是任意两个切面的切面图像。任意两个切面,可以是任意两个正交切面。
例如,可以通过获取图像范围、坐标系原点和像素间隔,根据这三个参数可以计算出图像的中心位置。接下来定义切面的变换矩阵,该矩阵的前三列分别表示X、Y和Z方向矢量,通过修改切面坐标系原点,可以得到不同位置的切面图像。
在其中一个实施例中,计算机设备获取待处理的三维图像后,按照互相正交的任意两个切面对三维图像进行切割,得到任意两个正交切面的切面图像,例如按照XY面和XZ面进行切割,分别得到XY面和XZ面对应的切面图像。
S204,对各切面图像中的目标对象进行语义分割。
在计算机视觉领域,图像分割是指把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程,也就是将数字图像细分为多个图像子区域,即像素的集合,也被称作超像素的过程。
其中,目标对象是指三维图像中需要分割出来的物体对象,也就是针对目标对象,对图像数据进行对象图像分割,用于定位图像中目标对象对应的物体和边界,例如可以用线、曲线等表示。例如,目标对象可以是图像中的人物、人脸、车辆或医学影像中的医学检测对象等,在此不做限定。
可以理解,在图像领域,语义指的是对图像中内容的意思理解。分割是指从像素的角度分割出图像中的不同对象,对原图像中的每个像素都进行标注。语义分割即图像语义分割,就是让计算机根据图像的语义来进行分割,是对图像中的每个像素打上类别标签的过程,也就是需要预测出图像的每一个像素点属于哪一类的标签。
计算机设备获取三维图像中不同切面下的二维的切面图像后,对各个切面图像进行图像语义分割处理,即针对每一个切面图像中的目标对象进行语义分割。
具体地,对于每一个切面图像,首先识别出不同图像语义类别的像素,然后预测出类别属于目标对象的像素,并标注出属于目标对象的像素区域,即标注出切面图像中目标对象对应的轮廓,从而得到各个切面图像中针对目标对象的语义分割结果。
可以理解,语义分割是把所有的目标对象无差别的分割出来,语义分割出来的结果是与原始图像大小相同的分割结果图。若一张切面图像中存在多个目标对象时,语义分割结果,则是在相应的原切面图像中标注出的所有目标对象对应的轮廓区域。
S206,对各切面图像中的目标对象进行实例分割。
其中,实例分割是在语义分割的基础上,还需要区分出同一类物体的不同个体。实例分割也可以理解为是目标检测和语义分割的结合,即首先在图像中将目标对象检测出来,然后对每个目标对象对应的像素打上标签。对于图像中每个物体都要进行区分和标注。其中,目标检测是识别图像中存在的目标对象内容和检测其位置的过程,例如识别和检测出图像中的人物位置。
可以理解,实例分割是将图像中的每一个个体的目标对象对应的轮廓区域分别分割出来。实例分割的分割结果,则是每一个目标对象均对应一个和原始图像大小一致的分割结果图,即每一个目标对象都生成有对应的轮廓分割图。
若一张切面图像中存在多个目标对象时,语义分割结果,则包括与每个目标对象分别对应的多个分割结果图。
计算机设备获取三维图像中不同切面下的二维的切面图像后,还对各个切面图像进行图像实例分割处理,即针对每一个切面图像中的目标对象进行实例分割。
具体地,对于每一个切面图像,首先识别出各切面图像中每一个目标对象对应的区域,然后识别每一个目标对象对应的区域中属于目标对象的像素,并标记出各切面图像中每一个目标对象对应的轮廓。其中,针对每个目标对象,根据目标对象对应的轮廓区域,生成每一个目标对象对应的轮廓分割图。可以理解的是,每一个目标对象对应的轮廓分割图,都是与对应的原切面图像的大小一致的分割结果图。轮廓分割图中标注了相应目标对象的位置和轮廓区域。对于除该目标对象的轮廓区域外的区域,可以采用掩码进行遮挡处理。
由此根据各切面图像中每一个目标对象分别对应的轮廓分割图,得到各切面图像中目标对象的实例分割结果。也就是由各切面图像中每一个目标对象对应的轮廓分割图,生成各个切面图像中目标对象的实例分割结果。
S208,根据目标对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各切面图像中目标对象对应的初始分割结果。
可以理解的是,初始分割结果是表示目标对象在同一切面图像中,结合语义分割结果和实例分割结果,得到的完备的实例分割结果。
具体地,计算机设备分别对各切面图像进行语义分割处理和实例分割处理,分别得到各切面图像中目标对象对应的语义分割结果和实例分割结果后。进一步地,将目标对象在同一切面图像中对应的语义分割结果和实例分割结果进行比较,从而可以识别出漏检的目标对象对应的区域。通过对漏检的目标对象对应的区域进行图像形态学处理后,得到漏检的目标对象对应的分割结果。进而将漏检的目标对象对应的分割结果,与原切面图像中的实例分割结果进行合并,从而得到各切面图像中完备的目标对象对应的实例分割结果,并将完备的实例分割结果确定为各切面图像中目标对象对应的初始分割结果。
例如,对于存在较多目标对象或目标对象较小图像,容易导致各个目标对象在切面图像中的实例分割结果出现误差。因此,通过将目标对象在同一切面图像中对应的语义分割结果和实例分割结果进行结合,能够识别出切面图像中漏检的目标对象,并将提取的漏检的目标对象对应的分割结果,与目标对象在原切面图像中的实例分割结果进行融合,由此能够精准地得到完备的实例分割结果。
S210,对各切面图像对应的初始分割结果进行融合处理,得到三维图像中目标对象的分割结果。
可以理解,三维图像可以由连续多张二维的切面图像堆叠形成,通过将目标对象在二维的各切面图像对应的初始分割结果进行融合,从而能够获得三维图像中目标对象的分割结果。
具体地,计算机设备获得目标对象在各切面图像对应的初始分割结果后,将各切面图像对应的初始分割结果进行匹配,识别出在各切面图像中相匹配的目标对象,进而将识别出的相匹配的目标对象,在各切面图像对应的初始分割结果进行融合,由此能够有效地得到三维图像中目标对象的分割结果。
其中,计算机设备还可以利用快速GPU(Graphics Processing Unit,图形处理器)计算资源对三维图像中不同切面下的二维的各切面图像进行图像分割处理。进一步地,还可以采用分布式同时对多张切面图像进行处理,从而能够有效提高对三维图像进行图像分割的处理效率。
在一个实施例中,对各切面图像对应的初始分割结果进行融合处理,得到三维图像中目标对象的分割结果,包括:对各初始分割结果进行矫正,得到的各切面图像对应的矫正后的分割结果;对各切面图像对应的矫正后的分割结果进行融合处理,得到三维图像中目标对象的分割结果。
可以理解,对各初始分割结果进行矫正,是为了对初始分割结果中少量的漏检或误检的目标对象的轮廓进行矫正,使得各切面图像中的目标对象的轮廓分割结果更加精准。
计算机设备结合语义分割和结果实例分割结果,得到完备的目标对象对应的初始分割结果后,还进一步对各切面图像中的初始分割结果进行矫正。具体地,获取对待矫正目标对象的矫正操作,对待矫正的目标对象对应的轮廓进行矫正处理,以对各初始分割结果进行矫正,得到的各切面图像对应的矫正后的分割结果。
在其中一个实施例中,计算机设备还可以将生成的各切面图像中目标对象对应的初始分割结果,在标注终端进行展示,使得标注人员通过标注终端对初始分割结果进行人工审核和人工矫正,以调整矫正存在误差的目标对象对应的分割结果。具体地,通过获取对各切面图像中相应目标对象的轮廓调整操作,从而实现对各切面图像中各目标对象的轮廓进行调整矫正。由此能够有效得到人工矫正后的精准度较高的初始分割结果。
本实施例中,通过计算机设备自动对三维图像中不同切面下的二维的各切面图像中的目标对象进行轮廓分割,得到各切面图像中目标对象对应的初始分割结果后,标注人员只需要对计算机设备自动生成的标注结果进行简单的校正和审核,即可得到最终准确的各切面图像中的目标对象的分割结果。通过利用人工智能技术和快速GPU计算资源自动对三维图像进行图像分割处理,大大减轻了人工标注的工作量,从而大大提高了三维图像的分割处理效率。
在其中一个实施例中,计算机设备还可以待处理的三维图像数据划分为多个图像块,例如将原始的三维图像裁剪为多个图像块。然后在对每个图像块对应的三维图像进行图像分割处理。计算机设备获得各个三维图像中目标对象对应的分割结果后,将各个三维图像中对应的分割结果进行拼接,从而能够得到完整的三维图像中目标对象的分割结果。
上述图像分割方法中,计算机设备获取三维图像中不同切面下的二维的切面图像后,通过对各切面图像中的目标对象进行语义分割,能够精准有效地获取各切面图像中目标对象对应的语义分割结果。通过对各切面图像中的目标对象进行实例分割,从而能够精准地获取各切面图像中目标对象对应的实例分割结果。将目标对象在同一切面图像中对应的语义分割结果和实例分割结果结合,由此能够分别得到各切面图像中目标对象对应的完备的初始分割结果。最后通过对各切面图像对应的初始分割结果进行融合处理,从而能够对不同切面的各切面图像对应的初始分割结果进行多视角融合,由此能够精准地得到三维图像中目标对象的分割结果。通过自动识别出各切面图像中的目标对象对应的语义分割结果和实例分割结果,并进一步进行融合处理,获得最终的三维图像中目标对象的分割结果,极大的提高了三维图像中目标对象的分割处理效率,同时有效提高了三维图像中目标对象的分割准确度。
在一个实施例中,对各切面图像中的目标对象进行语义分割,包括:提取各切面图像对应的图像语义特征;根据各切面图像对应的图像语义特征,识别属于各切面图像中的目标对象的像素点;根据各切面图像中的目标对象的像素点,确定各切面图像中目标对象对应的轮廓,得到各切面图像中目标对象对应的语义分割结果。
可以理解,图像语义特征是指包含了图像中大量图像语义信息的特征,如多尺度特征、局部特征、上下文特征、全局特征等。
计算机设备对各切面图像中的目标对象进行语义分割的过程中,首先对各切面图像进行特征提取,得到各切面图像的图像语义特征。例如可以通过对各切面图像进行多次卷积操作和池化操作,从而能够捕捉到切面图像对应的丰富的多尺度特征,进而根据捕捉到的这些多尺度特征得到各切面图像最终的图像语义特征。
计算机设备进而能够根据各切面图像对应的图像语义特征,识别各切面图像中每个像素的类别,进而可以识别出属于各切面图像中的目标对象的像素点。计算机设备则根据各切面图像中的目标对象的像素点,标注出各切面图像中目标对象对应的轮廓,由此得到各切面图像中目标对象对应的语义分割结果。
如图3所示,为一个实施例中对各切面图像中的目标对象进行语义分割的步骤的流程示意图,包括以下步骤:
S302,通过预先训练的语义分割网络的编码层,对各切面图像对应的特征图进行特征提取和卷积操作,得到各切面图像对应的局部多尺度特征。
S304,通过语义分割网络的空洞卷积层,对各切面图像对应的局部多尺度特征进行空洞卷积处理,得到各切面图像对应的上下文多尺度特征。
S306,通过语义分割网络的解码层,对各切面图像对应的局部多尺度特征和上下文多尺度特征进行卷积处理,将卷积处理后的特征进行连接,得到各切面图像对应的图像语义特征。
S308,根据各切面图像对应的图像语义特征,识别属于各切面图像中的目标对象的像素点。
S310,根据各切面图像中的目标对象的像素点,确定各切面图像中目标对象对应的轮廓,得到各切面图像中目标对象对应的语义分割结果。
可以理解,预先训练的语义分割网络,是通过基于深度学习训练得到的具有对图像进行语义分割功能的机器学习网络模型。其中,语义分割网络可以采用基于VGG16(Visual Geometry Group,卷积神经网络)、CNN(Convolutional Neural Networks,卷积神经网络)、DNN(Deep Neural Networks,深度神经网络)、ResNet(残差网络)、LFPN(FeaturePyramid Network,特征金字塔网络)、RPN(Region Proposal Network,区域生成网络)或FasterRCNN(Faster Region Convolutional Neural Networks,深度区域卷积神经网络)等的神经网络,或多个神经网络的组合等,但不限于此。
其中,语义分割网络可以包括编码层、空洞卷积层以及解码层。编码层包括多个卷积网络,用于对输入图像进行卷积处理、池化处理以及降采样处理。空洞卷积层中包括空洞卷积网络,用于对输入以不同采样率进行空洞卷积处理以及池化处理。解码层也包括多个卷积网络,用于对输入进行上采样和卷积处理。通过采用编码-解码的网络结构,能够精准有效地提取图像层级的图像语义特征。
具体地,计算机设备将各切面图像输入至预先训练的语义分割网络,首先输入至语义分割网络的编码层,通过编码层中的各卷积网络对输入的切面图像的空间分辨率进行下采样,得到各切面图像对应的特征图(feature map)。对各切面图像对应的特征图进行特征提取和卷积操作,得到各切面图像对应的局部多尺度特征,以获得高层次的特征。编码层通过对输入的空间分辨率进行下采样,生成分辨率较低的特征映射,且高层次的特征容易捕获更长的距离信息,进而能够高效地进行分类。
进一步将编码层输出的特征图以及对应的局部多尺度特征输入至语义分割网络的空洞卷积层,通过空洞卷积层以不同的采样率对各切面图像对应的局部多尺度特征进行空洞卷积处理,从不同图像等级的特征中获取上下文信息。具体还可以采用空间金字塔池化捕捉特征图中多个层次的上下文信息,从而得到各切面图像对应的上下文多尺度特征和全局多尺度特征。
进而将空洞卷积层输出的特征图以及对应的上下文多尺度特征和全局多尺度特征输入至解码层。其中,利用下采样的池化索引作为上采样的指导,将编码层部分的特征跳跃连接到解码层,通过解码层对各切面图像对应的上下文多尺度特征和全局多尺度特征,并同时连接编码层各卷积网络输出的特征,进行卷积处理,将卷积处理后的特征进行连接,从而得到各切面图像对应的图像语义特征。
语义分割网络中的解码层则进一步根据各切面图像对应的图像语义特征,识别属于各切面图像中的目标对象的像素点,进而根据各切面图像中的目标对象的像素点,确定各切面图像中目标对象对应的轮廓,得到各切面图像中目标对象对应的语义分割结果。
在一个具体的实施例中,语义分割网络可以采用编码-空洞卷积-解码的网络结构。如图4所示,为其中一个实施例中语义分割网络的结构示意图。其中,图4中41为残差网络层,42为卷积网络层,43为下采样残差网络层,44为空洞卷积层,45为上采样网络层,46表示跳跃连接,47表示拼接连接。其中,编码层也可以是编码器,编码器包括一个输入层和E1至E4这4个阶段的网络层,输入层可以包括一个41残差网络层和一个42卷积网络层。E1至E3阶段包括一个43下采样残差网络层、若干个41残差网络层以及一个42卷积网络层,E4阶段包括一个43下采样残差网络层和若干个41残差网络层。其中,E1至E4这4个阶段包括41残差网络层和43下采样残差网络层的数量之和分别为4、6、6、4。其中,每个阶段中的残差网络层可以采用46跳跃连接,每个阶段的输入和输出由相加操作连接,编码器的每个阶段之后均连接着一个核大小为3×3的卷积操作和核大小为2×2的平均池化操作,以将切面图像对应的特征图降采样到一半大小。
语义分割网络中的空洞卷积层,可以采用ASPP网络(Atrous Spatial PyramidPooling,空洞空间卷积池化金字塔),采用空洞空间金字塔池化在不同网格尺度上执行空间池化,能够对输入以不同采样率的空洞卷积并行采样,相当于以多个比例捕捉切面图像的上下文信息,以及捕捉多尺度信息。由此能够从不同图像等级的特征中捕捉多个层次的上下文信息,并聚合全局信息,从而能够有效地挖掘到更加充足的多尺度特征。
解码层也可以为解码器,解码器可以包括D1至D4四个解码阶段和一个输出卷积层。解码器的D1至D4四个解码阶段分别与编码器的S1至S4四个阶段相对应。解码器的D1至D4每个阶段可以包括一个45上采样网络层、42卷积网络层以及两个41残差网络层,输出卷积层包括一个42卷积网络层。在每个解码阶段前对输入进行二倍上采样和核大小为1×1的卷积操作。在解码过程中,将编码层在编码过程中得到的相同尺寸的特征图,连接到解码层的网络层中进行连接,也就是将编码层中E1至E4各阶段获得的特征图,分别连接至解码层与D1至D4对应的解码阶段中,与解码层各阶段获得的新的特征图进行拼接,并对应各网络层的维数进行连接,将相同尺寸的图按深度链接起。其中,通过上采样处理可以将特征还原为全分辨率分割图。
如图4所示,以为二维的切面图像作为输入图像,首先将输入图像输入至语义分割网络的编码层的输入层,通过编码层中的各卷积网络对输入的切面图像进行特征提取和卷积操作,提取输入图像对应的特征图以及局部多尺度特征。进一步通过空洞卷积层以不同的采样率对输入图像对应的的特征图以及局部多尺度特征进行空洞卷积处理,提取上下文多尺度特征和全局多尺度特征。同时将编码层部分的特征连接到解码层,进而通过编码层对各切面图像对应的上下文多尺度特征和全局多尺度特征,并同时连接编码层各卷积网络输出的特征,进行卷积处理,将卷积处理后的特征进行连接,得到输入图像对应的图像语义特征。解码层则基于提取的图像语义特征,识别属于输入图像中的目标对象的像素点,进而根据像素点确定中目标对象对应的轮廓,得到输入图像中目标对象对应的语义分割结果,并通过解码层的输出层输出对应的语义分割结果图。由此通过预先训练的语义分割网络能够精准地根据提取得到的图像语义特征,识别出目标对象对应的轮廓区域,从而能够得到准确度较高的语义分割结果。
在一个实施例中,对各切面图像中的目标对象进行实例分割,包括:针对每个目标对象,提取各切面图像中与目标对象对应的候选兴趣区域;分别提取各候选兴趣区域中属于目标对象的像素点;根据像素点,生成目标对象对应的轮廓分割图,得到目标对象分别对应于各切面图像的实例分割结果。
其中,兴趣区域,即RoI(Region of Interest,感兴趣区域)。感兴趣区域,是指在机器视觉、图像处理中,从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域。
可以理解,轮廓分割图是各切面图像中每一个目标对象的轮廓区域对应的分割结果图,即每一个目标对象均对应一个和原始切面图像大小一致的分割结果图。若一张切面图像中存在多个目标对象时,目标对象对应的轮廓分割图则包括与每个目标对象分别对应的多个分割结果图。
计算机设备对各切面图像中的目标对象进行实例分割的过程中,首先针对每个目标对象,提取各切面图像中与目标对象对应的候选兴趣区域。具体地,计算机设备首先对各切面图像进行特征提取,能够提取出各切面图像对应的深层次特征,然后根据所提取的深层次特征识别切面图像中各个兴趣区域像素的类别,并识别出切面图像中每个目标对象对应的候选兴趣区域。
计算机设备进而从每个目标对象对应的候选兴趣区域中,提取出属于每个目标对象的像素点,并根据每个目标对象的像素点,生成每个目标对象对应的轮廓分割图。进而根据每个目标对象对应的轮廓分割图生成目标对象分别对应于各切面图像的实例分割结果。
本实施例中,通过识别出切面图像中每一个目标对象对应的区域,提取属于每一个目标对象的像素,并标记出各切面图像中每一个目标对象对应的轮廓,从而根据各切面图像中每一个目标对象对应的轮廓,准确有效地得到各切面图像中目标对象的实例分割结果。
在一个实施例中,如图5所示,为一个实施例中对各切面图像中的目标对象进行实例分割的步骤的流程示意图,包括以下步骤:
S502,对各切面图像进行特征提取,得到各切面图像的特征图;
S504,对各切面图像的特征图进行卷积操作,得到多个不同尺度的特征信息;
S506,根据多个不同尺度的特征信息,识别各切面图像中的兴趣区域;
S508,预测各兴趣区域的实例类别,并选取实例类别为目标对象的兴趣区域,得到各切面图像中与每个目标对象对应的候选兴趣区域。
S510,针对每个目标对象,提取各切面图像中与目标对象对应的候选兴趣区域;
S512,分别提取各候选兴趣区域中属于目标对象的像素点;
S514,根据像素点,生成目标对象对应的轮廓分割图,得到目标对象分别对应于各切面图像的实例分割结果。
其中,实例类别是指图像中不同实例对象的类别,如不同的物体的类别。
计算机设备首先对各切面图像进行特征提取,得到对应的特征图后,然后基于特征图进行卷积操作,以提取各切面图像更深层次的多个不同尺度的特征信息。接着根据提取的多个不同尺度的特征信息,对各切面图像进行目标检测,识别出各切面图像中的兴趣区域。
然后对每个兴趣区域进行分类,预测出每个兴趣区域的实例类别,由此能够识别并选取出实例类别为目标对象的兴趣区域。在此过程中,还可以标注目标对象对应的兴趣区域。例如可以采用实例框将各切面图像中的目标对象对应的兴趣区域标记出来。从而得到各切面图像中与每个目标对象对应的候选兴趣区域。
在一个具体的实施例中,还可以采用预先训练的实例分割网络对各切面图像中的目标对象进行实例分割,以获得目标对象分别对应于各切面图像的实例分割结果。实例分割网络可以为采用基于MaskRCNN(基于掩膜的卷积区域神经网络)、FasterRCNN等神经网络构建的深度机器学习模型。其中,MaskRCNN是基于掩膜的实例分割模型,能够有效地用于物体检测和实例分割。
例如,实例分割网络可以采用基于MaskRCNN的网络结构。如图6所示,为一个实施例中实例分割网络的结构示意图。基于MaskRCNN的实例分割网络中还可以包括深度残差网络602(例如ResNet网络)、特征金字塔网络604(例如Feature Pyramid Network,FPN网络)、区域生成网络606(例如Region Proposal Network,RPN网络)、区域特征聚集网络608(例如Region of Interest Align,RoIAlign网络)以及预测层610。其中,预测层610中包括若干个卷积网络6101以及分类网络6102、边框预测网络6104和实例预测网络6106。例如卷积网络6101可以为Conv网络。其中分类网络6102用于对图像中的各背景区域进行分类预测。边框预测网络6104可以为基于Bounding-Box regression的边框回归预测网络,用于预测目标对象的边框,即目标对象区域对应的检测框。实例预测网络6106用于根据分类结果和边框预测结果输出与输入图像对应的实例分割结果图。
具体地,计算机设备将各切面图像输入至实例分割网络。首先将各切面图像输入至实例分割网络中的深度残差网络602,深度残差网络对输入的各切面图像进行卷积操作,得到对应的特征图。接着将提取的特征图输入至特征金字塔网络604,通过特征金字塔网络对各切面图像的特征图进行卷积操作,以获得多个不同尺度的特征信息,并输出多个不同尺度的特征图。其中,特征金字塔网络具有横向连接的自上而下的体系结构,可以根据单比例输入构建网络内要素金字塔,用于根据特征金字塔的规模从不同级别的功能金字塔中提取兴趣区域的特征。
区域生成网络606以提取的特征图以及对应的特征信息作为网络的输入,区域生成网络先进行多尺度的卷积,然后分两支全连接层进行1x1的卷积。以识别切面图像中的兴趣区域,并预测各个兴趣区域的实例类别,输出各类别(前景或背景)与坐标位置,例如可以是基于输入切面图像的坐标位置,并输出各切面图像中与每个目标对象对应的候选兴趣区域。
然后将区域生成网络的输出,输入至实例分割网络中的区域特征聚集网络608,区域特征聚集网络用于从所有候选兴趣区域中提取相同大小的特征图,并对每一个候选兴趣区域进行像素校正,用于后续进行分类与分割。具体地,可以将各个候选兴趣区域分割成多个正区域的单元,在每个单元中计算固定四个坐标位置,可以采用双线性内插的方式计算出这四个坐标位置的值,然后进行最大池化操作。通过区域特征聚集网络使每个候选兴趣区域生成多个固定尺寸的特征图。
最后通过预测层610以区域特征聚集网络提取的特征图作为输入,利用包括卷积网络和全连接网络的分类网络6102对候选兴趣区域中的像素进行分类,提取各候选兴趣区域中属于目标对象的像素点,其中,每一个目标对象对应的子区域的像素是连通的区域。同时还通过预测层610中的边框预测网络6104,预测每一个目标对象的位置对应的边框,并输出对应的检测框,得到每一个目标对象对应的边框预测结果。进而通过卷积网络生成每一个目标对象对应的轮廓区域,从而分别生成每一个目标对象对应的轮廓分割图,即针对每一个目标对象,均生成对应一个和原始图像大小一致的轮廓分割图。从而根据每一个目标对象对应的轮廓分割图,得到目标对象分别对应于各切面图像的实例分割结果。
进一步地,通过预测层610中的实例预测网络6106,结合所得的分类结果以及边框预测结果,输出各切面图像中目标对象对应的实例分割结果。即实例分割结果中,还包括了各个目标对象分别对应的检测框,检测框即每个目标对象在原切面图像中的位置检测框。还包括通过实例分割网络预测得到的每一个目标对象对应的轮廓区域的置信度分数,当置信度分数达到预设置信度阈值时,则判定相应的轮廓区域是一个目标对象的轮廓区域。
本实施例中,通过识别出各切面图像中每一个目标对象对应的区域,以及区域中属于目标对象的像素,并标记出各切面图像中每一个目标对象对应的轮廓,从而能够精准地分割出每一个目标对象对应的轮廓,由此能够准确有效地获得各切面图像中目标对象的实例分割结果。
在一个实施例中,根据目标对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各切面图像中目标对象对应的初始分割结果,包括:将目标对象在同一切面图像中对应的语义分割结果和实例分割结果进行比对,识别同一切面图像中的漏检的目标对象;对漏检的目标对象对应的区域进行连通域提取,得到漏检的目标对象对应的分割结果;将同一切面图像中漏检的目标对象对应的分割结果与实例分割结果进行融合,得到各切面图像中目标对象对应的初始分割结果。
其中,漏检的目标对象,是指各切面图像的实例分割结果中,未检测出的目标对象,也就是通过将语义分割结果与实例分割结果之间进行比对,存在误差的目标对象。
可以理解的是,语义分割结果是将切面图像中所有的目标对象的轮廓无差别的分割出来,所得到的分割结果。而实例分割结果是将切面图像中每一个目标对象的轮廓都分别分割出来,所得到的分割结果。因此,实例分割结果相对于语义分割结果而言,可能存在漏检的部分目标对象。
计算机设备分别得到各切面图像对应的语义分割结果和实例分割结果后,将目标对象在同一切面图像中对应的语义分割结果和实例分割结果进行比对,以确定同一切面图像中的漏检的目标对象。具体地,可以将同一切面图像中对应的语义分割结果和实例分割结果做减法操作,也就是将语义分割结果中目标对象对应的区域,减去实例分割结果中各目标对象分别对应的区域,从而减去实例分割结果与语义分割结果中的重叠区域,得到实例分割结果与语义分割结果中的非重叠区域,非重叠区域即为同一切面图像中的漏检的目标对象。
对于漏检的目标对象,计算机设备进一步对漏检的目标对象对应的区域进行图像形态学处理。具体地,计算机设备可以首先对漏检的目标对象对应的区域,进行腐蚀膨胀的图像形态学处理,再对图像形态学处理后的区域进行连通域提取,从而得到漏检的目标对象对应的分割结果。
然后,计算机设备将同一切面图像中漏检的目标对象对应的分割结果与实例分割结果进行融合,即将漏检的目标对象对应的分割结果与实例分割结果合并在一起,由此能够得到各切面图像中完备的目标对象对应的实例分割结果。完备后的目标对象对应的实例分割结果,即为各切面图像中目标对象对应的初始分割结果。
本实施例中,通过将每个切面图像对应的语义分割结果和实例分割结果进行比对,从而能够准确地识别出各切面图像中漏检的目标对象。进而通过提取漏检的目标对象对应的分割结果,并将漏检的目标对象对应的分割结果与实例分割结果进行结合,由此能够得到准确度较高且较完备的切面图像中各目标对象对应的分割结果。
在一个实施例中,切面图像包括第一切面图像和第二切面图像;对各切面图像对应的初始分割结果进行融合处理,得到三维图像中目标对象的分割结果,包括:将各第一切面图像中目标对象对应的初始分割结果进行两两匹配,获得各目标对象在各第一切面图像中的重叠率;将重叠率达到重叠率阈值的目标对象,确定为相匹配的目标对象;对各切面图像中相匹配的目标对象对应的初始分割结果进行融合,生成三维图像中目标对象的分割结果。
其中,从三维图像中切割得到的切面图像,是从两个不同切面进行切割得到的,具体可以为两个正交切面下的切面图像。由此,切面图像则包括第一切面图像和第二切面图像,即第一切面下的切面图像和第二切面下的切面图像,例如第一切面图像为XY切面对应的切面图像,第二切面图像为XZ切面对应的切面图像。
可以理解,各目标对象在各第一切面图像中的重叠率,是指各第一切面图像中任意两个目标对象对应的轮廓区域的重叠率。
计算机设备得到各切面图像中目标对象对应的初始分割结果后,首先将各第一切面图像中目标对象对应的初始分割结果进行两两匹配,也就是将同一切面的每一张切面图像中的每一个目标对象对应的区域,与同一切面的各切面图像中的每一个目标对象对应的区域进行匹配,可以得到两两目标对象之间的交叠区域,由此根据各交叠区域得到各目标对象在各第一切面图像中的重叠率。
当各目标对象在各第一切面图像中的重叠率达到重叠率阈值时,则表示是同一个目标对象,例如还可以利用目标对象标识将相匹配的目标对象标记为同一个目标对象。计算机设备进而将重叠率达到重叠率阈值的目标对象,确定为相匹配的目标对象。然后通过对各切面图像中相匹配的目标对象对应的初始分割结果进行融合,从而能够精准有效地生成三维图像中目标对象的分割结果。
在一个实施例中,如图7所示,为另一个实施例中图像分割方法的流程示意图,包括以下步骤:
S702,获取三维图像中不同切面下的二维的切面图像。
S704,对各切面图像中的目标对象进行语义分割。
S706,对各切面图像中的所述目标对象进行实例分割。
S708,根据目标对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各切面图像中目标对象对应的初始分割结果。
S710,将各第一切面图像中目标对象对应的初始分割结果进行两两匹配,获得各目标对象在各第一切面图像中的重叠率;
S712,将重叠率达到重叠率阈值的目标对象,确定为相匹配的目标对象;
S714,当目标对象的重叠率未达到重叠率阈值时,针对每个目标对象,确定目标对象分别在各第一切面图像和各第二切面图像中的重叠区域,并根据重叠区域确定目标对象对应的一致率;
S716,将一致率达到一致率阈值的目标对象,确定为相匹配的目标对象。
S718,对各切面图像中相匹配的目标对象对应的初始分割结果进行融合,生成三维图像中目标对象的分割结果。
可以理解,目标对象对应的一致率,是目标对象分别在各第一切面图像和各第二切面图像中的一致率。
计算机设备各目标对象在各第一切面图像中的重叠率确定出相匹配的目标对象后,对于重叠率未达到重叠率阈值的目标对象,计算机设备则进一步将各第一切面图像与各第二切面图像进行比对,确定未达到重叠率阈值的目标对象,分别在各第一切面图像和各第二切面图像中的重叠区域,并根据重叠区域确定目标对象对应的一致率。
以切面图像包括第一切面图像和第二切面图像,第一切面图像为XY切面对应的切面图像,第二切面图像为XZ切面对应的切面图像为例。
例如,首先对XY面每一张切面图像的每一个实例与后面每一张切面图像的实例进行匹配,并计算各目标对象在各第一切面图像中的重叠率;当重叠率达到重叠率阈值时,例如重叠率阈值可以为0.7,则判定为一个3D实例目标对象,则将已匹配的目标对象从待匹配列表中删除。
当重叠率未达到重叠率阈值时,则表示在同一切面图像中还无法确定是否为一个3D实例目标对象,计算机设备则获取XZ面中XY面细胞重叠区域沿Z方向各个目标对象的一致率;其中,是一致率,是通过计算XY切面上相邻两张二维的第一切面图像的待匹配细胞对在XZ切面上的分割结果,是否对应是同一个目标对象,并统计在XZ面预测结果中属于同一个目标对象的像素个数,占两个目标对象总像素并集的比例,这个比例即为一致率。
当一致率达到一致率阈值时,例如一致率阈值可以为0.5,表示该目标对象属于同一个3D目标对象,则确定为相匹配的目标对象。
计算机设备进而对各切面图像中相匹配的目标对象对应的初始分割结果进行融合,生成三维图像中目标对象的分割结果,即得到最终的3D目标对象的标注结果,也就是实例分割结果。
本实施例中,通过自动识别出各切面图像中的目标对象对应的语义分割结果和实例分割结果后,并进一步对二维的切面图像对应的初始分割结果进行多视角的融合处理,从而能够获得准确度较高的三维图像中目标对象的分割结果,极大的提高了三维图像中目标对象的分割处理效率,同时有效提高了三维图像中目标对象的分割准确度。
在一个实施例中,语义分割结果是通过语义分割网络获得的;语义分割网络通过训练步骤训练获得,如图8所示,为一个实施例中语义分割网络的训练步骤的流程示意图,包括以下步骤:
S802,获取二维的第一样本图像和第一训练标签;第一训练标签是第一样本图像中针对样本目标对象的语义标注标签;
S804,将第一样本图像输入待训练的语义分割网络,通过语义分割网络对第一样本图像对应的特征图进行特征提取,得到第一样本图像的图像语义特征;
S806,根据第一样本图像的图像语义特征,识别出第一样本图像中目标对象对应的轮廓,得到第一样本图像中目标对象对应的样本语义分割结果;
S808,基于样本语义分割结果与第一训练标签的差异,调整语义分割网络的参数,并继续训练,直至满足训练条件时停止训练。
其中,样本图像,是指作为模型训练样本数据的图像,第一样本图像是用于训练语义分割网络模型的样本图像。第一训练标签是第一训练样本对应的标注标签,第一训练标签用于对每次的训练结果进行调参等处理,以进一步训练和优化语义分割网络。第一样本图像对应的第一训练标签可以是对第一样本图像中的目标对象进行标注得到的,具体可以是由人工标注获得。例如,语义标注标签可以是对第一样本图像中所标注与目标对象对应的轮廓区域。
具体地,待训练的语义分割网络可以包括编码层、空洞卷积层以及解码层。
计算机设备获取二维的第一样本图像后,将第一样本图像输入至待训练的语义分割网络中,通过语义分割网络对第一样本图像进行特征提取,得到第一样本图像对应的特征图,然后进一步对应第一样本图像对应的特征图进行特征提取,具体可以对提取的特征图进行多次卷积操作和池化操作,从而能够捕捉到第一样本图像对应的丰富的多尺度特征,进而根据捕捉到的这些多尺度特征,得到第一样本图像的图像语义特征。
计算机设备进而根据第一样本图像的图像语义特征,识别第一样本图像中每个像素的类别,进而可以识别出属于第一样本图像中的目标对象的像素点。然后则可以根据第一样本图像中的目标对象的像素点,识别出第一样本图像中目标对象对应的轮廓,由此得到第一样本图像中目标对象对应的样本语义分割结果。
计算机设备则基于样本语义分割结果与第一训练标签的差异,调整语义分割网络的参数,并继续训练,直至满足训练条件时停止训练。可以理解,在网络模型训练的过程中,通常需要经过多轮迭代训练语义分割网络。每轮迭代训练通过调整每一轮的语义分割网络的模型参数,以逐步收敛模型,从而得到最终的语义分割网络。
其中,样本语义分割结果与第一训练标签的差异可以采用损失函数来衡量,例如可以选择交叉熵损失函数等函数、平均绝对值损失函数、平滑平均绝对误差等作为损失函数。训练条件是结束网络模型训练的条件。训练停止条件可以是达到预设的迭代次数,或者是调整参数后的语义分割网络的预测性能指标达到预设指标。
本实施例中,通过对第一样本图像中目标对象对应的轮廓区域进行预测训练,并根据样本语义分割结果与第一训练标签的差异,逐步调整语义分割网络的参数。由此在参数调整过程中,经过多次特征提取和特征增强,使得语义分割网络能够有效获得具有高级语义信息和细节信息的图像语义特征,由此能够训练得到针对目标对象区域的识别准确度较高的语义分割网络,从而提高了语义分割网络对目标对象的区域的分割准确度。
在一个实施例中,实例分割结果是通过实例分割网络获得的;实例分割网络通过训练步骤训练获得,如图9所示,为一个实施例中实例分割网络的训练步骤的流程示意图,包括以下步骤:
S902,获取二维的第二样本图像和第二训练标签;第二训练标签是样本图像中针对样本目标对象的实例标注标签。
S904,将第二样本图像输入待训练的实例分割网络,通过实例分割网络,针对每个目标对象,提取第二样本图像中的样本候选兴趣区域。
S906,对样本候选兴趣区域进行卷积操作和池化操作,根据提取的样本候选兴趣区域中属于目标对象对应的样本像素点。
S908,根据样本像素点,生成目标对象对应的样本轮廓分割图,得到目标对象对应于第二样本图像的样本实例分割结果。
S910,基于样本实例分割结果与第二训练标签的差异,调整实例分割网络的参数,并继续训练,直至满足训练条件时停止训练。
其中,第二样本图像是用于训练实例分割网络模型的样本图像。实例标注标签具体可以是对第二样本图像中所标注与每一个目标对象分别对应的轮廓区域。
计算机设备获取第二样本图像后,将第二样本图像输入待训练的实例分割网络中,然后通过实例分割网络对第二样本图像进行特征提取,具体还可以进行多次卷积操作和池化操作,以提取第二样本图像对应的深层次特征,然后根据所提取的深层次特征识别第二样本图像中各个兴趣区域像素的类别,并识别出第二样本图像中每个目标对象对应的候选兴趣区域。进而针对每个目标对象,提取第二样本图像中的样本候选兴趣区域。
计算机设备进一步通过实例分割网络对样本候选兴趣区域进行卷积操作和池化操作,根据提取的样本候选兴趣区域中属于目标对象对应的样本像素点。进而根据样本像素点,生成每一个目标对象对应的样本轮廓分割图,从而得到每一个目标对象对应于第二样本图像的样本实例分割结果。
计算机设备则基于样本实例分割结果与第二训练标签的差异,调整实例分割网络的参数,并继续训练,直至满足训练条件时停止训练。其中,样本实例分割结果与第二训练标签的差异也可以采用损失函数来衡量,例如可以选择交叉熵损失函数等函数、平均绝对值损失函数、平滑平均绝对误差等作为损失函数。训练条件是结束网络模型训练的条件。训练停止条件可以是达到预设的迭代次数,或者是调整参数后的实例分割网络的预测性能指标达到预设指标。
本实施例中,通过对第二样本图像中目标对象对应的轮廓区域进行预测训练,并根据样本实例分割结果与第二训练标签的差异,逐步调整实例分割网络的参数。由此在参数调整过程中,经过多次特征提取和特征增强,使得实例分割网络能够有效获得深层次的图像特征,由此能够训练得到针对第二样本图像中每个目标对象区域的识别准确度较高的实例分割网络,从而提高了实例分割网络对目标对象的区域的分割准确度。
在一个实施例中,三维图像为三维医学影像,目标对象是三维医学影像中的医学检测对象。
其中,三维医学影像,可以是通过相应的设备从多个角度对医学检测对象进行采集,得到的三维图像信息。例如可以通过CT(Computed Tomography,电子计算机断层扫描)、MRI(Magnetic Resonance Imaging,磁共振成像)、PET(positron emission tomography,正电子发射计算机断层显像)、超声等影像设备采集三维医学影像。在采集的过程或者还可以通过调整视角获取更多角度尺度信息,由此能够直接以立体显示的形式呈现三维信息,从而能够有效获得更全面准确的医学检测对象的结构形态信息。
本实施例中的三维图像为三维医学影像,目标对象是三维医学影像中的医学检测对象。计算机设备获取三维医学影像后,首先按照不同切面对三维医学影像进行切割,得到不同切面下的二维的切面图像。然后针对每一个切面图像中的医学检测对象进行语义分割,从而得到各个切面图像中针对医学检测对象的语义分割结果。同时还针对每一个切面图像中的医学检测对象进行实例分割处理,标记出各切面图像中每一个医学检测对象对应的轮廓,得到各切面图像中医学检测对象的实例分割结果。
计算机设备进而根据医学检测对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各切面图像中医学检测对象对应的初始分割结果。然后对各切面图像对应的初始分割结果进行融合处理,从而得到三维医学影象中医学检测对象的分割结果。
在一个具体的应用场景中,三维医学影像可以是通过3D显微设备采集得到的三维细胞图像,三维医学影像中的医学检测对象可以是细胞。如图10所示,为一个实施例中三维细胞图像的示意图。
具体地,计算机设备获取所采集的三维细胞图像,首先按照不同切面对三维细胞图像进行切割,得到不同切面下的二维的切面图像,具体为两个正交切面下的切面图像,如XY切面图像和XZ切面图像。如图11所示,图11(a)和图11(b)分别为一个实施例中三维细胞图像中XY切面图像和XZ切面图像的示意图。然后针对各个切面图像进行语义分割处理,识别并标注出各个切面图像中细胞的轮廓区域,从而得到各切面图像中细胞的语义分割结果。同时还针对各个切面图像中进行实例分割处理,标记出各切面图像中每一个细胞分别对应的轮廓区域,得到各切面图像中细胞的实例分割结果。
进一步地,将同一切面图像中细胞对应的语义分割结果和实例分割结果进行比对,从而可以识别出漏检的细胞对应的区域。通过对漏检的细胞的区域进行图像形态学处理和连通区域提取后,可以得到漏检的细胞对应的分割结果。
然后将漏检的细胞对应的分割结果,与细胞的实例分割结果进行合并,从而得到各切面图像中细胞完备的实例分割结果,并将完备的实例分割结果确定为各切面图像中细胞对应的初始分割结果。各切面图像中细胞对应的初始分割结果中,还可以包括各个细胞的检测框,以及每一个细胞的轮廓区域对应的置信度分数。例如,置信度分数可以0.99,即判定该轮廓区域99%的概率是细胞。进一步地,还可以仅标注出置信度分数达到预设置信度阈值的细胞的轮廓区域。如图12所示,为一个实施例中分别为二维的XY切面图像和XZ切面图像中细胞对应的初始分割结果的示意图。
接着,得到XY切面图像和XZ切面图像中细胞完备的实例分割结果后,采用2.5D多视角融合算法获取最终的3D细胞标注结果。具体地,对XY面每一张slice的每一个实例与后面每一张切面图像的实例进行匹配,计算每个细胞在XY切面图像中的重叠率;
当重叠率达到重叠率阈值时,例如重叠率阈值可以为0.7,则判定相应的细胞区域为一个3D细胞实例,将已匹配的细胞实例从待匹配列表中删除;
当重叠率未达到重叠率阈值时,将各XY面图像与各XZ切面图像进行比对,计算XZ切面图像中XY切面图像细胞重叠区域沿Z方向,各个细胞的一致率;
当一致率达到一致率阈值时,判定相应区域的细胞属于同一个3D细胞。否则,属于同一个3D细胞。
匹配完成后,计算机设备则将各切面图像中相匹配的细胞对应的初始分割结果进行融合,生成三维细胞图像中细胞的分割结果,从而得到3D细胞图像中最终的3D细胞标注结果。进一步的,最终的3D细胞标注结果还可以采用不同色彩进行标注。例如,如图13所示,为一个实施例中三维细胞图像中细胞的分割结果的示意图。
通常而言,三维细胞图像中的细胞数量较多且较密集,因此,本实施例中,通过分别对各切面图像中的细胞进行语义分割处理和实例分割处理,能够自动化地准确识别出各切面图像中细胞对应的语义分割结果和实例分割结果,并通过对二维的切面图像对应的初始分割结果进行多视角的融合处理,从而能够获得准确度较高的三维细胞图像中细胞的分割结果,提高了三维细胞图像中细胞的分割处理效率,极大的提高了细胞的分割精准度。
应该理解的是,虽然图2、3、5、7、8、9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、3、5、7、8、9中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图14所示,提供了一种图像分割装置1400,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:图像获取模块1402、语义分割模块1404、实例分割模块1406和融合模块1408,其中:
图像获取模块1402,用于获取三维图像中不同切面下的二维的切面图像;
语义分割模块1404,用于对各切面图像中的目标对象进行语义分割;
实例分割模块1406,用于对各切面图像中的目标对象进行实例分割;
融合模块1408,用于将目标对象在同一切面图像中对应的语义分割结果和实例分割结果进行融合,分别得到各切面图像中目标对象对应的初始分割结果;对各切面图像对应的初始分割结果进行融合处理,得到三维图像中目标对象的分割结果。
在一个实施例中,语义分割模块还用于提取各切面图像对应的图像语义特征;根据各切面图像对应的图像语义特征,识别属于各切面图像中的目标对象的像素点;根据各切面图像中的目标对象的像素点,确定各切面图像中目标对象对应的轮廓,得到各切面图像中目标对象对应的语义分割结果。
在一个实施例中,语义分割模块还用于通过预先训练的语义分割网络的编码层,对各切面图像对应的特征图进行特征提取和卷积操作,得到各切面图像对应的局部多尺度特征;通过语义分割网络的空洞卷积层,对各切面图像对应的局部多尺度特征进行空洞卷积处理,得到各切面图像对应的上下文多尺度特征;通过语义分割网络的解码层,对各切面图像对应的局部多尺度特征和上下文多尺度特征进行卷积处理,将卷积处理后的特征进行连接,得到各切面图像对应的图像语义特征。
在一个实施例中,实例分割模块还用于针对每个目标对象,提取各切面图像中与目标对象对应的候选兴趣区域;分别提取各候选兴趣区域中属于目标对象的像素点;根据像素点,生成目标对象对应的轮廓分割图,得到目标对象分别对应于各切面图像的实例分割结果。
在一个实施例中,实例分割模块还用于对各切面图像进行特征提取,得到各切面图像的特征图;对各切面图像的特征图进行卷积操作,得到多个不同尺度的特征信息;根据多个不同尺度的特征信息,识别各切面图像中的兴趣区域;预测各兴趣区域的实例类别,并选取实例类别为目标对象的兴趣区域,得到各切面图像中与每个目标对象对应的候选兴趣区域。
在一个实施例中,融合模块还用于将目标对象在同一切面图像中对应的语义分割结果和实例分割结果进行比对,识别同一切面图像中的漏检的目标对象;对漏检的目标对象对应的区域进行连通域提取,得到漏检的目标对象对应的分割结果;将同一切面图像中漏检的目标对象对应的分割结果与实例分割结果进行融合,得到各切面图像中目标对象对应的初始分割结果。
在一个实施例中,上述图像分割装置1400还包括矫正模块,用于对各初始分割结果进行矫正,得到的各切面图像对应的矫正后的分割结果;融合模块还用于对各切面图像对应的矫正后的分割结果进行融合处理,得到三维图像中目标对象的分割结果。
在一个实施例中,切面图像包括第一切面图像和第二切面图像;融合模块还用于将各第一切面图像中目标对象对应的初始分割结果进行两两匹配,获得各目标对象在各第一切面图像中的重叠率;将重叠率达到重叠率阈值的目标对象,确定为相匹配的目标对象;对各切面图像中相匹配的目标对象对应的初始分割结果进行融合,生成三维图像中目标对象的分割结果。
在一个实施例中,融合模块还用于当目标对象的重叠率未达到重叠率阈值时,针对每个目标对象,确定目标对象分别在各第一切面图像和各第二切面图像中的重叠区域,并根据重叠区域确定目标对象对应的一致率;将一致率达到一致率阈值的目标对象,确定为相匹配的目标对象。
在一个实施例中,语义分割结果是通过语义分割网络获得的;语义分割网络通过训练步骤训练获得,上述图像分割装置1400还包括第一模型训练模块,用于获取二维的第一样本图像和第一训练标签;第一训练标签是第一样本图像中针对样本目标对象的语义标注标签;将第一样本图像输入待训练的语义分割网络,通过语义分割网络对第一样本图像对应的特征图进行特征提取,得到第一样本图像的图像语义特征;根据第一样本图像的图像语义特征,识别出第一样本图像中目标对象对应的轮廓,得到第一样本图像中目标对象对应的样本语义分割结果;基于样本语义分割结果与第一训练标签的差异,调整语义分割网络的参数,并继续训练,直至满足训练条件时停止训练。
在一个实施例中,实例分割结果是通过实例分割网络获得的;实例分割网络通过训练步骤训练获得,上述图像分割装置1400还包括第二模型训练模块,用于获取二维的第二样本图像和第二训练标签;第二训练标签是样本图像中针对样本目标对象的实例标注标签;将第二样本图像输入待训练的实例分割网络,通过实例分割网络,针对每个目标对象,提取第二样本图像中的样本候选兴趣区域;对样本候选兴趣区域进行卷积操作和池化操作,根据提取的样本候选兴趣区域中属于目标对象对应的样本像素点;根据样本像素点,生成目标对象对应的样本轮廓分割图,得到目标对象对应于第二样本图像的样本实例分割结果;基于样本实例分割结果与第二训练标签的差异,调整实例分割网络的参数,并继续训练,直至满足训练条件时停止训练。
在一个实施例中,三维图像为三维医学影像,目标对象是三维医学影像中的医学检测对象。
关于图像分割装置的具体限定可以参见上文中对于图像分割方法的限定,在此不再赘述。上述图像分割装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,也可以是服务器,其内部结构图可以如图15所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像分割方法。
本领域技术人员可以理解,图15中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种图像分割方法,其特征在于,所述方法包括:
获取三维图像中不同切面下的二维的切面图像;
对各所述切面图像中的目标对象进行语义分割;
对各所述切面图像中的所述目标对象进行实例分割;
根据所述目标对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各所述切面图像中所述目标对象对应的初始分割结果;
对各所述切面图像对应的所述初始分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果。
2.根据权利要求1所述的方法,其特征在于,所述对各所述切面图像中的目标对象进行语义分割,包括:
提取各所述切面图像对应的图像语义特征;
根据各所述切面图像对应的图像语义特征,识别属于各所述切面图像中的所述目标对象的像素点;
根据各所述切面图像中的所述目标对象的像素点,确定各所述切面图像中所述目标对象对应的轮廓,得到各所述切面图像中所述目标对象对应的语义分割结果。
3.根据权利要求2所述的方法,其特征在于,所述提取各所述切面图像对应的图像语义特征,包括:
通过预先训练的语义分割网络的编码层,对各所述切面图像对应的特征图进行特征提取和卷积操作,得到各所述切面图像对应的局部多尺度特征;
通过所述语义分割网络的空洞卷积层,对各所述切面图像对应的局部多尺度特征进行空洞卷积处理,得到各所述切面图像对应的上下文多尺度特征;
通过所述语义分割网络的解码层,对各所述切面图像对应的局部多尺度特征和上下文多尺度特征进行卷积处理,将卷积处理后的特征进行连接,得到各所述切面图像对应的图像语义特征。
4.根据权利要求1所述的方法,其特征在于,所述对各所述切面图像中的所述目标对象进行实例分割,包括:
针对每个目标对象,提取各所述切面图像中与所述目标对象对应的候选兴趣区域;
分别提取各所述候选兴趣区域中属于所述目标对象的像素点;
根据所述像素点,生成所述目标对象对应的轮廓分割图,得到所述目标对象分别对应于各所述切面图像的实例分割结果。
5.根据权利要求4所述的方法,其特征在于,所述针对每个目标对象,提取各所述切面图像中与所述目标对象对应的候选兴趣区域,包括:
对各所述切面图像进行特征提取,得到各所述切面图像的特征图;
对各所述切面图像的特征图进行卷积操作,得到多个不同尺度的特征信息;
根据所述多个不同尺度的特征信息,识别各所述切面图像中的兴趣区域;
预测各所述兴趣区域的实例类别,并选取实例类别为所述目标对象的兴趣区域,得到各所述切面图像中与每个所述目标对象对应的候选兴趣区域。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标对象在同一切面图像中对应的语义分割结果和实例分割结果,得到各所述切面图像中所述目标对象对应的初始分割结果,包括:
将所述目标对象在同一切面图像中对应的语义分割结果和实例分割结果进行比对,识别所述同一切面图像中的漏检的目标对象;
对所述漏检的目标对象对应的区域进行连通域提取,得到所述漏检的目标对象对应的分割结果;
将所述同一切面图像中所述漏检的目标对象对应的分割结果与所述实例分割结果进行融合,得到各所述切面图像中所述目标对象对应的初始分割结果。
7.根据权利要求1所述的方法,其特征在于,所述对各所述切面图像对应的所述初始分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果,包括:
对各所述初始分割结果进行矫正,得到的各所述切面图像对应的矫正后的分割结果;
对各所述切面图像对应的所述矫正后的分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果。
8.根据权利要求1所述的方法,其特征在于,所述切面图像包括第一切面图像和第二切面图像;所述对各所述切面图像对应的所述初始分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果,包括:
将各所述第一切面图像中所述目标对象对应的初始分割结果进行两两匹配,获得各所述目标对象在各所述第一切面图像中的重叠率;
将所述重叠率达到重叠率阈值的目标对象,确定为相匹配的目标对象;
对各所述切面图像中相匹配的目标对象对应的所述初始分割结果进行融合,生成所述三维图像中所述目标对象的分割结果。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
当所述目标对象的重叠率未达到重叠率阈值时,针对每个目标对象,确定所述目标对象分别在各所述第一切面图像和各所述第二切面图像中的重叠区域,并根据所述重叠区域确定所述目标对象对应的一致率;
将所述一致率达到一致率阈值的目标对象,确定为相匹配的目标对象。
10.根据权利要求1所述的方法,其特征在于,所述语义分割结果是通过语义分割网络获得的;所述语义分割网络通过训练步骤训练获得,所述训练步骤包括:
获取二维的第一样本图像和第一训练标签;所述第一训练标签是所述第一样本图像中针对样本目标对象的语义标注标签;
将所述第一样本图像输入待训练的语义分割网络,通过所述语义分割网络对所述第一样本图像对应的特征图进行特征提取,得到所述第一样本图像的图像语义特征;
根据所述第一样本图像的图像语义特征,识别出所述第一样本图像中所述目标对象对应的轮廓,得到所述第一样本图像中所述目标对象对应的样本语义分割结果;
基于所述样本语义分割结果与所述第一训练标签的差异,调整所述语义分割网络的参数,并继续训练,直至满足训练条件时停止训练。
11.根据权利要求1所述的方法,其特征在于,所述实例分割结果是通过实例分割网络获得的;所述实例分割网络通过训练步骤训练获得,所述训练步骤包括:
获取二维的第二样本图像和第二训练标签;所述第二训练标签是所述样本图像中针对样本目标对象的实例标注标签;
将所述第二样本图像输入待训练的实例分割网络,通过所述实例分割网络,针对每个目标对象,提取所述第二样本图像中的样本候选兴趣区域;
对所述样本候选兴趣区域进行卷积操作和池化操作,根据提取的所述样本候选兴趣区域中属于所述目标对象对应的样本像素点;
根据所述样本像素点,生成所述目标对象对应的样本轮廓分割图,得到所述目标对象对应于所述第二样本图像的样本实例分割结果;
基于所述样本实例分割结果与所述第二训练标签的差异,调整所述实例分割网络的参数,并继续训练,直至满足训练条件时停止训练。
12.根据权利要求1至11任意一项所述的方法,其特征在于,所述三维图像为三维医学影像,所述目标对象是所述三维医学影像中的医学检测对象。
13.一种图像分割装置,其特征在于,所述装置包括:
图像获取模块,用于获取三维图像中不同切面下的二维的切面图像;
语义分割模块,用于对各所述切面图像中的目标对象进行语义分割;
实例分割模块,用于对各所述切面图像中的所述目标对象进行实例分割;
融合模块,用于将所述目标对象在同一切面图像中对应的语义分割结果和实例分割结果进行融合,分别得到各所述切面图像中所述目标对象对应的初始分割结果;对各所述切面图像对应的所述初始分割结果进行融合处理,得到所述三维图像中所述目标对象的分割结果。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。
15.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
CN202011152220.8A 2020-10-26 2020-10-26 图像分割方法、装置、计算机设备和存储介质 Active CN112017189B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011152220.8A CN112017189B (zh) 2020-10-26 2020-10-26 图像分割方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011152220.8A CN112017189B (zh) 2020-10-26 2020-10-26 图像分割方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112017189A true CN112017189A (zh) 2020-12-01
CN112017189B CN112017189B (zh) 2021-02-02

Family

ID=73527680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011152220.8A Active CN112017189B (zh) 2020-10-26 2020-10-26 图像分割方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112017189B (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112489060A (zh) * 2020-12-07 2021-03-12 北京医准智能科技有限公司 一种用于肺炎病灶分割的系统及方法
CN112669300A (zh) * 2020-12-31 2021-04-16 上海智臻智能网络科技股份有限公司 瑕疵检测方法及装置、计算机设备和存储介质
CN112734749A (zh) * 2021-01-11 2021-04-30 四川大学华西医院 一种基于卷积神经网络模型的声带白斑辅助诊断系统
CN112884787A (zh) * 2021-01-28 2021-06-01 北京有竹居网络技术有限公司 图像剪裁方法、装置、可读介质及电子设备
CN112950642A (zh) * 2021-02-25 2021-06-11 中国工商银行股份有限公司 点云实例分割模型的训练方法、装置、电子设备和介质
CN113192072A (zh) * 2021-04-01 2021-07-30 北京达佳互联信息技术有限公司 图像分割方法、装置、设备及存储介质
CN113255760A (zh) * 2021-05-20 2021-08-13 推想医疗科技股份有限公司 训练图像处理模型的方法、图像处理的方法及装置
CN113269062A (zh) * 2021-05-14 2021-08-17 彭皓 应用于智慧教育的人工智能异常识别方法
CN113344946A (zh) * 2021-05-31 2021-09-03 北京邮电大学 基于机器学习的安检图像违禁品检测方法、装置及介质
CN113822314A (zh) * 2021-06-10 2021-12-21 腾讯云计算(北京)有限责任公司 图像数据处理方法、装置、设备以及介质
CN113920128A (zh) * 2021-09-01 2022-01-11 北京长木谷医疗科技有限公司 膝关节股骨胫骨分割方法和装置
CN113920314A (zh) * 2021-09-30 2022-01-11 北京百度网讯科技有限公司 语义分割、模型训练方法,装置,设备以及存储介质
CN113947771A (zh) * 2021-10-15 2022-01-18 北京百度网讯科技有限公司 图像识别方法、装置、设备、存储介质以及程序产品
CN114494610A (zh) * 2022-04-14 2022-05-13 清华大学 大场景光场实时重建智能理解系统与装置
CN114627086A (zh) * 2022-03-18 2022-06-14 江苏省特种设备安全监督检验研究院 一种基于改进特征金字塔网络的起重机表面损伤检测方法
WO2022142450A1 (zh) * 2020-12-28 2022-07-07 北京达佳互联信息技术有限公司 用于图像分割模型训练和图像分割的方法及装置
CN114998706A (zh) * 2022-07-18 2022-09-02 中国电子科技集团公司第二十八研究所 一种基于强化学习决策区域细划分的图像目标检测方法
CN115359325A (zh) * 2022-10-19 2022-11-18 腾讯科技(深圳)有限公司 图像识别模型的训练方法、装置、设备和介质
AU2021240229B1 (en) * 2021-09-21 2023-02-02 Sensetime International Pte. Ltd. Stacked object recognition method, apparatus and device, and computer storage medium
WO2023047167A1 (en) * 2021-09-21 2023-03-30 Sensetime International Pte. Ltd. Stacked object recognition method, apparatus and device, and computer storage medium
CN116029951A (zh) * 2022-05-27 2023-04-28 荣耀终端有限公司 图像处理方法与电子设备
CN117011413A (zh) * 2023-09-28 2023-11-07 腾讯科技(深圳)有限公司 道路图像重建方法、装置、计算机设备和存储介质
CN117173405A (zh) * 2023-03-23 2023-12-05 荣耀终端有限公司 图像处理方法和电子设备
CN117197757A (zh) * 2023-11-07 2023-12-08 华雁智能科技(集团)股份有限公司 变电站禁区闯入监测方法、系统及电子设备
WO2024016812A1 (zh) * 2022-07-19 2024-01-25 腾讯科技(深圳)有限公司 显微图像的处理方法、装置、计算机设备及存储介质
CN116029951B (zh) * 2022-05-27 2024-06-07 荣耀终端有限公司 图像处理方法与电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016176863A1 (zh) * 2015-05-07 2016-11-10 深圳迈瑞生物医疗电子股份有限公司 三维超声成像方法和装置
CN109598728A (zh) * 2018-11-30 2019-04-09 腾讯科技(深圳)有限公司 图像分割方法、装置、诊断系统及存储介质
CN110176005A (zh) * 2019-05-16 2019-08-27 西安电子科技大学 基于归一化指数和多尺度模型的遥感图像分割方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016176863A1 (zh) * 2015-05-07 2016-11-10 深圳迈瑞生物医疗电子股份有限公司 三维超声成像方法和装置
CN109598728A (zh) * 2018-11-30 2019-04-09 腾讯科技(深圳)有限公司 图像分割方法、装置、诊断系统及存储介质
CN110176005A (zh) * 2019-05-16 2019-08-27 西安电子科技大学 基于归一化指数和多尺度模型的遥感图像分割方法

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112489060A (zh) * 2020-12-07 2021-03-12 北京医准智能科技有限公司 一种用于肺炎病灶分割的系统及方法
WO2022142450A1 (zh) * 2020-12-28 2022-07-07 北京达佳互联信息技术有限公司 用于图像分割模型训练和图像分割的方法及装置
CN112669300A (zh) * 2020-12-31 2021-04-16 上海智臻智能网络科技股份有限公司 瑕疵检测方法及装置、计算机设备和存储介质
CN112734749A (zh) * 2021-01-11 2021-04-30 四川大学华西医院 一种基于卷积神经网络模型的声带白斑辅助诊断系统
CN112884787A (zh) * 2021-01-28 2021-06-01 北京有竹居网络技术有限公司 图像剪裁方法、装置、可读介质及电子设备
CN112884787B (zh) * 2021-01-28 2023-09-15 北京有竹居网络技术有限公司 图像剪裁方法、装置、可读介质及电子设备
CN112950642A (zh) * 2021-02-25 2021-06-11 中国工商银行股份有限公司 点云实例分割模型的训练方法、装置、电子设备和介质
CN113192072A (zh) * 2021-04-01 2021-07-30 北京达佳互联信息技术有限公司 图像分割方法、装置、设备及存储介质
CN113192072B (zh) * 2021-04-01 2023-11-24 北京达佳互联信息技术有限公司 图像分割方法、装置、设备及存储介质
CN113269062A (zh) * 2021-05-14 2021-08-17 彭皓 应用于智慧教育的人工智能异常识别方法
CN113269062B (zh) * 2021-05-14 2021-11-26 食安快线信息技术(深圳)有限公司 应用于智慧教育的人工智能异常识别方法
CN113255760A (zh) * 2021-05-20 2021-08-13 推想医疗科技股份有限公司 训练图像处理模型的方法、图像处理的方法及装置
CN113344946A (zh) * 2021-05-31 2021-09-03 北京邮电大学 基于机器学习的安检图像违禁品检测方法、装置及介质
CN113822314A (zh) * 2021-06-10 2021-12-21 腾讯云计算(北京)有限责任公司 图像数据处理方法、装置、设备以及介质
CN113822314B (zh) * 2021-06-10 2024-05-28 腾讯云计算(北京)有限责任公司 图像数据处理方法、装置、设备以及介质
CN113920128B (zh) * 2021-09-01 2023-02-21 北京长木谷医疗科技有限公司 膝关节股骨胫骨分割方法和装置
CN113920128A (zh) * 2021-09-01 2022-01-11 北京长木谷医疗科技有限公司 膝关节股骨胫骨分割方法和装置
AU2021240229B1 (en) * 2021-09-21 2023-02-02 Sensetime International Pte. Ltd. Stacked object recognition method, apparatus and device, and computer storage medium
WO2023047167A1 (en) * 2021-09-21 2023-03-30 Sensetime International Pte. Ltd. Stacked object recognition method, apparatus and device, and computer storage medium
CN113920314A (zh) * 2021-09-30 2022-01-11 北京百度网讯科技有限公司 语义分割、模型训练方法,装置,设备以及存储介质
CN113947771B (zh) * 2021-10-15 2023-06-27 北京百度网讯科技有限公司 图像识别方法、装置、设备、存储介质以及程序产品
CN113947771A (zh) * 2021-10-15 2022-01-18 北京百度网讯科技有限公司 图像识别方法、装置、设备、存储介质以及程序产品
CN114627086A (zh) * 2022-03-18 2022-06-14 江苏省特种设备安全监督检验研究院 一种基于改进特征金字塔网络的起重机表面损伤检测方法
CN114494610B (zh) * 2022-04-14 2022-08-02 清华大学 大场景光场实时重建智能理解系统与装置
CN114494610A (zh) * 2022-04-14 2022-05-13 清华大学 大场景光场实时重建智能理解系统与装置
CN116029951B (zh) * 2022-05-27 2024-06-07 荣耀终端有限公司 图像处理方法与电子设备
CN116029951A (zh) * 2022-05-27 2023-04-28 荣耀终端有限公司 图像处理方法与电子设备
CN114998706A (zh) * 2022-07-18 2022-09-02 中国电子科技集团公司第二十八研究所 一种基于强化学习决策区域细划分的图像目标检测方法
WO2024016812A1 (zh) * 2022-07-19 2024-01-25 腾讯科技(深圳)有限公司 显微图像的处理方法、装置、计算机设备及存储介质
CN115359325B (zh) * 2022-10-19 2023-01-10 腾讯科技(深圳)有限公司 图像识别模型的训练方法、装置、设备和介质
CN115359325A (zh) * 2022-10-19 2022-11-18 腾讯科技(深圳)有限公司 图像识别模型的训练方法、装置、设备和介质
CN117173405A (zh) * 2023-03-23 2023-12-05 荣耀终端有限公司 图像处理方法和电子设备
CN117011413A (zh) * 2023-09-28 2023-11-07 腾讯科技(深圳)有限公司 道路图像重建方法、装置、计算机设备和存储介质
CN117011413B (zh) * 2023-09-28 2024-01-09 腾讯科技(深圳)有限公司 道路图像重建方法、装置、计算机设备和存储介质
CN117197757A (zh) * 2023-11-07 2023-12-08 华雁智能科技(集团)股份有限公司 变电站禁区闯入监测方法、系统及电子设备
CN117197757B (zh) * 2023-11-07 2024-01-23 华雁智能科技(集团)股份有限公司 变电站禁区闯入监测方法、系统及电子设备

Also Published As

Publication number Publication date
CN112017189B (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN112017189B (zh) 图像分割方法、装置、计算机设备和存储介质
CN111311578B (zh) 基于人工智能的对象分类方法以及装置、医学影像设备
CN110490212B (zh) 钼靶影像处理设备、方法和装置
Smolyanskiy et al. On the importance of stereo for accurate depth estimation: An efficient semi-supervised deep neural network approach
WO2020215985A1 (zh) 医学影像分割方法、装置、电子设备和存储介质
CN111047548B (zh) 姿态变换数据处理方法、装置、计算机设备和存储介质
EP3989119A1 (en) Detection model training method and apparatus, computer device, and storage medium
WO2022001623A1 (zh) 基于人工智能的图像处理方法、装置、设备及存储介质
CN111241989A (zh) 图像识别方法及装置、电子设备
CN111369581A (zh) 图像处理方法、装置、设备及存储介质
CN111667459B (zh) 一种基于3d可变卷积和时序特征融合的医学征象检测方法、系统、终端及存储介质
CN111681273A (zh) 图像分割方法、装置、电子设备及可读存储介质
CN112668573B (zh) 目标检测定位置信度确定方法、装置、电子设备及存储介质
Ji et al. SurfaceNet+: An end-to-end 3D neural network for very sparse multi-view stereopsis
WO2021164280A1 (zh) 三维边缘检测方法、装置、存储介质和计算机设备
CN112132827A (zh) 病理图像的处理方法、装置、电子设备及可读存储介质
CN113065551A (zh) 利用深度神经网络模型执行图像分割的方法
CN112508989A (zh) 一种图像处理方法、装置、服务器以及介质
CN114972016A (zh) 图像处理方法、装置、计算机设备、存储介质及程序产品
CN114332473A (zh) 目标检测方法、装置、计算机设备、存储介质及程序产品
CN117315210A (zh) 一种基于立体成像的图像虚化方法及相关装置
CN113704276A (zh) 地图更新方法、装置、电子设备及计算机可读存储介质
CN113537187A (zh) 文本识别方法、装置、电子设备及可读存储介质
CN116403062A (zh) 一种点云目标检测方法、系统、设备及介质
CN113514053B (zh) 生成样本图像对的方法、装置和更新高精地图的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40034948

Country of ref document: HK