CN113470048A - 场景分割方法、装置、设备及计算机可读存储介质 - Google Patents

场景分割方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113470048A
CN113470048A CN202110763842.2A CN202110763842A CN113470048A CN 113470048 A CN113470048 A CN 113470048A CN 202110763842 A CN202110763842 A CN 202110763842A CN 113470048 A CN113470048 A CN 113470048A
Authority
CN
China
Prior art keywords
scene
target image
feature
segmentation
enhanced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110763842.2A
Other languages
English (en)
Other versions
CN113470048B (zh
Inventor
张番栋
俞益洲
李一鸣
乔昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shenrui Bolian Technology Co Ltd
Shenzhen Deepwise Bolian Technology Co Ltd
Original Assignee
Beijing Shenrui Bolian Technology Co Ltd
Shenzhen Deepwise Bolian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shenrui Bolian Technology Co Ltd, Shenzhen Deepwise Bolian Technology Co Ltd filed Critical Beijing Shenrui Bolian Technology Co Ltd
Priority to CN202110763842.2A priority Critical patent/CN113470048B/zh
Publication of CN113470048A publication Critical patent/CN113470048A/zh
Application granted granted Critical
Publication of CN113470048B publication Critical patent/CN113470048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种场景分割方法,该方法包括:当获取到待分割的目标图像后,生成该目标图像的第一强化场景特征,其中,该第一强化场景特征中携带了目标图像中的各个图像类别之间的关联关系,然后,根据目标图像的第一强化场景特征,对目标图像进行场景分割。可见,本申请在对目标图像进行场景分割时,考虑了目标图像中各个类别之间的关联关系,因此,可以有效提升场景分割结果的准确性。本申请还提供了一种场景分割装置、设备及计算机可读存储介质。

Description

场景分割方法、装置、设备及计算机可读存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种场景分割方法、装置、设备及计算机可读存储介质。
背景技术
场景分割,是指将图像中的物体都分割识别出来,但在自然图像中,其图像场景中往往包含多种物体,因此,想要实现准确的场景分割,将具有非常高的挑战性。
在现有的一种场景分割技术中,设计了一种基于上下文先验的场景分割深度学习网络,通过该深度学习网络对场景图像提取深度特征,然后,通过预先设计的上下文先验模块,将提取的深度特征进行变换,得到上下文先验图,最后,将两者结合起来,得到场景分割结果。但是,采用该现有技术进行场景分割容易出现一些低级的常识性的分割错误,使得场景分割结果不够准确。
发明内容
本申请提供了一种场景分割方法、装置、设备及计算机可读存储介质,能够提升场景分割结果的准确性。
第一方面,本申请提供了一种场景分割方法,包括:
获取待分割的目标图像;
生成所述目标图像的第一强化场景特征,其中,所述第一强化场景特征中携带了所述目标图像中的各个图像类别之间的关联关系;
根据所述目标图像的第一强化场景特征,对所述目标图像进行场景分割。
可选的,所述生成所述目标图像的第一强化场景特征,包括:
对所述目标图像进行特征提取,得到所述目标图像的第一初始场景特征;
根据所述第一初始场景特征对所述目标图像进行场景分割,得到初始分割结果;
基于预先定义的图像类别关联关系、以及所述初始分割结果,生成所述目标图像的第一强化场景特征。
可选的,所述对所述目标图像进行特征提取,包括:
采用下采样和上采样相结合的网络结构,对所述目标图像进行特征提取。
可选的,所述第一初始场景特征包括特征分辨率不同的细节特征和语义特征。
可选的,所述初始分割结果包括至少一个分割位置,每个分割位置对应至少一种预测类别、且每个分割位置对应的各个预测类别的概率之和为1。
可选的,所述基于预先定义的图像类别关联关系、以及所述初始分割结果,生成所述目标图像的第一强化场景特征,包括:
根据预先定义的图像类别关联关系、所述目标图像中的每一分割位置对应的各个预测类别、以及所述初始场景特征中的属于每一分割位置的场景特征和/或每一分割位置的周边场景的场景特征,生成所述目标图像的第一强化场景特征。
可选的,所述根据所述目标图像的第一强化场景特征,对所述目标图像进行场景分割,包括:
根据所述目标图像的第一初始场景特征和第一强化场景特征,对所述目标图像进行场景分割。
可选的,所述根据所述目标图像的第一初始场景特征和第一强化场景特征,对所述目标图像进行场景分割,包括:
将所述目标图像的第一初始场景特征和第一强化场景特征的特征分辨率进行统一化处理,得到所述目标图像的第二初始场景特征和第二强化场景特征;
根据所述目标图像的第二初始场景特征和第二强化场景特征,对所述目标图像进行场景分割。
第二方面,本申请提供了一种场景分割装置,包括:
目标图像获取单元,用于获取待分割的目标图像;
强化特征生成单元,用于生成所述目标图像的第一强化场景特征,其中,所述第一强化场景特征中携带了所述目标图像中的各个图像类别之间的关联关系;
目标场景分割单元,用于根据所述目标图像的第一强化场景特征,对所述目标图像进行场景分割。
可选的,所述强化特征生成单元,包括:
特征提取子单元,用于对所述目标图像进行特征提取,得到所述目标图像的第一初始场景特征;
场景分割子单元,用于根据所述第一初始场景特征对所述目标图像进行场景分割,得到初始分割结果;
特征生成子单元,用于基于预先定义的图像类别关联关系、以及所述初始分割结果,生成所述目标图像的第一强化场景特征。
可选的,所述特征提取子单元,具体用于:
采用下采样和上采样相结合的网络结构,对所述目标图像进行特征提取,得到所述目标图像的第一初始场景特征。
可选的,所述第一初始场景特征包括特征分辨率不同的细节特征和语义特征。
可选的,所述初始分割结果包括至少一个分割位置,每个分割位置对应至少一种预测类别、且每个分割位置对应的各个预测类别的概率之和为1。
可选的,所述特征生成子单元,具体用于:
根据预先定义的图像类别关联关系、所述目标图像中的每一分割位置对应的各个预测类别、以及所述初始场景特征中的属于每一分割位置的场景特征和/或每一分割位置的周边场景的场景特征,生成所述目标图像的第一强化场景特征。
可选的,所述目标场景分割单元,包括:
场景分割子单元,用于根据所述目标图像的第一初始场景特征和第一强化场景特征,对所述目标图像进行场景分割。
可选的,所述场景分割子单元,具体用于:
将所述目标图像的第一初始场景特征和第一强化场景特征的特征分辨率进行统一化处理,得到所述目标图像的第二初始场景特征和第二强化场景特征;
根据所述目标图像的第二初始场景特征和第二强化场景特征,对所述目标图像进行场景分割。
第三方面,本申请提供了一种电子设备,包括:处理器、存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于通过调用所述计算机程序,执行上述场景分割方法。
第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述场景分割方法。
在以上本申请提供的技术方案中,当获取到待分割的目标图像后,生成该目标图像的第一强化场景特征,其中,该第一强化场景特征中携带了目标图像中的各个图像类别之间的关联关系,然后,根据目标图像的第一强化场景特征,对目标图像进行场景分割。可见,本申请在对目标图像进行场景分割时,考虑了目标图像中各个类别之间的关联关系,因此,可以有效提升场景分割结果的准确性。
附图说明
图1为本申请示出的一种场景分割方法的流程示意图;
图2为本申请示出的生成强化场景特征的流程示意图
图3为本申请示出的场景分割模型的组成示意图;
图4为本申请示出的一种场景分割装置的组成示意图;
图5为本申请示出的一种电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
需要说明的是,场景分割的难点在于,当场景中包含多种物体时,很难将它们一一分割识别出来,但实际上,物体类别之间有着明显的相互依赖,然而,现有的场景分割技术没有考虑到类别之间的关联关系(比如车辆基本都位于道路上或者停车场、路边的障碍物有对应的限制类别等),这样很容易出现一些违背常识的分类结果,使得场景分割结果不够准确。
为此,本申请实施例提供了一种场景分割方法,该方法考虑了场景中类别之间的关联关系,从而提升了场景分割结果的准确性,即,相比于现有技术,能够更准确的将图像中的物体分割识别出来。
参见图1,为本申请实施例提供的一种场景分割方法的流程示意图,该方法包括以下步骤:
S101:获取待分割的目标图像。
在本申请实施例中,将每一幅需要进行场景分割的图像定义为目标图像。本申请实施例不对目标图像的来源进行限定,比如,目标图像是马路上的摄像头拍摄的图像。
S102:生成目标图像的第一强化场景特征,其中,第一强化场景特征中携带了目标图像中的各个图像类别之间的关联关系。
在本申请实施例中,需要对目标图像进行特征提取,在提取到的场景特征中,使其不但包括目标图像的各个局部场景的场景特征(包括形状、位置等特征),还可以包括目标图像中的各个图像类别之间的关联关系,比如,其关联关系可能体现为车辆与道路、停车场之间的强相关关系、道路与路牌之间的强相关关系等。为便于区分,这里,将生成的携带有目标图像的图像类别关联关系的场景特征,定义为目标图像的第一强化场景特征。
在本申请实施例中,S102中的“生成目标图像的第一强化场景特征”,可以包括以下步骤S1021-S1023,参见图2所示的生成强化场景特征的流程示意图:
S1021:对目标图像进行特征提取,得到目标图像的第一初始场景特征。
在本申请实施例中,可以预先训练一个图像分割模型,如图3所示的场景分割模型的组成示意图,该图像分割模型可以包括预分割模块、推理关联模块和分割输出模块,这三个模块串行相连,在训练阶段,可以进行端到端的训练。
可以采用该图像分割模型中的预分割模块,对目标图像进行初步的特征提取,为便于区分,将提取的特征定义为目标图像的第一初始场景特征。其中,预分割模块所采用的网络可以是深度卷积网络,需要说明的是,本申请实施例不对预分割模块的网络结构进行限定。
在本申请实施例的一种实现方式中,当采用步骤S1021对目标图像进行特征提取时,可以包括:采用下采样和上采样相结合的网络结构,对目标图像进行特征提取。在本实现方式中,当利用图3所示的预分割模块对目标图像进行初步的特征提取时,该预分割模块可以采用下采样-上采样结合的网络结构,该下采样-上采样结合的网络结构,包括但限于U型网络、Deeplab系列网络、V型网络、特征金字塔网络(Feature Pyramid Network)等中的至少一种。
在本申请实施例的一种实现方式中,当对目标图像进行初步的特征提取,得到第一初始场景特征后,该第一初始场景特征可以包括特征分辨率不同的细节特征和语义特征。具体来讲,第一初始场景特征可以是一组场景特征,特征分辨率从高到低,包括低级别(低分辨率)的细节特征、高级别(高分辨率)的语义特征,等等;其中,低分辨率的特征可以作为生成更高一级分辨率特征的输入,也就是说,可以先提取目标图像的原始特征分辨率的场景特征,该原始特征分辨率的分辨率最低,为便于描述,将该原始特征分辨率的级别定义为第一级别,然后,基于第一级别的场景特征生成第二级别(第二级别高于第一级别)的场景特征,再基于第二级别的场景特征生成第三级别(第三级别高于第二级别)的场景特征……,以此类推,生成第N级别(第N级别高于第N-1级别,N≥2)的场景特征。
S1022:根据第一初始场景特征对目标图像进行场景分割,得到初始分割结果。
在本申请实施例中,可以采用图3所示的推理关联模块,基于第一初始场景特征,对目标图像进行预分割,即,对目标图像进行初步的场景分割,这里,将经此场景分割得到的分割结果定义为初始分割结果。
其中,初始分割结果可以包括至少一个分割位置,每个分割位置对应至少一种预测类别、且每个分割位置对应的各个预测类别的概率之和为1。具体来讲,当对目标图像进行预分割时,可以从中分割出多个物体位置,每个位置中的物体可能会有多种预测类别,对于每一位置来讲,该位置的各个预测类别的概率之和为1。
S1023:基于预先定义的图像类别关联关系、以及初始分割结果,生成目标图像的第一强化场景特征。
在本申请实施例中,可以采用图3所示的推理关联模块,显式地建模目标图像中的各图像类别之间的逻辑关系,用于强化目标图像中的场景特征,从而生成目标图像的第一强化场景特征。
在本申请实施例的一种实现方式中,S1023中的“基于预先定义的图像类别关联关系、以及初始分割结果,生成目标图像的第一强化场景特征”,可以包括:根据预先定义的图像类别关联关系、目标图像中的每一分割位置对应的各个预测类别、以及初始场景特征中的属于每一分割位置的场景特征和/或每一分割位置的周边场景的场景特征,生成目标图像的第一强化场景特征。
在本实现方式中,可以预先定义类别关联关系,本申请实施例不对该类别关联关系的定义方式进行限定,可以通过经验进行预先定义,也可以基于标注数据进行统计分析来预先定义。基于此,当对目标图像进行预分割得到初始分割结果后,对于该初始分割结果中的每一个分割位置,可以基于预先定义好的类别关联关系以及该分割位置对应的各个预测类别,来利用该分割位置的初始场景特征、和/或其周边邻域的场景特征,做加权图卷积操作,从而得到该分割位置的强化场景特征,这样,可以得到每一分割位置的强化场景特征,这些强化特征的集合即为第一强化场景特征。
可见,通过上述方式,本申请实施例实现了多分辨率的特征类别关联强化。
S103:根据目标图像的第一强化场景特征,对目标图像进行场景分割。
在本申请实施例中,可以采用图3所示的分割输出模块,来根据目标图像的第一强化场景特征,对目标图像进行场景分割。
在本申请实施例中,S103中的“根据目标图像的第一强化场景特征,对目标图像进行场景分割”,可以包括:根据目标图像的第一初始场景特征和第一强化场景特征,对目标图像进行场景分割。也就是说,当得到上述不同分辨率下的第一初始场景特征和第一强化场景特征之后,可以基于这些不同分辨率下的场景特征对目标图像进行场景分割。
在本申请实施例的一种实现方式中,当根据所述目标图像的第一初始场景特征和第一强化场景特征,对所述目标图像进行场景分割时,具体可以包括:将目标图像的第一初始场景特征和第一强化场景特征的特征分辨率进行统一化处理,得到目标图像的第二初始场景特征和第二强化场景特征;根据目标图像的第二初始场景特征和第二强化场景特征,对目标图像进行场景分割。
在本实现方式中,可以将上述不同分辨率下的第一初始场景特征和第一强化场景特征,分别基于上采样或反卷积统一到目标图像的原始分辨率下,得到具有相同分辨率的第二初始场景特征和第二强化场景特征;其中,第二初始场景特征是基于第一初始场景特征得到,二者的特征数量相同,第二强化场景特征是基于第一强化场景特征得到,二者的特征数量相同。然后,可以将第二初始场景特征和第二强化场景特征,利用一系列卷积操作融合在一起,得到场景分割特征;最后,将得到的场景分割特征输入给分类器,由分类器基于该场景分割特征实现对目标图像的场景分割,从而得到场景分割结果。
在上述提供的场景分割方法中,当获取到待分割的目标图像后,生成该目标图像的第一强化场景特征,其中,该第一强化场景特征中携带了目标图像中的各个图像类别之间的关联关系,然后,根据目标图像的第一强化场景特征,对目标图像进行场景分割。可见,本申请实施例在对目标图像进行场景分割时,考虑了目标图像中各个类别之间的关联关系,因此,可以有效提升场景分割结果的准确性。
参见图4,为本申请实施例提供的一种场景分割装置的组成示意图,该装置包括:
目标图像获取单元410,用于获取待分割的目标图像;
强化特征生成单元420,用于生成所述目标图像的第一强化场景特征,其中,所述第一强化场景特征中携带了所述目标图像中的各个图像类别之间的关联关系;
目标场景分割单元430,用于根据所述目标图像的第一强化场景特征,对所述目标图像进行场景分割。
在本申请实施例的一种实现方式中,强化特征生成单元420,包括:
特征提取子单元,用于对所述目标图像进行特征提取,得到所述目标图像的第一初始场景特征;
场景分割子单元,用于根据所述第一初始场景特征对所述目标图像进行场景分割,得到初始分割结果;
特征生成子单元,用于基于预先定义的图像类别关联关系、以及所述初始分割结果,生成所述目标图像的第一强化场景特征。
在本申请实施例的一种实现方式中,所述特征提取子单元,具体用于:
采用下采样和上采样相结合的网络结构,对所述目标图像进行特征提取,得到所述目标图像的第一初始场景特征。
在本申请实施例的一种实现方式中,所述第一初始场景特征包括特征分辨率不同的细节特征和语义特征。
在本申请实施例的一种实现方式中,所述初始分割结果包括至少一个分割位置,每个分割位置对应至少一种预测类别、且每个分割位置对应的各个预测类别的概率之和为1。
在本申请实施例的一种实现方式中,所述特征生成子单元,具体用于:
根据预先定义的图像类别关联关系、所述目标图像中的每一分割位置对应的各个预测类别、以及所述初始场景特征中的属于每一分割位置的场景特征和/或每一分割位置的周边场景的场景特征,生成所述目标图像的第一强化场景特征。
在本申请实施例的一种实现方式中,所述目标场景分割单元430,包括:
场景分割子单元,用于根据所述目标图像的第一初始场景特征和第一强化场景特征,对所述目标图像进行场景分割。
在本申请实施例的一种实现方式中,所述场景分割子单元,具体用于:
将所述目标图像的第一初始场景特征和第一强化场景特征的特征分辨率进行统一化处理,得到所述目标图像的第二初始场景特征和第二强化场景特征;
根据所述目标图像的第二初始场景特征和第二强化场景特征,对所述目标图像进行场景分割。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请实施例还提供了一种电子设备,该电子设备的结构示意图如图5所示,该电子设备5000包括至少一个处理器5001、存储器5002和总线5003,至少一个处理器5001均与存储器5002电连接;存储器5002被配置用于存储有至少一个计算机可执行指令,处理器5001被配置用于执行该至少一个计算机可执行指令,从而执行如本申请中任意一个实施例或任意一种可选实施方式提供的任意一种场景分割方法的步骤。
进一步,处理器5001可以是FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其它具有逻辑处理能力的器件,如MCU(Microcontroller Unit,微控制单元)、CPU(Central Process Unit,中央处理器)。
应用本申请实施例,在对目标图像进行场景分割时,考虑了目标图像中各个类别之间的关联关系,因此,可以有效提升场景分割结果的准确性。
本申请实施例还提供了另一种计算机可读存储介质,存储有计算机程序,该计算机程序用于被处理器执行时实现本申请中任意一个实施例或任意一种可选实施方式提供的任意一种场景分割方法的步骤。
本申请实施例提供的计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(RandomAccess Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
应用本申请实施例,在对目标图像进行场景分割时,考虑了目标图像中各个类别之间的关联关系,因此,可以有效提升场景分割结果的准确性。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (11)

1.一种场景分割方法,其特征在于,包括:
获取待分割的目标图像;
生成所述目标图像的第一强化场景特征,其中,所述第一强化场景特征中携带了所述目标图像中的各个图像类别之间的关联关系;
根据所述目标图像的第一强化场景特征,对所述目标图像进行场景分割。
2.根据权利要求1所述的方法,其特征在于,所述生成所述目标图像的第一强化场景特征,包括:
对所述目标图像进行特征提取,得到所述目标图像的第一初始场景特征;
根据所述第一初始场景特征对所述目标图像进行场景分割,得到初始分割结果;
基于预先定义的图像类别关联关系、以及所述初始分割结果,生成所述目标图像的第一强化场景特征。
3.根据权利要求2所述的方法,其特征在于,所述对所述目标图像进行特征提取,包括:
采用下采样和上采样相结合的网络结构,对所述目标图像进行特征提取。
4.根据权利要求2所述的方法,其特征在于,所述第一初始场景特征包括特征分辨率不同的细节特征和语义特征。
5.根据权利要求2所述的方法,其特征在于,所述初始分割结果包括至少一个分割位置,每个分割位置对应至少一种预测类别、且每个分割位置对应的各个预测类别的概率之和为1。
6.根据权利要求5所述的方法,其特征在于,所述基于预先定义的图像类别关联关系、以及所述初始分割结果,生成所述目标图像的第一强化场景特征,包括:
根据预先定义的图像类别关联关系、所述目标图像中的每一分割位置对应的各个预测类别、以及所述初始场景特征中的属于每一分割位置的场景特征和/或每一分割位置的周边场景的场景特征,生成所述目标图像的第一强化场景特征。
7.根据权利要求2-6任一项所述的方法,其特征在于,所述根据所述目标图像的第一强化场景特征,对所述目标图像进行场景分割,包括:
根据所述目标图像的第一初始场景特征和第一强化场景特征,对所述目标图像进行场景分割。
8.根据权利要求7所述的方法,其特征在于,所述根据所述目标图像的第一初始场景特征和第一强化场景特征,对所述目标图像进行场景分割,包括:
将所述目标图像的第一初始场景特征和第一强化场景特征的特征分辨率进行统一化处理,得到所述目标图像的第二初始场景特征和第二强化场景特征;
根据所述目标图像的第二初始场景特征和第二强化场景特征,对所述目标图像进行场景分割。
9.一种场景分割装置,其特征在于,包括:
目标图像获取单元,用于获取待分割的目标图像;
强化特征生成单元,用于生成所述目标图像的第一强化场景特征,其中,所述第一强化场景特征中携带了所述目标图像中的各个图像类别之间的关联关系;
目标场景分割单元,用于根据所述目标图像的第一强化场景特征,对所述目标图像进行场景分割。
10.一种电子设备,其特征在于,包括:处理器、存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于通过调用所述计算机程序,执行如权利要求1-8中任一项所述的场景分割方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-8任一项所述的场景分割方法。
CN202110763842.2A 2021-07-06 2021-07-06 场景分割方法、装置、设备及计算机可读存储介质 Active CN113470048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110763842.2A CN113470048B (zh) 2021-07-06 2021-07-06 场景分割方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110763842.2A CN113470048B (zh) 2021-07-06 2021-07-06 场景分割方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113470048A true CN113470048A (zh) 2021-10-01
CN113470048B CN113470048B (zh) 2023-04-25

Family

ID=77878820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110763842.2A Active CN113470048B (zh) 2021-07-06 2021-07-06 场景分割方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113470048B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114419070A (zh) * 2022-01-21 2022-04-29 北京字跳网络技术有限公司 一种图像场景分割方法、装置、设备及存储介质

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229478A (zh) * 2017-06-30 2018-06-29 深圳市商汤科技有限公司 图像语义分割及训练方法和装置、电子设备、存储介质和程序
CN108269266A (zh) * 2016-12-30 2018-07-10 达索系统公司 使用马尔可夫随机场优化来产生分割图像
CN108492301A (zh) * 2018-03-21 2018-09-04 广东欧珀移动通信有限公司 一种场景分割方法、终端及存储介质
CN108648233A (zh) * 2018-03-24 2018-10-12 北京工业大学 一种基于深度学习的目标识别与抓取定位方法
CN109086768A (zh) * 2018-07-13 2018-12-25 南京邮电大学 卷积神经网络的语义图像分割方法
CN109636049A (zh) * 2018-12-19 2019-04-16 浙江工业大学 一种结合道路网络拓扑结构与语义关联的拥堵指数预测方法
CN110097026A (zh) * 2019-05-13 2019-08-06 北京邮电大学 一种基于多维要素视频分割的段落关联规则评判方法
CN110110617A (zh) * 2019-04-22 2019-08-09 腾讯科技(深圳)有限公司 医学影像分割方法、装置、电子设备和存储介质
CN110322453A (zh) * 2019-07-05 2019-10-11 西安电子科技大学 基于位置注意力和辅助网络的3d点云语义分割方法
CN110533048A (zh) * 2018-05-23 2019-12-03 上海交通大学 基于全景区域场景感知的组合语义层次连接模型的实现方法及系统
CN110706239A (zh) * 2019-09-26 2020-01-17 哈尔滨工程大学 融合全卷积神经网络与改进aspp模块的场景分割方法
CN110991414A (zh) * 2019-12-21 2020-04-10 武汉中海庭数据技术有限公司 一种交通要素高精度分割方法、电子设备及存储介质
CN111178181A (zh) * 2019-12-16 2020-05-19 深圳市华尊科技股份有限公司 交通场景分割方法及相关装置
CN111798460A (zh) * 2020-06-17 2020-10-20 南京信息工程大学 一种卫星图像分割方法
CN112330685A (zh) * 2020-12-28 2021-02-05 北京达佳互联信息技术有限公司 图像分割模型训练、图像分割方法、装置及电子设备
CN112487927A (zh) * 2020-11-26 2021-03-12 深圳市人工智能与机器人研究院 一种基于物体关联注意力的室内场景识别实现方法及系统
CN112700794A (zh) * 2021-03-23 2021-04-23 北京达佳互联信息技术有限公司 一种音频场景分类方法、装置、电子设备和存储介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108269266A (zh) * 2016-12-30 2018-07-10 达索系统公司 使用马尔可夫随机场优化来产生分割图像
CN108229478A (zh) * 2017-06-30 2018-06-29 深圳市商汤科技有限公司 图像语义分割及训练方法和装置、电子设备、存储介质和程序
CN108492301A (zh) * 2018-03-21 2018-09-04 广东欧珀移动通信有限公司 一种场景分割方法、终端及存储介质
CN108648233A (zh) * 2018-03-24 2018-10-12 北京工业大学 一种基于深度学习的目标识别与抓取定位方法
CN110533048A (zh) * 2018-05-23 2019-12-03 上海交通大学 基于全景区域场景感知的组合语义层次连接模型的实现方法及系统
CN109086768A (zh) * 2018-07-13 2018-12-25 南京邮电大学 卷积神经网络的语义图像分割方法
CN109636049A (zh) * 2018-12-19 2019-04-16 浙江工业大学 一种结合道路网络拓扑结构与语义关联的拥堵指数预测方法
CN110110617A (zh) * 2019-04-22 2019-08-09 腾讯科技(深圳)有限公司 医学影像分割方法、装置、电子设备和存储介质
CN110097026A (zh) * 2019-05-13 2019-08-06 北京邮电大学 一种基于多维要素视频分割的段落关联规则评判方法
CN110322453A (zh) * 2019-07-05 2019-10-11 西安电子科技大学 基于位置注意力和辅助网络的3d点云语义分割方法
CN110706239A (zh) * 2019-09-26 2020-01-17 哈尔滨工程大学 融合全卷积神经网络与改进aspp模块的场景分割方法
CN111178181A (zh) * 2019-12-16 2020-05-19 深圳市华尊科技股份有限公司 交通场景分割方法及相关装置
CN110991414A (zh) * 2019-12-21 2020-04-10 武汉中海庭数据技术有限公司 一种交通要素高精度分割方法、电子设备及存储介质
CN111798460A (zh) * 2020-06-17 2020-10-20 南京信息工程大学 一种卫星图像分割方法
CN112487927A (zh) * 2020-11-26 2021-03-12 深圳市人工智能与机器人研究院 一种基于物体关联注意力的室内场景识别实现方法及系统
CN112330685A (zh) * 2020-12-28 2021-02-05 北京达佳互联信息技术有限公司 图像分割模型训练、图像分割方法、装置及电子设备
CN112700794A (zh) * 2021-03-23 2021-04-23 北京达佳互联信息技术有限公司 一种音频场景分类方法、装置、电子设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DONG LIANG等: "Cross-scene foreground segmentation with supervised and unsupervised model communication" *
岳师怡: "面向雾天道路场景的高精度语义分割算法", 《万方》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114419070A (zh) * 2022-01-21 2022-04-29 北京字跳网络技术有限公司 一种图像场景分割方法、装置、设备及存储介质
WO2023138558A1 (zh) * 2022-01-21 2023-07-27 北京字跳网络技术有限公司 一种图像场景分割方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113470048B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN113168510B (zh) 通过细化形状先验分割对象
WO2020047420A1 (en) Method and system for facilitating recognition of vehicle parts based on a neural network
US8379994B2 (en) Digital image analysis utilizing multiple human labels
CN110874841A (zh) 参照边缘图像的客体检测方法及装置
CN110728295B (zh) 半监督式的地貌分类模型训练和地貌图构建方法
US12061991B2 (en) Transfer learning with machine learning systems
CN110781980B (zh) 目标检测模型的训练方法、目标检测方法及装置
Guillermo et al. Implementation of automated annotation through mask rcnn object detection model in cvat using aws ec2 instance
CN110879960A (zh) 生成卷积神经网络学习用图像数据集的方法及计算装置
US20230281974A1 (en) Method and system for adaptation of a trained object detection model to account for domain shift
EP4432215A1 (en) Image processing method and device
WO2020239241A1 (en) Method for training a model to be used for processing images by generating feature maps
CN113569852A (zh) 语义分割模型的训练方法、装置、电子设备及存储介质
CN114330588A (zh) 一种图片分类方法、图片分类模型训练方法及相关装置
WO2021099938A1 (en) Generating training data for object detection
CN116071557A (zh) 一种长尾目标检测方法、计算机可读存储介质及驾驶设备
CN113223011B (zh) 基于引导网络和全连接条件随机场的小样本图像分割方法
CN113744280B (zh) 图像处理方法、装置、设备及介质
CN113470048B (zh) 场景分割方法、装置、设备及计算机可读存储介质
US20240233325A9 (en) Method for classifying images and electronic device
KR102026280B1 (ko) 딥 러닝을 이용한 씬 텍스트 검출 방법 및 시스템
CN114067221B (zh) 一种遥感影像林地提取方法及系统及装置及介质
US11755688B2 (en) Apparatus and method for generating training data for a machine learning system
CN116883820A (zh) 一种融合模型的训练方法、图像识别方法和系统
CN115424250A (zh) 一种车牌识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant