CN108734718A - 用于图像分割的处理方法、装置、产品、存储介质及设备 - Google Patents

用于图像分割的处理方法、装置、产品、存储介质及设备 Download PDF

Info

Publication number
CN108734718A
CN108734718A CN201810467235.XA CN201810467235A CN108734718A CN 108734718 A CN108734718 A CN 108734718A CN 201810467235 A CN201810467235 A CN 201810467235A CN 108734718 A CN108734718 A CN 108734718A
Authority
CN
China
Prior art keywords
pixel
segmentation
result
video frame
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810467235.XA
Other languages
English (en)
Other versions
CN108734718B (zh
Inventor
王嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sensetime Technology Development Co Ltd
Original Assignee
Beijing Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sensetime Technology Development Co Ltd filed Critical Beijing Sensetime Technology Development Co Ltd
Priority to CN201810467235.XA priority Critical patent/CN108734718B/zh
Publication of CN108734718A publication Critical patent/CN108734718A/zh
Application granted granted Critical
Publication of CN108734718B publication Critical patent/CN108734718B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供一种用于图像分割的处理方法、装置、存储介质、程序产品和电子设备,涉及计算机视觉技术领域。其中,所述方法包括:获取视频帧序列中当前视频帧的至少一个像素点的分割数据;基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果;基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。通过本发明实施例,能够基于视频帧序列中当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,确定当前视频帧的至少一个像素点中每个像素点的分割结果,减少了视频帧序列中连续视频帧之间的分割结果的不稳定性,从而提升用户体验。

Description

用于图像分割的处理方法、装置、产品、存储介质及设备
技术领域
本发明实施例涉及计算机视觉技术领域,尤其涉及一种用于图像分割的处理方法、装置、存储介质、程序产品和电子设备。
背景技术
图像分割是计算机视觉领域的基本问题,旨在将图像空域上相似的像素进行聚类分析,而视频分割是图像分割在时域上的扩展,这种分割能保持图像分割在时域上的一致性和连贯性,可用于更高级别的视觉任务,例如物体识别、目标跟踪、基于内容的检索等。最简单的视频分割方法是对视频帧序列中的视频帧分别进行图像语义分割,这种方法简单高效。其中,图像语义分割的目的为预测输入图像中每一个像素点的物体类别,实现精确、稠密的图像像素级别理解。实际应用中,视频帧序列的图像语义分割在互联网娱乐和增强现实技术中是一个很重要的基础性功能。
现有技术中,视频帧序列的图像语义分割一般是针对视频帧序列中的每个视频帧独立地进行目标区域的分割。由于语义分割模型不保证对于有相同语义类别的视频帧具有在时域上一致性或连贯性的分割结果,视频帧序列中的连续视频帧之间会随机产生时域上不具有一致性或连贯性的分割结果,从而导致了视频帧序列中连续视频帧之间的分割结果的不稳定性,在视觉上体现为视频帧序列中连续视频帧之间的分割结果的抖动,进而影响用户体验。
发明内容
本发明实施例的目的在于,提供一种用于图像分割的处理的技术方案。
根据本发明实施例的第一方面,提供了一种用于图像分割的处理方法。所述方法包括:获取视频帧序列中当前视频帧的至少一个像素点的分割数据;基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果;基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。
可选地,所述基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果,包括:基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率,确定所述至少一个像素点中每个像素点的分割置信度。
可选地,所述基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率,确定所述至少一个像素点中每个像素点的分割置信度,包括:基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率中的最大概率,确定所述至少一个像素点中每个像素点的分割置信度。
可选地,所述基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果,包括:针对所述至少一个像素点中的每个像素点,当像素点的分割置信度小于或等于预设阈值时,确定所述像素点的分割结果为所述视频帧序列中在前视频帧的相应像素点的分割结果;针对所述至少一个像素点中的每个像素点,当所述像素点的分割置信度大于所述预设阈值时,根据所述像素点的分割数据确定所述像素点的分割结果。
可选地,所述获取视频帧序列中当前视频帧的至少一个像素点的分割数据,包括:通过语义分割模型,获取视频帧序列中当前视频帧的至少一个像素点的分割数据。
可选地,所述分割数据包括像素点属于多个分割结果中每个分割结果的概率。
根据本发明实施例的第二方面,提供了一种用于图像分割的处理装置。所述装置包括:获取模块,用于获取视频帧序列中当前视频帧的至少一个像素点的分割数据;第一确定模块,用于基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果;第二确定模块,用于基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。
可选地,所述第一确定模块,包括:第一确定子模块,用于基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率,确定所述至少一个像素点中每个像素点的分割置信度。
可选地,所述第一确定子模块,具体用于:基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率中的最大概率,确定所述至少一个像素点中每个像素点的分割置信度。
可选地,所述第二确定模块,包括:第二确定子模块,用于针对所述至少一个像素点中的每个像素点,当像素点的分割置信度小于或等于预设阈值时,确定所述像素点的分割结果为所述视频帧序列中在前视频帧的相应像素点的分割结果;第三确定子模块,用于针对所述至少一个像素点中的每个像素点,当所述像素点的分割置信度大于所述预设阈值时,根据所述像素点的分割数据确定所述像素点的分割结果。
可选地,所述获取模块,具体用于:通过语义分割模型,获取视频帧序列中当前视频帧的至少一个像素点的分割数据。
可选地,所述分割数据包括像素点属于多个分割结果中每个分割结果的概率。
根据本发明实施例的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,其中,所述程序指令被处理器执行时实现本发明实施例第一方面所述的用于图像分割的处理方法的步骤。
根据本发明实施例的第四方面,提供了一种计算机程序产品,其包括有计算机程序指令,其中,所述程序指令被处理器执行时实现本发明实施例第一方面所述的用于图像分割的处理方法的步骤。
根据本发明实施例的第五方面,提供了一种电子设备,包括:处理器和存储器,所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如本发明实施例第一方面所述的用于图像分割的处理方法。
根据本发明实施例提供的技术方案,基于视频帧序列中当前视频帧的至少一个像素点中每个像素点的分割数据,确定当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,再基于当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,确定当前视频帧的至少一个像素点中每个像素点的分割结果,与现有技术相比,能够基于视频帧序列中当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,确定当前视频帧的至少一个像素点中每个像素点的分割结果,减少了视频帧序列中连续视频帧之间的分割结果的不稳定性,从而提升用户体验。
附图说明
图1是根据本发明实施例一的用于图像分割的处理方法的流程图;
图2是根据本发明实施例二的用于图像分割的处理方法的流程图;
图3是根据本发明实施例三的用于图像分割的处理装置的结构框图;
图4是根据本发明实施例四的用于图像分割的处理装置的结构框图;
图5是根据本发明实施例五的电子设备的结构框图。
具体实施方式
下面结合附图(若干附图中相同的标号表示相同的元素)和实施例,对本发明实施例的具体实施方式作进一步详细说明。以下实施例用于说明本发明,但不用来限制本发明的范围。
本领域技术人员可以理解,本发明实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
实施例一
图1是根据本发明实施例一的用于图像分割的处理方法的流程图。如图1所示,本实施例提供的用于图像分割的处理方法包括以下步骤:
在步骤S101中,获取视频帧序列中当前视频帧的至少一个像素点的分割数据。
在本实施例中,可获取视频帧序列中当前视频帧的所有像素点的分割数据。其中,像素点的分割数据包括像素点属于多个分割结果中每个分割结果的概率。举例来说,当视频帧序列中当前视频帧的内容包括人物、狗和背景,并且当前的分割任务为提取出人物所在的区域图像和狗所在的区域图像时,当前视频帧中的像素点的分割概率包括像素点属于人物的分割概率、像素点属于狗的分割概率以及像素点属于背景的分割概率,并且像素点属于人物的分割概率、像素点属于狗的分割概率以及像素点属于背景的分割概率的和为1。
在具体的实施方式中,可通过深度神经网络,获取视频帧序列中当前视频帧的像素点的分割数据。具体地,所述深度神经网络可以是任意适当的可实现特征提取或目标对象检测的神经网络,包括但不限于卷积神经网络、增强学习神经网络、对抗神经网络中的生成网络等等。神经网络中具体结构的设置可以由本领域技术人员根据实际需求适当设定,如卷积层的层数、卷积核的大小、通道数等等,本发明实施例对此不作限制。
在步骤S102中,基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果。
在本实施例中,像素点的分割数据判断结果可为对该像素点进行分割的可靠程度,例如,分割置信度。当像素点的分割数据包括像素点属于两个分割结果中的每个分割结果的概率时,像素点属于两个分割结果中的一个分割结果的概率越高,那么该像素点的分割置信度越高;像素点属于两个分割结果中的一个分割结果的概率越低,那么该像素点的分割置信度越高。当像素点的分割数据包括像素点属于三个以上分割结果中的每个分割结果的概率时,可根据像素点属于三个以上分割结果中的每个分割结果的概率中的最大概率,确定该像素点的分割置信度。
在步骤S103中,基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。
在本实施例中,可通过将像素点的分割置信度与预先设置的分割置信度阈值进行比较,来确定像素点的分割结果。具体地,当像素点的分割置信度大于预先设置的分割置信度阈值时,可根据该像素点的分割数据确定该像素点的分割结果。当像素点的分割置信度小于或等于预先设置的分割置信度时,可根据在当前视频帧之前的视频帧中的相应像素点的分割结果确定该像素点的分割结果。其中,所述预先设置的分割置信度阈值可由本领域技术人员根据实际需要进行设定,本实施例对此不作任何限制。
根据本实施例提供的用于图像分割的处理方法,基于视频帧序列中当前视频帧的至少一个像素点中每个像素点的分割数据,确定当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,再基于当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,确定当前视频帧的至少一个像素点中每个像素点的分割结果,与现有技术相比,能够基于视频帧序列中当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,确定当前视频帧的至少一个像素点中每个像素点的分割结果,减少了视频帧序列中连续视频帧之间的分割结果的不稳定性,从而提升用户体验。
本实施例的用于图像分割的处理方法可以由任意适当的具有图像或数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如Google Glass、Oculus Rift、Hololens、Gear VR)等。
实施例二
图2是根据本发明实施例二的用于图像分割的处理方法的流程图。如图2所示,本实施例提供的用于图像分割的处理方法包括以下步骤:
在步骤S201中,通过语义分割模型,获取视频帧序列中当前视频帧的至少一个像素点的分割数据。
在本实施例中,所述语义分割模型可由深度卷积神经网络来实现。具体地,可通过语义分割模型,获取视频帧序列中当前视频帧的所有像素点中每个像素点的分割数据。其中,像素点的分割数据包括像素点属于多个分割结果中每个分割结果的概率。举例来说,当视频帧序列中当前视频帧的内容包括猫、狗和背景,并且当前的分割任务为提取出猫所在的区域图像时,当前视频帧中的像素点的分割数据包括像素点属于猫的分割概率以及像素点属于背景(此处将像素点不属于猫的情况确定为像素点属于背景)的分割概率,并且像素点属于猫的分割概率和像素点属于背景的分割概率的和为1。当分割任务为提取出猫所在的区域图像和狗所在的区域图像时,当前视频帧中的像素点的分割数据包括像素点属于猫的分割概率、像素点属于狗的分割概率以及像素点属于背景的分割概率,并且像素点属于猫的分割概率、像素点属于狗的分割概率以及像素点属于背景的分割概率的和为1。
在步骤S202中,基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果。
在基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果时,可基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率,确定所述至少一个像素点中每个像素点的分割置信度。
在基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率,确定所述至少一个像素点中每个像素点的分割置信度时,可基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率中的最大概率,确定所述至少一个像素点中每个像素点的分割置信度。
在具体的实施方式中,当当前视频帧的像素点的分割数据包括像素点属于两个分割结果的概率时,可根据以下公式一计算得到像素点的分割置信度:
conf(i,p)=|prob_{i}(p,1)-0.5|公式一
其中,conf(i,p)表示视频帧序列中视频帧i的像素点p的分割置信度,prob_{i}(p,1)表示视频帧序列中视频帧i的像素点p属于背景的分割概率。
例如,当视频帧序列中当前视频帧的内容包括人物和背景,并且当前的分割任务为提取出人物所在的区域图像时,当前视频帧中的像素点的分割数据包括像素点属于人物的分割概率以及像素点属于背景的分割概率,并且可通过上述公式一,根据像素点属于背景的分割概率计算得到该像素点的分割置信度。
在具体的实施方式中,当当前视频帧的像素点的分割数据包括像素点属于三个以上分割结果的概率时,可根据像素点属于三个以上分割结果中的每个分割结果的概率中的最大概率,确定该像素点的分割置信度。
例如,当视频帧序列中当前视频帧中的像素点的分割数据包括像素点属于人物的分割概率、像素点属于松树的分割概率以及像素点属于背景的分割概率,并且像素点属于人物的分割概率为0.2、像素点属于松树的分割概率为0.1以及像素点属于背景的分割概率为0.7时,可根据像素点属于背景的分割概率(0.7)确定该像素点的分割置信度。具体地,可将像素点属于背景的分割概率与预设的概率阈值进行比较,来确定该像素点的分割置信度。更具体地,当像素点属于背景的分割概率大于预设的概率阈值时,可确定该像素点的分割置信度为1,也就是说,可根据该像素点当前的分割概率来确定该像素点的当前分割结果。当像素点属于背景的分割概率小于或等于预设的概率阈值时,可确定该像素点的分割置信度为0,也就是说,不能根据该像素点当前的分割概率来确定该像素点的当前分割结果。其中,所述预设的概率阈值可由本领域技术人员根据实际需要进行设定,本实施例对此不作任何限制。
在步骤S203中,基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。
在基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果时,针对所述至少一个像素点中的每个像素点,当所述分割置信度小于或等于预设阈值时,确定像素点的分割结果为所述视频帧序列中在前视频帧的相应像素点的分割结果;当所述分割置信度大于所述预设阈值时,根据所述像素点的分割数据确定所述像素点的分割结果。其中,所述预设阈值可为0.2。需要说明的是,所述预设阈值可由本领域技术人员根据实际需要进行设定,本实施例对此不作任何限制。
在具体的实施方式中,当像素点的分割置信度小于或等于预设阈值时,不可根据该像素点当前的分割数据确定该像素点的当前分割结果,可将该像素点的当前分割结果确定为所述视频帧序列中在前视频帧的相应像素点的分割结果。具体地,可根据该像素点在当前视频帧的分割概率图中的位置确定相应像素点在在前视频帧的分割概率图中的位置,从而可将在前视频帧的相应像素点的分割结果作为该像素点的分割结果。其中,所述在前视频帧可为与当前视频帧相邻的在前视频帧,还可为与当前视频帧不相邻的在前视频帧。具体地,可根据视频帧序列的帧率确定所述在前视频帧是否为与当前视频帧相邻的在前视频帧。当视频帧序列的帧率大于预设的帧率阈值时,所述在前视频帧可以为与当前视频帧相邻的在前视频帧,还可以为与当前视频帧不相邻的在前视频帧。当视频帧序列的帧率小于或等于预设的帧率阈值时,所述在前视频帧可为与当前视频帧相邻的在前视频帧,不可为与当前视频帧不相邻的在前视频帧。另外,当像素点的分割置信度大于预设阈值时,可根据所述像素点的分割数据确定所述像素点的分割结果。具体地,可根据所述像素点属于多个分割结果中每个分割结果的概率,确定所述像素点的分割结果。更具体地,可将所述像素点属于多个分割结果中的最大概率分割结果确定为所述像素点的当前分割结果。在确定得到当前视频帧的所有像素点中每个像素点的当前分割结果之后,可对当前视频帧进行分割,得到目标区域图像。
在实际应用中,单目虚化预览以及增强现实技术等基于视频流语义分割的应用,使用本实施例提供的用于图像分割的处理方法能够提高视频流的分割结果的输出稳定性,从而提升用户的视觉舒适度。
根据本实施例提供的用于图像分割的处理方法,基于视频帧序列中当前视频帧的至少一个像素点中每个像素点的分割数据,确定当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,再基于当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,确定当前视频帧的至少一个像素点中每个像素点的分割结果,与现有技术相比,能够基于视频帧序列中当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,确定当前视频帧的至少一个像素点中每个像素点的分割结果,减少了视频帧序列中连续视频帧之间的分割结果的不稳定性,从而提升用户体验。
本实施例的用于图像分割的处理方法可以由任意适当的具有图像或数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如Google Glass、Oculus Rift、Hololens、Gear VR)等。
实施例三
基于相同的技术构思,图3是根据本发明实施例三的一种用于图像分割的处理装置的结构框图。可用以执行以上实施例所述的用于图像分割的处理方法的流程。
参照图3,该用于图像分割的处理装置包括获取模块301、第一确定模块302和第二确定模块303。
获取模块301,用于获取视频帧序列中当前视频帧的至少一个像素点的分割数据;
第一确定模块302,用于基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果;
第二确定模块303,用于基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。
通过本实施例提供的用于图像分割的处理装置,基于视频帧序列中当前视频帧的至少一个像素点中每个像素点的分割数据,确定当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,再基于当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,确定当前视频帧的至少一个像素点中每个像素点的分割结果,与现有技术相比,能够基于视频帧序列中当前视频帧的至少一个像素点中每个像素点的分割数据判断结果,确定当前视频帧的至少一个像素点中每个像素点的分割结果,减少了视频帧序列中连续视频帧之间的分割结果的不稳定性,从而提升用户体验。
实施例四
基于相同的技术构思,图4是根据本发明实施例四的一种用于图像分割的处理装置的结构框图。可用以执行以上实施例所述的用于图像分割的处理方法的流程。
参照图4,该用于图像分割的处理装置包括获取模块401、第一确定模块402和第二确定模块403。其中,获取模块401,用于获取视频帧序列中当前视频帧的至少一个像素点的分割数据;第一确定模块402,用于基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果;第二确定模块403,用于基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。
可选地,所述第一确定模块402,包括:第一确定子模块4021,用于基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率,确定所述至少一个像素点中每个像素点的分割置信度。
可选地,所述第一确定子模块4021,具体用于:基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率中的最大概率,确定所述至少一个像素点中每个像素点的分割置信度。
可选地,所述第二确定模块403,包括:第二确定子模块4031,用于针对所述至少一个像素点中的每个像素点,当像素点的分割置信度小于或等于预设阈值时,确定所述像素点的分割结果为所述视频帧序列中在前视频帧的相应像素点的分割结果;第三确定子模块4032,用于针对所述至少一个像素点中的每个像素点,当所述像素点的分割置信度大于所述预设阈值时,根据所述像素点的分割数据确定所述像素点的分割结果。
可选地,所述获取模块401,具体用于:通过语义分割模型,获取视频帧序列中当前视频帧的至少一个像素点的分割数据。
可选地,所述分割数据包括像素点属于多个分割结果中每个分割结果的概率。
需要说明的是,对于本发明实施例提供的用于图像分割的处理装置还涉及的具体细节已在本发明实施例提供的用于图像分割的处理方法中作了详细的说明,在此不在赘述。
实施例五
本发明实施例还提供了一种电子设备,包括:处理器和存储器,所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如本发明实施例第一方面所述的用于图像分割的处理方法。例如,电子设备可以是移动终端、个人计算机(PC)、平板电脑、服务器等。下面参考图5,其示出了适于用来实现本发明实施例的终端设备或服务器的电子设备500的结构示意图。如图5所示,电子设备500包括一个或多个处理器、通信元件等,所述一个或多个处理器例如:一个或多个中央处理单元(CPU)501,和/或一个或多个图像处理器(GPU)513等,处理器可以根据存储在只读存储器(ROM)502中的可执行指令或者从存储部分508加载到随机访问存储器(RAM)503中的可执行指令而执行各种适当的动作和处理。本实施例中,只读存储器502和随机访问存储器503统称为存储器。通信元件包括通信组件512和/或通信接口509。其中,通信组件512可包括但不限于网卡,所述网卡可包括但不限于IB(Infiniband)网卡,通信接口509包括诸如LAN卡、调制解调器等的网络接口卡的通信接口,通信接口509经由诸如因特网的网络执行通信处理。
处理器可与只读存储器502和/或随机访问存储器503中通信以执行可执行指令,通过通信总线504与通信组件512相连、并经通信组件512与其他目标设备通信,从而完成本发明实施例提供的任一项用于图像分割的处理方法对应的操作,例如,获取视频帧序列中当前视频帧的至少一个像素点的分割数据;基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果;基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。
此外,在RAM 503中,还可存储有装置操作所需的各种程序和数据。CPU501或GPU513、ROM502以及RAM503通过通信总线504彼此相连。在有RAM503的情况下,ROM502为可选模块。RAM503存储可执行指令,或在运行时向ROM502中写入可执行指令,可执行指令使处理器执行上述通信方法对应的操作。输入/输出(I/O)接口505也连接至通信总线504。通信组件512可以集成设置,也可以设置为具有多个子模块(例如多个IB网卡),并在通信总线链接上。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信接口509。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
需要说明的,如图5所示的架构仅为一种可选实现方式,在具体实践过程中,可根据实际需要对上述图5的部件数量和类型进行选择、删减、增加或替换;在不同功能部件设置上,也可采用分离设置或集成设置等实现方式,例如GPU和CPU可分离设置或者可将GPU集成在CPU上,通信元件可分离设置,也可集成设置在CPU或GPU上,等等。这些可替换的实施方式均落入本发明的保护范围。
特别地,根据本发明实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行流程图所示的方法的程序代码,程序代码可包括对应执行本发明实施例提供的方法步骤对应的指令,例如,获取视频帧序列中当前视频帧的至少一个像素点的分割数据;基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果;基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。在这样的实施例中,该计算机程序可以通过通信元件从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被处理器执行时,执行本发明实施例的方法中限定的上述功能。
需要指出,根据实施的需要,可将本申请中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
可能以许多方式来实现本发明的方法和装置、设备。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明实施例的方法和装置、设备。用于方法的步骤的上述顺序仅是为了进行说明,本发明实施例的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明实施例的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明实施例的方法的程序的记录介质。
本发明实施例的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式,很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (10)

1.一种用于图像分割的处理方法,其特征在于,所述方法包括:
获取视频帧序列中当前视频帧的至少一个像素点的分割数据;
基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果;
基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果,包括:
基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率,确定所述至少一个像素点中每个像素点的分割置信度。
3.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率,确定所述至少一个像素点中每个像素点的分割置信度,包括:
基于所述至少一个像素点中每个像素点属于多个分割结果中的每个分割结果的概率中的最大概率,确定所述至少一个像素点中每个像素点的分割置信度。
4.根据权利要求1~3中任意一项权利要求所述的方法,其特征在于,所述基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果,包括:
针对所述至少一个像素点中的每个像素点,当像素点的分割置信度小于或等于预设阈值时,确定所述像素点的分割结果为所述视频帧序列中在前视频帧的相应像素点的分割结果;
针对所述至少一个像素点中的每个像素点,当所述像素点的分割置信度大于所述预设阈值时,根据所述像素点的分割数据确定所述像素点的分割结果。
5.根据权利要求1~4中任意一项权利要求所述的方法,其特征在于,所述获取视频帧序列中当前视频帧的至少一个像素点的分割数据,包括:
通过语义分割模型,获取视频帧序列中当前视频帧的至少一个像素点的分割数据。
6.根据权利要求1~5中任意一项权利要求所述的方法,其特征在于,所述分割数据包括像素点属于多个分割结果中每个分割结果的概率。
7.一种用于图像分割的处理装置,其特征在于,所述装置包括:
获取模块,用于获取视频帧序列中当前视频帧的至少一个像素点的分割数据;
第一确定模块,用于基于所述至少一个像素点中每个像素点的分割数据,确定所述至少一个像素点中每个像素点的分割数据判断结果;
第二确定模块,用于基于所述至少一个像素点中每个像素点的分割数据判断结果,确定所述至少一个像素点中每个像素点的分割结果。
8.一种计算机可读存储介质,其上存储有计算机程序指令,其中,所述程序指令被处理器执行时实现权利要求1~6中任意一项权利要求所述的用于图像分割的处理方法的步骤。
9.一种计算机程序产品,其包括有计算机程序指令,其中,所述程序指令被处理器执行时实现权利要求1~6中任意一项权利要求所述的用于图像分割的处理方法的步骤。
10.一种电子设备,包括:处理器和存储器,所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1~6中任意一项权利要求所述的用于图像分割的处理方法。
CN201810467235.XA 2018-05-16 2018-05-16 用于图像分割的处理方法、装置、存储介质及设备 Active CN108734718B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810467235.XA CN108734718B (zh) 2018-05-16 2018-05-16 用于图像分割的处理方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810467235.XA CN108734718B (zh) 2018-05-16 2018-05-16 用于图像分割的处理方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN108734718A true CN108734718A (zh) 2018-11-02
CN108734718B CN108734718B (zh) 2021-04-06

Family

ID=63938343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810467235.XA Active CN108734718B (zh) 2018-05-16 2018-05-16 用于图像分割的处理方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN108734718B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902755A (zh) * 2019-03-05 2019-06-18 南京航空航天大学 一种用于xct切片的多层信息分享与纠正方法
CN114096993A (zh) * 2019-07-02 2022-02-25 阿西斯特医疗系统有限公司 图像分割置信度确定
WO2022142419A1 (zh) * 2020-12-31 2022-07-07 上海商汤智能科技有限公司 视频处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6245517B1 (en) * 1998-09-29 2001-06-12 The United States Of America As Represented By The Department Of Health And Human Services Ratio-based decisions and the quantitative analysis of cDNA micro-array images
CN105095919A (zh) * 2015-09-08 2015-11-25 北京百度网讯科技有限公司 图像识别方法和装置
US20160379371A1 (en) * 2015-06-29 2016-12-29 Beihang University Method for object segmentation in videos tagged with semantic labels
CN106952286A (zh) * 2017-03-21 2017-07-14 中国人民解放军火箭军工程大学 基于运动显著图和光流矢量分析的动态背景目标分割方法
CN107624193A (zh) * 2015-04-29 2018-01-23 西门子公司 腹腔镜和内窥镜2d/2.5d图像数据中语义分割的方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6245517B1 (en) * 1998-09-29 2001-06-12 The United States Of America As Represented By The Department Of Health And Human Services Ratio-based decisions and the quantitative analysis of cDNA micro-array images
CN107624193A (zh) * 2015-04-29 2018-01-23 西门子公司 腹腔镜和内窥镜2d/2.5d图像数据中语义分割的方法和系统
US20160379371A1 (en) * 2015-06-29 2016-12-29 Beihang University Method for object segmentation in videos tagged with semantic labels
CN106327469A (zh) * 2015-06-29 2017-01-11 北京航空航天大学 一种语义标签引导的视频对象分割方法
CN105095919A (zh) * 2015-09-08 2015-11-25 北京百度网讯科技有限公司 图像识别方法和装置
CN106952286A (zh) * 2017-03-21 2017-07-14 中国人民解放军火箭军工程大学 基于运动显著图和光流矢量分析的动态背景目标分割方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
H.ZHAO ET AL: "Pyramid Scene Parsing Network", 《CVPR 2017》 *
WENBO LIU ET AL: "Joint recognition/segmentation with cascaded multi-level feature classification and confidence propagation", 《ICMEW 2013》 *
黄波 等: "基于模糊聚类和时域跟踪的视频分割", 《通信学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902755A (zh) * 2019-03-05 2019-06-18 南京航空航天大学 一种用于xct切片的多层信息分享与纠正方法
CN114096993A (zh) * 2019-07-02 2022-02-25 阿西斯特医疗系统有限公司 图像分割置信度确定
WO2022142419A1 (zh) * 2020-12-31 2022-07-07 上海商汤智能科技有限公司 视频处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN108734718B (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
US10776970B2 (en) Method and apparatus for processing video image and computer readable medium
CN110458107B (zh) 用于图像识别的方法和装置
CN111598164B (zh) 识别目标对象的属性的方法、装置、电子设备和存储介质
CN104574124B (zh) 确定广告数据的展示效果的方法及装置
CN113379627A (zh) 图像增强模型的训练方法和对图像进行增强的方法
CN108734718A (zh) 用于图像分割的处理方法、装置、产品、存储介质及设备
CN113361603A (zh) 训练方法、类别识别方法、装置、电子设备以及存储介质
CN112580666A (zh) 图像特征的提取方法、训练方法、装置、电子设备及介质
CN116401551A (zh) 模型训练方法和语言模型训练方法及装置
CN109241930B (zh) 用于处理眉部图像的方法和装置
US20220101120A1 (en) Interpretable visualization system for graph neural network
CN110008922A (zh) 用于终端设备的图像处理方法、设备、装置、介质
CN110046340A (zh) 文本分类模型的训练方法和装置
CN117593083A (zh) 商品图像生成方法、装置、电子设备和存储介质
CN117235371A (zh) 视频推荐方法、模型训练方法及装置
CN112784102A (zh) 视频检索方法、装置和电子设备
CN111563541A (zh) 图像检测模型的训练方法和装置
CN115147547B (zh) 人体重建方法和装置
CN112784189A (zh) 一种识别页面图像的方法和装置
CN113110782B (zh) 图像的识别方法、装置、计算机设备及存储介质
CN114093006A (zh) 活体人脸检测模型的训练方法、装置、设备以及存储介质
CN112560987A (zh) 图像样本处理方法、装置、设备、存储介质和程序产品
CN112966723A (zh) 视频数据增广方法、装置、电子设备及可读存储介质
CN113051472B (zh) 点击通过率预估模型的建模方法、装置、设备以及存储介质
CN115375802B (zh) 动态图像的生成方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant