CN110880011A - 影像切割方法、装置及其非暂态电脑可读取媒体 - Google Patents
影像切割方法、装置及其非暂态电脑可读取媒体 Download PDFInfo
- Publication number
- CN110880011A CN110880011A CN201910811868.2A CN201910811868A CN110880011A CN 110880011 A CN110880011 A CN 110880011A CN 201910811868 A CN201910811868 A CN 201910811868A CN 110880011 A CN110880011 A CN 110880011A
- Authority
- CN
- China
- Prior art keywords
- image
- neural network
- generate
- similarity
- image segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/174—Segmentation; Edge detection involving the use of two or more images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/97—Determining parameters from multiple pictures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Abstract
一种影像切割方法、装置及其非暂态电脑可读取媒体,该影像切割方法,应用于影像切割装置中,并包括:自影像串流中接收对应于第一及第二时间点的第一及第二影像;由切割神经网络对第二影像进行影像切割,以产生标签几率组合;由相似度计算神经网络对第一影像以及第二影像进行相似度判断运算,以产生相似度几率组合;由串接单元串接标签几率组合以及相似度几率组合,以产生串接结果;以及由策略神经网络对串接结果进行进一步的推断运算,以产生标签遮罩。本发明的影像切割方法、装置及其非暂态电脑可读取媒体可将先前影像纳入考虑,以产生相似度的信息来增加循序的切割结果间的一致性。
Description
技术领域
本发明涉及一种影像处理技术,且特别涉及一种影像切割方法、装置及其非暂态电脑可读取媒体。
背景技术
在电脑影像处理的领域中,影像切割是将数字影像切割为多个部分。影像切割的目标是为了简化及/或改变影像的表示方式,以成为更有意义或是更容易分析的部分。然而,传统的切割网络仅使用单一影像做为输入,对于影像串流来说,其相对先前影像的估测将无法维持良好的精确度。
因此,如何设计一个新的影像切割方法、装置及其非暂态电脑可读取媒体,以解决上述的缺失,乃为此一业界亟待解决的问题。
发明内容
本发明的影像切割方法、装置及其非暂态电脑可读取媒体可不仅根据当下影像,还根据先前影像执行分割,以增进循序分割结果的一致性。
本发明内容的一目的在于提供一种影像切割方法,应用于影像切割装置中,影像切割方法包括:自影像串流中接收对应于第一时间点的第一影像以及对应于第二时间点的第二影像;由切割神经网络对第二影像进行影像切割,以产生标签(label)几率组合;由相似度计算神经网络对第一影像以及第二影像进行相似度判断运算,以产生相似度几率组合;由串接单元串接标签几率组合以及相似度几率组合,以产生串接结果;以及由策略神经网络对串接结果进行进一步的推断运算(inference),以产生标签遮罩(label mask)。
于一实施例中,切割神经网络、相似度计算神经网络以及策略神经网络分别为卷积神经网络(convolution neural network;CNN),且切割神经网络配置以对第二影像进行卷积,相似度计算神经网络配置以对第一影像以及第二影像进行卷积,策略神经网络配置以对串接结果进行卷积。
于一实施例中,影像切割方法还包括:由切割神经网络的第一编码器以及第一解码器对第二影像进行影像切割,以产生标签几率组合;以及由相似度计算神经网络的第二编码器以及第二解码器对第一影像以及第二影像进行相似度判断运算,以产生相似度几率组合。
于一实施例中,第一编码器以及第二编码器实际上为同一编码器。
于一实施例中,切割神经网络在像素层次(pixel level)对第二影像进行影像切割,且影像切割方法还包括:由分类神经网络对该第二影像进行分类,以产生类别几率组合;判断类别几率组合中,对应所需类别的所需类别几率是否小于预设值;以及在所需类别几率小于预设值时,停止进行影像切割以及相似度判断运算,以产生空白遮罩。
于一实施例中,影像切割方法还包括:由串接单元串接标签几率组合、相似度几率组合以及先前标签遮罩,以产生串接结果;以及由策略神经网络对串接结果进行进一步的推断运算,以产生标签遮罩。
本发明内容的另一目的在于提供一种影像切割装置,包括:存储模块以及处理模块。存储模块配置以存储多个电脑可执行指令。处理模块电性耦接于存储模块,并配置以获取并执行电脑可执行指令,以执行影像切割方法。影像切割方法包括:自影像串流中接收对应于第一时间点的第一影像以及对应于第二时间点的第二影像;由切割神经网络对第二影像进行影像切割,以产生标签几率组合;由相似度计算神经网络对第一影像以及第二影像进行相似度判断运算,以产生相似度几率组合;由串接单元串接标签几率组合以及相似度几率组合,以产生串接结果;以及由策略神经网络对串接结果进行进一步的推断运算,以产生标签遮罩。
于一实施例中,切割神经网络在像素层次对第二影像进行影像切割,且影像切割方法还包括:由分类神经网络对该第二影像进行分类,以产生类别几率组合;判断类别几率组合中,对应所需类别的所需类别几率是否小于预设值;以及在所需类别几率小于预设值时,停止进行影像切割以及相似度判断运算,以产生空白遮罩。
于一实施例中,影像切割方法还包括:由串接单元串接标签几率组合、相似度几率组合以及先前标签遮罩,以产生串接结果;以及由策略神经网络对串接结果进行进一步的推断运算,以产生标签遮罩。
本发明内容的又一目的在于提供一种非暂态电脑可读取记录媒体,配置以存储应用程序以通过影像切割装置执行影像切割方法。影像切割方法包括:自影像串流中接收对应于第一时间点的第一影像以及对应于第二时间点的第二影像;由切割神经网络对第二影像进行影像切割,以产生标签几率组合;由相似度计算神经网络对第一影像以及第二影像进行相似度判断运算,以产生相似度几率组合;由串接单元串接标签几率组合以及相似度几率组合,以产生串接结果;以及由策略神经网络对串接结果进行进一步的推断运算,以产生标签遮罩。
本发明的影像切割方法、装置及其非暂态电脑可读取媒体可将先前影像纳入考虑,以产生相似度的信息来增加循序的切割结果间的一致性。
附图说明
为让本发明的上述和其他目的、特征、优点与实施例能更明显易懂,说明书附图的说明如下:
图1为本发明一实施例中,一种影像切割装置的方框图;
图2为本发明一实施例中,一种影像切割方法的流程图;
图3为本发明一实施例中,根据影像切割装置的运行所实现的系统的方框图;以及
图4为本发明另一实施例中,根据影像切割装置的运行所实现的系统的方框图。
附图标记说明:
1:影像切割装置 100:存储模块
105:电脑可执行指令 110:处理模块
200:影像切割方法 201-205:步骤
3:系统 300:切割神经网络
310:相似度计算神经网络 320:串接单元
330:策略神经网络 340、360:编码器
350、370:解码器 4:系统
400:分类神经网络 410:编码器
420:处理器 BM:空白遮罩
CPS:类别几率组合 CR:串接结果
IM1:第一影像 IM2:第二影像
LM:标签遮罩 LPS:标签几率组合
PLM:先前标签遮罩 SPS:相似度几率组合
VS:影像串流
具体实施方式
请参照本公开内容的实施例,其中以下的范例将搭配附图进行说明。在附图及说明中所使用相同的元件符号,将指称相同或类似的元件。
须注意的是,在说明书以及权利要求中所进行的叙述中,当元件被描述为“连接”或“耦接”至另一元件时,其可为直接连接或耦接至另一元件,或是可能存在有中间的元件。相对的,当元件被描述为“直接连接”或“直接耦接”至另一元件时,将不会有中间的元件存在。更进一步地,“电性连接”或“连接”可更用以指称两个或多个元件间的交互操作以及互动。
须注意的是,在说明书以及权利要求中所进行的叙述中,虽然“第一”、“第二”等用语可用以描述不同的元件,这些元件可不被这些用语所限制。这些用语仅用以区分不同的元件。举例来说,第一元件亦可被改称为第二元件,且类似地,第二元件亦可被改称第一元件,而不会悖离实施例的范围。
须注意的是,在说明书以及权利要求中所进行的叙述中,“包含”、“包括”、“具有”、“含有”及类似的用语是被理解为开放性的,例如表示“包含,但不限于”。
须注意的是,在说明书以及权利要求中所进行的叙述中,“及/或”的语句包含所列举的一个或多个相关事物中的任何以及全部的组合。
须注意的是,在说明书以及权利要求中所进行的叙述中,在以下的实施例的叙述中用以指称方向的词汇,例如“上”、“下”、“左”、“右”、“前”及“后”,是与附图中的方向相关。因此,这样指称方向的词汇是用以叙述,而非限制本公开内容。
须注意的是,在说明书以及权利要求中所进行的叙述中,除非另行定义,所有的用语(包含技术性或是科学性用语)具有任何本公开内容所属技术领域的通常知识者所普遍理解的相同意义。须更进一步了解的是,此些用语,例如定义于常用的字典者,除非特别定义,否则需解读为具有与在相关的技术领域所使用的相同意义,而不能被广泛地解读。
请参照图1。图1为本发明一实施例中,一种影像切割装置1的方框图。影像切割装置1包含存储模块100以及处理模块110。
于一实施例中,存储模块100可为例如,但不限于光盘、随机存取存储器(randomaccess memory;RAM)、只读存储器(read only memory;ROM)、软碟、硬盘或光学磁盘片。存储模块100配置以存储多个电脑可执行指令105。
处理模块110电性耦接于存储模块100。于一实施例中,处理模块110配置以获取并执行电脑可执行指令105,并据以执行脸部影像切割装置1的功能。更详细地说,处理模块110自一个影像串流接收第一影像IM1及第二影像IM2,以根据第一影像IM1及第二影像IM2进行影像切割。
影像切割装置1的运行将进一步于以下的段落详述。
请同时参照图2及图3。
图2为本发明一实施例中,一种影像切割方法200的流程图。影像切割方法200可应用于例如图1所示出的影像切割装置1中,或由其他硬件元件如数据库、一般处理器、计算机、服务器、或其他具特定逻辑电路的独特硬件装置或具特定功能的设备来实作,如将程序码和处理器/芯片整合成独特硬件。更详细地说,影像切割方法200可使用电脑程序实现,以控制影像切割装置1的各元件。电脑程序可存储于一非暂态电脑可读取记录媒体中,例如只读存储器、快闪存储器、软碟、硬盘、光盘、U盘、磁带、可由网络存取的数据库或熟悉此技艺者可轻易思及具有相同功能的电脑可读取记录媒体。
图3为本发明一实施例中,根据影像切割装置1的运行所实现的系统3的方框图。更详细地说,当处理模块110执行电脑可执行指令105时,电脑可执行指令105运行为系统3的模块,以执行影像切割方法200。系统3包含切割神经网络300、相似度计算神经网络310、串接单元320以及策略神经网络330。
影像切割方法200包含下列步骤(应了解到,在本实施方式中所提及的步骤,除特别叙明其顺序者外,均可依实际需要调整其前后顺序,甚至可同时或部分同时执行)。
于步骤201,自影像串流VS中接收对应于第一时间点的第一影像IM1以及对应于第二时间点的第二影像IM2。其中,第二时间点在第一时间点后。
于一实施例中,第一影像IM1对应于时间点T-1,而第二影像IM2对应于时间点T。换句话说,第一影像IM1以及第二影像IM2为在影像串流VS中相邻的两个影像画面。然而,第一影像IM1以及第二影像IM2亦可在影像串流VS中相隔一个以上的其他影像画面。本发明并不为此所限。
更进一步地,在不同的实施例中,影像串流VS可由处理模块110自存储模块100接收,或是通过有线或无线的方式自远端服务器接收。
于步骤202,由切割神经网络300对第二影像IM2进行影像切割,以产生标签几率组合LPS。
于一实施例中,切割神经网络300为卷积神经网络(convolution neuralnetwork;CNN),以对第二影像IM2进行卷积,产生标签几率组合LPS。
切割神经网络300可分为编码器340以及解码器350。编码器340配置以做为特征获取元件,以逐步缩降(down scale)第二影像IM2直到像素层次,来获取特征。解码器350配置以做为特征产生元件,以逐步扩升(up scale)编码器340产生的像素来产生特征,进一步产生标签几率组合LPS。于一实施例中,标签几率组合LPS包含多个标签几率,各个标签几率对应一个标签的几率,且此标签对应于一个预先定义物件。
于步骤203,由相似度计算神经网络310对第一影像IM1以及第二影像IM2进行相似度判断运算,以产生相似度几率组合SPS。
于一实施例中,相似度计算神经网络310亦为卷积神经网络,以对第一影像IM1以及第二影像IM2进行卷积,产生相似度几率组合SPS。
类似地,相似度计算神经网络310亦可分为编码器360以及解码器370。编码器360以及解码器370的运行方式与编码器340以及解码器350类似但具有不同的拓墣结构,在此并不详述。
需注意的是,于一实施例中,编码器340以及编码器360可由同一个编码器实现。更详细地说,切割神经网络300以及相似度计算神经网络310共享一个编码器,而不需要拆分为两个独立网络运算。因此,对于切割神经网络300以及相似度计算神经网络310来说,仅需要一次缩降的运算即可。
于一实施例中,相似度几率组合SPS包含多个相似度几率,各相似度几率对应一个相似度的几率,且此相似度是第一影像IM1以及第二影像IM2间的一个对应像素间的相似度。
相似度计算神经网络310的技术效果在于,在循序(sequential)的影像切割中,当下影像与先前影像的差异很小,特别是当用以获取影像的摄像装置几乎停留在相同的位置时。如果影像中的大部分并未变动,而仅有一点噪声扰动,则未变动的像素对应的切割标签有很大的几率会相同。通过使用相似度计算神经网络310,各个像素与先前影像的相似度几率可被测量,并得到哪些部分的影像最有可能改变。最后,系统可据以调整预测的遮罩。
于步骤204,由串接单元320串接标签几率组合LPS以及相似度几率组合SPS,以产生串接结果CR。
于一实施例中,由于标签几率组合LPS以及相似度几率组合SPS是在像素层次产生,当第一影像IM1以及第二影像IM2各具有X×Y的大小时,标签几率组合LPS以及相似度几率组合SPS亦各具有X×Y的大小。因此,串接结果CR的大小将为X×Y×2。
于步骤205,由策略神经网络330对串接结果CR进行进一步的推断运算,以产生标签遮罩LM。
于一实施例中,策略神经网络330亦为卷积神经网络,以对串接结果CR进行卷积,产生同样具有大小X×Y的标签遮罩LM。
于一实施例中,策略神经网络330亦可包含编码器与解码器,以通过缩降与扩升串接结果CR进行卷积。于另一实施例中,策略神经网络330亦可在不缩降与扩升串接结果CR的情形下进行卷积。
由策略神经网络330产生的标签遮罩LM可识别对应不同预设物件的标签。更详细地说,标签遮罩LM即是影像切割的结果。
需注意的是,于一实施例中,具有大小X×Y的一个先前标签遮罩PLM可被传送至串接单元320,以使串接单元320将标签几率组合LPS、相似度几率组合SPS以及先前标签遮罩PLM均串接在一起,产生具有大小X×Y×3的串接结果CR。
在这样的情形下,策略神经网络330将对具有大小X×Y×3的串接结果CR进行进一步的推断运算,以产生标签遮罩LM。标签遮罩LM可作为新的先前标签遮罩PLM,反馈至串接单元320。
在部分技术中,影像切割是仅考虑当下的影像来进行。在精确度不够的情形下,估测结果将不会与先前影像一致。
然而,本发明的影像切割装置1以及影像切割方法200可将先前影像纳入考虑,以产生相似度的信息来增加循序的切割结果间的一致性。更进一步地,通过先前标签遮罩的使用,先前的切割结果信息亦可被纳入考虑,以提供更一致的切割结果。
图4为本发明另一实施例中,根据影像切割装置1的运行所实现的系统4的方框图。更详细地说,当处理模块110执行电脑可执行指令105时,电脑可执行指令105运行为系统4的模块,以执行影像切割方法200。类似于图3中的系统3,系统4包含切割神经网络300、相似度计算神经网络310、串接单元320以及策略神经网络330。因此,相同的元件将不在此赘述。
系统4还包含分类神经网络400。分类神经网络400配置以对第二影像IM2进行分类,以产生类别几率组合CPS。
于一实施例中,分类神经网络400亦为卷积神经网络,以对第二影像IM2进行卷积,产生类别几率组合CPS。其中,分类是在影像层次进行。
于一实施例中,分类神经网络400亦可包含对串接结果CR进行缩降的编码器410,以及包含处理缩降结果的传统全连结(fully-connected)层或是其他分类网络模块的处理器420。
于一实施例中,分类神经网络400的编码器410亦可与切割神经网络300的编码器340以及相似度计算神经网络310的编码器360共享,以减少计算量。
在产生类别几率组合CPS后,类别几率组合CPS可被传送至分割神经网络300以及相似度计算神经网络310,以判断对应一个所需类别是否存在,或是类别几率组合CPS中的一个所需类别的所需类别几率是否小于预设值。
举例而言,如果所需类别对应于人脸,对应人脸的所需类别几率是否小于预设值将被判断。
当所需类别几率小于预设值时,将停止进行影像切割以及相似度判断运算。更详细地说,切割神经网络300以及相似度计算神经网络310的运行将在所需类别几率小于预设值时停止。
于一实施例中,分类神经网络400、切割神经网络300以及相似度计算神经网络310共享同一个编码器。因此,在分类神经网络400产生类别几率组合CPS后,切割神经网络300以及相似度计算神经网络310的解码器350及370将停止后续的运算。
更进一步地,由于切割神经网络300以及相似度计算神经网络310的运行停止进行,策略神经网络330将产生空白遮罩BM。
由于切割神经网络300以及相似度计算神经网络310的运行相当耗时,分类神经网络400提供早期分类机制,以在所需类别的物件不存在时,减少耗时的运算。
总结来说,本发明的影像切割装置1以及影像切割方法200可不仅根据当下影像,还根据先前影像执行分割,以增进循序分割结果的一致性。
虽然上文实施方式中公开了本发明的具体实施例,然其并非用以限定本发明,本发明所属技术领域中技术人员,在不悖离本发明的原理与构思的情形下,当可对其进行各种变动与修饰,因此本发明的保护范围当以附随权利要求所界定者为准。
Claims (10)
1.一种影像切割方法,应用于一影像切割装置中,其特征在于,该影像切割方法包括:
自一影像串流中接收对应于一第一时间点的一第一影像以及对应于一第二时间点的一第二影像;
由一切割神经网络对该第二影像进行影像切割,以产生一标签几率组合;
由一相似度计算神经网络对该第一影像以及该第二影像进行相似度判断运算,以产生一相似度几率组合;
由一串接单元串接该标签几率组合以及该相似度几率组合,以产生一串接结果;以及
由一策略神经网络对该串接结果进行进一步的推断运算,以产生一标签遮罩。
2.如权利要求1所述的影像切割方法,其特征在于,该切割神经网络、该相似度计算神经网络以及该策略神经网络分别为一卷积神经网络,且该切割神经网络配置以对该第二影像进行卷积,该相似度计算神经网络配置以对该第一影像以及该第二影像进行卷积,该策略神经网络配置以对该串接结果进行卷积。
3.如权利要求1所述的影像切割方法,其特征在于,该影像切割方法还包括:
由该切割神经网络的一第一编码器以及一第一解码器对该第二影像进行影像切割,以产生该标签几率组合;以及
由该相似度计算神经网络的一第二编码器以及一第二解码器对该第一影像以及该第二影像进行相似度判断运算,以产生该相似度几率组合。
4.如权利要求3所述的影像切割方法,其特征在于,该第一编码器以及该第二编码器实际上为同一编码器。
5.如权利要求3所述的影像切割方法,其特征在于,该切割神经网络在一像素层次对该第二影像进行影像切割,且该影像切割方法还包括:
由一分类神经网络对该第二影像进行分类,以产生一类别几率组合;
判断该类别几率组合中,对应一所需类别的一所需类别几率是否小于一预设值;以及
在该所需类别几率小于该预设值时,停止进行影像切割以及相似度判断运算,以产生一空白遮罩。
6.如权利要求1所述的影像切割方法,其特征在于,该影像切割方法还包括:
由该串接单元串接该标签几率组合、该相似度几率组合以及一先前标签遮罩,以产生该串接结果;以及
由该策略神经网络对该串接结果进行进一步的推断运算,以产生该标签遮罩。
7.一种影像切割装置,其特征在于,包括:
一存储模块,配置以存储多个电脑可执行指令;以及
一处理模块,电性耦接于该存储模块,并配置以获取并执行所述多个电脑可执行指令,以执行一影像切割方法,该影像切割方法包括:
自一影像串流中接收对应于一第一时间点的一第一影像以及对应于一第二时间点的一第二影像;
由一切割神经网络对该第二影像进行影像切割,以产生一标签几率组合;
由一相似度计算神经网络对该第一影像以及该第二影像进行相似度判断运算,以产生一相似度几率组合;
由一串接单元串接该标签几率组合以及该相似度几率组合,以产生一串接结果;以及
由一策略神经网络对该串接结果进行进一步的推断运算,以产生一标签遮罩。
8.如权利要求7所述的影像切割装置,其特征在于,该切割神经网络在一像素层次对该第二影像进行影像切割,且该影像切割方法还包括:
由一分类神经网络对该第二影像进行分类,以产生一类别几率组合;
判断该类别几率组合中,对应一所需类别的一所需类别几率是否小于一预设值;以及
在该所需类别几率小于该预设值时,停止进行影像切割以及相似度判断运算,以产生一空白遮罩。
9.如权利要求7所述的影像切割装置,其特征在于,该影像切割方法还包括:
由该串接单元串接该标签几率组合、该相似度几率组合以及一先前标签遮罩,以产生该串接结果;以及
由该策略神经网络对该串接结果进行进一步的推断运算,以产生该标签遮罩。
10.一种非暂态电脑可读取记录媒体,配置以存储一应用程序以通过一影像切割装置执行一影像切割方法,其特征在于,该影像切割方法包括:
自一影像串流中接收对应于一第一时间点的一第一影像以及对应于一第二时间点的一第二影像;
由一切割神经网络对该第二影像进行影像切割,以产生一标签几率组合;
由一相似度计算神经网络对该第一影像以及该第二影像进行相似度判断运算,以产生一相似度几率组合;
由一串接单元串接该标签几率组合以及该相似度几率组合,以产生一串接结果;以及
由一策略神经网络对该串接结果进行进一步的推断运算,以产生一标签遮罩。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862726999P | 2018-09-05 | 2018-09-05 | |
US62/726,999 | 2018-09-05 | ||
US16/527,043 | 2019-07-31 | ||
US16/527,043 US10957048B2 (en) | 2018-09-05 | 2019-07-31 | Image segmentation method, apparatus and non-transitory computer readable medium of the same |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110880011A true CN110880011A (zh) | 2020-03-13 |
CN110880011B CN110880011B (zh) | 2022-08-16 |
Family
ID=69641599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910811868.2A Active CN110880011B (zh) | 2018-09-05 | 2019-08-30 | 影像切割方法、装置及其非暂态电脑可读取媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10957048B2 (zh) |
CN (1) | CN110880011B (zh) |
TW (1) | TWI738045B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11507777B2 (en) * | 2020-05-13 | 2022-11-22 | Adobe Inc. | Labeling techniques for a modified panoptic labeling neural network |
CN113256670A (zh) * | 2021-05-24 | 2021-08-13 | 推想医疗科技股份有限公司 | 图像处理方法及装置、网络模型的训练方法及装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258324A (zh) * | 2013-04-02 | 2013-08-21 | 西安电子科技大学 | 基于可控核回归和超像素分割的遥感图像变化检测方法 |
CN103995889A (zh) * | 2014-06-03 | 2014-08-20 | 广东欧珀移动通信有限公司 | 图片分类方法及装置 |
CN104715249A (zh) * | 2013-12-16 | 2015-06-17 | 株式会社理光 | 物体跟踪方法和装置 |
CN105354307A (zh) * | 2015-11-06 | 2016-02-24 | 腾讯科技(深圳)有限公司 | 一种图像内容识别方法及装置 |
CN105427272A (zh) * | 2014-09-17 | 2016-03-23 | 富士通株式会社 | 图像处理设备、图像处理方法以及电子装置 |
CN105976400A (zh) * | 2016-05-10 | 2016-09-28 | 北京旷视科技有限公司 | 基于神经网络模型的目标跟踪方法及装置 |
CN106326857A (zh) * | 2016-08-19 | 2017-01-11 | 乐视控股(北京)有限公司 | 基于人脸图像的性别识别方法及装置 |
CN106534951A (zh) * | 2016-11-30 | 2017-03-22 | 北京小米移动软件有限公司 | 视频分割方法和装置 |
CN108073902A (zh) * | 2017-12-19 | 2018-05-25 | 深圳先进技术研究院 | 基于深度学习的视频总结方法、装置及终端设备 |
CN108446585A (zh) * | 2018-01-31 | 2018-08-24 | 深圳市阿西莫夫科技有限公司 | 目标跟踪方法、装置、计算机设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9105306B2 (en) * | 2006-12-27 | 2015-08-11 | Nec Corporation | Identifying objects in images using object identity probabilities based on interframe distances |
US10062198B2 (en) * | 2016-06-23 | 2018-08-28 | LoomAi, Inc. | Systems and methods for generating computer ready animation models of a human head from captured data images |
CN106778664B (zh) * | 2016-12-29 | 2020-12-15 | 天津中科智能识别产业技术研究院有限公司 | 一种虹膜图像中虹膜区域的分割方法及其装置 |
CN107244113B (zh) * | 2017-05-10 | 2019-03-22 | 山东大学 | 一种防滑且防止翘曲变形的临时路面垫板装置及方法 |
US10037610B1 (en) * | 2017-10-03 | 2018-07-31 | StradVision, Inc. | Method for tracking and segmenting a target object in an image using Markov Chain, and device using the same |
-
2019
- 2019-07-31 US US16/527,043 patent/US10957048B2/en active Active
- 2019-08-30 TW TW108131415A patent/TWI738045B/zh active
- 2019-08-30 CN CN201910811868.2A patent/CN110880011B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103258324A (zh) * | 2013-04-02 | 2013-08-21 | 西安电子科技大学 | 基于可控核回归和超像素分割的遥感图像变化检测方法 |
CN104715249A (zh) * | 2013-12-16 | 2015-06-17 | 株式会社理光 | 物体跟踪方法和装置 |
CN103995889A (zh) * | 2014-06-03 | 2014-08-20 | 广东欧珀移动通信有限公司 | 图片分类方法及装置 |
CN105427272A (zh) * | 2014-09-17 | 2016-03-23 | 富士通株式会社 | 图像处理设备、图像处理方法以及电子装置 |
CN105354307A (zh) * | 2015-11-06 | 2016-02-24 | 腾讯科技(深圳)有限公司 | 一种图像内容识别方法及装置 |
CN105976400A (zh) * | 2016-05-10 | 2016-09-28 | 北京旷视科技有限公司 | 基于神经网络模型的目标跟踪方法及装置 |
CN106326857A (zh) * | 2016-08-19 | 2017-01-11 | 乐视控股(北京)有限公司 | 基于人脸图像的性别识别方法及装置 |
CN106534951A (zh) * | 2016-11-30 | 2017-03-22 | 北京小米移动软件有限公司 | 视频分割方法和装置 |
CN108073902A (zh) * | 2017-12-19 | 2018-05-25 | 深圳先进技术研究院 | 基于深度学习的视频总结方法、装置及终端设备 |
CN108446585A (zh) * | 2018-01-31 | 2018-08-24 | 深圳市阿西莫夫科技有限公司 | 目标跟踪方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
王小新: "《卷积神经网络在图像分割中的进化史:从R-CNN到Mask R-CNN》", 《HTTPS://MP.WEIXIN.QQ.COM/S/FSKI_SYPRCJCVVRHPDFCYA》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110880011B (zh) | 2022-08-16 |
TW202011350A (zh) | 2020-03-16 |
US20200074638A1 (en) | 2020-03-05 |
TWI738045B (zh) | 2021-09-01 |
US10957048B2 (en) | 2021-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020238560A1 (zh) | 视频目标跟踪方法、装置、计算机设备及存储介质 | |
CN113033537B (zh) | 用于训练模型的方法、装置、设备、介质和程序产品 | |
JP2023541532A (ja) | テキスト検出モデルのトレーニング方法及び装置、テキスト検出方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
CN111368636B (zh) | 目标分类方法、装置、计算机设备和存储介质 | |
US10062013B2 (en) | Method of image processing | |
CN110880011B (zh) | 影像切割方法、装置及其非暂态电脑可读取媒体 | |
US20240029272A1 (en) | Matting network training method and matting method | |
CN114998595B (zh) | 弱监督语义分割方法、语义分割方法及可读存储介质 | |
Tang et al. | CLASS: cross-level attention and supervision for salient objects detection | |
WO2020043296A1 (en) | Device and method for separating a picture into foreground and background using deep learning | |
CN112183649A (zh) | 一种用于对金字塔特征图进行预测的算法 | |
CN113887615A (zh) | 图像处理方法、装置、设备和介质 | |
Sharjeel et al. | Real time drone detection by moving camera using COROLA and CNN algorithm | |
US20220207750A1 (en) | Object detection with image background subtracted | |
EP4009277A1 (en) | Methods and systems for generating end-to-end model to estimate 3-dimensional(3-d) pose of object | |
JP4572175B2 (ja) | 非定常映像検出装置,非定常映像検出方法及びその方法を実装したプログラム | |
WO2022205416A1 (zh) | 一种基于生成式对抗网络的人脸表情生成方法 | |
WO2024041108A1 (zh) | 图像矫正模型训练及图像矫正方法、装置和计算机设备 | |
CN112364933A (zh) | 图像分类方法、装置、电子设备和存储介质 | |
US20210240895A1 (en) | Hardware-implemented argmax layer | |
CN109598206B (zh) | 动态手势识别方法及装置 | |
CN116229095A (zh) | 一种模型训练方法、视觉任务处理方法、装置及设备 | |
Liang et al. | Robust cross-Scene foreground segmentation in surveillance video | |
CN113474785B (zh) | 用于目标检测的区域提取处理方法及相关产品 | |
CN115346143A (zh) | 行为检测方法、电子设备、计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |