CN112487974A - 视频流多人分割方法、系统、芯片及介质 - Google Patents
视频流多人分割方法、系统、芯片及介质 Download PDFInfo
- Publication number
- CN112487974A CN112487974A CN202011371357.2A CN202011371357A CN112487974A CN 112487974 A CN112487974 A CN 112487974A CN 202011371357 A CN202011371357 A CN 202011371357A CN 112487974 A CN112487974 A CN 112487974A
- Authority
- CN
- China
- Prior art keywords
- segmentation
- portrait
- mask
- network
- person
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 130
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012937 correction Methods 0.000 claims abstract description 31
- 238000013507 mapping Methods 0.000 claims abstract description 5
- 238000004590 computer program Methods 0.000 claims description 10
- 238000003709 image segmentation Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 38
- 230000000694 effects Effects 0.000 abstract description 5
- 230000003321 amplification Effects 0.000 abstract description 3
- 238000003199 nucleic acid amplification method Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005260 corrosion Methods 0.000 description 2
- 230000007797 corrosion Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 210000000746 body region Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000010339 dilation Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
视频流多人分割方法、系统、芯片及介质,方法包括:获取视频帧图像中的各人像的包围框,及粗分割而得的第一掩膜;利用包围框分别获取各人像区域的图片,与掩膜拼接成深度图像;将深度图像输入修正网络,输出精细的第二掩膜;将第二掩膜映射到原视频帧图像位置,完成人像分割。本发明融合人像定位及粗分割网络和修正分割网络,实现高精度的分割效果;增加漏检检测网络,提升多人分割方法的稳定性;利用数据扩增模拟各种粗分割结果,训练修正分割网络,提升修正分割网络鲁棒性。
Description
技术领域
本发明涉及计算机图像处理领域,具体地说是一种无绿幕、低延时、实时的视频流多人分割方法、系统、芯片及介质。
背景技术
人像分割技术,作用是将人像区域从图像中进行提取,达到人像与背景的分离。人像分割技术在视觉特效领域应用广泛,例如背景替换、背景虚化、人物隐藏等,这些特效的实现均依赖于高精度人像分割技术。
传统的人像分割技术依赖于利用人像的边缘检测,然后利用膨胀和漫水填充方法进行填充完成人像的分割。此种方法近适合人像和背景差异大,且背景简单的情况,在实际中很难应用。
随着深度学习技术的发展,特别是在计算机视觉领域,以卷积神经网络为代表的深度学习方法在人像的分割领域得到了广泛的研究。逐帧分割网络的训练以图片作为输入,输出为预测的掩模,一般用1表示人像区域,0表示背景,利用人工标注的真值来监督网络的训练。而当前逐帧人像分割网络的分割效果不稳定,经常出现误分割以及漏分割的现象;而视频流分割网络训练的输入除了当前帧外还有上一帧的输入作为先验,此外还需要提供第一帧的真值,仅能作为像素级的目标追踪,很难应用于实时的人数发生变化的分割应用。
此外一般神经网络消耗大量算力导致延时高,很难达到实时,导致单纯的分割网络很难直接应用于实际。
因此为了实际应用,需要一种能适用于任意背景,高精度且同时满足低延时以及实时的视频流多人分割系统。
发明内容
本发明为解决现有的问题,旨在提供视频流多人分割方法、系统、芯片及介质。
为了达到上述目的,本发明采用的技术方案提供一种视频流多人分割方法,包括:
a,获取视频帧图像中的各人像的包围框,及粗分割而得的第一掩膜;
b,利用包围框分别获取各人像区域的图片,与掩膜拼接成深度图像;
c,将深度图像输入修正网络,输出精细的第二掩膜;
d,将第二掩膜映射到原视频帧图像位置,完成人像分割。
在一些实施例中,a中,获取视频帧RGB图像中的人像的数量、和/或包围框的左上角坐标、和/或人像区域的宽和高。
在一些实施例中,a中采用实例分割网络CenterMask。
在一些实施例中,b中,利用包围框从RGB图像中分别分割出含每个单人的RGB图像,并将其与对应粗分割而得的第一掩膜组合成RGBD图像。
在一些实施例中,所述组合为通道拼接。
在一些实施例中,c中,将RGBD图像输入修正网络,输出针对每个人像区域中人像精细分割而得的第二掩膜。
在一些实施例中,所述修正网络为语义分割网络U2Net。
在一些实施例中,c中,在训练过程中通过数据增强方法来模拟各种不同的粗分割结果:
对真值的二值图像进行腐蚀,膨胀操作,来模拟人像定位和粗分割模块的粗分割结果;和/或将真值的二值图像像素随机替换为0或255,并进行腐蚀膨胀,来产生空洞区域,来模拟分割错误结果;和/或将真值的二值图像置为255,来模拟漏检检测模块输出的粗分割结果。
在一些实施例中,c中,将所有RGBD输入分割修正网络,完成针对粗分割的第一掩膜的修正,得到第二掩膜。
在一些实施例中,还包括e,监控a和/或b中前一帧和当前帧中的人数,若当前帧中的人数小于前帧,则重新获取视频帧图像中的人像;若当前帧中的人数大于a和/或b中的数量,则以检测到的人像区域代替a检测的人像区域。
在一些实施例中,将当前帧的图像输入漏检检测网络,然后输出检测到的人像包围框,通过漏检检测网络输出的包围框个数与人像定位和粗分割模块检测到的人像个数进行对比。
在一些实施例中,若漏检检测模块检测到的人数大于前一帧的人数,则判断为人像定位和粗分割模块漏检,则将该结果代替原有结果。
在一些实施例中,直接使用漏检检测网络输出的人像包围框代替人像定位和粗分割网络输出的人像包围框。
在一些实施例中,将漏检检测网络输出的人像包围框中的所有像素都标注为人像像素的方式,进行粗分割结果的替换。
本发明还提供一种视频流多人分割系统,包括:
人像定位模块,用于对视频帧图像中的人像进行定位;
粗分割模块,用于获取单个人像包围框,以及粗分割的第一掩膜
拼接模块,用于利用包围框分别获取各人像区域的图片,与掩膜拼接成深度图像;
修正模块,用于将深度图像输入修正网络,输出精细的第二掩膜;
分割模块,用于将第二掩膜映射到原视频帧图像位置,完成人像分割。
其中,还包括预处理模块,用于对输入的单张视频帧图像进行缩放处理,将图片缩放到固定尺寸。
其中,还包括漏检检测模块,用于检测人像定位模块和/或粗分割模块中检测到的人像个数以及前一帧的人像个数。
其中,所述各个模块单独为一个进程,通过开辟共享内存使得各个模块之间进行通讯,以完成数据交换
本发明还提供一种芯片,包括处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行所述的视频流多人分割方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令被处理执行时,实现任一所述的视频流多人分割方法。
和现有技术相比,本发明的技术优势在于:融合人像定位及粗分割网络和修正分割网络,实现高精度的分割效果;增加漏检检测网络,提升多人分割方法的稳定性;利用数据扩增模拟各种粗分割结果,训练修正分割网络,提升修正分割网络鲁棒性;通过对模型进行模型压缩和Float16量化操作,以及利用多进程和共享内存进行分布式部署实现低延时、实时的分割方法。
附图说明
图1为本发明实施例的流程示意图;
图2为人像定位与粗分割的示意图;
图3为漏检情况下粗分割结果替换的示意图;
图4为通过数据扩增生成各种粗分割结果的示意图;
图5为修正模块运行的效果示意图;
图6为修正前后细节对比示意图。
具体实施方式
现结合附图对本发明作进一步地说明。
参见图1至图6,图1至图6展示的是本发明的一个实施例,提供的是一种无绿幕、低延时、实时的视频流多人分割系统与方法。其中,本实施例的方法主要包括:
A,摄像机拍摄的RGB图像输入人像定位和粗分割模块,人像定位和粗分割模块输出图像中人像个数,每个单人人像区域包围框的左上角坐标及人像区域的宽和高,以及针对每个人像区域中人像的粗略分割结果,1表示人像区域像素,0表示背景像素。
B,利用步骤A输出的每个单人人像区域包围框从摄像机拍摄的RGB图像中分割出包含每个单人的RGB图像,然后将对应的粗分割结果与单人的RGB图像组合成RGBD图像。
C,将所有拼合的RGBD图像以一个批次的形式输入修正网络,输出针对每个人像区域中人像的精细分割结果,1表示人像区域像素,0表示背景像素。
D,利用步骤A中输出的每个单人人像区域包围框的位置以及步骤2输出的每个人像区域中人像的精细分割结果,将每个人像中的精细分割结果恢复到和摄像机输入RGB图片同样的大小的通道为1的图片中,1表示人像区域像素,0表示背景像素。利用整体掩膜从摄像机拍摄的RGB图片中提取出人像区域像素,完成人像的分割。
以及,E漏检检测模块监控步骤A中前一帧和当前帧中检测到的人数变化,若当前帧中的人数小于前帧,则漏检检测模块启动人体区域检测网络,进一步对图片中的人像数量进行确认,若检测到的人数大于步骤1检测的数量,则用漏检检测模块检测到的人像区域代替步骤1检测的人像区域,对应粗分割结果使用全为1的单通道图片表示。
参见图1,本实施例提供一种实现无绿幕条件下,高精度、低延时以及实时的视频流分割系统。如图1所示,该系统的输入为摄像机采集的视频帧,通过人像定位和粗分割模块进行人像计数、定位与粗略分割,由修正模块利用定位的人像区域和粗分割结果作为输入得到修正后的结果。由漏检检测模块监控人数变化,实时修正人数错误。各模块采用了分布式部署,利用共享内存进行通信,通过信号量机制进行调度。
人像定位和粗分割模块的构建与运行:
人像定位和粗分割模块输入预处理单元:对输入的单帧图片进行缩放处理,将图片缩放到固定尺寸。
人像定位和粗分割模块处理单元:处理模块采用实例分割网络,本系统采用CenterMask,该网络能够对图片中的人像进行定位和粗略分割,得到单个人像包围框以及掩膜。
任何可以完成人像定位和粗分割的网络均可作为人像定位和粗分割模块的处理单元,不仅限于CenterMask。
参见图2,人像定位和粗分割模块后处理单元:利用处理单元得到人像包围框,从输入图片中分割出包含人体区域的RGB图片,并与粗分割的掩膜进行通道拼接,得到RGBA的图片。针对每个个体的人像包围框均进行相同的处理。
漏检检测模块保存前一帧中人像定位和粗分割模块检测到的人像个数。通过比较当前帧中人像定位和粗分割模块检测到的人像个数以及前一帧的人像个数,来决定是否进行启动漏检检测网络,当监控到当前帧人数小于前一帧人数时,启动人像检测网络。
漏检检测模块的检测网络:漏检检测网络采用人像检测网络,本实施例采用YOLOv5,该网络能够对图像中的人像进行定位,得到每个人像的包围框(任何可以完成人像检测的网络均可作为漏检检测模块的检测网络,不仅限于YOLOv5)。将当前帧的图像输入漏检检测网络,漏检检测网络输出检测到的人像包围框,通过漏检检测网络输出的包围框个数与人像定位和粗分割模块检测到的人像个数进行对比,若漏检检测模块检测到的人数大于人像定位和粗分割模块人数,则判断为人像定位和粗分割模块漏检,采用漏检检测模块的结果代替人像定位和粗分割模块的结果。
进一步地,替换方法如下:
(a)包围框替换:直接使用漏检检测网络输出的人像包围框代替人像定位和粗分割网络输出的人像包围框;
(b)粗分割结果替换:参见图3,由于漏检网络只进行人像检测,不进行分割,因此采用将漏检检测网络输出的人像包围框中的所有像素都标注为人像像素的方式进行粗分割结果的替换。
修正模块为分割修正网络,而本实施例中的分割修正网络采用语义分割网络U2Net。所述语义分割网络U2Net输入为RGBD图片,RGB为包含人像的三通道图片,D表示对RGB图片中人像区域的粗略分割结果。用来监督网络训练的真值为RGB图片中人像区域的精细分割结果。
作为优选,参见图4,为了更好的模拟粗略分割结果,在训练过程中通过数据增强方法来模拟各种不同的粗分割结果,具体如下:
(a)对真值的二值图像进行腐蚀,膨胀操作,来模拟人像定位和粗分割模块的粗分割结果;
(b)将真值的二值图像像素随机替换为0或255,并进行腐蚀膨胀,来产生空洞区域,来模拟分割错误结果;
(c)将真值的二值图像置为255,来模拟漏检检测模块输出的粗分割结果;分割修正网络可采用任何语义分割网络,包括但不限于U2Net网络。
参见图5,修正模块将人像定位和粗分割模块或漏检检测模块输出的所有RGBD以一个批次的形式输入分割修正模块,完成针对粗分割结果的修正。完成修正后,参见图6,图6为修正前后对比,利用每个人像包围框的在原图中的位置,将修正后的粗分割结果,映射到原图位置,完成图片中人像分割。此外,本实施例中的人像为两个分离的情况。若遇到人像重叠的情况时,在将重叠的第二掩膜映射回到原图位置后采用的“或”运算,则人像区域均会被保留,不会产生覆盖的情况。
作为优选,上述各个模块单独为一个进程,通过开辟共享内存,让各个模块之间进行通讯,完成数据交换。利用信号量机制完成模块之间的调度。实现流水线的工作方式。
作为优选,网络推断及图片的处理基于Nvidia GPU进行计算。
上述的实施例中,粗略分割/粗分割的定义是:生成的人像掩膜允许欠分割(少分割,例如胳膊,腿分割不完整),以及多分割(将非人像区域背景纳入前景)情况的出现,无需精确的仅包含人像区域像素位置。
精细分割的定义是:分割结果无欠分割或多分割情况的出现,分割掩膜仅包含输入人像区域的像素位置。
本发明实施例还提供还提供一种芯片,包括处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行所述的视频流多人分割方法。例如,存储器可以包括随机存储器、闪存、只读存储器、可编程只读存储器、非易失性存储器或寄存器等。处理器可以是中央处理器(Central Processing Unit,CPU)等。或者是图像处理器(GraphicProcessing Unit,GPU)存储器可以存储可执行指令。处理器可以执行在存储器中存储的可执行指令,从而实现本文描述的各个过程。
可以理解,本实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是ROM(Read-OnlyMemory,只读存储器)、PROM(ProgrammableROM,可编程只读存储器)、EPROM(ErasablePROM,可擦除可编程只读存储器)、EEPROM(ElectricallyEPROM,电可擦除可编程只读存储器)或闪存。易失性存储器可以是RAM(RandomAccessMemory,随机存取存储器),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如SRAM(StaticRAM,静态随机存取存储器)、DRAM(DynamicRAM,动态随机存取存储器)、SDRAM(SynchronousDRAM,同步动态随机存取存储器)、DDRSDRAM(DoubleDataRate SDRAM,双倍数据速率同步动态随机存取存储器)、ESDRAM(Enhanced SDRAM,增强型同步动态随机存取存储器)、SLDRAM(SynchlinkDRAM,同步连接动态随机存取存储器)和DRRAM(DirectRambusRAM,直接内存总线随机存取存储器)。本文描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器存储了如下的元素,升级包、可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统和应用程序。
其中,操作系统,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序,包含各种应用程序,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序中。
在本发明实施例中,处理器通过调用存储器存储的程序或指令,具体的,可以是应用程序中存储的程序或指令,处理器用于执行上述方法步骤。
本发明实施例还提供一种芯片,用于执行上述的方法。具体地,该芯片包括:
处理器,用于从存储器中调用并运行计算机程序,使得安装有该芯片的设备用于执行上述方法。
本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现本发明上述的方法的步骤。
例如,机器可读存储介质可以包括但不限于各种已知和未知类型的非易失性存储器。
本发明实施例还提供一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行上述方法。
应理解,在本申请的各种实施例中,各过程的a-e的序号的并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请的实施例的实施过程构成任何限定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在机器可读存储介质中。因此,本申请的技术方案可以以软件产品的形式来体现,该软件产品可以存储在机器可读存储介质中,其可以包括若干指令用以使得电子设备执行本申请实施例所描述的技术方案的全部或部分过程。上述存储介质可以包括ROM、RAM、可移动盘、硬盘、磁盘或者光盘等各种可以存储程序代码的介质。
上面结合附图及实施例描述了本发明的实施方式,实施例给出的并不构成对本发明的限制,本领域内熟练的技术人员可依据需要做出调整,在所附权利要求的范围内做出各种变形或修改均在保护范围内。
Claims (10)
1.一种视频流多人分割方法,其特征在于包括:
a,获取视频帧图像中的各人像的包围框,及粗分割而得的第一掩膜;
b,利用包围框分别获取各人像区域的图片,与掩膜拼接成深度图像;
c,将深度图像输入修正网络,输出精细的第二掩膜;
d,将第二掩膜映射到原视频帧图像位置,完成人像分割。
2.根据权利要求1所述的视频流多人分割方法,其特征在于:a中,获取视频帧RGB图像中的人像的数量、和/或包围框的左上角坐标、和/或人像区域的宽和高。
3.根据权利要求2所述的视频流多人分割方法,其特征在于:a中采用实例分割网络CenterMask。
4.根据权利要求2或3所述的视频流多人分割方法,其特征在于:b中,利用包围框从RGB图像中分别分割出含每个单人的RGB图像,并将其与对应粗分割而得的第一掩膜组合成RGBD图像。
5.根据权利要求4所述的视频流多人分割方法,其特征在于:所述组合为通道拼接。
6.根据权利要求4或5所述的视频流多人分割方法,其特征在于:c中,将RGBD图像输入修正网络,输出针对每个人像区域中人像精细分割而得的第二掩膜。
7.根据权利要求6所述的视频流多人分割方法,其特征在于:所述修正网络为语义分割网络U2Net。
8.一种视频流多人分割系统,其特征在于:包括:
人像定位模块,用于对视频帧图像中的人像进行定位;
粗分割模块,用于获取单个人像包围框,以及粗分割的第一掩膜拼接模块,用于利用包围框分别获取各人像区域的图片,与掩膜拼接成深度图像;
修正模块,用于将深度图像输入修正网络,输出精细的第二掩膜;
分割模块,用于将第二掩膜映射到原视频帧图像位置,完成人像分割。
9.一种芯片,其特征在于,包括处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行权利要求1-7中任一所述的视频流多人分割方法。
10.一种计算机可读介质,其特征在于:其上存储有计算机程序指令,所述计算机程序指令被处理执行时,实现权利要求1-7中任一所述的视频流多人分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011371357.2A CN112487974A (zh) | 2020-11-30 | 2020-11-30 | 视频流多人分割方法、系统、芯片及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011371357.2A CN112487974A (zh) | 2020-11-30 | 2020-11-30 | 视频流多人分割方法、系统、芯片及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112487974A true CN112487974A (zh) | 2021-03-12 |
Family
ID=74937202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011371357.2A Pending CN112487974A (zh) | 2020-11-30 | 2020-11-30 | 视频流多人分割方法、系统、芯片及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112487974A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113538270A (zh) * | 2021-07-09 | 2021-10-22 | 厦门亿联网络技术股份有限公司 | 一种人像背景虚化方法和装置 |
CN113610884A (zh) * | 2021-07-08 | 2021-11-05 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN113902760B (zh) * | 2021-10-19 | 2022-05-17 | 深圳市飘飘宝贝有限公司 | 视频分割中物体边缘优化方法、系统、装置及存储介质 |
CN114782460A (zh) * | 2022-06-21 | 2022-07-22 | 阿里巴巴达摩院(杭州)科技有限公司 | 图像分割模型的生成方法及图像的分割方法、计算机设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521646A (zh) * | 2011-11-11 | 2012-06-27 | 浙江捷尚视觉科技有限公司 | 基于深度信息聚类的复杂场景人数统计算法 |
CN107610129A (zh) * | 2017-08-14 | 2018-01-19 | 四川大学 | 一种基于cnn的多模态鼻咽部肿瘤联合分割方法 |
US20190311202A1 (en) * | 2018-04-10 | 2019-10-10 | Adobe Inc. | Video object segmentation by reference-guided mask propagation |
CN111414860A (zh) * | 2020-03-20 | 2020-07-14 | 杭州趣维科技有限公司 | 一种实时的人像跟踪分割方法 |
CN111597976A (zh) * | 2020-05-14 | 2020-08-28 | 杭州相芯科技有限公司 | 一种基于rgbd相机的多人三维姿态估计方法 |
CN111611997A (zh) * | 2020-04-30 | 2020-09-01 | 青岛联合创智科技有限公司 | 一种基于人体动作迁移的卡通定制形象运动视频生成方法 |
CN111754528A (zh) * | 2020-06-24 | 2020-10-09 | Oppo广东移动通信有限公司 | 人像分割方法、装置、电子设备和计算机可读存储介质 |
-
2020
- 2020-11-30 CN CN202011371357.2A patent/CN112487974A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521646A (zh) * | 2011-11-11 | 2012-06-27 | 浙江捷尚视觉科技有限公司 | 基于深度信息聚类的复杂场景人数统计算法 |
CN107610129A (zh) * | 2017-08-14 | 2018-01-19 | 四川大学 | 一种基于cnn的多模态鼻咽部肿瘤联合分割方法 |
US20190311202A1 (en) * | 2018-04-10 | 2019-10-10 | Adobe Inc. | Video object segmentation by reference-guided mask propagation |
CN111414860A (zh) * | 2020-03-20 | 2020-07-14 | 杭州趣维科技有限公司 | 一种实时的人像跟踪分割方法 |
CN111611997A (zh) * | 2020-04-30 | 2020-09-01 | 青岛联合创智科技有限公司 | 一种基于人体动作迁移的卡通定制形象运动视频生成方法 |
CN111597976A (zh) * | 2020-05-14 | 2020-08-28 | 杭州相芯科技有限公司 | 一种基于rgbd相机的多人三维姿态估计方法 |
CN111754528A (zh) * | 2020-06-24 | 2020-10-09 | Oppo广东移动通信有限公司 | 人像分割方法、装置、电子设备和计算机可读存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610884A (zh) * | 2021-07-08 | 2021-11-05 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN113538270A (zh) * | 2021-07-09 | 2021-10-22 | 厦门亿联网络技术股份有限公司 | 一种人像背景虚化方法和装置 |
CN113902760B (zh) * | 2021-10-19 | 2022-05-17 | 深圳市飘飘宝贝有限公司 | 视频分割中物体边缘优化方法、系统、装置及存储介质 |
CN114782460A (zh) * | 2022-06-21 | 2022-07-22 | 阿里巴巴达摩院(杭州)科技有限公司 | 图像分割模型的生成方法及图像的分割方法、计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110176027B (zh) | 视频目标跟踪方法、装置、设备及存储介质 | |
CN112487974A (zh) | 视频流多人分割方法、系统、芯片及介质 | |
CN110188760B (zh) | 一种图像处理模型训练方法、图像处理方法及电子设备 | |
CN110163831B (zh) | 三维虚拟沙盘的物体动态展示方法、装置及终端设备 | |
US11367195B2 (en) | Image segmentation method, image segmentation apparatus, image segmentation device | |
EP3340075B1 (en) | Video abstract using signed foreground extraction and fusion | |
CN112084923A (zh) | 一种遥感图像语义分割方法、存储介质及计算设备 | |
CN111988657A (zh) | 一种广告插入方法及装置 | |
Jin et al. | Perspective fields for single image camera calibration | |
CN111382647A (zh) | 一种图片处理方法、装置、设备及存储介质 | |
CN111445496B (zh) | 一种水下图像识别跟踪系统及方法 | |
CN115270184A (zh) | 视频脱敏、车辆的视频脱敏方法、车载处理系统 | |
CN113808005A (zh) | 一种基于视频驱动的人脸姿态迁移方法及装置 | |
CN108520532B (zh) | 识别视频中物体运动方向的方法及装置 | |
CN114565508A (zh) | 虚拟换装方法及装置 | |
CN114299101A (zh) | 图像的目标区域获取方法、装置、设备、介质和程序产品 | |
CN112614149A (zh) | 基于实例分割的语义合成方法 | |
US11080861B2 (en) | Scene segmentation using model subtraction | |
CN112149745B (zh) | 确定难例样本的方法、装置、设备及存储介质 | |
CN110689609B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
US20220058779A1 (en) | Inpainting method and apparatus for human image, and electronic device | |
Zhang et al. | Construction Site Fence Recognition Method Based on Multi-Scale Attention Fusion ENet Segmentation Network (S). | |
CN117152167B (zh) | 一种目标移除、基于分割大模型的目标移除方法及设备 | |
CN116071607B (zh) | 基于残差网络的水库航拍图像分类及图像分割方法及系统 | |
US11887289B2 (en) | Occlusion key generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |