WO2022001464A1 - 自动抠图方法及系统 - Google Patents
自动抠图方法及系统 Download PDFInfo
- Publication number
- WO2022001464A1 WO2022001464A1 PCT/CN2021/094860 CN2021094860W WO2022001464A1 WO 2022001464 A1 WO2022001464 A1 WO 2022001464A1 CN 2021094860 W CN2021094860 W CN 2021094860W WO 2022001464 A1 WO2022001464 A1 WO 2022001464A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- picture
- cutout
- training
- generate
- data set
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 134
- 230000011218 segmentation Effects 0.000 claims abstract description 67
- 238000005520 cutting process Methods 0.000 claims description 18
- 230000003190 augmentative effect Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Definitions
- the embodiment of the second aspect of the present invention provides a computer-readable storage medium on which an automatic map-cutting program is stored, and when the automatic map-cutting program is executed by a processor, the above-mentioned automatic map-cutting method is implemented.
- the preprocessing module is configured to calculate the signal-to-noise ratio corresponding to each of the historical pictures, filter the historical pictures according to the signal-to-noise ratio, and filter the filtered pictures.
- the salient foregrounds in the historical images are annotated to generate a training dataset based on the annotated historical images.
- it also includes a sample expansion module, which is used to obtain a background data set, and randomly replace the background in the marked historical pictures according to the background data set, so as to generate corresponding expanded samples, so that A training dataset is generated based on the annotated historical images and augmented samples.
- a sample expansion module which is used to obtain a background data set, and randomly replace the background in the marked historical pictures according to the background data set, so as to generate corresponding expanded samples, so that A training dataset is generated based on the annotated historical images and augmented samples.
- the embodiments of the present invention further provide a computer device, including a memory, a processor, and a computer program stored in the memory and running on the processor, characterized in that the processor executes the When the program is executed, the automatic cutout method as described above is realized.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
Claims (10)
- 一种自动抠图方法,其特征在于,包括以下步骤:获取历史图片,并根据所述历史图片生成训练数据集;根据所述训练数据集进行分割模型的训练,以便通过训练得到的分割模型根据训练数据集中的原始图片生成对应的三元组图片;根据所述训练数据集中的原始图片和该原始图片对应的三元组图片进行抠图模型的训练,以生成抠图模型;获取待抠图图片,并将所述待抠图图片输入到所述分割模型,以通过所述分割模型生成所述待抠图图片对应的三元组图片;将所述待抠图图片和该待抠图图片对应的三元组图片输入到所述抠图模型,以通过所述抠图模型生成该待抠图图片对应的图形蒙版,以及根据所述图形蒙版对所述待抠图图片进行自动抠图。
- 如权利要求1所述的自动抠图方法,其特征在于,根据所述历史图片生成训练数据集之前,还包括:计算每个所述历史图片对应的信噪比,并根据所述信噪比对所述历史图片进行过滤;对过滤后的历史图片中的显著性前景进行标注,以便根据标注后的历史图片生成训练数据集。
- 如权利要求2所述的自动抠图方法,其特征在于,在对过滤后的历史图片中的显著性前景进行标注之后,还包括:获取背景数据集,并根据所述背景数据集对标注后的历史图片中的背景进行随机替换,以生成相应的扩充样本,以便根据标注后的历史图片和扩充样本生成训练数据集。
- 如权利要求1-3中任一项所述的自动抠图方法,其特征在于,通过训练得到的分割模型根据训练数据集中的原始图片生成对应的三元组图片,包括:根据所述原始图片生成该原始图片对应的多尺度特征,并对所述多尺度特征进行融合,以生成该原始图片对应的特征层;根据所述原始图片和该原始图片对应的特征层进行细粒度分割,以生成该原始图片对应的三元组图片。
- 如权利要求4所述的自动抠图方法,其特征在于,在生成该原始图片对应的特征层之后,还包括:提取该原始图片中每个像素对应的像素特征,并计算像素间的相似矩阵,以及根据所述像素特征和所述相似矩阵计算像素间的信息增益值,以便根据所述信息增益值对所述特征层进行更新。
- 一种计算机可读存储介质,其特征在于,其上存储有自动抠图程序,该自动抠图程序被处理器执行时实现如权利要求1-5中任一项所述的自动抠图方法。
- 一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现如权利要求1-5中任一项所述的自动抠图方法。
- 一种自动抠图系统,其特征在于,包括:获取模块,所述获取模块用于获取历史图片,并根据所述历史图片生成训练数据集;第一训练模块,所述第一训练模块用于根据所述训练数据集进行分割模型的训练,以便通过训练得到的分割模型根据训练数据集中的原始图片生成对应的三元组图片;第二训练模块,所述第二训练模块用于根据所述训练数据集中的原始图片和该原始图片对应的三元组图片进行抠图模型的训练,以生成抠图模型;自动抠图模块,所述自动抠图模块用于获取待抠图图片,并将所述待抠图图片输入到所述分割模型,以通过所述分割模型生成所述待抠图图片对应的三元组图片;所述自动抠图模块还用于将所述待抠图图片和该待抠图图片对应的三元组图片输入到所述抠图模型,以通过所述抠图模型生成该待抠图图片对应的图形蒙版,以及根据所述图形蒙版对所述待抠图图片进行自动抠图。
- .如权利要求8所述的自动抠图系统,其特征在于,还包括预处理模块,所述预处理模块用于计算每个所述历史图片对应的信噪比,并根据所述信噪比对所述历史图片进行过滤,以及对过滤后的历史图片中的显著性前景进行标注,以便根据标注后的历史图片生成训练数据集。
- 如权利要求9所述的自动抠图系统,其特征在于,还包括样本扩充模块,所述样本扩充模块用于获取背景数据集,并根据所述背景数据集对标注后的历史图片中的背景进行随机替换,以生成相应的扩充样本,以便根据标注后的历史图片和扩充样本生成训练数据集。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010611175.1 | 2020-06-30 | ||
CN202010611175.1A CN111784564B (zh) | 2020-06-30 | 2020-06-30 | 自动抠图方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022001464A1 true WO2022001464A1 (zh) | 2022-01-06 |
Family
ID=72760421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2021/094860 WO2022001464A1 (zh) | 2020-06-30 | 2021-05-20 | 自动抠图方法及系统 |
Country Status (2)
Country | Link |
---|---|
CN (2) | CN113706372A (zh) |
WO (1) | WO2022001464A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023159746A1 (zh) * | 2022-02-23 | 2023-08-31 | 平安科技(深圳)有限公司 | 基于图像分割的图像抠图方法、装置、计算机设备及介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113706372A (zh) * | 2020-06-30 | 2021-11-26 | 稿定(厦门)科技有限公司 | 自动抠图模型建立方法及系统 |
CN113012169B (zh) * | 2021-03-22 | 2023-07-07 | 深圳市人工智能与机器人研究院 | 一种基于非局部注意力机制的全自动抠图方法 |
CN113259605A (zh) * | 2021-04-22 | 2021-08-13 | 清华珠三角研究院 | 基于预测前景蒙版预测的视频抠图方法、系统和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150117779A1 (en) * | 2013-10-30 | 2015-04-30 | Thomson Licensing | Method and apparatus for alpha matting |
CN109035253A (zh) * | 2018-07-04 | 2018-12-18 | 长沙全度影像科技有限公司 | 一种语义分割信息指导的深度学习自动图像抠图方法 |
CN111161277A (zh) * | 2019-12-12 | 2020-05-15 | 中山大学 | 一种基于深度学习的自然图像抠图方法 |
CN111223106A (zh) * | 2019-10-28 | 2020-06-02 | 稿定(厦门)科技有限公司 | 全自动人像蒙版抠图方法及系统 |
CN111784564A (zh) * | 2020-06-30 | 2020-10-16 | 稿定(厦门)科技有限公司 | 自动抠图方法及系统 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8792718B2 (en) * | 2012-06-29 | 2014-07-29 | Adobe Systems Incorporated | Temporal matte filter for video matting |
WO2017177371A1 (en) * | 2016-04-12 | 2017-10-19 | Xiaogang Wang | Method and system for object re-identification |
CN108460770B (zh) * | 2016-12-13 | 2020-03-10 | 华为技术有限公司 | 抠图方法及装置 |
CN108062756B (zh) * | 2018-01-29 | 2020-04-14 | 重庆理工大学 | 基于深度全卷积网络和条件随机场的图像语义分割方法 |
CN110148102B (zh) * | 2018-02-12 | 2022-07-15 | 腾讯科技(深圳)有限公司 | 图像合成方法、广告素材合成方法及装置 |
CN108960499B (zh) * | 2018-06-27 | 2021-11-23 | 东华大学 | 一种融合视觉和非视觉特征的服装流行趋势预测系统 |
US10692221B2 (en) * | 2018-07-13 | 2020-06-23 | Adobe Inc. | Automatic trimap generation and image segmentation |
CN108961303B (zh) * | 2018-07-23 | 2021-05-07 | 北京旷视科技有限公司 | 一种图像处理方法、装置、电子设备和计算机可读介质 |
CN109145815B (zh) * | 2018-08-21 | 2022-05-03 | 深圳大学 | 一种sar目标识别方法、装置、计算机设备及存储介质 |
CN109145922B (zh) * | 2018-09-10 | 2022-03-29 | 成都品果科技有限公司 | 一种自动抠图系统 |
CN109255334B (zh) * | 2018-09-27 | 2021-12-07 | 中国电子科技集团公司第五十四研究所 | 基于深度学习语义分割网络的遥感影像地物分类方法 |
CN109461167B (zh) * | 2018-11-02 | 2020-07-21 | Oppo广东移动通信有限公司 | 图像处理模型的训练方法、抠图方法、装置、介质及终端 |
CN111160380A (zh) * | 2018-11-07 | 2020-05-15 | 华为技术有限公司 | 生成视频分析模型的方法及视频分析系统 |
CN109712145B (zh) * | 2018-11-28 | 2021-01-08 | 山东师范大学 | 一种图像抠图方法及系统 |
CN110245665B (zh) * | 2019-05-13 | 2023-06-06 | 天津大学 | 基于注意力机制的图像语义分割方法 |
CN110322468A (zh) * | 2019-06-04 | 2019-10-11 | 广东工业大学 | 一种图像自动编辑方法 |
CN110400323B (zh) * | 2019-07-30 | 2020-11-24 | 上海艾麒信息科技股份有限公司 | 一种自动抠图系统、方法以及装置 |
CN110543841A (zh) * | 2019-08-21 | 2019-12-06 | 中科视语(北京)科技有限公司 | 行人重识别方法、系统、电子设备及介质 |
CN110889855B (zh) * | 2019-10-28 | 2022-05-20 | 公安部交通管理科学研究所 | 基于端到端卷积神经网络的证件照抠图方法及系统 |
CN111046732B (zh) * | 2019-11-11 | 2023-11-28 | 华中师范大学 | 一种基于多粒度语义解析的行人重识别方法及存储介质 |
CN111275732B (zh) * | 2020-01-16 | 2023-05-02 | 北京师范大学珠海分校 | 一种基于深度卷积神经网络的前景对象图像分割方法 |
-
2020
- 2020-06-30 CN CN202110962940.9A patent/CN113706372A/zh active Pending
- 2020-06-30 CN CN202010611175.1A patent/CN111784564B/zh active Active
-
2021
- 2021-05-20 WO PCT/CN2021/094860 patent/WO2022001464A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150117779A1 (en) * | 2013-10-30 | 2015-04-30 | Thomson Licensing | Method and apparatus for alpha matting |
CN109035253A (zh) * | 2018-07-04 | 2018-12-18 | 长沙全度影像科技有限公司 | 一种语义分割信息指导的深度学习自动图像抠图方法 |
CN111223106A (zh) * | 2019-10-28 | 2020-06-02 | 稿定(厦门)科技有限公司 | 全自动人像蒙版抠图方法及系统 |
CN111161277A (zh) * | 2019-12-12 | 2020-05-15 | 中山大学 | 一种基于深度学习的自然图像抠图方法 |
CN111784564A (zh) * | 2020-06-30 | 2020-10-16 | 稿定(厦门)科技有限公司 | 自动抠图方法及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023159746A1 (zh) * | 2022-02-23 | 2023-08-31 | 平安科技(深圳)有限公司 | 基于图像分割的图像抠图方法、装置、计算机设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111784564A (zh) | 2020-10-16 |
CN113706372A (zh) | 2021-11-26 |
CN111784564B (zh) | 2022-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022001464A1 (zh) | 自动抠图方法及系统 | |
CN110263659B (zh) | 一种基于三元组损失和轻量级网络的指静脉识别方法及系统 | |
CN111127346A (zh) | 基于部分到整体注意力机制的多层次图像修复方法 | |
WO2020199478A1 (zh) | 图像生成模型训练方法、图像生成方法、装置、设备及存储介质 | |
EP3631750B1 (en) | Image resolution enhancement | |
US11651477B2 (en) | Generating an image mask for a digital image by utilizing a multi-branch masking pipeline with neural networks | |
CN110008962B (zh) | 基于注意力机制的弱监督语义分割方法 | |
US11393100B2 (en) | Automatically generating a trimap segmentation for a digital image by utilizing a trimap generation neural network | |
WO2022105608A1 (zh) | 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质 | |
WO2019196795A1 (zh) | 视频剪辑的方法以及装置及电子设备 | |
CN110543906A (zh) | 基于数据增强和Mask R-CNN模型的肤质自动识别方法 | |
CN112861659B (zh) | 一种图像模型训练方法、装置及电子设备、存储介质 | |
CN111932431A (zh) | 基于水印分解模型的可见水印去除方法和电子设备 | |
Chen et al. | Robust face super-resolution via position relation model based on global face context | |
CN103927533B (zh) | 一种针对早期专利文档扫描件中图文信息的智能处理方法 | |
US20220207808A1 (en) | Image manipulation | |
CN113222903A (zh) | 一种全切片组织病理图像分析方法及系统 | |
CN110942463B (zh) | 一种基于生成对抗网络的视频目标分割方法 | |
CN111709425A (zh) | 一种基于特征迁移的肺部ct图像分类方法 | |
Swathi et al. | Deep learning: A detailed analysis of various image augmentation techniques | |
CN113269734B (zh) | 一种基于元学习特征融合策略的肿瘤图像检测方法及装置 | |
Huynh et al. | SimpSON: Simplifying Photo Cleanup with Single-Click Distracting Object Segmentation Network | |
CN114547437A (zh) | 图像检索方法及装置 | |
JP2008020944A (ja) | 画像処理方法、プログラムおよび装置 | |
CN115376022B (zh) | 基于神经网络的小目标检测算法在无人机航拍中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21834412 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21834412 Country of ref document: EP Kind code of ref document: A1 |
|
32PN | Ep: public notification in the ep bulletin as address of the adressee cannot be established |
Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 17.07.2023) |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21834412 Country of ref document: EP Kind code of ref document: A1 |