JP2022002091A - 画像編集モデルの構築方法及び装置 - Google Patents
画像編集モデルの構築方法及び装置 Download PDFInfo
- Publication number
- JP2022002091A JP2022002091A JP2021102209A JP2021102209A JP2022002091A JP 2022002091 A JP2022002091 A JP 2022002091A JP 2021102209 A JP2021102209 A JP 2021102209A JP 2021102209 A JP2021102209 A JP 2021102209A JP 2022002091 A JP2022002091 A JP 2022002091A
- Authority
- JP
- Japan
- Prior art keywords
- image
- branch
- generator
- hostile
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010276 construction Methods 0.000 title claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 65
- 238000000034 method Methods 0.000 claims abstract description 35
- 230000006870 function Effects 0.000 claims description 42
- 230000015654 memory Effects 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 230000010354 integration Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 229920001690 polydopamine Polymers 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/40—Filling a planar surface by adding surface attributes, e.g. colour or texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/174—Segmentation; Edge detection involving the use of two or more images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
Claims (13)
- コンピュータによって実施される、画像編集モデルの構築方法であって、
第1画像及びそれに対応する第2画像を含む訓練サンプルを取得することと、
背景画像生成ブランチ、マスク画像生成ブランチ、及び前景画像生成ブランチを含む生成器と、判別器とを備える敵対的生成ネットワークを構築することと、
第1画像とそれに対応する第2画像とに基づいて前記敵対的生成ネットワークを訓練し、訓練された前記敵対的生成ネットワークにおける生成器を画像編集モデルとすることと、を含む、
方法。 - 前記訓練サンプルを取得することは、
前景画像及び背景画像を取得することと、
対応関係を有する2つの前景画像をそれぞれ同一の背景画像と統合し、統合結果を前記訓練サンプルのうちの第1画像とそれに対応する第2画像とすることと、を含む、
請求項1に記載の方法。 - 前記背景画像生成ブランチ、マスク画像生成ブランチ、及び前景画像生成ブランチのネットワーク構造は、ディープニューラルネットワークである、
請求項1に記載の方法。 - 前記第1画像とそれに対応する第2画像とに基づいて前記敵対的生成ネットワークを訓練することは、
前記訓練サンプルのうちの第2画像を実サンプルとして使用することと、
第1画像を生成器に入力した後、画像特徴を抽出して前記前景画像生成ブランチ、マスク画像生成ブランチ及び背景画像生成ブランチにそれぞれ入力し、各ブランチで生成された画像を統合して生成サンプルを得ることと、
生成サンプル及びそれに対応する実サンプルを判別器への入力として使用することと、
前記敵対的生成ネットワークが収束するまで生成器及び判別器を交互に訓練することと、を含む、
請求項1に記載の方法。 - 前記敵対的生成ネットワークが収束するまで生成器及び判別器を交互に訓練することは、
生成器に含まれる3つの画像生成ブランチに対して、各画像生成ブランチに対応する損失関数を構築することと、
各画像生成ブランチに対応する損失関数に基づいて、前記敵対的生成ネットワークが収束するまで各画像生成ブランチのネットワーク構造におけるパラメータをそれぞれ調整することと、を含む、
請求項4に記載の方法。 - 画像編集モデルの構築装置であって、
第1画像及びそれに対応する第2画像を含む訓練サンプルを取得する取得ユニットと、
背景画像生成ブランチ、マスク画像生成ブランチ、及び前景画像生成ブランチを含む生成器と、判別器とを備える敵対的生成ネットワークを構築する構築ユニットと、
第1画像とそれに対応する第2画像とに基づいて前記敵対的生成ネットワークを訓練し、訓練された前記敵対的生成ネットワークにおける生成器を画像編集モデルとする訓練ユニットと、を備える、
装置。 - 前記取得ユニットは、訓練サンプルを取得する場合に、具体的に、
前景画像及び背景画像を取得し、
対応関係を有する2つの前景画像をそれぞれ同一の背景画像と統合し、統合結果を前記訓練サンプルのうちの第1画像とそれに対応する第2画像とする、
請求項6に記載の装置。 - 前記構築ユニットにより構築される背景画像生成ブランチ、マスク画像生成ブランチ、及び前景画像生成ブランチのネットワーク構造は、ディープニューラルネットワークである、
請求項6に記載の装置。 - 前記訓練ユニットは、第1画像とそれに対応する第2画像とに基づいて前記敵対的生成ネットワークを訓練する場合に、具体的に、
前記訓練サンプルのうちの第2画像を実サンプルとして使用し、
第1画像を生成器に入力した後、画像特徴を抽出して前記前景画像生成ブランチ、マスク画像生成ブランチ及び背景画像生成ブランチにそれぞれ入力し、各ブランチで生成された画像を統合して生成サンプルを得、
生成サンプル及びそれに対応する実サンプルを判別器への入力として使用し、
前記敵対的生成ネットワークが収束するまで生成器と判別器を交互に訓練する、
請求項6に記載の装置。 - 前記訓練ユニットは、前記敵対的生成ネットワークが収束するまで生成器と判別器とを交互に訓練する場合に、具体的に、
生成器に含まれる3つの画像生成ブランチに対して、各画像生成ブランチに対応する損失関数を構築し、
前記敵対的生成ネットワークが収束するまで、各画像生成ブランチに対応する損失関数に基づいて各画像生成ブランチのネットワーク構造におけるパラメータをそれぞれ調整する、
請求項9に記載の装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されたメモリと、を備え、
前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項1〜5のいずれか一項に記載の方法を実行させる電子デバイス。 - コンピュータに請求項1〜5のいずれか一項に記載の方法を実行させるためのコンピュータコマンドが記憶された非一時的なコンピュータ可読記憶媒体。
- コンピュータに請求項1〜5のいずれか一項に記載の方法を実行させるためのプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010576505.8A CN111861955A (zh) | 2020-06-22 | 2020-06-22 | 构建图像编辑模型的方法以及装置 |
CN202010576505.8 | 2020-06-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022002091A true JP2022002091A (ja) | 2022-01-06 |
JP7241813B2 JP7241813B2 (ja) | 2023-03-17 |
Family
ID=72988090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021102209A Active JP7241813B2 (ja) | 2020-06-22 | 2021-06-21 | 画像編集モデルの構築方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210398334A1 (ja) |
EP (1) | EP3929875A1 (ja) |
JP (1) | JP7241813B2 (ja) |
KR (1) | KR102566277B1 (ja) |
CN (1) | CN111861955A (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113516615B (zh) * | 2020-11-24 | 2024-03-01 | 阿里巴巴集团控股有限公司 | 一种样本生成方法、系统、设备及存储介质 |
CN112837215B (zh) * | 2021-03-31 | 2022-10-18 | 电子科技大学 | 一种基于生成对抗网络的图像形状变换方法 |
CN113158977B (zh) * | 2021-05-12 | 2022-07-29 | 河南师范大学 | 改进FANnet生成网络的图像字符编辑方法 |
CN113963087B (zh) * | 2021-10-12 | 2023-10-27 | 北京百度网讯科技有限公司 | 图像处理方法、图像处理模型训练方法、装置及存储介质 |
CN114187624B (zh) * | 2021-11-09 | 2023-09-22 | 北京百度网讯科技有限公司 | 图像生成方法、装置、电子设备及存储介质 |
CN114528865B (zh) * | 2022-02-22 | 2024-02-20 | 广东奥普特科技股份有限公司 | 条形码检测模型的训练方法、装置及条形码检测方法、装置 |
CN117036658A (zh) * | 2022-04-29 | 2023-11-10 | 华为技术有限公司 | 一种图像处理方法及相关设备 |
CN114820885B (zh) * | 2022-05-19 | 2023-03-24 | 北京百度网讯科技有限公司 | 图像编辑方法及其模型训练方法、装置、设备和介质 |
CN115546848B (zh) * | 2022-10-26 | 2024-02-02 | 南京航空航天大学 | 一种对抗生成网络训练方法、跨设备掌纹识别方法及系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10242449B2 (en) * | 2017-01-04 | 2019-03-26 | Cisco Technology, Inc. | Automated generation of pre-labeled training data |
KR102403494B1 (ko) * | 2017-04-27 | 2022-05-27 | 에스케이텔레콤 주식회사 | 생성적 대립 네트워크에 기반한 도메인 간 관계를 학습하는 방법 |
CN107680088A (zh) * | 2017-09-30 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 用于分析医学影像的方法和装置 |
CN108182657A (zh) * | 2018-01-26 | 2018-06-19 | 深圳市唯特视科技有限公司 | 一种基于循环生成对抗网络的面部图像转换方法 |
US10719742B2 (en) * | 2018-02-15 | 2020-07-21 | Adobe Inc. | Image composites using a generative adversarial neural network |
US10825219B2 (en) * | 2018-03-22 | 2020-11-03 | Northeastern University | Segmentation guided image generation with adversarial networks |
CN109377448B (zh) * | 2018-05-20 | 2021-05-07 | 北京工业大学 | 一种基于生成对抗网络的人脸图像修复方法 |
CN109727264A (zh) * | 2019-01-10 | 2019-05-07 | 南京旷云科技有限公司 | 图像生成方法、神经网络的训练方法、装置和电子设备 |
DE102019210270A1 (de) * | 2019-05-23 | 2020-11-26 | Robert Bosch Gmbh | Verfahren zum Trainieren eines Generative Adversarial Networks (GAN), Generative Adversarial Network, Computerprogramm, maschinenlesbares Speichermedium und Vorrichtung |
CN110580472B (zh) * | 2019-09-12 | 2021-04-06 | 合肥工业大学 | 一种基于全卷积网络和条件对抗网络的视频前景检测方法 |
-
2020
- 2020-06-22 CN CN202010576505.8A patent/CN111861955A/zh active Pending
-
2021
- 2021-04-22 EP EP21169905.3A patent/EP3929875A1/en not_active Withdrawn
- 2021-04-27 US US17/241,211 patent/US20210398334A1/en not_active Abandoned
- 2021-06-15 KR KR1020210077704A patent/KR102566277B1/ko active IP Right Grant
- 2021-06-21 JP JP2021102209A patent/JP7241813B2/ja active Active
Non-Patent Citations (3)
Title |
---|
MEHMET OZGUR TURKOGLU, ET AL.: "A Layer-Based Sequential Framework for Scene Generation with GANs", ARXIV.ORG, JPN7022003702, 2 February 2019 (2019-02-02), US, ISSN: 0004841069 * |
THU NGUYEN-PHUOC, ET AL.: "BlockGAN Learning 3D Object-aware scene Representations from Unlabelled Images", ARXIV.ORG, JPN7022003701, 20 February 2020 (2020-02-20), US, pages 2002 - 08988, ISSN: 0004841068 * |
YANIV BERRY, ET AL.: "OneGAN: Simultaneous Unsupervised Learning of Conditional Image Generation, Foreground Segmentation,", ARXIV.ORG, JPN7022003700, 31 December 2019 (2019-12-31), US, ISSN: 0004841067 * |
Also Published As
Publication number | Publication date |
---|---|
US20210398334A1 (en) | 2021-12-23 |
KR102566277B1 (ko) | 2023-08-10 |
CN111861955A (zh) | 2020-10-30 |
JP7241813B2 (ja) | 2023-03-17 |
KR20210157878A (ko) | 2021-12-29 |
EP3929875A1 (en) | 2021-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022002091A (ja) | 画像編集モデルの構築方法及び装置 | |
KR102484617B1 (ko) | 이종 그래프 노드를 표현하는 모델 생성 방법, 장치, 전자 기기, 저장 매체 및 프로그램 | |
JP2021082308A (ja) | マルチモーダルコンテンツ処理方法、装置、機器及び記憶媒体 | |
CN111144108B (zh) | 情感倾向性分析模型的建模方法、装置和电子设备 | |
JP2021103574A (ja) | 顔融合モデルのトレーニング方法、装置及び電子機器 | |
JP2022018095A (ja) | マルチモーダル事前訓練モデル取得方法、装置、電子デバイス及び記憶媒体 | |
JP2022180519A (ja) | 画像処理方法、画像処理モデルのトレーニング方法、装置及び記憶媒体 | |
JP2021121966A (ja) | 画像処理方法、装置、電子機器及び記憶媒体 | |
US10387161B2 (en) | Techniques for capturing state information and performing actions for threads in a multi-threaded computing environment | |
US20230186583A1 (en) | Method and device for processing virtual digital human, and model training method and device | |
KR102538467B1 (ko) | 모델의 증류 방법, 장치, 전자기기 및 저장매체 | |
US11562732B2 (en) | Method and apparatus for predicting mouth-shape feature, and electronic device | |
JP7291740B2 (ja) | モデリングパラメータの設定方法、装置、デバイス、コンピュータ記憶媒体、及びコンピュータプログラム | |
CN111125451B (zh) | 数据生产加工方法、装置、电子设备及存储介质 | |
US20210390731A1 (en) | Method and apparatus for positioning key point, device, and storage medium | |
JP2022002093A (ja) | 顔編集方法、装置、電子デバイス及び可読記憶媒体 | |
JP7192192B2 (ja) | 語義類似度モデルの訓練方法、装置、電子デバイス及び記憶媒体 | |
JP7165226B2 (ja) | オプティマイザ学習方法、装置、電子デバイス、可読記憶媒体及びコンピュータプログラム | |
CN110852449A (zh) | 模型迁移方法和电子设备 | |
CN112184851B (zh) | 图像编辑方法、网络训练方法、相关装置及电子设备 | |
CN111986659B (zh) | 建立音频生成模型的方法以及装置 | |
CN111061743A (zh) | 数据加工方法、装置和电子设备 | |
CN112507692B (zh) | 建立风格文本生成模型的方法、装置 | |
EP3958183A1 (en) | Deep learning model adaptation method and apparatus and electronic device | |
Deshayes | A domain-specific modeling approach for gestural interaction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230307 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7241813 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |