JP2021193546A - 画像生成方法および装置、電子機器、記憶媒体並びにコンピュータプログラム - Google Patents
画像生成方法および装置、電子機器、記憶媒体並びにコンピュータプログラム Download PDFInfo
- Publication number
- JP2021193546A JP2021193546A JP2021032615A JP2021032615A JP2021193546A JP 2021193546 A JP2021193546 A JP 2021193546A JP 2021032615 A JP2021032615 A JP 2021032615A JP 2021032615 A JP2021032615 A JP 2021032615A JP 2021193546 A JP2021193546 A JP 2021193546A
- Authority
- JP
- Japan
- Prior art keywords
- image
- random vector
- class
- image class
- random
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000004590 computer program Methods 0.000 title claims abstract description 9
- 239000013598 vector Substances 0.000 claims abstract description 295
- 238000012549 training Methods 0.000 claims description 60
- 230000015654 memory Effects 0.000 claims description 26
- 238000002372 labelling Methods 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 238000013145 classification model Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 abstract description 10
- 238000010801 machine learning Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 42
- 230000008569 process Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000009827 uniform distribution Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- KHMVXSQLPUNRCF-UHFFFAOYSA-N DL-Adalin Natural products C1CCC2CC(=O)CC1(CCCCC)N2 KHMVXSQLPUNRCF-UHFFFAOYSA-N 0.000 description 2
- OPNPQXLQERQBBV-UHFFFAOYSA-N carbromal Chemical compound CCC(Br)(CC)C(=O)NC(N)=O OPNPQXLQERQBBV-UHFFFAOYSA-N 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 206010020400 Hostility Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
前記画像クラスに属するランダムベクトルをトレーニングされた画像生成器に入力し、前記画像クラスに属する仮想画像を生成する前に、前記第1のランダムベクトル集合における少なくとも1つのランダムベクトルを、その所属する画像クラスから前記画像クラスを除いた他の画像クラスに編集して、他の画像クラスに属する他のランダムベクトルを得るように構成される画像クラス編集モジュールを備える。
前記画像生成器に対応する画像クラス空間の属性ベクトル軸を取得するように構成されるベクトル軸取得ユニットであって、前記属性ベクトル軸は、前記画像クラス空間における任意の2つの画像クラスに対応する分類面の法線ベクトルである、ベクトル軸取得ユニットと、
前記属性ベクトル軸に基づいて、前記第1のランダムベクトル集合における少なくとも1つのランダムベクトルを、その所属する画像クラスから前記画像クラスを除いた他の画像クラスに編集して、他の画像クラスに属する他のランダムベクトルを得るように構成されるクラス編集ユニットと、を備えてもよい。
第1の画像クラスに属するランダムベクトルに、前記属性ベクトル軸と編集スケールパラメータとの積を加算し、第2の画像クラスに属するランダムベクトルを得るように構成される第1の編集サブユニット、および/または、
第2の画像クラスに属するランダムベクトルから、前記属性ベクトル軸と編集スケールパラメータとの積を減算し、第1の画像クラスに属するランダムベクトルを得るように構成される第2の編集サブユニットを、備えてもよい。
第2のランダムベクトル集合を取得するための第2の集合取得モジュールと、
前記第2のランダムベクトル集合における少なくとも1つのランダムベクトルをトレーニングされた前記画像生成器に入力して少なくとも1つのラベリング対象となる仮想画像を生成するように構成されるラベリング対象画像生成モジュールと、
前記ラベリング対象となる仮想画像および事前設定された画像クラスに基づいて、前記ランダムベクトルを分類およびラベリングして、分類タグを有するランダムベクトルサンプルを得るように構成される画像分類ラベリングモジュールと、
前記の分類タグを有するランダムベクトルサンプルを用いて、事前設定された分類モデルをトレーニングしてトレーニングされた分類器を取得するように構成される分類モデルトレーニングモジュールと、を備えてもよい。
分類タグ無しの実画像を複数含むサンプル画像データセットを取得するように構成されるサンプル画像取得モジュールと、
前記サンプル画像データセットを用いて、第1の敵対的生成ネットワークに対して教師無しトレーニングを行って、トレーニングされた画像生成器を得るように構成される生成器トレーニングモジュールと、を備えてもよい。
前記画像クラスに属するランダムベクトルを、トレーニングされた画像生成器に入力して、前記画像クラスに属する仮想画像を生成した後、前記仮想画像をその所属する画像クラスに従ってラベリングして、分類タグを有する仮想画像サンプルを生成するように構成される仮想画像ラベリングモジュールと、
前記仮想画像サンプルを用いて、第2の敵対的生成ネットワークに対して教師ありトレーニングを行って、トレーニングされた画像から画像の変換モデルを得るように構成される変換モデルトレーニングモジュールであって、前記画像から画像の変換モデルは、入力された画像をその所属する画像クラスから他の画像クラスの画像に変換するように構成される、変換モデルトレーニングモジュールと、を備えてもよい。
Claims (19)
- 第1のランダムベクトル集合を取得するステップと、
トレーニングされた分類器に基づいて、前記第1のランダムベクトル集合における少なくとも1つのランダムベクトルの所属する画像クラスを確定するステップと、
前記画像クラスに属するランダムベクトルをトレーニングされた画像生成器に入力し、前記画像クラスに属する仮想画像を生成するステップと、を含む画像生成方法。 - 前記画像クラスに属するランダムベクトルをトレーニングされた画像生成器に入力し、前記画像クラスに属する仮想画像を生成する前に、
前記第1のランダムベクトル集合における少なくとも1つのランダムベクトルを、その所属する画像クラスから前記画像クラスを除いた他の画像クラスに編集して、他の画像クラスに属する他のランダムベクトルを得るステップを、さらに含む、請求項1に記載の方法。 - 前記第1のランダムベクトル集合における少なくとも1つのランダムベクトルを、その所属する画像クラスから前記画像クラスを除いた他の画像クラスに編集して、他の画像クラスに属する他のランダムベクトルを得るステップは、
前記画像生成器に対応する画像クラス空間の属性ベクトル軸を取得するステップであって、前記属性ベクトル軸は、前記画像クラス空間におけるいずれか2つの画像クラスに対応する分類面の法線ベクトルである、ステップと、
前記属性ベクトル軸に基づいて、前記第1のランダムベクトル集合における少なくとも1つのランダムベクトルを、その所属する画像クラスから前記画像クラスを除いた他の画像クラスに編集して、他の画像クラスに属する他のランダムベクトルを得るステップと、を含む請求項2に記載の方法。 - 前記属性ベクトル軸に基づいて、前記第1のランダムベクトル集合における少なくとも1つのランダムベクトルを、その所属する画像クラスから前記画像クラスを除いた他の画像クラスに編集して、他の画像クラスに属する他のランダムベクトルを得るステップは、
第1の画像クラスに属するランダムベクトルに、前記属性ベクトル軸と編集スケールパラメータとの積を加算し、第2の画像クラスに属するランダムベクトルを得るステップ、および/または、
第2の画像クラスに属するランダムベクトルから、前記属性ベクトル軸と編集スケールパラメータとの積を減算し、第1の画像クラスに属するランダムベクトルを得るステップ、を含み、
前記属性ベクトル軸は、前記第1の画像クラスに対応する画像クラス空間から前記第2の画像クラスに対応する画像クラス空間に指向する、請求項3に記載の方法。 - 第2のランダムベクトル集合を取得するステップと、
前記第2のランダムベクトル集合における少なくとも1つのランダムベクトルを、トレーニングされた前記画像生成器に入力して、少なくとも1つのラベリング対象となる仮想画像を生成するステップと、
前記ラベリング対象となる仮想画像および事前設定された画像クラスによって、前記ランダムベクトルを分類およびラベリングし、分類タグを有するランダムベクトルサンプルを得るステップと、
前記の分類タグを有するランダムベクトルサンプルを用いて、事前設定された分類モデルをトレーニングして、トレーニングされた分類器を得るステップと、を含む請求項1に記載の方法。 - 前記第1のランダムベクトル集合におけるランダムベクトルの数が前記第2のランダムベクトル集合におけるランダムベクトルの数よりも大きい、請求項5に記載の方法。
- 分類タグ無しの実画像を複数含むサンプル画像データセットを取得するステップと、
前記サンプル画像データセットを用いて、第1の敵対的生成ネットワークに対して教師無しトレーニングを行って、トレーニングされた画像生成器を得るステップと、をさらに含む請求項1に記載の方法。 - 前記画像クラスに属するランダムベクトルをトレーニングされた画像生成器に入力して前記画像クラスに属する仮想画像を生成した後、さらに、
前記仮想画像をその所属する画像クラスに従ってラベリングして分類タグを有する仮想画像サンプルを生成するステップと、
前記仮想画像サンプルを用いて、第2の敵対的生成ネットワークに対して教師ありトレーニングを行って、入力された画像をその所属する画像クラスから他の画像クラスの画像に変換するための、トレーニングされた画像から画像の変換モデルを得るステップと、を含む請求項1〜7のいずれか1項に記載の方法。 - 第1のランダムベクトル集合を取得するように構成される第1の集合取得モジュールと、
トレーニングされた分類器によって、前記第1のランダムベクトル集合における少なくとも1つのランダムベクトルの所属する画像クラスを確定するように構成される画像クラス確定モジュールと、
前記画像クラスに属するランダムベクトルをトレーニングされた画像生成器に入力し、前記画像クラスに属する仮想画像を生成するように構成される仮想画像生成モジュールと、を備える画像生成装置。 - 前記画像クラスに属するランダムベクトルをトレーニングされた画像生成器に入力して前記画像クラスに属する仮想画像を生成する前に、前記第1のランダムベクトル集合における少なくとも1つのランダムベクトルを、その所属する画像クラスから前記画像クラスを除いた他の画像クラスに編集して、他の画像クラスに属する他のランダムベクトルを得るように構成される画像クラス編集モジュールを、さらに備える請求項9に記載の装置。
- 前記画像クラス編集モジュールは、
前記画像生成器に対応する画像クラス空間の属性ベクトル軸を取得するように構成されるベクトル軸取得ユニットであって、前記属性ベクトル軸は前記画像クラス空間におけるいずれか2つの画像クラスに対応する分類面の法線ベクトルである、ベクトル軸取得ユニットと、
前記属性ベクトル軸に基づいて、前記第1のランダムベクトル集合における少なくとも1つのランダムベクトルを、その所属する画像クラスから前記画像クラスを除いた他の画像クラスに編集して、他の画像クラスに属する他のランダムベクトルを得るように構成されるクラス編集ユニットと、を備える請求項10に記載の装置。 - 前記クラス編集ユニットは、
第1の画像クラスに属するランダムベクトルに、前記属性ベクトル軸と編集スケールパラメータとの積を加算し、第2の画像クラスに属するランダムベクトルを得るように構成される第1の編集サブユニット、および/または、
第2の画像クラスに属するランダムベクトルから、前記属性ベクトル軸と編集スケールパラメータとの積を減算し、第1の画像クラスに属するランダムベクトルを得るように構成される第2の編集サブユニット、を備え、
前記属性ベクトル軸は、前記第1の画像クラスに対応する画像クラス空間から前記第2の画像クラスに対応する画像クラス空間に指向する、請求項11に記載の装置。 - 第2のランダムベクトル集合を取得するように構成される第2の集合取得モジュールと、
前記第2のランダムベクトル集合における少なくとも1つのランダムベクトルをトレーニングされた前記画像生成器に入力して少なくとも1つのラベリング対象となる仮想画像を生成するように構成されるラベリング対象画像生成モジュールと、
前記ラベリング対象となる仮想画像および事前設定された画像クラスによって、前記ランダムベクトルを分類およびラベリングし、分類タグを有するランダムベクトルサンプルを得るように構成される画像分類ラベリングモジュールと、
前記の分類タグを有するランダムベクトルサンプルを用いて、事前設定された分類モデルをトレーニングして、トレーニングされた分類器を取得するように構成される分類モデルトレーニングモジュールと、をさらに備える請求項9に記載の装置。 - 前記第1のランダムベクトル集合におけるランダムベクトルの数が前記第2のランダムベクトル集合におけるランダムベクトルの数よりも大きい、請求項13に記載の装置。
- 分類タグ無しの実画像を複数含むサンプル画像データセットを取得するように構成されるサンプル画像取得モジュールと、
前記サンプル画像データセットを用いて、第1の敵対的生成ネットワークに対して教師無しトレーニングを行って、トレーニングされた画像生成器を得るように構成される生成器トレーニングモジュールと、をさらに備える請求項9に記載の装置。 - 前記画像クラスに属するランダムベクトルを、トレーニングされた画像生成器に入力して、前記画像クラスに属する仮想画像を生成した後、前記仮想画像をその所属する画像クラスによってラベリングして分類タグを有する仮想画像サンプルを生成するように構成される仮想画像ラベリングモジュールと、
前記仮想画像サンプルを用いて、第2の敵対的生成ネットワークに対して教師ありトレーニングを行って、入力された画像をその所属する画像クラスから他の画像クラスの画像に変換するための、トレーニングされた画像から画像の変換モデルを得るように構成される変換モデルトレーニングモジュールと、をさらに備える請求項9〜15のいずれか1項に記載の装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されているメモリと、を備えており、
前記メモリには前記少なくとも1つのプロセッサに実行され得る指令が記憶され、前記指令が前記少なくとも1つのプロセッサによって実行されると、請求項1〜8のいずれか1項に記載の方法が実行されることを特徴とする電子機器。 - コンピュータ指令が記憶されている非一時的なコンピュータ読取可能な記憶媒体であって、
請求項1〜8のいずれか1項に記載の方法を前記コンピュータに実行させるように構成されることを特徴とする非一時的なコンピュータ読取可能な記憶媒体。 - プロセッサにより実行されると、請求項1〜8のいずれか1項に記載の方法を実現する、コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010514466.9 | 2020-06-08 | ||
CN202010514466.9A CN111709470B (zh) | 2020-06-08 | 2020-06-08 | 图像生成方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021193546A true JP2021193546A (ja) | 2021-12-23 |
JP7308235B2 JP7308235B2 (ja) | 2023-07-13 |
Family
ID=72539880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021032615A Active JP7308235B2 (ja) | 2020-06-08 | 2021-03-02 | 画像生成方法および装置、電子機器、記憶媒体並びにコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210232932A1 (ja) |
EP (1) | EP3839824B1 (ja) |
JP (1) | JP7308235B2 (ja) |
KR (1) | KR20210152371A (ja) |
CN (1) | CN111709470B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613411B (zh) * | 2020-12-25 | 2022-05-27 | 浙江大学 | 基于生成对抗网络的行人重识别数据集姿态数据增广方法 |
CN112836755B (zh) * | 2021-02-05 | 2024-04-16 | 中国科学院深圳先进技术研究院 | 基于深度学习的样本图像生成方法及其系统 |
CN114140603B (zh) * | 2021-12-08 | 2022-11-11 | 北京百度网讯科技有限公司 | 虚拟形象生成模型的训练方法和虚拟形象生成方法 |
CN114155366B (zh) * | 2022-02-07 | 2022-05-20 | 北京每日优鲜电子商务有限公司 | 动态柜图像识别模型训练方法、装置、电子设备和介质 |
CN115170807B (zh) * | 2022-09-05 | 2022-12-02 | 浙江大华技术股份有限公司 | 一种图像分割、模型训练方法、装置、设备及介质 |
CN116011084B (zh) * | 2023-02-20 | 2023-11-28 | 中国建筑西南设计研究院有限公司 | 结构平面布置整体生成方法、装置、电子设备及存储介质 |
CN117218034A (zh) * | 2023-10-09 | 2023-12-12 | 脉得智能科技(无锡)有限公司 | 一种图像增强方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273978A (zh) * | 2017-05-25 | 2017-10-20 | 清华大学 | 一种三模型博弈的产生式对抗网络模型的建立方法及装置 |
JP2019207561A (ja) * | 2018-05-29 | 2019-12-05 | 日鉄ソリューションズ株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP2020016935A (ja) * | 2018-07-23 | 2020-01-30 | 日本電信電話株式会社 | 画像認識学習装置、画像認識装置、方法、及びプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9262853B2 (en) * | 2013-03-15 | 2016-02-16 | Disney Enterprises, Inc. | Virtual scene generation based on imagery |
JP6325405B2 (ja) * | 2014-09-22 | 2018-05-16 | 株式会社東芝 | 特徴点検出装置、方法及びプログラム |
CN108388925A (zh) * | 2018-03-06 | 2018-08-10 | 天津工业大学 | 基于新型条件对抗生成网络的抗模式崩溃鲁棒图像生成方法 |
CN108763874A (zh) * | 2018-05-25 | 2018-11-06 | 南京大学 | 一种基于生成对抗网络的染色体分类方法及装置 |
US11087174B2 (en) * | 2018-09-25 | 2021-08-10 | Nec Corporation | Deep group disentangled embedding and network weight generation for visual inspection |
CN109871888A (zh) * | 2019-01-30 | 2019-06-11 | 中国地质大学(武汉) | 一种基于胶囊网络的图像生成方法及系统 |
CN109919252B (zh) * | 2019-03-26 | 2020-09-01 | 中国科学技术大学 | 利用少数标注图像生成分类器的方法 |
CN110097103A (zh) * | 2019-04-22 | 2019-08-06 | 西安电子科技大学 | 基于生成对抗网络的半监督图像分类方法 |
CN110503703B (zh) * | 2019-08-27 | 2023-10-13 | 北京百度网讯科技有限公司 | 用于生成图像的方法和装置 |
-
2020
- 2020-06-08 CN CN202010514466.9A patent/CN111709470B/zh active Active
-
2021
- 2021-03-02 JP JP2021032615A patent/JP7308235B2/ja active Active
- 2021-03-11 KR KR1020210032190A patent/KR20210152371A/ko not_active Application Discontinuation
- 2021-03-11 EP EP21161971.3A patent/EP3839824B1/en active Active
- 2021-03-15 US US17/201,681 patent/US20210232932A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273978A (zh) * | 2017-05-25 | 2017-10-20 | 清华大学 | 一种三模型博弈的产生式对抗网络模型的建立方法及装置 |
JP2019207561A (ja) * | 2018-05-29 | 2019-12-05 | 日鉄ソリューションズ株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP2020016935A (ja) * | 2018-07-23 | 2020-01-30 | 日本電信電話株式会社 | 画像認識学習装置、画像認識装置、方法、及びプログラム |
Non-Patent Citations (2)
Title |
---|
MARIANI,GIOVANNI、他4名: "BAGAN: Data Augmentation with Balancing GAN", ARXIV, JPN6022013489, 5 June 2018 (2018-06-05), pages 1 - 9, ISSN: 0004937917 * |
RADFORD,ALEC、他1名: "Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks", UNDER REVIEW AS A CONFERENCE PAPER AT ICLR 2016, JPN6022013488, 7 January 2016 (2016-01-07), pages 1 - 16, XP055786755, ISSN: 0004937916 * |
Also Published As
Publication number | Publication date |
---|---|
CN111709470B (zh) | 2023-10-03 |
EP3839824B1 (en) | 2023-11-08 |
US20210232932A1 (en) | 2021-07-29 |
EP3839824A3 (en) | 2021-10-06 |
JP7308235B2 (ja) | 2023-07-13 |
KR20210152371A (ko) | 2021-12-15 |
EP3839824A2 (en) | 2021-06-23 |
CN111709470A (zh) | 2020-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021193546A (ja) | 画像生成方法および装置、電子機器、記憶媒体並びにコンピュータプログラム | |
JP7373554B2 (ja) | クロスドメイン画像変換 | |
US20230022550A1 (en) | Image processing method, method for training image processing model devices and storage medium | |
CN109086683B (zh) | 一种基于点云语义增强的人手姿态回归方法和系统 | |
Yang et al. | Swaptext: Image based texts transfer in scenes | |
US20210201161A1 (en) | Method, apparatus, electronic device and readable storage medium for constructing key-point learning model | |
KR102566277B1 (ko) | 이미지 편집 모델 구축 방법 및 장치 | |
CN111741330A (zh) | 一种视频内容评估方法、装置、存储介质及计算机设备 | |
KR102487260B1 (ko) | 이미지 처리 방법, 장치, 전자 기기 및 저장 매체 | |
US11641446B2 (en) | Method for video frame interpolation, and electronic device | |
CN116721334B (zh) | 图像生成模型的训练方法、装置、设备及存储介质 | |
JP7337172B2 (ja) | 音声パケット推薦方法、装置、電子機器およびプログラム | |
CN111539897A (zh) | 用于生成图像转换模型的方法和装置 | |
KR20220014865A (ko) | 비디오 이벤트 인식 방법, 장치, 전자 기기 및 기록 매체 | |
US11836836B2 (en) | Methods and apparatuses for generating model and generating 3D animation, devices and storage mediums | |
JP2023545052A (ja) | 画像処理モデルの訓練方法及び装置、画像処理方法及び装置、電子機器並びにコンピュータプログラム | |
JP2022002093A (ja) | 顔編集方法、装置、電子デバイス及び可読記憶媒体 | |
US20220222878A1 (en) | Method and system for providing visual text analytics | |
CN113362409B (zh) | 图像上色及其模型训练方法、装置、电子设备、存储介质 | |
JP2021190088A (ja) | 画像翻訳方法及び装置、画像翻訳モデルのトレーニング方法及び装置 | |
JP2021190085A (ja) | 画像翻訳方法及び装置、画像翻訳モデルトレーニング方法及び装置 | |
Wei et al. | Semantic Consistency Reasoning for 3-D Object Detection in Point Clouds | |
Liu et al. | Prediction with Visual Evidence: Sketch Classification Explanation via Stroke-Level Attributions | |
US20240135630A1 (en) | Image synthesis using diffusion models created from single or multiple view images | |
Tang et al. | DPStyler: Dynamic PromptStyler for Source-Free Domain Generalization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220412 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7308235 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |