JP2021190088A - 画像翻訳方法及び装置、画像翻訳モデルのトレーニング方法及び装置 - Google Patents
画像翻訳方法及び装置、画像翻訳モデルのトレーニング方法及び装置 Download PDFInfo
- Publication number
- JP2021190088A JP2021190088A JP2020217692A JP2020217692A JP2021190088A JP 2021190088 A JP2021190088 A JP 2021190088A JP 2020217692 A JP2020217692 A JP 2020217692A JP 2020217692 A JP2020217692 A JP 2020217692A JP 2021190088 A JP2021190088 A JP 2021190088A
- Authority
- JP
- Japan
- Prior art keywords
- image
- domain
- translated
- target
- generator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 184
- 238000000034 method Methods 0.000 title claims abstract description 134
- 238000012549 training Methods 0.000 title claims abstract description 69
- 238000012545 processing Methods 0.000 claims abstract description 96
- 230000004927 fusion Effects 0.000 claims abstract description 39
- 230000008569 process Effects 0.000 claims description 30
- 230000009466 transformation Effects 0.000 claims description 24
- 230000015654 memory Effects 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 230000014616 translation Effects 0.000 description 156
- 238000010586 diagram Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 10
- 230000001131 transforming effect Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 7
- 241000894007 species Species 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000010428 oil painting Methods 0.000 description 4
- 210000004709 eyebrow Anatomy 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 235000014443 Pyrus communis Nutrition 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010422 painting Methods 0.000 description 2
- 238000010429 water colour painting Methods 0.000 description 2
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 240000006413 Prunus persica var. persica Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/18—Image warping, e.g. rearranging pixels individually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
第7の態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムのおける命令が実行された場合に、第1の態様の実施例に記載の画像翻訳方法または第2の態様の実施例に記載の画像翻訳モデルのトレーニング方法が実行される。
ステップ101:元の画像を含む画像翻訳要求を取得する。
ターゲット翻訳画像が属する第1ドメインに基づいて、ターゲット生成器を取得するステップをさらに含む。
ターゲット生成器を利用して、元の画像を処理して、元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するステップをさらに含むことができる。
元の画像を認識し、元の画像が属する第2ドメインを決定するステップと、元の画像が属する第2ドメイン及びターゲット翻訳画像が属する第1ドメインに基づいて、N種の生成器からターゲット生成器を選択するステップとをさらに含む。
元の画像を認識して、元の画像が属する第2ドメインを決定するステップと、元の画像が属する第2ドメインに基づいて、ターゲット生成器を取得するステップとをさらに含む。
ターゲット生成器を利用して、元の画像を処理して、元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するステップを含むことができる。
ターゲット翻訳画像が属する第1ドメインを取得するステップと、ターゲット翻訳画像が属する第1ドメイン、及び元の画像が属する第2ドメインに基づいて、N種の生成器からターゲット生成器を選択するステップとをさらに含む。
ステップ201:元の画像を処理して、元の画像に含まれたターゲットオブジェクトの第1ドメインでの特徴を取得する。
ステップ301:マスク画像中の各ピクセルの画素値に基づいて、予め翻訳された画像の第1加重及び変形された画像の第2加重を決定する。
ステップ701:トレーニングサンプルセットを取得する。
像翻訳モデルをトレーニングし、トレーニングされた画像翻訳モデルにより画像を翻訳し、生成されたターゲット翻訳画像に元の画像から変形して生成された変形された画像が含まれるため、ターゲット翻訳画像がオリジナル画像で入力された高精細かつ豊かな高周波詳細情報を活用し、生成されたターゲット翻訳画像の解像度を向上させるとともに、生成されたターゲット翻訳画像の背景部分がオリジナル画像に一致し、それにより、画像のシームレス融合を実現でき、生成されたターゲット翻訳画像の自然さを大幅に向上させるとともに、該画像翻訳モデルのトレーニング方法が簡単かつ効率的であり、画像翻訳モデルの担持が低い。
ステップ801:第2初期生成器を利用して第3画像セットにおける画像をそれぞれ処理して、第2予め翻訳された画像セット、第2マスク画像セット及び第2変形パラメータセットを生成する。
Claims (23)
- 画像翻訳方法であって
元の画像を含む画像翻訳要求を取得するステップと、
前記元の画像を処理し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するステップと、 前記変形パラメータに基づいて、前記元の画像に対して変形処理を行って、変形された画像を取得するステップと、
前記変形された画像、前記予め翻訳された画像及び前記マスク画像を融合して、ターゲット翻訳画像を生成するステップとを含む、
ことを特徴とする画像翻訳方法。 - 前記翻訳要求は、前記ターゲット翻訳画像が属する第1ドメインをさらに含み、画像翻訳要求を取得するステップの後に、
前記ターゲット翻訳画像が属する第1ドメインに基づいて、ターゲット生成器を取得するステップをさらに含み、
前記元の画像を処理し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するステップは、
前記ターゲット生成器を利用して、前記元の画像を処理し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するステップを含む、
ことを特徴とする請求項1に記載の方法。 - 前記ターゲット翻訳画像が属する第1ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、画像翻訳要求を取得するステップの後に、
前記元の画像を認識して、前記元の画像が属する第2ドメインを決定するステップと、
前記元の画像が属する第2ドメイン及び前記ターゲット翻訳画像が属する第1ドメインに基づいて、前記N種の生成器から前記ターゲット生成器を選択するステップとをさらに含む、
ことを特徴とする請求項2に記載の方法。 - 前記画像翻訳要求を取得するステップの後に、
前記元の画像を認識して、前記元の画像が属する第2ドメインを決定するステップと、
前記元の画像が属する第2ドメインに基づいて、ターゲット生成器を取得するステップをさらに含み、
前記元の画像を処理し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するステップは、
前記ターゲット生成器を利用して、前記元の画像を処理し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するステップを含む、
ことを特徴とする請求項1に記載の方法。 - 前記元の画像が属する第2ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、画像翻訳要求を取得するステップの後に、
ターゲット翻訳画像が属する第1ドメインを取得するステップと、
前記ターゲット翻訳画像が属する第1ドメイン及び前記元の画像が属する第2ドメインに基づいて、前記N種の生成器から前記ターゲット生成器を選択するステップとをさらに含む、
ことを特徴とする請求項4に記載の方法。 - 前記元の画像を処理し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するステップは、
前記元の画像を処理して、前記元の画像に含まれたターゲットオブジェクトの第1ドメインでの特徴を取得するステップと、
前記ターゲットオブジェクトの第1ドメインでの特徴に基づいて、ターゲットオブジェクトの前記第2ドメインでの画像を再構築し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するステップとを含む、
ことを特徴とする請求項1〜5のいずれか1項に記載の方法。 - 前記変形された画像、前記予め翻訳された画像及び前記マスク画像を融合して、ターゲット翻訳画像を生成するステップは、
前記マスク画像中の各ピクセルの画素値に基づいて、前記予め翻訳された画像の第1加重及び前記変形された画像の第2加重を決定するステップと、
前記第1加重及び前記第2加重に基づいて、前記予め翻訳された画像中の各ピクセルの画素値と前記変形された画像中の各ピクセルの画素値とを融合して、前記ターゲット翻訳画像を生成するステップとを含む、
ことを特徴とする請求項1〜5のいずれか1項に記載の方法。 - 画像翻訳モデルのトレーニング方法であって
第1ドメインに属する第1画像セット、及び第2ドメインに属する第2画像セットを含むトレーニングサンプルセットを取得するステップと、
第1初期生成器を利用して前記第1画像セットにおける画像をそれぞれ処理して、第1予め翻訳された画像セット、第1マスク画像セット及び第1変形パラメータセットを生成するステップと、
前記第1変形パラメータセットに基づいて、前記第1画像セットにおける画像に対してそれぞれ変形処理を行って、第1変形された画像セットを取得するステップと、
前記第1変形された画像セット、前記第1予め翻訳された画像セット及び前記第1マスク画像セットにおける対応する画像をそれぞれ融合して、第3画像セットを取得するステップと、
前記第3画像セットにおける画像及び前記第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、前記第1初期判断装置から出力された前記第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び前記第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを取得するステップと、
前記第1確率セット及び前記第2確率セットに基づいて、前記第1初期生成器及び前記第1初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に翻訳するための第1ドメインに属するターゲット生成器を生成するステップとを含む、
ことを特徴とする画像翻訳モデルのトレーニング方法。 - 前記第1画像セットにおける画像がそれぞれ前記第2画像セットにおける画像に1つずつマッチングする、ことを特徴とする請求項8に記載のトレーニング方法。
- 第1画像セットにおける画像が前記第2画像セットにおける画像にマッチングしておらず、前記第1確率セット及び前記第2確率セットに基づいて、前記第1初期生成器及び前記第1初期判断装置を補正した後に、
第2初期生成器を利用して前記第3画像セットにおける画像をそれぞれ処理して、第2予め翻訳された画像セット、第2マスク画像セット及び第2変形パラメータセットを生成するステップと、
前記第2変形パラメータセットに基づいて、前記第3画像セットにおける画像に対してそれぞれ変形処理を行って、第2変形された画像セットを取得するステップと、
前記第2変形された画像セット、第2予め翻訳された画像セット及び前記第2マスク画像セットにおける対応する画像をそれぞれ融合して、第4画像セットを取得するステップと、
前記第4画像セットにおける画像及び前記第1画像セットにおける画像をそれぞれ第2初期判断装置に入力して、前記第2初期判断装置から出力された前記第4画像セットにおける画像がそれぞれ実際の画像に属する第3確率セット、及び前記第1画像セットにおける画像がそれぞれ実際の画像に属する第4確率セットを取得するステップと、
前記第3確率セット及び前記第4確率セットに基づいて、前記第1初期生成器、前記第2初期生成器、前記第1初期判断装置及び前記第2初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に翻訳するための第1ドメインに属するターゲット生成器、及び第2ドメインに位置する画像を第1ドメインに位置する画像に翻訳するための第2ドメインに属するターゲット生成器を生成するステップとをさらに含む、
ことを特徴とする請求項8に記載のトレーニング方法。 - 画像翻訳装置であって
元の画像を含む画像翻訳要求を取得するための第1取得モジュールと、
前記元の画像を処理し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するための第1処理モジュールと、
前記変形パラメータに基づいて、前記元の画像に対して変形処理を行って、変形された画像を取得するための第2処理モジュールと、
前記変形された画像、前記予め翻訳された画像及び前記マスク画像を融合して、ターゲット翻訳画像を生成するための第1融合モジュールとを備える、
ことを特徴とする画像翻訳装置。 - 前記翻訳要求は、前記ターゲット翻訳画像が属する第1ドメインをさらに含み、前記第1取得モジュールは、画像翻訳要求を取得した後に、さらに、
前記ターゲット翻訳画像が属する第1ドメインに基づいて、ターゲット生成器を取得するために用いられ、
前記第1処理モジュールは、具体的には、
前記ターゲット生成器を利用して、前記元の画像を処理し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するために用いられる、
ことを特徴とする請求項11に記載の装置。 - 前記ターゲット翻訳画像が属する第1ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、前記第1取得モジュールは、画像翻訳要求を取得した後に、さらに、
前記元の画像を認識して、前記元の画像が属する第2ドメインを決定し、
前記元の画像が属する第2ドメイン及び前記ターゲット翻訳画像が属する第1ドメインに基づいて、前記N種の生成器から前記ターゲット生成器を選択するために用いられる、
ことを特徴とする請求項12に記載の装置。 - 前記第1取得モジュールは、画像翻訳要求を取得した後に、さらに、
前記元の画像を認識して、前記元の画像が属する第2ドメインを決定し、
前記元の画像が属する第2ドメインに基づいて、ターゲット生成器を取得するために用いられ、
前記第1処理モジュールは、具体的には、
前記ターゲット生成器を利用して、前記元の画像を処理し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するために用いられる、
ことを特徴とする請求項11に記載の装置。 - 前記元の画像が属する第2ドメインに対応する生成器がN(Nは1より大きい整数である)種であると、前記第1取得モジュールは、画像翻訳要求を取得した後に、さらに、
ターゲット翻訳画像が属する第1ドメインを取得し、
前記ターゲット翻訳画像が属する第1ドメイン及び前記元の画像が属する第2ドメインに基づいて、前記N種の生成器から前記ターゲット生成器を選択するために用いられる、
ことを特徴とする請求項14に記載の装置。 - 前記第1処理モジュールは、
前記元の画像を処理して、前記元の画像に含まれたターゲットオブジェクトの第1ドメインでの特徴を取得するための第1処理ユニットと、
前記ターゲットオブジェクトの第1ドメインでの特徴に基づいて、ターゲットオブジェクトの前記第2ドメインでの画像を再構築し、前記元の画像に対応する予め翻訳された画像、マスク画像及び変形パラメータを生成するための最構築ユニットとを備える、
ことを特徴とする請求項11〜15のいずれか1項に記載の装置。 - 前記第1融合モジュールは、
前記マスク画像中の各ピクセルの画素値に基づいて、前記予め翻訳された画像の第1加重及び前記変形された画像の第2加重を決定するための決定ユニットと、
前記第1加重及び前記第2加重に基づいて、前記予め翻訳された画像中の各ピクセルの画素値と前記変形された画像中の各ピクセルの画素値とを融合して、前記ターゲット翻訳画像を生成するための第1融合ユニットとを備える、
ことを特徴とする請求項11〜15のいずれか1項に記載の装置。 - 画像翻訳モデルのトレーニング装置であって
第1ドメインに属する第1画像セット、及び第2ドメインに属する第2画像セットを含むトレーニングサンプルセットを取得するための第2取得モジュールと、
第1初期生成器を利用して前記第1画像セットにおける画像をそれぞれ処理して、第1予め翻訳された画像セット、第1マスク画像セット及び第1変形パラメータセットを生成するための第3処理モジュールと、
前記第1変形パラメータセットに基づいて、前記第1画像セットにおける画像に対してそれぞれ変形処理を行って、第1変形された画像セットを取得するための第4処理モジュールと、
前記第1変形された画像セット、前記第1予め翻訳された画像セット及び前記第1マスク画像セットにおける対応する画像をそれぞれ融合して、第3画像セットを取得するための第2融合モジュールと、
前記第3画像セットにおける画像及び前記第2画像セットにおける画像をそれぞれ第1初期判断装置に入力して、前記第1初期判断装置から出力された前記第3画像セットにおける画像がそれぞれ実際の画像に属する第1確率セット、及び前記第2画像セットにおける画像がそれぞれ実際の画像に属する第2確率セットを取得するための第3取得モジュールと、
前記第1確率セット及び前記第2確率セットに基づいて、前記第1初期生成器及び前記第1初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に翻訳するための第1ドメインに属するターゲット生成器を生成するための第1補正モジュールとを備える、
ことを特徴とする画像翻訳モデルのトレーニング装置。
- 前記第1画像セットにおける画像がそれぞれ前記第2画像セットにおける画像に1つずつマッチングする、 ことを特徴とする請求項18に記載のトレーニング装置。
- 第1画像セットにおける画像が前記第2画像セットにおける画像にマッチングしておらず、前記トレーニング装置は、
第2初期生成器を利用して前記第3画像セットにおける画像をそれぞれ処理して、第2予め翻訳された画像セット、第2マスク画像セット及び第2変形パラメータセットを生成するための第5処理モジュールと、
前記第2変形パラメータセットに基づいて、前記第3画像セットにおける画像に対してそれぞれ変形処理を行って、第2変形された画像セットを取得するための第6処理モジュールと、 前記第2変形された画像セット、第2予め翻訳された画像セット及び前記第2マスク画像セットにおける対応する画像をそれぞれ融合して、第4画像セットを取得するための第3融合モジュールと、
前記第4画像セットにおける画像及び前記第1画像セットにおける画像をそれぞれ第2初期判断装置に入力して、前記第2初期判断装置から出力された前記第4画像セットにおける画像がそれぞれ実際の画像に属する第3確率セット、及び前記第1画像セットにおける画像がそれぞれ実際の画像に属する第4確率セットを取得するための第4取得モジュールと、
前記第3確率セット及び前記第4確率セットに基づいて、前記第1初期生成器、前記第2初期生成器、前記第1初期判断装置及び前記第2初期判断装置を補正して、第1ドメインに位置する画像を第2ドメインに位置する画像に翻訳するための第1ドメインに属するターゲット生成器、及び第2ドメインに位置する画像を第1ドメインに位置する画像に翻訳するための第2ドメインに属するターゲット生成器を生成するための第2補正モジュールとをさらに備える、
ことを特徴とする請求項18に記載のトレーニング装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されるメモリとを備え、
前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令が記憶され、前記命令が前記少なくとも1つのプロセッサにより実行されることにより、前記少なくとも1つのプロセッサが請求項1〜7のいずれか1項に記載の方法または請求項8〜10のいずれか1項に記載のトレーニング方法を実行できる、 ことを特徴とする電子機器。
- コンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体であって、
前記コンピュータ命令は、前記コンピュータに請求項1〜7のいずれか1項に記載の方法または請求項8〜10のいずれか1項に記載のトレーニング方法を実行させる、
ことを特徴とするコンピュータ命令が記憶されている非一時的なコンピュータ可読記憶媒体。 - コンピュータプログラムであって、
前記コンピュータプログラムにおける命令が実行された場合に、前記コンピュータに請求項1〜7のいずれか1項に記載の方法または請求項8〜10のいずれか1項に記載のトレーニング方法が実行される、
ことを特徴とするコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010484274.8A CN111833238B (zh) | 2020-06-01 | 2020-06-01 | 图像的翻译方法和装置、图像翻译模型的训练方法和装置 |
CN202010484274.8 | 2020-06-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021190088A true JP2021190088A (ja) | 2021-12-13 |
JP7419226B2 JP7419226B2 (ja) | 2024-01-22 |
Family
ID=72897497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020217692A Active JP7419226B2 (ja) | 2020-06-01 | 2020-12-25 | 画像変換方法及び装置、画像変換モデルのトレーニング方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11526971B2 (ja) |
EP (1) | EP3920130A1 (ja) |
JP (1) | JP7419226B2 (ja) |
KR (1) | KR102521013B1 (ja) |
CN (1) | CN111833238B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113112400B (zh) * | 2021-05-07 | 2024-04-09 | 深圳追一科技有限公司 | 一种模型训练方法及模型训练装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2551172B (en) * | 2016-06-08 | 2019-02-20 | Sts Defence Ltd | Predicting temperature rise event |
US20180247201A1 (en) | 2017-02-28 | 2018-08-30 | Nvidia Corporation | Systems and methods for image-to-image translation using variational autoencoders |
EP3649579A1 (en) * | 2017-08-07 | 2020-05-13 | Siemens Aktiengesellschaft | Improved technique for machine visual learning |
WO2019075666A1 (zh) * | 2017-10-18 | 2019-04-25 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、终端及存储介质 |
US10388002B2 (en) * | 2017-12-27 | 2019-08-20 | Facebook, Inc. | Automatic image correction using machine learning |
US10719742B2 (en) * | 2018-02-15 | 2020-07-21 | Adobe Inc. | Image composites using a generative adversarial neural network |
WO2019178237A1 (en) * | 2018-03-14 | 2019-09-19 | Butterfly Network, Inc. | Methods and apparatuses for generating and displaying ultrasound images using an explaining model |
US10825219B2 (en) * | 2018-03-22 | 2020-11-03 | Northeastern University | Segmentation guided image generation with adversarial networks |
CN108717719A (zh) * | 2018-05-23 | 2018-10-30 | 腾讯科技(深圳)有限公司 | 卡通人脸图像的生成方法、装置及计算机存储介质 |
CN109377537B (zh) * | 2018-10-18 | 2020-11-06 | 云南大学 | 重彩画的风格转移方法 |
CN111127304B (zh) * | 2018-10-31 | 2024-02-20 | 微软技术许可有限责任公司 | 跨域图像转换 |
CN113016005A (zh) * | 2018-11-13 | 2021-06-22 | 三星电子株式会社 | 联合无监督对象分割与修复 |
GB201818759D0 (en) * | 2018-11-16 | 2019-01-02 | Anthropics Tech Limited | Method of modifying digital images |
US11748851B2 (en) * | 2019-03-25 | 2023-09-05 | Korea Advanced Institute Of Science And Technology | Method of replacing missing image data by using neural network and apparatus thereof |
WO2020202680A1 (ja) * | 2019-03-29 | 2020-10-08 | キヤノン株式会社 | 情報処理装置及び情報処理方法 |
US11120526B1 (en) * | 2019-04-05 | 2021-09-14 | Snap Inc. | Deep feature generative adversarial neural networks |
US11017560B1 (en) * | 2019-04-15 | 2021-05-25 | Facebook Technologies, Llc | Controllable video characters with natural motions extracted from real-world videos |
US11366985B2 (en) * | 2020-05-15 | 2022-06-21 | Retrace Labs | Dental image quality prediction platform using domain specific artificial intelligence |
CN110189249B (zh) * | 2019-05-24 | 2022-02-18 | 深圳市商汤科技有限公司 | 一种图像处理方法及装置、电子设备和存储介质 |
CN110322416B (zh) * | 2019-07-09 | 2022-11-18 | 腾讯科技(深圳)有限公司 | 图像数据处理方法、装置以及计算机可读存储介质 |
CN110648309B (zh) * | 2019-08-12 | 2024-05-28 | 平安科技(深圳)有限公司 | 基于条件生成对抗网络合成红细胞图像的方法及相关设备 |
CN110796111B (zh) * | 2019-11-05 | 2020-11-10 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备及存储介质 |
CN113966522A (zh) * | 2019-11-25 | 2022-01-21 | Essenlix 公司 | 基于成像的测定的有效训练和准确度改进 |
CN111047509A (zh) * | 2019-12-17 | 2020-04-21 | 中国科学院深圳先进技术研究院 | 一种图像特效处理方法、装置及终端 |
US11860925B2 (en) * | 2020-04-17 | 2024-01-02 | Accenture Global Solutions Limited | Human centered computing based digital persona generation |
US20220036564A1 (en) * | 2020-08-03 | 2022-02-03 | Korea Advanced Institute Of Science And Technology | Method of classifying lesion of chest x-ray radiograph based on data normalization and local patch and apparatus thereof |
-
2020
- 2020-06-01 CN CN202010484274.8A patent/CN111833238B/zh active Active
- 2020-11-30 US US17/107,196 patent/US11526971B2/en active Active
- 2020-12-24 KR KR1020200183347A patent/KR102521013B1/ko active IP Right Grant
- 2020-12-25 JP JP2020217692A patent/JP7419226B2/ja active Active
-
2021
- 2021-01-05 EP EP21150145.7A patent/EP3920130A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
CN111833238A (zh) | 2020-10-27 |
EP3920130A1 (en) | 2021-12-08 |
CN111833238B (zh) | 2023-07-25 |
US20210374924A1 (en) | 2021-12-02 |
KR102521013B1 (ko) | 2023-04-12 |
JP7419226B2 (ja) | 2024-01-22 |
KR20210149574A (ko) | 2021-12-09 |
US11526971B2 (en) | 2022-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102410328B1 (ko) | 얼굴 융합 모델 트레이닝 방법, 장치 및 전자 기기 | |
KR102565659B1 (ko) | 정보 생성 방법 및 장치 | |
JP7342062B2 (ja) | 画像処理方法、装置、電子機器及び記憶媒体 | |
US20230022550A1 (en) | Image processing method, method for training image processing model devices and storage medium | |
US11710215B2 (en) | Face super-resolution realization method and apparatus, electronic device and storage medium | |
US20210398334A1 (en) | Method for creating image editing model, and electronic device and storage medium thereof | |
EP3839824A2 (en) | Method and apparatus for generating image, device, medium and program | |
CN105183720A (zh) | 基于rnn模型的机器翻译方法和装置 | |
JP7282932B2 (ja) | フォント生成モデルトレーニング方法、字庫作成方法、装置及び機器 | |
US11928563B2 (en) | Model training, image processing method, device, storage medium, and program product | |
JP2021192294A (ja) | 人体3dキー点検出方法、モデル訓練方法及び関連装置 | |
CN111539897A (zh) | 用于生成图像转换模型的方法和装置 | |
JP2022006189A (ja) | 画像処理方法、事前トレーニングモデルのトレーニング方法、装置及び電子機器 | |
JP2021190088A (ja) | 画像翻訳方法及び装置、画像翻訳モデルのトレーニング方法及び装置 | |
US20210224476A1 (en) | Method and apparatus for describing image, electronic device and storage medium | |
JP2022002093A (ja) | 顔編集方法、装置、電子デバイス及び可読記憶媒体 | |
US11508044B2 (en) | Method for translating image, method for training image translation model | |
KR20210131221A (ko) | 이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램 | |
CN111126087B (zh) | 领域翻译处理方法、装置及设备 | |
CN117076838A (zh) | 一种数据处理方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220509 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230113 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20230113 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230123 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20230124 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20230210 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20230214 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230314 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7419226 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |