JP7542156B2 - 人物画像修復方法、装置、電子機器、記憶媒体及びプログラム製品 - Google Patents
人物画像修復方法、装置、電子機器、記憶媒体及びプログラム製品 Download PDFInfo
- Publication number
- JP7542156B2 JP7542156B2 JP2023537450A JP2023537450A JP7542156B2 JP 7542156 B2 JP7542156 B2 JP 7542156B2 JP 2023537450 A JP2023537450 A JP 2023537450A JP 2023537450 A JP2023537450 A JP 2023537450A JP 7542156 B2 JP7542156 B2 JP 7542156B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- face
- repaired
- feature map
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 86
- 230000001815 facial effect Effects 0.000 claims description 118
- 238000003062 neural network model Methods 0.000 claims description 59
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 24
- 238000006731 degradation reaction Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 16
- 230000015556 catabolic process Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 11
- 230000006835 compression Effects 0.000 claims description 10
- 238000007906 compression Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000003709 image segmentation Methods 0.000 claims description 5
- 230000008439 repair process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000010276 construction Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
修復対象の顔画像を取得するための画像取得モジュールと、
前記修復対象の顔画像の輝度チャンネルを抽出し、前記輝度チャンネルに基づいて人物画像修復を行い、目標顔画像を得るための人物画像修復モジュールと、
前記目標顔画像及び前記修復対象の顔画像の色チャンネルを融合して、第1の顔修復画像を得るための画像融合モジュールと、
前記第1の顔修復画像に対して画像変換処理を行い、第2の顔修復画像を得るための画像調整モジュールと、を含む人物画像修復装置を提供する。
前記目標特徴マップを前記第2のネットワークにおける前記N個のぼかしアップサンプリングモジュールに入力してぼかしアップサンプリングを行い、第2の特徴マップを得るS41と、
前記N個のぼかしアップサンプリングモジュールのうちの1番目~(N-1)番目のぼかしアップサンプリングモジュールから出力される特徴マップを前記第3のネットワークに入力してアップサンプリングを行い、第3の特徴マップを得るS42と、
前記輝度チャンネル、前記第2の特徴マップ及び前記第3の特徴マップを重ね合わせて、前記目標顔画像を得るS43と、を含む。
前記人物画像マスクのエッジに対してガウシアンぼかしを行うことと、前記元画像における前記顔画像の切り取り位置、及び前記人物画像マスクに基づいて、前記第2の顔修復画像における顔を、切り取り後の前記元画像に貼り戻して、前記元画像の修復を完了させることと、をさらに含む。
修復対象の顔画像を取得するための画像取得モジュール81と、
前記修復対象の顔画像の輝度チャンネルを抽出し、前記輝度チャンネルに基づいて人物画像修復を行い、目標顔画像を得るための人物画像修復モジュール82と、
前記目標顔画像及び前記修復対象の顔画像の色チャンネルを融合して、第1の顔修復画像を得るための画像融合モジュール83と、
前記第1の顔修復画像に対して画像変換処理を行い、第2の顔修復画像を得るための画像調整モジュール84と、を含む。
前記修復対象の顔画像のフォーマットが第1のフォーマットである場合、前記修復対象の顔画像の前記輝度チャンネルを抽出すること、または、前記修復対象の顔画像のフォーマットが第2のフォーマットである場合、前記修復対象の顔画像のフォーマットを前記第1のフォーマットに変換し、フォーマット変換後の前記修復対象の顔画像の前記輝度チャンネルを抽出することに用いられる。
前記輝度チャンネルをトレーニング済みのニューラルネットワークモデルに入力して人物画像修復を行い、前記目標顔画像を得ることに用いられる。
前記第1のネットワークを用いて前記輝度チャンネルに対して符号化操作を行い、目標特徴マップを得ることと、前記第2のネットワーク及び前記第3のネットワークを用いて前記目標特徴マップに対して復号化操作を行い、前記目標顔画像を得ることに用いられる。
前記輝度チャンネルを前記第1のネットワークに入力してダウンサンプリングを行い、第1の特徴マップを得ることと、前記第4のネットワークを用いて前記第1の特徴マップに対して上位層特徴抽出を行い、上位層特徴マップを得ることと、前記第1の特徴マップと前記上位層特徴マップとを重ね合わせて、前記目標特徴マップを得ることに用いられる。
前記目標特徴マップを前記第2のネットワークにおける前記N個のぼかしアップサンプリングモジュールに入力してぼかしアップサンプリングを行い、第2の特徴マップを得ることと、前記N個のぼかしアップサンプリングモジュールのうちの1番目~(N-1)番目のぼかしアップサンプリングモジュールから出力される特徴マップを前記第3のネットワークに入力してアップサンプリングを行い、第3の特徴マップを得ることと、前記輝度チャンネル、前記第2の特徴マップ及び前記第3の特徴マップを重ね合わせて、前記目標顔画像を得ることに用いられる。
前記N個のぼかしアップサンプリングモジュールのうちの1番目のぼかしアップサンプリングモジュールから出力される特徴マップのチャンネル数を圧縮して、第1の圧縮特徴マップを得ることと、前記第1の圧縮特徴マップを前記(N-1)個のアップサンプリングモジュールのうちの1番目のアップサンプリングモジュールに入力してアップサンプリングを行うことと、前記N個のぼかしアップサンプリングモジュールのうちのi(iは、1よりも大きく、N未満の整数である)番目のぼかしアップサンプリングモジュールから出力される特徴マップのチャンネル数を圧縮して、第2の圧縮特徴マップを得ることと、前記(N-1)個のアップサンプリングモジュールのうちの(i-1)番目のアップサンプリングモジュールから出力される特徴マップと前記第2の圧縮特徴マップとを重ね合わせ、重ね合わせて得られる特徴マップを前記(N-1)個のアップサンプリングモジュールのうちのi番目のアップサンプリングモジュールに入力してアップサンプリングを行うことと、前記(N-1)個のアップサンプリングモジュールによる処理を経て、前記第3の特徴マップを得ることに用いられる。
収集された元画像に対して顔検出を行うことと、前記元画像における検出された顔の位置に基づいて、顔画像を切り取ることと、前記顔画像を拡縮して、前記修復対象の顔画像を得ることに用いられる。
前記人物画像マスクのエッジに対してガウシアンぼかしを行うことと、前記元画像における前記顔画像の切り取り位置、及び前記人物画像マスクに基づいて、前記第2の顔修復画像における顔を、切り取り後の前記元画像に貼り戻して、前記元画像の修復を完了させることに用いられる。
前記第1の顔修復画像に対して色補正を行うことと、拡縮倍率を特定することと、拡縮倍率が予め設定された倍率よりも大きい場合、超解像技術を用いて色補正後の前記第1の顔修復画像を拡縮して、前記第2の顔修復画像を得ることに用いられる。
第1の顔画像と、前記第1の顔画像に基づいて得られる第2の顔画像とを含むサンプル画像ペアを構成することと、前記サンプル画像ペアをニューラルネットワークに入力してトレーニングを行い、前記第2の顔画像の修復画像を出力することと、前記修復画像及び前記第1の顔画像に基づいて目標損失を特定することと、前記目標損失を最小化するように、前記ニューラルネットワークのパラメータを調整して、前記ニューラルネットワークモデルを得ることに用いられる。
予め設定された前記第1の顔画像を取得することと、前記第1の顔画像の画質が劣化していない場合、前記第1の顔画像に対して大気擾乱劣化を行い、第1の劣化画像を得て、前記第1の劣化画像に対してダウンサンプリングを行い、目標劣化画像を得て、前記目標劣化画像に対してアップサンプリングを行い、第2の劣化画像を得て、前記第2の劣化画像に基づいて第3の劣化画像を得て、予め設定された圧縮品質パラメータを用いて前記第3の劣化画像を圧縮して、第4の劣化画像を得て、前記第4の劣化画像において矩形領域を決定し、前記第1の顔画像において前記矩形領域に対応する目標領域を特定し、前記目標領域内の画素値で前記矩形領域内の対応する画素値を置き換え、前記第2の顔画像を得て、前記第1の顔画像と前記第2の顔画像により前記サンプル画像ペアを構成すること、または、前記第1の顔画像の画質が劣化した場合、2枚の前記第1の顔画像により前記サンプル画像ペアを構成し、2枚のうちのいずれか一枚を前記第2の顔画像として決定することに用いられる。
前記第2の劣化画像の輝度チャンネルにノイズを加え、前記第2の劣化画像に対して非局所的平均ノイズ除去を行い、前記第3の劣化画像を得ること、または、前記第2の化画像に対してぼかし操作を行い、第5の劣化画像を得て、前記第5の劣化画像の輝度チャンネルにノイズを加え、前記第5の劣化画像に対して非局所的平均ノイズ除去を行い、前記第3の劣化画像を得ることに用いられる。
前記目標特徴マップを前記第2のネットワークにおける前記N個のぼかしアップサンプリングモジュールに入力してぼかしアップサンプリングを行い、第2の特徴マップを得ることと、前記N個のぼかしアップサンプリングモジュールのうちの1番目~(N-1)番目のぼかしアップサンプリングモジュールから出力される特徴マップを前記第3のネットワークに入力してアップサンプリングを行い、第3の特徴マップを得ることと、前記輝度チャンネル、前記第2の特徴マップ及び前記第3の特徴マップを重ね合わせて、前記目標顔画像を得ることと、を含む。
Claims (17)
- 人物画像修復方法であって、
修復対象の顔画像を取得することと、
前記修復対象の顔画像の輝度チャンネルを抽出し、前記輝度チャンネルに基づいて人物画像修復を行い、目標顔画像を得ることと、
前記目標顔画像及び前記修復対象の顔画像の色チャンネルを融合して、第1の顔修復画像を得ることと、
前記第1の顔修復画像に対して画像変換処理を行い、第2の顔修復画像を得ることと、を含み、
前記した、前記輝度チャンネルに基づいて人物画像修復を行い、目標顔画像を得ることは、
前記輝度チャンネルをトレーニング済みのニューラルネットワークモデルに入力して人物画像修復を行い、前記目標顔画像を得ることを含み、
前記ニューラルネットワークモデルは、第1のネットワークと第2のネットワークと第3のネットワークと第4のネットワークを含み、
前記第2のネットワークは、N(Nは、1よりも大きい整数である)個のぼかしアップサンプリングモジュールを含み、前記N個のぼかしアップサンプリングモジュールのうちの少なくとも1つのぼかしアップサンプリングモジュールにおけるぼかしアップサンプリングは、ぼかし畳み込みを含み、前記ぼかし畳み込みにおける畳み込みカーネルの重みは、予め設定された一定値であり、
前記ニューラルネットワークモデルは、前記第1のネットワークの入力、前記第2のネットワークの出力及び前記第3のネットワークの出力のところにショートカット接続があり、前記第1のネットワークの出力及び前記第4のネットワークの出力のところにショートカット接続がある、人物画像修復方法。 - 前記した、前記修復対象の顔画像の輝度チャンネルを抽出することは、
前記修復対象の顔画像のフォーマットが第1のフォーマットである場合、前記修復対象の顔画像の前記輝度チャンネルを抽出すること、または、
前記修復対象の顔画像のフォーマットが第2のフォーマットである場合、前記修復対象の顔画像のフォーマットを前記第1のフォーマットに変換し、フォーマット変換後の前記修復対象の顔画像の前記輝度チャンネルを抽出することを含む、請求項1に記載の人物画像修復方法。 - 前記した、前記輝度チャンネルをトレーニング済みのニューラルネットワークモデルに入力して人物画像修復を行い、前記目標顔画像を得ることは、
前記第1のネットワークを用いて前記輝度チャンネルに対して符号化操作を行い、目標特徴マップを得ることと、
前記第2のネットワーク及び前記第3のネットワークを用いて前記目標特徴マップに対して復号化操作を行い、前記目標顔画像を得ることと、を含む、請求項1に記載の人物画像修復方法。 - 前記した、前記第1のネットワークを用いて前記輝度チャンネルに対して符号化操作を行い、目標特徴マップを得ることは、
前記輝度チャンネルを前記第1のネットワークに入力してダウンサンプリングを行い、第1の特徴マップを得ることと、
前記第4のネットワークを用いて前記第1の特徴マップに対して上位層特徴抽出を行い、上位層特徴マップを得ることと、
前記第1の特徴マップと前記上位層特徴マップとを重ね合わせて、前記目標特徴マップを得ることと、を含む、請求項3に記載の人物画像修復方法。 - 前記した、前記第2のネットワーク及び前記第3のネットワークを用いて前記目標特徴マップに対して復号化操作を行い、前記目標顔画像を得ることは、
前記目標特徴マップを前記第2のネットワークにおける前記N個のぼかしアップサンプリングモジュールに入力してぼかしアップサンプリングを行い、第2の特徴マップを得ることと、
前記N個のぼかしアップサンプリングモジュールのうちの1番目~(N-1)番目のぼかしアップサンプリングモジュールから出力される特徴マップを前記第3のネットワークに入力してアップサンプリングを行い、第3の特徴マップを得ることと、
前記輝度チャンネル、前記第2の特徴マップ及び前記第3の特徴マップを重ね合わせて、前記目標顔画像を得ることと、を含む、請求項3または4に記載の人物画像修復方法。 - 前記第3のネットワークは、(N-1)個のアップサンプリングモジュールを含み、
前記した、前記N個のぼかしアップサンプリングモジュールのうちの1番目~(N-1)番目のぼかしアップサンプリングモジュールから出力される特徴マップを前記第3のネットワークに入力してアップサンプリングを行い、第3の特徴マップを得ることは、
前記N個のぼかしアップサンプリングモジュールのうちの1番目のぼかしアップサンプリングモジュールから出力される特徴マップのチャンネル数を圧縮して、第1の圧縮特徴マップを得ることと、
前記第1の圧縮特徴マップを前記(N-1)個のアップサンプリングモジュールのうちの1番目のアップサンプリングモジュールに入力してアップサンプリングを行うことと、
前記N個のぼかしアップサンプリングモジュールのうちのi(iは、1よりも大きく、N未満の整数である)番目のぼかしアップサンプリングモジュールから出力される特徴マップのチャンネル数を圧縮して、第2の圧縮特徴マップを得ることと、
前記(N-1)個のアップサンプリングモジュールのうちの(i-1)番目のアップサンプリングモジュールから出力される特徴マップと前記第2の圧縮特徴マップとを重ね合わせ、重ね合わせて得られる特徴マップを前記(N-1)個のアップサンプリングモジュールのうちのi番目のアップサンプリングモジュールに入力してアップサンプリングを行うことと、
前記(N-1)個のアップサンプリングモジュールによる処理を経て、前記第3の特徴マップを得ることと、を含む、請求項5に記載の人物画像修復方法。 - 人物画像修復方法であって、
修復対象の顔画像を取得することと、
前記修復対象の顔画像の輝度チャンネルを抽出し、前記輝度チャンネルに基づいて人物画像修復を行い、目標顔画像を得ることと、
前記目標顔画像及び前記修復対象の顔画像の色チャンネルを融合して、第1の顔修復画像を得ることと、
前記第1の顔修復画像に対して画像変換処理を行い、第2の顔修復画像を得ることと、を含み、
前記した、修復対象の顔画像を取得することは、
収集された元画像に対して顔検出を行うことと、
前記元画像における検出された顔の位置に基づいて、顔画像を切り取ることと、
前記顔画像を拡縮して、前記修復対象の顔画像を得ることと、を含み、
前記顔画像を拡縮して、前記修復対象の顔画像を得た後に、前記方法は、
前記元画像に対して人物画像分割を行い、人物画像マスクを得ることをさらに含み、
第2の顔修復画像を得た後に、前記方法は、
前記人物画像マスクのエッジに対してガウシアンぼかしを行うことと、
前記元画像における前記顔画像の切り取り位置、及び前記人物画像マスクに基づいて、前記第2の顔修復画像における顔を、切り取り後の前記元画像に貼り戻して、前記元画像の修復を完了させることと、をさらに含む、人物画像修復方法。 - 人物画像修復方法であって、
修復対象の顔画像を取得することと、
前記修復対象の顔画像の輝度チャンネルを抽出し、前記輝度チャンネルに基づいて人物画像修復を行い、目標顔画像を得ることと、
前記目標顔画像及び前記修復対象の顔画像の色チャンネルを融合して、第1の顔修復画像を得ることと、
前記第1の顔修復画像に対して画像変換処理を行い、第2の顔修復画像を得ることと、を含み、
前記した、前記第1の顔修復画像に対して画像変換処理を行い、第2の顔修復画像を得ることは、
前記第1の顔修復画像に対して色補正を行うことと、
拡縮倍率を特定することと、
拡縮倍率が予め設定された倍率よりも大きい場合、超解像技術を用いて色補正後の前記第1の顔修復画像を拡縮して、前記第2の顔修復画像を得ることと、を含む、人物画像修復方法。 - 人物画像修復方法であって、
修復対象の顔画像を取得することと、
前記修復対象の顔画像の輝度チャンネルを抽出し、前記輝度チャンネルに基づいて人物画像修復を行い、目標顔画像を得ることと、
前記目標顔画像及び前記修復対象の顔画像の色チャンネルを融合して、第1の顔修復画像を得ることと、
前記第1の顔修復画像に対して画像変換処理を行い、第2の顔修復画像を得ることと、を含み、
前記した、前記輝度チャンネルに基づいて人物画像修復を行い、目標顔画像を得ることは、
前記輝度チャンネルをトレーニング済みのニューラルネットワークモデルに入力して人物画像修復を行い、前記目標顔画像を得ることを含み、
修復対象の顔画像を取得する前に、前記方法は、
第1の顔画像と、前記第1の顔画像に基づいて得られる第2の顔画像とを含むサンプル画像ペアを構成することと、
前記サンプル画像ペアをニューラルネットワークに入力してトレーニングを行い、前記第2の顔画像の修復画像を出力することと、
前記修復画像及び前記第1の顔画像に基づいて目標損失を特定することと、
前記目標損失を最小化するように、前記ニューラルネットワークのパラメータを調整して、前記ニューラルネットワークモデルを得ることと、をさらに含む、人物画像修復方法。 - 前記目標損失は、回帰損失、知覚損失、敵対的生成損失及びコンテキスト損失のうちの少なくとも一つを含む、請求項9に記載の人物画像修復方法。
- 前記した、サンプル画像ペアを構成することは、
予め設定された前記第1の顔画像を取得することと、
前記第1の顔画像の画質が劣化していない場合、
前記第1の顔画像に対して大気擾乱劣化を行い、第1の劣化画像を得て、
前記第1の劣化画像に対してダウンサンプリングを行い、目標劣化画像を得て、
前記目標劣化画像に対してアップサンプリングを行い、第2の劣化画像を得て、
前記第2の劣化画像に基づいて第3の劣化画像を得て、
予め設定された圧縮品質パラメータを用いて前記第3の劣化画像を圧縮して、第4の劣化画像を得て、
前記第4の劣化画像において矩形領域を決定し、前記第1の顔画像において前記矩形領域に対応する目標領域を特定し、
前記目標領域内の画素値で前記矩形領域内の対応する画素値を置き換え、前記第2の顔画像を得て、前記第1の顔画像と前記第2の顔画像により前記サンプル画像ペアを構成すること、または、
前記第1の顔画像の画質が劣化した場合、2枚の前記第1の顔画像により前記サンプル画像ペアを構成し、2枚のうちのいずれか一枚を前記第2の顔画像として決定することと、を含む、請求項9に記載の人物画像修復方法。 - 前記した、前記第2の劣化画像に基づいて第3の劣化画像を得ることは、
前記第2の劣化画像の輝度チャンネルにノイズを加え、前記第2の劣化画像に対して非局所的平均ノイズ除去を行い、前記第3の劣化画像を得ること、または、
前記第2の劣化画像に対してぼかし操作を行い、第5の劣化画像を得て、
前記第5の劣化画像の輝度チャンネルにノイズを加え、前記第5の劣化画像に対して非局所的平均ノイズ除去を行い、前記第3の劣化画像を得ることを含む、請求項11に記載の人物画像修復方法。 - 人物画像修復方法であって、
修復対象の顔画像を取得することと、
前記修復対象の顔画像の輝度チャンネルを抽出し、前記輝度チャンネルを、第1のネットワークと第2のネットワークと第3のネットワークと第4のネットワークを含むトレーニング済みのニューラルネットワークモデルに入力して人物画像修復を行い、目標顔画像を得ることと、
前記目標顔画像及び前記修復対象の顔画像の色チャンネルを融合して、第1の顔修復画像を得ることと、
前記第1の顔修復画像に対して画像変換処理を行い、第2の顔修復画像を得ることと、を含み、
前記した、前記輝度チャンネルをトレーニング済みのニューラルネットワークモデルに入力して人物画像修復を行い、前記目標顔画像を得ることは、
前記第1のネットワークを用いて前記輝度チャンネルに対して符号化操作を行い、目標特徴マップを得ることと、
前記第2のネットワーク及び前記第3のネットワークを用いて前記目標特徴マップに対して復号化操作を行い、前記目標顔画像を得ることと、を含み、
前記した、前記第1のネットワークを用いて前記輝度チャンネルに対して符号化操作を行い、目標特徴マップを得ることは、
前記輝度チャンネルを前記第1のネットワークに入力してダウンサンプリングを行い、第1の特徴マップを得ることと、
前記第4のネットワークを用いて前記第1の特徴マップに対して上位層特徴抽出を行い、上位層特徴マップを得ることと、
前記第1の特徴マップと前記上位層特徴マップとを重ね合わせて、前記目標特徴マップを得ることと、を含む、人物画像修復方法。 - 請求項1~13の何れか1項に記載の方法を実行させるための処理ユニットを含む人物画像修復装置。
- 入力装置と出力装置を含む電子機器であって、
1つ以上の命令の実装に適するプロセッサと、
前記プロセッサによってロードされて請求項1~13の何れか1項に記載の人物画像修復方法を実行させるための1つ以上の命令が記憶されたコンピュータ記憶媒体とをさらに含む電子機器。 - プロセッサによってロードされて請求項1~13の何れか1項に記載の人物画像修復方法を実行させるための1つ以上の命令が記憶されたコンピュータ記憶媒体。
- コンピュータ読み取り可能なコードを含むコンピュータプログラム製品であって、
前記コンピュータ読み取り可能なコードが電子機器において動作すると、前記電子機器におけるプロセッサーは、請求項1~13の何れか1項に記載の方法を実行させるコンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011386894.4A CN112330574B (zh) | 2020-11-30 | 2020-11-30 | 人像修复方法、装置、电子设备及计算机存储介质 |
CN202011386894.4 | 2020-11-30 | ||
PCT/CN2021/090296 WO2022110638A1 (zh) | 2020-11-30 | 2021-04-27 | 人像修复方法、装置、电子设备、存储介质和程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023539691A JP2023539691A (ja) | 2023-09-15 |
JP7542156B2 true JP7542156B2 (ja) | 2024-08-29 |
Family
ID=74308400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023537450A Active JP7542156B2 (ja) | 2020-11-30 | 2021-04-27 | 人物画像修復方法、装置、電子機器、記憶媒体及びプログラム製品 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP7542156B2 (ja) |
KR (1) | KR102697331B1 (ja) |
CN (1) | CN112330574B (ja) |
WO (1) | WO2022110638A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112330574B (zh) * | 2020-11-30 | 2022-07-12 | 深圳市慧鲤科技有限公司 | 人像修复方法、装置、电子设备及计算机存储介质 |
CN112862852A (zh) * | 2021-02-24 | 2021-05-28 | 深圳市慧鲤科技有限公司 | 图像处理方法及装置、电子设备及计算机可读存储介质 |
CN113034393A (zh) * | 2021-03-25 | 2021-06-25 | 北京百度网讯科技有限公司 | 照片修复方法、装置、设备以及存储介质 |
CN115222606A (zh) * | 2021-04-16 | 2022-10-21 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机可读介质及电子设备 |
CN113222874B (zh) * | 2021-06-01 | 2024-02-02 | 平安科技(深圳)有限公司 | 应用于目标检测的数据增强方法、装置、设备及存储介质 |
CN113706402A (zh) * | 2021-07-23 | 2021-11-26 | 维沃移动通信(杭州)有限公司 | 神经网络训练方法、装置及电子设备 |
CN113763268B (zh) * | 2021-08-26 | 2023-03-28 | 中国科学院自动化研究所 | 人脸图像盲修复方法及系统 |
CN113793286B (zh) * | 2021-11-18 | 2022-05-10 | 成都索贝数码科技股份有限公司 | 一种基于多阶注意力神经网络的媒体图像水印移除方法 |
CN114782291B (zh) * | 2022-06-23 | 2022-09-06 | 中国科学院自动化研究所 | 图像生成器的训练方法、装置、电子设备和可读存储介质 |
CN115294055A (zh) * | 2022-08-03 | 2022-11-04 | 维沃移动通信有限公司 | 图像处理方法、装置、电子设备和可读存储介质 |
CN115376188B (zh) * | 2022-08-17 | 2023-10-24 | 天翼爱音乐文化科技有限公司 | 一种视频通话处理方法、系统、电子设备及存储介质 |
US20240143835A1 (en) * | 2022-11-02 | 2024-05-02 | Adobe Inc. | Anonymizing digital images utilizing a generative adversarial neural network |
CN115760646B (zh) * | 2022-12-09 | 2024-03-15 | 中山大学·深圳 | 一种针对不规则孔洞的多模态人脸图像修复方法和系统 |
CN116782041B (zh) * | 2023-05-29 | 2024-01-30 | 武汉工程大学 | 一种基于液晶微透镜阵列的图像质量提高方法及系统 |
CN117593462B (zh) * | 2023-11-30 | 2024-06-07 | 约翰休斯(宁波)视觉科技有限公司 | 三维空间场景的融合方法和系统 |
CN118429505B (zh) * | 2024-07-02 | 2024-09-24 | 中山大学 | 一种基于高斯泼溅的三维人物模型生成方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109389562A (zh) | 2018-09-29 | 2019-02-26 | 深圳市商汤科技有限公司 | 图像修复方法及装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000004372A (ja) * | 1998-06-17 | 2000-01-07 | Konica Corp | 画像復元装置及び画像出力装置 |
JP2006338377A (ja) * | 2005-06-02 | 2006-12-14 | Fujifilm Holdings Corp | 画像補正方法および装置並びにプログラム |
US9262684B2 (en) * | 2013-06-06 | 2016-02-16 | Apple Inc. | Methods of image fusion for image stabilization |
CN105469407B (zh) * | 2015-11-30 | 2018-06-22 | 华南理工大学 | 一种基于改进的引导滤波器的人脸图像图层分解方法 |
CN105931211A (zh) * | 2016-04-19 | 2016-09-07 | 中山大学 | 一种人脸图像美化方法 |
US10269121B2 (en) * | 2017-04-27 | 2019-04-23 | Intel Corporation | Fast color based and motion assisted segmentation of video into region-layers |
CN107301625B (zh) * | 2017-06-05 | 2021-06-01 | 天津大学 | 基于亮度融合网络的图像去雾方法 |
KR102174777B1 (ko) * | 2018-01-23 | 2020-11-06 | 주식회사 날비컴퍼니 | 이미지의 품질 향상을 위하여 이미지를 처리하는 방법 및 장치 |
CN111402135B (zh) * | 2020-03-17 | 2023-06-20 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN112330574B (zh) * | 2020-11-30 | 2022-07-12 | 深圳市慧鲤科技有限公司 | 人像修复方法、装置、电子设备及计算机存储介质 |
-
2020
- 2020-11-30 CN CN202011386894.4A patent/CN112330574B/zh active Active
-
2021
- 2021-04-27 JP JP2023537450A patent/JP7542156B2/ja active Active
- 2021-04-27 WO PCT/CN2021/090296 patent/WO2022110638A1/zh active Application Filing
- 2021-04-27 KR KR1020237009537A patent/KR102697331B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109389562A (zh) | 2018-09-29 | 2019-02-26 | 深圳市商汤科技有限公司 | 图像修复方法及装置 |
Non-Patent Citations (1)
Title |
---|
Dual Autoencoder Network for Retinex-Based Low-Light Image Enhancement,IEEE Access ( Volume: 6),米国,IEEE,2018年03月06日,22084 - 22093,https://ieeexplore.ieee.org/document/8307190 |
Also Published As
Publication number | Publication date |
---|---|
KR20230054432A (ko) | 2023-04-24 |
JP2023539691A (ja) | 2023-09-15 |
KR102697331B1 (ko) | 2024-08-20 |
WO2022110638A1 (zh) | 2022-06-02 |
CN112330574B (zh) | 2022-07-12 |
CN112330574A (zh) | 2021-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7542156B2 (ja) | 人物画像修復方法、装置、電子機器、記憶媒体及びプログラム製品 | |
Wang et al. | Real-esrgan: Training real-world blind super-resolution with pure synthetic data | |
Sun et al. | Learned image downscaling for upscaling using content adaptive resampler | |
US20220222786A1 (en) | Image processing method, smart device, and computer readable storage medium | |
WO2022206202A1 (zh) | 图像美颜处理方法、装置、存储介质与电子设备 | |
RU2706891C1 (ru) | Способ формирования общей функции потерь для обучения сверточной нейронной сети для преобразования изображения в изображение с прорисованными деталями и система для преобразования изображения в изображение с прорисованными деталями | |
CN111667410B (zh) | 图像分辨率提升方法、装置及电子设备 | |
CN112602088B (zh) | 提高弱光图像的质量的方法、系统和计算机可读介质 | |
WO2023284401A1 (zh) | 图像美颜处理方法、装置、存储介质与电子设备 | |
WO2021115403A1 (zh) | 一种图像的处理方法及装置 | |
Liang et al. | Improved non-local iterative back-projection method for image super-resolution | |
Rasheed et al. | LSR: Lightening super-resolution deep network for low-light image enhancement | |
CN111353955A (zh) | 一种图像处理方法、装置、设备和存储介质 | |
CN113902611A (zh) | 图像美颜处理方法、装置、存储介质与电子设备 | |
CN115294055A (zh) | 图像处理方法、装置、电子设备和可读存储介质 | |
CN115587934A (zh) | 基于损失分类与双分支网络的图像超分辨率重建和去雾方法及系统 | |
CN112001940A (zh) | 图像处理方法及装置、终端及可读存储介质 | |
CN117496019B (zh) | 一种驱动静态图像的图像动画处理方法及系统 | |
CN114565532A (zh) | 视频美颜处理方法、装置、存储介质与电子设备 | |
Li et al. | RGSR: A two-step lossy JPG image super-resolution based on noise reduction | |
US20230060988A1 (en) | Image processing device and method | |
Wang | Interpolation and sharpening for image upsampling | |
CN112634126B (zh) | 人像减龄处理方法、训练方法、装置、设备及存储介质 | |
CN109447900A (zh) | 一种图像超分辨率重建方法及装置 | |
CN116645267A (zh) | 模型训练方法、装置、计算机设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240819 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7542156 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |