JP7417640B2 - リアルタイム映像超高解像度 - Google Patents
リアルタイム映像超高解像度 Download PDFInfo
- Publication number
- JP7417640B2 JP7417640B2 JP2021575454A JP2021575454A JP7417640B2 JP 7417640 B2 JP7417640 B2 JP 7417640B2 JP 2021575454 A JP2021575454 A JP 2021575454A JP 2021575454 A JP2021575454 A JP 2021575454A JP 7417640 B2 JP7417640 B2 JP 7417640B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- training
- generate
- residual
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 claims description 162
- 238000000034 method Methods 0.000 claims description 79
- 238000003062 neural network model Methods 0.000 claims description 70
- 238000012545 processing Methods 0.000 claims description 28
- 238000004891 communication Methods 0.000 claims description 9
- 230000000593 degrading effect Effects 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 230000002708 enhancing effect Effects 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 description 32
- 238000013135 deep learning Methods 0.000 description 31
- 230000006870 function Effects 0.000 description 25
- 238000010801 machine learning Methods 0.000 description 21
- 238000004422 calculation algorithm Methods 0.000 description 19
- 210000002569 neuron Anatomy 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000007726 management method Methods 0.000 description 10
- 230000000903 blocking effect Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000005259 measurement Methods 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 238000010420 art technique Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000005309 stochastic process Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
- G06T3/4069—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution by subpixel displacements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
- G06T5/75—Unsharp masking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20224—Image subtraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
104 低解像度(LR)入力画像
106 深層学習アーキテクチャ(DLA)
108 DLモデル訓練
110 訓練されたDLモデル
112 分類器
114 新データ
116 評価
118 高解像度(HR)目標出力画像
202 ソースデータ
204 ニューラルネットワークモデル
206 訓練されたDLモデル
300 システム
302 入力画像
302 入力LR画像
304 LR残差画像
306 畳み込み層
308 HR残差サブ画像
310 HR残差画像
312 ベースHR画像
314 HR画像
316 バイキュービックアップサンプリングモジュール
318 画素シフトモジュール
320 加算器
322 残差生成モジュール
402 入力層
404 第1の畳み込み層
406 第2の畳み込み層
408 第3の畳み込み層
410 第4の畳み込み層
412 カーネル
414 畳み込みカーネル
416 畳み込みカーネル
420 層深さ
502 訓練画像
504 フィルタリングされた画像
506 ダウンサンプリングされたLR画像
508 ノイズの多いLR画像
510 LR画像
512 コントラスト強調画像
516 HR残差画像
518 HR残差サブ画像
520 ローカルコントラスト強調(LCE)モジュール
522 ローパスフィルタ(LPF)
524 ダウンサンプリング(DS)モジュール
526 ノイズ付加モジュール
528 アーチファクト追加モジュール
530 アップサンプリングモジュール
532 畳み込み層入力画像
534 画素分割動作
536 畳み込み層目標出力画像
538 アップサンプリングされたLR画像
540 減算モジュール
802 ソフトウェアアーキテクチャ
804 ハードウェア層
806 処理ユニット
808 実行可能命令
810 ストレージモジュール
812 ハードウェア
814 オペレーティングシステム
816 ライブラリ
818 ミドルウェア
820 アプリケーション
824 アプリケーションプログラミングインターフェース(API)呼び出し
826 メッセージ
828 カーネル
830 サービス
832 ドライバ
834 システムライブラリ
836 APIライブラリ
840 組み込みアプリケーション
842 サードパーティアプリケーション
844 プレゼンテーション層
846 仮想マシンモニタ
848 仮想マシン
850 オペレーティングシステム
852 ライブラリ
854 ミドルウェア
856 アプリケーション
858 プレゼンテーション層
860 超高解像管理モジュール
900 コンピューティングデバイス/コンピュータ/コンピュータシステム
905 プロセッサ
910 メモリ
915 ストレージ
915 リムーバブルストレージ
920 非リムーバブルストレージ
925 入力インタフェース
930 出力インタフェース
935 通信インタフェース
940 バス
945 揮発性メモリ
950 不揮発性メモリ
955 プログラム
Claims (22)
- デジタル画像の画像解像度を高めるためのコンピュータ実装方法であって、前記方法は、
ベース高解像度(HR)画像を生成するために、前記デジタル画像のバイキュービックアップサンプリングを実行するステップと、
前記デジタル画像の輝度を示すグレースケール画像である低解像度(LR)残差画像を生成するために、赤-緑-青(RGB)色空間から輝度(Y)、彩度青差(Cb)、および彩度赤差(Cr)(YCbCr)色空間に前記デジタル画像を変換するステップと、
ニューラルネットワークモデルの複数の畳み込み層を使用して、前記LR残差画像を前記デジタル画像に対応する複数のHR残差サブ画像に変換するステップと、
前記ベースHR画像および前記複数のHR残差サブ画像を使用して、前記デジタル画像に対応するHR画像を生成するステップと、
を含む、コンピュータ実装方法。 - HR残差画像を生成するために、前記複数のHR残差サブ画像を画素シフトするステップ
をさらに含み、
前記デジタル画像に対応する前記HR画像を生成する前記ステップは、前記HR残差画像と前記ベースHR画像とを合成するステップを含む、
請求項1に記載のコンピュータ実装方法。 - 前記ニューラルネットワークモデルは入力層を含み、前記複数の畳み込み層は4つの畳み込み層を含む、請求項1または2に記載のコンピュータ実装方法。
- 前記入力層は、前記デジタル画像を受け取るように構成され、前記4つの畳み込み層の出力層は、前記複数のHR残差サブ画像を出力するように構成される、請求項3に記載のコンピュータ実装方法。
- 前記複数の畳み込み層のうちの第1の層は、3×3画素カーネルおよび8チャネルで構成され、
前記複数の畳み込み層のうちの第2の層は、3×3画素カーネルおよび6チャネルで構成され、
前記複数の畳み込み層のうちの第3の層は、3×3画素カーネルおよび4チャネルで構成され、
前記複数の畳み込み層のうちの第4の層は、4チャネルで構成される、
請求項3に記載のコンピュータ実装方法。 - 複数の訓練画像対で前記ニューラルネットワークモデルを訓練するステップであって、前記複数の訓練画像対の各訓練画像対は、
訓練画像に対応するLR画像であって、前記LR画像は、劣化した画質を有し、前記ニューラルネットワークモデルへの入力として構成される、LR画像と、
前記訓練画像に対応し、前記ニューラルネットワークモデルの目標出力として構成される複数のHR残差サブ画像と、を含む、ステップ
をさらに含む、請求項1から5のいずれか一項に記載のコンピュータ実装方法。 - 前記ニューラルネットワークモデルを訓練するステップは、
フィルタリングされた画像を生成するために、ローパスフィルタを使用して前記訓練画像をフィルタリングするステップと、
ダウンサンプリングされたLR画像を生成するために、前記フィルタリングされた画像をダウンサンプリングするステップと、
前記訓練画像に対応する前記LR画像を生成するために、ノイズおよびアーチファクトを追加することによって、前記ダウンサンプリングされたLR画像の画質を劣化させるステップと、
をさらに含む、請求項6に記載のコンピュータ実装方法。 - 前記ニューラルネットワークモデルを訓練するステップは、
コントラスト強調画像を生成するために、前記訓練画像にアンバランスなアンシャープマスクを適用するステップと、
前記訓練画像に対応するHR残差画像を生成するために、前記コントラスト強調画像から前記ダウンサンプリングされたLR画像のアップサンプリングされたバージョンを減算するステップと、
をさらに含む、請求項7に記載のコンピュータ実装方法。 - 前記ニューラルネットワークモデルを訓練するステップは、
前記訓練画像に対応する前記複数のHR残差サブ画像を生成するために、前記訓練画像に対応する前記HR残差画像を分割するステップ
をさらに含む、請求項8に記載のコンピュータ実装方法。 - 命令を記憶するメモリと、
前記メモリと通信する1つまたは複数のプロセッサであって、前記1つまたは複数のプロセッサは、
ベース高解像度(HR)画像を生成するために、デジタル画像のバイキュービックアップサンプリングを実行し、
前記デジタル画像の輝度を示すグレースケール画像である低解像度(LR)残差画像を生成するために、赤-緑-青(RGB)色空間から輝度(Y)、彩度青差(Cb)、および彩度赤差(Cr)(YCbCr)色空間に前記デジタル画像を変換し、
ニューラルネットワークモデルの複数の畳み込み層を使用して、前記LR残差画像を前記デジタル画像に対応する複数のHR残差サブ画像に変換し、
前記ベースHR画像および前記複数のHR残差サブ画像を使用して、前記デジタル画像に対応するHR画像を生成する、前記命令を実行する、1つまたは複数のプロセッサと、
を備える、システム。 - 前記1つまたは複数のプロセッサは、
HR残差画像を生成するために、前記複数のHR残差サブ画像を画素シフトし、
前記デジタル画像に対応する前記HR画像を生成するために、前記HR残差画像と前記ベースHR画像とを合成する、
前記命令を実行する、請求項10に記載のシステム。 - 前記ニューラルネットワークモデルは入力層を含み、前記複数の畳み込み層は4つの畳み込み層を含み、
前記入力層は、前記デジタル画像を受け取るように構成され、
前記4つの畳み込み層の出力層は、前記複数のHR残差サブ画像を出力するように構成される、
請求項10または11に記載のシステム。 - 前記複数の畳み込み層のうちの第1の層は、3×3画素カーネルおよび8チャネルで構成され、
前記複数の畳み込み層のうちの第2の層は、3×3画素カーネルおよび6チャネルで構成され、
前記複数の畳み込み層のうちの第3の層は、3×3画素カーネルおよび4チャネルで構成され、
前記複数の畳み込み層のうちの第4の層は、4チャネルで構成される、
請求項12に記載のシステム。 - 前記1つまたは複数のプロセッサは、
複数の訓練画像対で前記ニューラルネットワークモデルを訓練する前記命令を実行し、前記複数の訓練画像対の各訓練画像対は、
訓練画像に対応するLR画像であって、前記LR画像は、劣化した画質を有し、前記ニューラルネットワークモデルへの入力として構成される、LR画像と、
前記訓練画像に対応し、前記ニューラルネットワークモデルの目標出力として構成される複数のHR残差サブ画像と、
を含む、請求項10から13のいずれか一項に記載のシステム。 - 前記ニューラルネットワークモデルを訓練するために、前記1つまたは複数のプロセッサは、
フィルタリングされた画像を生成するために、ローパスフィルタを使用して前記訓練画像をフィルタリングし、
ダウンサンプリングされたLR画像を生成するために、前記フィルタリングされた画像をダウンサンプリングし、
前記訓練画像に対応する前記LR画像を生成するために、ノイズおよびアーチファクトを追加することによって、前記ダウンサンプリングされたLR画像の画質を劣化させる、
前記命令を実行する、請求項14に記載のシステム。 - 前記ニューラルネットワークモデルを訓練するために、前記1つまたは複数のプロセッサは、
コントラスト強調画像を生成するために、前記訓練画像にアンバランスなアンシャープマスクを適用し、
前記訓練画像に対応するHR残差画像を生成するために、前記コントラスト強調画像から前記ダウンサンプリングされたLR画像のアップサンプリングされたバージョンを減算する、
前記命令を実行する、請求項15に記載のシステム。 - 前記ニューラルネットワークモデルを訓練するために、前記1つまたは複数のプロセッサは、
前記訓練画像に対応する前記複数のHR残差サブ画像を生成するために、前記訓練画像に対応する前記HR残差画像を分割する
前記命令を実行する、請求項16に記載のシステム。 - デジタル画像の画像解像度を高めるためのコンピュータ命令を記憶するコンピュータ可読媒体であって、前記命令は、1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、
ベース高解像度(HR)画像を生成するために、前記デジタル画像のバイキュービックアップサンプリングを実行するステップと、
前記デジタル画像の輝度を示すグレースケール画像である低解像度(LR)残差画像を生成するために、赤-緑-青(RGB)色空間から輝度(Y)、彩度青差(Cb)、および彩度赤差(Cr)(YCbCr)色空間に前記デジタル画像を変換するステップと、
ニューラルネットワークモデルの複数の畳み込み層を使用して、前記LR残差画像を前記デジタル画像に対応する複数のHR残差サブ画像に変換するステップと、
前記ベースHR画像および前記複数のHR残差サブ画像を使用して、前記デジタル画像に対応するHR画像を生成するステップと、
を実行させる、コンピュータ可読媒体。 - 前記命令はさらに、前記1つまたは複数のプロセッサに、
複数の訓練画像対で前記ニューラルネットワークモデルを訓練するステップであって、前記複数の訓練画像対の各訓練画像対は、
訓練画像に対応するLR画像であって、前記LR画像は、劣化した画質を有し、前記ニューラルネットワークモデルへの入力として構成される、LR画像と、
前記訓練画像に対応し、前記ニューラルネットワークモデルの目標出力として構成される複数のHR残差サブ画像と、
を含む、ステップを実行させる、請求項18に記載のコンピュータ可読媒体。 - 前記命令はさらに、前記1つまたは複数のプロセッサに、
フィルタリングされた画像を生成するために、ローパスフィルタを使用して前記訓練画像をフィルタリングするステップと、
ダウンサンプリングされたLR画像を生成するために、前記フィルタリングされた画像をダウンサンプリングするステップと、
前記訓練画像に対応する前記LR画像を生成するために、ノイズおよびアーチファクトを追加することによって、前記ダウンサンプリングされたLR画像の画質を劣化させるステップと、
を実行させる、請求項19に記載のコンピュータ可読媒体。 - 前記命令はさらに、前記1つまたは複数のプロセッサに、
コントラスト強調画像を生成するために、前記訓練画像にアンバランスなアンシャープマスクを適用するステップと、
前記訓練画像に対応するHR残差画像を生成するために、前記コントラスト強調画像から前記ダウンサンプリングされたLR画像のアップサンプリングされたバージョンを減算するステップと、
前記訓練画像に対応する前記複数のHR残差サブ画像を生成するために、前記訓練画像に対応する前記HR残差画像を分割するステップと、
を実行させる、請求項20に記載のコンピュータ可読媒体。 - デジタル画像の画像解像度を高めるための画像解像度調整システムであって、前記システムは、
ベース高解像度(HR)画像を生成するために、前記デジタル画像のバイキュービックアップサンプリングを実行するアップサンプリング手段と、
前記デジタル画像の輝度を示すグレースケール画像である低解像度(LR)残差画像を生成するために、赤-緑-青(RGB)色空間から輝度(Y)、彩度青差(Cb)、および彩度赤差(Cr)(YCbCr)色空間に前記デジタル画像を変換する色空間処理手段と、
前記LR残差画像を前記デジタル画像に対応する複数のHR残差サブ画像に変換する畳み込み手段と、
前記ベースHR画像および前記複数のHR残差サブ画像を使用して、前記デジタル画像に対応するHR画像を生成する追加手段と、
を備える、画像解像度調整システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2019/037727 WO2020256704A1 (en) | 2019-06-18 | 2019-06-18 | Real-time video ultra resolution |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022536807A JP2022536807A (ja) | 2022-08-18 |
JP7417640B2 true JP7417640B2 (ja) | 2024-01-18 |
Family
ID=67145877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021575454A Active JP7417640B2 (ja) | 2019-06-18 | 2019-06-18 | リアルタイム映像超高解像度 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11449966B2 (ja) |
EP (1) | EP3973498A1 (ja) |
JP (1) | JP7417640B2 (ja) |
CN (1) | CN114008663A (ja) |
AU (1) | AU2019451948B2 (ja) |
CA (1) | CA3144236A1 (ja) |
WO (1) | WO2020256704A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10489887B2 (en) * | 2017-04-10 | 2019-11-26 | Samsung Electronics Co., Ltd. | System and method for deep learning image super resolution |
WO2021002719A1 (ko) * | 2019-07-03 | 2021-01-07 | 한국과학기술원 | 비디오 처리 방법 및 장치 |
US10984507B2 (en) * | 2019-07-17 | 2021-04-20 | Harris Geospatial Solutions, Inc. | Image processing system including training model based upon iterative blurring of geospatial images and related methods |
CN110428378B (zh) * | 2019-07-26 | 2022-02-08 | 北京小米移动软件有限公司 | 图像的处理方法、装置及存储介质 |
US12033301B2 (en) | 2019-09-09 | 2024-07-09 | Nvidia Corporation | Video upsampling using one or more neural networks |
CN110677649B (zh) * | 2019-10-16 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 基于机器学习的去伪影方法、去伪影模型训练方法及装置 |
CN110827200B (zh) * | 2019-11-04 | 2023-04-07 | Oppo广东移动通信有限公司 | 一种图像超分重建方法、图像超分重建装置及移动终端 |
WO2021147095A1 (en) * | 2020-01-23 | 2021-07-29 | Baidu.Com Times Technology (Beijing) Co., Ltd. | Deep residual network for color filter array image denoising |
CN114945935A (zh) * | 2020-02-17 | 2022-08-26 | 英特尔公司 | 使用卷积神经网络的超分辨率 |
CN111598808B (zh) * | 2020-05-18 | 2022-08-23 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备及其训练方法 |
US20220067879A1 (en) * | 2020-09-03 | 2022-03-03 | Nvidia Corporation | Image enhancement using one or more neural networks |
US20220114700A1 (en) * | 2020-10-08 | 2022-04-14 | Nvidia Corporation | Upsampling an image using one or more neural networks |
CN112614132B (zh) * | 2021-01-27 | 2021-07-06 | 杭州健培科技有限公司 | 针对少样本腰椎医学影像的半监督循环自学习方法及模型 |
US20220286696A1 (en) * | 2021-03-02 | 2022-09-08 | Samsung Electronics Co., Ltd. | Image compression method and apparatus |
CN113421187B (zh) * | 2021-06-10 | 2023-01-03 | 山东师范大学 | 一种超分辨率重建方法、系统、存储介质、设备 |
EP4105879A1 (en) * | 2021-06-17 | 2022-12-21 | Fujitsu Limited | An unsupervised learning method to detect transparent, or hard to see, anomalies in images |
US12100120B2 (en) * | 2021-07-21 | 2024-09-24 | Black Sesame Technologies Inc. | Multi-frame image super resolution system |
CN113724151B (zh) * | 2021-07-30 | 2022-09-27 | 荣耀终端有限公司 | 一种图像增强方法、电子设备和计算机可读存储介质 |
US12041248B2 (en) * | 2021-08-02 | 2024-07-16 | Mediatek Singapore Pte. Ltd. | Color component processing in down-sample video coding |
CN114007135B (zh) * | 2021-10-29 | 2023-04-18 | 广州华多网络科技有限公司 | 视频插帧方法及其装置、设备、介质、产品 |
CN114359041A (zh) * | 2021-11-24 | 2022-04-15 | 宁波大学 | 一种光场图像空间超分辨率重建方法 |
US11948275B2 (en) * | 2022-07-13 | 2024-04-02 | Zoom Video Communications, Inc. | Video bandwidth optimization within a video communications platform |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358575A (zh) | 2017-06-08 | 2017-11-17 | 清华大学 | 一种基于深度残差网络的单幅图像超分辨率重建方法 |
US20190114742A1 (en) | 2017-10-13 | 2019-04-18 | Adobe Inc. | Image upscaling with controllable noise reduction using a neural network |
JP2019067078A (ja) | 2017-09-29 | 2019-04-25 | 国立大学法人 筑波大学 | 画像処理方法、及び画像処理プログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100846500B1 (ko) * | 2006-11-08 | 2008-07-17 | 삼성전자주식회사 | 확장된 가보 웨이브렛 특징 들을 이용한 얼굴 인식 방법 및장치 |
WO2010122502A1 (en) * | 2009-04-20 | 2010-10-28 | Yeda Research And Development Co. Ltd. | Super-resolution from a single signal |
CN102968766B (zh) * | 2012-11-23 | 2015-04-08 | 上海交通大学 | 基于字典数据库的自适应图像超分辨率重构方法 |
US9734558B2 (en) * | 2014-03-20 | 2017-08-15 | Mitsubishi Electric Research Laboratories, Inc. | Method for generating high-resolution images using regression patterns |
GB201604345D0 (en) * | 2016-03-14 | 2016-04-27 | Magic Pony Technology Ltd | Super resolution using fidelity transfer |
CN106683067B (zh) * | 2017-01-20 | 2020-06-23 | 福建帝视信息科技有限公司 | 一种基于残差子图像的深度学习超分辨率重建方法 |
US10685429B2 (en) * | 2017-02-22 | 2020-06-16 | Siemens Healthcare Gmbh | Denoising medical images by learning sparse image representations with a deep unfolding approach |
KR102331043B1 (ko) * | 2017-03-20 | 2021-11-25 | 삼성전자주식회사 | 인코딩 시스템 및 이의 동작 방법 |
-
2019
- 2019-06-18 CN CN201980097645.2A patent/CN114008663A/zh active Pending
- 2019-06-18 AU AU2019451948A patent/AU2019451948B2/en active Active
- 2019-06-18 CA CA3144236A patent/CA3144236A1/en active Pending
- 2019-06-18 WO PCT/US2019/037727 patent/WO2020256704A1/en unknown
- 2019-06-18 EP EP19735687.6A patent/EP3973498A1/en active Pending
- 2019-06-18 JP JP2021575454A patent/JP7417640B2/ja active Active
-
2020
- 2020-06-18 US US16/946,379 patent/US11449966B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358575A (zh) | 2017-06-08 | 2017-11-17 | 清华大学 | 一种基于深度残差网络的单幅图像超分辨率重建方法 |
JP2019067078A (ja) | 2017-09-29 | 2019-04-25 | 国立大学法人 筑波大学 | 画像処理方法、及び画像処理プログラム |
US20190114742A1 (en) | 2017-10-13 | 2019-04-18 | Adobe Inc. | Image upscaling with controllable noise reduction using a neural network |
Non-Patent Citations (2)
Title |
---|
CHEN, Chao et al.,Single Image Super-Resolution Using Deep CNN with Dense Skip Connections and Inception-ResNet,2018 9th International Conference on Information Technology in Medicine and Education (ITME),米国,2018年12月27日,pp.999-1003,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8589454 |
加藤 裕 他,水平・垂直畳み込みニューラルネットワークを用いた超解像,電気学会論文誌C,日本, 一般社団法人電気学会,2018年07月01日,Vol.138 No.7,pp.957-963 |
Also Published As
Publication number | Publication date |
---|---|
AU2019451948B2 (en) | 2023-10-26 |
WO2020256704A1 (en) | 2020-12-24 |
JP2022536807A (ja) | 2022-08-18 |
US20200402205A1 (en) | 2020-12-24 |
US11449966B2 (en) | 2022-09-20 |
CN114008663A (zh) | 2022-02-01 |
EP3973498A1 (en) | 2022-03-30 |
AU2019451948A1 (en) | 2022-01-27 |
CA3144236A1 (en) | 2020-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7417640B2 (ja) | リアルタイム映像超高解像度 | |
US11508146B2 (en) | Convolutional neural network processing method and apparatus | |
WO2021093620A1 (en) | Method and system for high-resolution image inpainting | |
Patel et al. | A generative adversarial network for tone mapping hdr images | |
US11915383B2 (en) | Methods and systems for high definition image manipulation with neural networks | |
US12100169B2 (en) | Sparse optical flow estimation | |
US11741579B2 (en) | Methods and systems for deblurring blurry images | |
CN118284905A (zh) | 用于3d场景的可泛化语义分割的神经语义场 | |
CA3143928C (en) | Dynamic image resolution assessment | |
Zhang et al. | Deep joint neural model for single image haze removal and color correction | |
US11948090B2 (en) | Method and apparatus for video coding | |
US20230359862A1 (en) | Systems and Methods for Machine-Learned Models Having Convolution and Attention | |
US20230073175A1 (en) | Method and system for processing image based on weighted multiple kernels | |
CN115375909A (zh) | 一种图像处理方法及装置 | |
EP4392925A1 (en) | Cascaded multi-resolution machine learning based image regions processing with improved computational efficiency | |
Feng et al. | Hierarchical guided network for low‐light image enhancement | |
CN113365072B (zh) | 特征图压缩方法、装置、计算设备以及存储介质 | |
US20230376766A1 (en) | Systems, methods, and media for generating and using neural networks having improved efficiency for analyzing video | |
Huang et al. | Cascading and Residual Connected Network for Single Image Superresolution | |
Ye et al. | Learning multi-granularity semantic interactive representation for joint low-light image enhancement and super-resolution | |
JIN | Data-Driven Auto-Photo Enhancement Based On User Preference | |
WO2023163757A1 (en) | High-definition video segmentation for web-based video conferencing | |
Huang et al. | Adversarial Framework for General Image Inpainting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7417640 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |