JP2023508512A - 超解像度再構築方法及び関連装置 - Google Patents
超解像度再構築方法及び関連装置 Download PDFInfo
- Publication number
- JP2023508512A JP2023508512A JP2022540308A JP2022540308A JP2023508512A JP 2023508512 A JP2023508512 A JP 2023508512A JP 2022540308 A JP2022540308 A JP 2022540308A JP 2022540308 A JP2022540308 A JP 2022540308A JP 2023508512 A JP2023508512 A JP 2023508512A
- Authority
- JP
- Japan
- Prior art keywords
- resolution
- video frame
- target
- frame
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 238000012545 processing Methods 0.000 claims abstract description 62
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims description 45
- 238000010586 diagram Methods 0.000 claims description 42
- 238000000605 extraction Methods 0.000 claims description 27
- 230000003321 amplification Effects 0.000 claims description 22
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 22
- 238000003860 storage Methods 0.000 claims description 18
- 238000007906 compression Methods 0.000 claims description 17
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 15
- 230000006835 compression Effects 0.000 claims description 13
- 238000000926 separation method Methods 0.000 claims description 11
- 230000002708 enhancing effect Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 22
- 230000006870 function Effects 0.000 description 19
- 230000000694 effects Effects 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 12
- 230000015556 catabolic process Effects 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000009418 renovation Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
- G06T3/4076—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution using the original low-resolution images to iteratively correct the high-resolution images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
Abstract
Description
本願は、画像処理分野に関し、特に超解像度再構築に関する。
一側面では、本願の実施例は、端末機器が実行する人工知能に基づく超解像度再構築方法であって、
第1の解像度の処理対象のビデオフレームシーケンスを取得するステップと、
前記処理対象のビデオフレームシーケンスにおける各フレームの処理対象のビデオフレームに対して、解像度再構築モデルに基づいて前記処理対象のビデオフレームを解像度再構築することで、第2の解像度の初期再構築ビデオフレームを取得するステップであって、前記第2の解像度は、前記第1の解像度よりも高いものであるステップと、
前記初期再構築ビデオフレームにおける輪郭領域を決定するステップと、
前記輪郭領域を輪郭強調処理することで、ターゲット再構築ビデオフレームを取得するステップと、
前記ターゲット再構築ビデオフレームに基づいて、第2の解像度の再構築ビデオフレームシーケンスを生成するステップと、を含む、超解像度再構築方法を提供する。
第1の解像度の処理対象のビデオフレームシーケンスを取得する取得ユニットと、
前記処理対象のビデオフレームシーケンスにおける各フレームの処理対象のビデオフレームに対して、解像度再構築モデルに基づいて前記処理対象のビデオフレームを解像度再構築することで、前記第1の解像度よりも高い第2の解像度の初期再構築ビデオフレームを取得する再構築ユニットと、
前記初期再構築ビデオフレームにおける輪郭領域を決定する決定ユニットと、
前記輪郭領域を輪郭強調処理することで、ターゲット再構築ビデオフレームを取得する処理ユニットと、
前記ターゲット再構築ビデオフレームに基づいて、第2の解像度の再構築ビデオフレームシーケンスを生成する生成ユニットと、を含む、超解像度再構築装置を提供する。
前記メモリは、プログラムコードを記憶し、前記プログラムコードを前記プロセッサに伝送し、
前記プロセッサは、前記プログラムコードにおける命令に基づいて、上記の方面に記載の超解像度再構築方法を実行する機器を提供する。
図2を参照する、図2は、人工知能に基づく超解像度再構築方法のフローチャートを示す。前記方法は、以下のステップS201~S205を含む。
処理対象のビデオフレームシーケンスは、端末機器で再生される、超解像度再構築が必要なビデオファイルのビデオフレームシーケンスとして、例えば、端末機器がサーバから取得したビデオフレームシーケンスであるが、このビデオフレームシーケンスの解像度(例えば、第1の解像度)は、いくつかの再生必要に対応する解像度よりも低い。
端末機器は、処理対象のビデオフレームシーケンスを取得した後、処理対象のビデオフレームシーケンスにおける各フレームの処理対象のビデオフレームを低解像度(Low Resolution、LR)画像として、解像度再構築モデルに入力し、解像度再構築モデルによって各フレームの処理対象のビデオフレームを解像度再構築することで、第2の解像度の初期再構築ビデオフレーム、即ち、超解像度(Super Resolution、SR)画像を取得することができる。ここで、第2の解像度は、第1の解像度よりも高く、つまり、解像度再構築モデルによってビデオファイルにおける各フレームの処理対象のビデオフレームの解像度を向上させることができる。
上記の解像度再構築モデルによって超解像度再構築することで、処理対象のビデオフレームの解像度を向上させることができるが、取得された初期再構築ビデオフレームが必ずしもそのアプリケーションシーンにおいて画質が最適な結果ではないため、取得された初期再構築ビデオフレームを後処理することができる。
S205において、前記ターゲット再構築ビデオフレームに基づいて第2の解像度の再構築ビデオフレームシーケンスを生成する。
S601において、収集されたオリジナルビデオサンプルをダウンサンプリング処理しビデオ圧縮処理することで、ターゲットビデオサンプルを取得する。
ターゲットビデオサンプルを取得した後、ターゲットビデオサンプルに対してビデオフレーム抽出を行い、ターゲットビデオサンプルから予め設定されたフレーム位置に位置する第1の画像を抽出することによって、マルチフレームの第1の画像を取得して低解像度サンプルセットを構成することができる。本実施例は、予め設定されたフレーム位置を限定せず、即ち、ビデオフレーム抽出方式を限定せず、例えばビデオフレーム抽出方式は、ターゲットビデオサンプルに対して1s置きに1フレームを抽出することであってもよく、つまり、予め設定されたフレーム位置は、ターゲットビデオサンプルにおける1s目に対応するビデオフレームであり、2s目に対応するビデオフレームであり、3s目に対応するビデオフレームであり、……Ns目に対応するビデオフレームであり、Nは、ターゲットビデオサンプルの全長である。
S604において、前記低解像度サンプルセットと前記高解像度サンプルセットに基づいてトレーニングデータセットを構築する。
トレーニングデータセットに基づいて初期再構築モデルをトレーニングし、初期再構築モデルは、トレーニングデータセットにおける第1の画像又は第1の画像によって決定された入力画像に基づいて解像度再構築を行い、初期再構築ビデオフレームを出力してもよい。ここで、第1の画像又は入力画像は、解像度再構築モデル使用過程における処理対象のビデオフレームに相当する。初期再構築ビデオフレームとラベル図を利用して損失関数を構築することによって、損失関数値が最小になるまで、損失関数に基づいて初期再構築モデルのパラメータを調整する。
S902において、ユーザは、あるビデオを検索する。
S903において、端末機器は、該ビデオのビデオファイルを取得して再生し、該ビデオファイルのビデオフレームシーケンスを処理対象のビデオフレームシーケンスとする。
S904において、端末機器は、処理対象のビデオフレームシーケンスにおける各処理対象のビデオフレームを順に読み取る。
S905において、端末機器は、解像度再構築モデルによって読み取った処理対象のビデオフレームを解像度再構築することで、第2の解像度の初期再構築ビデオフレームを取得する。
S906において、輪郭強調係数とノイズ係数によって初期再構築ビデオフレームにおける輪郭領域と平坦領域をそれぞれ調整することで、ターゲット再構築ビデオフレームを取得する。
S907において、端末機器は、ユーザにターゲット再構築ビデオフレームを再生する。
前記再構築ユニット1002は、前記処理対象のビデオフレームシーケンスにおける各フレームの処理対象のビデオフレームに対して、解像度再構築モデルに基づいて前記処理対象のビデオフレームを解像度再構築することで、前記第1の解像度よりも高い第2の解像度の初期再構築ビデオフレームを取得するために用いられる。
前記決定ユニット1003は、前記初期再構築ビデオフレームにおける輪郭領域を決定するために用いられる。
前記処理ユニット1004は、前記輪郭領域を輪郭強調処理することで、ターゲット再構築ビデオフレームを取得するために用いられる。
前記生成ユニット1005は、前記ターゲット再構築ビデオフレームに基づいて第2の解像度の再構築ビデオフレームシーケンスを生成するために用いられる。
前記処理対象のビデオフレームに対応する前記初期再構築ビデオフレームと前記バイキュービック補間増幅結果に基づいて残差分離を行い、高周波マスクと低周波マスクを取得すること、
前記初期再構築ビデオフレーム、前記バイキュービック補間増幅結果、及び前記高周波マスクに基づいて前記輪郭領域を決定し、前記初期再構築ビデオフレーム、前記バイキュービック補間増幅結果、及び前記低周波マスクに基づいて前記平坦領域を決定することに用いられる。
ビデオ再生命令を取得すること、
前記ビデオ再生命令に基づいて前記処理対象のビデオフレームシーケンスに対応するビデオファイルを再生すること、
前記ビデオファイルの解像度切り替え命令が検出されると、前記解像度切り替え命令により切り替えが指示された解像度が前記第2の解像度に関連付けられている場合、トリガー再構築ユニット1002は、前記処理対象のビデオフレームシーケンスにおける各フレームの処理対象のビデオフレームに対して、解像度再構築モデルに基づいて前記処理対象のビデオフレームを解像度再構築することで、第2の解像度の初期再構築ビデオフレームを取得するように実行することに用いられる。
現在再生中のビデオフレームの次のビデオフレームを決定すること、
前記再構築ビデオフレームシーケンスのうち、前記次のビデオフレームに対応するターゲット再構築ビデオフレームを決定すること、
次のビデオフレームを再生する時、前記次のビデオフレームに対応するターゲット再構築ビデオフレームに切り替え、前記再構築ビデオフレームシーケンスのうちのターゲット再構築ビデオフレームを再生することに用いられる。
収集された、解像度が予め設定された閾値よりも高いオリジナルビデオサンプルに対してダウンサンプリング処理とビデオ圧縮処理を行い、ターゲットビデオサンプルを取得すること、
前記ターゲットビデオサンプルに基づいて、前記ターゲットビデオサンプル内の予め設定されたフレーム位置に位置するマルチフレームの第1の画像が含まれる低解像度サンプルセットを決定すること、
前記オリジナルビデオサンプルのうち、前記予め設定されたフレーム位置に位置するマルチフレームの第2の画像に対して輪郭強調処理を行うことで、輪郭強調処理された前記マルチフレームの第2の画像である第3の画像が含まれる高解像度サンプルセットを取得すること、
前記低解像度サンプルセットと前記高解像度サンプルセットに基づいてトレーニングデータセットを構築すること、
前記トレーニングデータセットに基づいて初期再構築モデルをトレーニングし、前記解像度再構築モデルを取得することに用いられる。
第1のサイズに従って前記マルチフレームの第3の画像をそれぞれ分割することでラベル図を取得し、第2のサイズに従って前記マルチフレームの第1の画像をそれぞれ分割することで入力画像を取得すること、
前記マルチフレームの第3の画像のうち、各フレームの第3の画像に対応するラベル図に対して、前記ラベル図のうち、前記第3の画像に属する平坦領域のターゲットラベル図を決定すること、
前記ターゲットラベル図及び前記ターゲットラベル図に対応する入力画像を除去することに用いられる。
前記第3の画像に基づいて対応する初期演算子図を生成すること、
前記初期演算子図における画素値が第1の閾値よりも小さい画素点の画素値をゼロに再付与し、ターゲット演算子図を取得すること、
前記第1のサイズに従って前記ターゲット演算子図を分割し、前記第3の画像のラベル図に一対一で対応する、前記ターゲット演算子図の演算子サブ図を取得すること、
前記演算子サブ図における画素値がゼロでない画素点の個数が第2の閾値を超えない場合、前記演算子サブ図に対応するラベル図が前記ターゲットラベル図であると決定することに用いられる。
予め設定された範囲内で複数の異なる固定コードレート係数を選択すること、
前記複数の異なる固定コードレート係数を利用して前記オリジナルビデオサンプルに対してそれぞれビデオ圧縮処理を行い、複数の解像度のターゲットビデオサンプルを取得することに用いられる。
前記解像度再構築モデルによって前記処理対象のビデオフレームに対して少なくとも2回の残差抽出を行い、各残差抽出結果を取得すること、
各残差抽出結果に基づいて前記処理対象のビデオフレームを解像度再構築することで、第2の解像度の初期再構築ビデオフレームを取得することに用いられる。
前記解像度再構築モデルにおける畳み込み層によって前記処理対象のビデオフレームに対して畳み込み処理を行い、前記処理対象のビデオフレームに対応する畳み込み処理結果を取得すること、
前記畳み込み処理結果に基づいてネットワーク本体構造における各残差ブロックを順に残差抽出を行い、カスケード接続された前記各残差ブロックの残差抽出結果を取得することに用いられる。
スプライシング層によって前記各残差抽出結果をスプライシングし、残差スプライシング特徴を取得すること、
前記残差スプライシング特徴に対して特徴融合を行って融合特徴図を取得すること、
融合特徴図に対してアップサンプリング処理を行い、前記処理対象のビデオフレームに対応する、第2の解像度の初期再構築ビデオフレームを取得することに用いられる。
RF回路1110は、情報の送受信又は通話中の信号の受信と送信に用いられてもよく、特に、基地局のダウンリンク情報を受信してから、プロセッサ1180に処理させ、また、アップリンク用のデータを基地局に送信する。一般的には、RF回路1110は、アンテナ、少なくとも1つの増幅器、送受信機、カプラ、低雑音増幅器(Low Noise Amplifier、LNAと略称)、デュプレクサなどを含むが、これらに限らない。なお、RF回路1110は、無線通信とネットワークを介して他の機器との通信を行ってもよい。上記無線通信は、いずれか1つの通信規格又はプロトコルを用いてもよく、グローバル移動通信システム(Global System of Mobile communication、GSMと略称)、汎用パケット無線サービス(General Packet Radio Service、GPRSと略称)、符号分割多元接続(Code Division Multiple Access、CDMAと略称)、広帯域符号分割多元接続(Wideband Code Division Multiple Access、WCDMA(登録商標)と略称)、長期の進化(Long Term Evolution、LTEと略称)、電子メール、ショートメッセージサービス(Short Messaging Service、SMSと略称)などを含むが、これらに限らない。
図示されてはいないが、携帯電話は、カメラ、ブルートゥース(登録商標)モジュールなどをさらに含んでもよく、ここでは説明を省略する。
第1の解像度の処理対象のビデオフレームシーケンスを取得する機能、
前記処理対象のビデオフレームシーケンスにおける各フレームの処理対象のビデオフレームに対して、解像度再構築モデルに基づいて前記処理対象のビデオフレームを解像度再構築することで、前記第1の解像度よりも高い第2の解像度の初期再構築ビデオフレームを取得する機能、
前記初期再構築ビデオフレームにおける輪郭領域を決定する機能、
前記輪郭領域を輪郭強調処理することで、ターゲット再構築ビデオフレームを取得する機能、
前記ターゲット再構築ビデオフレームに基づいて第2の解像度の再構築ビデオフレームシーケンスを生成する機能を有する。
上記実施例においてサーバが実行するステップは、該図12に示されるサーバ構造に基づいて実行してもよい。
Claims (16)
- 端末機器が実行する人工知能に基づく超解像度再構築方法であって、
第1の解像度の処理対象のビデオフレームシーケンスを取得するステップと、
前記処理対象のビデオフレームシーケンスにおける各フレームの処理対象のビデオフレームに対して、解像度再構築モデルに基づいて前記処理対象のビデオフレームを解像度再構築することで、第2の解像度の初期再構築ビデオフレームを取得するステップであって、前記第2の解像度は、前記第1の解像度よりも高いものであるステップと、
前記初期再構築ビデオフレームにおける輪郭領域を決定するステップと、
前記輪郭領域を輪郭強調処理することで、ターゲット再構築ビデオフレームを取得するステップと、
前記ターゲット再構築ビデオフレームに基づいて、第2の解像度の再構築ビデオフレームシーケンスを生成するステップと、を含む、超解像度再構築方法。 - 前記初期再構築ビデオフレームにおける輪郭領域を決定する前記ステップは、
残差分離方式によって前記初期再構築ビデオフレームにおける輪郭領域と平坦領域を決定するステップを含み、
前記輪郭領域を輪郭強調処理することで、ターゲット再構築ビデオフレームを取得する前記ステップは、
前記輪郭領域を輪郭強調処理するとともに、前記平坦領域をノイズ除去処理して、ターゲット再構築ビデオフレームを取得するステップを含む、請求項1に記載の方法。 - 前記残差分離方式によって前記初期再構築ビデオフレームにおける輪郭領域と平坦領域を決定する前記ステップは、
前記処理対象のビデオフレームシーケンスにおける各フレームの処理対象のビデオフレームに対して、バイキュービック補間によってバイキュービック補間増幅結果を取得するステップと、
前記処理対象のビデオフレームに対応する前記初期再構築ビデオフレームと前記バイキュービック補間増幅結果に基づいて残差分離を行うことで、高周波マスクと低周波マスクを取得するステップと、
前記初期再構築ビデオフレームと、前記バイキュービック補間増幅結果と、前記高周波マスクに基づいて前記輪郭領域を決定し、前記初期再構築ビデオフレームと、前記バイキュービック補間増幅結果と、前記低周波マスクに基づいて前記平坦領域を決定するステップと、を含む、請求項2に記載の方法。 - 第1の解像度の処理対象のビデオフレームシーケンスを取得する前記ステップは、
ビデオ再生命令を取得するステップと、
前記ビデオ再生命令に基づいて、前記処理対象のビデオフレームシーケンスに対応するビデオファイルを再生するステップと、
前記ビデオファイルの解像度切り替え命令が検出されると、前記解像度切り替え命令により切り替えが指示された解像度が前記第2の解像度に関連付けられている場合、前記処理対象のビデオフレームシーケンスにおける各フレームの処理対象のビデオフレームに対して、解像度再構築モデルに基づいて前記処理対象のビデオフレームを解像度再構築することで、第2の解像度の初期再構築ビデオフレームを取得する前記ステップを実行するステップと、を含む、請求項1に記載の方法。 - 前記ターゲット再構築ビデオフレームに基づいて第2の解像度の再構築ビデオフレームシーケンスを生成する前記ステップの後、
現在再生中のビデオフレームの次のビデオフレームを決定するステップと、
前記再構築ビデオフレームシーケンスのうち、前記次のビデオフレームに対応するターゲット再構築ビデオフレームを決定するステップと、
次のビデオフレームを再生する際、前記次のビデオフレームに対応するターゲット再構築ビデオフレームに切り替えて、前記再構築ビデオフレームシーケンスのうちのターゲット再構築ビデオフレームを再生するステップと、をさらに含む、請求項1に記載の方法。 - 前記解像度再構築モデルは、
収集されたオリジナルビデオサンプルをダウンサンプリング処理とビデオ圧縮処理することで、ターゲットビデオサンプルを取得するステップであって、前記オリジナルビデオサンプルの解像度は、予め設定された閾値よりも高いものであるステップと、
前記ターゲットビデオサンプルに基づいて低解像度サンプルセットを決定するステップであって、前記低解像度サンプルセットには、前記ターゲットビデオサンプル内の予め設定されたフレーム位置に位置するマルチフレームの第1の画像が含まれるステップと、
前記オリジナルビデオサンプルのうち、前記予め設定されたフレーム位置に位置するマルチフレームの第2の画像を輪郭強調処理することで、高解像度サンプルセットを取得するステップであって、前記高解像度サンプルセットには、輪郭強調処理後の前記マルチフレームの第2の画像である、マルチフレームの第3の画像が含まれる、ステップと、
前記低解像度サンプルセットと前記高解像度サンプルセットに基づいてトレーニングデータセットを構築するステップと、
前記トレーニングデータセットに基づいて初期再構築モデルをトレーニングすることで、前記解像度再構築モデルを取得するステップと、
に従ってトレーニングされたものである、請求項1に記載の方法。 - 前記低解像度サンプルセットと前記高解像度サンプルセットに基づいてトレーニングデータセットを構築する前記ステップは、
第1のサイズに従って前記マルチフレームの第3の画像をそれぞれ分割して、ラベル図を取得し、第2のサイズに従って前記マルチフレームの第1の画像をそれぞれ分割して、入力画像を取得するステップと、
前記マルチフレームの第3の画像のうち、各フレームの第3の画像に対応するラベル図に対して、前記ラベル図のうち、前記第3の画像に属する平坦領域のターゲットラベル図を決定するステップと、
前記ターゲットラベル図及び前記ターゲットラベル図に対応する入力画像を除去するステップと、を含む、請求項6に記載の方法。 - 前記ラベル図のうち、前記第3の画像に属する平坦領域のターゲットラベル図を決定する前記ステップは、
前記第3の画像に基づいて対応する初期演算子図を生成するステップと、
前記初期演算子図における画素値が第1の閾値よりも小さい画素点の画素値をゼロに再付与し、ターゲット演算子図を取得するステップと、
前記第1のサイズに従って前記ターゲット演算子図を分割し、前記ターゲット演算子図の演算子サブ図を取得するステップであって、前記演算子サブ図は、前記第3の画像のラベル図に一対一で対応するステップと、
前記演算子サブ図における画素値がゼロでない画素点の個数が第2の閾値を超えない場合、前記演算子サブ図に対応するラベル図が前記ターゲットラベル図であると決定するステップと、を含む、請求項7に記載の方法。 - 収集されたオリジナルビデオサンプルをビデオ圧縮処理することは、
予め設定された範囲内で複数の異なる固定コードレート係数を選択するステップと、
前記複数の異なる固定コードレート係数を利用して前記オリジナルビデオサンプルをそれぞれビデオ圧縮処理することで、複数の解像度のターゲットビデオサンプルを取得するステップと、を含む、請求項6に記載の方法。 - 解像度再構築モデルに基づいて前記処理対象のビデオフレームを解像度再構築することで、第2の解像度の初期再構築ビデオフレームを取得する前記ステップは、
前記解像度再構築モデルによって前記処理対象のビデオフレームに対して少なくとも2回の残差抽出を行い、各残差抽出結果を取得するステップと、
各残差抽出結果に基づいて前記処理対象のビデオフレームを解像度再構築することで、第2の解像度の初期再構築ビデオフレームを取得するステップと、を含む、請求項1に記載の方法。 - 前記解像度再構築モデルによって前記処理対象のビデオフレームに対して少なくとも2回の残差抽出を行うことで、各残差抽出結果を取得する前記ステップは、
前記解像度再構築モデルにおける畳み込み層によって前記処理対象のビデオフレームを畳み込み処理することで、前記処理対象のビデオフレームに対応する畳み込み処理結果を取得するステップと、
前記畳み込み処理結果に基づいて、ネットワーク本体構造における各残差ブロックを順に残差抽出を行い、前記各残差ブロックの残差抽出結果を取得するステップであって、前記各残差ブロックは、カスケード接続されたものであるステップと、を含む、請求項10に記載の方法。 - 各残差抽出結果に基づいて前記処理対象のビデオフレームを解像度再構築することで、第2の解像度の初期再構築ビデオフレームを取得する前記ステップは、
スプライシング層によって前記各残差抽出結果をスプライシングし、残差スプライシング特徴を取得するステップと、
前記残差スプライシング特徴を特徴融合することで、融合特徴図を取得するステップと、
融合特徴図をアップサンプリング処理することで、第2の解像度の初期再構築ビデオフレームを取得するステップであって、前記初期再構築ビデオフレームは、前記処理対象のビデオフレームに対応するものであるステップと、を含む、請求項10に記載の方法。 - 人工知能に基づく超解像度再構築装置であって、
第1の解像度の処理対象のビデオフレームシーケンスを取得する取得ユニットと、
前記処理対象のビデオフレームシーケンスにおける各フレームの処理対象のビデオフレームに対して、解像度再構築モデルに基づいて前記処理対象のビデオフレームを解像度再構築することで、前記第1の解像度よりも高い第2の解像度の初期再構築ビデオフレームを取得する再構築ユニットと、
前記初期再構築ビデオフレームにおける輪郭領域を決定する決定ユニットと、
前記輪郭領域を輪郭強調処理することで、ターゲット再構築ビデオフレームを取得する処理ユニットと、
前記ターゲット再構築ビデオフレームに基づいて、第2の解像度の再構築ビデオフレームシーケンスを生成する生成ユニットと、を含む、超解像度再構築装置。 - プロセッサ及びメモリを含む機器であって、
前記メモリは、プログラムコードを記憶し、前記プログラムコードを前記プロセッサに伝送し、
前記プロセッサは、前記プログラムコードにおける命令に基づいて、請求項1から請求項12のいずれか1項に記載の方法を実行する、機器。 - コンピュータプログラムを記憶するコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータプログラムは、請求項1から請求項12のいずれか1項に記載の方法を実行するのに用いられる、コンピュータ読み取り可能な記憶媒体。 - コンピュータプログラム製品であって、
前記コンピュータプログラム製品がコンピュータで運行されると、前記コンピュータに請求項1から請求項12のいずれか1項に記載のデータ処理方法を実行させる、コンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010435082.8A CN111340711B (zh) | 2020-05-21 | 2020-05-21 | 一种超分辨率重建方法、装置、设备和存储介质 |
CN202010435082.8 | 2020-05-21 | ||
PCT/CN2021/086584 WO2021233008A1 (zh) | 2020-05-21 | 2021-04-12 | 一种超分辨率重建方法和相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023508512A true JP2023508512A (ja) | 2023-03-02 |
JP7417747B2 JP7417747B2 (ja) | 2024-01-18 |
Family
ID=71184962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022540308A Active JP7417747B2 (ja) | 2020-05-21 | 2021-04-12 | 超解像度再構築方法及び関連装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220261960A1 (ja) |
JP (1) | JP7417747B2 (ja) |
CN (1) | CN111340711B (ja) |
WO (1) | WO2021233008A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111340711B (zh) * | 2020-05-21 | 2020-09-08 | 腾讯科技(深圳)有限公司 | 一种超分辨率重建方法、装置、设备和存储介质 |
CN111951221B (zh) * | 2020-07-13 | 2023-10-31 | 清影医疗科技(深圳)有限公司 | 一种基于深度神经网络的肾小球细胞图像识别方法 |
CN113965790A (zh) * | 2020-07-20 | 2022-01-21 | Tcl科技集团股份有限公司 | 一种图像显示的处理方法、存储介质及终端设备 |
CN112019861B (zh) * | 2020-07-20 | 2021-09-14 | 清华大学 | 基于关键帧指导超分辨率的视频压缩方法及装置 |
CN114301905B (zh) * | 2020-09-23 | 2023-04-04 | 华为技术有限公司 | 一种分辨率转换的方法和装置 |
CN112330541A (zh) * | 2020-11-11 | 2021-02-05 | 广州博冠信息科技有限公司 | 直播视频处理方法、装置、电子设备和存储介质 |
CN112634136B (zh) * | 2020-12-24 | 2023-05-23 | 华南理工大学 | 一种基于图像特征快速拼接的图像超分辨率方法及其系统 |
CN112950471A (zh) * | 2021-02-26 | 2021-06-11 | 杭州朗和科技有限公司 | 视频超分处理方法、装置、超分辨率重建模型、介质 |
CN113055742B (zh) * | 2021-03-05 | 2023-06-09 | Oppo广东移动通信有限公司 | 视频显示方法、装置、终端及存储介质 |
CN112991203B (zh) * | 2021-03-08 | 2024-05-07 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN113038267A (zh) * | 2021-03-09 | 2021-06-25 | Oppo广东移动通信有限公司 | 视频处理方法及装置、计算机可读存储介质和电子设备 |
CN112861811B (zh) * | 2021-03-24 | 2023-08-01 | 北京百度网讯科技有限公司 | 目标识别方法、装置、设备、存储介质及雷达 |
CN113573142B (zh) * | 2021-09-22 | 2021-12-24 | 北京海誉动想科技股份有限公司 | 分辨率调整方法与装置 |
US20230129290A1 (en) * | 2021-10-21 | 2023-04-27 | Cisco Technology, Inc. | Interpretable forecasting using path state transitions in application driven predictive routing |
CN116368511A (zh) * | 2021-10-28 | 2023-06-30 | 京东方科技集团股份有限公司 | 视频处理方法、装置、电子设备和可读存储介质 |
CN113902650B (zh) * | 2021-12-07 | 2022-04-12 | 南湖实验室 | 基于平行深度学习网络架构的遥感影像锐化方法 |
CN114202463B (zh) * | 2021-12-15 | 2024-02-23 | 陕西师范大学 | 面向云端融合的视频超分辨率方法及系统 |
CN114422852A (zh) * | 2021-12-16 | 2022-04-29 | 阿里巴巴(中国)有限公司 | 视频播放方法、存储介质、处理器和系统 |
CN114419339A (zh) * | 2022-03-30 | 2022-04-29 | 南方电网数字电网研究院有限公司 | 基于电力肖像的数据重建模型训练的方法和装置 |
CN115035230B (zh) * | 2022-08-12 | 2022-12-13 | 浙江天猫技术有限公司 | 视频渲染处理方法、装置、设备及存储介质 |
CN115471398B (zh) * | 2022-08-31 | 2023-08-15 | 北京科技大学 | 图像超分辨率方法、系统、终端设备及存储介质 |
CN115472140A (zh) * | 2022-09-09 | 2022-12-13 | 维沃移动通信有限公司 | 显示方法、显示装置、电子设备和可读存储介质 |
CN115272083B (zh) * | 2022-09-27 | 2022-12-02 | 中国人民解放军国防科技大学 | 一种图像超分辨率方法、装置、设备及介质 |
CN116668773B (zh) * | 2022-11-22 | 2023-12-22 | 荣耀终端有限公司 | 增强视频画质的方法与电子设备 |
CN116680438B (zh) * | 2023-05-13 | 2024-02-27 | 全景智联(武汉)科技有限公司 | 一种视频浓缩方法、系统、存储介质及电子设备 |
CN116630220B (zh) * | 2023-07-25 | 2023-11-21 | 江苏美克医学技术有限公司 | 一种荧光图像景深融合成像方法、装置及存储介质 |
CN117078516B (zh) * | 2023-08-11 | 2024-03-12 | 济宁安泰矿山设备制造有限公司 | 基于残差混合注意力的矿井图像超分辨率重建方法 |
CN116797462B (zh) * | 2023-08-18 | 2023-10-24 | 深圳市优森美科技开发有限公司 | 基于深度学习的实时视频超分辨率重建方法 |
CN117392545B (zh) * | 2023-10-26 | 2024-02-09 | 南昌航空大学 | 一种基于深度学习的sar图像目标检测方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0115714D0 (en) * | 2001-06-27 | 2001-08-22 | Imperial College | Structure determination of macromolecules |
JP4221434B2 (ja) | 2006-10-04 | 2009-02-12 | 株式会社ナナオ | 輪郭補正方法、画像処理装置及び表示装置 |
JP2010206273A (ja) | 2009-02-27 | 2010-09-16 | Toshiba Corp | 情報処理装置 |
JP2011091533A (ja) * | 2009-10-21 | 2011-05-06 | Sony Corp | 画像処理装置および方法、並びに、プログラム |
EP2662824A1 (en) * | 2012-05-10 | 2013-11-13 | Thomson Licensing | Method and device for generating a super-resolution version of a low resolution input data structure |
JP6308206B2 (ja) * | 2013-02-18 | 2018-04-11 | 日本電気株式会社 | 画像処理方法、画像処理装置、及び画像処理プログラム |
US9154698B2 (en) * | 2013-06-19 | 2015-10-06 | Qualcomm Technologies, Inc. | System and method for single-frame based super resolution interpolation for digital cameras |
WO2015180053A1 (zh) * | 2014-05-28 | 2015-12-03 | 北京大学深圳研究生院 | 一种快速超分辨率图像重建方法和装置 |
US9478007B2 (en) * | 2015-01-21 | 2016-10-25 | Samsung Electronics Co., Ltd. | Stable video super-resolution by edge strength optimization |
JP2017091231A (ja) | 2015-11-11 | 2017-05-25 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 画像処理装置、画像処理方法及び画像処理プログラム |
JP6347028B1 (ja) | 2017-10-13 | 2018-06-27 | 株式会社ツバサファクトリー | アップサンプル装置、コンピュータプログラム、コンピュータシステム、機器、及びアップサンプル方法 |
CN107798665B (zh) * | 2017-11-07 | 2021-07-09 | 天津大学 | 基于结构-纹理分层的水下图像增强方法 |
WO2019190566A1 (en) * | 2018-03-30 | 2019-10-03 | Intel Corporation | Multilayer optical proximity correction (opc) model for opc correction |
CN109146788B (zh) * | 2018-08-16 | 2023-04-18 | 广州视源电子科技股份有限公司 | 基于深度学习的超分辨率图像重建方法和装置 |
CN110136066B (zh) * | 2019-05-23 | 2023-02-24 | 北京百度网讯科技有限公司 | 面向视频的超分辨率方法、装置、设备和存储介质 |
CN110490807A (zh) * | 2019-08-27 | 2019-11-22 | 中国人民公安大学 | 图像重建方法、装置及存储介质 |
CN110533594B (zh) * | 2019-08-30 | 2023-04-07 | Oppo广东移动通信有限公司 | 模型训练方法、图像重建方法、存储介质及相关设备 |
CN111340711B (zh) * | 2020-05-21 | 2020-09-08 | 腾讯科技(深圳)有限公司 | 一种超分辨率重建方法、装置、设备和存储介质 |
-
2020
- 2020-05-21 CN CN202010435082.8A patent/CN111340711B/zh active Active
-
2021
- 2021-04-12 JP JP2022540308A patent/JP7417747B2/ja active Active
- 2021-04-12 WO PCT/CN2021/086584 patent/WO2021233008A1/zh active Application Filing
-
2022
- 2022-05-06 US US17/739,004 patent/US20220261960A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN111340711A (zh) | 2020-06-26 |
US20220261960A1 (en) | 2022-08-18 |
WO2021233008A1 (zh) | 2021-11-25 |
CN111340711B (zh) | 2020-09-08 |
JP7417747B2 (ja) | 2024-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7417747B2 (ja) | 超解像度再構築方法及び関連装置 | |
CN110189246B (zh) | 图像风格化生成方法、装置及电子设备 | |
CN109729405B (zh) | 视频处理方法、装置、电子设备及存储介质 | |
CN111932463B (zh) | 图像处理方法、装置、设备及存储介质 | |
WO2021098338A1 (zh) | 一种模型训练的方法、媒体信息合成的方法及相关装置 | |
CN111063008A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN103997687A (zh) | 用于向视频增加交互特征的技术 | |
CN111445392A (zh) | 图像处理方法及装置、计算机可读存储介质和电子设备 | |
CN112184548A (zh) | 图像超分辨率方法、装置、设备及存储介质 | |
CN111985281A (zh) | 图像生成模型的生成方法、装置及图像生成方法、装置 | |
CN114630057B (zh) | 确定特效视频的方法、装置、电子设备及存储介质 | |
CN115170400A (zh) | 一种视频修复的方法、相关装置、设备以及存储介质 | |
CN112084959A (zh) | 一种人群图像处理方法及装置 | |
CN112702604B (zh) | 用于分层视频的编码方法和装置以及解码方法和装置 | |
CN113570510A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN115205164B (zh) | 图像处理模型的训练方法、视频处理方法、装置及设备 | |
CN111935509A (zh) | 一种多媒体数据播放的方法、相关装置、设备及存储介质 | |
CN110197459B (zh) | 图像风格化生成方法、装置及电子设备 | |
CN116805282A (zh) | 图像超分辨率重建方法、模型训练方法、装置及电子设备 | |
CN113822955B (zh) | 图像数据处理方法、装置、计算机设备及存储介质 | |
CN114332709A (zh) | 视频处理方法、装置、存储介质以及电子设备 | |
CN115526772A (zh) | 视频处理方法、装置、设备和存储介质 | |
CN113012064B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN113905177A (zh) | 视频生成方法、装置、设备及存储介质 | |
CN111698512A (zh) | 视频处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220628 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220628 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7417747 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |