JP6945953B2 - 撮像システム及び画像処理の方法 - Google Patents

撮像システム及び画像処理の方法 Download PDF

Info

Publication number
JP6945953B2
JP6945953B2 JP2020532842A JP2020532842A JP6945953B2 JP 6945953 B2 JP6945953 B2 JP 6945953B2 JP 2020532842 A JP2020532842 A JP 2020532842A JP 2020532842 A JP2020532842 A JP 2020532842A JP 6945953 B2 JP6945953 B2 JP 6945953B2
Authority
JP
Japan
Prior art keywords
image
channel
dictionary
images
trained
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020532842A
Other languages
English (en)
Other versions
JP2021506035A (ja
Inventor
リウ、デホン
ウェン、ビハン
カミロフ、ウルグベック
マンソール、ハッサン
ボウフォウノス、ペトロス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2021506035A publication Critical patent/JP2021506035A/ja
Application granted granted Critical
Publication of JP6945953B2 publication Critical patent/JP6945953B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • G06T3/4061Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution by injecting details from different spectral ranges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10032Satellite or aerial image; Remote sensing
    • G06T2207/10036Multispectral image; Hyperspectral image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Description

本開示は、包括的には、マルチスペクトル撮像に関し、より詳細には、畳み込み辞書を用いたマルチスペクトル画像の解像度を増大させることに関する。
マルチスペクトル(MS)撮像システムは、ハードウェア実施態様において空間解像度とスペクトル解像度との間のトレードオフに直面する。MS画像の空間高解像度は、多くの応用にとって望ましいが、センサ、例えば飛行機又は宇宙船の機体に搭載されるセンサのサイズ、重さ及びパワーの制限によって、MS画像の解像度は、通常、劣化する。
超解像画像を達成するために、いくつかの従来の画像処理技術は、画像解像度を増大させること、及び、同じシーンからの結合される複数の連続したフレームを用いることによってこのハードウェア制限を軽減して、空間解像度を増大させることを目指す。いくつかの従来の方法では、ハードウェア問題のうちのいくつかに対処する様々な技術を用いられる。例えば、特許文献1に記載されている方法は、シーンの複数の連続した画像を得るように複数のカメラを用いており、ワーピング技術及びフェージング技術を介して画像を結合し、単一でシームレスなシーンの画像を生成する。
画像超解像(SR)は、通常、不良設定逆問題(ill-posed inverse problem)である。マルチスペクトル(MS)撮像に関して、目標は、低解像度(LR)測定値から高解像度(HR)マルチチャネル画像を再構成することである。LR MS画像を、基準としてのHRパンクロマティック(PAN:panchromatic)画像に融合するために、パンシャープン(Pan-sharpening)法が提案されてきた。パンシャープン法は、空間領域における高周波数成分を強調することによって、限度はあるが、空間解像度を、向上させることができる。
米国特許第7,015,954号
本開示は、他の態様とともに、結合分析合成辞書(CASD:Coupled Analysis and Synthesis Dictionary)モデルを用いてマルチスペクトル画像の解像度を増大させることによって、現行の画像処理産業及び他の関連した技術産業の技術的需要に対処する。
本開示は、畳み込み辞書を用いて、マルチスペクトル(MS)画像の解像度を増大させることに関する。特に、マルチスペクトル(MS)画像超解像は、再構成される画像を正則化することによって、超解像(SR)マルチチャネル画像をそれらの低解像度画像から再構成することを目指す。本開示のいくつかの実施形態は、複数のスペクトルチャネルにわたって空間及びスペクトルの関係を利用するために、深層辞書学習フレームワークを用いる結合分析合成辞書(CASD)モデルを用いてMS画像の解像度を増大させる。本開示を通して、分析辞書という用語は、フィルタ辞書と称することもできる。
本開示は、実験を通して、畳み込み辞書を用いて複数のスペクトルチャネル内で及び複数のスペクトルチャネルにわたって機能する正則化項を利用することによって、MS画像SRのために新規な結合分析合成辞書(CASD)モデルを開発した。例えば、CASDモデルはパラメータを含み、DeepCASDと称される深層辞書学習フレームワークは、画像データセットに対してエンドツーエンドのCASDベース再構成ネットワークを展開及びトレーニングすることによって用いることができる。
本開示及び実験を通してわかったことのうちのいくつかをより良く理解するために、克服すべきいくつかの課題を理解することが重要である。例えば、MS画像の空間高解像度は多くの応用にとって望ましいが、通常、飛行機、宇宙機、又はその他のセンサ搭載アプリケーションの機体に搭載されるセンサのサイズ、重さ及びパワーの制限によって、MS画像解像度は低くなる。MS画像超解像(SR)は、再構成される画像を正則化することによって、超解像マルチチャネル画像をそれらの低解像度画像から再構成することを目指す。
いくつかの実施形態は、辞書学習の導入によって、データ駆動型方法が画像超解像について有利になるという認識に基づいている。MS画像を各スペクトルチャネルに関して独立して処理することができるということが実験を通してわかった。これらの畳み込み辞書学習方法をMS画像SR応用に拡張する単純な方法は、チャネルごとに独立して畳み込み辞書を学習することによって行うことができる。しかしながら、いくつかの実施形態は、この拡張がスペクトルチャネルにわたってマルチスペクトル画像の関係を利用しないという認識に基づく。
実験を通してわかった態様は、MS撮像システムが、可視光学RGB帯域、赤外線帯域及び短波赤外線帯域を含む幅広い周波数帯域の範囲にわたって関心領域(area of interest)からの応答を測定することができるということを含む。これらのマルチバンドスペクトルは、物質、特に視覚的に類似した色の物質を検出及び区別するように、豊富な情報を提供することができる。さらに、光学帯域と比較して赤外線帯域がより高い大気透過性質を有しているので、光学撮像システムが十分に機能しない、霞んだ、又は曇った天候条件において、MS撮像はより有益である。実験中試験された、いくつかの手法は、マルチスペクトル及びハイパースペクトル撮像技術、すなわち、画像超解像(SR)を含み、画像超解像は、通常、不良設定逆問題である。この問題を解くように試験された少なくとも1つの手法は、元になる高解像度画像に対して正則化項を用いることを含んだ。他の試験された手法は、パンシャープン技術を含み、このパンシャープン技術では、例えば、既知のパンクロマティック画像の空間情報が、色画像又はMS画像のスペクトル情報と融合されて、空間高解像度及びスペクトル高解像度画像が生成される。しかしながら、パンクロマティック画像のスペクトルバンドは赤外線帯域と重なっていないので、パンシャープン法は、MS画像SR、特に赤外線帯域のスペクトル歪を導入する可能性があり、MS画像超解像プロセスにおいて性能を低下させることがこの実験からわかった。
異なる画像チャネル内だけでなく、MS画像の関係を十分に利用するために、いくつかの実施形態では、共有される特徴マップ及び結合畳み込み辞書を通してマルチチャネル低解像度(LR)測定値と高解像度(HR)画像とを関係付けるデータ駆動型結合分析合成辞書(CASD)モデルを導入する。CASDモデルを学習するために、本開示では、DeepCASDと称される深層学習フレームワークを使用し、その深層学習フレームワークは、エンドツーエンドトレーニングを用いてトレーニングデータをより効率的に利用し、MS画像SRプロセスは、DeepCASDを用いる。実験を通して、とりわけ、多くの非限定的な例によるいくつかの利点には、画像SRのエンドツーエンド学習フレームワークである共有される特徴マップを用いた複数のチャネル内での及び複数のチャネルにわたる結合を可能にすることと、従来のパンシャープン及び単一チャネル画像SRプロセスと比較して、スペクトルチャネルの総数及び画像解像度に関してより優れた柔軟性を提供することとがある。
また、CASDモデルによって、低解像度MS画像及び再構成される高解像度MS画像の間の相関を利用することが可能になるということが実験を通してわかった。特に、分析畳み込み辞書B(l=1,...,L)は、M×L個の畳み込み辞書(フィルタ){Wmi}から構成され、第i(i=1,...,L)列は、第iチャネルの低解像度画像で畳み込まれる一組のM個のフィルタを含む。フィルタリングされた低解像度画像の和は、第lのチャネル特徴マップ又は構造を表している。全てのチャネルl=1,...,Lについての第l列におけるエントリを除く、Bの全てのエントリがゼロに等しい場合、この特定の畳み込み辞書は、各スペクトルチャネルについて独立して畳み込み辞書を学習することに等しい。しかしながら、畳み込み辞書Bの他の非ゼロの値は、MS画像のチャネル内依存性を捕捉することができる。
特に、いくつかの実施形態は、各チャネルの高解像度画像は、チャネルの高解像度画像のために学習された辞書及びチャネルの低解像度画像の構造の畳み込みとして表すことができるという認識に基づいている。この構造は、各チャネルについて独立して各低解像度画像から抽出することができる。しかしながら、この手法は、複数のスペクトルチャネルにわたるマルチスペクトル画像の関係を利用しない。そのため、いくつかの実施形態は、チャネルの或る周波数帯域で取得されるシーンの低解像度画像の構造を、チャネルの当該周波数帯域を含む、異なるチャネルの異なる周波数帯域で取得されるシーンの異なる低解像度画像から学習することができるという理解に基づいている。
特に、低解像度画像の構造は、異なるチャネルのフィルタリングされた低解像度画像の組合せである。さらに、構造マップは、閾値θより下の画像領域でスパースであり、すなわち、構造マップ係数のほとんどはゼロである。フィルタBの係数、高解像度画像の辞書D及び閾値θは、各チャネルについてオフラインで学習することができる。フィルタの異なる係数は、異なるチャネルに対応する。さらに、異なるチャネルを表すフィルタの少なくともいくつかの係数は、MS画像のチャネル内依存性を可能にするために非ゼロである。そのようにして、画像間関係は、辞書内で符号化され、チャネル内関係は、フィルタ内で符号化される。
MS画像超解像のCASDモデルを学習及び適用するために、いくつかの実施形態は、深層融合ネットワーク等のニューラルネットワーク及び深層融合ネットワークのエンドツーエンドトレーニング方法を用いる。モデルパラメータを繰り返し更新し、各パラメータが他のパラメータの最新の更新を所与として更新される代わりに、いくつかの実施形態は、多層ニューラルネットワークを構成するように、画像融合についてCASD学習プロセスを展開する。ネットワーク全体が、誤差逆伝播(error back-propagation)を用いてエンドツーエンドでトレーニングされ、各パラメータは、他のパラメータの最新の更新に関係付けられるだけではなく、パラメータの履歴の更新にも関係付けられる。
例えば、信号s及び辞書行列Dを所与として、スパース符号化は、Dx≒sであるような、わずかな非ゼロエントリを有するスパース表現xを見つける逆問題である。これらの同定に辿り着くプロセスは、行列Dが画像全体について学習される場合、本明細書において辞書学習又は畳み込み辞書学習と称される辞書行列Dを学習することに関する技術を必要とする。さらに、スパース表現を用いて辞書行列を学習することは、いくつかの応用にとって有益である場合がある。しかしながら、辞書行列Dが高解像度画像について学習される場合、当該辞書行列は、低解像度画像のスパース表現xを用いて画像の解像度を増大させることができる。
いくつかの実施形態は、この概念をMS画像超解像に拡張するために、マルチスペクトル画像の異なる画像の構造から1つのチャネルの或る画像の構造を学習する。例えば、いくつかの実施形態は、異なる重みを用いて各チャネルについて異なる画像の構造を融合して、一組の融合された構造を生成した。そのようにして、チャネルの融合された構造は、チャネルに対応する重みを用いて、構造の組の重み付けされた組合せとして融合される。特に、異なるチャネルの融合された構造は、異なる重みで結合される。
いくつかの実施態様では、辞書の組、フィルタの組、及び各チャネルの構造を融合するための一組の重みは、異なるチャネルの異なる画像を用いて同時にトレーニングされる。例えば、いくつかの実施形態は、フィルタB={Wmi}を導入して、MS画像間の構造的関係を捕捉する。さらに、いくつかの実施形態は、辞書行列D、フィルタB={Wmi}の係数及び閾値θを、全てのトレーニング画像及びチャネルにわたる負の平均ピーク信号対雑音比を最小化することによって求める。そのようにして、フィルタの係数をトレーニングして、トレーニング済みの閾値θより下のMS画像のスパース表現を生成する。スパース表現は、トレーニング済みの辞書行列で畳み込まれると、高解像度MS画像を生成する。
本開示の別の実施形態によって、マルチスペクトル画像の解像度を増大させる撮像システムを開示する。システムは、センサによって生成される或るシーンの一組の画像を含む、マルチスペクトル画像を受信する入力インタフェースを備える。各画像は、周波数帯域を規定するチャネルを表しており、或るチャネルの或る画像は、そのチャネルの或る周波数帯域内に自身の周波数を有するようになっている。メモリは、異なるチャネルのためにトレーニングされる一組の合成辞書を記憶する。画像の構造で畳み込まれる、チャネルのためにトレーニングされる合成辞書は、チャネルの画像の解像度よりも高い解像度を有するチャネルの高解像度画像を生成する。メモリは、異なるチャネルのためにトレーニングされる一組のフィルタ(分析辞書)を記憶する。画像の組内の各画像で畳み込まれる、チャネルのためにトレーニングされるフィルタ(分析辞書)は、チャネルの画像の構造を生成する。ハードウェアプロセッサは、フィルタ(分析辞書)の組を用いて異なるチャネルの画像の組を処理して、一組の構造を生成する。プロセッサは、各チャネルについて構造の組を融合し、一組の融合された構造を生成する。チャネルの融合された構造は、チャネルに対応する重みを用いて構造の組の重み付けされた組合せとして融合され、異なるチャネルの融合された構造は、異なる重みで結合されるようになっている。プロセッサは、合成辞書の組からの対応する辞書を用いて融合された構造の組を処理して、超解像マルチスペクトル画像を生成する。出力インタフェースは、超解像マルチスペクトル画像をレンダリングする。
本開示の一実施形態によって、マルチスペクトル画像の解像度を増大させる画像処理の方法を開示する。方法は、センサによって生成され、かつ入力インタフェースによって又はコンピュータ可読メモリから取得されるシーンの一組の画像を含む、マルチスペクトル画像を取得することを含む。各画像は、周波数帯域を規定するチャネルを表しており、チャネルの画像は、チャネルの周波数帯域内に自身の周波数を有するようになっている。方法は、コンピュータ可読メモリのデータベースに、異なるチャネルのためにトレーニングされる一組の辞書を記憶することを含む。方法は、画像の構造で畳み込まれる、チャネルのためにトレーニングされる辞書は、チャネルの画像の解像度よりも高い解像度を有するチャネルの高解像度画像を生成する。コンピュータ可読メモリの別のデータベースに、異なるチャネルのためにトレーニングされる一組のフィルタを記憶することを含む。方法は、画像の組内の各画像で畳み込まれる、チャネルのためにトレーニングされるフィルタは、チャネルの画像の構造を生成する。方法は、コンピュータ可読メモリ及び入力インタフェースと通信するハードウェアプロセッサを用いて、フィルタの記憶された組を用いて異なるチャネルの画像の組を処理して、一組の構造を生成することを含む。方法は、ハードウェアプロセッサを用いて、各チャネルについて、構造の組を融合して、一組の融合された構造を生成することを含む。方法は、チャネルの融合された構造は、チャネルに対応する重みを用いて、構造の組の重み付けされた組合せとして融合され、異なるチャネルの融合された構造は、異なる重みで結合されるようになっている。辞書の組からの対応する辞書を用いて融合された構造の組を処理して、シーンの超解像マルチスペクトル画像を生成することを含む。方法は、出力インタフェースによって超解像マルチスペクトル画像を通信ネットワークに出力すること、又はコンピュータ可読メモリに超解像マルチスペクトル画像を記憶することを含む。
本開示の別の実施形態によって、方法を実行するコンピュータによる実行可能なプログラムが具現化される非一時的コンピュータ可読記憶媒体を開示する。方法は、或るシーンの画像の画像処理に関する。方法は、センサによって生成され、かつ入力インタフェースによって又は記憶媒体から取得されるシーンの一組の画像を含む、マルチスペクトル画像を取得することを含む、或るシーンの画像の画像処理のためのものである。各画像は、周波数帯域を規定するチャネルを表しており、或るチャネルの或る画像は、チャネルの或る周波数帯域内に自身の周波数を有するようになっている。方法は、記憶媒体のデータベースに、異なるチャネルのためにトレーニングされる一組の辞書を記憶することを含む。方法は、画像の構造で畳み込まれる、チャネルのためにトレーニングされる辞書は、チャネルの画像の解像度よりも高い解像度を有するチャネルの高解像度画像を生成する。記憶媒体の別のデータベースに、異なるチャネルのためにトレーニングされる一組のフィルタを記憶することを含む。方法は、画像の組内の各画像で畳み込まれる、チャネルのためにトレーニングされるフィルタは、チャネルの画像の構造を生成する。記憶媒体及び入力インタフェースと通信するコンピュータを用いて、フィルタの記憶された組を用いて異なるチャネルの画像の組を処理して、一組の構造を生成することを含む。方法は、コンピュータを用いて、各チャネルについて、構造の組を融合して、一組の融合された構造を生成することを含む。方法は、チャネルの融合された構造は、チャネルに対応する重みを用いて、構造の組の重み付けされた組合せとして融合され、異なるチャネルの融合された構造は、異なる重みで結合されるようになっている。辞書の組からの対応する辞書を用いて融合された構造の組を処理して、シーンの超解像マルチスペクトル画像を生成することを含む。方法は、出力インタフェースによって超解像マルチスペクトル画像を通信ネットワークに出力すること、又は記憶媒体に超解像マルチスペクトル画像を記憶することを含む。
ここに開示されている実施形態は、添付図面を参照して更に説明される。示されている図面は、必ずしも一律の縮尺というわけではなく、ここに開示されている実施形態の原理を示すことに強調が置かれている。
本開示の実施形態による、マルチスペクトル画像の解像度を増大させる画像処理の方法のフローチャートを示すブロック図である。 本開示の実施形態による、方法を実施するのに用いることができるいくつかの構成要素を含む方法を示す概略図である。 本開示の実施形態による、方法がどのようにこの方法のためのデータを収集するかを示す概略図である。 本開示の実施形態による、超解像(SR)マルチチャネル画像を再構成するために、マルチスペクトル(MS)画像について、DeepCASDと称される深層学習フレームワークを用いるデータ駆動型結合分析合成辞書(CASD)モデルの概要を含むトレーニングプロセスを示す概略図である。 本開示の実施形態による、トレーニングステージからの例示の画像を示す写真であり、低解像度画像を示している。 本開示の実施形態による、トレーニングステージからの例示の画像を示す写真であり、縮小領域ネットワーク(shrinkage field network)の出力及びCASDモデルの入力としてマルチスペクトル画像211を示している。 本開示の実施形態による、トレーニングステージからの例示の画像を示す写真であり、CASDモデルからの出力画像を示している。 本開示の実施形態による、トレーニングステージからの例示の画像を示す写真であり、トレーニング/学習期間中に図2Dの出力画像と比較される、記憶された対応する高解像度画像を示している。 本開示の実施形態による、第lチャネル
Figure 0006945953
を超解像する第kステージのCASDの層レベルの構造、及び入力/出力データ次元を示す概略図である。
本開示の実施形態による、SRマルチチャネル画像を再構成するために、MS画像について、十分トレーニングされたDeepCASDモデルを用いた概要を含む、トレーニング済みモデルを用いた画像融合を示す概略図である。 本開示の実施形態による高精細(HD)画像合成のいくつかの原理を示すブロック図である。 本開示の実施形態による、MS画像のトゥルーカラー(RGB)及び3つの赤外線チャネルの擬色(false color)のいくつかの例示のSR結果を示す写真である。 本開示の実施形態による、代替のコンピュータ又はプロセッサを用いて実施することができる図1Aの方法を示すブロック図である。
上記で明らかにされた図面は、ここに開示されている実施形態を記載しているが、この論述において言及されるように、他の実施形態も意図されている。この開示は、限定ではなく代表例として例示の実施形態を提示している。ここに開示されている実施形態の原理の範囲及び趣旨に含まれる非常に多くの他の変更及び実施形態を当業者は考案することができる。
概説
本開示の実施形態は、畳み込み辞書を用いて、マルチスペクトル(MS)画像の解像度を増大させることに基づいている。特に、MS画像超解像は、再構成される画像を正則化することによって、超解像(SR)マルチチャネル画像をそれらの低解像度画像から再構成することを目指す。本開示は、実験を通して、畳み込み辞書を用いて複数のスペクトルチャネル内で及び複数のスペクトルチャネルにわたって機能する正則化項を利用することによって、MS画像SRのために新規な結合分析合成辞書(CASD)モデルを開発した。例えば、CASDモデルはパラメータを含み、DeepCASDと称される深層辞書学習フレームワークは、画像データセットに対して、エンドツーエンドのCASDベース再構成ネットワークを展開及びトレーニングすることによって用いることができる。
いくつかの実施形態は、辞書学習の導入によって、データ駆動型方法が画像超解像について有利になるという認識に基づいている。MS画像を各スペクトルチャネルに関して独立して処理することができるということが実験を通してわかった。チャネルごとに独立して畳み込み辞書を学習することによって、これらの従来の辞書学習方法をMS画像SR応用に拡張することができるということが更に実現されるが、この拡張がスペクトルチャネルにわたってマルチスペクトル画像の関係を利用しないということが実験からわかった。
実験を通してわかった他の態様は、MS撮像システムが、可視光学RGB帯域、赤外線帯域及び短波赤外線帯域を含む幅広い周波数帯域の範囲にわたって関心領域からの応答を測定することができるということを含む。これらのマルチバンドスペクトルは、物質、特に視覚的に類似した色の物質を検出及び区別するように、豊富な情報を提供することができる。さらに、光学帯域に対する赤外線帯域のより高い大気透過性質によって、光学撮像システムが十分働かない霞んだ又は曇った天候条件において、MS撮像がより有益になる。
異なる画像チャネル内で及び異なる画像チャネルにわたってMS画像の関係を十分に利用するために、いくつかの実施形態は、MS画像SRに関する結合分析合成辞書(CASD)モデルを導入する。CASDモデルによって、低解像度MS画像と再構成される高解像度MS画像との間の相関を利用することができる。
特に、いくつかの実施形態は、各チャネルの高解像度画像は、チャネルの高解像度画像のために学習された辞書及びチャネルの低解像度画像の構造の畳み込みとして表すことができるという認識に基づいている。この構造は、各チャネルについて独立して各低解像度画像から抽出することができる。しかしながら、この手法は、スペクトルチャネルにわたってマルチスペクトル画像の関係を利用しない。判明したのは、シーンの低解像度画像の構造は、チャネルの或る周波数帯域で取得することができ、チャネルの当該周波数帯域を含む、異なるチャネルの異なる周波数帯域で取得されるシーンの異なる低解像度画像から学習することができるということである。特に、低解像度画像の構造は、異なるチャネルのフィルタリングされた低解像度画像の組合せとすることができる。さらに、構造マップは、閾値θより下の画像領域でスパースとすることができ、すなわち、構造マップ係数のほとんどはゼロである。フィルタBの係数、高解像度画像の辞書D及び閾値θは、各チャネルについてオフラインで学習することができる。フィルタの異なる係数は、異なるチャネルに対応する。さらに、異なるチャネルを表すフィルタの少なくともいくつかの係数は、MS画像のチャネル内依存性を可能にするために非ゼロである。そのようにして、画像間関係は、辞書内で符号化され、チャネル内関係は、フィルタ内で符号化される。
MS画像超解像のCASDモデルを学習及び適用するために、いくつかの実施形態は、深層融合ネットワーク等のニューラルネットワーク及び深層融合ネットワークのエンドツーエンドトレーニング方法を用いる。モデルパラメータを繰り返し更新し、各パラメータが他のパラメータの最新の更新を所与として更新される代わりに、いくつかの実施形態は、多層ニューラルネットワークを構成するように、画像融合についてCASD学習プロセスを展開する。ネットワーク全体が、誤差逆伝播を用いてエンドツーエンドでトレーニングされ、各パラメータは、他のパラメータの最新の更新に関係付けられるだけではなく、パラメータの履歴の更新にも関係付けられる。
例えば、信号s及び辞書行列Dを所与として、スパース符号化は、Dx≒sであるような、わずかな非ゼロエントリを有するスパース表現xを見つける逆問題である。これらの同定に辿り着くプロセスは、行列Dが画像全体について学習される場合、本明細書において辞書学習又は畳み込み辞書学習と称される辞書行列Dを学習することに関する技術を必要とする。さらに、スパース表現を用いて辞書行列を学習することは、いくつかの応用にとって有益である場合がある。しかしながら、辞書行列Dが高解像度画像について学習される場合、当該辞書行列は、低解像度画像のスパース表現xを用いて画像の解像度を増大させることができる。
いくつかの実施形態は、この概念をMS画像超解像に拡張するために、マルチスペクトル画像の異なる画像の構造から1つのチャネルの或る画像の構造を学習する。例えば、いくつかの実施形態は、異なる重みを用いて各チャネルについて異なる画像の構造を融合して、一組の融合された構造を生成した。そのようにして、チャネルの融合された構造は、チャネルに対応する重みを用いて、構造の組の重み付けされた組合せとして融合される。特に、異なるチャネルの融合された構造は、異なる重みで結合される。
いくつかの実施態様では、辞書の組、フィルタの組、及び各チャネルの構造を融合するための一組の重みは、異なるチャネルの異なる画像を用いて同時にトレーニングされる。例えば、いくつかの実施形態は、フィルタB={Wmi}を導入して、MS画像間の構造的関係を捕捉する。さらに、いくつかの実施形態は、辞書行列D、フィルタB={Wmi}の係数及び閾値θを、全てのトレーニング画像及びチャネルにわたる負の平均ピーク信号対雑音比を最小化することによって求める。そのようにして、フィルタの係数をトレーニングして、トレーニング済みの閾値θより下のMS画像のスパース表現を生成する。スパース表現は、トレーニング済みの辞書行列で畳み込まれると、高解像度MS画像を生成する。
図1Aは、本開示の実施形態による、マルチスペクトル画像の解像度を増大させる画像処理の方法のフローチャートを示すブロック図である。方法100Aは、或るシーンの一組の画像を有するマルチスペクトル画像(複数の場合もある)を取得するステップ110を含む。各マルチスペクトル画像は、周波数帯域を規定するチャネルを表しており、或るチャネルの或る画像がそのチャネルの或る周波数帯域内に自身の周波数を有するようになっている。
図1Aのステップ115は、コンピュータ可読メモリのデータベースに、異なるチャネルについてトレーニングされた一組の辞書を記憶することを含むことができ、画像の構造で畳み込まれる、チャネルのためにトレーニングされた辞書は、チャネルの画像の解像度より高い解像度を有するチャネルの高解像度画像を生成するようになっている。さらに、コンピュータ可読メモリの別のデータベースに、異なるチャネルのためにトレーニングされた一組のフィルタを記憶し、画像の組内の各画像で畳み込まれる、チャネルのためにトレーニングされたフィルタは、チャネルの画像の構造を生成するようになっている。
図1Aのステップ120は、コンピュータ可読メモリ及び入力インタフェースと通信するプロセッサを用いて、記憶されたフィルタの組を用いて異なるチャネルの画像の組を処理して、一組の構造を生成することを含むことができる。
図1Aのステップ125は、プロセッサを用いて、各チャネルについて、構造の組を融合して、一組の融合された構造を生成することを含むことができ、チャネルの融合された構造は、チャネルに対応する重みを用いて構造の組の重み付けされた組合せとして融合され、異なるチャネルの融合された構造は、異なる重みで結合されるようになっている。
図1Aのステップ130は、辞書の組からの対応する辞書を用いて融合された構造の組を処理して、シーンの超解像マルチスペクトル画像を生成することを含むことができる。
図1Aのステップ135は、出力インタフェースによって超解像マルチスペクトル画像を通信ネットワークに出力すること、又は、コンピュータ可読メモリに超解像マルチスペクトル画像を記憶することを含むことができる。
図1Bは、本開示の実施形態による、方法100Bを実施するのに用いることができるいくつかの構成要素を含む方法を示す概略図である。例えば、いくつかの構成要素は、入力インタフェース13、外部メモリデバイス15、メモリ10、方法のステップを実施することができるプロセッサ12を含むことができる。
マルチスペクトル画像データ1を含む信号データは、センサ3によって集めるとともに、入力インタフェース13によって、又は外部メモリデバイス15若しくは有線若しくは無線のいずれかで通信する何らかの他の手段から取得することができる。例えば、マルチスペクトル画像(複数の場合もある)データ1は、プロセッサ12によって直接、又は、例えば、メモリ転送デバイス又は無線通信様式のデバイスによって間接的に取得することができる。キーボード(図示せず)を有するユーザインタフェース17は、プロセッサ12及びコンピュータ可読メモリ又はメモリと通信することができ、ユーザによるユーザインタフェース17のキーボードの表面からの入力を受信すると、多視点画像の組及び他のデータを取得し、コンピュータ可読メモリ10内に記憶することができるということが可能である。
図1Bを更に参照すると、プロセッサ12は、クライアントデバイス18に接続することができるネットワーク対応サーバ14と通信することができる。さらに、プロセッサ12は、送信機16及び外部記憶デバイス19に接続することができる。
図1Cは、本開示の実施形態による、方法がどのようにデータ、すなわち或るシーンのマルチスペクトル画像を収集することができるかを示す概略図である。方法100Cは、太陽7が太陽光8をシーンに照射するシーン9を含むことができ、このシーンにおいて、雲5が、センサ3、すなわち、ビデオ、カメラ等からのビューを妨げる。センサ3は、光学帯域を超えた広域の周波数範囲にわたってデータを捕捉又は収集することを含む複数の検知機構とすることができ、このデータはシーン9のマルチスペクトル画像1を含む。赤外線帯域及び短波赤外線帯域が雲を貫通することができるので、センサ3は、シーン9を赤外線帯域及び短波赤外線帯域内で捕捉することができる。シーン9の死角(blind areas)11は、光学RGB帯域内にある間、雲5が原因でセンサ3から不可視である。
図2Aは、畳み込み分析辞書(フィルタ)B、合成辞書D、及び閾値パラメータθを学習するように、マルチスペクトル(MS)画像について、DeepCASDと称される深層学習フレームワークを用いるデータ駆動型結合分析合成辞書(CASD)モデルの概要を示す概略図である。まず、低解像度マルチスペクトル画像202の各チャネルの低解像度画像は、独立して超解像プロセスについて縮小領域ネットワーク210に入力される。縮小領域ネットワーク210の出力211及びパンクロマティック画像201は、畳み込み辞書及びパラメータを学習するCASDモデルの入力である。Kステージ深層ネットワーク221及び222を用いて、L枚のマルチスペクトル画像231を含む出力超解像画像230は、L枚のマルチスペクトル画像251を含む、対応する高解像度画像250と比較される。231と251との間の損失関数は、畳み込み辞書B及びD、並びにパラメータθを更新するのに用いられる。損失関数が前もって設定された値未満であると、CASDモデルは十分トレーニングされており、画像超解像プロセスに向けた準備ができている。
図2B、図2C、図2D及び図2Eは、トレーニングステージからの例示の画像を示す写真であり、図2Bは、最初の超解像プロセスとして縮小領域ネットワークに入力される低解像度画像202を示しており、図2Cは、チャネル独立プロセスを用いた縮小領域ネットワークの出力としての、また、CASDモデルの入力としてのマルチスペクトル画像211を示している。クロスチャネル構造融合がなければ、画像211のうちのいくつかは、雲に覆われることに起因して十分解像しない。図2Dは、CASDモデルからの出力画像231を示しており、図2Eは、トレーニング期間中、本開示の実施形態による、図2Dの出力画像と比較される、記憶された対応する高解像度画像251を示している。
図3は、本開示の実施形態による、第lチャネル
Figure 0006945953
を超解像する第kステージのCASD221の層レベルの構造、及び入力/出力データ次元を示す概略図である。L枚のマルチスペクトル画像300の各チャネルは、M個の分析辞書311
Figure 0006945953
、312
Figure 0006945953
、...、及び313
Figure 0006945953
で畳み込まれ、結果として各チャネル画像に関するM個の構造マップ
Figure 0006945953
をもたらす。縮小プロセス321
Figure 0006945953
、322
Figure 0006945953
、...、及び323
Figure 0006945953
(ただし、閾値パラメータθ、θ、...、θ)の後、スパース構造マップ
Figure 0006945953
が達成され、合成辞書331
Figure 0006945953
、332
Figure 0006945953
、...、及び333
Figure 0006945953
で畳み込まれるのに用いられ、利用可能な場合高解像度パンクロマティック画像201に組み込まれ、lチャネル超解像画像340
Figure 0006945953
が生成される。
図4は、本開示の実施形態による、SRマルチチャネル画像を再構成する、MS画像についてのDeepCASDモデルの概要を示す概略図である。
図5は、本開示の実施形態による高精細(HD)画像合成のいくつかの原理を示すブロック図である。例えば、融合されたスパース係数マップu530にトレーニング済みの畳み込み辞書D(HR)520を乗算したものは、図5のマルチチャネル画像X(HR)510と等しい。
CASDモデル
MS画像SRについて、DeepCASDと称されるエンドツーエンド融合ネットワークが提示される。図4において示されるような、各DeepCASDブロックの構造は、異なる画像チャネル内で及び異なる画像チャネルにわたって十分機能するように、単一チャネルSRモジュール及びマルチチャネルSRモジュールの両方から構成される。縮小領域(SF)ネットワークが、実証された性能及び効率に起因して単一チャネルモジュールとして用いられる。L個のスペクトルチャネルを所与とすると、マルチチャネルCASDモデルは、l∈{1,...,L}についての各HR画像x及びマルチチャネルLR測定値
Figure 0006945953
の全てが、それぞれ畳み込み合成及び分析辞書の下でほぼスパースである(ただし、共有される係数マップはu∈RMpである)と想定する。
各チャネルにおけるHR画像xは、以下のCASD撮像問題を解くことによって超解像され、
Figure 0006945953
ここで、D=[Dl,1|...|Dl,M]∈Rp×Mpは、xについての畳み込み合成辞書である一方で、(P2)におけるyについての畳み込み分析辞書は、以下のように規定される。
Figure 0006945953
(P2)では、項
Figure 0006945953
及び
Figure 0006945953
は、それぞれ分析辞書及び合成辞書の下で、xについてモデル化誤差を示す。(P1)で用いられた単一分析モデルと比較して、(P2)におけるCASDモデルは、HR画像構造だけではなく、LR測定値とHR画像との間の相関を更に利用する。
CASDを学習するために、結合辞書学習に対する従来の研究で幅広く用いられていた交互最小化を用いて(P2)を直接解くことができる。実験中、多くの撮像応用においてより優れた性能を実証した合成スパース符号化問題を展開することによって、深層学習を審査することができる。したがって、(P2)における損失関数を直接最適化する代わりに、本開示は、画像融合のためにCASD学習を展開することによって、DeepCASDと称されるエンドツーエンドの学習フレームワークを用いる。MS画像SRのDeepCASDの概要は、図2Aにおいて示される。
エンドツーエンドDeepCASD学習
提案されるDeepCASDにおけるマルチチャネルSRモジュールは、K個のCASDステージを含む。各ステージにおいて、トレーニング可能なパラメータの組は、B、θ、Dであり、このセットを用いて特徴マップuを生成し、したがって各yを超解像する。u及び辞書Dを所与として、(P2)に対する解
Figure 0006945953
は、
Figure 0006945953
によって与えられ、ここで、λ’=1/(1+λ)であり、λ/(1+λ)は、学習中、
Figure 0006945953
に吸収される。特徴マップuを得るために、直接(P2)を解くことは、エンドツーエンドトレーニングにおいてトレーニング可能D及び出力
Figure 0006945953
を用いる勾配計算を含み、これにより、再帰ニューラルネットワーク構造がもたらされる。本開示は、各uが以下の分析(すなわち、変換)モデルスパース符号化問題
Figure 0006945953
を解くことによって推定されるように、効率的な実施のためにフィードフォワードDeepCASDネットワークを構成する。ここで
Figure 0006945953
は、特徴正則化項
Figure 0006945953
の対応する縮小関数を示している。例えば、uの非ゼロ要素の数を数えるl「ノルム」を用いる
Figure 0006945953
である場合、対応するηθ(・)は、閾値θを有するuのハード閾値処理関数(hard-thresholding function)になる。ここで、縮小関数
Figure 0006945953
となるようにトレーニング可能ガウスRBFを使用し、これは、SFネットワークにおける非線形縮小関数の良好な一般化を示す。
提案されるDeepCASDにおけるカスケード型構造を分析するために、lチャネル超解像画像を第kステージ(k=1,...,K)における
Figure 0006945953
として示す。
Figure 0006945953
の再構成のための第kステージにおけるトレーニング可能な組は、
Figure 0006945953
として示される。図4は、K個のカスケード型CASDステージがマルチチャネルSRモジュールを構成する方法を示している。すなわち、第kステージのマルチチャネル出力
Figure 0006945953
は、そのLR入力として次のステージに渡される。第kステージのマルチチャネル出力は、辞書
Figure 0006945953
及び
Figure 0006945953
、縮小関数パラメータの組
Figure 0006945953
、以前のステージ出力
Figure 0006945953
並びに第lチャネルLR画像yの関数として、以下のように再帰的に表すことができ、
Figure 0006945953
ここで、
Figure 0006945953
は、第1ステージにおける入力を示している。図3は、
Figure 0006945953
の再構成に関する第kステージのCASDネットワークの層レベルの構造を示している。
Figure 0006945953
は、
Figure 0006945953
の第m行を示しており、これは、縮小を適用する前に、マルチチャネル入力
Figure 0006945953
に融合し、すなわち、
Figure 0006945953
であることに留意されたい。
DeepCASDは、マルチチャネルHR画像X=[x(1)|...|x(N)]及びそれらのLR測定値Y=[y(1)|...|y(N)]のN個の対を含むトレーニングの組に対してトレーニングされる。全ての画像及びチャネルにわたる負の平均再構成PSNRが、最終の出力におけるコスト関数Lとして利用される。
Figure 0006945953
ここで、Bは最大画像ピクセル値(例えば、8ビット画像の場合B=255)であり、
Figure 0006945953
は、DeepCASDを用いた超解像マルチチャネル画像を示している。第KステージのDeepCASDにおける全てのトレーニング可能なパラメータの組を
Figure 0006945953
とする。ジョイントDeepCASDトレーニング問題は、以下のように定式化される。
Figure 0006945953
問題(P3)は、誤差逆伝播を用いて解くことができる。代替的には、各DeepCASDステージ自体がスタンドアローン式の画像融合ネットワークであるので、各Θは、以下のステージ単位のDeepCASDトレーニング問題を解くことによって、別個にトレーニングすることができる。
Figure 0006945953
実際に、(P3)が非常に非凸であるので、(P3)のジョイントトレーニングにおける初期化として(P4)を用いて学習されるステージ単位
Figure 0006945953
を用いることがより効率的である。DeepCASDネットワークトレーニングが完了すると、トレーニング済み
Figure 0006945953
を用いて再帰的に(4)を適用することによって、マルチチャネルSRが行われる。
図3は、第lチャネル
Figure 0006945953
超解像する第kステージのCASDの層レベルの構造、及び入力/出力データ次元をを示している。
表1:バイキュービック補間、辞書学習(DL)、縮小領域(SF)及び提案されるDeepCASD法を用いた、16個のチャネルにわたって平均されたMS画像×2SRのPSNR値(dB単位)。各行のPSNR最高値は、太字で示される。
Figure 0006945953
Figure 0006945953
実験
リモートセンシングMS画像に関するSR問題に対する提案されるDeepCASDの性能を評価及び比較するために、パンクロマティック、RGB、赤外線及び短波赤外線チャネルを含む、17個の別個のチャネルのMS画像が、AVIRISハイパースペクトル画像データセットを用いて合成される。各高解像度MSチャネルは、隣接する周波数帯域を包含する複数のハイパースペクトルチャネルの重み付けされた和として生成される。その後、対応する低解像度MSチャネルは、ローパスフィルタを通して高解像度MS画像をダウンサンプリングすることによって生成される。深層CASDネットワークのパラメータが、まず一組のMS画像を用いてトレーニングされる。トレーニングの組は、高解像度MS画像及び16個のチャネルにわたるそれらの対応する低解像度測定値の138個の対を含む。単一チャネルにおける各HR画像のサイズは、256×256である。LR画像は、まずバイキュービック補間によってHR画像サイズにアップスケーリングされる。HRパンクロマティック画像は、通常リモートセンシング応用に利用可能であるので、トレーニング及び試験においてスキップリンク(skip link)を通して各マルチチャネルSRステージ(すなわち、各CASDステージにおいてL=16の入力マルチスペクトルチャネル及び1つのパンクロマティック入力、並びにL=16の出力マルチスペクトルチャネルがある)に直接渡される(図2Aを参照されたい)。
単一チャネルSRモジュール(図2A)における3つの単一チャネルSRステージと、これに後続して、DeepCASDネットワークにおける1つのマルチチャネルSRステージとが用いられて、2×−SR実験が実行される。SRステージが多くなるほどDeepCASDを用いたSR性能が改善されることに留意されたい。しかしながら、より深いネットワークをトレーニングするためにはより多くのトレーニングデータが必要であり、より多くのトレーニングデータがなければ、DeepCASDは、SR品質の劣化をもたらす過剰適合(overfitting)になる場合がある。トレーニングプロセスについて、ジョイントトレーニングは、ステージ単位のトレーニングと比較してわずかに良好なSRの性能を達成することができるが、より多くの時間を消費することに更に留意されたい。ステージ単位のトレーニングは、ジョイントトレーニングと比較して、その効率及びSR性能の劣化に対する耐性のために用いられる。トレーニングが完了すると、AVIRISデータセットにおける他の領域のMS画像は超解像され、この画像は、多様な幾何学的特性を含む。再構成された画像のPSNRは、品質基準として用いられる。
図6は、本開示の実施形態による、MS画像のトゥルーカラー(RGB)及び3つの赤外線チャネルの擬色のいくつかの例示のSR結果を示している。例えば、従来の辞書学習(DL)及び縮小領域(SF)法によって得られる結果と比較して、DeepCASDは、特に道路及び建築物等の重要な局所的領域をより良好に解像することによって、より多くの詳細を発見することができる。
カリフォルニア州における4つの異なる試験領域についての表1の再構成されたMS画像PSNRを用いて、MS画像SR結果の性能を定量的に分析するために、各PSNR値は、前述の方法を用いて得られた16個のMSチャネルにわたって平均される。提案されるDeepCASD方式は、全ての試験MS画像について、全ての競合する方法に性能が勝ることが明らかである。バイキュービック補間、辞書学習(DL)ベースSR及びSFネットワークに対するDeepCASD結果の平均PSNRの改善は、それぞれ2.2dB、0.8dB及び0.2dBである。
本開示のデータ駆動型方法は、マルチスペクトル画像超解像に関する深層結合分析合成辞書(DeepCASD)フレームワークを用いる。開示の方法によって、複数の画像チャネル内での及び複数の画像チャネルにわたる畳み込み辞書の結合が可能になるとともに、エンドツーエンドトレーニングプロセス内で有効に高次元のデータを利用することが可能になる。
図7は、本開示の実施形態による、代替のコンピュータ又はプロセッサを用いて実施することができる図1Aの方法を示すブロック図である。コンピュータ711は、プロセッサ740と、コンピュータ可読メモリ712と、記憶装置758と、ディスプレイ752及びキーボード751とのユーザインタフェース749とを備え、これらは、バス756を通じて接続されている。例えば、プロセッサ740及びコンピュータ可読メモリ712と通信するユーザインタフェース749は、ユーザによるユーザ入力インタフェース757の表面、すなわちキーボード753からの入力を受信すると、画像データを取得し、コンピュータ可読メモリ712内に記憶する。
コンピュータ711は、電源754を備えることができ、用途に応じて、電源754は、任意選択でコンピュータ711の外部に配置されてもよい。バス756を通じて、ディスプレイデバイス748に接続するように構成されたユーザ入力インタフェース757をリンクすることができ、ディスプレイデバイス748は、とりわけ、コンピュータモニター、カメラ、テレビ、プロジェクター、又はモバイルデバイスを含むことができる。プリンタインタフェース759も、バス756を通じて接続することができ、印刷デバイス732に接続するように構成することができる。印刷デバイス732は、とりわけ、液体インクジェットプリンタ、固体インクプリンタ、大規模商用プリンタ、感熱式プリンタ、UVプリンタ、又は昇華型プリンタを含むことができる。ネットワークインタフェースコントローラ(NIC)734は、バス756を通じてネットワーク736に接続するように構成され、とりわけ、画像データ又は他のデータは、コンピュータ711の外部の第三者ディスプレイデバイス、第三者撮像デバイス、及び/又は第三者印刷デバイス上にレンダリングすることができる。コンピュータ/プロセッサ711は、バス756に接続されているGPS701を備えることができる。
図7を更に参照すると、とりわけ、画像データ又は他のデータは、ネットワーク736の通信チャネルを介して送信することができ、及び/又は、記憶及び/又は更なる処理のために記憶システム758内に記憶することができる。さらに、時系列データ又は他のデータは、受信機746(又は外部受信機738)から無線又は配線接続で受信することもできるし、送信機747(又は外部送信機739)を介して無線又は配線接続で送信することもでき、受信機746及び送信機747は、ともにバス756を通じて接続されている。コンピュータ711は、入力インタフェース708を介して外部検知デバイス744及び外部入力/出力デバイス741に接続することができる。入力インタフェース708は、1つ以上の入力/出力デバイス741、外部メモリ706、機械型のデバイス702に接続することができる外部センサ704に接続することができる。例えば、外部検知デバイス744は、機械の時系列データを収集する前、収集中、収集後に、データを集めるセンサを含むことができる。コンピュータ711は、他の外部コンピュータ742に接続することができる。出力インタフェース709は、プロセッサ740からの処理データを出力するのに用いることができる。プロセッサ740及び非一時的コンピュータ可読記憶媒体712と通信するユーザインタフェース749は、ユーザインタフェース749の表面752からユーザによる入力を受信すると、領域データを取得し非一時的コンピュータ可読記憶媒体712内に記憶することに留意されたい。
以下の説明は、例示的な実施形態のみを提供し、本開示の範囲も、適用範囲も、構成も限定することを意図していない。そうではなく、例示的な実施形態の以下の説明は1つ以上の例示的な実施形態を実施することを可能にする説明を当業者に提供する。添付の特許請求の範囲に明記されているような開示された主題の趣旨及び範囲から逸脱することなく要素の機能及び配置に行うことができる様々な変更が意図されている。
以下の説明では、実施形態の十分な理解を提供するために、具体的な詳細が与えられる。しかしながら、当業者は、これらの具体的な詳細がなくても実施形態を実施することができることを理解することができる。例えば、開示された主題におけるシステム、プロセス、及び他の要素は、実施形態を不必要な詳細で不明瞭にしないように、ブロック図形式の構成要素として示される場合がある。それ以外の場合において、よく知られたプロセス、構造、及び技法は、実施形態を不明瞭にしないように不必要な詳細なしで示される場合がある。さらに、様々な図面における同様の参照符号及び名称は、同様の要素を示す。
また、個々の実施形態は、フローチャート、フロー図、データフロー図、構造図、又はブロック図として描かれるプロセスとして説明される場合がある。フローチャートは、動作を逐次的なプロセスとして説明することができるが、これらの動作の多くは、並列又は同時に実行することができる。加えて、これらの動作の順序は、再配列することができる。プロセスは、その動作が完了したときに終了することができるが、論述されない又は図に含まれない追加のステップを有する場合がある。さらに、特に説明される任意のプロセスにおける全ての動作が全ての実施形態において行われ得るとは限らない。プロセスは、方法、関数、手順、サブルーチン、サブプログラム等に対応することができる。プロセスが関数に対応するとき、その関数の終了は、呼び出し側関数又はメイン関数へのその機能の復帰に対応することができる。
さらに、開示された主題の実施形態は、少なくとも一部は手動又は自動のいずれかで実施することができる。手動実施又は自動実施は、マシン、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、又はそれらの任意の組合せを用いて実行することもできるし、少なくとも援助することができる。ソフトウェア、ファームウェア、ミドルウェア又はマイクロコードで実施されるとき、必要なタスクを実行するプログラムコード又はプログラムコードセグメントは、マシン可読媒体に記憶することができる。プロセッサ(複数の場合もある)が、それらの必要なタスクを実行することができる。
本開示の上記で説明した実施形態は、多数の方法のうちの任意のもので実施することができる。例えば、実施形態は、ハードウェア、ソフトウェア又はそれらの組合せを用いて実施することができる。ソフトウェアで実施される場合、ソフトウェアコードは、単一のコンピュータに設けられるのか又は複数のコンピュータ間に分散されるのかにかかわらず、任意の適したプロセッサ又はプロセッサの集合体において実行することができる。そのようなプロセッサは、1つ以上のプロセッサを集積回路部品に有する集積回路として実装することができる。ただし、プロセッサは、任意の適したフォーマットの回路類を用いて実装することができる。
また、本明細書において略述された様々な方法又はプロセスは、様々なオペレーティングシステム又はプラットフォームのうちの任意の1つを用いる1つ以上のプロセッサ上で実行可能なソフトウェアとしてコード化することができる。加えて、そのようなソフトウェアは、複数の適したプログラミング言語及び/又はプログラミングツール若しくはスクリプティングツールのうちの任意のものを用いて記述することができ、実行可能機械語コード、又はフレームワーク若しくは仮想機械上で実行される中間コードとしてコンパイルすることもできる。通常、プログラムモジュールの機能は、様々な実施形態において所望に応じて組み合わせることもできるし、分散させることもできる。
また、本開示の実施形態は、方法として具現化することができ、この方法の一例が提供されている。この方法の一部として実行される動作は、任意の適した方法で順序付けることができる。したがって、例示したものと異なる順序で動作が実行される実施形態を構築することができ、この順序は、いくつかの動作が例示の実施形態では順次的な動作として示されていても、それらの動作を同時に実行することを含むことができる。さらに、請求項の要素を修飾する、特許請求の範囲における第1、第2等の序数の使用は、それ自体で、1つの請求項の要素の別の請求項の要素に対する優先順位も、優位性も、順序も暗示するものでもなければ、方法の動作が実行される時間的な順序も暗示するものでもなく、請求項の要素を区別するために、単に、或る特定の名称を有する1つの請求項の要素を、同じ(序数の用語の使用を除く)名称を有する別の要素と区別するラベルとして用いられているにすぎない。

Claims (18)

  1. マルチスペクトル画像の解像度を増大させる撮像システムであって、
    センサによって生成される或るシーンの一組の画像を含むマルチスペクトル画像を受信する入力インタフェースであって、各画像は、周波数帯域を規定するチャネルを表しており、或るチャネルの或る画像は、前記チャネルの或る周波数帯域内に自身の周波数を有するようになっている、入力インタフェースと、
    メモリであって、
    異なるチャネルのためにトレーニングされる一組の合成辞書であって、前記画像の構造で畳み込まれる、チャネルのためにトレーニングされる合成辞書は、前記チャネルの前記画像の解像度よりも高い解像度を有する前記チャネルの高解像度画像を生成するようになっている、一組の合成辞書と、
    前記異なるチャネルのためにトレーニングされる一組のフィルタ(分析辞書)であって、前記画像の組内の各画像で畳み込まれる、チャネルのためにトレーニングされるフィルタ(分析辞書)は、前記チャネルの前記画像の前記構造を生成するようになっている、一組のフィルタと、
    を記憶する、メモリと、
    ハードウェアプロセッサであって、
    前記フィルタ(分析辞書)の組を用いて前記異なるチャネルの前記画像の組を処理して、一組の構造を生成し、
    各チャネルについて、前記構造の組を融合して、一組の融合された構造を生成し、前記チャネルの融合された構造は、前記チャネルに対応する重みを用いて、前記構造の組の重み付けされた組合せとして融合され、異なるチャネルの前記融合された構造は、異なる重みで結合されるようになっており、
    前記合成辞書の組からの対応する辞書を用いて前記融合された構造の組を処理して、超解像マルチスペクトル画像を生成する、
    ハードウェアプロセッサと、
    前記超解像マルチスペクトル画像をレンダリングする出力インタフェースと、
    を備える、撮像システム。
  2. 前記フィルタの組内の各フィルタ(分析辞書)及び前記辞書の組内の各辞書は、前記異なるチャネルの異なる画像を用いてトレーニングされる、請求項1に記載の撮像システム。
  3. 前記合成辞書の組及び前記フィルタ(分析辞書)の組は、同時にトレーニングされて、前記異なるチャネル内の全てのトレーニング画像にわたる平均ピーク信号対雑音比が増大する、請求項2に記載の撮像システム。
  4. 前記辞書の組及び前記フィルタの組は、以前の反復中に学習された前記辞書の組及び前記フィルタの組の以前の値を用いて、現在の反復において前記辞書の組及び前記フィルタの組の現在の値を更新することによって、同時にレーニングされる、請求項3に記載の撮像システム。
  5. 前記メモリは、前記チャネルのためにトレーニングされる一組の閾値を記憶し、前記ハードウェアプロセッサは、対応する閾値を用いて前記チャネルの前記画像の前記構造の値を閾値処理することによって、前記チャネル内の前記画像の前記構造にスパース性を課すようになっている、請求項1に記載の撮像システム。
  6. 前記辞書の組は、畳み込み辞書である、請求項1に記載の撮像システム。
  7. 前記辞書の組、前記フィルタ(分析辞書)の組、及び各チャネルの構造を融合するための一組の重みは、前記異なるチャネルの異なる画像を用いて同時にトレーニングされる、請求項1に記載の撮像システム。
  8. 前記重みの組は、前記フィルタ(分析辞書)の組及び前記合成辞書の組のうちの一方又は組合せに組み込まれ、前記合成辞書の組と前記対応する構造との前記畳み込みの組合せは、前記異なる画像の前記構造と対応する重みとの前記融合を含むようになっている、請求項1に記載の撮像システム。
  9. 前記チャネルに対応する前記重みは、全てのトレーニング画像及びチャネルにわたる平均ピーク信号対雑音比を最大化することによって求められる、請求項1に記載の撮像システム。
  10. マルチスペクトル画像の解像度を増大させる画像処理の方法であって、
    センサによって生成され、かつ入力インタフェースによって又はコンピュータ可読メモリから取得される或るシーンの一組の画像を含むマルチスペクトル画像を取得することであって、各画像は、周波数帯域を規定するチャネルを表しており、或るチャネルの或る画像は、前記チャネルの或る周波数帯域内に自身の周波数を有するようになっている、取得することと、
    前記コンピュータ可読メモリのデータベースに、異なるチャネルのためにトレーニングされる一組の辞書を記憶することであって、前記画像の構造で畳み込まれる、チャネルのためにトレーニングされる辞書は、前記チャネルの前記画像の解像度よりも高い解像度を有する前記チャネルの高解像度画像を生成するようになっている、記憶することと、
    前記コンピュータ可読メモリの別のデータベースに、前記異なるチャネルのためにトレーニングされる一組のフィルタを記憶することであって、前記画像の組内の各画像で畳み込まれる、チャネルのためにトレーニングされるフィルタは、前記チャネルの前記画像の前記構造を生成するようになっている、記憶することと、
    前記コンピュータ可読メモリ及び前記入力インタフェースと通信するハードウェアプロセッサを用いて、前記フィルタの記憶された組を用いて前記異なるチャネルの前記画像の組を処理して、一組の構造を生成することと、
    前記ハードウェアプロセッサを用いて、各チャネルについて、前記構造の組を融合して、一組の融合された構造を生成することであって、前記チャネルの融合された構造は、前記チャネルに対応する重みを用いて、前記構造の組の重み付けされた組合せとして融合され、前記異なるチャネルの前記融合された構造は、異なる重みで結合されるようになっている、用いることと、
    前記辞書の組からの対応する辞書を用いて前記融合された構造の組を処理して、前記シーンの超解像マルチスペクトル画像を生成することと、
    出力インタフェースによって前記超解像マルチスペクトル画像を通信ネットワークに出力すること、又は、前記コンピュータ可読メモリに前記超解像マルチスペクトル画像を記憶することと、
    を含む、方法。
  11. 前記フィルタの組内の各フィルタ及び前記辞書の組内の各辞書は、前記異なるチャネルの異なる画像を用いてトレーニングされる、請求項10に記載の方法。
  12. 前記辞書の組及び前記フィルタの組は、同時にトレーニングされて、前記異なるチャネルにおける全てのトレーニング画像にわたる平均ピーク信号対雑音比が増大する、請求項11に記載の方法。
  13. 前記辞書の組及び前記フィルタ(分析辞書)の組は、以前の反復中に学習された前記辞書の組及び前記フィルタの組の以前の値を用いて、現在の反復において前記辞書の組及び前記フィルタの組の現在の値を更新することによって、同時にトレーニングされる、請求項12に記載の方法。
  14. 前記コンピュータ可読メモリは、前記チャネルのためにトレーニングされる一組の閾値を記憶し、前記ハードウェアプロセッサは、対応する閾値を用いて前記チャネルの前記画像の前記構造の値を閾値処理することによって、前記チャネル内の前記画像の前記構造にスパース性を課すようになっている、請求項12に記載の方法。
  15. 前記辞書の組は、畳み込み辞書である、請求項10に記載の方法。
  16. 前記辞書の組、前記フィルタの組、及び各チャネルの構造を融合するための一組の重みは、異なるチャネルの異なる画像を用いて同時にトレーニングされる、請求項10に記載の方法。
  17. 前記重みの組は、前記フィルタの組及び前記辞書の組のうちの一方又は組合せに組み込まれ、前記辞書の組と前記対応する構造との前記畳み込みの組合せは、異なる画像の前記構造と対応する重みとの前記融合を含むようになっている、請求項10に記載の方法。
  18. 方法を実行するコンピュータによって実行可能なプログラムが具現化される非一時的コンピュータ可読記憶媒体であって、前記方法は、或るシーンの画像の画像処理を行うものであり、
    センサによって生成され、かつ入力インタフェースよって又は前記非一時的コンピュータ可読記憶媒体から取得される或るシーンの一組の画像を含むマルチスペクトル画像を取得することであって、各画像は、周波数帯域を規定するチャネルを表しており、或るチャネルの或る画像は、前記チャネルの或る周波数帯域内に自身の周波数を有するようになっている、取得することと、
    前記非一時的コンピュータ可読記憶媒体のデータベースに、異なるチャネルのためにトレーニングされる一組の辞書を記憶することであって、前記画像の構造で畳み込まれる、チャネルのためにトレーニングされる辞書は、前記チャネルの前記画像の解像度よりも高い解像度を有する前記チャネルの高解像度画像を生成するようになっている、記憶することと、
    前記非一時的コンピュータ可読記憶媒体の別のデータベースに、前記異なるチャネルのためにトレーニングされる一組のフィルタを記憶することであって、前記画像の組内の各画像で畳み込まれる、チャネルのためにトレーニングされるフィルタは、前記チャネルの前記画像の前記構造を生成するようになっている、記憶することと、
    前記非一時的コンピュータ可読記憶媒体及び前記入力インタフェースと通信する前記コンピュータを用いて、前記フィルタの記憶された組を用いて前記異なるチャネルの前記画像の組を処理して、一組の構造を生成することと、
    前記コンピュータを用いて、各チャネルについて、前記構造の組を融合して、一組の融合された構造を生成することであって、前記チャネルの融合された構造は、前記チャネルに対応する重みを用いて前記構造の組の重み付けされた組合せとして融合され、前記異なるチャネルの前記融合された構造は、異なる重みで結合されるようになっている、用いることと、
    前記辞書の組からの対応する辞書を用いて前記融合された構造の組を処理して、前記シーンの超解像マルチスペクトル画像を生成することと、
    出力インタフェースによって前記超解像マルチスペクトル画像を通信ネットワークに出力すること、又は前記非一時的コンピュータ可読記憶媒体に前記超解像マルチスペクトル画像を記憶することと、
    を含む、非一時的コンピュータ可読記憶媒体。
JP2020532842A 2018-03-19 2018-08-22 撮像システム及び画像処理の方法 Active JP6945953B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/924,559 US10482576B2 (en) 2018-03-19 2018-03-19 Systems and methods for multi-spectral image super-resolution
US15/924,559 2018-03-19
PCT/JP2018/031845 WO2019180991A1 (en) 2018-03-19 2018-08-22 Imaging system and method for image processing

Publications (2)

Publication Number Publication Date
JP2021506035A JP2021506035A (ja) 2021-02-18
JP6945953B2 true JP6945953B2 (ja) 2021-10-06

Family

ID=63713977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020532842A Active JP6945953B2 (ja) 2018-03-19 2018-08-22 撮像システム及び画像処理の方法

Country Status (3)

Country Link
US (1) US10482576B2 (ja)
JP (1) JP6945953B2 (ja)
WO (1) WO2019180991A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10733756B2 (en) * 2017-08-31 2020-08-04 Nec Corporation Online flow guided memory networks for object detection in video
CN110852950B (zh) * 2019-11-08 2023-04-07 中国科学院微小卫星创新研究院 基于稀疏表示和图像融合的高光谱图像超分辨率重建方法
CN110853040B (zh) * 2019-11-12 2023-04-28 北京深境智能科技有限公司 一种基于超分辨率重建的图像协同分割方法
US11836893B2 (en) * 2020-03-11 2023-12-05 Mediatek Inc. Online AI super resolution engine and operations
CN111915546A (zh) * 2020-08-04 2020-11-10 西安科技大学 红外和可见光图像融合方法、系统、计算机设备及应用
CN112017160B (zh) * 2020-08-05 2023-04-25 中咨数据有限公司 一种基于多策略组合的多源遥感影像道路材质精细提取方法
US11418762B2 (en) * 2020-09-11 2022-08-16 GM Global Technology Operations LLC Imaging system and method
CN112200063A (zh) * 2020-09-30 2021-01-08 湖南理工学院 一种基于神经网络和注意力机制的高效波段加权预处理方法
CN112801879B (zh) * 2021-02-09 2023-12-08 咪咕视讯科技有限公司 图像超分辨率重建方法、装置、电子设备及存储介质
CN112967357B (zh) * 2021-02-19 2023-05-23 中国人民解放军国防科技大学 一种基于卷积神经网络的频谱地图构建方法
CN113191325B (zh) * 2021-05-24 2023-12-12 中国科学院深圳先进技术研究院 一种图像融合方法、系统及其应用
CN114155145B (zh) * 2021-11-12 2024-05-17 哈尔滨工业大学 一种基于深度展开网络的空谱同时超分辨率重建方法
CN113888413B (zh) * 2021-12-03 2022-02-22 湖南大学 异时异源多光谱图像盲光谱超分辨方法及系统
CN115115766B (zh) * 2022-05-17 2023-03-24 清华大学 多光谱场景数据生成方法及装置
CN115564692B (zh) * 2022-09-07 2023-12-05 宁波大学 顾及幅宽差异下的全色-多光谱-高光谱一体化融合方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7015954B1 (en) 1999-08-09 2006-03-21 Fuji Xerox Co., Ltd. Automatic video system using multiple cameras
US6529074B1 (en) 2001-07-26 2003-03-04 Cirrus Logic, Inc. Circuits and methods for output impedance matching in switched mode circuits
US7366564B2 (en) * 2002-08-23 2008-04-29 The United States Of America As Represented By The Secretary Of The Navy Nonlinear blind demixing of single pixel underlying radiation sources and digital spectrum local thermometer
CN100508087C (zh) 2002-09-30 2009-07-01 日本贵弥功株式会社 固体电解电容器的制造方法
US7055869B2 (en) 2004-01-27 2006-06-06 Itt Manufacturing Enterprises, Inc. False insertion protection top hat for fluid quick connectors
US7684643B2 (en) * 2004-10-26 2010-03-23 Siemens Medical Solutions Usa, Inc. Mutual information regularized Bayesian framework for multiple image restoration
US9251565B2 (en) * 2011-02-03 2016-02-02 Massachusetts Institute Of Technology Hyper-resolution imaging
EP2778635B1 (en) * 2011-04-25 2023-11-29 Planet Labs PBC Systems and methods for overhead imaging and video
US9563817B2 (en) * 2013-11-04 2017-02-07 Varian Medical Systems, Inc. Apparatus and method for reconstructing an image using high-energy-based data
US9336570B2 (en) * 2014-05-15 2016-05-10 The United States Of America, As Represented By The Secretary Of The Navy Demosaicking system and method for color array based multi-spectral sensors
US9225889B1 (en) * 2014-08-18 2015-12-29 Entropix, Inc. Photographic image acquisition device and method
US10366501B2 (en) * 2016-11-07 2019-07-30 The Boeing Company Method and apparatus for performing background image registration
CN107784628B (zh) * 2017-10-18 2021-03-19 南京大学 一种基于重建优化和深度神经网络的超分辨率实现方法

Also Published As

Publication number Publication date
WO2019180991A1 (en) 2019-09-26
US10482576B2 (en) 2019-11-19
US20190287216A1 (en) 2019-09-19
JP2021506035A (ja) 2021-02-18

Similar Documents

Publication Publication Date Title
JP6945953B2 (ja) 撮像システム及び画像処理の方法
CN109741256B (zh) 基于稀疏表示和深度学习的图像超分辨率重建方法
US10891527B2 (en) Systems and methods for multi-spectral image fusion using unrolled projected gradient descent and convolutinoal neural network
Chakrabarti Learning sensor multiplexing design through back-propagation
CN108875821A (zh) 分类模型的训练方法和装置、移动终端、可读存储介质
CN114119444B (zh) 一种基于深度神经网络的多源遥感图像融合方法
CN108269244B (zh) 一种基于深度学习和先验约束的图像去雾系统
US9854221B2 (en) Hyperspectral imaging devices using hybrid vector and tensor processing
US9336570B2 (en) Demosaicking system and method for color array based multi-spectral sensors
CN106251297A (zh) 一种改进的基于多幅图像模糊核估计的盲超分辨率重建算法
CN109785252B (zh) 基于多尺度残差密集网络夜间图像增强方法
CN110544212B (zh) 基于层级特征融合的卷积神经网络高光谱图像锐化方法
Arad et al. NTIRE 2022 spectral demosaicing challenge and data set
CN106507065B (zh) 拍摄装置、拍摄系统、图像生成装置及滤色器
CN112365414A (zh) 一种基于双路残差卷积神经网络的图像去雾方法
CN111008936B (zh) 一种多光谱图像全色锐化方法
Parmar et al. Spatio-spectral reconstruction of the multispectral datacube using sparse recovery
Lv et al. An integrated enhancement solution for 24-hour colorful imaging
CN112104847A (zh) 一种基于残差和高频替换的sony-rgbw阵列彩色重构方法
CN106780423B (zh) 一种基于少数波段高分辨率图像的光谱重建方法
CN107170013B (zh) 一种rgb相机光谱响应曲线的标定方法
CN113628143A (zh) 一种基于多尺度卷积的加权融合图像去雾方法及装置
CN117392065A (zh) 一种云边协同太阳能板覆灰状况自主评估方法
CN111968039B (zh) 基于硅传感器相机的昼夜通用图像处理方法、装置及设备
CN116563187A (zh) 一种基于图神经网络的多光谱图像融合

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200612

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210817

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210914

R150 Certificate of patent or registration of utility model

Ref document number: 6945953

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150