JP7072119B2

JP7072119B2 - 画像処理方法および装置、電子機器ならびに記憶媒体

Info

Publication number: JP7072119B2
Application number: JP2021500554A
Authority: JP
Inventors: レン，スーチエ; チェン，イェン; チョン，シュアンイェー; スン，ウェンシウ
Original assignee: Shenzhen Sensetime Technology Co Ltd
Current assignee: Shenzhen Sensetime Technology Co Ltd
Priority date: 2018-12-14
Filing date: 2019-05-20
Publication date: 2022-05-19
Anticipated expiration: 2039-05-20
Also published as: WO2020119026A1; US20210110522A1; CN109658352A; KR102538164B1; CN109658352B; SG11202012776VA; TWI717865B; TW202027033A; KR20210013149A; JP2021531566A

Description

本願は２０１８年１２月１４日に中国特許局に提出された、出願番号２０１８１１５３６１４４．３、発明名称「画像情報の最適化方法および装置、電子機器ならびに記憶媒体」の中国特許出願の優先権を主張し、その開示の全てが参照によって本願に組み込まれる。
本開示は画像処理分野に関し、特に画像処理方法および装置、電子機器ならびに記憶媒体に関する。

深度画像の取得または画像の最適化は多くの分野において重要な応用価値を有する。例えば、資源探査、三次元再構築、ロボットのナビゲーションなどの分野において、障害物の検出、自動運転、生体検出などはいずれもシーンの高精度の三次元データに依存している。関連技術では、信号対雑音比が低い場合、画像の正確な深度情報を得ることが困難であり、代表的には得られた深度画像に深度情報が欠落した大きなブラックホールが存在する。

本開示の実施例は画像最適化の技術的解決手段を提供する。

本開示の第一方面によれば、飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得することと、ニューラルネットワークによって前記複数の元画像に対して、少なくとも一回の畳み込み処理および少なくとも一回の非線形関数マッピング処理を含む最適化処理を実行し、前記複数の元画像に対応する深度マップを得ることと、を含む画像処理方法が提供される。

いくつかの可能な実施形態では、ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、ニューラルネットワークによって前記複数の元画像に最適化処理を行い、信号対雑音比が前記元画像よりも高い前記複数の元画像に対する複数の最適化画像を出力することと、前記複数の最適化画像に後処理を行い、前記複数の元画像に対応する深度マップを得ることと、を含む。

いくつかの可能な実施形態では、ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、ニューラルネットワークによって前記複数の元画像に最適化処理を行い、前記複数の元画像に対応する深度マップを出力することを含む。

いくつかの可能な実施形態では、ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、前記複数の元画像をニューラルネットワークに入力して最適化処理を行い、前記複数の元画像に対応する深度マップを得ることを含む。

いくつかの可能な実施形態では、前記方法は、前記複数の元画像に対して、画像キャリブレーション、画像補正、任意の二つの元画像間の線形処理、及び任意の二つの元画像間の非線形処理の少なくとも一つを含む前処理を実行し、前処理された前記複数の元画像を得ることをさらに含み、ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、前処理された前記複数の元画像を前記ニューラルネットワークに入力して最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることを含む。

いくつかの可能な実施形態では、前記ニューラルネットワークが実行する最適化処理は順に実行されるＱ個の最適化プロセス群を含み、各最適化プロセス群は少なくとも一回の畳み込み処理および／または少なくとも一回の非線形マッピング処理を含み、ニューラルネットワークによって前記複数の元画像に最適化処理を実行することは、前記複数の元画像を第一の最適化プロセス群の入力情報とし、前記第一の最適化プロセス群によって処理して前記第一の最適化プロセス群に対する最適化特徴行列を得ることと、第ｎの最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行うか、または前のｎ個の最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行う（ｎは１よりも大きくかつＱよりも小さい整数である）ことと、第Ｑの最適化プロセス群により処理された最適化特徴行列に基づき、出力結果を得ることと、を含む。

いくつかの可能な実施形態では、前記Ｑ個の最適化プロセス群は順に実行されるダウンサンプリング処理、残差処理およびアップサンプリング処理を含み、ニューラルネットワークによって前記複数の元画像に最適化処理を実行することは、前記複数の元画像に前記ダウンサンプリング処理を実行し、前記複数の元画像の特徴情報を融合した第一特徴行列を得ることと、前記第一特徴行列に前記残差処理を実行し、第二特徴行列を得ることと、前記第二特徴行列に前記アップサンプリング処理を実行し、最適化特徴行列を得ることと、を含み、前記ニューラルネットワークの出力結果は前記最適化特徴行列に基づいて得られる。

いくつかの可能な実施形態では、前記第二特徴行列に前記アップサンプリング処理を実行し、最適化特徴行列を得ることは、前記ダウンサンプリング処理プロセスで得られた特徴行列により前記第二特徴行列に前記アップサンプリング処理を実行し、前記最適化特徴行列を得ることを含む。

いくつかの可能な実施形態では、前記ニューラルネットワークは訓練サンプルセットによって訓練して得られ、前記訓練サンプルセットに含まれる複数の訓練サンプルのうちの各訓練サンプルは複数の第一サンプル画像、前記複数の第一サンプル画像に対応する複数の第二サンプル画像および前記複数の第二サンプル画像に対応する深度マップを含み、前記第二サンプル画像および対応する第一サンプル画像は同一対象に対する画像であり、かつ第二サンプル画像は前記第一サンプル画像よりも信号対雑音比が高い。前記ニューラルネットワークは訓練によって得られた敵対的生成ネットワークのうちの生成ネットワークであり、前記ニューラルネットワークのネットワーク損失値は第一ネットワーク損失と第二ネットワーク損失との加重和であり、前記第一ネットワーク損失は前記ニューラルネットワークが前記訓練サンプルに含まれる複数の第一サンプル画像を処理することによって得た複数の予測最適化画像と、前記訓練サンプルに含まれる複数の第二サンプル画像との差異に基づいて得られ、前記第二ネットワーク損失は前記複数の予測最適化画像に後処理を行うことによって得られた予測深度マップと、前記訓練サンプルに含まれる深度マップとの差異に基づいて得られる。

本開示が提供する第二方面によれば、飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得することと、ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、前記複数の元画像に対応する深度マップを得ることと、を含み、ニューラルネットワークは訓練サンプルセットによって訓練して得られ、前記訓練サンプルセットに含まれる複数の訓練サンプルのうちの各訓練サンプルは複数の第一サンプル画像、前記複数の第一サンプル画像に対応する複数の第二サンプル画像および前記複数の第二サンプル画像に対応する深度マップを含み、前記第二サンプル画像および対応する第一サンプル画像は同一対象に対する画像であり、かつ第二サンプル画像は対応する前記第一サンプル画像よりも信号対雑音比が高い画像処理方法が提供される。

いくつかの可能な実施形態では、前記ニューラルネットワークは訓練によって得られた敵対的生成ネットワークのうちの生成ネットワークであり、前記ニューラルネットワークのネットワーク損失値は第一ネットワーク損失と第二ネットワーク損失との加重和であり、前記第一ネットワーク損失は前記ニューラルネットワークが前記訓練サンプルに含まれる複数の第一サンプル画像を処理することによって得た複数の予測最適化画像と、前記訓練サンプルに含まれる複数の第二サンプル画像との差異に基づいて得られ、前記第二ネットワーク損失は前記複数の予測最適化画像に後処理を行うことによって得られた予測深度マップと、前記訓練サンプルに含まれる深度マップとの差異に基づいて得られる。

本開示の第三方面によれば、飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得するための取得モジュールと、ニューラルネットワークによって前記複数の元画像に対して、少なくとも一回の畳み込み処理および少なくとも一回の非線形関数マッピング処理を含む最適化処理を実行し、前記複数の元画像に対応する深度マップを得るための最適化モジュールと、を含む画像処理装置が提供される。

本開示の第四方面によれば、飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得するための取得モジュールと、ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、前記複数の元画像に対応する深度マップを得るための最適化モジュールと、を含み、ニューラルネットワークは訓練サンプルセットによって訓練して得られ、前記訓練サンプルセットに含まれる複数の訓練サンプルのうちの各訓練サンプルは複数の第一サンプル画像、前記複数の第一サンプル画像に対応する複数の第二サンプル画像および前記複数の第二サンプル画像に対応する深度マップを含み、前記第二サンプル画像および対応する第一サンプル画像は同一対象に対する画像であり、かつ第二サンプル画像は対応する前記第一サンプル画像よりも信号対雑音比が高い画像処理装置が提供される。

本開示の第五方面によれば、第一方面または第二方面のいずれか一項に記載の方法を実行するように構成されたプロセッサ、およびプロセッサにより実行可能な命令を記憶するためのメモリを含む電子機器が提供される。

本開示の第六方面によれば、コンピュータプログラム命令が記憶されているコンピュータ読み取り可能記憶媒体であって、前記コンピュータプログラム命令はプロセッサに実行される時に第一方面または第二方面のいずれか一項に記載の方法を実現することを特徴とするコンピュータ読み取り可能記憶媒体が提供される。

本開示の第七方面によれば、コンピュータ読み取り可能コードを含み、前記コンピュータコードが電子機器において運用される時、前記電子機器内のプロセッサに第一方面または第二方面のいずれか一項に記載の方法を実行させるコンピュータプログラムが提供される。

本開示の実施例は、露光率が低く画像の信号対雑音比が低い場合において応用することができる。上記場合に、カメラセンサが受信する信号は非常に弱くかつ多くの雑音が存在するため、従来技術ではこれらの信号により高精度の深度値を得ることが困難であるが、本開示の実施例は収集した低信号対雑音比の元画像に最適化処理を行うことで、低信号対雑音比の画像から深度情報を効果的に復元し、従来技術の画像特徴情報を効果的に抽出できないという技術的問題を解決する。本開示の実施例は遠距離測定および高吸収率物体測定による低信号対雑音比により深度情報を復元できないという問題を解決可能であり、また、信号対雑音比の要求による撮像解像度不足の問題を解決可能である。即ち、本開示の実施例は低信号対雑音比の画像を最適化して画像の特徴情報（深度情報）を復元することができる。

なお、以上の概略的な説明および以下の詳細な説明は例示的および説明的なものに過ぎず、本開示を限定するものではないことを理解すべきである。
ここの図面は、明細書の一部として組み込まれて、本開示に適合する実施例を示したものであり、かつ明細書と共に本開示の技術的解決手段を説明するために用いられる。

本開示の実施例に係る画像処理方法のフローチャートを示す。本開示の実施例に係る画像処理方法における最適化処理の例示的フローチャートを示す。本開示の実施例に係る画像処理方法における最適化処理の別の例示的フローチャートを示す。本開示の実施例に係る画像処理方法における第一の最適化プロセス群の例示的フローチャートを示す。本開示の実施例に係る画像処理方法における第二の最適化プロセス群の例示的フローチャートを示す。本開示の実施例に係る画像処理方法における第三の最適化プロセス群の例示的フローチャートを示す。本開示の実施例に係る画像処理方法の別のフローチャートを示す。本開示の実施例に係る画像処理方法の別のフローチャートを示す。本開示の実施例に係る画像処理方法の別のフローチャートを示す。本開示の実施例に係る画像処理装置のブロック図を示す。本開示の実施例に係る画像処理装置の別のブロック図を示す。本開示の実施例に係る電子機器のブロック図を示す。本開示の実施例に係る別の電子機器のブロック図を示す。

以下に図面を参照しながら本開示の様々な例示的実施例、特徴および態様を詳細に説明する。図面における同じ符号は機能が同じであるまたは類似する要素を表す。図面に実施例の様々な方面を示したが、特に断らない限り、比例に従って図面を描く必要がない。

ここで特に使われる用語「例示的」とは、「例として用いられること、実施例または説明的なもの」を意味する。ここで「例示的」として説明したいかなる実施例も他の実施例より優先または優れるものと解釈すべきではない。

本明細書において、用語「および／または」は、関連対象の関連関係を説明するためのものに過ぎず、三つの関係が存在可能であることを表し、例えば、Ａおよび／またはＢは、Ａのみが存在、ＡとＢが同時に存在、Ｂのみが存在という三つの状況を表すことができる。また、本明細書において、用語「少なくとも一つ」は複数種のうちのいずれか一つまたは複数種のうちの少なくとも二つの任意の組み合わせを表し、例えば、Ａ、Ｂ及びＣの少なくとも一つを含むことは、Ａ、ＢおよびＣからなる集合から選ばれたいずれか一つまたは複数の元素を含むことを表すことができる。

また、本開示をより効率よく説明するために、以下の具体的な実施形態において多くの具体的な詳細を提供した。当業者であれば、多少の具体的な詳細がなくても、本開示は同様に実施可能であることを理解すべきである。いくつかの実施例では、本開示の趣旨を強調するために、当業者に既知の方法、手段、要素および回路について、詳細な説明を行わない。

図１は本開示の実施例に係る画像処理方法のフローチャートを示す。本開示の実施例に係る画像処理方法は深度撮影機能を有する電子機器または画像処理を実行可能な電子機器、例えば携帯電話、カメラ、コンピュータ機器、スマートウォッチ、リストバンドなどの機器に応用することができるが、本開示はそれを限定しない。本開示の実施例は低露光率で得られた低信号対雑音比の画像を最適化処理し、最適化処理後の画像により豊富な深度情報を持たせることができる。

Ｓ１００で、飛行時間ＴＯＦセンサによって１回の露光において収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得する。

Ｓ２００で、ニューラルネットワークによって前記複数の元画像に対して、少なくとも一回の畳み込み処理および少なくとも一回の非線形関数マッピング処理を含む最適化処理を実行し、前記複数の元画像に対応する深度マップを得る。

上述したように、本開示の実施例が提供するニューラルネットワークは低信号対雑音比の画像に最適化処理を行い、より豊富な特徴情報を有する画像を得ること、即ち高品質の深度情報を有する深度マップを得ることができる。本開示の実施例の方法はＴｏＦカメラ（飛行時間カメラ）を備える機器に適用可能である。まず、本開示の実施例では、Ｓ１００によって低信号対雑音比を有する複数の元画像を取得してもよく、ここで、元画像は飛行時間カメラによって収集した各画像、例えば、飛行時間センサによって一回の露光プロセスにおいて複数の低信号対雑音比の元画像を収集したものであってもよい。本開示の実施例では信号対雑音比が第一の値よりも低い画像を低信号対雑音比画像と呼んでもよく、そのうち、第一の値は状況に応じて異なる値を設定してもよく、本開示はそれを具体的に限定しない。別のいくつかの実施例では、他の電子機器から元画像を受信して低信号対雑音比の各元画像を取得し、例えば他の電子機器からＴｏＦセンサが収集した元画像を最適化処理の対象として受信して、してもよいし、機器自体に配置された撮影機器によって各元画像を撮影してもよい。本開示の実施例では得た各元画像は同一撮影対象に対して一回の露光で得られた複数の画像であり、各画像の信号対雑音比が異なり、各元画像について異なる特徴行列がある。例えば、複数の元画像の特徴行列において同じ画素点に対する位相パラメータ値が異なる。本開示の実施例では低信号対雑音比とは、画像の信号対雑音比が低いことをいう。ＴｏＦカメラによって撮影する場合、一回の露光による各元画像を得ると共に赤外画像を得てもよく、該赤外画像における画素値に対応する信頼度情報が所定値よりも低い画素点の数は所定比率を超えた場合、元画像が低信号対雑音比の画像であるとは言える該所定値はＴＯＦカメラの使用シーンに応じて決定してもよく、いくつかの可能な実施例では１００に設定してもよいが、本開示を具体的に限定するものではない。また、所定比率は必要に応じて設定してもよく、例えば３０％または他の比率に設定してもよい。当業者は他の設定に基づいて元画像の低信号対雑音比状況を判定してもよい。また、低露光率で得られた画像も低信号対雑音比の画像であるため、低露光率で得られた画像も本開示の実施例の処理対象の元画像で、かつ各元画像における位相特徴が異なる。低露光率とは露光時間が４００マイクロ秒以下の露光をいう。該条件で得られた画像の信号対雑音比が低いが、本開示の実施例によって画像の信号対雑音比を向上させ、画像からより豊富な深度情報を得ることで、最適化後の画像により多くの特徴情報を持たせ、高品質の深度画像を得ることができる。本開示の実施例では取得する元対象は２つまたは４つであってもよく、本開示の実施例はこれを限定せず、他の個数であってもよい。

低信号対雑音比の複数の元画像を得てから、ニューラルネットワークにより元画像の最適化処理を行い、元画像から深度情報を復元し、元画像に対応する深度マップを得ることができる。元画像をニューラルネットワークに入力し、ニューラルネットワークにより該複数の元画像に最適化処理を実行し、さらに最適化された深度マップを得ることができる。本開示の実施例では採用される最適化処理は少なくとも一回の畳み込み処理および少なくとも一回の非線形関数マッピング処理を含んでもよい。まず元画像に畳み込み処理を実行し、そして畳み込み処理の結果に非線形関数マッピング処理を行うようにしてもよいし、まず元画像に非線形マッピング処理を実行し、そして非線形マッピング処理の結果に畳み込み処理を行うようにしてもよいし、または畳み込み処理および非線形処理を交互に数回実行するようにしてもよい。例えば、畳み込み処理をＪで表し、非線形関数マッピング処理をＹで表すと、本開示の実施例の最適化処理プロセスは、例えばＪＹ、ＪＪＹ、ＪＹＪＪＹ、ＹＪ、ＹＹＪ、ＹＪＹＹＪなどとすることができ、つまり本開示の実施例では、元画像の最適化処理は少なくとも一回の畳み込み処理および少なくとも一回の非線形マッピング処理を含んでもよいが、各畳み込み処理および非線形マッピング処理の順序や回数について、当業者は必要に応じて設定することができ、本開示はこれを具体的に限定しない。

畳み込み処理によって特徴行列における特徴情報を融合し、入力情報からより多くより正確な深度情報を抽出することができ、非線形関数マッピング処理によって１層深い深度情報を得ること、即ちより豊富な特徴情報を取得することができる。

いくつかの可能な実施形態では、ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、
ニューラルネットワークによって前記複数の元画像に最適化処理を行い、信号対雑音比が前記元画像よりも高い前記複数の元画像に対する複数の最適化画像を出力することと、
前記複数の最適化画像に後処理を行い、前記複数の元画像に対応する深度マップを得ることと、を含む。

つまり、本開示の実施例はニューラルネットワークによって複数の元画像に対応する複数の最適化画像を直接得ることができる。ニューラルネットワークの最適化処理によって入力された元画像の信号対雑音比を向上させ、対応する最適化画像を得ることができる。さらに、最適化画像に後処理を実行することで、より多くより正確な深度情報を有する深度マップを得ることができる。

複数の最適化画像によって深度マップを得る式は以下を含んでもよい。

ここで、ｄは深度マップを表し、ｃは光速を表し、ｆはカメラの調整パラメータを表し、

、

および

はそれぞれ各元画像における第ｉ行第ｊ列の特徴値であり、ｉおよびｊはそれぞれＮ以下の正整数であり、Ｎは元画像の次元（Ｎ＊Ｎ）を表す。

別のいくつかの可能な実施形態では、ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、ニューラルネットワークによって前記複数の元画像に最適化処理を行い、前記複数の元画像に対応する深度マップを出力することを含む。

つまり、本開示の実施例のニューラルネットワークは複数の元画像に最適化処理を行い、該複数の元画像に対応する深度マップを直接得ることができる。該構成はニューラルネットワークの訓練により実現することができる。

上記構成からわかるように、本開示の実施例ではニューラルネットワークの最適化処理によってより豊富かつより正確な深度情報を有する深度マップを直接得るようにしてもよいし、またはニューラルネットワークでの最適化によって入力された元画像に対応する最適化画像を得て、さらに最適化画像の後処理によってより豊富かつより正確な深度情報を有する深度マップを得るようにしてもよい。

また、いくつかの可能な実施形態では、ニューラルネットワークによって元画像に最適化処理を行う前に、元画像に前処理を実行し、前処理後の複数の元画像を得て、ニューラルネットワークに入力して最適化処理を実行し、複数の元画像に対応する深度マップを得るようにしてもよい。前処理は画像キャリブレーション、画像補正、および任意の二つの元画像間の線形処理や非線形処理の少なくとも一つを含んでもよい。元画像に画像キャリブレーションを実行することで、元画像を取得する画像収集機器の内部パラメータによる画像への影響を解消することができ、画像収集機器による雑音を解消することにより、元画像の精度をさらに向上させることができる。画像キャリブレーションは従来の技術的手段、例えば自己キャリブレーションアルゴリズムなどに基づいて実現してもよく、本開示はキャリブレーションアルゴリズムの具体的な処理プロセスを具体的に限定しない。画像補正とは画像に施す復元処理をいう。一般的には、画像歪みの発生原因は撮像システムの収差、歪曲、限られた帯域幅などによる画像歪み、結像デバイスの撮影姿勢および走査の非線形性による画像幾何学的歪み、およびモーションブラー、放射歪み、雑音導入などによる画像歪みを含む。画像補正では画像歪みの発生原因に応じて、対応する数学モデルを作成し、汚染されたまたは歪曲した画像信号から必要な情報を抽出し、画像歪みの逆プロセスに沿って画像を元に復元させることができる。画像補正のプロセスはフィルタによって元画像内の雑音を解消し、元画像の精度を向上させてもよい。

任意の二つの元画像間の線形処理とは二つの元画像に対して対応する画素点の特徴値の加算または減算を実行し、該線形処理の結果を得ることをいい、該結果は新たな画像の画像特徴として表すことができる。

任意の二つの元画像間の非線形処理とは予め設定された非線形関数により元画像の各画素点の非線形処理を行うことをいい、つまり各画素点の特徴値を非線形関数に入力し、新たな画素値を得るように、元画像の各画素点の非線形処理を完了し、新たな画像の画像特徴を得ることができる。

元画像に前処理を行ってから、前処理後の画像をニューラルネットワークに入力し、最適化処理を実行し、最適化された深度マップを得ることができる。前処理によって、元画像内の雑音、誤差による影響を軽減し、深度マップの精度を向上させることができる。以下に最適化プロセスを具体的に説明し、元画像の最適化処理プロセスを例にして説明し、前処理後の画像の最適化処理方法は元画像の最適化処理方法と同じであり、本開示は詳細な説明を繰り返さない。

本開示の実施例ではニューラルネットワークが実行する最適化処理は複数の最適化プロセス群、例えばＱ個の最適化プロセス群を含んでもよく、ここでＱは１よりも大きい整数であり、各最適化プロセス群は少なくとも一回の畳み込み処理および／または少なくとも一回の非線形マッピング処理を含む。複数の最適化プロセスの組み合わせによって、元画像に異なる最適化処理を実行することができる。例えば、三つの最適化プロセス群Ａ、ＢおよびＣを含んでもよく、該三つの最適化プロセス群はいずれも少なくとも一回の畳み込み処理および／または少なくとも一回の非線形マッピング処理を含んでもよいが、最適化プロセス全体として少なくとも一回の畳み込み処理および少なくとも一回の非線形処理を含まなければならない。

図２は本開示の実施例に係る画像処理方法における最適化処理の例示的フローチャートを示し、Ｑ個の最適化プロセス群を例にして説明する。

Ｓ２０１で、前記元画像を第一の最適化プロセス群の入力情報とし、前記第一の最適化プロセス群によって処理して該第一の最適化プロセス群に対する最適化特徴行列を得る。

Ｓ２０２で、第ｎの最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行い、または第ｎの最適化プロセス群が出力した最適化特徴行列、および前のｎ－１個の最適化プロセス群の少なくとも一つが出力した最適化特徴行列を、第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行い、最後の最適化プロセス群によって処理した最適化特徴行列に基づいて、出力結果を得る。ここで、ｎは１よりも大きくかつＱよりも小さい整数であり、Ｑは最適化プロセス群の数である。

本開示の実施例では、ニューラルネットワークが実行する最適化処理に含まれる複数の最適化プロセス群は順に直前の最適化プロセス群で得られた処理結果（最適化特徴行列）にさらに最適化処理を行い、かつ最後の最適化プロセス群で得られた処理結果を深度マップまたは最適化画像に対応する特徴行列とすることができる。いくつかの可能な実施形態では、直前の最適化プロセス群で得られた処理結果を直接最適化してもよく、つまり単に直前の最適化処理プロセス群で得られた処理結果を次の最適化プロセス群の入力情報としてもよい。別のいくつかの可能な実施形態では、現在の最適化プロセスの直前の最適化プロセスで得られた処理結果、および該直前の最適化プロセス以外の前の最適化プロセスのうちの少なくとも一つで得られた結果を入力としてもよい（例えば前のｎ個の最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報としてもよい）。例えばＡ、ＢおよびＣという三つの最適化プロセスの場合、Ｂの入力はＡの出力であってもよく、Ｃの入力はＢの出力であってもよいし、ＡおよびＢの出力であってもよい。つまり、本開示の実施例における第一最適化プロセスの入力は元画像であり、第一最適化プロセスによって元画像に最適化処理を行った最適化特徴行列を得て、最適化処理により得られた最適化特徴行列を二番目の最適化プロセスに入力して、二番目の最適化プロセスによって一番目の最適化プロセスで得られた最適化特徴行列にさらに最適化処理を実行し、二番目の最適化プロセスに対する最適化特徴行列を得て、該二番目の最適化プロセスで得られた最適化特徴行列が三番目の最適化特徴行列に入力されてもよい。可能な一実施形態では、三番目の最適化プロセスは二番目の最適化特徴行列の出力のみを入力情報としてもよいし、一番目の最適化プロセスで得られた最適化特徴行列と共に二番目の最適化プロセスで得られた最適化特徴行列を入力情報として最適化処理を行ってもよい。以降同様に、第ｎの最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行い、または第ｎの最適化プロセス群が出力した最適化特徴行列、および前のｎ－１個の最適化プロセス群の少なくとも一つが出力した最適化特徴行列を、第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行い、最後の最適化プロセスによって処理して最適化結果を得る。該最適化結果は最適化された深度マップであってもよいし、元画像に対応する最適化画像であってもよい。上記構成によって、当業者は必要に応じて異なる最適化プロセスを構築することができ、本開示の実施例はこれを限定しない。

また、各最適化プロセス群によって、入力情報内の特徴情報を絶えず融合してより多くの深度情報を復元することができ、つまり得られた最適化特徴行列が入力情報よりも多い特徴を有し、かつより多くの深度情報を有するようにすることができる。

各最適化プロセス群において畳み込み処理を実行する時に採用される畳み込みカーネルは同じであってもよく、異なってもよい。各最適化プロセス群において非線形マッピング処理を実行する時に採用される活性化関数も同じであっても良く、異なってもよい。また、毎回の畳み込み処理に採用される畳み込みカーネルの数も同じであってもよく、異なってもよく、当業者は必要に応じて構成することができる。

ＴｏＦカメラが取得した元画像には、各画素点の位相情報が含まれるため、本開示の実施例の最適化処理によって、位相情報から対応する深度情報を復元し、より多くより正確な深度情報を有する深度マップを得ることができる。

上記実施例に記載のように、Ｓ２００の最適化処理プロセスは複数の最適化プロセス群を含み、各最適化プロセス群は少なくとも一回の畳み込み処理および少なくとも一回の非線形関数マッピング処理を含んでもよい。本開示のいくつかの可能な実施形態では、各最適化プロセス群では異なる処理プロセスを採用してもよく、例えばダウンサンプリング、アップサンプリング、畳み込みまたは残差処理などを実行してもよい。当業者は異なる組み合わせおよび処理順序によって構成することができる。

図３は本開示の実施例に係る画像処理方法における最適化処理の別の例示的フローチャートを示す。前記元画像に最適化処理を実行することはさらに、
Ｓ２０３：複数の前記元画像に第一の最適化プロセス群を実行し、該複数の元画像の特徴情報を融合した第一特徴行列を得ることと、
Ｓ２０４：前記第一特徴行列に第二の最適化プロセス群を実行し、特徴情報が前記第一特徴行列の特徴情報よりも多い第二の特徴行列を得ることと、
Ｓ２０５：前記第二特徴行列に第三の最適化プロセス群を実行し、特徴情報が前記第二特徴行列の特徴情報よりも多い前記最適化特徴行列の出力結果を得ることと、を含んでもよい。

つまり、本開示の実施例のニューラルネットワークの最適化処理は順に実行される三つの最適化プロセス群を含んでもよく、即ちニューラルネットワークは上記第一の最適化プロセス群、第二の最適化プロセス群および第三の最適化プロセス群によって元画像の最適化を実現してもよい。いくつかの可能な実施形態では、第一の最適化プロセス群はダウンサンプリング処理プロセス、第二の最適化プロセス群は残差処理プロセス、第三の最適化プロセス群はアップサンプリング処理プロセスであってもよい。

まず、Ｓ２０３によって各元画像の第一の最適化プロセス群を実行し、各元画像の特徴情報を融合して深度情報を復元し、第一特徴行列を得るようにしてもよい。本開示の実施例は第一の最適化プロセス群の方法によって特徴行列のサイズ、例えば長さおよび幅の次元を変更することができ、また、特徴行列内の各画素点に対する特徴情報を増やし、より多くの特徴をさらに融合して一部の深度情報を復元することができる。

図４は本開示の実施例に係る画像処理方法における第一の最適化プロセス群の例示的フローチャートを示す。複数の前記元画像に第一の最適化プロセス群を実行し、該複数の元画像の特徴情報を融合した第一特徴行列を得ることは、
Ｓ２０３１：一番目の第一サブ最適化プロセスによって複数の元画像の第一畳み込み処理を実行し、第一畳み込み特徴を得て、該第一畳み込み特徴に第一非線形マッピング処理を実行することで第一最適化特徴行列を得ることと、
Ｓ２０３２：ｉ番目の第一サブ最適化プロセスによってｉ－１番目の第一サブ最適化プロセスで得られた第一最適化特徴行列の第一畳み込み処理を実行し、該第一畳み込み処理によって得られた第一畳み込み特徴に第一非線形マッピング処理を実行することでｉ番目の第一サブ最適化プロセスに対する第一最適化特徴行列を得ることと、
Ｓ２０３３：Ｎ番目の第一サブ最適化プロセスで得られた第一最適化特徴行列によって前記第一特徴行列を特定することと、を含んでもよく、ここでｉは１よりも大きくかつＮ以下の正整数であり、Ｎは第一サブ最適化プロセスの数を表す。

本開示の実施例はダウンサンプリングネットワークによってＳ２０３のプロセスを実行してもよく、即ち第一の最適化プロセス群はダウンサンプリングネットワークによって実行されるダウンサンプリング処理のプロセスであってもよく、ダウンサンプリングネットワークはニューラルネットワークにおける一部のネットワーク構造であってもよい。本開示の実施例におけるダウンサンプリングネットワークが実行する第一の最適化プロセス群は最適化処理の一つの最適化プロセスとして、複数の第一サブ最適化プロセスを含んでもよく、例えばダウンサンプリングネットワークは順に接続されている複数のダウンサンプリングモジュールを含んでもよく、各ダウンサンプリングモジュールは第一畳み込みユニット、および第一畳み込みユニットと接続されて第一畳み込みユニットが出力した特徴行列を処理する第一活性化ユニットを含んでもよい。それに対応して、Ｓ２０３での第一の最適化プロセス群はそれぞれ第一畳み込み処理および第一非線形マッピング処理を含む複数の第一サブ最適化プロセスを含んでもよく、つまり各ダウンサンプリングモジュールは一つの第一サブ最適化プロセスを実行し、ダウンサンプリングモジュール内の第一畳み込みユニットは上記第一畳み込み処理を実行し、第一活性化ユニットは上記第一非線形マッピング処理を実行してもよい。

一番目の第一サブ最適化プロセスによってＳ１００で得られた各元画像の第一畳み込み処理を実行し、対応する第一畳み込み特徴を得て、第一活性化関数により該第一畳み込み特徴の第一非線形マッピング処理を実行してもよく、例えば、第一活性化関数と該第一畳み込み特徴を乗算し、最終的に該一番目のダウンサンプリングプロセスの第一最適化特徴行列を得るか、または第一畳み込み特徴を第一活性化関数の対応するパラメータに代入し、活性化関数処理結果（第一最適化特徴行列）を得る。それに対応して、該一番目の第一サブ最適化プロセスで得られた第一最適化特徴行列を二番目の第一サブ最適化プロセスの入力とし、二番目の第一サブ最適化プロセスによって一番目の第一サブ最適化プロセスによる第一最適化特徴行列に第一畳み込み処理を行い、対応する第一畳み込み特徴を得て、第一活性化関数により該第一畳み込み特徴の第一活性化処理を実行し、該二番目の第一サブ最適化プロセスの第一最適化特徴行列を得てもよい。

以降同様に、ｉ番目の第一サブ最適化プロセスによってｉ－１番目の第一サブ最適化プロセスで得られた第一最適化特徴行列の第一畳み込み処理を実行し、該第一畳み込み処理によって得られた第一畳み込み特徴に第一非線形マッピング処理を実行することでｉ番目の第一サブ最適化プロセスに対する第一最適化特徴行列を得て、Ｎ番目の第一サブ最適化プロセスで得られた第一最適化特徴行列に基づいて前記第一特徴行列を特定してもよく、ここでｉは１よりも大きくかつＮ以下の正整数であり、Ｎは第一サブ最適化プロセスの数を表す。

各前記第一サブ最適化プロセスの第一畳み込み処理を実行する時、各第一畳み込み処理に採用される第一畳み込みカーネルは同じであり、かつ少なくとも一つの第一サブ最適化プロセスの第一畳み込み処理に採用される第一畳み込みカーネルの数は他の第一サブ最適化プロセスの第一畳み込み処理に採用される第一畳み込みカーネルの数と異なる。即ち、本開示の実施例の第一サブ最適化プロセスに採用される畳み込みカーネルはいずれも第一畳み込みカーネルであるが、各第一サブ最適化プロセスに採用される第一畳み込みカーネルの数は異なってもよく、第一サブ最適化プロセスによって、適当な数の第一畳み込みカーネルを選択して第一畳み込み処理を実行することができる。第一畳み込みカーネルは４＊４の畳み込みカーネルであってもよいし、または他のタイプの畳み込みカーネルであってもよく、本開示はこれを限定しない。また、各第一サブ最適化プロセスに採用される第一活性化関数は同じである。

言い換えれば、Ｓ１００で取得した元画像をダウンサンプリングネットワークにおける一番目のダウンサンプリングモジュールに入力し、一番目のダウンサンプリングモジュールが出力した第一最適化特徴行列を二番目のダウンサンプリングモジュールに入力し、以降同様に処理して、最後の第一ダウンサンプリングモジュールによって処理して第一特徴行列を出力してもよい。

まずダウンサンプリングネットワークにおける一番目のダウンサンプリングモジュール内の第一畳み込みユニットを用いて第一畳み込みカーネルによって各前記元画像に対する第一サブ最適化プロセスを実行し、一番目のダウンサンプリングモジュールに対応する第一畳み込み特徴を得てもよい。例えば、本開示の実施例の第一畳み込みユニットに採用される第一畳み込みカーネルは４＊４の畳み込みカーネルであってもよく、該畳み込みカーネルにより各元画像に対する第一畳み込み処理を実行し、各画素点の畳み込み結果を累積し、最終的な第一畳み込み特徴を得てもよい。同時に、本開示の実施例では、各第一畳み込みユニットに採用される第一畳み込みカーネルの数は複数としてもよく、該複数の第一畳み込みカーネルによって各元画像の第一畳み込み処理をそれぞれ実行し、さらに同じ画素点に対応する畳み込み結果を加算し、第一畳み込み特徴を得てもよい。該第一畳み込み特徴も実質的に行列形式である。第一畳み込み特徴を得てから、前記一番目のダウンサンプリングモジュールの第一活性化ユニットを用いて第一活性化関数によって該第一畳み込み特徴を処理し、一番目のダウンサンプリングモジュールに対する第一最適化特徴行列を得てもよい。即ち、本開示の実施例は第一畳み込みユニットが出力した第一畳み込み特徴を第一畳み込みユニットと接続される第一活性化ユニットに入力し、該第一活性化関数により第一畳み込み特徴を処理し、例えば第一活性化関数を第一畳み込み特徴で乗算し、一番目の第一ダウンサンプリングモジュールの第一最適化特徴行列を得てもよい。

さらに、一番目のダウンサンプリングモジュールの第一最適化特徴行列を得てから、二番目のダウンサンプリングモジュールを用いて第一最適化特徴行列を処理し、該二番目のダウンサンプリングモジュールに対応する第一最適化特徴行列を得て、以降同様に、各ダウンサンプリングモジュールに対応する第一最適化特徴行列をそれぞれ得て、最終的に第一特徴行列を得てもよい。各ダウンサンプリングモジュール内の第一畳み込みユニットに採用される第一畳み込みカーネルは同じ畳み込みカーネル、例えばいずれも４＊４の畳み込みカーネルであってもよいが、各ダウンサンプリングモジュール内の第一畳み込みユニットに採用される第一畳み込みカーネルの数は異なってもよく、このように異なるサイズの第一畳み込み特徴を得て、異なる特徴を融合した第一特徴行列を得ることができる。

表１は本開示の実施例に係る画像処理方法のネットワーク構造の模式表を示す。そのうちダウンサンプリングネットワークは四つのダウンサンプリングモジュールＤ１～Ｄ４を含んでもよい。各ダウンサンプリングモジュールは第一畳み込みユニットおよび第一活性化ユニットを含んでもよい。本開示の実施例の各第一畳み込みユニットは同じ第一畳み込みカーネルにより入力特徴行列に対する第一畳み込み処理を実行するが、各第一畳み込みユニットの第一畳み込み処理を実行する第一畳み込みカーネルの数は異なってもよい。例えば、表１から分かるように、一番目のダウンサンプリングモジュールＤ１は畳み込み層および活性化関数層を含んでもよく、第一畳み込みカーネルは４＊４の畳み込みカーネルであり、所定のステップサイズ（例えば２）に従って第一畳み込み処理を実行し、ダウンサンプリングモジュールＤ１内の第一畳み込みユニットは６４個の第一畳み込みカーネルによって入力された元画像の第一畳み込み処理を実行し、６４個の画像の特徴情報を含む第一畳み込み特徴を得る。第一畳み込み特徴を得てから、第一活性化ユニットを用いて処理を実行し、例えば第一畳み込み特徴と第一活性化関数を乗算し、Ｄ１の最終的な第一最適化特徴行列を得る。第一活性化ユニットによって処理することで、特徴情報をより豊富にすることができる。

それに対応して、二番目のダウンサンプリングモジュールＤ２はＤ１から出力した第一最適化特徴行列を受信し、その内部の第一畳み込みユニットを用いて１２８個の４＊４の畳み込みカーネルである第一畳み込みカーネルによって該第一最適化特徴行列に、所定のステップサイズ（例えば２）に従って第一畳み込み処理を実行してもよい。ダウンサンプリングモジュールＤ２内の第一畳み込みユニットは１２８個の第一畳み込みカーネルによって入力された第一最適化特徴行列の第一畳み込み処理を実行し、１２８個の画像の特徴情報を含む第一畳み込み特徴を得る。第一畳み込み特徴を得てから、第一活性化ユニットを用いて処理を実行し、例えば第一畳み込み特徴と第一活性化関数を乗算し、Ｄ２の最終的な第一最適化特徴行列を得る。第一活性化ユニットによって処理することで、特徴情報をより豊富にすることができる。

以降同様に、三番目のダウンサンプリングモジュールＤ３は、同様にステップサイズを２とし、２５６個の第一畳み込みカーネルによってＤ２が出力した第一最適化特徴行列に畳み込みを行い、さらに第一活性化ユニットを用いて出力された第一畳み込み特徴を処理し、Ｄ３の第一最適化特徴行列を得てもよい。そして、四番目のダウンサンプリングモジュールＤ４も、同様にステップサイズを２とし、２５６個の第一畳み込みカーネルによってＤ３が出力した第一最適化特徴行列に畳み込みを行い、さらに第一活性化ユニットを用いて出力された第一畳み込み特徴を処理し、Ｄ４の第一最適化特徴行列、即ち第一特徴行列を得てもよい。

本開示の実施例では、各ダウンサンプリングモジュールに採用される第一畳み込みカーネルは同じであってもよく、同じステップサイズで畳み込みを実行してもよいが、各第一畳み込みユニットが畳み込みを実行するために採用される第一畳み込みカーネルの数は異なってもよい。各ダウンサンプリングモジュールによるダウンサンプリング動作は、いずれも画像の特徴情報をさらに豊富にし、画像の信号対雑音比を向上させることができる。

Ｓ２０３を実行して第一特徴行列を得てから、第一特徴行列にＳ２０４を実行し、第二特徴行列を得、例えば第一特徴行列を残差ネットワークに入力し、残差ネットワークによって特徴をスクリーニングし、続いて活性化関数により深度特徴情報を増やしてもよい。残差ネットワークは同様に単独のニューラルネットワークであってもよいし、一つのニューラルネットワーク内の一部のネットワークモジュールであってもよい。本開示の実施例のＳ２０４での畳み込みは二番目の最適化処理プロセスとして、それぞれが第二畳み込み処理および第二非線形マッピング処理を含む複数の畳み込み処理プロセスを含んでもよい。それに対応する残差ネットワークは対応する第二畳み込み処理および第二非線形マッピング処理を実行可能な複数の残差モジュールを含んでもよい。

図５は本開示の実施例に係る画像処理方法における第二の最適化プロセス群の例示的フローチャートを示す。前記第一特徴行列に第二の最適化プロセス群を実行し、第二特徴行列を得ることは、
Ｓ２０４１：一番目の第二サブ最適化プロセスによって前記第一特徴行列の第二畳み込み処理を実行し、第二畳み込み特徴を得て、該第二畳み込み特徴に第二非線形マッピング処理を実行することで一番目の第二サブ最適化プロセスに対する第二最適化特徴行列を得ることと、
Ｓ２０４２：ｊ番目の第二サブ最適化プロセスによってｊ－１番目の第二サブ最適化プロセスで得られた第二最適化特徴行列の第二畳み込み処理を実行し、該第二畳み込み処理によって得られた第二畳み込み特徴に第二非線形マッピング処理を実行することでｊ番目の第二サブ最適化プロセスに対する第二最適化特徴行列を得ることと、
Ｓ２０４３：Ｍ番目の第二サブ最適化プロセスで得られた第二最適化特徴行列に基づいて前記第二特徴行列を特定することと、含んでもよく、ここでｊは１よりも大きくかつＭ以下の正整数であり、Ｍは第二サブ最適化プロセスの数を表す。

本開示の実施例のＳ２０４の第二の最適化プロセス群は別の最適化処理プロセス群として、Ｓ２０３の最適化処理結果に基づいてさらなる最適化を実行してもよい。該第二の最適化プロセス群は順に実行される複数の第二サブ最適化プロセスを含み、直前の第二サブ最適化によって得られた第二最適化特徴行列を次の第二サブ最適化の入力として、複数の第二サブ最適化プロセスを順に実行し、最終的に最後の第二サブ最適化プロセスによって第二特徴行列を得てもよい。一番目の第二サブ最適化プロセスの入力はＳ２０３で得られた第一特徴行列である。

具体的には、本開示の実施例は一番目の第二の最適化プロセス群によってＳ２０３で得られた第一特徴行列の第二畳み込み処理を実行し、対応する第二畳み込み特徴を得て、該第二畳み込み特徴に第二非線形マッピング処理を実行することで第二最適化特徴行列を得て、
ｊ番目の第二サブ最適化プロセスによってｊ－１番目の第二サブ最適化プロセスで得られた第二最適化特徴行列の第二畳み込み処理を実行し、該第二畳み込み処理によって得られた第二畳み込み特徴に第二非線形マッピング処理を実行することでｊ番目の第二サブ最適化プロセスの第二最適化特徴行列を得て、Ｍ番目の第二サブ最適化プロセスで得られた第二最適化特徴行列に基づいて前記第二特徴行列を得てもよく、ここでｊは１よりも大きくかつＭ以下の正整数であり、Ｍは第二サブ最適化プロセスの数を表す。

上述したように、本開示の実施例では、残差ネットワークによって該第二の最適化プロセス群を実行してもよく、即ち第二の最適化プロセス群は残差ネットワークにより実行される最適化プロセスであってもよい残差ネットワークはニューラルネットワークにおける一部のネットワーク構造であってもよい。第二の最適化プロセス群は複数の第二サブ最適化プロセスを含んでもよく、残差ネットワークは順に接続される複数の残差モジュールを含み、各残差モジュールは、対応する第二サブ最適化プロセスを実行するために第二畳み込みユニットおよび前記第二畳み込みユニットと接続される第二活性化ユニットを含んでもよい。

一番目の第二サブ最適化プロセスによってＳ２０３で得られた第一特徴行列の第二畳み込み処理を実行し、対応する第二畳み込み特徴を得て、第一活性化関数により該第二畳み込み特徴の第二非線形マッピング処理を実行し、例えば、第二活性化関数と該第二畳み込み特徴を乗算し、最終的に該二番目の第二サブ最適化プロセスの第二最適化特徴行列を得るか、または第二畳み込み特徴を第二活性化関数の対応するパラメータに代入し、活性化関数処理結果（第二最適化特徴行列）を得てもよい。それに対応して、該一番目の第二サブ最適化プロセスで得られた第二最適化特徴行列を二番目の第二サブ最適化プロセスの入力とし、二番目の第二サブ最適化プロセスにより一番目の第二サブ最適化プロセスの第二最適化特徴行列に第二畳み込み処理を実行し、対応する第二畳み込み特徴を得て、第二活性化関数により該第二畳み込み特徴の第二活性化処理を実行し、該二番目の第二サブ最適化プロセスの第二最適化特徴行列を得てもよい。

以降同様に、ｊ番目の第二サブ最適化プロセスによってｊ－１番目の第二サブ最適化プロセスで得られた第二最適化特徴行列の第二畳み込み処理を実行し、該第二畳み込み処理によって得られた第二畳み込み特徴に第二非線形マッピング処理を実行することでｊ番目の第二サブ最適化プロセスに対する第二最適化特徴行列を得て、Ｍ番目の第一サブ最適化プロセスで得られた第二最適化特徴行列に基づいて前記第二特徴行列を得てもよく、ここでｊは１よりも大きくかつＮ以下の正整数であり、Ｍは第一サブ最適化プロセスの数を表す。

各前記第二サブ最適化プロセスの第二畳み込み処理を実行する時、各第二畳み込み処理に採用される第二畳み込みカーネルは同じであり、かつ少なくとも一つの第二サブ最適化プロセスの第二畳み込み処理に採用される第二畳み込みカーネルの数は他の第二サブ最適化プロセスの第二畳み込み処理に採用される第二畳み込みカーネルの数と異なる。即ち、本開示の実施例の第一サブ最適化プロセスに採用される畳み込みカーネルはいずれも第二畳み込みカーネルであるが、各第二サブ最適化プロセスに採用される第二畳み込みカーネルの数は異なってもよく、第二サブ最適化プロセスによって、適当な数の第二畳み込みカーネルを選択して第二畳み込み処理を実行してもよい。第二畳み込みカーネルは３＊３の畳み込みカーネルであってもよいし、または他のタイプの畳み込みカーネルであってもよく、本開示はこれを限定しない。また、各第二サブ最適化プロセスに採用される第二活性化関数は同じである。

言い換えれば、Ｓ２０３で取得した第一特徴行列を残差ネットワークにおける一番目の残差モジュールに入力し、一番目の残差モジュールが出力した第二最適化特徴行列を二番目の残差モジュールに入力し、以降同様に処理して、最後の残差処理によって第二特徴行列を出力してもよい。

まず残差ネットワークにおける一番目の残差モジュール内の第二畳み込みユニットを用いて第二畳み込みカーネルによって第一特徴行列に対する畳み込みを実行し、一番目の残差モジュールに対応する第二畳み込み特徴を得てもよい。例えば本開示の実施例の第二畳み込みユニットに採用される第二畳み込みカーネルは３＊３の畳み込みカーネルで、該畳み込みカーネルにより第一特徴行列に対する畳み込みを実行し、各画素点の畳み込み結果を累積し、最終的な第二畳み込み特徴を得てもよい。同時に、本開示の実施例では、各第二畳み込みユニットに採用される第二畳み込みカーネルの数は複数として、該複数の第一畳み込みカーネルによって第一特徴行列の畳み込みをそれぞれ実行し、さらに同じ画素点に対応する畳み込み結果を加算し、第二畳み込み特徴を得てもよい。該第二畳み込み特徴も実質的に行列形式である。第二畳み込み特徴を得てから、前記一番目の残差モジュールの第二活性化ユニットを用いて第二活性化関数によって該第二畳み込み特徴を処理し、一番目の残差モジュールに対する第二最適化特徴行列を得てもよい。即ち、本開示の実施例は第二畳み込みユニットが出力した第二畳み込み特徴を第二畳み込みユニットと接続される第二活性化ユニットに入力し、該第二活性化関数により第二畳み込み特徴を処理し、例えば第二活性化関数を第二畳み込み特徴で乗算し、一番目の残差モジュールの第二最適化特徴行列を得てもよい。

さらに、一番目の残差モジュールの第二最適化特徴行列を得てから、二番目の残差モジュールを用いて一番目の残差モジュールが出力した第二最適化特徴行列を処理し、該二番目の残差モジュールに対応する第二最適化特徴行列を得て、以降同様に、各残差モジュールに対応する第二最適化特徴行列をそれぞれ得て、最終的に第二特徴行列を得てもよい。各残差モジュール内の第二畳み込みユニットに採用される第二畳み込みカーネルは同じ畳み込みカーネル、例えばいずれも３＊３の畳み込みカーネルであってもよく、本開示はこれを限定しないが、各ダウンサンプリングモジュール内の第一畳み込みユニットに採用される第二畳み込みカーネルの数は同じであってもよく、このように特徴行列のサイズを変更することなく画像の特徴情報の豊富さを保証することができる。

表１に示すように、残差ネットワークは九つの残差モジュールＲｅｓ１～Ｒｅｓ９を含んでもよい。各残差モジュールは第二畳み込みユニットおよび第二活性化ユニットを含んでもよい。本開示の実施例の各第二畳み込みユニットは同じ第二畳み込みカーネルによって入力された特徴行列の畳み込みを実行してもよいが、各第二畳み込みユニットの畳み込みを実行する第二畳み込みカーネルの数は同じである。例えば、表１から分かるように、各残差モジュールｒｅｓ１からＲｅｓ９は第二畳み込みユニットによる畳み込みおよび第二活性化ユニットによる処理が含まれる同じ処理を実行してもよい。第二畳み込みカーネルは３＊３の畳み込みカーネルであってもよく、畳み込みのステップサイズは１としてもよいが、本開示はこれを具体的に限定しない。

具体的には、残差モジュールＲｅｓ１内の第二畳み込みユニットは２５６個の第二畳み込みカーネルによって入力された第一特徴行列の畳み込みを実行し、２５６個の画像の特徴情報を含むものに相当する第二畳み込み特徴を得る。第二畳み込み特徴を得てから、第二活性化ユニットを用いて処理し、例えば第二畳み込み特徴と第二活性化関数を乗算し、Ｒｅｓ１の最終的な第二最適化特徴行列を得る。第二活性化ユニットによって処理することで、特徴情報をより豊富にすることができる。

それに対応して、二番目の残差モジュールＲｅｓ２はＲｅｓ１から出力した第二最適化特徴行列を受信し、その内部の第二畳み込みユニットを用いて２５６個の３＊３の畳み込みカーネルである第二畳み込みカーネルによって該第二最適化特徴行列に、所定のステップサイズ（例えば１）に従って畳み込みを実行してもよい。残差モジュールＲｅｓ２内の第二畳み込みユニットは２５６個の第二畳み込みカーネルによって入力された第二最適化特徴行列の畳み込みを実行し、２５６個の画像の特徴情報を含む第二畳み込み特徴を得る。第二畳み込み特徴を得てから、第二活性化ユニットを用いて処理を実行し、例えば第二畳み込み特徴と第二活性化関数を乗算し、Ｒｅｓ２の最終的な第二最適化特徴行列を得る。第二活性化ユニットによって処理することで、特徴情報をより豊富にすることができる。

以降同様に、後続の各残差モジュールＲｅｓ３～９は、同様にステップサイズを１とし、いずれも２５６個の第二畳み込みカーネルによって直前の残差モジュールＲｅｓ２～８が出力した第二最適化特徴行列の畳み込みを実行し、さらに第二活性化ユニットを用いて出力された第二畳み込み特徴を処理し、Ｒｅｓ３～９の第二最適化特徴行列を得してもよい。Ｒｅｓ９が出力した第二最適化特徴行列は残差ネットワークが出力した第二特徴行列となる。Ｄ４の第一最適化特徴行列は、第一特徴行列となる。

本開示の実施例では、各残差モジュールに採用される第二畳み込みカーネルは同じであってもよく、同じステップサイズで畳み込みを実行してもよく、各第二畳み込みユニットの畳み込みを実行するために採用される第二畳み込みカーネルの数も同じである。各残差モジュールによる処理は、いずれも画像の特徴情報をさらに豊富し、画像の信号対雑音比を向上させることができる。

Ｓ２０４によって第二特徴行列を得てから、その次の最適化プロセスによって第二特徴行列をさらに最適化し、出力結果を得てもよい。例えば該第二特徴行列をアップサンプリングネットワークに入力してもよい。アップサンプリングネットワークは第二特徴行列の第三の最適化プロセス群を実行でき、深度特徴情報をさらに豊富することができる。アップサンプリング処理プロセスを実行する時、ダウンサンプリング処理プロセスで得られた特徴行列によって第二特徴行列にアップサンプリング処理を実行して最適化特徴行列を得てもよい。例えばダウンサンプリング処理時に得られた第一最適化特徴行列によって第二特徴行列に最適化処理を実行する。

図６は本開示の実施例に係る画像処理方法における第三の最適化プロセス群の例示的フローチャートを示す。前記第二特徴行列に第三の最適化プロセス群を実行し、出力結果を得ることは、
Ｓ２０５１：一番目の第三サブ最適化プロセスによって前記第二特徴行列の第三畳み込み処理を実行し、第三畳み込み特徴を得て、該第三畳み込み特徴に第三非線形マッピング処理を実行することで一番目の第三サブ最適化プロセスに対する第三最適化特徴行列を得ることと、
Ｓ２０５２：ｋ－１番目の第三サブ最適化プロセスで得られた第三最適化特徴行列およびＧ－ｋ＋２番目の第一サブ最適化プロセスで得られた第一最適化特徴行列をｋ番目の第三サブ最適化プロセスの入力情報とし、ｋ番目の第三サブ最適化プロセスによって該入力情報の第三畳み込み処理を実行し、該第三畳み込み処理によって得られた第三畳み込み特徴に第三非線形マッピング処理を実行することでｋ番目の第三サブ最適化プロセスに対する第三最適化特徴行列を得ることと、
Ｓ２０５３：Ｇ番目の第三サブ最適化プロセスが出力した第三最適化特徴行列に基づいて前記出力結果に対応する最適化特徴行列を特定することと、を含み、ここでｋは１よりも大きくかつＧ以下の正整数であり、Ｇは第三サブ最適化プロセスの数を表す。

本開示の実施例はアップサンプリングネットワークによってＳ２０５のプロセスを実行してもよい。アップサンプリングネットワークは単独のニューラルネットワークであってもよいし、またはニューラルネットワークにおける一部のネットワーク構造であってもよく、本開示はこれを具体的に限定しない。本開示の実施例におけるアップサンプリングネットワークが実行する第三の最適化プロセス群は最適化処理の一つの最適化プロセスとして、例えば残差ネットワークに対応する最適化プロセスの後の最適化プロセスであってもよく、第二特徴行列をさらに最適化してもよい。該プロセスは、出力された第二特徴行列を処理するために、複数の第三サブ最適化プロセスを含んでもよく、例えばアップサンプリングネットワークは順に接続される複数のアップサンプリングモジュールを含み、各アップサンプリングモジュールは第三畳み込みユニットおよび第三畳み込みユニットと接続される第三活性化ユニットを含んでもよい。それに対応して、Ｓ２０５での第三の最適化プロセス群はそれぞれが第三畳み込み処理および第三非線形マッピング処理を含む複数の第三サブ最適化プロセスを含み、つまり各アップサンプリングモジュールは一つの第三サブ最適化プロセスを実行し、アップサンプリングモジュール内の第三畳み込みユニットは上記第三畳み込み処理を実行し、第三活性化ユニットは上記第三非線形マッピング処理を実行してもよい。

一番目の第三サブ最適化プロセスによってＳ２０４で得られた第二特徴行列の第一畳み込み処理を実行し、対応する第三畳み込み特徴を得て、第三活性化関数により該第三畳み込み特徴の第一非線形マッピング処理を実行し、例えば、第三活性化関数と該第三畳み込み特徴を乗算し、最終的に該一番目の第三サブ最適化プロセスの第三最適化特徴行列を得るか、または第三畳み込み特徴を第三活性化関数の対応するパラメータに代入し、活性化関数処理結果（第三最適化特徴行列）を得てもよい。それに対応して、該一番目の第三サブ最適化プロセスで得られた第三最適化特徴行列を二番目の第三サブ最適化プロセスの入力とし、二番目の第三サブ最適化プロセスによって一番目の第三サブ最適化プロセスの第三最適化特徴行列に第三畳み込み処理を行い、対応する第三畳み込み特徴を得て、第三活性化関数により該第三畳み込み特徴の第三活性化処理を実行し、該二番目の第三サブ最適化プロセスの第三最適化特徴行列を得てもよい。

以降同様に、ｋ番目の第三サブ最適化プロセスによってｋ－１番目の第三サブ最適化プロセスで得られた第三最適化特徴行列の第三畳み込み処理を実行し、該第三畳み込み処理によって得られた第三畳み込み特徴に第三非線形マッピング処理を実行することでｋ番目の第三サブ最適化プロセスに対する第三最適化特徴行列を得て、Ｇ番目の第三サブ最適化プロセスで得られた第三最適化特徴行列に基づいて前記出力結果に対応する最適化特徴行列を特定してもよく、ここでｋは１よりも大きくかつＧ以下の正整数であり、Ｇは第三サブ最適化プロセスの数を表す。

または、別のいくつかの可能な実施形態では、二番目の第三サブ最適化プロセスから、ｋ－１番目の第三サブ最適化プロセスで得られた第三最適化特徴行列およびＧ－ｋ＋２番目の第一サブ最適化プロセスで得られた第一最適化特徴行列をｋ番目の第三サブ最適化プロセスの入力情報とし、ｋ番目の第三サブ最適化プロセスによって該入力情報の第三畳み込み処理を実行し、該第三畳み込み処理によって得られた第三畳み込み特徴に第三非線形マッピング処理を実行することでｋ番目の第三サブ最適化プロセスに対する第三最適化特徴行列を得て、Ｇ番目の第三サブ最適化プロセスが出力した第三最適化特徴行列に基づいて前記出力結果に対応する最適化特徴行列を特定してもよく、ここでｋは１よりも大きくかつＧ以下の正整数であり、Ｇは第三サブ最適化プロセスの数を表し、そのうち、前記第三サブ最適化プロセスの数は前記第一の最適化プロセス群に含まれる第一サブ最適化プロセスの数と同じである。

つまり、一番目の第三サブ最適化プロセスで得られた第三最適化特徴行列、およびＧ番目の第一サブ最適化プロセスで得られた第一特徴行列を、二番目の第三サブ最適化プロセスに入力し、二番目の第三サブ最適化プロセスによって入力情報に第三畳み込み処理を行い、第三畳み込み特徴を得て、第三活性化関数により該第三畳み込み特徴に非線形関数マッピング処理を行い、二番目の第三サブ最適化プロセスで得られた第三最適化特徴行列を得てもよい。さらに二番目の第三サブ最適化プロセスで得られた第三最適化特徴行列およびＧ－１番目の第一サブ最適化プロセスで得られた第一最適化特徴行列を三番目の第三サブ最適化プロセスに入力し、第三畳み込み処理および第三活性化関数処理を実行し、三番目の第三サブ最適化プロセスに対する第三最適化特徴行列を得て、以降同様に処理して、最後の第三サブ最適化プロセスに対応する第三最適化特徴行列、即ち出力結果に対応する最適化特徴行列を得る。

各前記アップサンプリングプロセスの第一畳み込み処理を実行する時、各第三畳み込み処理に採用される第三畳み込みカーネルは同じであり、かつ少なくとも一つの第三サブ最適化プロセスの第三畳み込み処理に採用される第三畳み込みカーネルの数は他の第三サブ最適化の第三畳み込み処理に採用される第三畳み込みカーネルの数と異なる。即ち、本開示の実施例の各アップサンプリングプロセスに採用される畳み込みカーネルはいずれも第三畳み込みカーネルであるが、各第三サブ最適化プロセスに採用される第三畳み込みカーネルの数は異なってもよく、第三サブ最適化プロセスによって、適当な数の第三畳み込みカーネルを選択して第三畳み込み処理を実行してもよい。第三畳み込みカーネルは４＊４の畳み込みカーネルであってもよいし、または他のタイプの畳み込みカーネルであってもよく、本開示はこれを限定しない。また、各アップサンプリングプロセスに採用される第三活性化関数は同じである。

本開示の実施例はアップサンプリングネットワークによって前記第二特徴行列に第三の最適化プロセス群を実行し、出力結果に対応する特徴行列を得てもよい。本開示の実施例では、アップサンプリングネットワークは順に接続される複数のアップサンプリングモジュールを含み、各アップサンプリングモジュールは第三畳み込みユニットおよび前記第三畳み込みユニットと接続される第三活性化ユニットを含んでもよい。

Ｓ２０４で取得した第二特徴行列をアップサンプリングネットワークにおける一番目のアップサンプリングモジュールに入力し、一番目のアップサンプリングモジュールが出力した第三最適化特徴行列を二番目のアップサンプリングモジュールに入力し、かつ、対応するダウンサンプリングモジュールから出力された第一最適化特徴行列も対応するアップサンプリングモジュールに入力するため、アップサンプリングモジュールは二つの入力特徴行列の畳み込みを同時に実行し、対応する第三最適化特徴行列を得て、以降同様に処理して、最後のアップサンプリングモジュールによって処理して第三特徴行列を出力することができる。

まずアップサンプリングネットワークにおける一番目のアップサンプリングモジュール内の第三畳み込みユニットを用いて第三畳み込みカーネルによって第二特徴行列に対する畳み込みを実行し、一番目のアップサンプリングモジュールに対応する第三畳み込み特徴を得てもよい。例えば本開示の実施例の第三畳み込みユニットに採用される第三畳み込みカーネルは４＊４の畳み込みカーネルであってもよく、該畳み込みカーネルによって第二特徴行列に対する畳み込みを実行し、各画素点の畳み込み結果を累積し、最終的な第二畳み込み特徴を得てもよい。同時に、本開示の実施例では、各第三畳み込みユニットに採用される第三畳み込みカーネルの数は複数として、該複数の第三畳み込みカーネルによって第二特徴行列の第二の最適化プロセス群をそれぞれ実行し、さらに同じ画素点に対応する畳み込み結果を加算し、第三畳み込み特徴を得てもよい。該第三畳み込み特徴も実質的に行列形式である。第三畳み込み特徴を得てから、前記一番目のアップサンプリングモジュールの第三活性化ユニットを用いて第三活性化関数によって該第三畳み込み特徴を処理し、一番目のアップサンプリングモジュールに対する第三最適化特徴行列を得てもよい。即ち、本開示の実施例は第三畳み込みユニットが出力した第三畳み込み特徴を第三畳み込みユニットと接続される第三活性化ユニットに入力し、該第三活性化関数により第三畳み込み特徴を処理し、例えば第三活性化関数を第三畳み込み特徴で乗算し、一番目のアップサンプリングモジュールの第三最適化特徴行列を得てもよい。

さらに、一番目のアップサンプリングモジュールの第三最適化特徴行列を得てから、二番目のアップサンプリングモジュールを用いて一番目のアップサンプリングモジュールが出力した第三最適化特徴行列および対応するダウンサンプリングモジュールが出力した第一最適化特徴行列の畳み込みを行い、該二番目のアップサンプリングモジュールに対応する第三最適化特徴行列を得て、以降同様に、各アップサンプリングモジュールに対応する第三最適化特徴行列をそれぞれ得て、最終的に第三特徴行列を得てもよい。各アップサンプリングモジュール内の第三畳み込みユニットに採用される第三畳み込みカーネルは同じ畳み込みカーネル、例えばいずれも４＊４の畳み込みカーネルであってもよく、本開示はこれを限定しないが、各ダウンサンプリングモジュール内の第三畳み込みユニットに採用される第三畳み込みカーネルの数は異なってもよく、このようにアップサンプリングのプロセスによって画像行列を、入力された元画像のサイズと同じである画像行列に徐々に変換し、特徴情報をさらに増やすことができる。

可能な一実施例では、アップサンプリングネットワークにおけるアップサンプリングモジュールはダウンサンプリングネットワークにおけるダウンサンプリングモジュールと数が同じであってもよく、対応するアップサンプリングモジュールとダウンサンプリングモジュールとは、ｋ番目のアップサンプリングモジュールとＧ－ｋ＋２番目のダウンサンプリングモジュールとが対応するような対応関係にあってもよく、ここでｋは１よりも大きい整数であり、Ｇはアップサンプリングモジュールの数、即ちダウンサンプリングモジュールの数である。例えば２番目のアップサンプリングモジュールに対応するダウンサンプリングモジュールはＧ番目のダウンサンプリングモジュールであり、３番目のアップサンプリングモジュールに対応するダウンサンプリングモジュールはＧ－１番目のダウンサンプリングモジュールであり、ｋ番目のアップサンプリングモジュールに対応するダウンサンプリングモジュールはＧ－ｋ＋２番目のダウンサンプリングモジュールである。

表１に示すように、本開示の実施例は四つのアップサンプリングモジュールＵ１～Ｕ４を含んでもよい。各アップサンプリングモジュールは第三畳み込みユニットおよび第三活性化ユニットを含んでもよい。本開示の実施例の各第三畳み込みユニットは同じ第三畳み込みカーネルによって入力された特徴行列に対する畳み込みを実行してもよいが、各第二畳み込みユニットの畳み込みを実行する第一畳み込みカーネルの数は異なってもよい。例えば、表１から分かるように、各アップサンプリングモジュールＵ１からＵ４は異なるアップサンプリングモジュールをそれぞれ用いて、第三畳み込みユニットによる畳み込みおよび第三活性化ユニットによる処理が含まれる第三の最適化プロセス群の処理を実行してもよい。第三畳み込みカーネルは４＊４の畳み込みカーネルであってもよく、畳み込みのステップサイズは２としてもいが、本開示はこれを具体的に限定しない。

具体的には、一番目のアップサンプリングモジュールＵ１内の第三畳み込みユニットは２５６個の第三畳み込みカーネルによって入力された第二特徴行列の畳み込みを実行し、５１２個の画像の特徴情報を含むものに相当する第三畳み込み特徴を得る。第三畳み込み特徴を得てから、第三活性化ユニットを用いて処理を実行し、例えば第三畳み込み特徴と第三活性化関数を乗算し、Ｕ１の最終的な第三最適化特徴行列を得る。第三活性化ユニットによって処理することで、特徴情報をより豊富にすることができる。

それに対応して、二番目のアップサンプリングモジュールＵ２はＵ１から出力した第三最適化特徴行列およびＤ４から出力された第一特徴行列を受信し、その内部の第三畳み込みユニットを用いて１２８個の４＊４の畳み込みカーネルである第二畳み込みカーネルによって該Ｕ１が出力した第三最適化特徴行列およびＤ４が出力した第一特徴行列に、所定のステップサイズ（例えば２）に従って畳み込みを実行してもよい。アップサンプリングモジュールＵ２内の第三畳み込みユニットは１２８個の第三畳み込みカーネルによって上記畳み込みを実行し、２５６個の画像の特徴情報を含む第三畳み込み特徴を得る。第三畳み込み特徴を得てから、第三活性化ユニットを用いて処理を実行し、例えば第三畳み込み特徴と第三活性化関数を乗算し、Ｕ２の最終的な第三最適化特徴行列を得る。第三活性化ユニットによって処理することで、特徴情報をより豊富にすることができる。

さらに、三番目のアップサンプリングモジュールＵ３はＵ２から出力した第三最適化特徴行列およびＤ３から出力された第一最適化特徴行列を受信し、その内部の第三畳み込みユニットを用いて６４個の４＊４の畳み込みカーネルである第二畳み込みカーネルによって該Ｕ２が出力した第三最適化特徴行列およびＤ３が出力した第一最適化特徴行列に、所定のステップサイズ（例えば２）に従って畳み込みを実行してもよい。アップサンプリングモジュールＵ３内の第三畳み込みユニットは６４個の第三畳み込みカーネルによって上記畳み込みを実行し、１２８個の画像の特徴情報を含む第三畳み込み特徴を得る。第三畳み込み特徴を得てから、第三活性化ユニットを用いて処理を実行し、例えば第三畳み込み特徴と第三活性化関数を乗算し、Ｕ３の最終的な第三最適化特徴行列を得る。第三活性化ユニットによって処理することで、特徴情報をより豊富にすることができる。

さらに、四番目のアップサンプリングモジュールＵ４はＵ３から出力した第三最適化特徴行列およびＤ２から出力された第一最適化特徴行列を受信し、その内部の第三畳み込みユニットを用いて３個の４＊４の畳み込みカーネルである第二畳み込みカーネルによって該Ｕ３が出力した第三最適化特徴行列およびＤ２が出力した第一最適化特徴行列に、所定のステップサイズ（例えば２）に従って畳み込みを実行してもよい。アップサンプリングモジュールＵ４内の第三畳み込みユニットは３個の第三畳み込みカーネルによって上記畳み込みを実行し、第三畳み込み特徴を得る。第三畳み込み特徴を得てから、第三活性化ユニットを用いて処理を実行し、例えば第三畳み込み特徴と第三活性化関数を乗算し、Ｕ４の最終的な第三最適化特徴行列を得る。第三活性化ユニットによって処理することで、特徴情報をより豊富にすることができる。

本開示の実施例では、各アップサンプリングモジュールに採用される第三畳み込みカーネルは同じであってもよく、同じステップサイズで畳み込みを実行してもよく、かつ各第三畳み込みユニットの畳み込みを実行するために採用された第三畳み込みカーネルの数は異なっても良い。各アップサンプリングモジュールによる処理は、いずれも画像の特徴情報をさらに豊富にし、画像の信号対雑音比をさらに向上させることができる。

最後のアップサンプリングモジュールによって処理して第三特徴行列を得て、該第三特徴行列は複数の元画像に対応する深度マップであってもよく、元画像と同じサイズを有し、豊富な特徴情報（深度情報など）を含み、画像の信号対雑音比を向上させることができるため、該第三特徴行列を利用すれば最適化後の最適化画像を得ることができる。

また、ニューラルネットワークが出力した第三特徴行列は複数の元画像にそれぞれ対応する最適化後の画像の特徴行列であってもよく、該第三特徴行列によって対応する複数の最適化画像を得てもよい。最適化画像は元画像に比べ、より正確な特徴値を有するので、得られた元画像によって最適化された深度マップを得ることができる。

本開示の実施例では、ダウンサンプリングネットワーク、アップサンプリングネットワークおよび残差ネットワークによって画像最適化のプロセスを行う前に、さらに訓練データを利用して各ネットワークを訓練してもよい。本開示の実施例は上記ダウンサンプリングネットワーク、アップサンプリングネットワークおよび残差ネットワークに基づいて画像情報のニューラルネットワークを構築し、該ニューラルネットワークに第一訓練画像を入力してニューラルネットワークを訓練してもよい。本開示の実施例のニューラルネットワークは訓練して得られた敵対的生成ネットワークのうちの生成ネットワークである。

いくつかの可能な実施形態では、ニューラルネットワークによって元画像の深度マップを直接出力可能である場合、ニューラルネットワークを訓練する時、複数の訓練サンプルを含む訓練サンプルセットをニューラルネットワークに入力してもよく、そのうち各訓練サンプルは複数の第一サンプル画像、及び複数の第一サンプル画像に対応する実深度マップを含んでもよい。ニューラルネットワークによって入力された訓練サンプルを最適化処理し、各訓練サンプルに対応する予測深度マップを得る。実深度マップと予測深度マップとの差異によってネットワーク損失を得て、該ネットワーク損失に基づいてネットワークパラメータを、訓練要件を満たすまで調整してもよい。訓練要件は、実深度マップと予測深度マップとの差異によって特定されたネットワーク損失が損失閾値よりも小さいことであり、該損失閾値は予め設定された値、例えば０．１であってもよく、本開示はこれを具体的に限定しない。ネットワーク損失は下式で表されてもよい。

ここで、

はネットワーク損失（即ち深度損失）を表し、Ｎは元画像の次元（Ｎ＊Ｎ次元）を表し、ｉおよびｊはそれぞれ画素点の位置を表し、

は実深度マップにおける第ｉ行第ｊ列の画素点の実深度値を表し、

は予測深度マップにおける第ｉ行第ｊ列の画素点の予測深度値を表し、ｉおよびｊはそれぞれ１以上Ｎ以下の整数である。

以上によって、ニューラルネットワークのネットワーク損失を得て、該ネットワーク損失に基づいてニューラルネットワークのパラメータを、ネットワーク損失が損失閾値よりも小さくなるまでフィードバックして調整した場合、訓練要件を満たし、得られたニューラルネットワークにより元画像に対応する深度マップを正確に得ることが特定できる。

また、ニューラルネットワークによって元画像に対応する最適化画像を得る場合、本開示の実施例は深度損失および画像損失に基づいてニューラルネットワークの訓練プロセスを監視してもよい。図７は本開示の実施例に係る画像処理方法の別のフローチャートを示す。図５に示すように、本開示の実施例の前記方法はさらにニューラルネットワークの訓練プロセスを含み、ニューラルネットワークの訓練プロセスは以下のステップを含んでもよい。
Ｓ４０１：訓練サンプルセットを取得する。前記訓練サンプルセットは複数の訓練サンプルを含み、各訓練サンプルは複数の第一サンプル画像、複数の第一サンプル画像に対応する複数の第二サンプル画像、および複数の第二サンプル画像に対応する深度マップを含んでもよく、第二サンプル画像および対応する第一サンプル画像は同一対象に対する画像であり、かつ第二サンプル画像は第一サンプル画像よりも信号対雑音比が高い。
Ｓ４０２：前記ニューラルネットワークによって前記訓練サンプルセットに前記最適化処理を実行し、前記訓練サンプルセット内の第一サンプル画像に対する最適化結果を得て、ひいては第一ネットワーク損失および第二ネットワーク損失を得る。前記第一ネットワーク損失は、前記ニューラルネットワークが前記訓練サンプルに含まれる複数の第一サンプル画像を処理することによって得た複数の予測最適化画像と、前記訓練サンプルに含まれる複数の第二サンプル画像との差異に基づいて得られ、前記第二ネットワーク損失は、前記複数の予測最適化画像に後処理を行うことによって得られた予測深度マップと、前記訓練サンプルに含まれる深度マップとの差異に基づいて得られる。
Ｓ４０３：前記第一ネットワーク損失および第二ネットワーク損失に基づいてニューラルネットワークのネットワーク損失を得て、前記ネットワーク損失に基づいて前記ニューラルネットワークのパラメータを、所定の要件を満たすまで調整する。

本開示の実施例はニューラルネットワークに複数の訓練サンプルを入力してもよく、各訓練サンプルは複数の低信号対雑音比の画像（第一サンプル画像）、例えば低露光率で取得した画像情報であってもよい。該第一サンプル画像はＥＰＣ６６０ＴｏＦカメラおよびＳｏｎｙのＩＭＸ３１６Ｍｉｎｉｋｉｔ開発キットによって、実験室、事務室、寝室、応接室、食堂などの異なるシーンにおいて収集されてもよく、本開示は収集機器および収集シーンを具体的に限定せず、低露光率での第一訓練画像を得ることができれば、本開示の実施例とすることができる。本開示の実施例における第一サンプル画像は２００（または他の数）個のデータ群を含んでもよく、各データ群は露光時間がそれぞれ２００ｕｓ、４００ｕｓなどの低露光時間および正常な露光時間または長露光時間でのＴｏＦ元測定データ、深度マップ、振幅像を含み、そのうちＴｏＦ元測定データは第一サンプル画像とすることができる。例えばダウンサンプリングネットワーク、残差ネットワークおよびアップサンプリングネットワークによって訓練サンプルにおける複数の第一サンプル画像の最適化プロセスを実行し、最終的に各第一サンプル画像にそれぞれ対応する最適化特徴行列、即ち予測最適化画像を得るように、ニューラルネットワークでの最適化処理によって対応する最適化特徴行列を得てもよい。本開示の実施例は第一サンプル画像に対応する最適化特徴行列を標準特徴行列と比較し、つまり予測最適化画像を対応する第二サンプル画像と比較して、両者の差異を特定してもよい。標準特徴行列は第一訓練画像における各画像に対応する第二サンプル画像の特徴行列、即ち正確な特徴情報（位相、振幅、画素値などの情報）を有する画像特徴行列である。予測した最適化特徴行列を標準特徴行列と比較することで、ニューラルネットワークの第一ネットワーク損失を特定することができる。

各訓練サンプルに４つの第一サンプル画像が含まれることを例にして説明する場合、第一ネットワーク損失は下式で表されてもよい。

ここで、

は第一ネットワーク損失を表し、Ｎは第一サンプル画像、第二サンプル画像、予測最適化画像の次元（Ｎ＊Ｎ）を表し、

、

および

は訓練サンプルにおける４つの第一サンプル画像の第ｉ行第ｊ列の実特徴値をそれぞれ表し、

、

および

は４つの第一サンプル画像に対応する４つの予測最適化画像の第ｉ行第ｊ列の予測特徴値をそれぞれ表す。

上記方法によって第一ネットワーク損失を得ることができる。また、訓練サンプルにおける各第一サンプル画像に対応する予測最適化画像を得た場合、得られた予測最適化画像に基づいて該複数の第一サンプル画像に対応する予測深度マップをさらに特定し、即ち予測最適化画像に後処理を実行してもよく、具体的な方法は式１に特定されたものを参照すればよい。

それに対応して、予測深度マップを得てから、第二ネットワーク損失、即ち深度損失をさらに特定してもよく、具体的には上式２に基づいて第二ネットワーク損失を得ることができ、ここでは説明を省略する。

第一ネットワーク損失および第二ネットワーク損失を得てから、第一ネットワーク損失と第二ネットワーク損失との加重和によってニューラルネットワークのネットワーク損失を得てもよく、ニューラルネットワークのネットワーク損失は下式で表される。

ここで、Ｌはニューラルネットワークのネットワーク損失を表し、

および

はそれぞれ第一ネットワーク損失および第二ネットワーク損失の重みであり、重み値は必要に応じて設定してもよく、例えば全て１に設定してもよいし、または

と

との和を１にするように設定してもよく、本開示はこれを具体的に限定しない。

可能な一実施形態では、得られたネットワークパラメータに基づいてニューラルネットワークに採用されるパラメータ、例えば畳み込みカーネルパラメータ、活性化関数パラメータなどをフィードバックして調整してもよい。例えば、ダウンサンプリングネットワーク、残差ネットワークおよびアップサンプリングネットワークのパラメータを調整してもよいか、または該差異を適合度関数に入力し、得られたパラメータ値に基づいて最適化処理プロセスのパラメータ、およびダウンサンプリングネットワーク、残差ネットワークおよびアップサンプリングネットワークのパラメータを調整してもよい。その後、パラメータ調整後のニューラルネットワークによって訓練サンプルを改めて最適化処理し、新たな最適化結果を得る。このように、得られたネットワーク損失が予め設定された訓練要件、例えばネットワーク損失が予め設定された損失閾値よりも小さくなることを満たすまで繰り返す。得られたネットワーク損失が予め設定された要件を満たす場合、ニューラルネットワークの訓練が完了し、該訓練が完了したニューラルネットワークによって低信号対雑音比の画像の最適化プロセスを実行することができ、高い最適化精度を得ることができる。

さらに、ニューラルネットワークの最適化精度をさらに保証するために、本開示の実施例は敵対的ネットワークによって訓練完了されたニューラルネットワークの最適化結果を検証し、該ネットワークをさらに最適化する必要がある判定結果であれば、ニューラルネットワークが高い最適化効果を達成したという敵対的ネットワークの判定結果になるまで、ニューラルネットワークのパラメータをさらに調整してもよい。

図８は本開示の実施例に係る画像処理方法の別のフローチャートを示す。本開示の実施例では、Ｓ５０２の後に、さらに以下のステップを含んでもよい。
Ｓ５０１：訓練サンプルセットを取得する。該訓練サンプルセットは複数の訓練サンプルを含み、各訓練サンプルは複数の第一サンプル画像および該複数の第一サンプル画像に対応する複数の第二サンプル画像、ならびに複数の第二サンプル画像に対応する深度マップを含んでもよい。
Ｓ５０２：前記ニューラルネットワークによって前記訓練サンプルに前記最適化処理を実行し、最適化結果を得る。
いくつかの可能な実施形態では、得られた最適化結果はニューラルネットワークによって得られた、第一サンプル画像に対応する予測最適化画像であってもよいし、または第一サンプル画像に対応する予測深度マップであってもよい。
Ｓ５０３：前記最適化結果および対応する監視サンプル（第二サンプル画像または深度マップ）を敵対的ネットワークに入力し、前記敵対的ネットワークによって該最適化結果と監視サンプルの真偽判定を行い、前記敵対的ネットワークにより生成される判定値が第一判定値である場合、前記敵対的ネットワークの前記第一最適化画像および前記標準画像に対する判定値が第二判定値になるまで、前記最適化処理プロセスに採用されるパラメータをフィードバックして調整する。

本開示の実施例では、Ｓ４０１～Ｓ４０３によってニューラルネットワークを訓練してから、さらに敵対的ネットワークによって生成されたネットワーク（ニューラルネットワーク）をさらに最適化してもよく、Ｓ５０１での訓練サンプルセットはＳ４０１での訓練サンプルセットと同じであってもよく、異なってもよく、本開示はこれを限定しない。

ニューラルネットワークによって訓練サンプルセット内の訓練サンプルの最適化結果を得た場合、該最適化結果及び対応する監視サンプル（即ちリアルで明瞭な第二サンプル画像または深度マップ）を敵対的ネットワークに入力してもよい。敵対的ネットワークは最適化結果および監視サンプルの真偽判定を行い、つまり両者の差異が第三閾値よりも小さければ、第二判定値、例えば１を出力してもよい。この場合、最適化後のニューラルネットワークの最適化精度が高く、敵対的ネットワークが最適化結果と監視サンプルとの真偽を区別できず、ニューラルネットワークをさらに訓練する必要がないことを示す。

最適化結果と監視サンプルとの差異が第三閾値以上である場合、敵対的ネットワークは第一判定値、例えば０を出力してもよい。この場合、最適化後のニューラルネットワークの最適化精度があまり高くなく、敵対的ネットワークが最適化結果と監視サンプルとを区別でき、ニューラルネットワークをさらに訓練する必要があることを示す。つまり、最適化結果と監視サンプルとの差異に基づいて、前記敵対的ネットワークの前記最適化結果および監視サンプルに対する判定値が第二判定値になるまで、前記ニューラルネットワークのパラメータをフィードバックして調整する必要がある。上記構成によって、画像ニューラルネットワークの最適化精度をさらに向上させることができる。

まとめると、本開示の実施例は深度撮影機能を有する電子機器、例えばＴｏＦカメラにおいて応用することができる。本開示の実施例によって低信号対雑音比の元画像データから深度マップを復元し、最適化後の画像に高解像度、高フレームレートを持たせるなどの効果があり、精度を損なうことなく該効果を実現することができる。本開示の実施例が提供する方法は無人運転システムのＴｏＦカメラモジュールに応用し、より長い探測距離およびより高い探測精度を実現することができる。また、本開示の実施例はスマートフォンおよびスマートセキュリティ監視に応用することができる。測定精度に影響することなくモジュールの消費電力を低減し、ＴｏＦモジュールを、スマートフォンおよびセキュリティ監視の持続動作能力に影響しないようにすることができる。

また、本開示の実施例は画像処理方法をさらに提供し、図９は本開示の実施例に係る画像処理方法の別のフローチャートを示す。前記画像処理方法は以下のステップを含んでもよい。
Ｓ１０：飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得する。
Ｓ２０：ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、前記複数の元画像に対応する深度マップを得る。ここで、ニューラルネットワークは訓練サンプルセットによって訓練して得られ、前記訓練サンプルセットに含まれる複数の訓練サンプルのうちの各訓練サンプルは複数の第一サンプル画像、前記複数の第一サンプル画像に対応する複数の第二サンプル画像および前記複数の第二サンプル画像に対応する深度マップを含み、前記第二サンプル画像および対応する第一サンプル画像は同一対象に対する画像であり、かつ第二サンプル画像は対応する前記第一サンプル画像よりも信号対雑音比が高い。

いくつかの可能な実施形態では、前記方法はさらに、前記複数の元画像に対して、画像キャリブレーション、画像補正、任意の二つの元画像間の線形処理、及び任意の二つの元画像間の非線形処理の少なくとも一つを含む前処理を実行し、前処理された前記複数の元画像を得ることを含み、ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、前処理された前記複数の元画像を前記ニューラルネットワークに入力して最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることを含む。

いくつかの可能な実施形態では、前記ニューラルネットワークが実行する最適化処理は順に実行されるＱ個の最適化プロセス群を含み、各最適化プロセス群は少なくとも一回の畳み込み処理および／または少なくとも一回の非線形マッピング処理を含み、ニューラルネットワークによって前記複数の元画像に最適化処理を実行することは、
前記複数の元画像を第一の最適化プロセス群の入力情報とし、前記第一の最適化プロセス群によって処理して前記第一の最適化プロセス群に対する最適化特徴行列を得ることと、
第ｎの最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行うか、または前のｎ個の最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行う（ｎは１よりも大きくかつＱよりも小さい整数である）ことと、
第Ｑの最適化プロセス群により処理された最適化特徴行列に基づき、出力結果を得ることと、を含む。
いくつかの可能な実施形態では、前記Ｑ個の最適化プロセス群は順に実行されるダウンサンプリング処理、残差処理およびアップサンプリング処理を含み、ニューラルネットワークによって前記複数の元画像に最適化処理を実行することは、前記複数の元画像に前記ダウンサンプリング処理を実行し、前記複数の元画像の特徴情報を融合した第一特徴行列を得ることと、前記第一特徴行列に前記残差処理を実行し、第二特徴行列を得ることと、前記第二特徴行列に前記アップサンプリング処理を実行し、最適化特徴行列を得ることと、を含み、前記ニューラルネットワークの出力結果は前記最適化特徴行列に基づいて得られる。いくつかの可能な実施形態では、前記方法は、前記第二特徴行列に前記アップサンプリング処理を実行し、最適化特徴行列を得る前に、さらに、
前記ダウンサンプリング処理プロセスで得られた特徴行列により前記第二特徴行列に前記アップサンプリング処理を実行し、前記最適化特徴行列を得ることを含む。

いくつかの可能な実施形態では、前記ニューラルネットワークは訓練によって得られた敵対的生成ネットワークのうちの生成ネットワークであり、そのネットワーク損失値は第一ネットワーク損失と第二ネットワーク損失との加重和であり、お前記第一ネットワーク損失は前記ニューラルネットワークが前記訓練サンプルに含まれる複数の第一サンプル画像を処理することによって得た複数の予測最適化画像と、前記訓練サンプルに含まれる複数の第二サンプル画像との差異に基づいて得られ、前記第二ネットワーク損失は前記複数の予測最適化画像に後処理を行うことによって得られた予測深度マップと、前記訓練サンプルに含まれる深度マップとの差異に基づいて得られる。

当業者であれば、具体的な実施形態の上記方法では、各ステップの記載順序は厳密にその順に従って実行することを限定するものではなく、実施プロセスを何ら限定するものではなく、各ステップの具体的な実行順序はその機能および可能な内部論理によって決定されるべきであることが理解可能である。

理解できるように、本開示で言及された上記各方法の実施例は、原理や論理を違反しない限り、互いに組み合わせて実施例を形成することができ、紙幅に限りがあるため、本開示はその説明を省略する。

また、本開示は画像処理装置、電子機器、コンピュータ読み取り可能記憶媒体、プログラムをさらに提供し、いずれも本開示が提供する任意の画像処理方法を実現するために用いることができ、対応する技術的解決手段および説明は方法の部分の対応する記載を参照すればよく、ここでは説明を省略する。

図１０は本開示の実施例に係る画像処理装置のブロック図を示す。図１０に示すように、前記画像処理装置は、
飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得するための取得モジュール１０と、
ニューラルネットワークによって前記複数の元画像に対して、少なくとも一回の畳み込み処理および少なくとも一回の非線形関数マッピング処理を含む最適化処理を実行し、前記複数の元画像に対応する深度マップを得るための最適化モジュール２０と、を含む。

いくつかの可能な実施形態では、前記最適化モジュールはさらに、ニューラルネットワークによって前記複数の元画像に最適化処理を行い、信号対雑音比が前記元画像よりも高い前記複数の元画像に対する複数の最適化画像を出力し、前記複数の最適化画像に後処理を行い、前記複数の元画像に対応する深度マップを得るために用いられる。

いくつかの可能な実施形態では、前記最適化モジュールはさらに、ニューラルネットワークによって前記複数の元画像に最適化処理を行い、前記複数の元画像に対応する深度マップを出力するために用いられる。

いくつかの可能な実施形態では、前記最適化モジュールはさらに、前記複数の元画像をニューラルネットワークに入力して最適化処理を行い、前記複数の元画像に対応する深度マップを得るために用いられる。

いくつかの可能な実施形態では、前記装置はさらに、前記複数の元画像に対して、画像キャリブレーション、画像補正、任意の二つの元画像間の線形処理、及び任意の二つの元画像間の非線形処理の少なくとも一つを含む前処理を実行し、前処理された前記複数の元画像を得るための前処理モジュールを含み、前記最適化モジュールはさらに、前処理された前記複数の元画像を前記ニューラルネットワークに入力して最適化処理を実行し、複数の前記元画像に対応する深度マップを得るために用いられる。

いくつかの可能な実施形態では、前記最適化モジュールが実行する前記最適化処理は順に実行されるＱ個の最適化プロセス群を含み、各最適化プロセス群は少なくとも一回の畳み込み処理および／または少なくとも一回の非線形マッピング処理を含み、前記最適化モジュールはさらに、前記元画像を第一の最適化プロセス群の入力情報とし、前記第一の最適化プロセス群によって処理して該第一の最適化プロセス群に対する最適化特徴行列を得るために、および第ｎの最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行い、または前のｎ個の最適化プロセス群が出力した最適化特徴行列を、第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行い、第Ｑの最適化プロセス群により処理された最適化特徴行列に基づき、出力結果を得るために用いられ、ここで、ｎは１よりも大きくかつＱよりも小さい整数であり、Ｑは最適化プロセス群の数である。

いくつかの可能な実施形態では、前記Ｑ個の最適化プロセス群は順に実行されるダウンサンプリング処理、残差処理およびアップサンプリング処理を含み、前記最適化モジュールは、前記複数の元画像に前記ダウンサンプリング処理を実行し、前記複数の元画像の特徴情報を融合した第一特徴行列を得るための第一最適化ユニットと、前記第一特徴行列に前記残差処理を実行し、第二特徴行列を得るための第二最適化ユニットと、前記第二特徴行列に前記アップサンプリング処理を実行し、最適化特徴行列を得るための第三最適化ユニットと、を含み、前記ニューラルネットワークの出力結果は前記最適化特徴行列に基づいて得られる。

いくつかの可能な実施形態では、前記第三最適化ユニットはさらに、前記ダウンサンプリング処理プロセスで得られた特徴行列により前記第二特徴行列に前記アップサンプリング処理を実行し、前記最適化特徴行列を得るために用いられる。

いくつかの可能な実施形態では、前記ニューラルネットワークは訓練サンプルセットによって訓練して得られ、前記訓練サンプルセットに含まれる複数の訓練サンプルのうちの各訓練サンプルは複数の第一サンプル画像、前記複数の第一サンプル画像に対応する複数の第二サンプル画像および前記複数の第二サンプル画像に対応する深度マップを含み、前記第二サンプル画像および対応する第一サンプル画像は同一対象に対する画像であり、かつ第二サンプル画像は前記第一サンプル画像よりも信号対雑音比が高く、前記ニューラルネットワークは訓練によって得られた敵対的生成ネットワークのうちの生成ネットワークであり、そのネットワーク損失値は第一ネットワーク損失と第二ネットワーク損失との加重和であり、前記第一ネットワーク損失は前記ニューラルネットワークが前記訓練サンプルに含まれる複数の第一サンプル画像を処理することによって得た複数の予測最適化画像と、前記訓練サンプルに含まれる複数の第二サンプル画像との差異に基づいて得られ、前記第二ネットワーク損失は前記複数の予測最適化画像に後処理を行うことによって得られた予測深度マップと、前記訓練サンプルに含まれる深度マップとの差異に基づいて得られる。

図１１は本開示の実施例に係る画像処理装置の別のブロック図を示す。前記画像処理装置は、
飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得するための取得モジュール１００と、
ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、前記複数の元画像に対応する深度マップを得るための最適化モジュール２００と、を含んでもよい。ニューラルネットワークは訓練サンプルセットによって訓練して得られ、前記訓練サンプルセットに含まれる複数の訓練サンプルのうちの各訓練サンプルは複数の第一サンプル画像、前記複数の第一サンプル画像に対応する複数の第二サンプル画像および前記複数の第二サンプル画像に対応する深度マップを含み、前記第二サンプル画像および対応する第一サンプル画像は同一対象に対する画像であり、かつ第二サンプル画像は対応する前記第一サンプル画像よりも信号対雑音比が高い。

いくつかの可能な実施形態では、前記ニューラルネットワークが実行する最適化処理は順に実行されるＱ個の最適化プロセス群を含み、各最適化プロセス群は少なくとも一回の畳み込み処理および／または少なくとも一回の非線形マッピング処理を含み、前記最適化モジュールはさらに、前記複数の元画像を第一の最適化プロセス群の入力情報とし、前記第一の最適化プロセス群によって処理して前記第一の最適化プロセス群に対する最適化特徴行列を得るために、第ｎの最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行うか、または前のｎ個の最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行う（ｎは１よりも大きくかつＱよりも小さい整数である）ために、及び第Ｑの最適化プロセス群により処理された最適化特徴行列に基づき、出力結果を得るために用いられる。

いくつかの可能な実施形態では、前記Ｑ個の最適化プロセス群は順に実行されるダウンサンプリング処理、残差処理およびアップサンプリング処理を含み、前記最適化モジュールは、前記第一特徴行列に前記残差処理を実行し、第二特徴行列を得るための第一最適化ユニットと、前記第二特徴行列に前記アップサンプリング処理を実行し、最適化特徴行列を得るための第二最適化ユニットと、を含み、前記ニューラルネットワークの出力結果は前記最適化特徴行列に基づいて得られる。

いくつかの可能な実施形態では、前記ニューラルネットワークは訓練によって得られた敵対的生成ネットワークのうちの生成ネットワークであり、そのネットワーク損失値は第一ネットワーク損失と第二ネットワーク損失との加重和であり、前記第一ネットワーク損失は前記ニューラルネットワークが前記訓練サンプルに含まれる複数の第一サンプル画像を処理することによって得た複数の予測最適化画像と、前記訓練サンプルに含まれる複数の第二サンプル画像との差異に基づいて得られ、前記第二ネットワーク損失は前記複数の予測最適化画像に後処理を行うことによって得られた予測深度マップと、前記訓練サンプルに含まれる深度マップとの差異に基づいて得られる。

いくつかの実施例では、本開示の実施例が提供する装置が有する機能または含むモジュールは上記方法の実施例に記載の方法を実行するために用いることができ、その具体的な実現は上記方法の実施例の説明を参照すればよく、説明を簡潔にするために、ここでは詳細な説明を繰り返さない。

本開示の実施例はさらに、コンピュータプログラム命令が記憶されているコンピュータ読み取り可能記憶媒体であって、前記コンピュータプログラム命令はプロセッサに実行される時に上記方法を実現するコンピュータ読み取り可能記憶媒体を提供する。コンピュータ読み取り可能記憶媒体は非揮発性コンピュータ読み取り可能記憶媒体または揮発性コンピュータ読み取り可能記憶媒体を含んでもよい。

本開示の実施例はさらに、上記方法を実行するように構成されたプロセッサおよびプロセッサにより実行可能な命令を記憶するためのメモリを含む電子機器を提供する。

本開示の実施例はさらに、コンピュータ読み取り可能コードを含み、前記コンピュータコードが電子機器において運用される時、前記電子機器内のプロセッサに上記方法を実行させるコンピュータプログラムを提供する。

電子機器は端末、サーバまたは他の形態の機器として提供されてもよい。

図１２は本開示の実施例に係る電子機器のブロック図を示す。例えば、電子機器８００は携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレットデバイス、医療機器、フィットネス機器、パーソナルデジタル端末などの端末であってもよい。

図１２を参照すると、電子機器８００は、処理コンポーネント８０２、メモリ８０４、電源コンポーネント８０６、マルチメディアコンポーネント８０８、オーディオコンポーネント８１０、入力／出力（Ｉ／Ｏ）インタフェース８１２、センサコンポーネント８１４、および通信コンポーネント８１６のうちの一つ以上を含んでもよい。

処理コンポーネント８０２は通常、電子機器８００の全体的な動作、例えば表示、電話呼び出し、データ通信、カメラ動作および記録動作に関連する動作を制御する。処理コンポーネント８０２は、命令を実行して上記方法の全てまたは一部のステップを実行するために、一つ以上のプロセッサ８２０を含んでもよい。また、処理コンポーネント８０２は、他のコンポーネントとのインタラクションのための一つ以上のモジュールを含んでもよい。例えば、処理コンポーネント８０２は、マルチメディアコンポーネント８０８とのインタラクションのために、マルチメディアモジュールを含んでもよい。

メモリ８０４は電子機器８００での動作をサポートするための様々なタイプのデータを記憶するように構成される。これらのデータは、例として、電子機器８００において操作するあらゆるアプリケーションプログラムまたは方法の命令、連絡先データ、電話帳データ、メッセージ、ピクチャー、ビデオなどを含む。メモリ８０４は、例えば静的ランダムアクセスメモリ（ＳＲＡＭ）、電気的消去可能プログラマブル読み取り専用メモリ（ＥＥＰＲＯＭ）、消去可能なプログラマブル読み取り専用メモリ（ＥＰＲＯＭ）、プログラマブル読み取り専用メモリ（ＰＲＯＭ）、読み取り専用メモリ（ＲＯＭ）、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクなどのあらゆるタイプの揮発性または非揮発性記憶機器またはそれらの組み合わせによって実現できる。

電源コンポーネント８０６は電子機器８００の各コンポーネントに電力を供給する。電源コンポーネント８０６は電源管理システム、一つ以上の電源、および電子機器８００のための電力生成、管理および配分に関連する他のコンポーネントを含んでもよい。

マルチメディアコンポーネント８０８は前記電子機器８００とユーザとの間で出力インタフェースを提供するスクリーンを含む。いくつかの実施例では、スクリーンは液晶ディスプレイ（ＬＣＤ）およびタッチパネル（ＴＰ）を含んでもよい。スクリーンがタッチパネルを含む場合、ユーザからの入力信号を受信するタッチスクリーンとして実現されてもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャを検知するために、一つ以上のタッチセンサを含む。前記タッチセンサはタッチまたはスライド動きの境界を検知するのみならず、前記タッチまたはスライド操作に関連する持続時間および圧力を検出するようにしてもよい。いくつかの実施例では、マルチメディアコンポーネント８０８は一つの前面カメラおよび／または後面カメラを含む。電子機器８００が動作モード、例えば写真モードまたは撮影モードになる場合、前面カメラおよび／または後面カメラは外部のマルチメディアデータを受信するようにしてもよい。各前面カメラおよび後面カメラは、固定された光学レンズ系、または焦点距離および光学ズーム能力を有するものであってもよい。

オーディオコンポーネント８１０はオーディオ信号を出力および／または入力するように構成される。例えば、オーディオコンポーネント８１０は、マイク（ＭＩＣ）を含み、マイク（ＭＩＣ）は電子機器８００が動作モード、例えば呼び出しモード、記録モードおよび音声認識モードになる場合、外部のオーディオ信号を受信するように構成される。受信されたオーディオ信号はさらにメモリ８０４に記憶されるか、または通信コンポーネント８１６によって送信されてもよい。いくつかの実施例では、オーディオコンポーネント８１０はさらに、オーディオ信号を出力するためのスピーカーを含む。

Ｉ／Ｏインタフェース８１２は処理コンポーネント８０２と周辺インタフェースモジュールとの間でインタフェースを提供し、上記周辺インタフェースモジュールはキーボード、クリックホイール、ボタンなどであってもよい。これらのボタンはホームボタン、音量ボタン、スタートボタンおよびロックボタンを含んでもよいが、これらに限定されない。

センサコンポーネント８１４は電子機器８００の各面の状態評価のために一つ以上のセンサを含む。例えば、センサコンポーネント８１４は電子機器８００のオン／オフ状態、例えば電子機器８００の表示装置およびキーパッドのようなコンポーネントの相対的位置決めを検出でき、センサコンポーネント８１４はさらに、電子機器８００または電子機器８００のあるコンポーネントの位置の変化、ユーザと電子機器８００との接触の有無、電子機器８００の方位または加減速および電子機器８００の温度変化を検出できる。センサコンポーネント８１４は、いかなる物理的接触もない場合に近傍の物体の存在を検出するように構成された近接センサを含んでもよい。センサコンポーネント８１４はさらに、ＣＭＯＳまたはＣＣＤ画像センサのような、イメージングアプリケーションにおいて使用するための光センサを含んでもよい。いくつかの実施例では、該センサコンポーネント８１４はさらに、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサまたは温度センサを含んでもよい。

通信コンポーネント８１６は電子機器８００と他の機器との有線または無線通信を実現するように配置される。電子機器８００は通信規格に基づく無線ネットワーク、例えばＷｉＦｉ、２Ｇまたは３Ｇ、またはそれらの組み合わせにアクセスできる。一例示的実施例では、通信コンポーネント８１６は放送チャネルによって外部の放送管理システムの放送信号または放送関連情報を受信する。一例示的実施例では、前記通信コンポーネント８１６はさらに、近距離通信を促進させるために、近距離無線通信（ＮＦＣ）モジュールを含む。例えば、ＮＦＣモジュールは無線周波数識別（ＲＦＩＤ）技術、赤外線データ協会（ＩｒＤＡ）技術、超広帯域（ＵＷＢ）技術、ブルートゥース（登録商標）（ＢＴ）技術および他の技術によって実現できる。

例示的な実施例では、電子機器８００は一つ以上の特定用途向け集積回路（ＡＳＩＣ）、デジタル信号プロセッサ（ＤＳＰ）、デジタル信号処理デバイス（ＤＳＰＤ）、プログラマブルロジックデバイス（ＰＬＤ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子要素によって実現され、上記方法を実行するために用いることができる。

例示的な実施例では、さらに、非揮発性コンピュータ読み取り可能記憶媒体、例えばコンピュータプログラム命令を含むメモリ８０４が提供され、上記コンピュータプログラム命令は電子機器８００のプロセッサ８２０によって実行される時上記方法を実行することができる。

図１３は本開示の実施例に係る別の電子機器のブロック図を示す。例えば、電子機器１９００はサーバとして提供されてもよい。図１３を参照すると、電子機器１９００は、一つ以上のプロセッサを含む処理コンポーネント１９２２、および、処理コンポーネント１９２２によって実行可能な命令、例えばアプリケーションプログラムを記憶するための、メモリ１９３２を代表とするメモリ資源を含む。メモリ１９３２に記憶されたアプリケーションプログラムはそれぞれが１つの命令群に対応する一つ以上のモジュールを含んでもよい。また、処理コンポーネント１９２２は命令を実行することによって上記方法を実行するように構成される。

電子機器１９００はさらに、電子機器１９００の電源管理を実行するように構成された電源コンポーネント１９２６、電子機器１９００をネットワークに接続するように構成された有線または無線ネットワークインタフェース１９５０、および入出力（Ｉ／Ｏ）インタフェース１９５８を含んでもよい。電子機器１９００はメモリ１９３２に記憶されたオペレーティングシステム、例えばＷｉｎｄｏｗｓＳｅｒｖｅｒ^ＴＭ、ＭａｃＯＳＸ^ＴＭ、Ｕｎｉｘ^ＴＭ、Ｌｉｎｕｘ（登録商標）、ＦｒｅｅＢＳＤ^ＴＭまたは類似するものに基づいて動作できる。

例示的な実施例では、さらに、非揮発性コンピュータ読み取り可能記憶媒体、例えばコンピュータプログラム命令を含むメモリ１９３２が提供され、上記コンピュータプログラム命令は電子機器１９００の処理コンポーネント１９２２によって実行される時上記方法を実行することができる。

本開示はシステム、方法および／またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品はプロセッサに本開示の各態様を実現させるためのコンピュータ読み取り可能プログラム命令が有しているコンピュータ読み取り可能記憶媒体を含んでもよい。

コンピュータ読み取り可能記憶媒体は命令実行装置に使用される命令を保存および記憶可能な有形装置であってもよい。コンピュータ読み取り可能記憶媒体は例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置または上記の任意の適当な組み合わせであってもよいが、これらに限定されない。コンピュータ読み取り可能記憶媒体のさらに具体的な例（非網羅的リスト）としては、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュ）、静的ランダムアクセスメモリ（ＳＲＡＭ）、携帯型コンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリスティック、フロッピーディスク、例えば命令が記憶されているせん孔カードまたはスロット内突起構造のような機械的符号化装置、および上記の任意の適当な組み合わせを含む。ここで使用されるコンピュータ読み取り可能記憶媒体は瞬時信号自体、例えば無線電波または他の自由に伝播される電磁波、導波路または他の伝送媒体を経由して伝播される電磁波（例えば、光ファイバーケーブルを通過するパルス光）、または電線を経由して伝送される電気信号と解釈されるものではない。

ここで記述したコンピュータ読み取り可能プログラム命令はコンピュータ読み取り可能記憶媒体から各計算／処理機器にダウンロードされてもよいし、またはネットワーク、例えばインターネット、ローカルエリアネットワーク、広域ネットワークおよび／または無線ネットワークによって外部のコンピュータまたは外部記憶装置にダウンロードされてもよい。ネットワークは銅伝送ケーブル、光ファイバー伝送、無線伝送、ルーター、ファイアウォール、交換機、ゲートウェイコンピュータおよび／またはエッジサーバを含んでもよい。各計算／処理機器内のネットワークアダプタカードまたはネットワークインタフェースはネットワークからコンピュータ読み取り可能プログラム命令を受信し、該コンピュータ読み取り可能プログラム命令を転送し、各計算／処理機器内のコンピュータ読み取り可能記憶媒体に記憶させる。

本開示の動作を実行するためのコンピュータプログラム命令はアセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはＳｍａｌｌｔａｌｋ、Ｃ＋＋などのオブジェクト指向プログラミング言語、および「Ｃ」言語または類似するプログラミング言語などの一般的な手続き型プログラミング言語を含む一つ以上のプログラミング言語の任意の組み合わせで書かれたソースコードまたは目標コードであってもよい。コンピュータ読み取り可能プログラム命令は、完全にユーザのコンピュータにおいて実行されてもよく、部分的にユーザのコンピュータにおいて実行されてもよく、スタンドアロンソフトウェアパッケージとして実行されてもよく、部分的にユーザのコンピュータにおいてかつ部分的にリモートコンピュータにおいて実行されてもよく、または完全にリモートコンピュータもしくはサーバにおいて実行されてもよい。リモートコンピュータに関与する場合、リモートコンピュータは、ローカルエリアネットワーク（ＬＡＮ）または広域ネットワーク（ＷＡＮ）を含む任意の種類のネットワークを経由してユーザのコンピュータに接続されてもよく、または、（例えばインターネットサービスプロバイダを利用してインターネットを経由して）外部コンピュータに接続されてもよい。いくつかの実施例では、コンピュータ読み取り可能プログラム命令の状態情報を利用して、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）またはプログラマブル論理アレイ（ＰＬＡ）などの電子回路をパーソナライズし、該電子回路によりコンピュータ読み取り可能プログラム命令を実行するにより、本開示の各方面を実現するようにしてもよい。

なお、ここで本開示の実施例に係る方法、装置（システム）およびコンピュータプログラム製品のフローチャートおよび／またはブロック図を参照しながら本開示の各方面を説明したが、フローチャートおよび／またはブロック図の各ブロックおよびフローチャートおよび／またはブロック図の各ブロックの組み合わせは、いずれもコンピュータ読み取り可能プログラム命令によって実現できることを理解すべきである。

これらのコンピュータ読み取り可能プログラム命令は、汎用コンピュータ、専用コンピュータまたは他のプログラマブルデータ処理装置のプロセッサへ提供されて、これらの命令がコンピュータまたは他のプログラマブルデータ処理装置のプロセッサによって実行される時フローチャートおよび／またはブロック図の一つ以上のブロックにおいて指定された機能／動作を実現ように装置を製造してもよい。また、これらのコンピュータ読み取り可能プログラム命令は、コンピュータ読み取り可能記憶媒体に記憶し、コンピュータ、プログラマブルデータ処理装置および／または他の機器を特定の方式で動作させるようにしてもよい。命令を記憶しているコンピュータ読み取り可能記憶媒体に、フローチャートおよび／またはブロック図の一つ以上のブロックにおいて指定された機能／動作の各態様を実現するための命令を有する製品を含む。

コンピュータ読み取り可能プログラム命令は、コンピュータ、他のプログラマブルデータ処理装置、または他の機器にロードし、コンピュータ、他のプログラマブルデータ処理装置または他の機器に一連の動作ステップを実行させることにより、コンピュータにより実施なプロセスを生成し、コンピュータ、他のプログラマブルデータ処理装置、または他の機器において実行される命令によりフローチャートおよび／またはブロック図の一つ以上のブロックにおいて指定された機能／動作を実現する。

図面のうちフローチャートおよびブロック図は、本開示の複数の実施例に係るシステム、方法およびコンピュータプログラム製品の実現可能なシステムアーキテクチャ、機能および動作を示す。この点では、フローチャートまたはブロック図における各ブロックは一つのモジュール、プログラムセグメントまたは命令の一部分を代表することができ、前記モジュール、プログラムセグメントまたは命令の一部分は指定された論理機能を実現するための一つ以上の実行可能命令を含む。いくつかの代替としての実現形態では、ブロックに表記される機能は図面に付した順序と異なって実現してもよい。例えば、二つの連続的なブロックは実質的に同時に実行してもよく、また、係る機能によって、逆な順序で実行してもよい場合がある。なお、ブロック図および／またはフローチャートにおける各ブロック、およびブロック図および／またはフローチャートにおけるブロックの組み合わせは、指定される機能または動作を実行するハードウェアに基づく専用システムによって実現してもよいし、または専用ハードウェアとコンピュータ命令との組み合わせによって実現してもよいことにも注意すべきである。

以上、本開示の各実施例を記述したが、上記説明は例示的なものに過ぎず、網羅的なものではなく、かつ披露された各実施例に限定されるものでもない。当業者にとって、説明された各実施例の範囲および精神から逸脱することなく、様々な修正および変更が自明である。本明細書に選ばれた用語は、各実施例の原理、実際の適用または市場における技術への技術的改善を好適に解釈するか、または他の当業者に本明細書に披露された各実施例を理解させるためのものである。

Claims

飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得することと、
ニューラルネットワークによって前記複数の元画像に対して、少なくとも一回の畳み込み処理および少なくとも一回の非線形関数マッピング処理を含む最適化処理を実行し、前記複数の元画像に対応する深度マップを得ることと、を含むことを特徴とする画像処理方法。
ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、
ニューラルネットワークによって前記複数の元画像に最適化処理を行い、信号対雑音比が前記元画像よりも高い前記複数の元画像に対する複数の最適化画像を出力することと、
前記複数の最適化画像に後処理を行い、前記複数の元画像に対応する深度マップを得ることと、を含み、または、
ニューラルネットワークによって前記複数の元画像に最適化処理を行い、前記複数の元画像に対応する深度マップを出力することを含み、または、
前記複数の元画像をニューラルネットワークに入力して最適化処理を行い、前記複数の元画像に対応する深度マップを得ることを含むことを特徴とする請求項１に記載の方法。
前記複数の元画像に対して、画像キャリブレーション、画像補正、任意の二つの元画像間の線形処理、及び任意の二つの元画像間の非線形処理の少なくとも一つを含む前処理を実行し、前処理された前記複数の元画像を得ることをさらに、含み、
ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、
前処理された前記複数の元画像を前記ニューラルネットワークに入力して最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることを含むことを特徴とする請求項１または２に記載の方法。
前記ニューラルネットワークが実行する最適化処理は順に実行されるＱ個の最適化プロセス群を含み、各最適化プロセス群は少なくとも一回の畳み込み処理および／または少なくとも一回の非線形マッピング処理を含み、
ニューラルネットワークによって前記複数の元画像に最適化処理を実行することは、
前記複数の元画像を第一の最適化プロセス群の入力情報とし、前記第一の最適化プロセス群によって処理して前記第一の最適化プロセス群に対する最適化特徴行列を得ることと、
第ｎの最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行うか、または前のｎ個の最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行う（ｎは１よりも大きくかつＱよりも小さい整数である）ことと、
第Ｑの最適化プロセス群により処理された最適化特徴行列に基づき、出力結果を得ることと、を含むことを特徴とする請求項１から３のいずれか一項に記載の方法。
前記Ｑ個の最適化プロセス群は順に実行されるダウンサンプリング処理、残差処理およびアップサンプリング処理を含み、ニューラルネットワークによって前記複数の元画像に最適化処理を実行することは、
前記複数の元画像に前記ダウンサンプリング処理を実行し、前記複数の元画像の特徴情報を融合した第一特徴行列を得ることと、
前記第一特徴行列に前記残差処理を実行し、第二特徴行列を得ることと、
前記第二特徴行列に前記アップサンプリング処理を実行し、最適化特徴行列を得ることと、を含み、
前記ニューラルネットワークの出力結果は前記最適化特徴行列に基づいて得られることを特徴とする請求項４に記載の方法。
前記第二特徴行列に前記アップサンプリング処理を実行し、最適化特徴行列を得ることは、
前記ダウンサンプリング処理プロセスで得られた特徴行列により前記第二特徴行列に前記アップサンプリング処理を実行し、前記最適化特徴行列を得ることを含むことを特徴とする請求項５に記載の方法。
前記ニューラルネットワークは訓練サンプルセットによって訓練して得られ、前記訓練サンプルセットに含まれる複数の訓練サンプルのうちの各訓練サンプルは複数の第一サンプル画像、前記複数の第一サンプル画像に対応する複数の第二サンプル画像および前記複数の第二サンプル画像に対応する深度マップを含み、前記第二サンプル画像および対応する第一サンプル画像は同一対象に対する画像であり、かつ第二サンプル画像は前記第一サンプル画像よりも信号対雑音比が高く、
前記ニューラルネットワークは訓練によって得られた敵対的生成ネットワークのうちの生成ネットワークであり、
前記ニューラルネットワークのネットワーク損失値は第一ネットワーク損失と第二ネットワーク損失との加重和であり、
前記第一ネットワーク損失は前記ニューラルネットワークが前記訓練サンプルに含まれる複数の第一サンプル画像を処理することによって得た複数の予測最適化画像と、前記訓練サンプルに含まれる複数の第二サンプル画像との差異に基づいて得られ、
前記第二ネットワーク損失は前記複数の予測最適化画像に後処理を行うことによって得られた予測深度マップと、前記訓練サンプルに含まれる深度マップとの差異に基づいて得られることを特徴とする請求項１から６のいずれか一項に記載の方法。
飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得することと、
ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、前記複数の元画像に対応する深度マップを得ることと、を含み、
ニューラルネットワークは訓練サンプルセットによって訓練して得られ、前記訓練サンプルセットに含まれる複数の訓練サンプルのうちの各訓練サンプルは複数の第一サンプル画像、前記複数の第一サンプル画像に対応する複数の第二サンプル画像および前記複数の第二サンプル画像に対応する深度マップを含み、前記第二サンプル画像および対応する第一サンプル画像は同一対象に対する画像であり、かつ第二サンプル画像は対応する前記第一サンプル画像よりも信号対雑音比が高いことを特徴とする画像処理方法。
ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、
ニューラルネットワークによって前記複数の元画像に最適化処理を行い、信号対雑音比が前記元画像よりも高い前記複数の元画像に対する複数の最適化画像を出力することと、
前記複数の最適化画像に後処理を行い、前記複数の元画像に対応する深度マップを得ることと、を含み、または、
ニューラルネットワークによって前記複数の元画像に最適化処理を行い、前記複数の元画像に対応する深度マップを出力することを含み、または、
前記複数の元画像をニューラルネットワークに入力して最適化処理を行い、前記複数の元画像に対応する深度マップを得ることを含むことを特徴とする請求項８に記載の方法。
前記複数の元画像に対して、画像キャリブレーション、画像補正、任意の二つの元画像間の線形処理、及び任意の二つの元画像間の非線形処理の少なくとも一つを含む前処理を実行し、前処理された前記複数の元画像を得ることをさらに、含み、
ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることは、
前処理された前記複数の元画像を前記ニューラルネットワークに入力して最適化処理を実行し、複数の前記元画像に対応する深度マップを得ることを含むことを特徴とする請求項８又は９に記載の方法。
前記ニューラルネットワークが実行する最適化処理は順に実行されるＱ個の最適化プロセス群を含み、各最適化プロセス群は少なくとも一回の畳み込み処理および／または少なくとも一回の非線形マッピング処理を含み、
ニューラルネットワークによって前記複数の元画像に最適化処理を実行することは、
前記複数の元画像を第一の最適化プロセス群の入力情報とし、前記第一の最適化プロセス群によって処理して前記第一の最適化プロセス群に対する最適化特徴行列を得ることと、
第ｎの最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行うか、または前のｎ個の最適化プロセス群が出力した最適化特徴行列を第ｎ＋１の最適化プロセス群の入力情報として最適化処理を行う（ｎは１よりも大きくかつＱよりも小さい整数である）ことと、
第Ｑの最適化プロセス群により処理された最適化特徴行列に基づき、出力結果を得ることと、を含むことを特徴とする請求項８から１０のいずれか一項に記載の方法。
前記Ｑ個の最適化プロセス群は順に実行されるダウンサンプリング処理、残差処理およびアップサンプリング処理を含み、ニューラルネットワークによって前記複数の元画像に最適化処理を実行することは、
前記複数の元画像に前記ダウンサンプリング処理を実行し、前記複数の元画像の特徴情報を融合した第一特徴行列を得ることと、
前記第一特徴行列に前記残差処理を実行し、第二特徴行列を得ることと、
前記第二特徴行列に前記アップサンプリング処理を実行し、最適化特徴行列を得ることと、を含み、
前記ニューラルネットワークの出力結果は前記最適化特徴行列に基づいて得られることを特徴とする請求項１１に記載の方法。
前記第二特徴行列に前記アップサンプリング処理を実行し、最適化特徴行列を得ることは、
前記ダウンサンプリング処理プロセスで得られた特徴行列により前記第二特徴行列に前記アップサンプリング処理を実行し、前記最適化特徴行列を得ることを含むことを特徴とする請求項１２に記載の方法。
前記ニューラルネットワークは訓練によって得られた敵対的生成ネットワークのうちの生成ネットワークであり、
前記ニューラルネットワークのネットワーク損失値は第一ネットワーク損失と第二ネットワーク損失との加重和であり、
前記第一ネットワーク損失は前記ニューラルネットワークが前記訓練サンプルに含まれる複数の第一サンプル画像を処理することによって得た複数の予測最適化画像と、前記訓練サンプルに含まれる複数の第二サンプル画像との差異に基づいて得られ、
前記第二ネットワーク損失は前記複数の予測最適化画像に後処理を行うことによって得られた予測深度マップと、前記訓練サンプルに含まれる深度マップとの差異に基づいて得られることを特徴とする請求項８から１３のいずれか一項に記載の方法。
飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得するための取得モジュールと、
ニューラルネットワークによって前記複数の元画像に対して、少なくとも一回の畳み込み処理および少なくとも一回の非線形関数マッピング処理を含む最適化処理を実行し、前記複数の元画像に対応する深度マップを得るための最適化モジュールと、を含むことを特徴とする画像処理装置。
飛行時間ＴＯＦセンサによって１回の露光プロセスにおいて収集した、信号対雑音比が第一の値よりも低くかつ画像における同じ画素点に対応する位相パラメータ値が異なる複数の元画像を取得するための取得モジュールと、
ニューラルネットワークによって前記複数の元画像に最適化処理を実行し、前記複数の元画像に対応する深度マップを得るための最適化モジュールと、を含み、
ニューラルネットワークは訓練サンプルセットによって訓練して得られ、前記訓練サンプルセットに含まれる複数の訓練サンプルのうちの各訓練サンプルは複数の第一サンプル画像、前記複数の第一サンプル画像に対応する複数の第二サンプル画像および前記複数の第二サンプル画像に対応する深度マップを含み、前記第二サンプル画像および対応する第一サンプル画像は同一対象に対する画像であり、かつ第二サンプル画像は対応する前記第一サンプル画像よりも信号対雑音比が高いことを特徴とする画像処理装置。
プロセッサ、および
プロセッサにより実行可能な命令を記憶するためのメモリを含み、
前記プロセッサは、前記メモリ内の命令を呼び出して、請求項１から７のいずれか一項に記載の方法または請求項８から１４のいずれか一項に記載の方法を実行するように構成されることを特徴とする電子機器。
コンピュータプログラム命令が記憶されているコンピュータ読み取り可能記憶媒体であって、前記コンピュータプログラム命令はプロセッサに実行される時に請求項１から７のいずれか一項に記載の方法または請求項８から１４のいずれか一項に記載の方法を実現することを特徴とするコンピュータ読み取り可能記憶媒体。
コンピュータ読み取り可能コードを含み、前記コンピュータ読み取り可能コードが電子機器において運用される時、前記電子機器内のプロセッサに請求項１から７のいずれか一項に記載の方法または８から１４のいずれか一項に記載の方法を実行させることを特徴とするコンピュータプログラム。