WO2022201804A1

WO2022201804A1 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: WO2022201804A1
Application number: PCT/JP2022/001919
Authority: WO
Inventors: 英史山田; 達治芦谷
Original assignee: ソニーセミコンダクタソリューションズ株式会社
Priority date: 2021-03-25
Filing date: 2022-01-20
Publication date: 2022-09-29
Also published as: CN117099129A; JPWO2022201804A1

Abstract

本開示は、センサの視野に起因した補正対象画素を補正することができるようにする情報処理装置、情報処理方法、及びプログラムに関する。第１のセンサにより取得された対象物を深度情報で示した第１の画像、第２のセンサにより取得された対象物を深度情報で示した第２の画像、第１の画像と第２の画像から得られる第３の画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行い、いずれかの画像に含まれる補正対象画素を補正する処理部を備える情報処理装置が提供される。本開示は、例えば、複数のデプスセンサを有する機器に適用することができる。

Description

情報処理装置、情報処理方法、及びプログラム

　本開示は、情報処理装置、情報処理方法、及びプログラムに関し、特に、センサの視野に起因した補正対象画素を補正することができるようにした情報処理装置、情報処理方法、及びプログラムに関する。

　複数のデプスセンサにより得られたデプス画像を連結して、より広角なデプス画像を生成する技術がある。

　特許文献１には、深度マップの品質を向上させるために、深度測定データ内の欠陥画素を検出し、検出した欠陥画素の深度修正を定義し、検出した欠陥画素の深度測定データに深度修正を適用する技術が開示されている。

特表2014-524016号公報

　複数のデプスセンサを、視野が所定の関係を有するように配置して様々なデプス画像を生成するに際して、処理対象となるデプス画像に、センサの視野に起因して欠陥画素等の補正対象画素が含まれる場合があり、センサの視野に起因した補正対象画素を補正することが求められる。

　本開示はこのような状況に鑑みてなされたものであり、センサの視野に起因した補正対象画素を補正することができるようにするものである。

　本開示の第１の側面の情報処理装置は、第１のセンサにより取得された対象物を深度情報で示した第１の画像、第２のセンサにより取得された対象物を深度情報で示した第２の画像、前記第１の画像と前記第２の画像から得られる第３の画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行い、いずれかの画像に含まれる補正対象画素を補正する処理部を備える情報処理装置である。

　本開示の第１の側面の情報処理方法、及びプログラムは、上述した本開示の第１の側面の情報処理装置に対応する情報処理方法、及びプログラムである。

　本開示の第１の側面の情報処理装置、情報処理方法、及びプログラムにおいては、第１のセンサにより取得された対象物を深度情報で示した第１の画像、第２のセンサにより取得された対象物を深度情報で示した第２の画像、前記第１の画像と前記第２の画像から得られる第３の画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理が行われ、いずれかの画像に含まれる補正対象画素が補正される。

　本開示の第２の側面の情報処理装置は、第１の光源と第２の光源を有するセンサにより取得された対象物を深度情報で示した画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行う処理部を備え、前記第１の光源と前記第２の光源は、光の照射領域が重なるように配置されており、前記処理部は、前記画像における前記照射領域の重複部分に対応した位置を、画素補正位置として特定し、前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する情報処理装置である。

　本開示の第２の側面の情報処理方法、及びプログラムは、上述した本開示の第２の側面の情報処理装置に対応する情報処理方法、及びプログラムである。

　本開示の第２の側面の情報処理装置、情報処理方法、及びプログラムにおいては、光の照射領域が重なるように配置された第１の光源と第２の光源を有するセンサにより取得された対象物を深度情報で示した画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理が行われ、前記画像における前記照射領域の重複部分に対応した位置が、画素補正位置として特定され、前記学習済みモデルを用いて、前記画素補正位置の深度情報が補正される。

　なお、本開示の第１の側面及び第２の側面の情報処理装置は、独立した装置であってもよいし、１つの装置を構成している内部ブロックであってもよい。

本開示を適用した測距装置の構成例を示す図である。２つのデプスセンサの視野の重複部分の補正について説明する図である。教師あり学習を用いた場合における学習装置と推論部の構成例を示す図である。補正処理の流れを説明するフローチャートである。２つのデプスセンサの視野の隙間部分の補正について説明する図である。視野が異なる２つのデプスセンサの視野の重複部分の補正について説明する図である。１つのデプスセンサが有する複数の光源の照射領域の重複部分の補正について説明する図である。本開示を適用した測距装置の他の構成の第１の例を示す図である。本開示を適用した測距装置の他の構成の第２の例を示す図である。本開示を適用した測距装置の他の構成の第３の例を示す図である。本開示を適用した測距装置の他の構成の第４の例を示す図である。ＡＩ処理を行う装置を含むシステムの構成例を示す図である。電子機器の構成例を示すブロック図である。エッジサーバ又はクラウドサーバの構成例を示すブロック図である。光センサの構成例を示すブロック図である。処理部の構成例を示すブロック図である。複数の装置間でのデータの流れを示す図である。

＜１．本開示の実施の形態＞

（装置の構成例）
　図１は、本開示を適用した測距装置の構成例を示す図である。

　図１において、測距装置１０は、デプスセンサ１１－１、デプスセンサ１１－２、測距演算部１２－１、測距演算部１２－２、スティッチング処理部１３、及び距離補正部１４から構成される。測距装置１０において、デプスセンサ１１－１とデプスセンサ１１－２は、視野（FoV：Fields of View）に重なりを持つように配置される。

　デプスセンサ１１－１は、ToFセンサなどの測距センサである。例えば、ToFセンサでは、光源から照射された光が対象物で反射して受光素子（受光部）で受光するまでの時間を計測し、既知である光の速度を元に距離を算出する。ToFセンサは、dToF(direct Time of Flight)方式とiToF(indirect Time of Flight)方式のいずれの方式であってもよい。

　なお、デプスセンサ１１－１としては、ストラクチャライト方式のセンサ、LiDAR(Light Detection and Ranging)方式のセンサ、ステレオカメラなどを用いてもよい。デプスセンサ１１－１は、対象物を測定し、その結果得られるRAWデータを測距演算部１２－１に供給する。

　測距演算部１２－１は、測距キャリブレーションパラメータに基づいて、デプスセンサ１１－１から供給されるRAWデータを用いた測距演算を行い、その結果得られる対象物までの距離に関する距離データをスティッチング処理部１３に供給する。測距演算部１２－１は、デプスセンサ１１－１内に設けられてもよい。

　デプスセンサ１１－２は、ToFセンサなどの測距センサである。デプスセンサ１１－２は、対象物を測定し、その結果得られるRAWデータを測距演算部１２－２に供給する。

　測距演算部１２－２は、測距キャリブレーションパラメータに基づいて、デプスセンサ１１－２から供給されるRAWデータを用いた測距演算を行い、その結果得られる対象物までの距離に関する距離データをスティッチング処理部１３に供給する。測距演算部１２－２は、デプスセンサ１１－２内に設けられてもよい。

　測距キャリブレーションパラメータは、例えば、オフセット、サイクリックエラー、ディストーション、温度補正などに関するパラメータを含む。測距演算部１２－１と測距演算部１２－２では、測距キャリブレーションパラメータのうち、必要なパラメータを適宜用いることができる。

　スティッチング処理部１３には、測距演算部１２－１からの距離データと、測距演算部１２－２からの距離データが供給される。スティッチング処理部１３は、内部・外部キャリブレーションパラメータに基づいて、距離データを結合する結合処理を行い、その結果得られる結合後距離データを、距離補正部１４に供給する。

　例えば、スティッチング処理部１３では、距離データとして、各デプスセンサの信号から得られたデプス画像がそれぞれ供給され、それらのデプス画像を連結する処理が行われることで、結合後距離データとして、２枚のデプス画像を連結した広角デプス画像が生成される。デプス画像は、対象物を深度情報で示した画像である。広角デプス画像は、複数枚のデプス画像を連結することで、１枚のデプス画像と比べてより広角となったデプス画像である。

　内部・外部キャリブレーションパラメータは、内部キャリブレーションに用いられるレンズ歪みなどに関するパラメータと、外部キャリブレーションに用いられるカメラ姿勢などに関するパラメータとを含む。スティッチング処理部１３では、内部・外部キャリブレーションパラメータのうち、必要なパラメータを適宜用いることができる。

　距離補正部１４は、重複部情報に基づいて、スティッチング処理部１３から供給される結合後距離データを補正する補正処理を行い、その結果得られる補正後の結合後距離データを出力する。重複部情報は、重複する画素のマップなどの情報を含む。距離補正部１４では、重複部情報に含まれる情報のうち、必要な情報を適宜用いることができる。補正後の結合後距離データとしては、ポイントクラウド等のデータが出力される。

　距離補正部１４は、補正処理を行うに際して、結合後距離データの少なくとも一部に機械学習により学習された学習済みモデル（学習モデル）を用いた処理を行い、結合後距離データを補正する。例えば、距離補正部１４では、欠陥がある広角デプス画像に対し、機械学習により学習された学習済みモデル（学習モデル）を用いた処理を行うことで、欠陥を補正済みの広角デプス画像が生成される。

　以上のように構成される測距装置１０においては、デプスセンサ１１－１とデプスセンサ１１－２の２つのデプスセンサを、視野（FoV）に重なりを持つように配置して、対象物を測定することで得られる２枚のデプス画像を連結することで、より広角なデプス画像を生成することができる。

　このとき、デプスセンサ１１－１とデプスセンサ１１－２の視野の重なり部分により、例えば、次のような影響がある。

　すなわち、一方のデプスセンサの光源からの光に対し、他方のデプスセンサの光源からの光が入ってしまうことで、光源の相互干渉が発生して悪影響を及ぼす可能性がある。これは、光源が複数になることで、マルチパスのパターンが増えることに起因している。また、視野の重なり部分に対応した各デプス画像の領域、つまり、画像端は、レンズの歪みやその補正が不十分なことで劣化する可能性が高い。

　デプスセンサ１１－１とデプスセンサ１１－２のそれぞれの光源により光が照射されるため、視野の重なり部分では、二重の露光によってデプス値が異常な値になってしまう。さらに、一方のデプスセンサの光源から光を照射していたが、途中から、他方のデプスセンサの光源からも光が照射されてしまうと、コンフィデンス値が異常な値になってしまう。デプスセンサ内の受光素子（受光部）には受光可能なレンジがあるが、デプスセンサ１１－１とデプスセンサ１１－２から同時に光が照射されると、そのレンジを超えて飽和してしまう恐れがある。

　図２は、デプスセンサ１１－１の視野に対するデプスセンサ１１－２の視野の重複部分を示している。図２においては、デプスセンサ１１－１の視野FoV_１を一点鎖線で示し、デプスセンサ１１－２の視野FoV_２を二点鎖線で示すとともに、視野FoV_１に対する視野FoV_２の重複部分Ｏをドットの模様で示している。

　この重複部分Ｏでは、デプスセンサ１１－１とデプスセンサ１１－２の２つのデプスセンサの光源のそれぞれから光が照射されることや、各デプスセンサから得られるデプス画像の画像端が劣化することなどにより、デプス画像に対する様々な影響があることは先に述べた通りである。

　そこで、本開示に係る技術では、このような視野の重複部分に起因して欠陥を含む広角デプス画像を補正して、欠陥のない広角デプス画像が得られるようにする。欠陥がある広角デプス画像を補正するに際しては、広角デプス画像の少なくとも一部に機械学習により学習された学習済みモデル（学習モデル）を用いた処理が行われる。

（学習モデルを用いた処理）
　図１の距離補正部１４では、欠陥を含む広角デプス画像の少なくとも一部に学習済みモデル（学習モデル）を用いた処理が行われる。図３は、教師あり学習を用いた場合における学習時の処理を行う学習装置と、推論時の処理を行う推論部の構成例を示している。

　図３においては、上段に、学習時の処理を行う学習装置２００を示し、下段に、推論時の処理を行う推論部１１１が示されている。推論部１１１は、図１の距離補正部１４に含まれる。

　図３において、学習装置２００は、学習モデル２２１を有する。学習モデル２２１は、デプス値に欠陥がある広角デプス画像とその欠陥画素の位置を示した画素位置情報（欠陥画素位置情報）を入力とし、広角デプス画像を出力するニューラルネットワーク（NN：Neural Network）による機械学習を行うモデルである。

　例えば、学習モデル２２１では、デプス値に欠陥がある広角デプス画像と、欠陥画素の位置を示した画素位置情報（欠陥画素位置情報）を学習データとし、欠陥画素位置（を含む領域）の補正に関する情報を教師データとした学習を繰り返すことで、その出力として欠陥を補正済みの広角デプス画像を出力することができるようになる。例えば、欠陥を補正済みの広角デプス画像は、２つのデプスセンサの視野の重複部分に起因した欠陥が補正された広角デプス画像である。ニューラルネットワークとしては、例えば、DNN(Deep Neural Network)やオートエンコーダなどを用いることができる。

　このようにして学習時に機械学習により学習した学習モデル２２１を、学習済みモデルとして推論時に用いることができる。

　図３において、推論部１１１は、学習モデル１２１を有する。学習モデル１２１は、学習時に機械学習により学習することで学習済みとなった学習モデル２２１に対応している。

　学習モデル１２１は、デプス値に欠陥がある広角デプス画像と欠陥画素位置情報を入力とした推論を行うことで、欠陥を補正済みの広角デプス画像を出力する。ここで、デプス値に欠陥がある広角デプス画像は、デプスセンサ１１－１とデプスセンサ１１－２の２つのデプスセンサによる測定データとしての２枚のデプス画像を連結することで生成された広角デプス画像である。つまり、広角デプス画像の欠陥は、２つのデプスセンサの視野の重複部分に起因している。また、欠陥画素位置情報は、広角デプス画像から特定される欠陥画素の位置に関する情報である。

　なお、教師あり学習として、他の機械学習を行ってもよい。例えば、学習時において、学習モデル２２１の出力として欠陥を補正済みの画素位置に関する情報が出力されるように学習することで、推論時において、学習モデル１２１では、デプス値に欠陥がある広角デプス画像と欠陥画素位置情報を入力とした推論を行い、欠陥を補正済みの画素位置に関する情報を出力するようにしてもよい。

　また、教師なし学習により、学習モデルを生成しても構わない。例えば、欠陥がない広角デプス画像を入力としてニューラルネットワークにより機械学習を行う学習モデルを用いて、当該学習モデルが、欠陥がある広角デプス画像を知らずに教師なし学習を繰り返すことで、その出力として、欠陥が消えている広角デプス画像を出力するようになる。このようにして教師なし学習により学習済みとなった学習モデルを推論時に用いて、デプス値に欠陥がある広角デプス画像を入力とした推論を行うことで、欠陥を補正済みの広角デプス画像を出力することができる。

（補正処理）
　次に、図４のフローチャートを参照して、距離補正部１４における補正処理の流れを説明する。

　ステップＳ１０１において、スティッチング処理部１３は、２枚のデプス画像を連結して、広角デプス画像を生成する。

　ステップＳ１０２において、距離補正部１４は、広角デプス画像に含まれる全てのD画素を処理したかどうかを判定する。ここでは、広角デプス画像に含まれる画素をD画素と呼んでいる。

　ステップＳ１０２において、全てのD画素を処理していないと判定された場合、処理はステップＳ１０３に進められる。ステップＳ１０３において、距離補正部１４は、処理対象のD画素についてデプス値と画素位置(x, y)を取得する。

　ステップＳ１０４において、距離補正部１４は、取得した処理対象のD画素のデプス値が有効なデプス値であるかどうかを判定する。

　ステップＳ１０４において、処理対象のD画素のデプス値が有効なデプス値ではないと判定された場合、処理はステップＳ１０５に進められる。ステップＳ１０５において、距離補正部１４は、デプス値が有効でないD画素の画素位置(x, y)を、画素補正位置(x, y)として取得する。

　ステップＳ１０５の処理が終了すると、処理はステップＳ１０２に戻る。また、ステップＳ１０４において、処理対象のD画素のデプス値が有効なデプス値であると判定された場合には、ステップＳ１０５の処理はスキップされ、処理はステップＳ１０２に戻る。

　上述した処理が繰り返されて、ステップＳ１０２において、全てのD画素を処理したと判定された場合、処理はステップＳ１０６に進められる。すなわち、全てのD画素を処理したときに、広角デプス画像において、２つのデプスセンサの視野の重複部分に起因してデプス値が正常でないD画素の画素位置(x, y)が、画素補正位置(x, y)として全て特定される。

　ステップＳ１０６において、距離補正部１４は、広角デプス画像にて補正が必要なデプス値があるかどうかを判定する。

　ステップＳ１０６において、広角デプス画像にて補正が必要なデプス値があると判定された場合、処理はステップＳ１０７に進められる。ここでは、ステップＳ１０２乃至Ｓ１０５の処理が繰り返されることで、デプス値が正常でないD画素の画素補正位置(x, y)が特定されているとき、補正が必要なデプス値があると判定される。

　ステップＳ１０７において、距離補正部１４は、デプス値が正常でないD画素の画素補正位置(x, y)に基づいて、画素補正位置情報を生成する。この画素補正位置情報は、デプス値の補正が必要なD画素を、補正する必要がある画素（欠陥画素）であるとして、その画素位置を特定するための情報（座標(x, y)）を含んでいる。

　ステップＳ１０８において、距離補正部１４の推論部１１１（図３）は、学習モデル１２１を用いて、デプス値に欠陥がある広角デプス画像と画素補正位置情報を入力として推論を行い、欠陥を補正済みの広角デプス画像を生成する。学習モデル１２１は、学習時に、デプス値に欠陥がある広角デプス画像と欠陥画素位置情報を入力としてニューラルネットワークによる学習を行った学習済みモデルであって、欠陥を補正済みの広角デプス画像を出力することができる。

　なお、ここでは、学習モデル１２１（図３）を用いた場合を示したが、デプス値に欠陥がある広角デプス画像を入力とした推論を行うことで欠陥を補正済みの広角デプス画像を出力する学習モデルなどの他の学習済みモデルを用いても構わない。

　ステップＳ１０８の処理が終了すると、一連の処理は終了する。また、ステップＳ１０６において、広角デプス画像にて補正が必要なデプス値がないと判定された場合、欠陥がない広角デプス画像（完全な広角デプス画像）が生成されて補正する必要がないため、ステップＳ１０７，Ｓ１０８の処理がスキップされ、一連の処理は終了する。

　以上、補正処理の流れを説明した。この補正処理では、２つのデプスセンサの視野の重複部分に起因してデプス値に欠陥を含む広角デプス画像におけるデプス値が正常でないD画素の画素位置（画素補正位置）が特定され、デプス値に欠陥がある広角デプス画像と画素補正位置情報を入力として学習モデル１２１を用いた推論が行われることで、欠陥を含む広角デプス画像が補正される。これにより、２枚のデプス画像を連結した広角デプス画像において、２つのデプスセンサの視野の重複部分に対応する欠陥を含む領域が補正される。

（隙間部分の補正）
　上述した説明では、２つのデプスセンサの視野が重複している場合にその重複部分に対応する領域を含む広角デプス画像を補正する場合を示したが、デプスセンサ１１－１とデプスセンサ１１－２とで視野が重なりを持たない（視野が離れている）場合に、各デプスセンサから得られる２枚のデプス画像の隙間部分に対応する領域を補正するようにしてもよい。

　図５は、デプスセンサ１１－１の視野とデプスセンサ１１－２の視野との隙間部分を示している。図５においては、デプスセンサ１１－１の視野FoV_１を一点鎖線で示し、デプスセンサ１１－２の視野FoV_２を二点鎖線で示すとともに、視野FoV_１と視野FoV_２との隙間部分Ｇをドットの模様で示している。

　この場合において、各デプスセンサから得られる２枚のデプス画像を結合して広角デプス画像を生成した場合、２つのデプスセンサの視野の隙間部分Ｇに起因してデプス値に欠陥を含む広角デプス画像が生成されることになる。そこで、本開示に係る技術では、このような視野の隙間部分に起因して欠陥を含む広角デプス画像を補正して、欠陥のない広角デプス画像が得られるようにする。ここで、欠陥がある広角デプス画像を補正するに際しては、広角デプス画像の少なくとも一部に機械学習により学習された学習済みモデル（学習モデル）を用いた処理が行われる。

　ここでの補正処理としては、図４に示した補正処理と同様の処理が行われる。すなわち、図４に示した補正処理では、画素補正位置(x, y)として、２つのデプスセンサの視野の重複部分に起因してデプス値が正常でないD画素の画素位置(x, y)が特定される場合を説明したが、ここでは、２つのデプスセンサの視野の隙間部分に起因してデプス値が割り当てられていないD画素の画素位置(x, y)が特定される。

　そして、デプス値に欠陥がある広角デプス画像と画素補正位置情報を入力として学習モデルを用いた推論が行われることで、欠陥を含む広角デプス画像が補正される。これにより、欠陥を含む広角デプス画像において、２つのデプスセンサの視野の隙間部分に対応する領域が補正される。ここで用いられる学習モデルは、デプス値に欠陥がある広角デプス画像と画素補正位置情報を入力とした学習によって、視野の隙間部分に起因したデプス値の欠陥を補正済みの広角デプス画像を出力するようになった学習済みモデルであって、例えば、視野の異なる複数のデプス画像から隙間部分に対応した領域を類推するように学習されている。

　このように、デプスセンサ１１－１とデプスセンサ１１－２とで視野が重なりを持たない場合でも、欠陥がない広角デプス画像（連結部分が補間された広角デプス画像）を生成することができる。また、２つのデプスセンサの視野が重なりを持たないことから、各デプスセンサでは、受光素子が受光可能なレンジを超えて飽和することを避けることができる。さらに、２つのデプスセンサの視野に重複部分がある場合には、アイセーフの目的で、重複部分にて限度を超えないように光源を設定するため、重複部分以外の領域が暗く照らされてしまうが、２つのデプスセンサの視野に隙間部分がある場合には、そのような光源を絞ることは不要であり、一部の領域が暗く照らされることを回避することができる。

（異なる視野の重複部分の補正）
　上述した説明では、２つのデプスセンサの視野が際（境目の領域）で重複している場合を示したが、広角と望遠などの異なる視野を有する２つのデプスセンサの視野が重なるように配置される場合に、それらのデプスセンサの視野の重複部分に起因して欠陥を含むデプス画像を補正するようにしてもよい。

　図６は、広角側のデプスセンサ１１－１の視野と、望遠側のデプスセンサ１１－２の視野との重複部分を示している。図６においては、広角側のデプスセンサ１１－１の視野FoV_１を一点鎖線で示し、望遠側のデプスセンサ１１－２の視野FoV_２を二点鎖線で示すとともに、視野FoV_１に対する視野FoV_２の重複部分Ｏをドットの模様で示している。

　この場合において、各デプスセンサから得られる２枚のデプス画像を結合してデプス画像を新たに生成した場合、２つのデプスセンサの視野の重複部分Ｏに起因してデプス値に欠陥を含むデプス画像が生成される可能性がある。つまり、重複部分Ｏでは、各デプスセンサの光源により二重に露光がなされることで、デプス値が異常な値となる恐れがある。そこで、本開示に係る技術では、このようなデプスセンサの視野の重複部分に起因して欠陥を含むデプス画像を補正して、欠陥がないデプス画像が得られるようにする。

　ここで、デプス値に欠陥があるデプス画像を補正するに際しては、上述した説明と同様にして、デプス画像の少なくとも一部に機械学習により学習された学習済みモデル（学習モデル）を用いた処理が行われる。ここでは、学習モデルとして、デプス値に欠陥があるデプス画像と画素補正位置情報を入力とした学習によって、視野の重複部分に起因したデプス値の欠陥を補正済みのデプス画像を出力するようになった学習済みモデルを用いることができる。

　このように、デプスセンサ１１－１とデプスセンサ１１－２とが、広角と望遠などの異なる視野を有してそれらの視野が重なるように配置された場合でも、欠陥がないデプス画像を生成することができる。例えば、広角と望遠に対応したデプスセンサを組み合わせた場合に、各デプスセンサからのデプス画像を結合して得られるデプス画像の一部に学習モデルを用いた補正処理を行い、欠陥がないデプス画像を生成することで、デプス測距範囲（装置から見て手前から奥に向かう方向の測距範囲）を拡大させることができる。

（複数の光源を有する場合の重複部分の補正）
　１つのデプスセンサが複数の光源を有して、複数の光源による光の照射領域が重なるように配置される場合にも、光源の照射領域の重複部分に起因してデプス画像が欠陥を含むことが想定される。

　図７は、１つのデプスセンサ１１に対し、光源ＬＳ１と光源ＬＳ２の２つの光源が設けられる場合に、光源ＬＳ１による光の照射領域と光源ＬＳ２による光の照射領域との重複部分を示している。図７においては、光源ＬＳ１から照射される光Ｌ_１を一点鎖線で示し、光源ＬＳ２から照射される光Ｌ_２を二点鎖線で示すとともに、光源ＬＳ１と光源ＬＳ２の照射領域の重複部分Ｏをドットの模様で示している。光源による光の照射領域は、いわば光源の視野に対応した領域であり、図７では、光源ＬＳ１の視野と光源ＬＳ２の視野とが重複しているとも言える。

　この場合において、デプスセンサ１１がデプス画像を生成するとき、２つの光源の照射領域の重複部分Ｏに起因してデプス値に欠陥を含むデプス画像が生成される可能性がある。そこで、本開示に係る技術では、このような光源の照射領域の重複部分に起因して欠陥を含むデプス画像を補正して、欠陥がないデプス画像が得られるようにする。ここで、欠陥があるデプス画像を補正するに際しては、上述した説明と同様にして、デプス画像の少なくとも一部に機械学習により学習された学習済みモデル（学習モデル）を用いた処理が行われる。

　ここで、図４のフローチャートの処理に当てはめて、具体的に説明すれば、ステップＳ１０１の連結処理を行わずに、１つのデプスセンサ１１により取得された１枚のデプス画像（広角デプス画像）に対して、ステップＳ１０２以降の処理を行えばよい。ただし、ステップＳ１０８の推論処理で用いられる学習モデルは、デプス値に欠陥があるデプス画像と画素補正位置情報を入力とした学習によって、光源の照射領域の重なりに起因したデプス値の欠陥を補正済みのデプス画像を出力するようになった学習済みモデルを用いることができる。

＜２．変形例＞

（他の構成例）
　図１に示した構成では、距離補正部１４が、学習モデル１２１を用いて、結合後距離データとしての広角デプス画像に対する補正処理を行う構成を示したが、測距演算処理、スティッチング処理、及び距離補正処理を含む処理の少なくとも一部の処理で、機械学習により学習された学習済みモデル（学習モデル）を用いた処理を行うことができる。

（Ａ）第１の構成例
　図８は、２枚のデプス画像に対し、学習モデルを用いて補正処理を行う場合の構成例を示している。

　図８において、測距装置２０は、図１の測距装置１０と比べて、スティッチング処理部１３、及び距離補正部１４の代わりに、距離補正部２１－１、距離補正部２１－２、及びスティッチング処理部２２が設けられている。なお、図８において、図１と対応する箇所には同一の符号を付してあり、その説明は省略する。

　距離補正部２１－１は、重複部情報に基づいて、測距演算部１２－１から供給される距離データを補正する補正処理を行い、その結果得られる補正後距離データをスティッチング処理部２２に供給する。すなわち、距離補正部２１－１では、距離データとしてのデプス画像を補正（重なり部分を補正）するに際して、学習モデルを用いて、デプス値に欠陥があるデプス画像と画素補正位置情報を入力として推論を行い、欠陥を補正済みのデプス画像を生成する。

　距離補正部２１－２は、重複部情報に基づいて、測距演算部１２－２から供給される距離データを補正する補正処理を行い、その結果得られる補正後距離データをスティッチング処理部２２に供給する。距離補正部２１－２では、距離補正部２１－１と同様に、学習モデルを用いて、欠陥を補正済みのデプス画像が生成される。

　スティッチング処理部２２には、距離補正部２１－１からの補正後距離データと、距離補正部２１－２からの補正後距離データが供給される。スティッチング処理部２２は、内部・外部キャリブレーションパラメータに基づいて、補正後距離データを結合する結合処理を行い、その結果得られる結合後距離データを出力する。すなわち、スティッチング処理部２２では、補正後距離データとして供給される２枚の補正済みのデプス画像を連結する処理が行われ、欠陥がない広角デプス画像が生成される。

　距離補正部２１－１と距離補正部２１－２により行われる補正処理を、上述した図４のフローチャートの処理に当てはめれば、次のようになる。すなわち、ステップＳ１０１の連結処理を行わずに、２枚のデプス画像のそれぞれに対して、ステップＳ１０２以降の処理を行えばよい。ただし、ステップＳ１０８の推論処理で用いられる学習モデルは、学習時に、デプス値に欠陥があるデプス画像と画素補正位置情報を入力とした学習を繰り返した学習済みのモデルであり、視野の重複部分や隙間部分等に起因したデプス値の欠陥を補正済みのデプス画像を出力することができる。そして、補正済みの２枚のデプス画像を結合して広角デプス画像が生成される。

（Ｂ）第２の構成例
　図９は、学習モデルを用いて、距離補正処理とスティッチング処理を一体的に行う場合の構成を示している。

　図９において、測距装置３０は、図１の測距装置１０と比べて、スティッチング処理部１３、及び距離補正部１４の代わりに、距離補正・スティッチング処理部３１が設けられている。なお、図９において、図１と対応する箇所には同一の符号を付してあり、その説明は省略する。

　距離補正・スティッチング処理部３１には、測距演算部１２－１からの距離データと、測距演算部１２－２からの距離データが供給される。距離補正・スティッチング処理部３１は、重複部情報及び内部・外部キャリブレーションパラメータに基づいて、２つの距離データから、欠陥が補正された結合後の距離データを生成する処理を行い、その結果得られる結合後距離データを出力する。

　すなわち、距離補正・スティッチング処理部３１では、結合後距離データとしての補正済みの広角デプス画像を生成するに際し、学習モデルを用いて、２枚のデプス画像を入力として推論を行うことで、補正済みの広角デプス画像を生成する。この推論処理に用いられる学習モデルは、例えば、学習時に、デプス値に欠陥があるデプス画像などを入力とした学習を繰り返した学習済みのモデルであり、視野の重複部分や隙間部分等に起因したデプス値の欠陥を補正済みの広角デプス画像を出力することができる。

（Ｃ）第３の構成例
　図１０は、学習モデルを用いて、測距演算処理と距離補正処理とスティッチング処理を一体的に行う場合の構成を示している。

　図１０において、測距装置４０は、図１の測距装置１０と比べて、測距演算部１２－１、測距演算部１２－２、スティッチング処理部１３、及び距離補正部１４の代わりに、測距演算・距離補正・スティッチング処理部４１が設けられている。なお、図１０において、図１と対応する箇所には同一の符号を付してあり、その説明は省略する。

　測距演算・距離補正・スティッチング処理部４１には、デプスセンサ１１－１からのRAWデータと、デプスセンサ１１－２からのRAWデータが供給される。測距演算・距離補正・スティッチング処理部４１は、測距キャリブレーションパラメータ、重複部情報、及び内部・外部キャリブレーションパラメータに基づいて、２つのRAWデータから、欠陥が補正された結合後の距離データを生成する処理を行い、その結果得られる結合後距離データを出力する。

　すなわち、測距演算・距離補正・スティッチング処理部４１では、結合後距離データとしての補正済みの広角デプス画像を生成するに際し、学習モデルを用いて、２つのRAWデータを入力として推論を行うことで、補正済みの広角デプス画像を生成する。この推論処理に用いられる学習モデルは、例えば、学習時に、欠陥を含むRAWデータなどを入力とした学習を繰り返した学習済みのモデルであり、視野の重複部分や隙間部分等に起因したデプス値の欠陥を補正済みの広角デプス画像を出力することができる。

（さらに他の構成例）
　図１１は、デプスセンサが光源を含む場合に、光源と受光素子の同期を行う場合の構成例を示している。

　図１１において、測距装置５０は、図１の測距装置１０と比べて、タイミング制御部５１が新たに追加されている。また、デプスセンサ１１－１内の光源と受光素子のうち、光源を光源５２－１として図示している。同様に、デプスセンサ１１－２内の光源５２－２を図示している。なお、図１１において、図１と対応する箇所には同一の符号を付してあり、その説明は省略する。

　タイミング制御部５１は、制御信号を生成し、デプスセンサ１１－１とデプスセンサ１１－２にそれぞれ供給する。デプスセンサ１１－１では、タイミング制御部５１からの制御信号に従い、対象物Ｓに光を照射する光源５２－１と、対象物Ｓから反射した光を受光する受光素子とが同期して動作する。デプスセンサ１１－２では、タイミング制御部５１からの制御信号に従い、対象物Ｓに光を照射する光源５２－２と、対象物Ｓから反射した光を受光する受光素子とが同期して動作する。

（視野の重なりによる劣化を抑制する手法）
　上述した説明では、デプスセンサの視野の重なりに起因する画像の欠陥を、機械学習により学習された学習済みのモデル（学習モデル）を用いて補正したが、例えば、下記に示した視野の重なりによる画像の劣化を抑制する手法を組み合わせることで、より欠陥の少ない画像を生成することができる。

　すなわち、視野の重なりによる画像の劣化を抑制する手法としては、デプスセンサ１１－１とデプスセンサ１１－２における光源とバンドパスフィルタの波長を異ならせる手法がある。また、デプスセンサ１１－１とデプスセンサ１１－２における光源をドットパターンとする手法を用いることで、視野が重複する確率を減らすことができる。さらに、RAWフレーム撮影レベルのデッドタイム（Dead Time）を利用して、デプスセンサ１１－１とデプスセンサ１１－２とで交互に同期した測定（撮影）を行う手法がある。このように交互に同期した測定を行うことで、時間的に視野を重複しないようにすることができる。

　また、デプスセンサ１１－１の光源とデプスセンサ１１－２の光源との間で変調パターンや変調周波数などを変えて測定（撮影）を行う手法がある。光源間で変調パターンを変えて測定を行う場合には、干渉を回避するために、光源の変調パターンを同期して重複しないように制御する。光源間で変調周波数を変えて測定を行う場合には、デュアル周波数（Dual Frequency）などの測定（撮影）パターンが時間的に重複しないように制御する。さらに、デプスセンサ１１－１とデプスセンサ１１－２において、光源と受光素子の間で露光タイミングをシフトして測定（撮影）を行う手法がある。このように露光タイミングをシフトして測定を行うことで、時間的に視野を重複しないようにすることができる。

　なお、ここで述べた視野の重なりによる画像の劣化を抑制する手法は、推論時における学習モデルを用いた補正と組み合わせるだけでなく、単独で用いても構わない。視野の重なりによる画像の劣化を抑制する手法を単独で用いた場合でも、視野の重なりによる画像の劣化を抑制することができ、より欠陥の少ない画像を生成することができる。

　以上のように、本開示に係る技術では、デプスセンサ１１－１により取得されたデプス画像、デプスセンサ１１－２により取得されたデプス画像、及びそれらのデプス画像から得られる画像（例えば２枚のデプス画像を連結した広角デプス画像）の少なくとも一部に機械学習により学習された学習済みのモデルを用いた処理を行い、いずれかの画像に含まれる補正対象画素（例えばデプス値に欠陥がある欠陥画素）を補正することができる。これにより、デプスセンサ１１－１とデプスセンサ１１－２が、視野が重なるように配置された場合や、視野が重ならないように配置された場合などの所定の関係を有するように配置された場合であっても、それらの視野に起因した補正対象画素を補正することができる。

　これにより、欠陥が補正された広角デプス画像が得られるため、例えば、次のユースケースで利用することができる。すなわち、建設現場や工事現場における建物計測や地形計測による進捗管理などで、補正済みの広角デプス画像を利用することができる。あるいは、ゲームや映画などでのCG(Computer Graphics)モデリング環境の下絵として、補正済みの広角デプス画像を利用することができる。さらには、自動車や建設機械等の移動体について、周囲の安全センシング機能や、自動運転のための自己位置推定機能を実現するために、補正済みの広角デプス画像を利用することができる。

　なお、上述した測距装置１０は、複数のセンサ（デプスセンサ１１－１やデプスセンサ１１－２など）により取得されたデプス画像を処理する処理部（スティッチング処理部１３や距離補正部１４など）を有する情報処理装置であると捉えることができる。測距装置２０乃至測距装置５０についても同様に情報処理装置として捉えることができる。また、測距装置１０においては、デプスセンサ１１－１とデプスセンサ１１－２の２つのデプスセンサを有する場合を示したが、３つ以上のデプスセンサを設けた場合にも同様に、本開示に係る技術を適用することができる。また、図７では、１つのデプスセンサ１１に対して光源ＬＳ１と光源ＬＳ２の２つの光源を設けた場合を示したが、３つ以上の光源を設けた場合にも同様に、本開示に係る技術を適用することができる。

（拡張例）
　図１２は、ＡＩ処理を行う装置を含むシステムの構成例を示している。

　電子機器２０００１は、スマートフォン、タブレット型端末、携帯電話機等のモバイル端末である。電子機器２０００１は、例えば、図１の測距装置１０（情報処理装置）に対応しており、デプスセンサ１１－１，１１－２（図１）に対応した光センサ２００１１を有する。光センサは、光を電気信号に変換するセンサ（画像センサ）である。電子機器２０００１は、所定の通信方式に対応した無線通信によって所定の場所に設置された基地局２００２０に接続することで、コアネットワーク２００３０を介して、インターネット等のネットワーク２００４０に接続することができる。

　基地局２００２０とコアネットワーク２００３０の間などのモバイル端末により近い位置には、モバイルエッジコンピューティング（ＭＥＣ：Mobile Edge Computing）を実現するためのエッジサーバ２０００２が設けられる。ネットワーク２００４０には、クラウドサーバ２０００３が接続される。エッジサーバ２０００２とクラウドサーバ２０００３は、用途に応じた各種の処理を行うことができる。なお、エッジサーバ２０００２は、コアネットワーク２００３０内に設けられてもよい。

　電子機器２０００１、エッジサーバ２０００２、クラウドサーバ２０００３、又は光センサ２００１１により、ＡＩ処理が行われる。ＡＩ処理は、本開示に係る技術を、機械学習等のＡＩを利用して処理するものである。ＡＩ処理は、学習処理と推論処理を含む。学習処理は、学習モデルを生成する処理である。また、学習処理には、後述する再学習処理も含まれる。推論処理は、学習モデルを用いた推論を行う処理である。

　電子機器２０００１、エッジサーバ２０００２、クラウドサーバ２０００３、又は光センサ２００１１においては、ＣＰＵ(Central Processing Unit)等のプロセッサがプログラムを実行したり、あるいは特定用途に特化したプロセッサ等の専用のハードウエアを用いたりすることで、ＡＩ処理が実現される。例えば、特定用途に特化したプロセッサとしては、ＧＰＵ(Graphics Processing Unit)を用いることができる。

　図１３は、電子機器２０００１の構成例を示している。電子機器２０００１は、各部の動作の制御や各種の処理を行うＣＰＵ２０１０１と、画像処理や並列処理に特化したＧＰＵ２０１０２と、ＤＲＡＭ(Dynamic Random Access Memory)等のメインメモリ２０１０３と、フラッシュメモリ等の補助メモリ２０１０４を有する。

　補助メモリ２０１０４は、ＡＩ処理用のプログラムや各種パラメータ等のデータを記録している。ＣＰＵ２０１０１は、補助メモリ２０１０４に記録されたプログラムやパラメータをメインメモリ２０１０３に展開してプログラムを実行する。あるいは、ＣＰＵ２０１０１とＧＰＵ２０１０２は、補助メモリ２０１０４に記録されたプログラムやパラメータをメインメモリ２０１０３に展開してプログラムを実行する。これにより、ＧＰＵ２０１０２を、ＧＰＧＰＵ(General-Purpose computing on Graphics Processing Units)として用いることができる。

　なお、ＣＰＵ２０１０１やＧＰＵ２０１０２は、ＳｏＣ(System on a Chip)として構成されてもよい。ＣＰＵ２０１０１がＡＩ処理用のプログラムを実行する場合には、ＧＰＵ２０１０２を設けなくてもよい。

　電子機器２０００１はまた、本開示に係る技術を適用した光センサ２００１１と、物理的なボタンやタッチパネル等の操作部２０１０５と、少なくとも１以上のセンサを含むセンサ２０１０６と、画像やテキスト等の情報を表示するディスプレイ２０１０７と、音を出力するスピーカ２０１０８と、所定の通信方式に対応した通信モジュール等の通信Ｉ／Ｆ２０１０９と、それらを接続するバス２０１１０を有する。

　センサ２０１０６は、光センサ（画像センサ）、音センサ（マイクロフォン）、振動センサ、加速度センサ、角速度センサ、圧力センサ、匂いセンサ、生体センサ等の各種のセンサを少なくとも１以上有している。ＡＩ処理では、光センサ２００１１から取得したデータ（画像データ）とともに、センサ２０１０６の少なくとも１以上のセンサから取得したデータを用いることができる。なお、光センサ２００１１が、デプスセンサ１１－１（図１）に対応し、センサ２０１０６が、デプスセンサ１１－２（図１）に対応しているとしてもよい。

　なお、センサフュージョンの技術によって２以上の光センサから取得したデータやそれらを統合的に処理して得られるデータが、ＡＩ処理で用いられてもよい。２以上の光センサとしては、光センサ２００１１とセンサ２０１０６内の光センサの組み合わせでもよいし、あるいは光センサ２００１１内に複数の光センサが含まれていてもよい。例えば、光センサには、ＲＧＢの可視光センサ、ＴｏＦ（Time of Flight）等の測距センサ、偏光センサ、イベントベースのセンサ、ＩＲ像を取得するセンサ、多波長取得可能なセンサなどが含まれる。

　電子機器２０００１においては、ＣＰＵ２０１０１やＧＰＵ２０１０２等のプロセッサによってＡＩ処理を行うことができる。電子機器２０００１のプロセッサが推論処理を行う場合には、光センサ２００１１で画像データを取得した後に時間を要さずに処理を開始することができるため、高速に処理を行うことができる。そのため、電子機器２０００１では、短い遅延時間で情報を伝達することが求められるアプリケーションなどの用途に推論処理が用いられた際に、ユーザは遅延による違和感なく操作を行うことができる。また、電子機器２０００１のプロセッサがＡＩ処理を行う場合、クラウドサーバ２０００３等のサーバを利用する場合と比べて、通信回線やサーバ用のコンピュータ機器などを利用する必要がなく、低コストで処理を実現することができる。

　図１４は、エッジサーバ２０００２の構成例を示している。エッジサーバ２０００２は、各部の動作の制御や各種の処理を行うＣＰＵ２０２０１と、画像処理や並列処理に特化したＧＰＵ２０２０２を有する。エッジサーバ２０００２はさらに、ＤＲＡＭ等のメインメモリ２０２０３と、ＨＤＤ(Hard Disk Drive)やＳＳＤ(Solid State Drive)等の補助メモリ２０２０４と、ＮＩＣ(Network Interface Card)等の通信Ｉ／Ｆ２０２０５を有し、それらがバス２０２０６に接続される。

　補助メモリ２０２０４は、ＡＩ処理用のプログラムや各種パラメータ等のデータを記録している。ＣＰＵ２０２０１は、補助メモリ２０２０４に記録されたプログラムやパラメータをメインメモリ２０２０３に展開してプログラムを実行する。あるいは、ＣＰＵ２０２０１とＧＰＵ２０２０２は、補助メモリ２０２０４に記録されたプログラムやパラメータをメインメモリ２０２０３に展開してプログラムを実行することで、ＧＰＵ２０２０２をＧＰＧＰＵとして用いることができる。なお、ＣＰＵ２０２０１がＡＩ処理用のプログラムを実行する場合には、ＧＰＵ２０２０２を設けなくてもよい。

　エッジサーバ２０００２においては、ＣＰＵ２０２０１やＧＰＵ２０２０２等のプロセッサによってＡＩ処理を行うことができる。エッジサーバ２０００２のプロセッサがＡＩ処理を行う場合、エッジサーバ２０００２はクラウドサーバ２０００３と比べて、電子機器２０００１と近い位置に設けられるため、処理の低遅延化を実現することができる。また、エッジサーバ２０００２は、電子機器２０００１や光センサ２００１１に比べて、演算速度などの処理能力が高いため、汎用的に構成することができる。そのため、エッジサーバ２０００２のプロセッサがＡＩ処理を行う場合、電子機器２０００１や光センサ２００１１の仕様や性能の違いに依らず、データを受信できればＡＩ処理を行うことができる。エッジサーバ２０００２でＡＩ処理を行う場合には、電子機器２０００１や光センサ２００１１における処理の負荷を軽減することができる。

　クラウドサーバ２０００３の構成は、エッジサーバ２０００２の構成と同様であるため、説明は省略する。

　クラウドサーバ２０００３においては、ＣＰＵ２０２０１やＧＰＵ２０２０２等のプロセッサによってＡＩ処理を行うことができる。クラウドサーバ２０００３は、電子機器２０００１や光センサ２００１１に比べて、演算速度などの処理能力が高いため、汎用的に構成することができる。そのため、クラウドサーバ２０００３のプロセッサがＡＩ処理を行う場合、電子機器２０００１や光センサ２００１１の仕様や性能の違いに依らず、ＡＩ処理を行うことができる。また、電子機器２０００１又は光センサ２００１１のプロセッサで負荷の高いＡＩ処理を行うことが困難である場合には、その負荷の高いＡＩ処理をクラウドサーバ２０００３のプロセッサが行い、その処理結果を電子機器２０００１又は光センサ２００１１のプロセッサにフィードバックすることができる。

　図１５は、光センサ２００１１の構成例を示している。光センサ２００１１は、例えば複数の基板が積層された積層構造を有する１チップの半導体装置として構成することができる。光センサ２００１１は、基板２０３０１と基板２０３０２の２枚の基板が積層されて構成される。なお、光センサ２００１１の構成としては積層構造に限らず、例えば、撮像部を含む基板が、ＣＰＵやＤＳＰ(Digital Signal Processor)等のＡＩ処理を行うプロセッサを含んでいてもよい。

　上層の基板２０３０１には、複数の画素が２次元に並んで構成される撮像部２０３２１が搭載されている。下層の基板２０３０２には、撮像部２０３２１での画像の撮像に関する処理を行う撮像処理部２０３２２と、撮像画像や信号処理結果を外部に出力する出力Ｉ／Ｆ２０３２３と、撮像部２０３２１での画像の撮像を制御する撮像制御部２０３２４が搭載されている。撮像部２０３２１、撮像処理部２０３２２、出力Ｉ／Ｆ２０３２３、及び撮像制御部２０３２４により撮像ブロック２０３１１が構成される。

　下層の基板２０３０２には、各部の制御や各種の処理を行うＣＰＵ２０３３１と、撮像画像や外部からの情報等を用いた信号処理を行うＤＳＰ２０３３２と、ＳＲＡＭ（Static Random Access Memory）やＤＲＡＭ（Dynamic Random Access Memory）等のメモリ２０３３３と、外部と必要な情報のやり取りを行う通信Ｉ／Ｆ２０３３４が搭載されている。ＣＰＵ２０３３１、ＤＳＰ２０３３２、メモリ２０３３３、及び通信Ｉ／Ｆ２０３３４により信号処理ブロック２０３１２が構成される。ＣＰＵ２０３３１及びＤＳＰ２０３３２の少なくとも１つのプロセッサによってＡＩ処理を行うことができる。

　このように、複数の基板が積層された積層構造における下層の基板２０３０２に、ＡＩ処理用の信号処理ブロック２０３１２を搭載することができる。これにより、上層の基板２０３０１に搭載される撮像用の撮像ブロック２０３１１で取得される画像データが、下層の基板２０３０２に搭載されたＡＩ処理用の信号処理ブロック２０３１２で処理されるため、１チップの半導体装置内で一連の処理を行うことができる。

　光センサ２００１１においては、ＣＰＵ２０３３１等のプロセッサによってＡＩ処理を行うことができる。光センサ２００１１のプロセッサが推論処理等のＡＩ処理を行う場合、１チップの半導体装置内で一連の処理が行われるため、センサ外部に情報が漏れないことから情報の秘匿性を高めることができる。また、画像データ等のデータを他の装置に送信する必要がないため、光センサ２００１１のプロセッサでは、画像データを用いた推論処理等のＡＩ処理を高速に行うことができる。例えば、リアルタイム性が求められるアプリケーションなどの用途に推論処理が用いられた際に、リアルタイム性を十分に確保することができる。ここで、リアルタイム性を確保するということは、短い遅延時間で情報を伝達できることを指す。さらに、光センサ２００１１のプロセッサがＡＩ処理を行うに際して、電子機器２０００１のプロセッサにより各種のメタデータを渡すことで、処理を削減して低消費電力化を図ることができる。

　図１６は、処理部２０４０１の構成例を示している。電子機器２０００１、エッジサーバ２０００２、クラウドサーバ２０００３、又は光センサ２００１１のプロセッサがプログラムに従った各種の処理を実行することで、処理部２０４０１として機能する。なお、同一の又は異なる装置が有する複数のプロセッサを処理部２０４０１として機能させてもよい。

　処理部２０４０１は、ＡＩ処理部２０４１１を有する。ＡＩ処理部２０４１１は、ＡＩ処理を行う。ＡＩ処理部２０４１１は、学習部２０４２１と推論部２０４２２を有する。

　学習部２０４２１は、学習モデルを生成する学習処理を行う。学習処理では、画像データに含まれる補正対象画素を補正するための機械学習を行った機械学習済みの学習モデルが生成される。また、学習部２０４２１は、生成済みの学習モデルを更新する再学習処理を行ってもよい。以下の説明では、学習モデルの生成と更新を区別して説明するが、学習モデルを更新することで、学習モデルを生成しているとも言えるため、学習モデルの生成には、学習モデルの更新の意味が含まれるものとする。

　また、生成された学習モデルは、電子機器２０００１、エッジサーバ２０００２、クラウドサーバ２０００３、又は光センサ２００１１などが有するメインメモリ又は補助メモリなどの記憶媒体に記録されることで、推論部２０４２２が行う推論処理において新たに利用可能となる。これにより、当該学習モデルに基づく推論処理を行う電子機器２０００１、エッジサーバ２０００２、クラウドサーバ２０００３、又は光センサ２００１１などを生成することができる。さらに、生成された学習モデルは、電子機器２０００１、エッジサーバ２０００２、クラウドサーバ２０００３、又は光センサ２００１１などとは独立した記憶媒体又は電子機器に記録され、他の装置で使用するために提供されてもよい。なお、これらの電子機器２０００１、エッジサーバ２０００２、クラウドサーバ２０００３、又は光センサ２００１１などの生成とは、製造時において、それらの記憶媒体に新たに学習モデルを記録することだけでなく、既に記録されている生成済学習モデルを更新することも含まれるものとする。

　推論部２０４２２は、学習モデルを用いた推論処理を行う。推論処理では、学習モデルを用いて、画像データに含まれる補正対象画素を特定したり、特定した補正対象画素を補正したりする処理が行われる。補正対象画素は、画像データに応じた画像内の複数個の画素のうち、所定の条件を満たした補正対象となる画素である。

　機械学習の手法としては、ニューラルネットワークやディープラーニングなどを用いることができる。ニューラルネットワークとは、人間の脳神経回路を模倣したモデルであって、入力層、中間層（隠れ層）、出力層の３種類の層からなる。ディープラーニングとは、多層構造のニューラルネットワークを用いたモデルであって、各層で特徴的な学習を繰り返し、大量データの中に潜んでいる複雑なパターンを学習することができる。

　機械学習の問題設定としては、教師あり学習を用いることができる。例えば、教師あり学習は、与えられたラベル付きの教師データに基づいて特徴量を学習する。これにより、未知のデータのラベルを導くことが可能となる。学習データは、実際に光センサにより取得された画像データや、集約して管理されている取得済みの画像データ、シミュレータにより生成されたデータセットなどを用いることができる。

　なお、教師あり学習に限らず、教師なし学習、半教師あり学習、強化学習などを用いてもよい。教師なし学習は、ラベルが付いていない学習データを大量に分析して特徴量を抽出し、抽出した特徴量に基づいてクラスタリング等を行う。これにより、膨大な未知のデータに基づいて傾向の分析や予測を行うことが可能となる。半教師あり学習は、教師あり学習と教師なし学習を混在させたものであって、教師あり学習で特徴量を学ばせた後、教師なし学習で膨大な学習データを与え、自動的に特徴量を算出させながら繰り返し学習を行う方法である。強化学習は、ある環境内におけるエージェントが現在の状態を観測して取るべき行動を決定する問題を扱うものである。

　このように、電子機器２０００１、エッジサーバ２０００２、クラウドサーバ２０００３、又は光センサ２００１１のプロセッサがＡＩ処理部２０４１１として機能することで、それらの装置のいずれか又は複数の装置でＡＩ処理が行われる。

　ＡＩ処理部２０４１１は、学習部２０４２１及び推論部２０４２２のうち少なくとも一方を有していればよい。すなわち、各装置のプロセッサは、学習処理と推論処理の両方の処理を実行することは勿論、学習処理と推論処理のうちの一方の処理を実行するようにしてもよい。例えば、電子機器２０００１のプロセッサが推論処理と学習処理の両方を行う場合には、学習部２０４２１と推論部２０４２２を有するが、推論処理のみを行う場合には、推論部２０４２２のみを有していればよい。

　各装置のプロセッサは、学習処理又は推論処理に関する全ての処理を実行してもよいし、一部の処理を各装置のプロセッサで実行した後に、残りの処理を他の装置のプロセッサで実行してもよい。また、各装置においては、学習処理や推論処理などのＡＩ処理の各々の機能を実行するための共通のプロセッサを有してもよいし、機能ごとに個別にプロセッサを有してもよい。

　なお、上述した装置以外の他の装置によりＡＩ処理が行われてもよい。例えば、電子機器２０００１が無線通信などにより接続可能な他の電子機器によって、ＡＩ処理を行うことができる。具体的には、電子機器２０００１がスマートフォンである場合に、ＡＩ処理を行う他の電子機器としては、他のスマートフォン、タブレット型端末、携帯電話機、ＰＣ(Personal Computer)、ゲーム機、テレビ受像機、ウェアラブル端末、デジタルスチルカメラ、デジタルビデオカメラなどの装置とすることができる。

　また、自動車等の移動体に搭載されるセンサや、遠隔医療機器に用いられるセンサなどを用いた構成においても、推論処理等のＡＩ処理を適用可能であるが、それらの環境では遅延時間が短いことが求められる。このような環境においては、ネットワーク２００４０を介してクラウドサーバ２０００３のプロセッサでＡＩ処理を行うのではなく、ローカル側の装置（例えば車載機器や医療機器としての電子機器２０００１）のプロセッサでＡＩ処理を行うことで遅延時間を短くすることができる。さらに、インターネット等のネットワーク２００４０に接続する環境がない場合や、高速な接続を行うことができない環境で利用する装置の場合にも、例えば電子機器２０００１や光センサ２００１１等のローカル側の装置のプロセッサでＡＩ処理を行うことで、より適切な環境でＡＩ処理を行うことができる。

　なお、上述した構成は一例であって、他の構成を採用しても構わない。例えば、電子機器２０００１は、スマートフォン等のモバイル端末に限らず、ＰＣ、ゲーム機、テレビ受像機、ウェアラブル端末、デジタルスチルカメラ、デジタルビデオカメラなどの電子機器、車載機器、医療機器であってもよい。また、電子機器２０００１は、無線LAN(Local Area Network)や有線LANなどの所定の通信方式に対応した無線通信又は有線通信によってネットワーク２００４０に接続してもよい。ＡＩ処理は、各装置のＣＰＵやＧＰＵ等のプロセッサに限らず、量子コンピュータやニューロモーフィック・コンピュータなどを利用しても構わない。

　ところで、学習モデルや画像データ、補正済みデータ等のデータは、単一の装置内で用いられることは勿論、複数の装置の間でやり取りされ、それらの装置内で用いられてもよい。図１７は、複数の装置間でのデータの流れを示している。

　電子機器２０００１－１乃至２０００１－Ｎ（Ｎは１以上の整数）は、例えばユーザごとに所持され、それぞれ基地局（不図示）等を介してインターネット等のネットワーク２００４０に接続可能である。製造時において、電子機器２０００１－１には、学習装置２０５０１が接続され、学習装置２０５０１により提供される学習モデルを補助メモリ２０１０４に記録することができる。学習装置２０５０１は、シミュレータ２０５０２により生成されたデータセットを学習データとして用いて学習モデルを生成し、電子機器２０００１－１に提供する。なお、学習データは、シミュレータ２０５０２から提供されるデータセットに限らず、実際に光センサにより取得された画像データや、集約して管理されている取得済みの画像データなどを用いても構わない。

　図示は省略しているが、電子機器２０００１－２乃至２０００１－Ｎについても、電子機器２０００１－１と同様に、製造時の段階で学習モデルを記録することができる。以下、電子機器２０００１－１乃至２０００１－Ｎをそれぞれ区別する必要がない場合には、電子機器２０００１と呼ぶ。

　ネットワーク２００４０には、電子機器２０００１のほかに、学習モデル生成サーバ２０５０３、学習モデル提供サーバ２０５０４、データ提供サーバ２０５０５、及びアプリサーバ２０５０６が接続され、相互にデータをやり取りすることができる。各サーバは、クラウドサーバとして設けることができる。

　学習モデル生成サーバ２０５０３は、クラウドサーバ２０００３と同様の構成を有し、ＣＰＵ等のプロセッサによって学習処理を行うことができる。学習モデル生成サーバ２０５０３は、学習データを用いて学習モデルを生成する。図示した構成では、製造時に電子機器２０００１が学習モデルを記録する場合を例示しているが、学習モデルは、学習モデル生成サーバ２０５０３から提供されてもよい。学習モデル生成サーバ２０５０３は、生成した学習モデルを、ネットワーク２００４０を介して電子機器２０００１に送信する。電子機器２０００１は、学習モデル生成サーバ２０５０３から送信されてくる学習モデルを受信し、補助メモリ２０１０４に記録する。これにより、その学習モデルを備える電子機器２０００１が生成される。

　すなわち、電子機器２０００１では、製造時の段階で学習モデルを記録していない場合には、学習モデル生成サーバ２０５０３からの学習モデルを新規で記録することで、新たな学習モデルを記録した電子機器２０００１が生成される。また、電子機器２０００１では、製造時の段階で学習モデルを既に記録している場合、記録済みの学習モデルを、学習モデル生成サーバ２０５０３からの学習モデルに更新することで、更新済みの学習モデルを記録した電子機器２０００１が生成される。電子機器２０００１では、適宜更新される学習モデルを用いて推論処理を行うことができる。

　学習モデルは、学習モデル生成サーバ２０５０３から電子機器２０００１に直接提供するに限らず、各種の学習モデルを集約して管理する学習モデル提供サーバ２０５０４がネットワーク２００４０を介して提供してもよい。学習モデル提供サーバ２０５０４は、電子機器２０００１に限らず、他の装置に学習モデルを提供することで、その学習モデルを備える他の装置を生成しても構わない。また、学習モデルは、フラッシュメモリ等の着脱可能なメモリカードに記録して提供しても構わない。電子機器２０００１では、スロットに装着されたメモリカードから学習モデルを読み出して記録することができる。これにより、電子機器２０００１では、過酷環境下で使用される場合や、通信機能を有していない場合、通信機能を有しているが伝送可能な情報量が少ない場合などであっても、学習モデルを取得することができる。

　電子機器２０００１は、画像データや補正済みデータ、メタデータなどのデータを、ネットワーク２００４０を介して他の装置に提供することができる。例えば、電子機器２０００１は、画像データや補正済みデータ等のデータを、ネットワーク２００４０を介して学習モデル生成サーバ２０５０３に送信する。これにより、学習モデル生成サーバ２０５０３では、１又は複数の電子機器２０００１から収集された画像データや補正済みデータ等のデータを学習データとして用い、学習モデルを生成することができる。より多くの学習データを用いることで、学習処理の精度を上げることができる。

　画像データや補正済みデータ等のデータは、電子機器２０００１から学習モデル生成サーバ２０５０３に直接提供するに限らず、各種のデータを集約して管理するデータ提供サーバ２０５０５が提供してもよい。データ提供サーバ２０５０５は、電子機器２０００１に限らず他の装置からデータを収集してもよいし、学習モデル生成サーバ２０５０３に限らず他の装置にデータを提供しても構わない。

　学習モデル生成サーバ２０５０３は、既に生成された学習モデルに対し、電子機器２０００１又はデータ提供サーバ２０５０５から提供された画像データや補正済みデータ等のデータを学習データに追加した再学習処理を行い、学習モデルを更新してもよい。更新された学習モデルは、電子機器２０００１に提供することができる。学習モデル生成サーバ２０５０３において、学習処理又は再学習処理を行う場合、電子機器２０００１の仕様や性能の違いに依らず、処理を行うことができる。

　また、電子機器２０００１において、補正済みデータやメタデータに対してユーザが修正の操作を行った場合（例えばユーザが正しい情報を入力した場合）に、その修正処理に関するフィードバックデータが、再学習処理に用いられてもよい。例えば、電子機器２０００１からのフィードバックデータを学習モデル生成サーバ２０５０３に送信することで、学習モデル生成サーバ２０５０３では、電子機器２０００１からのフィードバックデータを用いた再学習処理を行い、学習モデルを更新することができる。なお、電子機器２０００１では、ユーザによる修正の操作が行われる際に、アプリサーバ２０５０６により提供されるアプリケーションが利用されてもよい。

　再学習処理は、電子機器２０００１が行ってもよい。電子機器２０００１において、画像データやフィードバックデータを用いた再学習処理を行って学習モデルを更新する場合、装置内で学習モデルの改善を行うことができる。これにより、その更新された学習モデルを備える電子機器２０００１が生成される。また、電子機器２０００１は、再学習処理で得られる更新後の学習モデルを学習モデル提供サーバ２０５０４に送信して、他の電子機器２０００１に提供されるようにしてもよい。これにより、複数の電子機器２０００１の間で、更新後の学習モデルを共有することができる。

　あるいは、電子機器２０００１は、再学習された学習モデルの差分情報（更新前の学習モデルと更新後の学習モデルに関する差分情報）を、アップデート情報として、学習モデル生成サーバ２０５０３に送信してもよい。学習モデル生成サーバ２０５０３では、電子機器２０００１からのアップデート情報に基づき改善された学習モデルを生成して、他の電子機器２０００１に提供することができる。このような差分情報をやり取りすることで、全ての情報をやり取りする場合と比べてプライバシを保護することができ、また通信コストを削減することができる。なお、電子機器２０００１と同様に、電子機器２０００１に搭載された光センサ２００１１が再学習処理を行ってもよい。

　アプリサーバ２０５０６は、ネットワーク２００４０を介して各種のアプリケーションを提供可能なサーバである。アプリケーションは、学習モデルや補正済みデータ、メタデータ等のデータを用いた所定の機能を提供する。電子機器２０００１は、ネットワーク２００４０を介してアプリサーバ２０５０６からダウンロードしたアプリケーションを実行することで、所定の機能を実現することができる。あるいは、アプリサーバ２０５０６は、例えばＡＰＩ（Application Programming Interface）などを介して電子機器２０００１からデータを取得し、アプリサーバ２０５０６上でアプリケーションを実行することで、所定の機能を実現することもできる。

　このように、本技術を適用した装置を含むシステムでは、各装置の間で、学習モデル、画像データ、補正済みデータ等のデータがやり取りされて流通し、それらのデータを用いた様々なサービスを提供することが可能となる。例えば、学習モデル提供サーバ２０５０４を介した学習モデルを提供するサービスや、データ提供サーバ２０５０５を介した画像データや補正済みデータ等のデータを提供するサービスを提供することができる。また、アプリサーバ２０５０６を介したアプリケーションを提供するサービスを提供することができる。

　あるいは、学習モデル提供サーバ２０５０４により提供される学習モデルに、電子機器２０００１の光センサ２００１１から取得した画像データを入力して、その出力として得られる補正済みデータが提供されてもよい。また、学習モデル提供サーバ２０５０４により提供される学習モデルを実装した電子機器などの装置を生成して提供してもよい。さらに、学習モデルや補正済みデータ、メタデータ等のデータを読み出し可能な記憶媒体に記録することで、それらのデータが記録された記憶媒体や、当該記憶媒体を搭載した電子機器などの装置を生成して提供してもよい。当該記憶媒体は、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどの不揮発性メモリでもよいし、ＳＲＡＭやＤＲＡＭなどの揮発性メモリでもよい。

　なお、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　また、本開示は、以下のような構成をとることができる。

（１）
　第１のセンサにより取得された対象物を深度情報で示した第１の画像、第２のセンサにより取得された対象物を深度情報で示した第２の画像、前記第１の画像と前記第２の画像から得られる第３の画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行い、いずれかの画像に含まれる補正対象画素を補正する
　処理部を備える
　情報処理装置。
（２）
　前記第１のセンサと前記第２のセンサは、視野が重なるように配置されており、
　前記処理部は、
　　前記第１の画像と前記第２の画像とを連結して前記第３の画像を生成する際に、前記第３の画像における前記視野の重複部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　前記（１）に記載の情報処理装置。
（３）
　前記学習済みモデルは、欠陥がある前記第３の画像と前記画素補正位置を入力とした学習によって、前記視野の重複部分による深度情報の欠陥が補正された前記第３の画像を出力するようになったモデルであり、
　前記処理部は、前記学習済みモデルを用いて、前記視野の重複部分により深度情報に欠陥がある前記第３の画像と前記画素補正位置を入力とした推論を行うことで、欠陥を補正済みの前記第３の画像を生成する
　前記（２）に記載の情報処理装置。
（４）
　前記第１のセンサと前記第２のセンサは、視野が重なるように配置されており、
　前記処理部は、
　　前記第１の画像と前記第２の画像とを連結して前記第３の画像を生成する際に、前記第１の画像と前記第２の画像における前記視野の重複部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　前記（１）に記載の情報処理装置。
（５）
　前記学習済みモデルは、欠陥がある前記第１の画像又は前記第２の画像と前記画素補正位置を入力とした学習によって、前記視野の重複部分による深度情報の欠陥が補正された前記第１の画像又は前記第２の画像を出力するようになったモデルであり、
　前記処理部は、
　　前記学習済みモデルを用いて、前記視野の重複部分により深度情報に欠陥がある前記第１の画像又は前記第２の画像と前記画素補正位置を入力とした推論を行うことで、欠陥を補正済みの前記第１の画像又は前記第２の画像を生成し、
　　前記第１の画像と前記第２の画像とを連結して前記第３の画像を生成する
　前記（４）に記載の情報処理装置。
（６）
　前記第１のセンサと前記第２のセンサは、視野が重ならないように配置されており、
　前記処理部は、
　　前記第１の画像と前記第２の画像とを連結して前記第３の画像を生成する際に、前記第３の画像における前記視野の隙間部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　前記（１）に記載の情報処理装置。
（７）
　前記学習済みモデルは、欠陥がある前記第３の画像と前記画素補正位置を入力とした学習によって、前記視野の隙間部分による深度情報の欠陥が補正された前記第３の画像を出力するようになったモデルであり、
　前記処理部は、前記学習済みモデルを用いて、前記視野の隙間部分により深度情報に欠陥がある前記第３の画像と前記画素補正位置を入力とした推論を行うことで、欠陥を補正済みの前記第３の画像を生成する
　前記（６）に記載の情報処理装置。
（８）
　前記第１のセンサと前記第２のセンサは、異なる視野を有するセンサであって、互いの視野が重なるように配置されており、
　前記処理部は、
　　前記第１の画像と前記第２の画像とを連結して前記第３の画像を生成する際に、前記第３の画像における前記視野の重複部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　前記（１）に記載の情報処理装置。
（９）
　前記学習済みモデルは、欠陥がある前記第３の画像と前記画素補正位置を入力とした学習によって、前記視野の重複部分による深度情報の欠陥が補正された前記第３の画像を出力するようになったモデルであり、
　前記処理部は、前記学習済みモデルを用いて、前記視野の重複部分により深度情報に欠陥がある前記第３の画像と前記画素補正位置を入力とした推論を行うことで、欠陥を補正済みの前記第３の画像を生成する
　前記（８）に記載の情報処理装置。
（１０）
　前記第１のセンサは、広角に対応した視野を有し、
　前記第２のセンサは、望遠に対応した視野を有する
　前記（８）又は（９）に記載の情報処理装置。
（１１）
　情報処理装置が、
　第１のセンサにより取得された対象物を深度情報で示した第１の画像、第２のセンサにより取得された対象物を深度情報で示した第２の画像、前記第１の画像と前記第２の画像から得られる第３の画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行い、いずれかの画像に含まれる補正対象画素を補正する
　情報処理方法。
（１２）
　コンピュータを、
　第１のセンサにより取得された対象物を深度情報で示した第１の画像、第２のセンサにより取得された対象物を深度情報で示した第２の画像、前記第１の画像と前記第２の画像から得られる第３の画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行い、いずれかの画像に含まれる補正対象画素を補正する
　処理部を備える
　情報処理装置として機能させるプログラム。
（１３）
　第１の光源と第２の光源を有するセンサにより取得された対象物を深度情報で示した画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行う処理部を備え、
　前記第１の光源と前記第２の光源は、光の照射領域が重なるように配置されており、
　前記処理部は、
　　前記画像における前記照射領域の重複部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　情報処理装置。
（１４）
　前記学習済みモデルは、欠陥がある前記画像と前記画素補正位置を入力とした学習によって、前記照射領域の重複部分による深度情報の欠陥が補正された前記画像を出力するようになったモデルであり、
　前記処理部は、前記学習済みモデルを用いて、前記照射領域の重複部分により深度情報に欠陥がある前記画像と前記画素補正位置を入力とした推論を行うことで、欠陥を補正済みの前記画像を生成する
　前記（１３）に記載の情報処理装置。
（１５）
　情報処理装置が、
　光の照射領域が重なるように配置された第１の光源と第２の光源を有するセンサにより取得された対象物を深度情報で示した画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行い、
　前記画像における前記照射領域の重複部分に対応した位置を、画素補正位置として特定し、
　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　情報処理方法。
（１６）
　コンピュータを、
　光の照射領域が重なるように配置された第１の光源と第２の光源を有するセンサにより取得された対象物を深度情報で示した画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行う処理部を備え、
　前記処理部は、
　　前記画像における前記照射領域の重複部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　情報処理装置として機能させるプログラム。

　１０，２０，３０，４０，５０　測距装置，　１１，１１－１，１１－２　デプスセンサ，　１２－１，１２－２　測距演算部，　１３　スティッチング処理部，　１４　距離補正部，　２０　学習装置，　２１－１，２１－２　距離補正部，　２２　スティッチング処理部，　３１　距離補正・スティッチング処理部，　４１　測距演算・距離補正・スティッチング処理部，　５１　タイミング制御部，　５２－１，５２－２　光源，　１１１　推論部，　１２１　学習モデル，　２００　学習装置，　２２１　学習モデル

Claims

　第１のセンサにより取得された対象物を深度情報で示した第１の画像、第２のセンサにより取得された対象物を深度情報で示した第２の画像、前記第１の画像と前記第２の画像から得られる第３の画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行い、いずれかの画像に含まれる補正対象画素を補正する
　処理部を備える
　情報処理装置。
　前記第１のセンサと前記第２のセンサは、視野が重なるように配置されており、
　前記処理部は、
　　前記第１の画像と前記第２の画像とを連結して前記第３の画像を生成する際に、前記第３の画像における前記視野の重複部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　請求項１に記載の情報処理装置。
　前記学習済みモデルは、欠陥がある前記第３の画像と前記画素補正位置を入力とした学習によって、前記視野の重複部分による深度情報の欠陥が補正された前記第３の画像を出力するようになったモデルであり、
　前記処理部は、前記学習済みモデルを用いて、前記視野の重複部分により深度情報に欠陥がある前記第３の画像と前記画素補正位置を入力とした推論を行うことで、欠陥を補正済みの前記第３の画像を生成する
　請求項２に記載の情報処理装置。
　前記第１のセンサと前記第２のセンサは、視野が重なるように配置されており、
　前記処理部は、
　　前記第１の画像と前記第２の画像とを連結して前記第３の画像を生成する際に、前記第１の画像と前記第２の画像における前記視野の重複部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　請求項１に記載の情報処理装置。
　前記学習済みモデルは、欠陥がある前記第１の画像又は前記第２の画像と前記画素補正位置を入力とした学習によって、前記視野の重複部分による深度情報の欠陥が補正された前記第１の画像又は前記第２の画像を出力するようになったモデルであり、
　前記処理部は、
　　前記学習済みモデルを用いて、前記視野の重複部分により深度情報に欠陥がある前記第１の画像又は前記第２の画像と前記画素補正位置を入力とした推論を行うことで、欠陥を補正済みの前記第１の画像又は前記第２の画像を生成し、
　　前記第１の画像と前記第２の画像とを連結して前記第３の画像を生成する
　請求項４に記載の情報処理装置。
　前記第１のセンサと前記第２のセンサは、視野が重ならないように配置されており、
　前記処理部は、
　　前記第１の画像と前記第２の画像とを連結して前記第３の画像を生成する際に、前記第３の画像における前記視野の隙間部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　請求項１に記載の情報処理装置。
　前記学習済みモデルは、欠陥がある前記第３の画像と前記画素補正位置を入力とした学習によって、前記視野の隙間部分による深度情報の欠陥が補正された前記第３の画像を出力するようになったモデルであり、
　前記処理部は、前記学習済みモデルを用いて、前記視野の隙間部分により深度情報に欠陥がある前記第３の画像と前記画素補正位置を入力とした推論を行うことで、欠陥を補正済みの前記第３の画像を生成する
　請求項６に記載の情報処理装置。
　前記第１のセンサと前記第２のセンサは、異なる視野を有するセンサであって、互いの視野が重なるように配置されており、
　前記処理部は、
　　前記第１の画像と前記第２の画像とを連結して前記第３の画像を生成する際に、前記第３の画像における前記視野の重複部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　請求項１に記載の情報処理装置。
　前記学習済みモデルは、欠陥がある前記第３の画像と前記画素補正位置を入力とした学習によって、前記視野の重複部分による深度情報の欠陥が補正された前記第３の画像を出力するようになったモデルであり、
　前記処理部は、前記学習済みモデルを用いて、前記視野の重複部分により深度情報に欠陥がある前記第３の画像と前記画素補正位置を入力とした推論を行うことで、欠陥を補正済みの前記第３の画像を生成する
　請求項８に記載の情報処理装置。
　前記第１のセンサは、広角に対応した視野を有し、
　前記第２のセンサは、望遠に対応した視野を有する
　請求項８に記載の情報処理装置。
　情報処理装置が、
　第１のセンサにより取得された対象物を深度情報で示した第１の画像、第２のセンサにより取得された対象物を深度情報で示した第２の画像、前記第１の画像と前記第２の画像から得られる第３の画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行い、いずれかの画像に含まれる補正対象画素を補正する
　情報処理方法。
　コンピュータを、
　第１のセンサにより取得された対象物を深度情報で示した第１の画像、第２のセンサにより取得された対象物を深度情報で示した第２の画像、前記第１の画像と前記第２の画像から得られる第３の画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行い、いずれかの画像に含まれる補正対象画素を補正する
　処理部を備える
　情報処理装置として機能させるプログラム。
　第１の光源と第２の光源を有するセンサにより取得された対象物を深度情報で示した画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行う処理部を備え、
　前記第１の光源と前記第２の光源は、光の照射領域が重なるように配置されており、
　前記処理部は、
　　前記画像における前記照射領域の重複部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　情報処理装置。
　前記学習済みモデルは、欠陥がある前記画像と前記画素補正位置を入力とした学習によって、前記照射領域の重複部分による深度情報の欠陥が補正された前記画像を出力するようになったモデルであり、
　前記処理部は、前記学習済みモデルを用いて、前記照射領域の重複部分により深度情報に欠陥がある前記画像と前記画素補正位置を入力とした推論を行うことで、欠陥を補正済みの前記画像を生成する
　請求項１３に記載の情報処理装置。
　情報処理装置が、
　光の照射領域が重なるように配置された第１の光源と第２の光源を有するセンサにより取得された対象物を深度情報で示した画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行い、
　前記画像における前記照射領域の重複部分に対応した位置を、画素補正位置として特定し、
　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　情報処理方法。
　コンピュータを、
　光の照射領域が重なるように配置された第１の光源と第２の光源を有するセンサにより取得された対象物を深度情報で示した画像の少なくとも一部に機械学習により学習された学習済みモデルを用いた処理を行う処理部を備え、
　前記処理部は、
　　前記画像における前記照射領域の重複部分に対応した位置を、画素補正位置として特定し、
　　前記学習済みモデルを用いて、前記画素補正位置の深度情報を補正する
　情報処理装置として機能させるプログラム。