JP7372322B2 - 色覚困難の知覚を改善する多重スペクトル多重偏光(msmp)フィルタ処理 - Google Patents

色覚困難の知覚を改善する多重スペクトル多重偏光(msmp)フィルタ処理 Download PDF

Info

Publication number
JP7372322B2
JP7372322B2 JP2021523507A JP2021523507A JP7372322B2 JP 7372322 B2 JP7372322 B2 JP 7372322B2 JP 2021523507 A JP2021523507 A JP 2021523507A JP 2021523507 A JP2021523507 A JP 2021523507A JP 7372322 B2 JP7372322 B2 JP 7372322B2
Authority
JP
Japan
Prior art keywords
filter
image data
data
interest
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021523507A
Other languages
English (en)
Other versions
JP2022512290A (ja
Inventor
ブリッグス、フォレスト、ザムエル
クレメント、ロマイン
ゾウ、イ
Original Assignee
ウーブン バイ トヨタ,ユーエス,インコーポレイティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ウーブン バイ トヨタ,ユーエス,インコーポレイティド filed Critical ウーブン バイ トヨタ,ユーエス,インコーポレイティド
Publication of JP2022512290A publication Critical patent/JP2022512290A/ja
Application granted granted Critical
Publication of JP7372322B2 publication Critical patent/JP7372322B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/143Sensing or illuminating at different wavelengths
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/147Details of sensors, e.g. sensor lenses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/133Equalising the characteristics of different image components, e.g. their average brightness or colour balance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/25Image signal generators using stereoscopic image cameras using two or more image sensors with different characteristics other than in their location or field of view, e.g. having different resolutions or colour pickup characteristics; using image signals from one sensor to control the characteristics of another sensor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/257Colour aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/10Circuitry of solid-state image sensors [SSIS]; Control thereof for transforming different wavelengths into image signals
    • H04N25/11Arrangement of colour filter arrays [CFA]; Filter mosaics
    • H04N25/13Arrangement of colour filter arrays [CFA]; Filter mosaics characterised by the spectral characteristics of the filter elements
    • H04N25/133Arrangement of colour filter arrays [CFA]; Filter mosaics characterised by the spectral characteristics of the filter elements including elements passing panchromatic light, e.g. filters passing white light
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B5/00Optical elements other than lenses
    • G02B5/20Filters
    • G02B5/201Filters in the form of arrays
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B5/00Optical elements other than lenses
    • G02B5/30Polarising elements
    • G02B5/3025Polarisers, i.e. arrangements capable of producing a definite output polarisation state from an unpolarised input state
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0077Colour aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/10Circuitry of solid-state image sensors [SSIS]; Control thereof for transforming different wavelengths into image signals
    • H04N25/11Arrangement of colour filter arrays [CFA]; Filter mosaics
    • H04N25/13Arrangement of colour filter arrays [CFA]; Filter mosaics characterised by the spectral characteristics of the filter elements
    • H04N25/135Arrangement of colour filter arrays [CFA]; Filter mosaics characterised by the spectral characteristics of the filter elements based on four or more different wavelength filter elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Vascular Medicine (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Optics & Photonics (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)
  • Software Systems (AREA)
  • Traffic Control Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)

Description

光学カメラは、静止画像または映像を取得するように構成されたイメージセンサを含むことがある。一例として、限定ではないが、光学カメラは、電荷結合素子(CCD)イメージセンサまたは相補型金属酸化膜半導体(CMOS)アクティブピクセルイメージセンサを含むことがある。特定の実施形態では、CMOSイメージセンサはフィルタアレイを含むことがある。一般的なフィルタアレイは、光の特定の特徴(例えば、波長または偏光)の情報を取得するように調整されたフィルタのモザイクを有する。
多重スペクトルイメージングは、多くの実際の適用例を改善するのに使用されることがある。例示の適用例は、自律車両のナビゲーション、ロボット用途、または空中作業台からの森林検査を含んでもよい。一例として、限定ではないが、成功するナビゲーション(例えば、支援式または自律)は、路上にある障害物の適時の検出および認識に依存しているが、フィルタアレイのスペクトル外にあるスペクトルの波長を検出することは、困難であって計算集約的なことがある。
一例のフィルタアレイを有するイメージセンサを示す断面図である。
一例のフィルタアレイのスペクトル応答を示す図である。
一例のフィルタタイプの組み合わせを有するフィルタアレイを含むカメラの概略を示す図である。
自動車用カメラシステムの一例の概略を示す図である。
一例の深度計算を示す図である。
関心対象物を検出する一例の方法を示す図である。
輸送管理環境の一例のブロック図である。
コンピューティングシステムの一例を示す図である。
以下の記載で、様々な実施形態について記載する。説明目的で、実施形態の徹底的な理解を提供するために、具体的な構成および詳細について説明する。しかしながら、実施形態はかかる具体的な詳細なしで実施されてもよいことも、当業者には明白となるであろう。更に、記載する実施形態が曖昧にならないようにするため、良く知られている特徴は省略または単純化されることがある。それに加えて、本明細書に開示する実施形態は単なる例であり、本開示の範囲はそれらに限定されない。特定の実施形態は、上記に開示した実施形態の構成要素、要素、特徴、機能、動作、または段階の全てもしくは一部を含むか、あるいはいずれも含まないことがある。本発明による実施形態は、特に、方法、記憶媒体、システム、およびコンピュータプログラム製品を対象とした添付の特許請求の範囲に開示され、1つのクレーム分類、例えば方法において言及される任意の特徴が、別のクレームカテゴリ、例えばシステムにおいても請求される場合がある。添付の特許請求の範囲における従属または後方参照は、形式上の理由でのみ選択される。しかしながら、任意の先行クレームに対する意図的な後方参照(特に、多項従属)の結果による任意の主題も同様に請求することができ、それによってクレームおよびその特徴の任意の組み合わせが開示され、添付の特許請求の範囲において選択される従属にかかわらずそれらを請求することができる。請求することができる主題は、添付の特許請求の範囲に提示されるような特徴の組み合わせだけではなく、特許請求の範囲における特徴の他の任意の組み合わせも備え、特許請求の範囲で言及される各特徴を、特許請求の範囲における他の任意の特徴または他の特徴の組み合わせと組み合わせることができる。更に、本明細書に記載もしくは描写する実施形態および特徴のいずれも、別個のクレームで、ならびに/あるいは本明細書に記載もしくは描写する任意の実施形態または特徴との、あるいは添付の特許請求の範囲の特徴のうち任意のものとの任意の組み合わせで、請求することができる。
光学カメラは、相補型金属酸化膜半導体(CMOS)アクティブピクセルイメージセンサと、フィルタアレイとを含んでもよい。フィルタアレイは、更に詳細に後述するが、入射光の特定の性質に応答する特徴を有するフィルタのモザイクである。一例として、限定ではないが、フィルタアレイは、入射光の特定の波長に応答する特徴の組み合わせを有してもよい。別の例として、フィルタアレイは、特定の偏光(例えば、0°、45°、90°、135°、または任意の好適な偏光)を有する入射光の成分に応答する、フィルタの組み合わせを有してもよい。異なる偏光を使用して取得されるデータは、油がある、濡れた、または凍った路面に共通である、鏡面反射を検出するのに使用されてもよい。これは、例えば、路面摩擦係数を画像から推定するのに使用されてもよい。更に、偏光は、空に対応するピクセルを他のピクセルから区別する助けとして使用されてもよい。深度推定に関する一般的な不良モードは、空が光学カメラから遠く離れていないと予測することによって、空に対する深度予測が不適正になるものである。
一例として、限定ではないが、光学カメラから取得した生データは、個々のフォトサイトの未修正スペクトル情報を格納してもよいが、多くの用途では、画像信号プロセッサ(ISP)を使用して、各フォトサイトに対するフィルタアレイの特徴一式に対応するデータを推論して、フル解像度の画像が生成されてもよい。一例として、限定ではないが、赤フィルタを有するフォトサイトは、主に赤色に対応するスペクトルの波長範囲に対応する入射光の部分に応答するが、ISPは、隣接するフォトサイトからのデータに基づいて、緑色および青色に対応するスペクトルの波長範囲に対応する信号を推定してもよい。別の例として、0°偏光を有するフォトサイトは、主に0°偏光に対応する入射光の部分に応答するが、ISPは、隣接するフォトサイトからのデータに基づいて、90°偏光データに対応する信号を推定してもよい。フィルタの特徴外にある特徴の検出における困難は、これら他の特徴を有する障害物を認識する際のレイテンシにつながることがあり、それがひいては、これらの障害物を回避するための介入の数が増加することにつながることがある。一例として、限定ではないが、オレンジ色(例えば、「セーフティ」オレンジ)に対応するスペクトルは、多くのフィルタアレイで比較的低いスペクトル応答を有することがあり、それによって、更に詳細に後述するように、交通信号の注意信号を検出すること、または建設工事領域(例えば、オレンジの作業コーンもしくはオレンジの機器)を回避することが困難になることがある。
本明細書では、特徴に対する言及は、例えばスペクトル、偏光、または温度など、光と関連付けられた品質を指す。更に、本明細書のフィルタタイプに対する言及は、光と関連付けられた特定の特徴を指す。一例として、限定ではないが、赤色もしくは緑色に対応するスペクトルに対する、または垂直もしくは45°偏光フィルタの偏光に対するフィルタタイプである。複数のカメラのモザイクは、少なくとも1つの他のカメラのモザイクと共通の特徴を有するモザイクにおける、少なくとも1つの対応するフィルタを含んでもよい。一例として、限定ではないが、第1のフィルタアレイは、赤、緑、青、および可視スペクトルのフィルタの組み合わせを有してもよく、第2のフィルタアレイは、赤、オレンジ、緑、および可視スペクトルのフィルタの組み合わせを有してもよい。特定の実施形態では、共通または参照フィルタ素子は、それぞれのフィルタアレイを使用して取得された画像からピクセルの深度を推定するのに使用されてもよい。
特定のフィルタの一次応答外にある入射光の特徴は、更に詳細に後述するように、センサの関連するフォトサイトにおける応答の低減を誘発する。複数のカメラからの1つまたは複数のフォトサイトにおける深度情報を決定することは、特に特徴なしの領域(例えば、空白の壁)を有するシーンに関して、コスト集約計算に基づいてカメラ間でのステレオマッチングを決定するのに使用されてもよい。換言すれば、1つのイメージセンサにおける特定のフォトサイトの深度、および別のイメージセンサにおける対応するフォトサイト位置が、同じシーンを取得している対応するフォトサイト間における空間オフセットの量を推定するのに使用されてもよい。
本明細書に記載する実施形態は、多重スペクトルデータを提供し、従来は既存のイメージセンサを使用して識別するのが困難である、特定の波長を決定することによって、様々なプラットフォーム、システム、または方法、特に周囲環境の正確な特性付けおよび知覚が重要であるものに有益であってもよい。一例として、限定ではないが、本明細書に記載する実施形態を使用して生成される多重スペクトル画像は、車両(例えば、自律、半自律、または従来のマニュアル車両)が(例えば、コンピュータビジョン技術を使用して)その周囲環境を理解し、情報に基づいて適宜判断する能力を改善してもよい(例えば、改善されたナビゲーションおよび運転上の判断、危険回避、緊急応答、特定の色の交通標識に対する応答など)。同様に、有人または無人航空機(UAV)の操縦者は、コンピュータ支援の基になる基礎的データの改善および強化により、改善されたコンピュータ支援を用いて飛行しナビゲートすることができてもよい。例えば、UAVは、対象物を検出して障害物(例えば、木、建物、および鳥)ならびに非障害物(例えば、雲)として分類する能力における信頼度が改善されて、ナビゲートすることができてもよい。別の例として、ロボットハンドリングシステムは、ロボットのビジョンシステムが、対象物の固有の色、多重スペクトル、および/または多重偏光シグネチャに基づいて、一括して様々な対象物を認識することができる場合、より効率的に働いてもよい。別の例として、自動収穫(例えば、果物)は、知覚しづらい色(例えば、オレンジ、紫、ピンクなど)を有する農産物を検出および認識できることによって、改善されてもよい。組立ラインにおける部品の欠陥の自動検出は、視覚画像だけを使用して検出するのは難しいことがある欠陥を、多重スペクトル多重偏光シグネチャが検出するのを利用して利益を得てもよい。
特定の実施形態では、更に詳細に後述する車両のセンサアレイは、多様な特徴のモザイクを有するフィルタアレイを有する、複数のカメラを含んでもよい。本明細書では、特徴に対する言及は、例えばスペクトル、偏光、または温度など、光と関連付けられた品質を指す。更に、本明細書でのフィルタタイプに対する言及は、光と関連付けられた特定の特徴を指す。一例として、限定ではないが、スペクトルフィルタタイプは、赤色または緑色に対応するフィルタ、または偏光の場合は垂直もしくは45°偏光フィルタを含んでもよい。複数のカメラのモザイクは、少なくとも1つの他のカメラのモザイクと共通の特徴を有するモザイクにおける、少なくとも1つの対応するフィルタを含んでもよい。特定の実施形態では、共通または参照フィルタ素子を使用して、それぞれのフィルタアレイを使用して取得された画像からのピクセルの深度が推定されてもよい。同じシーンを取得する異なるイメージセンサにおけるフォトサイト間の対応を決定することによって、多様なフィルタアレイを使用して取得されたデータを含む多重スペクトル多重偏光画像が、対象物検出のために生成されてもよい。更に詳細に後述するように、特定の色(例えば、オレンジ)に対応するフィルタを有するフィルタアレイを、異なるスペクトルの組み合わせを有するフィルタアレイと併用して、異なるスペクトルの組み合わせのチャネルと特定のスペクトルのチャネルとを組み合わせた多重スペクトル画像が生成されてもよい。
図1は、一例のフィルタアレイを有するイメージセンサの断面を示している。一例として、限定ではないが、光学カメラは、静止画像または映像を取得するように構成されたイメージセンサ102を使用する。光学カメラは、CCDまたはCMOSアクティブピクセルイメージセンサを含んでもよい。光学カメラは、道路、車線区分線、道路標識、交通信号、車両、人、動物、または外部環境に存在する他の目に見える関心対象物を認識するのに使用されてもよい。イメージセンサ102は、入射光の量に比例する信号をそれぞれ生成するフォトサイト(例えば、フォトダイオード、伝達ゲート、浮遊拡散、または任意の好適な感光素子)のアレイを含む。図1の例に示されるように、イメージセンサ102は、イメージセンサ102の上面の上に位置するフィルタアレイ104を含んでもよい。特定の実施形態では、フィルタアレイ104はマイクロレンズアレイ(図示なし)の下方にあってもよい。図1の例に示されるように、2×2のフィルタアレイ104は、特定のフィルタタイプ(例えば、特定の波長範囲もしくは偏光タイプ)をそれぞれ有する、特徴のパターンまたはモザイク(例えば、特定の波長範囲の光を通過させるスペクトルフィルタ、もしくは特定の偏光の光を通過させる偏光子)を形成する、領域106A~Dを含んでもよい。チャネルは、その特定の波長における光の強度のデータ、面法線および深度を計算するための異なる偏光のデータ、またはピクセルの速度を計算するためのデータを提供してもよい。更に、各領域106A~Dは、例えば、特定の波長フィルタおよび特定の偏光フィルタなど、複数のフィルタタイプを含んでもよい。各領域106A~Dは、イメージセンサ102の特定のフォトサイトに対応してもよい。図1の例に示されるように、領域106Aは、更に詳細に後述するように、多様なフィルタタイプを有するフィルタのパターンを形成する、領域106A~Dの2×2のサブセットを含んでもよい。本開示は、特定の寸法のパターンを有するフィルタを記載し例証しているが、本開示は、例えば4×4、132×132、または1080×1080など、任意の好適な寸法を有するパターンを考慮する。
図2は、一例のフィルタアレイのスペクトル応答を示している。特定の実施形態では、フィルタアレイは、図2の例に示されるように、特定の波長範囲(スペクトルまたは色)の光に応答する、フィルタのモザイクを含んでもよい。一例として、限定ではないが、曲線202、204、および206はそれぞれ、赤色、緑色、および青色に対応するフィルタを有するフォトサイトのスペクトル応答に対応してもよい。波長208は、フィルタアレイの特徴に対する応答が大幅に低減されているであろう、波長範囲(例えば、オレンジ)に対応してもよい。
上述したように、フィルタアレイのフィルタは、特定の波長帯(例えば、曲線202に対応)の色を識別するのに使用されてもよい。一例として、限定ではないが、赤フィルタを有するフォトサイトは主に、曲線202によって示されるような、赤色の波長範囲に対応する入射光の部分に応答する。赤フィルタを有するフォトサイトから強力な信号を受信したことに基づいて、顕著な赤成分を有する対象物(例えば、赤の交通信号もしくは車)が識別されてもよい。同様に、緑フィルタを有するフォトサイトから強力な信号を受信したことに基づいて、顕著な緑成分を有する対象物が識別されてもよい。フィルタアレイの特定の色フィルタの組み合わせ次第では、フィルタの応答曲線内にない波長に対応する対象物(例えば、「セーフティオレンジ」色の建設コーン)は、色フィルタの応答(例えば、202~206)に対する波長(例えば、線208)の位置によって識別しづらいことがある。
図3は、一例のフィルタタイプの組み合わせを有するフィルタアレイを有するカメラの概略図を示している。シーンは、視野(FOV)または視錐台が重なり合う複数の光学カメラ(例えば、カメラ1およびカメラ2)を使用して、三次元(3D)で再構築されてもよい。ステレオ再構築は、視錐台が重なり合ったカメラから導き出される情報に基づいて得られる、深度および3D構造の知覚である。光学カメラは異なる横方向位置に位置するので、両眼視差により、2つの異なる視線に沿って見た対象物の見かけの位置には知覚される変位または差がある。変位は、脳の視覚皮質で処理されて深度知覚をもたらす。短縮遠近法により、異なる位置から観察したとき、近くの対象物は遠くの対象物よりも大きい両眼視差を示すので、両眼視差は距離を決定するのに使用することができる。
一例として、限定ではないが、カメラシステム300は、少なくとも部分的に重なり合う視錐台を有する複数の(例えば、2つを超える)光学カメラを含んでもよい。別の例として、車両の光学カメラは、3D視覚データを取得するため、所定数(例えば、6つ)の対として組織化されてもよい。特定の実施形態では、外部環境の3D再構築は、複数の(例えば、2つを超える)光学カメラの多重スペクトル多重偏光データからの画像データを使用して実施されてもよい。図3の例に示されるように、カメラシステム300は、FOVまたは視錐台の少なくとも部分的な重なりを有する複数のカメラ、カメラ1およびカメラ2を含んでもよい。一例として、限定ではないが、3D再構築は、各カメラ(カメラ1およびカメラ2)の複数チャネルデータストリームからの画像を使用して実施されてもよく、チャネルの数は、フィルタアレイ104Aおよび104Bのフィルタタイプの数に対応してもよい。図3の例に示されるように、ステレオカメラシステム300は更に、多様なフィルタタイプの組み合わせを有するフィルタアレイ104Aおよび104Bを使用して得られるチャネルを使用して、3D多重スペクトル多重偏光画像を再構築するためのデータを生成するように構成された、更に詳細に後述する、画像信号プロセッサ(ISP)304を含んでもよい。
各光学カメラ(例えば、カメラ1)は、イメージセンサと、入ってくる光をイメージセンサの焦点領域上に集光し合焦させる、レンズまたはレンズアセンブリとを含んでもよい。一例として、限定ではないが、光学カメラ(カメラ1およびカメラ2)は、光をイメージセンサ上に合焦させるのに、魚眼レンズ、超広角レンズ、広角レンズ、または標準レンズを含んでもよい。本開示は、特定のイメージセンサおよびフィルタアレイを有する特定の光学カメラを記載し例証しているが、本開示は、任意の好適な特徴を有する任意の好適なイメージセンサおよびフィルタアレイを有する、任意の好適な光学カメラを考慮する。
更に詳細に上述したように、カメラ1のイメージセンサは、フィルタタイプの特定の組み合わせを有するフィルタアレイ104Aを含んでもよい。特定の実施形態では、フィルタアレイ104Aは、フィルタアレイ104Bのフィルタタイプの組み合わせとは異なる、フィルタタイプの組み合わせを有してもよい。一例として、限定ではないが、フィルタアレイ104Aは、図3の例に示されるように、フィルタアレイ104Bの色の組み合わせとは異なる色の組み合わせを有してもよい。特定の実施形態では、フィルタアレイ104Aおよび104Bは、波長1、波長2、波長3、または波長4に対するフィルタを含んでもよいフィルタタイプの組み合わせを含む、N×N(Nは2以上)の領域のサブセットのパターンを含んでもよい。
特定の実施形態では、カメラ1のフィルタアレイは、建設コーン/標識のオレンジ、車線分割線または警告標識(例えば、歩行者用もしくはスクールゾーン標識など)の黄色、特定の青系の色(例えば、駐車もしくは障害者用標識など)、特定の赤系の色(例えば、停止標識もしくは交通信号など)など、任意の関心対象物の既知の色である関心色に対応する波長を含んでもよい。一例として、限定ではないが、カメラ1のフィルタアレイの関心色は、オレンジ色(または他の任意の関心色)に対応する波長範囲であってもよい。特定の実施形態では、フィルタアレイ104Aおよび104Bは、フィルタアレイ104Aおよび104Bの間で異なるモザイク内の空間位置を有する、参照フィルタタイプを含んでもよい。この場合、MLアルゴリズムは既知の位置オフセットを相殺してもよい。特定の実施形態では、フィルタアレイ104Aおよび104Bは、図3の例に示されるように、両方のフィルタアレイ104Aおよび104Bに共通であるモザイク内の空間位置を有する、参照フィルタタイプを含んでもよい。一例として、限定ではないが、2×2のパターンまたはモザイクの場合、104Aおよび104Bのモザイクの左下は、「透明」または可視スペクトルのフィルタを参照フィルタタイプとして含んでもよい。更に詳細に後述するように、可視スペクトルフィルタに対応するフォトサイトからのデータは、重なり合う視錐台を有する2つ以上のカメラ(例えば、カメラ1およびカメラ2)におけるピクセル間の対応を確立し、フィルタアレイ104Aおよび104Bのフィルタタイプの複合データを含む、多重スペクトル多重偏光画像を生成するのに使用されてもよい。本開示は、特定の参照または共通フィルタタイプを有するフィルタアレイを記載し例証しているが、本開示は、例えば、特定のスペクトル(色)もしくは偏光など、任意の好適な参照または共通フィルタタイプを考慮する。
図4は、カメラシステムの一例の概略図を示している。図4の例に示されるように、各光学カメラ(例えば、カメラ1およびカメラ2)は、それぞれの同軸ケーブルを介した電源供給(PoC)のシリアルリンク404を通して、カメラインターフェース基板(CIB)402に接続されてもよい。特定の実施形態では、CIB 402は、車両内または車両外(例えば、屋根)でセンサアレイ内に搭載されてもよい。更に、CIB 402は、そのシリアルリンク(例えば、404)に接続された、それぞれの光学カメラ(例えば、カメラ1)に送信される電力、ならびにタイミングおよび制御(例えば、IC)データと、それぞれの光学カメラ(例えば、カメラ1)から受信される画像/映像データ(例えば、MIPI)とを多重化してもよい。CIB 402に結合されたタイミングシステム406は、それぞれのシリアルリンク404を通して、同期(シンク)パルスをカメラ1およびカメラ2に提供する。更に、タイミングシステム406は、メインコンピュータ408に結合され、重なり合う視錐台を有する光学カメラによって取得されるデータのタイムスタンプ情報を提供する。特定の実施形態では、外界とのインターフェースのメインコンピュータ408が、車両の機能全体を制御する。本開示は、構成要素の特定の構成を有する特定のカメラシステムを記載し例証しているが、本開示は、構成要素の任意の好適な構成を有する任意の好適なカメラシステムを考慮する。
特定の実施形態では、CIB 402は、イメージセンサからのデータを処理して、フィルタタイプの多様な組み合わせからのデータを組み合わせる複合データを生成するように構成された、更に詳細に上述したISPを含んでもよい。特定の実施形態では、関心の特徴またはフィルタタイプをフィルタアレイのモザイクに含めることによって、ISPを使用せずに対象物を検出することを可能にしてもよい。特定の実施形態では、機械学習(ML)アルゴリズムは、関心色を有する対象物を検出し、これらの対象物を含有する画像の部分のみを処理することができてもよい。一例として、限定ではないが、アルゴリズムは、オレンジの交通コーンを含む画像の部分のみを処理することができてもよい。特定の実施形態では、関心色を有する対象物は、ISPを使用することなく、フォトサイトからのデータを使用して、これらのフォトサイトからのデータ(例えば、強度に比例する信号)の値が所定の閾値よりも大きいことに基づいて検出されてもよい。一例として、限定ではないが、MLアルゴリズムは、三角形に関するデータの値が所定の閾値を上回ることに基づいて、これらの形状の数を識別することによって、路上の交通コーンを検出することができてもよい。更に、MLアルゴリズムは、検出された対象物を取り囲む領域に対応する全スペクトルデータを処理して、車両が作業区域を通るのをナビゲートしてもよい。
ISPは、各フォトサイトに存在しない特徴またはフィルタタイプに対応するデータを外挿するように構成されてもよい。例えば、ISPは、隣接するフォトサイトからのデータに基づいて、赤フィルタを有するフォトサイトに対して、青および緑成分に対応するデータを内挿してもよい。更に、複数のカメラによって取得される各画像のピクセルに対して、ISPは、更に詳細に後述するように、各々の画像で利用可能なチャネルの全てに対応するデータを組み合わせて、一連の複合データまたは特徴マップにするように構成されてもよい。特定の実施形態では、複数のカメラ(例えば、カメラ1およびカメラ2)によって取得される各画像のピクセルに対して、ISPは、各々の画像で利用可能なチャネルの全てを外挿し、ならびに直接測定できない特性に対する値を導き出すように構成されてもよい。一例として、限定ではないが、ISPは、異なる偏光特徴を含むフィルタアレイからのデータに基づいて、各ピクセルの面法線を推定するように構成されてもよい。更に、ISPは、ピクセルの深度、ピクセルと関連付けられた速度を推定するか、またはオクルージョンマスクを推定してもよい。特定のシーンに対するオクルージョンマスクは、シーンにおける特定のピクセルが、シーンの少なくとも一部を取得する他の光学カメラの画像において可視であるか否かの情報を提供する。
図5は、一例のコスト計算を示している。特定の実施形態では、メインコンピュータまたは他のコンピューティングシステムは、多様なフィルタアレイからの複合データに基づいて、直接測定できない特性に対する値を導き出してもよい。一例として、限定ではないが、コンピューティングシステムは、異なる偏光フィルタタイプを有するフィルタアレイからのデータに基づいて、各ピクセルの面法線を推定するように構成されてもよい。更に、コンピューティングシステムは、ピクセルの深度、ピクセルと関連付けられた速度を推定するか、またはオクルージョンマスクを推定してもよい。特定のシーンに対するオクルージョンマスクは、シーンにおける特定のピクセルが、シーンの少なくとも一部を取得する他の光学カメラの画像において可視であるか否かの情報を提供する。
深度マップは、視野(FOV)内の対象物の表面に対応する、各ピクセルの距離に関連する情報を含有する、画像または画像チャネルである。特定の実施形態では、深度情報は、画像に対するコストボリュームを計算することによって決定されてもよい。コストボリュームは、各々のピクセルにおけるコストの値を有する、3D(例えば、x、y、および視差ΔX)ルックアップテーブルである。コストボリュームは、x、y、および視差(ΔX)の関数である、単一の画像に対するコストの計算である。コスト(x、y、ΔX)はまた、第1の画像のx、yにおけるピクセルが他のいくつかの画像のピクセルとどの程度良好に一致するかの指標であってもよい(他の画像で比較するピクセルまたはピクセルのパッチの位置は、視差の関数である)。コストは、ピクセルのデータ(例えば、強度)に基づいて計算されてもよい。特定の実施形態では、視差の各値に対するコストは、ピクセルデータの絶対差の合計として計算されてもよい。特定の実施形態では、可視スペクトルピクセルからのデータは、フィルタアレイのフィルタ処理によって影響を受けないので、コストボリュームは、これらのピクセルに対応するイメージセンサのフォトサイトによって取得されるデータに基づいて計算されてもよい。特定の実施形態では、各ピクセルに対する特定の視差値を選択する、コスト集約が実施される。図5の例に示されるように、コスト502は視差ΔXの関数として計算されてもよい。特定の実施形態では、視差ΔXの「適正」値は、最低コスト504のΔX値であってもよい。いくつかの例では、ほぼ同じコスト502を有する視差ΔXのいくつかの値がある。特定の実施形態では、視差ΔXの最良値は、コストボリュームがピクセル類似度に対するコストを最小限に抑えるように、各々のピクセルにおける視差ΔXの値を求めるより大きいシステムに、コストボリュームを組み込むことによって決定されてもよく、特定の実施形態では、解の全体的な滑らかさを測定する他のコスト項を含んでもよい。換言すれば、滑らかな3D表面の場合、隣接するピクセルの視差ΔXが類似していることが予期される。
ΔXの値を決定することで、シーンを取得し、外部環境の多視点ステレオ再構築に使用される、画像中のピクセル間の空間的対応の情報が提供される。特定の実施形態では、深度情報は、対応する画像におけるピクセル間の空間的相関を決定するのに使用されてもよく、異なるフィルタアレイまたはカメラ(例えば、2つ以上)によって取得される特徴に対する値は、フル解像度の多重スペクトル多重偏光画像の各ピクセルに割り当てられてもよい。換言すれば、第1のイメージセンサで特定のフォトサイトによって取得される赤の値、および第2のイメージセンサで特定の偏光を有する対応するフォトサイトによって取得される強度値が、多重スペクトル多重偏光画像のピクセルに割り当てられてもよい。一例として、限定ではないが、ハーフ解像度画像は、フィルタアレイのN×Nのモザイクからのデータを組み合わせて単一のピクセルにすることによって生成されてもよく、その場合、単一のピクセルは、N×Nのモザイクの特徴全てからのデータを含む。一例として、限定ではないが、第1のカメラのフィルタアレイの特徴は、可視スペクトル、赤、青、およびオレンジの、N×Nのスペクトルの組み合わせを含んでもよい。第2のカメラは、可視スペクトル、赤、青、および緑に対応する特徴のN×Nのモザイクを含むフィルタアレイを有してもよい。深度が両方の画像で推定されると、可視スペクトル、赤、青、緑、およびオレンジのフィルタタイプに対して取得されたデータを有する、ピクセルを含むハーフ解像度画像が生成されてもよい。
特定の実施形態では、シーンの第1の画像におけるピクセルの深度が推定された後、ISPまたはMLアルゴリズムは、対応するピクセルが第2の画像に現れる位置を決定することができ、または第2のカメラがオクルージョンマスクに基づいてピクセルを取得できないと決定することができる。換言すれば、深度の推定は、対応するピクセルからのデータの内挿、またはデモザイクを支援する。本開示は、特定の特徴の組み合わせを有するフィルタアレイを記載し例証しているが、本開示は、例えば色、偏光、または熱など、特徴の任意の好適な組み合わせを有する任意の好適なフィルタアレイを考慮する。これらの特徴は、シーンの深度マップを計算する情報を提供してもよく、マップは次に、データのデモザイク、または特定のピクセルによって直接測定されない特徴の内挿を実施するのに使用されてもよい。
特定の実施形態では、異なる偏光を使用してフィルタ処理される入射光からのデータを同時に取得することで、より正確な3D再構築が可能になる。一例として、限定ではないが、異なる偏光を有するデータの解析によって、面法線推定が改善されることがあるが、純粋に物理学に基づくモデルには曖昧さが残り、それはMLアルゴリズムを使用して解決することができる。各偏光タイプ(例えば、垂直または45°)からの画像データは異なる情報を提供し、それは次に、面法線を決定するのに使用されてもよい。特定の実施形態では、生の偏光データをMLアルゴリズムに直接適用して、面法線が抽出され、深度マッピングが改善されてもよい。異なる偏光を通して画像データを獲得することで、光学カメラの視錐台における特徴なしの対象物を検出する助けとなる、より正確な深度マッピングが可能になる。複数のカメラからのデータを3D再構築する場合、第1の光学カメラの視錐台における特定の位置と、他の光学カメラの視錐台における対応する位置との識別は、特に、特徴がない対象物上の位置を識別するのを支援する目立った特徴が不足している、特徴がない対象物(例えば、白い壁)の場合、困難なことがある。異なる偏光を有するフィルタを通して取得される画像データは、3D環境を再構築するための制約条件として使用する、面法線の推定値を得るのに使用されてもよい。
特定の実施形態では、偏光フィルタは、1つまたは複数の光学カメラのフィルタアレイと統合されてもよい。一例として、限定ではないが、フィルタのN×Nの各サブセット内にある各フィルタは、異なる偏光を有してもよい。一例として、限定ではないが、第1のフィルタタイプは垂直偏光または90°であってもよく、第2のフィルタタイプは水平偏光または0°であってもよく、第3のフィルタタイプは45°偏光であってもよい。偏光されたフィルタを使用することで、異なる偏光を使用してフィルタ処理された入射光からデータを同時に獲得することが可能になってもよく、これは、シーン内の対象物が移動している場合に映像またはシーンを取得するのに有用である。対照的に、多重偏光データは、連続画像の間で回転させられる、調節可能な偏光フィルタを有する単一のカメラによって取得されてもよいが、この場合、映像を取得することは不可能である。各偏光タイプ(例えば、垂直、水平、または45°)からの画像データは異なる情報を提供し、それは面法線を決定するのに使用されてもよい。特定の実施形態では、面法線は、異なる偏光フィルタタイプからのデータを使用して推定されてもよい。面法線は、深度の推定を改良して、更に詳細に上述した、深度マップを生成するのに使用されてもよく、または対象物検出のためのMLアルゴリズムへの入力として使用されてもよい。
特定の実施形態では、更に詳細に後述する、ISPによって生成されるテンソルは、クラス分布を推定するMLアルゴリズムへの入力に含まれてもよい。特定の実施形態では、フィルタアレイの特徴を用いてISPによって生成されるテンソルは、ピクセルまたはピクセル群がシーンにおける対象物の特定のクラス(例えば、車もしくは木)に対応するという予測である、対象物分類に使用されてもよい。一例として、限定ではないが、ISPは、真/偽どちらかの値(例えば、0もしくは1)を含むインデックス、またはピクセル群が対象物の特定のクラスに対応する確率を有する、テンソルを生成してもよい。特定の実施形態では、複合データを有するテンソルはまた、シーン内の対象物のクラスだけではなく、それらのクラスの空間位置に関する追加情報も提供する、局所化/検出を実施するのに使用されてもよい。特定の実施形態では、複合データを有するテンソルはまた、各ピクセルにそれが包含する対象物または領域の特定のクラスをラベル付けすることができるように、各々のピクセルに対するラベルを推論する、セマンティックセグメンテーションに使用されてもよい。
テンソルは、テンソルのインデックスの数に対応する、関連するランクを有する。例えば、ランク0のテンソルはスカラーであり、ランク1のテンソルはベクトルであり、ランク2のテンソルは2Dアレイである。特定の実施形態では、ISPは、空間座標(例えば、xおよびy座標)と、データの1つまたは複数のチャネルとを含むテンソルを生成してもよく、チャネルに対応する第3のインデックスCは複数の値を有してもよい。一例として、限定ではないが、C=0は赤に対応してもよく、C=1は緑に対応してもよく、C=2は青に対応してもよく、C=3は深度に対応してもよく、またはC=4は面法線のx成分に対応してもよい。特定の実施形態では、MLアルゴリズムは、複合データを有するテンソルに対して畳み込みを実施し、追加の特徴または特徴マップを含む新しいテンソルを生成してもよい。畳み込みは、1つの形状またはランクを有するテンソルを入力として取ってもよく、一般的に、ランクは同じであるが形状または充填指数の数が異なるテンソルを出力する。一例として、限定ではないが、畳み込み後、テンソルは、赤、緑、青、他の関心色、熱、偏光、法線、深度、速度、または他の好適な特徴に対応するデータを含んでもよい。
本明細書に記載する実施形態は、3D再構築および対象物検出に対する利益を提供する。特定の実施形態では、ISPによって生成される、多様なフィルタアレイの特徴の複合データを含むテンソルは、MLアルゴリズムに直接適用されてもよい。一例として、限定ではないが、これらのフォトサイトからのデータは、ベイヤーカラーフィルタの原色(例えば、赤、緑、および青)以外の色に対応するデータを外挿するのに、ISPによる処理を要しないことがある。特定の実施形態では、MLアルゴリズムは、特定の対象物のスペクトルシグネチャに一致する複合データに基づいて、対象物を検出してもよい。一例として、限定ではないが、シーン内の交通コーンは、交通コーンのスペクトルシグネチャに一致するテンソルの複合データに基づいて検出されてもよい。
図6は、関心対象物を検出する一例の方法を示している。方法600は、段階610で始まってもよく、コンピューティングシステムは、第1のフィルタパターンを有する第1のフィルタアレイを有する第1のイメージセンサによって生成された、第1の画像データにアクセスしてもよい。特定の実施形態では、第1のフィルタパターンは、関心色(例えば、オレンジ)に対応する第1のフィルタタイプと、第2のフィルタタイプとを含む。一例として、限定ではないが、第2のフィルタタイプは透明フィルタであってもよい。段階620で、コンピューティングシステムは、第1のフィルタパターンとは異なる第2のフィルタパターンを有する第2のフィルタアレイを有する第2のイメージセンサによって生成された、第2の画像データにアクセスしてもよい。特定の実施形態では、第2のフィルタパターンは第2のフィルタタイプを含む。更に、第2のフィルタパターンは、原色にそれぞれ対応する第3および第4のフィルタタイプを含んでもよい。
段階630で、コンピューティングシステムは、第2のフィルタタイプと関連付けられた第1の画像データの部分、および第2のフィルタタイプと関連付けられた第2の画像データの部分に基づいて、第1の画像データの1つまたは複数の第1のピクセルと第2の画像データの1つまたは複数の第2のピクセルとの間の対応を決定する。特定の実施形態では、第1の画像データおよび第2の画像データの部分は、フィルタパターンの透明フィルタからのものである。段階635で、コンピューティングシステムは、第2のフィルタタイプのデータに基づいて、第1の画像データおよび第2の画像データの深度情報を計算する。段階645で、コンピューティングシステムは、第1の画像データと第2の画像データとの間の空間オフセットを決定する。特定の実施形態では、第1および第2の画像データの深度情報は、計算された空間オフセットを通して決定されてもよい。
段階650で、コンピューティングシステムは、対応に基づいて、第1の画像データおよび第2の画像データを使用して複合データを生成する。特定の実施形態では、複合画像データは、第1のフィルタパターンのフィルタタイプおよび第2のフィルタパターンのフィルタタイプからのデータの組み合わせである。段階660で、コンピューティングシステムは、複合データに基づいて、関心色を有する1つまたは複数の対象物を検出する。特定の実施形態では、MLアルゴリズムは、複合データに含まれるスペクトルシグネチャに基づいて、対象物を検出する。
特定の実施形態は、適切な場合、図6の方法の1つまたは複数の段階を繰り返してもよい。本開示は、特定の順序で起こるものとして図6の方法の特定の段階を記載し例証しているが、本開示は、任意の好適な順序で起こる図6の方法の任意の好適な段階を考慮する。更に、本開示は、図6の方法の特定の段階を含む、関心対象物を検出する一例の方法を記載し例証しているが、本開示は、適切な場合、図6の方法の段階の全てもしくはいくつかを含んでもよい、またはいずれも含まなくてもよい任意の好適な段階を含む、関心対象物を検出する任意の好適な方法を考慮する。更に、本開示は、図6の方法の特定の段階を実施する特定の構成要素、デバイス、またはシステムを記載し例証しているが、本開示は、図6の方法の任意の好適な段階を実施する、任意の好適な構成要素、デバイス、またはシステムの任意の好適な組み合わせを考慮する。
本明細書に記載する実施形態は、様々な文脈で適用可能であり、輸送車両(自律、マニュアル、または半自律運転)で使用される撮像および知覚システム、ロボットシステム、ならびに/あるいは周囲環境の正確な特性付けおよび知覚を利用する任意の好適な用途など、画像から導き出される情報を利用する任意のシステムまたは方法に有益であり得る。一例として、限定ではないが、図7は、多重スペクトル多重偏光イメージングシステムを使用してもよい、輸送管理環境の一例のブロック図を示している。特定の実施形態では、環境は、ユーザ701(例えば、乗車提供側もしくは要求側)のユーザコンピューティングデバイス730、輸送管理システム760、自律車両740、および1つまたは複数の第三者システム770など、様々なコンピューティングエンティティを含んでもよい。コンピューティングエンティティは、任意の好適なネットワーク710を通じて通信接続されてもよい。一例として、限定ではないが、ネットワーク710の1つまたは複数の部分は、アドホックネットワーク、エクストラネット、仮想私設ネットワーク(VPN)、ローカルエリアネットワーク(LAN)、無線LAN(WLAN)、広域ネットワーク(WAN)、無線WAN(WWAN)、メトロポリタンエリアネットワーク(MAN)、インターネットの一部分、公衆交換電話網(PSTN)の一部分、セルラーネットワーク、または上記の任意の組み合わせを含んでもよい。特定の実施形態では、コンピューティングエンティティが互いに通信できるようにする、任意の好適なネットワーク構成およびプロトコルが使用されてもよい。図7は、単一のユーザデバイス730、単一の輸送管理システム760、車両740、複数の第三者システム770、および単一のネットワーク710を示しているが、本開示は、任意の好適な数のこれらのエンティティそれぞれを考慮する。一例として、限定ではないが、ネットワーク環境は、複数のユーザ701、ユーザデバイス730、輸送管理システム760、自律車両740、第三者システム770、およびネットワーク710を含んでもよい。
特定の実施形態では、輸送管理システム760は、1つまたは複数のサーバコンピュータを含んでもよい。各サーバは、単一のサーバ、または複数のコンピュータもしくは複数のデータセンタにまたがる分散型サーバであってもよい。サーバは、例えば、非限定的に、ウェブサーバ、ニュースサーバ、メールサーバ、メッセージサーバ、広告サーバ、ファイルサーバ、アプリケーションサーバ、交換サーバ、データベースサーバ、プロキシサーバ、本明細書に記載する機能もしくはプロセスを実施するのに適した別のサーバ、またはそれらの任意の組み合わせなど、様々なタイプのものであってもよい。特定の実施形態では、各サーバは、ハードウェア、ソフトウェア、あるいはサーバによって実装または支援される適切な機能性を実施する、組込み論理構成要素または2つ以上のかかる構成要素の組み合わせを含んでもよい。特定の実施形態では、輸送管理システム760は、1つまたは複数のデータストアを含んでもよい。特定の実施形態では、データストアに格納された情報は、特定のデータ構造にしたがって組織化されてもよい。特定の実施形態では、各データストアは、関係、カラム型、相関、または他の任意の好適なタイプのデータベースシステムであってもよい。本開示は、特定のタイプのデータベースを記載または例証しているが、本開示は、任意の好適なタイプのデータベースを考慮する。
特定の実施形態では、車両740は、自律車両であって、センサのアレイ744と、ナビゲーションシステム746と、乗車サービスコンピューティングデバイス748とを具備してもよい。特定の実施形態では、一団の自律車両740が輸送管理システム760によって管理されてもよい。一団の自律車両740は、全体または一部が、輸送管理システム760と関連付けられたエンティティによって所有されてもよく、または輸送管理システム760に関連する第三者エンティティによって所有されてもよい。いずれの場合も、輸送管理システム760は、例えば、乗車要求を満たすように選択車両740を派遣すること、車両740に指示して選択動作(例えば、サービスセンターもしくは充電/給油ステーションに向かう、停車する、直ちに停止する、自己診断する、車室をロック/ロック解除する、音楽ラジオ局を変更する、温度を変更する、および他の任意の好適な動作)を実施させること、車両740に指示して選択動作モード(例えば、通常の動作、低速で走行、人間のオペレータの命令で走行、および他の任意の好適な動作モード)を入力させることを含む、自律車両740の動作を制御してもよい。
特定の実施形態では、車両740は、輸送管理システム760および第三者システム770からデータを受信し、またそれらにデータを送信してもよい。受信データの例としては、例えば、命令、新しいソフトウェアもしくはソフトウェア更新、マップ、3Dモデル、訓練済みもしくは訓練されていない機械学習モデル、位置情報(例えば、乗車要求側、自律車両740自体、他の自律車両740、およびサービスセンターなどの目的地の位置)、ナビゲーション情報、交通情報、気象情報、娯楽コンテンツ(例えば、音楽、ビデオ、およびニュース)、乗車要求側情報、乗車情報、ならびに他の任意の好適な情報を挙げることができる。自律車両740から送信されるデータの例としては、例えば、遠隔測定およびセンサデータ、かかるデータに基づいた決定/判定、車両条件または状態(例えば、電池/燃料レベル、タイヤおよびブレーキ条件、センサ条件、速度、走行距離計など)、位置、ナビゲーションデータ、乗客の入力(例えば、車両740のユーザインターフェースを通して、乗客は、輸送管理システム760および/または第三者システム770にデータを送受信してもよい)、ならびに他の任意の好適なデータを挙げることができる。
特定の実施形態では、自律車両740は、センサ/遠隔測定データを得て処理してもよい。かかるデータは、任意の好適なセンサによって取得されてもよい。例えば、車両740は、360°回転して、パルスレーザー光を放射し、車両740周囲の対象物からの反射光を測定するように構成された、複数のLiDAR送受信機のLiDARセンサアレイを有してもよい。特定の実施形態では、LiDAR送信信号は、光回折の原理を使用して光線を方向付けるMEMデバイスであってもよい、ゲーテッドライトバルブ(gated light valve)を用いて誘導されてもよい。かかるデバイスは、自律車両の周囲360°で光線を誘導するのにジンバル式ミラーを使用しないことがある。それよりもむしろ、ゲーテッドライトバルブは、光線を自律車両の周囲における多数の離散的な位置へと方向付けることができるように配置されてもよい、複数の光ファイバのうち1つへと光線を方向付けてもよい。それにより、自律車両の周囲360°でデータが取得されてもよいが、回転部品は不要であってもよい。LiDARは、標的までの距離を測定するのに有効なセンサであり、そのため、自律車両740の外部環境の三次元(3D)モデルを生成するのに使用されてもよい。一例として、限定ではないが、3Dモデルは、センサ配置の最大範囲(例えば、50、100、または200メートル)以内の他の車、縁石、岩屑、物体、および歩行者などの対象物を含む外部環境を表してもよい。別の例として、自律車両740は、異なる方向を指す光学カメラを有してもよい。カメラは、例えば、道路、車線区分線、道路標識、交通信号、警察、他の車両、および他の任意の目に見える関心対象物を認識するのに使用されてもよい。車両740が夜間に「見る」ことができるようにするため、赤外線カメラが据え付けられてもよい。特定の実施形態では、車両は、例えば、路上の歩行者または木の枝などの危険を見分ける、ステレオ視を具備してもよい。別の例として、車両740は、例えば、遠くの他の車両および/または危険を検出する、レーダーを有してもよい。更に、車両740は、例えば、駐車および障害物検出のための、超音波機器を有してもよい。車両740が、周囲の外部世界を検出、測定、および理解できるようにするセンサに加えて、車両740は更に、車両自体の状態および条件を検出し自己診断するためのセンサを具備してもよい。例えば、車両740は、例えば速度を測定するホイールセンサ、例えば車両の現在の地理位置を決定する全地球測位システム(GPS)、ならびに/あるいは移動もしくは運動検出のための慣性測定ユニット、加速度計、ジャイロスコープ、および/または走行距離計システムを有してもよい。これらのセンサの記載は有用性の特定の例を提供するが、当業者であれば、センサの有用性はそれらの例に限定されないことを認識するであろう。更に、有用性の一例は特定のタイプのセンサに関して記載されることがあるが、有用性は、センサの任意の組み合わせを使用して達成されてもよいことが認識されるべきである。例えば、自律車両740は、輸送管理システム760または第三者システム770から得られる予め生成されたマップとともに、自身のLiDAR、レーダー、ソナー、およびカメラからのデータに基づいて、周囲環境の3Dモデルを構築してもよい。センサ744は、図7では、自律車両740の特定の位置に見えているが、センサ744は、自律車両740の中または上の任意の好適な位置に位置してもよい。センサの位置の例としては、フロントおよびリアバンパー、ドア、フロントガラス、サイドパネル上、または他の任意の好適な位置が挙げられる。
特定の実施形態では、自律車両740は、処理装置(例えば、1つまたは複数のCPUおよびGPU)と、メモリと、記憶装置とを具備してもよい。このように、車両740は、センサデータの処理、有用な情報の抽出、および適宜の動作を含む、様々な計算および処理タスクを実施するように装備されてもよい。例えば、カメラおよびマシンビジョンモデルによって取得される画像に基づいて、車両740は、歩行者、他の車両、車線、縁石、および他の任意の関心対象物など、画像によって取得される特定のタイプの対象物を識別してもよい。
図8は、一例のコンピュータシステムを示している。特定の実施形態では、1つまたは複数のコンピュータシステム800は、本明細書に記載または例証される1つまたは複数の方法の1つもしくは複数の段階を実施する。特定の実施形態では、1つまたは複数のコンピュータシステム800は、本明細書に記載または例証される機能性を提供する。特定の実施形態では、1つまたは複数のコンピュータシステム800で稼働するソフトウェアは、本明細書に記載または例証される1つまたは複数の方法の1つもしくは複数の段階を実施するか、あるいは本明細書に記載または例証される機能性を提供する。特定の実施形態は、1つまたは複数のコンピュータシステム800の1つもしくは複数の部分を含む。本明細書では、コンピュータシステムに対する言及は、適切な場合、コンピューティングデバイスを包含してもよく、その逆もまた真である。更に、コンピュータシステムに対する言及は、適切な場合、1つまたは複数のコンピュータシステムを包含してもよい。
本開示は、任意の好適な数のコンピュータシステム800を考慮する。本開示は、任意の好適な物理的形態を取るコンピュータシステム800を考慮する。一例として、限定ではないが、コンピュータシステム800は、組込み型コンピュータシステム、システムオンチップ(SOC)、シングルボードコンピュータシステム(SBC)(例えば、コンピュータオンモジュール(COM)もしくはシステムオンモジュール(SOM)など)、デスクトップコンピュータシステム、ラップトップまたはノートブックコンピュータシステム、インタラクティブキオスク、メインフレーム、コンピュータシステムのメッシュ、移動電話、携帯情報端末(PDA)、サーバ、タブレットコンピュータシステム、拡張/仮想現実デバイス、あるいはこれらのうち2つ以上の組み合わせであってもよい。適切な場合、コンピュータシステム800は、1つもしくは複数のコンピュータシステム800を含むか、一体型または分散型であるか、複数の位置にまたがるか、複数の機械にまたがるか、複数のデータセンタにまたがるか、あるいは1つもしくは複数のクラウドコンポーネントを1つまたは複数のネットワークに含んでもよい、クラウドに常駐してもよい。適切な場合、1つまたは複数のコンピュータシステム800は、実質的に空間的または時間的な限定なしに、本明細書に記載または例証される1つまたは複数の方法の1つもしくは複数の段階を実施してもよい。一例として、限定ではないが、1つまたは複数のコンピュータシステム800は、リアルタイムまたはバッチモードで、本明細書に記載または例証される1つまたは複数の方法の1つもしくは複数の段階を実施してもよい。1つまたは複数のコンピュータシステム800は、適切な場合、異なる時間または異なる位置で、本明細書に記載または例証される1つまたは複数の方法の1つもしくは複数の段階を実施してもよい。
特定の実施形態では、コンピュータシステム800は、プロセッサ802と、メモリ804と、記憶装置806と、入力/出力(I/O)インターフェース808と、通信インターフェース810と、バス812とを含む。本開示は、特定の構成で特定の数の特定の構成要素を有する、特定のコンピュータシステムを記載し例証しているが、本開示は、任意の好適な構成で任意の好適な数の任意の好適な構成要素を有する、任意の好適なコンピュータシステムを考慮する。
特定の実施形態では、プロセッサ802は、コンピュータプログラムを作成するものなど、命令を実行するためのハードウェアを含む。一例として、限定ではないが、命令を実行するには、プロセッサ802は、内部レジスタ、内部キャッシュ、メモリ804、または記憶装置806から命令を検索し(もしくは取り出し)、それらを復号し実行し、次に1つまたは複数の結果を、内部レジスタ、内部キャッシュ、メモリ804、または記憶装置806に書き込んでもよい。特定の実施形態では、プロセッサ802は、データ、命令、またはアドレスのための1つもしくは複数の内部キャッシュを含んでもよい。本開示は、適切な場合、任意の好適な数の任意の好適な内部キャッシュを含むプロセッサ802を考慮する。一例として、限定ではないが、プロセッサ802は、1つまたは複数の命令キャッシュと、1つまたは複数のデータキャッシュと、1つまたは複数のトランスレーションルックアサイドバッファ(TLB)とを含んでもよい。命令キャッシュ内の命令は、メモリ804または記憶装置806内の命令のコピーであってもよく、命令キャッシュは、プロセッサ802によるそれらの命令の検索を高速化してもよい。データキャッシュ内のデータは、コンピュータ命令によって操作されるべきメモリ804もしくは記憶装置806内のデータのコピー、後に続く命令にアクセス可能なプロセッサ802によって実行された、またはメモリ804もしくは記憶装置806に書き込むための以前の命令の結果、あるいは他の任意の好適なデータであってもよい。データキャッシュは、プロセッサ802による読出しまたは書込み動作を高速化してもよい。TLBは、プロセッサ802のための仮想アドレス変換を高速化してもよい。特定の実施形態では、プロセッサ802は、データ、命令、またはアドレスのための1つもしくは複数の内部レジスタを含んでもよい。本開示は、適切な場合、任意の好適な数の任意の好適な内部レジスタを含むプロセッサ802を考慮する。適切な場合、プロセッサ802は、1つもしくは複数の論理演算装置(ALU)を含むか、マルチコアプロセッサであるか、または1つもしくは複数のプロセッサ802を含んでもよい。本開示は、特定のプロセッサを記載し例証しているが、本開示は、任意の好適なプロセッサを考慮する。
特定の実施形態では、メモリ804は、プロセッサ802が実行する命令、またはプロセッサ802が操作するデータを格納する、メインメモリを含む。一例として、限定ではないが、コンピュータシステム800は、命令を記憶装置806または別のソース(別のコンピュータシステム800など)からメモリ804にロードしてもよい。プロセッサ802は次に、命令をメモリ804から内部レジスタまたは内部キャッシュにロードしてもよい。命令を実行するため、プロセッサ802は、命令を内部レジスタまたは内部キャッシュから検索し、それらを復号してもよい。命令の実行中または実行後、プロセッサ802は、1つまたは複数の結果(中間結果もしくは最終結果であってもよい)を内部レジスタまたは内部キャッシュに書き込んでもよい。プロセッサ802は次に、それらの結果の1つまたは複数をメモリ804に書き込んでもよい。特定の実施形態では、プロセッサ802は、1つもしくは複数の内部レジスタまたは内部キャッシュ内、あるいはメモリ804内(記憶装置806または他の場所ではない)の命令のみを実行し、1つもしくは複数の内部レジスタまたは内部キャッシュ内、あるいはメモリ804内(記憶装置806または他の場所ではない)のデータのみを操作する。1つまたは複数のメモリバス(それぞれアドレスバスおよびデータバスを含んでもよい)は、プロセッサ802をメモリ804に結合してもよい。バス812は、更に詳細に後述するように、1つまたは複数のメモリバスを含んでもよい。特定の実施形態では、1つまたは複数のメモリ管理ユニット(MMU)は、プロセッサ802とメモリ804との間に常駐し、プロセッサ802の要求によってメモリ804にアクセスするのを容易にする。特定の実施形態では、メモリ804はランダムアクセスメモリ(RAM)を含む。このRAMは、適切な場合、揮発性メモリであってもよい。適切な場合、このRAMはダイナミックRAM(DRAM)またはスタティックRAM(SRAM)であってもよい。更に、適切な場合、このRAMはシングルポートまたはマルチポートRAMであってもよい。本開示は、任意の好適なRAMを考慮する。メモリ804は、適切な場合、1つまたは複数のメモリ804を含んでもよい。本開示は、特定のメモリを記載し例証しているが、本開示は、任意の好適なメモリを考慮する。
特定の実施形態では、記憶装置806は、データまたは命令のための大容量記憶装置を含む。一例として、限定ではないが、記憶装置806は、ハードディスクドライブ(HDD)、フロッピーディスクドライブ、フラッシュメモリ、光学ディスク、光磁気ディスク、磁気テープ、またはユニバーサルシリアルバス(USB)ドライブ、あるいはそれらのうち2つ以上の組み合わせを含んでもよい。記憶装置806は、適切な場合、取外し可能または取外し不能(固定)の媒体を含んでもよい。記憶装置806は、適切な場合、コンピュータシステム800の内部または外部であってもよい。特定の実施形態では、記憶装置806は不揮発性固体メモリである。特定の実施形態では、記憶装置806は読出し専用メモリ(ROM)を含む。適切な場合、このROMは、マスクプログラムROM、プログラマブルROM(PROM)、消去可能PROM(EPROM)、電気消去可能PROM(EEPROM)、電気的に書き換え可能なROM(EAROM)、またはフラッシュメモリ、あるいはこれらのうち2つ以上の組み合わせであってもよい。本開示は、任意の好適な物理的形態を取る大容量記憶装置806を考慮する。記憶装置806は、適切な場合、プロセッサ802と記憶装置806との間の通信を容易にする、1つまたは複数の記憶装置制御ユニットを含んでもよい。適切な場合、記憶装置806は、1つまたは複数の記憶装置806を含んでもよい。本開示は、特定の記憶装置を記載し例証しているが、本開示は、任意の好適な記憶装置を考慮する。
特定の実施形態では、I/Oインターフェース808は、コンピュータシステム800と1つまたは複数のI/Oデバイスとの間で通信するための、1つまたは複数のインターフェースを提供する、ハードウェア、ソフトウェア、または両方を含む。コンピュータシステム800は、適切な場合、これらのI/Oデバイスのうち1つまたは複数を含んでもよい。これらのI/Oデバイスのうち1つまたは複数は、人とコンピュータシステム800との間で通信できるようにしてもよい。一例として、限定ではないが、I/Oデバイスは、キーボード、キーパッド、マイクロフォン、モニタ、マウス、プリンタ、スキャナ、スピーカー、スチールカメラ、スタイラス、タブレット、タッチスクリーン、トラックボール、ビデオカメラ、別の好適なI/Oデバイス、またはこれらのうち2つ以上の組み合わせを含んでもよい。I/Oデバイスは1つまたは複数のセンサを含んでもよい。本開示は、任意の好適なI/Oデバイス、およびそれらのための任意の好適なI/Oインターフェース808を考慮する。適切な場合、I/Oインターフェース808は、プロセッサ802がこれらのI/Oデバイスのうち1つまたは複数を駆動できるようにする、1つもしくは複数のデバイスまたはソフトウェアドライバを含んでもよい。I/Oインターフェース808は、適切な場合、1つまたは複数のI/Oインターフェース808を含んでもよい。本開示は、特定のI/Oインターフェースを記載し例証しているが、本開示は、任意の好適なI/Oインターフェースを考慮する。
特定の実施形態では、通信インターフェース810は、コンピュータシステム800と1つもしくは複数の他のコンピュータシステム800または1つもしくは複数のネットワークとの間で通信(例えば、パケットベースの通信など)するための、1つまたは複数のインターフェースを提供する、ハードウェア、ソフトウェア、または両方を含む。一例として、限定ではないが、通信インターフェース810は、イーサネット(登録商標)または他の任意の有線ベースのネットワークと通信するための、ネットワークインターフェースコントローラ(NIC)またはネットワークアダプタ、あるいはWI-FI(登録商標)ネットワークなどの無線ネットワークと通信するための、無線NIC(WNIC)または無線アダプタを含んでもよい。本開示は、任意の好適なネットワーク、およびそのための任意の好適な通信インターフェース810を考慮する。一例として、限定ではないが、コンピュータシステム800は、アドホックネットワーク、パーソナルエリアネットワーク(PAN)、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、メトロポリタンエリアネットワーク(MAN)、またはインターネットの1つもしくは複数の部分、あるいはこれらのうち2つ以上の組み合わせを用いて通信してもよい。1つまたは複数のこれらのネットワークにおける1つもしくは複数の部分は、有線または無線であってもよい。一例として、コンピュータシステム800は、無線PAN(WPAN)(例えば、ブルートゥース(登録商標)WPANなど)、WI-FI(登録商標)ネットワーク、WI-MAXネットワーク、セルラー電話ネットワーク(例えば、汎欧州デジタル移動体通信システム(GSM(登録商標))ネットワークなど)、または他の任意の好適な無線ネットワーク、あるいはこれらのうち2つ以上の組み合わせを用いて通信してもよい。コンピュータシステム800は、適切な場合、これらのネットワークのうち任意のものに対する、任意の好適な通信インターフェース810を含んでもよい。通信インターフェース810は、適切な場合、1つまたは複数の通信インターフェース810を含んでもよい。本開示は、特定の通信インターフェースを記載し例証しているが、本開示は、任意の好適な通信インターフェースを考慮する。
特定の実施形態では、バス812は、コンピュータシステム800の構成要素を互いに結合する、ハードウェア、ソフトウェア、または両方を含む。一例として、限定ではないが、バス812は、アクセラレイテッドグラフィックスポート(AGP)または他の任意のグラフィックスバス、拡張業界標準アーキテクチャ(EISA)バス、フロントサイドバス(FSB)、ハイパートランスポート(HT)相互接続、業界標準アーキテクチャ(ISA)バス、インフィニバンド相互接続、低ピン数(LPC)バス、メモリバス、マイクロチャネルアーキテクチャ(MCA)バス、周辺構成要素相互接続(PCI)バス、PCIエクスプレス(PCIe)バス、シリアルアドバンストテクノロジーアタッチメント(SATA)バス、ビデオエレクトロニクススタンダーズアソシエーションローカル(VLB)バス、または別の好適なバス、あるいはそれらのうち2つ以上の組み合わせを含んでもよい。バス812は、適切な場合、1つまたは複数のバス812を含んでもよい。本開示は、特定のバスを記載し例証しているが、本開示は、任意の好適なバスまたは相互接続を考慮する。
本明細書では、コンピュータ可読非一時的記憶媒体は、適切な場合、1つもしくは複数の半導体ベースまたは他のタイプの集積回路(IC)(例えば、フィールドプログラマブルゲートアレイ(FPGA)もしくは特定用途向けIC(ASIC)など)、ハードディスクドライブ(HDD)、ハイブリッドハードドライブ(HHD)、光学ディスク、光学ディスクドライブ(ODD)、光磁気ディスク、光磁気ドライブ、フロッピーディスケット、フロッピーディスクドライブ(FDD)、磁気テープ、固体ドライブ(SSD)、RAMドライブ、セキュアデジタルカードもしくはドライブ、他の任意の好適なコンピュータ可読非一時的記憶媒体、あるいはこれらのうち2つ以上の任意の好適な組み合わせを含んでもよい。コンピュータ可読非一時的記憶媒体は、適切な場合、揮発性、不揮発性、または揮発性と不揮発性との組み合わせであってもよい。
本明細書では、「または」は、文脈による別段の明示または別段の指示がない限り、包括的であって排他的ではない。したがって、本明細書では、「AまたはB」は、文脈による別段の明示または別段の指示がない限り、「A、B、または両方」を意味する。更に、「および」は、文脈による別段の明示または別段の指示がない限り、共同および個別の両方である。したがって、本明細書では、「AおよびB」は、文脈による別段の明示または別段の指示がない限り、「共同的または個別的に、AおよびB」を意味する。
本開示の範囲は、当業者であれば理解するであろう、本明細書に記載または例証する例示的実施形態に対する全ての変更、置換、変形、修正、および改良を包含する。本開示の範囲は、本明細書に記載または例証する例示的実施形態に限定されない。更に、本開示は、特定の構成要素、要素、特徴、機能、動作、または段階を含むものとして、本明細書のそれぞれの実施形態を記載し例証しているが、これらの実施形態はいずれも、当業者であれば理解するであろう、本明細書の任意の箇所に記載または例証される構成要素、要素、特徴、機能、動作、または段階のうちいずれかの任意の組み合わせもしくは並べ替えを含んでもよい。更に、添付の特許請求の範囲における、特定の機能を実施するように適合された、配置された、可能である、構成された、可能にされた、動作可能な、または動作する、装置もしくはシステム、あるいは装置もしくはシステムの構成要素に対する言及は、装置、システム、または構成要素がそのように適合されるか、配置されるか、可能であるか、構成されるか、可能にされるか、動作可能であるか、または動作する限り、それもしくはその特定の機能が活性化されるか、始動されるか、またはロック解除されるか否かにかかわらず、装置、システム、構成要素を包含する。更に、本開示は、特定の利点を提供するものとして特定の実施形態を記載または例証しているが、特定の実施形態は、これらの利点を全く提供しなくても、または一部もしくは全てを提供してもよい。

Claims (20)

  1. コンピューティングシステムによって、
    第1のフィルタパターンを有する第1のフィルタアレイを有する第1のイメージセンサによって生成された第1の画像データにアクセスする段階であって、前記第1のフィルタパターンが、関心スペクトルに対応する第1のフィルタタイプと、第2のフィルタタイプとを有する、段階と、
    前記第1のフィルタパターンとは異なる第2のフィルタパターンを有する第2のフィルタアレイを有する第2のイメージセンサによって生成された第2の画像データにアクセスする段階であって、前記第2のフィルタパターンが複数の第2のフィルタタイプを有し、前記複数の第2のフィルタタイプおよび複数の前記第1のフィルタタイプが少なくとも1つの共通のフィルタタイプを有する、段階と、
    前記共通のフィルタタイプと関連付けられた前記第1の画像データの部分、および前記共通のフィルタタイプと関連付けられた前記第2の画像データの部分に基づいて、前記第1の画像データの1つまたは複数の第1のピクセルと前記第2の画像データの1つまたは複数の第2のピクセルとの間の対応を決定する段階と、
    前記対応に基づいて、前記第1の画像データおよび前記第2の画像データを使用して複合データを生成する段階であって、前記複合データが前記関心スペクトルに対応する前記第1のフィルタタイプのデータを有する、段階と、
    前記複合データに基づいて、前記関心スペクトルを有する1つまたは複数の対象物を検出する段階と
    を備える、方法。
  2. 前記第1の画像データまたは前記第2の画像データからの複数の偏光フィルタのデータに基づいて、前記第1の画像データおよび前記第2の画像データの深度情報を計算する段階を更に備える、請求項1に記載の方法。
  3. 前記深度情報を計算する段階が、前記共通のフィルタタイプと関連付けられた前記第1の画像データの前記部分、および前記共通のフィルタタイプと関連付けられた前記第2の画像データの前記部分に基づいて、前記第1の画像データのピクセルと前記第2の画像データの対応するピクセルとの間の空間オフセットを決定する段階を備える、請求項2に記載の方法。
  4. 前記1つまたは複数の対象物を検出する段階が、前記関心スペクトルに対応する前記第1のフィルタタイプのデータを、前記関心スペクトルを有する対象物の格納されたデータと比較する段階を備える、請求項1から3のいずれか一項に記載の方法。
  5. 前記第1のフィルタパターンおよび前記第2のフィルタパターンにおける前記第2のフィルタタイプの相対位置が同じである、請求項1から4のいずれか一項に記載の方法。
  6. 前記関心スペクトルに対応する前記第1のフィルタタイプが前記第2のフィルタパターンには存在しない、請求項1から5のいずれか一項に記載の方法。
  7. 第3の画像データにアクセスする段階であって、前記複合データを生成する段階が、1つまたは複数の追加のイメージセンサによって生成された1つもしくは複数の画像データを使用する段階を更に有し、前記1つまたは複数の追加のイメージセンサの少なくとも1つが、前記第1のフィルタパターンまたは前記第2のフィルタパターンとは異なる第3のフィルタパターンを有する第3のフィルタアレイを有する、段階を更に備える、請求項1から6のいずれか一項に記載の方法。
  8. 前記検出する段階が、機械学習アルゴリズムによって、前記複合データを1つまたは複数の関心対象物の格納された複合データと比較する段階を備える、請求項1から7のいずれか一項に記載の方法。
  9. 前記複合データと関連付けられた空間情報および前記複合データを有するテンソルを生成する段階を更に備える、請求項1から8のいずれか一項に記載の方法。
  10. 第1のフィルタパターンを有する第1のフィルタアレイを有する第1のイメージセンサによって生成された第1の画像データにアクセスする段階であって、前記第1のフィルタパターンが、関心スペクトルに対応する第1のフィルタタイプと、第2のフィルタタイプとを有する、段階と、
    前記第1のフィルタパターンとは異なる第2のフィルタパターンを有する第2のフィルタアレイを有する第2のイメージセンサによって生成された第2の画像データにアクセスする段階であって、前記第2のフィルタパターンが複数の第2のフィルタタイプを有し、前記複数の第2のフィルタタイプおよび複数の前記第1のフィルタタイプが少なくとも1つの共通のフィルタタイプを有する、段階と、
    前記共通のフィルタタイプと関連付けられた前記第1の画像データの部分、および前記共通のフィルタタイプと関連付けられた前記第2の画像データの部分に基づいて、前記第1の画像データの1つまたは複数の第1のピクセルと前記第2の画像データの1つまたは複数の第2のピクセルとの間の対応を決定する段階と、
    前記対応に基づいて、前記第1の画像データおよび前記第2の画像データを使用して複合データを生成する段階であって、前記複合データが前記関心スペクトルに対応する前記第1のフィルタタイプのデータを有する、段階と、
    前記複合データに基づいて、前記関心スペクトルを有する1つまたは複数の対象物を検出する段階と
    をコンピュータに実行させるプログラム。
  11. 前記第1の画像データまたは前記第2の画像データからの複数の偏光フィルタのデータに基づいて、前記第1の画像データおよび前記第2の画像データの深度情報を計算することを更にコンピュータに実行させる、請求項10に記載のプログラム。
  12. 前記共通のフィルタタイプと関連付けられた前記第1の画像データの前記部分、および前記共通のフィルタタイプと関連付けられた前記第2の画像データの前記部分に基づいて、前記第1の画像データのピクセルと前記第2の画像データの対応するピクセルとの間の空間オフセットを決定することを更にコンピュータに実行させる、請求項11に記載のプログラム。
  13. 前記関心スペクトルに対応する前記第1のフィルタタイプのデータを、前記関心スペクトルを有する対象物の格納されたデータと比較することを更にコンピュータに実行させる、請求項10から12のいずれか一項に記載のプログラム。
  14. 前記第1のフィルタパターンおよび前記第2のフィルタパターンにおける前記第2のフィルタタイプの相対位置が同じである、請求項10から13のいずれか一項に記載のプログラム。
  15. 前記関心スペクトルに対応する前記第1のフィルタタイプが前記第2のフィルタパターンには存在しない、請求項10から14のいずれか一項に記載のプログラム。
  16. コンピューティングシステムであって、
    1つまたは複数のプロセッサと、
    前記1つまたは複数のプロセッサのうち1つまたは複数に結合された1つまたは複数のコンピュータ可読非一時的記憶媒体であって、前記1つまたは複数のプロセッサのうち1つまたは複数によって実行されると、前記コンピューティングシステムに動作を実施させるように動作可能な命令を有する、1つまたは複数のコンピュータ可読非一時的記憶媒体と、を備え、前記動作が、
    第1のフィルタパターンを有する第1のフィルタアレイを有するイメージセンサによって生成された第1の画像データにアクセスする段階であって、前記第1のフィルタパターンが、関心スペクトルに対応する第1のフィルタタイプと、第2のフィルタタイプとを有する、段階と、
    前記第1のフィルタパターンとは異なる第2のフィルタパターンを有する第2のフィルタアレイをそれぞれ有する1つまたは複数の追加のイメージセンサによって生成された第2の画像データにアクセスする段階であって、前記第2のフィルタパターンが複数の第2のフィルタタイプを有し、前記複数の第2のフィルタタイプおよび複数の前記第1のフィルタタイプが少なくとも1つの共通のフィルタタイプを有する、段階と、
    前記共通のフィルタタイプと関連付けられた前記第1の画像データの部分、および前記共通のフィルタタイプと関連付けられた前記第2の画像データの部分に基づいて、前記第1の画像データの1つまたは複数の第1のピクセルと前記1つまたは複数の追加のイメージセンサによって生成された前記第2の画像データの1つまたは複数の第2のピクセルとの間の対応を決定する段階と、
    前記1つまたは複数の追加のイメージセンサによって、前記対応に基づいて、前記第1の画像データおよび前記第2の画像データを使用して複合データを生成する段階であって、前記複合データが前記関心スペクトルに対応する前記第1のフィルタタイプのデータを有する、段階と、
    前記複合データに基づいて、前記関心スペクトルを有する1つまたは複数の対象物を検出する段階と
    を備えるシステム。
  17. 前記1つまたは複数のプロセッサが、前記第1の画像データまたは前記第2の画像データからの複数の偏光フィルタのデータに基づいて、前記1つまたは複数の追加のイメージセンサによって生成された前記第1の画像データおよび前記第2の画像データの深度情報を計算するように更に動作可能である、請求項16に記載のシステム。
  18. 前記1つまたは複数のプロセッサが、前記共通のフィルタタイプと関連付けられた前記第1の画像データの前記部分、および前記共通のフィルタタイプと関連付けられた前記第2の画像データの前記部分に基づいて、前記1つまたは複数の追加のイメージセンサによって生成された前記第1の画像データのピクセルと前記第2の画像データの対応するピクセルとの間の空間オフセットを決定するように更に動作可能である、請求項17に記載のシステム。
  19. 前記1つまたは複数のプロセッサが、前記関心スペクトルに対応する前記第1のフィルタタイプのデータを、前記関心スペクトルを有する対象物の格納されたデータと比較するように更に動作可能である、請求項16から18のいずれか一項に記載のシステム。
  20. 前記第1のフィルタパターンおよび前記第2のフィルタパターンにおける前記第2のフィルタタイプの相対位置が同じである、請求項16から19のいずれか一項に記載のシステム。
JP2021523507A 2018-12-14 2019-12-05 色覚困難の知覚を改善する多重スペクトル多重偏光(msmp)フィルタ処理 Active JP7372322B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/221,414 US10708557B1 (en) 2018-12-14 2018-12-14 Multispectrum, multi-polarization (MSMP) filtering for improved perception of difficult to perceive colors
US16/221,414 2018-12-14
PCT/US2019/064746 WO2020123258A1 (en) 2018-12-14 2019-12-05 Multispectrum, multi-polarization (msmp) filtering for improved perception of difficult to perceive colors

Publications (2)

Publication Number Publication Date
JP2022512290A JP2022512290A (ja) 2022-02-03
JP7372322B2 true JP7372322B2 (ja) 2023-10-31

Family

ID=71073144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021523507A Active JP7372322B2 (ja) 2018-12-14 2019-12-05 色覚困難の知覚を改善する多重スペクトル多重偏光(msmp)フィルタ処理

Country Status (4)

Country Link
US (2) US10708557B1 (ja)
EP (1) EP3857870A4 (ja)
JP (1) JP7372322B2 (ja)
WO (1) WO2020123258A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019225080A1 (ja) * 2018-05-24 2019-11-28 ソニー株式会社 情報処理装置と情報処理方法およびプログラム
EP3578126B1 (en) * 2018-06-08 2023-02-22 Stryker European Operations Holdings LLC Surgical navigation system
JP6908793B2 (ja) * 2018-10-09 2021-07-28 富士フイルム株式会社 撮像装置
WO2021055585A1 (en) * 2019-09-17 2021-03-25 Boston Polarimetrics, Inc. Systems and methods for surface modeling using polarization cues
CN114766003B (zh) * 2019-10-07 2024-03-26 波士顿偏振测定公司 用于利用偏振增强传感器系统和成像系统的系统和方法
EP4066001A4 (en) * 2019-11-30 2024-01-24 Boston Polarimetrics Inc SYSTEMS AND METHODS FOR TRANSPARENT OBJECT SEGMENTATION USING POLARIZATION GUIDES
US11976939B2 (en) * 2020-10-12 2024-05-07 Nvidia Corporation High-definition maps and localization for road vehicles
CN115314617A (zh) * 2022-08-03 2022-11-08 Oppo广东移动通信有限公司 图像处理系统及方法、计算机可读介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011176710A (ja) 2010-02-25 2011-09-08 Sharp Corp 撮像装置
JP2015050494A (ja) 2013-08-30 2015-03-16 日立オートモティブシステムズ株式会社 撮像装置
JP2017046051A (ja) 2015-08-24 2017-03-02 株式会社デンソー 車載カメラ装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630806B2 (en) 1994-05-23 2009-12-08 Automotive Technologies International, Inc. System and method for detecting and protecting pedestrians
US7567271B2 (en) 2006-01-09 2009-07-28 Sony Corporation Shared color sensors for high-resolution 3-D camera
US20120188409A1 (en) * 2011-01-24 2012-07-26 Andrew Charles Gallagher Camera with multiple color sensors
CN104662589B (zh) 2012-08-21 2017-08-04 派力肯影像公司 用于使用阵列照相机捕捉的图像中的视差检测和校正的系统和方法
KR101611261B1 (ko) * 2013-12-12 2016-04-12 엘지전자 주식회사 스테레오 카메라, 이를 구비한 차량 운전 보조 장치, 및 차량
KR101641406B1 (ko) * 2013-12-30 2016-07-21 연세대학교 산학협력단 스테레오 카메라
US9113096B1 (en) * 2014-06-30 2015-08-18 Amazon Technologies, Inc. Single sensor two-sided camera
WO2016168378A1 (en) 2015-04-13 2016-10-20 Gerard Dirk Smits Machine vision for ego-motion, segmenting, and classifying objects
JP6566749B2 (ja) * 2015-07-01 2019-08-28 株式会社ソニー・インタラクティブエンタテインメント 撮像素子、イメージセンサ、および情報処理装置
EP3439301B1 (en) * 2016-03-30 2021-01-13 LG Electronics Inc. -1- Image processing apparatus and mobile terminal
KR102392751B1 (ko) 2017-03-07 2022-04-29 삼성전자 주식회사 카메라 모듈을 구비한 전자 장치 및 전자 장치 제어 방법
KR101831890B1 (ko) 2017-09-25 2018-02-26 공간정보기술 주식회사 스테레오 카메라를 사용해서 3차원 위치 기반 객체 식별 알고리즘을 응용한 유사도 측정 알고리즘의 정확도 향상 시스템
US11039122B2 (en) * 2018-09-04 2021-06-15 Google Llc Dark flash photography with a stereo camera

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011176710A (ja) 2010-02-25 2011-09-08 Sharp Corp 撮像装置
JP2015050494A (ja) 2013-08-30 2015-03-16 日立オートモティブシステムズ株式会社 撮像装置
JP2017046051A (ja) 2015-08-24 2017-03-02 株式会社デンソー 車載カメラ装置

Also Published As

Publication number Publication date
US10708557B1 (en) 2020-07-07
JP2022512290A (ja) 2022-02-03
EP3857870A4 (en) 2022-05-18
US20200404224A1 (en) 2020-12-24
EP3857870A1 (en) 2021-08-04
WO2020123258A1 (en) 2020-06-18
US20200195862A1 (en) 2020-06-18

Similar Documents

Publication Publication Date Title
JP7372322B2 (ja) 色覚困難の知覚を改善する多重スペクトル多重偏光(msmp)フィルタ処理
US11570416B2 (en) Multichannel, multi-polarization imaging for improved perception
Chen et al. Cooper: Cooperative perception for connected autonomous vehicles based on 3d point clouds
US11966673B2 (en) Sensor simulation and learning sensor models with generative machine learning methods
US11183067B2 (en) Image generating apparatus, image generating method, and recording medium
Heimberger et al. Computer vision in automated parking systems: Design, implementation and challenges
US11023788B2 (en) Systems and methods for estimating future paths
US11255952B2 (en) Image sensor processing using a combined image and range measurement system
US11961243B2 (en) Object detection using image alignment for autonomous machine applications
WO2019161300A1 (en) Detecting objects and determining confidence scores
CN112740268B (zh) 目标检测方法和装置
US11652982B2 (en) Applications for detection capabilities of cameras
US11948315B2 (en) Image composition in multiview automotive and robotics systems
JP2016009487A (ja) 立体画像に基づいて距離情報を求めるためのセンサシステム
US11308641B1 (en) Oncoming car detection using lateral emirror cameras
US11343485B1 (en) Virtual horizontal stereo camera
WO2017043331A1 (ja) 画像処理装置、及び、画像処理方法
CN116051780A (zh) 用于自主系统和应用的使用人工智能利用点云致密化的3d表面重建
CN117495972A (zh) 基于自适应投影误差的用于4d毫米波雷达和相机的外参标定
US20240022601A1 (en) Detecting identity spoofing attacks in multi-sensor systems and applications
CN118113036A (zh) 使用超声传感器用于自主系统及应用的传感器融合
CN116229390A (zh) 使用基于相机的输入用于自主系统和应用的基于深度学习的操作域验证
CN116048060A (zh) 用于自主系统和应用的使用神经网络基于真实世界数据的3d表面结构估计

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20210917

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231019

R150 Certificate of patent or registration of utility model

Ref document number: 7372322

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150