JP2008519371A - 集積された画像プロセッサ - Google Patents

集積された画像プロセッサ Download PDF

Info

Publication number
JP2008519371A
JP2008519371A JP2007540360A JP2007540360A JP2008519371A JP 2008519371 A JP2008519371 A JP 2008519371A JP 2007540360 A JP2007540360 A JP 2007540360A JP 2007540360 A JP2007540360 A JP 2007540360A JP 2008519371 A JP2008519371 A JP 2008519371A
Authority
JP
Japan
Prior art keywords
processor
substrate
pixel
integrated image
depth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007540360A
Other languages
English (en)
Other versions
JP2008519371A5 (ja
JP5306652B2 (ja
Inventor
ジョン アイゼルン ウッドフィル
ロナルド ジョン バック
ゲイル ギブソン ゴードン
ディヴィッド ウォルター ジュラセック
テレンス リー ブラウン
Original Assignee
ティジックス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ティジックス インコーポレイテッド filed Critical ティジックス インコーポレイテッド
Publication of JP2008519371A publication Critical patent/JP2008519371A/ja
Publication of JP2008519371A5 publication Critical patent/JP2008519371A5/ja
Application granted granted Critical
Publication of JP5306652B2 publication Critical patent/JP5306652B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/955Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Optical Radar Systems And Details Thereof (AREA)

Abstract

基板の上に実装された集積画像プロセッサが開示される。入力インターフェースは、2つ或いはそれより多い画像から画素データを受信するために構成される。基板の上に配置された画素ハンドリング・プロセッサは、画素データを深さ及び強度画素データに変換するように構成される。いくつかの実施例において、基板の上に配置された前景検知器プロセッサは、画素を、背景か、背景でないかに分類するために構成される。いくつかの実施例において、基板の上に配置された投射生成器は、深さ及び強度画素データの空間における投射を生成するために構成される。

Description

本発明は、集積画像プロセッサに関連する。
互いに僅かに分離された複数のカメラに起因する、同じシーンの2つ(又はそれより多い)画像の情報処理は、画像内の物体に対する深さ情報を発生できる。これらの画像の処理は、計算量的に大量であり、大きな量のデータの取り扱いを要求する。一般的に、この処理は、実質的な遅れを持つ。何故なら、その処理は、次のタイプの計算に動く前に、全体の画像に亘って1つのタイプの計算が実行されるような、一連の計算を伴うからである。さらに、これらの計算からの出力アレイは、通常大きく、時として、画像内の各位置に対して、深さ(depth)情報、強度(intensity)情報、及び、カラー情報を含む。出力アレイを削減して、後続の処理に対する計算要求を緩和することは有用である。レイテンシーを削減することによって実時間画像処理を可能とすることもまた、有用である。
<他の出願への相互参照>
本出願は、2004年11月3日に出願され、すべての目的のためにここに参照として取り込まれる、「ディープ・シーG2システムの概要」という名称の米国仮出願番号60/624,954(弁護士ドケット番号TYZXP001+)への優先権を請求する。
本発明は、工程、装置、システム、組成物、コンピュータ読取り可能な記憶媒体のようなコンピュータ読取り可能な媒体、または、プログラム命令が光又は電気通信リンクを介して送られるコンピュータ・ネットワーク、としての形を含む膨大なやり方で実施できる。本明細書では、これらの実施形態、又は、本発明が採りうる何らかの他の形式が、技術(techniques)と呼ばれ得る。タスクを実行するために構成されるものとして説明されるプロセッサ又はメモリのような構成要素には、所定の時間においてタスクを実行するために一時的に構成される一般的な構成要素と、タスクを実行するために製造される特定の構成要素の双方が含まれる。一般的に、開示された工程のステップの順序は、本発明の範囲内で変更され得る。
本発明の1つあるいはそれより多い実施例の詳細な説明が、本発明の原理を示す添付の図面を参照して、以下に提供される。本発明は、そのような実施例との関係で説明されるが、本発明は、如何なる実施例にも限定されない。本発明の範囲は、請求項によってのみ限定され、本発明は、膨大な代替物、修正、及び、均等物を包含する。本発明の完全な理解を提供するために、膨大な特定の詳細が以下の説明に記載される。これらの詳細は、例示の目的のために提供され、本発明は、これらの特定の詳細のいくつか、又は全て、を伴うこと無しに、請求項に従って実施され得る。説明を明確にするために、本発明が不必要に不明瞭化されないように、本発明に関連する技術分野で知られている技術的材料は詳細には説明されていない。
基板の上に実装された集積された画像プロセッサが開示される。入力インターフェースは、2つ或いはそれより多い画像から画素データを受信するように構成される。基板の上に配置された画素ハンドリング・プロセッサは、画素データを、深さ及び強度画素データ(depth and intensity pixel data)に変換するように構成される。いくつかの実施例において、基板上に配置された前景検知器は、画素を、前景又は前景でない、として分類するように構成される。いくつかの実施例において、基板の上に配置された投射生成器(projection generator)は、深さ及び強度画素データの投射を生成するように構成される。いくつかの実施例において、基板の上に配置されたセグメンテーション・プロセッサは、対象物(objects)、及び、高さ、エクステント(extent)、及び/又は、カラーを含む対象物の記述のリストを生成するように構成される。種々の実施例において、基板の上に配置されたアプリケーション・プロセッサは、他のプロセッサの結果を使用して、人々の計数(count)、車の計数、対象物の計数、対象物の検知、対象物の追跡、障害物の特定、車両のためにナビゲート可能な経路の検知、及び/又は、ドアを通したテールゲートの特定、のようなユーザ・アプリケーションに対する出力を生成するように構成される。
種々の実施例において、画像のソース(例えばカメラ)は、複数の画像の間の位置を変更せず関心の対象の対象物は複数の画像の間の位置を変更しなかったり、画像のソースは画像の間の位置を変更せず関心の対象の対象物は複数の画像の間の位置を変更したり、画像のソースは画像の間の位置を変更し関心の対象の対象物は複数の画像の間の位置を変更しなかったり、画像のソースは画像の間の位置を変更し関心の対象の対象物は複数の画像の間の位置を変更したりする。
本発明の種々の実施例が、以下の詳細な説明及び添付の図面において開示される。
図1は、集積された画像プロセッサの実施例を説明するブロック図である。ここに示される例では、集積された画像プロセッサ100は、入力インターフェース102、画素ハンドリング・プロセッサ104、及び、前景(foreground)検知器プロセッサ106を含む。入力インターフェース102には、2つ或いはそれより多いソースからの画素データが入力される。ソースは、深さ情報が計算されることを可能とするデータを提供する。いくつかの実施例において、画素データには、強度情報、カラー情報(例えば、赤、緑、青、輝度、UV又は熱的IRのような他のスペクトル・バンド、クロミナンス、飽和(saturation)、及び/又は、強度情報)、垂直同期情報、及び、水平同期情報が含まれる。いくつかの実施例において、画像データを提供する2つのソース、つまりステレオ・ソースが存在する。種々の実施例において、各ソースは、毎秒20又は200回発生する512×512画素の画像を生成する。種々の実施例において、ソース・データ・サイズは、8ビット又は10ビット画素を伴った512×2048である。種々の実施例において、2つのソース・カメラの間の隔離(separation)は、3cm、5cm、22cm、又は、33cmである。種々の実施例において、視野は、少なくとも部分的に画像ソースのレンズに基づいて、45度又は50度である。入力インターフェース102は、画素データを画素ハンドリング・プロセッサ104に出力する。画素ハンドリング・プロセッサ104の出力には、1つあるいはそれより多い次のものが含まれる:深さ情報、ばらつき情報、データの有効性情報、及び、平均強度のような画像特性。
画素ハンドリング・プロセッサ104は、画素データの1つあるいはそれより多い画像を取り込み(grabs)、校正パラメータに基づいてレンズ及びカメラからの歪を除去することによって1つあるいはそれより多い画像を修正(rectifies)し、そして、深さ又はばらつき(disparity)を計算する。
前景検知器プロセッサ106入力には、深さ情報又はばらつき情報、及び/又は、データ有効性情報が含まれる。前景検知器プロセッサ106出力には、どの画素が前景の一部であり、どの画素が前景の一部ではないかという指示(indication)が含まれる。いくつかの実施例においては、前景検知には、背景のモデリングが含まれる。背景のモデルを構築し、時間に亘って(over time)そのモデルを更新することによって、前景又は背景への画素の分類が可能となる。背景画素は、比較的長い時間に亘って比較的安定な状態を維持する画素である。
前景画素は、比較的安定に維持されない、対象物(objects)に対応する画素である。いくつかの実施例において、背景のモデルは、範囲又は表示の中の所定の変動内に一定に維持される画素を識別することによって構築される。いくつかの実施襟において、背景のモデルは、カラー又は強度の所定の変動、及び/又は、時間の期間(例えば、少なくとも部分的に、ソース画像の、興味の対象である動きに対して関連する時定数に基づく時間)に亘る範囲、の中に一定に維持され、これらの画素が、背景画素であることを示す画素を識別することによって構築される。
いくつかの実施例において、入力インターフェース102、画素ハンドリング・プロセッサ104、及び、前景検知器プロセッサ106は、各ブロックが、平行に又は同時に処理するような、パイプライン・アーキテクチャ内に配置される。いくつかの実施例において、各ブロックによって画像情報のサブセットだけが要求され、それによって、各ブロックのレイテンシー、及び、各ブロックによって要求される情報のサブセットのサイズに依存して、いくつかのブロックが、同時に同じフレーム周期からの画素データについて作動する(ここで、フレーム周期は、画像データの複数のフレームの間の時間である)。種々の実施例において、入力インターフェース102、画素ハンドリング・プロセッサ104、及び、前景検知器プロセッサ106は、共通基板の上に配置された集積回路、又は、共通集積された回路パッケージの一部である。
図2は、集積された画像プロセッサの実施例を示すブロック図である。ここに示された例において、集積された画像プロセッサ200は、入力インターフェース202、画素ハンドリング・プロセッサ204、及び、投射生成器206を含む。入力インターフェース202入力は、2つ或いはそれより多いソースからの画素データを含む。ソースは、深さ情報が計算されることを可能とする画像データを提供する。いくつかの実施例において、画素データは、強度情報、カラー情報(例えば、赤、緑、青、輝度、クロミナンス、飽和、及び/又は、強度情報)、垂直同期情報、及び、水平同期情報を含む。入力インターフェース202は、画素データを画素ハンドリング・プロセッサ204に出力する。画素ハンドリング・プロセッサ104出力は、次のうちの1つあるいはそれより多くを含む:深さ情報、ばらつき情報、及び、有効性情報。画素ハンドリング・プロセッサ204は、画素の1つあるいはそれより多くの画像を取り込み、レンズ及びカメラからの歪を除去することによって1つあるいはそれより多くの画像を修正し、深さ又はばらつき(disparity)を計算する。投射生成器206入力は、深さ情報又はばらつき情報、オプショナルな入力マスク、及び/又は、有効性情報を含む。投射生成器206出力は、次のうちの1つあるいはそれより多くを含む:3次元(3D)データ・セット、又は、3Dデータの2次元投射。
3次元データ・セットは、変換され、量子化された、入力データの3D表現である。量子化は、各軸に対して独立である。入力深さ画素は、所望の量子化及びカメラ校正パラメータに基づいて3Dマップのセルにマップされる。各セルに入る(falling into)画素に対する統計値は、例えば、カウント、所定の軸の最小及び/又は最大値、及び/又は、カラー特性を含みつつ維持され得る。いくつかの実施例において、3D回転、平行移動(translation)、及び、スケーリング、からなる3Dリジッド(rigid)変換が、3D投射量(projection volume)へのマッピング中に適用される。2次元データ・セットは、1つの次元が量子化(quantization)1を持つ(すなわち、その軸に沿った3Dデータの投射である)3Dデータ・セットの実施例である。いくつかの実施例において、有用な統計値(例えば、最小空間エクステント(extent)、強度、又は、カラー値、最大空間エクステント、強度、又は、カラー値、ヒストグラム)が、投射データ・セットの一部として格納される。例えば、部屋のトップ・ダウン投射のために(例えば、床又は人を位置決めする(locating)ために)、所定の位置に対する最小又は最大高さを知ることが有用である。これは、セルにマップされた、最も低い、又は、最も高い空間位置を格納することによって導かれ得る。
いくつかの実施例において、投射統計値は、再スケール(rescaled)される。例えば、所定のサイズの画像化ソースにより近い対象物は、同じ所定のサイズの、より離れた対象物に比較して、それを表現するより大きい数の画素を持つことになる。画像ソースへの距離に基づいて、所定の投射セルに対する画素カウントを再スケールするための訂正は、2時限又は3次元投射データ・セットに対して、計算され、適用され得る。種々の実施例において、再スケーリングの前、再スケーリングの後、又は、再スケーリングの前及び後に、スレッシュホールドが適用される。
いくつかの実施例において、入力インターフェース202、画素ハンドリング・プロセッサ204、及び、投射生成器206は、各ブロックが平行に又は同時に処理するようなパイプライン・アーキテクチャ内に配列される。いくつかの実施例において、各ブロックによって、画像情報のサブセットだけが要求されることによって、各ブロックのレイテンシー及び各ブロックによって要求される情報のサブセットのサイズに依存して、いくつかのブロックが、同時に同じフレーム期間からの画素データ上で作動する。種々の実施例において、入力インターフェース202、画素ハンドリング・プロセッサ204、及び、投射生成器206は、共通の基板の上に配置された集積回路であるか、或いは、共通に集積された回路パッケージの一部である。
図3は、集積された画像プロセッサの実施例を示すブロック図である。ここに示される例において、集積された画像プロセッサ300は、入力インターフェース302、画素ハンドリング・プロセッサ304、前景検知器プロセッサ306、投射生成器308、セグメンテーション・プロセッサ310、及び、アプリケーション・プロセッサ312を含む。入力インターフェース302入力は、2つ或いはそれより多いソースからの画素データを含む。ソースは、深さ情報が計算されることを可能とする画像データを提供する。いくつかの実施例において、画素データには、強度情報、カラー情報(例えば、赤、緑、青、輝度、クロミナンス、飽和(saturation)、UV又は熱的IRのような他のスペクトル・バンド、及び/又は、強度情報)、垂直同期情報、及び、水平同期情報が含まれる。入力インターフェース302は、画素データを、画素ハンドリング・プロセッサ304に出力する。画素ハンドリング・プロセッサ104出力には、2つ或いはそれより多い次のものが含まれる:深さ情報、ばらつき情報、及び、有効性情報。画素ハンドリング・プロセッサ304は、2つ或いはそれより多いソースからの画素データの座標ストリーム(coordinate stream)を受け入れ、レンズ及びカメラからの歪を除去することによって画素ストリームを修正(rectifies)し、深さ及びばらつきを計算する。
前景検知器プロセッサ306入力には、深さ情報又はばらつき情報、及び/又は、が有効性情報が含まれる。前景検知器プロセッサ306出力には、どの画素が前景の一部であるか、及び、どの画素が前景の一部ではないか、の指示が含まれる。どの画素が前景の一部であるかの指示は、画素当たり1ビットのデータ・アレイによって指示される。いくつかの実施例において、前景検知は、背景のモデリングを含む。前景又は背景への画素の分類は、背景のモデルの構築、及び、時間に亘る(over time)そのモデルの更新から得られる。背景画素は、比較的長い期間に亘って比較的安定な状態を維持する画素である。投射生成器308入力には、深さ情報又はばらつき情報、及び/又は、有効性情報が含まれる。投射生成器308入力には、深さ情報、又は、ばらつき情報、オプショナルの入力マスク、及び/又は、有効性情報が含まれる。投射生成器308出力には、次のうち1つあるいはそれより多いものが含まれる:3次元データ・セット又は3Dデータの2次元投射。
セグメンテーション・プロセッサ310入力には、投射生成器308の出力が含まれる。セグメンテーション・プロセッサ310計算には、スムージング、スレッシュホールディング、及び、2次元投射データ・セット又は3次元データセットの要素の接続による、対象物(object)のリスト及びそれらの対象物のデスクリプタ(descriptor)の生成が含まれる。例えば、部屋の床に平行な2次元投射データ・セットにおいて、対象物は、隣接セルのカウントについての(on)スムージング・フィルタを用いて区分(segmented)され、スムーズ化(smoothed)された値にスレッシュホールドを適用して対象物の境界の検知を支援し、そして、局所的に、関心の対象の対象物として残存する、接続された領域を識別する。各対象物は、3Dの物理的なエクステントの空間的位置、カラー、等の点に関して記述され得る。いくつかの実施例において、1つあるいはそれより多いエッジ検知フィルタが用いられて、対象物の周りの境界を識別する。いくつかの実施例において、セグメンテーション・プロセッサ310は、頂部又は正面ビュー(top or plan view)投射内のどの領域が、対象物(object)(例えば人)を表すかを検知する。
アプリケーション・プロセッサ312入力は、セグメンテーション・プロセッサ310の出力を含む。種々の実施例において、アプリケーション・プロセッサ312は、対象物をカウント、対象物を分類、対象物を追跡、又は、対象物内のパターンを検知できる。例えば、アプリケーション312は、道の表面の上の、車であるために十分大きな程度の対象物を識別し、各オブジェクトを車としてカウントすることによって、車をカウントできる。他の例において、アプリケーション312は、対象物の異なったデスクリプタ(車は、トラックほど背が高くなく、それより狭く、それより長くない)を用いて、車とトラックの間を差別化することによって、車両を分類できる。他の例として、ドアを通って入るためにカード・キーを読取り機に通すことが要求されるような状況において、1回のカードの読取り機へのスワイプ(swipe)における、ドアを通って動く2人の人のパターンを識別することによって、セキュリティの違反が存在することを示すことができる。いくつかの実施例において、アプリケーション・プロセッサ312は、現在のフレーム内の人々の位置を、前の位置と比較し、フレーム内の人々の空間的対応に基づいて人識別子を割り当てることによって、人々を追跡する。
いくつかの実施例において、入力インターフェース302、画素ハンドリング・プロセッサ304、前景検知器プロセッサ306、投射生成器308、セグメンテーション・プロセッサ310、及び、アプリケーション・プロセッサ312が、各ブロックが平行に又は同時に処理するようなパイプライン・アーキテクチャに配置(arranged)される。いくつかの実施襟において、各ブロックによって画像情報のサブセットだけが要求されることによって、各ブロックのレイテンシー、及び、各ブロックによって要求される情報のサブセットのサイズに依存して、いくつかのブロックが同時に、同じフレーム期間からの画素データについて作動する。種々の実施例において、入力インターフェース302、画素ハンドリング・プロセッサ304、前景検知器プロセッサ306、投射生成器308、セグメンテーション・プロセッサ310、及び、アプリケーション・プロセッサ312は、共通基板の上に配置された集積回路、又は、共通集積回路パッケージの一部である。
図4は、画素ハンドリング・プロセッサの実施例を示すブロック図である。種々の実施例において、図4の画素ハンドリング・プロセッサ400が用いられて、頭の104、頭2の204、及び、図3の304を実現する。ここに示される例において、画素ハンドリング・プロセッサ400は、画像グラッビング(grabbing)プロセッサ402、修正(rexctify)プロセッサ404、及び、深さ/ばらつき・プロセッサ406を含む。いくつかの実施例において、画素ハンドリング・プロセッサは、修正プロセッサを含まない。画像グラッビング・プロセッサ402入力は、大体同期的なやり方での、2つ或いはそれより多いソースからの画像情報を含む。画像情報はソースに依存し、画素(画像要素)のためのいくつかのフォーマット(例えば、RGB−赤、緑、青、HSV−色合い、飽和、値、HSB−色合い、飽和、輝度、又は、YUV−輝度及び2つのクロミナンス値、又は、他のスペクトラム・バンドを含む何らかの他の適切な画像情報フォーマット)での、強度及びカラー情報、及び、垂直及び水平同期情報を含み得る。画像グラッビング・プロセッサ402出力は、単一のフォーマットでの、2つ或いはそれより多い画像のための同期画像情報を含む。
修正プロセッサ404は入力として、所定の校正パラメータ(例えば、相対的イメージャ位置及び方向、レンズの主ポイント、焦点長、及び、レンズ歪パラメータ)を持つ、画像グラッバ402及びソース(例えば、カメラ、カラー・イメージャ、白黒イメージャ等)からの出力を持つ。修正プロセッサ404の「修正(rectify)」部は、各入力ソースからの、幾何学的ミスアライメント及びレンズ歪を訂正する(いくつかの場合には、全ての歪とミスアライメントの除去は不可能である)。レンズ及びカメラの歪及び位置訂正は、画像への、回転、平行移動、拡大、及び、歪除去オペレーションによって除去される。いくつかの実施例において、回転、平行移動、及び、拡大は、画像情報に対するマトリックス・オペレーションを用いて実現される。いくつかの実施例において、歪除去は、多項式歪除去モデルを用いて実現される。幾何学的及び歪訂正の組み合わせによって、修正された画像画素座標からの歪んだ画像画素座標へのマッピングがもたらされる。いくつかの実施例において、修正された画像画素座標から、歪んだ画像画素座標へのマッピングは、事前に計算されたルックアップ・テーブルの形式で格納され得る。いくつかの実施例において、マッピングは、画素ストリームの修正中に、実時間で(on the fly)計算され得る。いくつかの実施例において、マッピングは、どの、正確な歪んだ、画像画素座標にも一致(match)しないので、修正された画素座標、及び/又は、画素値を導くために補間が要求される。種々の実施例において、補間は、線形補間、スプライン補間、又は、他の適切な補間である。修正プロセッサ404のオペレーションは、各画素の計算のための画像情報のサブセットを要求する。いくつかの実施例において、パイプライニング・アーキテクチャが用いられて、所定の画素情報の計算のために要求される画像情報のサブセットだけが、修正プロセッサ404によって要求されるように、並行に計算を実行する。
深さ/ばらつき・プロセッサ406入力は、修正プロセッサ404からの出力情報を含む。深さ/ばらつき・プロセッサ406は、少なくとも部分的に、校正パラメータに基づいて、2つ或いはそれより多い画像、及び/又は、深さ、又は、ソースからの範囲、の間の画素データを相関付ける(correlate)ことによって、入力画像における画素のばらつきを計算する。深さ、及び/又は、ばらつき計算は、画像の次元に沿って、1つあるいはそれより多い画素を相関付けることによって実行される。いくつかの実施例において、1つの画像からの画素値のアレイは、他の画像からの画素値と相関付けられる。いくつかの実施例において、非パラメータ的相関が用いられる。種々の実施例において、SLOG(ガウシアンのラプラシアンの符号ビット)、SAD(絶対差の合計)、SSD(平方差の合計)、等が、相関付けのために使用され得る。いくつかの実施例において、深さ/ばらつき・プロセッサ・ブロックに対する出力として有効性情報が提供される。有効性情報は、例えば、画像1と画像2、そして、次に、画像2と画像1、の間のばらつきの計算の間の一致(corresopndence)をチェックすることから導かれ得る。いくつかの実施例において、もし、画像内の画素領域が円滑(smooth)ならば、深さ情報は、有効である可能性がより少ない。種々の実施例において、強度、及び/又は、カラー情報が用いられて、深さ、及び/又は、ばらつきが計算される。
いくつかの実施襟において、画像グラッビング・プロセッサ402、修正プロセッサ404、及び、深さ/ばらつき・プロセッサ406は、各ブロックが、平行又は同時に処理するようなパイプライン・アーキテクチャに配置される。いくつかの実施例において、各ブロックによって、画像情報のサブセットだけが要求され、それによって、各ブロックのレイテンシー、及び、各ブロックによって要求される情報のサブセットのサイズに依存して、ブロックのいくつかが同時に、同じフレーム周期からの画素データについて作動する。種々の実施襟において、画像グラッビング・プロセッサ402、修正プロセッサ404、及び、深さ/ばらつき・プロセッサ406は、共通基板の上に配置された集積回路、又は、共通集積回路パッケージの一部である。
いくつかの実施例において、画素ハンドリング・プロセッサ400は、深さ/ばらつき・プロセッサ406を含まない。この場合には、画素ハンドリング・プロセッサ400は、入力として、各画素に対する、範囲、又は、深さ、情報を含む、1つあるいはそれより多い情報の画像を持つ。前景検知器プロセッサ160又は投射プロセッサ206は、次に、少なくとも部分的に、範囲情報とともに、1つあるいはそれより多い入力画像に基づいて、入力範囲情報について作動できる。
理解の明確性の目的のために、いくつかの詳細において以上の実施例が説明されてきたが、本発明は、提供された詳細に限定されない。本発明を実施するための多くの代替的方法が存在する。開示された実施襟は、説明目的のものであり、限定的ではない。
集積された画像プロセッサの実施例を説明するブロック図である。 集積された画像プロセッサの実施例を説明するブロック図である。 集積された画像プロセッサの実施例を説明するブロック図である 画素ハンドリング・プロセッサの実施例を説明するブロック図である。

Claims (17)

  1. 2つ或いはそれより多い画像から画素データを受信するように構成される入力インターフェース、及び、
    前記画素データを、深さ及び強度画素データに変換するように構成される前記基板の上に配置される画素ハンドリング・プロセッサ、及び、
    画素を、背景又は背景でないとして分類する、前記基板の上に配置された前景検知器プロセッサ、
    を備える基板の上に実装される集積された画像プロセッサ。
  2. 前記画素ハンドリング・プロセッサ及び投射生成器が、画素データを平行に処理する、
    請求項1に記載された基板の上に実装された集積された画像プロセッサ。
  3. セグメンテーション・プロセッサを更に含む、請求項1に記載された基板の上に実装された集積された画像プロセッサ。
  4. アプリケーション・プロセッサを更に含む、請求項1に記載された基板の上に実装された集積された画像プロセッサ。
  5. 深さ及び強度画素データの空間に投射を生成するように構成される、前記基板の上に配置された投射生成器を更に含む、請求項1に記載された基板の上に実装された集積された画像プロセッサ。
  6. 前記画素ハンドリング・プロセッサが、画像グラッビング・プロセッサを含む、請求項1に記載された基板の上に実装された集積された画像プロセッサ。
  7. 前記画素ハンドリング・プロセッサが、修正プロセッサを含む、請求項1に記載された基板の上に実装された集積された画像プロセッサ。
  8. 前記画素ハンドリング・プロセッサが、深さプロセッサを含む、請求項1に記載された基板の上に実装された集積された画像プロセッサ。
  9. 深さが、ばらつき(disparity)を含む、請求項1に記載された基板の上に実装された集積された画像プロセッサ。
  10. 基板の上に実装された集積された画像プロセッサであって、
    2つ或いはそれより多い画像から画素データを受信するように構成される入力インターフェース、
    画素データを深さ及び強度画素データに変換するように構成された、前記基板の上に配置された画素ハンドリング・プロセッサ、及び、
    前記深さ及び強度画素データの空間における投射を生成するように構成された、前記基板の上に配置された投射生成器、
    を備える画像プロセッサ。
  11. 前記画素ハンドリング・プロセッサ及び前景検知器プロセッサが、平行して画素データを処理する、
    請求項10に記載された基板の上に実装された集積された画像プロセッサ。
  12. セグメンテーション・プロセッサを更に含む、請求項10に記載された基板の上に実装された集積された画像プロセッサ。
  13. アプリケーション・プロセッサを更に含む、請求項10に記載された基板の上に実装された集積された画像プロセッサ。
  14. 前記画素ハンドリング・プロセッサが、画像グラッビング・プロセッサを含む、請求項10に記載された基板の上に実装された集積された画像プロセッサ。
  15. 前記画素ハンドリング・プロセッサが、修正プロセッサを含む、請求項10に記載された基板の上に実装された集積された画像プロセッサ。
  16. 前記画素ハンドリング・プロセッサが、深さプロセッサを含む、請求項10に記載された基板の上に実装された集積された画像プロセッサ。
  17. 深さが、ばらつき(disparity)を含む、請求項10に記載された基板の上に実装された集積された画像プロセッサ。
JP2007540360A 2004-11-03 2005-10-31 集積された画像プロセッサ Expired - Fee Related JP5306652B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US62495404P 2004-11-03 2004-11-03
US60/624,954 2004-11-03
PCT/US2005/039285 WO2006052508A2 (en) 2004-11-03 2005-10-31 An integrated image processor

Publications (3)

Publication Number Publication Date
JP2008519371A true JP2008519371A (ja) 2008-06-05
JP2008519371A5 JP2008519371A5 (ja) 2012-01-19
JP5306652B2 JP5306652B2 (ja) 2013-10-02

Family

ID=36336962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007540360A Expired - Fee Related JP5306652B2 (ja) 2004-11-03 2005-10-31 集積された画像プロセッサ

Country Status (4)

Country Link
US (2) US7664315B2 (ja)
EP (1) EP1810220A4 (ja)
JP (1) JP5306652B2 (ja)
WO (1) WO2006052508A2 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US7146260B2 (en) 2001-04-24 2006-12-05 Medius, Inc. Method and apparatus for dynamic configuration of multiprocessor system
US10298735B2 (en) 2001-04-24 2019-05-21 Northwater Intellectual Property Fund L.P. 2 Method and apparatus for dynamic configuration of a multiprocessor health data system
US7178049B2 (en) 2002-04-24 2007-02-13 Medius, Inc. Method for multi-tasking multiple Java virtual machines in a secure environment
WO2006052508A2 (en) * 2004-11-03 2006-05-18 Tyzx, Inc. An integrated image processor
US7337650B1 (en) 2004-11-09 2008-03-04 Medius Inc. System and method for aligning sensors on a vehicle
WO2009016614A2 (en) * 2007-08-02 2009-02-05 Emza Visual Sense Ltd. Universal counting and measurement system
US10425595B2 (en) * 2007-11-28 2019-09-24 Flir Systems, Inc. Modular camera systems and methods
US9358924B1 (en) 2009-05-08 2016-06-07 Eagle Harbor Holdings, Llc System and method for modeling advanced automotive safety systems
US8417490B1 (en) 2009-05-11 2013-04-09 Eagle Harbor Holdings, Llc System and method for the configuration of an automotive vehicle with modeled sensors
US8941726B2 (en) * 2009-12-10 2015-01-27 Mitsubishi Electric Research Laboratories, Inc. Method and system for segmenting moving objects from images using foreground extraction
KR101429250B1 (ko) * 2010-08-20 2014-09-25 주식회사 팬택 단계별 객체 정보 제공이 가능한 단말 장치 및 방법
US10200671B2 (en) * 2010-12-27 2019-02-05 3Dmedia Corporation Primary and auxiliary image capture devices for image processing and related methods
US9501834B2 (en) * 2011-08-18 2016-11-22 Qualcomm Technologies, Inc. Image capture for later refocusing or focus-manipulation
US9604581B2 (en) 2011-11-07 2017-03-28 Magna Electronics Inc. Vehicle vision system with color correction
CN103164851B (zh) * 2011-12-09 2016-04-20 株式会社理光 道路分割物检测方法和装置
US8886392B1 (en) 2011-12-21 2014-11-11 Intellectual Ventures Fund 79 Llc Methods, devices, and mediums associated with managing vehicle maintenance activities
US9269155B2 (en) * 2012-04-05 2016-02-23 Mediatek Singapore Pte. Ltd. Region growing method for depth map/color image
US10237528B2 (en) * 2013-03-14 2019-03-19 Qualcomm Incorporated System and method for real time 2D to 3D conversion of a video in a digital camera
US10326969B2 (en) 2013-08-12 2019-06-18 Magna Electronics Inc. Vehicle vision system with reduction of temporal noise in images
US9639951B2 (en) * 2014-10-23 2017-05-02 Khalifa University of Science, Technology & Research Object detection and tracking using depth data
US9639166B2 (en) * 2015-03-11 2017-05-02 Microsoft Technology Licensing, Llc Background model for user recognition
US9536287B1 (en) * 2015-07-09 2017-01-03 Intel Corporation Accelerated lens distortion correction with near-continuous warping optimization
US10282623B1 (en) * 2015-09-25 2019-05-07 Apple Inc. Depth perception sensor data processing
US10430994B1 (en) 2016-11-07 2019-10-01 Henry Harlyn Baker Techniques for determining a three-dimensional textured representation of a surface of an object from a set of images with varying formats
JP7021036B2 (ja) * 2018-09-18 2022-02-16 株式会社東芝 電子機器及び通知方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06187434A (ja) * 1992-06-04 1994-07-08 Internatl Business Mach Corp <Ibm> イメージ/ビデオ処理のためのプロセス・パイプライン・アー キテクチャ
JPH09297849A (ja) * 1996-05-08 1997-11-18 Matsushita Electric Ind Co Ltd 車両検出装置
WO1999067742A1 (en) * 1998-06-25 1999-12-29 Matsushita Electric Industrial Co., Ltd. Image processor
JP2003109128A (ja) * 2001-07-25 2003-04-11 Fuji Electric Co Ltd 侵入者検出装置
US6556704B1 (en) * 1999-08-25 2003-04-29 Eastman Kodak Company Method for forming a depth image from digital image data

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1406511A (en) 1973-01-19 1975-09-17 Ici Ltd Cellular polyurethanes
US3901595A (en) * 1974-02-13 1975-08-26 Bendix Corp Parallel line scanning system for stereomapping
US4524455A (en) * 1981-06-01 1985-06-18 Environmental Research Inst. Of Michigan Pipeline processor
US4574394A (en) * 1981-06-01 1986-03-04 Environmental Research Institute Of Mi Pipeline processor
US5054097A (en) * 1988-11-23 1991-10-01 Schlumberger Technologies, Inc. Methods and apparatus for alignment of images
US5592599A (en) * 1991-12-18 1997-01-07 Ampex Corporation Video special effects system with graphical operator interface
JP3679426B2 (ja) 1993-03-15 2005-08-03 マサチューセッツ・インスティチュート・オブ・テクノロジー 画像データを符号化して夫々がコヒーレントな動きの領域を表わす複数の層とそれら層に付随する動きパラメータとにするシステム
DE69532916D1 (de) * 1994-01-28 2004-05-27 Schneider Medical Technologies Verfahren und vorrichtung zur bilddarstellung
US5531227A (en) * 1994-01-28 1996-07-02 Schneider Medical Technologies, Inc. Imaging device and method
US5559335A (en) * 1994-12-28 1996-09-24 The University Of Utah Rotating and warping projector/backprojector for converging-beam geometries
US5812787A (en) * 1995-06-30 1998-09-22 Intel Corporation Video coding scheme with foreground/background separation
GB9513515D0 (en) * 1995-07-03 1995-09-06 Sgs Thomson Microelectronics Expansion of data
US5982378A (en) * 1996-08-02 1999-11-09 Spatial Technology Inc. System and method for modeling a three dimensional object
US5870085A (en) * 1997-02-03 1999-02-09 Ati International Generating text strings
US6215898B1 (en) * 1997-04-15 2001-04-10 Interval Research Corporation Data processing system and method
US6064760A (en) * 1997-05-14 2000-05-16 The United States Corps Of Engineers As Represented By The Secretary Of The Army Method for rigorous reshaping of stereo imagery with digital photogrammetric workstation
DE19817720A1 (de) * 1998-04-21 1999-10-28 Heidelberger Druckmasch Ag Verfahren zur Bilddatenkomprimierung für Zwei-Farben-Bilder
US6594385B2 (en) * 1998-10-27 2003-07-15 Hewlett-Packard Development Company, L.P. Image compression of background and text tiles
WO2000034919A1 (en) * 1998-12-04 2000-06-15 Interval Research Corporation Background estimation and segmentation based on range and color
DE29912572U1 (de) * 1999-07-19 1999-09-16 Marantec Antrieb Steuerung Vorrichtung zum Öffnen bzw. Schließen eines Tores
DE60114498T2 (de) * 2000-04-11 2006-08-03 Hoya Corp. Darstellung der Leistung eines Brillenglases durch eine Indexanzeige in visuell verständlicher Weise
US7386170B2 (en) * 2000-06-30 2008-06-10 Texas Instruments Incorporated Image object ranking
US6788809B1 (en) * 2000-06-30 2004-09-07 Intel Corporation System and method for gesture recognition in three dimensions using stereo imaging and color vision
US6567099B1 (en) * 2000-11-15 2003-05-20 Sony Corporation Method and system for dynamically allocating a frame buffer for efficient anti-aliasing
US6792140B2 (en) * 2001-04-26 2004-09-14 Mitsubish Electric Research Laboratories, Inc. Image-based 3D digitizer
US20030007703A1 (en) * 2001-07-03 2003-01-09 Roylance Eugene A. Configurable image processing logic for use in image processing devices
US7003136B1 (en) * 2002-04-26 2006-02-21 Hewlett-Packard Development Company, L.P. Plan-view projections of depth image data for object tracking
US7227893B1 (en) * 2002-08-22 2007-06-05 Xlabs Holdings, Llc Application-specific object-based segmentation and recognition system
US7567274B2 (en) * 2002-12-09 2009-07-28 Frank Edughom Ekpar Method and apparatus for creating interactive virtual tours
KR100503820B1 (ko) 2003-01-30 2005-07-27 학교법인 포항공과대학교 시스톨릭 어레이를 이용한 멀티레이어 실시간 입체 영상정합 시스템 및 방법
US7224830B2 (en) * 2003-02-04 2007-05-29 Intel Corporation Gesture detection from digital video images
US7017492B2 (en) * 2003-03-10 2006-03-28 Quad/Tech, Inc. Coordinating the functioning of a color control system and a defect detection system for a printing press
GB2400287A (en) * 2003-04-02 2004-10-06 Autodesk Canada Inc Three-Dimensional Image Compositing
US7298898B2 (en) * 2003-04-15 2007-11-20 Honeywell International Inc. System and method for image segmentation
US7643025B2 (en) * 2003-09-30 2010-01-05 Eric Belk Lange Method and apparatus for applying stereoscopic imagery to three-dimensionally defined substrates
US7747067B2 (en) * 2003-10-08 2010-06-29 Purdue Research Foundation System and method for three dimensional modeling
US7623674B2 (en) * 2003-11-05 2009-11-24 Cognex Technology And Investment Corporation Method and system for enhanced portal security through stereoscopy
US7158225B2 (en) * 2004-01-23 2007-01-02 Kaiser Optical Systems Multi-channel, self-calibrating fiber-coupled raman spectrometers including diagnostic and safety features
JP2005229200A (ja) * 2004-02-10 2005-08-25 Fujitsu Ltd ディストーション補正回路
US20060067592A1 (en) * 2004-05-27 2006-03-30 Walmsley Simon R Configurable image processor
US20050270372A1 (en) * 2004-06-02 2005-12-08 Henninger Paul E Iii On-screen display and privacy masking apparatus and method
WO2006052508A2 (en) * 2004-11-03 2006-05-18 Tyzx, Inc. An integrated image processor

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06187434A (ja) * 1992-06-04 1994-07-08 Internatl Business Mach Corp <Ibm> イメージ/ビデオ処理のためのプロセス・パイプライン・アー キテクチャ
JPH09297849A (ja) * 1996-05-08 1997-11-18 Matsushita Electric Ind Co Ltd 車両検出装置
WO1999067742A1 (en) * 1998-06-25 1999-12-29 Matsushita Electric Industrial Co., Ltd. Image processor
US6556704B1 (en) * 1999-08-25 2003-04-29 Eastman Kodak Company Method for forming a depth image from digital image data
JP2003109128A (ja) * 2001-07-25 2003-04-11 Fuji Electric Co Ltd 侵入者検出装置

Also Published As

Publication number Publication date
WO2006052508A3 (en) 2007-04-26
US8724885B2 (en) 2014-05-13
EP1810220A4 (en) 2008-04-30
EP1810220A2 (en) 2007-07-25
JP5306652B2 (ja) 2013-10-02
US7664315B2 (en) 2010-02-16
WO2006052508A2 (en) 2006-05-18
US20060153450A1 (en) 2006-07-13
US20100104175A1 (en) 2010-04-29

Similar Documents

Publication Publication Date Title
JP5306652B2 (ja) 集積された画像プロセッサ
CN110009561B (zh) 一种监控视频目标映射到三维地理场景模型的方法及系统
JP2008519371A5 (ja)
US9426449B2 (en) Depth map generation from a monoscopic image based on combined depth cues
US10192313B2 (en) Networked capture and 3D display of localized, segmented images
CA2867365C (en) Method, system and computer storage medium for face detection
US20160042515A1 (en) Method and device for camera calibration
TWI491849B (zh) 應用複數攝影裝置之物件定位方法
CN111160291B (zh) 基于深度信息与cnn的人眼检测方法
WO2014036813A1 (zh) 图像特征的提取方法及装置
CN107358189B (zh) 一种基于多视目标提取的室内环境下物体检测方法
Fregin et al. Three ways of using stereo vision for traffic light recognition
CN110853002A (zh) 一种基于双目视觉的变电站异物检测方法
Shioyama et al. Measurement of the length of pedestrian crossings and detection of traffic lights from image data
US20160055642A1 (en) Identifying points of interest in an image
CN115880643A (zh) 一种基于目标检测算法的社交距离监测方法和装置
KR101241813B1 (ko) Gpu를 이용한 파노라마 영상의 객체 검출 장치 및 방법
CN108009272A (zh) 一种基于有向带权图的低空运动目标搜索方法
CN111489384B (zh) 基于互视角的遮挡评估方法及装置、设备、系统和介质
KR101980899B1 (ko) 직교 소실점을 이용한 단일 영상의 내벽 구조 검출 장치 및 방법
Heinrichs et al. Robust spatio-temporal feature tracking
Asif et al. Video analytics for panning camera in dynamic surveillance environment
Wu Accurate Vehicle Detection Using Multi-Camera Data Fusion and Machine Learning
US9818180B2 (en) Image processing device, method, and program
CN114511823A (zh) 车牌的识别方法、装置和计算机介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110523

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110823

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111118

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20111118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120717

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121017

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121024

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130527

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130626

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5306652

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees