JP2020194532A - 歪み画像内の対象物を検出するための方法、システム、およびデバイス - Google Patents

歪み画像内の対象物を検出するための方法、システム、およびデバイス Download PDF

Info

Publication number
JP2020194532A
JP2020194532A JP2020066372A JP2020066372A JP2020194532A JP 2020194532 A JP2020194532 A JP 2020194532A JP 2020066372 A JP2020066372 A JP 2020066372A JP 2020066372 A JP2020066372 A JP 2020066372A JP 2020194532 A JP2020194532 A JP 2020194532A
Authority
JP
Japan
Prior art keywords
sliding window
image
distorted image
distortion
distorted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020066372A
Other languages
English (en)
Other versions
JP2020194532A5 (ja
Inventor
ハンプス リンス,
Hampus Linse
ハンプス リンス,
ソン ユアン,
Song Yuan
ソン ユアン,
ヨハン フェルベルク,
Foerberg Johan
ヨハン フェルベルク,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Axis AB
Original Assignee
Axis AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axis AB filed Critical Axis AB
Publication of JP2020194532A publication Critical patent/JP2020194532A/ja
Publication of JP2020194532A5 publication Critical patent/JP2020194532A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4023Scaling of whole images or parts thereof, e.g. expanding or contracting based on decimating pixels or lines of pixels; based on inserting pixels or lines of pixels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/168Segmentation; Edge detection involving transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Image Analysis (AREA)

Abstract

【課題】スライディングウィンドウアルゴリズムを使用して第1の歪み画像内の対象物を検出するための方法、コンピュータプログラム製品、デバイスおよびシステムを提供する。【解決手段】方法は、第1の歪み画像の歪みの数学的表現の反転を受信すること(S302)、対象物の検出は、第1の歪み画像にわたってスライディングウィンドウをスライドさせること(S304)ならびに第1の歪み画像内の複数の位置の各位置における歪みの数学的表現の反転に基づいてスライディングウィンドウを変換すること(S306)および第1の歪み画像内の位置における対象物検出のために、スライディングウィンドウアルゴリズムにおいて、変更された特徴検出パターンを含む変換されたスライディングウィンドウを使用すること(S308)を含む。【選択図】図3

Description

本発明は、歪み画像内の対象物を検出するための方法、デバイス、およびシステムに関する。
カメラアプリケーションのための重要な分野は場所のモニタリングである。モニタリングアプリケーションにおいて、モニタリングされる場所のビデオは、通常、広範囲の異なる画像処理アルゴリズムを使用して処理される。例えば、記録されるビデオ内の動きを自動的に検出するアルゴリズムを実装することが一般的である。重要な特徴の別の例は、撮像された画像における対象物検出である。そして、典型的なアプローチは、撮像された画像を参照データベース内の画像と比較することである。対象物検出アルゴリズムは、撮像された画像内の特徴と参照データベース内の画像を照合するため、対象物が検出され、認識される。
しかしながら、そのようなアルゴリズムに関して幾つかの問題が存在する。例えば、参照データベース内の画像に対する高い要件が存在する。例えば、これらの画像は、対象物を識別可能な方法で描写しながら、広範囲の対象物を反映しなければならない。したがって、対象物は、通常、異なる照明条件下でかつ広範囲の方向から撮像される。そのため、参照データベースが参照画像の大きいセットを含むことが一般的である。
しかしながら、撮像される画像は、理想的な撮像条件下でめったに撮像されない。撮像される画像は、例えば、低輝度に悩まされるまたは歪まされる場合がある。或る範囲の画像歪みの異なる発生源、例えば、フィッシュアイレンズおよび光学ドームなどの広角レンズの使用、ならびに、パノラマ画像を提供するためのスティッチング技法が存在する。
歪み発生源(複数可)および歪みの形状によらず、歪みは、画像を解析するときの課題である。例えば、多くの対象物検出アルゴリズムは、歪み画像に適用されると、大損害を受け、なぜならば、ほとんどのアルゴリズムが、無歪み画像に適用されるように設計されているからである。そのため、プロセッサが歪み画像内の対象物を検出することは、計算集約的になる。
したがって、非理想画像において対象物検出するための改良型アルゴリズムについての必要性が存在する。
上記を考慮して、当技術分野において上記で特定された欠点の1つまたは複数をなくすまたは少なくとも軽減することが本発明の概念の目的である。特に、歪み画像内の対象物を検出するための方法、システム、およびデバイスを提供することが目的である。
第1の態様によれば、スライディングウィンドウアルゴリズムを使用して第1の歪み画像内の対象物を検出するための方法が提供される。方法は、第1の歪み画像の歪みの数学的表現の反転を受信することを含み;対象物の検出は、スライディングウィンドウを第1の歪み画像にわたってスライドさせること、ならびに、第1の歪み画像内の複数の位置の各位置について:その位置における歪みの数学的表現の反転に基づいてスライディングウィンドウを変換すること;および、第1の歪み画像内の位置における対象物検出のために、スライディングウィンドウアルゴリズムにおいて、変換されたスライディングウィンドウを使用することを含む。
言い回し「歪み画像(distorted image)」は、本出願の文脈において、歪んだ見え方を有する画像として解釈されるべきである。歪み画像において、シーン内のまっすぐな線は、通常、或る程度、湾曲する。対照的に、完全に直線的な画像は、描写されるシーン内のまっすぐな線に対応する完全にまっすぐな線を有する。本出願の文脈において、2つのタイプの歪み発生源:物理的歪み発生源およびデジタル歪み発生源が論じられる。物理的歪み発生源の非制限的な例は、広角レンズであり、フィッシュアイレンズ(例えば、fシータ(fθ)レンズ)、光学ドーム、および不完全に直線的なレンズを含む。レンズの不完全性は、低精度(imprecision)を製造することによって引き起こされる場合がある。デジタル歪み発生源の非制限的な例は、例えば、複数の画像からパノラマ画像を生成するための画像スティッチングアルゴリズムである。歪みパターンは、不規則的または規則的(放射状歪みなど)であり得る。撮像された画像の歪みパターンは、歪み発生源のうちの1つまたは組み合わせによる結果であることができる。
言い回し「スライディングウィンドウアルゴリズム(sliding window algorithm)」は、本出願の文脈において、スライディングウィンドウを含む対象物検出アルゴリズムとして解釈されるべきである。スライディングウィンドウは、画像にわたって移動する、最初に所定の幅および高さの長方形領域である。スライディングウィンドウによって画定される領域内に存在する画像特徴は、画像内の対象物を検出するために、参照特徴のデータベースと比較される。スライディングウィンドウ内の特徴検出パターンは、参照特徴のデータベースに基づくことができる。スライディングウィンドウアルゴリズムは、複数の特徴検出パターンを使用することができ、それにより、第1のスライディングウィンドウは第1の特徴検出パターンを含み、第2のスライディングウィンドウは第2の特徴検出パターンを含み、などである。それにより、スライディングウィンドウアルゴリズムは、複数の異なるスライディングウィンドウおよび特徴検出パターンを使用することによって、複数の異なる特徴を検出することができる。スライディングウィンドウアルゴリズムは、畳み込みベースのアルゴリズムであることができる。
言い回し「歪みの数学的表現(mathematical representation of the distortion)」は、本出願の文脈において、画像変換(image transform)であって、直線的な画像に適用されると、歪み画像をもたらす画像変換の数学的記述として解釈されるべきである。上記で述べた歪みを、多項式、行列、またはルックアップテーブルとして数学的に表現することができることが理解される。例えば、数学的表現は、歪み画像を撮像するときに使用されるフィッシュアイレンズの伝達関数を記述する多項式/行列であることができる。ルックアップテーブルは、直線的(または無歪み)画像内の座標によって索引付けされる歪み画像内の座標を含むことができる、または、その逆も同様である。
本方法によって、スライディングウィンドウアルゴリズムは、第1の歪み画像などの歪み画像内の対象物を検出するために使用され得る。そのため、第1の歪み画像に関連する画像データは、スライディングウィンドウアルゴリズムを使用する対象物検出に先立って、変換/デワープされる必要がない。それにより、画像変換に関する計算コストは低減される。例えば、対象物検出に先立って曲線的画像を直線的画像に変換する必要性を、低減または完全になくすことができる。画像変換についての必要性を低減することは、それにより、そのような画像変換に関連するいずれの不必要な画像クロッピングも低減することができる。そのため、画像クロッピングによって除去されることになる領域内の画像特徴を、スライディングウィンドウアルゴリズム内に含むことができ、そのような領域内に存在する対象物を、それにより、検出することができる。
さらに、第1の歪み画像が変換/デワープされる必要がないため、第1の歪み画像に関連する画像データは補間される必要がない。それにより、スライディングウィンドウアルゴリズムに関連する計算コストを低減することができ、なぜならば、スライディングウィンドウアルゴリズムが、画像補間で生成される画像データを含む必要がないからである。撮像される画像に関連する画像データ内にまだ存在しない更なる情報を、補間される画像データは含まず、したがって、画像補間で生成される(generate)画像データをスライディングウィンドウアルゴリズムに含むことは、実際の画像情報の対応する増加なしで計算コストを増加させるだけである。
さらに、第1の歪み画像が変換される必要がないため、本方法は、画像処理パイプラインにおいて早期に実施され得る。画像処理パイプラインにおいて早期に、本方法を実施すること、それにより、対象物を検出することは、画像処理パイプラインにおける後続のステップを遅延させることなく画像処理パイプラインにおける後続のステップのための入力として、検出される対象物を使用することを可能にすることができ、それにより、画像処理パイプラインに関連するより短い処理時間を可能にする。例えば、検出される対象物を、画像処理パイプラインによって形成されるビデオストリームについてのエンコーダー設定を計算するための、および/または、画像処理パイプラインによって形成されるビデオストリームにおいて境界ボックスなどのオーバーレイを描画するための入力として使用することできる。画像処理パイプラインにおいて早期に対象物を検出することに関連するさらなる利点は、対象物を検出ためにだけ使用されるアナリティクスカメラについて、画像処理パイプラインにおける後続のステップが実施される必要がない場合があることである。そのため、アナリティクスカメラがビデオストリームを出力する必要性が全く存在しない場合があるため、アナリティクスカメラの電力消費は、それにより、低減される場合がある。
スライディングウィンドウを変換するステップは、スライディングウィンドウの特徴検出パターンを変更することを含むことができる。
言い回し「特徴検出パターン(feature detection pattern)」は、本出願の文脈において、特定の特徴を検出するためにスライディングウィンドウアルゴリズムが使用するパターンとして解釈されるべきである。スライディングウィンドウアルゴリズムが複数の異なる特徴検出パターンを含むことができることが理解される。例えば、特徴検出パターンは、種々の角度を有する画像フレーム内で縁部を検出するために使用することができる。特徴検出パターンは、画像フレーム内で、人、人の特定の面、または、車、犬などのような他の対象物を検出するために使用することもできる。
特徴検出パターンを、スライディングウィンドウの位置における歪みの数学的表現の反転に基づいて変更することができる。
スライディングウィンドウの特徴検出パターンを変更する利点は、第1の歪み画像内の歪みあり特徴を検出することができることである。それにより、スライディングウィンドウアルゴリズムは、第1の歪み画像内の歪みあり対象物を検出することができる。
スライディングウィンドウの特徴検出パターンを変更するさらなる利点は、第1の歪み画像の空間分解能が第1の歪み画像にわたって変動する場合があるため、特徴検出パターンが、第1の歪み画像の空間分解能に適応することができることである。例えば、低い空間分解能の領域において、より粗い特徴検出パターンがスライディングウィンドウアルゴリズムにおいて使用され、それにより、スライディングウィンドウアルゴリズムに関連する計算コストを低減することができる。
言い回し「空間分解能(spatial resolution)」は、本出願の文脈において、画像フレームについての空間分解能として理解されるべきである。例えば、広角レンズを通して取得される、または、複数の画像フレームからスティッチングされる歪み画像において、画像の異なりエリアは異なる空間分解能を有する。換言すれば、画像フレームの同じサイズのエリアは、カメラの視野(FOV:field of view)の異なるサイズの角度をカバーする。空間分解能は、画像フレームについてピクセルレベルで使用することができる、または、ピクセルサブグループレベルで、例えば、マクロブロックレベルで決定され得る。空間分解能は、FOV角度についてのピクセル数としてまたはピクセルについてのFOV角度の量として表現することができる。アプリケーションに応じてこれらの表現の間で交換する方法に当業者は情通している。例えば、本出願による方法の実装態様において、これらの表現のうちの1つの表現を使用するのが好まれる場合がある。空間分解能分布は、例えば、ピクセルについてまたはピクセルサブグループ、例えば、マクロブロックについての空間分解能分布を示すテーブルによって表すことができる。
スライディングウィンドウを変換するステップは、スライディングウィンドウのサイズを変更することを含むことができる。
スライディングウィンドウのサイズは、スライディングウィンドウの位置における歪みの数学的表現の反転に基づいて変更することができる。スライディングウィンドウの高さをスライディングウィンドウの幅と独立に変更することができることが理解される。
スライディングウィンドウのサイズを変更する利点は、第1の歪み画像の空間分解能が第1の歪み画像にわたって変動する場合があるため、スライディングウィンドウのサイズが、第1の歪み画像の空間分解能に適応することができることである。それにより、スライディングウィンドウのサイズに関連する計算コストを低減することができる。
方法は、変換されたスライディングウィンドウを畳み込みニューラルネットワークの第1の層のカーネルとして使用することをさらに含むことができる。
言い回し「畳み込みニューラルネットワーク(convolutional neural network)」は、本出願の文脈において、画像分類のために使用されるアルゴリズムとして解釈されるべきである。アルゴリズムは、対象物検出のために使用するのに先立って訓練することができる。この訓練は、特定の画像特徴に関連する畳み込みフィルターのデータベースをもたらす。畳み込みニューラルネットワークが対象物検出のために使用されると、複数の畳み込みが入力画像に対して実施され、複数の畳み込みにおける各畳み込みは異なる畳み込みフィルターを使用する。換言すれば、第1の層は、(変更されたカーネルを使用して)畳み込み演算を入力(画像フレームの画像データ)に適用し、その結果を次の層に渡す畳み込み層である。各畳み込みは、畳み込みフィルターに関連する画像特徴マップをもたらす。複数の畳み込みから得られる特徴マップは、その後、最終出力を形成するために使用される。最終出力は、その後、入力画像内の対象物を検出するために使用することができる。
変換されたスライディングウィンドウを畳み込みニューラルネットワークの第1の層のカーネルとしてすることに関連する利点は、第1の歪み画像の画像変換が必要とされない場合があることである。それにより、画像変換に関連する計算コストを低減することができる。
方法は、第1の歪み画像内の複数の位置の各位置について、変換されたスライディングウィンドウを記憶することをさらに含むことができる。
第1の歪み画像内の複数の位置の各位置について、変換されたスライディングウィンドウを記憶することに関連する利点は、変換されたスライディングウィンドウを後で使用することができることである。例えば、変換されたスライディングウィンドウは、画像処理パイプラインにおいて後でさらなる計算のために使用することができる。歪みが画像間で同じであるため、各画像フレームについてスライディングウィンドウの特徴検出パターンおよび/またはサイズを変更する必要性は全く存在しない。それにより、第1の歪み画像内の複数の位置の各位置について、変換されたスライディングウィンドウを記憶することは、第1の歪み画像と同じ方法で撮像された他の歪み画像内の対象物検出における、変換されたスライディングウィンドウの再使用を容易にし、そのことは、次に、複数の歪み画像における対象物検出に関連する計算時間および計算コストを減少させることができる。
変換されたスライディングウィンドウは、第1の歪み画像内の複数の位置の位置によって索引付けされるルックアップテーブルに記憶することができる。
第1の歪み画像内の複数の位置の位置によって索引付けされるルックアップテーブルに、変換されたスライディングウィンドウを記憶することに関連する利点は、それが、変換されたスライディングウィンドウの簡略化された取り出しを可能にし、それにより、関連する計算コストを低減することができることである。
方法が、複数の歪み画像に対して実施される場合、複数の歪み画像の各画像内の対象物の検出は、第1の歪み画像内の対象物検出のために使用される、変換されたスライディングウィンドウを使用することを含むことができる。
スライディングウィンドウの変換を、複数の歪み画像について1回実施することができることから、スライディングウィンドウが複数の歪み画像内の各歪み画像について変換される必要がないため、スライディングウィンドウの変換に関連する計算コストを低減することができる。
さらに、スライディングウィンドウの変換を、複数の歪み画像内の1つの歪み画像について実施することができるため、計算コストを、従来技術のシステムの場合と同様の複数の歪み画像内の各歪み画像の変換と比較して低減することができる。換言すれば、複数の歪み画像内の対象物検出に関連する計算コストを、本方法によって低減することができる。
方法は、複数の変換された画像を変換されたビデオストリームにエンコードすることをさらに含むことができる。
歪みは光学歪みを含むことができる。光学歪みは、樽型歪み、糸巻き型歪み、および/または陣笠型歪みを含むことができる。光学歪みは、撮像光学部品の光軸と画像センサの光軸との間のミスアライメントを含むことができる。光学歪みは接線歪みを含むことができる。
歪みは、画像データに適用される画像変換を含み、それにより、歪み画像を形成することができる。
画像変換は画像フィルターを含むことができる。画像変換は画像スティッチングを含むことができる。複数の1次画像を、パノラマ画像を形成するためにスティッチングすることができる。歪み画像は、形成されるパノラマ画像であることができる。形成されるパノラマ画像が画像スティッチングの結果として歪みあり特徴を含むことができることを当業者は認識する。
画像データに適用される画像変換を含み、それにより、歪み画像を形成する歪みに関連する利点は、画像データに関連する歪み画像が、対象物検出のためにスライディングウィンドウアルゴリズムを適用するのに先立ってフィルタリングすることができることである。それにより、画像データ内に存在する或る特徴を、対象物検出に先立って低減または除去することができる。
画像スティッチングを含む歪みに関連する利点は、それが、パノラマ画像内の対象物を検出することを本発明に可能にさせることである。
スライディングウィンドウを変換するステップはハードウェアにより実装されうる。例えば、特徴検出パターンの変更は、有利には、グラフィカル処理ユニット(GPU:graphical processing unit)などのハードウェアで実施することができる。
第2の態様によれば、コンピュータプログラム製品が提供される。コンピュータプログラム製品は、処理能力を有するデバイスによって実行されると、本方法を実施するように適合される命令を有するコンピュータ可読記憶媒体を備える。
コンピュータ可読記憶媒体は非一時的コンピュータ可読記憶媒体であることができる。
方法の上記で述べた特徴は、適用可能であるとき、この第2の態様にも適用される。不要な反復を避けるため、上記に対して参照が行われる。
第3の態様によれば、スライディングウィンドウアルゴリズムを使用して第1の歪み画像内の対象物を検出するために配置されたデバイスが提供される。デバイスは、第1の歪み画像を受信するために配置された画像受信機と;第1の歪み画像の歪みの数学的表現の反転を受信するために配置された歪み受信機と;少なくとも1つのプロセッサとを備え、少なくとも1つのプロセッサは:スライディングウィンドウを第1の歪み画像内の複数の位置にわたってスライドさせ、第1の歪み画像の複数の位置の各位置について:
その位置における歪みの数学的表現の反転に基づいてスライディングウィンドウを変換し;第1の歪み画像内の位置における対象物検出のために、スライディングウィンドウアルゴリズムにおいて、変換されたスライディングウィンドウを使用するために配置される。
方法および/またはコンピュータプログラム製品の上記で述べた特徴は、適用可能であるとき、この第3の態様にも適用される。不要な反復を避けるため、上記に対して参照が行われる。
デバイスは、歪み画像内の複数の位置の各位置について、変換されたスライディングウィンドウを記憶するために構成される非一時的記憶媒体をさらに備えることができる。
デバイスはカメラであることができる。
第4の態様によれば、スライディングウィンドウアルゴリズムを使用して歪み画像内の対象物を検出するために配置されたシステムが提供される。システムは、シーンの歪み画像を撮像するために配置されたカメラと;本デバイスとを備え、デバイスの画像受信機は、カメラによって撮像されるシーンの歪み画像を受信するために配置される。
方法、コンピュータプログラム製品、および/またはデバイスの上記で述べた特徴は、適用可能であるとき、この第4の態様にも適用される。不要な反復を避けるため、上記に対して参照が行われる。
本開示の適用可能性のさらなる範囲は、以下で示す詳細な説明から明らかになるであろう。しかしながら、詳細な説明および特定の例が、本発明の概念の好ましい変形を示しながら、例証としてのみ与えられることが理解されるべきであり、なぜならば、発明の概念の範囲内の種々の変更および修正が、この詳細な説明から当業者に明らかになることになるからである。
したがって、そのような方法およびシステムが変動する場合があるため、本発明の概念が、述べる方法の特定のステップまたは述べるシステムのコンポーネント部品に限定されないことが理解される。本明細書で使用される用語が、特定の実施形態を述べるためのものに過ぎず、制限的であることを意図されないことも理解される。本明細書および添付特許請求項で使用するとき、冠詞「1つの(a)」、「1つの(an)」、「その(the)」、および「前記(said)」が、別途文脈が明確に指示しない限り、要素の1つまたは複数が存在することを意味することを意図されることが留意されなげればならない。そのため、例えば、「或るユニット(a unit)」または「そのユニット(the unit)」に対する参照は、幾つかのデバイスまたは同様なものを含むことができる。さらに、言い回し「備えている(comprising)」、「含んでいる(including)」、「含んでいる(containing)」、および同様の言い回しは、他の要素またはステップを排除しない。
本発明の上記のまた他の態様は、本発明の実施形態を示す添付図面を参照して、ここでより詳細に述べられる。図は、特定の実施形態に本発明を制限するものと考えられるべきではなく;代わりに、図は、本発明を説明し理解するために使用される。
図に示すように、層および領域のサイズは、例証のために誇張され、したがって、本発明の実施形態の一般的な構造を示すために提供される。同様の参照数字は、全体を通して同様の要素を指す。
スライディングウィンドウアルゴリズムを使用して歪み画像内の対象物を検出するために配置されたデバイスを示す図である。 カメラを示す図である。 まっすぐな線を含むシーンを示す図である。 図2Aのシーンの歪み画像を示す図である。 特徴検出パターンおよび複数の変換されたスライディングウィンドウを示す図である。 スライディングウィンドウアルゴリズムを使用する、第1の歪み画像内の対象物を検出するための方法のブロックスキームである。 歪み画像内の対象物を検出するために配置されたシステムを示す図である。
本発明の概念は、ここで、発明の概念の現在のところ好ましい変更がそこに示される添付図面を参照して、以降でより完全に述べられることになる。しかしながら、本発明の概念は、多くの異なる形態で実装することができ、また、本明細書で述べる変更に限定されるものと解釈されるべきでなく;むしろ、これらの変更は、徹底性および完全性のために提供され、本発明の概念を当業者に完全に伝える。
特徴が画像内でワープされるため、歪み画像内の対象物を検出することが問題となる可能性がある。したがって、解決策は、対象物検出アルゴリズムを適用するのに先立って歪み画像をデワープすることである。デワーピングは、対象物検出アルゴリズムがそれについてうまく働く直線的に投影された画像に歪み画像を戻すプロセスである。しかしながら、デワーピングは、それ自体で、プロセッサに負荷をかけ、例えばプロセッサ内で、時間、電力、および帯域幅などの価値ある資源を同様に占有する計算上非常に重い演算である。さらに、デワーピングは、制限された資源であるカメラシステム内のスケーラーユニットに負荷をかけ、したがって、スケーラーに対するアクセスを同様に必要とする他のプロセスが損害を受ける場合がある。
スライディングウィンドウアルゴリズムにおいてスライディングウィンドウを変換することによって、歪み画像内で対象物を直接検出することができることを本発明者らは認識した。そのため、本発明の概念によって、対象物検出のためにスライディングウィンドウアルゴリズムを適用するのに先立って、歪み画像をデワープすることが必要でない。本発明の概念は、ここで、図1〜図4を参照して述べられる。
図1A〜図1Bは、スライディングウィンドウアルゴリズムを使用して第1の歪み画像600内の対象物を検出するために配置されたデバイス100を示す。デバイスの機能は、ここで、図2A〜図2Cと関連して説明される。
デバイス100は画像受信機102を備える。画像受信機102は、第1の歪み画像(以下の図2Bを参照されたい、参照数字600)を受信するために配置される。第1の歪み画像600は、ビデオストリーム内のフレームであることができる。画像受信機102を、画像センサから画像データを受信するために配置することができる。画像受信機102は画像センサであることができる。
デバイス100は歪み受信機104をさらに備える。歪み受信機104は、第1の歪み画像600の歪みの数学的表現の反転を受信するために配置される。歪みは光学歪みを含むことができる。光学歪みは、コリメーターを使用して決定することができる。歪みは、既知の平面ターゲットの歪み画像に基づいて決定することができる。既知の平面ターゲットは、変動および/または反復パターンを含むことができる。例えば、既知の平面ターゲットは、既知の幾何形状の反復パターンを含むことができる。反復パターンは、チェスボード様パターンであることができる。
歪みは、画像データに適用される画像変換を含み、それにより、歪み画像を形成することができる。画像変換は、パノラマ画像を形成するための画像のスティッチングに関連することができる。幾つかの変形において、歪みは、光学歪みと、撮像された画像データに適用される画像変換の組み合わせである。
画像受信機102および歪み受信機104は単一受信機であることができる。
デバイス100は少なくとも1つのプロセッサ106をさらに備える。少なくとも1つのプロセッサ106は、スライディングウィンドウ620を第1の歪み画像600の複数の位置にわたってスライドさせ、第1の歪み画像600内の複数の位置の各位置630、634、638について:位置630,634,638における歪みの数学的表現の反転に基づいてスライディングウィンドウ620を変換し;第1の歪み画像600内の位置630、634、638における対象物検出のために、スライディングウィンドウアルゴリズムにおいて、変換されたスライディングウィンドウ720、724、728を使用するために配置される。
スライディングウィンドウ620は特徴検出パターン700を含むことができる。複数の特徴検出パターン700は、デバイス100と通信状態にあるサーバー(図には示さず)から受信することができる、または、デバイス100に記憶することができる。複数の特徴検出パターンは、訓練プロセスによって予め決定することができる。訓練プロセスは、関心の特徴を含む複数の画像を使用することができる。訓練プロセスは、関心の特徴を含まない複数の画像を使用することができる。例えば、訓練プロセスは、車を含む複数の画像および車を含まない複数の画像を使用することができる。
訓練プロセスは、関心の特徴に最もよく一致することになる畳み込みニューラルネットワーク(CNN:convolutional neural network)のためのカーネルを決定する最適化技法を含むことができる。CNNにおいて、第1の層は、常に、スライディングウィンドウアルゴリズムおよび規定されたカーネルのセットを使用する畳み込み層である。典型的なCNNシナリオにおいて、各畳込み層は、それ自身の畳み込みカーネルのセットを有し、その畳み込みカーネルのセットについて、重みが、CNNの対象物(関心の特徴、例えば、車、人間など)検出シナリオに基づいて訓練されるべきである。上記で述べたように、歪み画像について、規定されたカーネルは、常に十分であるわけではない。本明細書で述べる発明の概念を使用して、特徴検出パターンおよび/またはCNNの畳み込み層のカーネルのセットのサイズは、歪の数学的表現の反転および歪み画像内の位置に基づいて変更することができる。その結果、歪み画像を、CNNに対する入力として使用することができ、CNNのカーネル、特に、第1の層の、しかし、さらに/代替的に同様に、CNNの他の畳み込み層のカーネルを、代わりに変更することができる。
少なくとも1つのプロセッサ106は、パノラマ画像を形成するために、例えばカメラの画像センサから受信される画像をスティッチングするためにさらに配置することができる。第1の歪み画像600は、形成されるパノラマ画像であることができる。
デバイス100は、図1Aに例示するように非一時的記憶媒体108をさらに備えることができる。非一時的記憶媒体108は、第1の歪み画像600内の複数の位置の各位置630、634、638について、変換されたスライディングウィンドウ720、724、728を記憶するために構成することができる。非一時的記憶媒体108は、画像受信機102によって受信される歪み画像を記憶するようにさらに構成することができる。非一時的記憶媒体108は、特定のカメラおよび/またはカメラモデルに関連する歪みおよび/または歪みの反転を記憶するようにさらに構成することができる。歪みが記憶媒体108に記憶される場合、少なくとも1つのプロセッサ106は、歪みの反転を計算するために使用することができる。非一時的記憶媒体108は、複数の特徴検出パターンを記憶するようにさらに構成することができる。
デバイス100は、図1Aに例示するようにエンコーダー110をさらに備えることができる。エンコーダー110は、変換された画像をさらなるビデオストリームにエンコードするために配置することができる。非一時的記憶媒体108は、さらなるビデオストリームを記憶するようにさらに構成することができる。
デバイス100は、図1Aに例示するようにデータバス112を備えることができる。画像受信機102、歪み受信機104、少なくとも1つのプロセッサ106、非一時的記憶媒体108、および/またはエンコーダー110はデータバス112を介して通信することができる。
デバイス100は、図1Bに例示するようにカメラ200であることができる。カメラ200は、図1Bに例示するように光学部品202を備えることができる。光学部品202は撮像光学部品であることができる。撮像光学部品はカメラ対物レンズであることができる。光学部品はシーン500を撮像することができる。デバイス100はシーン500のパノラマ画像を生成するために配置することができる。少なくとも1つのプロセッサ106は、シーン500のパノラマ画像を形成するため画像をスティッチングするためにさらに配置することができる。
本発明の概念は、ここで、図2A〜図2Cを参照してさらに述べられる。図2Aは、複数のまっすぐな線510、512、514、516、518を含むシーン500を示す。シーン500の直線的な画像は、まっすぐな線510、512、514、516、518を再生することになる。しかしながら、画像は、しばしば歪み、そのことは、図2Bにおいて樽型歪みとして例示される。図2Bは、図2Aのシーン500の歪み画像600を示す。図2Bに例示するように、シーン500内のまっすぐな線510、512、514、516、518は、歪み画像600内で屈曲線610、612、614、616、618として現れる。歪み画像600において例示するように、歪みは歪み画像600にわたって変動する。例えば、歪み画像600の中心の近くで、シーン500内のまっすぐな線514は歪み画像600内のまっすぐな線614として撮像される。歪み画像600の縁部の近くで、シーン500内のまっすぐな線510、518は歪み画像600内の屈曲線610、618として撮像される。換言すれば、図2Bに例示する歪みの場合、歪みは、歪み画像600の中心において小さく、歪み画像600の縁部に向かって大きい。そのため、歪みの程度および形状は、歪み自身および歪み画像600内の位置630、634、638に依存する。
図2Bにおいて、スライディングウィンドウ620が示される。歪み画像600内の特徴を正確に識別するため、特徴検出パターン700は、歪みの反転および歪み画像600内の位置630、634、638に基づいて変更することができる。図2Cに示す例において、特徴検出パターン700はまっすぐな線に関連する。特徴検出パターン700を歪み画像600に直接適用することは、例えば、歪み画像600内の第1の位置630および第3の位置638におけるまっすぐな線に関する特徴を正確に検出することができないことになる。しかしながら、特徴検出パターン700を歪み画像600に直接適用することは、例えば、歪み画像600内の第2の位置634におけるまっすぐな線に関する特徴を正確に検出することになる。そのため、スライディングウィンドウアルゴリズムが特徴検出パターン700に関する特徴を正確に識別するために、スライディングウィンドウ620は、歪み画像600内の各位置630、634、638についての歪の反転に基づいて変換することができる。これは、歪み画像600内の3つの異なる位置630、634、638について、図2Cの変更された特徴検出パターンを含む3つの変換されたスライディングウィンドウ720、724、728によって例示される。それにより、スライディングウィンドウアルゴリズムにおける変換されたスライディングウィンドウ720、724、728を歪み画像600に適用することは、歪み画像600内の各位置630、634、638についての特徴検出パターン700に関する特徴を正確に識別することになる。
図2Aに示すシーン500内のまっすぐな線510、512、514、516、518、図2Bの光学歪み、および図2Cの特徴検出パターン700が例に過ぎないこと、および、それらが、本発明の概念を説明するためにここで使用されることが理解される。本発明の概念が、異なる画像特徴、例えば、現実世界の対象物、および、異なる歪み、例えば、糸巻き型歪み、陣笠型歪み、および/または画像スティッチングを使用して説明することができることが理解される。
図3は、スライディングウィンドウアルゴリズムを使用する、第1の歪み画像600内の対象物を検出するための方法S300のブロックスキームである。方法S300は、第1の歪み画像600の歪みの数学的表現の反転を受信することS302を含む。
歪みは光学歪みを含むことができる。光学歪みは、樽型歪み、糸巻き型歪み、および/または陣笠型歪みを含むことができる。光学歪みは、撮像光学部品の光軸と画像センサの光軸との間のミスアライメントを含むことができる。
歪みは、画像データに適用される画像変換を含み、それにより、歪み画像を形成することができる。画像変換は画像スティッチングを含むことができる。画像スティッチングは、パノラマ画像を形成するために複数の1次画像をスティッチングすることができる。歪み画像はパノラマ画像であることができる。
歪み画像が、光学歪みおよび画像データに適用される画像変換を含むことができることが理解される。
対象物の検出は、スライディングウィンドウ620を、第1の歪み画像600にわたってスライドさせることS304、ならびに、第1の歪み画像600内の複数の位置の各位置630、634、638について:位置630、634、638における歪みの数学的表現の反転に基づいてスライディングウィンドウ620を変換することS306;および、第1の歪み画像600内の位置630、634、638における対象物検出のために、スライディングウィンドウアルゴリズムにおいて、変換されたスライディングウィンドウ720、724、728を使用することS308を含む。
スライディングウィンドウ620を変換するステップS306は、スライディングウィンドウ620の特徴検出パターン700を変更することS310を含むことができる。
スライディングウィンドウ620を変換するステップS306は、スライディングウィンドウ620のサイズを変更することS312を含むことができる。
スライディングウィンドウ620を変換するステップS306は、ハードウェア実装式であることができる。スライディングウィンドウ620を変換するステップS306は、特定用途向け集積回路(ASIC:application−specific integrated circuit)に実装することができる。スライディングウィンドウ620を変換するステップS306は、他の変形において、デバイス100の少なくとも1つのプロセッサ106内のソフトウェアに実装することができる。
変換されたスライディングウィンドウ720、724、728は、第1の歪み画像600内の複数の位置の位置630、634、638によって索引付けされるルックアップテーブルに記憶することができる。
方法S300は、変換されたスライディングウィンドウ720、724、728を畳み込みニューラルネットワークの第1の層のカーネルとして使用することをさらに含むことができる。
方法S300は、変換されたスライディングウィンドウ720、724、728を、第1の歪み画像600内の複数の位置の各位置630、634、638について記憶することS316をさらに含むことができる。
方法S300が複数の歪み画像に対して実施される場合、複数の歪み画像の各画像における対象物の検出は、第1の歪み画像600内の対象物検出のために使用される、変換されたスライディングウィンドウ720、724、728を使用することを含むことができる。複数の歪み画像はビデオストリームであることができる。方法S300は、複数の変換された画像を、変換されたビデオストリームにエンコードすることをさらに含むことができる。
図4は、スライディングウィンドウアルゴリズムを使用して歪み画像内の対象物を検出するために配置されたシステム800を示す。システム800は、シーン500の歪み画像を撮像するために配置されたカメラ810と;本デバイス100とを備え、デバイス100の画像受信機102は、カメラ810によって撮像されるシーン500(図2A)の歪み画像を受信するために配置される。カメラ810は撮像光学部品812を備えることができる。デバイス100の画像受信機102は、有線または無線通信インターフェースを介してシーン500の歪み画像を受信するために配置することができる。歪み画像は第1の歪み画像600であることができる。システム800は、シーン500のパノラマ画像を生成するために配置された複数のカメラを備えることができる。システム800は単一組み立て体に搭載することができる。
本発明の概念が、上記で述べる好ましい変形に決して限定されないことを当業者は認識する。逆に、多くの修正および変形が、添付特許請求項の範囲内で可能である。
さらに、開示される変形に対する変形が、図面、開示、および添付特許請求項の調査から、特許請求される発明を実施するときに、当業者によって理解され、もたらされ得る。
上記で開示されるシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェア、またはその組み合わせとして実装することができる。ハードウェア実装態様において、上記説明において参照される機能ユニット間のタスクの分割は、物理ユニットへの分割に必ずしも対応せず;逆に、1つの物理コンポーネントは複数の機能を有することができ、1つのタスクは幾つかの物理コンポーネントによって協働して実施することができる。或るコンポーネントまたは全てのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装することができる、あるいは、ハードウェアとしてまたは特定用途向け集積回路として実装することができる。例えば、スライディングウィンドウの変換は、GPUまたは特定用途向け集積回路、ASICに実装することができ、一方、変換されたスライディングウィンドウによってスライディングウィンドウアルゴリズムを実行することは、デバイスの中央処理ユニット、CPU(:Central Processing Unit)上で実行されるソフトウェアに実装することができる。

Claims (13)

  1. スライディングウィンドウアルゴリズムを使用して第1の歪み画像(600)内の対象物を検出するための方法(S300)であって:
    前記第1の歪み画像(600)の歪みの数学的表現の反転を受信すること(S302)を含み;
    対象物の検出は、特徴検出パターン(700)を含むスライディングウィンドウ(620)を、前記第1の歪み画像(600)にわたってスライドさせること(S304)、ならびに、前記第1の歪み画像(600)内の複数の位置の各位置(630,634,638)について:
    前記位置(630,634,638)における前記歪みの前記数学的表現の前記反転に基づいて前記スライディングウィンドウ(620)を変換すること(S306)であって、前記スライディングウィンドウ(620)を変換する前記ステップ(S306)は、前記変換されたスライディングウィンドウ(720,724,726)の前記特徴検出パターンの得られる歪みが、前記位置における前記第1の歪み画像(600)の前記歪みに対応するように、前記スライディングウィンドウ(620)の前記特徴検出パターン(700)を変更すること(S310)を含む、変換すること(S306);および、
    前記スライディングウィンドウアルゴリズムにおいて、前記変更された特徴検出パターンを含む前記変換されたスライディングウィンドウ(720,724,728)を使用すること(S308)
    を含む、方法(S300)。
  2. 前記スライディングウィンドウ(620)を変換する前記ステップ(S306)は、前記スライディングウィンドウ(620)のサイズを変更すること(S312)を含む、請求項1に記載の方法(S300)。
  3. 前記第1の歪み画像(600)内の前記複数の位置の各位置(630,634,638)について、前記変換されたスライディングウィンドウ(720,724,728)を記憶すること(S316)をさらに含む、請求項1または2に記載の方法(S300)。
  4. 前記変換されたスライディングウィンドウ(720,724,728)は、前記第1の歪み画像(600)内の前記複数の位置の前記位置(630,634,638)によって索引付けされるルックアップテーブル内に記憶される、請求項3に記載の方法(S300)。
  5. 複数の歪み画像のそれぞれにおける対象物の検出は、前記第1の歪み画像(600)における対象物検出のために使用される前記変換されたスライディングウィンドウ(720,724,728)を使用することを含む、複数の歪み画像に対して実施される請求項3または4に記載の方法(S300)。
  6. 前記歪みは光学歪みを含む、請求項1〜5のいずれか1項に記載の方法(S300)。
  7. 前記歪みは、画像データに適用される画像変換を含み、それにより、前記歪み画像を形成する、請求項1〜6のいずれか1項に記載の方法(S300)。
  8. 前記スライディングウィンドウ(620)を変換する前記ステップはハードウェアにより実装される、請求項1〜7いずれか1項に記載の方法(S300)。
  9. 処理能力を有するデバイスによって実行されると、請求項1の方法(S300)を実施するように適合される命令を有する非一時的コンピュータ可読記憶媒体を備えるコンピュータプログラム製品。
  10. スライディングウィンドウアルゴリズムを使用して第1の歪み画像(600)内の対象物を検出するために配置されたデバイス(100)であって:
    前記第1の歪み画像(600)を受信するために配置された画像受信機(102)と;
    前記第1の歪み画像(600)の歪みの数学的表現の反転を受信するために配置された歪み受信機(104)と;
    少なくとも1つのプロセッサ(106)とを備え、前記少なくとも1つのプロセッサ(106)は:
    特徴検出パターン(700)を含むスライディングウィンドウ(620)を、前記第1の歪み画像(600)の複数の位置にわたってスライドさせ、前記第1の歪み画像(600)内の複数の位置の各位置(630,634,638)について:
    前記位置(630,634,638)における前記歪みの前記数学的表現の前記反転に基づいて前記スライディングウィンドウ(620)を変換し、前記スライディングウィンドウ(620)を変換する前記ステップ(S306)は、前記変換されたスライディングウィンドウ(820,724,726)の前記特徴検出パターンの得られる歪みが、前記第1の歪み画像(600)の前記歪みに対応するように、前記スライディングウィンドウ(620)の前記特徴検出パターン(700)を変更し;
    前記第1の歪み画像(600)内の前記位置(630,634,638)における対象物検出のために、前記スライディングウィンドウアルゴリズムにおいて、前記変更された特徴検出パターンを含む前記変換されたスライディングウィンドウ(720,724,728)を使用する
    ために配置される、デバイス(100)。
  11. 前記歪み画像(600)内の前記複数の位置の各位置(630,634,638)について、前記変換されたスライディングウィンドウ(720,724,728)を記憶するために構成される非一時的記憶媒体(108)をさらに備える、請求項10に記載のデバイス(100)。
  12. 前記デバイス(100)はカメラ(200)である、請求項10または11に記載のデバイス(100)。
  13. スライディングウィンドウアルゴリズムを使用して歪み画像内の対象物を検出するために配置されたシステム(800)であって:
    シーン(500)の歪み画像を撮像するために配置されたカメラ(810)と;
    請求項10または11に記載のデバイス(100)とを備え、
    前記デバイス(100)の前記画像受信機(102)は、前記カメラ(810)によって撮像される前記シーン(500)の前記歪み画像を受信するために配置される、システム(800)。
JP2020066372A 2019-04-10 2020-04-02 歪み画像内の対象物を検出するための方法、システム、およびデバイス Pending JP2020194532A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP19168368.9A EP3722991B1 (en) 2019-04-10 2019-04-10 Method, system, and device for detecting an object in a distorted image
EP19168368.9 2019-04-10

Publications (2)

Publication Number Publication Date
JP2020194532A true JP2020194532A (ja) 2020-12-03
JP2020194532A5 JP2020194532A5 (ja) 2023-04-12

Family

ID=66217701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020066372A Pending JP2020194532A (ja) 2019-04-10 2020-04-02 歪み画像内の対象物を検出するための方法、システム、およびデバイス

Country Status (6)

Country Link
US (1) US11682190B2 (ja)
EP (1) EP3722991B1 (ja)
JP (1) JP2020194532A (ja)
KR (1) KR102598910B1 (ja)
CN (1) CN111815512A (ja)
TW (1) TW202042178A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210264153A1 (en) * 2020-02-21 2021-08-26 CACI, Inc.- Federal Machine learning method and apparatus for detection and continuous feature comparison

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7613357B2 (en) * 2005-09-20 2009-11-03 Gm Global Technology Operations, Inc. Method for warped image object recognition
US9373057B1 (en) 2013-11-01 2016-06-21 Google Inc. Training a neural network to detect objects in images
DE102014013967A1 (de) * 2014-09-19 2016-03-24 Audi Ag Head-up-Display für einen Kraftwagen, Kraftwagen mit einem Head-up-Display und Verfahren zum Anordnen eines Head-up-Displays in einem Kraftwagen
WO2016104842A1 (ko) * 2014-12-26 2016-06-30 재단법인 다차원 스마트 아이티 융합시스템 연구단 카메라의 왜곡을 고려한 물체 인식 시스템 및 방법
US20160217164A1 (en) * 2015-01-28 2016-07-28 Numenta, Inc. Sparse distributed representation of spatial-temporal data
EP3387849A4 (en) * 2015-12-09 2019-11-27 Origin Wireless, Inc. METHOD, DEVICE AND SYSTEMS FOR WIRELESS EVENT DETECTION AND MONITORING
CN106228510B (zh) * 2016-08-11 2019-01-29 中国电子科技集团公司第三十八研究所 基于畸变程度分割的无人机载实时sar图像配准方法
CN106504233B (zh) * 2016-10-18 2019-04-09 国网山东省电力公司电力科学研究院 基于Faster R-CNN的无人机巡检图像电力小部件识别方法及系统
FR3062223B1 (fr) * 2017-01-25 2019-04-19 Valeo Schalter Und Sensoren Gmbh Detection d'obstacles dans l'environnement d'un vehicule automobile par traitement d'images
WO2018232754A1 (en) 2017-06-23 2018-12-27 Microsoft Technology Licensing, Llc. JOINT OBJECT DETECTION BASED ON COLLABORATIVE INFORMATION
CN107590438A (zh) * 2017-08-16 2018-01-16 中国地质大学(武汉) 一种智能辅助驾驶方法及系统
CN110675307B (zh) * 2019-08-19 2023-06-06 杭州电子科技大学 基于vslam的3d稀疏点云到2d栅格图的实现方法
CN111126306A (zh) * 2019-12-26 2020-05-08 江苏罗思韦尔电气有限公司 一种基于边缘特征及滑动窗的车道线检测方法

Also Published As

Publication number Publication date
EP3722991B1 (en) 2024-05-29
CN111815512A (zh) 2020-10-23
KR20200119712A (ko) 2020-10-20
US11682190B2 (en) 2023-06-20
US20200327691A1 (en) 2020-10-15
TW202042178A (zh) 2020-11-16
KR102598910B1 (ko) 2023-11-03
EP3722991A1 (en) 2020-10-14

Similar Documents

Publication Publication Date Title
JP6330987B2 (ja) 画像処理装置、画像処理方法、及び記憶媒体
US8855441B2 (en) Method and apparatus for transforming a non-linear lens-distorted image
JP5906028B2 (ja) 画像処理装置、画像処理方法
JP4782899B2 (ja) 視差検出装置、測距装置及び視差検出方法
KR20170063953A (ko) 이미지 처리 방법 및 장치
JP6518115B2 (ja) 画像処理装置、撮像装置、画像処理装置の制御方法、及びプログラム
CN108805807B (zh) 环景图像的拼接方法及其系统
US9269131B2 (en) Image processing apparatus with function of geometrically deforming image, image processing method therefor, and storage medium
KR102157610B1 (ko) 초고해상도 디지털 이미지 생성을 통한 자동화 구조물 손상 검출 시스템 및 그 방법
KR20190086964A (ko) 어안 렌즈 및 전방위 영상의 왜곡 제거를 위한 장치 및 방법
JP2020036310A (ja) 画像処理方法、画像処理装置、撮像装置、レンズ装置、プログラム、記憶媒体、および、画像処理システム
JP2020194532A (ja) 歪み画像内の対象物を検出するための方法、システム、およびデバイス
JP2009100407A (ja) 画像処理装置及びその方法
JP6403401B2 (ja) 画像処理装置、画像処理方法、及び、プログラム
CN111953982B (zh) 编码失真的图像帧的方法、设备和介质
US11790483B2 (en) Method, apparatus, and device for identifying human body and computer readable storage medium
JP5344647B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP2017017609A (ja) 画像処理装置
JP6579934B2 (ja) 画像処理装置、撮像装置、画像処理方法、プログラム、記憶媒体
JP6273881B2 (ja) 画像処理装置、画像処理方法、及びプログラム
US20240029321A1 (en) Image processing method, image processing apparatus, storage medium, image processing system, method of generating machine learning model, and learning apparatus
TWI824321B (zh) 影像控制器、影像處理系統及影像修正方法
JP2013192152A (ja) 撮像装置、撮像システムおよび画像処理方法
Ghofur et al. Combining Super Resolution Algorithm (Gaussian Denoising and Kernel Blurring) and Compare with Camera Super Resolution
CN115567653A (zh) 图像控制器、图像处理系统及图像修正方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230403

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230403

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230913

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240213

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240522