JP2019194616A - 画像に基づく位置検出方法、装置、機器及び記憶媒体 - Google Patents

画像に基づく位置検出方法、装置、機器及び記憶媒体 Download PDF

Info

Publication number
JP2019194616A
JP2019194616A JP2019123629A JP2019123629A JP2019194616A JP 2019194616 A JP2019194616 A JP 2019194616A JP 2019123629 A JP2019123629 A JP 2019123629A JP 2019123629 A JP2019123629 A JP 2019123629A JP 2019194616 A JP2019194616 A JP 2019194616A
Authority
JP
Japan
Prior art keywords
image
target object
dimensional position
detection
imaging device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019123629A
Other languages
English (en)
Other versions
JP6845895B2 (ja
Inventor
シュビン リー、
Xubin Li
シュビン リー、
ジエン ワン、
Jian Wang
ジエン ワン、
シレイ ウエン、
Shilei Wen
シレイ ウエン、
エルイ ディン、
Errui Ding
エルイ ディン、
ハオ サン、
Hao Sun
ハオ サン、
ラ カン、
Kang Le
ラ カン、
インズ バオ、
Yingze Bao
インズ バオ、
ミンギュ チェン、
Mingyu Chen
ミンギュ チェン、
ジージェン チー、
Zhizhen Chi
ジージェン チー、
ズユ リウ、
Zeyu Liu
ズユ リウ、
チャンユエ ジャン、
Chengyue Zhang
チャンユエ ジャン、
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2019194616A publication Critical patent/JP2019194616A/ja
Application granted granted Critical
Publication of JP6845895B2 publication Critical patent/JP6845895B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Abstract

【課題】画像に基づく位置検出方法、装置、機器及び記憶媒体を提供する。【解決手段】異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得しS11、対象物体の各画像での2次元位置を検出しS12、対象物体の各画像での2次元位置、及び複数の撮影機器の内部パラメータと外部パラメータに基づいて、対象物体の実空間での3次元位置を決定するS13。これにより、マルチカメラに基づく3次元測位手法を実現し、物体測位の信頼性及び正確性を向上させる。【選択図】図1

Description

本願の実施例は、人工知能の技術分野に関し、特に画像に基づく位置検出方法、装置、機器及び記憶媒体に関する。
社会が知能化へ進んでいるに伴い、無人スーパーマーケットが新しい小売手段として幅広く注目されてきた。現在、無人スーパーマーケットの関連技術はあまり成熟しておらず、特に、如何にマルチカメラで顧客の位置を判断し位置追跡を持続的に行うかは課題となっている。
従来、画像に基づく測位方法は主に、単一カメラが撮影したピクチャーを基に、予め訓練した検出モデルにより画像から対象物体が位置する2次元位置を検出して取得し、当該2次元位置に基づいて物体の位置を測位する。しかしながら、対象物体が遮断されたり、対象物体のピクチャーにおける2次元位置の検出が不正確であったりする場合、測位不可又は不正確な測位の問題が生じやすい。
本願の実施例は、マルチカメラに基づく3次元測位手法を実現して、物体測位の信頼性及び正確性を向上させるための画像に基づく位置検出方法、装置、機器及び記憶媒体を提供する。
本願の実施例の第1態様は、異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得するステップと、対象物体の各画像での2次元位置を検出するステップと、前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定するステップとを含む画像に基づく位置検出方法を提供する。
本願の実施例の第2態様は、異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得するための第1の取得モジュールと、対象物体の各画像での2次元位置を検出するための検出モジュールと、前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定するための決定モジュールとを備える画像に基づく位置検出装置を提供する。
本願の実施例の第3態様は、1つ又は複数のプロセッサと、前記1つ又は複数のプロセッサにより実行されると、前記1つ又は複数のプロセッサに上記第1態様の前記方法を実現させる1つ又は複数のプログラムを記憶するための記憶装置とを備えるコンピュータ機器を提供する。
本願の実施例の第4態様は、プロセッサにより実行されると上記第1態様の前記方法を実現するコンピュータプログラムが記憶されたコンピュータ可読記憶媒体を提供する。
以上の各態様によれば、本願の実施例は、異なる方位に配置された複数の撮影機器が同一時刻に撮影して得られた画像を取得し、対象物体の各画像での2次元位置を検出し、検出した対象物体の各画像での2次元位置及び複数の撮影機器の内部パラメータと外部パラメータに基づいて対象物体の実空間での3次元位置を決定する。これにより、本願の実施例は、対象物体の複数の画像における2次元位置を組み合わせることで、対象物体の実空間での3次元位置を決定するため、対象物体がある画像においてほかの物体により遮断された場合においても、当該対象物体のほかの画像での2次元位置に基づいて正確な3次元位置を取得することができる。また、複数の画像に基づいて3次元位置を決定する手段は、単一画像における2次元位置の認識の不正確さにより3次元位置の測位が不正確になるという問題をも回避し、物体測位の正確性及び信頼性を向上させることができる。
なお、上記発明の概要において説明された内容は、本願の実施例のキーとなる特徴又は重要な特徴を限定することも、本願の範囲を制限することも意図しない。本願のほかの特徴は以下の説明により理解しやすくなる。
本願の実施例による画像に基づく位置検出方法のフローチャートである。 本願の実施例による画像に基づく位置検出方法のフローチャートである。 本願の実施例による画像に基づく位置検出方法のフローチャートである。 本願の実施例による画像に基づく位置検出装置の構造概略図である。 本願の実施例による検出モジュール42の構造概略図である。 本願の実施例による画像に基づく位置検出装置の構造概略図である。
以下、図面を参照しながら本願の実施例をさらに詳細に説明する。図面に本願のいくつかの実施例が示されているが、なお、本願は様々な形態で実現することができ、ここで説明する実施例に制限されるものではなく、むしろ、これらの実施例は本願のより徹底的且つ完全な理解のために提供されている。なお、本願の図面及び実施例は例示的なものに過ぎず、本願の保護範囲を制限するものではない。
本願の実施例の明細書、特許請求の範囲及び上記図面における用語「第1」、「第2」、「第3」、「第4」など(存在する場合)は類似した対象を区別するためのものであり、必ずしも特定の順番又は優先順位を説明すると限らない。なお、ここで説明される本願の実施例が例えばここで図示又は説明される順番以外の順番に従って実施できるように、このように使用されるデータは適宜交換してもよい。また、用語「含む」、「有する」及びこれらの任意の変形は、非排他的な包含をカバーすることを意図し、例えば、一連のステップ又はユニットを含むプロセス、方法、システム、製品又は機器は必ずしも明確に挙げられたステップ又はユニットに制限されるものではなく、明確に挙げられていない又はこれらのプロセス、方法、製品又は機器に固有のほかのステップ又はユニットを含んでもよい。
無人スーパーマーケットなどの新しい小売場面では、如何に複数のカメラによって顧客の位置を判断し持続的に追跡するかは技術的に困難である。ショッピングプロセスにわたって顧客と顧客が取る商品とを関連付けて、持続的に顧客の位置を取得することが必要とされる。現在、人体位置の判断方法としては、主に予め訓練されて得られた検出モデルに基づいて、画像から人体及び/又は四肢が位置する2次元位置を検出して取得し、当該2次元位置に基づいて測位を行う。しかしながら、上記2次元位置がモデルの正確性に非常に依存して決定されるため、誤検出又はほかの物体による対象物体の遮断の場合、2次元位置の検出が不正確になり、その結果、測位の失敗又は測位の不正確さの問題が生じやすい。
従来技術に存在する上記問題に対して、本願の実施例は、画像に基づく位置検出方法を提供し、当該方法は、複数の撮影機器が同一時刻に異なる方位で撮影して得られた複数の画像での対象物体の2次元位置に基づいて、複数の撮影機器の内部パラメータと外部パラメータと組み合わせて、対象物体の3次元位置を決定する。したがって、ある画像において対象物体がほかの物体により遮断された場合においても、当該対象物体のほかの画像での2次元位置に基づいて正確な3次元位置を取得できる。また、複数の画像に基づいて3次元位置を決定する手段は、単一画像における2次元位置の認識の不正確さにより3次元位置の測位が不正確になるという問題をも回避し、物体測位の正確性及び信頼性を向上させることができる。
以下、図面を参照しながら、本願の実施例の技術案を具体的に説明する。
図1は本願の実施例による画像に基づく位置検出方法のフローチャートであり、当該方法は、画像に基づく位置検出装置(以下、位置検出装置と略称)によって実行できる。図1に示されるように、当該方法は、ステップS11〜S13を含む。
S11、異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得する。
本実施例の前記複数の撮影機器は、同一の標定物に合わせてもよいし、それぞれ異なる標定物に合わせてもよく、各撮影機器の位置、向き及び撮影角度が必要に応じて設定できる。また、当該複数の撮影機器は、ネットワークタイムを読み取ることで時間を同期化させてもよいし、特定装置が送信した同期化信号を受信することで同期化させてもよいが、本実施例では、特に限定しない。
本実施例に係る撮影機器が撮影した画像はRGB画像又は深度画像である。
S12、対象物体の各画像での2次元位置を検出する。
本実施例における対象物体は、人体であってもよいし、ほかの生物体又は物体であってもよい。
本実施例では、対象物体の各画像での2次元位置を検出する際、少なくとも下記方法のうちの1種を採用できる。
利用可能な方法の1つとして、予め設定された重要点検出モデルに基づいて、各画像における対象物体の重要点を検出し、対象物体の重要点の各画像での分布領域を対象物体の各画像での2次元位置として決定する。好ましくは、上記重要点検出モデルは予め訓練して得られたニューラルネットワークモデルであってよい。本実施例の前記重要点は、対象物体上のいずれかの点であり得、例えば、対象物体が人間である場合、重要点は人体の手での点、腕での点、足での点などとしてもよいが、これらの位置での点に制限されない。
別の利用可能な方法として、予め設定された四肢検出モデルに基づいて、対象物体での各部分(例えば、人体の胴体や頭部など)を検出してよい。対象物体の各部分の各画像での2次元位置を決定し、各画像において対象物体の各部分が位置する2次元位置に基づいて、各画像において対象物体全体が位置する2次元位置を決定する。
さらなる利用可能な方法として、画像において重要点検出と対象物体での各部分の検出の両方を行う。例えば、利用可能な一形態では、まず、各画像において対象物体での各部分を検出して、対象物体の各部分の各画像での2次元位置を取得し、対象物体の各部分の各画像での2次元位置に基づいて、対象物体全体の各画像でのおおよその領域の位置を決定し、次に、上記おおよその領域の位置において重要点検出を行い、両方の検出結果に基づいて対象物体の各画像での正確な2次元位置を決定する。このような手段によれば、重要点の検出漏れ又は誤検出により測位が不正確になるという問題を回避するとともに、重要点検出の計算量を減少させて、検出効率を向上させることができる。別の利用可能な形態では、各画像において重要点検出及び対象物体の各部分の検出を同時に行い、各画像における対象物体での重要点の分布領域、及び対象物体の各部分が位置する領域の組み合わせに基づいて、対象物体の各画像での2次元位置を決定し、重要点の誤検出又は検出漏れによる第1の領域の位置決定への干渉を解消する。
さらなる利用可能な方法として、予め設定されたエッジ検出方法によって、対象物体の各画像での2次元位置を検出できる。
S13、前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定する。
本実施例の前記撮影機器の内部パラメータには、焦点距離、視野(FOV)、解像度が含まれるが、これらに制限されない。本実施例の前記撮影機器の外部パラメータには、座標位置、向き及びピッチ角が含まれるが、これらに制限されない。
対象物体の各画像での2次元位置が既知である場合、各撮影機器の内部パラメータ及び外部パラメータに基づいて、従来の幾何学理論と組み合わせることで、対象物体の実空間での3次元位置を取得できる。
同様に、対象物体の実空間での3次元位置を取得した後、上記撮影して得られた画像において対象物体がほかの物体により遮断されることによって、対象物体の当該画像での2次元位置を直接判断できない場合、対象物体の3次元位置、及び撮影機器が当該画像を撮影するときの内部パラメータと外部パラメータに基づいて、対象物体の当該画像での位置を逆方向に決定することができ、このようにして、対象物体が画像においてほかの物体により遮断された場合においても、対象物体の実際な3次元位置に基づいて、対象物体の画像での位置を推定することができ、それによって、対象物体が画像において遮断されることにより測位できないという問題を解決する。又は、対象物体の3次元位置を取得した後、各撮影機器の内部パラメータと外部パラメータに基づいて、幾何学的原理と組み合わせることで、対象物体の各画像での2次元位置を補正し、それによって、2次元位置測位の正確性を向上させてもよい。
本実施例では、異なる方位に配置された複数の撮影機器が同一時刻に撮影して得られた画像を取得し、対象物体の各画像での2次元位置を検出し、検出して得られた対象物体の各画像での2次元位置及び複数の撮影機器の内部パラメータと外部パラメータに基づいて、対象物体の実空間での3次元位置を決定する。これにより、本実施例では、対象物体の複数の画像での2次元位置を組み合わせることで、対象物体の実空間での3次元位置を決定するため、対象物体がある画像においてほかの物体により遮断された場合においても、当該対象物体のほかの画像での2次元位置に基づいて正確な3次元位置を取得することができる。また、複数の画像に基づいて3次元位置を決定する手段は、単一画像における2次元位置の認識の不正確さにより3次元位置の測位が不正確になるという問題を回避し、物体測位の正確性及び信頼性を向上させることができる。
以下、図面を参照しながら、上記実施例をさらに最適化させて拡張させる。
図2は、本願の実施例による画像に基づく位置検出方法のフローチャートであり、図2に示されるように、図1の実施例を基に、当該方法はステップS21〜S23を含む。
S21、異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得する。
S22、予め設定された検出モデルに基づいて、対象物体の各画像での2次元位置を検出する。
一例として、本実施例における検出モデルは、予め訓練して得られたニューラルネットワークモデルであってよく、当該ニューラルネットワークモデルは、対象物体での各部分の位置を検出し、対象物体の各部分の各画像での位置を取得した後、各画像において対象物体の各部分が位置する領域を直列接続して対象物体全体の各画像での2次元位置を取得することに用いられることができる。つまり、本実施例は、予め設定されたモデルに基づいて、対象物体の各部分の各画像での位置の領域を検出し、且つ各画像において対象物体の各部分が位置する2次元位置に基づいて、各画像において対象物体全体が位置する2次元位置を決定することができる。
上記検出モデルの正確性を向上させるために、モデル訓練を行うときに、モデルでの異なるネットワーク層が対象物体での異なる部分を検出するように訓練できる。例えば、モデルでの比較的下層のネットワーク層が対象物体での小寸法の部分を検出し、モデルでの比較的上層のネットワーク層が対象物体での大寸法の部分を検出するように訓練することができる。
上記例は、本実施例の技術案を明瞭に説明するために過ぎず、本願を一意に限定するものではない。
S23、前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定する。
本実施例では、予め設定された検出モデルによって対象物体の各画像での2次元位置を検出し、対象物体の各画像での2次元位置、及び各撮影機器の内部パラメータと外部パラメータに基づいて、対象物体の実空間での3次元位置を決定することによって、対象物体の2次元位置の認識効率及び正確性を向上させるとともに、本実施例では、対象物体の複数の画像での2次元位置に基づいて、対象物体の実空間での3次元位置を決定するという技術案は、単一画像に基づいて測位する場合、対象物体が画像において遮断されることによって、正確に測位できないという問題を解決できる。
図3は、本願の実施例による画像に基づく位置検出方法のフローチャートであり、図3に示されるように、図1の実施例を基に、当該方法はステップS31〜S34を含む。
S31、異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた深度画像を取得する。
S32、前記複数の撮影機器が撮影して得られた実空間において対象物体がない場合の深度画像を基準画像として取得する。
S33、各撮影機器ごとに、前記撮影機器が前記時刻に撮影した深度画像の深度情報と前記撮影機器が撮影した基準画像の深度情報との間の差異に基づいて、前記対象物体の各画像での2次元位置を決定する。
S34、前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定する。
本実施例における撮影機器が深度カメラであってもよく、当該撮影機器が撮影した画像が深度画像である。
対象物体が人体である場合、まず、撮影機器が撮影した人体を含む深度画像、及び撮影機器が撮影した場面に人体がない画像を取得し、同一場面に人体を含むときの画像の深度情報と人体を含まないときの画像の深度情報とに差異があるため、両方の深度情報の間の差異に基づいて人体の画像での2次元領域を決定することができ、次に、人体の複数の画像での2次元領域、及び各撮影機器の内部パラメータと外部パラメータに基づいて、幾何学的方法により人体の実場面での3次元位置を取得することができる。
勿論、上記例示は人間を例にして行われる例示的な説明に過ぎず、本願を一意に限定するものではなく、実際には、上記方法は人間を含める任意の物体に適用できる。
本実施例は、異なる方位に位置する複数の撮影機器が同一時刻に撮影して得られた深度画像、及び当該複数の撮影機器が撮影して得られた基準画像を取得し、各深度画像の深度情報とそれに対応した基準画像の深度情報との間の差異に基づいて、対象物体の各深度画像での2次元位置を決定し、それによって、対象物体の2次元位置の測位の正確性を向上させ、対象物体の3次元位置の測位を確保することができる。
図4は、本願の実施例による画像に基づく位置検出装置の構造概略図であり、図4に示されるように、当該装置40は、
異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得するための第1の取得モジュール41と、
対象物体の各画像での2次元位置を検出するための検出モジュール42と、
前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定するための決定モジュール43とを備える。
一つの利用可能な設計では、前記画像は深度画像を含む。
別の利用可能な設計では、前記装置はさらに、
前記対象物体の実空間での3次元位置、及び各撮影機器の外部パラメータと内部パラメータに基づいて、前記対象物体の各撮影機器が撮影した画像での2次元位置を補正するための補正モジュールを備える。
本実施例による装置は、図1の実施例の方法の実行に適用でき、その実行手段及び有益な効果が類似したため、ここで詳細な説明を省略する。
図5は、本願の実施例による検出モジュール42の構造概略図であり、図5に示されるように、図4の実施例を基に、検出モジュール42は、
予め設定された検出モデルに基づいて、対象物体の各画像での2次元位置を検出するための第1の検出サブモジュール421を備える。
一つの利用可能な設計では、前記第1の検出サブモジュール421は、具体的には、
予め設定された検出モデルに基づいて、各画像において前記対象物体の各部分が位置する2次元位置を検出し、
各画像において前記対象物体の各部分が位置する2次元位置に基づいて、各画像において前記対象物体全体が位置する2次元位置を決定することに用いられる。
本実施例による装置は、図2の実施例の方法の実行に適用でき、その実行手段及び有益な効果が類似したため、ここで詳細な説明を省略する。
図6は、本願の実施例による画像に基づく位置検出装置の構造概略図であり、図6に示されるように、図4の実施例を基に、前記装置40はさらに、
前記複数の撮影機器が撮影して得られた実空間において対象物体がない場合の深度画像を基準画像として取得するための第2の取得モジュール44を備え、
前記検出モジュール42は、
各撮影機器ごとに、前記撮影機器が前記時刻に撮影した深度画像の深度情報と前記撮影機器が撮影した基準画像の深度情報との間の差異に基づいて、前記対象物体の各画像での2次元位置を決定するための第2の検出サブモジュール422を備える。
本実施例による装置は、図3の実施例の方法の実行に適用でき、その実行手段及び有益な効果が類似したため、ここで詳細な説明を省略する。
本願の実施例はさらに、1つ又は複数のプロセッサと、前記1つ又は複数のプロセッサにより実行されると前記1つ又は複数のプロセッサに上記いずれかの実施例の前記方法を実現させる1つ又は複数のプログラムを記憶するための記憶装置とを備えるコンピュータ機器を提供する。
本願の実施例はさらに、プロセッサにより実行されると上記いずれかの実施例の前記方法を実現するコンピュータプログラムが記憶されたコンピュータ可読記憶媒体を提供する。
本明細書において、以上説明した機能は、少なくとも部分的に1つ又は複数のハードウェアロジックコンポーネントにより実行できる。例えば、使用可能な例示的なハードウェアロジックコンポーネントは、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け製品(ASSP)、システムオンチップ(SOC)、コンプレックスプログラマブルロジック機械(CPLD)などを含むが、それらに制限されない。
本開示の方法を実施するためのプログラムコードは1つ又は複数のプログラミング言語の任意の組み合わせを用いてプログラミングできる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又はほかのプログラマブルデータ処理装置のプロセッサ又はコントローラに提供でき、プログラムコードがプロセッサ又はコントローラにより実行されると、フローチャート及び/又はブロック図に規定された機能/操作が実施される。プログラムコードは、完全に機械において実行されてもよく、部分的に機械において実行されてもよく、独立したソフトウェアパッケージとして部分的に機械において実行され且つ部分的にリモート機械において実行されてもよく、又は完全にリモート機械又はサーバーにおいて実行されてもよい。
本明細書において、機械可読媒体は物理的な媒体であってよく、命令実行システム、装置又は機器が使用した又は命令実行システム、装置又は機器と組み合わせて使用するプログラムを含んだり記憶したりすることができる。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であり得る。機械可読媒体は、電子、磁性、光学、電磁気、赤外線、又は半導体のシステム、装置又は機器、又は上記内容の任意の適切な組み合わせを含むが、それらに制限されない。機械可読記憶媒体のさらなる具体例には、1つ又は複数のワイヤに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブル・コンパクト・ディスク読み出し専用メモリ(CD−ROM)、光学式記憶機器、磁気記憶機器、又は上記内容の任意の適切な組み合わせが含まれる。
また、特定の順番に従って各操作を説明したが、このような操作が示された特定の順序に従って又は順次実行されるか、又は所望の結果を達成させるために図示されたすべての操作が実行されることが要求されると理解すべきである。マルチタスク処理および並列処理は、特定の状況では有益な場合がある。同様に、上記の記述では複数の詳細が説明されたが、本開示の範囲を制限するものとして理解できない。別々の実施例の文脈で説明されているいくつかの特徴は、単一の実施形態において組み合わせて実施することもできる。逆に、単一の実施形態の文脈で説明されている様々な特徴は、個別にまたは任意の適切なサブ組み合わせの形で複数の実施形態において実施することもできる。
本主旨は構造特徴及び/又は方法の理論的な動作に特有の言語で説明されているが、添付の特許請求の範囲により限定された主旨は必ずしも上記で説明された特定の特徴又は動作に限定されない。むしろ、上記で説明された特定の特徴及び動作は単に特許請求の範囲を実施するための例示的な形態に過ぎない。

Claims (14)

  1. 画像に基づく位置検出方法であって、
    異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得するステップと、
    対象物体の各画像での2次元位置を検出するステップと、
    前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定するステップとを含むことを特徴とする画像に基づく位置検出方法。
  2. 対象物体の各画像での2次元位置を検出する前記ステップは、
    予め設定された検出モデルに基づいて、対象物体の各画像での2次元位置を検出するステップを含むことを特徴とする請求項1に記載の方法。
  3. 予め設定された検出モデルに基づいて、対象物体の各画像での2次元位置を検出する前記ステップは、
    予め設定された検出モデルに基づいて、各画像において前記対象物体での各部分が位置する2次元位置を検出するステップと、
    各画像において前記対象物体の各部分が位置する2次元位置に基づいて、各画像において前記対象物体全体が位置する2次元位置を決定するステップとを含むことを特徴とする請求項2に記載の方法。
  4. 前記画像は深度画像を含むことを特徴とする請求項1に記載の方法。
  5. 前記対象物体の各画像での2次元位置を検出する前に、前記方法はさらに、
    前記複数の撮影機器が撮影して得られた実空間において対象物体がない場合の深度画像を基準画像として取得するステップを含み、
    対象物体の各画像での2次元位置を検出する前記ステップは、
    各撮影機器ごとに、前記撮影機器が前記時刻に撮影した深度画像の深度情報と前記撮影機器が撮影した基準画像の深度情報との間の差異に基づいて、前記対象物体の各画像での2次元位置を決定するステップを含むことを特徴とする請求項4に記載の方法。
  6. 前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定した後、前記方法はさらに、
    前記対象物体の実空間での3次元位置、及び各撮影機器の外部パラメータと内部パラメータに基づいて、前記対象物体の各撮影機器が撮影した画像での2次元位置を補正するステップを含むことを特徴とする請求項1〜5のいずれか1項に記載の方法。
  7. 画像に基づく位置検出装置であって、
    異なる方位に配置され時間が同期化している複数の撮影機器が同一時刻に撮影して得られた画像を取得するための第1の取得モジュールと、
    対象物体の各画像での2次元位置を検出するための検出モジュールと、
    前記対象物体の各画像での2次元位置、及び前記複数の撮影機器の内部パラメータと外部パラメータに基づいて、前記対象物体の実空間での3次元位置を決定するための決定モジュールとを備えることを特徴とする画像に基づく位置検出装置。
  8. 前記検出モジュールは、予め設定された検出モデルに基づいて、対象物体の各画像での2次元位置を検出するための第1の検出サブモジュールを備えることを特徴とする請求項7に記載の装置。
  9. 前記第1の検出サブモジュールは、具体的には、
    予め設定された検出モデルに基づいて、各画像において前記対象物体での各部分が位置する2次元位置を検出し、
    各画像において前記対象物体の各部分が位置する2次元位置に基づいて、各画像において前記対象物体全体が位置する2次元位置を決定することに用いられることを特徴とする請求項8に記載の装置。
  10. 前記画像は深度画像を含むことを特徴とする請求項7に記載の装置。
  11. 前記装置はさらに、
    前記複数の撮影機器が撮影して得られた実空間において対象物体がない場合の深度画像を基準画像として取得するための第2の取得モジュールを含み、
    前記検出モジュールは、
    各撮影機器ごとに、前記撮影機器が前記時刻に撮影した深度画像の深度情報と前記撮影機器が撮影した基準画像の深度情報との間の差異に基づいて、前記対象物体の各画像での2次元位置を決定するための第2の検出サブモジュールを含むことを特徴とする請求項10に記載の装置。
  12. 前記装置はさらに、
    前記対象物体の実空間での3次元位置、及び各撮影機器の外部パラメータと内部パラメータに基づいて、前記対象物体の各撮影機器が撮影した画像での2次元位置を補正するための補正モジュールを含むことを特徴とする請求項7〜11のいずれか1項に記載の装置。
  13. コンピュータ機器であって、
    1つ又は複数のプロセッサと、
    前記1つ又は複数のプロセッサにより実行されると、前記1つ又は複数のプロセッサに請求項1〜6のいずれか1項に記載の方法を実現させる1つ又は複数のプログラムを記憶するための記憶装置とを含むことを特徴とするコンピュータ機器。
  14. コンピュータプログラムが記憶されたコンピュータ可読記憶媒体であって、当該プログラムがプロセッサにより実行されると、請求項1〜6のいずれか1項に記載の方法を実現することを特徴とするコンピュータ可読記憶媒体。
JP2019123629A 2018-07-03 2019-07-02 画像に基づく位置検出方法、装置、機器及び記憶媒体 Active JP6845895B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810717769.3A CN108986164B (zh) 2018-07-03 2018-07-03 基于图像的位置检测方法、装置、设备及存储介质
CN201810717769.3 2018-07-03

Publications (2)

Publication Number Publication Date
JP2019194616A true JP2019194616A (ja) 2019-11-07
JP6845895B2 JP6845895B2 (ja) 2021-03-24

Family

ID=64536624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019123629A Active JP6845895B2 (ja) 2018-07-03 2019-07-02 画像に基づく位置検出方法、装置、機器及び記憶媒体

Country Status (4)

Country Link
US (1) US11074709B2 (ja)
EP (1) EP3547259B1 (ja)
JP (1) JP6845895B2 (ja)
CN (1) CN108986164B (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340042B (zh) * 2018-12-19 2023-09-22 中国移动通信集团四川有限公司 物体轮廓识别方法、装置、设备及存储介质
CN109815813B (zh) * 2018-12-21 2021-03-05 深圳云天励飞技术有限公司 图像处理方法及相关产品
CN110472476A (zh) * 2019-06-24 2019-11-19 平安科技(深圳)有限公司 姿态匹配度获取方法、装置、计算机及存储介质
CN110826499A (zh) * 2019-11-08 2020-02-21 上海眼控科技股份有限公司 物体空间参数检测方法、装置、电子设备及存储介质
CN112911205B (zh) * 2019-12-04 2023-08-29 上海图漾信息科技有限公司 监测系统和方法
CN113392267B (zh) * 2020-03-12 2024-01-16 平湖莱顿光学仪器制造有限公司 一种用于生成目标对象的二维显微视频信息的方法与设备
CN113642281B (zh) * 2020-04-27 2024-04-05 浙江宇视科技有限公司 Pcb设计图的检测方法、装置、设备及介质
CN111814634B (zh) * 2020-06-29 2023-09-08 北京百度网讯科技有限公司 一种实时距离确定方法、装置、设备及介质
CN111767843B (zh) * 2020-06-29 2024-01-02 阿波罗智联(北京)科技有限公司 三维位置预测方法、装置、设备以及存储介质
CN112329645A (zh) * 2020-11-06 2021-02-05 北京迈格威科技有限公司 图像检测方法、装置、电子设备及存储介质
CN114650366A (zh) * 2020-12-18 2022-06-21 深圳市卫飞科技有限公司 飞鸟防御方法、主控模块、飞鸟防御系统及存储介质
CN115146686B (zh) * 2021-08-03 2023-04-14 嘉洋智慧安全科技(北京)股份有限公司 一种确定目标对象安装位置的方法、装置、设备及介质
CN114040115A (zh) * 2021-11-29 2022-02-11 海南哦课教育科技有限公司 目标对象异常动作的捕获方法、装置、介质和电子设备
CN114577112A (zh) * 2022-01-19 2022-06-03 格力电器(芜湖)有限公司 一种底盘螺栓位置检测方法及检测装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012057974A (ja) * 2010-09-06 2012-03-22 Ntt Comware Corp 撮影対象サイズ推定装置及び撮影対象サイズ推定方法並びにそのプログラム
JP2012068937A (ja) * 2010-09-24 2012-04-05 Panasonic Corp 瞳孔検出装置及び瞳孔検出方法
JP2013083505A (ja) * 2011-10-07 2013-05-09 National Institute Of Information & Communication Technology 3次元座標位置推定装置、その方法、そのプログラムおよび3次元座標推定システム、ならびに、カメラ較正情報生成装置
US20130162643A1 (en) * 2010-09-03 2013-06-27 Marc Cardle Physical Three-Dimensional Model Generation Apparatus
US9109886B1 (en) * 2012-10-09 2015-08-18 Amazon Technologies, Inc. Time-of-flight of light calibration
JP2016001181A (ja) * 2009-12-24 2016-01-07 コグネックス・コーポレイション カメラのミスキャリブレーションの実行時決定のためのシステムと方法
JP2018077196A (ja) * 2016-11-11 2018-05-17 スタンレー電気株式会社 監視システム
CN108053469A (zh) * 2017-12-26 2018-05-18 清华大学 多视角相机下的复杂动态场景人体三维重建方法及装置
WO2018101080A1 (ja) * 2016-11-30 2018-06-07 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元モデル配信方法及び三次元モデル配信装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103903246A (zh) * 2012-12-26 2014-07-02 株式会社理光 物体检测方法和装置
JP2016212784A (ja) * 2015-05-13 2016-12-15 株式会社リコー 画像処理装置、画像処理方法
US10699421B1 (en) * 2017-03-29 2020-06-30 Amazon Technologies, Inc. Tracking objects in three-dimensional space using calibrated visual cameras and depth cameras
US10755428B2 (en) * 2017-04-17 2020-08-25 The United States Of America, As Represented By The Secretary Of The Navy Apparatuses and methods for machine vision system including creation of a point cloud model and/or three dimensional model
CN107945282B (zh) * 2017-12-05 2021-01-29 洛阳中科信息产业研究院(中科院计算技术研究所洛阳分所) 基于对抗网络的快速多视角三维合成和展示方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016001181A (ja) * 2009-12-24 2016-01-07 コグネックス・コーポレイション カメラのミスキャリブレーションの実行時決定のためのシステムと方法
US20130162643A1 (en) * 2010-09-03 2013-06-27 Marc Cardle Physical Three-Dimensional Model Generation Apparatus
JP2012057974A (ja) * 2010-09-06 2012-03-22 Ntt Comware Corp 撮影対象サイズ推定装置及び撮影対象サイズ推定方法並びにそのプログラム
JP2012068937A (ja) * 2010-09-24 2012-04-05 Panasonic Corp 瞳孔検出装置及び瞳孔検出方法
JP2013083505A (ja) * 2011-10-07 2013-05-09 National Institute Of Information & Communication Technology 3次元座標位置推定装置、その方法、そのプログラムおよび3次元座標推定システム、ならびに、カメラ較正情報生成装置
US9109886B1 (en) * 2012-10-09 2015-08-18 Amazon Technologies, Inc. Time-of-flight of light calibration
JP2018077196A (ja) * 2016-11-11 2018-05-17 スタンレー電気株式会社 監視システム
WO2018101080A1 (ja) * 2016-11-30 2018-06-07 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元モデル配信方法及び三次元モデル配信装置
CN108053469A (zh) * 2017-12-26 2018-05-18 清华大学 多视角相机下的复杂动态场景人体三维重建方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SUSANTO, WANDI, ET AL.: ""3D Object Detection with Multiple Kinects"", LECTURE NOTES IN COMPUTER SCIENCE,[ONLINE], vol. 7584, JPN6020032666, 2012, DE, pages 93 - 102, XP047033435, ISSN: 0004338653, DOI: 10.1007/978-3-642-33868-7_10 *

Also Published As

Publication number Publication date
US20190318499A1 (en) 2019-10-17
EP3547259A2 (en) 2019-10-02
EP3547259B1 (en) 2020-11-25
EP3547259A3 (en) 2020-01-01
CN108986164A (zh) 2018-12-11
CN108986164B (zh) 2021-01-26
JP6845895B2 (ja) 2021-03-24
US11074709B2 (en) 2021-07-27

Similar Documents

Publication Publication Date Title
JP6845895B2 (ja) 画像に基づく位置検出方法、装置、機器及び記憶媒体
US20210000551A1 (en) Tracking system and tracking method using same
US10260862B2 (en) Pose estimation using sensors
Goncalves et al. A visual front-end for simultaneous localization and mapping
WO2015134794A2 (en) Method and system for 3d capture based on structure from motion with simplified pose detection
JP2008506953A5 (ja)
JPS59182688A (ja) ステレオ視処理装置
CN105554441B (zh) 用于配准图像的设备和方法
JP2006284372A (ja) 画像処理装置及び画像処理方法
WO2014100950A1 (en) Three-dimensional imaging system and handheld scanning device for three-dimensional imaging
CN110926330B (zh) 图像处理装置和图像处理方法
JP2014211404A (ja) モーションキャプチャー方法
CN103795935B (zh) 一种基于图像校正的摄像式多目标定位方法及装置
Führ et al. Camera self-calibration based on nonlinear optimization and applications in surveillance systems
JP6410231B2 (ja) 位置合わせ装置、位置合わせ方法及び位置合わせ用コンピュータプログラム
Fan et al. A shape-based stereo matching algorithm for binocular vision
Beltran et al. A comparison between active and passive 3d vision sensors: Bumblebeexb3 and Microsoft Kinect
US20210335010A1 (en) Calibration method and calibration apparatus
JP5336325B2 (ja) 画像処理方法
JP2007025863A (ja) 撮影システム、撮影方法及び画像処理プログラム
KR101578891B1 (ko) 패턴 인식을 이용한 영상 정보의 차원 일치 장치 및 방법
KR102410300B1 (ko) 스테레오 카메라를 이용한 카메라 위치 측정 장치 및 방법
JP2009266155A (ja) 移動体追跡装置及びその方法
JP2005031044A (ja) 三次元誤差測定装置
Kollmitzer Object detection and measurement using stereo images

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190702

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210226

R150 Certificate of patent or registration of utility model

Ref document number: 6845895

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250