JP2021517649A - 位置姿勢推定方法、装置、電子機器及び記憶媒体 - Google Patents

位置姿勢推定方法、装置、電子機器及び記憶媒体 Download PDF

Info

Publication number
JP2021517649A
JP2021517649A JP2021503196A JP2021503196A JP2021517649A JP 2021517649 A JP2021517649 A JP 2021517649A JP 2021503196 A JP2021503196 A JP 2021503196A JP 2021503196 A JP2021503196 A JP 2021503196A JP 2021517649 A JP2021517649 A JP 2021517649A
Authority
JP
Japan
Prior art keywords
coordinates
key point
estimated
covariance matrix
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2021503196A
Other languages
English (en)
Inventor
シャオウェイ ツォウ,
シャオウェイ ツォウ,
フジュン バオ,
フジュン バオ,
ユアン リュウ,
ユアン リュウ,
ペン,シダ
Original Assignee
ヂェージャン センスタイム テクノロジー デベロップメント カンパニー, リミテッド
ヂェージャン センスタイム テクノロジー デベロップメント カンパニー, リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヂェージャン センスタイム テクノロジー デベロップメント カンパニー, リミテッド, ヂェージャン センスタイム テクノロジー デベロップメント カンパニー, リミテッド filed Critical ヂェージャン センスタイム テクノロジー デベロップメント カンパニー, リミテッド
Publication of JP2021517649A publication Critical patent/JP2021517649A/ja
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

本開示は、位置姿勢推定方法、装置、電子機器及び記憶媒体に関する。前記方法は、被処理画像中の目標対象物に対してキーポイント検出処理を行って、複数のキーポイント及び各キーポイントに対応する第1共分散行列を得ること(S11)と、各キーポイントに対応する第1共分散行列に基づいて、複数のキーポイントから目標キーポイントを選出すること(S12)と、目標キーポイントに基づいて位置姿勢推定処理を行って、回転行列及び変位ベクトルを得ること(S13)とを含む。この位置姿勢推定方法によれば、キーポイント検出により被処理画像中のキーポイント及び対応する第1共分散行列を得て、第1共分散行列によりキーポイントをスクリーニングすることにより、キーポイント間の相互干渉を除くことができ、マッチング関係の正確性が上がる。また、キーポイントをスクリーニングすることにより、目標対象物の位置姿勢を代表できないキーポイントを除去することができ、推定された位置姿勢と実際の位置姿勢の誤差が減る。【選択図】図1

Description

「関連出願の相互参照」
本開示は、2018年12月25日に中国国家知識産権局に提出された、出願番号が201811591706.4で、発明の名称が「位置姿勢推定方法、装置、電子機器及び記憶媒体」である中国特許出願の優先権を主張し、その全ての内容は援用することによって本開示に組み込まれる。
本開示は、コンピュータ技術の分野に関し、特に、位置姿勢推定方法、装置、電子機器及び記憶媒体に関する。
関連の技術で、三次元空間と画像中の点とのマッチングを行う必要の場合、マッチングする点が多いため、一般にニューラルネットワーク等を利用して複数の点のマッチング関係を自動的に得る。しかしながら、出力誤差及び付近の複数の点との相互干渉により、マッチング関係は一般的に不正確なものであり、また、マッチングする点の大部分が目標対象物の位置姿勢を代表できないので、出力位置姿勢と実際の位置姿勢とで大きな誤差が発生してしまう。
本開示は、位置姿勢推定方法、装置、電子機器及び記憶媒体を提供する。
本開示の一方面によれば、被処理画像中の目標対象物に対してキーポイント検出処理を行って、被処理画像における目標対象物の複数のキーポイント、及び各キーポイントに対応する、キーポイントの被処理画像における位置座標とキーポイントの推定座標に基づいて決定される第1共分散行列を得ることと、各キーポイントに対応する第1共分散行列に基づいて、前記複数のキーポイントをスクリーニングして、複数のキーポイントから目標キーポイントを決定することと、前記目標キーポイントに基づいて位置姿勢推定処理を行って、回転行列及び変位ベクトルを得ることとを含む位置姿勢推定方法が提供される。
本開示の実施例の位置姿勢推定方法によれば、キーポイント検出により被処理画像中のキーポイント及び対応する第1共分散行列を得、第1共分散行列によりキーポイントをスクリーニングすることにより、キーポイント間の相互干渉を除くことができ、マッチング関係の正確性が上がる。また、キーポイントをスクリーニングすることにより、目標対象物の位置姿勢を代表できないキーポイントを除去することができ、推定された位置姿勢と実際の位置姿勢の誤差が減る。
可能な一実現形態では、前記目標キーポイントに基づいて位置姿勢推定処理を行って、回転行列及び変位ベクトルを得ることは、前記目標キーポイントの三次元座標系における三次元座標である空間座標を取得することと、前記目標キーポイントの被処理画像における二次元座標である位置座標及び前記空間座標に基づいて、初期回転行列及び初期変位ベクトルを決定することと、前記空間座標及び前記目標キーポイントの被処理画像における位置座標に基づいて、前記初期回転行列及び初期変位ベクトルを調整して、前記回転行列及び変位ベクトルを得ることとを含む。
可能な一実現形態では、前記空間座標及び前記位置座標に基づいて、前記初期回転行列及び初期変位ベクトルを調整して、前記回転行列及び変位ベクトルを得ることは、前記初期回転行列及び初期変位ベクトルに基づいて、前記空間座標の投影処理を行って、前記空間座標の前記被処理画像における投影座標を得ることと、前記投影座標と目標キーポイントの被処理画像における位置座標との誤差距離を決定することと、前記誤差距離に基づいて、前記初期回転行列及び初期変位ベクトルを調整することと、誤差条件を満たす場合に、前記回転行列及び変位ベクトルを得ることとを含む。
可能な一実現形態では、前記投影座標と前記目標キーポイントの被処理画像における位置座標との誤差距離を決定することは、各目標キーポイントの被処理画像における位置座標と投影座標とのベクトル差、及び各目標キーポイントに対応する第1共分散行列をそれぞれ得ることと、各目標キーポイントに対応するベクトル差及び第1共分散行列に基づいて、前記誤差距離を決定することとを含む。
可能な一実現形態では、被処理画像中の目標対象物に対してキーポイント検出処理を行って、被処理画像における目標対象物の複数のキーポイント及び各キーポイントに対応する第1共分散行列を得ることは、
被処理画像中の目標対象物に対してキーポイント検出処理を行って、各キーポイントの複数の推定座標及び各推定座標の重みを得ることと、各推定座標の重みに基づいて、前記複数の推定座標に対して加重平均処理を行って、前記キーポイントの位置座標を得ることと、前記複数の推定座標、各推定座標の重み及び前記キーポイントの位置座標に基づいて、前記キーポイントに対応する第1共分散行列を得ることとを含む。
可能な一実現形態では、複数の推定座標、各推定座標の重み及び前記キーポイントの位置座標に基づいて、前記キーポイントに対応する第1共分散行列を得ることは、各推定座標と前記キーポイントの位置座標との第2共分散行列を決定することと、各推定座標の重みに基づいて、複数の第2共分散行列に対して加重平均処理を行って、前記キーポイントに対応する第1共分散行列を得ることとを含む。
可能な一実現形態では、被処理画像中の目標対象物に対してキーポイント検出処理を行って、各キーポイントの複数の推定座標及び各推定座標の重みを得ることは、被処理画像中の目標対象物に対してキーポイント検出処理を行って、前記キーポイントの複数の初期推定座標及び各初期推定座標の重みを得ることと、各初期推定座標の重みに基づいて、複数の初期推定座標をスクリーニングして、前記初期推定座標から前記推定座標を選出することとを含む。
このように、重みに基づいて推定座標を選出することにより、計算量が減り、処理効率が上がり、外れ値が除去されてキーポイント座標の精度が上がる。
可能な一実現形態では、各キーポイントに対応する第1共分散行列に基づいて、前記複数のキーポイントをスクリーニングして、複数のキーポイントから目標キーポイントを決定することは、各キーポイントに対応する第1共分散行列の跡を決定することと、各キーポイントに対応する第1共分散行列から、予め設定された数量の第1共分散行列を選出し、ただし、選出された第1共分散行列の跡は選出されていない第1共分散行列の跡より小さいことと、選出された予め設定された数量の第1共分散行列に基づいて、前記目標キーポイントを決定することとを含む。
このように、キーポイントをスクリーニングして、キーポイント間の相互干渉を除去し、目標対象物の位置姿勢を代表できないキーポイントを除去することができ、位置姿勢推定の精度が向上し、処理効率が上がる。
本開示の別の方面によれば、被処理画像中の目標対象物に対してキーポイント検出処理を行って、被処理画像における目標対象物の複数のキーポイント、及び各キーポイントに対応する、キーポイントの被処理画像における位置座標とキーポイントの推定座標に基づいて決定される第1共分散行列を得る検出モジュールと、各キーポイントに対応する第1共分散行列に基づいて、前記複数のキーポイントをスクリーニングして、複数のキーポイントから目標キーポイントを決定するスクリーニングモジュールと、前記目標キーポイントに基づいて位置姿勢推定処理を行って、回転行列及び変位ベクトルを得る位置姿勢推定モジュールとを含む位置姿勢推定装置が提供される。
可能な一実現形態では、前記位置姿勢推定モジュールは、さらに、前記目標キーポイントの三次元座標系における三次元座標である空間座標を取得し、前記目標キーポイントの被処理画像における二次元座標である位置座標及び前記空間座標に基づいて、初期回転行列及び初期変位ベクトルを決定し、前記空間座標及び前記目標キーポイントの被処理画像における位置座標に基づいて、前記初期回転行列及び初期変位ベクトルを調整して、前記回転行列及び変位ベクトルを得るように構成される。
可能な一実現形態では、前記位置姿勢推定モジュールは、さらに、前記初期回転行列及び初期変位ベクトルに基づいて、前記空間座標の投影処理を行って、前記空間座標の前記被処理画像における投影座標を得、前記投影座標と目標キーポイントの被処理画像における位置座標との誤差距離を決定し、前記誤差距離に基づいて、前記初期回転行列及び初期変位ベクトルを調整し、誤差条件を満たす場合に、前記回転行列及び変位ベクトルを得るように構成される。
可能な一実現形態では、前記位置姿勢推定モジュールは、さらに、各目標キーポイントの被処理画像における位置座標と投影座標とのベクトル差、及び各目標キーポイントに対応する第1共分散行列をそれぞれ得、各目標キーポイントに対応するベクトル差及び第1共分散行列に基づいて、前記誤差距離を決定するように構成される。
可能な一実現形態では、前記検出モジュールは、さらに、被処理画像中の目標対象物に対してキーポイント検出処理を行って、各キーポイントの複数の推定座標及び各推定座標の重みを得、各推定座標の重みに基づいて、前記複数の推定座標に対して加重平均処理を行って、前記キーポイントの位置座標を得、複数の推定座標、各推定座標の重み及び前記キーポイントの位置座標に基づいて、前記キーポイントに対応する第1共分散行列を得るように構成される。
可能な一実現形態では、前記検出モジュールは、さらに、各推定座標と前記キーポイントの位置座標との第2共分散行列を決定し、各推定座標の重みに基づいて、複数の第2共分散行列に対して加重平均処理を行って、前記キーポイントに対応する第1共分散行列を得るように構成される。
可能な一実現形態では、前記検出モジュールは、さらに、被処理画像中の目標対象物に対してキーポイント検出処理を行って、前記キーポイントの複数の初期推定座標及び各初期推定座標の重みを得、各初期推定座標の重みに基づいて、複数の初期推定座標をスクリーニングして、前記初期推定座標から前記推定座標を選出するように構成される。
可能な一実現形態では、前記スクリーニングモジュールは、さらに、各キーポイントに対応する第1共分散行列の跡を決定し、各キーポイントに対応する第1共分散行列から、予め設定された数量の第1共分散行列を選出し、ただし、選出された第1共分散行列の跡は選出されていない第1共分散行列の跡より小さく、選出された予め設定された数量の第1共分散行列に基づいて、前記目標キーポイントを決定するように構成される。
本開示の別の方面によれば、プロセッサと、プロセッサにより実行可能な命令を記憶するメモリと、を含み、前記プロセッサは、上記の位置姿勢推定方法を実行するように構成される電子機器が提供される。
本開示の別の方面によれば、コンピュータプログラム命令が記憶されているコンピュータ可読記憶媒体であって、前記コンピュータプログラム命令はプロセッサによって実行されると、上記の位置姿勢推定方法を実現させるコンピュータ可読記憶媒体が提供される。
なお、上述した概略的な説明及び次の詳細な説明は、例示的及び解釈的なものに過ぎず、本開示を限定するものではない。
以下、図面を参考しながら例示的な実施例を詳細に説明することによって、本開示の他の特徴及び方面は明瞭になる。
ここで、本明細書の一部として組み込まれる図面は、本開示の実施例に適し、明細書と共に本開示の技術的解決手段の説明に用いられる。
図1は、本開示の実施例に係る位置姿勢推定方法のフローチャートを示す。 図2は、本開示の実施例に係るキーポイント検出の模式図を示す。 図3は、本開示の実施例に係るキーポイント検出の模式図を示す。 図4は、本開示の実施例に係る位置姿勢推定方法の適用の模式図を示す。 図5は、本開示の実施例に係る位置姿勢推定装置のブロック図を示す。 図6は、本開示の実施例に係る電子装置のブロック図を示す。 図7は、本開示の実施例に係る電子装置のブロック図を示す。
以下に、図面を参照しながら本開示の様々な例示的な実施例、特徴および方面を詳細に説明する。図面における同じ符号は同じまたは類似する機能の要素を示す。図面において実施例の様々な方面を示したが、特に断らない限り、比例に従って図面を描く必要がない。
ここでの用語「例示的」とは、「例、実施例として用いられることまたは説明的なもの」を意味する。ここで「例示的」に説明されるいかなる実施例は他の実施例より好ましいまたは優れるものであると理解すべきではない。
本明細書における用語「及び/又は」は、単に関連対象との関連関係を記述するものであり、3つの関係が存在可能であることを示し、例えば、A及び/又はBは、Aのみが存在し、AとBの両方が存在し、Bのみが存在するという3つの場合を示してもよい。また、本明細書における用語「少なくとも1つ」は複数のうちのいずれか1つ、又は複数のうちの少なくとも2つの任意の組み合わせを示し、例えば、A、B、Cのうちの少なくとも1つを含むことは、A、B及びCからなる集合から選択されたいずれか1つ又は複数の要素を含むことを示してもよい。
また、本開示をより効果的に説明するために、以下の具体的な実施形態において様々な具体的な詳細を示す。当業者であれば、本開示は何らかの具体的な詳細がなくても同様に実施できると理解すべきである。いくつかの実施例では、本開示の趣旨を強調するために、当業者が熟知している方法、手段、要素および回路について詳細な説明を行わない。
図1は、本開示の実施例に係る位置姿勢推定方法のフローチャートを示す。図1に示すように、当該方法は、被処理画像中の目標対象物に対してキーポイント検出処理を行って、被処理画像における目標対象物の複数のキーポイント、及び各キーポイントに対応する、キーポイントの被処理画像における位置座標とキーポイントの推定座標に基づいて決定される第1共分散行列を得るステップS11と、各キーポイントに対応する第1共分散行列に基づいて、前記複数のキーポイントをスクリーニングして、複数のキーポイントから目標キーポイントを決定するステップS12と、前記目標キーポイントに基づいて位置姿勢推定処理を行って、回転行列及び変位ベクトルを得るステップS13とを含む。
本開示の実施例の位置姿勢推定方法によれば、キーポイント検出により被処理画像中のキーポイント及び対応する第1共分散行列を得、第1共分散行列によりキーポイントをスクリーニングすることにより、キーポイント間の相互干渉を除くことができ、マッチング関係の正確性が上がる。また、キーポイントをスクリーニングすることにより、目標対象物の位置姿勢を代表できないキーポイントを除去することができ、推定された位置姿勢と実際の位置姿勢の誤差が減る。
可能な一実現形態では、被処理画像中の目標対象物に対してキーポイント検出処理を行う。被処理画像の各領域にそれぞれ位置する複数の目標対象物は前記被処理画像に含まれてもよく、又は被処理画像中の目標対象物は複数の領域を有してもよい。キーポイント検出処理によって各領域のキーポイントを得ることができる。例示的に、各領域のキーポイントの複数の推定座標を得、前記推定座標に基づいて、各領域のキーポイントの位置座標を得るようにしてもよい。さらに、前記位置座標及び前記推定座標に基づいて各キーポイントに対応する第1共分散行列を得るようにしてもよい。
可能な一実現形態では、ステップS11は、被処理画像中の目標対象物に対してキーポイント検出処理を行って、各キーポイントの複数の推定座標及び各推定座標の重みを得ることと、各推定座標の重みに基づいて、前記複数の推定座標に対して加重平均処理を行って、前記キーポイントの位置座標を得ることと、複数の推定座標、各推定座標の重み及び前記キーポイントの位置座標に基づいて、前記キーポイントに対応する第1共分散行列を得ることとを含むようにしてもよい。
可能な一実現形態では、予めトレーニングされたニューラルネットワークを用いて被処理画像を処理して、目標対象物のキーポイントの複数の推定座標及び各推定座標の重みを得るようにしてもよい。前記ニューラルネットワークは畳み込みニューラルネットワークであってもよい。本開示ではニューラルネットワークのタイプが限定されない。例示的に、前記ニューラルネットワークによって、各目標対象物のキーポイントの推定座標又は目標対象物の各領域のキーポイントの推定座標、及び各推定座標の重みを得てもよい。例示的に、画素処理等の方式によってキーポイントの推定座標を得てもよい。本開示ではキーポイント推定座標を得る方式が限定されない。
例示的に、前記ニューラルネットワークは、被処理画像の各画素の位置する領域、及びキーポイントの各領域を指す第1方向ベクトルを出力する。例えば、被処理画像にA及びBの2つ目標対象物がある(又は被処理画像に目標対象物が1つだけがあり、目標対象物をA及びBの2つの領域に分ける)場合に、被処理画像を3つの領域、即ち、領域A、領域B及び背景領域Cに分けて、領域の任意のパラメータを用いて画素の位置する領域を示すことができる。例えば、座標(10、20)の画素が領域Aに位置し、当該画素を(10、20、A)と示し、座標(50、80)の画素が背景領域に位置し、当該画素を(50、80、C)と示してもよい。前記第1方向ベクトルは単位ベクトル、例えば、(0.707、0.707)であってもよい。例示的に、画素の位置する領域及び第1方向ベクトルを前記画素の座標に添えて示してもよく、例えば、(10、20、A、0.707、0.707)で示してもよい。
例示的に、ある領域(例えば、領域A)中のキーポイントの推定座標を決定する場合、領域A中の任意の2つの画素の第1方向ベクトルの交点を決定し、当該交点を前記キーポイントの1つの推定座標として決定し、この方式で繰り返して任意の2つの第1方向ベクトルの交点を得、即ち、前記キーポイントの複数の推定座標を決定するようにしてもよい。
例示的に、次の式(1)によって各推定座標の重みを決定するようにしてもよい。
Figure 2021517649
ここで、wk,iはk番目の領域(例えば、領域A)中のi番目のキーポイントの推定座標の重み値であり、Oは当該領域中の全ての画素であり、p’は当該領域中の任意の1つの画素であり、hk,iは当該領域中のi番目のキーポイントの推定座標であり、
Figure 2021517649
はp’のhk,iを指す第2方向ベクトルであり、v(p’)はp’の第1方向ベクトルであり、θは所定の閾値であり、例示的に、θの値は0.99である。本開示では所定の閾値が限定されない。IIは活性化関数であり、
Figure 2021517649
とv(p’)の内積が所定の閾値θ以上である場合に、IIの値は1であり、そうでない場合に、IIの値は0である。式(1)は目標領域中の全ての画素の活性化関数の値を加算した結果、即ちキーポイントの推定座標hk,iの重みを表すことができる。本開示では内積が所定の閾値以上である場合の活性化関数の値が限定されない。
例示的に、キーポイントの複数の推定座標及び各推定座標の重みを得る上記の方法に従って、目標対象物の各領域又は各目標対象物のキーポイントの複数の推定座標及び各推定座標の重みを得るようにしてもよい。
図2は、本開示の実施例に係るキーポイント検出の模式図を示す。図2に示すように、図2に複数の目標対象物が含まれ、ニューラルネットワークによって各目標対象物のキーポイントの推定座標及び各推定座標の重みを得るようにしてもよい。
可能な一実現形態では、各領域のキーポイントの推定座標に対して加重平均処理を行って、各領域のキーポイントの位置座標を得るようにしてよい。キーポイントの複数の推定座標をスクリーニングして、重みが小さい推定座標を除去するようにしてもよい。これにより、計算量が減り、外れ値が除去され、キーポイント座標の精度が上がる。
可能な一実現形態では、被処理画像中の目標対象物に対してキーポイント検出処理を行って、各キーポイントの複数の推定座標及び各推定座標の重みを得ることは、被処理画像中の目標対象物に対してキーポイント検出処理を行って、前記キーポイントの複数の初期推定座標及び各初期推定座標の重みを得ることと、各初期推定座標の重みに基づいて、複数の初期推定座標をスクリーニングして、前記初期推定座標から前記推定座標を選出することとを含む。
このように、重みに基づいて推定座標を選出することにより、計算量が減り、処理効率が上がり、外れ値が除去されてキーポイント座標の精度が上がる。
可能な一実現形態では、ニューラルネットワークによってキーポイントの初期推定座標及び各初期推定座標の重みを取得するようにしてもよい。さらに、キーポイントの複数の初期推定座標から、重みが重み閾値以上である初期推定座標を選出し、又は重みが大きい一部の初期推定座標を選出し(例えば、各初期推定座標を重み大きさの順にソートして、重みの高い順から上位20%に入れる初期推定座標を選出する)、選出された初期推定座標を前記推定座標として決定し、残りの初期推定座標を除去するようにしてもよい。さらに、前記推定座標に対して加重平均処理を行って、前記キーポイントの位置座標を得るようにてもよい。このような方式で全てのキーポイントの位置座標を得るようにしてもよい。
可能な一実現形態では、各推定座標に対して加重平均処理を行って、前記キーポイントの位置座標を得るようにしてもよい。例示的に、次の式(2)によって前記キーポイントの位置座標を得る。
Figure 2021517649
ここで、μはk番目の領域(例えば、領域A)中のN個のキーポイントの推定座標に対して加重平均処理を行って得られたキーポイントの位置座標である。
可能な一実現形態では、キーポイントの複数の推定座標、各推定座標の重み及び前記キーポイントの位置座標に基づいて、前記キーポイントに対応する第1共分散行列を決定するようにしてもよい。例示的に、前記複数の推定座標、各推定座標の重み及び前記キーポイントの位置座標に基づいて、前記キーポイントに対応する第1共分散行列を得ることは、各推定座標と前記キーポイントの位置座標との第2共分散行列を決定することと、各推定座標の重みに基づいて、複数の第2共分散行列に対して加重平均処理を行って、前記キーポイントに対応する第1共分散行列を得ることとを含む。
可能な一実現形態では、キーポイントの位置座標は複数の推定座標の加重平均により得られた座標であり、各推定座標とキーポイントの位置座標との共分散行列(即ち、第2共分散行列)を得て、さらに、各推定座標の重みを用いて、第2共分散行列に対して加重平均処理を行って、前記第1共分散行列を得るようにしてもよい。
例示的に、次の式(3)によって前記第1共分散行列Σを得る。
Figure 2021517649
例示的に、推定座標を選出せずに、キーポイントの全ての初期推定座標に対する加重平均処理によってキーポイントの位置座標を得、各初期推定座標と前記位置座標との共分散行列を得、各共分散行列に対して加重平均処理を行って、キーポイントに対応する第1共分散行列を得るようにしてもよい。本開示では初期推定座標をスクリーニングするか否かは限定されない。
図3は、本開示の実施例に係るキーポイント検出の模式図を示す。図3に示すように、各領域中のキーポイントの位置座標及び第1共分散行列に基づいて、各領域中のキーポイント位置の確率分布を決定するようにしてもよい。例えば、図3で各目標対象物中の楕円形はキーポイント位置の確率分布を示し、楕円の中心(即ち、星印の位置)は各領域のキーポイントの位置座標である。
可能な一実現形態では、ステップS12において、各キーポイントに対応する第1共分散行列に基づいて、目標キーポイントを選出するようにしてもよい。例示的に、ステップS12は、各キーポイントに対応する第1共分散行列の跡を決定することと、各キーポイントに対応する第1共分散行列から、予め設定された数量の第1共分散行列を選出し、ただし、選出された第1共分散行列の跡は選出されていない第1共分散行列の跡より小さいことと、選出された予め設定された数量の第1共分散行列に基づいて、前記目標キーポイントを決定することとを含むようにしてもよい。
例示的に、被処理画像中の目標対象物は複数のキーポイントを含み、各キーポイントに対応する第1共分散行列の跡に基づいてキーポイントをスクリーニングするようにしてもよい。各キーポイントに対応する共分散行列の跡の算出は、第1共分散行列の主対角線の要素を加算するようにしてもよい。跡が小さい複数の第1共分散行列に対応するキーポイントを選出するようにしてもよい。例示的に、予め設定された数量の第1共分散行列を選出し、ただし、選出された第1共分散行列の跡は選出されていない第1共分散行列の跡より小さいようにしてもよい。例えば、キーポイントを跡の大きさの順にソートし、跡の小さい順から、予め設定された数量の第1共分散行列を選択し、例えば、跡の小さい順から4つの第1共分散行列を選択する。さらに、選出された第1共分散行列に対応するキーポイントを目標キーポイントとし、例えば、4つのキーポイントを選択するようにしてもよい。このように、目標対象物の位置姿勢を代表できるキーポイントを選出し、他のキーポイントの干渉を除くことができる。
このように、キーポイントをスクリーニングすることにより、キーポイント間の相互干渉を除去し、目標対象物の位置姿勢を代表できないキーポイントを除去することができ、位置姿勢推定の精度が向上し、処理効率が上がる。
可能な一実現形態では、ステップS13において、目標キーポイントに基づいて位置姿勢推定を行って、回転行列及び変位ベクトルを得るようにしてもよい。
可能な一実現形態では、ステップS13は、前記目標キーポイントの三次元座標系における三次元座標である空間座標を取得することと、前記目標キーポイントの被処理画像における二次元座標である位置座標及び前記空間座標に基づいて、初期回転行列及び初期変位ベクトルを決定することと、前記空間座標及び前記目標キーポイントの被処理画像における位置座標に基づいて、前記初期回転行列及び初期変位ベクトルを調整して、前記回転行列及び変位ベクトルを得ることとを含むようにしてもよい。
可能な一実現形態では、前記三次元座標系は前記目標対象物の位置する空間で構築された任意の空間座標系であり、撮られた目標対象物の三次元モデリングを行い、例えば、コンピュータ支援設計(Computer Aided Design、略称CAD)を利用して三次元モデリングを行い、三次元モデルにおいて目標キーポイントに対応する点の空間座標を決定するようにしてもよい。
可能な一実現形態では、目標キーポイントの被処理画像における位置座標(即ち、目標キーポイントの位置座標)及び前記空間座標に基づいて初期回転行列及び初期変位ベクトルを決定するようにしてもよい。例示的に、カメラの内部パラメータ行列と目標キーポイントの空間座標を掛け算し、最小二乗法を利用して乗算の結果と前記目標キーポイントの被処理画像における位置座標の要素を対応付けて解くことで、初期回転行列及び初期変位ベクトルを得るようにしてもよい。
例示的に、EPnP(Efficient Perspective−n−Point Camera Pose Estimation)アルゴリズム又は直接線形変換(Direct Linear Transform、略称DLT)アルゴリズムによって、目標キーポイントの被処理画像における位置座標及び各目標キーポイントの三次元座標を処理して、初期回転行列及び初期変位ベクトルを得るようにしてもよい。
可能な一実現形態では、初期回転行列及び初期変位ベクトルを調整するようにしてもよい。これによって推定された位置姿勢と目標対象物の実際の位置姿勢との誤差が小さくなる。
可能な一実現形態では、前記空間座標及び前記目標キーポイントの被処理画像における位置座標に基づいて、前記初期回転行列及び初期変位ベクトルを調整して、前記回転行列及び変位ベクトルを得ることは、前記初期回転行列及び初期変位ベクトルに基づいて、前記空間座標の投影処理を行って、前記空間座標の前記被処理画像における投影座標を得ることと、前記投影座標と目標キーポイントの被処理画像における位置座標との誤差距離を決定することと、前記誤差距離に基づいて、前記初期回転行列及び初期変位ベクトルを調整することと、誤差条件を満たす場合に、前記回転行列及び変位ベクトルを得ることとを含む。
可能な一実現形態では、初期回転行列及び初期変位ベクトルを用いて空間座標の投影処理を行って、空間座標の前記被処理画像における投影座標を得るようにしてもよい。さらに、投影座標と各目標キーポイントの被処理画像における位置座標との誤差距離を得るようにしてもよい。
可能な一実現形態では、前記投影座標と前記目標キーポイントの被処理画像における位置座標との誤差距離を決定することは、各目標キーポイントの被処理画像における位置座標と投影座標とのベクトル差、及び各目標キーポイントに対応する第1共分散行列をそれぞれ得ることと、各目標キーポイントに対応するベクトル差及び第1共分散行列に基づいて、前記誤差距離を決定することとを含む。
可能な一実現形態では、目標キーポイントに対応する空間座標の投影座標と目標キーポイントの被処理画像における位置座標とのベクトル差を得、例えば、ある目標キーポイントの投影座標と位置座標とを減算して前記ベクトル差を得るようにしてもよい。このような方式で全ての目標キーポイントに対応するベクトル差を得るようにしてもよい。
可能な一実現形態では、次の式(4)によって誤差距離を決定するようにしてもよい。
Figure 2021517649
ここで、Mは前記誤差距離であり、即ち、マハラノビス距離(Mahalanobis distance)であり、nは目標キーポイントの数量であり、
Figure 2021517649
はk番目の領域中の目標キーポイント(即ち、k番目の目標キーポイント)の三次元座標の投影座標であり、μは目標キーポイントの位置座標であり、
Figure 2021517649
は目標キーポイントに対応する第1共分散行列の逆行列である。即ち、各目標キーポイントに対応するベクトル差と第1共分散行列の逆行列を掛け算した後、各乗算結果の和を求めることで、前記誤差距離Mを得る。
可能な一実現形態では、前記誤差距離に基づいて、前記初期回転行列及び初期変位ベクトルを調整するようにしてもよい。例示的に、空間座標の投影座標と位置座標との誤差距離が小さくなるように初期回転行列及び初期変位ベクトルのパラメータを調整するようにしてもよい。例示的に、初期回転行列に対する誤差距離の勾配、及び初期変位ベクトルに対する誤差距離の勾配をそれぞれ決定し、勾配降下法によって初期回転行列及び初期変位ベクトルのパラメータを調整することにより、前記誤差距離を小さくするようにしてもよい。
可能な一実現形態では、初期回転行列及び初期変位ベクトルのパラメータを調整する上記の処理を、誤差条件を満たすまで繰り返し実行するようにしてもよい。前記誤差条件は誤差距離が誤差閾値以下になること、又は回転行列及び変位ベクトルのパラメータが変わらなくなること等を含んでよい。誤差条件を満たすと、パラメータが調整された回転行列及び変位ベクトルを位置姿勢推定用の回転行列及び変位ベクトルとするようにしてもよい。
本開示の実施例の位置姿勢推定方法によれば、キーポイントの検出により被処理画像中のキーポイントの推定位置及び重みを得て、重みに基づいて推定座標を選出することにより、計算量が減り、処理効率が上がり、外れ値が除去されてキーポイント座標の精度が上がる。さらに、第1共分散行列によりキーポイントをスクリーニングすることにより、キーポイント間の相互干渉を除くことができ、マッチング関係の正確性が上がる。また、キーポイントをスクリーニングすることにより、目標対象物の位置姿勢を代表できないキーポイントを除去することができ、推定された位置姿勢と実際の位置姿勢の誤差が減り、位置姿勢推定の精度が上がる。
図4は、本開示の実施例に係る位置姿勢推定方法の適用の模式図を示す。図4に示すように、図4の左側は被処理画像であり、被処理画像に対してキーポイント検出処理を行って、被処理画像中の各キーポイントの推定座標及び重みを得るようにしてもよい。
可能な一実現形態では、各キーポイントについて、各キーポイントの初期推定座標のうち、重みの高い順から上位20%に入れるものを推定座標として選出し、これらの推定座標に対して加重平均処理を行って、各キーポイントの位置座標を得るようにしてもよい(図4の左側の楕円形領域の中心の三角形印を参照)。
可能な一実現形態では、キーポイントの推定座標と位置座標との第2共分散行列を決定し、各推定座標の第2共分散行列に対して加重平均処理を行って、各キーポイントに対応する第1共分散行列を得るようにしてもよい。図4の左側の楕円形領域に示すように、各キーポイントの位置座標及び各キーポイントの第1共分散行列によって、各キーポイントの位置の確率分布を決定することができる。
可能な一実現形態では、各キーポイントの第1共分散行列の跡に基づいて、跡の小さい順からの4つの第1共分散行列に対応するキーポイントを目標キーポイントとして選択し、被処理画像中の目標対象物の三次元モデリングを行い、目標キーポイントの三次元モデルにおける空間座標を得るようにしてもよい(図4の右側の円形印を参照)。
可能な一実現形態では、目標キーポイントの空間座標と位置座標をEPnPアルゴリズム又はDLTアルゴリズムによって処理して、初期回転行列及び初期変位ベクトルを得、初期回転行列及び初期変位ベクトルによって、目標キーポイントの空間座標を投影して投影座標を得るようにしてもよい(図4の左側の円形印を参照)。
可能な一実現形態では、式(4)によって誤差距離を算出し、初期回転行列に対する誤差距離の勾配、及び初期変位ベクトルに対する誤差距離の勾配をそれぞれ決定し、さらに、勾配降下法によって初期回転行列及び初期変位ベクトルのパラメータを調整することにより、前記誤差距離を小さくするようにしてもよい。
可能な一実現形態では、誤差距離が誤差閾値以下になり、又は回転行列及び変位ベクトルのパラメータが変わらなくなる場合、パラメータが調整された回転行列及び変位ベクトルを位置姿勢推定用の回転行列及び変位ベクトルとするようにしてもよい。
図5は、本開示の実施例に係る位置姿勢推定装置のブロック図を示す。図5に示すように、前記装置は、被処理画像中の目標対象物に対してキーポイント検出処理を行って、被処理画像における目標対象物の複数のキーポイント、及び各キーポイントに対応する、キーポイントの被処理画像における位置座標とキーポイントの推定座標に基づいて決定される第1共分散行列を得る検出モジュール11と、各キーポイントに対応する第1共分散行列に基づいて、前記複数のキーポイントをスクリーニングして、複数のキーポイントから目標キーポイントを決定するスクリーニングモジュール12と、前記目標キーポイントに基づいて位置姿勢推定処理を行って、回転行列及び変位ベクトルを得る位置姿勢推定モジュール13とを含む。
可能な一実現形態では、前記位置姿勢推定モジュールは、さらに、前記目標キーポイントの三次元座標系における三次元座標である空間座標を取得し、前記目標キーポイントの被処理画像における二次元座標である位置座標及び前記空間座標に基づいて、初期回転行列及び初期変位ベクトルを決定し、前記空間座標及び前記目標キーポイントの被処理画像における位置座標に基づいて、前記初期回転行列及び初期変位ベクトルを調整して、前記回転行列及び変位ベクトルを得るように構成される。
可能な一実現形態では、前記位置姿勢推定モジュールは、さらに、前記初期回転行列及び初期変位ベクトルに基づいて、前記空間座標の投影処理を行って、前記空間座標の前記被処理画像における投影座標を得、前記投影座標と目標キーポイントの被処理画像における位置座標との誤差距離を決定し、前記誤差距離に基づいて、前記初期回転行列及び初期変位ベクトルを調整し、誤差条件を満たす場合に、前記回転行列及び変位ベクトルを得るように構成される。
可能な一実現形態では、前記位置姿勢推定モジュールは、さらに、各目標キーポイントの被処理画像における位置座標と投影座標とのベクトル差、及び各目標キーポイントに対応する第1共分散行列をそれぞれ得、各目標キーポイントに対応するベクトル差及び第1共分散行列に基づいて、前記誤差距離を決定するように構成される。
可能な一実現形態では、前記検出モジュールは、さらに、被処理画像中の目標対象物に対してキーポイント検出処理を行って、各キーポイントの複数の推定座標及び各推定座標の重みを得、各推定座標の重みに基づいて、前記複数の推定座標に対して加重平均処理を行って、前記キーポイントの位置座標を得、前記複数の推定座標、各推定座標の重み及び前記キーポイントの位置座標に基づいて、前記キーポイントに対応する第1共分散行列を得るように構成される。
可能な一実現形態では、前記検出モジュールは、さらに、各推定座標と前記キーポイントの位置座標との第2共分散行列を決定し、各推定座標の重みに基づいて、複数の第2共分散行列に対して加重平均処理を行って、前記キーポイントに対応する第1共分散行列を得るように構成される。
可能な一実現形態では、前記検出モジュールは、さらに、被処理画像中の目標対象物に対してキーポイント検出処理を行って、前記キーポイントの複数の初期推定座標及び各初期推定座標の重みを得、各初期推定座標の重みに基づいて、複数の初期推定座標をスクリーニングして、前記初期推定座標から前記推定座標を選出するように構成される。
可能な一実現形態では、前記スクリーニングモジュールは、さらに、各キーポイントに対応する第1共分散行列の跡を決定し、各キーポイントに対応する第1共分散行列から、予め設定された数量の第1共分散行列を選出し、ただし、選出された第1共分散行列の跡は選出されていない第1共分散行列の跡より小さく、選出された予め設定された数量の第1共分散行列に基づいて、前記目標キーポイントを決定するように構成される。
本開示で言及される上記各方法の実施例は、原理と論理に違反しない限り、相互に組み合わせて実施例を形成することができることが理解すべきである。紙数に限りがあるので、本開示では詳細な説明を省略する。
さらに、本開示では、位置姿勢推定装置、電子機器、コンピュータ可読記憶媒体、プログラムが提供される。これらはいずれも本開示に係る位置姿勢推定方法のいずれか1つを実現するために利用できる。対応する技術的解決手段と説明は、方法の対応する記載を参照すればよく、詳細な説明を省略する。
また、当業者であれば、具体的な実施形態に係る上記の方法では、各ステップの記載順序は、実行順序を厳密に限定して実施の過程を限定するものではなく、各ステップの実行順序がその機能と内部の論理によって具体的に決定されることが理解すべきである。
いくつかの実施例では、本開示の実施例に係る装置が備える機能又はモジュールは、上述した方法の実施例に説明される方法を実行するために利用でき、その具体的な実現について、上述した方法の実施例の説明を参照すればよく、簡素化のために、ここで詳細な説明を省略する。
本開示の実施例では、コンピュータプログラム命令が記憶されているコンピュータ可読記憶媒体であって、前記コンピュータプログラム命令はプロセッサによって実行されると、上記の方法を実現させるコンピュータ可読記憶媒体がさらに提供される。当該コンピュータ可読記憶媒体は、不揮発性のコンピュータ可読記憶媒体であってもよい。
本開示の実施例では、プロセッサと、プロセッサにより実行可能な命令を記憶するメモリと、を含み、前記プロセッサは、上記の方法を実行するように構成される電子機器がさらに提供される。
本開示の実施例では、コンピュータ可読コードを含むコンピュータプログラム製品であって、当該コンピュータ可読コードは機器において動作すると、機器のプロセッサに上述したいずれかの実施例に係る位置姿勢推定方法を実現するための命令を実行させるコンピュータプログラム製品がさらに提供される。
本開示の実施例では、コンピュータ可読命令が記憶されているコンピュータプログラム製品であって、命令は実行されると、コンピュータに上述したいずれかの実施例に係る位置姿勢推定方法の動作を実行させる別のコンピュータプログラム製品がさらに提供される。
当該コンピュータプログラム製品は、ハードウェア、ソフトウェア、又はそれらの組み合わせによって具体的に実現できる。選択可能的な一実施例では、前記コンピュータプログラム製品はコンピュータ記憶媒体として具現化される。選択可能的な別の実施例では、コンピュータプログラム製品はソフトウェア製品、例えば、ソフトウェア開発キット(Software Development Kit、略称SDK)等として具現化される。
電子機器は、端末、サーバ又は他の形態の機器として提供されてもよい。
図6は、例示的な一実施例の電子機器800のブロック図を示す。例えば、電子機器800は携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信機器、ゲームコンソール、タブレット型機器、医療機器、フィットネス機器、パーソナル・デジタル・アシスタント等の端末であってもよい。
図6を参照すると、電子機器800は、処理コンポーネント802、メモリ804、電源コンポーネント806、マルチメディアコンポーネント808、オーディオコンポーネント810、入力/出力(I/O)のインタフェース812、センサコンポーネント814、および通信コンポーネント816のうちの一つ以上を含んでもよい。
処理コンポーネント802は通常、電子機器800の全体的な動作、例えば表示、電話の呼び出し、データ通信、カメラ動作および記録動作に関連する動作を制御する。処理コンポーネント802は、上記方法の全てまたは一部のステップを実行するために、命令を実行する一つ以上のプロセッサ820を含んでもよい。また、処理コンポーネント802は、他のコンポーネントとのインタラクションのための一つ以上のモジュールを含んでもよい。例えば、処理コンポーネント802は、マルチメディアコンポーネント808とのインタラクションのために、マルチメディアモジュールを含んでもよい。
メモリ804は電子機器800での動作をサポートするための様々なタイプのデータを記憶するように構成される。これらのデータは、例として、電子機器800において操作するあらゆるアプリケーションプログラムまたは方法の命令、連絡先データ、電話帳データ、メッセージ、ピクチャー、ビデオなどを含む。メモリ804は、例えば静的ランダムアクセスメモリ(SRAM)、電気的消去可能プログラマブル読み取り専用メモリ(EEPROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM)、プログラマブル読み取り専用メモリ(PROM)、読み取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクなどの様々なタイプの揮発性または不揮発性記憶装置またはそれらの組み合わせによって実現できる。
電源コンポーネント806は電子機器800の各コンポーネントに電力を供給する。電源コンポーネント806は電源管理システム、一つ以上の電源、および電子機器800のための電力生成、管理および配分に関連する他のコンポーネントを含んでもよい。
マルチメディアコンポーネント808は前記電子機器800とユーザとの間で出力インタフェースを提供するスクリーンを含む。いくつかの実施例では、スクリーンは液晶ディスプレイ(LCD)およびタッチパネル(TP)を含んでもよい。スクリーンがタッチパネルを含む場合、ユーザからの入力信号を受信するタッチスクリーンとして実現してもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャーを検知するように、一つ以上のタッチセンサを含む。前記タッチセンサはタッチまたはスライド動きの境界を検知するのみならず、前記タッチまたはスライド操作に関連する持続時間および圧力を検出するようにしてもよい。いくつかの実施例では、マルチメディアコンポーネント808は前面カメラおよび/または背面カメラを含む。電子機器800が動作モード、例えば撮影モードまたは撮像モードになる場合、前面カメラおよび/または背面カメラは外部のマルチメディアデータを受信するようにしてもよい。各前面カメラおよび背面カメラは、固定された光学レンズ系、または焦点距離および光学ズーム能力を有するものであってもよい。
オーディオコンポーネント810はオーディオ信号を出力および/または入力するように構成される。例えば、オーディオコンポーネント810は、一つのマイク(MIC)を含み、マイク(MIC)は、電子機器800が動作モード、例えば呼び出しモード、記録モードおよび音声認識モードになる場合、外部のオーディオ信号を受信するように構成される。受信されたオーディオ信号はさらにメモリ804に記憶されるか、または通信コンポーネント816を介して送信されてもよい。いくつかの実施例では、オーディオコンポーネント810はさらに、オーディオ信号を出力するためのスピーカーを含む。
I/Oインタフェース812は処理コンポーネント802と周辺インタフェースモジュールとの間でインタフェースを提供し、上記周辺インタフェースモジュールはキーボード、クリックホイール、ボタンなどであってもよい。これらのボタンはホームボタン、音量ボタン、スタートボタンおよびロックボタンを含んでもよいが、これらに限定されない。
センサコンポーネント814は電子機器800の各方面の状態評価のために一つ以上のセンサを含む。例えば、センサコンポーネント814は電子機器800のオン/オフ状態、例えば電子機器800の表示装置およびキーパッドのようなコンポーネントの相対的位置決めを検出でき、センサコンポーネント814はさらに、電子機器800または電子機器800のあるコンポーネントの位置の変化、ユーザと電子機器800との接触の有無、電子機器800の方位または加減速および電子機器800の温度変化を検出できる。センサコンポーネント814は、いかなる物理的接触もない場合に近傍の物体の存在を検出するように構成される近接センサを含んでもよい。センサコンポーネント814はさらに、CMOSまたはCCDイメージセンサのような、イメージングアプリケーションにおいて使用するための光センサを含んでもよい。いくつかの実施例では、該センサコンポーネント814はさらに、加速度センサ、ジャイロセンサ、磁気センサ、圧力センサまたは温度センサを含んでもよい。
通信コンポーネント816は電子機器800と他の機器との有線または無線通信を実現するように構成される。電子機器800は通信規格に基づく無線ネットワーク、例えばWiFi、2Gまたは3G、またはそれらの組み合わせにアクセスできる。一例示的実施例では、通信コンポーネント816は放送チャネルを介して外部の放送管理システムからの放送信号または放送関連情報を受信する。一例示的実施例では、前記通信コンポーネント816はさらに、近距離通信を促進させるために、近距離無線通信(NFC)モジュールを含む。例えば、NFCモジュールは、無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(BT)技術および他の技術によって実現できる。
例示的な実施例では、電子機器800は一つ以上の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタルシグナルプロセッサ(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子要素によって実現され、上記方法を実行するために用いられることができる。
例示的な実施例では、さらに、不揮発性コンピュータ読み取り可能記憶媒体、例えばコンピュータプログラム命令を含むメモリ804が提供され、上記コンピュータプログラム命令は、電子機器800のプロセッサ820によって実行されと、上記方法を実行させることができる。
図7は、例示的な一実施例の電子機器1900のブロック図を示す。例えば、電子機器1900はサーバとして提供されてもよい。図7を参照すると、電子機器1900は、一つ以上のプロセッサを含む処理コンポーネント1922、および、処理コンポーネント1922によって実行可能な命令例えばアプリケーションプログラムを記憶するための、メモリ1932を代表とするメモリ資源を含む。メモリ1932に記憶されているアプリケーションプログラムは、それぞれが1つの命令群に対応する一つ以上のモジュールを含んでもよい。また、処理コンポーネント1922は命令を実行することによって上記方法を実行するように構成される。
電子機器1900はさらに、電子機器1900の電源管理を実行するように構成される電源コンポーネント1926、電子機器1900をネットワークに接続するように構成される有線または無線ネットワークインタフェース1950、および入出力(I/O)インタフェース1958を含んでもよい。電子機器1900はメモリ1932に記憶されいるオペレーティングシステム、例えばWindows ServerTM、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTMまたは類似するものに基づいて動作できる。
例示的な実施例では、さらに、不揮発性コンピュータ可読記憶媒体、例えばコンピュータプログラム命令を含むメモリ1932が提供され、上記コンピュータプログラム命令は、電子機器1900の処理コンポーネント1922によって実行されと、上記方法を実行させることができる。
本開示はシステム、方法および/またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、プロセッサに本開示の各方面を実現させるためのコンピュータ可読プログラム命令が有しているコンピュータ可読記憶媒体を含んでもよい。
コンピュータ可読記憶媒体は、命令実行機器に使用される命令を保存および記憶可能な有形装置であってもよい。コンピュータ可読記憶媒体は例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置、または上記の任意の適当な組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のさらに具体的な例(非網羅的リスト)としては、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)、静的ランダムアクセスメモリ(SRAM)、携帯型コンパクトディスク読み取り専用メモリ(CD−ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピーディスク、例えば命令が記憶されているせん孔カードまたはスロット内突起構造のような機械的符号化装置、および上記の任意の適当な組み合わせを含む。ここで使用されるコンピュータ可読記憶媒体は、瞬時信号自体、例えば無線電波または他の自由に伝播される電磁波、導波路または他の伝送媒体を経由して伝播される電磁波(例えば、光ファイバーケーブルを通過するパルス光)、または電線を経由して伝送される電気信号と解釈されるものではない。
ここで記述したコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から各計算/処理機器にダウンロードされてもよいし、またはネットワーク、例えばインターネット、ローカルエリアネットワーク、広域ネットワークおよび/または無線ネットワークを介して外部のコンピュータまたは外部記憶装置にダウンロードされてもよい。ネットワークは銅伝送ケーブル、光ファイバー伝送、無線伝送、ルーター、ファイアウォール、交換機、ゲートウェイコンピュータおよび/またはエッジサーバを含んでもよい。各計算/処理機器内のネットワークアダプタカードまたはネットワークインタフェースはネットワークからコンピュータ可読プログラム命令を受信し、該コンピュータ可読プログラム命令を転送し、各計算/処理機器内のコンピュータ可読記憶媒体に記憶させる。
本開示の動作を実行するためのコンピュータプログラム命令はアセンブリ命令、命令セットアーキテクチャ(ISA)命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk、C++などのオブジェクト指向プログラミング言語、および「C」言語または類似するプログラミング言語などの一般的な手続き型プログラミング言語を含める一つ以上のプログラミング言語の任意の組み合わせで書かれたソースコードまたは目標コードであってもよい。コンピュータ可読プログラム命令は、完全にユーザのコンピュータにおいて実行されてもよく、部分的にユーザのコンピュータにおいて実行されてもよく、スタンドアロンソフトウェアパッケージとして実行されてもよく、部分的にユーザのコンピュータにおいてかつ部分的にリモートコンピュータにおいて実行されてもよく、または完全にリモートコンピュータもしくはサーバにおいて実行されてもよい。リモートコンピュータに関与する場合、リモートコンピュータは、ローカルエリアネットワーク(LAN)または広域ネットワーク(WAN)を含む任意の種類のネットワークを経由してユーザのコンピュータに接続されてもよく、または、(例えばインターネットサービスプロバイダを利用してインターネットを経由して)外部コンピュータに接続されてもよい。いくつかの実施例では、コンピュータ可読プログラム命令の状態情報を利用して、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)またはプログラマブル論理アレイ(PLA)などの電子回路をパーソナライズし、該電子回路によりコンピュータ可読プログラム命令を実行することににより、本開示の各方面を実現するようにしてもよい。
ここで本開示の実施例に係る方法、装置(システム)およびコンピュータプログラム製品のフローチャートおよび/またはブロック図を参照しながら本開示の各態様を説明したが、フローチャートおよび/またはブロック図の各ブロックおよびフローチャートおよび/またはブロック図の各ブロックの組み合わせは、いずれもコンピュータ可読プログラム命令によって実現できることを理解すべきである。
これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータまたは他のプログラマブルデータ処理装置のプロセッサへ提供され、これらの命令がコンピュータまたは他のプログラマブルデータ処理装置のプロセッサによって実行されると、フローチャートおよび/またはブロック図の一つ以上のブロックにおいて指定された機能/動作を実現ように、装置を製造してもよい。これらのコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体に記憶され、コンピュータ、プログラマブルデータ処理装置および/または他の機器を特定の方式で動作させるようにしてもよい。これにより、命令が記憶されているコンピュータ可読記憶媒体は、フローチャートおよび/またはブロック図の一つ以上のブロックにおいて指定された機能/動作の各方面を実現する命令を有する製品を含む。
コンピュータ可読プログラム命令は、コンピュータ、他のプログラマブルデータ処理装置、または他の機器にロードされ、コンピュータ、他のプログラマブルデータ処理装置または他の機器に一連の動作ステップを実行させることにより、コンピュータにより実施なプロセスを生成するようにしてもよい。このようにして、コンピュータ、他のプログラマブルデータ処理装置、または他の機器において実行される命令により、フローチャートおよび/またはブロック図の一つ以上のブロックにおいて指定された機能/動作を実現する。
図面のうちフローチャートおよびブロック図は、本開示の複数の実施例に係るシステム、方法およびコンピュータプログラム製品の実現可能なシステムアーキテクチャ、機能および動作を示す。この点では、フローチャートまたはブロック図における各ブロックは一つのモジュール、プログラムセグメントまたは命令の一部分を代表することができ、前記モジュール、プログラムセグメントまたは命令の一部分は指定された論理機能を実現するための一つ以上の実行可能命令を含む。いくつかの代替としての実現形態では、ブロックに表記される機能は、図面に付した順序と異なって実現してもよい。例えば、連続的な二つのブロックは実質的に並列に実行してもよく、また、係る機能によって、逆な順序で実行してもよい。なお、ブロック図および/またはフローチャートにおける各ブロック、およびブロック図および/またはフローチャートにおけるブロックの組み合わせは、指定される機能または動作を実行するハードウェアに基づく専用システムによって実現してもよいし、または専用ハードウェアとコンピュータ命令との組み合わせによって実現してもよいことにも注意すべきである。
以上、本開示の各実施例を記述したが、上記説明は例示的なものに過ぎず、網羅的なものではなく、かつ披露された各実施例に限定されるものでもない。当業者にとって、説明された各実施例の範囲および精神から逸脱することなく、様々な修正および変更が自明である。本明細書に選ばれた用語は、各実施例の原理、実際の適用または既存技術に対する改善を好適に解釈するか、または他の当業者に本文に披露された各実施例を理解させるためのものである。

Claims (18)

  1. 被処理画像中の目標対象物に対してキーポイント検出処理を行って、被処理画像における目標対象物の複数のキーポイント、及び各キーポイントに対応する、キーポイントの被処理画像における位置座標とキーポイントの推定座標に基づいて決定される第1共分散行列を得ることと、
    各キーポイントに対応する第1共分散行列に基づいて、前記複数のキーポイントをスクリーニングして、複数のキーポイントから目標キーポイントを決定することと、
    前記目標キーポイントに基づいて位置姿勢推定処理を行って、回転行列及び変位ベクトルを得ることとを含むことを特徴とする位置姿勢推定方法。
  2. 前記目標キーポイントに基づいて位置姿勢推定処理を行って、回転行列及び変位ベクトルを得ることは、
    前記目標キーポイントの三次元座標系における三次元座標である空間座標を取得することと、
    前記目標キーポイントの被処理画像における二次元座標である位置座標及び前記空間座標に基づいて、初期回転行列及び初期変位ベクトルを決定することと、
    前記空間座標及び前記目標キーポイントの被処理画像における位置座標に基づいて、前記初期回転行列及び初期変位ベクトルを調整して、前記回転行列及び変位ベクトルを得ることとを含むことを特徴とする請求項1に記載の方法。
  3. 前記空間座標及び前記位置座標に基づいて、前記初期回転行列及び初期変位ベクトルを調整して、前記回転行列及び変位ベクトルを得ることは、
    前記初期回転行列及び初期変位ベクトルに基づいて、前記空間座標の投影処理を行って、前記空間座標の前記被処理画像における投影座標を得ることと、
    前記投影座標と目標キーポイントの被処理画像における位置座標との誤差距離を決定することと、
    前記誤差距離に基づいて、前記初期回転行列及び初期変位ベクトルを調整することと、
    誤差条件を満たす場合に、前記回転行列及び変位ベクトルを得ることとを含むことを特徴とする請求項2に記載の方法。
  4. 前記投影座標と前記目標キーポイントの被処理画像における位置座標との誤差距離を決定することは、
    各目標キーポイントの被処理画像における位置座標と投影座標とのベクトル差、及び各目標キーポイントに対応する第1共分散行列をそれぞれ得ることと、
    各目標キーポイントに対応するベクトル差及び第1共分散行列に基づいて、前記誤差距離を決定することとを含むことを特徴とする請求項3に記載の方法。
  5. 被処理画像中の目標対象物に対してキーポイント検出処理を行って、被処理画像における目標対象物の複数のキーポイント及び各キーポイントに対応する第1共分散行列を得ることは、
    被処理画像中の目標対象物に対してキーポイント検出処理を行って、各キーポイントの複数の推定座標及び各推定座標の重みを得ることと、
    各推定座標の重みに基づいて、複数の推定座標に対して加重平均処理を行って、前記キーポイントの位置座標を得ることと、
    複数の推定座標、各推定座標の重み及び前記キーポイントの位置座標に基づいて、前記キーポイントに対応する第1共分散行列を得ることとを含むことを特徴とする請求項1〜4のいずれか1項に記載の方法。
  6. 前記複数の推定座標、各推定座標の重み及び前記キーポイントの位置座標に基づいて、前記キーポイントに対応する第1共分散行列を得ることは、
    各推定座標と前記キーポイントの位置座標との第2共分散行列を決定することと、
    各推定座標の重みに基づいて、複数の第2共分散行列に対して加重平均処理を行って、前記キーポイントに対応する第1共分散行列を得ることとを含むことを特徴とする請求項5に記載の方法。
  7. 被処理画像中の目標対象物に対してキーポイント検出処理を行って、各キーポイントの複数の推定座標及び各推定座標の重みを得ることは、
    被処理画像中の目標対象物に対してキーポイント検出処理を行って、前記キーポイントの複数の初期推定座標及び各初期推定座標の重みを得ることと、
    各初期推定座標の重みに基づいて、複数の初期推定座標をスクリーニングして、前記初期推定座標から前記推定座標を選出することとを含むことを特徴とする請求項5又は6に記載の方法。
  8. 各キーポイントに対応する第1共分散行列に基づいて、前記複数のキーポイントをスクリーニングして、複数のキーポイントから目標キーポイントを決定することは、
    各キーポイントに対応する第1共分散行列の跡を決定することと、
    各キーポイントに対応する第1共分散行列から、予め設定された数量の第1共分散行列を選出し、ただし、選出された第1共分散行列の跡は選出されていない第1共分散行列の跡より小さいことと、
    選出された予め設定された数量の第1共分散行列に基づいて、前記目標キーポイントを決定することとを含むことを特徴とする請求項1〜7のいずれか1項に記載の方法。
  9. 被処理画像中の目標対象物に対してキーポイント検出処理を行って、被処理画像における目標対象物の複数のキーポイント、及び各キーポイントに対応する、キーポイントの被処理画像における位置座標とキーポイントの推定座標に基づいて決定される第1共分散行列を得る検出モジュールと、
    各キーポイントに対応する第1共分散行列に基づいて、前記複数のキーポイントをスクリーニングして、複数のキーポイントから目標キーポイントを決定するスクリーニングモジュールと、
    前記目標キーポイントに基づいて位置姿勢推定処理を行って、回転行列及び変位ベクトルを得る位置姿勢推定モジュールとを含むことを特徴とする位置姿勢推定装置。
  10. 前記位置姿勢推定モジュールは、さらに、
    前記目標キーポイントの三次元座標系における三次元座標である空間座標を取得し、
    前記目標キーポイントの被処理画像における二次元座標である位置座標及び前記空間座標に基づいて、初期回転行列及び初期変位ベクトルを決定し、
    前記空間座標及び前記目標キーポイントの被処理画像における位置座標に基づいて、前記初期回転行列及び初期変位ベクトルを調整して、前記回転行列及び変位ベクトルを得るように構成されることを特徴とする請求項9に記載の装置。
  11. 前記位置姿勢推定モジュールは、さらに、
    前記初期回転行列及び初期変位ベクトルに基づいて、前記空間座標の投影処理を行って、前記空間座標の前記被処理画像における投影座標を得、
    前記投影座標と目標キーポイントの被処理画像における位置座標との誤差距離を決定し、
    前記誤差距離に基づいて、前記初期回転行列及び初期変位ベクトルを調整し、
    誤差条件を満たす場合に、前記回転行列及び変位ベクトルを得るように構成されることを特徴とする請求項10に記載の装置。
  12. 前記位置姿勢推定モジュールは、さらに、
    各目標キーポイントの被処理画像における位置座標と投影座標とのベクトル差、及び各目標キーポイントに対応する第1共分散行列をそれぞれ得、
    各目標キーポイントに対応するベクトル差及び第1共分散行列に基づいて、前記誤差距離を決定するように構成されることを特徴とする請求項11に記載の装置。
  13. 前記検出モジュールは、さらに、
    被処理画像中の目標対象物に対してキーポイント検出処理を行って、各キーポイントの複数の推定座標及び各推定座標の重みを得、
    各推定座標の重みに基づいて、複数の推定座標に対して加重平均処理を行って、前記キーポイントの位置座標を得、
    複数の推定座標、各推定座標の重み及び前記キーポイントの位置座標に基づいて、前記キーポイントに対応する第1共分散行列を得るように構成されることを特徴とする請求項9〜12のいずれか1項に記載の装置。
  14. 前記検出モジュールは、さらに、
    各推定座標と前記キーポイントの位置座標との第2共分散行列を決定し、
    各推定座標の重みに基づいて、複数の第2共分散行列に対して加重平均処理を行って、前記キーポイントに対応する第1共分散行列を得るように構成されることを特徴とする請求項13に記載の装置。
  15. 前記検出モジュールは、さらに、
    被処理画像中の目標対象物に対してキーポイント検出処理を行って、前記キーポイントの複数の初期推定座標及び各初期推定座標の重みを得、
    各初期推定座標の重みに基づいて、複数の初期推定座標をスクリーニングして、前記初期推定座標から前記推定座標を選出するように構成されることを特徴とする請求項13又は14に記載の装置。
  16. 前記スクリーニングモジュールは、さらに、
    各キーポイントに対応する第1共分散行列の跡を決定し、
    各キーポイントに対応する第1共分散行列から、予め設定された数量の第1共分散行列を選出し、ただし、選出された第1共分散行列の跡は選出されていない第1共分散行列の跡より小さく、
    選出された予め設定された数量の第1共分散行列に基づいて、前記目標キーポイントを決定するように構成されることを特徴とする請求項9〜15のいずれか1項に記載の装置。
  17. プロセッサと、
    プロセッサにより実行可能な命令を記憶するメモリと、を含み、
    前記プロセッサは、請求項1〜8のいずれか1項に記載の方法を実行するように構成されることを特徴とする電子機器。
  18. コンピュータプログラム命令が記憶されているコンピュータ可読記憶媒体であって、前記コンピュータプログラム命令はプロセッサによって実行されると、請求項1〜8のいずれか1項に記載の方法を実現させることを特徴とするコンピュータ可読記憶媒体。
JP2021503196A 2018-12-25 2019-12-25 位置姿勢推定方法、装置、電子機器及び記憶媒体 Ceased JP2021517649A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201811591706.4 2018-12-25
CN201811591706.4A CN109697734B (zh) 2018-12-25 2018-12-25 位姿估计方法及装置、电子设备和存储介质
PCT/CN2019/128408 WO2020135529A1 (zh) 2018-12-25 2019-12-25 位姿估计方法及装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
JP2021517649A true JP2021517649A (ja) 2021-07-26

Family

ID=66231975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021503196A Ceased JP2021517649A (ja) 2018-12-25 2019-12-25 位置姿勢推定方法、装置、電子機器及び記憶媒体

Country Status (5)

Country Link
US (1) US20210012523A1 (ja)
JP (1) JP2021517649A (ja)
KR (1) KR102423730B1 (ja)
CN (1) CN109697734B (ja)
WO (1) WO2020135529A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018033137A1 (zh) * 2016-08-19 2018-02-22 北京市商汤科技开发有限公司 在视频图像中展示业务对象的方法、装置和电子设备
CN109697734B (zh) * 2018-12-25 2021-03-09 浙江商汤科技开发有限公司 位姿估计方法及装置、电子设备和存储介质
CN110188769B (zh) * 2019-05-14 2023-09-05 广州虎牙信息科技有限公司 关键点标注的审核方法、装置、设备及存储介质
CN110473259A (zh) * 2019-07-31 2019-11-19 深圳市商汤科技有限公司 位姿确定方法及装置、电子设备和存储介质
CN114820814A (zh) * 2019-10-30 2022-07-29 深圳市瑞立视多媒体科技有限公司 摄影机位姿计算方法、装置、设备及存储介质
CN110969115B (zh) * 2019-11-28 2023-04-07 深圳市商汤科技有限公司 行人事件的检测方法及装置、电子设备和存储介质
CN112150551B (zh) * 2020-09-25 2023-07-25 北京百度网讯科技有限公司 物体位姿的获取方法、装置和电子设备
CN112887793B (zh) * 2021-01-25 2023-06-13 脸萌有限公司 视频处理方法、显示设备和存储介质
CN114088062B (zh) * 2021-02-24 2024-03-22 上海商汤临港智能科技有限公司 目标定位方法及装置、电子设备和存储介质
CN113395762A (zh) * 2021-04-18 2021-09-14 湖南财政经济学院 超宽带定位网络中位置校正方法及装置
CN113269876A (zh) * 2021-05-10 2021-08-17 Oppo广东移动通信有限公司 地图点坐标优化方法及装置、电子设备及存储介质
CN113838134B (zh) * 2021-09-26 2024-03-12 广州博冠信息科技有限公司 图像关键点检测方法、装置、终端和存储介质
CN114333067B (zh) * 2021-12-31 2024-05-07 深圳市联洲国际技术有限公司 行为活动的检测方法、检测装置与计算机可读存储介质
CN114764819A (zh) * 2022-01-17 2022-07-19 北京甲板智慧科技有限公司 基于滤波算法的人体姿态估计方法及装置
CN116740382B (zh) * 2023-05-08 2024-02-20 禾多科技(北京)有限公司 障碍物信息生成方法、装置、电子设备和计算机可读介质
CN116563356A (zh) * 2023-05-12 2023-08-08 北京长木谷医疗科技股份有限公司 全局3d配准方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663413A (zh) * 2012-03-09 2012-09-12 中盾信安科技(江苏)有限公司 一种面向多姿态和跨年龄的人脸图像认证方法
CN105447462A (zh) * 2015-11-20 2016-03-30 小米科技有限责任公司 人脸姿态估计方法及装置
JP2017010327A (ja) * 2015-06-23 2017-01-12 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
JP2018077479A (ja) * 2012-04-13 2018-05-17 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチモーダル整合方式を使用するオブジェクト認識

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001250122A (ja) 2000-03-06 2001-09-14 Nippon Telegr & Teleph Corp <Ntt> 物体の位置姿勢決定処理方法およびそのためのプログラム記録媒体
US8837839B1 (en) * 2010-11-03 2014-09-16 Hrl Laboratories, Llc Method for recognition and pose estimation of multiple occurrences of multiple objects in visual images
GB2506411B (en) * 2012-09-28 2020-03-11 2D3 Ltd Determination of position from images and associated camera positions
US9940553B2 (en) * 2013-02-22 2018-04-10 Microsoft Technology Licensing, Llc Camera/object pose from predicted coordinates
US10260862B2 (en) * 2015-11-02 2019-04-16 Mitsubishi Electric Research Laboratories, Inc. Pose estimation using sensors
CN106447725B (zh) * 2016-06-29 2018-02-09 北京航空航天大学 基于轮廓点混合特征匹配的空间目标姿态估计方法
CN106101640A (zh) * 2016-07-18 2016-11-09 北京邮电大学 自适应视频传感器融合方法及装置
WO2018099556A1 (en) * 2016-11-30 2018-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Image processing device and method for producing in real-time a digital composite image from a sequence of digital images of an interior of a hollow structure
US10242458B2 (en) * 2017-04-21 2019-03-26 Qualcomm Incorporated Registration of range images using virtual gimbal information
CN107730542B (zh) * 2017-08-29 2020-01-21 北京大学 锥束计算机断层扫描图像对应与配准方法
WO2019094094A1 (en) * 2017-11-13 2019-05-16 Siemens Aktiengesellschaft Part identification using a locally learned threedimensional (3d) landmark database
CN108444478B (zh) * 2018-03-13 2021-08-10 西北工业大学 一种用于水下航行器的移动目标视觉位姿估计方法
CN108765474A (zh) * 2018-04-17 2018-11-06 天津工业大学 一种针对ct与光学扫描牙齿模型的高效配准方法
CN108830888B (zh) * 2018-05-24 2021-09-14 中北大学 基于改进的多尺度协方差矩阵特征描述子的粗匹配方法
CN108921898B (zh) * 2018-06-28 2021-08-10 北京旷视科技有限公司 摄像机位姿确定方法、装置、电子设备和计算机可读介质
CN108871349B (zh) * 2018-07-13 2021-06-15 北京理工大学 一种深空探测器光学导航位姿加权确定方法
CN109697734B (zh) * 2018-12-25 2021-03-09 浙江商汤科技开发有限公司 位姿估计方法及装置、电子设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663413A (zh) * 2012-03-09 2012-09-12 中盾信安科技(江苏)有限公司 一种面向多姿态和跨年龄的人脸图像认证方法
JP2018077479A (ja) * 2012-04-13 2018-05-17 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチモーダル整合方式を使用するオブジェクト認識
JP2017010327A (ja) * 2015-06-23 2017-01-12 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
CN105447462A (zh) * 2015-11-20 2016-03-30 小米科技有限责任公司 人脸姿态估计方法及装置

Also Published As

Publication number Publication date
US20210012523A1 (en) 2021-01-14
KR20200139229A (ko) 2020-12-11
KR102423730B1 (ko) 2022-07-20
CN109697734B (zh) 2021-03-09
CN109697734A (zh) 2019-04-30
WO2020135529A1 (zh) 2020-07-02

Similar Documents

Publication Publication Date Title
JP2021517649A (ja) 位置姿勢推定方法、装置、電子機器及び記憶媒体
JP7238141B2 (ja) 顔と手を関連付けて検出する方法及び装置、電子機器、記憶媒体及びコンピュータプログラム
KR102421820B1 (ko) 키포인트 검출 방법, 장치, 전자 기기 및 기억 매체
KR102593020B1 (ko) 이미지 처리 방법 및 장치, 전자 기기 및 기억 매체
JP7089106B2 (ja) 画像処理方法及び装置、電子機器、コンピュータ読取可能記憶媒体及びコンピュータプログラム
TWI747325B (zh) 目標對象匹配方法及目標對象匹配裝置、電子設備和電腦可讀儲存媒介
JP2022500791A (ja) 画像処理方法、装置、電子機器、記憶媒体及びコンピュータプログラム
KR20210102180A (ko) 이미지 처리 방법 및 장치, 전자 기기 및 기억 매체
CN111340766A (zh) 目标对象的检测方法、装置、设备和存储介质
JP2021512378A (ja) アンカー決定方法及び装置、電子機器並びに記憶媒体
CN109522937B (zh) 图像处理方法及装置、电子设备和存储介质
KR20220011207A (ko) 이미지 처리 방법 및 장치, 전자 기기 및 저장 매체
CN109145970B (zh) 基于图像的问答处理方法和装置、电子设备及存储介质
KR20200081466A (ko) 이미지 처리 방법, 이미지 처리 장치, 전자 기기 및 저장 매체
JP7316456B2 (ja) 点群マップ構築方法及びその装置、電子機器、記憶媒体並びにプログラム
CN114088061B (zh) 目标定位方法及装置、电子设备和存储介质
CN111259967A (zh) 图像分类及神经网络训练方法、装置、设备及存储介质
CN111339880A (zh) 一种目标检测方法及装置、电子设备和存储介质
JP7266667B2 (ja) ジェスチャー認識方法、ジェスチャー処理方法及び装置
WO2023155393A1 (zh) 特征点匹配方法、装置、电子设备、存储介质和计算机程序产品
CN111626398B (zh) 运算方法、装置及相关产品
CN113537350B (zh) 图像处理方法及装置、电子设备和存储介质
CN112734015B (zh) 网络生成方法及装置、电子设备和存储介质
CN117893591A (zh) 光幕模板识别方法及装置、设备、存储介质和程序产品
CN113780433A (zh) 目标检测器安全性测试方法及装置、电子设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220818

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221220

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20230425