JP6769554B2 - 物体識別装置、物体識別方法、計算装置、システムおよび記録媒体 - Google Patents

物体識別装置、物体識別方法、計算装置、システムおよび記録媒体 Download PDF

Info

Publication number
JP6769554B2
JP6769554B2 JP2019528293A JP2019528293A JP6769554B2 JP 6769554 B2 JP6769554 B2 JP 6769554B2 JP 2019528293 A JP2019528293 A JP 2019528293A JP 2019528293 A JP2019528293 A JP 2019528293A JP 6769554 B2 JP6769554 B2 JP 6769554B2
Authority
JP
Japan
Prior art keywords
image
identification
parameter
captured image
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019528293A
Other languages
English (en)
Other versions
JPWO2019008734A1 (ja
Inventor
岩元 浩太
浩太 岩元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019008734A1 publication Critical patent/JPWO2019008734A1/ja
Application granted granted Critical
Publication of JP6769554B2 publication Critical patent/JP6769554B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features

Description

本開示は、物体識別装置、物体識別方法、計算装置、システムおよび記録媒体に関する。
認識精度を高める方法として、認識に用いるデータベースの情報量を増やすことが開示されている(例えば、特許文献1)。また、参照用の物体を異なる複数の視点で撮像した画像を用いて作成したデータベースを用いて、二次元画像に基づいて三次元物体の位置・姿勢を推定する技術が開示されている(例えば、特許文献2)。
特開2001−014465号公報 特開2007−219765号公報
ところで、局所特徴量を用いた物体識別(被写体識別)では、例えば、データベースに登録された物体の様々な方向から撮像された画像(データベース画像)と、識別対象の物体が含まれるクエリ画像とを照合し、該クエリ画像中のどの位置に何れの物体があるのかを識別する方法が考えられる。
このように、1つの物体に対し識別に用いる複数のデータベース画像がデータベースに登録されている場合、クエリ画像に対し、複数のデータベース画像が識別結果として出力される可能性がある。識別結果に複数のデータベース画像が含まれることにより、識別された物体の個数が正確に把握できない可能性がある。
本開示は上記課題に鑑みてなされたものであり、その目的は、識別対象の物体の個数を精度よく識別することが可能な技術を提供することにある。
本開示の一態様に係る物体識別装置は、撮像画像と物体を識別するための複数の識別用画像との照合を行う照合手段と、前記照合の結果が前記撮像画像に複数の物体が含まれることを示す場合、前記識別用画像間の幾何学関係を表す第1パラメータと、識別された各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータとに基づいて、前記複数の物体が同一物体か否かを判定する判定手段と、を備える。
また、本開示の一態様に係る物体識別方法は、撮像画像と物体を識別するための複数の識別用画像との照合を行い、前記照合の結果が前記撮像画像に複数の物体が含まれることを示す場合、前記識別用画像間の幾何学関係を表す第1パラメータと、識別された各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータとに基づいて、前記複数の物体が同一物体か否かを判定する。
また、本開示の一態様に係る計算装置は、物体を識別するための複数の識別用画像の夫々から、前記物体の特徴を表す特徴情報を抽出する抽出手段と、前記抽出された特徴情報に基づいて、前記複数の識別用画像間の幾何学関係を表す第1パラメータであって、前記識別用画像を用いた照合により撮像画像に複数の物体が識別される場合において、該複数の物体が同一物体か否かを判定する際に、識別される各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータと共に用いる第1パラメータを計算する計算手段と、を備える。
また、上記物体識別装置および計算装置を含むシステムも本開示の範疇に含まれる。
なお、上記各装置または方法を、コンピュータによって実現するコンピュータプログラム、およびそのコンピュータプログラムが格納されている、コンピュータ読み取り可能な非一時的記録媒体も、本開示の範疇に含まれる。
本開示によれば、識別対象の物体の個数を精度よく識別することができる。
第1の実施の形態に係るシステムの全体構成の一例を示す図である。 第1実施の形態に係るシステムが利用される利用シーンの一例を説明するための図である。 第1の実施の形態に係るシステムに含まれる物体識別装置および計算装置の機能構成の一例を示す機能ブロック図である。 画像記憶部に格納されたデータベース画像を含む画像情報の一例を示す図である。 パラメータ計算部によるパラメータの計算を説明するための図である。 パラメータ記憶部が格納するパラメータ情報の一例を示す図である。 判定部が行う判定処理を説明するための図である。 判定部が行う判定処理を更に説明するための図である。 出力装置が受け取った情報をファイル出力する装置の場合における、出力されるファイルの一例を示す図である。 出力装置がディスプレイを有する表示装置または端末装置の場合における、出力装置が出力する画面の一例を示す図である。 計算装置の処理の流れの一例を示すフローチャートである。 物体識別装置の処理の流れの一例を示すフローチャートである。 第2の実施の形態に係る物体識別装置の機能構成の一例を示す機能ブロック図である。 第2の実施の形態に係る物体識別装置の処理の流れの一例を示すフローチャートである。 第2の実施の形態において、物体識別装置が参照する第1パラメータを計算する計算装置の機能構成の一例を示す機能ブロック図である。 第2の実施の形態において、物体識別装置および計算装置を含むシステムの構成の一例を示すブロック図である。 各実施の形態を実現可能なコンピュータ(情報処理装置)のハードウェア構成を例示的に説明する図である。
<第1の実施の形態>
本開示の第1の実施の形態について、図面を参照して説明する。図1は、本実施の形態に係るシステム1の全体構成の一例を示す図である。図1に示すシステム1は、物体識別装置100と、計算装置200と、撮像装置300と、出力装置400とを含む。なお、図1は、本開示に特有な構成について示したものであり、システム1が図1に示されていない装置を有していてもよいことは言うまでもない。また、図1に示す各装置は、各々組み合わせて構成されてもよい。例えば、物体識別装置100と計算装置200とが一体となっていてもよいし、物体識別装置100と撮像装置300とが一体となっていてもよい。
物体識別装置100は、計算装置200、撮像装置300および出力装置400と互いに通信可能に接続している。各装置間の通信手段は、有線または無線通信の何れであってもよいし、携帯通信網、公衆回線網、LAN(Local Area Network)、または、WAN(Wide Area Network)の何れを介した通信であってもよい。このように、各装置間の通信方法は、さまざまな方法が考えられる。
撮像装置300は、撮像対象の物体を含む画像を撮像する。撮像装置300は、例えば、レンズおよび撮像素子を含むカメラによって実現される。撮像装置300は、例えば、デジタルカメラやWebカメラ等によって実現される。撮像装置300は、撮像画像を物体識別装置100に供給する。なお、撮像装置300は、撮像画像を撮像装置300の内部または物体識別装置100とは異なる記憶装置に格納してもよい。この場合、物体識別装置100は、撮像画像を該撮像画像が格納された場所から取得すればよい。
出力装置400は、物体識別装置100からの制御信号に基づいた出力を行う。出力装置400は、例えば、ディスプレイなどの表示装置であってもよいし、ディスプレイを有する端末装置であってもよい。また、出力装置400はこれに限定されず、スピーカであってもよいし、プリンタであってもよいし、受け取った信号に含まれる情報をファイル出力する装置であってもよい。
図2は、本実施の形態に係るシステム1が利用される利用シーンの一例を説明するための図である。図2では、物体の例として、所定の容器に梱包された物品5を撮像可能な位置に設置されたカメラ3を撮像装置300の一例として示している。また、図2では、携帯端末4を出力装置400の一例として示している。
カメラ3によって撮像された、物品5を含む撮像画像は、物体識別装置100に送信される。物体識別装置100は、物品5の識別結果と、計算装置200によって計算されたパラメータとに基づいて、物品5の個数を判定する。そして、物体識別装置100は、判定結果を携帯端末4に出力する。これにより、作業者2は、携帯端末4の画面に表示された判定結果を確認することができる。
次に、図3を参照して、システム1に含まれる物体識別装置100および計算装置200の構成について説明する。物体識別装置100は、撮像装置300によって撮像された撮像画像を受け取り、該撮像画像に含まれる物体を照合し、該物体の個数を判定する。物体識別装置100は、第1特徴抽出部110と、照合部120と、判定部130と、出力制御部140とを備える。
計算装置200は、物体識別装置100が、撮像画像に含まれる物体の照合を行う際に用いる、物体を識別するための識別用画像(データベース画像とも呼ぶ)を格納する。また、計算装置200は、物体識別装置100が物体の個数を判定する際に用いるパラメータを計算する。計算装置200は、画像記憶部210と、第2特徴抽出部220と、パラメータ計算部230と、パラメータ記憶部240とを備える。
まず、計算装置200の各部について説明する。画像記憶部210は、物体を識別するためのデータベース画像を格納する。データベース画像は、撮像画像との間で物体の照合を行う際に用いられる。本実施の形態では、画像記憶部210は、物体毎に、該物体を複数の角度から撮像した画像をデータベース画像として格納する。画像記憶部210が格納するデータベース画像の一例を図4に示す。図4は、画像記憶部210に格納されたデータベース画像を含む画像情報41の一例を示す図である。画像情報41は、図4に示す通り、画像番号42、物品名43およびデータベース画像44を含む。画像番号42は、データベース画像44を識別する識別子である。物品名43は、データベース画像44が示す物品の名前である。データベース画像44は、物品名43によって示される物品を撮像した撮像画像である。
図4に示す通り、画像情報41は、物品名43が「AAA」の物品を複数の方向から撮像した撮像画像であるデータベース画像44を含む。例えば、画像番号42が「401A」のデータベース画像44(データベース画像44A)は、「AAA」の文字を含むラベルが全て含まれる第1方向から物品を撮像した撮像画像であり、画像番号42が「401B」のデータベース画像44(データベース画像44B)は、同じ物品を第1方向とは異なる第2方向から撮像した撮像画像である。このように、本実施の形態では、画像情報41は、1つの物品に対し複数の方向から撮像した撮像画像をデータベース画像44として含むとする。
なお、データベース画像44は、実際に撮像した画像ではなく、照合用の画像として作成された画像であってもよい。また、データベース画像44は、撮像装置300によって撮像された画像であってもよいし、その他の方法で取得された画像であってもよい。また、画像記憶部210は、計算装置200とは別個の記憶装置によって実現されてもよい。
第2特徴抽出部220は、画像記憶部210に格納されたデータベース画像44の夫々から特徴量を抽出し、該特徴量を有する特徴点を抽出(検出)する。以降、第2特徴抽出部220が抽出する特徴量および特徴点に関連する情報を、特徴情報と呼ぶ。第2特徴抽出部220は、任意の方法によって特徴情報を抽出すればよく、その方法は特に限定されない。第2特徴抽出部220は、物体識別装置100が照合を行う際に使用する特徴情報を抽出すればよい。第2特徴抽出部220は、抽出した特徴情報を抽出元のデータベース画像44を示す情報(例えば、画像番号42)と共に、自身または画像記憶部210等の記憶部に格納する。なお、前述した画像記憶部210はデータベース画像44に加え、または、データベース画像44の代わりに、第2特徴抽出部220が抽出した特徴情報を格納してもよい。また、第2特徴抽出部220は、複数種類の特徴量を特徴情報として抽出してもよい。第2特徴抽出部220は、抽出した特徴情報を、抽出元のデータベース画像44を示す情報(例えば、画像番号42)と共に、パラメータ計算部230に供給する。
パラメータ計算部230は、第2特徴抽出部220が抽出した特徴情報を用いて、データベース画像間の幾何学関係を表すパラメータを計算する。図5は、パラメータ計算部230によるパラメータの計算を説明するための図である。
図5の上部に示すデータベース画像51は、図4に示す画像番号42が「401A」のデータベース画像44である。また、図5の下部に示すデータベース画像52は、図4に示す画像番号42が「401B」のデータベース画像44である。パラメータ計算部230は、第2特徴抽出部220がデータベース画像51およびデータベース画像52の夫々から抽出した特徴情報を用いて、データベース画像間で対応する特徴点を特定する。図5における破線53は、データベース画像間で対応する特徴点同士を結んだ線分の一例である。パラメータ計算部230は、このように対応する特徴点を特定し、データベース画像間の幾何学関係を表すパラメータを計算する。
パラメータを、例えば、ホモグラフィ行列としたとき、パラメータ計算部230は、データベース画像51上の座標をデータベース画像52上の座標に変換するホモグラフィ行列を計算する。また、パラメータ計算部230は、データベース画像52上の座標をデータベース画像51上の座標に変換するホモグラフィ行列も計算する。なお、データベース画像52上の座標をデータベース画像51上の座標に変換するホモグラフィ行列は、データベース画像51上の座標をデータベース画像52上の座標に変換するホモグラフィ行列の逆行列となるため、一方を計算してもよい。
なお、本実施の形態では、パラメータは、ホモグラフィ行列であるとして説明を行うが、これに限定されず、アフィン変換に用いる変換係数であってもよいし、その他の変換式に用いるパラメータであってもよい。
パラメータ計算部230は、画像記憶部210に格納されたデータベース画像44のうち、幾何学関係を持つデータベース画像間に対し、第2特徴抽出部220が抽出した特徴情報を用いて、パラメータを計算する。そして、パラメータ計算部230はパラメータの計算の対象となる2つのデータベース画像の夫々を示す情報と、パラメータとを互いに関連付けてパラメータ記憶部240に格納する。
パラメータ記憶部240は、パラメータ計算部230が計算したパラメータをパラメータの計算の対象となる2つのデータベース画像の夫々を示す情報と共に格納する。パラメータ記憶部240が格納するパラメータを含むパラメータ情報の一例を図6に示す。図6に示す通り、パラメータ記憶部240は、パラメータ情報61を格納する。
パラメータ情報61は、図6に示す通り、変換元画像番号62と、変換先画像番号63と、パラメータ64とを含む。変換元画像番号62は、幾何学変換を行う元となるデータベース画像を表す画像番号であり、変換先画像番号63は、幾何学変換を行う先となるデータベース画像を表す画像番号である。例えば、パラメータ情報61の1行目のパラメータ64は、画像番号42が「401A」のデータベース画像44であるデータベース画像44A上の座標を画像番号42が「401B」のデータベース画像44であるデータベース画像44B上の座標に変換する場合におけるホモグラフィ行列である。以下では、説明の便宜上、この場合におけるパラメータ64をH[401A→401B]と記載する。
同様に、H[401A→401C]は、画像番号42が「401A」のデータベース画像44A上の座標を画像番号42が「401C」のデータベース画像44であるデータベース画像44C上の座標に変換する場合におけるホモグラフィ行列であり、図6の2行目に含まれるパラメータ64を示す。
また、H[401B→401A]は、画像番号42が「401B」のデータベース画像44B上の座標を画像番号42が「401A」のデータベース画像44A上の座標に変換する場合におけるホモグラフィ行列であり、H[401A→401B]の逆行列である。
なお、パラメータ記憶部240は、計算装置200とは別個の記憶装置によって実現されてもよい。また、パラメータ記憶部240は、画像記憶部210と一体構成されてもよい。また、パラメータ記憶部240は、物体識別装置100に内蔵されてもよい。
次に、物体識別装置100について説明する。第1特徴抽出部110は、撮像画像から特徴量を抽出し、該特徴量を有する特徴点を抽出する。第1特徴抽出部110は、撮像装置300または撮像画像を格納する記憶装置から撮像画像を取得する。第1特徴抽出部110は、取得した撮像画像から特徴量および特徴点に関する情報である特徴情報を抽出する。第1特徴抽出部110は、任意の方法によって特徴情報を抽出すればよく、その方法は特に限定されない。第1特徴抽出部110は第2特徴抽出部220と同様の方法で特徴情報を抽出してもよい。第2特徴抽出部220が複数種類の特徴量を特徴情報として抽出する場合、第1特徴抽出部110は、その何れかの種類の特徴量を特徴情報として抽出すればよい。そして、第1特徴抽出部110は、抽出した特徴情報を抽出元の撮像画像と共に、照合部120に供給する。
なお、第1特徴抽出部110が取得した撮像画像を、物体識別装置100内の記憶部等に格納する場合、第1特徴抽出部110は、抽出した特徴情報を抽出元の撮像画像を示す情報と共に照合部120に供給してもよい。
照合部120は、第1特徴抽出部110が抽出した特徴情報と、第2特徴抽出部220が抽出した特徴情報とを用いて、撮像画像をデータベース画像と照合する。そして、照合部120は、照合結果を判定部130に供給する。照合結果は、例えば、撮像画像とデータベース画像44との類似の度合い、データベース画像44を示す情報、対応する特徴点を示す情報と、該特徴点の撮像画像上の位置等を含むがこれに限定されるものではない。またデータベース画像44を示す情報は、例えば、画像番号42であってもよいし、その他の情報であってもよい。照合部120が行う照合の方法は特に限定されず、任意の方法を採用してもよい。
判定部130は、照合結果を参照し、該照合結果が撮像画像に複数の物体が含まれることを示すか否かを判定する。判定部130は、照合結果に基づくと、撮像画像に複数の物体が含まれると判定される場合、パラメータ記憶部240に格納されたパラメータ64(第1パラメータ)と、データベース画像44および撮像画像の間の幾何学関係を表す第2パラメータとに基づいて、複数の物体が同一物体か否かを判定する。
ここで、データベース画像44および撮像画像の間の幾何学関係を表す第2パラメータは、上述したデータベース画像44間のパラメータと同じであることが好ましい。本実施の形態では、第2パラメータは、ホモグラフィ行列であるとして説明を行うが、これに限定されず、アフィン変換に用いる変換係数であってもよいし、その他の変換式に用いるパラメータであってもよい。
まず、判定部130は、照合部120から照合結果を受け取る。そして、判定部130は、照合結果を参照し、複数の物体が識別され、且つ、識別された複数の物体が同じ物体を示すか否かを判定する。識別された複数の物体が同じ物体を示すことは、例えば、同じ名称(例えば、物品名)を有するか否かを判定することによって判定されてもよい。そして、判定部130は、同じ物品名を有する複数の物体が識別された場合、照合結果に含まれる、撮像画像の物体に対応するデータベース画像44を示す情報を用いて、データベース画像44間のパラメータ64をパラメータ記憶部240から取得する。そして、判定部130は取得したパラメータ64と、データベース画像44および撮像画像の間の幾何学関係を表す第2パラメータと、に基づいて、識別された複数の物体が同一物体か否かを判定する。
判定部130が行う判定処理について、図4、図5、図7および図8を参照してさらに説明する。図7および図8は判定部130が行う判定処理を説明するための図である。
図7に示す撮像画像70(Q70とも記載する)は、物品71を撮像することによって得られた画像である。図7に示す通り、撮像画像70には1つの物品71が含まれる。照合部120はこのような撮像画像70とデータベース画像44とを、データベース画像44から抽出された特徴情報と、撮像画像70から抽出された特徴情報と用いて照合する。これにより、得られる照合結果から、図4に示すデータベース画像44Aが示す物体とデータベース画像44Bが示す物体とが撮像画像70に写っているという照合結果を得るとする。つまり、この照合結果からは、あたかも、データベース画像44Aが示す物体と、データベース画像44Bが示す物体との2つの物体が撮像画像70に写っているように見える。
この照合結果から、判定部130は、照合部120が照合に用いた、データベース画像44Aの特徴情報と、撮像画像70から抽出された特徴情報とを用いて、データベース画像44Aと撮像画像70との幾何学関係を表すパラメータ(上述した第2パラメータ)を計算する。なお、第2パラメータの計算の方法は、パラメータ計算部230が行う方法と同じであってもよい。以下、この場合における第2パラメータであるホモグラフィ行列をH[401A→Q70]と記載する。このホモグラフィ行列H[401A→Q70]を用いて、データベース画像44A上の座標を撮像画像70の座標空間に変換した座標を、第1座標P1と呼ぶ。
同様に、判定部130は、データベース画像44Bの特徴情報と、撮像画像70から抽出された特徴情報とを用いて、データベース画像44B上の座標を撮像画像70上の座標に変換する場合におけるホモグラフィ行列を計算する。以下、この場合におけるパラメータであるホモグラフィ行列をH[401B→Q70]と記載する。このホモグラフィ行列H[401B→Q70]を用いて、データベース画像44B上の座標を撮像画像70の座標空間に変換した座標を、第2座標P2と呼ぶ。
図7に示す枠72は、第1座標P1によって示される撮像画像70上の領域であり、図7に示す枠73は、第2座標P2によって示される撮像画像70上の領域である。
判定部130は、照合結果に基づいて、データベース画像44Aを示す画像番号42である「401A」とデータベース画像44Bを示す画像番号42である「401B」とに関連付けられたパラメータ64をパラメータ記憶部240から取得する。ここでは、判定部130は、変換元画像番号62が「401A」であり、変換先画像番号63が「401B」である図6に示す1行目のパラメータ64を、パラメータ記憶部240から取得する。取得したパラメータ64を上述した通り、H[401A→401B]とする。
そして、判定部130は、H[401A→Q70]、H[401B→Q70]およびH[401A→401B]を用いて、識別された複数の物体が同一物体か否かを判定する。
具体的には、判定部130は、H[401A→401B]を用いて、データベース画像44A上の座標を、データベース画像44Bの座標空間の座標に変換する。そして、判定部130は、H[401B→Q70]を用いて、データベース画像44Bの座標空間に変換した座標を、更に、撮像画像70の座標空間の座標に変換する。この2つのホモグラフィ変換を行った後の座標を第3座標P3と呼ぶ。
図7に示す破線の枠74は、第3座標P3が表す撮像画像70上の領域の一例を示す。この枠74が示す領域は、H[401A→401B]およびH[401B→Q70]を用いて推定された、撮像画像70の座標空間におけるデータベース画像44Aの座標の推定位置を示す領域である。
枠72によって示される領域と枠74によって示される領域とを比較すると、これらは略重なっていることがわかる。判定部130は、この枠72の領域と、枠74の領域との重なりの度合いを示す値である重複率を計算し、重複率が所定の閾値以上の場合、枠72に含まれる物体と、枠73に含まれる物体とは同一物体であると判定する。このように、同一物体か否かの判定に、領域の重複率を用いることにより、判定部130は、少ない計算量で同一物体か否かの判定を行うことができる。
なお、判定部130は、一方の領域の面積に対する、該一方の領域と他方の領域との両方に含まれる領域の面積の比を示す重複率に基づいて、複数の物体が同一物体であるか否かを判定してもよい。例えば、判定部130は、枠72の領域の面積に対する枠72の領域および枠74の領域の両方に含まれる領域の面積の重複率に基づいて、複数の物体が同一物体であるか否かを判定してもよい。また、判定部130は、枠74の領域の面積に対する枠72の領域および枠74の領域の両方に含まれる領域の面積の重複率に基づいて、複数の物体が同一物体であると判定してもよい。また、判定部130は、これら2つの重複率を用いて、複数の物体が同一物体であると判定してもよい。また、重複率はこれに限定されず、2つの面積の和に対する、両方に含まれる領域の面積の比であってもよいし、2つの領域の少なくとも何れか一方に含まれる部分の面積に対する、両方に含まれる領域の面積の比であってもよい。
また、判定部130は、複数の物体が同一物体であるかを、領域ではなく、パラメータ間の近さで判定してもよい。例えば、H[401B→Q70]×H[401A→401B]を計算し、H[401B→Q70]×H[401A→401B]と、H[401A→Q70]との類似度を計算する。この類似度は、どのような指標であってもよい。例えば、行列の各値の近さであってもよいし、行列に基づいて導き出される任意の指標に基づく値の近さであってもよい。そして、類似度が所定の条件を満たす場合、例えば類似度が所定の閾値以上の場合、判定部130は、複数の物体が同一物体であると判定してもよい。
このように、同一物体か否かの判定に、行列同士の類似度を用いることにより、領域の重複率を用いる場合に比べ、物体識別装置100は、より正確に、同一物体か否かの判定を行うことができる。なお、類似度を求める場合、判定部130は、照合結果に基づいて、データベース画像44間のパラメータ64を取得した後に、該パラメータ64と同じ種類の第2パラメータを、計算してもよい。
また、判定部130は、データベース画像44上の全ての座標ではなく、特徴点を用いて、複数の物体が同一物体であるか否かを判定してもよい。例えば、判定部130は、H[401A→401B]およびH[401B→Q70]を用いて変換した特徴点の座標と、H[401A→Q70]を用いて変換した特徴点の座標との距離が所定の閾値以下である場合に、複数の物体が同一物体であると判定してもよい。
また、判定部130は、上述した判定の代わりに、または上述した判定に加え、H[401A→Q70]、H[401B→Q70]およびH[401B→401A]を用いて、識別された複数の物体が同一物体か否かを判定してもよい。
図8に示す撮像画像80(Q80とも呼ぶ)は、物品81および物品82を撮像することによって得られた画像である。図8に示す通り、撮像画像80には2つの物品81および物品82が含まれる。照合部120はこのような撮像画像80とデータベース画像44とを、データベース画像44から抽出された特徴情報と、撮像画像80から抽出された特徴情報と用いて照合する。
物品81および物品82が夫々、複数の物品に識別された場合の同一物体であることに関する判定方法は、図7を用いて説明した場合と同様である。ここでは、2つの物品が夫々別の物体であると正しく識別される方法について説明する。
例えば、照合結果に、データベース画像44Aが示す物体およびデータベース画像44Cが示す物体が撮像画像80に写っているということを示す情報が含まれるとする。
このような照合結果に基づいて、判定部130は、データベース画像44Aに含まれる特徴情報と、対応する撮像画像80上の特徴情報とから、データベース画像44A上の座標を撮像画像80上の座標に変換する場合におけるホモグラフィ行列であるH[401A→Q80]を計算する。このホモグラフィ行列H[401A→Q80]を用いて、データベース画像44A上の座標を撮像画像80の座標空間に変換した座標を、第4座標P4と呼ぶ。
同様に、判定部130は、データベース画像44Cに含まれる特徴情報と、対応する撮像画像80上の特徴情報とから、データベース画像44C上の座標を撮像画像80上の座標に変換する場合におけるホモグラフィ行列であるH[401C→Q80]を計算する。このホモグラフィ行列H[401C→Q80]を用いて、データベース画像44C上の座標を撮像画像80の座標空間に変換した座標を、第5座標P5と呼ぶ。
図8に示す枠83は、第4座標P4によって示される撮像画像80上の領域であり、図8に示す枠84は、第5座標P5によって示される撮像画像80上の領域である。
判定部130は、照合結果に基づいて、データベース画像44Aを示す画像番号42である「401A」とデータベース画像44Cを示す画像番号42である「401C」とに関連付けられたパラメータ64をパラメータ記憶部240から取得する。ここでは、判定部130は、変換元画像番号62が「401A」であり、変換先画像番号63が「401C」である図6に示す2行目のパラメータ64を、パラメータ記憶部240から取得する。取得したパラメータ64を、H[401A→401C]と表現する。
そして、判定部130は、H[401A→401C]を用いて、データベース画像44A上の座標を、データベース画像44Cの座標空間の座標に変換する。そして、判定部130は、H[401C→Q80]を用いて、データベース画像44Cの座標空間に変換した座標を、更に、撮像画像80の座標空間の座標に変換する。この2つのホモグラフィ変換を行った後の座標を第6座標P6と呼ぶ。
図8に示す破線の枠85は、第6座標P6が表す撮像画像80上の領域の一例を示す。この枠85が示す領域は、H[401A→401C]およびH[401C→Q80]を用いて推定された、物品82に対する、撮像画像80の座標空間におけるデータベース画像44Aの座標の推定位置を示す領域である。
枠83によって示される領域と枠85によって示される領域とを比較すると、これらは、図7の枠72によって示される領域および枠74によって示される領域に比べ重複していない箇所が多い。よって、判定部130は、枠85の計算に用いた情報に関連するデータベース画像44Cが示す物体と、枠83に関連するデータベース画像44Aが示す物体とが異なる物体であると判定する。これにより、判定部130は、図8に含まれる物体が2つであると判定することができる。
このように本実施の形態に係る物体識別装置100は隣り合って並んだ物体を別の物体であると正しく判定することができる。
判定部130は、このように識別された複数の物体が同一物体か否かを示す判定結果を出力制御部140に供給する。
出力制御部140は、判定部130から供給された判定結果に基づいて、該判定結果を表す情報の出力を制御する。例えば、出力装置400がディスプレイ(表示部)などの表示装置またはディスプレイを有する端末装置の場合、出力制御部140は、判定結果を表す情報を画面表示する制御信号を、出力装置400に出力する。これにより、出力装置400は、判定結果を表す情報を画面表示する。
また、出力装置400が受け取った情報をファイル出力する装置の場合、出力制御部140は、判定結果を表す情報をファイル出力する制御信号を、出力装置400に出力する。これにより、出力装置400は、判定結果を表す情報をファイルとして出力する。
図9は、出力装置400が受け取った情報をファイル出力する装置の場合における、出力されるファイルの一例を示す図である。図9に示す出力ファイル91は、物品名92の列と、個数93の列とを含む表データである。出力制御部140はこのような出力ファイル91を出力装置400が出力するよう制御する制御信号を生成してもよい。これにより、撮像画像に、どの物体がいくつ含まれるのかを作業者2は容易に把握することができる。また、出力制御部140は、例えば、撮像画像に含まれるべき物体の一覧と判定結果とを比較し、比較結果を出力装置400に表示するよう制御してもよい。
図10は、出力装置400がディスプレイを有する表示装置または端末装置の場合における、出力装置400が出力する表示画面の一例を示す図である。
出力制御部140は、識別された物体の撮像画像上における位置を示す位置情報を撮像画像に重畳した表示画面をディスプレイなどの表示部に表示させる制御信号を生成する。出力装置400は、出力制御部140が生成した制御信号に基づいて、位置情報を撮像画像に重畳した表示画面を表示部に表示する。
図10に示す表示画面94は、図7に示す、物品71を含む撮像画像70を表示部に表示した画面である。出力制御部140は、識別された物体の撮像画像上における位置を示す位置情報を、撮像画像70に重畳した表示画面を生成する。出力制御部140は、照合部120による照合の際に、データベース画像44の何れかとマッチする撮像画像70上の領域のうち、特徴点間の類似スコアが最も高い領域を示す情報を位置情報としてもよい。
また、出力制御部140は、照合部120による照合の際に、撮像画像70とマッチすると判定されたデータベース画像44を、撮像画像70の座標空間の座標に変換した場合における該データベース画像44に対応する領域を示す情報を位置情報としてもよい。例えば、出力制御部140は、図7に示す枠72で示される領域とおよび枠73で示される領域の何れかを示す情報を位置情報としてもよい。また、出力制御部140は、図7に示す枠72で示される領域とおよび枠73で示される領域とのうち、特徴点間の類似スコアが最も高い領域を示す情報を位置情報としてもよい。
また、出力制御部140は、同一物体と判定された物体に関連するパラメータである、H[401A→Q70]およびH[401B→Q70]を用いて計算された、データベース画像44の撮像画像70上の位置を示す枠72および枠73から、物体の位置を推定してもよい。出力制御部140は、H[401A→Q70]を用いて計算した座標と、H[401B→Q70]を用いて計算した座標とを用いて、例えば、座標の平均値を求めることにより、物体の位置を推定してもよい。そして、出力制御部140は、推定した位置(領域)を示す情報を撮像画像70に重畳して表示した表示画面を生成してもよい。図10に示す枠95は推定した位置を示す。このように、出力制御部140、物体の位置を示す情報を、撮像画像70に重畳した表示画面を出力装置400に表示させることにより、物体識別装置100は、例えば、表示画面を見る作業者2に物体の個数と位置とを容易に把握させることができる。

図11は、本実施の形態に係るシステム1における計算装置200の処理の流れの一例を示すフローチャートである。図11に示す通り、第2特徴抽出部220が、画像記憶部210に格納されたデータベース画像44の夫々から特徴情報を抽出する(ステップS111)。
そして、パラメータ計算部230が、抽出された特徴情報に基づいて、データベース画像44間の幾何学関係を表すパラメータを計算する(ステップS112)。
上述した通り、パラメータは、データベース画像44を用いた照合により、撮像画像に複数の物体が識別される場合において、該複数の物体が同一物体か否かを判定する際に、データベース画像44および撮像画像の間の幾何学関係を表す第2パラメータと共に用いられるものである。
その後、パラメータ計算部230は、計算したパラメータをパラメータ記憶部240に格納する(ステップS113)。
図12は、本実施の形態に係るシステム1における物体識別装置100の処理の流れの一例を示すフローチャートである。図12に示す通り、物体識別装置100の第1特徴抽出部110は、取得した撮像画像から特徴情報を抽出する(ステップS121)。
そして、照合部120が、撮像画像から抽出された特徴情報と、ステップS111において、データベース画像44から抽出された特徴情報とを用いて、撮像画像とデータベース画像44との照合を行う(ステップS122)。
判定部130は、照合結果を参照し、複数の物体が識別され、且つ、識別された物体が同じ物品名を示すか否かを判定する(ステップS123)。同じ物品名の物体を複数識別していない場合(ステップS123にてNO)、処理はステップS126に進む。
同じ物品名の物体が複数識別された場合(ステップS123にてYES)、判定部130は、識別された物体に対応する(撮像画像とマッチした)データベース画像44と撮像画像との間の幾何学関係を表すパラメータを計算する(ステップS124)。
そして、ステップS112で計算されたパラメータと、ステップS124で計算されたパラメータとを用いて、複数の物体が同一物体か否かを判定する(ステップS125)。
その後、出力制御部140が、出力装置400による情報の出力を制御する制御信号を生成する(ステップS126)。ステップS125が行われた後の場合、出力制御部140は判定結果に基づいて、該判定結果を表す情報の出力を行うための制御信号を生成する。そして、出力制御部140は、生成した制御信号を出力装置400に出力する(ステップS127)。
これにより、出力装置400は、出力制御部140が出力した制御信号に基づいて、例えば、図10に示すような表示画面94を表示部に表示することができる。
以上のように、本実施の形態に係るシステム1の物体識別装置100は、照合部120が撮像画像と物体を識別するための複数のデータベース画像との照合を行う。そして、判定部130が、照合の結果が撮像画像に複数の物体が含まれる場合、データベース画像間の幾何学関係を表すパラメータと、識別された各物体に対応するデータベース画像および撮像画像の間の幾何学関係を表すパラメータとに基づいて、複数の物体が同一物体か否かを判定する。
例えば、実際には1つの物体が含まれる撮像画像において、撮像画像と複数のデータベース画像とが対応するとの照合結果を得ると、該照合結果からは、該撮像画像に複数の物体が含まれるとみなされる。本実施の形態によれば、判定部130がこの照合結果に基づいて、データベース画像間の幾何学関係を表すパラメータと、撮像画像と上記複数のデータベース画像の夫々との幾何学関係を表す複数のパラメータとに基づいて、識別された複数の物体が同一物体か否かを判定するため、あるデータベース画像と関連する他のデータベース画像が、撮像画像上においてどの位置に対応するのかを計算することができる。これにより、物体識別装置100は、撮像画像に含まれる物体が、あるデータベース画像と他のデータベース画像とにマッチする1の物体であるか否かを判定することができる。
よって、本実施の形態に係る物体識別装置100によれば、1の物体が複数のデータベース画像と対応付いた場合であっても、該物体の数が1つであると正確に判定することができる。
よって、本実施の形態に係る物体識別装置100によれば、識別対象の物体の個数を精度よく識別することできる。
なお、本実施の形態に係るシステム1において、撮像装置300と物体識別装置100とは一体となって形成され、例えば、インテリジェンスカメラとして機能してもよい。また、計算装置200の一部の機能が物体識別装置100に組み込まれてもよい。例えば、第1特徴抽出部110と、第2特徴抽出部220とが同じ回路で実現されてもよい。
このように、図1に示すシステム1における各装置は各々組み合わせて構成されてもよい。
<第2の実施の形態>
本開示の第2の実施の形態について説明する。本実施の形態では、本開示の課題を解決する基本構成について説明する。
図13は、本実施の形態に係る物体識別装置10の機能構成の一例を示す機能ブロック図である。図13に示す通り、本実施の形態に係る物体識別装置10は、照合部12と、判定部13とを備える。
照合部12は、上述した照合部120の機能を有する。照合部12は、撮像画像と物体を識別するための複数の識別用画像との照合を行う。照合部12は、照合結果を判定部13に供給する。照合部12が行う照合の方法は特に限定されず、上述した照合部120と同様の方法を採用してもよい。
判定部13は、上述した判定部130の機能を有する。判定部13は、照合の結果が撮像画像に複数の物体が含まれることを示す場合、識別用画像間の幾何学関係を表す第1パラメータと、識別された各物体に対応する識別用画像および撮像画像の間の幾何学関係を表す第2パラメータとに基づいて、複数の物体が同一物体か否かを判定する。判定部13は、上述した判定部130と同様に、(1)第1パラメータおよび第2パラメータを用いてある識別用画像の座標を撮像画像の座標空間の座標に変換することによって得られる領域であって、撮像画像の座標空間上における識別用画像の領域と、(2)第2パラメータを用いて他の識別用画像の座標を撮像画像の座標空間の座標に変換することによって得られる領域であって、撮像画像の座標空間上における他の識別用画像の領域と、の重なりの度合いを示す重複率に基づいて、複数の物体が同一物体か否かを判定してもよい。
図14は、本実施の形態に係る物体識別装置10の処理の流れの一例を示すフローチャートである。図14に示す通り、照合部12が、撮像画像と物体を識別するための複数の識別用画像との照合を行う(ステップS141)。そして、判定部13が、第1パラメータと、第2パラメータとに基づいて、複数の物体が同一物体か否かを判定する(ステップS142)。
図15は、上述した物体識別装置10が参照する第1パラメータを計算する計算装置20の機能構成の一例を示す機能ブロック図である。図15に示す通り、計算装置20は、抽出部22と、計算部23とを備える。
抽出部22は、上述した第2特徴抽出部220の機能を有する。物体を識別するための複数の識別用画像の夫々から、物体の特徴を表す特徴情報を抽出する。抽出部22は、抽出した特徴情報を計算部23に供給する。
計算部23は、上述したパラメータ計算部230の機能を有する。計算部23は、抽出された特徴情報に基づいて、複数の識別用画像間の幾何学関係を表す第1パラメータを計算する。なお、上述した通り、第1パラメータは、物体識別装置10による識別用画像を用いた照合により撮像画像に複数の物体が識別される場合において、該複数の物体が同一物体か否かを判定する際に、識別される各物体に対応する識別用画像および撮像画像の間の幾何学関係を表す第2パラメータと共に用いられる。
また、本実施の形態において、物体識別装置10および計算装置20は、図16に示すシステム6として構成されてもよい。図16は、物体識別装置10と計算装置20とを含むシステムの構成の一例を示すブロック図である。図16に示す通り、システム6は、物体識別装置10と計算装置20とを含む。物体識別装置10と計算装置20とは互いに通信可能に接続している。
なお、物体識別装置10と計算装置20とは一体となって形成されてもよいし、計算装置20の一部の機能が物体識別装置10に組み込まれてもよい。また、システム6は、上述したシステム1と同様に、撮像装置300および出力装置400を含む構成であってもよい。
例えば、実際には1つの物体が含まれる撮像画像において、撮像画像と複数の識別用画像とが対応するとの照合結果を得ると、該照合結果からは、該撮像画像に複数の物体が含まれると識別される。本実施の形態によれば、判定部13がこの照合結果に基づいて、第1パラメータと、複数の第2パラメータとに基づいて、識別された複数の物体が同一物体か否かを判定するため、ある識別用画像と関連する他の識別用画像が、撮像画像上においてどの位置に含まれるのかを計算することができる。これにより、物体識別装置10は、撮像画像に含まれる物体が、ある識別用画像と他の識別用画像とにマッチする1の物体であるか否かを判定することができる。
よって、本実施の形態に係る物体識別装置10によれば、1の物体が複数の識別用画像と対応付いた場合であっても、該物体の数が1つであると正確に判定することができる。
よって、本実施の形態に係る物体識別装置10によれば、識別対象の物体の個数を精度よく識別することできる。
(ハードウェア構成について)
本開示の各実施形態において、各装置の各構成要素は、機能単位のブロックを示している。各装置の各構成要素の一部又は全部は、例えば、図17に示すような情報処理装置900とプログラムとの任意の組み合わせにより実現される。図17は、各装置の各構成要素を実現する情報処理装置900のハードウェア構成の一例を示すブロック図である。情報処理装置900は、一例として、以下のような構成を含む。
・CPU(Central Processing Unit)901
・ROM(Read Only Memory)902
・RAM(Random Access Memory)903
・RAM903にロードされるプログラム904
・プログラム904を格納する記憶装置905
・記録媒体906の読み書きを行うドライブ装置907
・通信ネットワーク909と接続する通信インタフェース908
・データの入出力を行う入出力インタフェース910
・各構成要素を接続するバス911
各実施形態における各装置の各構成要素は、これらの機能を実現するプログラム904をCPU901が取得して実行することで実現される。各装置の各構成要素の機能を実現するプログラム904は、例えば、予め記憶装置905やROM902に格納されており、必要に応じてCPU901がRAM903にロードして実行される。なお、プログラム904は、通信ネットワーク909を介してCPU901に供給されてもよいし、予め記録媒体906に格納されており、ドライブ装置907が当該プログラムを読み出してCPU901に供給してもよい。
各装置の実現方法には、様々な変形例がある。例えば、各装置は、構成要素毎にそれぞれ別個の情報処理装置900とプログラムとの任意の組み合わせにより実現されてもよい。また、各装置が備える複数の構成要素が、一つの情報処理装置900とプログラムとの任意の組み合わせにより実現されてもよい。
また、各装置の各構成要素の一部又は全部は、その他の汎用または専用の回路、プロセッサ等やこれらの組み合わせによって実現される。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。
各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。
各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
なお、上述した各実施の形態は、本開示の好適な実施の形態であり、上記各実施の形態にのみ本開示の範囲を限定するものではなく、本開示の要旨を逸脱しない範囲において当業者が上記各実施の形態の修正や代用を行い、種々の変更を施した形態を構築することが可能である。
例えば、本開示における物体識別装置(10、100)は、POS(Point Of Sales)レジスタ等のキャッシュレジスタの近傍に設置されたカメラを含むシステムにも好適に利用できる。この場合、上述した物体識別装置(10、100)は、POSレジスタに内蔵されることによって実現されてもよい。なお、該POSレジスタは、更に計算装置(20、200)の機能を備えてもよい。また、物体識別装置(10、100)は、POSレジスタに、出力装置400と同様の出力を行わせてもよい。この場合であっても、物体識別装置(10、100)は、カメラが商品を撮像することによって得られた撮像画像から、認識された複数の物体が同一物体か否かを判定することにより、該識別対象の物体の個数を精度よく識別することできる。
また、本開示における物体識別装置(10、100)および計算装置(20、200)は、POSレジスタと通信可能なサーバ装置で実現されてもよい。そして、物体識別装置(10、100)は、POSレジスタに、出力装置400と同様の出力を行わせてもよい。このように、既に店舗に設置されているPOSレジスタを利用した構成にも、本開示の物体識別装置(10、100)および計算装置(20、200)を好適に適用することができる。
なお、上述したPOSレジスタとは、店員が操作するキャッシュレジスタに限定されず、精算を顧客が行う分担型のキャッシュレジスタ(セミセルフレジスタ)、レジスタの通過時に店員が介在しない(精算までの一連の作業を顧客のみで行う)キャッシュレジスタ(セルフレジスタ)の何れであってもよい。
上記の実施の形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
撮像画像と物体を識別するための複数の識別用画像との照合を行う照合手段と、
前記照合の結果が前記撮像画像に複数の物体が含まれることを示す場合、前記識別用画像間の幾何学関係を表す第1パラメータと、識別された各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータとに基づいて、前記複数の物体が同一物体か否かを判定する判定手段と、
を備える物体識別装置。
(付記2)
前記判定手段は、前記照合の結果に基づいて、識別された第1物体に対応する識別用画像である第1識別用画像の座標を前記撮像画像上に変換する場合の幾何学関係を表す第3パラメータと、識別された、前記第1物体とは異なる第2物体に対応する識別用画像である第2識別用画像の座標を前記撮像画像上に変換する場合の幾何学関係を表す第4パラメータとを前記第2パラメータとして計算し、
前記第1識別用画像の座標を前記第2識別用画像上に変換する場合の前記第1パラメータおよび前記第4パラメータから得られる値と、前記第3パラメータとを用いて、前記複数の物体が同一物体か否かを判定する、
付記1に記載の物体識別装置。
(付記3)
前記判定手段は、前記第1パラメータおよび前記第4パラメータから推定される前記第1物体の前記撮像画像上における第1領域と、前記第3パラメータから得られる前記第1物体の前記撮像画像上における第2領域との重複の度合いを示す重複率が、所定の閾値以上の場合、前記複数の物体が同一物体であると判定する、
付記2に記載の物体識別装置。
(付記4)
前記判定手段は、前記第1識別用画像の座標を前記第2識別用画像上に変換する場合の前記第1パラメータおよび前記第4パラメータから得られる値と、前記第3パラメータとの、所定の指標に基づく類似度が、所定の条件を満たす場合、前記複数の物体が同一物体であると判定する、
付記2に記載の物体識別装置。
(付記5)
前記判定手段による判定結果を表す情報の出力を制御する出力制御手段を更に備え、
前記出力制御手段は、前記識別された物体の前記撮像画像上における位置を示す位置情報を前記撮像画像に重畳した表示画面を表示部に表示させるよう制御する、
付記1から4の何れか1つに記載の物体識別装置。
(付記6)
前記出力制御手段は、同一物体と判定された物体に関連する前記第2パラメータを用いて、複数の前記識別用画像の夫々の前記撮像画像上における位置から、前記物体の位置を推定し、推定した前記位置を示す情報を、前記位置情報とする、
付記5に記載の物体識別装置。
(付記7)
撮像画像と物体を識別するための複数の識別用画像との照合を行い、
前記照合の結果が前記撮像画像に複数の物体が含まれることを示す場合、前記識別用画像間の幾何学関係を表す第1パラメータと、識別された各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータとに基づいて、前記複数の物体が同一物体か否かを判定する、
物体識別方法。
(付記8)
前記照合の結果に基づいて、識別された第1物体に対応する識別用画像である第1識別用画像の座標を前記撮像画像上に変換する場合の幾何学関係を表す第3パラメータと、識別された、前記第1物体とは異なる第2物体に対応する識別用画像である第2識別用画像の座標を前記撮像画像上に変換する場合の幾何学関係を表す第4パラメータとを前記第2パラメータとして計算し、
前記第1識別用画像の座標を前記第2識別用画像上に変換する場合の前記第1パラメータおよび前記第4パラメータから得られる値と、前記第3パラメータとを用いて、前記複数の物体が同一物体か否かを判定する、
付記7に記載の物体識別方法。
(付記9)
撮像画像と物体を識別するための複数の識別用画像との照合を行う処理と、
前記照合の結果が前記撮像画像に複数の物体が含まれることを示す場合、前記識別用画像間の幾何学関係を表す第1パラメータと、識別された各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータとに基づいて、前記複数の物体が同一物体か否かを判定する処理と、
をコンピュータに実行させるプログラムを記録する、コンピュータ読み取り可能な非一時的な記録媒体。
(付記10)
前記判定する処理は、前記照合の結果に基づいて、識別された第1物体に対応する識別用画像である第1識別用画像の座標を前記撮像画像上に変換する場合の幾何学関係を表す第3パラメータと、識別された、前記第1物体とは異なる第2物体に対応する識別用画像である第2識別用画像の座標を前記撮像画像上に変換する場合の幾何学関係を表す第4パラメータとを前記第2パラメータとして計算し、
前記第1識別用画像の座標を前記第2識別用画像上に変換する場合の前記第1パラメータおよび前記第4パラメータから得られる値と、前記第3パラメータとを用いて、前記複数の物体が同一物体か否かを判定する、
付記9に記載の記録媒体。
(付記11)
物体を識別するための複数の識別用画像の夫々から、前記物体の特徴を表す特徴情報を抽出する抽出手段と、
前記抽出された特徴情報に基づいて、前記複数の識別用画像間の幾何学関係を表す第1パラメータであって、前記識別用画像を用いた照合により撮像画像に複数の物体が識別される場合において、該複数の物体が同一物体か否かを判定する際に、識別される各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータと共に用いる第1パラメータを計算する計算手段と、を備える計算装置。
(付記12)
付記1から6の何れか1つに記載の物体識別装置と、
付記11に記載の計算装置と、
を備えるシステム。
1 システム
6 システム
10 物体識別装置
12 照合部
13 判定部
20 計算装置
22 抽出部
23 計算部
100 物体識別装置
110 第1特徴抽出部
120 照合部
130 判定部
140 出力制御部
200 計算装置
210 画像記憶部
220 第2特徴抽出部
230 パラメータ計算部
240 パラメータ記憶部
300 撮像装置
400 出力装置

Claims (10)

  1. 撮像画像と物体を識別するための複数の識別用画像との照合を行う照合手段と、
    前記照合の結果が前記撮像画像に複数の物体が含まれることを示す場合、前記識別用画像間の幾何学関係を表す第1パラメータと、識別された各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータとに基づいて、前記複数の物体が同一物体か否かを判定する判定手段と、
    を備える物体識別装置。
  2. 前記判定手段は、前記照合の結果に基づいて、識別された第1物体に対応する識別用画像である第1識別用画像の座標を前記撮像画像上に変換する場合の幾何学関係を表す第3パラメータと、識別された、前記第1物体とは異なる第2物体に対応する識別用画像である第2識別用画像の座標を前記撮像画像上に変換する場合の幾何学関係を表す第4パラメータとを前記第2パラメータとして計算し、
    前記第1識別用画像の座標を前記第2識別用画像上に変換する場合の前記第1パラメータおよび前記第4パラメータから得られる値と、前記第3パラメータとを用いて、前記複数の物体が同一物体か否かを判定する、
    請求項1に記載の物体識別装置。
  3. 前記判定手段は、前記第1パラメータおよび前記第4パラメータから推定される前記第1物体の前記撮像画像上における第1領域と、前記第3パラメータから得られる前記第1物体の前記撮像画像上における第2領域との重複の度合いを示す重複率が、所定の閾値以上の場合、前記複数の物体が同一物体であると判定する、
    請求項2に記載の物体識別装置。
  4. 前記判定手段は、前記第1識別用画像の座標を前記第2識別用画像上に変換する場合の前記第1パラメータおよび前記第4パラメータから得られる値と、前記第3パラメータとの、所定の指標に基づく類似度が、所定の条件を満たす場合、前記複数の物体が同一物体であると判定する、
    請求項2に記載の物体識別装置。
  5. 前記判定手段による判定結果を表す情報の出力を制御する出力制御手段を更に備え、
    前記出力制御手段は、前記識別された物体の前記撮像画像上における位置を示す位置情報を前記撮像画像に重畳した表示画面を表示部に表示させるよう制御する、
    請求項1から4の何れか1項に記載の物体識別装置。
  6. 前記出力制御手段は、同一物体と判定された物体に関連する前記第2パラメータを用いて、複数の前記識別用画像の夫々の前記撮像画像上における位置から、前記物体の位置を推定し、推定した前記位置を示す情報を、前記位置情報とする、
    請求項5に記載の物体識別装置。
  7. 撮像画像と物体を識別するための複数の識別用画像との照合を行い、
    前記照合の結果が前記撮像画像に複数の物体が含まれることを示す場合、前記識別用画像間の幾何学関係を表す第1パラメータと、識別された各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータとに基づいて、前記複数の物体が同一物体か否かを判定する、
    物体識別方法。
  8. 撮像画像と物体を識別するための複数の識別用画像との照合を行う処理と、
    前記照合の結果が前記撮像画像に複数の物体が含まれることを示す場合、前記識別用画像間の幾何学関係を表す第1パラメータと、識別された各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータとに基づいて、前記複数の物体が同一物体か否かを判定する処理と、
    をコンピュータに実行させるプログラム
  9. 物体を識別するための複数の識別用画像の夫々から、前記物体の特徴を表す特徴情報を抽出する抽出手段と、
    前記抽出された特徴情報に基づいて、前記複数の識別用画像間の幾何学関係を表す第1パラメータであって、前記識別用画像を用いた照合により撮像画像に複数の物体が識別される場合において、該複数の物体が同一物体か否かを判定する際に、識別される各物体に対応する前記識別用画像および前記撮像画像の間の幾何学関係を表す第2パラメータと共に用いる第1パラメータを計算する計算手段と、を備える計算装置。
  10. 請求項1から6の何れか1項に記載の物体識別装置と、
    請求項に記載の計算装置と、
    を備えるシステム。
JP2019528293A 2017-07-07 2017-07-07 物体識別装置、物体識別方法、計算装置、システムおよび記録媒体 Active JP6769554B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/024923 WO2019008734A1 (ja) 2017-07-07 2017-07-07 物体識別装置、物体識別方法、計算装置、システムおよび記録媒体

Publications (2)

Publication Number Publication Date
JPWO2019008734A1 JPWO2019008734A1 (ja) 2020-04-09
JP6769554B2 true JP6769554B2 (ja) 2020-10-14

Family

ID=64950680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019528293A Active JP6769554B2 (ja) 2017-07-07 2017-07-07 物体識別装置、物体識別方法、計算装置、システムおよび記録媒体

Country Status (3)

Country Link
US (1) US11205089B2 (ja)
JP (1) JP6769554B2 (ja)
WO (1) WO2019008734A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7242309B2 (ja) * 2019-01-16 2023-03-20 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
EP4062268A1 (en) * 2019-11-19 2022-09-28 Orcam Technologies Ltd. Wearable systems and methods for locating an object
US11804039B2 (en) * 2020-05-28 2023-10-31 Science House LLC Systems, methods, and apparatus for enhanced cameras

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001014465A (ja) 1999-06-29 2001-01-19 Matsushita Electric Ind Co Ltd 物体認識方法及び物体認識装置
FR2825814B1 (fr) * 2001-06-07 2003-09-19 Commissariat Energie Atomique Procede de creation automatique d'une base de donnees images interrogeable par son contenu semantique
JP4004899B2 (ja) * 2002-09-02 2007-11-07 ファナック株式会社 物品の位置姿勢検出装置及び物品取出し装置
JP4824411B2 (ja) 2005-01-20 2011-11-30 パナソニック株式会社 顔抽出装置、半導体集積回路
JP2006295890A (ja) * 2005-03-15 2006-10-26 Fuji Photo Film Co Ltd アルバム作成装置、アルバム作成方法、及びプログラム
JP4715539B2 (ja) 2006-02-15 2011-07-06 トヨタ自動車株式会社 画像処理装置、その方法、および画像処理用プログラム
JP4640825B2 (ja) 2006-02-23 2011-03-02 富士フイルム株式会社 特定向き顔判定方法および装置並びにプログラム
US8611673B2 (en) * 2006-09-14 2013-12-17 Parham Aarabi Method, system and computer program for interactive spatial link-based image searching, sorting and/or displaying
TWI506565B (zh) * 2008-03-03 2015-11-01 Avo Usa Holding 2 Corp 動態物件分類
WO2010021527A2 (ko) * 2008-08-22 2010-02-25 Jung Tae Woo 영상에 포함된 객체를 색인하는 시스템 및 방법
WO2011089872A1 (ja) * 2010-01-22 2011-07-28 パナソニック株式会社 画像管理装置、画像管理方法、プログラム、記録媒体及び集積回路
JP5431429B2 (ja) 2011-09-06 2014-03-05 東芝テック株式会社 情報処理装置及びプログラム
US9171195B1 (en) * 2014-06-16 2015-10-27 Amazon Technologies, Inc. Recognizing three-dimensional objects
US9483704B2 (en) * 2014-12-10 2016-11-01 Ricoh Co., Ltd. Realogram scene analysis of images: superpixel scene analysis
US10242287B2 (en) * 2015-06-11 2019-03-26 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and recording medium
US9449258B1 (en) * 2015-07-02 2016-09-20 Agt International Gmbh Multi-camera vehicle identification system
JP2019200697A (ja) * 2018-05-18 2019-11-21 東芝テック株式会社 棚管理システムおよびプログラム
US10902263B1 (en) * 2018-06-26 2021-01-26 Amazon Technologies, Inc. Image processing system for object identification
US20200193552A1 (en) * 2018-12-18 2020-06-18 Slyce Acquisition Inc. Sparse learning for computer vision

Also Published As

Publication number Publication date
US20200143196A1 (en) 2020-05-07
JPWO2019008734A1 (ja) 2020-04-09
US11205089B2 (en) 2021-12-21
WO2019008734A1 (ja) 2019-01-10

Similar Documents

Publication Publication Date Title
JP7019357B2 (ja) 棚情報推定装置及び情報処理プログラム
JP6278276B2 (ja) 物体識別装置、物体識別方法、及びプログラム
JP6458239B1 (ja) 画像認識システム
JP6769554B2 (ja) 物体識別装置、物体識別方法、計算装置、システムおよび記録媒体
JP6976733B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2019046484A (ja) 画像認識システム
US11640709B2 (en) Merchandise specification systems and programs
WO2016158438A1 (ja) 検品処理装置及び方法、及びプログラム
JP6236825B2 (ja) 自動販売機の販売商品認識装置及び販売商品認識方法、並びにコンピュータ・プログラム
JP2021168151A (ja) 処理システム、処理方法及びプログラム
JP2020095408A (ja) リスト生成装置、被写体識別装置、リスト生成方法、及びプログラム
US11189053B2 (en) Information processing apparatus, method of controlling information processing apparatus, and non-transitory computer-readable storage medium
US20160260106A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
US11544926B2 (en) Image processing apparatus, method of processing image, and storage medium
WO2017170260A1 (ja) 検品処理装置、検品システム、商品マスタ登録装置、検品処理方法及びプログラム
JP6930601B2 (ja) 情報処理装置、表示位置調整方法、およびプログラム
US11580721B2 (en) Information processing apparatus, control method, and program
JP6769555B2 (ja) 物品識別装置、物品識別方法、計算装置、システムおよびプログラム
US20180181940A1 (en) Pos terminal device, information processing device, information processing system, image recognition method, and image recognition program
US11568564B2 (en) Mapping multiple views to an identity
JP6544482B2 (ja) 物体認識装置、物体認識方法及び記憶媒体
WO2022266996A1 (zh) 物体检知方法及物体检知装置
JP7322945B2 (ja) 処理装置、処理方法及びプログラム
JP6582875B2 (ja) 検品処理装置、検品システム、検品処理方法及びプログラム
JP7207396B2 (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191206

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200825

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200907

R150 Certificate of patent or registration of utility model

Ref document number: 6769554

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150