WO2023127085A1

WO2023127085A1 - 物体認識装置、物体認識方法、及び、記憶媒体

Info

Publication number: WO2023127085A1
Application number: PCT/JP2021/048764
Authority: WO
Inventors: 壮馬白石
Original assignee: 日本電気株式会社
Priority date: 2021-12-28
Filing date: 2021-12-28
Publication date: 2023-07-06

Abstract

物体認識装置において、画像取得手段は、複数の物体を含む画像を取得する。物体認識手段は、物体認識処理を行うことにより、画像に含まれる複数の物体各々に対応する認識結果を取得する。接続関係特定手段は、認識結果に基づき、複数の物体各々に対応する複数の物体領域の接続関係の有無を特定する。領域関係性取得手段は、接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得する。クラス関係性取得手段は、認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得する。認識結果補正手段は、領域関係性情報及びクラス関係性情報に基づいて認識結果を補正することにより、複数の補正後の認識結果を取得する。評価手段は、複数の補正後の認識結果を用いて認識結果を評価することにより、複数の物体各々が属するクラスに係る最終的な認識結果を取得する。

Description

物体認識装置、物体認識方法、及び、記憶媒体

　本開示は、画像に含まれる物体の認識に関する。

　店舗内の商品棚を撮影した画像を用い、商品の棚割を管理する手法が提案されている。

　具体的には、例えば、特許文献１には、複数の商品が配列された商品棚を撮影して得られた画像において、一の商品領域画像により表される商品を第１の商品として認識し、当該一の商品領域画像以外の他の商品領域画像により表される商品を第２の商品として認識し、さらに、当該第１の商品と当該第２の商品との関連性に基づき、当該一の商品領域画像を当該第１の商品として認識したことの妥当性を判定する観点が開示されている。

国際公開ＷＯ２０１９／１０７１５７号公報

　しかし、特許文献１に開示された観点によれば、複数の商品における商品同士の関連性に基づいて認識結果の妥当性が判定されることに起因し、当該複数の商品における個々の商品の認識精度が低下してしまう場合がある、という課題が生じている。

　本開示の１つの目的は、画像に含まれる複数の物体における個々の物体の認識精度を向上させることが可能な物体識別装置を提供することにある。

　本開示の一つの観点では、物体認識装置は、
　複数の物体を含む画像を取得する画像取得手段と、
　前記画像に対して物体認識処理を行うことにより、前記画像に含まれる前記複数の物体各々に対応する認識結果を取得する物体認識手段と、
　前記物体認識処理により得られた前記認識結果に基づき、前記複数の物体各々に対応する複数の物体領域の接続関係の有無を特定するための処理を行う接続関係特定手段と、
　前記接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得する領域関係性取得手段と、
　前記物体認識処理により前記認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得するクラス関係性取得手段と、
　前記領域関係性情報及び前記クラス関係性情報に基づいて前記物体認識処理により得られた前記認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得する認識結果補正手段と、
　前記複数の補正後の認識結果を用いて前記物体認識処理により得られた前記認識結果を評価することにより、前記複数の物体各々が属するクラスに係る最終的な認識結果を取得する評価手段と、を備える。

　本開示の他の観点では、物体認識方法は、
　複数の物体を含む画像を取得し、
　前記画像に対して物体認識処理を行うことにより、前記画像に含まれる前記複数の物体各々に対応する認識結果を取得し、
　前記物体認識処理により得られた前記認識結果に基づき、前記複数の物体各々に対応する複数の物体領域の接続関係の有無を特定するための処理を行い、
　前記接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得し、
　前記物体認識処理により前記認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得し、
　前記領域関係性情報及び前記クラス関係性情報に基づいて前記物体認識処理により得られた前記認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得し、
　前記複数の補正後の認識結果を用いて前記物体認識処理により得られた前記認識結果を評価することにより、前記複数の物体各々が属するクラスに係る最終的な認識結果を取得する。

　本開示のさらに他の観点では、記録媒体は、
　複数の物体を含む画像を取得し、
　前記画像に対して物体認識処理を行うことにより、前記画像に含まれる前記複数の物体各々に対応する認識結果を取得し、
　前記物体認識処理により得られた前記認識結果に基づき、前記複数の物体各々に対応する複数の物体領域の接続関係の有無を特定するための処理を行い、
　前記接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得し、
　前記物体認識処理により前記認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得し、
　前記領域関係性情報及び前記クラス関係性情報に基づいて前記物体認識処理により得られた前記認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得し、
　前記複数の補正後の認識結果を用いて前記物体認識処理により得られた前記認識結果を評価することにより、前記複数の物体各々が属するクラスに係る最終的な認識結果を取得する処理をコンピュータに実行させるプログラムを記録する。

　本開示によれば、画像に含まれる複数の物体における個々の物体の認識精度を向上させることが可能な物体識別装置を提供することができる。

第１実施形態に係る物体認識装置の概略を示す図。第１実施形態に係る物体認識装置のハードウェア構成を示すブロック図。第１実施形態に係る物体認識装置の機能構成を示すブロック図。第１実施形態に係る物体認識装置の処理において用いられる画像の一例を示す図。第１実施形態に係る物体認識装置の処理により検出される商品領域及び空き領域を説明するための図。第１実施形態に係る物体認識装置において行われる接続関係の特定に係る処理を説明するための図。第１実施形態に係る物体認識装置において行われる接続関係の特定に係る処理を説明するための図。第１実施形態に係る物体認識装置において行われる接続関係の特定に係る処理を説明するための図。クラス関係性情報を取得する際に用いられる属性情報の例を説明するための図。クラス関係性情報として含まれ得る情報の例を説明するための図。クラス関係性情報として含まれ得る情報の例を説明するための図。第１実施形態に係る物体認識装置において行われる処理を説明するためのフローチャート。第２の実施形態に係る物体認識装置の機能構成を示すブロック図。第２の実施形態に係る物体認識装置において行われる処理を説明するためのフローチャート。

　以下、図面を参照して、本開示の好適な実施形態について説明する。なお、本明細書においては、任意の記号の上に「^~」が付された文字を、便宜上、「Ａ~」（「Ａ」は任意の文字）と表すものとする。

　＜第１実施形態＞
　［概略構成］
　図１は、第１実施形態に係る物体認識装置の概略を示す図である。物体認識装置１００は、例えば、タブレット端末等のような可搬型の端末装置として構成されている。また、物体認識装置１００は、店舗の商品棚を撮影して得られた画像から、商品棚に陳列された個々の商品を認識する。また、物体認識装置１００は、個々の商品を認識した認識結果に対して補正等の処理を施すことにより得られた処理結果を、最終的な認識結果として取得する。

　［ハードウェア構成］
　図２は、第１実施形態に係る物体認識装置のハードウェア構成を示すブロック図である。物体認識装置１００は、図２に示すように、インタフェース（ＩＦ）１１１と、プロセッサ１１２と、メモリ１１３と、記録媒体１１４と、データベース（ＤＢ）１１５と、カメラ１１６と、タッチパネル１１７と、を備える。

　ＩＦ１１１は、外部装置との間でデータの入出力を行う。また、物体認識装置１００により得られた最終的な認識結果は、必要に応じ、ＩＦ１１１を通じて外部装置へ出力される。

　プロセッサ１１２は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）などのコンピュータであり、予め用意されたプログラムを実行することにより、物体認識装置１００の全体を制御する。具体的には、プロセッサ１１２は、物体認識処理、及び、認識結果補正処理等の処理を行う。

　メモリ１１３は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などにより構成される。メモリ１１３は、プロセッサ１１２による各種の処理の実行中に作業メモリとしても使用される。

　記録媒体１１４は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、物体認識装置１００に対して着脱可能に構成される。記録媒体１１４は、プロセッサ１１２が実行する各種のプログラムを記録している。物体認識装置１００が各種の処理を実行する際には、記録媒体１１４に記録されているプログラムがメモリ１１３にロードされ、プロセッサ１１２により実行される。

　データベース１１５には、例えば、ＩＦ１１１を通じて入力された情報、プロセッサ１１２の処理により得られた処理結果、及び、カメラ１１６により得られた画像等が格納される。

　カメラ１１６は、複数の商品が陳列された商品棚を撮影して画像を取得する。なお、本実施形態においては、複数の商品がカメラ１１６から略等距離の位置に配置されている限りは、当該複数の商品が商品棚以外の什器等に配置されていてもよい。また、本実施形態においては、カメラ１１６として、例えば、撮影時に画像及び奥行き情報を併せて取得することが可能なデプスカメラが物体認識装置１００に設けられていてもよい。そして、デプスカメラを物体認識装置１００に設けた場合には、例えば、複数の商品がカメラ１１６から略等距離の位置に配置されていない場合であっても、後述のサイズ情報ＳＺＪとして適正な情報を取得することができる。

　タッチパネル１１７は、例えば、カメラ１１６により撮影された画像、及び、プロセッサ１１２の処理により得られた最終的な認識結果等を表示可能な機能を有している。また、タッチパネル１１７は、例えば、ユーザのタッチ操作に応じた指示及び情報等を入力可能な機能を有している。

　［機能構成］
　図３は、第１実施形態に係る物体認識装置の機能構成を示すブロック図である。物体認識装置１００は、図３に示すように、画像取得部２１と、物体認識部２２と、接続関係特定部２３と、領域関係性取得部２４と、クラス関係性取得部２５と、認識結果補正部２６と、評価部２７と、出力部２８と、を有している。

　画像取得部２１は、複数の商品が陳列された商品棚を撮影して画像ＩＭＴを取得する。なお、画像取得部２１は、商品棚を撮影して画像ＩＭＴを取得するものに限らず、例えば、商品棚を撮影した画像群が予め蓄積されているデータベース等から画像ＩＭＴを取得するようにしてもよい。

　物体認識部２２は、例えば、ニューラルネットワーク等により構成された学習済みの物体認識モデルを用いて画像ＩＭＴに対して物体認識処理を行うことにより、当該画像ＩＭＴに含まれる複数の商品各々に対応する認識結果を取得する。

　具体的には、物体認識部２２は、画像ＩＭＴに含まれる複数の商品各々に対応する矩形領域を複数の商品領域ＳＡとして検出するとともに、当該画像ＩＭＴにおいて一定距離以内に商品が存在しない領域を空き領域ＥＡとして検出する。また、物体認識部２２は、複数の商品領域ＳＡの位置、サイズ及び特徴量を抽出することにより得られた抽出結果に基づき、当該複数の商品領域ＳＡに含まれる商品各々を予め設定された複数のクラスのうちのいずれかに分類した場合におけるクラス毎の蓋然性を示す値である認識スコアを取得する。

　接続関係特定部２３は、物体認識部２２により検出された複数の商品領域ＳＡに基づき、当該複数の商品領域ＳＡの接続関係の有無を特定するための処理を行う。換言すると、接続関係特定部２３は、物体認識部２２の物体認識処理により得られた認識結果に基づき、複数の商品各々に対応する複数の商品領域ＳＡの接続関係の有無を特定するための処理を行う。

　領域関係性取得部２４は、画像ＩＭＴを解析することにより、接続関係特定部２３により接続関係を有することが特定された各商品領域ＳＡの関係性に係る情報である領域関係性情報ＡＲＪを取得する。具体的には、領域関係性取得部２４は、画像ＩＭＴを解析することにより、例えば、接続関係特定部２３により接続関係を有することが特定された各商品領域ＳＡのうち、互いに隣接する２つの商品領域ＳＡの関係性に係る領域関係性情報ＡＲＪを取得する。

　クラス関係性取得部２５は、属性情報格納部２５ａに格納されている属性情報ＡＴＪに基づき、物体認識部２２において認識結果を得るために予め設定されている複数のクラスの関係性を示すクラス関係性情報ＣＲＪを取得するための処理を行う。

　認識結果補正部２６は、接続関係特定部２３により得られた複数の商品領域ＳＡの接続関係と、領域関係性取得部２４により得られた領域関係性情報ＡＲＪと、クラス関係性取得部２５により得られたクラス関係性情報ＣＲＪと、に基づいて認識結果補正処理を行うことにより、物体認識部２２により得られた認識結果を補正する。そして、認識結果補正部２６は、物体認識部２２により認識されるクラスの数と、接続関係特定部２３により接続関係を有することが特定された商品領域ＳＡの数と、に応じた複数の補正後の認識結果を取得する。すなわち、認識結果補正部２６は、領域関係性情報ＡＲＪ及びクラス関係性情報ＣＲＪに基づいて物体認識部２２の物体認識処理により得られた認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得する。

　評価部２７は、認識結果補正部２６により得られた複数の補正後の認識結果を用い、物体認識部２２の物体認識処理により得られた認識結果を評価する処理を行うことにより、複数の商品領域ＳＡに含まれる複数の商品各々が属するクラスに係る最終的な認識結果を取得する。

　出力部２８は、評価部２７により得られた最終的な認識結果を表示するための表示画面を生成し、当該生成した表示画面を表示装置へ出力する。また、出力部２８は、評価部２７により得られた最終的な認識結果等を含むデータを外部装置へ出力する。

　［物体認識装置において行われる処理の具体例］
　続いて、第１実施形態に係る物体認識装置において行われる処理の具体例について説明する。

　画像取得部２１は、複数の商品が陳列された商品棚を撮影して画像ＩＭＴを取得する。具体的には、画像取得部２１は、画像ＩＭＴとして、例えば、図４に示すような、商品棚ＰＳの上にペットボトル飲料等の商品が一列に並べられた状態の画像を取得する。図４は、第１実施形態に係る物体認識装置の処理において用いられる画像の一例を示す図である。

　物体認識部２２は、画像ＩＭＴに対して物体認識処理を行うことにより、複数の商品領域ＳＡ及び空き領域ＥＡを検出する。このような処理によれば、商品領域ＳＡ及び空き領域ＥＡとして、例えば、図５に示すような領域が検出される。図５は、第１実施形態に係る物体認識装置の処理により検出される商品領域及び空き領域を説明するための図である。

　また、物体認識部２２は、複数の商品領域ＳＡに含まれる商品各々を予め設定された複数のクラスのうちのいずれかに分類した場合におけるクラス毎の蓋然性を示す値である複数の認識スコアを取得する。具体的には、物体認識部２２は、例えば、クラスＡ～Ｄの４つのクラスが予め設定されている場合には、一の商品領域ＳＡに含まれる一の商品の認識結果として、当該一の商品をクラスＡに分類した場合の蓋然性を示す認識スコアＲＡ、当該一の商品をクラスＢに分類した場合の蓋然性を示す認識スコアＲＢ、当該一の商品をクラスＣに分類した場合の蓋然性を示す認識スコアＲＣ、及び、当該一の商品をクラスＤに分類した場合の蓋然性を示す認識スコアＲＤを取得する。また、物体認識部２２は、クラスＡ～Ｄの４つのクラスが予め設定されている場合には、画像ＩＭＴにおいて検出した全ての商品領域ＳＡについて、認識スコアＲＡ～ＲＤを取得する。なお、本実施形態によれば、物体認識部２２において、物体認識処理を経て出力された出力値の範囲をソフトマックス関数等により調整する処理が行われる。そのため、本実施形態においては、物体認識部２２により取得された複数の認識スコアの合計値が１になるとともに、当該複数の認識スコア各々が０以上かつ１以下の値をとるものとして説明を行う。

　接続関係特定部２３は、物体認識部２２により検出された複数の商品領域ＳＡ及び空き領域ＥＡに基づき、当該複数の商品領域ＳＡの接続関係の有無を特定するための処理を行う。

　ここで、例えば、図６Ａに示すように、商品棚ＰＳに配置されている商品Ｋに対応する商品領域ＳＡＫと、当該商品棚ＰＳにおいて当該商品Ｋと同一の棚板上に配置されている商品Ｌに対応する商品領域ＳＡＬと、が物体認識部２２により検出された場合における接続関係特定部２３の処理について説明する。図６Ａ～６Ｃは、第１実施形態に係る物体認識装置において行われる接続関係の特定に係る処理を説明するための図である。

　まず、接続関係特定部２３は、商品領域ＳＡＫに隣接する位置に、当該商品領域ＳＡＫと同じサイズを有する矩形領域ＳＡＫＡを設定する。具体的には、接続関係特定部２３は、例えば、図６Ｂに示すように、商品領域ＳＡＫの右側に隣接する位置に矩形領域ＳＡＫＡを設定する。

　次に、接続関係特定部２３は、商品領域ＳＡＬと矩形領域ＳＡＫＡとが重複する重複領域ＴＲＡを検出するとともに、当該商品領域ＳＡＬに対する当該重複領域ＴＲＡの割合ＲＫＬを算出する。重複領域ＴＲＡは、例えば、図６Ｃのような領域として表される。

　その後、接続関係特定部２３は、割合ＲＫＬと、閾値ＴＨＡと、に基づき、商品領域ＳＡＫと商品領域ＳＡＬとが隣接するか否かを判定する。

　接続関係特定部２３は、割合ＲＫＬが閾値ＴＨＡ未満である場合には、商品領域ＳＡＫと商品領域ＳＡＬとが隣接しないと判定する。具体的には、図６Ｃの重複領域ＴＲＡに応じて算出した割合ＲＫＬが閾値ＴＨＡ未満である場合には、商品領域ＳＡＫの右側において、当該商品領域ＳＡＫと商品領域ＳＡＬとが隣接しないと判定する。そして、このような判定を行った場合には、接続関係特定部２３は、商品棚ＰＳに配置されている商品領域ＳＡＫと商品領域ＳＡＬとが、当該商品棚ＰＳの左右方向に接続関係を有しないことを特定する。

　また、接続関係特定部２３は、割合ＲＫＬが閾値ＴＨＡ以上である場合には、矩形領域ＳＡＫＡを設定した方向において、商品領域ＳＡＫと商品領域ＳＡＬとが隣接すると判定する。具体的には、図６Ｃの重複領域ＴＲＡに応じて算出した割合ＲＫＬが閾値ＴＨＡ以上である場合には、商品領域ＳＡＫの右側において、当該商品領域ＳＡＫと商品領域ＳＡＬとが隣接すると判定する。そして、このような判定を行った場合には、接続関係特定部２３は、商品棚ＰＳに配置されている商品領域ＳＡＫと商品領域ＳＡＬとが、当該商品棚ＰＳの左右方向に接続関係を有することを特定する。

　なお、接続関係特定部２３は、例えば、商品領域ＳＡＫと商品領域ＳＡＬとの間に空き領域ＥＡが存在する場合には、以上に述べた処理を行わずに、商品領域ＳＡＫと商品領域ＳＡＬとが（当該空き領域ＥＡの方向に）接続関係を有しないことを特定してもよい。

　領域関係性取得部２４は、画像ＩＭＴを解析することにより、接続関係特定部２３により接続関係を有することが特定された各商品領域ＳＡのうち、互いに隣接する２つの商品領域ＳＡの関係性に係る領域関係性情報ＡＲＪを取得する。

　具体的には、領域関係性取得部２４は、接続関係特定部２３により接続関係を有することが特定された各商品領域ＳＡのうち、例えば、商品領域ＳＡＫ及びＳＡＬに対応する領域関係性情報ＡＲＪとして、外観の類似性に係る情報である外観類似性情報ＧＳＪと、相対的なサイズの大小関係に係る情報であるサイズ情報ＳＺＪと、を取得する。

　領域関係性取得部２４は、外観類似性情報ＧＳＪとして、例えば、商品領域ＳＡＫに含まれる商品Ｋの色及び模様に基づいて算出した特徴ベクトルＳＡＫＶと、商品領域ＳＡＬに含まれる商品Ｌの色及び模様に基づいて算出した特徴ベクトルＳＡＬＶと、の類似度を示す値である外観類似度ＧＳＤを取得する。なお、本実施形態においては、外観類似度ＧＳＤが、例えば、０以上かつ１以下の範囲の値をとるコサイン類似度として取得される。そのため、外観類似度ＧＳＤは、例えば、特徴ベクトルＳＡＫＶ及びＳＡＬＶが近い場合、すなわち、商品領域ＳＡＫ及びＳＡＬが互いに類似している場合には、相対的に大きな値として取得される。また、外観類似度ＧＳＤは、例えば、特徴ベクトルＳＡＫＶ及びＳＡＬＶが遠い場合、すなわち、商品領域ＳＡＫ及びＳＡＬが互いに類似していない場合には、相対的に小さな値として取得される。

　領域関係性取得部２４は、サイズ情報ＳＺＪとして、例えば、商品領域ＳＡＫの鉛直方向の高さＨＫと、商品領域ＳＡＬの鉛直方向の高さＨＬと、を比較することにより得られた比較結果に係る情報を取得する。具体的には、領域関係性取得部２４は、サイズ情報ＳＺＪとして、例えば、高さＨＫが高さＨＬより大きいこと（ＨＫ＞ＨＬ）、高さＨＫと高さＨＬとが一致すること（ＨＫ＝ＨＬ）、または、高さＨＫが高さＨＬより小さいこと（ＨＫ＜ＨＬ）のいずれかを示す情報を取得する。なお、本実施形態によれば、領域関係性取得部２４は、例えば、商品Ｋ及びＬが商品棚ＰＳの同一の棚板上に配置されており、かつ、当該商品Ｋ及びＬのうちの少なくとも一方の下部が広告及び値札等の遮蔽物により隠されている場合に、商品領域ＳＡＫの鉛直方向の最上部の座標値と、商品領域ＳＡＬの鉛直方向の最上部の座標値と、を比較した結果に係る情報をサイズ情報ＳＺＪとして取得するようにしてもよい。

　クラス関係性取得部２５は、属性情報格納部２５ａに格納されている属性情報ＡＴＪに基づき、物体認識部２２において認識結果を得るために予め設定されているクラスＡ～Ｄの関係性を示すクラス関係性情報ＣＲＪを取得するための処理を行う。

　属性情報ＡＴＪは、クラスＡ～Ｄの４つのクラスが物体認識部２２において設定されている場合には、例えば、図７に示すような情報として作成されていればよい。図７は、クラス関係性情報を取得する際に用いられる属性情報の例を説明するための図である。

　属性情報ＡＴＪの「商品名」によれば、クラスＡに属する商品の名称が「ＰＮＡ」であること、クラスＢに属する商品の名称が「ＰＮＢ」であること、クラスＣに属する商品の名称が「ＰＮＣ」であること、及び、クラスＤに属する商品の名称が「ＰＮＤ」であることが示されている。また、属性情報ＡＴＪの「高さ」によれば、クラスＡに属する商品の高さが「１５ｃｍ」であること、クラスＢに属する商品の高さが「１５ｃｍ」であること、クラスＣに属する商品の高さが「１８ｃｍ」であること、及び、クラスＤに属する商品の高さが「８ｃｍ」であることが示されている。

　クラス関係性取得部２５は、図７の属性情報ＡＴＪが属性情報格納部２５ａに格納されている場合には、クラス関係性情報ＣＲＪとして、例えば、図８に示すような商品名関係性情報ＮＲＪと、図９に示すような高さ関係性情報ＨＲＪと、を取得するための処理を行う。図８及び図９は、クラス関係性情報として含まれ得る情報の例を説明するための図である。

　図８の商品名関係性情報ＮＲＪは、クラスＡ～Ｄの４つのクラスのうちの一のクラスに実際に属すると仮定した場合の商品の名称と、物体認識部２２により認識された商品の名称と、が一致しているか否かを示す情報に相当する。具体的には、図８の商品名関係性情報ＮＲＪによれば、例えば、実際にクラスＡに属すると仮定した商品の名称について、物体認識部２２がクラスＡであると認識した商品の名称と一致すること、並びに、物体認識部２２がクラスＢ、クラスＣ及びクラスＤのうちのいずれかであると認識した商品の名称とは一致しないことが示されている。

　なお、本実施形態によれば、クラス関係性取得部２５は、商品名関係性情報ＮＲＪとして、例えば、図８に示した情報の代わりに、クラスＡ～Ｄに属する商品の画像に基づいて算出したクラス間類似度ＣＳＤの値を取得するものであってもよい。クラス間類似度ＣＳＤの詳細については、後程説明する。

　図９の高さ関係性情報ＨＲＪは、クラスＡ～Ｄの４つのクラスのうちの一のクラスに実際に属すると仮定した場合の商品の高さと、物体認識部２２により認識された商品の高さと、がどのような関係を有しているかを示す情報に相当する。具体的には、図９の高さ関係性情報ＨＲＪによれば、例えば、実際にクラスＡに属すると仮定した商品の高さについて、物体認識部２２がクラスＡ及びクラスＢのうちのいずれかであると認識した商品の高さと同じであること、物体認識部２２がクラスＣであると認識した商品の高さより小さいこと、並びに、物体認識部２２がクラスＤであると認識した商品の高さより大きいことが示されている。

　認識結果補正部２６は、接続関係特定部２３により得られた複数の商品領域ＳＡの接続関係と、領域関係性取得部２４により得られた領域関係性情報ＡＲＪと、クラス関係性取得部２５により得られたクラス関係性情報ＣＲＪと、に基づいて認識結果補正処理を行うことにより、物体認識部２２により得られた認識結果を補正する。

　ここで、認識結果補正処理の具体例について説明する。なお、以下においては、接続関係特定部２３により接続関係を有することが特定された商品領域ＳＡＫ及びＳＡＬについて、当該商品領域ＳＡＫに含まれる商品Ｋの認識結果を基準として、当該商品領域ＳＡＬに含まれる商品Ｌの認識結果を補正する場合について説明する。また、以下においては、物体認識部２２が商品領域ＳＡＬに含まれる商品Ｌを認識した認識結果として、当該商品ＬをクラスＡ～Ｄに分類した場合の蓋然性を示す認識スコアＲＬＡ、ＲＬＢ、ＲＬＣ及びＲＬＤが取得されたものとして説明を行う。また、以下においては、外観類似性情報ＧＳＪ及びサイズ情報ＳＺＪを含む領域関係性情報ＡＲＪが取得されたものとして説明を行う。また、以下においては、図８に例示した商品名関係性情報ＮＲＪと、図９に例示した高さ関係性情報ＨＲＪと、を含むクラス関係性情報ＣＲＪが取得されたものとして説明を行う。

　まず、領域関係性情報ＡＲＪに含まれる外観類似性情報ＧＳＪと、クラス関係性情報ＣＲＪに含まれる商品名関係性情報ＮＲＪと、に基づいて補正値を取得する処理について説明する。なお、以降においては、このような処理により取得される補正値を包括して補正値ＨＶＡと称するものとする。

　認識結果補正部２６は、外観類似性情報ＧＳＪ及び商品名関係性情報ＮＲＪに基づき、例えば、商品Ｋが実際にクラスＡに属すると仮定した場合において、認識スコアＲＬＡ、ＲＬＢ、ＲＬＣ及びＲＬＤを補正するための補正値ＨＶＡを取得する。

　具体的には、認識結果補正部２６は、例えば、外観類似性情報ＧＳＪに含まれる外観類似度ＧＳＤが大きな値（１または１に近い値）である場合には、商品名関係性情報ＮＲＪに基づき、商品ＬがクラスＡに属する蓋然性が高く、かつ、当該商品ＬがクラスＢ～Ｄのいずれかに属する蓋然性が低いと判定する。そして、このような判定を行った場合には、認識結果補正部２６は、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＡに属する場合の補正値ＨＶＡとして０を取得する。また、前述のような判定を行った場合には、認識結果補正部２６は、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＢ～Ｄのいずれかに属する場合の補正値ＨＶＡとして、外観類似度ＧＳＤを負の値に変換した値（－ＧＳＤ）を取得する。

　また、認識結果補正部２６は、例えば、外観類似性情報ＧＳＪに含まれる外観類似度ＧＳＤが小さな値（０または０に近い値）である場合には、商品名関係性情報ＮＲＪに基づき、商品ＬがクラスＡに属する蓋然性が低く、かつ、当該商品ＬがクラスＢ～Ｄのいずれかに属する蓋然性が高いと判定する。そして、このような判定を行った場合には、認識結果補正部２６は、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＡに属する場合の補正値ＨＶＡとして、外観類似度ＧＳＤを負の値に変換した値（－ＧＳＤ）を取得する。また、前述のような判定を行った場合には、認識結果補正部２６は、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＢ～Ｄのいずれかに属する場合の補正値ＨＶＡとして０を取得する。

　認識結果補正部２６は、以上に述べた処理と同様の処理を行うことにより、商品Ｋが実際にクラスＢに属すると仮定した場合、当該商品Ｋが実際にクラスＣに属すると仮定した場合、及び、当該商品Ｋが実際にクラスＤに属すると仮定した場合の各々について、認識スコアＲＬＡ、ＲＬＢ、ＲＬＣ及びＲＬＤを補正するための補正値ＨＶＡを取得する。

　すなわち、以上に述べた処理によれば、認識結果補正部２６は、外観類似性情報ＧＳＪ及び商品名関係性情報ＮＲＪに基づき、物体認識部２２の物体認識処理により得られた認識スコアを補正するための補正値ＨＶＡを取得する。また、以上に述べたような処理によれば、外観類似度ＧＳＤの値の大きさと、商品名関係性情報ＮＲＪにより示されるクラスＡ～Ｄの関係と、の間に矛盾がない場合には、補正値ＨＶＡとして０が取得される。また、以上に述べたような処理によれば、外観類似度ＧＳＤの値の大きさと、商品名関係性情報ＮＲＪにより示されるクラスＡ～Ｄの関係と、の間に矛盾がある場合には、補正値ＨＶＡとして－ＧＳＤが取得される。

　なお、本実施形態によれば、認識結果補正部２６は、例えば、商品名関係性情報ＮＲＪ等により示されるクラスＡ～Ｄの関係に基づいて得られるクラス間類似度ＣＳＤの値と、外観類似度ＧＳＤの値と、の差に応じた０以下の値が算出される関数を用いて補正値ＨＶＡを取得するようにしてもよい。クラス間類似度ＣＳＤは、例えば、商品Ｋ及びＬの商品名が一致する場合に１となり、かつ、当該商品Ｋ及びＬの商品名が一致しない場合に０となるように設定されていればよい。または、クラス間類似度ＣＳＤは、例えば、実際にクラスＡに属する商品の画像から算出した特徴ベクトルと、実際にクラスＢに属する商品の画像から算出した特徴ベクトルと、実際にクラスＣに属する商品の画像から算出した特徴ベクトルと、実際にクラスＤに属する商品の画像から算出した特徴ベクトルと、のうちの２つの特徴ベクトルにおける類似度を示す０以上かつ１以下の値として設定されていればよい。また、前述の関数は、例えば、ニューラルネットワークを有して構成されているとともに、商品領域ＳＡＫ及びＳＡＬの商品名の比較結果と、商品名関係性情報ＮＲＪにより示されるクラスＡ～Ｄの関係と、の入力に応じた補正値ＨＶＡを出力するように予め学習された機械学習モデルを用いて実現されるものであってもよい。そして、以上に述べた構成によれば、例えば、ＣＳＤ＝０．７かつＧＳＤ＝０．７の場合の補正値ＨＶＡとして０を取得することができる。また、以上に述べた構成によれば、例えば、ＣＳＤ＝０．７かつＧＳＤ＝０．８の場合の補正値ＨＶＡとして－０．１を取得することができる。また、以上に述べた構成によれば、例えば、ＣＳＤ＝０．７かつＧＳＤ＝０．４の場合の補正値ＨＶＡとして－０．３を取得することができる。

　次に、領域関係性情報ＡＲＪに含まれるサイズ情報ＳＺＪと、クラス関係性情報ＣＲＪに含まれる高さ関係性情報ＨＲＪと、に基づいて補正値を取得する処理について説明する。なお、以降においては、このような処理により取得される補正値を包括して補正値ＨＶＢと称するものとする。

　認識結果補正部２６は、サイズ情報ＳＺＪ及び高さ関係性情報ＨＲＪに基づき、例えば、商品Ｋが実際にクラスＡに属すると仮定した場合において、認識スコアＲＬＡ、ＲＬＢ、ＲＬＣ及びＲＬＤを補正するための補正値ＨＶＢを取得する。

　具体的には、認識結果補正部２６は、例えば、ＨＫ＝ＨＬであることを示す情報がサイズ情報ＳＺＪに含まれている場合には、高さ関係性情報ＨＲＪに基づき、商品ＬがクラスＡまたはＢのいずれかに属する蓋然性が高く、かつ、当該商品ＬがクラスＣまたはＤのいずれかに属する蓋然性が低いと判定する。そして、このような判定を行った場合には、認識結果補正部２６は、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＡまたはＢのいずれかに属する場合の補正値ＨＶＢとして０を取得する。また、前述のような判定を行った場合には、認識結果補正部２６は、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＣまたはＤのいずれかに属する場合の補正値ＨＶＢとして－１を取得する。

　また、認識結果補正部２６は、例えば、ＨＫ＞ＨＬであることを示す情報がサイズ情報ＳＺＪに含まれている場合には、高さ関係性情報ＨＲＪに基づき、商品ＬがクラスＤに属する蓋然性が高く、かつ、当該商品ＬがクラスＡ、ＢまたはＣのいずれかに属する蓋然性が低いと判定する。そして、このような判定を行った場合には、認識結果補正部２６は、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＤに属する場合の補正値ＨＶＢとして０を取得する。また、前述のような判定を行った場合には、認識結果補正部２６は、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＡ～Ｃのいずれかに属する場合の補正値ＨＶＢとして－１を取得する。

　また、認識結果補正部２６は、例えば、ＨＫ＜ＨＬであることを示す情報がサイズ情報ＳＺＪに含まれている場合には、高さ関係性情報ＨＲＪに基づき、商品ＬがクラスＣに属する蓋然性が高く、かつ、当該商品ＬがクラスＡ、ＢまたはＤのいずれかに属する蓋然性が低いと判定する。そして、このような判定を行った場合には、認識結果補正部２６は、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＣに属する場合の補正値ＨＶＢとして０を取得する。また、前述のような判定を行った場合には、認識結果補正部２６は、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＡ、ＢまたはＤのいずれかに属する場合の補正値ＨＶＢとして－１を取得する。

　認識結果補正部２６は、以上に述べた処理と同様の処理を行うことにより、商品Ｋが実際にクラスＢに属すると仮定した場合、当該商品Ｋが実際にクラスＣに属すると仮定した場合、及び、当該商品Ｋが実際にクラスＤに属すると仮定した場合の各々について、認識スコアＲＬＡ、ＲＬＢ、ＲＬＣ及びＲＬＤを補正するための補正値ＨＶＢを取得する。

　すなわち、以上に述べた処理によれば、認識結果補正部２６は、サイズ情報ＳＺＪ及び高さ関係性情報ＨＲＪに基づき、物体認識部２２の物体認識処理により得られた認識スコアを補正するための補正値ＨＶＢを取得する。また、以上に述べたような処理によれば、サイズ情報ＳＺＪに含まれている高さＨＫ及びＨＬの比較結果と、高さ関係性情報ＨＲＪにより示されるクラスＡ～Ｄの関係と、の間に矛盾がない場合には、補正値ＨＶＢとして０が取得される。また、以上に述べたような処理によれば、サイズ情報ＳＺＪに含まれている高さＨＫ及びＨＬの比較結果と、高さ関係性情報ＨＲＪにより示されるクラスＡ～Ｄの関係と、の間に矛盾がある場合には、補正値ＨＶＢとして－１が取得される。

　なお、本実施形態によれば、認識結果補正部２６は、例えば、前述の矛盾がない場合に０以上の値が算出され、かつ、前述の矛盾がある場合に負の値が算出されるような関数を用いて補正値ＨＶＢを取得するようにしてもよい。また、前述の関数は、例えば、ニューラルネットワークを有して構成されているとともに、商品領域ＳＡＫ及びＳＡＬのサイズの比較結果と、高さ関係性情報ＨＲＪにより示されるクラスＡ～Ｄの関係と、の入力に応じた補正値ＨＶＢを出力するように予め学習された機械学習モデルを用いて実現されるものであってもよい。

　認識結果補正部２６は、補正値ＨＶＡ及び補正値ＨＶＢを用いた認識結果補正処理を行うことにより、物体認識部２２により得られた認識結果を補正する。

　具体的には、認識結果補正部２６は、認識結果補正処理として、例えば、認識スコアＲＬＡ、ＲＬＢ、ＲＬＣ及びＲＬＤの各々に対し、補正値ＨＶＡ及び補正値ＨＶＢを加算する処理を行う。そして、このような処理によれば、ＲＬＡ＋ＨＶＡ＋ＨＶＢに相当する補正済認識スコアＡＲＬＡと、ＲＬＢ＋ＨＶＡ＋ＨＶＢに相当する補正済認識スコアＡＲＬＢと、ＲＬＣ＋ＨＶＡ＋ＨＶＢに相当する補正済認識スコアＡＲＬＣと、ＲＬＤ＋ＨＶＡ＋ＨＶＢに相当する補正済認識スコアＡＲＬＤと、が取得される。また、補正済認識スコアＡＲＬＡ～ＡＲＬＤは、商品Ｋが属すると仮定したクラス毎に取得される。すなわち、認識結果補正部２６は、商品Ｋが属すると仮定したクラスＡ～Ｄの各々について、補正済認識スコアＡＲＬＡ～ＡＲＬＤを取得する。

　評価部２７は、認識結果補正部２６により得られた複数の補正後の認識結果を用い、物体認識部２２により得られた認識結果を評価する処理を行うことにより、複数の商品領域ＳＡに含まれる商品各々が属するクラスに係る最終的な認識結果を取得する。

　ここで、物体認識部２２により得られた認識結果の評価に係る処理の具体例について説明する。なお、以下においては、物体認識部２２が商品領域ＳＡＫに含まれる商品Ｋを認識した認識結果として、当該商品ＫをクラスＡ～Ｄに分類した場合の蓋然性を示す認識スコアＲＫＡ、ＲＫＢ、ＲＫＣ及びＲＫＤが取得されたものとして説明を行う。また、以下においては、認識スコアＲＫＡ～ＲＫＤと、補正済認識スコアＡＲＬＡ～ＡＲＬＤと、を用いて処理を行う場合について主に説明する。

　評価部２７は、例えば、商品Ｋが実際にクラスＡに属すると仮定した場合に得られた補正済認識スコアＡＲＬＡ～ＡＲＬＤの各々に対して認識スコアＲＫＡを加算する処理を行う。そして、このような処理によれば、ＲＫＡ＋ＡＲＬＡに相当する評価値ＥＶＡＡと、ＲＫＡ＋ＡＲＬＢに相当する評価値ＥＶＡＢと、ＲＫＡ＋ＡＲＬＣに相当する評価値ＥＶＡＣと、ＲＫＡ＋ＡＲＬＤに相当する評価値ＥＶＡＤと、が取得される。

　また、評価部２７は、例えば、商品Ｋが実際にクラスＢに属すると仮定した場合に得られた補正済認識スコアＡＲＬＡ～ＡＲＬＤの各々に対して認識スコアＲＫＢを加算する処理を行う。そして、このような処理によれば、ＲＫＢ＋ＡＲＬＡに相当する評価値ＥＶＢＡと、ＲＫＢ＋ＡＲＬＢに相当する評価値ＥＶＢＢと、ＲＫＢ＋ＡＲＬＣに相当する評価値ＥＶＢＣと、ＲＫＢ＋ＡＲＬＤに相当する評価値ＥＶＢＤと、が取得される。

　また、評価部２７は、例えば、商品Ｋが実際にクラスＣに属すると仮定した場合に得られた補正済認識スコアＡＲＬＡ～ＡＲＬＤの各々に対して認識スコアＲＫＣを加算する処理を行う。そして、このような処理によれば、ＲＫＣ＋ＡＲＬＡに相当する評価値ＥＶＣＡと、ＲＫＣ＋ＡＲＬＢに相当する評価値ＥＶＣＢと、ＲＫＣ＋ＡＲＬＣに相当する評価値ＥＶＣＣと、ＲＫＣ＋ＡＲＬＤに相当する評価値ＥＶＣＤと、が取得される。

　また、評価部２７は、例えば、商品Ｋが実際にクラスＤに属すると仮定した場合に得られた補正済認識スコアＡＲＬＡ～ＡＲＬＤの各々に対して認識スコアＲＫＤを加算する処理を行う。そして、このような処理によれば、ＲＫＤ＋ＡＲＬＡに相当する評価値ＥＶＤＡと、ＲＫＤ＋ＡＲＬＢに相当する評価値ＥＶＤＢと、ＲＫＤ＋ＡＲＬＣに相当する評価値ＥＶＤＣと、ＲＫＤ＋ＡＲＬＤに相当する評価値ＥＶＤＤと、が取得される。

　評価部２７は、以上に述べた処理により取得した評価値ＥＶＡＡ～ＥＶＡＤ、評価値ＥＶＢＡ～ＥＶＢＤ、評価値ＥＶＣＡ～ＥＶＣＤ、及び、評価値ＥＶＤＡ～ＥＶＤＤの１６個の評価値を比較することにより、最も大きな値を有する評価値ＥＶＭを特定する。そして、評価部２７は、評価値ＥＶＭに対応する商品Ｋ及びＬのクラスを示す情報を最終的な認識結果として取得する。具体的には、例えば、ＥＶＭ＝ＥＶＡＢである場合には、商品ＫがクラスＡに属し、かつ、商品ＬがクラスＢに属することを示す情報を最終的な認識結果として取得する。

　一方、本実施形態においては、評価部２７は、例えば、商品棚ＰＳの上にＮ（Ｎ≧２）個の商品が横一列に並んで配置されている場合、すなわち、Ｎ個の商品領域が左右方向に接続関係を有する場合においては、下記数式（１）及び（２）による動的計画法を用いた処理を行うことにより、下記数式（１）の評価値ＥＶを最大化する当該Ｎ個の商品各々のクラスを示す情報を最終的な認識結果として取得する。

　なお、上記数式（１）において、ｘ_１は商品棚ＰＳの左から１番目の商品が実際に属すると仮定したクラスを示し、ｓ_１（ｘ_１）は当該ｘ_１のクラスに対応する認識スコアを示している。また、上記数式（１）及び（２）において、ｓ~_ｊ（ｘ_ｊ－１，ｘ_ｊ）は、商品棚ＰＳの左からｊ－１（２≦ｊ≦Ｎ）番目の商品が実際に属すると推定されたクラスと、当該商品棚ＰＳの左からｊ番目の商品が属すると認識されたクラスと、の組み合わせにおける補正後の認識スコアを示している。また、上記数式（２）において、ｘ_ｊは商品棚ＰＳの左からｊ（２≦ｊ≦Ｎ）番目の商品が属すると推定されたクラスを示し、ｓ_ｊ（ｘ_ｊ）は当該ｘ_ｊのクラスに対応する認識スコアを示している。また、上記数式（２）において、ｈ_ｓｉｚｅ（ｘ_ｊ－１，ｘ_ｊ）は、商品棚の左からｊ－１番目及びｊ番目の商品に対して前述の手法を適用することにより算出した補正値ＨＶＢに相当する。また、上記数式（２）において、ｈ_ｓｉｍ（ｘ_ｊ－１，ｘ_ｊ）は、商品棚の左からｊ－１番目及びｊ番目の商品に対して前述の手法を適用することにより算出した補正値ＨＶＡに相当する。

　ここで、上記数式（１）及び（２）による動的計画法を用いた処理の概要について説明する。

　まず、評価部２７は、商品棚ＰＳの左から１番目の商品ＳＨ１、及び、当該商品棚ＰＳの左から２番目の商品ＳＨ２について、上記数式（１）及び（２）による処理を行うことにより、前述の評価値ＥＶＡＡ~ＥＶＤＤと同様の１６個の評価値ＥＶを取得するとともに、当該１６個の評価値ＥＶの中から最も大きな値を有する評価値ＥＶＭを特定する。そして、評価部２７は、例えば、ＥＶＭ＝ＥＶＡＢである場合には、商品ＳＨ１がクラスＡに属し、かつ、商品ＳＨ２がクラスＢに属するとの推定結果を取得する。

　次に、評価部２７は、商品ＳＨ２、及び、商品棚ＰＳの左から３番目の商品ＳＨ３について、上記数式（１）及び（２）による処理を行う。評価部２７は、上記数式（１）及び（２）による処理を行うに際し、例えば、商品ＳＨ２がクラスＢに属するとの推定結果を予め取得している場合には、前述の評価値ＥＶＢＡ～ＥＶＢＤと同様の４個の評価値ＥＶを取得するとともに、当該４個の評価値ＥＶの中から最も大きな値を有する評価値ＥＶＭを特定する。そして、評価部２７は、例えば、ＥＶＭ＝ＥＶＢＤである場合には、商品ＳＨ３がクラスＤに属するとの推定結果を取得する。

　その後、評価部２７は、上記数式（１）及び（２）による処理を商品棚ＰＳの左の商品から右の商品にかけて順次行うことにより、商品棚ＰＳに配置されたＮ個の商品各々が属するクラスに係る推定結果を取得する。

　すなわち、以上に述べた処理によれば、評価部２７は、上記数式（１）の評価値ＥＶが最大値になるように取得された、商品棚ＰＳに配置されたＮ個の商品各々が属するクラスに係る推定結果を、最終的な認識結果として取得する。

　なお、本実施形態においては、商品棚ＰＳに配置されたＮ個の商品各々が属するクラスについて、評価部２７により得られた最終的な認識結果に応じたクラスが表示されるものに限らず、例えば、物体認識部２２により得られた補正前の認識結果に応じたクラスが併せて表示されるようにしてもよい。

　また、本実施形態においては、商品棚ＰＳに配置されたＮ個の商品各々が属するクラスについて、例えば、ユーザの主観に基づいて、または、文字認識等の処理を行って得られた処理結果に基づいて最終的な認識結果を修正可能とするための表示画面が表示されるようにしてもよい。さらに、本実施形態においては、最終的な認識結果が修正された場合に、例えば、修正後の認識結果のうちの修正対象となった各商品のクラスを固定した状態で、認識結果補正部２６及び評価部２７の処理が再度行われるようにしてもよい。

　また、本実施形態においては、ユーザの主観に基づいて最終的な認識結果が修正された場合に、例えば、文字認識等の処理により修正後の認識結果をさらに修正した再修正後の認識結果が表示されるようにしてもよい。さらに、本実施形態においては、再修正後の認識結果の是非をユーザに決定させることが可能なダイアログ等が表示されるようにしてもよい。

　［処理フロー］
　続いて、物体認識装置において行われる処理の流れについて説明する。図１０は、第１実施形態に係る物体認識装置において行われる処理を説明するためのフローチャートである。

　まず、画像取得部２１は、複数の商品が陳列された商品棚を撮影して画像を取得する（ステップＳ１１）。

　次に、物体認識部２２は、ステップＳ１１により得られた画像に対して物体認識処理を行うことにより、当該画像に含まれる複数の商品各々に対応する認識結果を取得する（ステップＳ１２）。具体的には、前述の認識結果には、例えば、複数の商品領域と、当該複数の商品領域に含まれる商品を予め設定された複数のクラスのうちのいずれかに分類した場合におけるクラス毎の蓋然性を示す値である認識スコアと、が含まれている。

　続いて、接続関係特定部２３は、ステップＳ１２により得られた認識結果における複数の商品領域の接続関係の有無を特定するための処理を行う（ステップＳ１３）。

　続いて、領域関係性取得部２４は、ステップＳ１１により得られた画像に基づき、ステップＳ１３により接続関係を有することが特定された各商品領域のうち、互いに隣接する２つの商品領域の関係性に係る領域関係性情報を取得する（ステップＳ１４）。

　続いて、クラス関係性取得部２５は、属性情報格納部２５ａに格納されている属性情報に基づき、ステップＳ１２の物体認識処理により認識結果を得るために予め設定されている複数のクラスの関係性を示すクラス関係性情報を取得するための処理を行う（ステップＳ１５）。

　続いて、認識結果補正部２６は、ステップＳ１３により特定された複数の商品領域の接続関係と、ステップＳ１４により得られた領域関係性情報と、ステップＳ１５により得られたクラス関係性情報と、に基づいて認識結果補正処理を行うことにより、ステップＳ１２により得られた認識結果に含まれる認識スコアを補正する（ステップＳ１６）。このような処理によれば、認識結果補正部２６は、物体認識部２２により認識されるクラスの数と、接続関係特定部２３により接続関係を有することが特定された商品領域ＳＡの数と、に応じた複数の補正後の認識結果を取得する。

　続いて、評価部２７は、ステップＳ１６により得られた複数の補正後の認識結果を用い、ステップＳ１２により得られた認識結果を評価する処理を行うことにより、複数の商品領域に含まれる商品各々が属するクラスに係る最終的な認識結果を取得する（ステップＳ１７）。

　最後に、出力部２８は、ステップＳ１７により得られた最終的な認識結果を表示装置及び外部装置等へ出力する（ステップＳ１８）。

　以上に述べたように、本実施形態によれば、複数の物体を含む画像に対して物体認識処理を施すことにより当該複数の物体の認識結果を取得し、当該物体認識処理により得られた認識結果を領域関係性情報及びクラス関係性情報に基づいて補正することにより複数の補正後の認識結果を取得し、当該複数の補正後の認識結果を用いて当該物体認識処理により得られた認識結果を評価することにより最終的な（最適化された）認識結果を得ることができる。そのため、本実施形態によれば、画像に含まれる複数の物体における個々の物体の認識精度を向上させることができる。

　［変形例］

　以下、上記の実施形態に対する変形例を説明する。なお、以降においては、簡単のため、既述の処理等を適用可能な部分に関する具体的な説明を適宜省略するものとする。

　（変形例１）
　接続関係特定部２３は、例えば、商品領域ＳＡＫの上側または下側に隣接する位置に矩形領域ＳＡＫＡを設定した状態において、既述の処理と同様の処理を行うことにより、商品棚ＰＳの棚板を挟んで配置されている商品領域ＳＡＫと商品領域ＳＡＬとが、当該商品棚ＰＳの上下方向に接続関係を有するか否かを特定するようにしてもよい。

　（変形例２）
　認識結果補正部２６は、例えば、Ｇｒａｐｈ　ｃｏｎｖｏｌｕｔｉｏｎａｌ　ｎｅｕｒａｌ　ｎｅｔｗｏｒｋを有する学習済の機械学習モデルとして構成されているとともに、当該機械学習モデルに入力されたグラフデータに応じた補正値を出力するように構成されていてもよい。また、前述のグラフデータは、例えば、画像ＩＭＴに含まれる複数の商品各々に対応する複数のノード間がエッジで接続されているとともに、当該複数の商品各々に対応する複数の商品領域の関係性を示す外観類似性情報ＧＳＪ及びサイズ情報ＳＺＪ等の情報がエッジ特徴量として埋め込まれたデータとして構成されていればよい。

　（変形例３）
　評価部２７は、例えば、商品棚ＰＳの上にＮ個の商品が横一列に並んで配置されている場合、すなわち、Ｎ個の商品領域が左右方向に接続関係を有する場合において、下記数式（３）及び（４）による動的計画法を用いた処理を行うことにより、下記数式（１）のコスト値ＣＶを最小化する当該Ｎ個の商品各々のクラスを示す情報を最終的な認識結果として取得するようにしてもよい。

　なお、上記数式（３）において、ｘ_１は商品棚ＰＳの左から１番目の商品が実際に属すると仮定したクラスを示し、ｒ_１（ｘ_１）は１．０から当該ｘ_１のクラスに対応する認識スコアを減じて得られる値を示している。また、上記数式（３）及び（４）において、ｈ~_ｋ（ｘ_ｋ－１，ｘ_ｋ）は、商品棚ＰＳの左からｋ－１（２≦ｋ≦Ｎ）番目の商品が実際に属すると推定されたクラスと、当該商品棚ＰＳの左からｋ番目の商品が属すると認識されたクラスと、の組み合わせにおける補正後の認識スコアを示している。また、上記数式（４）において、ｘ_ｋは商品棚ＰＳの左からｋ番目の商品が属すると推定されたクラスを示し、ｒ_ｋ（ｘ_ｋ）は１．０から当該ｘ_ｋのクラスに対応する認識スコアを減じて得られる値を示している。また、上記数式（４）において、Ｍ_ｓｉｚｅ（ｘ_ｋ－１，ｘ_ｋ）は、商品棚ＰＳの左からｋ－１番目及びｋ番目の商品について、高さ（サイズ）が一致している場合には０となり、かつ、高さ（サイズ）が一致していない場合には１となるような補正値を示している。また、上記数式（４）において、Ｍ_ｓｉｍ（ｘ_ｋ－１，ｘ_ｋ）は、商品棚ＰＳの左からｋ－１番目及びｋ番目の商品について、互いに同じクラスに属する場合には０となり、かつ、互いに異なるクラスに属する場合には下記数式（５）に応じた値となるような補正値を示している。

　なお、上記数式（５）において、（φ_ｋ－１，φ_ｋ）は、商品棚ＰＳの左からｋ－１番目の商品に対応する商品領域の特徴ベクトルと、当該商品棚ＰＳの左からｋ番目の商品に対応する商品領域の特徴ベクトルと、がなす角度を示している。

　＜第２実施形態＞
　図１１は、第２の実施形態に係る物体認識装置の機能構成を示すブロック図である。

　本実施形態に係る物体認識装置１００Ａは、物体認識装置１００と同様のハードウェア構成を有している。また、物体認識装置１００Ａは、画像取得手段４１と、物体認識手段４２と、接続関係特定手段４３と、領域関係性取得手段４４と、クラス関係性取得手段４５と、認識結果補正手段４６と、評価手段４７と、を有している。

　図１２は、第２の実施形態に係る物体認識装置において行われる処理を説明するためのフローチャートである。

　画像取得手段４１は、複数の物体を含む画像を取得する（ステップＳ４１）。

　物体認識手段４２は、画像に対して物体認識処理を行うことにより、当該画像に含まれる複数の物体各々に対応する認識結果を取得する（ステップＳ４２）。

　接続関係特定手段４３は、物体認識処理により得られた認識結果に基づき、複数の物体各々に対応する複数の物体領域の接続関係の有無を特定するための処理を行う（ステップＳ４３）。

　領域関係性取得手段４４は、接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得する（ステップＳ４４）。

　クラス関係性取得手段４５は、物体認識処理により認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得する（ステップＳ４５）。

　認識結果補正手段４６は、領域関係性情報及びクラス関係性情報に基づいて物体認識処理により得られた認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得する（ステップＳ４６）。

　評価手段４７は、複数の補正後の認識結果を用いて物体認識処理により得られた認識結果を評価することにより、複数の物体各々が属するクラスに係る最終的な認識結果を取得する（ステップＳ４７）。

　本実施形態によれば、画像に含まれる複数の物体における個々の物体の認識精度を向上させることができる。

　上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

　（付記１）
　複数の物体を含む画像を取得する画像取得手段と、
　前記画像に対して物体認識処理を行うことにより、前記画像に含まれる前記複数の物体各々に対応する認識結果を取得する物体認識手段と、
　前記物体認識処理により得られた前記認識結果に基づき、前記複数の物体各々に対応する複数の物体領域の接続関係の有無を特定するための処理を行う接続関係特定手段と、
　前記接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得する領域関係性取得手段と、
　前記物体認識処理により前記認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得するクラス関係性取得手段と、
　前記領域関係性情報及び前記クラス関係性情報に基づいて前記物体認識処理により得られた前記認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得する認識結果補正手段と、
　前記複数の補正後の認識結果を用いて前記物体認識処理により得られた前記認識結果を評価することにより、前記複数の物体各々が属するクラスに係る最終的な認識結果を取得する評価手段と、
　を備えた物体認識装置。

　（付記２）
　前記物体認識手段は、前記画像に対して前記物体認識処理を行うことにより、前記認識結果として、前記複数の物体各々を前記複数のクラスのうちのいずれかに分類した場合におけるクラス毎の蓋然性を示す値である認識スコアを取得する付記１の物体認識装置。

　（付記３）
　前記領域関係性取得手段は、前記接続関係を有する２つの物体領域に対応する前記領域関係性情報として、当該２つの物体領域に含まれる物体同士の外観の類似性に係る情報である外観類似性情報を取得する付記２の物体認識装置。

　（付記４）
　前記クラス関係性取得手段は、前記クラス関係性情報として、前記複数のクラスのうちの一のクラスに実際に属すると仮定した場合の物体の名称と、前記物体認識処理により認識された物体の名称と、が一致しているか否かを示す情報である物体名関係性情報を取得する付記３の物体認識装置。

　（付記５）
　前記認識結果補正手段は、前記外観類似性情報及び前記物体名関係性情報に基づき、前記物体認識処理により得られた前記認識スコアを補正するための補正値を取得する付記４の物体認識装置。

　（付記６）
　前記領域関係性取得手段は、前記接続関係を有する２つの物体領域に対応する前記領域関係性情報として、当該２つの物体領域に含まれる物体同士の相対的なサイズの大小関係に係る情報であるサイズ情報を取得する付記２の物体認識装置。

　（付記７）
　前記クラス関係性取得手段は、前記クラス関係性情報として、前記複数のクラスのうちの一のクラスに実際に属すると仮定した場合の物体の高さと、前記物体認識処理により認識された物体の高さと、がどのような関係を有しているかを示す情報である高さ関係性情報を取得する付記６の物体認識装置。

　（付記８）
　前記認識結果補正手段は、前記サイズ情報及び前記高さ関係性情報に基づき、前記物体認識処理により得られた前記認識スコアを補正するための補正値を取得する付記７の物体認識装置。

　（付記９）
　複数の物体を含む画像を取得し、
　前記画像に対して物体認識処理を行うことにより、前記画像に含まれる前記複数の物体各々に対応する認識結果を取得し、
　前記物体認識処理により得られた前記認識結果に基づき、前記複数の物体各々に対応する複数の物体領域の接続関係の有無を特定するための処理を行い、
　前記接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得し、
　前記物体認識処理により前記認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得し、
　前記領域関係性情報及び前記クラス関係性情報に基づいて前記物体認識処理により得られた前記認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得し、
　前記複数の補正後の認識結果を用いて前記物体認識処理により得られた前記認識結果を評価することにより、前記複数の物体各々が属するクラスに係る最終的な認識結果を取得する物体認識方法。

　（付記１０）
　複数の物体を含む画像を取得し、
　前記画像に対して物体認識処理を行うことにより、前記画像に含まれる前記複数の物体各々に対応する認識結果を取得し、
　前記物体認識処理により得られた前記認識結果に基づき、前記複数の物体各々に対応する複数の物体領域の接続関係の有無を特定するための処理を行い、
　前記接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得し、
　前記物体認識処理により前記認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得し、
　前記領域関係性情報及び前記クラス関係性情報に基づいて前記物体認識処理により得られた前記認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得し、
　前記複数の補正後の認識結果を用いて前記物体認識処理により得られた前記認識結果を評価することにより、前記複数の物体各々が属するクラスに係る最終的な認識結果を取得する処理をコンピュータに実行させるプログラムを記録した記録媒体。

　以上、実施形態及び実施例を参照して本開示を説明したが、本開示は上記実施形態及び実施例に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。

　２１　画像取得部
　２２　物体認識部
　２３　接続関係特定部
　２４　領域関係性取得部
　２５　クラス関係性取得部
　２６　認識結果補正部
　２７　評価部
　２８　出力部
　１００　物体認識装置

Claims

　複数の物体を含む画像を取得する画像取得手段と、
　前記画像に対して物体認識処理を行うことにより、前記画像に含まれる前記複数の物体各々に対応する認識結果を取得する物体認識手段と、
　前記物体認識処理により得られた前記認識結果に基づき、前記複数の物体各々に対応する複数の物体領域の接続関係の有無を特定するための処理を行う接続関係特定手段と、
　前記接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得する領域関係性取得手段と、
　前記物体認識処理により前記認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得するクラス関係性取得手段と、
　前記領域関係性情報及び前記クラス関係性情報に基づいて前記物体認識処理により得られた前記認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得する認識結果補正手段と、
　前記複数の補正後の認識結果を用いて前記物体認識処理により得られた前記認識結果を評価することにより、前記複数の物体各々が属するクラスに係る最終的な認識結果を取得する評価手段と、
　を備えた物体認識装置。
　前記物体認識手段は、前記画像に対して前記物体認識処理を行うことにより、前記認識結果として、前記複数の物体各々を前記複数のクラスのうちのいずれかに分類した場合におけるクラス毎の蓋然性を示す値である認識スコアを取得する請求項１に記載の物体認識装置。
　前記領域関係性取得手段は、前記接続関係を有する２つの物体領域に対応する前記領域関係性情報として、当該２つの物体領域に含まれる物体同士の外観の類似性に係る情報である外観類似性情報を取得する請求項２に記載の物体認識装置。
　前記クラス関係性取得手段は、前記クラス関係性情報として、前記複数のクラスのうちの一のクラスに実際に属すると仮定した場合の物体の名称と、前記物体認識処理により認識された物体の名称と、が一致しているか否かを示す情報である物体名関係性情報を取得する請求項３に記載の物体認識装置。
　前記認識結果補正手段は、前記外観類似性情報及び前記物体名関係性情報に基づき、前記物体認識処理により得られた前記認識スコアを補正するための補正値を取得する請求項４に記載の物体認識装置。
　前記領域関係性取得手段は、前記接続関係を有する２つの物体領域に対応する前記領域関係性情報として、当該２つの物体領域に含まれる物体同士の相対的なサイズの大小関係に係る情報であるサイズ情報を取得する請求項２に記載の物体認識装置。
　前記クラス関係性取得手段は、前記クラス関係性情報として、前記複数のクラスのうちの一のクラスに実際に属すると仮定した場合の物体の高さと、前記物体認識処理により認識された物体の高さと、がどのような関係を有しているかを示す情報である高さ関係性情報を取得する請求項６に記載の物体認識装置。
　前記認識結果補正手段は、前記サイズ情報及び前記高さ関係性情報に基づき、前記物体認識処理により得られた前記認識スコアを補正するための補正値を取得する請求項７に記載の物体認識装置。
　複数の物体を含む画像を取得し、
　前記画像に対して物体認識処理を行うことにより、前記画像に含まれる前記複数の物体各々に対応する認識結果を取得し、
　前記物体認識処理により得られた前記認識結果に基づき、前記複数の物体各々に対応する複数の物体領域の接続関係の有無を特定するための処理を行い、
　前記接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得し、
　前記物体認識処理により前記認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得し、
　前記領域関係性情報及び前記クラス関係性情報に基づいて前記物体認識処理により得られた前記認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得し、
　前記複数の補正後の認識結果を用いて前記物体認識処理により得られた前記認識結果を評価することにより、前記複数の物体各々が属するクラスに係る最終的な認識結果を取得する物体認識方法。
　複数の物体を含む画像を取得し、
　前記画像に対して物体認識処理を行うことにより、前記画像に含まれる前記複数の物体各々に対応する認識結果を取得し、
　前記物体認識処理により得られた前記認識結果に基づき、前記複数の物体各々に対応する複数の物体領域の接続関係の有無を特定するための処理を行い、
　前記接続関係を有することが特定された各物体領域の関係性に係る情報である領域関係性情報を取得し、
　前記物体認識処理により前記認識結果を得るために予め設定されている複数のクラスの関係性を示す情報であるクラス関係性情報を取得し、
　前記領域関係性情報及び前記クラス関係性情報に基づいて前記物体認識処理により得られた前記認識結果を補正するための認識結果補正処理を行うことにより、複数の補正後の認識結果を取得し、
　前記複数の補正後の認識結果を用いて前記物体認識処理により得られた前記認識結果を評価することにより、前記複数の物体各々が属するクラスに係る最終的な認識結果を取得する処理をコンピュータに実行させるプログラムを記録した記録媒体。