WO2017073520A1

WO2017073520A1 - 対象認識システム、対象認識方法、プログラム及びコンピュータ記憶媒体

Info

Publication number: WO2017073520A1
Application number: PCT/JP2016/081458
Authority: WO
Inventors: 三郎山内
Original assignee: 三郎山内
Priority date: 2015-10-26
Filing date: 2016-10-24
Publication date: 2017-05-04
Also published as: TW201724022A; JP2019008337A

Abstract

所定領域の対象を認識する対象認識システムであって、前記所定領域を撮像する撮像部と、前記撮像部から前記所定領域までの距離を測定する測距部と、前記測距部で測定された距離に基づいて、前記所定領域のメッシュモデルを生成するモデル生成部と、前記モデル生成部で生成された前記所定領域のメッシュモデルにおいて、前記所定領域の背景のメッシュモデルから突出した前記対象のメッシュモデルを抽出する対象抽出部と、前記対象抽出部で抽出された前記対象のメッシュモデルと、データベースに格納された対象の情報とを照合し、当該対象抽出部で抽出された前記対象を特定する対象特定部と、を有する。

Description

対象認識システム、対象認識方法、プログラム及びコンピュータ記憶媒体

　本発明は、所定領域において物体や人物などの対象を認識する対象認識システム、当該対象認識システムを用いた対象認識方法、プログラム及びコンピュータ記憶媒体に関する。

　画像内の物体や人物などの対象を識別して認識することは、実世界を把握する上で重要な手掛かりになるため、様々なサービス分野でニーズがある。そこで従来より、対象の認識率を向上させるべく、対象を認識するための装置が多数開発されている。

　例えば画像から個々の物体を識別するためには、その前提処理として、背景から物体を抽出する必要がある。従来、例えばカラー画像のＲＧＢ（Ｒ：Ｒｅｄ、Ｇ：Ｇｒｅｅｎ、Ｂ：Ｂｌｕｅ）などのカラーコードを用いて、物体を抽出することが行われていた。しかしながら、実世界のすべての物体を区別し、そのカラーコードの特徴量を明確にすることは困難であり、すなわちカラーコードだけでは、物体を抽出することは困難である。

　そこで、特許文献１に記載された物体識別装置（対象認識装置）では、撮像したカラーデジタル画像をＬａｂ色空間のＬ軸成分により表したＬ画像に変換し、Ｌ画像に基づきＣａｎｎｙエッジ画像を作成して、物体の輪郭抽出を行うことが提案されている。そして、かかる物体識別装置では、物体領域の判別を行って背景領域から切り出してマスク画像を出力し、切り出した物体領域に基づいて、予め登録した特徴量との対比で物体の種類等を識別する。この際、物体領域の判別は、Ｌａｂ色空間における色の距離の大小如何、色の分散の大小如何により行っている。

日本国特開２０１３－１４５４４１号公報

　しかしながら、特許文献１に記載された物体識別装置では、カラーデジタル画像のみから物体の輪郭を抽出しており、色の変化率のみから物体を正確に抽出するのには限界がある。また、当該物体識別装置では、物体の形状や大きさ等も正確に把握することはできない。したがって、物体を識別するには改善の余地がある。

　本発明は、かかる点に鑑みてなされたものであり、所定領域において物体や人物などの対象を認識するにあたり、当該対象の認識率を向上させることを目的とする。

　前記の目的を達成するため、本発明は、所定領域の対象を認識する対象認識システムであって、前記所定領域を撮像する撮像部と、前記撮像部から前記所定領域までの距離を測定する測距部と、前記測距部で測定された距離に基づいて、前記所定領域のメッシュモデルを生成するモデル生成部と、前記モデル生成部で生成された前記所定領域のメッシュモデルにおいて、前記所定領域の背景のメッシュモデルから突出した前記対象のメッシュモデルを抽出する対象抽出部と、前記対象抽出部で抽出された前記対象のメッシュモデルと、データベースに格納された対象の情報とを照合し、当該対象抽出部で抽出された前記対象を特定する対象特定部と、を有することを特徴としている。

　本発明によれば、モデル生成部で生成される所定領域のメッシュモデルは、測距部で測定された撮像部から各メッシュまでの距離情報を含んでおり、すなわち各メッシュの水平方向と高さ方向の情報（三次元情報）を含んでいる。そうすると、対象抽出部において、所定領域の背景のメッシュモデルから対象のメッシュモデルを適切に抽出することができる。また、対象のメッシュモデルも三次元情報を含んでおりその形状や大きさを把握できるため、対象特定部において、対象を適切に特定することができる。したがって、本発明によれば、所定領域の対象を適切に識別して認識することができ、当該対象の認識率を向上させることができる。

　前記対象抽出部は、前記撮像部で撮像された画像における前記所定領域のカラーコードをさらに用いて、前記対象を抽出してもよい。

　前記対象特定部は、前記対象抽出部で抽出された前記対象のメッシュモデルに対し、当該対象のメッシュモデルにおいて把握できない部分を補完して推定してもよい。

　前記対象特定部は、人工知能を用いて前記対象を特定してもよい。

　前記対象認識システムは、前記対象抽出部で抽出された前記対象に属性を付与し、当該対象の属性情報を前記データベースに格納するデータベース更新部をさらに有していてもよい。

　前記対象は物体であって、前記対象認識システムは、前記所定領域の物体の材質を測定する材質測定部をさらに有していてもよい。

　前記対象は人物であって、前記対象認識システムは、人物の動きと人物の行動パターンとを対応付けて前記データベースを作成するデータベース作成部をさらに有し、前記対象抽出部は、抽出された人物のメッシュモデルから当該人物の動きを把握し、前記対象特定部は、前記対象抽出部で把握された人物の動きと、前記データベース作成部で作成された前記データベースにおける人物の動きと人物の行動パターンとの対応付けとを照合し、当該対象抽出部で抽出された人物の行動パターンを特定してもよい。

　前記データベース作成部は、人工知能を用いて前記人物の動きと前記人物の行動パターンとの対応付けを行ってもよい。

　前記対象認識システムは、前記データベース作成部で作成された前記データベースにおける前記人物の動きと前記人物の行動パターンとの対応付けを、予め格納された人物の動きと人物の基礎行動パターンの対応付けに基づいて検証するデータベース検証部をさらに有していてもよい。

　別な観点による本発明は、所定領域の対象を認識する対象認識方法であって、撮像部で前記所定領域を撮像する撮像工程と、前記撮像部から前記所定領域までの距離を測定する測距工程と、前記測距工程で測定された距離に基づいて、前記所定領域のメッシュモデルを生成するモデル生成工程と、前記モデル生成工程で生成された前記所定領域のメッシュモデルにおいて、前記所定領域の背景のメッシュモデルから突出した前記対象のメッシュモデルを抽出する対象抽出工程と、前記対象抽出工程で抽出された前記対象のメッシュモデルと、データベースに格納された対象の情報とを照合し、当該対象抽出工程で抽出された前記対象を特定する対象特定工程と、を有することを特徴としている。

　前記対象抽出工程において、前記撮像工程で撮像された画像における前記所定領域のカラーコードをさらに用いて、前記対象を抽出してもよい。

　前記対象特定工程において、前記対象抽出工程で抽出された前記対象のメッシュモデルに対し、当該対象のメッシュモデルにおいて把握できない部分を補完して推定してもよい。

　前記対象特定工程において、人工知能を用いて前記対象を特定してもよい。

　前記対象認識方法は、前記対象抽出工程で抽出された前記対象に属性を付与し、当該対象の属性情報を前記データベースに格納するデータベース更新工程をさらに有していてもよい。

　前記対象は物体であって、前記対象抽出工程において、前記所定領域の物体の材質を測定し、当該測定された材質をさらに用いて、前記物体を抽出してもよい。

　前記対象は物体であって、前記対象特定工程において、前記対象抽出工程で抽出された物体の材質を測定し、当該測定された材質をさらに用いて、前記物体を特定してもよい。

　前記対象は人物であって、前記対象認識方法は、人物の動きと人物の行動パターンとを対応付けて前記データベースを作成するデータベース作成工程をさらに有し、前記対象抽出工程において、抽出された人物のメッシュモデルから当該人物の動きを把握し、前記対象特定工程において、前記対象抽出工程で把握された人物の動きと、前記データベース作成工程で作成された前記データベースにおける人物の動きと人物の行動パターンとの対応付けとを照合し、当該対象抽出工程で抽出された人物の行動パターンを特定してもよい。

　前記データベース作成工程において、人工知能を用いて前記人物の動きと前記人物の行動パターンとの対応付けを行ってもよい。

　前記対象認識方法は、前記データベース作成工程で作成された前記データベースにおける前記人物の動きと前記人物の行動パターンとの対応付けを、予め格納された人物の動きと人物の基礎行動パターンの対応付けに基づいて検証するデータベース検証工程をさらに有していてもよい。

　また別な観点による本発明によれば、前記対象認識方法を対象認識システムによって実行させるように、当該対象認識システムを制御する、コンピュータ上で動作するプログラムが提供される。

　さらに別な観点による本発明によれば、前記プログラムを格納した読み取り可能なコンピュータ記憶媒体が提供される。

　本発明によれば、所定領域の対象を認識するにあたり、当該対象の認識率を向上させることができる。

本実施の形態にかかる対象認識システムの構成の概略を示す説明図である。本実施の形態にかかる対象認識方法を示すフローチャートである。所定領域（机とコップ）を示す説明図である。所定領域のメッシュモデルを生成する様子を示す説明図である。所定領域のメッシュモデルを示す説明図である。他の実施の形態にかかる対象認識システムの構成の概略を示す説明図である。他の実施の形態にかかる対象認識システムの構成の概略を示す説明図である。他の実施の形態にかかる対象認識システムの構成の概略を示す説明図である。他の実施の形態にかかる対象認識システムの構成の概略を示す説明図である。

　以下、本発明の実施の形態について図面を参照して説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

＜１．対象認識システムの構成＞
　図１は、本実施の形態にかかる対象認識システム１の構成の概略を示している。なお、本実施の形態では対象が物体である場合について説明する。すなわち、対象認識システム１では、所定領域において対象である物体を識別して認識する。

　対象認識システム１は、撮像装置１０と対象認識装置２０を有する。撮像装置１０と対象認識装置２０は、ネットワーク（図示せず）を介して接続される。このネットワークは、撮像装置１０と対象認識装置２０との間の通信を行うことができるものであれば特に限定されるものではないが、例えばインターネットや有線ＬＡＮ、無線ＬＡＮなどにより構成される。

　撮像装置１０では、所定領域を撮像すると共に、所定領域までの距離を測定する。また、対象認識装置２０では、所定領域について三次元のメッシュモデルを生成し、所定領域における対象のメッシュモデルを抽出して、当該対象を特定する。なお、これら撮像装置１０と対象認識装置２０の構成と動作については、以下において詳細に説明する。

＜２．撮像装置の構成＞
　撮像装置１０は、筐体１１の下部に、透明又は半透明のドームカバー１２が設けられた構成を有する。ドームカバー１２の内部には、測距部としての測距センサ１３と、撮像部としてのカメラ１４と、カメラ１４を支持する支持部材１５とが設けられている。また、筐体１１の内部には、支持部材１５を介してカメラ１４の回動動作を制御する駆動機構１６と、撮像装置１０で取得されたデータを対象認識装置２０に送信するための通信部１７とが設けられている。なお、撮像装置１０の形状はこれに限定されるものではなく、任意に設計できる。

　測距センサ１３は、例えば赤外線を照射する照射源１３ａと、赤外線の反射波を受光する受光素子１３ｂと備えている。照射源１３ａには、例えばＬＥＤが用いられる。受光素子１３ｂには、例えばＰＳＤやＣＭＯＳなどが用いられる。照射源１３ａと受光素子１３ｂの所定領域３０側には、それぞれ光を集束させるレンズ（図示せず）が設けられている。なお、照射源１３ａと受光素子１３ｂは、それぞれ複数設けられていてもよい。

　測距センサ１３では、照射源１３ａから所定領域に赤外線を照射し、所定領域で反射した赤外線の反射波を受光素子１３ｂで受光することにより、当該所定領域までの距離が測定される。赤外線の反射波に基づいて所定領域までの距離を測定する方法としては、例えば赤外線が照射されてからその反射波が戻ってくるまでの時間や位相差、赤外線の反射波が受光される受光素子上の位置、赤外線の反射波の強度などから算出する方法があり、当業者は公知の方法の中から任意に選択できる。そして、測距センサ１３で測定された距離データは、通信部１７に出力される。

　測距センサ１３は、カメラ１４に近接して固定して設けられている。したがって、測距センサ１３で測定された距離は、カメラ１４から所定領域までの距離と見做すことができる。

　なお、本実施の形態の測距センサ１３は、測定対象までの距離を測定するために赤外線を用いたが、これに限定されず、例えば超音波やレーザなど、任意に選択できる。

　カメラ１４には、例えばＣＣＤカメラやＣＭＯＳカメラなどの任意のカメラが用いられる。カメラ１４は、支持部材１５に支持されている。またカメラ１４は、駆動機構１６によって、水平方向（Ｘ軸方向及びＹ軸方向、パン方向）と高さ方向（Ｚ軸方向、チルト方向）に回転することができ、またズーム動作が可能に構成されている。駆動機構１６には、例えばステッピングモータやダイレクトドライブモータが用いられる。そして、カメラ１４は、撮像窓となるドームカバー１２を介して所定領域を撮像し、当該所定領域のカラー画像を取得できる。また、カメラ１４で撮像された画像データは、通信部１７に出力される。

　通信部１７は、ネットワークとの間の通信を媒介する通信インターフェースであり、後述する対象認識装置２０の入力部２１とデータ通信を行う。具体的に通信部１７は、測距センサ１３で測定された距離データと、カメラ１４で撮像された画像データとを対象認識装置２０に出力する。

＜３．対象認識装置の構成＞
　対象認識装置２０は、例えばコンピュータによって構成され、例えば回路（ハードウェア）やＣＰＵなどの中央演算処理装置と、これらを機能させるためのプログラム（ソフトウェア）から構成される。対象認識装置２０は、入力部２１、モデル生成部２２、対象抽出部２３、対象特定部２４、出力部２５、制御部２６、及び記憶部２７を有する。

　入力部２１は、ネットワークとの間の通信を媒介する通信インターフェースであり、撮像装置１０の通信部１７とデータ通信を行う。具体的に入力部２１には、上述した測距センサ１３で測定された距離データと、カメラ１４で撮像された画像データとが入力される。

　モデル生成部２２は、入力部２１の距離データに基づいて所定領域のメッシュモデルを生成する。また、対象抽出部２３は、モデル生成部２２で生成された所定領域のメッシュモデルにおいて、所定領域の背景のメッシュモデルから突出した対象のメッシュモデルを抽出する。さらに、対象特定部２４は、対象抽出部２３で抽出された対象のメッシュモデルと、記憶部２７のデータベースに格納された物体の情報とを照合し、当該対象を特定する。これらモデル生成部２２、対象抽出部２３及び対象特定部２４の具体的な動作については後述する。

　出力部２５は、対象特定部２４の対象認識結果を出力する。対象認識結果の出力方法は特に限定されるものではなく、例えばディスプレイに表示するなど、任意の方法を選択できる。

　制御部２６は、撮像装置１０における各動作を制御する。すなわち、制御部２６は、例えば測距センサ１３が距離を測定するタイミングと位置を制御し、またカメラ１４が撮像するタイミングと位置を制御する。

　記憶部２７には、対象認識システム１で所定領域３０を監視するためのプログラムが格納されている。なお、上記プログラムは、このように記憶部２７に格納されていてもよいし、あるいはコンピュータ読み取り可能なハードディスク（ＨＤ）、フレキシブルディスク（ＦＤ）、コンパクトディスク（ＣＤ）、マグネットオプティカルデスク（ＭＯ）、各種メモリなどのコンピュータに読み取り可能な記憶媒体に格納されていてもよい。また、上記プログラムは、インターネットなどの通信回線網を介してダウンロードすることにより、上記記憶媒体などに格納することもできる。

　また、記憶部２７には、物体の情報が格納されたデータベースが記憶されている。データベースに格納される物体は、実世界のあらゆる物体が対象となる。また、物体の情報としては、当該物体の属性に加え、形状や大きさの三次元情報などが含まれる。

＜４．対象認識システムの動作＞
　次に、以上のように構成された対象認識システム１で行われる所定領域の対象（物体）の識別方法について説明する。図２は、かかる対象認識方法の主な工程の例を示すフローチャートである。

　以下においては、図３に示す所定領域３０において、背景である机３１から対象であるコップ３２を識別する場合を例にとって説明する。ここで背景には、所定領域における床、壁、天井に加え、対象を支持する支持材（本実施の形態における机３１）や、所定領域において常設される常設物などが含まれる。また、対象は、所定領域において背景以外の物体であって、当該所定領域に静止している物体に加えて、動く物体も含まれる。なお、背景と対象は、本実施の形態の机３１とコップ３２に限定されるものではない。

　先ず、撮像装置１０のカメラ１４を用いて所定領域３０を撮像すると共に、測距センサ１３を用いてカメラ１４と所定領域３０の間の距離を測定する（図２のステップＳ１）。カメラ１４で撮像された画像データは、通信部１７と入力部２１を介して、対象認識装置２０の対象抽出部２３に出力される。測距センサ１３で測定された距離データは、通信部１７と入力部２１を介して、対象認識装置２０のモデル生成部２２に出力される。

　モデル生成部２２では、測距センサ１３で測定された距離データに基づいて、所定領域３０のメッシュモデルを生成する（図２のステップＳ２）。具体的には、図４に示すように所定領域３０において撮像装置１０側からメッシュを積み上げていく。メッシュのサイズは任意に設定される。各メッシュの水平方向（Ｘ軸方向及びＹ軸方向）の位置は、積み上げられたメッシュの数で算出できる。また、各メッシュの高さ方向（Ｚ軸方向）の位置は、測距センサ１３で測定された距離データから算出できる。

　このように水平方向と高さ方向の三次元の位置情報を備えたメッシュを積み上げていくと、図５に示すように所定領域３０について、机３１とコップ３２が反映された三次元のメッシュモデルが生成される。換言すれば、ステップＳ２では、測距センサ１３で測定された距離データに基づいて、所定領域３０が複数のメッシュで三次元に区画され、メッシュモデルが生成される。

　対象抽出部２３では、モデル生成部２２で生成された所定領域３０のメッシュモデルにおいて、机３１のメッシュモデルから突出したコップ３２のメッシュモデルを抽出する（図２のステップＳ３）。上述したように机３１のメッシュモデルとコップ３２のメッシュモデルは、それぞれ水平方向と高さ方向の三次元情報を備えたメッシュで構成されているため、これら机３１のメッシュモデルとコップ３２のメッシュモデルを区別することができる。

　なお、ステップＳ３でコップ３２のメッシュモデルを抽出する際、対象抽出部２３に入力されたカメラ１４の画像データのカラーコードを用いてもよい。カラーコードとしては、例えばＲＧＢやＨＳＶなど、種々の表色系が用いられる。かかる場合、机３１のカラーコードとコップ３２のカラーコードを区別することで、机３１のメッシュモデルからコップ３２のメッシュモデルを抽出できる。すなわち、画像データのカラーコードは、コップ３２のメッシュモデルの抽出を補完するものであり、これによりさらに適切にコップ３２のメッシュモデルを抽出することができる。

　対象特定部２４では、対象抽出部２３で抽出されたコップ３２のメッシュモデルと、記憶部２７のデータベースに格納された物体の情報とを照合し、コップ３２を特定する（図２のステップＳ４）。上述したようにデータベースには、物体の属性に加え、形状や大きさの三次元情報などが含まれる。対象特定部２４では、コップ３２のメッシュモデルから、当該コップ３２の形状や大きさの三次元情報を把握する。そして、データベースに格納された複数の物体の三次元情報のうち、コップ３２のメッシュモデルの三次元情報と適合するものを選択し、当該コップ３２のメッシュモデルに属性を付与してコップを特定する。

　ここで、撮像装置１０はコップ３２の一方向に配置されるため、コップ３２のメッシュモデルからは、例えばコップ３２の底面など、形状や大きさを把握できない部分がある。しかしながら、対象特定部２４では、コップ３２のメッシュモデルにおいて把握できる部分に基づいて、把握できない部分の形状や大きさを補完して推定することができる。こうして、コップ３２全体の形状や大きさを推定することができる。従来のようにＲＧＢなどのカラーコードのみを用いて物体を特定する場合、データベースには物体のあらゆる角度からのカラーコードが格納されている必要があるが、本実施の形態では上述のようにコップ３２の形状や大きさを推定することができるので、データベースにはコップ３２の一部の形状や大きさが格納されていればよい。

　また、対象特定部２４は人工知能を備えていてもよい。かかる場合、ステップＳ４において、例えばデータベースに格納された複数の物体の三次元情報のうち、コップ３２のメッシュモデルの三次元情報と完全に適合するものがなかったとしても、人工知能を用いて、当該三次元情報と近いものをデータベースから選択することができる。そして、コップ３２のメッシュモデルに属性を付与して、コップを特定することができる。

　こうして、所定領域３０においてコップ３２を識別して認識することができる。なお、対象特定部２４の対象認識結果は、出力部２５に出力される。

　本実施の形態によれば、ステップＳ２においてモデル生成部２２で生成された所定領域３０のメッシュモデルは、各メッシュの水平方向と高さ方向の情報（三次元情報）を含んでいる。そうするとステップＳ３において、対象抽出部２３で机３１のメッシュモデルからコップ３２のメッシュモデルを適切に抽出することができ、さらにステップＳ４において、対象特定部２４でコップ３２を適切に特定することができる。したがって、従来のようにカラーコードのみを用いて物体を識別する場合に比して、対象の認識率を向上させることができる。また、メッシュモデルの三次元情報に加えて、画像データのカラーコードを併用することで、対象の認識率をさらに向上させることができる。

＜５．対象が物体である場合の他の実施の形態＞
　次に、対象が物体である場合の、本発明の他の実施の形態について説明する。以下の説明において、上記実施の形態と重複する箇所は説明を省略する。

　図６に示すように対象認識装置２０は、記憶部２７のデータベースを更新するデータベース更新部４０をさらに有していてもよい。データベース更新部４０は、例えば対象抽出部２３で抽出された対象のメッシュモデルについて、当該メッシュモデルの三次元情報が、データベースに格納された物体の三次元情報と適合しない場合、この対象に属性を付与して、当該対象の属性情報をデータベースに格納する。対象に属性を付与する方法は任意であるが、例えばデータベース更新部４０が出力部２５を介して対象の属性を問い合わせし、オペレータが対象に属性を付与し、入力部２１を介してデータベース更新部４０にその属性を入力してもよい。

　このように対象認識装置２０が学習して記憶部２７のデータベースを更新することで、対象の認識率を向上させることができる。

　なお、以上の実施の形態において対象認識システム１が複数設けられている場合、物体の情報を格納するデータベースは、複数の対象認識システム１に共通のマスタデータベースであってもよい。かかる場合、複数の対象認識システム１を用いて、上述したようにデータベース更新部４０でマスタデータベースを更新することにより、当該マスタデータベースに格納される物体の情報が飛躍的に増え、さらに精緻なマスタデータベースを構築することが可能となる。したがって、このマスタデータベースを用いることで、対象の認識率をさらに向上させることができる。

　また、図７に示すように対象認識システム１は、所定領域３０の対象（物体）の材質を測定する材質測定部５０をさらに有していてもよい。材質測定部５０は、例えば超音波発振器５１、超音波検出器５２、及び超音波解析部５３を有している。超音波発振器５１と超音波検出器５２はそれぞれ、例えば撮像装置１０のドームカバー１２の内部に設けられている。超音波解析部５３は、例えば対象認識装置２０に設けられている。なお、材質測定部５０の構成はこれに限定されるものではなく、任意に設計できる。

　超音波発振器５１は、対象にレーザ光（パルス状のレーザ光）を照射し、当該対象に超音波振動を発生させる。超音波検出器５２は、対象にレーザ光（連続波のレーザ光）を照射すると共に、対象からの反射光を受光することにより、対象に発生した超音波振動の変位を検出する。超音波検出器５２で検出された超音波振動の検出信号は、通信部１７と入力部２１を介して、超音波解析部５３に出力される。なお、これら超音波発振器５１と超音波検出器５２の構成は特に限定されるものはなく、一般的な装置を用いることができる。

　超音波解析部５３では、超音波検出器５２で検出された超音波振動の検出信号を解析し、対象の組織の粒径や強度などの材質特性値を算出する。そして、この材質特性値に基づいて、対象の材質が測定される。なお、記憶部２７のデータベースには、物体の情報として、物体の材質がさらに格納されている。

　以上の構成を有する材質測定部５０は、上述したステップＳ３で用いられてもよいし、ステップＳ４で用いられてもよい。

　ステップＳ３で材質測定部５０を用いる場合、当該材質測定部５０によって、所定領域３０に存在する机３１とコップ３２の材質がそれぞれ測定される。かかる場合、机３１の材質とコップ３２の材質の違いを利用することで、机３１のメッシュモデルからコップ３２のメッシュモデルを抽出できる。すなわち、机３１の材質とコップ３２の材質は、コップ３２のメッシュモデルの抽出を補完するものであり、これによりさらに適切にコップ３２のメッシュモデルを抽出することができる。

　また、ステップＳ４で材質測定部５０を用いる場合、ステップＳ３でコップ３２のメッシュモデルを抽出した後、材質測定部５０によってコップ３２の材質が測定される。そして、ステップＳ４において、対象特定部２４でコップ３２を特定する。このステップＳ４では、対象抽出部２３で抽出されたコップ３２のメッシュモデルと、記憶部２７のデータベースに格納された物体の情報（三次元情報）とを照合するが、これに加えて、材質測定部５０で測定されたコップ３２の材質と、記憶部２７のデータベースに格納された物体の情報（材質）とも照合する。したがって、コップ３２の特定をより確実に行うことができる。

＜６．対象が人物である場合の実施の形態＞
　次に、対象が人物である場合の実施の形態について説明する。以下の説明において、上記実施の形態と重複する箇所は説明を省略する。

　対象が物体から人物に代わった場合でも、上述した対象認識システム１を用いて、所定領域の対象（人物）を識別して認識することができる。かかる場合、記憶部２７に格納されたデータベースには、人物の属性（例えば性別、年齢等）に加え、人物の体格などの三次元情報などが含まれる。

　そして、所定領域の人物を認識する際には、上述したステップＳ１～Ｓ４が行われる。ステップＳ１、Ｓ２は、それぞれ上記実施の形態におけるステップＳ１、Ｓ２と同様である。

　ステップＳ３では、対象抽出部２３において、モデル生成部２２で生成された所定領域３０のメッシュモデルにおいて、背景のメッシュモデルから突出した人物のメッシュモデルを抽出する。この具体的な抽出方法は、上記実施の形態におけるステップＳ３と同様である。

　ステップＳ４では、対象抽出部２３で抽出された人物のメッシュモデルと、記憶部２７のデータベースに格納された人物の情報とを照合し、対象が人物であると特定する。この具体的な特定方法は、上記実施の形態におけるステップＳ４と同様である。

　本実施の形態においても、上記実施形態と同様の効果を享受することができる。すなわち、対象（人物）の認識率を向上させることができる。

　また、対象が人物である場合、対象認識システム１を用いて、所定領域における人物の行動パターンも認識することができる。かかる場合、記憶部２７に格納されたデータベースには、人物の動きと人物の行動パターンとが対応付けられた相関情報が含まれる。人物の動きには、例えば頭（顔）、手、足、胴体などの各部位の動きが含まれる。人物の行動パターンには、例えば食べる、話す、歩く、座るなどの人物の行動のあらゆるパターンが含まれる。

　かかる場合、ステップＳ３では、上述したように対象抽出部２３において、人物のメッシュモデルを抽出し、さらに当該抽出された人物のメッシュモデルから人物の動きを把握する。具体的には、例えばメッシュモデルにおけるメッシュの変位を把握することで、人物の各部位の動きを把握する。

　その後、ステップＳ４では、対象抽出部２３で把握された人物の動き（人物の各部位の動き）と、記憶部２７のデータベースに格納された人物の動きと人物の行動パターンの対応付けとを照合し、対象抽出部２３で把握された人物の動きに適合する人物の行動パターンを特定する。具体的には、例えば人物の動きとして、手が口の方に移動する動きが把握された場合、当該人物の行動パターンを「食べる」と認識する。

　本実施の形態によれば、対象認識システム１を用いて人物の行動パターンを認識することができ、例えば人物が倒れるなどの異常状態や危険事象の発生を把握することが可能となる。さらに、例えば特定人物の通常の行動パターンを予め把握しておけば、対象認識システム１を用いて特定人物の行動パターンを認識することで、当該特定人物の健康状態まで把握することもできる。

　ここで、上述した人物の動きと人物の行動パターンとの対応付けを含むデータベースの作成方法について説明する。図８に示すように対象認識装置２０は、記憶部２７のデータベースを作成するデータベース形成部６０をさらに有している。データベース形成部６０は、人物の動きと、人物の行動パターンとを対応付けてデータベースを作成する。

　人物の動きと人物の行動パターンを対応付ける方法は任意である。例えばオペレータが人物の動きと人物の行動パターンを対応付けて、入力部２１を介してデータベース形成部６０にその対応付けを入力してもよい。また、オペレータが対応付けを行う際には、例えば対象抽出部２３で把握された人物の動きに対して、ボタンを押しながら行動パターンを教示してもよい。具体的には、例えば人物が手を口の方に動かしている場合において、オペレータはボタンを押しながら、当該人物の行動パターンを「食べる」と教示する。

　また、データベース形成部６０が備える人工知能を用いて、人物の動きと人物の行動パターンを対応付けてもよい。例えば所定の時間、所定の場所に人物が起こす行動に対し、人工知能が行動パターンを予測して教示する。具体的には、例えば朝、ダイニングに人物が座り、当該人物が手を口の方に動かしている場合、人工知能は人物の行動パターンを「食べる」と予測して教示する。

　そして、この人工知能を用いたデータベース形成において、ディープラーニング（深層学習）により、人物の動きに対する人物の行動パターンを学習することで、人物の動きと人物の行動パターンを対応付けてもよい。

　このように人物の行動パターンの教示には、オペレータによるマニュアル教示や人工知能を用いた教示など種々の方法があるが、いずれの場合でも、データベース形成部６０において人物の動きと人物の行動パターンを対応付けることができる。

　また、上述したデータベース形成部６０で作成したデータベースにおける人物の動きと人物の行動パターンとの対応付けについて、さらに当該対応付けの正誤を検証してもよい。図９に示すように対象認識装置２０は、上記対応付けの検証を行うデータベース検証部６１をさらに有している。データベース検証部６１には、予め人物の動きと人物の基礎行動パターンの対応付けが格納されている。なお、基礎行動パターンは、人物の動きに対して正と対応付けられる行動パターンである。

　かかる場合、データベース検証部６１において、データベース形成部６０で作成したデータベースにおける人物の動きと人物の行動パターンとの対応付けの正誤を検証するので、正しい対応付けのみが記憶部２７のデータベースに格納される。そうすると、記憶部２７のデータベースがブラッシュアップされていき、人物の行動パターンの認識率をさらに向上させることができる。

　なお、本実施の形態において、所定領域における人物の行動パターンを認識するにあたり、人物のメッシュモデルを形成して当該人物の動きを把握していたが、所定領域における人物の動きを把握する方法はこれに限定されない。例えば人物の各部位（頭、手、足、胴体など）までの距離を測定し、当該人物の動きを把握してもよい。また、人物の動きとして、例えば人物の目の動きや表情を把握してもよい。

　また、以上の実施の形態では、対象が物体である場合と人物である場合を別々に説明したが、対象はこれら物体と人物の組み合わせでもよい。例えば人物が手で箸を持ち、箸を口の方に動かしている場合、対象認識システム１は、物体として箸を認識すると共に、人物の動きを把握して人物の行動パターン「食べる」を認識することができる。このように物体と人物の両方を組み合わせることにより、より精度よく人物の行動パターンを認識することができる。

　以上の実施の形態の対象認識システム１は、様々なサービス分野に適用することができる。例えば対象認識システム１は、所定領域を監視する際に用いてもよい。かかる場合、所定領域において物体や人物の対象を適切に識別して認識することで、当該所定領域を適切に監視することができる。

　以上、添付図面を参照しながら本発明の好適な実施の形態について説明したが、本発明はかかる例に限定されない。当業者であれば、請求の範囲に記載された思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。

　本発明は、所定領域において物体や人物などの対象を認識する際に有用である。

　１　　対象認識システム
　１０　撮像装置
　１１　筐体
　１２　ドームカバー
　１３　測距センサ
　１３ａ　照射源
　１３ｂ　受光素子
　１４　カメラ
　１５　支持部材
　１６　駆動機構
　１７　通信部
　２０　対象認識装置
　２１　入力部
　２２　モデル生成部
　２３　対象抽出部
　２４　対象特定部
　２５　出力部
　２６　制御部
　２７　記憶部
　３０　所定領域
　３１　机
　３２　コップ
　４０　データベース更新部
　５０　材質測定部
　５１　超音波発振器
　５２　超音波検出器
　５３　超音波解析部
　６０　データベース形成部
　６１　データベース検証部

Claims

所定領域の対象を認識する対象認識システムであって、
前記所定領域を撮像する撮像部と、
前記撮像部から前記所定領域までの距離を測定する測距部と、
前記測距部で測定された距離に基づいて、前記所定領域のメッシュモデルを生成するモデル生成部と、
前記モデル生成部で生成された前記所定領域のメッシュモデルにおいて、前記所定領域の背景のメッシュモデルから突出した前記対象のメッシュモデルを抽出する対象抽出部と、
前記対象抽出部で抽出された前記対象のメッシュモデルと、データベースに格納された対象の情報とを照合し、当該対象抽出部で抽出された前記対象を特定する対象特定部と、を有することを特徴とする、対象認識システム。
前記対象抽出部は、前記撮像部で撮像された画像における前記所定領域のカラーコードをさらに用いて、前記対象を抽出することを特徴とする、請求項１に記載の対象認識システム。
前記対象特定部は、前記対象抽出部で抽出された前記対象のメッシュモデルに対し、当該対象のメッシュモデルにおいて把握できない部分を補完して推定することを特徴とする、請求項１又は２に記載の対象認識システム。
前記対象特定部は、人工知能を用いて前記対象を特定することを特徴とする、請求項１～３のいずれか一項に記載の対象認識システム。
前記対象抽出部で抽出された前記対象に属性を付与し、当該対象の属性情報を前記データベースに格納するデータベース更新部をさらに有することを特徴とする、請求項１～４のいずれか一項に記載の対象認識システム。
前記対象は物体であって、
前記対象認識システムは、前記所定領域の物体の材質を測定する材質測定部をさらに有することを特徴とする、請求項１～５のいずれか一項に記載の対象認識システム。
前記対象は人物であって、
前記対象認識システムは、人物の動きと人物の行動パターンとを対応付けて前記データベースを作成するデータベース作成部をさらに有し、
前記対象抽出部は、抽出された人物のメッシュモデルから当該人物の動きを把握し、
前記対象特定部は、前記対象抽出部で把握された人物の動きと、前記データベース作成部で作成された前記データベースにおける人物の動きと人物の行動パターンとの対応付けとを照合し、当該対象抽出部で抽出された人物の行動パターンを特定することを特徴とする、請求項１～５のいずれか一項に記載の対象認識システム。
前記データベース作成部は、人工知能を用いて前記人物の動きと前記人物の行動パターンとの対応付けを行うことを特徴とする、請求項７に記載の対象認識システム。
前記データベース作成部で作成された前記データベースにおける前記人物の動きと前記人物の行動パターンとの対応付けを、予め格納された人物の動きと人物の基礎行動パターンの対応付けに基づいて検証するデータベース検証部をさらに有することを特徴とする、請求項７又は８に記載の対象認識システム。
所定領域の対象を認識する対象認識方法であって、
撮像部で前記所定領域を撮像する撮像工程と、
前記撮像部から前記所定領域までの距離を測定する測距工程と、
前記測距工程で測定された距離に基づいて、前記所定領域のメッシュモデルを生成するモデル生成工程と、
前記モデル生成工程で生成された前記所定領域のメッシュモデルにおいて、前記所定領域の背景のメッシュモデルから突出した前記対象のメッシュモデルを抽出する対象抽出工程と、
前記対象抽出工程で抽出された前記対象のメッシュモデルと、データベースに格納された対象の情報とを照合し、当該対象抽出工程で抽出された前記対象を特定する対象特定工程と、を有することを特徴とする、対象認識方法。
前記対象抽出工程において、前記撮像工程で撮像された画像における前記所定領域のカラーコードをさらに用いて、前記対象を抽出することを特徴とする、請求項１０に記載の対象認識方法。
前記対象特定工程において、前記対象抽出工程で抽出された前記対象のメッシュモデルに対し、当該対象のメッシュモデルにおいて把握できない部分を補完して推定することを特徴とする、請求項１０又は１１に記載の対象認識方法。
前記対象特定工程において、人工知能を用いて前記対象を特定することを特徴とする、請求項１０～１２のいずれか一項に記載の対象認識方法。
前記対象抽出工程で抽出された前記対象に属性を付与し、当該対象の属性情報を前記データベースに格納するデータベース更新工程をさらに有することを特徴とする、請求項１０～１３のいずれか一項に記載の対象認識方法。
前記対象は物体であって、
前記対象抽出工程において、前記所定領域の物体の材質を測定し、当該測定された材質をさらに用いて、前記物体を抽出することを特徴とする、請求項１０～１４のいずれか一項に記載の対象認識方法。
前記対象は物体であって、
前記対象特定工程において、前記対象抽出工程で抽出された物体の材質を測定し、当該測定された材質をさらに用いて、前記物体を特定することを特徴とする、請求項１０～１５のいずれか一項に記載の対象認識方法。
前記対象は人物であって、
前記対象認識方法は、人物の動きと人物の行動パターンとを対応付けて前記データベースを作成するデータベース作成工程をさらに有し、
前記対象抽出工程において、抽出された人物のメッシュモデルから当該人物の動きを把握し、
前記対象特定工程において、前記対象抽出工程で把握された人物の動きと、前記データベース作成工程で作成された前記データベースにおける人物の動きと人物の行動パターンとの対応付けとを照合し、当該対象抽出工程で抽出された人物の行動パターンを特定することを特徴とする、請求項１０～１４のいずれか一項に記載の対象認識方法。
前記データベース作成工程において、人工知能を用いて前記人物の動きと前記人物の行動パターンとの対応付けを行うことを特徴とする、請求項１７に記載の対象認識方法。
前記データベース作成工程で作成された前記データベースにおける前記人物の動きと前記人物の行動パターンとの対応付けを、予め格納された人物の動きと人物の基礎行動パターンの対応付けに基づいて検証するデータベース検証工程をさらに有することを特徴とする、請求項１７又は１８に記載の対象認識方法。
請求項１０～１９のいずれか一項に記載の対象認識方法を対象認識システムによって実行させるように、当該対象認識システムを制御する、コンピュータ上で動作するプログラム。
請求項１４に記載のプログラムを格納した読み取り可能なコンピュータ記憶媒体。