WO2022176444A1

WO2022176444A1 - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: WO2022176444A1
Application number: PCT/JP2022/000803
Authority: WO
Inventors: 正春松戸
Original assignee: ソニーグループ株式会社
Priority date: 2021-02-17
Filing date: 2022-01-12
Publication date: 2022-08-25

Abstract

本開示の情報処理装置は、第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングするクラスタリング処理部と、第１のオブジェクトおよび第２のオブジェクトのそれぞれについて、クラスタごとに点群データの位置情報を算出する位置情報算出部と、第１のオブジェクトの位置情報と第２のオブジェクトの位置情報とに基づいて、第１のオブジェクトのクラスタと第２のオブジェクトのクラスタとの３次元的な位置合わせ処理を行うことによって、第２のオブジェクトの第１のオブジェクトに対する並進量および回転量を算出する移動量算出部とを備える。

Description

情報処理装置、情報処理方法およびプログラム

　本開示は、物体の動き検出を行う情報処理装置、情報処理方法およびプログラムに関する。

　物体の動き検出を行う技術が種々、開発されている（例えば特許文献１参照）。例えば測距センサから取得した３次元的な点群データを用いたオブジェクトの３次元的な動き推定を行う手法として、様々な３次元レジストレーション（位置合わせ）を用いる手法がある。

特開２０１９－２１０６０号公報

　３次元的な点群データを用いて３次元レジストレーションにより動き検出の処理を行う場合、精度と処理速度の両立が困難である。

　動き検出の精度と処理速度とを両立させることが可能な情報処理装置、情報処理方法およびプログラムを提供することが望ましい。

　本開示の一実施の形態に係る情報処理装置は、第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングするクラスタリング処理部と、第１のオブジェクトおよび第２のオブジェクトのそれぞれについて、クラスタごとに点群データの位置情報を算出する位置情報算出部と、第１のオブジェクトの位置情報と第２のオブジェクトの位置情報とに基づいて、第１のオブジェクトのクラスタと第２のオブジェクトのクラスタとの３次元的な位置合わせ処理を行うことによって、第２のオブジェクトの第１のオブジェクトに対する並進量および回転量を算出する移動量算出部とを備える。

　本開示の一実施の形態に係る情報処理方法は、第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングすることと、第１のオブジェクトおよび第２のオブジェクトのそれぞれについて、クラスタごとに点群データの位置情報を算出することと、第１のオブジェクトの位置情報と第２のオブジェクトの位置情報とに基づいて、第１のオブジェクトのクラスタと第２のオブジェクトのクラスタとの３次元的な位置合わせ処理を行うことによって、第２のオブジェクトの第１のオブジェクトに対する並進量および回転量を算出することとを含む。

　本開示の一実施の形態に係るプログラムは、第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングすることと、第１のオブジェクトおよび第２のオブジェクトのそれぞれについて、クラスタごとに点群データの位置情報を算出することと、第１のオブジェクトの位置情報と第２のオブジェクトの位置情報とに基づいて、第１のオブジェクトのクラスタと第２のオブジェクトのクラスタとの３次元的な位置合わせ処理を行うことによって、第２のオブジェクトの第１のオブジェクトに対する並進量および回転量を算出することとを含む処理をコンピュータに実行させる。

　本開示の一実施の形態に係る情報処理装置、情報処理方法またはプログラムでは、第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングする。そして、第１のオブジェクトのクラスタと第２のオブジェクトのクラスタとの３次元的な位置合わせ処理を行うことによって、第２のオブジェクトの第１のオブジェクトに対する並進量および回転量を算出する。

比較例に係る動き検出の手法の概要を示す説明図である。本開示の第１の実施の形態に係る情報処理装置、および情報処理方法による動き検出の手法の概要を示す説明図である。第１の実施の形態に係る情報処理装置の一構成例を示すブロック図である。第１の実施の形態に係る情報処理装置における移動量・回転量算出部の一構成例を示すブロック図である。第１の実施の形態に係る情報処理装置における動き検出の処理動作の流れの一例を示すフローチャートである。第１の実施の形態に係る情報処理装置におけるカルマンフィルタを用いた時間平滑化処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置におけるカルマンフィルタを用いた時間平滑化処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置におけるカルマンフィルタを用いた時間平滑化処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置において群流推定を行う場合のクラスタリング処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置において群流推定を行う場合のクラスタリング処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置において群流推定を行う場合のクラスタリング処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置におけるクラスタリング処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置におけるオブジェクトの種類に応じたクラスタリング処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置におけるオブジェクトの種類に応じたクラスタリング処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置におけるオブジェクトの種類に応じたクラスタリング処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置におけるオブジェクトの種類に応じたクラスタリング処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置におけるオブジェクトの種類に応じたクラスタリング処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置におけるオブジェクトの種類に応じたクラスタリング処理の一例を示す説明図である。第１の実施の形態に係る情報処理装置におけるオブジェクトの種類に応じたクラスタリング処理の一例を示す説明図である。第１の実施の形態の変形例に係る情報処理装置による動き検出の手法の概要を示す説明図である。第１の実施の形態の変形例に係る情報処理装置における動き検出の処理動作の流れの一例を示すフローチャートである。第２の実施の形態に係る情報処理装置の一構成例を示すブロック図である。

　以下、本開示の実施の形態について図面を参照して詳細に説明する。なお、説明は以下の順序で行う。
　１．第１の実施の形態（図１～図２１）
　　１．０　概要
　　１．１　構成
　　１．２　動作
　　１．３　変形例
　　１．４　効果
　２．第２の実施の形態（図２２）
　３．その他の実施の形態

＜１．第１の実施の形態＞
［１．０　概要］
（比較例）
　図１は、比較例に係る動き検出の手法の概要を示している。

　図１には、オブジェクトの３次元的な点群データを１つのクラスタの正規分布で表すことによって動き検出を行う手法の例を示している。

　ここでは、図１（Ａ）に示したように、同一のオブジェクトについて、時刻ｔ－１（過去）のオブジェクトを第１のオブジェクト、時刻ｔ（現在）のオブジェクトを第２のオブジェクトとする。また、動き検出として、時刻ｔのオブジェクトの時刻ｔ－１のオブジェクトに対する並進量および回転量を算出するものとする。

　比較例に係る動き検出の手法では、時刻ｔのオブジェクトの３次元的な点群データおよび時刻ｔ－１のオブジェクトの３次元的な点群データのそれぞれを、１つのクラスタにクラスタリングする。また、時刻ｔのオブジェクトの３次元的な点群データおよび時刻ｔ－１のオブジェクトの３次元的な点群データのそれぞれについて、位置情報として、平均位置（μ_ｔ－１，μ_ｔ）と共分散行列（Σ_ｔ－１，Σ_ｔ）とを算出する（図１（Ｂ））。次に、時刻ｔのオブジェクトの３次元的な点群データおよび時刻ｔ－１のオブジェクトの３次元的な点群データのそれぞれについて、固有値分解（Σ_ｔ－１＝Ｒ_ｔ－１Ｄ_ｔ－１Ｒ_ｔ－１ ^Ｔ，Σ_ｔ＝Ｒ_ｔＤ_ｔＲ_ｔ ^Ｔ）を行う（図１（Ｃ））。次に、時刻ｔのオブジェクトの時刻ｔ－１のオブジェクトに対する並進量（Ｔ＝μ_ｔ－μ_ｔ－１）および回転量（Ｒ＝Ｒ_ｔＲ_ｔ－１ ^Ｔ）を算出する（図１（Ｄ））。

　比較例に係る動き検出の手法では、精度と処理速度とを両立することが困難である。処理速度を考えると、データ量の削減と組み合わせた手法がよいと考えられる。並進量だけであれば、オブジェクトの重心位置を算出しその重心位置の差分で、多くの場合推定可能となる（点の差分で算出可能）。しかしながら、回転量も含めて算出する場合、点では情報が足りず、どう情報量を維持しつつ回転量を含めた動き推定を行うかが課題となる。

（第１の実施の形態における動き検出の手法）
　図２は、本開示の第１の実施の形態に係る情報処理装置、および情報処理方法による動き検出の手法の概要を示している。

　ここでは、図２（Ａ）に示したように、同一のオブジェクトについて、時刻ｔ－１（過去）のオブジェクトを第１のオブジェクト、時刻ｔ（現在）のオブジェクトを第２のオブジェクトとする。すなわち、第２のオブジェクトは、第１のオブジェクトに対して所定の時間だけ経過後のオブジェクトである。また、動き検出として、時刻ｔのオブジェクトの時刻ｔ－１のオブジェクトに対する並進量および回転量を算出する。

　第１の実施の形態における動き検出の手法では、以下の処理手順を含む。
（処理１）時刻ｔのオブジェクトの３次元的な点群データおよび時刻ｔ－１のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つ（Ｎ個）のクラスタにクラスタリングする（図２（Ａ））。
（処理２）時刻ｔのオブジェクト内の全点群および時刻ｔ－１のオブジェクト内の全点群の各基準位置（例えば重心位置Ｐｔ，Ｐｔ－１）（１個）を算出する（図２（Ａ））。なお、基準位置は、重心位置に限らず、中心に近い位置となればよく、平均位置でも、メディアン（中央位置）でもよい。
（処理３）時刻ｔのオブジェクトおよび時刻ｔ－１のオブジェクトのそれぞれの各クラスタ内の点群の分布を所定の分布（例えば正規分布）とみなし、各クラスタごとに点群データの位置情報として、平均位置（Ｎ個）および共分散行列（Ｎ個）を算出する（図２（Ａ））。
（処理４）処理２による時刻ｔ－１のオブジェクトの重心位置Ｐｔ－１の算出結果と、処理２による時刻ｔのオブジェクトの重心位置Ｐｔの算出結果とから大まかな（粗い）並進量Ｔｃを算出する（図２（Ａ），（Ｂ））。
（処理５）各重心位置Ｐｔ－１，Ｐｔが所定の原点Ｐ０となるよう、処理３による時刻ｔ－１および時刻ｔの平均位置（Ｎ個）および共分散行列（Ｎ個）の算出結果（平均Ｎ個）から処理２による各重心位置Ｐｔ－１，Ｐｔの算出結果を減算する（図２（Ｂ），（Ｃ））。
（処理６）時刻ｔ－１の処理５の結果と時刻ｔの処理５の結果とから、時刻ｔのオブジェクトのクラスタと時刻ｔ－１のオブジェクトのクラスタとのＧＩＣＰ（Generalized Iterative Closest Point）に基づく３次元的な位置合わせ処理を行い、より正確な並進量Ｔｆおよび回転量Ｒｆを算出する。
（処理７）並進量については、Ｔｃ＋Ｔｆを最終的な並進量として出力する。

　以上の処理手順を含むことにより、第１の実施の形態における動き検出の手法では、使用するデータ量が圧縮され、処理速度が向上する（処理１，処理３）。また、分布情報を保持する（処理３）ことにより、精度が向上する。また、大まかに並進量を算出（処理２，処理４）した後に、詳細な並進量および回転量を算出する（処理５，処理６，処理７）ことにより、精度が向上する。

　なお、処理３、処理６では例えば正規分布を仮定して処理を行っているが、当然、形状が表現できていればよく、他の所定の分布（例えば一様分布）や、所定の形状（幾何図形（例えば多角形））などを仮定した処理に置き換えてもよい。

　また、セグメンテーション後、オブジェクトをさらにパーツごとに分割し、それぞれ正規分布を取ることでより正確な並進量、および回転量を算出するようにしてもよい。

　さらに、算出した並進量および回転量と時刻ｔのオブジェクトの位置情報とに基づいて、並進量および回転量に対して時間的な平滑化処理を行うようにしてもよい。例えば、時間的な平滑化処理としてカルマンフィルタを用いた平滑化処理を行うようにしてもよい。　

　また、処理５、および処理６において、各重心位置Ｐｔ－１，Ｐｔを原点Ｐ０となるように位置合わせした後、ＧＩＣＰに基づく３次元的な位置合わせ処理を行うことにより、座標位置によらず、並進量および回転量を算出することが可能となる。また、一般的なＧＩＣＰに対しての修正を行い、クラスタ内の分散も考慮して位置合わせすることで算出精度が向上する。

　既存のＧＩＣＰでは、ＩＣＰに使用する全点群に対して近傍数点から共分散行列を算出し、その共分散行列を平面と近似することによって、計算時間の短縮、計算収束性を高めている。点群の場合はこれでよいが、第１の実施の形態における動き検出の手法では、近傍数点ではなく、より広くクラスタリングを実施する場合、情報量が減る分、並進量、および回転量の算出精度が落ちる。そこで、第１の実施の形態における動き検出の手法では、平面近似を行わず、クラスタの分散をそのまま使用することで、より位置合わせを正確に行えるようにしている。これにより、よりオブジェクトの実際の形状にあった、並進量、および回転量の算出が可能となる。

［１．１　構成］
　図３は、第１の実施の形態に係る情報処理装置１の一構成例を示している。

　図３に示した情報処理装置１は、例えば移動機構４２を備えた移動体に適用される。移動体は、駆動制御部４１、移動機構４２、移動センサ４３を備えている。また、移動体は、センサ１１、センサ１２、慣性計測装置（ＩＭＵ：Inertial Measurement Unit）１３、およびＧＮＳＳ（Global Navigation Satellite System：全地球衛星測位システム）１４を備えている。情報処理装置１には、センサ１１、センサ１２、慣性計測装置１３、およびＧＮＳＳ１４から各種のデータが入力される。

　情報処理装置１は、クラスタリング処理部２１と、オブジェクト検出部２２と、座標系変換部２３と、座標系変換部２４と、セグメンテーション処理部２５と、非オブジェクト用処理部２６と、行動計画部２７と、自己位置推定部２８と、移動量・回転量算出部３０とを備えている。

　センサ１１は、クラスタリングに用いられる点群データを出力する。センサ１２は、オブジェクトの検出に用いられる画像データを出力する。

　センサ１１は、例えば測域センサである。具体的には、センサ１１は、ＬｉＤＡＲ（Laser Imaging Detection and Ranging）、Ｒａｄａｒ（RAdio Detection And Ranging）であってもよい。また、センサ１１は、ＴｏＦ（Time of Flight）カメラやステレオカメラ等の距離画像カメラであってもよい。また、センサ１１は、カラー画像（ＲＧＢ）に加えて奥行き画像（Ｄｅｐｔｈ）を取得可能なＲＧＢ－Ｄカメラであってもよい。

　センサ１２は、例えば画像カメラ（ＲＧＢカメラ、白黒カメラ等）や測域センサであってもよい。

　クラスタリング処理部２１は、センサ１１からの点群データに基づいて、クラスタリング処理を行い、少なくとも１つのクラスタを含むクラスタ群のデータを生成する。クラスタリング処理部２１は、オブジェクトの種類に基づいて、クラスタの生成数およびクラスタの生成範囲の少なくとも一方を変更するようにしてもよい（後述の図１２～図１９参照）。

　オブジェクト検出部２２は、センサ１２からの画像データに基づいて、オブジェクトの検出処理を行う。オブジェクト検出部２２は、例えばＣＮＮ（Convolutional Neural Network）やＤＮＮ（Deep Neural Network）によるオブジェクト検出を行ってもよい。また、オブジェクト検出部２２は、幾何形状の組み合わせによる検出、例えば、オブジェクトとして人の検出を行うのであれば、球（頭）、棒（胴体）の幾何形状があり、その大きさの比率が一般的な人のそれと同じで、かつ、その形状がつながっていれば、人と判定する処理を行ってもよい。また、オブジェクト検出部２２は、パターンマッチングによるオブジェクト検出を行ってもよい。例えば、オブジェクトのテンプレートを用意し、そのテンプレートとマッチしたものをオブジェクトと判定するようにしてもよい。

　なお、図３ではクラスタリング処理とオブジェクト検出とで、別々のセンサからの出力データを用いる例を示しているが、クラスタリング処理とオブジェクト検出とで、１つのセンサを共用するようにしてもよい。この場合、クラスタリング処理部２１とオブジェクト検出部２２とに入力されるデータは同じものなので、入力されるデータに番号付けをしておき、オブジェクト検出によってオブジェクトと判定されたデータを含むクラスタをオブジェクトのクラスタと判定するようにしてもよい。例えば、測域センサで取得した点群データをクラスタリング処理とオブジェクト検出との両処理で使用する場合は、点群データに番号を付けておき、オブジェクト検出でオブジェクトと判定された点群を含むクラスタをオブジェクトと判定するようにしてもよい。

　クラスタリング処理とオブジェクト検出とで別々のセンサからの出力データを用いる場合と１つのセンサからの出力データを共用する場合とのいずれであっても、オブジェクト検出部２２で検出した領域に存在するクラスタをオブジェクトのクラスタと判定してもよい。オブジェクト検出部２２によるオブジェクトの検出領域については、形状内で定義する方法、例えば、ｂｏｕｎｄｉｎｘ　ｂｏｘを用いる方法がある。また、確率分布で定義し、確率が閾値以上のところをオブジェクト領域と判定する方法などが考えられる。

　自己位置推定部２８は、慣性計測装置１３からの慣性計測データ、およびＧＮＳＳ１４からの測位データと移動センサ４３からの自機体移動量の情報とに基づいて、自己位置・姿勢を推定する。

　座標系変換部２３は、クラスタリング処理部２１からのクラスタ群のデータに対してセンサ座標と地図座標との座標変換を行う。また、座標系変換部２３は、自己位置推定部２８からの自己位置・姿勢のデータに対してセンサ座標と地図座標との座標変換を行う。

　座標系変換部２４は、クラスタリング処理部２１からのオブジェクトのデータに対してセンサ座標と地図座標との座標変換を行う。また、座標系変換部２４は、自己位置推定部２８からの自己位置・姿勢のデータに対してセンサ座標と地図座標との座標変換を行う。

　セグメンテーション処理部２５は、クラスタ群のデータに対してオブジェクトと非オブジェクト（背景等）とのセグメンテーションを行う。

　非オブジェクト用処理部２６は、非オブジェクトのクラスタ群のデータに対して所定の処理を行う。

　移動量・回転量算出部３０は、オブジェクトのクラスタ群のデータに基づいてオブジェクトの並進量および回転量を算出する処理を行う。

　行動計画部２７は、非オブジェクト用処理部２６および移動量・回転量算出部３０の処理結果と自己位置推定部２８からの自己位置・姿勢の情報とに基づいて、移動体の行動計画を行い、機体指示を駆動制御部４１に出力する。

　なお、情報処理装置１は、例えばＣＰＵ（Central Processing Unit）、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）を有するマイクロコンピュータによって構成されてもよい。この場合、情報処理装置１による処理は、ＲＯＭまたはＲＡＭに記憶されたプログラムに基づく処理をＣＰＵが実行することで実現し得る。また、情報処理装置１による処理は、例えば有線または無線によるネットワークにより外部から供給されたプログラムに基づく処理をＣＰＵが実行することで実現してもよい。

　図４は、第１の実施の形態に係る情報処理装置１における移動量・回転量算出部３０の一構成例を示している。

　移動量・回転量算出部３０は、オブジェクト重心位置算出部３１と、オブジェクト重心位置合わせ部３２と、回転量・並進量算出部３３と、時間平滑化部３４とを有している。

　移動量・回転量算出部３０は、本開示の技術における「移動量算出部」の一具体例に相当する。オブジェクト重心位置算出部３１は、本開示の技術における「位置情報算出部」の一具体例に相当する。

　オブジェクト重心位置算出部３１は、上述の処理２～処理４の処理を行う。

　オブジェクト重心位置合わせ部３２は、上述の処理５の処理を行う。

　回転量・並進量算出部３３は、上述の処理６および処理７の処理を行う。

　時間平滑化部３４は、回転量・並進量算出部３３によって算出された並進量および回転量に対して時間的な平滑化処理を行う。時間平滑化部３４は、例えば、時間的な平滑化処理としてカルマンフィルタを用いた平滑化処理を行う。

［１．２　動作］
　図５は、第１の実施の形態に係る情報処理装置１における動き検出の処理動作の流れの一例を示すフローチャートである。

　まず、情報処理装置１に、センサ１１からの点群データおよびセンサ１２からの画像データが入力される（ステップＳ１１）。次に、情報処理装置１は、点群データに対してクラスタリング処理および座標変換処理を行い、クラスタ群のデータを生成する（ステップＳ１２）。次に、情報処理装置１は、クラスタ群のデータに対してオブジェクトと非オブジェクト（背景等）とのセグメンテーションを行う（ステップＳ１３）

　次に、情報処理装置１は、クラスタ群が動き検出の対象となるオブジェクトであるか否かを判断する（ステップＳ１４）。動き検出の対象となるオブジェクトでは無いと判断した場合（ステップＳ１４；Ｎ）には、情報処理装置１は、動き検出の対象からは除外する。

　一方、クラスタ群が動き検出の対象となるオブジェクトであると判断した場合（ステップＳ１４；Ｙ）には、情報処理装置１は、オブジェクトの重心位置を算出する（ステップＳ１５）。次に、情報処理装置１は、粗い並進量Ｔｃを算出する。次に、情報処理装置１は、重心位置の位置合わせを行う（ステップＳ１６）。次に、情報処理装置１は、より正確な並進量Ｔｆおよび回転量Ｒｆを算出する（ステップＳ１７）。並進量については、Ｔｃ＋Ｔｆを最終的な並進量とする。次に、情報処理装置１は、時間平滑化部３４において時間的な平滑化処理を行う（ステップＳ１８）。

　ここで、時間平滑化部３４による時間的な平滑化処理を行う場合には、適宜、ステップＳ１６の処理に戻る。次に、時間平滑化部３４による時間的な平滑化処理の一例として、カルマンフィルタを用いた時間平滑化処理の例を説明する。

　図６ないし図８は、第１の実施の形態に係る情報処理装置１におけるカルマンフィルタを用いた時間平滑化処理の一例を示している。

　カルマンフィルタを用いた時間平滑化処理は、以下の処理を含む。
（１）観測：状態変数をカルマンフィルタ５０（図７）に入力する。ここでは、状態変数は、位置、並進量、および回転量とする（図６、図７）。観測時の誤差は常にあるものとし、その誤差（分散）は既知とする。
（２）予測：１時刻前（時刻ｔ－１）のカルマンフィルタ結果（図７のステップＳ１０３）の状態変数から現時刻（時刻ｔ）の状態変数を予測する（図７のステップＳ１００，Ｓ１０１）。予測時に誤差は常にあるものとし、その誤差（分散）は既知とする。
（３）補正：観測誤差、予測誤差に応じて予測結果が観測結果に近くなるように補正する（図７のステップＳ１０２）。観測誤差、予測誤差が小さければ、観測結果を優先する。観測誤差、予測誤差が大きければ、過去の状態変数からの予測結果を優先する。

　カルマンフィルタ５０で算出した回転量および並進量は、時刻ｔ－１のクラスタから時刻ｔのクラスタまでの回転量、並進量の補正値となる。

（カルマンフィルタ５０によるクラスタの補正について）
　動いているオブジェクトの場合、時々刻々とオブジェクトの形状が変わる。さらにいえば、クラスタの形状が変わる。そのため、その形状変化に対応するために、時刻ｔ－１（１時刻前）のクラスタに対して、カルマンフィルタ結果（並進量、回転量）を反映するのではなく、時刻ｔ（現時刻）のクラスタに対して、カルマンフィルタ結果（並進量、回転量）を反映する（図８のステップＳ２００，Ｓ２０１，Ｓ２０３）。

　具体的に書くと、クラスタ（時刻ｔ）に対して、時刻ｔの観測値（並進量、回転量）を使って、クラスタ（時刻ｔ）を１時刻前相当の状態に戻し、それから、時刻ｔのカルマンフィルタ結果（並進量、回転量）を反映することで補正後クラスタ（時刻ｔ）を生成する。なお、ここでは２つのステップに分けて説明したが、１つのステップにまとめることも可能である。

　このようにして、毎時刻、クラスタの状態（位置、並進量、回転量）を更新していく。時刻ｔ＋１では、時刻ｔと時刻ｔ＋１のクラスタを使って処理する。そのときの時刻ｔのクラスタは補正後クラスタを使う。過去のデータは常に補正後の結果を使用する。

（オブジェクトとして想定している物体）
　第１の実施の形態に係る情報処理装置１による動き検出のターゲットは、人に限らず移動物体すべてがターゲットとなり得る。ただし、オブジェクトを例えば正規分布（２次元でいうと楕円、３次元でいうと楕円球）の集まりとして、並進量、および回転量を算出するため、球形のオブジェクトの回転量の算出は困難である。しかしながら、この後説明するユースケースにおいて、球形のオブジェクトの回転量が求められないことによるデメリットは全くない。

（ユースケース例）
　第１の実施の形態に係る情報処理装置１による動き検出のユースケースは、例えば以下のようなものがある。
１．人（図３）、モノ等のオブジェクトの３Ｄトラッキング
　動き量推定結果から近い未来の位置を算出し、障害物回避などに使用する。
２．群流推定
　図３では、オブジェクトを複数のクラスタに分割したが、分割せず、例えば人、モノ自体を１つのクラスタとして並進量、および回転量を算出することも可能である。この場合にも、１．同様に、障害物回避などに使用可能となる。

（群流推定）
　図９ないし図１１は、第１の実施の形態に係る情報処理装置１において群流推定を行う場合のクラスタリング処理の一例を示している。

　情報処理装置１において、例えば図９（Ａ），（Ｂ）に示したように、クラスタ群単位での並進量の算出として、クラスタ群を構成する要素（人や車自体）を１つのクラスタとみなして、群流推定として使用してもよい。

　また、情報処理装置１において、例えば図１０に示したように、構成要素ごとにクラスタ分けせずに、クラスタ群自体を１つのクラスタとみなして、群流推定として使用することも可能である。

　また、並進量および回転量の時間平滑化の他に、空間フィルタリングと組み合わせることも可能である。例えば、図１１に示したように、重心位置Ｐｔ－１，Ｐｔから、所定の半径内にあるクラスタのみ使用して並進量を算出するようにしてもよい。クラスタ群の全構成要素が全く同じスピードで移動しているとは限らないので、空間フィルタリングを入れることで、推定結果の安定化を図るようにしてもよい。

（オブジェクトの種類ごとのクラスタの設定の仕方や工夫）
　情報処理装置１において、オブジェクトの形状により、クラスタの分割方法を切り替えるようにしてもよい。

　図１２は、第１の実施の形態に係る情報処理装置１におけるクラスタリング処理の一例を示している。

　情報処理装置１では、例えば正規分布（２次元であれば楕円、３次元であれば楕円球の集合）を用いてオブジェクトの形状を表現する。そのため、形状を楕円球としてとらえてよいのであれば、図１２（Ａ）に示したようにクラスタは１つでよいが、より複雑な形状として動き検出を行う場合、図１２（Ｂ）に示したようにクラスタをその分増やす必要がある。オブジェクトを構成するクラスタ数を増やすことにより、各パーツ（クラスタ）の分散が小さくなり（形状の曖昧さが低くなり）、回転精度を高めることができる。回転量の精度を求めないのであれば、１つのクラスタで動き検出を行うことも可能となる。状況に応じて、求める精度によりクラスタ数を適応的に変更するシステムを構築することも可能となる。

（オブジェクトのクラスタ分割例）
　情報処理装置１では、オブジェクトの並進量および回転量の算出のキーとなる部分の形状が残るようにクラスタリングするようにしてもよい。

　図１３ないし図１９は、第１の実施の形態に係る情報処理装置１におけるオブジェクトの種類に応じたクラスタリング処理の一例を示している。図１３ないし図１８は、単体のオブジェクトのクラスタリング処理の一例を示している。図１９は、複数のオブジェクト（複合化されたオブジェクト）を含む場合のクラスタリング処理の一例を示している。

　図１３は、人の並進量および回転量を求める場合のクラスタリング処理の一例を示している。この場合、例えば胴体部分の形状が残るようにクラスタリングする。さらに、例えば頭、腕（本数分）、および足（本数分）の形状が残るようにクラスタリングする。

　図１４は、紙飛行機の並進量および回転量を求める場合のクラスタリング処理の一例を示している。この場合、例えば紙飛行機の上面、および下側面の形状が残るようにクラスタリングする。

　図１５は、人に近い形のロボットの並進量および回転量を求める場合のクラスタリング処理の一例を示している。この場合、例えば胴体と頭、腕（本数分）、および車輪の形状が残るようにクラスタリングする。

　図１６は、太鼓のスティックの並進量および回転量を求める場合のクラスタリング処理の一例を示している。この場合、例えばスティックを１つのクラスタにする。

　図１７は、虫、動物の並進量および回転量を求める場合のクラスタリング処理の一例を示している。この場合、例えば胴体と頭、腕（本数分）、および足（本数分）の形状が残るようにクラスタリングする。

　図１８は、車の並進量および回転量を求める場合のクラスタリング処理の一例を示している。この場合、例えば車体とタイヤ（個数分）の形状が残るようにクラスタリングする。

　図１９は、複合化されたオブジェクトとして人と自転車を含む場合図１９（Ａ）の、並進量および回転量を求める場合のクラスタリング処理の一例を示している。この場合、例えば図１９（Ｂ）に示したように、人の胴体形状を残すことを優先してクラスタリングしてもよい。この場合、さらに、人の頭、腕（本数分）、および足（本数分）と自転車全体の形状が残るようにクラスタリングしてもよい。また、例えば図１９（Ｃ）に示したように、自転車の形状を残すことを優先してクラスタリングしてもよい。この場合、さらに人全体の形状が残るようにクラスタリングしてもよい。

　このように、人も自転車も形状が残るようにクラスタリングしてもよい。ただ、立ちこぎしたり、人の姿勢によって、自転車と人の位置関係が変わるので、安定性を求めるのであれば人と自転車の一方のみを基準として、並進量および回転量を算出する方がよい。

［１．３　変形例］
　以上では、同一のオブジェクトについて、時刻ｔ－１（過去）のオブジェクトを第１のオブジェクト、時刻ｔ（現在）のオブジェクトを第２のオブジェクトとし、動き検出として、時刻ｔのオブジェクトの時刻ｔ－１のオブジェクトに対する並進量および回転量を算出する例を説明した。このような例に限らず、例えば、第１のオブジェクトを、第２のオブジェクトの基準（リファレンス）となるオブジェクトとし、基準となるオブジェクトからの並進量および回転量を算出するようにしてもよい。

　時刻との差分ではなく、Ｒｅｆｅｒｅｎｃｅとの差分を取ることにより、野球やゴルフのスイングや、ピッチングフォームなどのフォームチェック（リファレンスとの差分チェック）に使用することが可能となる。

　図２０は、第１の実施の形態の変形例に係る情報処理装置１による動き検出の手法の概要を示している。

　例えば、オブジェクトの注目箇所をセグメンテーション（図２０（Ａ））し、そのセグメンテーションされた注目箇所について、リファレンスクラスタ（図２０（Ｃ））を用意しておき、そのリファレンスクラスタと実際のクラスタ（図２０（Ｂ））とを比較する（図２０（Ｄ））。これにより算出した回転量および並進量のデータをリファレンスとのズレのデータとして記録媒体等に保存するようにしてもよい。

　図２１は、第１の実施の形態の変形例に係る情報処理装置１における動き検出の処理動作の流れの一例を示すフローチャートである。

　図２１において、ステップＳ１１～Ｓ１６の処理は図５の処理と同様である。情報処理装置１は、ステップＳ１７では、例えば記録媒体等に保存されたリファレンスクラスタの情報を入力し、リファレンスクラスタの情報に基づいて、動き検出の対象となるオブジェクトの回転量および並進量を算出する。その後、情報処理装置１は、リファレンスとの差分のデータを記録媒体等に保存する（ステップＳ２０）。

［１．４　効果］
　以上説明したように、第１の実施の形態に係る情報処理装置１によれば、動き検出の精度と処理速度とを両立させることが可能となる。

　なお、本明細書に記載された効果はあくまでも例示であって限定されるものではなく、また他の効果があってもよい。以降の他の実施の形態の効果についても同様である。

＜２．第２の実施の形態＞
　次に、本開示の第２の実施の形態に係る情報処理装置について説明する。なお、以下では、上記第１の実施の形態に係る情報処理装置の構成要素と略同じ部分については、同一符号を付し、適宜説明を省略する。

　図２２は、本開示の第２の実施の形態に係る情報処理装置１Ａの一構成例を示している。

　第２の実施の形態に係る情報処理装置１Ａは、第１の実施の形態に係る情報処理装置１の構成に対して、オブジェクト検出部２２に代えてオブジェクト分類器２２Ａを備えている。また、情報処理装置１Ａは、情報処理装置１の構成に対して、座標系変換部２４とセグメンテーション処理部２５との間にフレーム補間部２９をさらに備えている。

　オブジェクト分類器２２Ａは、例えば、図１３ないし図１９に示したような種々のオブジェクトの種類を分類する。

　第１の実施の形態において図１３ないし図１９を用いて説明したように、オブジェクトの種類に応じてクラスタリングの方法を変えることでより正確な並進量および回転量を算出することが可能となる。オブジェクト分類器２２Ａは、それを実現するために、オブジェクトの種類を分類する。

　情報処理装置１Ａにおいて、クラスタリング用のセンサ１１とオブジェクト検出用のセンサ１２とではフレームレートの違いが生ずることが考えられる。また、クラスタリング処理部２１によるクラスタリング処理とオブジェクト分類器２２Ａによるオブジェクトの検出処理では、処理レートの違いが生ずることが考えられる。フレーム補間部２９は、このようなフレームレートや処理レートの違いを吸収するためにフレームレートを補間、あるいはフレーム間引き処理を行う。

　また、センサ１１，１２の解像度の違いに合わせてスケーリング、あるいは間引き処理を追加した構成も考えられる。

　また、センサ１１，１２同士は非同期なことが多いので、その対策としての同期処理を行う回路を追加した構成であってもよい。

　その他の構成、動作および効果は、上記第１の実施の形態に係る情報処理装置１と略同様であってもよい。

＜３．その他の実施の形態＞
　本開示による技術は、上記各実施の形態の説明に限定されず種々の変形実施が可能である。

　例えば、本技術は以下のような構成を取ることもできる。
　以下の構成の本技術によれば、第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングする。そして、第１のオブジェクトのクラスタと第２のオブジェクトのクラスタとの３次元的な位置合わせ処理を行うことによって、第２のオブジェクトの第１のオブジェクトに対する並進量および回転量を算出する。これにより、動き検出の精度と処理速度とを両立させることが可能となる。

（１）
　第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングするクラスタリング処理部と、
　前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれについて、前記クラスタごとに前記点群データの位置情報を算出する位置情報算出部と、
　前記第１のオブジェクトの前記位置情報と前記第２のオブジェクトの前記位置情報とに基づいて、前記第１のオブジェクトの前記クラスタと前記第２のオブジェクトの前記クラスタとの３次元的な位置合わせ処理を行うことによって、前記第２のオブジェクトの前記第１のオブジェクトに対する並進量および回転量を算出する移動量算出部と
　を備える
　情報処理装置。
（２）
　前記位置情報は、前記点群データの平均位置および共分散行列の情報を含む
　上記（１）に記載の情報処理装置。
（３）
　前記移動量算出部は、前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの基準位置を所定の原点に位置合わせした後、前記第１のオブジェクトの前記クラスタと前記第２のオブジェクトの前記クラスタとの前記３次元的な位置合わせ処理を行う
　上記（１）または（２）に記載の情報処理装置。
（４）
　前記基準位置は、前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの点群データの重心位置、平均位置、または中央位置である
　上記（３）に記載の情報処理装置。
（５）
　前記位置情報算出部は、前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの前記クラスタに含まれる点群の分布を所定の分布、または所定の形状とみなして前記平均位置および前記共分散行列を算出する
　上記（２）に記載の情報処理装置。
（６）
　前記３次元的な位置合わせ処理は、ＧＩＣＰ（Generalized Iterative Closest Point）に基づく位置合わせ処理である。
　上記（１）ないし（５）のいずれか１つに記載の情報処理装置。
（７）
　前記移動量算出部は、前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの基準位置に基づいて前記第２のオブジェクトの前記第１のオブジェクトに対する粗い並進量を算出し、前記粗い並進量と前記３次元的な位置合わせ処理を行うことによって算出された並進量とを合算して最終的な並進量を算出する
　上記（１）ないし（６）のいずれか１つに記載の情報処理装置。
（８）
　前記移動量算出部は、算出した前記並進量および前記回転量と前記第２のオブジェクトの前記位置情報とに基づいて、前記並進量および前記回転量に対して時間的な平滑化処理を行う
　上記（１）ないし（７）のいずれか１つに記載の情報処理装置。
（９）
　前記移動量算出部は、前記時間的な平滑化処理としてカルマンフィルタを用いた平滑化処理を行う
　上記（８）に記載の情報処理装置。
（１０）
　前記クラスタリング処理部は、前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの種類に基づいて、クラスタの生成数およびクラスタの生成範囲の少なくとも一方を変更する
　上記（１）ないし（９）のいずれか１つに記載の情報処理装置。
（１１）
　前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの種類を分類するオブジェクト分類器、をさらに備える
　上記（１０）に記載の情報処理装置。
（１２）
　前記第２のオブジェクトは、前記第１のオブジェクトに対して所定の時間だけ経過後のオブジェクトである
　上記（１）ないし（１１）のいずれか１つに記載の情報処理装置。
（１３）
　前記第１のオブジェクトは、前記第２のオブジェクトの基準となるオブジェクトである
　上記（１）ないし（１１）のいずれか１つに記載の情報処理装置。
（１４）
　第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングすることと、
　前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれについて、前記クラスタごとに前記点群データの位置情報を算出することと、
　前記第１のオブジェクトの前記位置情報と前記第２のオブジェクトの前記位置情報とに基づいて、前記第１のオブジェクトの前記クラスタと前記第２のオブジェクトの前記クラスタとの３次元的な位置合わせ処理を行うことによって、前記第２のオブジェクトの前記第１のオブジェクトに対する並進量および回転量を算出することと
　を含む
　情報処理方法。
（１５）
　第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングすることと、
　前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれについて、前記クラスタごとに前記点群データの位置情報を算出することと、
　前記第１のオブジェクトの前記位置情報と前記第２のオブジェクトの前記位置情報とに基づいて、前記第１のオブジェクトの前記クラスタと前記第２のオブジェクトの前記クラスタとの３次元的な位置合わせ処理を行うことによって、前記第２のオブジェクトの前記第１のオブジェクトに対する並進量および回転量を算出することと
　を含む処理をコンピュータに実行させる
　プログラム。

　本出願は、日本国特許庁において２０２１年２月１７日に出願された日本特許出願番号第２０２１－２３１８０号を基礎として優先権を主張するものであり、この出願のすべての内容を参照によって本出願に援用する。

　当業者であれば、設計上の要件や他の要因に応じて、種々の修正、コンビネーション、サブコンビネーション、および変更を想到し得るが、それらは添付の請求の範囲やその均等物の範囲に含まれるものであることが理解される。

Claims

　第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングするクラスタリング処理部と、
　前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれについて、前記クラスタごとに前記点群データの位置情報を算出する位置情報算出部と、
　前記第１のオブジェクトの前記位置情報と前記第２のオブジェクトの前記位置情報とに基づいて、前記第１のオブジェクトの前記クラスタと前記第２のオブジェクトの前記クラスタとの３次元的な位置合わせ処理を行うことによって、前記第２のオブジェクトの前記第１のオブジェクトに対する並進量および回転量を算出する移動量算出部と
　を備える
　情報処理装置。
　前記位置情報は、前記点群データの平均位置および共分散行列の情報を含む
　請求項１に記載の情報処理装置。
　前記移動量算出部は、前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの基準位置を所定の原点に位置合わせした後、前記第１のオブジェクトの前記クラスタと前記第２のオブジェクトの前記クラスタとの前記３次元的な位置合わせ処理を行う
　請求項１に記載の情報処理装置。
　前記基準位置は、前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの点群データの重心位置、平均位置、または中央位置である
　請求項３に記載の情報処理装置。
　前記位置情報算出部は、前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの前記クラスタに含まれる点群の分布を所定の分布、または所定の形状とみなして前記平均位置および前記共分散行列を算出する
　請求項２に記載の情報処理装置。
　前記３次元的な位置合わせ処理は、ＧＩＣＰ（Generalized Iterative Closest Point）に基づく位置合わせ処理である。
　請求項１に記載の情報処理装置。
　前記移動量算出部は、前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの基準位置に基づいて前記第２のオブジェクトの前記第１のオブジェクトに対する粗い並進量を算出し、前記粗い並進量と前記３次元的な位置合わせ処理を行うことによって算出された並進量とを合算して最終的な並進量を算出する
　請求項１に記載の情報処理装置。
　前記移動量算出部は、算出した前記並進量および前記回転量と前記第２のオブジェクトの前記位置情報とに基づいて、前記並進量および前記回転量に対して時間的な平滑化処理を行う
　請求項１に記載の情報処理装置。
　前記移動量算出部は、前記時間的な平滑化処理としてカルマンフィルタを用いた平滑化処理を行う
　請求項８に記載の情報処理装置。
　前記クラスタリング処理部は、前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの種類に基づいて、クラスタの生成数およびクラスタの生成範囲の少なくとも一方を変更する
　請求項１に記載の情報処理装置。
　前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれの種類を分類するオブジェクト分類器、をさらに備える
　請求項１０に記載の情報処理装置。
　前記第２のオブジェクトは、前記第１のオブジェクトに対して所定の時間だけ経過後のオブジェクトである
　請求項１に記載の情報処理装置。
　前記第１のオブジェクトは、前記第２のオブジェクトの基準となるオブジェクトである
　請求項１に記載の情報処理装置。
　第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングすることと、
　前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれについて、前記クラスタごとに前記点群データの位置情報を算出することと、
　前記第１のオブジェクトの前記位置情報と前記第２のオブジェクトの前記位置情報とに基づいて、前記第１のオブジェクトの前記クラスタと前記第２のオブジェクトの前記クラスタとの３次元的な位置合わせ処理を行うことによって、前記第２のオブジェクトの前記第１のオブジェクトに対する並進量および回転量を算出することと
　を含む
　情報処理方法。
　第１のオブジェクトの３次元的な点群データおよび第２のオブジェクトの３次元的な点群データのそれぞれを、少なくとも１つのクラスタにクラスタリングすることと、
　前記第１のオブジェクトおよび前記第２のオブジェクトのそれぞれについて、前記クラスタごとに前記点群データの位置情報を算出することと、
　前記第１のオブジェクトの前記位置情報と前記第２のオブジェクトの前記位置情報とに基づいて、前記第１のオブジェクトの前記クラスタと前記第２のオブジェクトの前記クラスタとの３次元的な位置合わせ処理を行うことによって、前記第２のオブジェクトの前記第１のオブジェクトに対する並進量および回転量を算出することと
　を含む処理をコンピュータに実行させる
　プログラム。