JP2019074478A - 識別装置、識別方法およびプログラム - Google Patents

識別装置、識別方法およびプログラム Download PDF

Info

Publication number
JP2019074478A
JP2019074478A JP2017202080A JP2017202080A JP2019074478A JP 2019074478 A JP2019074478 A JP 2019074478A JP 2017202080 A JP2017202080 A JP 2017202080A JP 2017202080 A JP2017202080 A JP 2017202080A JP 2019074478 A JP2019074478 A JP 2019074478A
Authority
JP
Japan
Prior art keywords
tensor
feature
multidimensional
complex
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017202080A
Other languages
English (en)
Inventor
素子 加賀谷
Motoko Kagaya
素子 加賀谷
前野 蔵人
Kurato Maeno
蔵人 前野
山本 康平
Kohei Yamamoto
康平 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2017202080A priority Critical patent/JP2019074478A/ja
Publication of JP2019074478A publication Critical patent/JP2019074478A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Radar Systems Or Details Thereof (AREA)

Abstract

【課題】あらかじめ閾値を設定せずとも、高精度に物体を識別することを可能とする技術が提供されることが望まれる。【解決手段】センサによる計測に基づいて複素数の多次元テンソルを取得する取得部と、前記複素数の多次元テンソルに基づく畳込み処理および次元圧縮それぞれを複数回行ってテンソル要素の特徴を抽出する特徴抽出部と、前記テンソル要素の特徴の次元を逆畳込み処理によって前記多次元テンソルの次元まで拡張して再拡張多次元テンソルを生成する拡張部と、前記再拡張多次元テンソルのテンソル要素ごとにクラスを識別することによって領域分割を行う領域分割部と、を備える、識別装置が提供される。【選択図】図2

Description

本発明は、識別装置、識別方法およびプログラムに関する。
近年、レーダによる計測が利用されている。レーダによる計測は、アンテナから送信された電波が物体に当たって反射した場合、その反射波の位相シフトを解析することによって可能となる。例えば、FM−CW(Frequency-Modulated continuous wave)レーダでは、ビート信号の周波数はアンテナから物体までの距離に比例するため、信号強度が大きい周波数に対応する距離に物体があると判断することができる。
しかし、物体からの直接の反射波だけではなく、当該物体から他の物体を経由した反射波が受信されてしまう場合も想定される。このような場合には、当該他の物体を経由した反射波に基づく計測によって、実際には物体が存在しない場所に物体があると誤認識されてしまうという偽像(「ゴースト」とも言う。)発生の問題が生じ得る。また、偽像はフーリエ変換のサイドローブによっても発生し得る。
ここで、偽像を除去または抑制するための技術として、様々な技術が開示されている。例えば、第1の間隔で配置された複数の受信アンテナ素子での受信信号の位相差から求めた反射波の到来方向と、第1の間隔とは異なる第2の間隔で配置された複数の受信アンテナ素子での受信信号の位相差から求めた反射波の到来方向とが一致するか否かによって、偽像が発生していないか否かを判定する技術が開示されている(例えば、特許文献1参照)。
また、電波の送信信号と電波の反射波の受信信号とからビート信号を生成し、ビート信号のピーク周波数における振幅値(信号強度)とピーク周波数とに基づいて、物標の存在確率を測定サイクル毎に算出し、算出した存在確率が所定値に達したか否かに応じて、偽像が発生していないか否かを判定する技術が開示されている(例えば、特許文献2参照)。
特開2000−230974号公報 特開2009−210337号公報
既に開示されている上記技術などにおいては、ビート信号のピーク周波数の振幅値と閾値との比較結果に基づいて、偽像が発生していないか否かを判定する必要がある。しかし、ビート信号のピーク周波数における振幅値は、電波を反射する物体(反射物体)の材質、電波を反射する部分の面積(反射断面積)、アンテナと物体との距離などによって変化する可能性がある。そのため、あらゆる状況に適用可能な閾値を設定するのが困難である。
そこで、あらかじめ閾値を設定せずとも、高精度に物体を識別することを可能とする技術が提供されることが望まれる。
上記問題を解決するために、本発明のある観点によれば、センサによる計測に基づいて複素数の多次元テンソルを取得する取得部と、前記複素数の多次元テンソルに基づく畳込み処理および次元圧縮それぞれを複数回行ってテンソル要素の特徴を抽出する特徴抽出部と、前記テンソル要素の特徴の次元を逆畳込み処理によって前記多次元テンソルの次元まで拡張して再拡張多次元テンソルを生成する拡張部と、前記再拡張多次元テンソルのテンソル要素ごとにクラスを識別することによって領域分割を行う領域分割部と、を備える、識別装置が提供される。
前記特徴抽出部は、前記複素数の多次元テンソルの各テンソル要素の絶対値に対して畳込み処理および次元圧縮それぞれを複数回行ってよい。
前記特徴抽出部は、前記複素数の多次元テンソルの各テンソル要素自体に対して畳込み処理および次元圧縮それぞれを複数回行うことによって複素数によるテンソル要素の特徴を抽出し、前記複素数によるテンソル要素の特徴を実数によるテンソル要素の特徴に変換してよい。
前記領域分割部は、前記テンソル要素ごとのクラスの識別結果に基づいて、物体と偽像とを区別してよい。
前記取得部は、前記センサによる計測に基づく2次元情報に対応付けられた複素信号を各テンソル要素として有する前記複素数の多次元テンソルを取得してよい。
前記2次元情報は、前記センサを基準とした物体までの距離と角度との組み合わせ、または、前記センサを基準とした物体までの距離と前記物体の速度との組み合わせによって構成されてよい。
前記特徴抽出部は、学習処理によって得られたパラメータを前記畳込み処理に利用してよい。
前記特徴抽出部は、高分解能化処理に基づいて生成された教師データを用いた学習処理によって得られたパラメータを前記畳込み処理に利用してよい。
前記特徴抽出部は、テンソル要素の特徴数をクラスの数に合わせ、前記拡張部は、前記クラスの数に特徴数が合わせられたテンソル要素の特徴の次元を拡張してよい。
また、本発明の別の観点によれば、センサによる計測に基づいて複素数の多次元テンソルを取得することと、前記複素数の多次元テンソルに基づく畳込み処理および次元圧縮それぞれを複数回行ってテンソル要素の特徴を抽出することと、前記テンソル要素の特徴の次元を逆畳込み処理によって前記多次元テンソルの次元まで拡張して再拡張多次元テンソルを生成することと、前記再拡張多次元テンソルのテンソル要素ごとにクラスを識別することによって領域分割を行うことと、を含む、識別方法が提供される。
また、本発明の別の観点によれば、コンピュータを、センサによる計測に基づいて複素数の多次元テンソルを取得する取得部と、前記複素数の多次元テンソルに基づく畳込み処理および次元圧縮それぞれを複数回行ってテンソル要素の特徴を抽出する特徴抽出部と、前記テンソル要素の特徴の次元を逆畳込み処理によって前記多次元テンソルの次元まで拡張して再拡張多次元テンソルを生成する拡張部と、前記再拡張多次元テンソルのテンソル要素ごとにクラスを識別することによって領域分割を行う領域分割部と、を備える識別装置として機能させるためのプログラムが提供される。
以上説明したように本発明によれば、あらかじめ閾値を設定せずとも、高精度に物体を識別することを可能とする技術が提供される。
偽像の発生を説明するための図である。 第1の実施形態に係る識別装置の構成例を示す図である。 信号マップの絶対値を画像化した一例を示す図である。 第1の実施形態に係るクラス識別の処理例を示すフローチャートである。 学習処理に利用される信号マップの絶対値が画像化された一例を示す図である。 図5に示した画像に対応する教師データの例を示す図である。 第2の実施形態に係る識別装置の構成例を示す図である。 第2の実施形態に係るクラス識別の処理例を示すフローチャートである。 本発明の実施形態に係る識別装置の例としての情報処理装置のハードウェア構成を示す図である。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、本明細書および図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なる数字を付して区別する場合がある。ただし、実質的に同一の機能構成を有する複数の構成要素等の各々を特に区別する必要がない場合、同一符号のみを付する。また、異なる実施形態の類似する構成要素については、同一の符号の後に異なるアルファベットを付して区別する場合がある。ただし、異なる実施形態の類似する構成要素等の各々を特に区別する必要がない場合、同一符号のみを付する。
(0.概略)
近年、レーダによる計測が利用されている。レーダによる計測は、アンテナから送信された電波が物体に当たって反射した場合、その反射波の位相シフトを解析することによって可能となる。例えば、FM−CWレーダでは、ビート信号の周波数はアンテナから物体までの距離に比例するため、信号強度が大きい周波数に対応する距離に物体があると判断することができる。しかし、かかる技術によれば、実際には物体がない場所に物体があると誤認識されてしまうという偽像発生の問題が生じ得る。以下、偽像の発生について、図面を参照しながら説明する。
図1は、偽像の発生を説明するための図である。図1を参照すると、実空間に物体91が存在している。また、実空間には他の物体90も存在している。ここで、物体91からの直接の反射波が受信されれば、その反射波の位相シフトを解析することによって、物体91が存在する位置を正常に認識することが可能である。しかし、図1に示したように、実際には物体91からの反射波が他の物体90を経由して受信されてしまう場合も想定される。
このような場合には、他の物体90を経由した反射波に基づく計測によって、実際には物体91が存在しない場所(図1に示した例では、偽像92が存在する場所)に物体91があると誤認識されてしまうという偽像発生の問題が生じ得る。また、偽像はフーリエ変換のサイドローブによっても発生し得る。
ここで、偽像を除去または抑制するための技術としては、既に説明したように様々な技術が開示されている。既に開示されている上記技術などにおいては、ビート信号のピーク周波数の振幅値と閾値との比較結果に基づいて、偽像が発生していないか否かを判定する必要がある。しかし、ビート信号のピーク周波数における振幅値は、電波を反射する物体(反射物体)の材質、電波を反射する部分の面積(反射断面積)、アンテナと物体との距離などによって変化する可能性がある。そのため、あらゆる状況に適用可能な閾値を設定するのが困難である。
そこで、本明細書においては、閾値をあらかじめ設定せずとも、高精度に物体を識別することを可能とする技術について主に説明する。
(1.第1の実施形態)
まず、第1の実施形態について説明する。
(1.1.構成)
第1の実施形態に係る識別装置10Aの構成例について説明する。
図2は、第1の実施形態に係る識別装置10Aの構成例を示す図である。図2に示すように、第1の実施形態に係る識別装置10Aは、送受信部111、取得部112、特徴抽出部113A、拡張部114および領域分割部115を備える。ここで、送受信部111は、センサによる計測を行い、計測結果を取得部112に出力する。そして、取得部112は、センサによる計測に基づいて複素数の多次元テンソルを取得する。
特徴抽出部113Aは、複素数の多次元テンソルに基づく畳込み処理および次元圧縮それぞれを複数回行ってテンソル要素の特徴を抽出する。拡張部114は、テンソル要素の特徴の次元を逆畳込み処理によって前記多次元テンソルの次元まで拡張して再拡張多次元テンソルを生成する。領域分割部115は、再拡張多次元テンソルのテンソル要素ごとにクラスを識別することによって領域分割を行う。
センサの種類は、特に限定されない。以下では、電波を用いたレーダ技術が用いられる場合を主に説明する。かかる場合には、電波を送信するアンテナ(送信アンテナ)と電波を受信するアンテナ(受信アンテナ)とを有するレーダがセンサに該当し得る。しかし、電波を用いたレーダ技術の代わりに、他の技術が用いられてもよい。例えば、電波を用いたレーダ技術の代わりに、音波を用いたソナー技術などが用いられてもよい。音波を用いたソナー技術が用いられる場合、音波受信器がセンサに該当し得る。
以下では、取得部112が、センサによる計測に基づく2次元情報に対応付けられた複素信号を各テンソル要素として有する複素数の多次元テンソルを取得する場合を主に説明する。センサによる計測に基づく2次元情報の種類は、特に限定されない。以下では、センサによる計測に基づく2次元情報が、センサから物体までの距離と角度との組み合わせによって構成される場合を主に説明する。しかし、センサによる計測に基づく2次元情報は、センサから物体までの距離と物体の速度との組み合わせによって構成されてもよい。
センサから物体までの距離は、どのようにして求められてもよい。例えば、センサから物体までの距離は、送信アンテナから送信された電波が物体で反射して受信アンテナによって受信されるまでの伝搬遅延から求められてもよい。あるいは、センサから物体までの距離は、周波数が異なる複数の電波が送信された場合、各電波の物体からの反射波によるドップラー信号の位相に基づいて求められてもよい。あるいは、センサから物体までの距離は、送信波の周波数を連続的に変化させ、物体での反射による伝搬遅延に基づき生じる周波数差から求められてもよい。
センサから物体までの角度(方位)は、どのようにして求められてもよい。センサから物体までの角度は、複数のアンテナ間の位相差またはパワー差から求められてもよい。あるいは、センサから物体までの角度は、指向性を有した電波(ビーム)を形成し、形成したビームを電子的または機械的に動かしながら送信した場合に、物体から反射されて検出されるビームの方向に基づいて検出されてもよい。
特に、第1の実施形態においては、特徴抽出部113Aが、複素数の多次元テンソルの各テンソル要素の絶対値に対して畳込み処理および次元圧縮それぞれを複数回行う場合を説明する。各テンソル要素の絶対値は、センサによる計測に基づく2次元情報(例えば、センサによる計測に基づく距離および角度)に対応付けられた複素信号の振幅値(信号強度)に該当し得る。
以上、第1の実施形態に係る識別装置10Aの構成例について説明した。
(1.2.動作)
続いて、第1の実施形態に係る識別装置10Aの動作例について説明する。まず、送受信部111は、送信アンテナによって電波(送信信号)を送信し、送信アンテナによって送信した電波の反射波(受信信号)を受信アンテナによって受信する。送信アンテナの数は、1つであってもよいが、複数であるのがよい。また、受信アンテナの数は、1つであってもよいが、複数であるのがよい。
複数の送信アンテナおよび複数の受信アンテナがMIMO(Multiple Input Multiple Output)レーダに用いられた場合、仮想的なアレイアンテナが構成され、角度の検知分解能が向上され得ることが知られている。MIMOレーダの仮想的なアレイアンテナの構成については、以下の参考文献1を参照されたい。
参考文献1:菅原 博樹(日本無線株式会社)「電波環境適応レーダーの研究開発」,電波資源拡大のための研究開発,第7回成果発表会,2014年
取得部112は、送受信部111によって送信された電波(送信信号)と送受信部111によって受信された反射波(受信信号)とをミキシング処理することによって、ビート信号br,tを得る。ここで、tは、サンプリング時刻を示し、rは、仮想アレイの並び順の番号を示す。そして、取得部112は、得られたビート信号br,tを、下記の(数式1)および(数式2)によって、距離d−角度θの2次元の(N,M)行列に変換する。
Figure 2019074478
ここで、Nは、距離方向の信号サンプル数を示し、Mは、角度方向の信号サンプル数を示し、Kは、仮想的な受信アレイアンテナの数を示す。
以上のように、取得部112は、ビート信号br,tを距離d−角度θの2次元平面に分解することによって2次元の(N,M)行列を得る。2次元の(N,M)行列は、複素数を要素として有している(すなわち、2次元の(N,M)行列は、複素信号を各テンソル要素として有する多次元テンソルの一例に相当し得る)。以下では、この2次元の(N,M)行列を「信号マップ」と呼ぶこともある。
ここで、信号マップB(d,θ)の各要素(複素数)の絶対値は振幅値(信号強度)を示している。図3は、信号マップb(d,θ)の絶対値を画像化した一例を示す図である。図3を参照すると、画像70−1が示されている。画像70−1の縦軸は、レーダ中心方向からの角度に相当し、画像70−1の横軸は、レーダからの距離に相当する。また、画像70−1において、物体からの反射波の強度が大きい領域ほど、輝度が高くなっている(白っぽくなっている)。一方、物体からの反射波の強度が小さい領域ほど、輝度が低くなっている(黒っぽくなっている)。
より具体的に、画像70−1において、物体からの反射波の強度の最も大きい領域71−1は、実際に物体が存在する領域である(すなわち、物体からの直接の反射波の受信によって輝度が最も高くなっている)。一方、画像70−1において、物体からの反射波の強度が大きい他の領域72−1〜72−3は、偽像が発生した領域である(すなわち、物体から他の物体を経由した反射波の受信によって輝度が高くなっている)。
画像70−1から把握されるように、実際に物体が存在する領域71−1の信号強度は大きい値を示すこととなる。一方、画像70−1から把握されるように、実際には物体が存在しない領域72−1〜72−3の信号強度も、偽像の発生によって大きめの値を示してしまうこととなる。
続いて、信号マップが有する要素(座標)ごとにクラスが識別される。クラスの種類は特に限定されない。以下では、クラスの種類として、物体に対応するクラスと背景に対応するクラスを主に想定する。背景は、対象とする物体が存在しない領域であり、偽像が発生している領域も含み得る。かかる場合には、領域分割部115は、クラスの識別結果に基づいて、物体と偽像とを区別することができる。また、以下においても説明するように、物体の種類は、1つであってもよいし、複数であってもよい。物体の種類が複数である場合、複数の種類それぞれの物体に対応するクラスが存在してよい。
以下、クラス識別の処理例について詳細に説明する。なお、以下で説明するクラス識別の処理例は、以下の参考文献2に記載されたFully convolutional network(FCN)をもとにした手法である。すなわち、参考文献2に記載されたFully convolutional network(FCN)は、画像のピクセル単位にクラスを識別する手法であり、本実施形態に係るクラス識別の処理例は、この画像のピクセル単位にクラスを識別する手法と同様の考え方を信号マップに適用したものである。
参考文献2:Long, Jonathan,
Evan Shelhamer, and Trevor Darrell. "Fully convolutional networks for
semantic segmentation." Proceedings of the IEEE Conference on Computer
Vision and Pattern Recognition. 2015.
図4は、第1の実施形態に係るクラス識別の処理例を示すフローチャートである。まず、特徴抽出部113Aは、取得部112によって得られた信号マップB(d,θ)(ただし、1≦d≦N,1≦θ≦M)を取得する(P001)。続いて、特徴抽出部113Aは、信号マップB(d,θ)の絶対値を算出することによって、絶対値|B(d,θ)|を取得する(P002)。|B(d,θ)|は、2次元行列に該当する。そして、特徴抽出部113Aは、2次元行列|B(d,θ)|に対して畳込みフィルタの適用による畳込み処理(P003)とd軸およびθ軸の各方向の次元圧縮(P004)とを複数回行う。
次元圧縮(P004)においては、MaxPoolingなどのプーリングが行われてもよい。また、次元圧縮は、畳込み処理のストライド幅を2以上の整数とすることによって行われてもよい。参考文献2に記載された例では、d軸およびθ軸の各方向のサイズが1/2となるように次元圧縮が行われているが、次元圧縮の度合いは限定されない。
また、図4に示した例では、畳込み処理(P003)と次元圧縮(P004)とが交互にそれぞれ複数回行われている。しかし、畳込み処理および次元圧縮それぞれが複数回行われればよく、複数回の畳込み処理が連続的に行われてもよい。参考文献2に記載された例では、d軸およびθ軸の各方向のサイズが1/32となるように、サイズを1/2にする次元圧縮が5回行われているが、畳込み処理および次元圧縮それぞれの回数も限定されない。
上記したようにして、畳込み処理および次元圧縮それぞれが複数回行われることによって、複素数(テンソル要素)の特徴が抽出される(ここでは、複素数(テンソル要素)の特徴が実数として抽出される)。以下では、信号マップに基づいて抽出された特徴を「特徴マップ」とも言う。ここで、特徴マップのテンソルの次元を、(l,n,m)と表すことにする。lは、特徴マップの次元数(テンソル要素の特徴数)を示し、nは、特徴マップの距離方向の次元数を示し、mは、特徴マップの角度方向の次元数を示す。
このとき、識別可能なクラスの数がnclであり、特徴マップの次元数lとクラス数nclとが異なる場合が存在し得る。かかる場合には、特徴抽出部113Aは、特徴マップの次元数を変更する(P005)。具体的に、特徴抽出部113Aは、特徴マップの次元数lをクラス数nclに合わせることによって、特徴マップの次元数を変更する。これによって、特徴マップのテンソルの次元(l,n,m)が(ncl,n,m)に変更される。
このような特徴マップの次元数の変更は、1回の畳込み処理によって実現されてもよい。あるいは、特徴マップの次元数の変更は、出力次元を(k,n,m)(ただし、m≠ncl)とする畳込み処理が複数回行われた後に、出力次元を(ncl,n,m)とする畳込み処理が行われることによって実現されてもよい。
続いて、拡張部114は、特徴マップの距離dおよび角度θそれぞれの軸方向の次元を復元させる(P006)。具体的に、拡張部114は、テンソルの次元が(ncl,n,m)である特徴マップに基づいて、特徴マップの距離方向および角度方向の次元(テンソル要素の特徴の次元)を逆畳込み処理(Deconvolution)によって、P001において取得された信号マップ(多次元テンソル)の次元まで拡張する。これによって、次元再拡張後の特徴マップ(再拡張多次元テンソル)が生成され、特徴マップのテンソルの次元は、(ncl,n,m)から(ncl,N,M)に変更される。
続いて、領域分割部115は、テンソルの次元が(ncl,N,M)に変更された特徴マップのテンソル要素ごとにクラスを識別することによって領域分割を行う。まず、領域分割部115は、テンソルの次元が(ncl,N,M)に変更された特徴マップの各テンソル要素をSoftmax関数などによって0以上1以下の値に変換する。これによって、特徴マップの各次元に対応して各(d,θ)における識別確率が算出される(P007)。なお、Softmax関数の詳細については、以下の参考文献3を参照されたい。
参考文献3:斎藤 康毅,"ゼロから作るDeep Learning-Pythonで学ぶディープラーニングの理論と実装",O'Reill出版,pp66-71
続いて、領域分割部115は、特徴マップの各次元に対応して存在する各(d,θ)における識別確率に基づいて、(d,θ)ごとに識別確率が最大となる特徴マップの次元を検出する。特徴マップの各次元に対しては、あらかじめクラスが対応付けられている。そこで、領域分割部115は、(d,θ)ごとに識別確率が最大となる特徴マップの次元を検出すと、検出した特徴マップの次元に対応するクラスを(d,θ)ごとに識別し、識別結果として出力する(P008)。
上記したように、クラスの種類は特に限定されない。ここでは、クラスの種類として、物体に対応するクラスと背景に対応するクラスを主に想定する。背景は、対象とする物体が存在しない領域であり、偽像が発生している領域も含み得る。また、物体の種類は、1つであってもよいし、複数であってもよい。物体の種類が複数である場合、複数の種類それぞれの物体に対応するクラスが存在してよい。
例えば、クラスの種類として、物体に対応するクラスと背景に対応するクラスとを想定する場合には、物体に対応するクラス1つと背景に対応するクラス1つとの合計2つがクラス数nclとなる。さらに、物体の種類として、人、車、および、自転車の3種類を想定する場合には、物体に対応するクラス3つと背景に対応するクラス1つとの合計4つが、クラス数nclとなる。
以上、信号マップの各座標(d,θ)(ただし、1≦d≦N,1≦θ≦M)におけるクラス識別の処理例について詳細に説明した。このような推論時におけるクラス識別がなされる前には、畳込みフィルタのパラメータ(例えば、重み、バイアスなど)などがあらかじめ学習される必要がある。すなわち、特徴抽出部113Aは、学習処理によって得られたパラメータを畳込み処理に利用する。このような学習処理には、信号マップの座標に対してクラスの対応付け(ラベル付け)がなされた教師データが必要となる。
図5は、学習処理に利用される信号マップの絶対値が画像化された一例を示す図である。図5を参照すると、画像70−2が示されている。図3に示した画像70−1と同様に、画像70−2の縦軸は、レーダ中心方向からの角度に相当し、画像70−2の横軸は、レーダからの距離に相当する。また、画像70−2において、物体からの反射波の強度が大きい領域ほど、輝度が高くなっている。一方、物体からの反射波の強度が小さい領域ほど、輝度が低くなっている。
より具体的に、画像70−2において、物体からの反射波の強度の最も大きい領域71−2は、実際に物体が存在する領域である。また、画像70−2において、物体からの反射波の強度が次に大きい領域71−3も、実際に物体が存在する領域である。一方、画像70−2において、物体からの反射波の強度が次に大きい領域72−4は、偽像が発生した領域である。
図6は、図5に示した画像70−2に対応する教師データの例を示す図である。図6を参照すると、教師データ80が示されている。図5を参照しながら説明したように、領域71−2と領域71−3とは、実際に物体が存在する領域である。したがって、領域71−2および領域71−3それぞれの座標には、物体に対応するクラスが対応付けられるのがよい。図6に示した教師データ80を参照すると、領域81−1および領域81−2それぞれに対して、物体に対応するクラスのラベルが付されている。
一方、図5を参照しながら説明したように、領域72−4は、偽像が発生した領域である。したがって、領域72−4の座標には、物体に対応するクラスが対応付けられなくてよい。図6に示した教師データ80を参照すると、偽像が発生した領域72−4(図5)に対応する領域に対しては、物体に対応するクラスのラベルが付されていない。
このように、信号マップには偽像が発生した領域が存在し得る。そのため、教師データの生成は、人手を用いたとしても困難な場合もあり得る。そこで、教師データの生成には、以下の参考文献4に記載された手法が適用されてもよい。これによって、精度の高い教師データが生成され得る。
参考文献4:特願2017−061420の出願明細書
さらに、教師データが生成されるに際しては、信号マップ生成時に下記の参考文献5に記載されているような角度方向の高分解能化処理を適用しておいてもよい。そうすれば、高分解能な教師データが生成され得る。このとき、特徴抽出部113Aは、高分解能化処理に基づいて生成された教師データを用いた学習処理によって得られたパラメータを畳込み処理に利用してよい。これによって、より高精度なクラス識別が可能となる。
参考文献5:Y.Wakamatsu, H.
Yamada, Y.Yamaguchi, "MIMO Doppler radar using Khatri-Rao product virtual
array for human location estimation", in Electromagnetics of the 2014 IEEE
International Workshop on, 2014.
なお、高分解能化処理が適用された場合には、高分解能化処理に相当する分の演算量が増大してしまう。しかし、高分解能な教師データを用いた学習処理によって得られたパラメータを推論時に利用するようにすれば、推論時において高分解能化処理は適用されなくとも、クラスの識別結果を高分解能化することが可能となる。
上記した学習処理は、教師データと上記したP001〜P008が実行された結果として出力される識別結果(座標ごとに識別されたクラス)とに基づいて行われる。例えば、学習処理は、SoftmaxCrossEntropyを用いて、教師データと識別結果との誤差を逆伝播することによって行われてよい。SoftmaxCrossEntropyの詳細は、上記した参考文献3を参照されたい。
(1.3.効果)
第1の実施形態によれば、信号マップの振幅値(信号強度)に対する畳込み処理によって、高精度にクラス識別が可能となる。推論時における畳込み処理に利用される畳込みフィルタには、信号マップの信号強度の分布パターンの学習処理によって得られたパラメータが利用され得る。これによって、信号マップの振幅値(信号強度)の閾値があらかじめ設定されなくても、高精度にクラス識別が可能となる。したがって、クラスを識別する機能を有する識別器(識別装置)の設計が容易となる。
以上、第1の実施形態について説明した。
(2.第2の実施形態)
続いて、第2の実施形態について説明する。
(2.1.構成)
まず、第2の実施形態に係る識別装置10Bの構成例について説明する。
図7は、第2の実施形態に係る識別装置10Bの構成例を示す図である。図2および図7に示すように、第2の実施形態に係る識別装置10Bは、第1の実施形態に係る識別装置10Aと比較して、特徴抽出部113Aの代わりに、特徴抽出部113Bを有する点において異なっている。したがって、第2の実施形態に係る特徴抽出部113Bについて主に説明し、他の構成についての詳細な説明は省略する。
第2の実施形態においても、特徴抽出部113Bは、複素数の多次元テンソルに基づく畳込み処理および次元圧縮それぞれを複数回行ってテンソル要素の特徴を抽出する。特に、第2の実施形態においては、特徴抽出部113Bが、複素数の多次元テンソルの各テンソル要素自体に対して畳込み処理および次元圧縮それぞれを複数回行うことによって複素数によるテンソル要素の特徴を抽出し、複素数によるテンソル要素の特徴を実数によるテンソル要素の特徴に変換する場合を説明する。
具体的に、第1の実施形態においては、複素数の信号マップの絶対値に対する畳込み処理によってクラス識別を行う場合を説明した。信号マップの絶対値は、信号マップの振幅値(信号強度)に相当する。しかし、移動物体からの反射波がレーダによって受信される場合には、反射波の位相が変化することが想定される。そこで、信号マップの位相には、各座標(d,θ)(ただし、1≦d≦N,1≦θ≦M)の間を埋める角度または距離に関する情報が含まれていると考えられる。
したがって、信号マップの絶対値だけではなく、信号マップの位相も考慮したほうが物体の存否をより高精度に識別可能になることが想定される。そこで、第2の実施形態においては、信号マップの絶対値だけではなく、信号マップの位相も考慮してクラス識別を行うことによって、さらに高精度に物体を識別することを可能とする技術を説明する。
以上、第2の実施形態に係る識別装置10Bの構成例について説明した。
(2.2.動作)
続いて、第2の実施形態に係る識別装置10Bの動作例について説明する。図8は、第2の実施形態に係るクラス識別の処理例を示すフローチャートである。第1の実施形態と同様にして、特徴抽出部113Bは、取得部112によって得られた複素数の信号マップB(d,θ)(ただし、1≦d≦N,1≦θ≦M)を取得する(P101)。続いて、特徴抽出部113Bは、複素数の信号マップB(d,θ)に対して複素畳込みフィルタの適用による畳込み処理(P102)とd軸およびθ軸の各方向の次元圧縮(P103)とを複数回行う。
次元圧縮(P103)は、畳込み処理のストライド幅を2以上の整数とすることによって行われてもよい。参考文献2に記載された例では、d軸およびθ軸の各方向のサイズが1/2となるように次元圧縮が行われているが、次元圧縮の度合いは限定されない。
また、図8に示した例では、畳込み処理(P102)と次元圧縮(P103)とが交互にそれぞれ複数回行われている。しかし、畳込み処理および次元圧縮それぞれが複数回行われればよく、複数回の畳込み処理が連続的に行われてもよい。畳込み処理および次元圧縮それぞれの回数も限定されない。
上記したようにして、畳込み処理および次元圧縮それぞれが複数回行われることによって、複素数(テンソル要素)の特徴が抽出される。ここでは、複素数(テンソル要素)の特徴が複素数として抽出される。すなわち、複素数からなる特徴マップ(以下、「複素数特徴マップ」とも言う。)が抽出される。特徴抽出部113Bは、複素数特徴マップを実数からなる特徴マップ(以下、「実数特徴マップ」とも言う。)に変換する(P104)。
例えば、特徴抽出部113Bは、複素数特徴マップの実部と虚部とを分けることによって、複素数特徴マップを実数特徴マップに変換する。例えば、複素数特徴マップのテンソルの次元が(k,da,θa)である場合、複素数特徴マップの実部と虚部とを分けられることによって、テンソルの次元が(2k,da,θa)である実数特徴マップが得られる。なお、複素数特徴マップから実数特徴マップへの変換の処理としては、下記の参考文献5に記載された手法を利用することができる。
参考文献5:特願2017−044846の出願明細書
続いて、図8に示したP105〜P110が実行される。しかし、図8に示したP105〜P110は、図4に示したP003〜P008と同じである。したがって、図8に示したP105〜P110についての詳細な説明は省略する。
以上、信号マップの各座標(d,θ)(ただし、1≦d≦N,1≦θ≦M)におけるクラス識別の処理例について詳細に説明した。第2の実施形態においても、第1の実施形態と同様にして、推論時におけるクラス識別がなされる前には、畳込みフィルタのパラメータ(例えば、重み、バイアスなど)などがあらかじめ学習される必要がある。
第2の実施形態に係る学習処理は、教師データと上記したP101〜P110が実行された結果として出力される識別結果(座標ごとに識別されたクラス)とに基づいて行われる。このとき、第2の実施形態においても、第1の実施形態と同様に、SoftmaxCrossEntropyを用いて、教師データと識別結果との誤差を逆伝播することによって、学習処理が行われてよい。その他、第2の実施形態に係る学習処理(例えば、教師データの生成など)は、第1の実施形態と同様に行われてよい。
(2.3.効果)
第2の実施形態によれば、複素数の信号マップB(d,θ)それ自体に対する複素畳込み処理によって、複素数特徴マップを得た後、複素数特徴マップを実数特徴マップに変換し(複素数特徴マップを複素数から実数への変換層に通す)、実数特徴マップに基づいてクラス識別を行う。これによって、信号マップの絶対値だけではなく、信号マップの位相も考慮されてクラス識別がされるため、物体の存否をより高精度に識別可能となり、さらに高精度に物体を識別することが可能となる。
推論時における複素畳込み処理(P102)に利用される複素畳込みフィルタには、信号マップの位相の分布パターンの学習処理によって得られたパラメータが利用され得る。これによって、学習処理において、信号マップの振幅値(信号強度)の誤差だけではなく、信号マップの位相の誤差も、複素畳込みフィルタのパラメータに反映され、さらに高精度に物体を識別することが可能となる。また、振幅雑音に対して堅牢となることが期待される。
以上、第2の実施形態について説明した。
(3.第3の実施形態)
続いて、第3の実施形態について説明する。ここで、第1の実施形態および第2の実施形態においては、1つのサンプリング時刻tにおける信号マップB(d,θ)(ただし、1≦d≦N,1≦θ≦M)が用いられる例を主に説明した(P001,P101)。すなわち、第1の実施形態および第2の実施形態においては、信号マップのテンソルの次元は、(1,N,M)であった。
しかし、1つのサンプリング時刻tにおける信号マップが用いられる場合には、信号マップに時間的な変化が含まれないため、信号マップを時系列な情報として扱うことができない。信号マップを時系列な情報として扱うことができない場合、移動物体と静止物体との区別を行うのが困難となり得る。そのため、移動物体を物体として認識し、静止物体を背景として認識したい場合などには(移動物体のみを物体として認識したい場合などには)、信号マップから静止物体をあらかじめ除去しておく必要が生じる。
そこで、第3の実施形態においては、識別対象の時刻tの前後数時間分の信号マップを用いる。これによって、信号マップに時間的な変化が含まれるようになるため(信号マップに含まれる時間的な変化も学習処理に利用されるようになるため)、移動物体と静止物体との区別を行うのが可能となる。そのため、移動物体を物体として認識し、静止物体を背景として認識したい場合であっても、信号マップから静止物体をあらかじめ除去する必要がなくなる。
具体的に、第3の実施形態においては、第1の実施形態および第2の実施形態において利用される信号マップ(具体的には、P001およびP101において取得される信号マップ)を、下記の(数式3)に示すような信号マップBt+k(d,θ)に変更すればよい。なお、第1の実施形態および第2の実施形態における信号マップB(d,θ)が、(数式3)に示す信号マップBt+k(d,θ)に変更された場合、信号マップのテンソルの次元は、(1,N,M)から(2m+1,N,M)に変更される。
Figure 2019074478
以上、第3の実施形態について説明した。
(4.ハードウェア構成例)
続いて、本発明の実施形態に係る識別装置10のハードウェア構成例について説明する。以下では、本発明の実施形態に係る識別装置10のハードウェア構成例として、情報処理装置900のハードウェア構成例について説明する。なお、以下に説明する情報処理装置900のハードウェア構成例は、識別装置10のハードウェア構成の一例に過ぎない。したがって、識別装置10のハードウェア構成は、以下に説明する情報処理装置900のハードウェア構成から不要な構成が削除されてもよいし、新たな構成が追加されてもよい。
図9は、本発明の実施形態に係る識別装置10の例としての情報処理装置900のハードウェア構成を示す図である。情報処理装置900は、CPU(Central Processing Unit)901と、ROM(Read Only Memory)902と、RAM(Random Access Memory)903と、ホストバス904と、ブリッジ905と、外部バス906と、インタフェース907と、入力装置908と、出力装置909と、ストレージ装置910と、通信装置911と、を備える。
CPU901は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置900内の動作全般を制御する。また、CPU901は、マイクロプロセッサであってもよい。ROM902は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバス等から構成されるホストバス904により相互に接続されている。
ホストバス904は、ブリッジ905を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス906に接続されている。なお、必ずしもホストバス904、ブリッジ905および外部バス906を分離構成する必要はなく、1つのバスにこれらの機能を実装してもよい。
入力装置908は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチおよびレバー等ユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU901に出力する入力制御回路等から構成されている。情報処理装置900を操作するユーザは、この入力装置908を操作することにより、情報処理装置900に対して各種のデータを入力したり処理動作を指示したりすることができる。
出力装置909は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Diode)装置、ランプ等の表示装置およびスピーカ等の音声出力装置を含む。
ストレージ装置910は、データ格納用の装置である。ストレージ装置910は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置等を含んでもよい。ストレージ装置910は、例えば、HDD(Hard Disk Drive)で構成される。このストレージ装置910は、ハードディスクを駆動し、CPU901が実行するプログラムや各種データを格納する。
通信装置911は、例えば、ネットワークに接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置911は、無線通信または有線通信のどちらに対応してもよい。
以上、本発明の実施形態に係る識別装置10のハードウェア構成例について説明した。
(5.まとめ)
以上に説明したように、本実施形態によれば、センサによる計測に基づいて複素数の多次元テンソルを取得する取得部と、前記複素数の多次元テンソルに基づく畳込み処理および次元圧縮それぞれを複数回行ってテンソル要素の特徴を抽出する特徴抽出部と、前記テンソル要素の特徴の次元を逆畳込み処理によって前記多次元テンソルの次元まで拡張して再拡張多次元テンソルを生成する拡張部と、前記再拡張多次元テンソルのテンソル要素ごとにクラスを識別することによって領域分割を行う領域分割部と、を備える、識別装置が提供される。
かかる構成によれば、あらかじめ閾値を設定せずとも、高精度に物体を識別することが可能となる。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
10(10A,10B) 識別装置
111 送受信部
112 取得部
113A,113B 特徴抽出部
114 拡張部
115 領域分割部

Claims (11)

  1. センサによる計測に基づいて複素数の多次元テンソルを取得する取得部と、
    前記複素数の多次元テンソルに基づく畳込み処理および次元圧縮それぞれを複数回行ってテンソル要素の特徴を抽出する特徴抽出部と、
    前記テンソル要素の特徴の次元を逆畳込み処理によって前記多次元テンソルの次元まで拡張して再拡張多次元テンソルを生成する拡張部と、
    前記再拡張多次元テンソルのテンソル要素ごとにクラスを識別することによって領域分割を行う領域分割部と、
    を備える、識別装置。
  2. 前記特徴抽出部は、前記複素数の多次元テンソルの各テンソル要素の絶対値に対して畳込み処理および次元圧縮それぞれを複数回行う、
    請求項1に記載の識別装置。
  3. 前記特徴抽出部は、前記複素数の多次元テンソルの各テンソル要素自体に対して畳込み処理および次元圧縮それぞれを複数回行うことによって複素数によるテンソル要素の特徴を抽出し、前記複素数によるテンソル要素の特徴を実数によるテンソル要素の特徴に変換する、
    請求項1に記載の識別装置。
  4. 前記領域分割部は、前記テンソル要素ごとのクラスの識別結果に基づいて、物体と偽像とを区別する、
    請求項1に記載の識別装置。
  5. 前記取得部は、前記センサによる計測に基づく2次元情報に対応付けられた複素信号を各テンソル要素として有する前記複素数の多次元テンソルを取得する、
    請求項1に記載の識別装置。
  6. 前記2次元情報は、前記センサを基準とした物体までの距離と角度との組み合わせ、または、前記センサを基準とした物体までの距離と前記物体の速度との組み合わせによって構成される、
    請求項1に記載の識別装置。
  7. 前記特徴抽出部は、学習処理によって得られたパラメータを前記畳込み処理に利用する、
    請求項1に記載の識別装置。
  8. 前記特徴抽出部は、高分解能化処理に基づいて生成された教師データを用いた学習処理によって得られたパラメータを前記畳込み処理に利用する、
    請求項7に記載の識別装置。
  9. 前記特徴抽出部は、テンソル要素の特徴数をクラスの数に合わせ、
    前記拡張部は、前記クラスの数に特徴数が合わせられたテンソル要素の特徴の次元を拡張する、
    請求項1に記載の識別装置。
  10. センサによる計測に基づいて複素数の多次元テンソルを取得することと、
    前記複素数の多次元テンソルに基づく畳込み処理および次元圧縮それぞれを複数回行ってテンソル要素の特徴を抽出することと、
    前記テンソル要素の特徴の次元を逆畳込み処理によって前記多次元テンソルの次元まで拡張して再拡張多次元テンソルを生成することと、
    前記再拡張多次元テンソルのテンソル要素ごとにクラスを識別することによって領域分割を行うことと、
    を含む、識別方法。
  11. コンピュータを、
    センサによる計測に基づいて複素数の多次元テンソルを取得する取得部と、
    前記複素数の多次元テンソルに基づく畳込み処理および次元圧縮それぞれを複数回行ってテンソル要素の特徴を抽出する特徴抽出部と、
    前記テンソル要素の特徴の次元を逆畳込み処理によって前記多次元テンソルの次元まで拡張して再拡張多次元テンソルを生成する拡張部と、
    前記再拡張多次元テンソルのテンソル要素ごとにクラスを識別することによって領域分割を行う領域分割部と、
    を備える識別装置として機能させるためのプログラム。

JP2017202080A 2017-10-18 2017-10-18 識別装置、識別方法およびプログラム Pending JP2019074478A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017202080A JP2019074478A (ja) 2017-10-18 2017-10-18 識別装置、識別方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017202080A JP2019074478A (ja) 2017-10-18 2017-10-18 識別装置、識別方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2019074478A true JP2019074478A (ja) 2019-05-16

Family

ID=66544038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017202080A Pending JP2019074478A (ja) 2017-10-18 2017-10-18 識別装置、識別方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2019074478A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175551A (zh) * 2019-05-21 2019-08-27 青岛科技大学 一种手语识别方法
CN111551812A (zh) * 2020-05-29 2020-08-18 哈尔滨理工大学 一种基于张量多模态算法的电压波特征参数提取方法
CN113837921A (zh) * 2021-09-26 2021-12-24 安徽寒武纪信息科技有限公司 数据处理装置、数据处理方法及相关产品
JP2023513650A (ja) * 2021-01-18 2023-04-03 浙江大学 相互相関テンソルに基づく三次元の互いに素のキュービックアレイの到来方向推定方法
WO2023100390A1 (ja) * 2021-12-02 2023-06-08 古野電気株式会社 情報処理方法、レーダー装置及びコンピュータプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175551A (zh) * 2019-05-21 2019-08-27 青岛科技大学 一种手语识别方法
CN110175551B (zh) * 2019-05-21 2023-01-10 青岛科技大学 一种手语识别方法
CN111551812A (zh) * 2020-05-29 2020-08-18 哈尔滨理工大学 一种基于张量多模态算法的电压波特征参数提取方法
JP2023513650A (ja) * 2021-01-18 2023-04-03 浙江大学 相互相関テンソルに基づく三次元の互いに素のキュービックアレイの到来方向推定方法
JP7327840B2 (ja) 2021-01-18 2023-08-16 浙江大学 相互相関テンソルに基づく三次元の互いに素のキュービックアレイの到来方向推定方法
CN113837921A (zh) * 2021-09-26 2021-12-24 安徽寒武纪信息科技有限公司 数据处理装置、数据处理方法及相关产品
WO2023100390A1 (ja) * 2021-12-02 2023-06-08 古野電気株式会社 情報処理方法、レーダー装置及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
JP2019074478A (ja) 識別装置、識別方法およびプログラム
JP7062878B2 (ja) 情報処理方法および情報処理装置
JP5628144B2 (ja) 目的物及び動作検出
Li et al. FM-track: pushing the limits of contactless multi-target tracking using acoustic signals
Tan et al. A real-time high resolution passive WiFi Doppler-radar and its applications
CN110447014B (zh) 经由循环缓冲器访问高帧率雷达数据
JP2021530821A (ja) 三次元無線モデル構築を実行するための方法、装置およびコンピュータプログラム
JP5984376B2 (ja) レーダ信号処理装置およびレーダ装置
Wang et al. Amaging: Acoustic hand imaging for self-adaptive gesture recognition
WO2019127621A1 (zh) 超声成像方法、系统和设备
JP5813779B2 (ja) 超音波イメージング装置、超音波イメージング方法および超音波イメージング用プログラム
JP2017156219A (ja) 追尾装置、追尾方法およびプログラム
Li et al. Room-scale hand gesture recognition using smart speakers
JP2017211348A (ja) 軌跡推定装置、軌跡推定方法及びプログラム
WO2016078486A1 (en) Method and apparatus for obtaining vibration information and user equipment
Kong et al. Gesture recognition system based on ultrasonic FMCW and ConvLSTM model
Kong et al. M $^{3} $ FAS: An Accurate and Robust MultiModal Mobile Face Anti-Spoofing System
WO2016078484A1 (en) Method and apparatus for obtaining vibration information and user equipment
JP6822492B2 (ja) 物体検知装置、物体検知方法、及びプログラム
JP5217917B2 (ja) 物体検知追跡装置,物体検知追跡方法および物体検知追跡プログラム
WO2018135188A1 (ja) 超音波撮像システム、超音波撮像装置、超音波撮像方法、及び画像合成プログラム
JP7056212B2 (ja) 方位推定方法および装置
CN111880146B (zh) 声源定向方法和装置及存储介质
Ren et al. Person Re-identification in 3D Space: A {WiFi} Vision-based Approach
Bai et al. WhisperWand: Simultaneous Voice and Gesture Tracking Interface

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190327

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190328