JP2018152036A - 人工地物認識装置、人工地物認識方法及び人工地物認識プログラム - Google Patents
人工地物認識装置、人工地物認識方法及び人工地物認識プログラム Download PDFInfo
- Publication number
- JP2018152036A JP2018152036A JP2017127765A JP2017127765A JP2018152036A JP 2018152036 A JP2018152036 A JP 2018152036A JP 2017127765 A JP2017127765 A JP 2017127765A JP 2017127765 A JP2017127765 A JP 2017127765A JP 2018152036 A JP2018152036 A JP 2018152036A
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature
- point group
- columnar object
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
【課題】高い精度で人工地物を認識し、分類することができる、人工地物認識装置、人工地物認識方法及び人工地物認識プログラムを提供する。【解決手段】柱状物体点群から点群特徴量算出部を用いて点群特徴量を得る。正規化柱状物画像からCNN処理部を用いて特徴量を抽出し、更に寄与度フィルタで上位の特徴量を抜粋して、画像特徴量を得る。点群特徴量と画像特徴量を組み合わせて柱状物特徴量として、学習処理を行い、学習済み分類器を作成する。この学習済み分類器を用いることで、道路周辺の人工地物を高い認識率で認識し、分類することが可能になる。【選択図】図8
Description
本発明は、道路の周辺に配置されている、標識や信号機、街灯等の人工地物を認識する、人工地物認識装置、人工地物認識方法及び人工地物認識プログラムに関する。
近年、自動車の自動運転技術が注目されている。運転に人間が全く介在しない自動車の自動運転を実現するには、その前提として、自動車が現在位置している道路の周辺にどの様な地物が存在するのかを精緻かつ詳細に把握することが必要である。現在、市場では平面的な地図を用いたナビゲーションシステムが普及しているが、自動車の自動運転にはこの様な平面的な地図では情報が不足する。特に、自動車で自動運転システムを稼働させる際に、信号機の認識は極めて重要である。すなわち、自動運転システムには3D地図データが必要である。
道路周辺に存在する地物は、街路樹等の自然物と、標識、信号機、街灯、歩行者信号等の人工地物に分けられる。このうち、自動運転システムには人工地物の認識が重要となる。
現在、来るべき自動運転システム実用化に向け、MMS(Mobille Mapping System:移動計測車両)を市街地に走行させ、道路及びその周辺の地物を3Dデータとして記録し、3Dデータを蓄積する動きがある。
現在、来るべき自動運転システム実用化に向け、MMS(Mobille Mapping System:移動計測車両)を市街地に走行させ、道路及びその周辺の地物を3Dデータとして記録し、3Dデータを蓄積する動きがある。
非特許文献1には、点群と画像を用いた道路周辺地物の自動分類手法が開示されている。
非特許文献2には、移動計測データからのメッシュ生成とセグメンテーションが開示されている。
非特許文献3には、移動計測データから地物を検出し分類する技術が開示されている。
非特許文献4には、移動計測データに基づく柱状物体の分類に適した幾何特徴量に関する情報が開示されている。
非特許文献5には、本発明にて利用している教師付き学習アルゴリズムの一種である、ランダムフォレストに関する情報が開示されている。
非特許文献2には、移動計測データからのメッシュ生成とセグメンテーションが開示されている。
非特許文献3には、移動計測データから地物を検出し分類する技術が開示されている。
非特許文献4には、移動計測データに基づく柱状物体の分類に適した幾何特徴量に関する情報が開示されている。
非特許文献5には、本発明にて利用している教師付き学習アルゴリズムの一種である、ランダムフォレストに関する情報が開示されている。
森 悠真, 小平圭祐, 増田 宏, 点群と画像を用いた道路周辺地物の自動分類手法,精密工学会秋季大会講演論文集, I-04, 2016/09/06 <http://www.ddm.mi.uec.ac.jp/papers/smt2016a_mori.pdf>
小平圭祐, 深野健太, 増田 宏, 移動計測データからのメッシュ生成とセグメンテーション(第3報), 精密工学会春季大会講演論文集, 2016/03/15 <http://www.ddm.mi.uec.ac.jp/papers/smt2016s_kohira.pdf>
K. Fukano, H. Masuda, Detection and Classification of Pole-Like Objects from Mobile Mapping Data, ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Vol. I-3/ W5, pp.57-64, 2015/09/30 <http://www.isprs-ann-photogramm-remote-sens-spatial-inf-sci.net/II-3-W5/57/2015/isprsannals-II-3-W5-57-2015.pdf>
深野健太, 増田 宏, 移動計測データに基づく柱状物体の分類に適した幾何特徴量, 土木学会論文集F3(土木情報学), Vol.70, No.1, 40-47, 2014 <https://www.jstage.jst.go.jp/article/jscejcei/70/1/70_40/_pdf>
Breiman, Leo(2001). "Random Forests".Machine Learning.45(1): 5-32.doi:10.1023/A:1010933404324. <https://www.stat.berkeley.edu/~breiman/randomforest2001.pdf>
MMSは、乗用車の天井にカメラ、レーザスキャナ、GPS(Global Positioning System)、IMU(Inertial Measurement Unit)が搭載され、GPSとIMUを組み合わせて車両の自己位置と姿勢を計算し、カメラとレーザスキャナからそれぞれデータを受け取り、大容量ハードディスク装置に記録する。
発明者らは、MMSのデータを用いて人工地物を認識し、分類するシステムの開発と改良を行っている。
発明者らは、MMSのデータを用いて人工地物を認識し、分類するシステムの開発と改良を行っている。
レーザスキャナから得られる3次元の座標情報の集合体である点群(またはポイントクラウドとも呼ばれる)を用いた人工地物認識は、道路周辺の地物の立体的な特徴を捉えることができる。しかし、MMSが高速走行することで点群の解像度が低下したり、信号機とある種の案内標識のように外枠の特徴が類似する人工地物の場合、誤認識を生じるケースがある。
カメラから得られる2次元の画像データを後述するCNN(Convolutional Neural Network)を用いた画像認識ベースの人工地物認識は、道路周辺の地物の平面的な外見を捉えることができる。しかし、画像が逆光で不鮮明であったり、例えば撮影された地物である交通標識が経年劣化等で色褪せていた場合、画像認識に失敗するケースがある。
カメラから得られる2次元の画像データを後述するCNN(Convolutional Neural Network)を用いた画像認識ベースの人工地物認識は、道路周辺の地物の平面的な外見を捉えることができる。しかし、画像が逆光で不鮮明であったり、例えば撮影された地物である交通標識が経年劣化等で色褪せていた場合、画像認識に失敗するケースがある。
本発明は係る課題を解決し、高い精度で人工地物を認識し、分類することができる、人工地物認識装置、人工地物認識方法及び人工地物認識プログラムを提供することを目的とする。
上記課題を解決するために、本発明の人工地物認識装置は、3次元の座標情報を有する点群の集合体である点群データベースから、柱状物体を構成する点群である柱状物体点群を抽出する、柱状物体抽出処理部と、カメラが撮影した画像データと撮影日時が格納されている撮影画像データベースから、柱状物体点群に含まれている時刻を基に、柱状物体点群が被写体となって写っている画像データを検索する画像検索処理部とを具備する。更に、画像検索処理部の検索処理によってヒットした複数の画像データに対し、柱状物体点群を投影することによって、最適な画像データを選択して柱状物画像を得る画像点群投影処理部と、柱状物画像から特徴量を得る第一特徴量変換部と、第一特徴量変換部が出力した特徴量に対し、寄与度に基づいて上位の特徴量を抜粋して画像特徴量を得る寄与度フィルタと、柱状物体点群から点群特徴量を得る第二特徴量変換部と、画像特徴量と点群特徴量よりなる柱状物特徴量を、予め作成した辞書データを用いて分類する、学習済み分類器とを具備する。
本発明によれば、高い精度で人工地物を認識し、分類することができる、人工地物認識装置、人工地物認識方法及び人工地物認識プログラムを提供することができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
以下、本発明の実施形態の例を、図面を参照して説明する。
これより説明する人工地物認識装置101は、MMS102が計測したデータを基に、学習アルゴリズムを用いて、人工地物を機械的に認識し、分類する装置である。
周知のように学習アルゴリズムは、ある事象に係る多数の情報を、その事象を特徴づける少数の特徴量に変換するアルゴリズムである。多くの学習アルゴリズムを利用した装置やシステムにおいて共通する課題は、学習エンジンに対し、如何に効果的な入力を与えて、高い認識率を達成するか、である。
本発明の実施形態に係る人工地物認識装置101は、先ず、人工地物を点群データと画像データに分ける。そして、点群データと画像データのそれぞれに対し、対応する学習アルゴリズムを用いて特徴量を得る。画像データに対する学習アルゴリズムを用いた特徴量は、要素数が膨大になるので、特徴量の寄与度を基に特徴量の間引き処理を行う。こうして得られた点群データの特徴量と画像データの特徴量に対し、更に学習アルゴリズムを用いて、特徴量の集合体である辞書データ318(図3参照)を作成する。
これより説明する人工地物認識装置101は、MMS102が計測したデータを基に、学習アルゴリズムを用いて、人工地物を機械的に認識し、分類する装置である。
周知のように学習アルゴリズムは、ある事象に係る多数の情報を、その事象を特徴づける少数の特徴量に変換するアルゴリズムである。多くの学習アルゴリズムを利用した装置やシステムにおいて共通する課題は、学習エンジンに対し、如何に効果的な入力を与えて、高い認識率を達成するか、である。
本発明の実施形態に係る人工地物認識装置101は、先ず、人工地物を点群データと画像データに分ける。そして、点群データと画像データのそれぞれに対し、対応する学習アルゴリズムを用いて特徴量を得る。画像データに対する学習アルゴリズムを用いた特徴量は、要素数が膨大になるので、特徴量の寄与度を基に特徴量の間引き処理を行う。こうして得られた点群データの特徴量と画像データの特徴量に対し、更に学習アルゴリズムを用いて、特徴量の集合体である辞書データ318(図3参照)を作成する。
[人工地物認識装置101の実施形態]
図1は、本発明の実施形態に係る、人工地物認識装置101の実施態様を示す概略図である。
MMS102は道路103を走行し、車両の天井に搭載されたレーザスキャナ104とカメラ105が信号機106等の人工地物を含むデータ収集を行う。収集されたデータは、大容量のハードディスク107に記憶される。このハードディスク107を借用し、人工地物認識装置101に接続する。そして、人工地物認識装置101は後述するデータ処理を実行する。
図1は、本発明の実施形態に係る、人工地物認識装置101の実施態様を示す概略図である。
MMS102は道路103を走行し、車両の天井に搭載されたレーザスキャナ104とカメラ105が信号機106等の人工地物を含むデータ収集を行う。収集されたデータは、大容量のハードディスク107に記憶される。このハードディスク107を借用し、人工地物認識装置101に接続する。そして、人工地物認識装置101は後述するデータ処理を実行する。
[人工地物認識装置101のハードウェア構成]
図2は、人工地物認識装置101のハードウェア構成を示すブロック図である。
一般的なパソコン等で構成される人工地物認識装置101は、CPU201、ROM202、RAM203、不揮発性ストレージ204、表示部205、操作部206がバス207に接続されている。MMS102から貸与されるハードディスク107は、バス207に周知のシリアルATAインターフェース等で接続される他、NAS(Network Attached Storage)として、ネットワークを通じてNIC208を介して接続される場合もある。
不揮発性ストレージ204には、パソコンを人工地物認識装置101として稼働させるためのプログラムと、後述する学習処理の過程で形成される辞書データ318等が格納されている。
図2を見て明らかなように、本発明の実施形態に係る人工地物認識装置101の実質的な機能は、ソフトウェア(プログラム)にて実現される。
図2は、人工地物認識装置101のハードウェア構成を示すブロック図である。
一般的なパソコン等で構成される人工地物認識装置101は、CPU201、ROM202、RAM203、不揮発性ストレージ204、表示部205、操作部206がバス207に接続されている。MMS102から貸与されるハードディスク107は、バス207に周知のシリアルATAインターフェース等で接続される他、NAS(Network Attached Storage)として、ネットワークを通じてNIC208を介して接続される場合もある。
不揮発性ストレージ204には、パソコンを人工地物認識装置101として稼働させるためのプログラムと、後述する学習処理の過程で形成される辞書データ318等が格納されている。
図2を見て明らかなように、本発明の実施形態に係る人工地物認識装置101の実質的な機能は、ソフトウェア(プログラム)にて実現される。
[人工地物認識装置101のソフトウェア機能(学習モードの例)]
図3は、人工地物認識装置101の、学習モードにおけるソフトウェア機能を示すブロック図である。
MMS102から提供されるデータには、レーザスキャナ104の計測結果である点群データベース301と、カメラ105の撮影結果である撮影画像データベース304がある。点群データベース301のフィールド構成は、MMS102を提供し運用する会社が定めた仕様によって決められている。例えば、3次元の点を表す座標系として「緯度、経度、楕円体高」、「平面直角座標系」、「ENU座標系」、「WGS84」などが用いられる。点群データベース301には、これらのいずれか、もしくは複数の座標系での3次元座標が記憶される。
図3は、人工地物認識装置101の、学習モードにおけるソフトウェア機能を示すブロック図である。
MMS102から提供されるデータには、レーザスキャナ104の計測結果である点群データベース301と、カメラ105の撮影結果である撮影画像データベース304がある。点群データベース301のフィールド構成は、MMS102を提供し運用する会社が定めた仕様によって決められている。例えば、3次元の点を表す座標系として「緯度、経度、楕円体高」、「平面直角座標系」、「ENU座標系」、「WGS84」などが用いられる。点群データベース301には、これらのいずれか、もしくは複数の座標系での3次元座標が記憶される。
一例として、最も簡単なENU座標系で点群データベース301を構成する場合、点群データベース301は、
・MMS102を起点として、当該点が東方向に何m離れているのかを示すEast値が格納されるEast値フィールドと、
・MMS102を起点として、当該点が北方向に何m離れているのかを示すNorth値が格納されるNorth値フィールドと、
・MMS102を起点として、当該点が上下方向に何m離れているのかを示すUp値が格納されるUp値フィールドと、
・当該点を撮影した時点のGPS時刻が格納されるGPS時刻フィールドと
を有する。
・MMS102を起点として、当該点が東方向に何m離れているのかを示すEast値が格納されるEast値フィールドと、
・MMS102を起点として、当該点が北方向に何m離れているのかを示すNorth値が格納されるNorth値フィールドと、
・MMS102を起点として、当該点が上下方向に何m離れているのかを示すUp値が格納されるUp値フィールドと、
・当該点を撮影した時点のGPS時刻が格納されるGPS時刻フィールドと
を有する。
一方、撮影画像データベース304は、
・画像データを撮影した日時が格納される撮影日時フィールドと、
・MMS102の、GPS及び/またはIMUで計測した測位情報が格納されるMMS位置フィールドと、
・MMS102の車両上におけるカメラ105の位置と、撮影時点のカメラ105の姿勢が格納されるカメラ位置及び姿勢フィールドと、
・RAW形式等の画像データが格納される画像データフィールドと
を有する。
・画像データを撮影した日時が格納される撮影日時フィールドと、
・MMS102の、GPS及び/またはIMUで計測した測位情報が格納されるMMS位置フィールドと、
・MMS102の車両上におけるカメラ105の位置と、撮影時点のカメラ105の姿勢が格納されるカメラ位置及び姿勢フィールドと、
・RAW形式等の画像データが格納される画像データフィールドと
を有する。
柱状物体抽出処理部302は、点群データベース301を読み込み、柱状物体を構成する点群である柱状物体点群303を抽出する。
画像検索処理部305は、柱状物体点群303に含まれているGPS時刻を基に、柱状物体点群303が被写体となって写っている画像を撮影画像データベース304から検索する。画像検索処理部305は、検索の結果、撮影画像データベース304から静止画像データである、柱状物体が撮影されている柱状物体撮影画像306を抜粋する。
画像検索処理部305は、柱状物体点群303に含まれているGPS時刻を基に、柱状物体点群303が被写体となって写っている画像を撮影画像データベース304から検索する。画像検索処理部305は、検索の結果、撮影画像データベース304から静止画像データである、柱状物体が撮影されている柱状物体撮影画像306を抜粋する。
柱状物体抽出処理部302の動作について、図面を参照して更に説明する。
図4Aは、点群データベース301を基に市街地を計測した結果を3Dイメージに変換した画像の一例を示す図である。
図4Bは、点群データベース301から抽出したメッシュから断面線を作成する様子を示す概略図である。
図4Cは、断面線で抽出した柱状物(人工地物)の一例を示す図である。
点群データベース301は、図4Aに示すように、市街地等の立体構造の表面を、3次元座標情報を有する点の集合体として計測した結果である。
柱状物体抽出処理部302は、点群データベース301を基に、図4Bに示すようにワイヤフレームD401を作成する。ワイヤフレームD401は、図4Aに示すような点群を構成する点のうち、2個の点の距離が閾値以下の場合に、その2点を線分で連結することで生成される線分集合のことである。そして、作成したワイヤフレームD401に対し、水平面とワイヤフレームの線分集合との交点を計算し、交点集合からなる断面D402を作成する。なお、水平面は、所定の等間隔で複数設置し、水平面ごとに断面を作成する。柱状物体では、断面となる交点集合は円弧となるため、円弧上に乗っている点を検出し、円弧の方程式を計算する。この様な処理を行うことで、点群データベース301から図4Cに示すような、信号機等の人工地物を抽出することが可能になる。なお、柱状物体抽出処理部302の処理については、非特許文献4に記載されている。
図4Aは、点群データベース301を基に市街地を計測した結果を3Dイメージに変換した画像の一例を示す図である。
図4Bは、点群データベース301から抽出したメッシュから断面線を作成する様子を示す概略図である。
図4Cは、断面線で抽出した柱状物(人工地物)の一例を示す図である。
点群データベース301は、図4Aに示すように、市街地等の立体構造の表面を、3次元座標情報を有する点の集合体として計測した結果である。
柱状物体抽出処理部302は、点群データベース301を基に、図4Bに示すようにワイヤフレームD401を作成する。ワイヤフレームD401は、図4Aに示すような点群を構成する点のうち、2個の点の距離が閾値以下の場合に、その2点を線分で連結することで生成される線分集合のことである。そして、作成したワイヤフレームD401に対し、水平面とワイヤフレームの線分集合との交点を計算し、交点集合からなる断面D402を作成する。なお、水平面は、所定の等間隔で複数設置し、水平面ごとに断面を作成する。柱状物体では、断面となる交点集合は円弧となるため、円弧上に乗っている点を検出し、円弧の方程式を計算する。この様な処理を行うことで、点群データベース301から図4Cに示すような、信号機等の人工地物を抽出することが可能になる。なお、柱状物体抽出処理部302の処理については、非特許文献4に記載されている。
次に、画像検索処理部305の動作について、図面を参照して更に説明する。
図5は、撮影画像データベース304に収録されている画像データの一例を示す図である。
後述する画像点群投影処理部307では、画像データに地物の付属物D501(信号機や標識)の点群を投影する処理を行う。その際、点群を投影する基となる画像データは、できる限り高い解像度であることが好ましい。
MMS102は、およそ時速20〜40km程度で走行する。走行中、カメラ105は頻繁に道路103周辺の撮影を行う。すると、図4に示すように、同じ地物が時間の経過とともに複数の画像データに渡って撮影される。画像検索処理部305は、柱状物体点群303に含まれているGPS時刻を基に、柱状物体点群303が被写体となって写っている画像を撮影画像データベース304から検索するが、この検索で複数枚の画像データがヒットすることとなる。画像検索処理部305は、検索でヒットした複数の画像データをそのまま柱状物体撮影画像306として出力する。
複数の画像データの中から、当該柱状物体が最も大きく写り、かつ、はみ出ていない画像データを選択する作業は、後述する画像点群投影処理部307が行う。
図5は、撮影画像データベース304に収録されている画像データの一例を示す図である。
後述する画像点群投影処理部307では、画像データに地物の付属物D501(信号機や標識)の点群を投影する処理を行う。その際、点群を投影する基となる画像データは、できる限り高い解像度であることが好ましい。
MMS102は、およそ時速20〜40km程度で走行する。走行中、カメラ105は頻繁に道路103周辺の撮影を行う。すると、図4に示すように、同じ地物が時間の経過とともに複数の画像データに渡って撮影される。画像検索処理部305は、柱状物体点群303に含まれているGPS時刻を基に、柱状物体点群303が被写体となって写っている画像を撮影画像データベース304から検索するが、この検索で複数枚の画像データがヒットすることとなる。画像検索処理部305は、検索でヒットした複数の画像データをそのまま柱状物体撮影画像306として出力する。
複数の画像データの中から、当該柱状物体が最も大きく写り、かつ、はみ出ていない画像データを選択する作業は、後述する画像点群投影処理部307が行う。
図3に戻って、ブロック図の説明を続ける。
柱状物体撮影画像306と柱状物体点群303は、画像点群投影処理部307に読み込まれる。
画像点群投影処理部307は、ピンホールカメラモデル等の手法を用いて、柱状物体点群303を柱状物体撮影画像306に投影して、柱状物体撮影画像306から,柱状物体の付属物(信号機や標識)が 映っている領域を算出する。
なお、MMS102には、MMS102自体の位置情報を示す車両座標系、MMS102に搭載されているカメラ105の位置と方向を示すカメラ座標系、MMS102に搭載されているレーザスキャナ座標系の3つの座標系が存在する。ここで、レーザスキャナ座標系は、レーザスキャナ104が計測した点群とレーザスキャナ104との相対的な位置関係を示す座標系である。画像点群投影処理部307では、レーザスキャナ座標系を車両座標系に変換し、更にカメラ座標系に変換することで、カメラ画像と点群を一致させる処理を行う。
柱状物体撮影画像306と柱状物体点群303は、画像点群投影処理部307に読み込まれる。
画像点群投影処理部307は、ピンホールカメラモデル等の手法を用いて、柱状物体点群303を柱状物体撮影画像306に投影して、柱状物体撮影画像306から,柱状物体の付属物(信号機や標識)が 映っている領域を算出する。
なお、MMS102には、MMS102自体の位置情報を示す車両座標系、MMS102に搭載されているカメラ105の位置と方向を示すカメラ座標系、MMS102に搭載されているレーザスキャナ座標系の3つの座標系が存在する。ここで、レーザスキャナ座標系は、レーザスキャナ104が計測した点群とレーザスキャナ104との相対的な位置関係を示す座標系である。画像点群投影処理部307では、レーザスキャナ座標系を車両座標系に変換し、更にカメラ座標系に変換することで、カメラ画像と点群を一致させる処理を行う。
画像点群投影処理部307の動作について、図面を参照して更に説明する。
図6Aは、画像点群投影処理部307が画像に投影する点群の一例を示す図である。
図6Bは、ピンホールカメラの原理を示す図である。
図6Cは、点群が投影される付属物画像の様子を示す図である。
これまで述べたように、点群は座標情報を有する3次元のデータである一方、画像データは座標情報を持たない2次元のデータである。
3次元の点群を用いて、画像データから柱状物体の付属物を切り出すために、3次元の点群を2次元の画像データに投影する必要がある。画像点群投影処理部307は、ピンホールカメラモデル等の手法を用いて、柱状物体点群303を柱状物体撮影画像306に投影する。
図6Aは、画像点群投影処理部307が画像に投影する点群の一例を示す図である。
図6Bは、ピンホールカメラの原理を示す図である。
図6Cは、点群が投影される付属物画像の様子を示す図である。
これまで述べたように、点群は座標情報を有する3次元のデータである一方、画像データは座標情報を持たない2次元のデータである。
3次元の点群を用いて、画像データから柱状物体の付属物を切り出すために、3次元の点群を2次元の画像データに投影する必要がある。画像点群投影処理部307は、ピンホールカメラモデル等の手法を用いて、柱状物体点群303を柱状物体撮影画像306に投影する。
3次元の点群は座標情報を持っているので、MMS102から柱状物体の付属物との距離がわかる。また、柱状物体の付属物自体の大きさもわかる。画像点群投影処理部307は、MMS102をピンホールカメラのピンホールに見立てて、柱状物体が存在する場所に仮想スクリーンを置く。この仮想スクリーンが、柱状物体撮影画像306である。そして、柱状物体点群303を前後左右反転した反転点群を、仮想スクリーンとMMS102との距離と同じ距離で、かつ仮想スクリーンと反対方向に置き、ピンホールを通じて反転点群のイメージを仮想スクリーンに描画する。すると、図6Bに示すように、3次元の立体が、ピンホールを通じて平面上に投影される。
このように、予め上下左右を反転させた反転点群を、ピンホールを用いて2次元の画像に投影する演算処理を行うと、図6Cに示すように、柱状物体の付属物に点群を平面的に投影させることが可能になる。点群が投影された箇所D601が、画像データにおいて柱状物体の付属物として切り出す範囲となる。
このように、予め上下左右を反転させた反転点群を、ピンホールを用いて2次元の画像に投影する演算処理を行うと、図6Cに示すように、柱状物体の付属物に点群を平面的に投影させることが可能になる。点群が投影された箇所D601が、画像データにおいて柱状物体の付属物として切り出す範囲となる。
図5を再度参照して、画像点群投影処理部307の動作の説明を続ける。
前述のように、画像データに柱状物体点群303を投影すると、図6Cに示すように、画像データのどこに柱状物体が存在し、どの程度の大きさであるのかが一目瞭然でわかる。
ところで、先に説明したように、画像検索処理部305は柱状物体が含まれている画像データを複数枚、柱状物体撮影画像306として出力していた。これら複数の画像データは、それぞれMMS102の位置が異なる画像データである。図5に示すように、MMS102が柱状物体に近づくに連れて、画像データ中の柱状物体の付属物の大きさが大きくなる。
前述のように、画像データに柱状物体点群303を投影すると、図6Cに示すように、画像データのどこに柱状物体が存在し、どの程度の大きさであるのかが一目瞭然でわかる。
ところで、先に説明したように、画像検索処理部305は柱状物体が含まれている画像データを複数枚、柱状物体撮影画像306として出力していた。これら複数の画像データは、それぞれMMS102の位置が異なる画像データである。図5に示すように、MMS102が柱状物体に近づくに連れて、画像データ中の柱状物体の付属物の大きさが大きくなる。
画像点群投影処理部307は、複数の画像データである柱状物体撮影画像306の全ての画像データに対し、柱状物体点群303の投影処理を行う。すると、それぞれの画像データについて、画像データのどこに柱状物体が存在し、どの程度の大きさであるのかが一目瞭然でわかる。画像点群投影処理部307は、そうして投影された点群の中から、当該柱状物体が最も大きく写り、かつ、点群が画像データからはみ出ていない、すなわち見切れていない画像データを選択する。
再び図3に戻って、ブロック図の説明を続ける。
画像正規化処理部308は、画像点群投影処理部307で算出され抜粋された付属物画像に正規化処理を施す。具体的には、付属物の画像をN×N(Nは自然数、例えば256)の画像に正規化し、付属物が写っていない領域を黒または白で塗り潰す。
こうして、正規化柱状物画像309が作成される。
画像正規化処理部308は、画像点群投影処理部307で算出され抜粋された付属物画像に正規化処理を施す。具体的には、付属物の画像をN×N(Nは自然数、例えば256)の画像に正規化し、付属物が写っていない領域を黒または白で塗り潰す。
こうして、正規化柱状物画像309が作成される。
次に、画像正規化処理部308の動作について、図面を参照して更に説明する。
図7Aは、画像点群投影処理部307が画像に投影した点群の一例を示す図である。
図7Bは、画像点群投影処理部307が画像に投影した点群に基づいて抽出されたカメラ画像の一例を示す図である。
図7Aに示すように、柱状物体の付属物の点群は、MMS102のカメラ105の角度に応じて傾斜する可能性がある。そこで、点群を全て包含する長方形をウィンドウ枠W701として作成し、このウィンドウ枠W701で図7Bに示すようにカメラ画像を抽出する。
図7Aは、画像点群投影処理部307が画像に投影した点群の一例を示す図である。
図7Bは、画像点群投影処理部307が画像に投影した点群に基づいて抽出されたカメラ画像の一例を示す図である。
図7Aに示すように、柱状物体の付属物の点群は、MMS102のカメラ105の角度に応じて傾斜する可能性がある。そこで、点群を全て包含する長方形をウィンドウ枠W701として作成し、このウィンドウ枠W701で図7Bに示すようにカメラ画像を抽出する。
図7Cは、画像点群投影処理部307によって抽出されたカメラ画像の一例を示す図である。
図7Dは、画像正規化処理部308によって正規化されたカメラ画像の一例を示す図である。
画像点群投影処理部307によって抽出されたカメラ画像データは、その大きさにばらつきがある。画像データの大きさにばらつきがあると、後述するCNN処理部310における特徴量の抽出に支障をきたす。そこで、できるだけ入力される画像データを均一化するべく、付属物の画像に拡大縮小処理を施して大きさを揃え、付属物が写っていない領域を黒または白で塗り潰す。例えば、横長の画像データであれば、図7Dに示すように、上下の余白部分が黒で塗り潰される。
図7Dは、画像正規化処理部308によって正規化されたカメラ画像の一例を示す図である。
画像点群投影処理部307によって抽出されたカメラ画像データは、その大きさにばらつきがある。画像データの大きさにばらつきがあると、後述するCNN処理部310における特徴量の抽出に支障をきたす。そこで、できるだけ入力される画像データを均一化するべく、付属物の画像に拡大縮小処理を施して大きさを揃え、付属物が写っていない領域を黒または白で塗り潰す。例えば、横長の画像データであれば、図7Dに示すように、上下の余白部分が黒で塗り潰される。
なお、後述するCNN処理部310の実装形態によっては、画像正規化処理部308による画像正規化処理が必ずしも必要とは限らない場合もある。その場合は、画像点群投影処理部307が出力した、正規化処理をしない柱状物画像データがそのまま、後述するCNN処理部310に入力されることとなる。
再び図3に戻って、ブロック図の説明を続ける。
正規化柱状物画像309は、第一特徴量変換部に相当するCNN処理部310に読み込まれる。
CNN処理部310は、正規化柱状物画像309からCNN(Convolutional Neural Network)による特徴量を抽出する。CNNでは多数の特徴量が用いられる。特徴量の個数は、CNN処理系に依存するが、画像による物体認識では多くの場合、4096個もしくはそれ以上の特徴量が出力される。それらの特徴量は、寄与度フィルタ311に読み込まれる。
寄与度フィルタ311は、出力された多数の特徴量に対し、予めランダムフォレスト(非特許文献5参照)等を用いて計算しておいた寄与度の順位で上位数十個(例えば32個程度)を抜粋する。
この上位数十個の特徴量を、画像特徴量312とする。
正規化柱状物画像309は、第一特徴量変換部に相当するCNN処理部310に読み込まれる。
CNN処理部310は、正規化柱状物画像309からCNN(Convolutional Neural Network)による特徴量を抽出する。CNNでは多数の特徴量が用いられる。特徴量の個数は、CNN処理系に依存するが、画像による物体認識では多くの場合、4096個もしくはそれ以上の特徴量が出力される。それらの特徴量は、寄与度フィルタ311に読み込まれる。
寄与度フィルタ311は、出力された多数の特徴量に対し、予めランダムフォレスト(非特許文献5参照)等を用いて計算しておいた寄与度の順位で上位数十個(例えば32個程度)を抜粋する。
この上位数十個の特徴量を、画像特徴量312とする。
ここで、寄与度フィルタ311について追加説明を記す。
先ず、CNN処理部310に人工地物を学習させた結果として得られた特徴量を多数用意する。次に、得られた特徴量に対し、ランダムフォレスト(非特許文献5参照)等のエントロピーもしくはジニ係数を用いて、決定木を作成する。このとき、ある特徴量Xが決定木の結果にどの程度の影響を与えているのかを考える。
もし、特徴量Xが重要であるならば、データ群のうち、Xの値だけをバラバラにシャッフルすると、認識率が悪化することが期待できる。
逆に、特徴量Xが重要でないならば、データ群のうち、Xの値だけをバラバラにシャッフルしても、認識率は殆ど悪化しないことが期待できる。
先ず、CNN処理部310に人工地物を学習させた結果として得られた特徴量を多数用意する。次に、得られた特徴量に対し、ランダムフォレスト(非特許文献5参照)等のエントロピーもしくはジニ係数を用いて、決定木を作成する。このとき、ある特徴量Xが決定木の結果にどの程度の影響を与えているのかを考える。
もし、特徴量Xが重要であるならば、データ群のうち、Xの値だけをバラバラにシャッフルすると、認識率が悪化することが期待できる。
逆に、特徴量Xが重要でないならば、データ群のうち、Xの値だけをバラバラにシャッフルしても、認識率は殆ど悪化しないことが期待できる。
そこで、Xの値だけをランダムに入れ替えたデータ群を作成し、決定木を用いて認識結果を予測する。そして、Xの値を入れ替える前の正解率との差を求め、これを寄与度とする。すなわち、寄与度が大きい特徴量とは、その値をシャッフルすると、正解率が大きく低下する特徴量である。寄与度の度合いに応じて特徴量をランキングすることで、特徴量ランキングが作成できる。
寄与度フィルタ311は、この特徴量ランキングを、CNN処理部310が出力する特徴量に適用する。CNN処理部310が出力する特徴量は、1次元の数列データ(配列)であり、配列の要素番号で特徴量を区別する。寄与度フィルタ311の内容は、特徴量配列の要素番号が寄与度の順位に対応して列挙されている。
寄与度フィルタ311は、この特徴量ランキングを、CNN処理部310が出力する特徴量に適用する。CNN処理部310が出力する特徴量は、1次元の数列データ(配列)であり、配列の要素番号で特徴量を区別する。寄与度フィルタ311の内容は、特徴量配列の要素番号が寄与度の順位に対応して列挙されている。
一方、柱状物体点群303は第二特徴量変換部に相当する点群特徴量算出部313に読み込まれる。点群特徴量算出部313は周知の主成分分析(PCA:principal component analysis)などの点群処理手法を適用し、柱状物体点群303から数十個(例えば21個)の点群特徴量314を抽出する。なお、非特許文献4では、点群処理による特徴量である点群特徴量314として55個を提案している。本発明では、点群特徴量314として、これらのすべて、もしくは一部を用いる。例えば、以下の様な要素を抽出する。
(1)柱状物体の付属物に関する、15個の特徴量
<a>点群の形態を示す、基本的な幾何学的特徴量(全体の大きさ、第一主成分ベクトル、第二主成分ベクトル…等、PCAから得られる固有値)
<b>局所的な点群の形状タイプ(線状、平面状、立体状…等)
(2)付属物の、柱状部分との相対的な情報に関する、3個の特徴量
<c>柱状部分と付属物の重心距離
<d>柱状部分に対する付属物の設置高さ(上からの距離、下からの距離)
(3)柱状部分の情報に関する、3個の特徴量
<e>テーパの角度
<f>テーパを構成する円の半径(上端、下端)
以上、計21個の特徴量を用いる。
なお、点群特徴量314においても、ランダムフォレスト(非特許文献5参照)等を用いて、32個程度に絞り込むことができる。
(1)柱状物体の付属物に関する、15個の特徴量
<a>点群の形態を示す、基本的な幾何学的特徴量(全体の大きさ、第一主成分ベクトル、第二主成分ベクトル…等、PCAから得られる固有値)
<b>局所的な点群の形状タイプ(線状、平面状、立体状…等)
(2)付属物の、柱状部分との相対的な情報に関する、3個の特徴量
<c>柱状部分と付属物の重心距離
<d>柱状部分に対する付属物の設置高さ(上からの距離、下からの距離)
(3)柱状部分の情報に関する、3個の特徴量
<e>テーパの角度
<f>テーパを構成する円の半径(上端、下端)
以上、計21個の特徴量を用いる。
なお、点群特徴量314においても、ランダムフォレスト(非特許文献5参照)等を用いて、32個程度に絞り込むことができる。
32個の画像特徴量312と、21個の点群特徴量314は、併せて53個の柱状物特徴量315として、学習処理部316に入力される。
学習処理部316は、例えばランダムフォレスト(非特許文献5参照)等の教師付き学習アルゴリズムを用いて、柱状物特徴量315に対し、人間等が入力する教師データ317を併せて、辞書データ318を作成する。教師データ317とは、「これは標識である」「これは信号機である」「街灯である」「歩行者信号である」といった、ラベリングである。このように処理を進めることで、辞書データ318は、信号機特徴量、標識特徴量、街灯特徴量、歩行者信号特徴量…に分類される。
つまり、信号機の柱状物特徴量315は信号機特徴量へ、標識の柱状物特徴量315は標識特徴量へ、街灯の柱状物特徴量315は街灯特徴量へ、歩行者信号の柱状物特徴量315は歩行者信号特徴量へ、それぞれ出力される。
学習処理部316は、例えばランダムフォレスト(非特許文献5参照)等の教師付き学習アルゴリズムを用いて、柱状物特徴量315に対し、人間等が入力する教師データ317を併せて、辞書データ318を作成する。教師データ317とは、「これは標識である」「これは信号機である」「街灯である」「歩行者信号である」といった、ラベリングである。このように処理を進めることで、辞書データ318は、信号機特徴量、標識特徴量、街灯特徴量、歩行者信号特徴量…に分類される。
つまり、信号機の柱状物特徴量315は信号機特徴量へ、標識の柱状物特徴量315は標識特徴量へ、街灯の柱状物特徴量315は街灯特徴量へ、歩行者信号の柱状物特徴量315は歩行者信号特徴量へ、それぞれ出力される。
CNN処理部310と寄与度フィルタ311は、正規化柱状物画像309から画像特徴量312を抽出し、点群特徴量算出部313は、柱状物体点群303から点群特徴量314を抽出する。これらは、正規化柱状物画像309と柱状物体点群303から柱状物特徴量315を算出する、特徴抽出処理部319であると言える。
[人工地物認識装置101のソフトウェア機能(推定モードの例)]
図8は、人工地物認識装置101の、推定モードにおけるソフトウェア機能を示すブロック図である。
特徴抽出処理部319までは図3と同じであるので、同一の機能ブロックには同一の符号を付して、説明を省略する。
学習済み分類器801は辞書データ318を参照して、柱状物特徴量315が信号機と類似するか、標識と類似するか…を推定する。学習済み分類器801が出力する推定結果と、柱状物撮影画像と、柱状物体点群303は、外部の情報処理装置へ出力される。
図8は、人工地物認識装置101の、推定モードにおけるソフトウェア機能を示すブロック図である。
特徴抽出処理部319までは図3と同じであるので、同一の機能ブロックには同一の符号を付して、説明を省略する。
学習済み分類器801は辞書データ318を参照して、柱状物特徴量315が信号機と類似するか、標識と類似するか…を推定する。学習済み分類器801が出力する推定結果と、柱状物撮影画像と、柱状物体点群303は、外部の情報処理装置へ出力される。
[実験結果]
図9は、従来技術による人工地物の識別と、本発明の実施形態に係る人工地物認識装置101による識別の結果を示す表である。
表中、点群のみの識別は主成分分析を通した後、ランダムフォレストを用いた。
画像のみの識別はCNNを用いた。
画像+点群の識別は本発明の実施形態に係る人工地物認識装置101、すなわち画像からCNNで特徴量を抽出し、点群から主成分で特徴量を抽出し、それぞれの特徴量を組み合わせてランダムフォレストを用いた。
案内標識の識別率は、点群のみの識別率は画像のみの識別率と比べてスコアがやや低い。これは案内標識の面積が大きいことから、画像が鮮明である場合が多いことに起因すると思われる。
逆に、歩行者信号の識別率は、案内標識とは逆に、歩行者信号は柱状物の付属物としての大きさが小さいため、画像のみの識別率が点群のみの識別率に比べて大きく劣る結果になっている。
図9は、従来技術による人工地物の識別と、本発明の実施形態に係る人工地物認識装置101による識別の結果を示す表である。
表中、点群のみの識別は主成分分析を通した後、ランダムフォレストを用いた。
画像のみの識別はCNNを用いた。
画像+点群の識別は本発明の実施形態に係る人工地物認識装置101、すなわち画像からCNNで特徴量を抽出し、点群から主成分で特徴量を抽出し、それぞれの特徴量を組み合わせてランダムフォレストを用いた。
案内標識の識別率は、点群のみの識別率は画像のみの識別率と比べてスコアがやや低い。これは案内標識の面積が大きいことから、画像が鮮明である場合が多いことに起因すると思われる。
逆に、歩行者信号の識別率は、案内標識とは逆に、歩行者信号は柱状物の付属物としての大きさが小さいため、画像のみの識別率が点群のみの識別率に比べて大きく劣る結果になっている。
街灯の識別率、信号機の識別率についても、その形態的特徴から識別率の差が生じていることが伺える。
しかし、画像+点群、すなわち本発明の実施形態に係る人工地物認識装置101を使用すると、画像と点群の両方の特徴量を学習及び識別の対象とすることから、どちらか一方あるいは両方のスコアが低くても、相補的に識別率が向上している。これら識別率の調和平均を計算すると、人工地物認識装置101は、99.2%という極めて良好な識別率を実現できていることがわかる。
しかし、画像+点群、すなわち本発明の実施形態に係る人工地物認識装置101を使用すると、画像と点群の両方の特徴量を学習及び識別の対象とすることから、どちらか一方あるいは両方のスコアが低くても、相補的に識別率が向上している。これら識別率の調和平均を計算すると、人工地物認識装置101は、99.2%という極めて良好な識別率を実現できていることがわかる。
次に、本発明の実施形態に係る人工地物認識装置101において、53個の柱状物特徴量315からどの程度特徴量を間引くことが可能か、シミュレーション計算を行った結果を示す。
図10Aは、53個の柱状物特徴量315の要素に対し、寄与度フィルタ311と同様に寄与度を計算し、上位32個のみを用いて学習を行い、識別処理を行った結果の識別率を示す表である。
図10Bは、柱状物特徴量315の要素を、21個の点群特徴量314はそのままで、画像特徴量312を4075個まで増加させて学習を行い、識別処理を行った結果の識別率を示す表である。
表中、「recall」とは再現率、「precision」は適合率、「F−measure」とはF値を示す。
概ね、柱状物特徴量315の数は32個でほぼ実用的な値が得られており、これ以上要素を増やしても劇的な識別率の改善は期待できないことがわかる。
図10Aは、53個の柱状物特徴量315の要素に対し、寄与度フィルタ311と同様に寄与度を計算し、上位32個のみを用いて学習を行い、識別処理を行った結果の識別率を示す表である。
図10Bは、柱状物特徴量315の要素を、21個の点群特徴量314はそのままで、画像特徴量312を4075個まで増加させて学習を行い、識別処理を行った結果の識別率を示す表である。
表中、「recall」とは再現率、「precision」は適合率、「F−measure」とはF値を示す。
概ね、柱状物特徴量315の数は32個でほぼ実用的な値が得られており、これ以上要素を増やしても劇的な識別率の改善は期待できないことがわかる。
図11は、柱状物特徴量315の数と識別率の関係を示す折れ線グラフである。柱状物特徴量315の要素については寄与度を計算し、その上位から抽出して識別を行った結果である。
このグラフを見る限り、上位12個程度でも十分実用的な識別率を得られている一方、29番目の特徴量において一部識別率が低下していることから、32個がほぼ妥当な柱状物特徴量315の要素数であることがわかる。
このグラフを見る限り、上位12個程度でも十分実用的な識別率を得られている一方、29番目の特徴量において一部識別率が低下していることから、32個がほぼ妥当な柱状物特徴量315の要素数であることがわかる。
図12は、柱状物特徴量315の要素のうち、寄与度の順に並べた上位32個の内訳を示す表である。
表中、「画像特徴量」という名称が画像特徴量312の要素であり、付されている番号が要素番号である。「画像特徴量」と書かれていない名称の要素は全て点群特徴量314の要素である。
寄与度の順位で見ると、点群特徴量314の要素の間に画像特徴量312の要素が幾つか挟まっているような状態である。このように互いの要素同士が入り組んだ状態であることから、点群特徴量314単体、あるいは画像特徴量312単体の認識処理と比べて、高い認識率を得られていることが推測できる。
表中、「画像特徴量」という名称が画像特徴量312の要素であり、付されている番号が要素番号である。「画像特徴量」と書かれていない名称の要素は全て点群特徴量314の要素である。
寄与度の順位で見ると、点群特徴量314の要素の間に画像特徴量312の要素が幾つか挟まっているような状態である。このように互いの要素同士が入り組んだ状態であることから、点群特徴量314単体、あるいは画像特徴量312単体の認識処理と比べて、高い認識率を得られていることが推測できる。
図8にて説明した人工地物認識装置101の機能は、データの処理手順をも表している。すなわち、人工地物認識装置101は、
3次元の座標情報を有する点群の集合体である点群データベースから、柱状物体を構成する点群である柱状物体点群を抽出する、柱状物体抽出処理ステップ(柱状物体抽出処理部302)と、
カメラが撮影した画像データと撮影日時が格納されている撮影画像データベースから、前記柱状物体点群に含まれているGPS時刻を基に、前記柱状物体点群が被写体となって写っている画像データを検索する画像検索処理ステップ(画像検索処理部305)と、
前記画像検索処理ステップの検索結果によってヒットした複数の前記画像データに対し、前記柱状物体点群を投影することによって、最適な前記画像データを選択して柱状物画像を得る画像点群投影処理ステップ(画像点群投影処理部307)と、
前記柱状物画像から特徴量を得る第一特徴量変換ステップ(第一特徴量変換部に相当するCNN処理部310)と、
前記第一特徴量変換ステップによって得られた前記特徴量に対し、寄与度に基づいて上位の特徴量を抜粋して画像特徴量を得る寄与度フィルタリングステップ(寄与度フィルタ311)と、
前記柱状物体点群から点群特徴量を得る第二特徴量変換ステップ(第二特徴量変換部に相当する点群特徴量算出部313)と、
前記画像特徴量と前記点群特徴量よりなる柱状物特徴量を、予め作成した辞書データを用いて分類する、学習済み分類ステップ(学習済み分類器801)と
を有する、人工地物認識方法を実現する。
3次元の座標情報を有する点群の集合体である点群データベースから、柱状物体を構成する点群である柱状物体点群を抽出する、柱状物体抽出処理ステップ(柱状物体抽出処理部302)と、
カメラが撮影した画像データと撮影日時が格納されている撮影画像データベースから、前記柱状物体点群に含まれているGPS時刻を基に、前記柱状物体点群が被写体となって写っている画像データを検索する画像検索処理ステップ(画像検索処理部305)と、
前記画像検索処理ステップの検索結果によってヒットした複数の前記画像データに対し、前記柱状物体点群を投影することによって、最適な前記画像データを選択して柱状物画像を得る画像点群投影処理ステップ(画像点群投影処理部307)と、
前記柱状物画像から特徴量を得る第一特徴量変換ステップ(第一特徴量変換部に相当するCNN処理部310)と、
前記第一特徴量変換ステップによって得られた前記特徴量に対し、寄与度に基づいて上位の特徴量を抜粋して画像特徴量を得る寄与度フィルタリングステップ(寄与度フィルタ311)と、
前記柱状物体点群から点群特徴量を得る第二特徴量変換ステップ(第二特徴量変換部に相当する点群特徴量算出部313)と、
前記画像特徴量と前記点群特徴量よりなる柱状物特徴量を、予め作成した辞書データを用いて分類する、学習済み分類ステップ(学習済み分類器801)と
を有する、人工地物認識方法を実現する。
本実施形態では、人工地物認識装置101を開示した。
柱状物体点群303から点群特徴量算出部313を用いて点群特徴量314を得る。正規化柱状物画像309からCNN処理部310を用いて特徴量を抽出し、更に寄与度フィルタ311で上位の特徴量を抜粋して、画像特徴量312を得る。点群特徴量314と画像特徴量312を組み合わせて柱状物特徴量315として、学習処理を行い、学習済み分類器801を作成する。この学習済み分類器801を用いることで、道路103周辺の人工地物を高い認識率で認識し、分類することが可能になる。
柱状物体点群303から点群特徴量算出部313を用いて点群特徴量314を得る。正規化柱状物画像309からCNN処理部310を用いて特徴量を抽出し、更に寄与度フィルタ311で上位の特徴量を抜粋して、画像特徴量312を得る。点群特徴量314と画像特徴量312を組み合わせて柱状物特徴量315として、学習処理を行い、学習済み分類器801を作成する。この学習済み分類器801を用いることで、道路103周辺の人工地物を高い認識率で認識し、分類することが可能になる。
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、他の変形例、応用例を含む。
101…人工地物認識装置、102…MMS、103…道路、104…レーザスキャナ、105…カメラ、106…信号機、107…ハードディスク、201…CPU、202…ROM、203…RAM、204…不揮発性ストレージ、205…表示部、206…操作部、207…バス、208…NIC、301…点群データベース、302…柱状物体抽出処理部、303…柱状物体点群、304…撮影画像データベース、305…画像検索処理部、306…柱状物体撮影画像、307…画像点群投影処理部、308…画像正規化処理部、309…正規化柱状物画像、310…CNN処理部、311…寄与度フィルタ、312…画像特徴量、313…点群特徴量算出部、314…点群特徴量、315…柱状物特徴量、316…学習処理部、317…教師データ、318…辞書データ、319…特徴抽出処理部、801…学習済み分類器
Claims (4)
- 3次元の座標情報を有する点群の集合体である点群データベースから、柱状物体を構成する点群である柱状物体点群を抽出する、柱状物体抽出処理部と、
カメラが撮影した画像データと撮影日時が格納されている撮影画像データベースから、前記柱状物体点群に含まれている時刻を基に、前記柱状物体点群が被写体となって写っている画像データを検索する画像検索処理部と、
前記画像検索処理部の検索処理によってヒットした複数の前記画像データに対し、前記柱状物体点群を投影することによって、最適な前記画像データを選択して柱状物画像を得る画像点群投影処理部と、
前記柱状物画像から特徴量を得る第一特徴量変換部と、
前記第一特徴量変換部が出力した前記特徴量に対し、寄与度に基づいて上位の特徴量を抜粋して画像特徴量を得る寄与度フィルタと、
前記柱状物体点群から点群特徴量を得る第二特徴量変換部と、
前記画像特徴量と前記点群特徴量よりなる柱状物特徴量を、予め作成した辞書データを用いて分類する、学習済み分類器と
を具備する、人工地物認識装置。 - 前記第一特徴量変換部はCNNを実行するものであり、
前記第二特徴量変換部は主成分分析を実行するものであり、
前記辞書データはランダムフォレストを用いた学習処理によって形成されるものである、
請求項1に記載の人工地物認識装置。 - 3次元の座標情報を有する点群の集合体である点群データベースから、柱状物体を構成する点群である柱状物体点群を抽出する、柱状物体抽出処理ステップと、
カメラが撮影した画像データと撮影日時が格納されている撮影画像データベースから、前記柱状物体点群に含まれている時刻を基に、前記柱状物体点群が被写体となって写っている画像データを検索する画像検索処理ステップと、
前記画像検索処理ステップの検索結果によってヒットした複数の前記画像データに対し、前記柱状物体点群を投影することによって、最適な前記画像データを選択して柱状物画像を得る画像点群投影処理ステップと、
前記柱状物画像から特徴量を得る第一特徴量変換ステップと、
前記第一特徴量変換ステップによって得られた前記特徴量に対し、寄与度に基づいて上位の特徴量を抜粋して画像特徴量を得る寄与度フィルタリングステップと、
前記柱状物体点群から点群特徴量を得る第二特徴量変換ステップと、
前記画像特徴量と前記点群特徴量よりなる柱状物特徴量を、予め作成した辞書データを用いて分類する、学習済み分類ステップと
を有する、人工地物認識方法。 - 計算機を、
3次元の座標情報を有する点群の集合体である点群データベースから、柱状物体を構成する点群である柱状物体点群を抽出する、柱状物体抽出処理部と、
カメラが撮影した画像データと撮影日時が格納されている撮影画像データベースから、前記柱状物体点群に含まれている時刻を基に、前記柱状物体点群が被写体となって写っている画像データを検索する画像検索処理部と、
前記画像検索処理部の検索処理によってヒットした複数の前記画像データに対し、前記柱状物体点群を投影することによって、最適な前記画像データを選択して柱状物画像を得る画像点群投影処理部と、
前記柱状物画像から特徴量を得る第一特徴量変換部と、
前記第一特徴量変換部が出力した前記特徴量に対し、寄与度に基づいて上位の特徴量を抜粋して画像特徴量を得る寄与度フィルタと、
前記柱状物体点群から点群特徴量を得る第二特徴量変換部と、
前記画像特徴量と前記点群特徴量よりなる柱状物特徴量を、予め作成した辞書データを用いて分類する、学習済み分類器と
を具備する、人工地物認識装置として動作させるための人工地物認識プログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017066201 | 2017-03-10 | ||
JP2017066201 | 2017-03-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018152036A true JP2018152036A (ja) | 2018-09-27 |
Family
ID=63680931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017127765A Pending JP2018152036A (ja) | 2017-03-10 | 2017-06-29 | 人工地物認識装置、人工地物認識方法及び人工地物認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018152036A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7417465B2 (ja) | 2020-05-07 | 2024-01-18 | 株式会社トヨタマップマスター | 情報処理装置、情報処理方法及び情報処理プログラム |
JP7417466B2 (ja) | 2020-05-07 | 2024-01-18 | 株式会社トヨタマップマスター | 情報処理装置、情報処理方法及び情報処理プログラム |
-
2017
- 2017-06-29 JP JP2017127765A patent/JP2018152036A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7417465B2 (ja) | 2020-05-07 | 2024-01-18 | 株式会社トヨタマップマスター | 情報処理装置、情報処理方法及び情報処理プログラム |
JP7417466B2 (ja) | 2020-05-07 | 2024-01-18 | 株式会社トヨタマップマスター | 情報処理装置、情報処理方法及び情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | CCTSDB 2021: a more comprehensive traffic sign detection benchmark | |
US11144786B2 (en) | Information processing apparatus, method for controlling information processing apparatus, and storage medium | |
CN108345822B (zh) | 一种点云数据处理方法及装置 | |
US9970774B2 (en) | Automatic content analysis method and system | |
WO2018068653A1 (zh) | 点云数据处理方法、装置及存储介质 | |
CN110226186B (zh) | 表示地图元素的方法和装置以及定位的方法和装置 | |
US8953838B2 (en) | Detecting ground geographic features in images based on invariant components | |
US9129163B2 (en) | Detecting common geographic features in images based on invariant components | |
JP5225542B2 (ja) | 地図情報生成方法、地図情報生成プログラム及び地図情報収集装置 | |
JP2011505610A (ja) | 画像センサデータに距離センサデータをマッピングする方法及び装置 | |
WO2020093939A1 (zh) | 定位方法、装置以及电子设备 | |
Silvister et al. | Deep learning approach to detect potholes in real-time using smartphone | |
CN112836657A (zh) | 一种基于轻量化YOLOv3的行人检测方法及系统 | |
JP2010224670A (ja) | 車両の周辺監視装置 | |
CN111931683A (zh) | 图像识别方法、装置及计算机可读存储介质 | |
Almutairy et al. | Arts: Automotive repository of traffic signs for the united states | |
Murray et al. | Mobile mapping system for the automated detection and analysis of road delineation | |
JP2018152036A (ja) | 人工地物認識装置、人工地物認識方法及び人工地物認識プログラム | |
Matsuda et al. | A system for real-time on-street parking detection and visualization on an edge device | |
Singh et al. | A Review: Techniques of vehicle detection in Fog | |
Arvind et al. | Vision based speed breaker detection for autonomous vehicle | |
Bruno et al. | A comparison of traffic signs detection methods in 2d and 3d images for the benefit of the navigation of autonomous vehicles | |
Sadekov et al. | Road sign detection and recognition in panoramic images to generate navigational maps | |
JP7238821B2 (ja) | 地図生成システム及び地図生成プログラム | |
KR102286178B1 (ko) | 정밀도로지도 품질평가 점수 생성 및 배포 시스템 |