JP7295710B2 - 学習用画像データ生成装置 - Google Patents

学習用画像データ生成装置 Download PDF

Info

Publication number
JP7295710B2
JP7295710B2 JP2019107298A JP2019107298A JP7295710B2 JP 7295710 B2 JP7295710 B2 JP 7295710B2 JP 2019107298 A JP2019107298 A JP 2019107298A JP 2019107298 A JP2019107298 A JP 2019107298A JP 7295710 B2 JP7295710 B2 JP 7295710B2
Authority
JP
Japan
Prior art keywords
sign
image
traffic sign
learning
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019107298A
Other languages
English (en)
Other versions
JP2020201661A (ja
Inventor
淳一 竹田
Original Assignee
ジオテクノロジーズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジオテクノロジーズ株式会社 filed Critical ジオテクノロジーズ株式会社
Priority to JP2019107298A priority Critical patent/JP7295710B2/ja
Publication of JP2020201661A publication Critical patent/JP2020201661A/ja
Application granted granted Critical
Publication of JP7295710B2 publication Critical patent/JP7295710B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、学習用データ構造及び学習用画像データ生成装置に関する。
車両の運転者をサポートする際、及び、車両を自動運転する際には、画像処理によって交通標識を高精度で認識できるようにすることが好ましい。
例えば特許文献1には、以下の技術が記載されている。まず、車両に搭載された装置が、画像解析によって道路標識を認識し、認識結果を情報センタに送信する。情報センタは、この認識結果を含む情報を、他の車両に配信する。
また、特許文献2には、以下の技術が記載されている。まず、車載カメラによって撮影された画像に対して明暗に関する補正を行うことにより、明暗補正画像を生成する。また、同じ画像に対して色に関する補正を行うことにより、色補正画像を生成する。次いで、明暗補正画像を用いて物体を検出するとともに、色補正画像を用いて物体検出を行う。そして、2つの物体検出処理結果を用いて、標識及び表示を認識する。
一方、近年は機械学習に関する開発が行われている。機械学習の精度は、教師データの質及び量に大きく影響される。これに対して特許文献3には、背景の特徴量を別の値に置換することにより、シルエット画像から複数の学習用の画像を生成することが記載されている。
特開2004-171159号公報 特開2018-72893号公報 特開2008-59110号公報
上記したように、機械学習の精度は、学習データの質及び量に大きく影響される。一方、交通標識は様々な場所に配置されているが、その見え方はその時の環境によって大きく変わる。このため、機械学習の結果を用いて交通標識を精度よく認識できるようにするためには、様々な環境の下で撮影された画像を学習用のデータとして準備する必要がある。
本発明が解決しようとする課題としては、交通標識を認識するための学習用のデータを準備しやすくすることが一例として挙げられる。
請求項1に記載の発明は、第1交通標識を含む撮影画像から取得される前記第1交通標識の外観に影響を与える標識処理データと、前記第1交通標識とは異なる第2交通標識の画像を用いて生成される、前記第2交通標識を学習するための学習用画像データと、
前記学習用画像データが前記第2交通標識を含むことを示す属性データと、
を有する学習用データ構造である。
請求項4に記載の発明は、第1交通標識を含む撮影画像から、前記第1交通標識の外観に影響を与える標識処理データを取得する取得手段と、
前記第1交通標識とは異なる第2交通標識の画像と、前記標識処理データとを用いて前記第2交通標識を学習するための学習用画像データを生成する生成手段と、
を有する学習用画像データ生成装置である。
請求項11に記載の発明は、第1交通標識を含む複数の撮影画像から、GAN(Generative Adversarial Networks)を用いて生成される第1の特徴量空間を用いて、前記第1の特徴量空間において指定された点に対応する画像の特徴量である指定点特徴量と前記第1の特徴量空間における前記第1交通標識を示す所定の標準画像の特徴量である標準特徴量との差分により標識処理データを取得する取得手段と、
前記第1交通標識とは異なる第2交通標識の画像の標識特徴量と、前記標識処理データとを用いて前記第2交通標識の学習用画像データを生成する生成手段と、
を有する学習用画像データ生成装置である。
請求項14に記載の発明は、標識が設置される道路の道路種別が高速道路である第1交通標識を含む撮影画像から、前記第1交通標識の外観に影響を与える標識処理データを取得する取得手段と、
前記第1交通標識とは異なり標識が設置される道路の道路種別が高速道路である第2交通標識の画像と、前記標識処理データと、高速道路の風景画像とを用いて前記第2交通標識を学習するための学習用画像データを生成する生成手段と、
を有する学習用画像データ生成装置である。
請求項15に記載の発明は、第1交通標識を含む撮影画像から、前記第1交通標識の外観に影響を与える標識処理データを取得する取得手段と、
前記第1交通標識とは異なる第2交通標識の画像と、前記標識処理データと、風景を撮影した風景画像を用いて前記第2交通標識を学習するための学習用画像データを生成する生成手段と、を有し、
前記撮影画像および前記風景画像の撮影時間帯が同一である学習用画像データ生成装置である。
第1実施形態に係る学習用画像データ生成装置の機能構成を示す図である。 生成部の処理を模式的に説明するための図である。 取得部及び生成部が行う処理の例を説明するための図である。 撮影画像記憶部が記憶している撮影画像の一例を示す図である。 撮影画像記憶部が記憶している撮影画像の一例を示す図である。 撮影画像記憶部が記憶しているデータのデータ構造の第1例を示す図である。 撮影画像記憶部が記憶しているデータのデータ構造の第2例を示す図である。 標識処理データ記憶部が記憶しているデータのデータ構造の一例を示す図である。 学習用画像データ生成装置のハードウェア構成例を示す図である。 取得部による標識処理データの生成処理の一例を示す図である。 生成部による学習用画像データの生成処理の第1例を示す図である。 生成部による学習用画像データの生成処理の第2例を示す図である。 生成部による学習用画像データの生成処理の第3例を示す図である。 生成部による学習用画像データの生成処理の第4例を示す図である。 第2実施形態に係る学習用画像データ生成装置の機能構成を示す図である。 第2実施形態に係る生成部が行う処理の第1例を示す図である。 第2実施形態に係る生成部が行う処理の第2例を示す図である。 第3実施形態に係る学習用画像データ生成装置の機能構成を示す図である。
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
[第1実施形態]
図1は、本実施形態に係る学習用画像データ生成装置10の機能構成を示す図である。この学習用画像データ生成装置10は、取得部110及び生成部120を備えている。取得部110は、第1交通標識を含む撮影画像から、標識処理データを取得する。標識処理データは、第1交通標識の外観に影響を与えるデータ、言い換えると交通標識の外観を変更するためのパラメータである。生成部120は、第1交通標識とは異なる第2交通標識の画像と、標識処理データとを用いて第2交通標識を学習するための学習用画像データを生成する。学習用画像データは、機械学習によって処理される。以下、学習用画像データ生成装置10について詳細に説明する。
本実施形態において、取得部110は撮影画像を撮影画像記憶部130から取得する、撮影画像記憶部130は、複数の撮影画像を記憶している。撮影画像は、実際に設置されている交通標識を撮影した画像であり、例えば車載カメラによって生成されている。ただし、撮影画像は車載カメラ以外のカメラ、例えば定点カメラや人が保持しているカメラによって生成されていてもよい。
また、取得部110は標識処理データを生成する際に、第1交通標識を示す標準画像を用いる。この標準画像は、例えば、背景や陰影を含まない第1交通標識の画像(以下、テンプレート画像と記載)である。ただし標準画像は、撮影画像から第1交通標識をトリミングすることにより生成されていてもよい。本実施形態において、取得部110は標識標準画像記憶部140から標準画像を取得する。そして取得部110は、この標準画像と、撮影画像中の第1交通標識との差分により、標識処理データを取得する。標識処理データは、例えば図6を用いて後述するように、特徴量空間における座標である。
そして取得部110は、一つの撮影画像につき一つの標識処理データを生成する。撮影画像記憶部130は複数の撮影画像を記憶しているため、取得部110は、複数の標識処理データを生成できる。
図1に示す例において、取得部110は標識処理データを標識処理データ記憶部150に記憶させる。そして生成部120は、標識処理データ記憶部150から標識処理データを読み出す。標識処理データ記憶部150は不揮発性の記憶部である。ただし、標識処理データ記憶部150はメモリなど揮発性の記憶部であってもよい。この場合、標識処理データ記憶部150は、取得部110が生成した標識処理データを一時的に記憶する。
取得部110は、例えば機械学習を用いて標識処理データを生成する。この機械学習の一例は、GAN(Generative Adversarial Networks)であるが、他の手法、例えばVAE(Variational Auto Encoder)やCVAE(Conditional Variational Auto Encoder)を用いてもよい。
生成部120は、上記したように、第2交通標識の画像と、標識処理データとを用いて、第2交通標識を学習するための学習用画像データを生成する。図1に示す例において、生成部120は、第2交通標識の標準画像を標識標準画像記憶部140から読み出して使用する。そして生成部120は、生成した学習用画像データをその画像の属性データとともに学習用データ記憶部160に記憶させる。すなわち学習用画像データと属性データによりデータ構造が構成されている。属性データは、少なくとも、この学習用画像データが第2交通標識を含むことを示している。
上記したように、生成部120は学習用画像データを生成する際に、標識処理データを用いている。標識処理データは、上記したように、GANなどの機械学習を用いて生成されている。このように、学習用画像データは、一般的な画像合成のみを用いて生成された画像データではなく、機械学習を用いて生成された画像データである。
なお、標識標準画像記憶部140は、交通標識の標準画像を、その交通標識が設置される道路の種別(例えば一般道、高速道路、及び有料道路)を特定する情報に紐づけて記憶していてもよい。このようにすると、道路種が指定されると、その道路種に対応した第2交通標識を選択し、選択した第2交通標識に関する学習用画像データを生成することができる。すなわち、道路種別に、その道路に設置される可能性が高い交通標識を含む学習用画像データを生成できる。
特に、後述する他の実施例において図15を用いて説明するように、標識の背景画像についても道路種別が紐づけられている場合、その道路の種別に応じた背景画像を選択できるため、より良い学習用画像データを生成できる。
また、山間部に警戒標識が多い、人口の多いところに駐車禁止が多い等、特定の交通標識が存在しやすい道路種別や地域属性がある。このため、交通標識に、道路種別や地域属性を紐づけており、第2交通標識が選択されると、その第2交通標識に紐付いた道路種別や地域属性を選択し、さらにこの道路種別や地域属性に紐付いた背景画像を選択してもよい。このようにすると、現実に近い教師用画像データを生成できる。
一方、背景画像を選択する際に、道路種別や地域属性を考慮しなくてもよい。このようにすると、例外的な組み合わせに従った教師用画像データが生成されるため、教師用画像データのバリエーションは増える。このように、学習用画像データ生成装置10を用いると、その用途に合わせて教師用画像データを生成できる。
なお、地域属性の一例は、後述するように、都市、郊外、トンネル、及び山間部などの地域の特徴、並びに人口密度の少なくとも一方である。そしてこの地域属性は、例えば、道路種別や一般的な地理情報などから判断できる。
生成部120の機能により、学習用データ記憶部160は、第2交通標識に関する複数の学習用画像データを記憶することができる。これら複数の学習用画像データは機械学習の教師データとして使用される。そしてこの機械学習の結果(例えば分類器)は、車載カメラが撮像した画像が第2交通標識を含むか否かを判別する際に用いられる。学習用画像データ生成装置10は、さらに、この判別処理を行ってもよい。
なお、学習用データ記憶部160は、学習用画像データの代わりに、後述する特徴量空間の座標を学習用データとして記憶していてもよい。
図1に示した例において、撮影画像記憶部130、標識標準画像記憶部140、標識処理データ記憶部150、及び学習用データ記憶部160は、いずれも学習用画像データ生成装置10の一部である。ただし、これら記憶部の少なくとも一つは、学習用画像データ生成装置10の外部のストレージであってもよい。この場合、学習用画像データ生成装置10とこのストレージは、通信回線を介して互いに接続する。この通信回線の少なくとも一部は無線であってもよい。
図2は、生成部120の処理を模式的に説明するための図である。撮影画像は、実際に設置されている第1交通標識の画像である。このため、この画像には、陰影や白とびなど、環境起因の様々な影響が加わっている。生成部120は、撮影画像と第1交通標識の標準画像の差分を、この影響を他の画像に再現するためのデータ(すなわち標識処理データ)として生成する。
そして、この標識処理データを用いて第2交通標識の画像を処理することにより、学習用画像データを生成する。この学習用画像データは、第2交通標識に対して、撮影画像と同様の影響が加わった画像となっている。
図3は、取得部110及び生成部120が行う処理の例を説明するための図である。画像を機械学習するアルゴリズムの大部分は、画像から複数種類の特徴量を抽出し、これら複数種類の特徴量のそれぞれを座標軸とした多次元の特徴量空間における座標を、学習対象にする。
取得部110は、画像を処理することにより、上述した特徴量を生成する。そして、この特徴量空間における、撮影画像の座標(指定点特徴量の一例)と標準画像の座標(標準特徴量の一例)の差分、すなわち各特徴量の差分を、標識処理データとして生成する。この場合、標識処理データは、例えば標準画像の座標を原点とした、撮影画像の座標のベクトルとして示される。
そして生成部120は、第2標識画像に関する特徴量空間において、第2標識画像の座標(標識特徴量の一例)を上記した差分ほど移動させ(例えばベクトルを加える)、この移動後の座標(特徴量)を用いることにより、学習用画像データを生成する。
なお、特徴量空間で用いられる特徴量としては、例えば、標識の姿勢(yaw、pitch、及びrollの少なくとも一つ)、明度、汚れ具合、左右反転(H-Flip)、並びに上下反転(V-Flip)の少なくとも2つ以上であるが、これらをすべて用いるのが好ましい。また、撮影画像が背景を含む場合、特徴量空間で用いられる特徴量には、地域属性(都市、郊外、トンネル、及び山間部などの区別、及び人口密度の少なくとも一方)の確からしさ、緑の多さ、建物の多さ、及び車両の多さの少なくとも一つを含めることができる。また、撮影画像に、その撮影画像を撮影した時の天候情報が紐付いている場合、特徴量空間で用いられる特徴量にこの天候情報を含めてもよい。ここで用いられる天候情報は、例えば、日照量、雨の有無及びその降水量、霧の有無、並びに雪の有無その降水量の少なくとも一つである。
図4及び図5のそれぞれは、撮影画像記憶部130が記憶している撮影画像の一例を示している。これらの図に示すように、撮影画像記憶部130は、同一の交通標識を含む撮影画像を複数有している。図4に示す例において、撮影画像記憶部130は、交通標識をトリミングした画像を撮影画像として記憶している。一方、図5に示すように、撮影画像記憶部130は、背景を含む画像を撮影画像として記憶していてもよい。
図6は、撮影画像記憶部130が記憶しているデータのデータ構造の第1例を示す図である。上記したように、撮影画像記憶部130は、同一の交通標識(第1交通標識)を含む画像を複数記憶している。また、本図に示す例において、撮影画像記憶部130は、撮影画像を、その画像の属性に紐づけて記憶している。画像の属性としては、例えば画像が撮影された地域を特定する情報(例えば緯度経度情報や住所情報)、その第1交通標識が設けられていた道路の種別(例えば一般道、高速道路、及び有料道路)を特定する情報、標識の形状を特定する情報、並びに撮影日時(又は時間帯のみ)の少なくとも一つである。このようにすると、取得部110は、指定された属性を有する撮影画像のみを選択して処理することにより、属性別に標識処理データを生成することができる。
なお、撮影画像記憶部130は、複数の交通標識それぞれについて、複数の撮影画像を記憶していてもよいし、一つの交通標識について複数の撮影画像を記憶していてもよい。前者の場合、撮影画像記憶部130は、図6に示すように、交通標識を特定する情報(以下、標識特定情報と記載)を、撮影画像に紐づけて記憶している。
図7は、撮影画像記憶部130が記憶しているデータのデータ構造の第2例を示す図である。本図に示す例において、撮影画像記憶部130は、標識の種類を区別せずに撮影画像を記憶している。その代わりに、撮影画像のそれぞれを、その撮影画像の属性情報に紐づけて記憶するとともに、その撮影画像が含む交通標識の標識特定情報に紐付づけて記憶している。
図8は、標識処理データ記憶部150が記憶しているデータのデータ構造の一例を示す図である。本図に示す例において、標識処理データ記憶部150は、属性毎に複数の標識処理データ(図中データ群と記載)を記憶している。この属性の具体例は、撮影画像に紐づけられた属性と同様であり、少なくとも、交通標識が存在する地域を示す地域属性、設置される道路の道路種別を示す道路種別属性、及び交通標識の形状を示す形状属性の少なくとも一つを含む。本図に示す例において、標識処理データ記憶部150は、道路の種別に標識処理データを記憶している。ただし標識処理データ記憶部150は、地域別又は標識の形状別に標識処理データを記憶していてもよい。
なお、取得部110が、属性に関係ない状態で標識処理データを生成していることも有る。この場合、取得部110は、複数の標識処理データを属性に紐付けない状態で記憶する。
図8は、学習用画像データ生成装置10のハードウェア構成例を示す図である。学習用画像データ生成装置10は、バス1010、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060を有する。
バス1010は、プロセッサ1020、メモリ1030、ストレージデバイス1040、入出力インタフェース1050、及びネットワークインタフェース1060が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1020などを互いに接続する方法は、バス接続に限定されない。
プロセッサ1020は、CPU(Central Processing Unit) やGPU(Graphics Processing Unit)などで実現されるプロセッサである。
メモリ1030は、RAM(Random Access Memory)などで実現される主記憶装置である。
ストレージデバイス1040は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、又はROM(Read Only Memory)などで実現される補助記憶装置である。ストレージデバイス1040は学習用画像データ生成装置10の各機能(例えば取得部110及び生成部120)を実現するプログラムモジュールを記憶している。プロセッサ1020がこれら各プログラムモジュールをメモリ1030上に読み込んで実行することで、そのプログラムモジュールに対応する各機能が実現される。
入出力インタフェース1050は、学習用画像データ生成装置10と各種入出力機器とを接続するためのインタフェースである。
ネットワークインタフェース1060は、学習用画像データ生成装置10をネットワークに接続するためのインタフェースである。このネットワークは、例えばLAN(Local Area Network)やWAN(Wide Area Network)である。ネットワークインタフェース1060がネットワークに接続する方法は、無線接続であってもよいし、有線接続であってもよい。
図10は、取得部110による標識処理データの生成処理の一例を示す図である。取得部110は、属性の指定を取得する(ステップS102)。この指定は、例えば、キーボード、マウス、音声認識デバイス等の入力デバイスを介して、学習用画像データ生成装置10のユーザから入力される。また、ここで特定される属性は、図6を用いて説明した通りであり、例えば、交通標識が存在する地域を示す地域属性、及び、設置される道路の道路種別を示す道路種別属性、及び交通標識の形状を示す形状属性の少なくとも一つである。
すると取得部110は、撮影画像記憶部130から、指定された属性に対応する撮影画像を複数読み出す。また取得部110は、読み出した各撮影画像に紐付いた標識特定情報を認識し、この標識特定情報に対応する標準画像を標識標準画像記憶部140から読み出す(ステップS104)。次いで取得部110は、読み出した撮影画像及び標準画像を用いて、標識処理データを生成する。取得部110は、標識処理データの生成処理を、複数の撮影画像それぞれに対して行う。そして取得部110は、生成した複数の標識処理データを、ステップS102で取得した属性に紐づけて標識処理データ記憶部150に記憶させる(ステップS106)。
図11は、生成部120による学習用画像データの生成処理の第1例を示す図である。生成部120は、第2交通標識の指定を取得する。この指定は、例えば、キーボード、マウス、音声認識デバイス等の入力デバイスを介して、学習用画像データ生成装置10のユーザから入力される(ステップS202)。
次いで生成部120は、指定された第2交通標識の標準画像を、標識標準画像記憶部140から読み出す。また生成部120は、複数の標識処理データを標識処理データ記憶部150から読み出す(ステップS204)。次いで生成部120は、読み出した標準画像を、標識処理データを用いて処理することにより学習用画像データを生成する。生成部120は、学習用画像データの生成処理を、複数の標識処理データ毎に行う。このため、生成部120は、一つの標準画像から複数の学習用画像データを生成する。
次いで生成部120は、生成した複数の学習用画像データを、その学習用画像データの属性情報とともに学習用データ記憶部160に記憶させる(ステップS206)。学習用画像データの属性情報は、少なくとも、その学習用画像データが第2交通標識を含むことを示している。
図12は、生成部120による学習用画像データの生成処理の第2例を示す図である。本図に示す例において、生成部120は、第2交通標識の指定を取得するとともに、生成される学習用画像データの属性を取得する(ステップS212)。この属性は、例えば、交通標識が存在する地域を示す地域属性、及び、設置される道路の道路種別を示す道路種別属性の少なくとも一つである。これらの取得は図11のステップS202と同様である。
すると生成部120は、第2交通標識の標準画像を標識標準画像記憶部140から読み出すとともに、取得した属性に対応する標識処理データを、標識処理データ記憶部150から読み出す(ステップS214)。そして生成部120は、読み出した第2交通標識の標準画像及び標識処理データを用いて学習用画像データを生成し、生成した学習用画像データを、属性情報に紐づけて学習用データ記憶部160に記憶させる(ステップS216)。ステップS216の処理は、図11のステップS206と同様である。ただし、学習用画像データに紐付いた属性情報には、その学習用画像データが第2交通標識を含むことの他に、ステップS212で取得した属性が含まれる。
なお、標識標準画像記憶部140において第2交通標識の標準画像に属性が紐付いている場合、生成部120は、ステップS212において学習用画像データの属性を取得する代わりに、ステップS214において、標識標準画像記憶部140から、第2交通標識の標準画像に紐付いた属性を読み出してもよい。
図13は、生成部120による学習用画像データの生成処理の第3例を示す図である。本図に示す例において、標識処理データ記憶部150には予め標識処理データが記憶されていない。
本図において、ステップS222に示した処理は、図12のステップS212に示した処理と同様である。また、ステップS228に示した処理は、図12のステップS216に示した処理と同様である。ただし、ステップS216に示した処理の代わりに、ステップS224,S226を有している。
具体的には、生成部120は、ステップS222で取得した属性に対応する複数の撮影画像を撮影画像記憶部130から読み出す(ステップS224)。次いで生成部120は、ステップS224で読み出した複数の撮影画像を用いて、複数の標識処理データを生成する(ステップS226)。そしてステップS228において、生成部120は、ステップS226で生成した標識処理データを用いる。
図14は、生成部120による学習用画像データの生成処理の第4例を示す図である。まず生成部120は、標識処理データ記憶部150から標識処理データを読み出す。この際、生成部120は、標識処理データ記憶部150から、読み出した標識処理データの属性も取得する(ステップS232)。この属性は、上記したように、交通標識が存在する地域を示す地域属性、設置される道路の道路種別を示す道路種別属性、及び交通標識の形状を示す形状属性の少なくとも一つである。
ここで生成部120は、まず、属性の指定を入力デバイスを介して取得してもよい。この場合、ステップS232において、生成部120は、標識処理データ記憶部150から、指定された属性を有する標識処理データを複数読み出す。
次いで生成部120は、ステップS232で読み出した属性と同一の属性を有する第2交通標識の標準画像を標識標準画像記憶部140から読み出す(ステップS234)。次いで生成部120は、ステップS234で読み出した第2交通標識の標準画像を、ステップS232で読み出した複数の標識処理データを用いて処理することにより、複数の学習用画像データを生成して学習用データ記憶部160に記憶させる(ステップS236)。ステップS234において複数の第2交通標識が読み出されていた場合、生成部120は、これら複数の第2交通標識のそれぞれに対してステップS236に示した処理を行う。
以上、本実施形態によれば、生成部120は、第2交通標識の標準画像を、第1交通標識を含む撮影画像から取得された標識処理データを用いて処理することにより、第2交通標識を含む学習用画像データを生成する。従って、学習用画像データ生成装置10のユーザは、学習用画像データを容易に準備することができる。特に、学習用画像データ生成装置10を用いると、実際に設置されている場所が少ない交通標識についても、多くの学習用画像データを容易に準備することができる。
[第2実施形態]
図15は、第2実施形態に係る学習用画像データ生成装置10の機能構成を示す図である。本実施形態に係る学習用画像データ生成装置10は、以下の点を除いて第1実施形態に係る学習用画像データ生成装置10と同様の構成である。
まず、学習用画像データ生成装置10は風景画像憶部170を有している。風景画像憶部170は、風景画像すなわち標識の背景となるべき画像を記憶している。風景画像は風景を撮影した画像である。例えば風景画像憶部170は、風景の属性毎に、複数の標準画像を記憶している。ここで用いられる風景の属性は、図6で説明した属性と同様であり、例えば、都市部、郊外部、トンネル、及び山岳部などの地域特性や、一般道、高速道路、及び有料道路などの道路の種別である。
そして生成部120は、標識処理データを用いて処理した後の第2標識画像と、風景画像憶部170が記憶している風景画像とを合成することにより、学習用画像データを生成する。この学習用画像データは、例えば風景画像の中に第2標識画像が嵌めこまれた状態を示している。
生成部120は、標識処理データの属性及び第2標識画像の属性の少なくとも一方が指定されている場合(例えば第1実施形態の図12~図14を用いて説明した例)、同一の属性を有する風景画像を風景画像憶部170から読み出し、読み出した風景画像にはめ込むことにより、学習用画像データを生成する。ここで読み出された風景画が複数ある場合、生成部120は、読み出された複数の風景画のそれぞれを用いて、学習用画像データを生成する。この場合、生成部120が用いた標識処理データ、第2標識画像、及び風景画像がそれぞれl個、m個、及びn個ある場合、学習用画像データは、l×m×n個生成される。
なお、ここで用いられる属性は、地域(すなわち撮影場所)、及び撮影時間帯の少なくとも一方が含まれるのが好ましい。
図16は、本実施形態に係る生成部120が行う処理の第1例を示す図である。本図に示す処理は、第1実施形態において図12を用いて説明した処理に近い。
まず生成部120は、第2交通標識の指定を取得するとともに、生成される学習用画像データの属性を取得する(ステップS242)。これらの取得は図12のステップS212で説明した通りである。
すると生成部120は、第2交通標識の標準画像を標識標準画像記憶部140から読み出すとともに、取得した属性に対応する標識処理データを、標識処理データ記憶部150から読み出す(ステップS244)。また生成部120は、取得した属性に対応する背景画像を風景画像憶部170から読み出す(ステップS246)。そして生成部120は、読み出した第2交通標識の標準画像、標識処理データ、及び背景画像を用いて学習用画像データを生成し、生成した学習用画像データを、属性情報に紐づけて学習用データ記憶部160に記憶させる(ステップS248)。例えば生成部120は、図12のステップS216と同様の処理を行うことにより、第2交通標識の標準画像を処理し、処理後の第2交通標識を風景画像にはめ込むことにより、学習用画像データを生成する。
図17は、本実施形態に係る生成部120が行う処理の第2例を示す図である。本図に示す処理は、第1実施形態において図14を用いて説明した処理に近い。まず生成部120は、標識処理データ記憶部150から標識処理データを読み出す。この際、生成部120は、標識処理データ記憶部150から、読み出した標識処理データの属性も取得する(ステップS252)。この属性の一例は、交通標識が存在する地域を示す地域属性、設置される道路の道路種別を示す道路種別属性、または交通標識の形状を示す形状属性の少なくとも一つである。
ここで生成部120は、まず、属性の指定を入力デバイスを介して取得してもよい。この場合、ステップS252において、生成部120は、標識処理データ記憶部150から、指定された属性を有する標識処理データを複数読み出す。
次いで生成部120は、ステップS252で取得した属性と同一の属性を有する第2交通標識の標準画像を、標識標準画像記憶部140から読み出す(ステップS254)。また生成部120は、この属性と同一の属性を有する背景画像を風景画像憶部170から読み出す(ステップS256)。次いで生成部120は、読み出した第2交通標識の標準画像、標識処理データ、及び背景画像を用いて学習用画像データを生成し、生成した学習用画像データを、属性情報に紐づけて学習用データ記憶部160に記憶させる(ステップS258)。ここで行われる学習用データの生成処理は、図17のステップS248で説明した処理と同様である。また、ステップS254において複数の第2交通標識が読み出されていた場合、生成部120は、これら複数の第2交通標識のそれぞれに対してステップS258に示した処理を行う。
本実施形態によっても、第1実施形態と同様に、学習用画像データ生成装置10のユーザは、学習用画像データを容易に準備することができる。また、学習用画像データ生成装置10のユーザは、所望の背景を有する学習用画像データを容易に準備することができる。
[第3実施形態]
図18は、第3実施形態に係る学習用画像データ生成装置10の機能構成を示す図である。本実施形態に係る学習用画像データ生成装置10は、更新部132を有している点を除いて、第2実施形態に係る学習用画像データ生成装置10と同様の構成である。
更新部132は、車載カメラに接続している車載装置又は車載カメラと通信を行い、車載カメラが撮影した画像(例えば動画を構成するフレーム画像)であって交通標識を含む画像を取得する。そして更新部132は、この画像、又はこの画像から交通標識をトリミングした画像を、撮影画像として撮影画像記憶部130に記憶させる。この際、更新部132は、撮影画像の属性情報も取得し、撮影画像記憶部130に記憶させる。
また更新部132は、交通標識を含む画像から交通標識をトリミングした画像を標準画像として標識標準画像記憶部140に記憶させてもよいし、交通標識を含まない画像を風景画像として風景画像憶部170に記憶させてもよい。いずれの場合においても、更新部132は、必要な属性情報を画像とともに取得し、標識標準画像記憶部140や風景画像憶部170に記憶させる。
なお、第1実施形態に係る学習用画像データ生成装置10に、本実施形態で示した更新部132を設けてもよい。
本実施形態によっても、第2実施形態と同様に、所望の背景を有する学習用画像データを容易に準備することができる。また、学習用画像データは標識処理データを用いて生成されるが、本実施形態では、この標識処理データの基となる撮影画像を容易に増やすことができる。このため、容易に学習用画像データの数を増やすことができる。
以上、図面を参照して実施形態及び実施例について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
10 学習用画像データ生成装置
110 取得部
120 生成部
130 撮影画像記憶部
132 更新部
140 標識標準画像記憶部
150 標識処理データ記憶部
160 学習用データ記憶部
170 風景画像憶部

Claims (9)

  1. 第1交通標識を含む撮影画像から、前記第1交通標識の外観に影響を与える標識処理データを取得する取得手段と、
    前記第1交通標識とは異なる第2交通標識の画像と、前記標識処理データとを用いて前記第2交通標識を学習するための学習用画像データを生成する生成手段と、を有し、
    前記生成手段は、標識が存在する地域を示す地域属性、設置される道路の道路種別を示す道路種別属性、または交通標識の形状を示す形状属性のうち、少なくともいずれかの属性が前記第2交通標識の画像の属性と同一である第1交通標識を含む撮影画像から取得した標識処理データを選択する、学習用画像データ生成装置。
  2. 請求項に記載の学習用画像データ生成装置において、
    前記取得手段は、前記第1交通標識を示す所定の標準画像と、前記撮影画像中の第1交通標識との差分により前記標識処理データを取得する学習用画像データ生成装置。
  3. 請求項または請求項2に記載の学習用画像データ生成装置において、
    前記生成手段は、前記第2交通標識の画像として、第2交通標識を示す所定の標準画像を用いる学習用画像データ生成装置。
  4. 請求項1から請求項3のいずれか一項に記載の学習用画像データ生成装置において、
    前記生成手段は、さらに風景を撮影した風景画像を用いて前記学習用画像データを生成する学習用画像データ生成装置。
  5. 請求項に記載の学習用画像データ生成装置において、
    前記生成手段は、画像の撮影時間帯または撮影場所の特徴が同一である前記風景画像と前記撮影画像を用いて生成する学習用画像データ生成装置。
  6. 第1交通標識を含む複数の撮影画像から、GAN(Generative Adversarial Networks)を用いて生成される第1の特徴量空間を用いて、前記第1の特徴量空間において指定された点に対応する画像の特徴量である指定点特徴量と前記第1の特徴量空間における前記第1交通標識を示す所定の標準画像の特徴量である標準特徴量との差分により標識処理データを取得する取得手段と、
    前記第1交通標識とは異なる第2交通標識の画像の標識特徴量と、前記標識処理データとを用いて前記第2交通標識の学習用画像データを生成する生成手段と、
    を有する学習用画像データ生成装置。
  7. 請求項に記載の学習用画像データ生成装置において、
    前記生成手段は、標識が存在する地域を示す地域属性、設置される道路の道路種別を示す道路種別属性、または交通標識の形状を示す形状属性のうち、少なくともいずれかの属性が第1交通標識と同一である第2交通標識の画像を選択する学習用画像データ生成装置。
  8. 請求項に記載の学習用画像データ生成装置において、
    前記生成手段は、標識が存在する地域を示す地域属性、設置される道路の道路種別を示す道路種別属性、または交通標識の形状を示す形状属性のうち、少なくともいずれかの属性が前記第2交通標識の画像の属性と同一である第1交通標識を含む撮影画像から取得した標識処理データを選択する学習用画像データ生成装置。
  9. 標識が設置される道路の道路種別が高速道路である第1交通標識を含む撮影画像から、前記第1交通標識の外観に影響を与える標識処理データを取得する取得手段と、
    前記第1交通標識とは異なり標識が設置される道路の道路種別が高速道路である第2交通標識の画像と、前記標識処理データと、高速道路の風景画像とを用いて前記第2交通標識を学習するための学習用画像データを生成する生成手段と、を有し、
    前記生成手段は、標識が存在する地域を示す地域属性、設置される道路の道路種別を示す道路種別属性、または交通標識の形状を示す形状属性のうち、少なくともいずれかの属性が前記第2交通標識の画像の属性と同一である第1交通標識を含む撮影画像から取得した標識処理データを選択する、学習用画像データ生成装置。
JP2019107298A 2019-06-07 2019-06-07 学習用画像データ生成装置 Active JP7295710B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019107298A JP7295710B2 (ja) 2019-06-07 2019-06-07 学習用画像データ生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019107298A JP7295710B2 (ja) 2019-06-07 2019-06-07 学習用画像データ生成装置

Publications (2)

Publication Number Publication Date
JP2020201661A JP2020201661A (ja) 2020-12-17
JP7295710B2 true JP7295710B2 (ja) 2023-06-21

Family

ID=73744210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019107298A Active JP7295710B2 (ja) 2019-06-07 2019-06-07 学習用画像データ生成装置

Country Status (1)

Country Link
JP (1) JP7295710B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018533138A (ja) 2015-09-29 2018-11-08 クゥアルコム・インコーポレイテッドQualcomm Incorporated 選択的バックプロパゲーション

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018533138A (ja) 2015-09-29 2018-11-08 クゥアルコム・インコーポレイテッドQualcomm Incorporated 選択的バックプロパゲーション

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Ries Uittenbogaard et al.,Conditional Transfer with Dense Residual Attention: Synthesizing traffic signs from street-view imagery,[online],2018年08月20日,pp.553-559,https://ieeexplore.ieee.org/document/8545149
堰澤映,外1名,人工的に生成した道路シーンを用いた道路標識認識器の学習,信学技報PRMU2018-89,2018年12月,pp.73-78

Also Published As

Publication number Publication date
JP2020201661A (ja) 2020-12-17

Similar Documents

Publication Publication Date Title
CN109117718B (zh) 一种面向道路场景的三维语义地图构建和存储方法
CN110758243B (zh) 一种车辆行驶过程中的周围环境显示方法和系统
JP6299427B2 (ja) シーン推定方法およびシーン推定装置
EP2491530B1 (de) Bestimmung der pose einer kamera
US9129163B2 (en) Detecting common geographic features in images based on invariant components
KR100801827B1 (ko) 영상 종류 판정 시스템, 영상 가공 시스템과 그 서버 및 단말기, 영상 가공 방법 및 영상 가공 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체
CN113255589B (zh) 一种基于多卷积融合网络的目标检测方法及系统
CN108304593B (zh) 纸质地图与电子地图互动显示的方法
CN109598794A (zh) 三维gis动态模型的构建方法
JPWO2019082797A1 (ja) 再構成方法および再構成装置
CN111209825A (zh) 一种用于动态目标3d检测的方法和装置
US20240077331A1 (en) Method of predicting road attributers, data processing system and computer executable code
CN112037543A (zh) 基于三维建模的城市交通灯控制方法、装置、设备和介质
CN104700384B (zh) 基于增强现实技术的展示系统及展示方法
JP6976731B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP7295710B2 (ja) 学習用画像データ生成装置
EP4293622A1 (en) Method for training neural network model and method for generating image
CN112507891A (zh) 自动化识别高速路口并构建路口向量的方法及装置
CN111726535A (zh) 基于车辆感知的智慧城市cim视频大数据画质控制方法
CN113436279B (zh) 一种图像处理方法、装置及设备
KR102195535B1 (ko) 모바일 매핑 시스템을 통해 획득한 차선 정보를 이용하여 자동으로 생성하는 수치지도제작시스템
CN114238541A (zh) 敏感目标信息获取方法、装置和计算机设备
CN110969875B (zh) 一种用于道路交叉口交通管理的方法及系统
JP5070421B2 (ja) 地図表示装置
JP2023540519A (ja) パノラマ像の状態認識生成

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20210827

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20210916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220316

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230609

R150 Certificate of patent or registration of utility model

Ref document number: 7295710

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150