JPWO2020049634A1 - 教師データ生成装置、教師データ生成方法、および、教師データ生成システム - Google Patents
教師データ生成装置、教師データ生成方法、および、教師データ生成システム Download PDFInfo
- Publication number
- JPWO2020049634A1 JPWO2020049634A1 JP2020540899A JP2020540899A JPWO2020049634A1 JP WO2020049634 A1 JPWO2020049634 A1 JP WO2020049634A1 JP 2020540899 A JP2020540899 A JP 2020540899A JP 2020540899 A JP2020540899 A JP 2020540899A JP WO2020049634 A1 JPWO2020049634 A1 JP WO2020049634A1
- Authority
- JP
- Japan
- Prior art keywords
- teacher data
- image
- moving body
- data generation
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 22
- 238000004364 calculation method Methods 0.000 claims description 84
- 239000002131 composite material Substances 0.000 claims description 36
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 238000010801 machine learning Methods 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 238000012545 processing Methods 0.000 description 51
- 238000013480 data collection Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000015654 memory Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
Description
従来知られているような画像の活用方法では、例えば、画像に写っている特定の物体の画像中での位置を出力するアプリケーションが使用され、当該アプリケーションを構築する際に、機械学習が用いられる。
一般に、人手によって、1枚または複数枚の画像から、当該画像中の物体の位置または大きさに関する、機械学習のための教師データを生成するためには、多大な労力を必要とする。
そこで、教師データを容易に生成する技術として、例えば、特許文献1には、予め用意された背景画像から抽出した領域に該当する画像に、複数の人物に関係する、人物の状態の指示情報に従って決定された、群集の人物状態に該当する人物の画像を合成して、群集状態画像を生成し、当該群集状態画像に対する教師ラベルを特定することで、群集画像の教師データを生成する教師データ生成装置に関する技術が開示されている。
その結果、特許文献1に開示されている技術に代表される従来技術では、教師データとしての信頼性に疑問があるという課題があった。
実施の形態1.
実施の形態1に係る教師データ生成装置は、移動体が撮影された判定対象画像における当該移動体の位置を検出するための機械学習モデルを構築する際に使用される教師データを生成する。実施の形態1において、機械学習モデルとは、複数の画像を学習し予測した結果得られた、当該複数の画像の特徴量のパターンである。判定対象画像とは、機械学習モデルを用いて、その画像上に映っている移動体を検出する対象となる、未知の画像である。
以下の説明においては、一例として、移動体は海上の船舶とし、教師データ生成装置は、海上の船舶が撮影された教師データ生成用画像を取得し、取得した教師データ生成用画像に基づき、教師データを生成するものとする。
また、実施の形態1に係る教師データ生成装置は、後述するデータ収集装置に備えられているものとする。
図1は、実施の形態1に係る教師データ生成装置100を備えたデータ収集装置1の構成例を示す図である。
データ収集装置1は、教師データ生成装置100の他、カメラ200と、記憶装置300と、カメラ較正装置400と、移動体情報受信アンテナ500と、移動体情報受信機600を備える。
カメラ200は、撮影した画像を記憶装置300に記憶させる。実施の形態1において、カメラ200は、予め決められたフレーム数分の画像を、記憶装置300に記憶させるものとする。何フレーム分の画像を記憶させるようにするかは、ユーザが適宜決定することができるものとするが、ユーザは、少なくとも1フレームの画像が記憶されるようにする。カメラ200が撮影し、記憶装置300に記憶させる画像が、教師データ生成用画像である。以下、画像の数について言及する場合、フレーム単位の数を意味するものとする。
なお、データ収集装置1は、カメラ200によって海上を撮影可能な場所に設置されている。また、ここでは、データ収集装置1は、カメラ200を備えるものとするが、データ収集装置1は、カメラ200に代えて、2次元画像を取得可能なセンサ等を備えるようにしてもよい。データ収集装置1は、海上の画像を取得することができるようになっていればよい。
記憶装置300は、カメラ200が備えるものとしてもよい。
カメラ較正装置400は、カメラ200の内部パラメータおよび外部パラメータを、教師データ生成装置100に出力する。
なお、カメラ較正装置400は、カメラ200が備えるものとしてもよい。
実施の形態1では、一例として、移動体情報発信装置は、AIS(Automatic Identification System:船舶自動識別装置)とする。AISは、船舶に搭載されており、当該AISが搭載されている船舶の船名、船舶の大きさ、船舶の現在位置、船舶の速度、船舶の種類、または、針路に関する情報等、船舶に関する様々な情報を発信する。但し、AISが発信する情報には、船舶の高さ情報は含まれていない。
教師データ生成装置100は、移動体情報取得部101と、記憶部102と、データ処理部103と、画像取得部104と、立方体領域設定部105と、座標変換部106と、最小矩形計算部107と、背景画像生成部108と、差分計算部109と、高さ計算部110と、教師データ生成部111と、教師データ出力部112を備える。
データ処理部103は、補間部1031と間引き部1032を備える。
画像取得部104は、撮影時刻取得部1041を備える。
背景画像生成部108は、マスク設定部1081を備える。
なお、移動体情報取得部101が取得する移動体情報がエンコードされている場合は、例えば、移動体情報取得部101がデコード部(図示省略)を備え、デコード部が、取得した移動体情報をデコードする。デコード部は、移動体情報取得部101に備えられるのではなく、例えば、移動体情報取得部101の外部の、移動体情報取得部101が参照可能な場所に備えられ、デコードした移動体情報を記憶するようにし、移動体情報取得部101は、デコード部が記憶した、デコード後の移動体情報を取得するようにしてもよい。移動体情報取得部101が、デコード後の移動体情報を取得できるようになっていればよい。
移動体情報取得部101は、移動体情報受信機600から取得した移動体情報を、記憶部102に記憶させる。デコード部が移動体情報をデコードするようにした場合は、移動体情報取得部101は、デコード部によってデコードされた後の移動体情報を、記憶部102に記憶させる。
なお、移動体情報には、少なくとも、船舶に関する情報と、移動体情報の受信日時の情報が含まれる。
なお、実施の形態1では、記憶部102は、教師データ生成装置100に備えられるものとするが、これは一例に過ぎず、記憶部102は、教師データ生成装置100の外部の、教師データ生成装置100が参照可能な場所に備えられるようにしてもよい。
実施の形態1では、カメラ200で撮影される教師データ生成用画像は1FPSである。一方、実施の形態1では、移動体情報発信装置はAISである。AISは、一定時間おきに移動体情報を発信するが、必ずしも毎秒、当該移動体情報を発信するわけではない。そのため、実施の形態1では、補間部1031が、1秒毎に撮影される教師データ生成用画像にそれぞれ対応する1秒毎の移動体情報が存在するよう、移動体情報の時間補間を行う。
補間部1031は、移動体情報取得部101が取得した移動体情報が示す船舶の速度情報を補間した上で、当該船舶の位置情報の補間を行うことによって、当該移動体情報の時間補間を行う。
例えば、ある時刻T=0(秒)およびT=3(秒)の、船舶Xに関する移動体情報が記憶部102に記憶されており、T=0(秒)およびT=3(秒)における船舶Xの位置および速度がわかっているものとする。
補間部1031は、まず、T=1(秒)およびT=2(秒)における船舶Xの速度Vを線形補間で計算する。次に、補間部1031は、T=1(秒)およびT=2(秒)における船舶Xの位置を、速度Vの積分で計算する。
そして、補間部1031は、T=1(秒)およびT=2(秒)における船舶Xの位置情報および速度情報を含む移動体情報を生成する。
このように、補間部1031は、時間補間処理において、船舶の速度情報を補間した上で船舶の位置情報を補間することで移動体情報の補間を行うため、図2に示すように、秒毎の船舶の位置は必ずしも等間隔にはならない。
補間部1031は、時間補間処理により新たに生成した移動体情報を、記憶部102に記憶させる。
移動体情報は、カメラ200による撮影範囲よりも広い範囲に位置する移動体について取得され得る情報であるため、間引き部1032が不要な移動体情報を間引いておくことで、後段の処理が軽くなる。
図3において、301で示す範囲が、カメラ200の撮影範囲である。間引き部1032は、カメラ較正装置400から出力された、カメラ200の内部パラメータおよび外部パラメータに基づき、当該撮影範囲を計算する。
また、図3において、302で示す丸印が、移動体情報に基づく各船舶の存在位置を示す。
間引き部1032は、船舶の存在位置が撮影範囲301の外であることを示す移動体情報を間引く。具体的には、間引き部1032は、船舶の存在位置が撮影範囲301の外であることを示す移動体情報に、対象外フラグを付与し、後段の処理で当該移動体情報を使用しないようにする。
画像取得部104の撮影時刻取得部1041は、記憶装置300から取得した特定教師データ生成用画像について、撮影時刻を取得する。
撮影時刻取得部1041は、特定教師データ生成用画像の撮影時刻を、例えば、撮影開始時刻からのフレーム数で判断すればよい。撮影開始時刻は、例えば、記憶装置300に記憶されているものとする。また、例えば、カメラ200が監視カメラである場合等、カメラ200が撮影する画像に撮影時刻が文字で重畳表示されている場合、撮影時刻取得部1041は、重畳表示されている文字から、撮影時刻を取得するようにしてもよい。
そして、画像取得部104は、記憶部102を参照し、記憶部102から、特定教師データ生成用画像と対応する移動体情報を抽出する。特定教師データ生成用画像と対応する移動体情報とは、特定教師データ生成用画像の撮影時刻と、移動体情報に含まれる、当該移動体情報の受信時刻とが一致する移動体情報をいう。なお、画像取得部104が抽出する移動体情報は、データ処理部103によって、補間および間引きが行われた後の移動体情報である。また、実施の形態1において、特定教師データ生成用画像の撮像時刻と、移動体情報の受信時刻とが一致するとは、厳密に一致していることを必須としない。画像取得部104は、特定教師データ生成用画像の撮像時刻と移動体情報の受信時刻との差が予め許容範囲として設定された範囲内である等、特定教師データ生成用画像が撮影された際の移動体の位置がある程度わかる移動体情報であれば、当該移動体情報の受信時刻は特定教師データ生成用画像の撮像時刻と一致しているとみなす。
画像取得部104は、抽出した移動体情報を、特定教師データ生成用画像と対応付けて、立方体領域設定部105に出力する。
また、画像取得部104は、特定教師データ生成用画像の撮像時刻と一致する受信時刻の複数の移動体情報が存在する場合、全ての移動体情報を抽出する。例えば、同一時刻に複数の船舶が特定教師データ生成用画像の撮影範囲に存在する場合、当該特定教師データ生成用画像と対応付けられる移動体情報は複数存在することになる。
実施の形態1では、立方体領域設定部105は、移動体情報に基づき、船舶の幅、長さ、および、角度を特定し、当該船舶を囲む立方体(以下「移動体包囲立方体」という。)の座標を設定する。なお、立方体領域設定部105が設定する移動体包囲立方体の座標は、移動体包囲立方体の8つの頂点の座標である。以下、立方体領域設定部105が設定する、移動体包囲立方体の各頂点の座標を、立方体座標という。
このとき、立方体領域設定部105は、立方体座標を、地球中心座標系で設定する。
ここで、図4は、実施の形態1で用いる座標系の定義について説明するための図である。図4Aは、地球中心座標系の定義を説明するための図(富山高等専門学校 航海科学研究室ホームページより引用)であり、図4Bは、カメラ座標系の定義を説明するための図である。
カメラ200の内部パラメータによって設定可能な3×3の内部行列と、カメラ200の回転角およびカメラ200の位置の情報から計算可能な4×3の外部行列により、地球中心座標系とカメラ座標系の間の座標の変換が可能である。
画像取得部104から出力された特定教師データ生成用画像に対応付けられている移動体情報が複数ある場合、立方体領域設定部105は、特定教師データ生成用画像に対応付けられた全ての移動体情報で示される全ての船舶に対して、当該船舶を囲む移動体包囲立方体を設定する。
立方体領域設定部105は、設定した各立方体座標を、特定教師データ生成用画像の、対応する移動体情報に付与して、座標変換部106に出力する。
なお、画像取得部104から特定教師データ生成用画像が複数出力される場合、立方体領域設定部105は、特定教師データ生成用画像毎に、当該特定教師データ生成用画像に対応付けられている移動体情報で示される船舶を囲む移動体方位立方体を設定する。
上述のとおり、カメラ200の内部パラメータによって設定可能な3×3の内部行列と、カメラ200の回転角およびカメラ200の位置の情報から計算可能な4×3の外部行列により、地球中心座標系とカメラ座標系の間の座標の変換が可能である。
座標変換部106は、以下の式(1)によって、立方体座標を、カメラ座標系に変換する。
式(1)に示すuが、カメラ座標系におけるx座標に該当し、式(1)に示すvが、カメラ座標系におけるy座標に該当する。
式(1)において、fxおよびfyは焦点距離(単位:ピクセル)である。
立方体領域設定部105が立方体座標(X,Y,Z)を設定し、座標変換部106は、立方体領域設定部105が設定した立方体座標(X,Y,Z)を、式(1)を用いてカメラ座標系の座標(u,v)に変換する。なお、地球中心座標系とカメラ座標系の間の座標の変換の技術は、既知の技術である。
立方体領域設定部105から出力された特定教師データ生成用画像に対応付けられている移動体情報が複数ある場合、座標変換部106は、特定教師データ生成用画像に対応付けられた全ての移動体情報に付与された立方体座標を、それぞれ、カメラ座標系に変換する。
座標変換部106は、カメラ座標系に変換した、変換後の各立方体座標(以下「変換後座標」という。)を、特定教師データ生成用画像の、対応する移動体情報に付与して、最小矩形計算部107に出力する。
なお、立方体領域設定部105から特定教師データ生成用画像が複数出力される場合、座標変換部106は、特定教師データ生成用画像毎に、当該特定教師データ生成用画像に対応付けられている各移動体情報に付与された各立方体座標を、カメラ座標系に変換する。
具体的には、最小矩形計算部107は、移動体情報に対応付けられている全て(8つ)の変換後座標のx座標のうちの最小値と、全てのカメラ座標のy座標のうちの最小値を、当該移動体情報で示される船舶に対応する最小矩形の枠の左上の座標として定義する。また、最小矩形計算部107は、全てのカメラ座標のx座標のうちの最大値と、全てのカメラ座標のy座標のうちの最大値を、当該移動体情報を示される船舶に対応する最小矩形の枠の右下の座標として定義する。
最小矩形計算部107は、計算した最小矩形の座標を、特定教師データ生成用画像の、対応する移動体情報に付与する。
座標変換部106から出力された特定教師データ生成用画像に対応付けられている移動体情報が複数ある場合、最小矩形計算部107は、特定教師データ生成用画像に対応付けられた全ての移動体情報について、最小矩形を計算する。
なお、座標変換部106から特定教師データ生成用画像が複数出力される場合、最小矩形計算部107は、特定教師データ生成用画像毎に、当該特定教師データ生成用画像に対応付けられている各移動体情報について、最小矩形を計算する。
最小矩形計算部107は、移動体情報に最小矩形の座標を付与した特定教師データ生成用画像を、時系列で、例えば、記憶部102、または、教師データ生成装置100が内部に備える記憶領域に一時記憶させる。
背景画像生成部108が合成背景画像を生成する手順について説明する。
まず、背景画像生成部108のマスク設定部1081は、最小矩形計算部107によって一時記憶されている特定教師データ生成用画像について、それぞれ、当該特定教師データ生成用画像に対応付けられている移動体情報に基づき、特定教師データ生成用画像上にマスクを設定した画像を生成する。実施の形態1において、マスク設定部1081が生成した、特定教師データ生成用画像にマスクを設定した画像を、「マスク設定画像」というものとする。具体的には、マスク設定部1081は、移動体情報で示される、船舶の長さ、および、船舶の回転角の情報に基づき、マスクの横幅を計算する。そして、マスク設定部1081は、特定教師データ生成用画像の縦幅をマスクの縦幅とし、当該縦幅と計算した横幅とからなる領域を、マスクに決定する。マスク設定部1081は、特定教師データ生成用画像上に決定したマスクが設定されたマスク設定画像を生成する。
マスク設定部1081は、生成したマスク設定画像を、一時記憶されている特定教師データ生成用画像の、対応する移動体情報に付与する。
一時記憶されている特定教師データ生成用画像に対応付けられている移動体情報が複数ある場合、マスク設定部1081は、特定教師データ生成用画像に対応付けられた全ての移動体情報について、当該移動体情報に基づいてマスクを設定したマスク設定画像を生成する。例えば、ある特定教師データ生成用画像に対応付けられている移動体情報が3つあるとすると、当該3つそれぞれに対して、マスク設定部1081によってマスク設定画像が生成され、移動体情報に付与される。
具体的には、まず、背景画像生成部108は、決定後教師データ生成用画像について、移動体情報に付与されたマスク設定画像に設定されているマスクの領域(以下「注目マスク領域」という。)を切り出し、一時記憶されている、当該決定後教師データ生成用画像の前後の特定教師データ生成用画像(以下「比較対象教師データ生成用画像」という。)を確認して、マスクの領域内に船舶が入っていない特定教師データ生成用画像(以下「合成用画像」という。)を検索する。マスクの領域内に船舶が入っていないとは、比較対象教師データ生成用画像の、注目マスク領域に対応する領域に、マスクが設定されていないことをいう。背景画像生成部108は、比較対象教師データ生成用画像の移動体情報に付与されているマスク設定画像から、注目マスク領域に対応する領域に、マスクが設定されているか否かを判断すればよい。つまり、背景画像生成部108は、比較対象教師データ生成用画像の移動体情報に、注目マスク領域と同じ領域にマスクが設定されたマスク設定画像が付与されていなければ、当該比較対象教師データ生成用画像は、マスクの領域内に船舶が入っていない合成用画像と判断する。
なお、ここでは、背景画像生成部108は、マスクの領域内に船舶が入っていない特定教師データ生成用画像を合成用画像とするものとするが、これは一例に過ぎず、合成用画像は、必ずしもマスクの領域に対応する領域内に船舶が入っていない特定教師データ生成用画像であることを必須としない。例えば、背景画像生成部108は、マスクの領域内に多少船舶が入っている特定教師データ生成用画像であっても、合成用画像とするようにしてもよい。
背景画像生成部108は、当該検索を、合成用画像を予め設定されたフレーム数見つけるまで反復する。実施の形態1では、一例として、予め設定されたフレーム数は5フレームとする。
背景画像生成部108は、合成背景画像を生成する際には、決定後教師データ生成用画像と合成用画像とを、単純に平均することで合成背景画像を生成してもよいし、当該決定後教師データ生成用画像からみた時差を考慮して、足し合わせる合成用画像に重み付けを行った加重平均によって、合成背景画像を生成するようにしてもよい。
なお、複数の特定教師データ生成用画像をそれぞれ決定後教師データ生成用画像とする場合、背景画像生成部108は、順次決定した決定後教師データ生成用画像毎に、合成背景画像を生成する。このように、背景画像生成部108が、順次、決定後教師データ生成用画像を決定して、決定後教師データ生成用画像毎に合成背景画像を生成するのは、できるだけ各決定後教師データ生成用画像に近い時間帯の合成背景画像を取得するためである。
ある決定後教師データ生成用画像において、対応付けられている移動体情報が複数ある場合、背景画像生成部108は、決定後教師データ生成用画像に対応付けられた全ての移動体情報について、当該移動体情報に付与されているマスク設定画像に基づき、合成用画像を検索して合成背景画像を生成する。
二値の差分画像を生成するためには、閾値を適切に設定する必要がある。船舶のない領域については、事前にAISで取得した情報があるため、ユーザ等は、予め、船舶のない領域が確実に差分なしに分類されるような閾値を設定する。また、差分計算部109は、二値化後にラベリング処理を行い、対象となる領域以外に発生している、面積の小さいノイズを除去する。対象となる領域とは、閾値以上の変化がある領域のことであり、当該領域は、船舶が存在する領域である。例えば、波面のきらめき等によって、差分計算部109は、当該波面のきらめき等の領域を閾値以上の変化がある領域と判断して差分画像を生成する場合がある。しかし、波面のきらめき等は船舶が存在する領域ではない。そこで、差分計算部109は、船舶が存在する領域と判断できる最大領域以外の、面積の小さいノイズを除去する。なお、これは一例に過ぎず、差分計算部109は、当該面積の小さいノイズの除去を行うことを必須とはしない。例えば、差分計算部109は、明らかに船舶が存在する領域ではないと判断できる程度に面積の小さい領域については、ノイズの除去を行わないようにしてもよい。
差分計算部109は、生成した差分画像を、決定後教師データ生成用画像の、対応する移動体情報に付与して、高さ計算部110に出力する。
背景画像生成部108から決定後教師データ生成用画像が複数出力される場合、差分計算部109は、決定後教師データ生成用画像毎に、差分画像を生成する。
ある決定後教師データ生成用画像に対応付けられている移動体情報が複数ある場合、差分計算部109は、決定後教師データ生成用画像に対応付けられた全ての移動体情報に付与されている合成背景画像について、それぞれ、決定後教師データ生成用画像との差分画像を生成し、移動体情報に付与する。
高さ計算部110は、更新後の最小矩形の情報が反映された決定後教師用データ生成用画像を、教師データ生成部111に出力する。
なお、差分計算部109から決定後教師データ生成用画像が複数出力される場合、高さ計算部110は、決定後教師データ生成用画像毎に、当該決定後教師データ生成用画像上の各船舶の高さを計算する。
ある決定後教師データ生成用画像に対応付けられている移動体情報が複数ある場合、高さ計算部110は、決定後教師データ生成用画像に対応付けられた全ての移動体情報に付与されている差分画像に基づき、それぞれ、移動体情報に付与されている最小矩形の枠の上端および下端の情報を更新する。
また、教師データ生成部111は、高さ計算部110から出力された、更新後の最小矩形の情報が反映された決定後教師データ生成用画像に基づき、教師データを生成する。
具体的には、教師データ生成部111は、決定後教師データ生成用画像と、高さ計算部110が更新した最小矩形の情報とを対応付けて教師データとする。このとき、教師データ生成部111は、最小矩形の情報に加えて、船舶の種別等、移動体情報に含まれる情報も、教師データに含めるようにする。教師データ生成部111が生成する教師データのフォーマットは、例えば、Pascal VOC(Visual Object Classes)のようなjson(JavaScript Object Notation)(JavaScriptは登録商標)形式等が想定される。なお、最小矩形の情報は、例えば、最小矩形の左上と右下の座標の情報を複数まとめた情報である。
また、教師データ生成部111は、決定後教師データ生成用画像上に最小矩形を重畳させるのではなく、例えば、差分画像の周囲のパスをベクトル情報として決定後教師データ生成用画像と対応付けた教師データを生成するようにしてもよい。
なお、高さ計算部110から決定後教師データ生成用画像が複数出力される場合、教師データ生成部111は、決定後教師データ生成用画像毎に、一時記憶されている特定教師データ生成用画像との置換えを行い、決定後教師データ生成用画像毎に、教師データを生成する。
ある決定後教師データ生成用画像に対応付けられている移動体情報が複数ある場合、教師データ生成部111は、決定後教師データ生成用画像に対応付けられた全ての移動体情報に付与されている最小矩形の情報を、一時記憶されている特定教師データ生成用画像の移動体情報に付与された最小矩形の情報と置き換える。また、ある決定後教師データ生成用画像に対応付けられている移動体情報が複数ある場合、教師データ生成部111は、決定後教師データ生成用画像に対応付けられた各移動体情報の分だけ、移動情報に付与された更新後の最小矩形の情報が反映された決定後教師データ生成用画像に基づき、教師データを生成する。
教師データ出力部112は、教師データ生成部111が生成した教師データを出力する。
図5Aに示すように、カメラ200が撮影した画像中の船舶について、AISから得られる移動体情報によれば、当該船舶の船体の長さの情報は得られるが、船舶の高さの情報は得られない。
そこで、教師データ生成装置100において、背景画像生成部108が、マスクを設定したマスク設定画像を生成した上で決定後教師データ生成用画像および合成対象画像を複数枚足し合わせて平均することで、背景画像を生成する(図5B)。なお、図5Bでは、説明の簡単のため、背景画像を生成するもととなる画像を3フレームのみ図示しているが、実施の形態1では、背景画像生成部108は、背景が写っている合成対象画像が最低限5フレーム含まれるように、前後の特定教師データ生成用画像を順に検索する。
そして、差分計算部109が、決定後教師データ生成用画像と背景画像との差分を計算し、高さ計算部110が決定後教師データ生成用画像中の各船舶の高さを更新する(図5C)。
図6A,図6Bは、実施の形態1に係る教師データ生成装置100を備えるデータ収集装置1の動作を説明するためのフローチャートである。
カメラ200は、船舶が存在し得る海上を撮影し、撮影した教師データ生成用画像を記憶装置300に記憶させる(ステップST601)。
なお、データ収集装置1において、カメラ200は、所定のフレーム数の画像を撮影するまで、ステップST601の動作を行う。
移動体情報取得部101は、ステップST602にて移動体情報受信機600から出力された移動体情報を取得する。そして、移動体情報取得部101は、移動体情報受信機600から取得した移動体情報を、記憶部102に記憶させる(ステップST603)。
データ処理部103の補間部1031は、画像取得部104によって取得された、互いに異なる時刻で撮影された複数の教師データ生成用画像にそれぞれ対応する移動体情報が存在するよう、移動体情報取得部101が取得した移動体情報に対して時間補間を行い、新たに生成した移動体情報を、記憶部102に記憶させる(ステップST604)。
データ処理部103の間引き部1032は、カメラ較正装置400から出力された、カメラ200の内部パラメータおよび外部パラメータに基づき、地図上における、カメラ200の撮影範囲を地図上で計算する。そして、間引き部1032は、移動体情報で示される船舶の存在位置が、計算した撮影範囲の外となる移動体情報を、後段の、教師データを生成するための処理の対象外とする間引きを行う(ステップST605)。
画像取得部104は、抽出した移動体情報を、特定教師データ生成用画像と対応付けて、立方体領域設定部105に出力する。
立方体領域設定部105は、設定した立方体座標を、特定教師データ生成用画像の、対応する移動体情報に付与して、座標変換部106に出力する。
座標変換部106は、変換後座標を、特定教師データ生成用画像の、対応する移動体情報に付与して、最小矩形計算部107に出力する。
最小矩形計算部107は、計算した最小矩形の座標を、特定教師データ生成用画像の、対応する移動体情報に付与する。
最小矩形計算部107は、移動体情報に最小矩形の座標を付与した特定教師データ生成用画像を、時系列で、例えば、記憶部102、または、教師データ生成装置100が内部に備える記憶領域に一時記憶させる。
背景画像生成部108は、生成した合成背景画像を、決定後教師データ生成用画像と対応付けて、差分計算部109に出力する。
差分計算部109は、生成した差分画像を、決定後教師データ生成用画像と対応付けて、高さ計算部110に出力する。
高さ計算部110は、更新後の最小矩形の情報が反映された決定後教師用データ生成用画像を、教師データ生成部111に出力する。
なお、このとき、教師データ生成部111は、ステップST614にて高さ計算部110から出力された、更新後の最小矩形の情報が反映された決定後教師データ生成用画像に基づき、当該決定後教師データの移動体情報に付与された最小矩形の情報を、一時記憶されている特定教師データ生成用画像の移動体情報に付与された最小矩形の情報と置き換える。
教師データ出力部112が教師データを出力すると、制御部(図示省略)が、記憶装置300に記憶されている画像、および、一時記憶させている教師データ生成用画像等を削除する。制御部は、画像および教師データ生成用画像等に、処理済フラグを付与する等してもよい。
例えば、教師データ生成装置100は、全ての教師データ生成用画像について、当該全ての教師データ生成用画像上の船舶の高さを計算して教師データを生成し、生成した教師データをまとめて出力するようにしてもよい。
実施の形態1において、移動体情報取得部101と、データ処理部103と、画像取得部104と、立方体領域設定部105と、座標変換部106と、最小矩形計算部107と、背景画像生成部108と、差分計算部109と、高さ計算部110と、教師データ生成部111と、教師データ出力部112の機能は、処理回路701により実現される。すなわち、データ収集装置1は、移動体を検出するための教師データを生成する制御を行うための処理回路701を備える。
処理回路701は、図7Aに示すように専用のハードウェアであっても、図7Bに示すようにメモリ707に格納されるプログラムを実行するCPU(Central Processing Unit)706であってもよい。
また、記憶装置300および記憶部102は、メモリ707を使用する。なお、これは一例であって、記憶装置300および記憶部102は、HDD702、SSD(Solid State Drive)、または、DVD等によって構成されるものであってもよい。
また、データ収集装置1は、移動体情報発信装置等との通信を行う、入力インタフェース装置703、および、出力インタフェース装置704を有する。
また、データ収集装置1は、移動体情報受信アンテナ500、移動体情報受信機600、カメラ較正装置400、および、カメラ200等の撮影装置705を備える。
また、既存の、AIS等の移動体情報発信装置から発信される情報をもとに教師データを生成するため、従来のような重い画像処理を必要とせず、教師データ生成の省力化が可能となる。
また、教師データ生成装置100は、移動体情報取得部101が取得した移動体情報について、当該移動体情報で示される移動体の存在位置が、教師データ生成用画像の撮影範囲外となる場合、当該撮影範囲外となる当該移動体情報を、教師データ生成部111が教師データを生成するための移動体情報から除外する間引き部1032を備えるようにした。そのため、不要なデータを間引き、教師データ生成のための処理を軽くすることができる。
また、移動体が船舶であり、移動体情報発信装置がAISである場合、教師データ生成装置100は、教師データ生成用画像(決定後教師データ生成用画像)毎に、当該教師データ生成用画像上に船舶が存在しない場合の合成背景画像を生成する背景画像生成部108と、教師データ生成用画像と、当該教師データ生成用画像に対応付けられている合成背景画像との差分を計算し、差分画像を生成する差分計算部109と、教師データ生成用画像に対応付けられている差分画像に基づき、教師データ生成用画像上の船舶の高さを計算する高さ計算部110を備え、教師データ生成部111は、高さ計算部110が計算した船舶の高さの情報を含む教師データを生成するようにした。そのため、AISから船舶の高さの情報が得られなくても、当該船舶の高さの情報を設定できる。
例えば、カメラ200が教師データ生成用画像を撮影する時間幅と、移動体情報発信装置が移動体情報を発信する時間幅が同じ場合等、移動体情報を補間する必要がなければ、教師データ生成装置100は、補間部1031を備えない構成としてもよい。
また、例えば、移動体情報発信装置が移動体情報を発信する範囲と、カメラ200が教師データ生成用画像を撮影する撮影範囲とが同じ場合等、移動体情報を間引く必要がなければ、教師データ生成装置100は、間引き部1032を備えない構成としてもよい。
例えば、教師データ生成部111が、生成した教師データを、教師データ生成装置100に記憶させておくようにする場合、教師データ生成装置100は、教師データ出力部112を備えない構成としてもよい。
カメラ200がデータ収集装置1の外部に備えられる場合、カメラ200が移動体を撮影可能な場所に設置されるようになっていればよく、データ収集装置1が、移動体を撮影可能な場所に設置される必要はない。
例えば、図8に示すように、データ収集装置1と、カメラ200と、記憶装置300と、カメラ較正装置400とがネットワークで接続されたデータ収集システムを構成するようにしてもよい。なお、図8に示すようなデータ収集システムにおいても、カメラ200と記憶装置300を一体型としてもよいし、当該一体型のカメラ200にカメラ較正装置400がさらに含まれるようにしてもよい。
Claims (7)
- 判定対象画像中の移動体の位置を検出するための機械学習モデルを構築する際に使用される教師データを生成する、教師データ生成装置であって、
前記移動体が撮影された教師データ生成用画像を取得する画像取得部と、
前記移動体の属性情報と当該移動体の位置情報とを含む移動体情報を発信する移動体情報発信装置から発信された、当該移動体に関する前記移動体情報を取得する移動体情報取得部と、
前記画像取得部が取得した前記教師データ生成用画像と、前記移動体情報取得部が取得した前記移動体情報とに基づき、前記教師データを生成する教師データ生成部
とを備えた教師データ生成装置。 - 前記画像取得部によって取得された、互いに異なる時刻で撮影された複数の前記教師データ生成用画像にそれぞれ対応する前記移動体情報が存在するよう、前記移動体情報取得部が取得した前記移動体情報の時間補間を行う補間部を備え、
前記教師データ生成部は、前記補間部が前記時間補間を行った後の前記移動体情報に基づき、前記教師データを生成する
ことを特徴とする請求項1記載の教師データ生成装置。 - 前記移動体情報取得部が取得した前記移動体情報について、当該移動体情報で示される移動体の存在位置が、前記教師データ生成用画像の撮影範囲外となる場合、当該撮影範囲外となる当該移動体情報を、前記教師データ生成部が前記教師データを生成するための前記移動体情報から除外する間引き部を備えた
ことを特徴とする請求項1記載の教師データ生成装置。 - 前記画像取得部が取得した前記教師データ生成用画像毎に、当該教師データ生成用画像に対応する前記移動体情報に基づき、当該移動体情報で示される移動体の位置を表わす立方体の座標を、地球中心座標系にて設定する立方体領域設定部と、
前記立方体領域設定部が設定した地球中心座標系の前記立方体の座標を、前記教師データ生成用画像上の座標系に変換し、変換後座標を生成する座標変換部と、
前記座標変換部が生成した前記変換後座標に基づき、前記教師データ生成用画像上で、前記変換後座標を含む最小矩形を計算する最小矩形計算部を備え、
前記教師データ生成部は、
前記最小矩形計算部が計算した最小矩形の情報を含む前記教師データを生成する
ことを特徴とする請求項1記載の教師データ生成装置。 - 前記移動体は船舶であり、前記移動体情報発信装置は船舶自動識別装置であって、
前記教師データ生成用画像毎に、当該教師データ生成用画像上に前記船舶が存在しない場合の合成背景画像を生成する背景画像生成部と、
前記教師データ生成用画像と、当該教師データ生成用画像に対応付けられている前記合成背景画像との差分を計算し、差分画像を生成する差分計算部と、
前記教師データ生成用画像に対応付けられている前記差分画像に基づき、前記教師データ生成用画像上の前記船舶の高さを計算する高さ計算部を備え、
前記教師データ生成部は、
前記高さ計算部が計算した前記船舶の高さの情報を含む前記教師データを生成する
ことを特徴とする請求項1記載の教師データ生成装置。 - 判定対象画像中の移動体の位置を検出するための機械学習モデルを構築する際に使用される教師データを生成する、教師データ生成方法であって、
画像取得部が、前記移動体が撮影された教師データ生成用画像を取得するステップと、
移動体情報取得部が、前記移動体の属性情報と当該移動体の位置情報とを含む移動体情報を発信する移動体情報発信装置から発信された、当該移動体に関する前記移動体情報を取得するステップと、
教師データ生成部が、前記画像取得部が取得した前記教師データ生成用画像と、前記移動体情報取得部が取得した前記移動体情報とに基づき、前記教師データを生成するステップ
とを備えた教師データ生成方法。 - 判定対象画像中の移動体の位置を検出するための機械学習モデルを構築する際に使用される教師データを生成する、教師データ生成装置であって、
前記移動体が撮影された教師データ生成用画像を取得する画像取得部と、
前記移動体の属性情報と当該移動体の位置情報とを含む移動体情報を発信する移動体情報発信装置から発信された、当該移動体に関する前記移動体情報を取得する移動体情報取得部と、
前記画像取得部が取得した前記教師データ生成用画像と、前記移動体情報取得部が取得した前記移動体情報とに基づき、前記教師データを生成する教師データ生成部とを備えた教師データ生成装置と、
前記移動体を撮影する撮影装置とを有する教師データ生成システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/032756 WO2020049634A1 (ja) | 2018-09-04 | 2018-09-04 | 教師データ生成装置、教師データ生成方法、および、教師データ生成システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020049634A1 true JPWO2020049634A1 (ja) | 2020-12-17 |
JP6869440B2 JP6869440B2 (ja) | 2021-05-12 |
Family
ID=69723034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020540899A Active JP6869440B2 (ja) | 2018-09-04 | 2018-09-04 | 教師データ生成装置、教師データ生成方法、および、教師データ生成システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6869440B2 (ja) |
WO (1) | WO2020049634A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639624B (zh) * | 2020-06-10 | 2023-09-29 | 深圳市时海科技有限公司 | 一种基于人工智能的课堂教学及时强化能力评估方法及系统 |
JPWO2022014220A1 (ja) * | 2020-07-13 | 2022-01-20 | ||
JP2023124260A (ja) * | 2022-02-25 | 2023-09-06 | 古野電気株式会社 | 物標監視システム、物標監視方法、及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650705A (zh) * | 2017-01-17 | 2017-05-10 | 深圳地平线机器人科技有限公司 | 区域标注方法、装置和电子设备 |
WO2018105122A1 (ja) * | 2016-12-09 | 2018-06-14 | 富士通株式会社 | 教師データ候補抽出プログラム、教師データ候補抽出装置、及び教師データ候補抽出方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104660994B (zh) * | 2015-02-09 | 2018-03-16 | 武汉理工大学 | 海事专用摄像机及海事智能监控方法 |
-
2018
- 2018-09-04 JP JP2020540899A patent/JP6869440B2/ja active Active
- 2018-09-04 WO PCT/JP2018/032756 patent/WO2020049634A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018105122A1 (ja) * | 2016-12-09 | 2018-06-14 | 富士通株式会社 | 教師データ候補抽出プログラム、教師データ候補抽出装置、及び教師データ候補抽出方法 |
CN106650705A (zh) * | 2017-01-17 | 2017-05-10 | 深圳地平线机器人科技有限公司 | 区域标注方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6869440B2 (ja) | 2021-05-12 |
WO2020049634A1 (ja) | 2020-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10495756B2 (en) | Multi-camera laser scanner | |
EP3457683B1 (en) | Dynamic generation of image of a scene based on removal of undesired object present in the scene | |
CN110248096B (zh) | 对焦方法和装置、电子设备、计算机可读存储介质 | |
ES2869438T3 (es) | Captura de imágenes asistida por rastreador | |
US20230087330A1 (en) | Object tracking | |
JP6869440B2 (ja) | 教師データ生成装置、教師データ生成方法、および、教師データ生成システム | |
CN107516294B (zh) | 拼接图像的方法和装置 | |
CN110248097B (zh) | 追焦方法、装置、终端设备、计算机可读存储介质 | |
JP5663352B2 (ja) | 画像処理装置、画像処理方法、及び画像処理プログラム | |
EP2662833B1 (en) | Light source data processing device, method and program | |
CN112001375B (zh) | 一种火焰检测方法、装置、电子设备及存储介质 | |
JP5531603B2 (ja) | 画像処理装置および方法、並びにプログラム | |
KR20150126768A (ko) | 이미지 합성 방법 및 그 전자 장치 | |
JP7118934B2 (ja) | 物体数推定装置、物体数推定方法、および物体数推定プログラム | |
KR20200095888A (ko) | 무인 선박 시스템의 상황인지 방법 및 장치 | |
GB2562037A (en) | Three-dimensional scene reconstruction | |
CN110991385A (zh) | 一种识别船只行驶轨迹的方法、装置及电子设备 | |
JP7196999B2 (ja) | オブジェクト検出・追跡装置、方法、およびプログラム | |
JP2020140497A (ja) | 演算装置、視差算出方法 | |
JP6532370B2 (ja) | 撮像システム、構図設定装置、及び構図設定プログラム | |
JP4686773B2 (ja) | 動体認識方法および動体認識装置 | |
US11967117B2 (en) | Cloud-based training and camera correction | |
US20230290061A1 (en) | Efficient texture mapping of a 3-d mesh | |
JP2015005200A (ja) | 情報処理装置、情報処理システム、情報処理方法、プログラムおよび記憶媒体 | |
WO2021253189A1 (en) | Electric device, scanning method of controlling electric device, and computer readable storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200909 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200909 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20201016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210316 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210413 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6869440 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |