JPWO2020049634A1 - 教師データ生成装置、教師データ生成方法、および、教師データ生成システム - Google Patents

教師データ生成装置、教師データ生成方法、および、教師データ生成システム Download PDF

Info

Publication number
JPWO2020049634A1
JPWO2020049634A1 JP2020540899A JP2020540899A JPWO2020049634A1 JP WO2020049634 A1 JPWO2020049634 A1 JP WO2020049634A1 JP 2020540899 A JP2020540899 A JP 2020540899A JP 2020540899 A JP2020540899 A JP 2020540899A JP WO2020049634 A1 JPWO2020049634 A1 JP WO2020049634A1
Authority
JP
Japan
Prior art keywords
teacher data
image
moving body
data generation
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020540899A
Other languages
English (en)
Other versions
JP6869440B2 (ja
Inventor
百代 日野
百代 日野
秀明 前原
秀明 前原
遼雅 鈴木
遼雅 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2020049634A1 publication Critical patent/JPWO2020049634A1/ja
Application granted granted Critical
Publication of JP6869440B2 publication Critical patent/JP6869440B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

移動体が撮影された教師データ生成用画像を取得する画像取得部(104)と、移動体の属性情報と当該移動体の位置情報とを含む移動体情報を発信する移動体情報発信装置から発信された、当該移動体に関する移動体情報を取得する移動体情報取得部(101)と、画像取得部(104)が取得した教師データ生成用画像と、移動体情報取得部(101)が取得した移動体情報とに基づき、教師データを生成する教師データ生成部(111)とを備えた。

Description

この発明は、機械学習モデルを構築する際に使用される教師データを生成する教師データ生成装置に関する。
従来、機械学習を用いた、画像についての様々な活用方法が知られている。
従来知られているような画像の活用方法では、例えば、画像に写っている特定の物体の画像中での位置を出力するアプリケーションが使用され、当該アプリケーションを構築する際に、機械学習が用いられる。
一般に、人手によって、1枚または複数枚の画像から、当該画像中の物体の位置または大きさに関する、機械学習のための教師データを生成するためには、多大な労力を必要とする。
そこで、教師データを容易に生成する技術として、例えば、特許文献1には、予め用意された背景画像から抽出した領域に該当する画像に、複数の人物に関係する、人物の状態の指示情報に従って決定された、群集の人物状態に該当する人物の画像を合成して、群集状態画像を生成し、当該群集状態画像に対する教師ラベルを特定することで、群集画像の教師データを生成する教師データ生成装置に関する技術が開示されている。
国際公開第2014/002670号
特許文献1に開示されている技術に代表される従来技術では、背景とする画像の抽出、人物の画像の切り出し、および、背景とする画像と人物の画像の合成等、教師データを生成するにあたって、画像処理に依存する部分が多い。しかし、画像は外界の明るさの変化等で輝度が安定せず、背景とする画像の抽出、または、人物の画像の切り出しを安定的に行える保証がない。また、背景とする画像と人物の画像を合成して教師データを生成しているため、実際に起こり得るシーンが再現されていない可能性がある。
その結果、特許文献1に開示されている技術に代表される従来技術では、教師データとしての信頼性に疑問があるという課題があった。
この発明は上記のような課題を解決するためになされたもので、信頼性の高い教師データを生成することが可能な教師データ生成装置を提供することを目的とする。
この発明に係る教師データ生成装置は、判定対象画像中の移動体の位置を検出するための機械学習モデルを構築する際に使用される教師データを生成する、教師データ生成装置であって、移動体が撮影された教師データ生成用画像を取得する画像取得部と、移動体の属性情報と当該移動体の位置情報とを含む移動体情報を発信する移動体情報発信装置から発信された、当該移動体に関する移動体情報を取得する移動体情報取得部と、画像取得部が取得した教師データ生成用画像と、移動体情報取得部が取得した移動体情報とに基づき、教師データを生成する教師データ生成部とを備えたものである。
この発明によれば、信頼性の高い教師データを生成することができる。
実施の形態1に係る教師データ生成装置の構成例を示す図である。 実施の形態1における、補間部による時間補間処理のイメージの一例を示す図である。 実施の形態1における、間引き部による間引き処理のイメージの一例を示す図である。 実施の形態1で用いる座標系の定義について説明するための図であって、図4Aは、地球中心座標系の定義を説明するための図であり、図4Bは、カメラ座標系の定義を説明するための図である。 実施の形態1において、教師データ生成装置が、船舶の高さ情報を計算するための背景画像を生成し、実際に船舶の高さを計算するまでの処理のイメージを示す図であって、図5Aは、船舶が撮影された画像のイメージを示す図であり、図5Bは、背景画像の生成処理のイメージを示す図であり、図5Cは、画像中の船舶の高さを計算する処理のイメージを示す図である。 実施の形態1に係る教師データ生成装置を備えるデータ収集装置の動作を説明するためのフローチャートである。 実施の形態1に係る教師データ生成装置を備えるデータ収集装置の動作を説明するためのフローチャートである。 図7A,図7Bは、実施の形態1に係る教師データ生成装置を備えるデータ収集装置のハードウェア構成の一例を示す図である。 実施の形態1に係る教師データ生成装置と、カメラと、記憶装置と、カメラ較正装置とを備えたデータ収集システムの構成例を説明するための図である。
以下、この発明の実施の形態について、図面を参照しながら詳細に説明する。
実施の形態1.
実施の形態1に係る教師データ生成装置は、移動体が撮影された判定対象画像における当該移動体の位置を検出するための機械学習モデルを構築する際に使用される教師データを生成する。実施の形態1において、機械学習モデルとは、複数の画像を学習し予測した結果得られた、当該複数の画像の特徴量のパターンである。判定対象画像とは、機械学習モデルを用いて、その画像上に映っている移動体を検出する対象となる、未知の画像である。
以下の説明においては、一例として、移動体は海上の船舶とし、教師データ生成装置は、海上の船舶が撮影された教師データ生成用画像を取得し、取得した教師データ生成用画像に基づき、教師データを生成するものとする。
また、実施の形態1に係る教師データ生成装置は、後述するデータ収集装置に備えられているものとする。
図1は、実施の形態1に係る教師データ生成装置100を備えたデータ収集装置1の構成例を示す図である。
データ収集装置1は、教師データ生成装置100の他、カメラ200と、記憶装置300と、カメラ較正装置400と、移動体情報受信アンテナ500と、移動体情報受信機600を備える。
カメラ200は、可視光カメラを想定しており、船舶が存在し得る海上を撮影する。実施の形態1では、カメラ200は、1FPS(Frame Per Second)のフレームレートで撮影するものとする。
カメラ200は、撮影した画像を記憶装置300に記憶させる。実施の形態1において、カメラ200は、予め決められたフレーム数分の画像を、記憶装置300に記憶させるものとする。何フレーム分の画像を記憶させるようにするかは、ユーザが適宜決定することができるものとするが、ユーザは、少なくとも1フレームの画像が記憶されるようにする。カメラ200が撮影し、記憶装置300に記憶させる画像が、教師データ生成用画像である。以下、画像の数について言及する場合、フレーム単位の数を意味するものとする。
なお、データ収集装置1は、カメラ200によって海上を撮影可能な場所に設置されている。また、ここでは、データ収集装置1は、カメラ200を備えるものとするが、データ収集装置1は、カメラ200に代えて、2次元画像を取得可能なセンサ等を備えるようにしてもよい。データ収集装置1は、海上の画像を取得することができるようになっていればよい。
記憶装置300は、カメラ200が撮影した画像である教師データ生成用画像を記憶する。
記憶装置300は、カメラ200が備えるものとしてもよい。
カメラ較正装置400は、カメラ200の較正を行い、カメラ200の内部パラメータおよび外部パラメータを保存する。カメラ200の内部パラメータは、カメラ200の焦点距離に関する情報を含む。カメラ200の外部パラメータは、カメラ200の位置または姿勢に関する情報を含む。
カメラ較正装置400は、カメラ200の内部パラメータおよび外部パラメータを、教師データ生成装置100に出力する。
なお、カメラ較正装置400は、カメラ200が備えるものとしてもよい。
移動体情報受信アンテナ500は、移動体の情報を発信する装置(以下「移動体情報発信装置」という。図示省略。)が発する電波を受信する。移動体情報発信装置は、移動体に関する様々な情報を発信する。移動体情報発信装置が発信する、移動体に関する情報(以下「移動体情報」という。)には、少なくとも移動体の属性情報、および、当該移動体の位置情報が含まれる。移動体の属性情報は、移動体の名称等、特定の移動体を識別可能とする固有の情報の他、移動体の大きさ等の情報を含む。移動体の位置情報は、移動体の現在位置の他、移動体の速度等の情報を含む。
実施の形態1では、一例として、移動体情報発信装置は、AIS(Automatic Identification System:船舶自動識別装置)とする。AISは、船舶に搭載されており、当該AISが搭載されている船舶の船名、船舶の大きさ、船舶の現在位置、船舶の速度、船舶の種類、または、針路に関する情報等、船舶に関する様々な情報を発信する。但し、AISが発信する情報には、船舶の高さ情報は含まれていない。
移動体情報受信機600は、移動体情報受信アンテナ500経由で、上述の移動体情報を受信し、当該移動体情報を教師データ生成装置100に出力する。
教師データ生成装置100は、記憶装置300から取得した教師データ生成用画像と、移動体情報受信機600から取得した移動体情報に基づき、教師データを生成する。
教師データ生成装置100は、移動体情報取得部101と、記憶部102と、データ処理部103と、画像取得部104と、立方体領域設定部105と、座標変換部106と、最小矩形計算部107と、背景画像生成部108と、差分計算部109と、高さ計算部110と、教師データ生成部111と、教師データ出力部112を備える。
データ処理部103は、補間部1031と間引き部1032を備える。
画像取得部104は、撮影時刻取得部1041を備える。
背景画像生成部108は、マスク設定部1081を備える。
移動体情報取得部101は、移動体情報発信装置から発信された移動体情報を取得する。実施の形態1では、移動体情報取得部101は、移動体情報発信装置から発信された移動体情報を、移動体情報受信アンテナ500および移動体情報受信機600を経由して取得する。実施の形態1では、移動体情報取得部101が取得する移動体情報は、具体的には、船舶に関する情報である。
なお、移動体情報取得部101が取得する移動体情報がエンコードされている場合は、例えば、移動体情報取得部101がデコード部(図示省略)を備え、デコード部が、取得した移動体情報をデコードする。デコード部は、移動体情報取得部101に備えられるのではなく、例えば、移動体情報取得部101の外部の、移動体情報取得部101が参照可能な場所に備えられ、デコードした移動体情報を記憶するようにし、移動体情報取得部101は、デコード部が記憶した、デコード後の移動体情報を取得するようにしてもよい。移動体情報取得部101が、デコード後の移動体情報を取得できるようになっていればよい。
移動体情報取得部101は、移動体情報受信機600から取得した移動体情報を、記憶部102に記憶させる。デコード部が移動体情報をデコードするようにした場合は、移動体情報取得部101は、デコード部によってデコードされた後の移動体情報を、記憶部102に記憶させる。
なお、移動体情報には、少なくとも、船舶に関する情報と、移動体情報の受信日時の情報が含まれる。
記憶部102は、移動体情報を記憶する。
なお、実施の形態1では、記憶部102は、教師データ生成装置100に備えられるものとするが、これは一例に過ぎず、記憶部102は、教師データ生成装置100の外部の、教師データ生成装置100が参照可能な場所に備えられるようにしてもよい。
データ処理部103は、カメラ較正装置400から出力された、カメラ200の内部パラメータおよび外部パラメータを用いて、記憶部102に記憶されている移動体情報に対する、時間補間処理および間引き処理を行う。記憶部102に記憶されている移動体情報に、複数の異なる船舶に関する移動体情報が含まれる場合、データ処理部103は、同一の船舶に関する移動体情報単位で、時間補間処理および間引き処理を行う。つまり、データ処理部103は、船舶毎に、当該船舶に関する移動体情報の、時間補間処理および間引き処理を行う。
データ処理部103の補間部1031は、画像取得部104によって取得された、互いに異なる時刻で撮影された複数の教師データ生成用画像にそれぞれ対応する移動体情報が存在するよう、移動体情報取得部101が取得した移動体情報に対して時間補間を行う。
実施の形態1では、カメラ200で撮影される教師データ生成用画像は1FPSである。一方、実施の形態1では、移動体情報発信装置はAISである。AISは、一定時間おきに移動体情報を発信するが、必ずしも毎秒、当該移動体情報を発信するわけではない。そのため、実施の形態1では、補間部1031が、1秒毎に撮影される教師データ生成用画像にそれぞれ対応する1秒毎の移動体情報が存在するよう、移動体情報の時間補間を行う。
補間部1031は、移動体情報取得部101が取得した移動体情報が示す船舶の速度情報を補間した上で、当該船舶の位置情報の補間を行うことによって、当該移動体情報の時間補間を行う。
ここで、図2は、実施の形態1における、補間部1031による時間補間処理のイメージの一例を示す図である。
例えば、ある時刻T=0(秒)およびT=3(秒)の、船舶Xに関する移動体情報が記憶部102に記憶されており、T=0(秒)およびT=3(秒)における船舶Xの位置および速度がわかっているものとする。
補間部1031は、まず、T=1(秒)およびT=2(秒)における船舶Xの速度Vを線形補間で計算する。次に、補間部1031は、T=1(秒)およびT=2(秒)における船舶Xの位置を、速度Vの積分で計算する。
そして、補間部1031は、T=1(秒)およびT=2(秒)における船舶Xの位置情報および速度情報を含む移動体情報を生成する。
このように、補間部1031は、時間補間処理において、船舶の速度情報を補間した上で船舶の位置情報を補間することで移動体情報の補間を行うため、図2に示すように、秒毎の船舶の位置は必ずしも等間隔にはならない。
補間部1031は、時間補間処理により新たに生成した移動体情報を、記憶部102に記憶させる。
データ処理部103の間引き部1032は、カメラ較正装置400から出力された、カメラ200の内部パラメータおよび外部パラメータに基づき、地図上における、カメラ200の撮影範囲を計算する。そして、間引き部1032は、移動体情報で示される船舶の存在位置が、計算された撮影範囲の外となる移動体情報を、後段の、教師データを生成するための処理の対象外とする。具体的には、例えば、間引き部1032は、移動体情報で示される船舶の存在位置が、撮影範囲の外となる移動体情報に、対象外フラグを付与する。これによって、移動体情報の間引きが行われる。なお、間引き部1032による間引き処理は、補間部1031が時間補間処理を行った後の移動体情報に対して行うものとしてもよいし、補間部1031が時間補間処理を行う前の移動体情報に対して行うものとしてもよい。
移動体情報は、カメラ200による撮影範囲よりも広い範囲に位置する移動体について取得され得る情報であるため、間引き部1032が不要な移動体情報を間引いておくことで、後段の処理が軽くなる。
ここで、図3は、実施の形態1における、間引き部1032による間引き処理のイメージの一例を示す図である。
図3において、301で示す範囲が、カメラ200の撮影範囲である。間引き部1032は、カメラ較正装置400から出力された、カメラ200の内部パラメータおよび外部パラメータに基づき、当該撮影範囲を計算する。
また、図3において、302で示す丸印が、移動体情報に基づく各船舶の存在位置を示す。
間引き部1032は、船舶の存在位置が撮影範囲301の外であることを示す移動体情報を間引く。具体的には、間引き部1032は、船舶の存在位置が撮影範囲301の外であることを示す移動体情報に、対象外フラグを付与し、後段の処理で当該移動体情報を使用しないようにする。
画像取得部104は、カメラ200が撮影し、記憶装置300に記憶されている教師データ生成用画像を取得する。画像取得部104は、教師データ生成用画像を、フレーム単位で取得する。記憶装置300に複数フレームの教師データ生成用画像が記憶されている場合、画像取得部104は、記憶されている教師データ生成用画像を順に取得する。以下、画像取得部104が記憶装置300から取得した教師データ生成用画像を、「特定教師データ生成用画像」ともいう。
画像取得部104の撮影時刻取得部1041は、記憶装置300から取得した特定教師データ生成用画像について、撮影時刻を取得する。
撮影時刻取得部1041は、特定教師データ生成用画像の撮影時刻を、例えば、撮影開始時刻からのフレーム数で判断すればよい。撮影開始時刻は、例えば、記憶装置300に記憶されているものとする。また、例えば、カメラ200が監視カメラである場合等、カメラ200が撮影する画像に撮影時刻が文字で重畳表示されている場合、撮影時刻取得部1041は、重畳表示されている文字から、撮影時刻を取得するようにしてもよい。
そして、画像取得部104は、記憶部102を参照し、記憶部102から、特定教師データ生成用画像と対応する移動体情報を抽出する。特定教師データ生成用画像と対応する移動体情報とは、特定教師データ生成用画像の撮影時刻と、移動体情報に含まれる、当該移動体情報の受信時刻とが一致する移動体情報をいう。なお、画像取得部104が抽出する移動体情報は、データ処理部103によって、補間および間引きが行われた後の移動体情報である。また、実施の形態1において、特定教師データ生成用画像の撮像時刻と、移動体情報の受信時刻とが一致するとは、厳密に一致していることを必須としない。画像取得部104は、特定教師データ生成用画像の撮像時刻と移動体情報の受信時刻との差が予め許容範囲として設定された範囲内である等、特定教師データ生成用画像が撮影された際の移動体の位置がある程度わかる移動体情報であれば、当該移動体情報の受信時刻は特定教師データ生成用画像の撮像時刻と一致しているとみなす。
画像取得部104は、抽出した移動体情報を、特定教師データ生成用画像と対応付けて、立方体領域設定部105に出力する。
また、画像取得部104は、特定教師データ生成用画像の撮像時刻と一致する受信時刻の複数の移動体情報が存在する場合、全ての移動体情報を抽出する。例えば、同一時刻に複数の船舶が特定教師データ生成用画像の撮影範囲に存在する場合、当該特定教師データ生成用画像と対応付けられる移動体情報は複数存在することになる。
立方体領域設定部105は、画像取得部104から出力された特定教師データ生成用画像に、当該特定教師データ生成用画像に対応付けられている移動体情報に基づき、移動体情報で示される船舶の位置を表わす立方体を設定する。
実施の形態1では、立方体領域設定部105は、移動体情報に基づき、船舶の幅、長さ、および、角度を特定し、当該船舶を囲む立方体(以下「移動体包囲立方体」という。)の座標を設定する。なお、立方体領域設定部105が設定する移動体包囲立方体の座標は、移動体包囲立方体の8つの頂点の座標である。以下、立方体領域設定部105が設定する、移動体包囲立方体の各頂点の座標を、立方体座標という。
このとき、立方体領域設定部105は、立方体座標を、地球中心座標系で設定する。
ここで、図4は、実施の形態1で用いる座標系の定義について説明するための図である。図4Aは、地球中心座標系の定義を説明するための図(富山高等専門学校 航海科学研究室ホームページより引用)であり、図4Bは、カメラ座標系の定義を説明するための図である。
カメラ200の内部パラメータによって設定可能な3×3の内部行列と、カメラ200の回転角およびカメラ200の位置の情報から計算可能な4×3の外部行列により、地球中心座標系とカメラ座標系の間の座標の変換が可能である。
立方体領域設定部105が設定する移動体包囲立方体の幅は船舶幅であり、移動体包囲立方体の長さは船舶の船体の長さである。上述のとおり、AISが発信する情報に船舶の高さ情報は含まれていないため、移動体情報にも船舶の高さ情報は含まれていない。したがって、立方体領域設定部105は、移動体包囲立方体の高さについては、仮の値を設定する。仮の値とは、例えば、実際の船舶の高さより十分に大きいと想定される値であり、ユーザ等が予め設定可能とする。実施の形態1では、一例として、立方体領域設定部105は、移動体包囲立方体の高さには、船舶幅の2倍の値を設定するものとする。
画像取得部104から出力された特定教師データ生成用画像に対応付けられている移動体情報が複数ある場合、立方体領域設定部105は、特定教師データ生成用画像に対応付けられた全ての移動体情報で示される全ての船舶に対して、当該船舶を囲む移動体包囲立方体を設定する。
立方体領域設定部105は、設定した各立方体座標を、特定教師データ生成用画像の、対応する移動体情報に付与して、座標変換部106に出力する。
なお、画像取得部104から特定教師データ生成用画像が複数出力される場合、立方体領域設定部105は、特定教師データ生成用画像毎に、当該特定教師データ生成用画像に対応付けられている移動体情報で示される船舶を囲む移動体方位立方体を設定する。
座標変換部106は、カメラ較正装置400から出力される、カメラ200の内部パラメータおよび外部パラメータを用いて、立方体領域設定部105から出力された特定教師データ生成用画像に対応付けられている移動体情報に付与された立方体座標を、カメラ座標系(図4B参照)に変換する。
上述のとおり、カメラ200の内部パラメータによって設定可能な3×3の内部行列と、カメラ200の回転角およびカメラ200の位置の情報から計算可能な4×3の外部行列により、地球中心座標系とカメラ座標系の間の座標の変換が可能である。
座標変換部106は、以下の式(1)によって、立方体座標を、カメラ座標系に変換する。
式(1)に示すuが、カメラ座標系におけるx座標に該当し、式(1)に示すvが、カメラ座標系におけるy座標に該当する。
Figure 2020049634
式(1)において、fxおよびfyは焦点距離(単位:ピクセル)である。
立方体領域設定部105が立方体座標(X,Y,Z)を設定し、座標変換部106は、立方体領域設定部105が設定した立方体座標(X,Y,Z)を、式(1)を用いてカメラ座標系の座標(u,v)に変換する。なお、地球中心座標系とカメラ座標系の間の座標の変換の技術は、既知の技術である。
立方体領域設定部105から出力された特定教師データ生成用画像に対応付けられている移動体情報が複数ある場合、座標変換部106は、特定教師データ生成用画像に対応付けられた全ての移動体情報に付与された立方体座標を、それぞれ、カメラ座標系に変換する。
座標変換部106は、カメラ座標系に変換した、変換後の各立方体座標(以下「変換後座標」という。)を、特定教師データ生成用画像の、対応する移動体情報に付与して、最小矩形計算部107に出力する。
なお、立方体領域設定部105から特定教師データ生成用画像が複数出力される場合、座標変換部106は、特定教師データ生成用画像毎に、当該特定教師データ生成用画像に対応付けられている各移動体情報に付与された各立方体座標を、カメラ座標系に変換する。
最小矩形計算部107は、座標変換部106から出力された特定教師データ生成用画像に対応付けられている移動体情報について、当該移動体情報に付与された変換後座標に基づき、当該変換後座標全てを含む最小矩形を計算する。
具体的には、最小矩形計算部107は、移動体情報に対応付けられている全て(8つ)の変換後座標のx座標のうちの最小値と、全てのカメラ座標のy座標のうちの最小値を、当該移動体情報で示される船舶に対応する最小矩形の枠の左上の座標として定義する。また、最小矩形計算部107は、全てのカメラ座標のx座標のうちの最大値と、全てのカメラ座標のy座標のうちの最大値を、当該移動体情報を示される船舶に対応する最小矩形の枠の右下の座標として定義する。
最小矩形計算部107は、計算した最小矩形の座標を、特定教師データ生成用画像の、対応する移動体情報に付与する。
座標変換部106から出力された特定教師データ生成用画像に対応付けられている移動体情報が複数ある場合、最小矩形計算部107は、特定教師データ生成用画像に対応付けられた全ての移動体情報について、最小矩形を計算する。
なお、座標変換部106から特定教師データ生成用画像が複数出力される場合、最小矩形計算部107は、特定教師データ生成用画像毎に、当該特定教師データ生成用画像に対応付けられている各移動体情報について、最小矩形を計算する。
最小矩形計算部107は、移動体情報に最小矩形の座標を付与した特定教師データ生成用画像を、時系列で、例えば、記憶部102、または、教師データ生成装置100が内部に備える記憶領域に一時記憶させる。
背景画像生成部108は、特定教師データ生成用画像毎に、当該特定教師データ生成用画像上に船舶が存在しない場合の合成背景画像を生成する。
背景画像生成部108が合成背景画像を生成する手順について説明する。
まず、背景画像生成部108のマスク設定部1081は、最小矩形計算部107によって一時記憶されている特定教師データ生成用画像について、それぞれ、当該特定教師データ生成用画像に対応付けられている移動体情報に基づき、特定教師データ生成用画像上にマスクを設定した画像を生成する。実施の形態1において、マスク設定部1081が生成した、特定教師データ生成用画像にマスクを設定した画像を、「マスク設定画像」というものとする。具体的には、マスク設定部1081は、移動体情報で示される、船舶の長さ、および、船舶の回転角の情報に基づき、マスクの横幅を計算する。そして、マスク設定部1081は、特定教師データ生成用画像の縦幅をマスクの縦幅とし、当該縦幅と計算した横幅とからなる領域を、マスクに決定する。マスク設定部1081は、特定教師データ生成用画像上に決定したマスクが設定されたマスク設定画像を生成する。
マスク設定部1081は、生成したマスク設定画像を、一時記憶されている特定教師データ生成用画像の、対応する移動体情報に付与する。
一時記憶されている特定教師データ生成用画像に対応付けられている移動体情報が複数ある場合、マスク設定部1081は、特定教師データ生成用画像に対応付けられた全ての移動体情報について、当該移動体情報に基づいてマスクを設定したマスク設定画像を生成する。例えば、ある特定教師データ生成用画像に対応付けられている移動体情報が3つあるとすると、当該3つそれぞれに対して、マスク設定部1081によってマスク設定画像が生成され、移動体情報に付与される。
一時記憶されている各特定教師データ生成用画像について、マスク設定画像を生成し、特定教師データ生成用画像に対応付けられた移動体情報に付与すると、背景画像生成部108は、一時記憶されている特定教師データ生成用画像から、合成背景画像を生成する対象とする特定教師データ生成用画像を決定する。なお、合成背景画像を生成する対象とする特定教師データ生成用画像は、すなわち、後段の処理(詳細は後述する)で教師データを生成する対象となる教師データ生成用画像である。以下、背景画像生成部108によって決定された特定教師データ生成用画像を、「決定後教師データ生成用画像」ともいうものとして説明する。背景画像生成部108は、例えば、一時記憶されている特定教師データ生成用画像を時系列で順番に、決定後教師データ生成用画像に決定するようにすればよい。
具体的には、まず、背景画像生成部108は、決定後教師データ生成用画像について、移動体情報に付与されたマスク設定画像に設定されているマスクの領域(以下「注目マスク領域」という。)を切り出し、一時記憶されている、当該決定後教師データ生成用画像の前後の特定教師データ生成用画像(以下「比較対象教師データ生成用画像」という。)を確認して、マスクの領域内に船舶が入っていない特定教師データ生成用画像(以下「合成用画像」という。)を検索する。マスクの領域内に船舶が入っていないとは、比較対象教師データ生成用画像の、注目マスク領域に対応する領域に、マスクが設定されていないことをいう。背景画像生成部108は、比較対象教師データ生成用画像の移動体情報に付与されているマスク設定画像から、注目マスク領域に対応する領域に、マスクが設定されているか否かを判断すればよい。つまり、背景画像生成部108は、比較対象教師データ生成用画像の移動体情報に、注目マスク領域と同じ領域にマスクが設定されたマスク設定画像が付与されていなければ、当該比較対象教師データ生成用画像は、マスクの領域内に船舶が入っていない合成用画像と判断する。
なお、ここでは、背景画像生成部108は、マスクの領域内に船舶が入っていない特定教師データ生成用画像を合成用画像とするものとするが、これは一例に過ぎず、合成用画像は、必ずしもマスクの領域に対応する領域内に船舶が入っていない特定教師データ生成用画像であることを必須としない。例えば、背景画像生成部108は、マスクの領域内に多少船舶が入っている特定教師データ生成用画像であっても、合成用画像とするようにしてもよい。
背景画像生成部108は、当該検索を、合成用画像を予め設定されたフレーム数見つけるまで反復する。実施の形態1では、一例として、予め設定されたフレーム数は5フレームとする。
そして、予め設定されたフレーム数、合成用画像を見つけると、背景画像生成部108は、決定後教師データ生成用画像と、見つけた合成用画像の平均をとり、合成背景画像を生成する。このとき、背景画像生成部108は、注目マスク領域については、足し合わせを行わないようにする。
背景画像生成部108は、合成背景画像を生成する際には、決定後教師データ生成用画像と合成用画像とを、単純に平均することで合成背景画像を生成してもよいし、当該決定後教師データ生成用画像からみた時差を考慮して、足し合わせる合成用画像に重み付けを行った加重平均によって、合成背景画像を生成するようにしてもよい。
背景画像生成部108は、生成した合成背景画像を、決定後教師データ生成用画像の、対応する移動体情報に付与して、差分計算部109に出力する。
なお、複数の特定教師データ生成用画像をそれぞれ決定後教師データ生成用画像とする場合、背景画像生成部108は、順次決定した決定後教師データ生成用画像毎に、合成背景画像を生成する。このように、背景画像生成部108が、順次、決定後教師データ生成用画像を決定して、決定後教師データ生成用画像毎に合成背景画像を生成するのは、できるだけ各決定後教師データ生成用画像に近い時間帯の合成背景画像を取得するためである。
ある決定後教師データ生成用画像において、対応付けられている移動体情報が複数ある場合、背景画像生成部108は、決定後教師データ生成用画像に対応付けられた全ての移動体情報について、当該移動体情報に付与されているマスク設定画像に基づき、合成用画像を検索して合成背景画像を生成する。
差分計算部109は、背景画像生成部108から出力された決定後教師データ生成用画像と、当該決定後教師データ生成用画像に対応付けられている合成背景画像との差分を計算し、閾値以上の変化がある領域を白、閾値以上の変化がない領域を黒とした差分画像を生成する。より詳細には、差分計算部109は、背景画像生成部108から出力された決定後教師データ生成用画像と、当該決定後教師データ生成用画像に対応付けられている移動体情報に付与された合成背景画像との差分を計算する。
二値の差分画像を生成するためには、閾値を適切に設定する必要がある。船舶のない領域については、事前にAISで取得した情報があるため、ユーザ等は、予め、船舶のない領域が確実に差分なしに分類されるような閾値を設定する。また、差分計算部109は、二値化後にラベリング処理を行い、対象となる領域以外に発生している、面積の小さいノイズを除去する。対象となる領域とは、閾値以上の変化がある領域のことであり、当該領域は、船舶が存在する領域である。例えば、波面のきらめき等によって、差分計算部109は、当該波面のきらめき等の領域を閾値以上の変化がある領域と判断して差分画像を生成する場合がある。しかし、波面のきらめき等は船舶が存在する領域ではない。そこで、差分計算部109は、船舶が存在する領域と判断できる最大領域以外の、面積の小さいノイズを除去する。なお、これは一例に過ぎず、差分計算部109は、当該面積の小さいノイズの除去を行うことを必須とはしない。例えば、差分計算部109は、明らかに船舶が存在する領域ではないと判断できる程度に面積の小さい領域については、ノイズの除去を行わないようにしてもよい。
差分計算部109は、生成した差分画像を、決定後教師データ生成用画像の、対応する移動体情報に付与して、高さ計算部110に出力する。
背景画像生成部108から決定後教師データ生成用画像が複数出力される場合、差分計算部109は、決定後教師データ生成用画像毎に、差分画像を生成する。
ある決定後教師データ生成用画像に対応付けられている移動体情報が複数ある場合、差分計算部109は、決定後教師データ生成用画像に対応付けられた全ての移動体情報に付与されている合成背景画像について、それぞれ、決定後教師データ生成用画像との差分画像を生成し、移動体情報に付与する。
高さ計算部110は、決定後教師データ生成用画像に対応付けられている差分画像に基づき、当該決定後教師データ生成用画像上の船舶の高さを計算する。より詳細には、高さ計算部110は、決定後教師データ生成用画像に対応付けられている移動体情報に付与された差分画像に基づき、当該決定後教師データ生成用画像上の船舶の高さを計算する。具体的には、高さ計算部110は、差分計算部109が差分ありと判定した白の領域のy座標の最大値および最小値を計算することで、船舶を示す最小矩形の上端および下端のy座標を計算する。計算したy座標の情報に基づき、高さ計算部110は、最小矩形計算部107が計算し、移動体情報に付与した最小矩形の枠の上端および下端の情報を更新する。
高さ計算部110は、更新後の最小矩形の情報が反映された決定後教師用データ生成用画像を、教師データ生成部111に出力する。
なお、差分計算部109から決定後教師データ生成用画像が複数出力される場合、高さ計算部110は、決定後教師データ生成用画像毎に、当該決定後教師データ生成用画像上の各船舶の高さを計算する。
ある決定後教師データ生成用画像に対応付けられている移動体情報が複数ある場合、高さ計算部110は、決定後教師データ生成用画像に対応付けられた全ての移動体情報に付与されている差分画像に基づき、それぞれ、移動体情報に付与されている最小矩形の枠の上端および下端の情報を更新する。
教師データ生成部111は、高さ計算部110から出力された、更新後の最小矩形の情報が反映された決定後教師データ生成用画像に基づき、当該決定後教師データの移動体情報に付与された最小矩形の情報を、一時記憶されている特定教師データ生成用画像の移動体情報に付与された最小矩形の情報と置き換える。教師データ生成部111は、決定後教師データ生成用画像に反映された更新後の最小矩形の情報を、背景画像生成部108が決定後教師データ生成用画像に決定した特定教師データ生成用画像の移動体情報に付与された最小矩形の情報と置き換える。
また、教師データ生成部111は、高さ計算部110から出力された、更新後の最小矩形の情報が反映された決定後教師データ生成用画像に基づき、教師データを生成する。
具体的には、教師データ生成部111は、決定後教師データ生成用画像と、高さ計算部110が更新した最小矩形の情報とを対応付けて教師データとする。このとき、教師データ生成部111は、最小矩形の情報に加えて、船舶の種別等、移動体情報に含まれる情報も、教師データに含めるようにする。教師データ生成部111が生成する教師データのフォーマットは、例えば、Pascal VOC(Visual Object Classes)のようなjson(JavaScript Object Notation)(JavaScriptは登録商標)形式等が想定される。なお、最小矩形の情報は、例えば、最小矩形の左上と右下の座標の情報を複数まとめた情報である。
教師データ生成部111は、教師データとして、決定後教師データ生成用画像上に最小矩形を重畳表示させた画像を生成してもよい。具体的には、例えば、教師データ生成部111は、決定後教師データ生成用画像中の船舶の位置を矩形で囲った画像を、教師データとして生成してもよい。また、教師データ生成部111は、最小矩形の他に、当該最小矩形で表される船舶が発信している、当該船舶の自己の情報を、教師データに含めるようにしてもよい。船舶が発信している当該船舶の自己の情報とは、自船の進行方向、船名、速度、船種、船幅、船体の長さ、船舶識別番号、状態、または、喫水位置等の情報である。教師データ生成部111がこれらの情報を教師データに含めるようにすることで、例えば、船舶の検出だけでなく、種別の分類が可能な機械学習用データセットを生成することができ、更に詳細な画像認識を可能とすることができる。
また、教師データ生成部111は、決定後教師データ生成用画像上に最小矩形を重畳させるのではなく、例えば、差分画像の周囲のパスをベクトル情報として決定後教師データ生成用画像と対応付けた教師データを生成するようにしてもよい。
教師データ生成部111は、生成した教師データを、教師データ出力部112に出力する。
なお、高さ計算部110から決定後教師データ生成用画像が複数出力される場合、教師データ生成部111は、決定後教師データ生成用画像毎に、一時記憶されている特定教師データ生成用画像との置換えを行い、決定後教師データ生成用画像毎に、教師データを生成する。
ある決定後教師データ生成用画像に対応付けられている移動体情報が複数ある場合、教師データ生成部111は、決定後教師データ生成用画像に対応付けられた全ての移動体情報に付与されている最小矩形の情報を、一時記憶されている特定教師データ生成用画像の移動体情報に付与された最小矩形の情報と置き換える。また、ある決定後教師データ生成用画像に対応付けられている移動体情報が複数ある場合、教師データ生成部111は、決定後教師データ生成用画像に対応付けられた各移動体情報の分だけ、移動情報に付与された更新後の最小矩形の情報が反映された決定後教師データ生成用画像に基づき、教師データを生成する。
教師データ出力部112は、教師データ生成部111が生成した教師データを出力する。
図5は、実施の形態1において、教師データ生成装置100が、船舶の高さ情報を計算するための背景画像を生成し、実際に船舶の高さを計算するまでの処理のイメージを示す図である。
図5Aに示すように、カメラ200が撮影した画像中の船舶について、AISから得られる移動体情報によれば、当該船舶の船体の長さの情報は得られるが、船舶の高さの情報は得られない。
そこで、教師データ生成装置100において、背景画像生成部108が、マスクを設定したマスク設定画像を生成した上で決定後教師データ生成用画像および合成対象画像を複数枚足し合わせて平均することで、背景画像を生成する(図5B)。なお、図5Bでは、説明の簡単のため、背景画像を生成するもととなる画像を3フレームのみ図示しているが、実施の形態1では、背景画像生成部108は、背景が写っている合成対象画像が最低限5フレーム含まれるように、前後の特定教師データ生成用画像を順に検索する。
そして、差分計算部109が、決定後教師データ生成用画像と背景画像との差分を計算し、高さ計算部110が決定後教師データ生成用画像中の各船舶の高さを更新する(図5C)。
次に、実施の形態1に係る教師データ生成装置100を備えるデータ収集装置1の動作について説明する。
図6A,図6Bは、実施の形態1に係る教師データ生成装置100を備えるデータ収集装置1の動作を説明するためのフローチャートである。
カメラ200は、船舶が存在し得る海上を撮影し、撮影した教師データ生成用画像を記憶装置300に記憶させる(ステップST601)。
なお、データ収集装置1において、カメラ200は、所定のフレーム数の画像を撮影するまで、ステップST601の動作を行う。
移動体情報受信機600は、移動体情報受信アンテナ500経由で、移動体情報を受信し、教師データ生成装置100に出力する(ステップST602)。
移動体情報取得部101は、ステップST602にて移動体情報受信機600から出力された移動体情報を取得する。そして、移動体情報取得部101は、移動体情報受信機600から取得した移動体情報を、記憶部102に記憶させる(ステップST603)。
データ処理部103の補間部1031は、画像取得部104によって取得された、互いに異なる時刻で撮影された複数の教師データ生成用画像にそれぞれ対応する移動体情報が存在するよう、移動体情報取得部101が取得した移動体情報に対して時間補間を行い、新たに生成した移動体情報を、記憶部102に記憶させる(ステップST604)。
データ処理部103の間引き部1032は、カメラ較正装置400から出力された、カメラ200の内部パラメータおよび外部パラメータに基づき、地図上における、カメラ200の撮影範囲を地図上で計算する。そして、間引き部1032は、移動体情報で示される船舶の存在位置が、計算した撮影範囲の外となる移動体情報を、後段の、教師データを生成するための処理の対象外とする間引きを行う(ステップST605)。
ステップST601にて、カメラ200が所定のフレーム数の画像を撮影すると、ステップST606以降の処理に進む。
画像取得部104は、特定教師データ生成用画像を取得する。そして、画像取得部104の撮影時刻取得部1041は、記憶装置300から取得した特定教師データ生成用画像について、撮影時刻を取得する(ステップST606)。
画像取得部104は、記憶部102を参照し、記憶部102から、特定教師データ生成用画像と対応する移動体情報を抽出する(ステップST607)。
画像取得部104は、抽出した移動体情報を、特定教師データ生成用画像と対応付けて、立方体領域設定部105に出力する。
立方体領域設定部105は、ステップST607にて画像取得部104から出力された特定教師データ生成用画像に、当該特定教師データ生成用画像に対応付けられている移動体情報に基づき、移動体情報で示される船舶の位置を表わす立方体を設定する。具体的には、立方体領域設定部105は、移動体情報に基づき、船舶の幅、長さ、および、角度を特定し、当該船舶を囲む移動体包囲立方体の座標を設定する(ステップST608)。
立方体領域設定部105は、設定した立方体座標を、特定教師データ生成用画像の、対応する移動体情報に付与して、座標変換部106に出力する。
座標変換部106は、カメラ較正装置400から出力される、カメラ200の内部パラメータおよび外部パラメータを用いて、ステップST608にて立方体領域設定部105から出力された特定教師データ生成用画像に対応付けられている移動体情報に付与された立方体座標を、変換後座標に変換する(ステップST609)。
座標変換部106は、変換後座標を、特定教師データ生成用画像の、対応する移動体情報に付与して、最小矩形計算部107に出力する。
最小矩形計算部107は、ステップST609にて座標変換部106から出力された特定教師データ生成用画像に対応付けられている移動体情報について、当該移動体情報に付与された変換後座標に基づき、当該変換後座標全てを含む最小矩形を計算する(ステップST610)。
最小矩形計算部107は、計算した最小矩形の座標を、特定教師データ生成用画像の、対応する移動体情報に付与する。
最小矩形計算部107は、移動体情報に最小矩形の座標を付与した特定教師データ生成用画像を、時系列で、例えば、記憶部102、または、教師データ生成装置100が内部に備える記憶領域に一時記憶させる。
ステップST606〜ステップST610の動作は、特定教師データ生成用画像毎に行われる。また、1フレームの特定教師データ生成用画像に、複数の移動体情報が対応付けられている場合、対応付けられた移動体情報の分だけ、ステップST608〜ステップST610の動作が繰り返される。
背景画像生成部108のマスク設定部1081は、ステップST610にて一時記憶された特定教師データ生成用画像について、それぞれ、当該特定教師データ生成用画像に対応付けられている移動体情報に基づき、特定教師データ生成用画像上にマスクを設定したマスク設定画像を生成する(ステップST611)。
そして、背景画像生成部108は、一時記憶されている特定教師データ生成用画像から、順に決定後教師データ生成用画像を決定し、当該決定後教師データ生成用画像の合成背景画像を生成する(ステップST612)。
背景画像生成部108は、生成した合成背景画像を、決定後教師データ生成用画像と対応付けて、差分計算部109に出力する。
差分計算部109は、ステップST612にて背景画像生成部108から出力された決定後教師データ生成用画像と、当該決定後教師データ生成用画像に対応付けられている合成背景画像との差分を計算し、閾値以上の変化がある領域を白、閾値以上の変化がない領域を黒とした差分画像を生成する(ステップST613)。
差分計算部109は、生成した差分画像を、決定後教師データ生成用画像と対応付けて、高さ計算部110に出力する。
高さ計算部110は、決定後教師データ生成用画像に対応付けられている差分画像に基づき、当該決定後教師データ生成用画像上の船舶の高さを計算する(ステップST614)。
高さ計算部110は、更新後の最小矩形の情報が反映された決定後教師用データ生成用画像を、教師データ生成部111に出力する。
教師データ生成部111は、ステップST614にて高さ計算部110から出力された、更新後の最小矩形の情報が反映された決定後教師データ生成用画像に基づき、教師データを生成する(ステップST615)。教師データ生成部111は、生成した教師データを、教師データ出力部112に出力する。
なお、このとき、教師データ生成部111は、ステップST614にて高さ計算部110から出力された、更新後の最小矩形の情報が反映された決定後教師データ生成用画像に基づき、当該決定後教師データの移動体情報に付与された最小矩形の情報を、一時記憶されている特定教師データ生成用画像の移動体情報に付与された最小矩形の情報と置き換える。
教師データ出力部112は、ステップST615にて教師データ生成部111が生成した教師データを出力する(ステップST616)。
ステップST612〜ステップST616の動作は、決定後教師データ生成用画像毎に行われる。また、1フレームの決定後教師データ生成用画像に、複数の移動体情報が対応付けられている場合、対応付けられた移動体情報の分だけ、ステップST612〜ステップST616の動作が繰り返される。
教師データ出力部112が教師データを出力すると、制御部(図示省略)が、記憶装置300に記憶されている画像、および、一時記憶させている教師データ生成用画像等を削除する。制御部は、画像および教師データ生成用画像等に、処理済フラグを付与する等してもよい。
なお、実施の形態1では、上述のように、教師データ生成装置100は、教師データ生成用画像(決定後教師データ生成用画像)毎に、当該教師データ生成用画像上の船舶の高さを計算する都度、教師データを生成し、出力するようにしているが、これは一例に過ぎない。
例えば、教師データ生成装置100は、全ての教師データ生成用画像について、当該全ての教師データ生成用画像上の船舶の高さを計算して教師データを生成し、生成した教師データをまとめて出力するようにしてもよい。
図7A,図7Bは、実施の形態1に係る教師データ生成装置100を備えるデータ収集装置1のハードウェア構成の一例を示す図である。
実施の形態1において、移動体情報取得部101と、データ処理部103と、画像取得部104と、立方体領域設定部105と、座標変換部106と、最小矩形計算部107と、背景画像生成部108と、差分計算部109と、高さ計算部110と、教師データ生成部111と、教師データ出力部112の機能は、処理回路701により実現される。すなわち、データ収集装置1は、移動体を検出するための教師データを生成する制御を行うための処理回路701を備える。
処理回路701は、図7Aに示すように専用のハードウェアであっても、図7Bに示すようにメモリ707に格納されるプログラムを実行するCPU(Central Processing Unit)706であってもよい。
処理回路701が専用のハードウェアである場合、処理回路701は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field−Programmable Gate Array)、またはこれらを組み合わせたものが該当する。
処理回路701がCPU706の場合、移動体情報取得部101と、データ処理部103と、画像取得部104と、立方体領域設定部105と、座標変換部106と、最小矩形計算部107と、背景画像生成部108と、差分計算部109と、高さ計算部110と、教師データ生成部111と、教師データ出力部112の機能は、ソフトウェア、ファームウェア、または、ソフトウェアとファームウェアとの組み合わせにより実現される。すなわち、移動体情報取得部101と、データ処理部103と、画像取得部104と、立方体領域設定部105と、座標変換部106と、最小矩形計算部107と、背景画像生成部108と、差分計算部109と、高さ計算部110と、教師データ生成部111と、教師データ出力部112は、HDD(Hard Disk Drive)702、メモリ707等に記憶されたプログラムを実行するCPU706、またはシステムLSI(Large−Scale Integration)等の処理回路により実現される。また、HDD702、またはメモリ707等に記憶されたプログラムは、移動体情報取得部101と、データ処理部103と、画像取得部104と、立方体領域設定部105と、座標変換部106と、最小矩形計算部107と、背景画像生成部108と、差分計算部109と、高さ計算部110と、教師データ生成部111と、教師データ出力部112の手順や方法をコンピュータに実行させるものであるとも言える。ここで、メモリ707とは、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read−Only Memory)等の、不揮発性もしくは揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、またはDVD(Digital Versatile Disc)等が該当する。
なお、移動体情報取得部101と、データ処理部103と、画像取得部104と、立方体領域設定部105と、座標変換部106と、最小矩形計算部107と、背景画像生成部108と、差分計算部109と、高さ計算部110と、教師データ生成部111と、教師データ出力部112の機能について、一部を専用のハードウェアで実現し、一部をソフトウェアまたはファームウェアで実現するようにしてもよい。例えば、移動体情報取得部101については専用のハードウェアとしての処理回路701でその機能を実現し、データ処理部103と、画像取得部104と、立方体領域設定部105と、座標変換部106と、最小矩形計算部107と、背景画像生成部108と、差分計算部109と、高さ計算部110と、教師データ生成部111と、教師データ出力部112については処理回路がメモリ707に格納されたプログラムを読み出して実行することによってその機能を実現することが可能である。
また、記憶装置300および記憶部102は、メモリ707を使用する。なお、これは一例であって、記憶装置300および記憶部102は、HDD702、SSD(Solid State Drive)、または、DVD等によって構成されるものであってもよい。
また、データ収集装置1は、移動体情報発信装置等との通信を行う、入力インタフェース装置703、および、出力インタフェース装置704を有する。
また、データ収集装置1は、移動体情報受信アンテナ500、移動体情報受信機600、カメラ較正装置400、および、カメラ200等の撮影装置705を備える。
以上のように、実施の形態1によれば、教師データ生成装置100は、移動体が撮影された教師データ生成用画像を取得する画像取得部104と、移動体の属性情報と当該移動体の位置情報とを含む移動体情報を発信する移動体情報発信装置から発信された、当該移動体に関する移動体情報を取得する移動体情報取得部101と、画像取得部104が取得した教師データ生成用画像と、移動体情報取得部101が取得した移動体情報とに基づき、教師データを生成する教師データ生成部111とを備えるように構成した。そのため、従来のように、事前に設計された画像認識の処理精度の影響を受けることを低減し、信頼性の高い教師データを生成することができる。
また、既存の、AIS等の移動体情報発信装置から発信される情報をもとに教師データを生成するため、従来のような重い画像処理を必要とせず、教師データ生成の省力化が可能となる。
また、教師データ生成装置100は、画像取得部104によって取得された、互いに異なる時刻で撮影された複数の教師データ生成用画像にそれぞれ対応する移動体情報が存在するよう、移動体情報取得部101が取得した移動体情報の時間補間を行う補間部1031を備え、教師データ生成部111は、補間部1031が時間補間を行った後の移動体情報に基づき、教師データを生成するようにした。そのため、教師データ生成用画像の取得タイミングと、移動体情報の取得タイミングが異なる場合であっても、教師データ生成用画像と対応する移動体情報を生成し、当該教師データ生成用画像と当該移動体情報に基づいて教師データを生成することができる。
また、教師データ生成装置100は、移動体情報取得部101が取得した移動体情報について、当該移動体情報で示される移動体の存在位置が、教師データ生成用画像の撮影範囲外となる場合、当該撮影範囲外となる当該移動体情報を、教師データ生成部111が教師データを生成するための移動体情報から除外する間引き部1032を備えるようにした。そのため、不要なデータを間引き、教師データ生成のための処理を軽くすることができる。
また、移動体が船舶であり、移動体情報発信装置がAISである場合、教師データ生成装置100は、教師データ生成用画像(決定後教師データ生成用画像)毎に、当該教師データ生成用画像上に船舶が存在しない場合の合成背景画像を生成する背景画像生成部108と、教師データ生成用画像と、当該教師データ生成用画像に対応付けられている合成背景画像との差分を計算し、差分画像を生成する差分計算部109と、教師データ生成用画像に対応付けられている差分画像に基づき、教師データ生成用画像上の船舶の高さを計算する高さ計算部110を備え、教師データ生成部111は、高さ計算部110が計算した船舶の高さの情報を含む教師データを生成するようにした。そのため、AISから船舶の高さの情報が得られなくても、当該船舶の高さの情報を設定できる。
なお、以上の実施の形態1では、移動体情報発信装置をAISとし、AISから受信する情報からでは、船舶の高さの情報は得られないため、教師データ生成装置100にて船舶の高さを計算し、教師データに反映するようにした。しかし、これに限らず、移動体情報発信装置から、教師データの生成に必要な情報を過不足なく得られる場合、教師データ生成装置100は、移動体の高さ等、移動体に関する情報を計算する必要はない。この場合、教師データ生成装置100において、最小矩形計算部107は、移動体の高さに応じた最小矩形を設定するようにすればよい。また、この場合、教師データ生成装置100は、背景画像生成部108、差分計算部109、および、高さ計算部110を備えない構成とすることができる。
また、以上の実施の形態1では、教師データ生成装置100は、データ処理部103(補間部1031および間引き部1032)を備えるものとしたが、補間部1031および間引き部1032は必須ではない。
例えば、カメラ200が教師データ生成用画像を撮影する時間幅と、移動体情報発信装置が移動体情報を発信する時間幅が同じ場合等、移動体情報を補間する必要がなければ、教師データ生成装置100は、補間部1031を備えない構成としてもよい。
また、例えば、移動体情報発信装置が移動体情報を発信する範囲と、カメラ200が教師データ生成用画像を撮影する撮影範囲とが同じ場合等、移動体情報を間引く必要がなければ、教師データ生成装置100は、間引き部1032を備えない構成としてもよい。
また、以上の実施の形態1では、教師データ生成装置100は、教師データ出力部112を備えるものとしたが、教師データ出力部112は必須ではない。
例えば、教師データ生成部111が、生成した教師データを、教師データ生成装置100に記憶させておくようにする場合、教師データ生成装置100は、教師データ出力部112を備えない構成としてもよい。
また、以上の実施の形態1では、カメラ200、記憶装置300、および、カメラ較正装置400は、データ収集装置1に備えられるものとしたが、これに限らない。カメラ200、記憶装置300、および、カメラ較正装置400は、データ収集装置1の外部の、データ収集装置1からアクセスが可能な場所に備えられるようになっていてもよい。
カメラ200がデータ収集装置1の外部に備えられる場合、カメラ200が移動体を撮影可能な場所に設置されるようになっていればよく、データ収集装置1が、移動体を撮影可能な場所に設置される必要はない。
例えば、図8に示すように、データ収集装置1と、カメラ200と、記憶装置300と、カメラ較正装置400とがネットワークで接続されたデータ収集システムを構成するようにしてもよい。なお、図8に示すようなデータ収集システムにおいても、カメラ200と記憶装置300を一体型としてもよいし、当該一体型のカメラ200にカメラ較正装置400がさらに含まれるようにしてもよい。
また、以上の実施の形態1では、移動体は、船舶であるものとしたが、これは一例に過ぎない。例えば、移動体は、車であってもよい。また、例えば、移動体は、自己位置等の情報を発信可能なデバイスを携帯している人、または、自己位置等の情報を発信可能なデバイスを装着させられている動物であってもよい。
また、以上の実施の形態1では、カメラ200は、可視光カメラを前提とするが、これに限らず、カメラ200は、IRカメラ等としてもよい。カメラ200をIRカメラとすることで、夜間でも船舶の観測が可能となり、例えば、24時間分の撮影画像を用いて教師データを生成することができる。
また、本願発明はその発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。
この発明に係る教師データ生成装置は、画像処理に依存することなく、信頼性の高い教師データを生成することができるように構成したため、画像中の移動体の位置を検出するための教師データを生成する教師データ生成装置に適用することができる。
1 データ収集装置、100 教師データ生成装置、101 移動体情報取得部、102 記憶部、103 データ処理部、1031 補間部、1032 間引き部、104 画像取得部、1041 撮影時刻取得部、105 立方体領域設定部、106 座標変換部、107 最小矩形計算部、108 背景画像生成部、1081 マスク設定部、109 差分計算部、110 高さ計算部、111 教師データ生成部、112 教師データ出力部、200 カメラ、300 記憶装置、400 カメラ較正装置、500 移動体情報受信アンテナ、600 移動体情報受信機、701 処理回路、702 HDD、703 入力インタフェース装置、704 出力インタフェース装置、705 撮影装置、706 CPU、707 メモリ。

Claims (7)

  1. 判定対象画像中の移動体の位置を検出するための機械学習モデルを構築する際に使用される教師データを生成する、教師データ生成装置であって、
    前記移動体が撮影された教師データ生成用画像を取得する画像取得部と、
    前記移動体の属性情報と当該移動体の位置情報とを含む移動体情報を発信する移動体情報発信装置から発信された、当該移動体に関する前記移動体情報を取得する移動体情報取得部と、
    前記画像取得部が取得した前記教師データ生成用画像と、前記移動体情報取得部が取得した前記移動体情報とに基づき、前記教師データを生成する教師データ生成部
    とを備えた教師データ生成装置。
  2. 前記画像取得部によって取得された、互いに異なる時刻で撮影された複数の前記教師データ生成用画像にそれぞれ対応する前記移動体情報が存在するよう、前記移動体情報取得部が取得した前記移動体情報の時間補間を行う補間部を備え、
    前記教師データ生成部は、前記補間部が前記時間補間を行った後の前記移動体情報に基づき、前記教師データを生成する
    ことを特徴とする請求項1記載の教師データ生成装置。
  3. 前記移動体情報取得部が取得した前記移動体情報について、当該移動体情報で示される移動体の存在位置が、前記教師データ生成用画像の撮影範囲外となる場合、当該撮影範囲外となる当該移動体情報を、前記教師データ生成部が前記教師データを生成するための前記移動体情報から除外する間引き部を備えた
    ことを特徴とする請求項1記載の教師データ生成装置。
  4. 前記画像取得部が取得した前記教師データ生成用画像毎に、当該教師データ生成用画像に対応する前記移動体情報に基づき、当該移動体情報で示される移動体の位置を表わす立方体の座標を、地球中心座標系にて設定する立方体領域設定部と、
    前記立方体領域設定部が設定した地球中心座標系の前記立方体の座標を、前記教師データ生成用画像上の座標系に変換し、変換後座標を生成する座標変換部と、
    前記座標変換部が生成した前記変換後座標に基づき、前記教師データ生成用画像上で、前記変換後座標を含む最小矩形を計算する最小矩形計算部を備え、
    前記教師データ生成部は、
    前記最小矩形計算部が計算した最小矩形の情報を含む前記教師データを生成する
    ことを特徴とする請求項1記載の教師データ生成装置。
  5. 前記移動体は船舶であり、前記移動体情報発信装置は船舶自動識別装置であって、
    前記教師データ生成用画像毎に、当該教師データ生成用画像上に前記船舶が存在しない場合の合成背景画像を生成する背景画像生成部と、
    前記教師データ生成用画像と、当該教師データ生成用画像に対応付けられている前記合成背景画像との差分を計算し、差分画像を生成する差分計算部と、
    前記教師データ生成用画像に対応付けられている前記差分画像に基づき、前記教師データ生成用画像上の前記船舶の高さを計算する高さ計算部を備え、
    前記教師データ生成部は、
    前記高さ計算部が計算した前記船舶の高さの情報を含む前記教師データを生成する
    ことを特徴とする請求項1記載の教師データ生成装置。
  6. 判定対象画像中の移動体の位置を検出するための機械学習モデルを構築する際に使用される教師データを生成する、教師データ生成方法であって、
    画像取得部が、前記移動体が撮影された教師データ生成用画像を取得するステップと、
    移動体情報取得部が、前記移動体の属性情報と当該移動体の位置情報とを含む移動体情報を発信する移動体情報発信装置から発信された、当該移動体に関する前記移動体情報を取得するステップと、
    教師データ生成部が、前記画像取得部が取得した前記教師データ生成用画像と、前記移動体情報取得部が取得した前記移動体情報とに基づき、前記教師データを生成するステップ
    とを備えた教師データ生成方法。
  7. 判定対象画像中の移動体の位置を検出するための機械学習モデルを構築する際に使用される教師データを生成する、教師データ生成装置であって、
    前記移動体が撮影された教師データ生成用画像を取得する画像取得部と、
    前記移動体の属性情報と当該移動体の位置情報とを含む移動体情報を発信する移動体情報発信装置から発信された、当該移動体に関する前記移動体情報を取得する移動体情報取得部と、
    前記画像取得部が取得した前記教師データ生成用画像と、前記移動体情報取得部が取得した前記移動体情報とに基づき、前記教師データを生成する教師データ生成部とを備えた教師データ生成装置と、
    前記移動体を撮影する撮影装置とを有する教師データ生成システム。
JP2020540899A 2018-09-04 2018-09-04 教師データ生成装置、教師データ生成方法、および、教師データ生成システム Active JP6869440B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/032756 WO2020049634A1 (ja) 2018-09-04 2018-09-04 教師データ生成装置、教師データ生成方法、および、教師データ生成システム

Publications (2)

Publication Number Publication Date
JPWO2020049634A1 true JPWO2020049634A1 (ja) 2020-12-17
JP6869440B2 JP6869440B2 (ja) 2021-05-12

Family

ID=69723034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020540899A Active JP6869440B2 (ja) 2018-09-04 2018-09-04 教師データ生成装置、教師データ生成方法、および、教師データ生成システム

Country Status (2)

Country Link
JP (1) JP6869440B2 (ja)
WO (1) WO2020049634A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639624B (zh) * 2020-06-10 2023-09-29 深圳市时海科技有限公司 一种基于人工智能的课堂教学及时强化能力评估方法及系统
JPWO2022014220A1 (ja) * 2020-07-13 2022-01-20
JP2023124260A (ja) * 2022-02-25 2023-09-06 古野電気株式会社 物標監視システム、物標監視方法、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106650705A (zh) * 2017-01-17 2017-05-10 深圳地平线机器人科技有限公司 区域标注方法、装置和电子设备
WO2018105122A1 (ja) * 2016-12-09 2018-06-14 富士通株式会社 教師データ候補抽出プログラム、教師データ候補抽出装置、及び教師データ候補抽出方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104660994B (zh) * 2015-02-09 2018-03-16 武汉理工大学 海事专用摄像机及海事智能监控方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018105122A1 (ja) * 2016-12-09 2018-06-14 富士通株式会社 教師データ候補抽出プログラム、教師データ候補抽出装置、及び教師データ候補抽出方法
CN106650705A (zh) * 2017-01-17 2017-05-10 深圳地平线机器人科技有限公司 区域标注方法、装置和电子设备

Also Published As

Publication number Publication date
JP6869440B2 (ja) 2021-05-12
WO2020049634A1 (ja) 2020-03-12

Similar Documents

Publication Publication Date Title
US10495756B2 (en) Multi-camera laser scanner
EP3457683B1 (en) Dynamic generation of image of a scene based on removal of undesired object present in the scene
CN110248096B (zh) 对焦方法和装置、电子设备、计算机可读存储介质
ES2869438T3 (es) Captura de imágenes asistida por rastreador
US20230087330A1 (en) Object tracking
JP6869440B2 (ja) 教師データ生成装置、教師データ生成方法、および、教師データ生成システム
CN107516294B (zh) 拼接图像的方法和装置
CN110248097B (zh) 追焦方法、装置、终端设备、计算机可读存储介质
JP5663352B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
EP2662833B1 (en) Light source data processing device, method and program
CN112001375B (zh) 一种火焰检测方法、装置、电子设备及存储介质
JP5531603B2 (ja) 画像処理装置および方法、並びにプログラム
KR20150126768A (ko) 이미지 합성 방법 및 그 전자 장치
JP7118934B2 (ja) 物体数推定装置、物体数推定方法、および物体数推定プログラム
KR20200095888A (ko) 무인 선박 시스템의 상황인지 방법 및 장치
GB2562037A (en) Three-dimensional scene reconstruction
CN110991385A (zh) 一种识别船只行驶轨迹的方法、装置及电子设备
JP7196999B2 (ja) オブジェクト検出・追跡装置、方法、およびプログラム
JP2020140497A (ja) 演算装置、視差算出方法
JP6532370B2 (ja) 撮像システム、構図設定装置、及び構図設定プログラム
JP4686773B2 (ja) 動体認識方法および動体認識装置
US11967117B2 (en) Cloud-based training and camera correction
US20230290061A1 (en) Efficient texture mapping of a 3-d mesh
JP2015005200A (ja) 情報処理装置、情報処理システム、情報処理方法、プログラムおよび記憶媒体
WO2021253189A1 (en) Electric device, scanning method of controlling electric device, and computer readable storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200909

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200909

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20201016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210316

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210413

R150 Certificate of patent or registration of utility model

Ref document number: 6869440

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250