WO2022049691A1

WO2022049691A1 - 転移学習装置、転移学習方法およびプログラム

Info

Publication number: WO2022049691A1
Application number: PCT/JP2020/033406
Authority: WO
Inventors: 彦俊中里; 健二阿部
Original assignee: 日本電信電話株式会社
Priority date: 2020-09-03
Filing date: 2020-09-03
Publication date: 2022-03-10
Also published as: JPWO2022049691A1; JP7380895B2

Abstract

転移学習装置（１）は、過去の配置パターンの配置パターン情報（３００）および過去の配置パターン毎の学習モデル（４００）を記憶する記憶部（１２）と、デバイス間の距離差の情報を取得し、所定の類似配置パターン選択ロジックに基づき、類似する過去の配置パターンを選択し、その類似する過去の配置パターンの学習モデル（４００）を出力する配置パターン選択部（１３０）と、出力された類似する過去の配置パターンにおける学習モデル（４００）を転移学習し、新たな配置パターンの各カメラデバイス（５０）からの撮影状況の情報を入力して、当該各カメラデバイス（５０）のデバイス制御値を出力するデバイス制御部（１４０）とを備える。

Description

転移学習装置、転移学習方法およびプログラム

　本発明は、デバイス制御値を算出する学習モデルを転移学習する、転移学習装置、転移学習方法およびプログラムに関する。

　例えば、自動車等の移動対象を複数のカメラ等のデバイスで捕捉して撮影する場合において、そのデバイス（カメラデバイス）の最適な制御値は、その配置位置によって変動する。従来、画像と視点座標という２つのセンサ情報を用いて、そのシーンに固有の変数を推論し、未知の視点座標から対応する観測画像を、深層生成モデルを用いて予測する技術が開発されている（例えば、非特許文献１参照）。この技術を利用することで、変動するデバイスの配置位置を推定することが可能である。

谷口尚平、他２名、「メタ学習としてのGenerative Query Network」、一般社団法人人工知能学会、2019年度人工知能学会全国大会（第33回）、人工知能学会全国大会論文集２Q5-J-2-03、 2019年6月

　しかしながら、デバイスの位置が頻繁に移動するような場合では、膨大な状況数を必要とし、新しい状況が発生するごとに、デバイス制御値を学習し直す必要があった。このため、最適値へ収束するまでの準備時間の増大を招き、サービス品質維持時間の低下に結びつくものであった。

　このような点に鑑みて本発明がなされたのであり、本発明は、カメラデバイスの配置位置が変化した場合に、位置変化後の配置における学習モデルの最適なデバイス制御値への学習時間を短縮させることを課題とする。

　本発明に係る転移学習装置は、学習モデルを転移学習する転移学習装置であって、各カメラデバイスの位置を含む、複数の過去の配置パターンの情報が格納される配置パターン情報、および、撮影状況の情報を入力して、各カメラデバイスのデバイス制御値を出力する、前記過去の配置パターン毎の学習モデル、を記憶する記憶部と、新たな配置パターンのカメラデバイスとそのカメラデバイスの画像に類似する画像を撮影した過去の配置パターンのカメラデバイスとのデバイス間の距離差の情報を取得し、よりデバイス間の距離差が少ない過去の画像を撮影したカメラデバイスを選択することにより、前記新たな配置パターンに全体として類似する前記過去の配置パターンを選択するための所定の類似配置パターン選択ロジックに基づき、類似する前記過去の配置パターンを選択し、選択した類似する前記過去の配置パターンにおける学習モデルを、前記記憶部から抽出して出力する配置パターン選択部と、出力された類似する前記過去の配置パターンにおける学習モデルを転移学習し、新たな配置パターンの各カメラデバイスからの撮影状況の情報を入力して、当該各カメラデバイスの前記デバイス制御値を出力する、前記転移学習した新たな配置パターンの学習モデルを用いて、前記新たな配置パターンの各カメラデバイスを制御するデバイス制御部と、を備えることを特徴とする。

　本発明によれば、カメラデバイスの配置位置が変化した場合に、位置変化後の配置における学習モデルの最適なデバイス制御値への学習時間を短縮させることができる。

本実施形態に係る転移学習装置の構成を示すブロック図である。ホモグラフィ行列の内容を説明する図である。現在画像と比較した各過去画像における、Ｌ２ノルム（類似度：Ｓｉｍ）の値を示す図である。本実施形態に係るＬ２ノルムとホモグラフィ行列における固有値の例を示す図である。現在画像と比較した各過去画像における、Ｘ軸方向の移動量と、Ｙ軸方向の移動量と、Ｌ２ノルム（類似度：Ｓｉｍ）の値を示す図である。本実施形態に係る類似デバイス抽出部による、ホップ数の算出処理を説明する図である。本実施形態に係る転移学習装置が実行する転移学習処理の流れを示すフローチャートである。本実施形態に係る転移学習装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

　次に、本発明を実施するための形態（以下、「本実施形態」と称する。）について説明する。まず、本発明の前提について説明する。

＜本発明の前提＞
　本発明に係る転移学習装置１は、過去の配置パターン毎に、デバイス制御値を出力する学習モデルを記憶しておき、過去のデバイスの配置位置と、新たなデイバスの配置位置との距離差（移動量）の情報を取得して、最も類似する過去のデバイスの配置パターンを選択し、その類似する過去の配置パターンにおける学習モデルを、新たな配置パターンの学習モデルとして転移学習することを特徴とする。
　２つのデバイスの距離差（移動量）を各デバイスの撮影画像から算出する手法は、本発明において限定するものではないが、本実施形態においては、画像内の物体から局所的な特徴量を抽出する手法（特徴量抽出手法）に、画像間の変化量を表現できるホモグラフィ行列（詳細は後記）を組み合わせて画像間の変化量を求め、その画像間の変化量からデバイス間の距離差（後記する「ポップ数」）を取得するものとして説明する。

＜本実施形態＞
　図１は、本実施形態に係る転移学習装置１の構成を示すブロック図である。
　転移学習装置１は、過去のカメラデバイス５０の配置位置と、新たなカメラデバイス５０の配置位置との距離差（ホップ数）の情報（以下、「デバイス間の距離差の情報」と称する。）を取得する。そして、転移学習装置１は、新たな配置パターンにおいてデバイスを配置する際に、画像の類似度の高い、つまり、カメラ位置の移動量の少ないデバイスを含む複数のデバイスの過去の配置パターンを選択する。転移学習装置１は、過去の配置パターン毎に、その配置パターンにおいて用いる学習モデルを記憶している。そして、転移学習装置１は、選択した過去の配置パターンの学習モデルを、新たな配置パターンの各デバイスに関する学習モデルとして取り込み、学習（転移学習）する。これにより、新たな配置パターンでデバイスを配置する際に、学習モデルの最適なデバイス制御値への学習時間を短縮させることができる。
　この転移学習装置１は、制御部１０と、入出力部１１と、記憶部１２とを備える。

　入出力部１１は、他の装置（複数のカメラデバイス５０等）との間の情報について入出力を行う。この入出力部１１は、通信回線を介して情報の送受信を行う通信インタフェースと、不図示のキーボード等の入力装置やモニタ等の出力装置との間で情報の入出力を行う入出力インタフェースとから構成される。

　記憶部１２は、ハードディスクやフラッシュメモリ、ＲＡＭ（Random Access Memory）等により構成される。
　この記憶部１２には、配置パターン情報３００と、配置パターン毎の学習モデル４００（４００Ａ，４００Ｂ，４００Ｃ，…）が格納される学習モデル群情報４１０とが記憶される（詳細は後記）。この学習モデル群情報４１０において、学習モデル４００は、配置パターンという環境毎に用意される。また、転移学習装置１自身がデバイス間の距離差の情報を算出する場合には、デバイス毎の画像データ２００が、記憶部１２に記憶される。
　さらに、記憶部１２には、制御部１０の各機能部を実行させるためのプログラムや、制御部１０の処理に必要な情報が一時的に記憶される。

　制御部１０は、転移学習装置１が実行する処理の全般を司り、配置パターン選択部１３０と、デバイス制御部１４０とを含んで構成される。また、転移学習装置１自身がデバイス間の距離差の情報を算出する場合には、画像認識部１１０と、類似デバイス抽出部１２０とを制御部１０に備える。以下においては、転移学習装置１が、画像認識部１１０および類似デバイス抽出部１２０を備えるものとして説明する。
　なお、転移学習装置１が、画像認識部１１０および類似デバイス抽出部１２０を備えない場合は、外部装置等からデバイス間の距離差の情報を取得するようにしてもよい。

　画像認識部１１０は、新たな配置パターンの各カメラデバイス５０から、比較元画像である現在画像５ａを取り込む。また、画像認識部１１０は、記憶部１２の画像データ２００から、比較対象である過去画像５ｂとを取り込む。そして、画像認識部１１０は、特徴量抽出アルゴリズムを用いて、それぞれの画像から特徴量を抽出する。続いて、画像認識部１１０は、現在画像５ａと過去画像５ｂとの間で特徴点のマッチングを行う。画像認識部１１０は、２つの画像のマッチングされた各特徴点の位置の変化からホモグラフィ行列を算出し、算出したホモグラフィ行列から画像間の類似度を算出する。
　この画像認識部１１０は、特徴量抽出部１１１と類似度算出部１１２とを含んで構成される。

　特徴量抽出部１１１は、各カメラデバイス５０から比較元画像である現在画像５ａを取得する。また、特徴量抽出部１１１は、記憶部１２内の画像データ２００から、複数のカメラデバイス５０により撮影された過去画像５ｂを取得する。なお、画像データ２００には、各カメラデバイス５０に対応付けて、そのカメラデバイス５０が撮影した画像（過去画像５ｂ）が記憶される。
　また、比較元画像となる現在画像５ａを送信してきた各カメラデバイス５０は、既存の（過去の）カメラデバイス５０の配置位置において撮影された画像ではなく、新たな配置パターンの位置で撮影した画像を送信するデバイスである。

　特徴量抽出部１１１は、例えばＡＫＡＺＥ（Accelerated KAZE）等の所定の特徴量抽出アルゴリズムを用いて、現在画像５ａおよび１つ以上の過去画像５ｂからそれぞれの特徴量を抽出し、各特徴点のベクトルを比較することにより、ベクトルの類似度が高い特徴点をマッチングする。つまり、特徴量抽出部１１１は、画像間の特徴点の組合せを算出する。

　類似度算出部１１２は、図２の符号３１に示す、変換前画像５５ａと、変換後画像５５ｂとにおいてマッチングされた各特徴点の位置の変化からホモグラフィ行列（図２の符号１００）を算出する。ホモグラフィとは、ある平面を、射影変換を用いて別の平面に射影することをいう。
　ホモグラフィ行列１００は、ある画像において、射影変換（拡大・縮小、回転、平行移動など）が行われた場合、元画像の画像座標（変換前座標：ｘ，ｙ）から変換後の画像座標（変換後座標：ｘ′，ｙ′）に射影することができる３×３の行列で表される。
　変換後座標（ｘ′，ｙ′）は、変換前座標（ｘ，ｙ）とホモグラフィ行列とを用いて図２の式（１）のように表すことができる。

　ホモグラフィ変換では、図２の符号３２に示すように、ホモグラフィ行列１００の各要素を、９つのパラメータ（ｈ_１１，ｈ_１２，…，ｈ_３３）で表現する。
　ここで、例えば、座標ｘ，ｙに依存しない影響を示すパラメータ「ｈ_１３，ｈ_２３」に着目すればＸ軸・Ｙ軸方向の移動量を推定することができる。また、スケールに対する影響度を示すパラメータ「ｈ_３１，ｈ_３２」に着目すれば、スケール（拡大・縮小）の変化量を推定することができる。よって、ホモグラフィ行列の各要素（パラメータ）を利用することにより、実際のカメラ位置の変化量を推定することが可能になる。

　ホモグラフィ行列における固有値Ｈを確定するためには、４組以上の特徴量のペア（所定数の特徴点）が必要となる。本実施形態に係る類似度算出部１１２は、４組以上の特徴量のペアが存在する場合には、そのすべての特徴量のペアに関して、後記する誤差距離の総和Ｓを算出する。そして、類似度算出部１１２は、算出した誤差距離の総和Ｓが最も小さい４組のペアによるホモグラフィ行列の固有値Ｈを採用する。

≪ホモグラフィ行列における固有値Ｈの確定処理≫
　類似度算出部１１２は、ホモグラフィ行列における固有値Ｈの確定処理を以下に示す手順で行う。
　ここで、変換前の座標を変換前座標ａとし、変換後の座標を変換後座標ａ′とする。また、ｎ組（ここでは、例として１０組）の特徴量のペア（以下、「特徴量ペア」と称する。）があるとする。

（手順１）ｎ組（１０組）の特徴量ペアのうち、ランダムの４組の特徴量ペア（所定数の特徴点）を選び、ホモグラフィ行列を算出する。
（手順２）残り６組の特徴量ペアのそれぞれについて、（手順１）で算出されたホモグラフィ行列と座標（Ｈａ）とを使って算出した値と実際の座標（Ｈａ′）との差√（ｘ^２＋ｙ^２）（誤差距離：変換後座標を（0,0）としたときの座標平面上の２点間の距離であり、特徴点間の座標のずれを示す。）を残り６組の特徴量ペアそれぞれについて求め、その誤差距離の総和Ｓを算出する。
（手順３）（手順２）で算出された誤差距離の総和Ｓを、全通りの特徴量ペア（ここでは、_１０Ｃ_４通り）計算する。
（手順４）誤差距離の総和Ｓが最も小さい特徴量ペア（４組の特徴量ペア）で算出されたホモグラフィ行列を採用し、固有値Ｈとして確定する。

　なお、類似度算出部１１２は、採用したホモグラフィ行列における誤差距離の情報（最も小さい誤差距離の総和Ｓ）を、後記する新たな配置パターンのカメラデバイス５０に関するホップ数の算出に利用するため、記憶部１２に記憶しておく。

　本実施形態では、特徴点の位置の変化量であるデータ間距離としてホモグラフィ行列で示される固有ベクトルを利用し、２画像間の類似度を示す指標として、ホモグラフィ行列における固有値を用いたＬ２ノルムを採用する。
　Ｌ２ノルムは、画像間の類似度（Ｓｉｍ）を示す指標であり、以下の式（２）で示される。

　ここで、ｘ_ｉは、ホモグラフィ行列の固有値を示す。
　類似度算出部１１２は、確定したホモグラフィ行列の固有値ＨからこのＬ２ノルムを計算する。このＬ２ノルムは、値が小さいほど類似度が高いものとなる。

　図３のグラフ（符号４１）は、現在画像５ａと比較した各過去画像５ｂについての、Ｌ２ノルムである画像間の類似度（Ｓｉｍ）（縦軸）の値を示している。
　図３では、過去画像「05.jpg」は、他の過去画像５ｂに比べＬ２ノルムの値が低くなっている。これにより、現在画像５ａと過去画像「05.jpg」の類似度が高いことが示される。

　また、図４に示す各過去画像５ｂについてのＬ２ノルムを示すグラフ（符号４１）では、過去画像「05.jpg」および「04.jpg」において、Ｌ２ノルムがそれぞれ「0.0226」「0.0245」と小さい値となっている。
　よって、この２つの過去画像５ｂは、現在画像５ａとの類似度が高いことが示される。このとき、「05.jpg」および「04.jpg」のホモグラフィ行列の固有値は、図４の符号Ｈ_５と符号Ｈ_４で示される。
　そして、このホモグラフィ行列の固有値Ｈ_５，Ｈ₄から、例えば、Ｘ軸方向の移動量を示す値（ｈ_１３成分）、Ｙ軸方向の移動量を示す値（ｈ_２３成分）が示される。なお、Ｘ軸方向の移動量（ｈ_１３成分：符号ａで示す値）は、Ｙ軸方向の移動量（ｈ_2３成分：符号ｂで示す値）よりも大きな値であることがわかる。また、スケール（拡大・縮小）の変化量を示す値（ｈ_３１成分，ｈ_３２成分：符号ｃで示す値）が全体として小さな値であることがわかる。

　以上説明した、画像認識部１１０の特徴量抽出部１１１および類似度算出部１１２は、複数のカメラデバイス５０で構成される新規の配置パターンとして、複数のカメラデバイス５０からの画像（現在画像５ａ）を取得した場合には、各カメラデバイス５０から取得したそれぞれの画像に対して、上記した特徴量抽出処理と、ホモグラフィ行列の算出によるデータ間距離（固有値Ｈ）およびＬ２ノルム（類似度）の算出を実行する。
　なお、データ間距離や類似度の算出手法は、ＡＫＡＺＥ等の特徴量抽出処理やホモグラフィ行列を用いたものに限定されない。ホモグラフィ行列に代わる手法として、畳み込みニューラルネットワーク（ＣＮＮ：Convolutional Neural Network）のような大域特徴量を活用して画像全体から特徴量を取得し、デバイス間の距離差を求めるようにしてもよい。

　図１に戻り、類似デバイス抽出部１２０の処理について説明する。
　類似デバイス抽出部１２０は、新規に配置されたパターン（以下、「新規配置パターン」と称する。）のカメラデバイス群の画像（各現在画像５ａ）を転移学習装置１が取得した場合、画像認識部１１０が、上記において説明した処理を行い、画像データ２００に記憶された過去画像５ｂと比較することにより算出したデータ間距離（固有値Ｈ）およびＬ２ノルム（類似度）を用いて、Ｌ２ノルムが所定の閾値以下の過去画像５ｂを抽出する。これにより、類似デバイス抽出部１２０は、画像間の類似度が高い、つまり、新規配置パターンのカメラデバイス５０と配置位置の近いデバイスを抽出する。

　図５は、現在画像５ａと比較した各過去画像５ｂにおける、Ｘ軸方向の移動量と、Ｙ軸方向の移動量と、Ｌ２ノルム（類似度：Ｓｉｍ）の値を示す図である。類似デバイス抽出部１２０は、画像間の類似度（Ｓｉｍ）を示すＬ２ノルムの値が所定の閾値以下の場合に、画像間の類似度が高いとして、画像同士で推定されたＸ軸方向とＹ軸方向の移動量が、実際の変動量に比例し信頼できるデータであるとする。
　一方、Ｌ２ノルムの値が所定の閾値を超える場合、画像間の類似度が低く、現在画像５ａと過去画像５ｂの２つの画像が全体として様相が大きく変わっており、一致する特徴量（特徴点）が少なかったり、特徴量自身のマッピングがずれていることが起因して、推定される変動量と実際の画像との間にずれが発生しやすいものとなる。つまり、Ｘ軸方向、Ｙ軸方向の移動量の信頼度は低いものとなる。

　図５に示す例では、例えば、Ｌ２ノルムの所定の閾値が「5.000e-01」であるとする。類似デバイス抽出部１２０は、Ｌ２ノルムの値が「5.000e-01」以下である過去画像５ｂ（５ｂ_１２，５ｂ_１３，５ｂ_１４，５ｂ_１５，５ｂ_１６）（図５において各データを斜線で囲んだ過去画像）を類似度の高い画像として抽出する。図５に示す例では、比較元となる現在画像５ａと同様に、駅舎と列車の両方が映っている過去画像５ｂが類似度の高い画像として抽出される。

　ここで、類似デバイス抽出部１２０は、新規配置パターンのカメラデバイス５０毎に、抽出したデバイスの中で、Ｌ２ノルムの値が最小のカメラデバイス５０を選択する。そして、類似デバイス抽出部１２０は、選択したカメラデバイス５０それぞれについて、類似度算出部１１２が算出した誤差距離の総和Ｓを、所定の距離Ｎ（Ｎは、２点間を１ポップとして規定する距離）で割った値について小数点を繰り上げ（Roundup）し、ホップ数（推定距離）として保持する。

　なお、新規配置パターンに類似するカメラデバイス５０を選択する前提として、各カメラデバイス５０におけるカメラズーム倍率は常に一定であり不変であるとする。また、各カメラデバイス５０の絶対的な位置情報は、他の手段からは得られないものとする。

　図６は、本実施形態に係る類似デバイス抽出部１２０による、ホップ数の算出処理を説明する図である。ここでは、類似デバイス抽出部１２０が、新規配置パターンのデバイス「Ａ」「Ｂ」「Ｃ」の配置位置に近いデバイスの距離を推定する場合で説明する。なお、デバイス「Ａ」「Ｂ」は、図６において同一機種として同じ記号「〇」で示し、デバイスＣは、それとは異なる機種として記号「△」で示している。

　デバイス「Ａ」の近傍では、Ｌ２ノルムの値であるＳｉｍ（類似度）が所定の閾値（Ｔｈ）以下（Ｓｉｍ＜Ｔｈ）であり、そのうちの最小値として選択されたデバイス「Ｐ１」が抽出される。そして、デバイス「Ａ」は、デバイス「Ｐ１」の近傍の１ホップ以内の距離にあると推定される（Ｈ（Ａ，Ｐ１）＝１）。
　同様に、デバイス「Ｂ」の近傍には、Ｓｉｍが所定の閾値（Ｔｈ）以下（Ｓｉｍ＜Ｔｈ）であり、そのうちの最小値として選択されたデバイス「Ｐ３」が抽出される。なお、デバイス「Ｐ２」は、Ｓｉｍが所定の閾値（Ｔｈ）を超えているので抽出されない。そして、デバイス「Ｂ」は、デバイスＰ３の近傍の３ホップ以内の距離にあると推定される（Ｈ（Ａ，Ｐ１）＝３）。
　同様に、デバイスＣの近傍には、Ｓｉｍが所定の閾値（Ｔｈ）以下（Ｓｉｍ＜Ｔｈ）であり、そのうちの最小値として選択されたデバイス「Ｐ４」が抽出される。なお、デバイス「Ｐ５」は、Ｓｉｍが所定の閾値（Ｔｈ）を超えているので抽出されない。そして、デバイス「Ｃ」は、デバイス「Ｐ４」の近傍の２ホップ以内の距離にあると推定される（Ｈ（Ａ，Ｐ１）＝２）。

　このようにして、類似デバイス抽出部１２０は、新規配置パターンにおける各カメラデバイス５０の現在画像５ａから、Ｌ２ノルム（Ｓｉｍ）が所定の閾値以下であり、そのＬ２ノルムの値が最小のカメラデバイス５０を抽出する。そして、類似デバイス抽出部１２０は、新規配置パターンおけるカメラデバイス５０と抽出したカメラデバイス５０との間の誤差距離の総和Ｓを用いて、ホップ数（推定距離）を算出することができる。
　以上の画像認識部１１０および類似デバイス抽出部１２０の処理により、デバイス間の実際の距離差に比例した正確なずれの情報（デバイス間の距離差の情報）をホップ数として算出することができる。なお、本発明は、本実施形態に係る画像認識部１１０および類似デバイス抽出部１２０が実行する処理に限定されず、デバイス間の距離差の情報が取得できるのであれば、他の手法を用いてもよい。

　図１に戻り、配置パターン選択部１３０は、新たな配置パターンのカメラデバイス５０とそのカメラデバイス５０の画像に類似する画像を撮影した過去の配置パターンのカメラデバイス５０とについて、デバイス間の距離差の情報（ここでは、「ホップ数」）を取得する。配置パターン選択部１３０は、新たに配置するカメラデバイスの配置パターンに対し、デバイス間の距離差の情報（ホップ数）を利用した所定の類似配置パターン選択ロジックに基づき、配置パターン情報３００を参照して最も類似する（過去の）配置パターンを選択する。そして、配置パターン選択部１３０は、選択した配置パターンにおける学習モデル４００を、学習モデル群情報４１０の中から抽出し、デバイス制御部１４０に出力する。

　配置パターン選択部１３０の処理の前提として、記憶部１２内に、過去における様々なデバイスの配置パターン（各カメラデバイス５０のロケーション（位置）および機種等）の情報である配置パターン情報３００を記憶している。また、その過去の配置パターンにおいて用いる学習モデル４００（４００Ａ，４００Ｂ，４００Ｃ，…）を、過去の各配置パターンに対応付けて学習モデル群情報４１０として記憶部１２に記憶している。

　配置パターン選択部１３０は、所定の類似配置パターン選択ロジックとして、以下に示す順位に基づき、配置パターン情報３００に記憶された（過去の）複数の配置パターンの中から最も類似する配置パターンを選択する。この所定の類似配置パターン選択ロジックは、類似デバイス抽出部１２０が算出したホップ数のうち、よりホップ数の少ない過去画像を撮影したカメラデバイス５０を選ぶことにより、新規の配置パターンに全体として類似する過去の配置パターンを選択するためのロジックである。

≪類似配置パターン選択ロジック≫
（順位１）同一機種のデバイスが所定の第１ホップ数Ｘ（例えば、ホップ数「１」）以内に配置されているデバイス数がより多い。
（順位２）所定の第１ホップ数Ｘ以内に該当機種のデバイスが存在しないが、所定の第２ホップ数Ｙ（Ｘ＜Ｙ）（例えば、ホップ数「３」）以内に同一機種のデバイスが位置しており、配置パターンの各デバイスそれぞれのホップ数の合計である総ホップ数がより小さい。
（順位３）（順位２）において、総ホップ数が等しい場合、各デバイスのホップ数の標準偏差がより小さい。

　配置パターン選択部１３０は、新たに配置するカメラデバイス５０の配置パターンにおける推定距離（ホップ数）を利用して、最も配置パターンが類似する過去の配置パターンを、例えば上記した所定の類似配置パターン選択ロジックに基づき決定する。そして、配置パターン選択部１３０は、その配置パターンにおける学習モデル４００を、学習モデル群情報４１０の中から抽出し、デバイス制御部１４０に出力する。

　図１に戻り、デバイス制御部１４０は、撮影状況の情報を入力すると各配置パターンのカメラデバイス５０の制御値の情報を出力する学習モデル４００を備える。そして、デバイス制御部１４０は、この学習モデル４００について、新たに配置するカメラデバイス５０の配置パターンに類似する過去の配置パターンにおける学習モデル４００を、配置パターン選択部１３０から取得し、学習（転移学習）させる。
　このデバイス制御部１４０は、学習モデル取得部１４１と、機械学習部１４２と、制御情報作成部１４３とを備えている。

　学習モデル取得部１４１は、配置パターン選択部１３０から、新たに配置するカメラデバイスの配置パターンに類似する過去の配置パターンにおける学習モデル４００を取得し、機械学習部１４２に転移学習させる。
　この学習モデル４００は、過去の配置パターン（各カメラデバイス５０のロケーション（位置）および機種等）において、撮影状況の情報（例えば、撮影対象の自動車の速度）ごとに、その撮影状況の情報に対応した各カメラデバイス５０の制御値（例えば、デバイスが自動車を追尾する首振りカメラであれば、カメラの回転方向、指定角度、回転開始時刻など）と、当該制御値で配置パターンに属する各カメラデバイス５０を制御した場合のスコア値とを学習データとして、パラメータを最適化したデータである。

　機械学習部１４２は、学習モデル取得部１４１が取得した、新たに配置するカメラデバイス５０の配置パターンに類似する過去の配置パターンにおける学習モデル４００を受け取り、学習（転移学習）する。つまり、機械学習部１４２は、新たな配置パターンのカメラデバイス５０の制御値について、一から学習するのではなく、類似した配置パターンにおいて利用していた学習モデル４００を取り込んで転移学習する。
　この機械学習部１４２は、転移学習した学習モデル４００を用いて、実際に新たな配置パターンにおける情報（撮影状況の情報、制御値、スコア値等）を学習データとして、学習することにより、学習モデル４００のパラメータを最適化していく。この際、類似した配置パターンの学習モデル４００を転移学習しているので、要求された報酬（スコア値）を満たす適切な制御値を算出するまでの時間（収束時間）を短縮することができる。

　制御情報作成部１４３は、実際に新たに配置されたデバイスの配置パターンにおける各カメラデバイス５０からの情報を取得し、学習モデル４００に学習させた情報を用いて制御値を作成する。そして、制御情報作成部１４３は、作成した制御情報を各カメラデバイス５０に送信することにより、各カメラデバイス５０を制御する。

　このようにすることにより、転移学習装置１は、新たに配置するカメラデバイス５０の配置パターンにおける学習モデル４００において、最も配置パターンが類似する過去の配置パターンの学習モデル４００を転移学習させることができる。これにより、転移学習装置１は、カメラデバイス５０の位置変化後の配置における学習モデルの最適なデバイス制御値への学習時間を短縮させることができる。

＜処理の流れ＞
　次に、図７を参照して、本実施形態に係る転移学習装置１が実行する転移学習処理の流れについて説明する。

　まず、転移学習装置１の配置パターン選択部１３０は、新たな配置パターンのカメラデバイス５０とそのカメラデバイス５０の画像に類似する画像を撮影した過去の配置パターンのカメラデバイス５０とについて、デバイス間の距離差の情報を取得する（ステップＳ１０）。
　ここでは、配置パターン選択部１３０は、類似デバイス抽出部１２０が算出した２つのデバイス間のホップ数の情報を、デバイス間の距離差の情報として取得するものとする。なお、本発明において、デバイス間の距離差の情報を、上記した画像認識部１１０および類似デバイス抽出部１２０と異なる手法により算出してもよいし、外部装置から取得するようにしてもよい。

　続いて、配置パターン選択部１３０は、過去の配置パターンにおけるカメラデバイス５０において、ホップ数の少ないカメラデバイス５０がより多く選択されるロジックである所定の類似配置パターン選択ロジックに基づき、最も配置パターンが類似する過去の配置パターンを選択する（ステップＳ１１）。

　次に、配置パターン選択部１３０は、選択した最も配置パターンが類似する過去の配置パターンにおける学習モデル４００を、学習モデル群情報４１０の中から抽出し、デバイス制御部１４０に出力する（ステップＳ１２）。

　デバイス制御部１４０の学習モデル取得部１４１は、配置パターン選択部１３０から、新たに配置するカメラデバイスの配置パターンに類似する過去の配置パターンにおける学習モデル４００を取得し、機械学習部１４２に転移学習させる（ステップＳ１３）。

　制御情報作成部１４３は、実際に新たに配置されたデバイスの配置パターンにおける各カメラデバイス５０からの情報を取得し、学習モデル４００を用いて制御値を作成する。そして、制御情報作成部１４３は、作成した制御値を各カメラデバイス５０に送信して制御する（ステップＳ１４）。

　機械学習部１４２は、転移学習した学習モデル４００を用いて、実際に新たな配置パターンにおける情報（撮影状況の情報、制御値、スコア値等）を学習データとして学習することにより、学習モデル４００のパラメータを最適化する（ステップＳ１５）。

　このようにすることで、転移学習装置１は、新規配置パターンに類似する過去の配置パターンの学習モデル４００を、転移学習させることができる。これにより、新規配置パターンにおける各カメラデバイス５０の制御値を算出するための学習モデル４００の学習時間を短縮することができる。

＜ハードウェア構成＞
　本実施形態に係る転移学習装置１は、例えば図８に示すようなコンピュータ９００によって実現される。
　図８は、本実施形態に係る転移学習装置１の機能を実現するコンピュータ９００の一例を示すハードウェア構成図である。コンピュータ９００は、ＣＰＵ（Central Processing Unit）９０１、ＲＯＭ（Read Only Memory）９０２、ＲＡＭ９０３、ＨＤＤ（Hard Disk Drive）９０４、入出力Ｉ／Ｆ（Interface）９０５、通信Ｉ／Ｆ９０６およびメディアＩ／Ｆ９０７を有する。

　ＣＰＵ９０１は、ＲＯＭ９０２またはＨＤＤ９０４に記憶されたプログラムに基づき作動し、図１に示す転移学習装置１の制御部１０による制御を行う。ＲＯＭ９０２は、コンピュータ９００の起動時にＣＰＵ９０１により実行されるブートプログラムや、コンピュータ９００のハードウェアに係るプログラム等を記憶する。

　ＣＰＵ９０１は、入出力Ｉ／Ｆ９０５を介して、マウスやキーボード等の入力装置９１０、および、ディスプレイ等の出力装置９１１を制御する。ＣＰＵ９０１は、入出力Ｉ／Ｆ９０５を介して、入力装置９１０からデータを取得するともに、生成したデータを出力装置９１１へ出力する。なお、プロセッサとしてＣＰＵ９０１とともに、ＧＰＵ（Graphics Processing Unit）等を用いても良い。

　ＨＤＤ９０４は、ＣＰＵ９０１により実行されるプログラムおよび当該プログラムによって使用されるデータ等を記憶する。通信Ｉ／Ｆ９０６は、通信網（例えば、ＮＷ（Network）９２０）を介して他の装置からデータを受信してＣＰＵ９０１へ出力し、また、ＣＰＵ９０１が生成したデータを、通信網を介して他の装置へ送信する。

　メディアＩ／Ｆ９０７は、記録媒体９１２に格納されたプログラムまたはデータを読み取り、ＲＡＭ９０３を介してＣＰＵ９０１へ出力する。ＣＰＵ９０１は、目的の処理に係るプログラムを、メディアＩ／Ｆ９０７を介して記録媒体９１２からＲＡＭ９０３上にロードし、ロードしたプログラムを実行する。記録媒体９１２は、ＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto Optical disk）等の光磁気記録媒体、磁気記録媒体、導体メモリテープ媒体又は半導体メモリ等である。

　例えば、コンピュータ９００が本実施形態に係る転移学習装置１として機能する場合、コンピュータ９００のＣＰＵ９０１は、ＲＡＭ９０３上にロードされたプログラムを実行することにより転移学習装置１の機能を実現する。また、ＨＤＤ９０４には、ＲＡＭ９０３内のデータが記憶される。ＣＰＵ９０１は、目的の処理に係るプログラムを記録媒体９１２から読み取って実行する。この他、ＣＰＵ９０１は、他の装置から通信網（ＮＷ９２０）を介して目的の処理に係るプログラムを読み込んでもよい。

＜効果＞
　以下、本発明に係る転移学習装置１等の効果について説明する。
　本発明に係る転移学習装置は、学習モデルを転移学習する転移学習装置１であって、各カメラデバイス５０の位置を含む、複数の過去の配置パターンの情報が格納される配置パターン情報３００、および、撮影状況の情報を入力して、各カメラデバイス５０のデバイス制御値を出力する、過去の配置パターン毎の学習モデル４００、を記憶する記憶部１２と、新たな配置パターンのカメラデバイス５０とそのカメラデバイス５０の画像に類似する画像を撮影した過去の配置パターンのカメラデバイス５０とのデバイス間の距離差の情報を取得し、よりデバイス間の距離差が少ない過去の画像を撮影したカメラデバイス５０を選択することにより、新たな配置パターンに全体として類似する過去の配置パターンを選択するための所定の類似配置パターン選択ロジックに基づき、類似する過去の配置パターンを選択し、選択した類似する過去の配置パターンにおける学習モデル４００を、記憶部１２から抽出して出力する配置パターン選択部１３０と、出力された類似する過去の配置パターンにおける学習モデル４００を転移学習し、新たな配置パターンの各カメラデバイス５０からの撮影状況の情報を入力して、当該各カメラデバイス５０のデバイス制御値を出力する、転移学習した新たな配置パターンの学習モデル４００を用いて、新たな配置パターンの各カメラデバイス５０を制御するデバイス制御部１４０と、を備えることを特徴とする。

　このように、転移学習装置１は、過去の配置パターン毎の学習モデル４００を記憶部１２に備える。そして、転移学習装置１は、新たな配置パターンのカメラデバイス５０とそのカメラデバイス５０の画像に類似する画像を撮影した過去の配置パターンのカメラデバイス５０とのデバイス間の距離差の情報を取得する。転移学習装置１は、よりデバイス間の距離差が少ない過去の画像を撮影したカメラデバイス５０を選択する、所定の類似配置パターン選択ロジックに基づき、類似する過去の配置パターンを選択する。そして、転移学習装置１は、その類似する過去の配置パターンにおける学習モデル４００を記憶部１２から出力して、新たな配置パターンの学習モデル４００として転移学習することができる。
　これにより、転移学習装置１は、新たな配置パターンでカメラデバイス５０を配置する際に、類似する過去の配置パターンの学習モデルを転移学習することができるため、最適なデバイス制御値への学習時間を短縮させることができる。

　なお、本発明は、以上説明した実施形態に限定されるものではなく、多くの変形が本発明の技術的思想内で当分野において通常の知識を有する者により可能である。

　１　　　転移学習装置
　１０　　制御部
　１１　　入出力部
　１２　　記憶部
　５０　　カメラデバイス
　１００　ホモグラフィ行列
　１１０　画像認識部
　１１１　特徴量抽出部
　１１２　類似度算出部
　１２０　類似デバイス抽出部
　１３０　配置パターン選択部
　１４０　デバイス制御部
　１４１　学習モデル取得部
　１４２　機械学習部
　１４３　制御情報作成部
　２００　画像データ
　３００　配置パターン情報
　４００　学習モデル
　４１０　学習モデル群情報

Claims

　学習モデルを転移学習する転移学習装置であって、
　各カメラデバイスの位置を含む、複数の過去の配置パターンの情報が格納される配置パターン情報、および、撮影状況の情報を入力して、各カメラデバイスのデバイス制御値を出力する、前記過去の配置パターン毎の学習モデル、を記憶する記憶部と、
　新たな配置パターンのカメラデバイスとそのカメラデバイスの画像に類似する画像を撮影した過去の配置パターンのカメラデバイスとのデバイス間の距離差の情報を取得し、よりデバイス間の距離差が少ない過去の画像を撮影したカメラデバイスを選択することにより、前記新たな配置パターンに全体として類似する前記過去の配置パターンを選択するための所定の類似配置パターン選択ロジックに基づき、類似する前記過去の配置パターンを選択し、選択した類似する前記過去の配置パターンにおける学習モデルを、前記記憶部から抽出して出力する配置パターン選択部と、
　出力された類似する前記過去の配置パターンにおける学習モデルを転移学習し、新たな配置パターンの各カメラデバイスからの撮影状況の情報を入力して、当該各カメラデバイスの前記デバイス制御値を出力する、前記転移学習した新たな配置パターンの学習モデルを用いて、前記新たな配置パターンの各カメラデバイスを制御するデバイス制御部と、
　を備えることを特徴とする転移学習装置。
　学習モデルを転移学習する転移学習装置の転移学習方法であって、
　前記転移学習装置は、
　各カメラデバイスの位置を含む、複数の過去の配置パターンの情報が格納される配置パターン情報、および、撮影状況の情報を入力して、各カメラデバイスのデバイス制御値を出力する、前記過去の配置パターン毎の学習モデル、を記憶する記憶部を備えており、
　新たな配置パターンのカメラデバイスとそのカメラデバイスの画像に類似する画像を撮影した過去の配置パターンのカメラデバイスとのデバイス間の距離差の情報を取得し、よりデバイス間の距離差が少ない過去の画像を撮影したカメラデバイスを選択することにより、前記新たな配置パターンに全体として類似する前記過去の配置パターンを選択するための所定の類似配置パターン選択ロジックに基づき、類似する前記過去の配置パターンを選択し、選択した類似する前記過去の配置パターンにおける学習モデルを、前記記憶部から抽出して出力するステップと、
　出力された類似する前記過去の配置パターンにおける学習モデルを転移学習し、新たな配置パターンの各カメラデバイスからの撮影状況の情報を入力して、当該各カメラデバイスの前記デバイス制御値を出力する、前記転移学習した新たな配置パターンの学習モデルを用いて、前記新たな配置パターンの各カメラデバイスを制御するステップと、
　を実行することを特徴とする転移学習方法。
　各カメラデバイスの位置を含む、複数の過去の配置パターンの情報が格納される配置パターン情報、および、撮影状況の情報を入力して、各カメラデバイスのデバイス制御値を出力する、前記過去の配置パターン毎の学習モデル、を記憶する記憶部を有し、学習モデルを転移学習する転移学習装置としてのコンピュータに、
　新たな配置パターンのカメラデバイスとそのカメラデバイスの画像に類似する画像を撮影した過去の配置パターンのカメラデバイスとのデバイス間の距離差の情報を取得し、よりデバイス間の距離差が少ない過去の画像を撮影したカメラデバイスを選択することにより、前記新たな配置パターンに全体として類似する前記過去の配置パターンを選択するための所定の類似配置パターン選択ロジックに基づき、類似する前記過去の配置パターンを選択し、選択した類似する前記過去の配置パターンにおける学習モデルを、前記記憶部から抽出して出力する手順、
　出力された類似する前記過去の配置パターンにおける学習モデルを転移学習し、新たな配置パターンの各カメラデバイスからの撮影状況の情報を入力して、当該各カメラデバイスの前記デバイス制御値を出力する、前記転移学習した新たな配置パターンの学習モデルを用いて、前記新たな配置パターンの各カメラデバイスを制御する手順、
　を実行させるためのプログラム。