WO2020202572A1

WO2020202572A1 - 画像処理システム、推定装置、処理方法及びプログラム

Info

Publication number: WO2020202572A1
Application number: PCT/JP2019/015210
Authority: WO
Inventors: 健全劉; 俊男李
Original assignee: 日本電気株式会社
Priority date: 2019-04-05
Filing date: 2019-04-05
Publication date: 2020-10-08
Also published as: JP7124957B2; JPWO2020202572A1; US20220189151A1

Abstract

本発明は、第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成するサンプル画像生成部（１１）と、特性が第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルにサンプル画像を入力し、サンプル画像毎に内容を示す画像内容推定結果を生成する推定部（１２）と、サンプル画像各々の画像内容推定結果に基づき、学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定するタスク実行部（１４）と、相対的位置関係の推定結果が正しいか判定する判定部（１５）と、相対的位置関係の推定結果が誤っていると判定された場合、推定モデルのパラメタの値を修正する修正部（１６）と、を有する処理システム（１０）を提供する。

Description

[規則37.2に基づきISAが決定した発明の名称]　画像処理システム、推定装置、処理方法及びプログラム

　本発明は、処理システム、推定装置、処理方法及びプログラムに関する。

　特許文献１は、トレーニング画像と事業店舗位置を識別する情報とで機械学習を行う技術を開示している。そして、特許文献１は、パノラマ画像、視野が１８０°より大きい画像、球形又はほぼ球形であるパノラマ画像等をトレーニング画像にできることを開示している。

特表２０１８－５２４６７８号

　特性（画角等）が異なるレンズで撮影されると、同一の被写体であっても画像に現れる特徴が異なり得る。例えば、画像の歪みが発生し得る画角が広い魚眼レンズで撮影した場合と、画角が４０°～６０°前後のいわゆる標準レンズで撮影した場合とでは、画像に現れる被写体の特徴が異なり得る。

　近年、機械学習で生成された推定モデルを用いて画像の内容を推定することがなされている。十分な推定精度を有する推定モデルを生成するためには大量の学習データが必要となるが、特性が異なるレンズごとに大量の学習データ（各レンズを用いた撮影で生成された画像と、その画像の内容を示すラベルとの組み合わせ）を用意することは多大な労力を要する。本発明は、画像の内容を推定する推定モデルを生成する新たな手法を提供することを課題とする。

　本発明によれば、
　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成するサンプル画像生成手段と、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成する推定手段と、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定するタスク実行手段と、
　前記相対的位置関係の推定結果が正しいか判定する判定手段と、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する修正手段と、
を有する処理システムが提供される。

　また、本発明によれば、
　魚眼レンズを用いた撮影で生成された魚眼レンズ画像と前記魚眼レンズ画像の内容を示すラベルとを含む学習データを用いた転移学習により、前記魚眼レンズ画像を平面展開したパノラマ画像の内容を推定する推定モデルを、前記魚眼レンズ画像の内容を推定する領域に適用させる転移学習手段を有する処理システム。

　また、本発明によれば、
　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成するサンプル画像生成手段と、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成する推定手段と、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定するタスク実行手段と、
　前記相対的位置関係の推定結果が正しいか判定する判定手段と、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する修正手段と、を有する処理システムによりパラメタの値を調整された前記推定モデルを用いて、前記第１のレンズを用いた撮影で生成された推定対象の画像、又は、前記推定対象の画像を平面展開した画像の内容を推定する推定装置が提供される。

　また、本発明によれば、
　コンピュータが、
　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成し、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成し、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定し、
　前記相対的位置関係の推定結果が正しいか判定し、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する処理方法が提供される。

　また、本発明によれば、
　コンピュータを、
　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成するサンプル画像生成手段、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成する推定手段、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定するタスク実行手段、
　前記相対的位置関係の推定結果が正しいか判定する判定手段、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する修正手段、
として機能させるプログラムが提供される。

　本発明によれば、画像の内容を推定する推定モデルを生成する新たな手法が実現される。

　上述した目的、および、その他の目的、特徴および利点は、以下に述べる好適な実施の形態、および、それに付随する以下の図面によって、さらに明らかになる。

本実施形態の処理システムの処理の概念を示す図である。本実施形態の処理システム及び推定装置のハードウエア構成の一例を示す図である。本実施形態の処理システムの機能ブロック図の一例である。本実施形態の処理システムのデータの流れの一例を示す図である。本実施形態の処理システムの処理の流れの一例を示すフローチャートである。本実施形態の処理システムの機能ブロック図の一例である。本実施形態の処理システムの機能ブロック図の一例である。本実施形態の推定装置の構成を説明するための図である。本実施形態の推定装置が推定する画像の一例を示す図である。本実施形態の推定装置が推定する画像の一例を示す図である。

＜第１の実施形態＞
　まず、本実施形態の処理システムの概要を説明する。処理システムは、標準レンズ（例えば画角４０°前後～６０°前後）を用いた撮影で生成された通常画像の内容を精度よく推定できるように調整された推定モデルのパラメタの値を、魚眼レンズ（例えば画角１８０°前後）を用いた撮影で生成された魚眼レンズ画像を平面展開したパノラマ画像と当該推定モデルとを用いた所定のタスクの結果に基づき修正することで、魚眼レンズ画像を平面展開したパノラマ画像の内容を精度よく推定できるように当該推定モデルのパラメタの値を調整する。

　図１に、この処理の概要を示す。まず、通常画像とその通常画像の内容を示すラベルとを含む学習データを用いた機械学習を実行済みであり、通常画像の内容を精度よく推定できるようにパラメタの値が調整された推定モデルが準備される。初期状態において、当該推定モデルは、通常画像が示す物体、場所、場面、状況等を、精度よく推定できる。

　処理システムは、魚眼レンズ画像を平面展開したパノラマ画像から生成された複数のサンプル画像を推定モデルに入力し、推定モデルから出力された各サンプル画像の内容の推定結果（画像内容推定結果）を取得する。上述の通り、初期状態において、推定モデルのパラメタの値は、通常画像の内容を精度よく推定できるように調整されている。図示するサイクルを繰り返すことで、魚眼レンズ画像を平面展開したパノラマ画像の内容を精度よく推定できるようになるが、サイクルの初期段階では、推定モデルから出力された推定結果が「誤り」である可能性が高くなる。

　「推定結果が誤り」とは、画像が示す内容と、推定結果が示す内容とが一致しない状態を示す。一方、「推定結果が正しい」とは、画像が示す内容と、推定結果が示す内容とが一致する状態を示す。

　その後、処理システムは、各サンプル画像の画像内容推定結果をタスクモデルに入力し、タスクモデルから出力されたタスクの結果を取得する。推定モデルから出力された各サンプル画像の画像内容推定結果が「正しい」場合、タスクモデルによるタスクの結果が所定の条件を満たしやすくなる。一方、推定モデルから出力された各サンプル画像の画像内容推定結果が「誤り」である場合、タスクモデルによるタスクの結果が所定の条件を満たし難くなる。

　その後、処理システムは、タスクの結果を判定器に入力し、判定器から出力された判定結果を取得する。判定器は、タスクの結果が所定の条件を満たすか否かを判定する。

　そして、処理システムは、判定器の判定結果が「タスクの結果が所定の条件を満たさない」である場合、その旨を修正器に入力する。修正器は、推定モデルのパラメタの値を修正する（新しいパラメタの値に更新する）。

　処理システムは、判定器による判定結果が所定の終了条件を満たすまで、当該サイクルを繰り返す。

　なお、本明細書において、「取得」とは、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置が他の装置や記憶媒体に格納されているデータを取りに行くこと（能動的な取得）」、たとえば、他の装置にリクエストまたは問い合わせして受信すること、他の装置や記憶媒体にアクセスして読み出すこと等を含んでもよい。また、「取得」とは、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置に他の装置から出力されるデータを入力すること（受動的な取得）」、たとえば、配信（または、送信、プッシュ通知等）されるデータを受信すること等を含んでもよい。また、「取得」とは、受信したデータまたは情報の中から選択して取得すること、及び、「データを編集（テキスト化、データの並び替え、一部データの抽出、ファイル形式の変更等）などして新たなデータを生成し、当該新たなデータを取得すること」を含んでもよい。

　次に、処理システムの構成を詳細に説明する。まず、処理システムのハードウエア構成の一例について説明する。処理システムが備える各機能部は、任意のコンピュータのＣＰＵ（Central Processing Unit）、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット（あらかじめ装置を出荷する段階から格納されているプログラムのほか、ＣＤ（Compact Disc）等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納できる）、ネットワーク接続用インターフェイスを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。

　図２は、処理システムのハードウエア構成を例示するブロック図である。図２に示すように、処理システムは、プロセッサ１Ａ、メモリ２Ａ、入出力インターフェイス３Ａ、周辺回路４Ａ、バス５Ａを有する。周辺回路４Ａには、様々なモジュールが含まれる。処理システムは周辺回路４Ａを有さなくてもよい。なお、処理システムは物理的及び／又は論理的に分かれた複数の装置で構成されてもよいし、物理的及び／又は論理的に一体となった１つの装置で構成されてもよい。処理システムが物理的及び／又は論理的に分かれた複数の装置で構成される場合、複数の装置各々が上記ハードウエア構成を備えることができる。

　バス５Ａは、プロセッサ１Ａ、メモリ２Ａ、周辺回路４Ａ及び入出力インターフェイス３Ａが相互にデータを送受信するためのデータ伝送路である。プロセッサ１Ａは、例えばＣＰＵ、ＧＰＵ（Graphics Processing Unit）などの演算処理装置である。メモリ２Ａは、例えばＲＡＭ（Random Access Memory）やＲＯＭ（Read Only Memory）などのメモリである。入出力インターフェイス３Ａは、入力装置、外部装置、外部サーバ、外部センサー、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。入力装置は、例えばキーボード、マウス、マイク、物理ボタン、タッチパネル等である。出力装置は、例えばディスプレイ、スピーカ、プリンター、メーラ等である。プロセッサ１Ａは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。

　次に、処理システムの機能構成を説明する。図３に、処理システム１０の機能ブロック図の一例を示す。図４に、処理システム１０のデータの流れの一例を示す。図示するように、処理システム１０は、サンプル画像生成部１１と、推定部１２と、記憶部１３と、タスク実行部１４と、判定部１５と、修正部１６と、繰り返し制御部１７とを有する。なお、処理システム１０は記憶部１３を有さなくてもよい。この場合、処理システム１０と通信可能に構成された外部装置が記憶部１３を備える。

　サンプル画像生成部１１は、魚眼レンズ（第１のレンズ）を用いた撮影で生成された学習用の魚眼レンズ画像（第１の画像）から、各々が学習用の魚眼レンズ画像の一部領域に対応した複数のサンプル画像を生成する。魚眼レンズ画像は、いわゆる、全方位画像、全天球画像、全周画像、３６０°画像等である。

　サンプル画像生成部１１は、学習用の魚眼レンズ画像を平面展開した学習用のパノラマ画像内の一部領域を、サンプル画像として抽出する。サンプル画像生成部１１は、学習用の魚眼レンズ画像全体を平面展開した後に、当該平面展開により得られた学習用のパノラマ画像からサンプル画像を切り出してもよい。その他、サンプル画像生成部１１は、学習用の魚眼レンズ画像から一部を切り出し、切り出した一部を平面展開してサンプル画像を生成してもよい。いずれにおいても、学習用の魚眼レンズ画像を平面展開した学習用のパノラマ画像内の一部領域を、サンプル画像として抽出することができる。なお、魚眼レンズ画像を平面展開する手法は広く知られているので、ここでの説明は省略する。

　本実施形態では、サンプル画像生成部１１は、学習用のパノラマ画像内の互いに隣接する複数の一部領域各々をサンプル画像として切り出すことができる。複数のサンプル画像は、隙間なく互いに隣接していることが好ましいが、多少の隙間を挟んで隣接していてもよい。なお、サンプル画像を切り出す位置、大きさ及び数等は、タスク実行部１４が実行するタスクの内容に応じて設計できる。

　サンプル画像生成部１１は、図４に示すように、生成したサンプル画像を推定部１２に渡す。また、サンプル画像生成部１１は、学習用の魚眼レンズ画像（学習用のパノラマ画像）内における複数のサンプル画像の相対的位置関係を示す情報を、判定部１５に渡す。複数のサンプル画像の相対的位置関は、左右に隣接する複数のサンプル画像の左右の並び順や、上下に隣接する複数のサンプル画像の上下の並び順等を示す。本実施形態では、サンプル画像生成部１１は、左右に隣接する３つのサンプル画像を切り出し、この３つのサンプル画像の並び順を示す情報を判定部１５に渡すものとするが、これに限定されない。

　記憶部１３は、推定モデルを記憶する。推定モデルは、例えばＣＮＮ（convolutional neural network）であるが、これに限定されない。推定モデルは、第２のレンズを用いた撮影で生成された第２の画像と、その第２の画像の内容を示すラベルとを含む学習データを用いた機械学習を実行済みであり、第２の画像の内容を精度よく推定できるようにパラメタの値が調整されている。

　第２のレンズの特性は、魚眼レンズの特性と異なる。第２のレンズと魚眼レンズとの間で異なる特性は、画像に現れる被写体の特徴に影響し得るものであり（すなわち、特性が異なれば画像に現れる被写体の特徴も異なり得る）、例えば、画角、焦点距離等が例示される。

　本実施形態では、第１のレンズは魚眼レンズであり、第２のレンズは標準レンズである。すなわち、記憶部１３に記憶されている推定モデルは、標準レンズを用いた撮影で生成された通常画像と、その通常画像の内容を示すラベルとを含む学習データを用いた機械学習を実行済みであり、通常画像の内容を精度よく推定できるようにパラメタの値が調整されている。なお、第２のレンズは、魚眼レンズと異なるレンズであればよく、標準レンズ以外のレンズであってもよい。

　推定部１２は、記憶部１３に記憶されている推定モデルにサンプル画像を入力し、サンプル画像毎に内容を示す画像内容推定結果を生成する。画像内容推定結果は、サンプル画像が示す物体、場所、場面、状況等を示す。なお、上述の通り、初期状態において、推定モデルのパラメタの値は通常画像の内容を精度よく推定できるように調整されている。このため、修正部１６によるパラメタの値の修正がなされる前の状態、また、修正部１６によるパラメタの値の修正が不十分な状態においては、画像内容推定結果が示すサンプル画像の内容は、「誤り」である可能性が高くなる。

　図４に示すように、推定部１２は、生成した複数のサンプル画像各々の画像内容推定結果を、タスク実行部１４に渡す。

　タスク実行部１４は、サンプル画像各々の画像内容推定結果に基づき、所定のタスクを実行する。本実施形態では、タスク実行部１４は、学習用の魚眼レンズ画像（学習用のパノラマ画像）内における複数のサンプル画像の相対的位置関係を推定する。より具体的には、サンプル画像生成部１１が左右に隣接する３つのサンプル画像を切り出す本実施形態の場合、タスク実行部１４はこの３つのサンプル画像の横方向の並び順を推定する。例えば、タスク実行部１４は、複数の画像各々の画像内容推定結果に基づき、複数の画像の相対的位置関係を推定する推定モデルに、サンプル画像各々の画像内容推定結果を入力することで、サンプル画像各々の画像内容推定結果を取得してもよい。

　図４に示すように、タスク実行部１４は、複数のサンプル画像の相対的位置関係の推定結果を判定部１５に渡す。タスク実行部１４が判定部１５に渡す推定結果は複数のサンプル画像の相対的位置関係を示すものであればよく、例えば、複数のサンプル画像の並び順であってもよいし、３つのサンプル画像の中の所定の並び位置（例：３つのサンプル画像の真ん中）にあると推定されたサンプル画像の識別情報であってもよいし、その他であってもよい。

　判定部１５は、サンプル画像生成部１１から取得した複数のサンプル画像の相対的位置関係を示す情報（正解情報）と、タスク実行部１４から取得した複数のサンプル画像の相対的位置関係の推定結果とに基づき、タスク実行部１４による相対的位置関係の推定結果が正しいか判定する。

　繰り返し制御部１７は、複数のサンプル画像の相対的位置関係の推定結果が終了条件を満たすまで、サンプル画像生成部１１、推定部１２、タスク実行部１４、判定部１５及び修正部１６による上述した処理を繰り返し実行させる。

　終了条件は、「複数のサンプル画像の相対的位置関係の推定結果が正しいと判定された」、「複数のサンプル画像の相対的位置関係の推定結果が正しいと判定された累積回数が閾値に達した」、「所定回数連続で、複数のサンプル画像の相対的位置関係の推定結果が正しいと判定された」等であるが、これらに限定されない。

　修正部１６は、複数のサンプル画像の相対的位置関係の推定結果が誤っていると判定された場合、記憶部１３に記憶されている推定モデルのパラメタの値を修正する（パラメタの値を新しい値に更新する）。例えば、修正部１６は、確率的勾配降下法により、推定モデルの複数のレイヤ（層）のウエイトを修正することができる。なお、ここでの例示はあくまで一例であり、その他の手法で推定モデルを更新してもよい。

　次に、図５のフローチャートを用いて、処理システム１０の処理の流れの一例を説明する。なお、各ステップで各機能部が行う処理の詳細は上述したので、ここでの説明は省略する。

　Ｓ１０では、サンプル画像生成部１１は、魚眼レンズを用いた撮影で生成された学習用の魚眼レンズ画像から、各々が学習用の魚眼レンズ画像の一部領域に対応した複数のサンプル画像を生成する。例えば、サンプル画像生成部１１は、学習用の魚眼レンズ画像を平面展開した学習用のパノラマ画像内において互いに隣接した３つの領域を切り出し、３つのサンプル画像とする。

　Ｓ１１では、推定部１２は、記憶部１３に記憶されている推定モデルにサンプル画像を入力することで、サンプル画像毎に内容を示す画像内容推定結果を生成する。

　Ｓ１２では、タスク実行部１４は、サンプル画像各々の画像内容推定結果に基づき、学習用の魚眼レンズ画像（学習用のパノラマ画像）内での複数のサンプル画像の相対的位置関係を推定する。

　Ｓ１３では、判定部１５は、Ｓ１２で生成された複数のサンプル画像の相対的位置関係の推定結果が正しいか判定する。

　誤っている場合（Ｓ１４のＮｏ）、修正部１６は、機械学習の再実行により、記憶部１３に記憶されている推定モデルのパラメタの値を修正する（Ｓ１６）。

　正しい場合（Ｓ１４のＹｅｓ）、及び、Ｓ１６の後に、Ｓ１５に進む。Ｓ１５では、Ｓ１２で生成された複数のサンプル画像の相対的位置関係の推定結果が終了条件を満たすか判定する。終了条件を満たさない場合（Ｓ１５のＮｏ）、Ｓ１０に戻り、処理を繰り返す。終了条件を満たす場合（Ｓ１５のＹｅｓ）、処理を終了する。

　以上説明した本実施形態の処理システム１０によれば、標準レンズを用いた撮影で生成された通常画像の内容を精度よく推定できるように調整された推定モデルのパラメタの値を、魚眼レンズを用いた撮影で生成された魚眼レンズ画像を平面展開したパノラマ画像と当該推定モデルとを用いた所定のタスクの結果に基づき修正することで、魚眼レンズ画像を平面展開したパノラマ画像の内容を精度よく推定できるように当該推定モデルのパラメタの値を調整することができる。

　このような本実施形態の処理システム１０によれば、魚眼レンズ画像を平面展開したパノラマ画像と、そのパノラマ画像の内容を示すラベルとを含む学習データを大量に用意することなしに、魚眼レンズ画像を平面展開したパノラマ画像の内容を精度よく推定できる推定モデルを生成することができる。

　また、本実施形態の処理システム１０によれば、確率的勾配降下法に基づき推定モデルのパラメタの値を修正することで、良好な収束性が得られる。

＜第２の実施形態＞
　本実施形態の処理システム１０は、転移学習用の魚眼レンズ画像と転移学習用の魚眼レンズ画像の内容を示すラベルとを含む学習データを用いた転移学習により、魚眼レンズ画像を平面展開したパノラマ画像の内容を精度よく推定できるようにパラメタの値を調整された推定モデルを、魚眼レンズ画像の内容を推定する領域に適用させる。

　図６に、処理システム１０の機能ブロック図の一例を示す。図示するように、処理システム１０は、サンプル画像生成部１１と、推定部１２と、記憶部１３と、タスク実行部１４と、判定部１５と、修正部１６と、繰り返し制御部１７と、転移学習部１８とを有する。サンプル画像生成部１１、推定部１２、記憶部１３、タスク実行部１４、判定部１５、修正部１６及び繰り返し制御部１７の構成は、第１の実施形態と同様である。

　図７に、処理システム１０の機能ブロック図の他の一例を示す。図示するように、処理システム１０は、転移学習部１８と、記憶部１９とを有する。

　記憶部１３及び記憶部１９には、魚眼レンズ画像を平面展開したパノラマ画像の内容を精度よく推定できるようにパラメタの値を調整された推定モデルが記憶されている。当該推定モデルは、第１の実施形態で説明した手法で生成された推定モデルであってもよい。その他、当該推定モデルは、魚眼レンズ画像を平面展開したパノラマ画像と、そのパノラマ画像の内容を示すラベルとを含む学習データを機械学習することで生成された推定モデルであってもよい。推定モデルは、例えばＣＮＮであるが、これに限定されない。

　転移学習部１８は、転移学習用の魚眼レンズ画像と転移学習用の魚眼レンズ画像の内容を示すラベルとを含む学習データを用いた転移学習により、魚眼レンズ画像を平面展開したパノラマ画像の内容を精度よく推定できるようにパラメタの値を調整された推定モデルを、魚眼レンズ画像の内容を推定する領域に適用させる。転移学習部１８は、あらゆる転移学習の手法を採用することができる。

　処理システム１０のハードウエア構成の一例は、第１の実施形態と同様である。

　以上、本実施形態の処理システム１０によれば、転移学習を利用することで、魚眼レンズ画像とその魚眼レンズ画像の内容を示すラベルとを含む学習データを大量に用意することなしに、魚眼レンズ画像の内容を精度よく推定できる推定モデルを生成することができる。

＜第３の実施形態＞
　本実施形態の推定装置２０は、図８に示すように、第１又は第２の実施形態の処理システム１０が生成した推定モデルに、推定対象の魚眼レンズ画像又は推定対象のパノラマ画像（魚眼レンズ画像を平面展開した画像）を入力することで、推定対象の魚眼レンズ画像又は推定対象のパノラマ画像の内容を推定する。推定装置２０のハードウエア構成の一例は、処理システム１０と同様図２で示される。

　以上、本実施形態の推定装置２０によれば、魚眼レンズ画像を平面展開したパノラマ画像と、そのパノラマ画像の内容を示すラベルとを含む学習データを大量に用意することなしに、魚眼レンズ画像を平面展開したパノラマ画像の内容を精度よく推定できるようになる。推定装置２０は、場面（シーン）の認識や物体の認識等を行うことができる。例えば、推定装置２０は、図９に示すように、画像からカフェなどの場面（シーン）を認識したり、図１０に示すように、画像からバイクや人物等の物体を認識したりできる。

　また、本実施形態の推定装置２０によれば、魚眼レンズ画像とその魚眼レンズ画像の内容を示すラベルとを含む学習データを大量に用意することなしに、魚眼レンズ画像の内容を精度よく推定できるようになる。

＜変形例＞
　ここで、変形例を説明する。第１乃至第３の実施形態では、「第１のレンズが魚眼レンズ」であり、「第２のレンズが標準レンズ」であり、処理システム１０は、「標準レンズを用いた撮影で生成された通常画像の内容を精度よく推定できるように調整された推定モデルのパラメタの値を、魚眼レンズを用いた撮影で生成された魚眼レンズ画像の内容を精度よく推定できるように調整する」例を説明した。

　しかし、これに限定されない。例えば、「第１のレンズは魚眼レンズに分類されない広角レンズ」であり、「第２のレンズは標準レンズ」であり、処理システム１０は、「標準レンズを用いた撮影で生成された通常画像の内容を精度よく推定できるように調整された推定モデルのパラメタの値を、魚眼レンズに分類されない広角レンズを用いた撮影で生成された画像の内容を精度よく推定できるように調整」してもよい。

　その他、「第１のレンズは魚眼レンズ」であり、「第２のレンズは魚眼レンズに分類されない広角レンズ」であり、処理システム１０は、「魚眼レンズに分類されない広角レンズを用いた撮影で生成された画像の内容を精度よく推定できるように調整された推定モデルのパラメタの値を、魚眼レンズを用いた撮影で生成された魚眼レンズ画像の内容を精度よく推定できるように調整」してもよい。

　その他、「第１のレンズは魚眼レンズに分類されない広角レンズ」であり、「第２のレンズは魚眼レンズ」であり、処理システム１０は、「魚眼レンズを用いた撮影で生成された魚眼レンズ画像の内容を精度よく推定できるように調整された推定モデルのパラメタの値を、魚眼レンズに分類されない広角レンズを用いた撮影で生成された画像の内容を精度よく推定できるように調整」してもよい。

　また、第１乃至第３の実施形態で説明した例では、タスク実行部１４は複数のサンプル画像の相対的位置関係を推定するタスクを実行した。しかし、タスク実行部１４が実行するタスクは、推定部１２が生成したサンプル画像の画像内容推定結果が正しい場合にタスクの結果が所定の条件を満たしやすくなり、推定部１２が生成したサンプル画像の画像内容推定結果が正しくない場合にタスクの結果が上記所定の条件を満たし難くなるものであればよく、上記例に限定されない。

　以上、実施形態（及び実施例）を参照して本願発明を説明したが、本願発明は上記実施形態（及び実施例）に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限定されない。
１．　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成するサンプル画像生成手段と、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成する推定手段と、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定するタスク実行手段と、
　前記相対的位置関係の推定結果が正しいか判定する判定手段と、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する修正手段と、
を有する処理システム。
２．　１に記載の処理システムにおいて、
　前記修正手段は確率的勾配降下法に基づき、前記推定モデルのパラメタの値を修正する処理システム。
３．　１又は２に記載の処理システムにおいて、
　前記相対的位置関係の推定結果が終了条件を満たすまで、前記サンプル画像生成手段、前記推定手段、前記タスク実行手段、前記判定手段及び前記修正手段による処理を繰り返し実行させる繰り返し制御手段をさらに有する処理システム。
４．　１から３のいずれかに記載の処理システムにおいて、
　前記第１のレンズは魚眼レンズであり、前記第２のレンズは魚眼レンズと異なるレンズである処理システム。
５．　４に記載の処理システムにおいて、
　前記サンプル画像生成手段は、魚眼レンズを用いた撮影で生成された前記学習用の第１の画像を平面展開した学習用のパノラマ画像内の一部領域を、前記サンプル画像として抽出する処理システム。
６．　５に記載の処理システムにおいて、
　魚眼レンズを用いた撮影で生成された転移学習用の魚眼レンズ画像と前記転移学習用の魚眼レンズ画像の内容を示すラベルとを含む学習データを用いた転移学習により、前記パノラマ画像の内容を推定する前記推定モデルを、前記魚眼レンズ画像の内容を推定する領域に適用させる転移学習手段を有する処理システム。
７．　魚眼レンズを用いた撮影で生成された魚眼レンズ画像と前記魚眼レンズ画像の内容を示すラベルとを含む学習データを用いた転移学習により、前記魚眼レンズ画像を平面展開したパノラマ画像の内容を推定する推定モデルを、前記魚眼レンズ画像の内容を推定する領域に適用させる転移学習手段を有する処理システム。
８．　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成するサンプル画像生成手段と、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成する推定手段と、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定するタスク実行手段と、
　前記相対的位置関係の推定結果が正しいか判定する判定手段と、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する修正手段と、を有する処理システムによりパラメタの値を調整された前記推定モデルを用いて、前記第１のレンズを用いた撮影で生成された推定対象の画像、又は、前記推定対象の画像を平面展開した画像の内容を推定する推定装置。
９．　コンピュータが、
　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成し、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成し、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定し、
　前記相対的位置関係の推定結果が正しいか判定し、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する処理方法。
１０．　コンピュータを、
　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成するサンプル画像生成手段、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成する推定手段、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定するタスク実行手段、
　前記相対的位置関係の推定結果が正しいか判定する判定手段、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する修正手段、
として機能させるプログラム。

Claims

　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成するサンプル画像生成手段と、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成する推定手段と、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定するタスク実行手段と、
　前記相対的位置関係の推定結果が正しいか判定する判定手段と、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する修正手段と、
を有する処理システム。
　請求項１に記載の処理システムにおいて、
　前記修正手段は確率的勾配降下法に基づき、前記推定モデルのパラメタの値を修正する処理システム。
　請求項１又は２に記載の処理システムにおいて、
　前記相対的位置関係の推定結果が終了条件を満たすまで、前記サンプル画像生成手段、前記推定手段、前記タスク実行手段、前記判定手段及び前記修正手段による処理を繰り返し実行させる繰り返し制御手段をさらに有する処理システム。
　請求項１から３のいずれか１項に記載の処理システムにおいて、
　前記第１のレンズは魚眼レンズであり、前記第２のレンズは魚眼レンズと異なるレンズである処理システム。
　請求項４に記載の処理システムにおいて、
　前記サンプル画像生成手段は、魚眼レンズを用いた撮影で生成された前記学習用の第１の画像を平面展開した学習用のパノラマ画像内の一部領域を、前記サンプル画像として抽出する処理システム。
　請求項５に記載の処理システムにおいて、
　魚眼レンズを用いた撮影で生成された転移学習用の魚眼レンズ画像と前記転移学習用の魚眼レンズ画像の内容を示すラベルとを含む学習データを用いた転移学習により、前記パノラマ画像の内容を推定する前記推定モデルを、前記魚眼レンズ画像の内容を推定する領域に適用させる転移学習手段を有する処理システム。
　魚眼レンズを用いた撮影で生成された魚眼レンズ画像と前記魚眼レンズ画像の内容を示すラベルとを含む学習データを用いた転移学習により、前記魚眼レンズ画像を平面展開したパノラマ画像の内容を推定する推定モデルを、前記魚眼レンズ画像の内容を推定する領域に適用させる転移学習手段を有する処理システム。
　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成するサンプル画像生成手段と、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成する推定手段と、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定するタスク実行手段と、
　前記相対的位置関係の推定結果が正しいか判定する判定手段と、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する修正手段と、を有する処理システムによりパラメタの値を調整された前記推定モデルを用いて、前記第１のレンズを用いた撮影で生成された推定対象の画像、又は、前記推定対象の画像を平面展開した画像の内容を推定する推定装置。
　コンピュータが、
　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成し、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成し、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定し、
　前記相対的位置関係の推定結果が正しいか判定し、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する処理方法。
　コンピュータを、
　第１のレンズを用いた撮影で生成された学習用の第１の画像から、各々が前記学習用の第１の画像の一部領域に対応した複数のサンプル画像を生成するサンプル画像生成手段、
　特性が前記第１のレンズと異なる第２のレンズを用いた撮影で生成された第２の画像と、前記第２の画像の内容を示すラベルとを含む学習データを用いた機械学習で生成された推定モデルに前記サンプル画像を入力し、前記サンプル画像毎に内容を示す画像内容推定結果を生成する推定手段、
　前記サンプル画像各々の前記画像内容推定結果に基づき、前記学習用の第１の画像内での複数の前記サンプル画像の相対的位置関係を推定するタスク実行手段、
　前記相対的位置関係の推定結果が正しいか判定する判定手段、
　前記相対的位置関係の推定結果が誤っていると判定された場合、前記推定モデルのパラメタの値を修正する修正手段、
として機能させるプログラム。