JP7068745B2

JP7068745B2 - 学習済モデル提案システム、学習済モデル提案方法、およびプログラム

Info

Publication number: JP7068745B2
Application number: JP2020521646A
Authority: JP
Inventors: 俊二菅谷
Original assignee: Optim Corp
Current assignee: Optim Corp
Priority date: 2018-05-28
Filing date: 2018-05-28
Publication date: 2022-05-17
Anticipated expiration: 2038-05-28
Also published as: JPWO2019229789A1; WO2019229789A1

Description

本発明は、画像の解析の目的と画像が撮影される環境とを取得して利用することで、それに似た既存の学習済モデルを提案することが可能な学習済モデル提案システム、学習済モデル提案方法、およびプログラムに関する。

人物画像に対して画像解析処理を行うことで、誰が写っているかを判別し、自動的に人物画像をカテゴライズする仕組みを提供する方法が提案されている（特許文献１）。

また、人工知能が画像解析を行うための機械学習の手法として、教師あり学習（ＳｕｐｅｒｖｉｓｅｄＬｅａｒｎｉｎｇ）はよく知られる手法であり、目的にあわせた学習済モデルの生成方法も提案されている（特許文献２）。

特開２０１５－６９５８０特許６２１６０２４

しかしながら、画像解析のために教師あり学習を行う場合、一般的に数万枚～数百万枚以上の大量の画像を用意して、画像に対して正しい教師データを付加してから、画像を分類するための分類器やニューラルネットワーク等に学習させて学習済モデルを作成する必要がある。複数のカメラについて、それぞれ最適な学習済モデルを作成するためには、学習のための画像を準備する手間がかかるとともに、学習のための時間も長期間必要となるという点が問題となる。

この課題に対して、本発明者は、画像の解析の目的と画像が撮影される環境とが適合するのであれば、既存の学習済モデルを利用し、学習時間をかけずに、精度の良い画像解析結果を得ることができるのではないかという点に着目した。

本発明は、画像の解析の目的と画像が撮影される環境とを取得して利用することで、それに似た既存の学習済モデルを提案し、学習時間をかけずに、精度の良い画像解析結果を得ることが可能な学習済モデル提案システム、学習済モデル提案方法、およびプログラムを提供することを目的とする。

本発明では、以下のような解決手段を提供する。

第１の特徴に係る発明は、
画像解析に適切な学習済モデルを提案する学習済モデル提案システムであって、
画像解析を行うための学習済モデルを目的と環境に対応付けて記憶する学習済モデルデータベースと、
画像解析の目的を取得する目的取得手段と、
当該目的のための画像が撮影される環境を取得する環境取得手段と、
前記学習済モデルデータベースを参照して、前記目的と前記環境に適合した学習済モデルを提案し、当該目的と当該環境とに適合した学習済モデルがない場合、当該目的が合致し、当該環境が近い学習済モデルを提案又は参考として出力する学習済モデル提案手段と、
を備えることを特徴とする学習済モデル提案システムを提供する。

第１の特徴に係る発明によれば、画像解析に適切な学習済モデルを提案する学習済モデル提案システムは、画像解析を行うための学習済モデルを目的と環境に対応付けて記憶する学習済モデルデータベースと、画像解析の目的を取得する目的取得手段と、当該目的のための画像が撮影される環境を取得する環境取得手段と、前記学習済モデルデータベースを参照して、前記目的と前記環境に適合した学習済モデルを提案し、当該目的と当該環境とに適合した学習済モデルがない場合、当該目的が合致し、当該環境が近い学習済モデルを提案又は参考として出力する学習済モデル提案手段と、を備える。

第１の特徴に係る発明は、学習済モデル提案システムのカテゴリであるが、学習済モデル提案方法、およびプログラムであっても同様の作用、効果を奏する。

第２の特徴に係る発明は、第１の特徴に係る発明である学習済モデル提案システムであって、
前記学習済モデルは、過去の画像と正解データとからなる所定の学習データで学習した学習済みの分類器を含み、
前記学習済モデル提案手段は、前記学習済みの分類器を学習済モデルとして提案することを特徴とする学習済モデル提案システムを提供する。

第２の特徴に係る発明によれば、第１の特徴に係る発明である学習済モデル提案システムにおいて、前記学習済モデルは、過去の画像と正解データとからなる所定の学習データで学習した学習済みの分類器を含み、前記学習済モデル提案手段は、前記学習済みの分類器を学習済モデルとして提案する。

第３の特徴に係る発明は、第２の特徴に係る発明である学習済モデル提案システムであって、
前記学習済モデルは、画像を分類器で分類する場合の分類器の種類と、画像を特徴ベクトルへ変換する変換方法と、からなることを特徴とする学習済モデル提案システムを提供する。

第３の特徴に係る発明によれば、第２の特徴に係る発明である学習済モデル提案システムにおいて、前記学習済モデルは、画像を分類器で分類する場合の分類器の種類と、画像を特徴ベクトルへ変換する変換方法と、からなる。

第４の特徴に係る発明は、第１の特徴に係る発明である学習済モデル提案システムであって、
前記学習済モデルが、過去の画像と正解データとからなる所定の学習データで学習した学習済みの畳み込みニューラルネットワークであることを特徴とする学習済モデル提案システムを提供する。

第４の特徴に係る発明によれば、第１の特徴に係る発明である学習済モデル提案システムにおいて、前記学習済モデルが、過去の画像と正解データとからなる所定の学習データで学習した学習済みの畳み込みニューラルネットワークである。

第５の特徴に係る発明は、第２の特徴から第４の特徴のいずれかに係る発明である学習済モデル提案システムであって、
前記画像解析を行いたい環境の画像を取得する画像取得手段と、
取得した前記画像と、前記所定の学習データの画像とが類似か否かを決定する画像比較手段と、を備え、
前記画像が類似している場合に、前記学習済モデル提案手段が、前記学習済モデルを提案することを特徴とする学習済モデル提案システムを提供する。

第５の特徴に係る発明によれば、第２の特徴から第４の特徴のいずれかに係る発明である学習済モデル提案システムにおいて、前記画像解析を行いたい環境の画像を取得する画像取得手段と、取得した前記画像と、前記所定の学習データの画像とが類似か否かを決定する画像比較手段と、を備え、前記画像が類似している場合に、前記学習済モデル提案手段が、前記学習済モデルを提案する。

第６の特徴に係る発明は、第１の特徴から第５の特徴のいずれかに係る発明である学習済モデル提案システムであって、
前記環境取得手段は、提示した質問に対して入力された回答を環境に関するデータとして取得することを特徴とする学習済モデル提案システムを提供する。

第６の特徴に係る発明によれば、第１の特徴から第５の特徴のいずれかに係る発明である学習済モデル提案システムにおいて、前記環境取得手段は、提示した質問に対して入力された回答を環境に関するデータとして取得する。

第７の特徴に係る発明は、第１の特徴から第５の特徴のいずれかに係る発明である学習済モデル提案システムであって、
前記環境取得手段は、センサ又はカメラで検知したデータを取得することを特徴とする学習済モデル提案システムを提供する。

第７の特徴に係る発明によれば、第１の特徴から第５の特徴のいずれかに係る発明である学習済モデル提案システムにおいて、前記環境取得手段は、センサ又はカメラで検知したデータを取得する。

第８の特徴に係る発明は、
画像解析に適切な学習済モデルを提案する学習済モデル提案システムが実行する学習済モデル提案方法であって、
画像解析を行うための学習済モデルを目的と環境に対応付けて記憶する学習済モデルデータベースと、
画像解析の目的を取得するステップと、
当該目的のための画像が撮影される環境を取得するステップと、
前記学習済モデルデータベースを参照して、前記目的と前記環境に適合した学習済モデルを提案し、当該目的と当該環境とに適合した学習済モデルがない場合、当該目的が合致し、当該環境が近い学習済モデルを提案又は参考として出力するステップと、
を備える学習済モデル提案方法を提供する。

第９の特徴に係る発明は、
画像解析を行うための学習済モデルを目的と環境に対応付けて記憶する学習済モデルデータベースを備える学習済モデル提案システムに、
画像解析の目的を取得するステップ、
当該目的のための画像が撮影される環境を取得するステップ、
前記学習済モデルデータベースを参照して、前記目的と前記環境に適合した学習済モデルを提案し、当該目的と当該環境とに適合した学習済モデルがない場合、当該目的が合致し、当該環境が近い学習済モデルを提案又は参考として出力するステップ、
を実行させるためのプログラムを提供する。

本発明によれば、画像の解析の目的と画像が撮影される環境とを取得して利用することで、それに似た既存の学習済モデルを提案し、学習時間をかけずに、精度の良い画像解析結果を得ることが可能な学習済モデル提案システム、学習済モデル提案方法、およびプログラムを提供することが可能となる。

図１は、本発明の好適な実施形態の概要図である。図２は、カメラ１００とコンピュータ２００の機能ブロックと各機能の関係を示す図である。図３は、学習済モデル提案処理のフローチャート図である。図４は、画像比較を行う場合の、カメラ１００とコンピュータ２００の機能ブロックと各機能の関係を示す図である。図５は、画像比較を行う場合の、学習済モデル提案処理のフローチャート図である。図６は、画像解析の目的と画像の撮影環境を取得するための、質問提示と入力の画面の一例である。図７は、画像解析の目的と画像の撮影環境を取得するための、質問提示と入力の画面の別の一例である。図８は、学習済モデル提案の画面の一例である。図９は、学習済モデルデータベースの構成の一例である。

以下、本発明を実施するための最良の形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。

［学習済モデル提案システムの概要］
図１は、本発明の好適な実施形態の概要図である。この図１に基づいて、本発明の概要を説明する。学習済モデル提案システムは、カメラ１００、コンピュータ２００、通信網３００から構成される。

なお、図１において、カメラ１００の数は１つに限らず複数であってもよい。また、コンピュータ２００は、実在する装置に限らず、仮想的な装置であってもよい。

カメラ１００は、図２に示すように、撮像部１０、制御部１１０、通信部１２０、記憶部１３０から構成される。また、コンピュータ２００は、同じく図２に示すように、制御部２１０、通信部２２０、記憶部２３０、入出力部２４０から構成される。記憶部２３０には、学習済モデルデータベース２３を備える。制御部２１０は通信部２２０、記憶部２３０、入出力部２４０と協働して目的取得モジュール２１１、環境取得モジュール２１２を実現する。また、入出力部２４０は、制御部２１０、記憶部２３０と協働して、学習済モデル提案モジュール２４１を実現する。通信網３００は、インターネット等の公衆通信網でも専用通信網でもよく、カメラ１００とコンピュータ２００間の通信を可能とする。

カメラ１００は、コンピュータ２００とデータ通信可能な、撮像素子やレンズ等の撮像デバイスを備える撮像装置であり、画像解析を行いたい画像を撮影する。ここでは、例としてＷＥＢカメラを図示しているが、デジタルカメラ、デジタルビデオ、ドローンに搭載したカメラ、ウェアラブルデバイスのカメラ、防犯カメラ、車載カメラ、３６０度カメラ等の必要な機能を備える撮像装置であってよい。また、記憶部１３０に撮像画像を保存可能としても良い。また、カメラ１００はステレオカメラであってもよく、その場合には被写体群との距離を測定することが可能となる。また、カメラ１００は光度センサを備えてもよく、その場合には周囲の光度を測定することが可能となる。

コンピュータ２００は、カメラ１００とデータ通信可能な計算装置である。ここでは、例としてデスクトップ型のコンピュータを図示しているが、携帯電話、携帯情報端末、タブレット端末、パーソナルコンピュータに加え、ネットブック端末、スレート端末、電子書籍端末、携帯型音楽プレーヤ等の電化製品や、スマートグラス、ヘッドマウントディスプレイ等のウェアラブル端末等であってよい。

図１の学習済モデル提案システムにおいて、まず、コンピュータ２００の学習済モデルデータベース２３に、複数の学習済モデルを記憶する（ステップＳ０１）。学習済モデルは、他のコンピュータや記憶媒体から取得しても良いし、コンピュータ２００で作成しても良い。また、このステップＳ０１は、既に学習済モデルデータベース２３に十分な学習済モデルが記憶されている場合には、省略可能である。

図９は、学習済モデルデータベースの構成の一例である。本発明において、学習済モデルとは、過去の画像と正解データとからなる所定の学習データ（教師データ）と、その所定の学習データで学習した学習済みの分類器や学習済みの畳み込みニューラルネットワーク（ＣｏｎｖｏｌｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ：ＣＮＮ）等の機械学習の手法とを含むものとする。画像を特徴ベクトルへと変換するための変換方法が存在する場合には、その変換方法も機械学習の手法とあわせて、学習済モデルに含めるものとする。また、学習済モデルデータベース２３には、それぞれの学習済モデルについて、画像解析の目的と、画像を撮影した環境とを関連付けて保存するものとする。ここで、画像解析の目的としては、例えば、不審者の進入を検知すること（不審者検知）、農作物の収穫時期を適切に検知すること（収穫物検知）、害虫の発生を検知すること（害虫検知）等が、考えられる。また、画像が撮影される環境については、場所、広さ、カメラ位置、照明、等が条件として考えられる。例えば、場所については、屋内か、屋外（街）か、屋外（農場）か、広さについては、何平方メートルか何ｈａか、カメラ位置については、天井隅か、天井中央か、机・棚の上か、建物外部か、電柱か、ドローンか、照明については、蛍光灯か、ＬＥＤか、自然光か、なしか、ありか、等が選択肢として考えられる。これらの画像解析の目的と、画像を撮影した環境の情報を利用することで、目的と環境が同じ学習済モデルを提案することが可能となる。

図１に戻り、コンピュータ２００の目的取得モジュール２１１は、何のために画像解析を行いたいのかという目的を取得する（ステップＳ０２）。ここで、目的取得の方法として、図１に図示しているようにカメラ１００から目的を送信させてそれを取得してもよいし、コンピュータ２００の入出力部２４０を利用してユーザに入力させることで取得してもよいし、別の端末等（非図示）を介してユーザに入力させることで取得してもよい。

次に、コンピュータ２００の環境取得モジュール２１２は、画像解析を行いたい画像を撮影する環境を取得する（ステップＳ０３）。ここで、環境取得の方法として、図１に図示しているようにカメラ１００から環境を送信させてそれを取得してもよいし、コンピュータ２００の入出力部２４０を利用してユーザに入力させることで取得してもよいし、別の端末等（非図示）を介してユーザに入力させることで取得してもよい。

図６は、画像解析の目的と画像の撮影環境を取得するための、質問提示と入力の画面の一例である。この画面は、コンピュータ２００の入出力部２４０に表示してもよいし、ユーザの使用する別の端末（非図示）の入出力部に表示してもよい。ユーザに対して、画像解析の目的と、画像の撮影環境についての設問を表示し、ユーザに選択又は入力させることで、目的と環境を特定する。図６の例では、画像解析の目的として、不審者検知、収穫物検知、害虫検知を提示して、不審者検知が選択された例を示している。また、画像の撮影環境として、場所については、屋内、屋外（街）、屋外（農場）を提示して、屋内が選択された例を、広さについては、２０平方メートルと入力された例を、カメラ位置については、天井隅、天井中央、机・棚の上を提示して、天井中央が選択された例を、照明については、蛍光灯、ＬＥＤ、自然光を提示して、ＬＥＤが選択された例を示している。ここで、検索ボタン６０１を選択することで、質問に対する入力を確定とし、目的取得モジュール２１１と環境取得モジュール２１２が、取得を完了するものとする。ここでは、画像解析の目的と画像の撮影環境とについての質問提示を一画面で行う場合の例を示したが、それぞれ別の画面としてもよい。

また、図７は、画像解析の目的と画像の撮影環境を取得するための、質問提示と入力の画面の別の一例である。図７の例では、画像解析の目的として、不審者検知、収穫物検知、害虫検知を提示して、収穫物検知が選択された例を示している。また、画像の撮影環境として、場所については、屋内、屋外（街）、屋外（農場）を提示して、屋外（農場）が選択された例を、広さについては、５ｈａと入力された例を、カメラ位置については、建物外部、電柱、ドローンを提示して、電柱が選択された例を、照明については、なし、ありを提示して、なしが選択された例を示している。図７では、図６の例と、画像解析の目的が異なるため、画像の撮影環境として提示する選択肢を変更して表示した例を示している。このように、画像解析の目的や、場所等、選択済みの項目に合わせて、撮影環境の選択肢を変化させることで、ユーザが目的や場所にあわせた入力をより容易に行うことが可能となる。

図１に戻り、最後にコンピュータ２００の学習済モデル提案モジュール２４１は、学習済モデルデータベース２３を参照し、ステップＳ０２で取得した目的と、ステップＳ０３で取得した環境が、どの学習済モデルの目的および環境と適合するかを調べ、適切な学習済モデルを提案する（ステップＳ０４）。ここでの学習済モデルの提案は、コンピュータ２００の入出力部２４０に出力してもよいし、ユーザが使用する別の端末等（非図示）の入出力部に出力してもよい。

図８は、学習済モデル提案の画面の一例である。この画面は、コンピュータ２００の入出力部２４０に表示してもよいし、ユーザの使用する別の端末（非図示）の入出力部に表示してもよい。図６の例の検索結果として、目的が不審者検知、環境が屋内、広さ約２０平方メートル、カメラ位置天井中央、照明ＬＥＤという条件で検索を行った場合に、図９の学習済モデルデータベース２３を検索すると、学習済モデル「Ｂｕｎｒｕｉｋｉ００２」が適合する。そこでここでは、「Ｂｕｎｒｕｉｋｉ００２」を学習済モデルとして提案するという例を示している。提案画面で、図８のリンク８０１に示すように、ダウンロードＵＲＬを表示して、それをユーザが選択することで、提案した学習済モデルをすぐにダウンロード可能としてもよい。また、終了ボタン８０２を選択することで、学習済モデル提案システムを終了してよい。また、検索画面へボタン８０３を選択することで、図６や図７に示した画像解析の目的と画像の撮影環境を取得するための、質問提示と入力の画面に戻ってよい。また、適合する学習済モデルが見つからない場合には、目的が合致し、環境が近い学習済モデルを、提案又は参考として出力してもよい。ユーザは、これらの学習済モデルを利用することで、学習時間をかけずに、目的にあわせた精度の良い画像解析結果を得ることが可能となる。

［各機能の説明］
図２は、カメラ１００とコンピュータ２００の機能ブロックと各機能の関係を示す図である。カメラ１００は、撮像部１０、制御部１１０、通信部１２０、記憶部１３０から構成される。また、コンピュータ２００は、制御部２１０、通信部２２０、記憶部２３０、入出力部２４０、から構成される。制御部２１０は通信部２２０、記憶部２３０、入出力部２４０と協働して目的取得モジュール２１１、環境取得モジュール２１２を実現する。また、入出力部２４０は、制御部２１０、記憶部２３０と協働して、学習済モデル提案モジュール２４１を実現する。通信網３００は、インターネット等の公衆通信網でも専用通信網でもよく、カメラ１００とコンピュータ２００間の通信を可能とする。

カメラ１００は、撮像部１０として、レンズ、撮像素子、各種ボタン、フラッシュ等の撮像デバイス等を備え、動画や静止画等の撮像画像として撮像する。また、撮像して得られる画像は、画像解析に必要なだけの情報量を持った精密な画像であるものする。

制御部１１０として、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）等を備える。

通信部１２０として、他の機器と通信可能にするためのデバイス、例えば、ＩＥＥＥ８０２．１１に準拠したＷｉＦｉ（ＷｉｒｅｌｅｓｓＦｉｄｅｌｉｔｙ）対応デバイス又は第３世代、第４世代移動通信システム等のＩＭＴ－２０００規格に準拠した無線デバイス等を備える。有線によるＬＡＮ接続であってもよい。

記憶部１３０として、ハードディスクや半導体メモリによる、データのストレージ部を備え、撮像画像等の必要なデータ等を記憶する。画像解析の目的やと画像の撮影環境等も、あわせて記憶してもよい。

制御部２１０として、ＣＰＵ、ＲＡＭ、ＲＯＭ等を備える。制御部２１０は通信部２２０、記憶部２３０、入出力部２４０と協働して目的取得モジュール２１１、環境取得も寿ユール２１２を実現する。

通信部２２０として、他の機器と通信可能にするためのデバイス、例えば、ＩＥＥＥ８０２．１１に準拠したＷｉＦｉ対応デバイス又は第３世代、第４世代移動通信システム等のＩＭＴ－２０００規格に準拠した無線デバイス等を備える。有線によるＬＡＮ接続であってもよい。また、この通信部２２０を介して、必要に応じてユーザの使用する別の端末（非図示）との通信を行うものとする。

記憶部２３０として、ハードディスクや半導体メモリによる、データのストレージ部を備え、撮像画像や、教師データ、画像解析結果、等の処理に必要なデータ等を記憶する。また、記憶部２３０に、学習済モデルデータベース２３を備える。

入出力部２４０は、学習済モデル提案システムを利用するために必要な機能を備えるものとする。入出力部２４０は、制御部２１０、記憶部２３０と協働して、学習済モデル提案モジュール２４１を実現する。入力を実現するための例として、タッチパネル機能を実現する液晶ディスプレイ、キーボード、マウス、ペンタブレット、装置上のハードウェアボタン、音声認識を行うためのマイク等を備えることが可能である。また、出力を実現するための例として、液晶ディスプレイ、ＰＣのディスプレイ、プロジェクターへの投影等の表示と音声出力等の形態が考えられる。入出力方法により、本発明は特に機能を限定されるものではない。

［学習済モデル提案処理］
図３は、学習済モデル提案処理のフローチャート図である。上述した各モジュールが実行する処理について、本処理にあわせて説明する。

まず、コンピュータ２００の学習済モデルデータベース２３に、複数の学習済モデルを記憶する（ステップＳ３０１）。学習済モデルは、他のコンピュータや記憶媒体から取得しても良いし、コンピュータ２００で作成しても良い。また、このステップＳ３０１は、既に学習済モデルデータベース２３に十分な学習済モデルが記憶されている場合には、省略可能である。

図９は、学習済モデルデータベースの構成の一例である。本発明において、学習済モデルとは、過去の画像と正解データとからなる所定の学習データ（教師データ）と、その所定の学習データで学習した学習済みの分類器や学習済みの畳み込みニューラルネットワーク等の機械学習の手法とを含むものとする。画像を特徴ベクトルへと変換するための変換方法が存在する場合には、その変換方法も機械学習の手法とあわせて、学習済モデルに含めるものとする。また、学習済モデルデータベース２３には、それぞれの学習済モデルについて、画像解析の目的と、画像を撮影した環境とを関連付けて保存するものとする。ここで、画像解析の目的としては、例えば、不審者の進入を検知すること（不審者検知）、農作物の収穫時期を適切に検知すること（収穫物検知）、害虫の発生を検知すること（害虫検知）等が、考えられる。また、画像が撮影される環境については、場所、広さ、カメラ位置、照明、等が条件として考えられる。例えば、場所については、屋内か、屋外（街）か、屋外（農場）か、広さについては、何平方メートルか何ｈａか、カメラ位置については、天井隅か、天井中央か、机・棚の上か、建物外部か、電柱か、ドローンか、照明については、蛍光灯か、ＬＥＤか、自然光か、なしか、ありか、等が選択肢として考えられる。これらの画像解析の目的と、画像を撮影した環境の情報を利用することで、目的と環境が同じ学習済モデルを提案することが可能となる。

コンピュータ２００で学習済モデルを作成する場合、過去の画像と正解データとからなる所定の学習データ（教師データ）を使用して、機械学習を行う。ここで用いる機械学習の手法は、画像解析に適したものであることが望ましい。機械学習の手法としては、畳み込みニューラルネットワーク（ＣＮＮ）、パーセプトロン、再起型ニューラルネットワーク（ＲＮＮ）、残差ネットワーク（ＲｅｓＮｅｔ）等のニューラルネットワークや、サポートベクターマシン（ＳＶＮ）、単純ベイズ分類器等が挙げられる。また、画像を特徴ベクトルへと変換するための変換方法としては、例えば、ＢｕｇｏｆＶｉｓｕａｌＷｏｒｄｓ、ＨＯＧ（ＨｉｓｔｇｒａｍｏｆＯｒｉｅｎｔｅｄＧｒａｄｉｅｎｔｓ）、ＯＲＢ、ＳＵＲＦ等が挙げられる。また、学習済モデルを学習済モデルデータベース２３に記憶させる際には、過去の画像と正解データとからなる所定の学習データと、その所定の学習データで学習した学習済みの分類器や学習済みの畳み込みニューラルネットワーク等の機械学習の手法とを含むものとする。画像を特徴ベクトルへと変換するための変換方法が存在する場合には、その変換方法も機械学習の手法とあわせて、学習済モデルに含めるものとする。ある学習データに対して複数の機械学習の手法を試し、もっとも画像解析の結果の良い手法のみを学習済モデルデータベース２３に記憶させるものとしてもよい。また、コンピュータ２００で学習済モデルを作成する場合には、学習のための時間が必要となるため、学習済モデル提案システムの稼働前等、十分学習のために時間とＣＰＵをかけられるときに行うことが望ましい。

図３に戻り、コンピュータ２００の目的取得モジュール２１１は、何のために画像解析を行いたいのかという目的を取得するために、目的送信要求を送信する（ステップＳ３０２）。図３では、目的取得の方法として、カメラ１００から目的を送信させてそれを取得する場合を図示している。目的送信要求を送信する先は、別の端末等（非図示）でもよい。また、目的送信要求を送信する代わりに、コンピュータ２００の入出力部２４０に質問を提示してもよい。

カメラ１００は、コンピュータ２００からの目的送信要求を受け、通信部１２０を介して目的を送信する（ステップＳ３０３）。目的送信要求を送信する先を別の端末等（非図示）とした場合には、別の端末（非図示）が目的をコンピュータ２００に送信する。また、目的送信要求を送信する代わりに、コンピュータ２００の入出力部２４０に質問を提示した場合には、ユーザが質問に対する入力を確定したタイミングが、目的送信に相当する。

コンピュータ２００の目的取得モジュール２１１は、目的を取得する（ステップＳ３０４）。取得先は、ステップＳ３０２の目的送信要求先にあわせて、カメラ１００でもよいし、別の端末等（非図示）でもよいし、コンピュータ２００の入出力部２４０でもよい。

次に、コンピュータ２００の環境取得モジュール２１２は、画像解析を行いたい画像を撮影する環境を取得するために、環境送信要求を送信する（ステップＳ３０５）。図３では、環境取得の方法として、カメラ１００から環境を送信させてそれを取得する場合を図示している。目的送信要求を送信する先は、別の端末等（非図示）でもよい。また、環境送信要求を送信する代わりに、コンピュータ２００の入出力部２４０に質問を提示してもよい。

カメラ１００は、コンピュータ２００からの環境送信要求を受け、通信部１２０を介して環境を送信する（ステップＳ３０６）。ここで、カメラ１００がステレオカメラである場合には、被写体までの距離を解析することで広さ等を割り出し、環境として送信してもよい。また、カメラ１００に光度センサ等の特別なセンサを備える場合には、センサの値から場所や照明等を割り出し、環境として送信してもよい。環境送信要求を送信する先を別の端末等（非図示）とした場合には、別の端末（非図示）が環境をコンピュータ２００に送信する。また、環境送信要求を送信する代わりに、コンピュータ２００の入出力部２４０に質問を提示した場合には、ユーザが質問に対する入力を確定したタイミングが、環境送信に相当する。

次に、コンピュータ２００の環境取得モジュール２１２は、環境を取得する（ステップＳ３０７）。取得先は、ステップＳ３０５の環境送信要求先にあわせて、カメラ１００でもよいし、別の端末等（非図示）でもよいし、コンピュータ２００の入出力部２４０でもよい。

ここで環境取得モジュール２１２が取得する環境は、場所、広さ、カメラ位置、照明、等を直接取得してもよいし、例えば、カメラに光度センサを備える場合には、それを利用して場所が室内か屋外かを判断してもよいし、カメラがステレオカメラである場合には、それを利用して被写体までの距離や広さを判断してもよい。

図６は、画像解析の目的と画像の撮影環境を取得するための、質問提示と入力の画面の一例である。この画面は、コンピュータ２００の入出力部２４０に表示してもよいし、ユーザの使用する別の端末（非図示）の入出力部に表示してもよい。ユーザに対して、画像解析の目的と、画像の撮影環境についての設問を表示し、ユーザに選択又は入力させることで、目的と環境を特定する。図６の例では、画像解析の目的として、不審者検知、収穫物検知、害虫検知を提示して、不審者検知が選択された例を示している。また、画像の撮影環境として、場所については、屋内、屋外（街）、屋外（農場）を提示して、屋内が選択された例を、広さについては、２０平方メートルと入力した例を、カメラ位置については、天井隅、天井中央、机・棚の上を提示して、天井中央が選択された例を、照明については、蛍光灯、ＬＥＤ、自然光を提示して、ＬＥＤが選択された例を示している。ここで、検索ボタン６０１を選択することで、質問に対する入力を確定とし、目的取得モジュール２１１と環境取得モジュール２１２が、取得を完了するものとする。ここでは、画像解析の目的と画像の撮影環境とについての質問提示を一画面で行う場合の例を示したが、それぞれ別の画面としてもよい。

また、図７は、画像解析の目的と画像の撮影環境を取得するための、質問提示と入力の画面の別の一例である。図７の例では、画像解析の目的として、不審者検知、収穫物検知、害虫検知を提示して、収穫物検知が選択された例を示している。また、画像の撮影環境として、場所については、屋内、屋外（街）、屋外（農場）を提示して、屋外（農場）が選択された例を、広さについては、５ｈａと入力した例を、カメラ位置については、建物外部、電柱、ドローンを提示して、電柱が選択された例を、照明については、なし、ありを提示して、なしが選択された例を示している。図７では、図６の例と、画像解析の目的が異なるため、画像の撮影環境として提示する選択肢を変更した例を示している。このように、画像解析の目的や、場所等、選択済みの項目に合わせて、撮影環境の選択肢を変化させることで、より目的や場所にあわせた入力を容易に行うことが可能となる。

図３に戻り、最後にコンピュータ２００の学習済モデル提案モジュール２４１は、学習済モデルデータベース２３を参照し、ステップＳ３０４で取得した目的と、ステップＳ３０７で取得した環境が、どの学習済モデルの目的および環境と適合するかを検索して、適切な学習済モデルを提案する（ステップＳ３０８）。ここでの学習済モデルの提案は、コンピュータ２００の入出力部２４０に出力してもよいし、ユーザが使用する別の端末等（非図示）の入出力部に出力してもよい。

図８は、学習済モデル提案の画面の一例である。この画面は、コンピュータ２００の入出力部２４０に表示してもよいし、ユーザの使用する別の端末（非図示）の入出力部に表示してもよい。図６の例の検索結果として、目的が不審者検知、環境が屋内、広さ約２０平方メートル、カメラ位置天井中央、照明ＬＥＤという条件で検索を行った場合に、図９の学習済モデルデータベース２３を検索して、「Ｂｕｎｒｕｉｋｉ００２」を適合する学習済モデルとして提案するという例を示している。提案画面で、図８のリンク８０１に示すように、ダウンロードＵＲＬを示して、選択することで提案した学習済モデルをすぐにダウンロード可能としてもよい。また、終了ボタン８０２を選択することで、学習済モデル提案システムの終了を行ってよい。また、検索画面へボタン８０１を選択することで、図６や図７に示した画像解析の目的と画像の撮影環境を取得するための、質問提示と入力の画面に戻ってよい。また、適合する学習済モデルが見つからない場合には、目的が合致し、環境が近い学習済モデルを、提案又は参考として出力してもよい。ユーザは、提案された学習済モデルを利用することで、学習時間をかけずに、目的にあわせた精度の良い画像解析結果を得ることが可能となる。

［画像比較処理］
図４は、画像比較を行う場合の、カメラ１００とコンピュータ２００の機能ブロックと各機能の関係を示す図である。図２の構成に加え、コンピュータ２００の制御部２１０は、通信部２２０、記憶部２３０と協働して画像取得モジュール２１３を実現する。また、制御部２１０は記憶部２３０と協働して画像比較モジュール２１４を実現する。図５は、画像比較を行う場合の、学習済モデル提案処理のフローチャート図である。上述した各モジュールが実行する処理について、本処理にあわせて説明する。図５のステップＳ５０１からステップＳ５０７の処理は、図３のステップＳ３０１からステップＳ３０７の処理に相当するため、ステップＳ５０８以降について説明する。なお、ステップＳ５０１の処理は、ステップＳ３０１と同じく、既に学習済モデルデータベース２３に十分な学習済モデルが記憶されている場合には、省略可能であるものとする。

コンピュータ２００の画像取得モジュール２１３は、画像解析を行いたい画像を取得するために、カメラ１００に画像送信要求を送信する（ステップＳ５０８）。

カメラ１００は、コンピュータ２００からの画像送信要求を受け、通信部１２０を介して画像を送信する（ステップＳ５０９）。カメラ１００は、リアルタイムに撮像している画像の送信を行うだけでなく、カメラ１００が過去に撮像して記憶部１３０に保存しておいた画像を送信しても良い。

コンピュータ２００の画像取得モジュール２１３は、カメラ１００から画像解析を行いたい画像を取得する（ステップＳ５１０）。

ここで、フローチャートには記載していないが、例えばステップＳ５０７で取得した環境の情報が不足している場合には、環境取得モジュール２１２がステップＳ５１０で取得した画像を解析して、場所、広さ、カメラ位置、照明、等を判断してもよいものとする。

次に、コンピュータ２００の画像比較モジュール２１４は、ステップＳ５１０で取得した画像解析を行いたい画像と、学習済モデルデータベース２３に記憶されている学習済モデルの所定の学習データ（教師データ）の画像とを、比較する（ステップＳ５１１）。ここで、比較のために使用する学習済モデルの所定の学習データの画像は、一つの学習済モデルの画像全てを使用するのではなく、一枚又は複数枚をピックアップして使用してよい。この比較により、画像解析を行いたい画像が、学習済モデルの所定の学習データの画像に類似である場合に、その学習済モデルを使用して画像解析を行った場合の精度がよくなると考え、提案するものとする。また、この比較作業は、必ず行って目的と環境が適合する学習済モデルの画像と類似であることを確認してもよいし、目的と環境が適合する学習済モデルが複数ある場合にどの学習済モデルを提案するか絞り込むために行ってもよいし、目的と環境が適合する学習済モデルが無い場合に目的のみが適合する学習済モデルから提案する学習済モデルを選択するために行ってもよい。適合する学習済モデルが見つからない場合には、適合する学習済モデルなしとしてもよいし、目的が合致し最も環境が近い学習済モデルを提案してもよい。

最後にコンピュータ２００の学習済モデル提案モジュール２４１は、ステップＳ５１１の画像比較結果に基づき、適切な学習済モデルを提案する（ステップＳ５１２）。ここでの学習済モデルの提案は、コンピュータ２００の入出力部２４０に出力してもよいし、ユーザが使用する別の端末等（非図示）の入出力部に出力してもよい。図８は、前述の通り、学習済モデル提案の画面の一例である。ユーザは、提案された学習済モデルを利用することで、学習時間をかけずに、目的にあわせた精度の良い画像解析結果を得ることが可能となる。

本発明によれば、画像の解析の目的と画像が撮影される環境とに加え、更に、画像解析を行いたい画像とを取得して利用することで、それに似た既存の学習済モデルを提案し、学習時間をかけずに、精度の良い画像解析結果を得ることが可能な学習済モデル提案システム、学習済モデル提案方法、およびプログラムを提供することが可能となる。

上述した手段、機能は、コンピュータ（ＣＰＵ、情報処理装置、各種端末を含む）が、所定のプログラムを読み込んで、実行することによって実現される。プログラムは、例えば、コンピュータからネットワーク経由で提供される（ＳａａＳ：ソフトウェア・アズ・ア・サービス）形態であってもよいし、フレキシブルディスク、ＣＤ（ＣＤ－ＲＯＭ等）、ＤＶＤ（ＤＶＤ－ＲＯＭ、ＤＶＤ－ＲＡＭ等）、コンパクトメモリ等のコンピュータ読取可能な記録媒体に記録された形態で提供される。この場合、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置又は外部記憶装置に転送し記憶して実行する。また、そのプログラムを、例えば、磁気ディスク、光ディスク、光磁気ディスク等の記憶装置（記録媒体）に予め記録しておき、その記憶装置から通信回線を介してコンピュータに提供するようにしてもよい。

以上、本発明の実施形態について説明したが、本発明は上述したこれらの実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。

１００カメラ、２００コンピュータ、３００通信網

Claims

画像解析に適切な学習済モデルを提案する学習済モデル提案システムであって、
画像解析を行うための学習済モデルを目的と環境に対応付けて記憶する学習済モデルデータベースと、
画像解析の目的を取得する目的取得手段と、
当該目的のための画像が撮影される環境を取得する環境取得手段と、
前記学習済モデルデータベースを参照して、前記目的と前記環境に適合した学習済モデルを提案し、当該目的と当該環境とに適合した学習済モデルがない場合、当該目的が合致し、当該環境が近い学習済モデルを提案又は参考として出力する学習済モデル提案手段と、
を備えることを特徴とする学習済モデル提案システム。
前記学習済モデルは、過去の画像と正解データとからなる所定の学習データで学習した学習済みの分類器を含み、
前記学習済モデル提案手段は、前記学習済みの分類器を学習済モデルとして提案することを特徴とする請求項１に記載の学習済モデル提案システム。
前記学習済モデルは、画像を分類器で分類する場合の分類器の種類と、画像を特徴ベクトルへ変換する変換方法と、からなることを特徴とする請求項２に記載の学習済モデル提案システム。
前記学習済モデルが、過去の画像と正解データとからなる所定の学習データで学習した学習済みの畳み込みニューラルネットワークであることを特徴とする請求項１に記載の学習済モデル提案システム。
前記画像解析を行いたい環境の画像を取得する画像取得手段と、
取得した前記画像と、前記所定の学習データの画像とが類似か否かを決定する画像比較手段と、を備え、
前記画像が類似している場合に、前記学習済モデル提案手段が、前記学習済モデルを提案することを特徴とする請求項２から請求項４のいずれか一項に記載の学習済モデル提案システム。
前記環境取得手段は、提示した質問に対して入力された回答を環境に関するデータとして取得することを特徴とする請求項１から請求項５のいずれか一項に記載の学習済モデル提案システム。
前記環境取得手段は、センサ又はカメラで検知したデータを取得することを特徴とする請求項１から請求項５のいずれか一項に記載の学習済モデル提案システム。
画像解析に適切な学習済モデルを提案する学習済モデル提案システムが実行する学習済モデル提案方法であって、
画像解析を行うための学習済モデルを目的と環境に対応付けて記憶する学習済モデルデータベースと、
画像解析の目的を取得するステップと、
当該目的のための画像が撮影される環境を取得するステップと、
前記学習済モデルデータベースを参照して、前記目的と前記環境に適合した学習済モデルを提案し、当該目的と当該環境とに適合した学習済モデルがない場合、当該目的が合致し、当該環境が近い学習済モデルを提案又は参考として出力するステップと、
を備えることを特徴とする学習済モデル提案方法。
画像解析を行うための学習済モデルを目的と環境に対応付けて記憶する学習済モデルデータベースを備える学習済モデル提案システムに、
画像解析の目的を取得するステップ、
当該目的のための画像が撮影される環境を取得するステップ、
前記学習済モデルデータベースを参照して、前記目的と前記環境に適合した学習済モデルを提案し、当該目的と当該環境とに適合した学習済モデルがない場合、当該目的が合致し、当該環境が近い学習済モデルを提案又は参考として出力するステップ、
を実行させるためのプログラム。