WO2022019312A1

WO2022019312A1 - 情報処理システム、情報処理装置、情報処理方法及びプログラム

Info

Publication number: WO2022019312A1
Application number: PCT/JP2021/027227
Authority: WO
Inventors: 桂一伊藤; 藍雅鈴木; 卓秀伊部; 展之大津
Original assignee: 株式会社アダコテック
Priority date: 2020-07-21
Filing date: 2021-07-20
Publication date: 2022-01-27

Abstract

【課題】画像処理を用いて対象物に関する情報を取得するための技術をより適切に実現すること。【解決手段】情報処理システム１において、ユーザ端末２０は、ＵＩ制御部２１１を備える。ＵＩ制御部２１１は、サーバ１０に対し、画像における対象物に関する情報を取得するための処理を要求する。サーバ１０は、最適化処理部１１３を備える。最適化処理部１１３は、ユーザ端末２０の要求に応じて、学習用画像の画像基底に基づいて、ブラックボックス最適化処理により、画像の前処理フィルタを設計し、設計された画像の前処理フィルタを用いて学習用画像を前処理し、当該前処理された学習用画像に基づいて、対象物に関する情報を取得するための機械学習に関するパラメータを取得する。

Description

情報処理システム、情報処理装置、情報処理方法及びプログラム

　本発明は、情報処理システム、情報処理装置、情報処理方法及びプログラムに関する。

　近年、画像処理を用いて、対象物の状態を認識する等、対象物に関する情報を取得する技術が盛んに利用されるようになっている。
　この場合、人手による特徴量設計、統計的分析、及び、深層学習等を用いた手法が用いられている。
　これらの手法において、十分な認識性能等を実現するためには、特徴抽出を行う前に画像中のノイズを除去したり、認識に有用な成分を強調するための空間フィルタリングによる前処理を行ったりする等の調整が重要となる。
　ところが、これらの調整を行うための画一的な方法は存在せず、人手による細かな調整を要するのが実状である。
　これに対し、特許文献１には、これらの調整を自動で行うための技術が開示されている。

特開２００７－１０２４５８号公報

　しかしながら、特許文献１に記載された技術においては、予め用意した画像処理の組み合わせの範囲において最適化を行っていることから、種々のケースに適用した場合に、必ずしも十分な性能が得られない可能性がある。

　本発明の課題は、画像処理を用いて対象物に関する情報を取得するための技術をより適切に実現することである。

　上記課題を解決するため、本発明の一態様に係る情報処理システムは、
　ユーザによって使用される端末装置と、前記端末装置と通信可能に構成されたサーバとを含む情報処理システムであって、
　前記端末装置は、
　前記サーバに対し、画像における対象物に関する情報を取得するための処理を要求する要求手段を備え、
　前記サーバは、
　前記端末装置の要求に応じて、学習用画像の画像基底に基づいて、ブラックボックス最適化処理により、画像の前処理フィルタを設計し、設計された前記画像の前処理フィルタを用いて前記学習用画像を前処理し、当該前処理された前記学習用画像に基づいて、前記対象物に関する情報を取得するための機械学習に関するパラメータを取得するフィルタ最適化手段を備えることを特徴とする。

　本発明によれば、画像処理を用いて対象物に関する情報を取得するための技術をより適切に実現することができる。

本発明に係る情報処理システム１全体のシステム構成を示す模式図である。各装置を構成する情報処理装置８００のハードウェア構成を示す図である。サーバ１０の機能的構成を示すブロック図である。ユーザ端末２０の機能的構成を示すブロック図である。ユーザ端末２０が実行するＵＩ制御処理の流れを示すフローチャートである。サーバ１０が実行する情報取得処理の流れを示すフローチャートである。サーバ１０が実行する最適化処理の流れを示すフローチャートである。サーバ１０が実行する画像基底の算出処理の流れを示すフローチャートである。サーバ１０が実行する画像前処理フィルタの設計処理の流れを示すフローチャートである。サーバ１０が実行するパラメータの探索処理の流れを示すフローチャートである。サーバ１０が実行する学習処理の流れを示すフローチャートである。サーバ１０が実行する対象物情報取得処理の流れを示すフローチャートである。物体検知処理及び処理結果の表示を実行するスタンドアローン型の情報処理装置８００の機能的構成を示すブロック図である。

　以下、本発明の実施形態について、図面を参照して説明する。
　本実施形態に係る情報処理システムにおいては、ブラックボックス最適化アルゴリズムを用いて、画像前処理フィルタの最適設計を行う。このとき、まず、画像の局所領域を表現する適切な局所画像の基底を参照して画像前処理フィルタの設計を行う。画像前処理フィルタは、局所画像の基底の線形結合によって実現され、その結合係数が最適化対象とされる。そして、画像前処理フィルタの設計（最適化）を一定世代進めた段階で、画像前処理フィルタを一旦固定し、他の調整が必要なパラメータ（例えば、特徴量計算や識別に用いる統計モデルの実行に必要な各種パラメータ）の最適化を行う。そして、最適化されたパラメータを用いて、再び、画像前処理フィルタの設計（最適化）を実行する。本実施形態に係る情報処理システムでは、これらの処理を繰り返すことにより、画像処理を用いて対象物に関する情報を取得するための最適化された画像前処理フィルタを取得する。
　これにより、人手による調整等に依存することなく、パラメータが相互に関連する画像前処理フィルタと機械学習のハイパーパラメータの最適化を併せて実行することができる。
　したがって、画像処理を用いて対象物に関する情報を取得するための技術をより適切に実現することができる。

［構成］
［システム構成］
　図１は、本発明に係る情報処理システム１全体のシステム構成を示す模式図である。
　図１に示すように、情報処理システム１は、サーバ１０と、複数のユーザ端末２０と、を含んで構成され、サーバ１０と複数のユーザ端末２０とは、インターネット等のネットワーク３０を介して通信可能に構成されている。

　サーバ１０は、ユーザ端末２０から、画像処理によって対象物に関する情報を取得（例えば、対象物の状態の認識、識別、検出等）する処理（以下、「情報取得処理」と称する。）の実行が要求された場合に、ユーザ端末２０で設定された条件（画像前処理フィルタの設定パラメータ、あるいは、学習処理のためのパラメータ等）に従って、情報取得処理を実行し、情報取得処理の結果をユーザ端末２０に送信する。情報取得処理において、サーバ１０は、画像前処理フィルタを設計し、最適化すると共に、画像処理を用いて対象物に関する情報を推論により取得するアルゴリズム（情報取得アルゴリズム）を機械学習する学習処理を実行する。そして、サーバ１０は、確定した画像前処理フィルタを用いて、対象物に関する情報を取得する画像（以下、「情報取得対象画像」と称する。）を画像処理し、情報取得対象画像に含まれる対象物に関する情報を取得する。

　ユーザ端末２０は、ユーザによって使用される情報処理装置であり、サーバ１０に対して、情報取得処理の実行を要求したり、情報取得処理における条件を設定したりする。また、ユーザ端末２０は、サーバ１０から送信された情報取得処理の結果を表示したり、情報取得処理の結果を表すデータをダウンロードしたりする。

［ハードウェア構成］
　次に、情報処理システム１における各装置のハードウェア構成を説明する。
　情報処理システム１において、各装置はＰＣ、サーバコンピュータあるいはタブレット端末等の情報処理装置によって構成され、その基本的構成は同様である。

　図２は、各装置を構成する情報処理装置８００のハードウェア構成を示す図である。
　図２に示すように、各装置を構成する情報処理装置８００は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）８１１と、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）８１２と、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）８１３と、バス８１４と、入力部８１５と、出力部８１６と、記憶部８１７と、通信部８１８と、ドライブ８１９と、撮像部８２０と、を備えている。

　ＣＰＵ８１１は、ＲＯＭ８１２に記録されているプログラム、または、記憶部８１７からＲＡＭ８１３にロードされたプログラムに従って各種の処理を実行する。
　ＲＡＭ８１３には、ＣＰＵ８１１が各種の処理を実行する上において必要なデータ等も適宜記憶される。

　ＣＰＵ８１１、ＲＯＭ８１２及びＲＡＭ８１３は、バス８１４を介して相互に接続されている。バス８１４には、入力部８１５、出力部８１６、記憶部８１７、通信部８１８、ドライブ８１９及び撮像部８２０が接続されている。

　入力部８１５は、各種ボタン等で構成され、指示操作に応じて各種情報を入力する。
　出力部８１６は、ディスプレイやスピーカ等で構成され、映像や音声を出力する。
　なお、情報処理装置８００がスマートフォンやタブレット端末として構成される場合には、入力部８１５と出力部８１６のディスプレイとを重ねて配置し、タッチパネルを構成することとしてもよい。
　記憶部８１７は、ハードディスクあるいはＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）等で構成され、各サーバで管理される各種データを記憶する。
　通信部８１８は、ネットワーク３０を介して他の装置との間で行う通信を制御する。

　ドライブ８１９には、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリ等よりなる、リムーバブルメディア８３１が適宜装着される。ドライブ８１９によってリムーバブルメディア８３１から読み出されたプログラムは、必要に応じて記憶部８１７にインストールされる。
　撮像部８２０は、レンズ及び撮像素子等を備えた撮像装置によって構成され、被写体の画像を撮像する。
　なお、情報処理装置８００がタブレット端末として構成される場合には、入力部８１５をタッチセンサによって構成し、出力部８１６のディスプレイに重ねて配置することにより、タッチパネルを備える構成とすることも可能である。

［機能的構成］
　次に、情報処理システム１における各装置の機能的構成について説明する。
［サーバ１０の構成］
　図３は、サーバ１０の機能的構成を示すブロック図である。
　図３に示すように、サーバ１０のＣＰＵ８１１においては、画像データ取得部１１１と、パラメータ設定部１１２と、最適化処理部１１３と、学習処理部１１４と、情報取得処理部１１５と、が機能する。また、サーバ１０の記憶部８１７には、画像データ記憶部１７１と、パラメータ記憶部１７２と、取得結果記憶部１７３と、が形成される。

　画像データ記憶部１７１には、画像前処理フィルタの設計のための学習処理に用いられる画像（以下、「学習用画像」と称する。）のデータ、及び、対象物に関する情報を取得する画像（情報取得対象画像）のデータが記憶される。

　パラメータ記憶部１７２には、ユーザ端末２０から送信された各種パラメータ（例えば、情報取得処理における条件を表す画像前処理フィルタの設定パラメータ、あるいは、学習処理のためのパラメータ等）が記憶される。
　取得結果記憶部１７３には、情報取得処理によって取得された対象物に関する情報（情報取得処理の結果）のデータが記憶される。

　画像データ取得部１１１は、ユーザ端末２０あるいは他の情報処理装置から、情報取得処理において用いられる学習用画像のデータ及び情報取得対象画像のデータを取得する。本実施形態において、学習用画像のデータは、被写体となっている対象物に関する情報が既知である教師データであり、例えば、製造物の表面の画像や防犯カメラの画像等、画像から対象物に関する情報を取得可能な種々の画像のデータとすることができる。

　パラメータ設定部１１２は、ユーザ端末２０から送信された各種パラメータ（例えば、情報取得処理における条件を表す画像前処理フィルタの設定パラメータ、あるいは、学習処理のためのパラメータ等）に基づいて、情報取得処理を実行する際の条件を設定する。

　最適化処理部１１３は、パラメータ設定部１１２によって設定されたハイパーパラメータ（画像基底の数ｍ，画像前処理フィルタのサイズｋ等）に従って、画像前処理フィルタの設計及び最適化のための最適化処理を実行する。具体的には、最適化処理部１１３は、学習用画像のデータにおける画像基底を算出し、算出した画像基底と、ブラックボックス最適化アルゴリズムによってサンプリングしたフィルタ係数とに基づいて、画像前処理フィルタを設計する。また、最適化処理部１１３は、設計した画像前処理フィルタを用いた場合に性能を最適化するハイパーパラメータを探索し、ハイパーパラメータを最適化する。さらに、最適化処理部１１３は、設計した画像前処理フィルタの評価値（ここでは、汎化性能値とする）を算出し、評価値を最大化するように最適化処理のアルゴリズムを更新する。最適化処理部１１３は、画像前処理フィルタの最適化及びハイパーパラメータの最適化を繰り返すことにより、実際に情報取得対象画像の処理に用いる画像前処理フィルタおよび機械学習のハイパーパラメータを取得する。

　学習処理部１１４は、最適化処理部１１３によって取得された画像前処理フィルタに基づいて、画像処理を用いて対象物に関する情報を推論により取得するアルゴリズム（情報取得アルゴリズム）を機械学習するための学習処理を実行する。具体的には、学習処理部１１４は、最適化処理部１１３によって取得された画像前処理フィルタを用いて学習用画像を画像処理し、その処理結果の画像を用いて機械学習を実行することにより、情報取得対象画像に含まれる対象物に関する情報を推論によって取得するための機械学習モデルを決定する。

　情報取得処理部１１５は、学習処理部１１４によって決定された機械学習モデルを用いて、情報取得対象画像に含まれる対象物に関する情報を取得するための対象物情報取得処理を実行する。このとき、情報取得処理部１１５は、最適化処理部１１３によって取得された画像前処理フィルタを用いて情報取得対象画像を画像処理し、対象物に関する情報を取得する。

［ユーザ端末２０の構成］
　図４は、ユーザ端末２０の機能的構成を示すブロック図である。
　図４に示すように、ユーザ端末２０のＣＰＵ８１１においては、ＵＩ制御部２１１と、データ管理部２１２と、が機能する。また、ユーザ端末２０の記憶部８１７には、画像データ記憶部２７１と、パラメータ記憶部２７２と、取得結果記憶部２７３と、が形成される。

　画像データ記憶部２７１には、画像前処理フィルタの設計のための学習処理に用いられる学習用画像のデータ、及び、対象物に関する情報を取得する情報取得対象画像のデータが記憶される。

　パラメータ記憶部２７２には、ユーザによって設定された各種パラメータ（例えば、情報取得処理における条件を表す画像前処理フィルタの設定パラメータ、あるいは、学習処理のためのパラメータ等）が記憶される。
　取得結果記憶部２７３には、情報取得処理によって取得された対象物に関する情報（情報取得処理の結果）のデータが記憶される。

　ＵＩ制御部２１１は、画像処理によって対象物に関する情報を取得する情報取得処理ためのパラメータを入出力する各種入出力画面（以下、「ＵＩ画面」と称する。）の表示を制御する。例えば、ＵＩ制御部２１１は、情報取得処理における条件（画像前処理フィルタの設定パラメータ、あるいは、学習処理のためのパラメータ等）を設定するためのユーザインターフェースや、サーバ１０から送信された情報取得処理の結果等を表示する。

　データ管理部２１２は、画像データ記憶部１７１への画像のデータの記憶及び読み出し、パラメータ記憶部１７２への各種パラメータの記憶及び読み出し、あるいは、サーバ１０との間でのデータの送受信を管理する。例えば、データ管理部２１２は、情報取得処理で用いられる学習用画像のデータ及び情報取得対象画像のデータを画像データ記憶部１７１から読み出したり、ＵＩ画面において設定された各種パラメータのデータをパラメータ記憶部１７２に記憶したりする。また、データ管理部２１２は、情報取得処理の実行をサーバ１０に要求する際に、学習用画像のデータ及び情報取得対象画像のデータ、あるいは、情報取得処理における条件を表すパラメータをサーバ１０に送信したり、情報取得処理の結果のデータをサーバ１０から受信したりする。

［動作］
　次に、情報処理システム１の動作を説明する。
［ＵＩ制御処理］
　図５は、ユーザ端末２０が実行するＵＩ制御処理の流れを示すフローチャートである。
　ＵＩ制御処理は、ユーザ端末２０の入力部８１５を介してＵＩ制御処理の実行が指示入力されることに対応して開始される。

　ＵＩ制御処理が開始されると、ステップＳ１において、ＵＩ制御部２１１は、画像処理によって対象物に関する情報を取得するためのＵＩ画面を表示する。このとき表示されるＵＩ画面においては、サーバ１０に情報取得処理を要求するための各種情報を入力することが可能となっている。

　ステップＳ２において、ＵＩ制御部２１１は、ユーザの操作に応じて、画像データ記憶部１７１から学習用画像及び情報取得対象画像を選択する。
　ステップＳ３において、ＵＩ制御部２１１は、ユーザの操作に応じて、画像処理によって対象物に関する情報を取得する情報取得処理のため各種パラメータ（画像前処理フィルタの設定パラメータ、あるいは、学習処理のためのパラメータ等）を設定する。
　ステップＳ４において、ＵＩ制御部２１１は、情報取得処理の実行をサーバ１０に要求する。このとき、ステップＳ２で選択された学習用画像のデータ及び情報取得対象画像のデータ、及び、ステップＳ３で設定された各種パラメータのデータがサーバ１０に送信される。

　ステップＳ５において、ＵＩ制御部２１１は、情報取得処理の結果をサーバ１０から受信する。情報取得処理の結果は、情報取得対象画像に含まれる対象物に関する情報の取得結果を表すものである。
　ステップＳ６において、ＵＩ制御部２１１は、サーバ１０から受信した情報取得処理の結果を表示する。
　ステップＳ７において、ＵＩ制御部２１１は、サーバ１０から受信した情報取得処理の結果を取得結果記憶部２７３に記憶する。

　ステップＳ８において、ＵＩ制御部２１１は、ＵＩ制御処理の終了が指示されたか否かの判定を行う。
　ＵＩ制御処理の終了が指示されていない場合、ステップＳ８においてＮＯと判定されて、処理はステップＳ１に移行する。
　一方、ＵＩ制御処理の終了が指示された場合、ステップＳ８においてＹＥＳと判定されて、ＵＩ制御処理は終了する。

　次に、サーバ１０が実行する処理について説明する。
［情報取得処理］
　図６は、サーバ１０が実行する情報取得処理の流れを示すフローチャートである。
　情報取得処理は、ユーザ端末２０から情報取得処理の要求が送信されることにより開始される。

　情報取得処理が開始されると、ステップＳ１１において、最適化処理部１１３は、ユーザ端末２０から受信した学習用画像のデータ及び情報取得対象画像のデータと各種パラメータのデータとに基づいて、最適化処理を実行する。
　ステップＳ１２において、学習処理部１１４は、最適化処理によって取得された画像前処理フィルタに基づいて、画像処理を用いて対象物に関する情報を推論により取得するアルゴリズム（情報取得アルゴリズム）を機械学習するための学習処理を実行する。
　ステップＳ１３において、情報取得処理部１１５は、学習処理で取得された機械学習モデルを用いて、情報取得対象画像に含まれる対象物に関する情報を取得するための対象物情報取得処理を実行する。

　ステップＳ１４において、情報取得処理部１１５は、全ての情報取得対象画像について情報取得処理が終了したか否かの判定を行う。
　全ての情報取得対象画像について情報取得処理が終了していない場合、ステップＳ１４においてＮＯと判定されて、処理はステップＳ１３に移行する。
　一方、全ての情報取得対象画像について情報取得処理が終了した場合、ステップＳ１４おいてＹＥＳと判定されて、情報取得処理は終了する。

［最適化処理］
　次に、情報取得処理のステップＳ１１において実行される最適化処理について説明する。
　図７は、サーバ１０が実行する最適化処理の流れを示すフローチャートである。
　最適化処理が開始されると、ステップＳ２１において、画像データ取得部１１１は、情報取得処理において用いられる学習用画像のデータを取得する。ここでは、Ｎ枚の学習用画像のデータが取得されるものとする。

　ステップＳ２２において、パラメータ設定部１１２は、ユーザ端末２０から送信された各種パラメータ（例えば、情報取得処理における条件を表す画像前処理フィルタの設定パラメータ、あるいは、学習処理のためのパラメータ等）に基づいて、情報取得処理を実行する際の条件を設定する。ステップＳ２２においては、画像基底の要素となる基底の数ｍ及び画像前処理フィルタのサイズｋが設定される。
　ステップＳ２３において、最適化処理部１１３は、学習用画像を対象として、画像基底の算出処理を実行する。なお、画像基底は、後述するように、局所画像から得られる基底を要素とする行列として定義される。
　ステップＳ２４において、最適化処理部１１３は、画像前処理フィルタの設定パラメータに基づいて、画像前処理フィルタの設計処理を実行する。

　ステップＳ２５において、最適化処理部１１３は、画像前処理フィルタの設計処理を実行するループが規定の回数に達したか否かの判定を行う。
　画像前処理フィルタの設計処理を実行するループが規定の回数に達していない場合、ステップＳ２５において、ＮＯと判定されて、処理はステップＳ２４に移行する。
　一方、画像前処理フィルタの設計処理を実行するループが規定の回数に達した場合、ステップＳ２５において、ＹＥＳと判定されて、処理はステップＳ２６に移行する。
　ステップＳ２６において、最適化処理部１１３は、学習処理で用いるパラメータの探索処理を実行する。

　ステップＳ２７において、最適化処理部１１３は、最適化処理の終了条件を充足したか否かの判定を行う。最適化処理の終了条件として、例えば、設定された時間が経過すること、設定されたループの回数に達したこと、あるいは、ユーザ端末２０からの終了指示の受信等を設定することができる。
　最適化処理の終了条件を充足していない場合、ステップＳ２７においてＮＯと判定されて、処理はステップＳ２４に移行する。
　一方、最適化処理の終了条件を充足した場合、ステップＳ２７においてＹＥＳと判定されて、処理はステップＳ２８に移行する。
ステップＳ２８において、最適化処理部１１３は、最適化処理の結果をユーザ端末２０に送信する。
　ステップＳ２８の後、処理は情報取得処理に戻る。
　なお、最適化処理において取得される各種パラメータは、パラメータ記憶部１７２に逐次記憶される。

［画像基底の算出処理］
　次に、最適化処理のステップＳ２３において実行される画像基底の算出処理について説明する。
　図８は、サーバ１０が実行する画像基底の算出処理の流れを示すフローチャートである。
　画像基底の算出処理が開始されると、ステップＳ３１において、最適化処理部１１３は、学習用画像それぞれにおける局所画像のサンプリングを行う。このとき、複数の学習用画像を画像データセットＸとすると、画像データセットＸのそれぞれの画像から、ｋ×ｋピクセルの領域を一定幅（例えば、数ピクセル）ずつずらしながらＮ’個の局所画像をサンプリングし、サンプリング結果をデータ行列Ｘ’に格納する。ここで、

であり、式（１）において、Ｒは実数の集合、Ｎ’はサンプリングした局所画像の数を表している。

　ステップＳ３２において、最適化処理部１１３は、サンプリングした局所画像を基底分解する。このとき、各種行列分解アルゴリズム（独立成分分析（ＩＣＡ）、スパース主成分分析（ｓｐａｒｓｅ　ＰＣＡ）、　主成分分析（ＰＣＡ）、非負値行列因子分解（ＮＭＦ）等）を用いて、以下の条件を充足するように、基底分解が行われる。

　このとき取得された基底をｖ_１～ｖ_ｍとし、基底ｖ_１～ｖ_ｍによって定義される画像基底をＶ（＝｛ｖ_１，ｖ_２，・・・，ｖ_ｍ｝）とする。
　ステップＳ３３において、最適化処理部１１３は、基底行列Ｖを正規化する。具体的には、ステップＳ３３において、最適化処理部１１３は、画像基底Ｖの基底毎に、ノルムを１に正規化する。
　ステップＳ３４において、最適化処理部１１３は、インパルスフィルタの追加処理を行う。具体的には、ステップＳ３４において、最適化処理部１１３は、正規化した画像基底Ｖにインパルスフィルタをｍ＋１個目の要素ｖ_ｍ＋１として追加し、画像基底Ｖ＝｛ｖ_１，ｖ_２，・・・，ｖ_ｍ，ｖ_ｍ＋１｝とする。なお、インパルスフィルタｖ_ｍ＋１は、以下の式（３）によって表され、画像前処理フィルタの強度を設定するために用いられる。

　ステップＳ３５において、最適化処理部１１３は、取得した画像基底Ｖを最適化処理に返す。
　ステップＳ３５の後、処理は最適化処理に戻る。

［画像前処理フィルタの設計処理］
　次に、最適化処理のステップＳ２４において実行される画像前処理フィルタの設計処理について説明する。
　図９は、サーバ１０が実行する画像前処理フィルタの設計処理の流れを示すフローチャートである。

　画像前処理フィルタの設計処理が開始されると、ステップＳ４１において、最適化処理部１１３は、画像前処理フィルタを求めるためのブラックボックス最適化処理の設定を行う。具体的には、ステップＳ４１において、最適化処理部１１３は、所定のブラックボックス最適化手法（ＴＰＥ（Ｔｒｅｅ－ｓｔｒｕｃｔｕｒｅｄ　Ｐａｒｚｅｎ　Ｅｓｔｉｍａｔｏｒ）、ＣＭＡ－ＥＳ（Ｃｏｖａｒｉａｎｃｅ　Ｍａｔｒｉｘ　Ａｄａｐｔａｔｉｏｎ　Ｅｖｏｌｕｔｉｏｎ　Ｓｔｒａｔｅｇｙ）、Ｂａｙｅｓｉａｎ　Ｏｐｔｉｍｉｚａｔｉｏｎ、ランダムサーチ等）に従って、画像前処理フィルタを設計するための設定を行う。このとき、用いられるブラックボックス最適化手法に応じた評価指標が設定される。

　なお、最適化処理におけるパラメータの探索処理で探索することに代えて、機械学習で用いられるハイパーパラメータを、ステップＳ４１におけるブラックボックス最適化処理で最適化するパラメータに含めることとしてもよい。この場合、総当たりによる探索等が不可能なハイパーパラメータであっても、最適化することが可能となる。

　ステップＳ４２において、最適化処理部１１３は、画像前処理フィルタの設計目的に応じた汎化性能指針を設定する。このとき、汎化性能指針として、ユーザにおいて最大化したいと考える指標を用いることができる。例えば、画像処理において対象物の見落としを防ぐこと（失報しないこと）を最優先する場合には、「見落としの少なさ（失報率の低さ）」を汎化性能指針とすることができる。また、画像処理において対象物を誤って検出しないこと（誤報しないこと）を最優先する場合には、「誤報の少なさ（誤報率の低さ）」を汎化性能指針とすることができる。

　ステップＳ４３において、最適化処理部１１３は、画像基底Ｖにおける基底の数ｍ＋１に応じたフィルタ係数ａ（＝｛ａ_１，ａ_２，・・・，ａ_ｍ，ａ_ｍ＋１｝）をサンプリングする。ここで、フィルタ係数ａはｍ＋１次元の［－１，１］区間に値をとるベクトルであり、ブラックボックス最適化アルゴリズムによってサンプリングされる。

　ステップＳ４４において、最適化処理部１１３は、画像前処理フィルタｆの設計を行う。具体的には、ステップＳ４４において、最適化処理部１１３は、画像基底Ｖ＝｛ｖ_１，ｖ_２，・・・，ｖ_ｍ，ｖ_ｍ＋１｝及びフィルタ係数ａ＝｛ａ_１，ａ_２，・・・，ａ_ｍ，ａ_ｍ＋１｝を基に、画像前処理フィルタｆを
ｆ＝ａ_１ｖ_１＋ａ_２ｖ_２＋・・・＋ａ_ｍｖ_ｍ
として算出する。即ち、画像前処理フィルタｆは、フィルタ係数のベクトルａと、画像基底Ｖの行列との積で表される。

　ステップＳ４５において、最適化処理部１１３は、画像前処理フィルタｆの正規化を行う。具体的には、ステップＳ４５において、最適化処理部１１３は、画像前処理フィルタｆに対し、ｆ／（Σ_ｉ，ｊｆ_ｉ，ｊ）を乗算することでフィルタ係数の総和が１となるよう正規化する。
　ステップＳ４６において、最適化処理部１１３は、フィルタ性能の評価値ｓを算出する。具体的には、ステップＳ４６において、最適化処理部１１３は、設計した画像前処理フィルタｆで学習用画像を前処理し、ＶａｌｉｄａｔｉｏｎデータあるいはＫ－ｆｏｌｄ交差検証等により特定される汎化性能値を最適化の評価値ｓとする。

　ステップＳ４７において、最適化処理部１１３は、算出された評価値ｓを参照して、最適化アルゴリズムを更新する。具体的には、ステップＳ４７において、最適化処理部１１３は、評価値ｓを最大化するようブラックボックス最適化アルゴリズムの状態（設定されるパラメータ）を更新する。
　ステップＳ４７の後、処理は最適化処理に戻る。

［パラメータの探索処理］
　次に、最適化処理のステップＳ２６において実行されるパラメータの探索処理について説明する。
　図１０は、サーバ１０が実行するパラメータの探索処理の流れを示すフローチャートである。
　パラメータの探索処理が開始されると、ステップＳ５１において、最適化処理部１１３は、候補となるパラメータ（探索対象のパラメータ）の全ての組み合わせ（直積）を算出する。なお、好ましいパラメータの候補が既知である場合、候補となるパラメータの全ての組み合わせを算出することなく、好ましいパラメータの候補のみを対象として探索を行うこととしてもよい。

　ステップＳ５２において、最適化処理部１１３は、機械学習の用途に応じた汎化性能指針を設定する。例えば、ステップＳ５２において、最適化処理部１１３は、異常検知を行う場合には、ＲＯＣ（Ｒｅｃｅｉｖｅｒ　Ｏｐｅｒａｔｏｒａｔｉｎｇ　Ｃｈａｒａｃｔｅｒｉｓｔｉｃ）曲線のＡＵＣ（Ａｒｅａ　Ｕｎｄｅｒ　ｔｈｅ　Ｃｕｒｖｅ）を汎化性能指針としたり、分類を行う場合には、ｆ１スコアを汎化性能指針としたりすることができる。

　ステップＳ５３において、最適化処理部１１３は、ステップＳ５１で算出したパラメータの組み合わせそれぞれに対し、ステップＳ５３で設定した汎化性能指針による汎化性能評価を行う。このとき、画像前処理フィルタの設計処理と同様に、算出したパラメータの組み合わせで学習用画像を前処理し、ＶａｌｉｄａｔｉｏｎデータあるいはＫ－ｆｏｌｄ交差検証等により特定される汎化性能値を評価値とすることができる。

　ステップＳ５４において、最適化処理部１１３は、ステップＳ５１で算出したパラメータの組み合わせのランク付けを行う。具体的には、ステップＳ５４において、最適化処理部１１３は、汎化性能値が高い順に、パラメータの組み合わせをソートする。
　ステップＳ５５において、最適化処理部１１３は、汎化性能値が最も高いパラメータの組み合わせを最適化処理に返す。なお、汎化性能値が最も高いパラメータの組み合わせに加えて、汎化性能値が上位の複数のパラメータの組み合わせを最適化処理に返すこととしてもよい。
　ステップＳ５５の後、処理は最適化処理に戻る。

［学習処理］
　次に、情報取得処理のステップＳ１２において実行される学習処理について説明する。
　図１１は、サーバ１０が実行する学習処理の流れを示すフローチャートである。
　学習処理が開始されると、ステップＳ６１において、学習処理部１１４は、最適化処理で決定されたパラメータを取得する。

　ステップＳ６２において、学習処理部１１４は、学習用画像のデータを取得する。
　ステップＳ６３において、学習処理部１１４は、学習用画像のデータに対し、最適化処理で決定されたパラメータを設定した画像前処理フィルタによって、画像の前処理を実行する。
　ステップＳ６４において、学習処理部１１４は、画像の前処理が行われた結果の画像データに対し、画像処理を用いて対象物に関する情報を推論により取得するアルゴリズム（情報取得アルゴリズム）の機械学習を実行する。これにより、対象物情報取得処理で用いられる機械学習モデルが生成される。
　なお、機械学習の手法としては、出願人による国際特許出願ＰＣＴ／ＪＰ２０１８／０２８７８４（ＷＯ２０１９／０５８７７５）に記載された手法や、各種深層学習手法等を用いることができる。
　ステップＳ６４の後、処理は情報取得処理に戻る。

［対象物情報取得処理］
　次に、情報取得処理のステップＳ１３において実行される対象物情報取得処理について説明する。
　図１２は、サーバ１０が実行する対象物情報取得処理の流れを示すフローチャートである。
　対象物情報取得処理が開始されると、ステップＳ７１において、情報取得処理部１１５は、学習処理によって生成された機械学習モデルを取得する。

　ステップＳ７２において、情報取得処理部１１５は、情報取得対象画像のデータを取得する。
　ステップＳ７３において、情報取得処理部１１５は、情報取得対象画像のデータに対し、最適化処理で決定されたパラメータを設定した画像前処理フィルタによって、画像の前処理を実行する。
　ステップＳ７４において、情報取得処理部１１５は、画像の前処理が行われた結果の画像データに対し、学習処理によって生成された機械学習モデルを適用して、対象物に関する情報を取得する。これにより、最適化された画像前処理フィルタで前処理した情報取得対象画像において、対象物に関する情報が取得される。
　ステップＳ７４の後、処理は情報取得処理に戻る。

　このような処理により、本実施形態に係る情報処理システム１においては、学習用画像のデータにおける画像基底に基づいて、ブラックボックス最適化アルゴリズムにより、画像前処理フィルタを設計し、最適化のループを所定回数繰り返す。そして、画像前処理フィルタのパラメータを一旦固定し、機械学習で用いられるハイパーパラメータの探索を行い、取得された最適なハイパーパラメータを用いて、再び、画像前処理フィルタの最適化が行われる。情報処理システム１では、このような処理を繰り返すことで、複雑に最適化された画像前処理フィルタを自動的に生成する。
　これにより、人手による調整等に依存することなく、パラメータが相互に関連する画像前処理フィルタの最適化を実行することができる。
　したがって、画像処理を用いて対象物に関する情報を取得するための技術をより適切に実現することができる。

［変形例１］
　上述の実施形態においては、クライアント－サーバ型の情報処理システム１を構築し、サーバ１０において情報取得処理を実行して、ユーザ端末２０に情報取得処理の結果を送信するものとした。
　これに対し、情報取得処理を実行するための機能及び情報取得処理の結果を表示するための機能を１つの装置（例えば、ユーザ端末２０等）に備えることにより、情報処理システム１の機能を単体の情報処理装置８００で実現（即ち、スタンドアローン型のシステムとして実現）することとしてもよい。

　図１３は、物体検知処理及び処理結果の表示を実行するスタンドアローン型の情報処理装置８００の機能的構成を示すブロック図である。
　図１３に示すように、スタンドアローン型として構成する場合、単体の情報処理装置８００において、ユーザ端末２０のＵＩ制御部２１１、サーバ１０の画像データ取得部１１１、パラメータ設定部１１２、最適化処理部１１３、学習処理部１１４及び情報取得処理部１１５の機能をＣＰＵ８１１に備えると共に、サーバ１０が備える画像データ記憶部１７１、パラメータ記憶部１７２及び取得結果記憶部１７３を記憶部８１７に備えることとすればよい。

　以上のように、本実施形態に係る情報処理システム１は、ユーザによって使用されるユーザ端末２０と、ユーザ端末２０と通信可能に構成されたサーバ１０とを含む。
　ユーザ端末２０は、ＵＩ制御部２１１を備える。
　ＵＩ制御部２１１は、サーバ１０に対し、画像における対象物に関する情報を取得するための処理を要求する。
　サーバ１０は、最適化処理部１１３を備える。
　最適化処理部１１３は、ユーザ端末２０の要求に応じて、学習用画像の画像基底に基づいて、ブラックボックス最適化処理により、画像の前処理フィルタを設計し、設計された画像の前処理フィルタを用いて学習用画像を前処理し、当該前処理された学習用画像に基づいて、対象物に関する情報を取得するための機械学習に関するパラメータを取得する。
　これにより、人手による調整等に依存することなく、パラメータが相互に関連する画像前処理フィルタの最適化を実行することができる。
　したがって、画像処理を用いて対象物に関する情報を取得するための技術をより適切に実現することができる。

　最適化処理部１１３は、取得された機械学習に関するパラメータを用いて、画像の前処理フィルタをブラックボックス最適化処理により再び設計する。
　これにより、複雑に最適化された画像前処理フィルタを自動的に生成することができる。

　最適化処理部１１３は、設計した画像の前処理フィルタのパラメータを評価するための評価値に基づいて、ブラックボックス最適化処理に設定されるパラメータを変更し、当該変更後のブラックボックス最適化処理によって、画像の前処理フィルタを設計することにより、画像の前処理フィルタを最適化する。
　これにより、最適化のループを繰り返して、機械学習に用いられる画像の前処理フィルタを設計することができる。

　最適化処理部１１３は、対象物に関する情報を取得するための機械学習に関するパラメータについて、当該機械学習に関するパラメータを評価するための評価値を取得し、評価値が上位のパラメータの組み合わせを、最適化された機械学習に関するパラメータとして取得する。
　これにより、パラメータの組み合わせを総当たりすること等により、最適化された機械学習に関するパラメータとして、より適切なパラメータの組み合わせを取得することができる。

　最適化処理部１１３は、ブラックボックス最適化処理における処理対象として、対象物に関する情報を取得するための機械学習に関するパラメータを含めることにより、最適化された機械学習に関するパラメータを取得する。
　これにより、パラメータの組み合わせを総当たりすることが不可能なパラメータ等においても、最適化された機械学習に関するパラメータとして妥当性が高いものを取得することができる。

　最適化処理部１１３は、学習用画像の局所領域の基底を要素とする画像基底を算出し、画像基底の要素の数に応じてサンプリングされた画像の前処理フィルタの係数と、当該画像基底の要素とを乗算することにより、画像の前処理フィルタを設計する。
　これにより、画像の前処理フィルタとして適切なパラメータを用いて、より適切な画像の前処理フィルタを自動的に設計することができる。

　また、情報処理システム１は、学習処理部１１４を備える。
　学習処理部１１４は、最適化処理部１１３によって取得された画像の前処理フィルタを用いて学習用画像を処理することにより、画像における対象物に関する情報を取得するための機械学習モデルを生成する。
　これにより、適切なフィルタリングが可能な画像の前処理フィルタで処理された画像を対象として、より高精度な情報取得を可能とする機械学習モデルを生成することができる。

　また、情報処理システム１は、情報取得処理部１１５を備える。
　情報取得処理部１１５は、最適化処理部１１３によって取得された画像の前処理フィルタを用いて対象物に関する情報を取得する画像を処理し、学習処理部１１４によって生成された機械学習モデルを用いて、画像の前処理フィルタによって処理された情報取得対象画像における被写体に関する情報を推論することにより、対象物に関する情報を取得する。
　これにより、適切なフィルタリングが可能な画像の前処理フィルタで処理された画像を対象として、より高精度な情報取得を行うことが可能となる。

　また、本実施形態に係る情報処理装置８００（サーバ１０または変形例１の情報処理装置８００）は、最適化処理部１１３を備える。
　最適化処理部１１３は、ユーザ端末２０の要求に応じて、学習用画像の画像基底に基づいて、ブラックボックス最適化処理により、画像の前処理フィルタを設計すると共に、設計した画像の前処理フィルタを最適化する処理を繰り返し、当該最適化する処理を繰り返して取得された画像の前処理フィルタを用いて学習用画像を処理することにより、対象物に関する情報を取得するための機械学習に関するパラメータを取得する。
　これにより、人手による調整等に依存することなく、パラメータが相互に関連する画像前処理フィルタの最適化を実行することができる。
　したがって、画像処理を用いて対象物に関する情報を取得するための技術をより適切に実現することができる。

　なお、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
　例えば、上述の実施形態において、クライアント－サーバ型の情報処理システム１を構成する場合、システムを構成する情報処理装置の組み合わせは、上述の実施形態に示した例に限られない。
　即ち、サーバ１０に備えられた機能をより多くのサーバに分散して実装したり、ユーザ端末２０あるいはサーバ１０の機能をより少ない装置にまとめて実装したりすることが可能である。
　また、サーバ１０及びユーザ端末２０が備える機能が全体として情報処理システム１に実装されていればよく、いずれの機能をいずれの装置に実装するかは、目的に応じて種々の形態をとり得る。例えば、サーバ１０において最適化処理及び学習処理を実行し、ユーザ端末２０において対象物情報取得処理を実行すること等が可能である。

　また、上述の実施形態においては、情報処理システム１が、最適化処理、学習処理及び対象物情報取得処理の全てを実行するものとして説明したが、これに限られない。即ち、情報処理システム１は、最適化処理、学習処理及び対象物情報取得処理のうち、いずれかを実行するものとしてもよい。例えば、情報処理システム１において、ユーザ端末２０の要求に応じて、サーバ１０が最適化処理を実行し、画像前処理フィルタを生成することとしてもよい。画像前処理フィルタをサーバ１０が生成し、他の装置に提供することで、他の装置においては、画像前処理フィルタを生成する必要がなくなることから、この場合においても、画像処理を用いて対象物に関する情報を取得するための技術をより適切に実現することができる。

　上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
　換言すると、上述の実施形態における機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が情報処理システム１を構成するいずれかのコンピュータに備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に示した例に限定されない。
　また、１つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。

　また、上述した一連の処理を実行するためのプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布されるリムーバブルメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。

　以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。

１　情報処理システム、１０　サーバ、２０　ユーザ端末、３０　ネットワーク、１１１　画像データ取得部、１１２　パラメータ設定部、１１３　最適化処理部、１１４　学習処理部、１１５　情報取得処理部、１７１，２７１　画像データ記憶部、１７２，２７２　パラメータ記憶部、１７３，２７３　取得結果記憶部、２１１　ＵＩ制御部、２１２　データ管理部、８００　情報処理装置、８１１　ＣＰＵ、８１２　ＲＯＭ、８１３　ＲＡＭ、８１４　バス、８１５　入力部、８１６　出力部、８１７　記憶部、８１８　通信部、８１９　ドライブ、８２０　撮像部、８３１　リムーバブルメディア

Claims

　ユーザによって使用される端末装置と、前記端末装置と通信可能に構成されたサーバとを含む情報処理システムであって、
　前記端末装置は、
　前記サーバに対し、画像における対象物に関する情報を取得するための処理を要求する要求手段を備え、
　前記サーバは、
　前記端末装置の要求に応じて、学習用画像の画像基底に基づいて、ブラックボックス最適化処理により、画像の前処理フィルタを設計し、設計された前記画像の前処理フィルタを用いて前記学習用画像を前処理し、当該前処理された前記学習用画像に基づいて、前記対象物に関する情報を取得するための機械学習に関するパラメータを取得するフィルタ最適化手段を備えることを特徴とする情報処理システム。
　前記フィルタ最適化手段は、取得された前記機械学習に関するパラメータを用いて、前記画像の前処理フィルタを前記ブラックボックス最適化処理により再び設計することを特徴とする請求項１に記載の情報処理システム。
**フィルタ最適化のループを具体化**
　前記フィルタ最適化手段は、設計した前記画像の前処理フィルタのパラメータを評価するための評価値に基づいて、前記ブラックボックス最適化処理に設定されるパラメータを変更し、当該変更後の前記ブラックボックス最適化処理によって、前記画像の前処理フィルタを設計することにより、前記画像の前処理フィルタを最適化することを特徴とする請求項１または２に記載の情報処理システム。
　前記フィルタ最適化手段は、前記対象物に関する情報を取得するための機械学習に関するパラメータについて、当該機械学習に関するパラメータを評価するための評価値を取得し、評価値が上位のパラメータの組み合わせを、最適化された前記機械学習に関するパラメータとして取得することを特徴とする請求項１から３のいずれか１項に記載の情報処理システム。
　前記フィルタ最適化手段は、前記ブラックボックス最適化処理における処理対象として、前記対象物に関する情報を取得するための機械学習に関するパラメータを含めることにより、最適化された前記機械学習に関するパラメータを取得することを特徴とする請求項１から３のいずれか１項に記載の情報処理システム。
　前記フィルタ最適化手段は、前記学習用画像の局所領域の基底を要素とする前記画像基底を算出し、前記画像基底の前記要素の数に応じてサンプリングされた前記画像の前処理フィルタの係数と、当該画像基底の前記要素とを乗算することにより、前記画像の前処理フィルタを設計することを特徴とする請求項１から５のいずれか１項に記載の情報処理システム。
　前記フィルタ最適化手段によって取得された前記画像の前処理フィルタを用いて前記学習用画像を処理することにより、画像における対象物に関する情報を取得するための機械学習モデルを生成する学習手段を備えることを特徴とする請求項１から６のいずれか１項に記載の情報処理システム。
　前記フィルタ最適化手段によって取得された前記画像の前処理フィルタを用いて対象物に関する情報を取得する画像を処理し、前記学習手段によって生成された前記機械学習モデルを用いて、前記画像の前処理フィルタによって処理された前記対象物に関する情報を取得する画像における被写体に関する情報を推論することにより、前記対象物に関する情報を取得する情報取得手段を備えることを特徴とする請求項７に記載の情報処理システム。
　画像における対象物に関する情報を取得するための処理を実行する情報処理装置であって、
　学習用画像の画像基底に基づいて、ブラックボックス最適化処理により、画像の前処理フィルタを設計し、設計された前記画像の前処理フィルタを用いて前記学習用画像を前処理し、当該前処理された前記学習用画像に基づいて、前記対象物に関する情報を取得するための機械学習に関するパラメータを取得するフィルタ最適化手段を備えることを特徴とする情報処理装置。
　情報処理システムが実行する情報処理方法であって、
　学習用画像の画像基底に基づいて、ブラックボックス最適化処理により、画像の前処理フィルタを設計し、設計された前記画像の前処理フィルタを用いて前記学習用画像を前処理し、当該前処理された前記学習用画像に基づいて、画像における対象物に関する情報を取得するための機械学習に関するパラメータを取得するフィルタ最適化処理を含むことを特徴とする情報処理方法。
　コンピュータに、
　学習用画像の画像基底に基づいて、ブラックボックス最適化処理により、画像の前処理フィルタを設計し、設計された前記画像の前処理フィルタを用いて前記学習用画像を前処理し、当該前処理された前記学習用画像に基づいて、画像における対象物に関する情報を取得するための機械学習に関するパラメータを取得するフィルタ最適化機能を実現させることを特徴とするプログラム。