WO2019215868A1

WO2019215868A1 - パターン認識システム、パラメータ生成方法およびパラメータ生成プログラム

Info

Publication number: WO2019215868A1
Application number: PCT/JP2018/018104
Authority: WO
Inventors: 高橋　勝彦; 博義宮野; 哲夫井下
Original assignee: 日本電気株式会社
Priority date: 2018-05-10
Filing date: 2018-05-10
Publication date: 2019-11-14
Also published as: US11586850B2; JP6977875B2; JPWO2019215868A1; US20210027110A1

Abstract

第一パラメータ生成部８１１は、認識対象のデータと、そのデータの正解ラベルと、そのデータの収集環境を示すドメイン情報との組合せを含む第一の学習データを用いて、第一の認識器のパラメータである第一パラメータを生成する。第二パラメータ生成部８１２は、第一パラメータを基に、所定の収集環境で収集された認識対象のデータと、そのデータの正解ラベルと、所定の収集環境を示す対象ドメイン情報との組合せを含む第二の学習データを用いて、第二の認識器のパラメータである第二パラメータを生成する。第三パラメータ生成部８１３は、第一パラメータおよび第二パラメータを統合して、第一の学習データを用いた学習により、入力データのパターン認識に用いられる第三パラメータを生成する。

Description

パターン認識システム、パラメータ生成方法およびパラメータ生成プログラム

　本発明は、パターン認識の性能を向上させるパターン認識システム、および、パターン認識で用いられる認識器のパラメータを生成するパラメータ生成方法およびパラメータ生成プログラムに関する。

　多くのパターンデータを用いて学習を行うことで、認識エンジンの性能を向上できることが知られている。また、基礎となる認識エンジンから各環境に適合させた認識エンジンにチューニングすることも行われている。なお、認識エンジンは、認識器と呼ばれることもある。

　また、異なる環境に応じて認識精度を向上させる方法も各種提案されている。例えば、特許文献１には、文字の書かれている環境に応じた認識処理を行うパターン認識装置が記載されている。特許文献１に記載されたパターン認識装置は、入力画像から抽出された処理対象の状態ごとにパターン認識処理のいずれか１つ又は複数を呼び出して認識処理を行わせる。

　また、特許文献２には、撮像環境の違いによる追加学習の長期化を回避する画像認識方法が記載されている。特許文献２に記載された画像認識方法では、画像撮像時の撮像環境と、パラメータテーブルに管理されている各撮像環境を示す撮像環境情報との差分から類似度を算出する。類似度が所定の閾値を上回る類似度を持つ撮像環境を示す撮像環境情報がパラメータテーブルに存在しない場合、その類似度が所定の閾値を下回る類似度の中で最も類似度が高い撮像環境に対応する認識制御パラメータを選択する。そして選択された認識制御パラメータを基礎として、所定の学習アルゴリズムを用いて、新たに取得した画像の認識に用いる認識制御パラメータを生成する。

特開２００７－０５８８８２号公報特開２０１６－０１５１１６号公報

　各環境向けにチューニングした認識エンジンも、時間の経過に従って性能が低下することが想定されるため、性能改善が必要になる場合がある。しかし、環境ごとの認識エンジンを個別に更新し続けることは手離れが悪いことから、手離れを改善することが必要になる。

　手離れを改善するための一般的なアプローチは、学習パターンをできるだけ多く収集し、少しでも汎化性能の高い認識辞書を構築することである。例えば、画像のパターン認識を行う認識辞書を構築する場合、正解ラベルを一部の学習データのみに設定する方法や、正解ラベルを用いることなく画像のみを用いて学習を行う方法も知られている。一般に、良質の学習データ（画像と正確な正解ラベルのセット）を大量に準備して学習することが良いとされているが、学習パターンを多数収集するには、非常に多くのコストを要してしまう。

　例えば、画像データのパターン認識を行う場合、基礎となる認識エンジンを学習するために、カメラの設置環境のバリエーションを網羅できるだけの学習パターンを収集することが理想である。しかし、そのような学習パターンの収集は、物理的またはコスト的に困難である。

　また、ある顧客の環境において実運用されている認識エンジンが存在し、他の顧客でもその認識エンジンを同様の目的で利用し得るケースも存在する。しかし、そのような認識エンジンが存在したとしても、顧客の学習パターン（データ）の持ち出しや、そのデータを他の用途へ利用することが認められないケースがほとんどである。そのため、その運用で用いられた学習パターン（データ）を新たな認識エンジンのチューニングに利用することは困難である。

　例えば、特許文献２に記載された方法では、類似度が高い撮像環境に対応する認識制御パラメータを選択し、選択された認識制御パラメータを基礎として、新たな認識制御パラメータを生成する。しかし、特許文献２に記載された方法は、撮像環境ごとの認識精度を向上させる方法であるため、上記以外の撮像環境を想定した認識制御パラメータの認識精度を向上させること困難であり、結果として認識エンジンの汎化性能を向上させることは困難である。

　基礎となる認識エンジンの汎化性能を向上できれば、各環境向けの認識エンジンのチューニング作業も軽減できることになる。一方で、各環境向けの認識エンジンのチューニングに用いる学習パターンを、基礎となる認識エンジンの学習に直接用いることは困難であることから、学習パターンを増強することなく基礎となる認識エンジンの汎化性能を向上できることが好ましい。

　そこで、本発明は、学習パターンを増強することなくパターン認識を行う認識器の汎化性能を向上できるパターン認識システム、パラメータ生成方法およびパラメータ生成プログラムを提供することを目的とする。

　本発明のパターン認識システムは、入力データのパターンを認識するパターン認識装置を備え、パターン認識装置が、認識対象のデータと、そのデータの正解ラベルと、そのデータの収集環境を示すドメイン情報との組合せを含む第一の学習データを用いて、第一の認識器のパラメータである第一パラメータを生成する第一パラメータ生成部と、第一パラメータを基に、所定の収集環境で収集された認識対象のデータと、そのデータの正解ラベルと、所定の収集環境を示す対象ドメイン情報との組合せを含む第二の学習データを用いて、第二の認識器のパラメータである第二パラメータを生成する第二パラメータ生成部と、第一パラメータおよび第二パラメータを統合して、第一の学習データを用いた学習により、入力データのパターン認識に用いられる第三パラメータを生成する第三パラメータ生成部とを含み、第三パラメータ生成部が、対象ドメイン情報に合致するドメイン情報を含む第一の学習データを用いた学習において、第二パラメータによる認識結果を優先させるように第三パラメータを生成することを特徴とする。

　本発明のパラメータ生成方法は、認識対象のデータと、そのデータの正解ラベルと、そのデータの収集環境を示すドメイン情報との組合せを含む第一の学習データを用いて、第一の認識器のパラメータである第一パラメータを生成し、第一パラメータを基に、所定の収集環境で収集された認識対象のデータと、そのデータの正解ラベルと、所定の収集環境を示す対象ドメイン情報との組合せを含む第二の学習データを用いて、第二の認識器のパラメータである第二パラメータを生成し、第一パラメータおよび第二パラメータを統合して、第一の学習データを用いた学習により、入力データのパターン認識に用いられる第三パラメータを生成し、第三パラメータを生成する際、対象ドメイン情報に合致するドメイン情報を含む第一の学習データを用いた学習において、第二パラメータによる認識結果を優先させるように第三パラメータを生成することを特徴とする。

　本発明のパラメータ生成プログラムは、コンピュータに、認識対象のデータと、そのデータの正解ラベルと、そのデータの収集環境を示すドメイン情報との組合せを含む第一の学習データを用いて、第一の認識器のパラメータである第一パラメータを生成する第一パラメータ生成処理、第一パラメータを基に、所定の収集環境で収集された認識対象のデータと、そのデータの正解ラベルと、所定の収集環境を示す対象ドメイン情報との組合せを含む第二の学習データを用いて、第二の認識器のパラメータである第二パラメータを生成する第二パラメータ生成処理、および、第一パラメータおよび第二パラメータを統合して、第一の学習データを用いた学習により、入力データのパターン認識に用いられる第三パラメータを生成する第三パラメータ生成処理を実行させ、第三パラメータ生成処理で、対象ドメイン情報に合致するドメイン情報を含む第一の学習データを用いた学習において、第二パラメータによる認識結果を優先させるように第三パラメータを生成させることを特徴とする。

　本発明によれば、学習パターンを増強することなくパターン認識を行う認識器の汎化性能を向上できる。

本発明のパターン認識システムの第一の実施形態の構成例を示すブロック図である。記憶部が記憶する情報の例を示す説明図である。記憶部が記憶する情報の他の例を示す説明図である。第一の実施形態のパターン認識システムの動作例を示すフローチャートである。第一の実施形態のパターン認識システムの変形例を示すブロック図である。本発明のパターン認識システムの第二の実施形態の構成例を示すブロック図である。第二の実施形態のパターン認識システムの動作例を示すフローチャートである。第二の実施形態のパターン認識システムの変形例を示すブロック図である。本発明のパターン認識システムの第三の実施形態の構成例を示すブロック図である。本発明によるパターン認識システムの概要を示すブロック図である。

　以下、本発明の実施形態を図面を参照して説明する。

実施形態１．
　図１は、本発明のパターン認識システムの第一の実施形態の構成例を示すブロック図である。本実施形態のパターン認識システム１は、対象とする入力データのパターンを認識するパターン認識装置１００を備えている。パターン認識装置１００がパターンを認識する対象のデータの態様は任意であり、例えば、画像データや映像データ、音響データやテキストデータなどが挙げられる。

　パターン認識装置１００は、第一パラメータ生成部１０と、第二パラメータ生成部２０と、第三パラメータ生成部３０と、記憶部４０と、パターン認識部５０とを含む。

　記憶部４０は、パターン認識に用いる認識器を学習するためのデータ（以下、学習データと記す。）を記憶する。また、記憶部４０は、認識器を特定するためのパラメータも記憶する。パラメータは、後述する第一パラメータ生成部１０、第二パラメータ生成部２０および第三パラメータ生成部３０により生成される。なお、記憶部４０は、他の装置（図示せず）等により生成された認識器のパラメータを記憶してもよい。記憶部４０は、例えば、磁気ディスク等により実現される。

　学習データは、認識対象とするデータと、そのデータの正解ラベルと、そのデータの収集環境を示す情報（以下、ドメイン情報と記す。）との組合せを含む。ドメイン情報は、例えば、映像データの場合、カメラの設置角度、方位、高さ、カメラが室内に設置されているか、屋外に設置されているか、認識対象の向き、画角、レンズ、歪み係数、撮像ノイズ状態、映像圧縮ノイズ状態、などである。認識対象の向きとは、例えば、改札入口に設置されたカメラで撮影される場合、認識対象は常に正面から来るか、などである。なお、学習データは、これらの組合せ以外の情報を含んでいてもよく、例えば、学習する際に用いるデータの重みなどを含んでいてもよい。

　本実施形態では、認識器を特定するパラメータとして、三種類のパラメータを想定する。第一パラメータは、基礎となる認識器を特定するためのパラメータである。第二パラメータは、第一パラメータで特定される認識器を基に生成されるパラメータであり、特に所定の環境の下で認識処理を行うために第一パラメータからチューニングされたパラメータである。そのため、第二パラメータは、第一パラメータに由来するパラメータであるということもできる。

　第三パラメータは、基礎となる認識器を特定する第一パラメータと、所定の環境で用いられる認識器を特定する第二パラメータとを統合して生成されるパラメータである。本実施形態では、基礎となる認識器が有する認識性能に、所定の環境で用いられる認識性能を反映させて、第一パラメータの性能を上回る第三パラメータを生成することを目的とする。各パラメータの生成方法については後述される。

　第一パラメータ生成部１０は、学習データを用いて第一パラメータを生成する。以下、第一パラメータ生成部１０が用いる学習データを第一の学習データと記す。上述するように、第一パラメータは、基礎となる認識器を特定するためのパラメータであり、この認識器は他の認識器に対する親の認識器に相当する。以下の説明では、第一パラメータにより特定される認識器を第一の認識器と記す。第一の認識器は、親ＡＩ（Artificial Intelligence ）と言うこともできる。第一パラメータ生成部１０が認識器を学習する方法は任意であり、広く知られた方法が用いられればよい。

　第二パラメータ生成部２０は、第一パラメータ（すなわち、基礎となる認識器のパラメータ）を基に、学習データを用いて第二パラメータを生成する。第二パラメータ生成部２０が用いる学習データも、第一の学習データと同様に、認識対象とするデータと、そのデータの正解ラベルと、そのデータのドメイン情報との組合せを含む。

　ただし、第二パラメータ生成部２０が用いる学習データは、所定の収集環境で収集されたデータと、そのデータの正解ラベルと、所定の収集環境を示す情報（以下、対象ドメイン情報）との組合せを含む。以下、第二パラメータ生成部２０が用いる学習データを第二の学習データと記す。

　所定の収集環境とは、第二の認識器が認識を行うデータを収集する環境である。例えば、店舗の天井に設置されたカメラで映像が撮影される場合、所定の収集環境は、例えば、斜め方向からデータを撮影する環境、と言える。また、例えば、夜間に建屋の入口の映像を撮影している場合、所定の収集環境は、屋外で夜間に撮影される環境、と言える。

　これらのことから、第二の学習データに基づいて学習される第二パラメータは、所定の収集環境に特化した認識性能を有するパラメータと言うこともできる。また、第一の認識器が親ＡＩと言うのに対し、第二の認識器は、子ＡＩと言うこともできる。また、第二の学習データは、例えば、各顧客でのみ扱うことが可能なデータと言うこともできる。

　第二パラメータ生成部２０が第二パラメータを学習する方法も任意である。第二パラメータ生成部２０は、第一パラメータ生成部１０が第一パラメータを学習する方法と同様の方法を用いて第二パラメータを学習してもよい。この場合、生成される第二パラメータは、第一の学習データと第二の学習データの両方を用いた学習された結果生成されるパラメータと言うことができる。

　なお、第二の学習データは、所定の収集環境を示す共通のドメイン情報を含むことが想定される。そのため、第二の学習データは、共通するドメイン情報を別に保持して、データ及び正解ラベルのみ含んでいてもよい。

　第二パラメータ生成部２０は、第二の学習データとして、第一の学習データに含まれるデータとは別に収集されたデータと正解ラベルと対象ドメイン情報との組合せを含む第二の学習データを用いて第二パラメータを生成してもよい。このような第二の学習データを用いることができる状況として、例えば、顧客の運用中に学習データが取得できる場合などが挙げられる。

　図２は、記憶部４０が記憶する情報の例を示す説明図である。図２に示す例では、記憶部４０が、第一パラメータの学習に用いられる第一の学習データｄ１、第二パラメータの学習に用いられる第二の学習データｄ２、並びに、３種類のパラメータである第一パラメータｐ１、第二パラメータｐ２および第三パラメータｐ３をそれぞれ記憶していることを示す。また、図２に示す例では、第一の学習データｄ１および第二の学習データｄ２が、それぞれ、認識対象の入力データ、正解ラベルおよびドメイン情報を含むデータであることを示す。

　なお、図２に示す例では、第一の学習データｄ１、および、第二の学習データｄ２がいずれも記憶部４０に記憶されている場合を例示しているが、第一の学習データｄ１と第二の学習データｄ２が、それぞれ別の記憶装置に記憶されていてもよい。

　一方、顧客の運用中のデータを学習データとして用いることができない場合も想定される。このような場合、第二パラメータ生成部２０は、第一の学習データから、第一の学習データに含まれるドメイン情報が示す収集環境と同一または類似する収集環境のデータを第二の学習データとして抽出し、抽出したこの学習データを第二の学習データとして用いて第二パラメータを生成してもよい。以下の説明では、所定の収集環境と同一または類似する学習データのことを、所定の環境と合致する学習データと記すこともある。

　ドメイン情報が同一または類似する（すなわち合致する）か否かを判断する基準は、予め定めておけばよい。例えば、カメラによって認識対象を撮影する角度を示すドメイン情報が合致する基準として、予め範囲の角度（例えば、１０度以内）以内の場合には、合致する、と定めておいてもよい。

　図３は、記憶部４０が記憶する情報の他の例を示す説明図である。図３に示す例では、記憶部４０が、第一パラメータの学習に用いられる第一の学習データｄ１、第二パラメータの学習に用いられる対象ドメイン情報ｄ３、並びに、第一パラメータｐ１、および、第二パラメータｐ２をそれぞれ記憶していることを示す。なお、記憶部４０は、図２に例示するように、第三パラメータｐ３を記憶していてもよい。

　また、図３では、第一の学習データｄ１、および、対象ドメイン情報ｄ３がいずれも記憶部４０に記憶されている場合を例示しているが、第一の学習データｄ１と対象ドメイン情報ｄ３が、それぞれ別の記憶装置に記憶されていてもよい。

　第三パラメータ生成部３０は、第一パラメータおよび第二パラメータを統合して、第一の学習データを用いた学習により、認識対象のデータのパターン認識に用いられる第三パラメータを生成する。第三パラメータは、例えば、後述するパターン認識部５０が、入力データのパターンを認識する際に用いられる。

　具体的には、第三パラメータ生成部３０は、対象ドメイン情報に合致するドメイン情報を含む第一の学習データを用いた学習において、第二パラメータによる認識結果を優先させるように第三パラメータを生成する。

　第三パラメータ生成部３０は、例えば、第一パラメータによる認識器および第二パラメータによる認識器の両方を取り込んで、両方の認識器の性能を学習データに含まれるドメイン情報に応じてバランスさせるように第三のパラメータを生成してもよい。この場合、記憶部４０は、例えば、各パラメータ（または認識器）と、用いた学習データに含まれるドメイン情報の割合（または数）とを対応付けて保持しておく。

　そして、第三パラメータ生成部３０は、パラメータの学習に用いられた学習データに含まれるドメイン情報に合致する度合いが高いほど、そのパラメータの認識結果を優先するように第三パラメータを生成してもよい。これは、学習したドメイン環境がより近い方に識別結果をバランスさせることを意味する。また、これは、同じようなドメイン環境で収集されたデータに基づいて学習した識別器の信頼度をより高くするということもできる。

　例えば、水平方向から撮影した画像を用いて学習した認識器Ａと、斜め方向から撮影した画像を用いて学習した認識器Ｂが存在するとする。一般に、認識器は、認識結果と併せて確信度（例えば、信頼する場合の確信度を１、信頼しない場合の確信度を０とし、より確信が高くなるほど１に近くなる、など）を出力する。ここで、認識器Ａが斜め方向から撮影した画像の確信度を０．３と出力したとする。この場合、この確信度は、学習したデータのドメイン環境が異なることから、認識器Ａが想定する確信度よりも低いことが想定される。この場合、第三パラメータ生成部３０は、上述する「合致する度合い」を重みとして確信度を補正してもよい。

　そして、第三パラメータ生成部３０は、このように算出された確信度の認識結果ごとの総和から平均を算出し、最も平均が高い認識結果を最終的な認識結果として採用するように第三パラメータを生成してもよい。

　また、第三パラメータ生成部３０は、第一の学習データ自体に重み情報を設定してもよい。具体的には、第三パラメータ生成部３０は、第二パラメータの学習に用いられた学習データのドメイン情報の割合を、学習データの重みとして設定してもよい。例えば、単純には、第三パラメータ生成部３０は、対象ドメインに合致するドメイン情報を含む学習データに１を設定し、異なるドメイン情報の場合に０を設定してもよい。この重みは、学習の際、正解ラベルと認識結果とのズレを理想に近づけるための修正量として用いることができる。このような重みを設定することで、第二パラメータの認識性能を第一パラメータの認識性能に反映することが可能になる。

　一方、第三パラメータ生成部３０は、第一パラメータおよび第二パラメータを用いて、新たな環境に適合させるように第三パラメータを生成してもよい。以下、新たな環境を示す情報のことを新ドメイン情報と記す。この場合、第三パラメータ生成部３０は、第一パラメータと第二パラメータのうち、パラメータの生成に用いた学習データに含まれるドメイン情報が、新たな環境を示す新ドメイン情報により近いパラメータを優先的に選択する。そして、第三パラメータ生成部３０は、第一の学習データに含まれるドメイン情報が新ドメイン情報に合致するほど認識結果の確信度が高くなるように、第三パラメータを生成する。

　パターン認識部５０は、生成された第三パラメータにより特定される認識器を用いて入力データのパターン認識を行う。

　第一パラメータ生成部１０と、第二パラメータ生成部２０と、第三パラメータ生成部３０と、パターン認識部５０とは、プログラム（パラメータ生成プログラム）に従って動作するコンピュータのＣＰＵ（Central Processing Unit ）によって実現される。例えば、プログラムは、パターン認識装置１００の記憶部４０に記憶され、ＣＰＵは、そのプログラムを読み込み、プログラムに従って、第一パラメータ生成部１０、第二パラメータ生成部２０、第三パラメータ生成部３０およびパターン認識部５０として動作してもよい。

　また、第一パラメータ生成部１０と、第二パラメータ生成部２０と、第三パラメータ生成部３０と、パターン認識部５０とは、それぞれが専用のハードウェアで実現されていてもよい。

　次に、本実施形態のパターン認識システムの動作を説明する。図４は、本実施形態のパターン認識システム１の動作例を示すフローチャートである。第一パラメータ生成部１０は、第一の学習データを用いて第一パラメータを生成する（ステップＳ１１）。第二パラメータ生成部２０は、第一のパラメータを基に、第二の学習データを用いて、第二パラメータを生成する（ステップＳ１２）。

　そして、第三パラメータ生成部３０は、第一パラメータおよび第二パラメータを統合して第三パラメータを生成する（ステップＳ１３）。このとき、第三パラメータ生成部３０は、対象ドメイン情報に合致するドメイン情報を含む第一の学習データを用いた学習において、第二パラメータによる認識結果を優先させるように第三パラメータを生成する。

　以上のように、本実施形態では、第一パラメータ生成部１０が第一の学習データを用いて第一パラメータを生成し、第二パラメータ生成部２０が、第一のパラメータを基に、第二の学習データを用いて、第二パラメータを生成する。そして、第三パラメータ生成部３０が、第一パラメータおよび第二パラメータを統合して第三パラメータを生成する。このとき、第三パラメータ生成部３０は、対象ドメイン情報に合致するドメイン情報を含む第一の学習データを用いた学習において、第二パラメータによる認識結果を優先させるように第三パラメータを生成する。

　よって、学習パターンを増強することなくパターン認識を行う認識器の汎化性能を向上できる。これにより、基礎となる認識エンジンの基本性能を向上できるため、現場に設置するシステムの認識エンジン（子ＡＩ）のチューニング作業も軽減できる。

　次に、本実施形態のパターン認識システムの変形例を説明する。上記実施形態では、第二パラメータ生成部２０が、一種類の第二パラメータを生成し、第三パラメータ生成部３０が、第一パラメータに第二パラメータを統合して第三パラメータを生成する場合について説明した。なお、第一パラメータに統合する第二パラメータは、一種類に限定されない。

　図５は、第一の実施形態のパターン認識システムの変形例を示すブロック図である。図５に例示するパターン認識システム２のパターン認識装置２００は、は、第一パラメータ生成部１０と、複数の第二パラメータ生成部２１～２Ｎと、第三パラメータ生成部３０と、記憶部４０と、パターン認識部５０とを含む。すなわち、本変形例では、パターン認識装置２００が、複数の第二パラメータ生成部２１～２Ｎを備えている点において、上記実施形態と異なる。

　各第二パラメータ生成部２１～２１Ｎの内容は、第一の実施形態の第二パラメータ生成部２０の内容と同様である。第三パラメータ生成部３０は、第一パラメータおよび複数種類の第二パラメータを統合して第三パラメータを生成する。具体的には、第三パラメータ生成部３０は、各第二パラメータの対象ドメイン情報に合致するドメイン情報を含む第一の学習データを用いた学習において、対応する第二パラメータによる認識結果を優先させるように第三パラメータを生成する。なお、第三パラメータ生成部３０が第三パラメータを生成する方法は、第一の実施形態と同様である。

　このように、第三パラメータ生成部３０が、第一パラメータおよび複数種類の第二パラメータを統合して第三パラメータを生成することで、複数の第二パラメータの認識性能を反映させた認識エンジンを生成できる。

実施形態２．
　次に、本発明のパターン認識システムの第二の実施形態を説明する。第一の実施形態で生成された第三パラメータは、汎化性能が向上していることが期待される。一方、第二パラメータは、所定の収集環境に基づいてチューニングされたパラメータであるため、第三パラメータよりもデータの収集環境に適合した認識性能を有することも想定される。そこで、本実施形態では、認識性能に応じてパラメータの更新有無を判断する方法を説明する。

　図６は、本発明のパターン認識システムの第二の実施形態の構成例を示すブロック図である。本実施形態のパターン認識システム３は、パターン認識装置３００と、子認識装置４００とを備えている。

　子認識装置４００は、入力データのパターン認識を行う装置である。子認識装置４００は、記憶部４１と、パターン認識部５１と、データ送受信部７１とを含む。

　データ送受信部７１は、パターン認識装置３００とデータの送受信を行う。

　記憶部４１は、パターン認識部５１がパターン認識を行うためのパラメータを記憶する。例えば、子認識装置４００によるデータの収集環境が第二の学習データの収取環境に対応している場合、記憶部４１は、第二パラメータを記憶していてもよい。この場合、後述するパターン認識部５１は、記憶部４１に記憶された第二パラメータに基づいてパターン認識を行う。

　パターン認識部５１は、記憶部４１に記憶されたパラメータにより特定される認識器を用いて入力データのパターン認識を行う。上述するように、記憶部４１が第二パラメータを記憶している場合、パターン認識部５１は、第二パラメータにより特定される認識器を用いて入力データのパターン認識を行う。ただし、パターン認識部５１がパターン認識に用いるパラメータは第二パラメータに限定されない。パラメータの内容は、後述するパターン認識装置３００のパラメータ更新部９０によって生成されたパラメータに逐次更新される。

　パターン認識装置３００は、第一パラメータ生成部１０と、第二パラメータ生成部２０と、第三パラメータ生成部３０と、記憶部４０と、パターン認識部５０と、データ分岐部６０と、データ送受信部７０と、認識結果比較部８０と、パラメータ更新部９０とを含む。なお、パターン認識装置３００が、複数の第二パラメータ生成部２１～２Ｎを備えていてもよい。

　すなわち、第２の実施形態のパターン認識装置３００は、第一の実施形態のパターン認識装置１００と比較し、データ分岐部６０と、データ送受信部７０と、認識結果比較部８０と、パラメータ更新部９０とを更に含む。なお、第一パラメータ生成部１０、第二パラメータ生成部２０、第三パラメータ生成部３０、記憶部４０およびパターン認識部５０の構成は、第一の実施形態と同様である。

　データ送受信部７０は、子認識装置４００とデータの送受信を行う。

　データ分岐部６０は、認識対象の入力データを、パターン認識装置３００のパターン認識部５０と、子認識装置４００のパターン認識部５１とにそれぞれ入力する。そして、データ分岐部６０は、パターン認識部５０およびパターン認識部５１による認識結果を認識結果比較部８０に入力する。データ分岐部６０には、例えば、映像データが入力される。

　認識結果比較部８０は、子認識装置４００がパターン認識に用いているパラメータと、生成された第三パラメータとの性能を比較する。より具体的には、認識結果比較部８０は、第二パラメータによる認識結果と第三パラメータによる認識結果とを比較して、認識精度を判定する。認識結果比較部８０は、例えば、各パラメータによる認識結果と第一の学習データに含まれる正解ラベルが示す結果との合致度合いが大きいパラメータを、より認識精度の高いパラメータと判定してもよい。

　認識結果比較部８０は、例えば、第一の学習データに含まれるデータの認識結果と正解ラベルとの差異を複数の学習データについて集計することで認識精度を判定してもよい。ただし、上述する認識精度の判定方法は一例であり、認識結果比較部８０は、広く知られた他の方法により認識精度を判定してもよい。

　パラメータ更新部９０は、子認識装置４００がパターン認識に用いるパラメータを更新する。具体的には、パラメータ更新部９０は、認識結果比較部８０により、第三パラメータが第二パラメータよりも認識精度が高いと判定された場合、子認識装置が認識処理に用いる第二パラメータを第三パラメータに更新する。

　このように、パラメータを更新するか否かの判定を子認識装置４００以外の装置で行うことにより、子認識装置４００の業務を遮ることなく、子認識装置４００のパラメータを更新することが可能になる。

　なお、パラメータ更新部９０は、子認識装置を実現する計算機資源の制約を考慮し、知識の蒸留（Knowledge Distillation）に基づいて、教師モデルに相当する第三パラメータから生徒モデルに相当するより小規模なパラメータを生成してもよい。なお、教師モデルから生徒モデルを生成する方法は広く知られており、ここでは詳細な説明を省略する。パラメータ更新部９０は、パラメータの内容や計算機資源の制約を考慮して、知識の蒸留を行えばよい。

　第一パラメータ生成部１０と、第二パラメータ生成部２０と、第三パラメータ生成部３０と、パターン認識部５０と、データ分岐部６０と、データ送受信部７０と、認識結果比較部８０と、パラメータ更新部９０とは、プログラム（パラメータ生成プログラム）に従って動作するコンピュータのＣＰＵによって実現される。また、子認識装置４００におけるパターン認識部５１およびデータ送受信部７１も、プログラムに従って動作するコンピュータのＣＰＵによって実現される。

　次に、本実施形態のパターン認識システムの動作を説明する。図７は、本実施形態のパターン認識システム３の動作例を示すフローチャートである。なお、第三パラメータ生成部３０が第一パラメータおよび第二パラメータを統合して第三パラメータを生成するまでの処理は、図４におけるステップＳ１１からステップＳ１３までの処理と同様である。

　データ分岐部６０は、入力データをパターン認識装置３００のパターン認識部５０と、子認識装置４００のパターン認識部５１にそれぞれ入力する（ステップＳ２１）。パターン認識装置３００のパターン認識部５０および子認識装置４００のパターン認識部５１は、それぞれ入力データのパターン認識を行う（ステップＳ２２）。すなわち、パターン認識装置３００のパターン認識部５０は、第三パラメータに基づいてパターン認識を行い、子認識装置４００のパターン認識部５１は、第二パラメータに基づいてパターン認識を行う。

　認識結果比較部８０は、パターン認識部５１による認識結果（すなわち、第二パラメータによる認識結果）とパターン認識部５０による認識結果（すなわち、第三パラメータによる認識結果）とを比較し、第三パラメータが第二パラメータよりも認識精度が高いか否か判定する（ステップＳ２３）。

　第三パラメータが第二パラメータよりも認識精度が高い場合（ステップＳ２３におけるＹｅｓ）、パラメータ更新部９０は、子認識装置４００が認識処理に用いる第二パラメータを第三パラメータに更新する（ステップＳ２４）。一方、第三パラメータが第二パラメータよりも認識精度が高くない場合（ステップＳ２３におけるＮｏ）、パラメータの更新処理は行われず、処理を終了する。

　以上のように、本実施形態では、第一の実施形態の構成に加え、認識結果比較部８０が、第二パラメータによる認識結果と第三パラメータによる認識結果とを比較する。そのため、より認識精度の高いパラメータを選択することが可能になる。

　次に、本実施形態の変形例を説明する。第二の実施形態では、認識結果比較部８０が学習データを用いて認識結果の精度を判定する方法を説明した。なお、この判定結果としてユーザによる判定結果を用いることも可能である。本変形例では、認識結果比較部８０が、ユーザに判定結果を入力させる方法を説明する。

　図８は、第二の実施形態のパターン認識システムの変形例を示すブロック図である。図８に例示するパターン認識システム４は、パターン認識装置５００と、子認識装置４００とを備えている。子認識装置４００の構成は、第２の実施形態の子認識装置４００の構成と同様である。

　パターン認識装置５００は、第一パラメータ生成部１０と、第二パラメータ生成部２０と、第三パラメータ生成部３０と、記憶部４０と、パターン認識部５０と、データ分岐部６０と、データ送受信部７０と、認識結果比較部８１と、パラメータ更新部９０とを含む。すなわち、パターン認識装置５００の構成は、認識結果比較部８０の内容が認識結果比較部８１に置き換わった以外、第２の実施形態のパターン認識装置３００の構成と同様である。

　認識結果比較部８１は、結果表示部８２と、判定結果入力部８３とを有する。

　結果表示部８２は、第二パラメータによる認識結果および第三パラメータによる認識結果を出力する。結果表示部８２は、例えば、入力データに対する認識結果や、その認識結果に対する確信度を出力してもよい。

　判定結果入力部８３は、結果表示部８２が出力した認識結果に基づくユーザの判定結果を入力する。判定結果入力部８３は、例えば、第二パラメータによる認識結果と第三パラメータによる認識結果のいずれがより認識精度が高いかをユーザから受け付けてもよい。判定結果の入力を受け付けた後の処理（すなわち、パラメータ更新部９０の処理）は、第２の実施形態と同様である。

　以上のように、本変形例では、認識結果比較部８１が認識結果に対するユーザからの判定結果を受け付ける。そのため、学習データ以外の任意のデータに対する認識結果をパラメータの選択に反映させることが可能になる。

実施形態３．
　次に、本発明のパターン認識システムの第三の実施形態を説明する。第一の実施形態および第二の実施形態では、学習データが予め記憶部４０に記憶されている場合について説明した。なお、この学習データは、オペレータの運用業務に付随して生成されてもよい。オペレータの観点から学習データを生成することで、より適切なパラメータを生成することが可能になる。

　図９は、本発明のパターン認識システムの第三の実施形態の構成例を示すブロック図である。本実施形態のパターン認識システム５は、パターン認識装置６００を備えている。なお、本実施形態のパターン認識システム５は、第２の実施形態の子認識装置４００を備えていてもよい。

　パターン認識装置６００は、第一パラメータ生成部１０と、第二パラメータ生成部２０と、第三パラメータ生成部３０と、記憶部４０と、パターン認識部５０と、データ取得部１１０と、取得データ出力部１２０と、データ抽出部１３０と、データ登録部１４０とを含む。なお、パターン認識装置６００は、第２の実施形態のデータ分岐部６０、データ送受信部７０、認識結果比較部８０およびパラメータ更新部９０を含んでいてもよい。

　データ取得部１１０は、認識対象のデータを取得する。例えば、画像データや映像データが認識対象のデータの場合、データ取得部１１０は、カメラなどの撮像装置により実現される。また、例えば、音声データが認識対象のデータの場合、データ取得部１１０は、音声レコーダなどにより実現される。また、例えば、テキストデータが認識対象のデータの場合、データ取得部１１０は、ＯＣＲ（Optical Character Recognition ）や音声認識装置などにより実現される。また、データ取得部１１０によるデータの収集環境は、ドメイン情報として予めユーザ等により設定される。

　取得データ出力部１２０は、データ取得部１１０により取得されたデータを出力する。取得データ出力部１２０は、例えば、画像データや映像データをディスプレイ装置などの表示装置（図示せず）に表示してもよい。

　データ抽出部１３０は、ユーザの指示に応じて、取得データ出力部１２０によって出力されたデータを抽出する。抽出対象のデータの内容（すなわち、正解ラベル）は、予め設定されているものとする。

　例えば、オペレータがモニターを参照して不審人物を監視する運用業務を行っているとする。このとき、データ取得部１１０は、所定の範囲を随時撮影し、取得データ出力部１２０は、その映像を出力する。その映像中に、オペレータが不審人物を発見した場合、データ抽出部１３０は、例えば、オペレータによる検出操作（例えば、画面上の不審人物をクリックする操作）に応じて、その画像データを抽出する。

　また、画像データの抽出方法も任意であり、データ取得部１１０は、表示された全体の画像データを抽出してもよく、クリックされた周辺の領域の画像データを不審人物領域として抽出してもよい。

　データ登録部１４０は、データ抽出部１３０により抽出されたデータを記憶部４０に登録する。具体的には、オペレータの抽出対象は予め正解ラベルとして設定されており、データの収集環境を示すドメイン情報も予め設定されている。そこで、データ登録部１４０は、抽出されたデータと、正解ラベルと、ドメイン情報との組合せを生成し、学習データとして記憶部４０に登録する。なお、データ登録部１４０は、生成した学習データを、第一の学習データとして登録してもよく、第二の学習データとして登録してもよい。

　以上のように、本実施形態では、データ抽出部１３０が、ユーザの指示に応じて出力されたデータを抽出し、データ登録部１４０が、抽出されたデータと、正解ラベルと、ドメイン情報との組合せを生成し、学習データとして記憶部４０に登録する。そのため、オペレータの観点から、より精度の高い学習データを生成することが可能になる。

　次に、本発明の概要を説明する。図１０は、本発明によるパターン認識システムの概要を示すブロック図である。本発明によるパターン認識システム８００（例えば、パターン認識システム１）は、入力データのパターンを認識するパターン認識装置８１０（例えば、パターン認識装置１００）を備えている。

　パターン認識装置８１０は、認識対象のデータと、そのデータの正解ラベルと、そのデータの収集環境を示すドメイン情報との組合せを含む第一の学習データを用いて、第一の認識器のパラメータである第一パラメータを生成する第一パラメータ生成部８１１（例えば、第一パラメータ生成部１０）と、第一パラメータを基に、所定の収集環境で収集された認識対象のデータと、そのデータの正解ラベルと、所定の収集環境を示す対象ドメイン情報との組合せを含む第二の学習データを用いて、第二の認識器のパラメータである第二パラメータを生成する第二パラメータ生成部８１２（例えば、第二パラメータ生成部２０）と、第一パラメータおよび第二パラメータを統合して、第一の学習データを用いた学習により、入力データのパターン認識に用いられる第三パラメータを生成する第三パラメータ生成部８１３（例えば、第三パラメータ生成部３０）とを含む。

　第三パラメータ生成部８１３は、対象ドメイン情報に合致するドメイン情報を含む第一の学習データを用いた学習において、第二パラメータによる認識結果を優先させるように第三パラメータを生成する。

　そのような構成により、学習パターンを増強することなくパターン認識を行う認識器の汎化性能を向上できる。

　また、第二パラメータ生成部８１２は、第一の学習データに含まれるデータとは別に収集されたデータと、そのデータの正解ラベルと、そのデータの収集環境を示す対象ドメイン情報との組合せを含む第二の学習データを用いて第二パラメータを生成してもよい。そのような構成により、各収集環境の状況をより反映したパラメータを生成することが可能になる。

　一方、第二パラメータ生成部８１２は、第一の学習データのうち、その第一の学習データに含まれるドメイン情報が示す収集環境が、所定の収集環境と合致する学習データを用いて第二パラメータを生成してもよい。そのような構成により、第二のドメイン情報が示す収集環境で学習データを収集できない場合でも、認識器の汎化性能を向上することが可能になる。

　また、第三パラメータ生成部８１３は、パラメータの学習に用いられた学習データに含まれるドメイン情報の合致する度合いが高いほどそのパラメータの認識結果を優先するように第一パラメータおよび第二パラメータを統合して、第三パラメータを生成してもよい。そのような構成により、すでに生成されたいずれのパラメータの性質も利用することが可能になる。

　また、第三パラメータ生成部８１３は、第一パラメータと第二パラメータのうち、パラメータの生成に用いた学習データに含まれるドメイン情報が、新たな環境を示す新ドメイン情報により近いパラメータを優先的に選択し、第一の学習データに含まれるドメイン情報が新ドメイン情報に合致するほど認識結果の確信度が高くなるように、第三パラメータを生成してもよい。そのような構成により、既存の収集環境とは異なる環境での認識精度を向上させることが可能になる。

　また、パターン認識装置８１０は、第二パラメータによる認識結果と第三パラメータによる認識結果とを比較する認識結果比較部（例えば、認識結果比較部８０）を含んでいてもよい。そして、認識結果比較部は、認識結果と第一の学習データに含まれる正解ラベルが示す結果との合致度合いが大きいパラメータを、より認識精度の高いパラメータと判定してもよい。そのような構成により、より認識精度の高いパラメータを選択することが可能になる。

　また、パターン認識システム８００は、第二パラメータに基づいて入力データのパターンを認識する子認識装置（例えば、子認識装置４００）を備えていてもよい。そして、パターン認識装置８１０は、子認識装置が認識に用いるパラメータを更新するパラメータ更新部（例えば、パラメータ更新部９０）を含んでいてもよい。そして、パラメータ更新部は、第三パラメータが第二パラメータよりも認識精度が高いと判定された場合、子認識装置が認識処理に用いる第二パラメータを第三パラメータに更新してもよい。

　また、パラメータ更新部は、知識の蒸留に基づいて、第三パラメータからより小規模なパラメータを生成し、子認識装置が認識処理に用いる第二パラメータを生成されたパラメータで更新してもよい。そのような構成により、子認識装置の資源の制約に対応することが可能になる。

　本発明は、パターン認識の性能を向上させるパターン認識システムに好適に適用される。例えば、本発明は、例えば、大規模監視システム向け画像認識エンジンを搭載したシステムや、ＦＡ（Factory Automation）向け欠陥検査システムにおいて好適に適用される。

　具体的には、多数の現場にカメラが設置されメインの認識エンジンと現地システムのエンジンとを分けて運用するような大規模監視システム向け認識エンジンを用いたシステム本発明を好適に適用できる。

　１～５　パターン認識システム
　１０　第一パラメータ生成部
　２０，２１～２Ｎ　第二パラメータ生成部
　３０　第三パラメータ生成部
　４０，４１　記憶部
　５０，５１　パターン認識部
　６０　データ分岐部
　７０，７１　データ送受信部
　８０，８１　認識結果比較部
　８２　結果表示部
　８３　判定結果入力部
　１００，２００，３００，５００　パターン認識装置
　１１０　データ取得部
　１２０　取得データ出力部
　１３０　データ抽出部
　１４０　データ登録部
　４００　子認識装置

Claims

　入力データのパターンを認識するパターン認識装置を備え、
　前記パターン認識装置は、
　認識対象のデータと、当該データの正解ラベルと、当該データの収集環境を示すドメイン情報との組合せを含む第一の学習データを用いて、第一の認識器のパラメータである第一パラメータを生成する第一パラメータ生成部と、
　前記第一パラメータを基に、所定の収集環境で収集された認識対象のデータと、当該データの正解ラベルと、前記所定の収集環境を示す対象ドメイン情報との組合せを含む第二の学習データを用いて、第二の認識器のパラメータである第二パラメータを生成する第二パラメータ生成部と、
　前記第一パラメータおよび前記第二パラメータを統合して、前記第一の学習データを用いた学習により、前記入力データのパターン認識に用いられる第三パラメータを生成する第三パラメータ生成部とを含み、
　前記第三パラメータ生成部は、前記対象ドメイン情報に合致するドメイン情報を含む前記第一の学習データを用いた学習において、前記第二パラメータによる認識結果を優先させるように前記第三パラメータを生成する
　ことを特徴とするパターン認識システム。
　第二パラメータ生成部は、第一の学習データに含まれるデータとは別に収集されたデータと、当該データの正解ラベルと、当該データの収集環境を示す対象ドメイン情報との組合せを含む第二の学習データを用いて第二パラメータを生成する
　請求項１記載のパターン認識システム。
　第二パラメータ生成部は、第一の学習データのうち、当該第一の学習データに含まれるドメイン情報が示す収集環境が、所定の収集環境と合致する学習データを用いて第二パラメータを生成する
　請求項１記載のパターン認識システム。
　第三パラメータ生成部は、パラメータの学習に用いられた学習データに含まれるドメイン情報の合致する度合いが高いほど当該パラメータの認識結果を優先するように第一パラメータおよび第二パラメータを統合して、第三パラメータを生成する
　請求項１から請求項３のうちのいずれか１項に記載のパターン認識システム。
　第三パラメータ生成部は、第一パラメータと第二パラメータのうち、パラメータの生成に用いた学習データに含まれるドメイン情報が、新たな環境を示す新ドメイン情報により近いパラメータを優先的に選択し、第一の学習データに含まれるドメイン情報が前記新ドメイン情報に合致するほど認識結果の確信度が高くなるように、第三パラメータを生成する
　請求項１から請求項３のうちのいずれか１項に記載のパターン認識システム。
　パターン認識装置は、第二パラメータによる認識結果と第三パラメータによる認識結果とを比較する認識結果比較部を含み、
　前記認識結果比較部は、前記認識結果と第一の学習データに含まれる正解ラベルが示す結果との合致度合いが大きいパラメータを、より認識精度の高いパラメータと判定する
　請求項１から請求項５のうちのいずれか１項に記載のパターン認識システム。
　第二パラメータに基づいて入力データのパターンを認識する子認識装置を備え、
　パターン認識装置は、
　前記子認識装置が認識に用いるパラメータを更新するパラメータ更新部を含み、
　前記パラメータ更新部は、第三パラメータが第二パラメータよりも認識精度が高いと判定された場合、前記子認識装置が認識処理に用いる第二パラメータを前記第三パラメータに更新する
　請求項６記載のパターン認識システム。
　パラメータ更新部は、知識の蒸留に基づいて、第三パラメータからより小規模なパラメータを生成し、子認識装置が認識処理に用いる第二パラメータを生成されたパラメータで更新する
　請求項７記載のパターン認識システム。
　認識対象のデータと、当該データの正解ラベルと、当該データの収集環境を示すドメイン情報との組合せを含む第一の学習データを用いて、第一の認識器のパラメータである第一パラメータを生成し、
　前記第一パラメータを基に、所定の収集環境で収集された認識対象のデータと、当該データの正解ラベルと、前記所定の収集環境を示す対象ドメイン情報との組合せを含む第二の学習データを用いて、第二の認識器のパラメータである第二パラメータを生成し、
　前記第一パラメータおよび前記第二パラメータを統合して、前記第一の学習データを用いた学習により、前記入力データのパターン認識に用いられる第三パラメータを生成し、
　前記第三パラメータを生成する際、前記対象ドメイン情報に合致するドメイン情報を含む前記第一の学習データを用いた学習において、前記第二パラメータによる認識結果を優先させるように前記第三パラメータを生成する
　ことを特徴とするパラメータ生成方法。
　コンピュータに、
　認識対象のデータと、当該データの正解ラベルと、当該データの収集環境を示すドメイン情報との組合せを含む第一の学習データを用いて、第一の認識器のパラメータである第一パラメータを生成する第一パラメータ生成処理、
　前記第一パラメータを基に、所定の収集環境で収集された認識対象のデータと、当該データの正解ラベルと、前記所定の収集環境を示す対象ドメイン情報との組合せを含む第二の学習データを用いて、第二の認識器のパラメータである第二パラメータを生成する第二パラメータ生成処理、および、
　前記第一パラメータおよび前記第二パラメータを統合して、前記第一の学習データを用いた学習により、前記入力データのパターン認識に用いられる第三パラメータを生成する第三パラメータ生成処理を実行させ、
　前記第三パラメータ生成処理で、前記対象ドメイン情報に合致するドメイン情報を含む前記第一の学習データを用いた学習において、前記第二パラメータによる認識結果を優先させるように前記第三パラメータを生成させる
　ためのパラメータ生成プログラム。