JP2017224156A

JP2017224156A - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: JP2017224156A
Application number: JP2016119128A
Authority: JP
Inventors: 裕輔御手洗; Hirosuke Mitarai
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2016-06-15
Filing date: 2016-06-15
Publication date: 2017-12-21
Anticipated expiration: 2036-06-15
Also published as: US11544628B2; EP3258425A1; CN107527063B; JP6884517B2; US20170364826A1; EP3258425B1; CN107527063A

Abstract

【課題】転移学習を用いて、より高精度に識別可能な識別器を生成できるようにすることを目的とする。
【解決手段】目標とするタスクである第１のタスクの第１のカテゴリに属する複数の学習データである目標タスク学習データに係る第１の分布と、第１のタスクとは異なる第２のタスクの第１のカテゴリに属する学習データである元タスク学習データの第１のカテゴリに属する複数の学習データに係る第２の分布と、の差異に基づいて、元タスク学習データを変換するための変換パラメータを調整し、調整された変換パラメータに基づいて、元タスク学習データを変換し、変換された元タスク学習データと、目標タスク学習データとに基づいて、第１のタスクに係る識別器を生成する。
【選択図】図３

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。

入力パターンが特定のカテゴリのパターンであるか否かといった識別を行う方法として、様々な方法が提案されている。このような方法は、例えば、多数のデータ内から、特定のカテゴリであるパターン（特定カテゴリパターン）を検出したり、逆に、特定のカテゴリとは異なるパターン（非特定カテゴリパターン）を検出したりするような用途に用いることができる。

特定のカテゴリのパターンであるか否かを識別する方法としては、ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ（ＳＶＭ）等の２クラス識別器を用いる方法がある。これは、多数の特定カテゴリパターン、及び、多数の非特定カテゴリパターンを用いて、特定カテゴリパターンと、非特定カテゴリパターンとを分離する識別器を生成し、その識別器を用いてパターンを識別する方法である。

しかしながら、状況によってはどちらか一方のカテゴリパターンのデータ量が不足することがある。例えば、識別器の生成に用いる非特定カテゴリパターンが少ないと、識別器の生成に用いていない非特定カテゴリパターンを、特定のカテゴリであると誤判定しやすいように識別器が生成されてしまう場合がある。そこで、識別器の生成において、ターゲットであるタスクについての学習データを学習に適正な量だけ確保することが難しい場合等に、他のタスクについての学習データを利用する転移学習という技術がある。

例えば、特許文献１に記載の方法のように、十分な量の学習データが存在するタスクＡの学習データを変換して、それを、学習データが不十分な状況でパターンを学習したいタスクＢにおける学習データに追加する方法が提案されている。他のタスクからデータを追加して学習を行うことにより、学習データが不十分な状況でも学習することができる。この手法は、転移学習の手法の一例である。タスクＢのそれぞれの学習データに対応するタスクＡの学習データを用い、タスクＡからタスクＢへの変換規則を求めて、その変換規則により、その他のタスクＡの学習データを変換して、タスクＢの学習データに追加、即ち、転移する。これにより、量が不十分であるタスクＢの学習データを用いたパターンの学習においても、擬似的にデータを増やして学習を行うことができるようになる。

また、非特許文献１では、異なるタスク間で、同じカテゴリに属する学習データはより近く、異なるカテゴリに属する学習データはより遠くに写像されるような相互の変換規則を求める。そして、他のタスクの学習データをその変換規則により変換し、目標としているタスクの学習データに転移して学習を行う方法が提案されている。これも、特許文献１の手法と同様に、目標としているタスクのデータを用いた学習において、そのタスクのデータが少ない場合でも、他のタスクからパターンを変換して追加することで、擬似的にデータを増やした状態での学習が可能となる。

このように、入力パターンが特定のカテゴリのパターンであるか否かを識別することを目的とした識別器の生成方法において、以下の処理ができる。即ち、学習に用いることができる学習データの量が不十分な場合でも、他のタスクの学習データを用いて、擬似的に多くの学習データを用いて処理を行うことができる。

特許第３００３３５３号公報特開２００６−０７９２７２号公報特許第５４１４４１６号公報

Ｋｕｌｉｓ、Ｂ．ａｎｄＴ．Ｄａｒｒｅｌｌ、"ＷｈａｔＹｏｕＳａｗｉｓＮｏｔＷｈａｔＹｏｕＧｅｔ：ＤｏｍａｉｎＡｄａｐｔａｔｉｏｎＵｓｉｎｇＡｓｙｍｍｅｔｒｉｃＫｅｒｎｅｌＴｒａｎｓｆｏｒｍｓ"、ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ、ｐｐ．１７８５−１７９２、２０１１Ｄａｌａｌ、Ｎ．、Ｂ．ＴｒｉｇｇｓａｎｄＣ．Ｓｃｈｍｉｄ、"ＨｕｍａｎＤｅｔｅｃｔｉｏｎｕｓｉｎｇＯｒｉｅｎｔｅｄＨｉｓｔｏｇｒａｍｓｏｆＦｌｏｗａｎｄＡｐｐｅａｒａｎｃｅ"、ＩＥＥＥＥｕｒｏｐｅａｎＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ、Ｖｏｌ．２、ｐｐ．４２８−４４１、２００６Ｓｕｇｉｙａｍａ，Ｍ．，Ｔ．Ｋａｎａｍｏｒｉ，Ｔ．Ｓｕｚｕｋｉ，Ｍ．Ｃ．ｄｕＰｌｅｓｓｉｓ，Ｓ．ＬｉｕａｎｄＩ．Ｔａｋｅｕｃｈｉ，"Ｄｅｎｓｉｔｙ−ＤｉｆｆｅｒｅｎｃｅＥｓｔｉｍａｔｉｏｎ"，ＮｅｕｒａｌＣｏｍｐｕｔａｔｉｏｎ，Ｖｏｌ．２５，Ｎｏ．１０，ｐｐ．２７３４−２７７５，２０１３Ｙａｍａｄａ，Ｍ．，Ｔ．Ｓｕｚｕｋｉ，Ｔ．Ｋａｎａｍｏｒｉ，Ｈ．ＨａｃｈｉｙａａｎｄＭ．Ｓｕｇｉｙａｍａ，"ＲｅｌａｔｉｖｅＤｅｎｓｉｔｙ−ＲａｔｉｏＥｓｔｉｍａｔｉｏｎｆｏｒＲｏｂｕｓｔＤｉｓｔｒｉｂｕｔｉｏｎＣｏｍｐａｒｉｓｏｎ"，ＡｄｖａｎｃｅｓｉｎＮｅｕｒａｌＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍｓ２４，ｐｐ．５９４−６０２，２０１１

特許文献１や非特許文献１等の従来技術では、異なるタスク間で対応する、それぞれの学習データに含まれる、ある特定のデータに基づいて、タスク間の学習データの変換規則が求められる。そのため、求められた変換規則は、利用された特定のデータに依存する変換規則となってしまう。したがって、利用されたデータによっては変換規則が不十分なものとなり、適切な学習データが得られない可能性がある。
そこで本発明は、転移学習を用いて、より高精度に識別可能な識別器を生成できるようにすることを目的とする。

本発明の情報処理装置は、目標とするタスクである第１のタスクにおいて、第１のカテゴリに属する複数の学習データを、目標タスク学習データとして、取得する第１の取得手段と、前記第１のタスクとは異なる第２のタスクにおいて、前記第１のカテゴリに属する学習データと前記第１のカテゴリとは異なる第２のカテゴリに属する学習データとを含む複数の学習データを、元タスク学習データとして、取得する第２の取得手段と、前記目標タスク学習データの前記第１のカテゴリに属する複数の学習データに係る第１の分布と、前記元タスク学習データの前記第１のカテゴリに属する複数の学習データに係る第２の分布との差異に基づいて、前記元タスク学習データを変換するための変換パラメータを調整する調整手段と、前記調整手段により調整された前記変換パラメータに基づいて、前記元タスク学習データを変換する変換手段と、前記変換手段によって変換された元タスク学習データと、前記目標タスク学習データとに基づいて、前記第１のタスクに係る識別器を生成する生成手段と、を有する。

本発明によれば、転移学習を用いて、より高精度に識別可能な識別器を生成することができる。

情報処理装置のハードウェア構成等の一例を示す図である。情報処理装置の機能構成等の一例を示す図である。識別器学習処理の一例を示すフローチャートである。情報処理装置の機能構成等の一例を示す図である。パターン識別処理の一例を示すフローチャートである。処理対象となるパターンの一例を示す図である。情報処理装置の機能構成等の一例を示す図である。特徴選択処理の一例を示すフローチャートである。情報処理装置の機能構成等の一例を示す図である。パターン識別処理の一例を示すフローチャートである。情報処理装置の機能構成等の一例を示す図である。識別器学習処理の一例を示すフローチャートである。領域抽出エリアの一例を示す図である。

以下、図面を参照しながら、本発明の実施形態を説明する。

＜実施形態１＞
本実施形態では、情報処理装置１０がカメラ１６により撮影された画像に基づいて、カメラ１６の監視対象であるエリア内の異常を検出する識別器を生成する方法について説明する。以下では、異常が発生していない状況、つまり、正常な状況を示すカテゴリを、特定カテゴリ（第１のカテゴリ）とし、何らかの異常が発生している状況を示すカテゴリを、非特定カテゴリ（第２のカテゴリ）とする。また、以下では、特定カテゴリのデータ、つまり、正常な状況で監視カメラにより撮影された画像を正常データ、非特定カテゴリのデータ、つまり、何らかの異常が発生している状況で監視カメラにより撮影された画像を異常データとする。

まず、本実施形態の処理の概要について説明する。図１に示すように、情報処理装置１０は、予め、カメラ１６から監視エリアの撮影画像のデータである目標タスクにおける学習データ（目標タスク学習データ）を取得している。学習データとは、識別器の生成に利用されるデータであり、本実施形態の場合、監視エリアの撮影画像のデータや撮影画像のデータから抽出された特徴量のデータ等である。また、情報処理装置１０は、カメラ１６又はその他の監視カメラから、少なくとも１つの、監視エリアと類似したその他のエリアの撮影画像のデータである元タスクにおける学習データ（元タスク学習データ）を取得しているとする。本実施形態では、目標タスクは、監視エリアの異常事態を検出するタスクであり、元タスクは、監視エリアに類似するエリアの異常事態を検出するタスクである。目標タスクは、第１のタスクの一例であり、元タスクは、第２のタスクの一例である。本実施形態の処理は、情報処理装置１０が入力されたデータが正常であるか否かを判定する識別器を、目標タスク学習データと、元タスク学習データとを用いて生成する処理である。ここで、目標タスク学習データに含まれる正常データの量は、学習に十分な量である。しかし、目標タスク学習データに含まれる異常データの量は、目標タスク学習データに含まれる正常データの量に比べて非常に少ない、又は、０であるとする。

識別器の生成に用いられる非特定カテゴリの学習データが適正な量よりも少ないと、識別器の生成に用いられていない非特定カテゴリのパターンを、特定のカテゴリであると誤判定しやすい識別器が生成されてしまう場合がある。例えば、監視カメラにより撮影された画像に基づいて、異常な事態を検出するような用途において、識別器の生成に用いる異常な事態を示す学習データの数が少ないほど、このような状況が発生してしまう可能性が高くなる。つまり、学習に用いられた学習データに対応する事態以外の異常な事態を、正常な事態と判定してしまう識別器が生成されてしまう場合がある。このような状況の発生を抑えるためには、異常な事態を示すパターンを適正な量だけ用意して識別器を生成すればよいが、異常な事態は、発生頻度が正常な事態に比べて非常に低いため、そのようなパターンを適正な量だけ用意するのは困難であるという問題がある。

一方、元タスク学習データに含まれる正常データの量は、目標タスク学習データと同様に学習に十分な量であり、元タスク学習データに含まれる異常データの量は、目標タスク学習データに比べて、多いものとする。また、監視エリアに類似したエリアとは、例えば、目標タスク学習データが、ある駅構内の監視エリアを撮影したものである場合、その他の駅構内の監視エリア等のように状況が類似したエリアである。このようなエリアで撮影されたデータが、元タスク学習データとして利用されることになる。このように、本実施形態では、目標タスク学習データと、元タスク学習データと、の２つの学習データを用いて識別器を生成する例について説明するが、何れの学習データにおいても、正常データについては十分な量が存在する。そして、情報処理装置１０は、特定カテゴリの学習データの分布の差異に基づいて、データの変換規則を求める。情報処理装置１０は、求めた変換規則に基づき、元タスク学習データの非特定カテゴリに属する学習データを変換して、目標タスクの非特定カテゴリに属する学習データとして利用する。目標タスクの特定カテゴリに属する学習データの分布は、第１の分布の一例であり、元タスクの特定カテゴリに属する学習データの分布は、第２の分布の一例である。情報処理装置１０は、特定のデータに依らない変換規則で学習データを変換することで、変換後の学習データが不適切なものとなる可能性を低減できる。
また、本実施形態では、情報処理装置１０は、元タスクの学習データの異常データを変換して目標タスクの学習データに追加する。これにより、情報処理装置１０は、目標タスクの学習データには存在しないが、元タスクの学習データには存在するようなタイプの異常データを、擬似的に目標タスクの学習データとして追加することができる。そのため、情報処理装置１０は、目標タスクの学習データには存在しなかったタイプの異常データに対しても、正しく異常であると判定できる識別器を生成できる可能性を高めることができる。

図１は、情報処理装置１０のハードウェア構成等の一例を示すブロック図である。情報処理装置１０は、ＣＰＵ１１、主記憶装置１２、補助記憶装置１３、入出力Ｉ／Ｆ１４を含む。ＣＰＵ１１、主記憶装置１２、補助記憶装置１３、入出力Ｉ／Ｆ１４は、システムバス１５を介して、相互に接続されており、相互に情報のやり取りを行う。
ＣＰＵ１１は、情報処理装置１０の処理を制御する中央演算装置である。主記憶装置１２は、ＣＰＵ１１のワークエリアやデータの一時保存領域として利用される記憶装置である。補助記憶装置１３は、各種プログラムや各種設定データ、識別器の生成に用いられる学習データ等を記憶する記憶装置である。入出力Ｉ／Ｆ１４は、カメラ１６等の外部の装置との間での情報の入出力に利用されるインターフェースである。本実施形態のカメラ１６は、設定された監視エリアを撮影し、撮影した画像のデータを、情報処理装置１０に送信する監視カメラである。
ＣＰＵ１１が、補助記憶装置１３等に記憶されたプログラムに基づき処理を実行することによって、図２、４、６、９、１１で後述する情報処理装置１０の機能、及び図３、５、７、１０、１２で後述するフローチャートの処理が実現される。

図２は、本実施形態の情報処理装置１０における識別器を生成するための機能構成等の一例を示すブロック図である。また、図３は、識別器学習処理の一例を示すフローチャートである。以下、図２、及び、図３を用いて、本実施形態の識別器生成方法について説明する。
情報処理装置１０は、目標タスク学習データ入力部２０、元タスク学習データ入力部２１、目標タスク学習データ保持部２０ＤＢ、元タスク学習データ保持部２１ＤＢ、特徴抽出部２２を含む。また、情報処理装置１０は、目標タスク学習パターン保持部２２−０ＤＢ、元タスク学習パターン保持部２２−１ＤＢ、変換規則算出部２３、変換処理部２４、識別器生成部２５、識別器データ出力部２６を含む。
目標タスク学習データ入力部２０は、カメラ１６、補助記憶装置１３等から目標タスクの学習データを取得する。元タスク学習データ入力部２１は、補助記憶装置１３等から予め記憶されている元タスクの学習データを取得する。

目標タスク学習データ保持部２０ＤＢは、目標タスク学習データ入力部２０により取得された学習データを保持するデータベースであり、補助記憶装置１３に実装される。元タスク学習データ保持部２１ＤＢは、元タスク学習データ入力部２１により取得された学習データを保持するデータベースであり、補助記憶装置１３に実装される。
特徴抽出部２２は、目標タスク学習データ保持部２０ＤＢ、元タスク学習データ保持部２１ＤＢに保持されている学習データから特徴抽出を行う。目標タスク学習パターン保持部２２−０ＤＢは、目標タスク学習データ保持部２０ＤＢに保持されている学習データから特徴抽出部２２により抽出された特徴ベクトルのデータを保持するデータベースであり、補助記憶装置１３に実装される。元タスク学習パターン保持部２２−１ＤＢは、元タスク学習データ保持部２１ＤＢに保持されている学習データから特徴抽出部２２により抽出された特徴量のデータを保持するデータベースであり、補助記憶装置１３に実装される。
変換規則算出部２３は、目標タスク学習パターン保持部２２−０ＤＢ、元タスク学習パターン保持部２２−１ＤＢに保持される特徴量のデータに基づいて、元タスクの学習データの特徴量を、目標タスクの学習データの特徴量に変換するための変換規則を算出する。

変換処理部２４は、元タスク学習パターン保持部２２−１ＤＢに保持される特徴量のデータを、変換規則算出部２３により算出された変換規則に基づいて、目標タスクの学習データの特徴量に変換する。
識別器生成部２５は、目標タスク学習パターン保持部２２−０ＤＢに保持されている特徴量のデータと、変換処理部２４により変換された特徴量のデータと、に基づいて、識別器を生成する。
識別器データ出力部２６は、識別器生成部２５により生成された識別器のデータを出力する。例えば、識別器データ出力部２６は、識別器のデータを、補助記憶装置１３に記録することにより出力する。

次に、識別器を生成する具体的な処理手順について図３を参照しながら説明する。
Ｓ３０において、目標タスク学習データ入力部２０は、監視エリアにおける異常を検出するための識別器の生成に用いられる学習データとして、監視エリアの撮影画像のデータを、カメラ１６から取得する。また、目標タスク学習データ入力部２０は、補助記憶装置１３に予め記憶されている監視エリアの撮影画像のデータを、補助記憶装置１３から取得することとしてもよい。本実施形態では、目標タスク学習データ入力部２０は、学習データとして、Ｎｔ個の正常データと、Ｍｔ個の異常データとを取得する。そして、目標タスク学習データ入力部２０は、取得した学習データを、目標タスク学習データ保持部２０ＤＢに記録する。

Ｓ３１において、元タスク学習データ入力部２１は、補助記憶装置１３に予め記憶されている監視エリアに類似するエリアの撮影画像のデータを、補助記憶装置１３から取得する。このとき、元タスク学習データ入力部２１は、Ｎｓ個の正常データと、Ｍｓ個の異常データとを、それぞれ元タスクの学習データとして取得する。また、元タスク学習データ入力部２１は、監視エリアに類似したエリアの撮影画像を、元タスクの学習データとして、カメラ１６やその他の監視カメラから取得することとしてもよい。元タスク学習データ入力部２１は、取得した元タスクの学習データを、元タスク学習データ保持部２１ＤＢに記録する。
Ｓ３２において、特徴抽出部２２は、Ｓ３０、及び、Ｓ３１において取得されたそれぞれのデータに対して特徴抽出を行う。本実施形態では、Ｓ３０、Ｓ３１で取得されたデータが画像であるため、特徴抽出部２２は、画像を対象とした特徴抽出として、特許文献２に記載の立体高次局所自己相関特徴（ＣＨＬＡＣ）の抽出を行う。これにより、特徴抽出部２２は、１つのデータに対して、２５１次元の特徴ベクトルを抽出する。

特徴抽出部２２は、Ｓ３０で取得されたデータから抽出した特徴ベクトルを、目標タスク学習パターン保持部２２０ＤＢに記録する。また、特徴抽出部２２は、Ｓ３１で取得されたデータから抽出した特徴ベクトルを、元タスク学習パターン保持部２２１ＤＢに記録する。以下では、目標タスク学習パターン保持部２２０ＤＢに記録された、目標タスクの学習データの正常データから抽出された特徴ベクトルを目標正常パターンとする。また、以下では、目標タスク学習パターン保持部２２０ＤＢに記録された、目標タスクの学習データの異常データから抽出された特徴ベクトルを目標異常パターンとする。また、元タスク学習パターン保持部２２１ＤＢに記録された、元タスクの学習データの正常データから抽出された特徴ベクトルを元正常パターンとする。また、元タスク学習パターン保持部２２１ＤＢに記録された、元タスクの学習データの異常データから抽出された特徴ベクトルを元異常パターンとする。
したがって、本実施形態では、目標正常パターンとしてＮｔ個の２５１次元ベクトルと、目標異常パターンとしてＭｔ個の２５１次元ベクトルとが、目標タスク学習パターン保持部２２０ＤＢに記録される。そして、元正常パターンとしてＮｓ個の２５１次元ベクトルと、元異常パターンとしてＭｓ個の２５１次元ベクトルとが、元タスク学習パターン保持部２２１ＤＢに記録されることになる。本実施形態では、特徴抽出部２２は、Ｓ３２で、特徴量としてＣＨＬＡＣの抽出を行うこととしたが、他の特徴量を抽出してもよい。例えば、特徴抽出部２２は、非特許文献２に記載の、ＭｏｔｉｏｎＢｏｕｎｄａｒｙＨｉｓｔｏｇｒａｍ（ＭＢＨ）特徴量等を抽出しても構わない。

Ｓ３３において、変換規則算出部２３は、Ｓ３２で抽出された特徴量に基づいて、元タスクの学習データの特徴量を目標タスクの学習データの特徴量に変換するための変換規則を求める処理を行う。変換規則算出部２３は、目標タスク学習パターン保持部２２−０ＤＢに記録されている複数の目標正常パターン、及び、元タスク学習パターン保持部２２−１ＤＢに記録されている複数の元正常パターンを用いて、処理を行う。本実施形態では、変換規則算出部２３は、元タスクの学習データの特徴量を目標タスクの学習データの特徴量に、線形変換を用いて変換するためのパラメータを算出する。即ち、元正常パターン、又は元異常パターンをベクトルｚとすると、ベクトルｚを、目標正常パターンや目標異常パターンと同様の２５１次元のベクトルに変換することになる。変換後のベクトルをベクトルｘ'とした場合、ベクトルｘ'の次元である２５１次の正方行列Ａ、及び、２５１次元のバイアスベクトルｂを用いて、変換処理部２４は、ｘ'＝Ａ^Tｚ＋ｂと変換することになる。ここで、上付きＴは行列の転置である。Ｓ３３では、変換規則算出部２３は、変換に用いられる変換パラメータである、行列Ａの各成分、及び、バイアスベクトルｂの各要素の値を求めることになる。
本実施形態では、変換規則算出部２３は、行列Ａの各成分とバイアスベクトルｂとの各要素の値を、目標正常パターンの分布と線形変換により変換された後の元正常パターンの分布との差異を最も小さくするようにすることで求める。より具体的には、変換規則算出部２３は、目標正常パターンの分布と、変換された後の元正常パターンの分布との間のＬ２距離の推定値を最小化するような、行列Ａの各成分、及びバイアスベクトルｂの各要素の値を求める。つまり、それぞれのデータの密度分布の差異が最小化するように、線形変換の変換パラメータを求めることになる。本実施形態では、変換規則算出部２３は、目標正常パターンの分布と、変換された後の元正常パターンの分布との間のＬ２距離の推定値を、非特許文献３に記載の推定方法により求める。また、変換規則算出部２３は、目標正常パターンの分布と、変換された後の元正常パターンの分布との間のＬ２距離の推定値が設定された閾値よりも小さくなるような任意の値で、行列Ａの各成分、及びバイアスベクトルｂの各要素の値を求めることとしてもよい。
目標正常パターンの分布をχ、行列Ａ、及び、バイアスベクトルｂによる変換された後の元正常パターンの分布をχ'とした時、Ｌ２距離の推定値Ｌ^II（χ，χ'）は、以下の式１により求められる。

式１中のｈ、及び、θは、それぞれ（Ｎｔ＋Ｎｓ）次元のベクトルでる。また、Ｈは、Ｎｔ＋Ｎｓ次の正方行列である。ｈ、Ｈ、θは、それぞれ、以下の式２〜式４で表される。

ｘ_ｉは、ｉ番目の目標正常パターン、ｘ_j'は、ｊ番目の元正常パターンである。また
、ｃ_kは、ｋ≦Ｎｔの場合、ｃ_k＝ｘ_kとなり、ｋ＞Ｎｔの場合、ｃ_k＝ｘ_k−Ｎｔ'となる値である。そして、σは、ガウス基底関数のパラメータで、λは、正則化パラメータ、Ｉは、（Ｎｔ＋Ｎｓ）次の単位行列である。
本実施形態では、変換規則算出部２３は、行列Ａとバイアスベクトルｂとの各要素に適当な初期値を設定（例えば、擬似乱数等に基づいて求まる値を設定）する。そして、変換規則算出部２３は、式１に示したＬ２距離の推定値を表す式を行列Ａやバイアスベクトルｂに対応するパラメータで微分した式に基づいて、行列Ａやバイアスベクトルｂに対応するパラメータを更新していく。即ち、変換規則算出部２３は、勾配法により、行列Ａとバイアスベクトルｂとを求める。式１で求まるＬ２距離の推定値を、変換のパラメータである行列Ａの成分ａで微分した式は、以下の式５のように表される。

式５を用いることにより、行列Ａのｒ行ｃ列の成分ａ_rcの更新後の値は、以下の式６のようになる。

同様に、バイアスベクトルｂのｃ番目の要素ｂ_cの更新後の値は、以下の式７のようになる。

ここで、ηは、学習係数である。ηの値は、一定の値でもよいし、行列Ａ及びバイアスベクトルｂの更新の都度、徐々に小さくするようにしてもよい。例えば、変換規則算出部２３は、行列Ａ及びバイアスベクトルｂの更新を１回行う度に、ηの値をη＝０．９×ηの値に更新することとしてもよい。
変換規則算出部２３は、行列Ａ及びバイアスベクトルｂの更新を、Ｌ２距離の推定値の減少量、及び、学習係数ηが、共に設定された閾値（例えば１０^-6等）よりも小さくなるまで繰り返し実行する。これにより、変換規則算出部２３は、変換のための変換パラメータである行列Ａ、及び、バイアスベクトルｂの値を調整する。変換規則算出部２３により求められた変換のためのパラメータ（本実施形態では、行列Ａ及びバイアスベクトルｂ）を、変換パラメータ２３ｄとする。
以上のように、本実施形態では、変換規則算出部２３は、目標タスク学習データの特定カテゴリデータの分布と、変換後の元タスク学習データの特定カテゴリデータの分布と、の差異に基づいて変換規則を求める。
Ｓ３３における勾配法は、Ｌ２距離の局所最小化であるため、最終的な結果は、変換パラメータの初期値に依存する。そのため、予め設定されている行列Ａ及びバイアスベクトルｂの複数（例えば３つ、４つ）の初期値について、変換規則算出部２３は、これらの初期値毎にＳ３３の処理を行い、以下の処理を行うこととしてもよい。即ち、変換規則算出部２３は、これらの初期値毎に実行した処理の結果、最終的なＬ２距離の推定値が、最も小さかった場合の変換パラメータを採用することとしてもよい。また、変換規則算出部２３は、ガウス基底関数のパラメータσ、及び、正則化パラメータλに関しては、交差検定により、検定データに対するＬ２距離の推定値の平均値が、最も小さくなるようなパラメータを設定すればよい。Ｓ３３の処理は、変換パラメータの値を調整する調整処理の一例である。

Ｓ３４において、変換処理部２４は、Ｓ３３で求められた変換規則を用い、Ｓ３２で抽出されたＭｓ個の元異常パターンを変換する処理を行う。本実施形態においては、変換処理部２４は、Ｓ３３で求められた行列Ａ、及び、バイアスベクトルｂを用いた線形変換を行うことになる。Ｓ３４で変換された元異常パターンは、識別器生成部２５による識別器の生成処理に用いられる。本実施形態では、情報処理装置１０は、元異常パターンのみを変換するが、元正常パターンも変換して識別器の生成に用いてもよい。

Ｓ３５において、識別器生成部２５は、目標タスクパターン保持部３２−０ＤＢから、Ｎｔ個の目標正常パターン、Ｍｔ個の目標異常パターンを取得する。そして、識別器生成部２５は、取得したＮｔ個の目標正常パターン及びＭｔ個の目標異常パターンと、Ｓ３４で変換されたＭｓ個の元異常パターンと、を用いて、識別器の生成を行う。本実施形態では、識別器生成部２５は、Ｓ３５で、識別器としてガウスカーネルを用いた非線形ＳＶＭの学習を行う。つまり、識別器生成部２５は、目標正常パターンを正例パターンとし、目標異常パターン、及び、変換された元異常パターンを負例パターンとした２クラス識別器の生成を行う。識別器生成部２５は、Ｓ３４で元正常パターンも変換した場合、変換した元正常パターンは、正例パターンとして学習に用いればよい。
本実施形態では、識別器生成部２５は、Ｓ３５で識別器としてＳＶＭの学習を行うが、例えば、ロジスティック回帰等、その他の識別器の生成を行うこととしてもよい。また、識別器生成部２５は、例えばＡｄａＢｏｏｓｔのような、各パターンに対して重みを設定して学習を行える識別器の生成を行う場合、変換した元異常パターンのようなデータの初期の重みを目標異常パターンの重みよりも小さくして学習してもよい。この場合、識別器生成部２５は、Ｓ３３で求められた、最終的なＬ２距離の推定値が大きいほど、この重みを小さくするように設定すると好適である。

Ｓ３６において、識別器データ出力部２６は、Ｓ３５での学習処理の結果を外部に出力して、図３の処理を終了する。例えば、識別器データ出力部２６は、Ｓ３５で生成された識別器のデータを、補助記憶装置１３等に記憶することで、出力する。本実施形態では、識別器データ出力部２６は、識別器としてＳＶＭの学習が行われるので、複数のサポートベクターと、それぞれに対応する係数、及び、閾値の情報を出力することになる。

以上のように、本実施形態では、情報処理装置１０は、まず、目標タスクの特定カテゴリデータの分布と、変換後の元タスクの特定カテゴリデータの分布との差異に基づいて変換規則を求める。より具体的には、情報処理装置１０は、各密度分布の差異が局所最小化するように変換規則を求める。これにより、特定のデータに依存せずにタスク間の違いを吸収するような変換規則を求めることができるようになる。そして、情報処理装置１０は、その変換規則を用いて元タスクのデータを変換することで、変換したデータを目標タスクにおける学習用データとして利用することができる。
上記のように、この変換規則は、特定のデータに依存せずタスク間の違いを吸収するような変換規則である。そのため、例えば、この変換規則を用いて元タスクの異常データを変換することにより、変換した異常データは、目標タスクの異常データとして利用できる可能性が高くなる。即ち、情報処理装置１０は、変換後の学習データが不適切となる可能性を低減できることになる。そのため、情報処理装置１０は、学習に用いることができるデータが少ない場合でも、このように他のタスクのデータを変換して用いることにより、擬似的に多くのデータを用いて処理を行うことができる。そのため、本実施形態の処理により生成された識別器は、少ない学習データのみを用いた場合と比較して、例えば、目標タスク学習データには存在しないが、元タスク学習データには存在するようなタイプの異常データを検出できる可能性が高くなる。即ち、情報処理装置１０は、識別器の識別精度をより向上させることができる。
本実施形態では、情報処理装置１０は、１つの元タスク学習データのみを利用したが、複数の元タスク学習データを利用することもできる。より具体的には、情報処理装置１０は、各元タスク学習データについて、Ｓ３１〜Ｓ３３の処理を行い、それぞれに対応した変換規則を求める。そして、情報処理装置１０は、各元タスクに対応した変換規則により、元タスク学習データを変換して、変換したデータを識別器の生成に用いるようにすればよい。また、本実施形態では、目標タスク学習データに異常データが含まれる場合について説明したが、目標タスク学習データに異常データが含まれないこととしてもよい。その場合、情報処理装置１０は、元タスクの異常データを変換したデータを、疑似的に、目標タスクの異常データとして、識別器の生成を行う。

次に、図３の処理により生成された識別器を用い、監視カメラの画像に基づいて、監視エリア内の異常を検出するパターン識別処理について説明する。
図４は、情報処理装置１０におけるパターンの識別を行うための機能構成の一例を示すブロック図である。図５は、パターン識別処理の一例を示すフローチャートである。以下、図４、及び、図５を用いて、本実施形態のパターン識別処理について説明する。
情報処理装置１０は、識別器データ入力部４０、データ入力部４１、特徴抽出部４２、特定カテゴリ度算出部４３、及び識別結果出力部４４を含む。
識別器データ入力部４０は、図３の処理により出力された識別器のデータを取得する。データ入力部４１は、カメラ１６から撮影エリアの撮影画像のデータを取得する。特徴抽出部４２は、データ入力部４１により取得されたデータから特徴量を抽出する。特定カテゴリ度算出部５３は、特徴抽出部４２により抽出された特徴量に基づいて、データ入力部４１により取得されたデータの特定カテゴリらしさを示す特定カテゴリ度を算出する。識別結果出力部５４は、特定カテゴリ度算出部５３により算出された特定カテゴリ度に基づいて、データ入力部４１により取得されたデータが特定カテゴリに属するか否かを判定し、判定結果を出力する。

次に、識別器を用いてパターンを識別する具体的な処理手順について図５を参照しながら説明する。
Ｓ５０において、識別器データ入力部４０は、図３の処理で生成された識別器のデータを、補助記憶装置１３等から取得する処理を行う。本実施形態では、識別器データ入力部４０は、ＳＶＭのサポートベクターと、それぞれに対応する係数、及び、閾値の情報を取得する。Ｓ５０で取得された識別器データは、特定カテゴリ度算出部４３により用いられるため、識別器データ入力部４０は、取得した識別器のデータを、特定カテゴリ度算出部４３に送信する。また、識別器の入力データが特定カテゴリか非特定カテゴリかの判定に利用される閾値の情報は、識別結果出力部４４により用いられる。そのため、識別器データ入力部４０は、このデータを、識別結果出力部４４に送信する。

Ｓ５１において、データ入力部４１１は、カメラ１６から、異常が存在するか否かの判定を行う対象である監視エリアの撮影画像のデータを取得する処理を行う。
Ｓ５２において、特徴抽出部４２は、Ｓ５１で取得した撮影画像のデータに対し、Ｓ３２の処理と同様にＣＨＬＡＣの抽出を行う。特徴抽出部４２は、Ｓ５２の処理により、Ｓ５１で取得された画像データに対する特徴抽出を行い、２５１次元の特徴ベクトルを得ることになる。
Ｓ５３において、特定カテゴリ度算出部４３は、Ｓ５０で取得された識別器のデータ、及び、Ｓ５２で抽出された特徴ベクトルを用い、以下の式８により特定カテゴリ度の算出を行う。

式８で、ｘは、Ｓ５２において抽出した２５１次元の特徴ベクトルである。また、ｘ_(sv)ｉは、全部でＮ_SV個のサポートベクターの内のｉ番目のサポートベクターで、これも２
５１次元のベクトルである。α_(SV)ｉは、ｉ番目のサポートベクターに対応する係数で、
ｋ（ｘ、ｘ'）は、ＳＶＭの学習時に用いたカーネル関数（例えばガウスカーネル等）である。Ｓ５３で求める特定カテゴリ度は、本実施形態では、正常らしさを表した尺度となる。

Ｓ５４において、識別結果出力部４４は、Ｓ５３で算出された特定カテゴリ度と、Ｓ５０で取得された識別器の閾値と、を比較する。そして、識別結果出力部４４は、特定カテゴリ度が閾値より大きい場合、Ｓ５１で取得された画像内において、異常な事態は発生していないと判定する。識別結果出力部４４は、特定カテゴリ度が閾値以下である場合、Ｓ５１で取得された画像内で、異常な事態が発生していると判定する。そして、識別結果出力部４４は、Ｓ５４での判定処理の結果を出力する処理を行う。例えば、識別結果出力部４４は、Ｓ５４での判定処理の結果を、情報処理装置１０の表示部に表示することで出力する。そして、識別結果出力部４４は、図５の処理を終了する。情報処理装置１０は、図３の処理により生成した識別器を用いることで、少ない異常データのみで学習した識別器を用いる場合と比較して、様々な種類の異常を検出することができる。

本実施形態では、カメラ１６から取得された１つの画像に対するパターン識別処理について説明した。しかし、情報処理装置１０は、図５のＳ５１以降の処理を繰り返すことにより、カメラ１６により撮影される画像に対して、継続的に異常を検出する処理を行うこともできる。また、本実施形態では、識別結果出力部４４は、Ｓ５４で特定カテゴリ度が特定カテゴリであるか否かを判定するための閾値として、Ｓ３５で算出された閾値を用いたが、他の閾値を用いてもよい。例えば、識別結果出力部４４は、より異常に対して敏感にすることを可能とするために、Ｓ３５で算出された閾値に設定された値を加えた値を、閾値として用いてもよい。
本実施形態では、情報処理装置１０がカメラ１６で撮影された画像における異常を検出する例を示した。情報処理装置１０は、例えば、監視目的でないカメラからの画像を入力として、特にイベントが発生していない状況を撮影したデータを、本実施形態の正常データと置き換え、特定のイベントが発生したか否かを検出するといったことが可能になる。このように、情報処理装置１０は、正常、異常の判定だけでなく、その他のパターン識別処理も可能である。

以上、本実施形態の処理により、情報処理装置１０は、十分な量の目標タスクの正常データと、十分な量の元タスクの正常データと、に基づいて、元タスクの学習データの特徴量を、目標タスクの学習データの特徴量に変換する変換パラメータを求める。このように、情報処理装置１０は、特定のデータに依存しない変換パラメータを求め、求めた変換規則に基づいて、元タスクの学習データを変換する。求められた変換パラメータは、特定のデータに依存せず、汎用性があるため、変換後のデータが不適切である可能性が抑制される。即ち、情報処理装置１０は、転移学習において、変換後の学習データが不適切なものとなる可能性を低減することができる。
また、情報処理装置１０は、目標タスクにおける負例の学習データを十分に確保できない場合でも、負例の学習データが十分な量だけ存在する元タスクの学習データから元異常パターンを変換し、識別器の生成に利用する。これにより、情報処理装置１０は、識別器が目標タスクにおける負例の学習データにオーバーフィットすることを防止することができる。
また、情報処理装置１０は、識別器の生成に、元タスクの負例の学習データのみを変換して利用し、元タスクの正例の学習データを利用しないようにしている。これにより、情報処理装置１０は、識別器が正常と識別する範囲を拡大させることなく、異常を正常と識別するような見逃しが発生する確率を低減できる。

＜実施形態２＞
本実施形態では、実施形態１の変形として、複雑なテクスチャパターンを有する製造物の表面を撮影した画像から、その表面上の欠陥を、異常パターンとして検出する際に用いる識別器の生成方法を説明する。本実施形態では、情報処理装置１０は、複雑なテクスチャパターンを有する製造物として、表面に粗し加工を施したゴム板の表面上の欠陥を検出する識別器の生成を行うこととする。即ち、本実施形態の目標タスクは、表面に粗し加工を施したゴム板の表面上の欠陥を検出することである。しかし、情報処理装置１０は、その他の物の表面上の欠陥を検出する識別器の生成を行うこととしてもよい。
本実施形態の情報処理装置１０のハードウェア構成は、実施形態１と同様であるとする。また、本実施形態のカメラ１６は、製造物の表面を撮影し、製造物の品質管理のための画像を撮影するカメラである。

図６に、本実施形態での識別器による識別処理の対象となるパターンの例を示す。図６（ａ）〜図６（ｊ）の画像は、表面粗し加工が施されたゴム板の表面を撮影したグレースケール画像から、１２８×１２８画素の領域が切り出された画像である。図６（ａ）〜（ｅ）は、正常であるゴム板の画像から切り出された画像である。図６（ｆ）〜（ｊ）は、欠陥を含むゴム板の画像から、欠陥部（図中、丸印にて図示）を含むように切り出された画像である。本実施形態では、図６（ａ）〜（ｅ）のような正常であるゴム板の画像データを正常データとする。また、図６（ｆ）〜（ｊ）のようなゴム板の欠陥部を含む画像データを異常データとする。図６（ｆ）、（ｇ）は、黒いスポット状のムラのような欠陥が存在する異常データであり、図６に示されるように、形状やサイズが様々である。また、図６（ｈ）のように、全体的にグラデーションがあるようなパターンや、図６（ｉ）のように、白いスポット状のムラがあるもの、図６（ｊ）のように、テクスチャのコントラストが一部だけ低いようなもの等、様々な欠陥の種類が存在する。本実施形態では、情報処理装置１０は、図６（ａ）〜（ｅ）のような画像データが与えられた場合には、正常なデータであると判定し、図６（ｆ）〜（ｊ）のような画像データが与えられた場合は、異常なデータであると判定する識別器を生成する。

図７は、本実施形態の情報処理装置１０における識別器を生成するための機能構成等の一例を示すブロック図である。また、図８は、識別器生成処理の一例を示すフローチャートである。以下、図７、及び、図８を用いて、本実施形態の識別器生成処理について説明する。本実施形態では、実施形態１と異なる点について説明する。
情報処理装置１０は、目標タスク学習データ入力部７０、目標タスク学習データ保持部７０ＤＢ、類似タスク探索部７１−０、従来タスク学習データ保持部７１−０ＤＢ、元タスク学習データ入力部７１−１、元タスク学習データ保持部７１−１ＤＢを含む。また、情報処理装置１０は、特徴抽出部７２、目標タスク学習パターン保持部７２−０ＤＢ、元タスク学習パターン保持部７２−１ＤＢ、変換規則算出部７３、変換処理部７４、特徴選択部７５、識別器生成部７６、識別器データ出力部７７を含む。

目標タスク学習データ入力部７０は、カメラ１６、補助記憶装置１３等から目標タスクの学習データを取得する。
目標タスク学習データ保持部７０ＤＢは、目標タスク学習データ入力部７０により取得された学習データを保持するデータベースであり、補助記憶装置１３に実装される。
類似タスク探索部７１−０は、学習データが目標タスクと類似したタスクを、複数の従来タスク学習データのタスクから探索する。
従来タスク学習データ保持部７１−０ＤＢは、従来タスク学習データを保持するデータベースであり、補助記憶装置１３に実装される。なお、従来タスク学習データについては後述する。
元タスク学習データ入力部７１−１は、従来タスク学習データ保持部７１−０ＤＢ内の複数の従来タスク学習データの内、類似タスク探索部７１−０により探索された学習データを元タスク学習データとして取得する。
元タスク学習データ保持部７１−１ＤＢは、元タスク学習データ入力部７１−２により取得された元タスク学習データを保持するデータベースであり、補助記憶装置１３に実装される。
特徴抽出部７２は、目標タスク学習データ保持部７０ＤＢ、元タスク学習データ保持部７１−１ＤＢに保持されている学習データから特徴抽出を行う。
目標タスク学習パターン保持部７２−０ＤＢは、目標タスク学習データ保持部７０ＤＢに保持されている学習データから特徴抽出部７２により抽出された特徴量のデータを保持するデータベースであり、補助記憶装置１３に実装される。
元タスク学習パターン保持部７２−１ＤＢは、元タスク学習データ保持部７１−１ＤＢに保持されている学習データから特徴抽出部７２により抽出された特徴量のデータを保持するデータベースであり、補助記憶装置１３に実装される。

変換規則算出部７３は、目標タスク学習パターン保持部７２−０ＤＢ、元タスク学習パターン保持部７２−１ＤＢに保持される特徴量のデータに基づいて、元タスクの学習データの特徴量を、目標タスクの学習データの特徴量に変換するための変換規則を算出する。
変換処理部７４は、元タスク学習パターン保持部７２−１ＤＢに保持される特徴量のデータを、変換規則算出部７３により算出された変換規則に基づいて、目標タスクの学習データの特徴量に変換する。
特徴選択部７５は、変換処理部７４により変換された特徴量、目標タスク学習データ保持部７０ＤＢに含まれる特徴量のうち、識別器の生成に用いる特徴量を選択する。
識別器生成部７６は、特徴選択部７５により選択された特徴量に基づいて、識別器の生成を行う。
識別器データ出力部７７は、識別器生成部２５により生成された識別器のデータを出力する。例えば、識別器データ出力部７７は、識別器のデータを、補助記憶装置１３に記憶することにより、出力する。

次に、識別器を生成する具体的な処理手順について図８を参照しながら説明する。
Ｓ８０において、目標タスク学習データ入力部７０は、カメラ１６、補助記憶装置１３等から、識別器の生成に用いられる、目標タスクの学習データを取得する。本実施形態では、目標タスク学習データ入力部７０は、目標タスクの学習データとして、図７に示したようなゴム板の表面が撮影された画像データを複数取得する。本実施形態では、目標タスク学習データ入力部７０は、Ｓ８０で、図７（ａ）〜（ｅ）のような、欠陥の無いＮｔ枚の画像データ（正常データ）と、図７（ｆ）〜（ｊ）のような、何らか欠陥が存在するＭｔ枚の画像データ（異常データ）を取得する。目標タスク学習データ入力部７０は、取得したデータを、目標タスク学習データ保持部７０ＤＢに記録する。本実施形態では、Ｍｔ枚の異常データが取得されるが、Ｍｔ＝０であってもよい。

Ｓ８１−０において、類似タスク探索部７１−０は、Ｓ８０で取得された目標タスク学習データに基づき、学習データが目標タスクと類似したタスクを、複数の従来タスク学習データのタスクから探索する処理を行う。ここで、従来タスク学習データとは、過去に他の製造物の表面を撮影することにより取得した、目標タスク学習データと同様、正常データと異常データとからなるタスク毎の学習データである。本実施形態では、まず、類似タスク探索部７１−０は、従来タスク学習データの正常データの画素値の分散が、目標タスク学習データの正常データにおける画素値の分散と類似する学習データを探索する処理を行う。例えば、類似タスク探索部７１−０は、各従来タスク学習データにおける正常データについて画素値の分散を求め、求めた分散と目標タスク学習データの正常データとの画素値の分散との差分の大きさに反比例する類似度を決定する。この類似度は、各従来タスク学習データが目標タスク学習データとどれくらい類似しているかを示す指標である。類似タスク探索部７１−０は、タスク毎に類似度の平均値を算出し、算出した平均値が設定された閾値以上であるタスクを、目標タスクに類似するタスクとして探索する。
本実施形態では、類似タスク探索部７１−０は、正常データの画素値の分散が類似しているタスクを探索するが、例えば、Ｃｏ−ｏｃｃｕｒｒｅｎｃｅＭａｔｒｉｘに基づくテクスチャ特徴量が類似している学習データのタスクを探索する等でもよい。ただし、正常データ間の類似性に基づいて、類似するタスクを探索する方が好適である。また、類似タスク探索部７１−０は、画像データの情報だけでなく、例えば、製造物の素材情報や、製造工程の情報を別途取得し、その情報を利用して、類似するタスクを探索する等してもよい。このように、本実施形態では、類似タスク探索部７１−０は、複数の従来タスク学習データの中から、学習データの類似性に基づき、目標タスクに類似する従来タスクを探索する。しかし、類似タスク探索部７１−０は、例えば、目標タスクが、製造物の製造工程変更に対応するものである場合等は、製造工程変更前のデータを利用するようにしてもよい。

Ｓ８１−１において、元タスク学習データ入力部７１−１は、従来タスク学習データ保持部７１−０ＤＢからＳ８１−０で探索された従来タスクに属する学習データを、元タスク学習データとして取得する処理を行う。本実施形態では、元タスク学習データ入力部７１−１は、元タスク学習データとして、Ｎｓ枚の正常データ、及び、Ｍｓ枚の異常データを取得する。元タスク学習データ入力部７１−１は、取得した学習データを、元タスク学習データ保持部７１−１ＤＢに記録する。

Ｓ８２において、特徴抽出部７２は、Ｓ８０、Ｓ８１−１で取得されたそれぞれの学習データに対して特徴抽出を行う。本実施形態では、Ｓ８０、Ｓ８１−１で取得された各画像それぞれに対し、画素値の平均値や、分散、最大値といった、ｄ種類（例えば３０種類程度）の特徴量を抽出する。特徴抽出部７２は、各画像データから抽出された、それぞれｄ種類の特徴量を並べたものを、ｄ次元の特徴ベクトルとする。そして、特徴抽出部７２は、Ｓ８０で取得されたデータから抽出した特徴ベクトルを、目標タスク学習パターン保持部７２−０ＤＢに記録する。また、特徴抽出部７２は、Ｓ８１−１で取得されたデータから抽出した特徴ベクトルを、元タスク学習パターン保持部７２−１ＤＢに記録する。以下では、目標タスク学習パターン保持部７２−０ＤＢに記録された、目標タスク学習データの正常データから抽出されたｄ次元のベクトルを目標正常パターン、目標タスク学習データの異常データから抽出されたｄ次元のベクトルを目標異常パターンとする。また、元タスク学習パターン保持部７２−１ＤＢに記録された、元タスク学習データの正常データから抽出されたｄ次元のベクトルを元正常パターン、元タスク学習データの異常データから抽出されたｄ次元のベクトルを元異常パターンとする。

Ｓ８３において、変換規則算出部７３は、Ｓ３３と同様の処理により、元タスク学習データから、目標タスク学習データへの変換を行う変換規則を求める処理を行う。本実施形態でも、実施形態１と同様、変換規則算出部７３は、目標正常パターンと、元正常パターンを特定カテゴリのデータとして、それらの分布の差異を局所最小化するような線形変換のための変換パラメータ（行列Ａ及びバイアスベクトルｂ）の値を調整する。本実施形態では、各パターンは、ｄ次元のベクトルなので、行列Ａは、ｄ次の正方行列、バイアスベクトルｂは、ｄ次元のベクトルとなる。Ｓ８３で求められた行列Ａとバイアスベクトルｂのデータを、変換パラメータ７３ｄとする。
Ｓ８４において、変換処理部７４は、Ｓ３４と同様、特徴抽出ステップ５２で抽出したＭｓ個の元異常パターンを変換する処理を行う。Ｓ８４で変換された元異常パターンは、実施形態１とは異なり、特徴選択部７５による特徴選択処理に用いられるため、変換処理部７４は、変換した元異常パターンを、特徴選択部７５に送信することになる。
Ｓ８５において、特徴選択部７５は、Ｎｔ個の目標正常パターン、Ｍｔ個の目標異常パターン、及び、Ｓ８４で変換されたＭｓ個の元異常パターンを用いて、特徴選択の処理を行う。本実施形態では、特徴選択部７５は、特徴選択の方法として、特許文献３に記載の特徴選択方法を用いる。特徴選択部７５は、この処理により、各パターンの要素であるｄ個の特徴量の中から、有効であると考えられるｄ'個（ｄ'＜ｄ）の特徴量を選択する。特徴選択部７５は、選択したｄ'個の特徴量が、どの特徴量であるかを示す情報を、識別器生成部７６に送信する。このように、情報処理装置１０は、識別器の生成のみでなく、特徴選択処理といった、その他の情報処理も可能である。また、上記のように、特徴選択の処理を行い、特徴ベクトルの要素のうち、選択された要素のみを用いて識別器の生成を行う処理も可能である。

Ｓ８６において、識別器生成部７６は、目標正常パターンの内、特徴選択ステップ５５で選択されたｄ'個の特徴のみを用いて、識別器の生成を行う。本実施形態では、情報処理装置１０は、識別器として１クラスＳＶＭを用いる。そのため、識別器生成部７６は、識別器の生成には異常パターンを用いず、目標正常パターンのみを用いて生成を行う。識別器生成部７６は、学習結果として得られる複数のサポートベクターと、それに対応する係数、及び、閾値を識別器データ出力部７７に送信する。本実施形態では、識別器生成部７６は、目標正常パターンのみを用いて識別器の生成を行うが、実施形態１と同様に、目標異常パターンや、変換した元異常パターンも用いて、２クラス識別器の生成を行ってもよい。
Ｓ８７において、識別器データ出力部７７は、Ｓ８６で求められた複数のサポートベクターと、それに対応する係数、及び、閾値のデータを出力して、図８の処理を終了する。例えば、識別器データ出力部７７は、Ｓ８６で求められた複数のサポートベクターと、それに対応する係数、及び、閾値のデータを補助記憶装置１３に記録することで出力する。

続いて、図８の処理により生成された識別器を用いた、複雑なテクスチャパターンを有する製造物であるゴム板の表面を撮影した画像から、その表面上の欠陥を、異常パターンとして検出する処理を説明する。
図９は、情報処理装置１０においてパターン識別処理を行うための機能構成等の一例を示すブロック図である。図１０は、パターン識別処理の一例を示すフローチャートである。以下、図９、及び、図１０を用いて、本実施形態のパターン識別処理について説明する。
情報処理装置１０は、識別器データ入力部９０、データ入力部９１、画像切り出し部９２、特徴抽出部９３、特定カテゴリ度算出部９４、及び識別結果出力部９６を含む。
識別器データ入力部９０は、図８の処理により出力された識別器のデータを取得する。データ入力部９１は、カメラ１６からゴム板の表面の撮影画像のデータを取得する。画像切り出し部９２は、データ入力部９１により取得されたデータに対応する画像の一部を切り出し、切り出した画像のデータを出力する。特徴抽出部９３は、画像切り出し部９２により出力されたデータから特徴量を抽出する。特定カテゴリ度算出部９４は、特徴抽出部９３により抽出された特徴量に基づいて、データ入力部９１により取得されたデータの特定カテゴリらしさを示す特定カテゴリ度を算出する。識別結果出力部９６は、特定カテゴリ度算出部９４により算出された特定カテゴリ度に基づいて、データ入力部９１により取得されたデータが特定カテゴリに属するか否かを判定し、判定結果を出力する。

次に、識別器を用いてパターンを識別する具体的な処理手順について図１０を参照しながら説明する。
Ｓ１００において、識別器データ入力部９０は、図８の処理により出力された識別器のデータである複数のサポートベクターと、それぞれに対応する係数、及び、閾値の情報を、補助記憶装置１３等から取得する。識別器データ入力部９０は、複数のサポートベクターと対応する係数との情報を、特定カテゴリ度算出部９４に、閾値の情報を識別結果出力部９６に送信する。
Ｓ１０１において、データ入力部９１は、異常が存在するか否かを判定する対象である製造物（ゴム板）の表面を撮影した画像を、カメラ１６から取得する。本実施形態では、データ入力部９１は、カメラ１６によりゴム板の表面が撮影された２５６×２５６画素のモノクロ画像を取得する処理を行う。
Ｓ１０２において、画像切り出し部９２は、Ｓ１０１で取得された画像から、目標タスク学習データの画像サイズと同じ、１２８×１２８画素の画像切り出しを行う。画像切り出し部９２は、切り出した画像を、特徴抽出部９３に送信する。本実施形態では、画像切り出し部９２は、Ｓ１０１で取得される画像が２５６×２５６画素の画像であるので、画像を１２８×１２８画素のサイズの４つの領域に分けて切り出す。情報処理装置１０は、切り出されたそれぞれの画像について、異常が存在するか否かの判定を行う。

Ｓ１０３において、特徴抽出部９３は、Ｓ１０２で切り出された１２８×１２８画素の画像に対して特徴抽出の処理を行う。ここでは、Ｓ８５で選択されたｄ'個の特徴量を抽出する処理を行う。
Ｓ１０４において、特定カテゴリ度算出部９４は、Ｓ１０３で抽出されたｄ'個の特徴量に対し、式８に示したものと同様の式を用いて、特定カテゴリ度の算出を行う。この特定カテゴリ度は、正常らしさを表した数値であり、この値が低い程、異常である可能性が高いことになる。
Ｓ１０５において、特定カテゴリ度算出部９４は、Ｓ１０４で算出した特定カテゴリ度が、閾値以下であるか否かに基づいて、異常があるか否かの判定を行う。特定カテゴリ度算出部９４は、異常があると判定した場合は、Ｓ１０６の処理に進む。特定カテゴリ度算出部９４は、異常が無いと判定した場合、Ｓ１０２ｅの処理に進む。

Ｓ１０２ｅにおいて、特定カテゴリ度算出部９４は、Ｓ１０２で取得された画像の全領域に対して処理を行ったか否かを判定し、行ったと判定した場合、Ｓ１０６の処理に進み、行っていないと判定した場合、Ｓ１０２の処理に進む。
Ｓ１０６において、識別結果出力部９６は、Ｓ１０５により異常があると判定された場合は、入力された画像に異常が存在するという判定結果を出力し、そうでなければ、正常であるという判定結果を出力し、図１０の処理を終了する。例えば、識別結果出力部９６は、異常があるか否かの判定結果を示す情報を、情報処理装置１０の不図示の表示部に表示することで出力する。

以上、本実施形態の処理により、情報処理装置１０は、元タスクの学習データの特徴量を変換した特徴量のうち、特徴選択部７５により選択された特徴量のみを用いて識別器の生成を行うことができる。これにより、情報処理装置１０は、より識別に寄与する特徴量のみを用いた識別器を生成し、生成した識別器を用いて、入力データから抽出されたより識別に寄与する特徴量のみを用いて識別処理を行うことができる。情報処理装置１０は、識別処理の際に利用するデータの量が減るため、処理の負荷を軽減できる。また、情報処理装置１０は、本実施形態で示したように、類似したタスクを従来のタスクから探索して、そのタスクの学習データを元タスク学習データとして用いるといったこともできる。このような方法は、類似するタスクが明確でない場合に有効である。一方、例えば、製造物の材料変更への対応等の場合は、変更前のタスクが、目標タスクに最も類似している可能性が高いので、情報処理装置１０は、その変更前のタスクの学習データを、元タスク学習データとして利用するのが好適である。

＜実施形態３＞
本実施形態では、実施形態１の変形として、監視カメラの動画像に基づいて、監視エリア内の異常を検出するパターン識別方法における、識別器の生成を行う処理を説明する。実施形態１では、情報処理装置１０は、変換規則を求める際に、異なるタスクの正常データの分布間のＬ２距離の推定値を小さくするという基準で変換規則を求めた。これに対し、本実施形態では、情報処理装置１０は、分布間の相対ピアソン距離の推定値を小さくするという基準で変換規則を求める。
本実施形態の情報処理装置１０のハードウェア構成及び機能構成は、実施形態１と同様であるとする。
図２、及び、図３を用いて、本実施形態の識別器生成処理について説明する。本実施形態では、実施形態１と異なる部分について説明する。
Ｓ３０〜Ｓ３２の処理により、目標正常パターンとして、Ｎｔ個の２５１次元ベクトル、目標異常パターンとして、Ｍｔ個の２５１次元ベクトルが、目標タスク学習パターン保持部２２０ＤＢに記録される。そして、元正常パターンとして、Ｎｓ個の２５１次元ベクトル、元異常パターンとして、Ｍｓ個の２５１次元ベクトルが、元タスク学習パターン保持部２２１ＤＢに記録されることになる。
Ｓ３３において、変換規則算出部２３は、それぞれの学習データの特定カテゴリデータ、即ち、複数の目標正常パターン、及び、複数の元正常パターンを用いて、元異常パターンを識別器の生成に用いることができるように変換するための変換規則を求める。本実施形態でも、実施形態１と同様、ここでの変換として線形変換を用いる。ただし、変換規則算出部２３は、実施形態１では、分布間のＬ２距離の推定値を局所最小化するような変換を求めたが、本実施形態では、非特許文献４に記載の、分布間の相対ピアソン距離の推定値を局所最小化するような変換を求める。
実施形態１と同様、目標正常パターンの分布をχ、行列Ａ、及び、バイアスベクトルｂによる変換された後の元正常パターンの分布をχ'とした場合、相対ピアソン距離の推定値ｒＰＥ（χ，χ'）は、以下の式９により求められる。

この相対ピアソン距離の推定値は、式１のＬ２距離の推定値と、ほぼ同様であるが、式９中のｈ及びＨの定義が異なり、以下の式１０及び式１１のように定義される。

ここで、実施形態１と同様、ｘ_ｉは、ｉ番目の目標正常パターン、ｘ_j'は、ｊ番目の
元正常パターンである。式９のθは、実施形態１で示した式４におけるθと同じ定義であるが、ｈ、及び、Ｈが異なるため、Ｎｔ次元のベクトルとなる。σは、ガウス基底関数のパラメータで、λは、正則化パラメータ、Ｉは、Ｎｔ次の単位行列である。また、式１１内のβは、０≦β＜１の分布混合パラメータで、例えば、β＝０．５等となる。
本実施形態でも、実施形態１と同様、行列Ａとバイアスベクトルｂとに適当な初期値を設定し、式９に示した相対ピアソン距離の推定値を表す式を、行列Ａやバイアスベクトルｂに対応するパラメータで微分した式に基づいて更新していく。式９に示した相対ピアソン距離の推定値を、変換のパラメータａで微分した式は、以下の式１２のように表される。

変換規則算出部２３は、式１２を用い、行列Ａのｒ行ｃ列の成分ａ_r,c、及び、バイアスベクトルｂのｃ番目の要素ｂｃを、以下の式１３、１４に従って更新する。

式１３、１４中のηは、第１の実施形態と同様の学習係数である。本実施形態でも、第１の実施形態と同様、行列Ａ、及び、バイアスベクトルｂの値を更新した後の相対ピアソン距離と、学習係数ηが、共に設定された閾値よりも小さくなるまで、式１３、１４による更新を繰り返す。それにより、変換規則算出部２３は、変換のための行列Ａ、及び、バイアスベクトルｂを求める。Ｓ３４〜Ｓ３６の処理は、実施形態１と同様である。
このように、情報処理装置１０は、分布間のＬ２距離の推定値でなく、分布間の相対ピアソン距離の推定値を局所最小化することでも、学習データの変換に用いられる変換パラメータを算出できる。
本実施形態の処理により、情報処理装置１０は、分布間の相対ピアソン距離を近づけるような変換を行うことが好適である場合に対応することができる。

＜実施形態４＞
本実施形態では、人物の顔の画像を入力し、その画像内の人物が、予め定めた特定の人物であるか否かを識別する方法において用いる識別器の生成方法を示す。本実施形態では、対象である特定の人物に似て非なる人物の顔の画像が存在しない場合でも、識別器が似て非なる人物の顔の画像を、誤って特定の人物であると判定する可能性を低減させるように、識別器の生成を行う。
本実施形態の情報処理装置１０のハードウェア構成は、実施形態１と同様であるとする。

図１１は、本実施形態の情報処理装置１０における識別器を生成するための機能構成等の一例を示すブロック図である。また、図１２は、識別器生成処理の一例を示すフローチャートである。以下、図１１、及び、図１２を用いて、本実施形態の識別器生成処理について説明する。
情報処理装置１０は、目標タスク学習データ入力部１１０、元タスク学習データ入力部１１１、目標タスク学習データ保持部１１０ＤＢ、元タスク学習データ保持部１１１ＤＢを含む。情報処理装置１０は、目標タスク学習データ領域抽出部１１２−０、目標タスク学習パターン保持部１１２−０ＤＢ、元タスク学習データ領域抽出部１１２−１、元タスク学習パターン保持部１１２−１ＤＢ、変換規則算出部１１３、変換処理部１１４を含む。また、情報処理装置１０は、識別器生成部１１５、識別器データ出力部１１６を含む。
目標タスク学習データ入力部１１０は、カメラ１６、補助記憶装置１３等から目標タスクの学習データを取得する。元タスク学習データ入力部１１１は、カメラ１６、補助記憶装置１３等から元タスクの学習データを取得する。

目標タスク学習データ保持部１１０ＤＢは、目標タスク学習データ入力部１１０により取得された学習データを保持するデータベースであり、補助記憶装置１３に実装される。元タスク学習データ保持部１１１ＤＢは、元タスク学習データ入力部１１１により取得された学習データを保持するデータベースであり、補助記憶装置１３に実装される。
目標タスク学習データ領域抽出部１１２−０は、目標タスク学習データ入力部１１０により取得された画像から、人物の顔を検出し、検出した顔のうち、設定された領域を抽出し、抽出した領域から特徴量を取得する。元タスク学習データ領域抽出部１１２−１は、元タスク学習データ入力部１１１により取得された画像から、人物の顔を検出し、検出した顔のうち、設定された領域を抽出し、抽出した領域から特徴量を取得する。
目標タスク学習パターン保持部１１２−０ＤＢは、目標タスク学習データ領域抽出部１１２−０により抽出された領域から取得された特徴量の情報を記憶するデータベースであり、補助記憶装置１３に実装される。元タスク学習パターン保持部１１２−１ＤＢは、元タスク学習データ領域抽出部１１２−１により抽出された領域から取得された特徴量の情報を記憶するデータベースであり、補助記憶装置１３に実装される。
変換規則算出部２３は、目標タスク学習パターン保持部１１２−０ＤＢ、元タスク学習パターン保持部１１２−１ＤＢに保持される特徴量のデータに基づいて、元タスクの学習データの特徴量を目標タスクの学習データの特徴量に変換するための変換規則を算出する。

変換処理部１１４は、元タスク学習パターン保持部１１２−１ＤＢに保持される特徴量のデータを、変換規則算出部１１３により算出された変換規則に基づいて、目標タスクの学習データの特徴量に変換する。
識別器生成部１１５は、目標タスク学習パターン保持部１１２−０ＤＢに保持されている特徴量のデータと、変換処理部１１４により変換された特徴量のデータと、に基づいて、識別器の生成を行う。
識別器データ出力部１１６は、識別器生成部１１５により生成された識別器のデータを出力する。例えば、識別器データ出力部１１６は、識別器のデータを、補助記憶装置１３に記録することにより出力する。

次に、識別器を生成する具体的な処理手順について図１２を参照しながら説明する。
Ｓ１２０において、目標タスク学習データ入力部１１０は、識別器の生成に用いる複数の学習データをカメラ１６、補助記憶装置１３等から取得する。本実施形態では、目標タスク学習データ入力部１１０は、複数の学習データとして、複数の人物の顔画像を取得する。より具体的には、本実施形態では、目標タスク学習データ入力部１１０は、人物の顔の領域が切り出された４０×４０画素のグレースケール画像を取得する。以下では、人物の顔の領域が切り出された４０×４０画素のグレースケール画像を、顔画像とする。目標タスク学習データ入力部１１０は、目標タスク学習データとして、予め定めた特定の人物（人物Ａとする）の顔画像と、人物Ａ以外の任意の人物の顔画像とを取得する。ただし、この人物Ａ以外の人物の顔画像の中に、人物Ａの顔画像と類似するが人物Ａとは別人の顔画像は存在しないものとする。目標タスク学習データ入力部１１０は、取得した顔画像のデータを、目標タスク学習データ保持部１１０ＤＢに記録される。
Ｓ１２１において、元タスク学習データ入力部１１１は、人物Ａとは異なる、ある人物（人物Ｂとする）と、人物Ｂと類似する人物（人物Ｂ'とする）と、のそれぞれの複数の顔画像を、カメラ１６、補助記憶装置１３等から取得する。本実施形態では、情報処理装置１０は、Ｓ１２１で取得されたデータを、元タスク学習用データとして用いる。元タスク学習データ入力部１１１は、取得した顔画像のデータを、元タスク学習データとして、元タスク学習データ保持部１１１ＤＢに記録する。

Ｓ１２２−０において、目標タスク学習データ領域抽出部１１２０は、Ｓ１２０で取得された全ての顔画像それぞれに対し、顔画像中に設定された局所領域から画素値を抽出して、その値を並べたベクトルデータを生成する処理を行う。本実施形態では、顔画像中に設定された局所領域は、図１３（ａ）に矩形で示したような領域である。目標タスク学習データ領域抽出部１１２０は、各領域の画素値を抽出し、その値を並べたベクトルを、それぞれの画像について生成する。この矩形領域全てにおける総画素数がｄであったとすると、ここで生成されるベクトルは、ｄ次元のベクトルとなる。目標タスク学習データ領域抽出部１１２０は、生成したベクトルを、目標タスク学習パターン保持部１１２０ＤＢに記録する。ここで、人物Ａの顔画像に基づいて生成されたベクトルを目標特定人物パターン、人物Ａ以外の顔画像に基づいて生成されたベクトルを目標非特定人物パターンとする。
Ｓ１２２−１において、元タスク学習データ領域抽出部１１２−１は、Ｓ１２１で取得された全ての顔画像それぞれに対し、以下の処理を行う。即ち、元タスク学習データ領域抽出部１１２−１は、図１３（ｂ）に示したような、顔の中心部分に設定されている図１３（ａ）の各矩形領域に比べて大きな矩形領域から画素値を抽出し、その値を並べたベクトルデータを生成する処理を行う。図１３（ｂ）の矩形領域の画素数が、ｄ'であったとすると、ここで生成するベクトルは、ｄ'次元のベクトルとなる。この矩形の大きさは、任意であるが、元タスク学習データ側の情報量が多い方が、目標タスクへの適切な変換ができる可能性が高いため、ｄ'＞ｄとするのが好適である。元タスク学習データ領域抽出部１１２−１は、生成したベクトルを、元タスク学習パターン保持部１１２−１ＤＢに記録する。ここで、人物Ｂの顔画像に基づいて生成されたベクトルを、目標特定人物パターンに対応する、元参照人物パターン、人物Ｂ'の顔画像に基づいて生成されたベクトルを元非特定人物パターンとする。そして、本実施形態では、目標タスクにおける目標特定人物パターン、及び、元タスクにおける元参照人物パターンが、特定カテゴリのデータとなる。

Ｓ１２３において、変換規則算出部１１３は、学習データの特定カテゴリのデータ、即ち、複数の目標特定人物パターン、及び、複数の元参照人物パターンを用いて、以下の処理を行う。即ち、変換規則算出部１１３は、元非特定人物パターンを識別器の生成に用いることができるように変換するための変換規則を求める処理を行う。本実施形態でも、ここでの変換は、線形変換であるとするが、他の実施形態と異なり、変換先と変換元との次元が異なるため、変換パラメータである行列Ａが正方行列ではない。本実施形態では、変換先がｄ次元、変換元がｄ'次元であるので、線形変換の行列Ａは、ｄ'行ｄ列の行列、バイアスベクトルｂは、ｄ次元のベクトルとなる。本実施形態でも、変換規則算出部１１３は、行列Ａ、及び、バイアスベクトルｂを、実施形態１と同様に、Ｌ２距離の推定値を小さくするという基準で求めるが、本実施形態のように、変換先と変換元とのベクトルの次元が異なっても変換規則を求めることができる。情報処理装置１０は、目標タスクの学習データの特徴量のベクトルの次元と、元タスクの学習データの特徴量のベクトルの次元とが異なっていても、変換規則を求めて、変換できる。Ｓ１２３の処理は、行列の要素数が違うのみで、実施形態１と同様である。Ｓ１２３で求められた行列Ａとバイアスベクトルｂとを、変換パラメータ１１３ｄとする。
Ｓ１２４において、変換処理部１１４は、複数の元非特定人物パターンを、Ｓ１２３で求められた変換規則により変換する処理を行う。この処理では、元非特定人物パターン、つまり、人物Ｂと似て非なる人物Ｂ'のデータを、人物Ａのデータの分布と人物Ｂのデータの分布との差異を局所最小化するような変換規則により変換することで、擬似的に、人物Ａと類似する人物のデータを生成する。Ｓ１２４で変換された元非特定人物パターンは、識別器生成部１１５による識別器生成処理において用いられる。

Ｓ１２５において、識別器生成部１１５は、複数の目標特定人物パターンを正例、複数の目標非特定人物パターン、及び、Ｓ１２４で変換された複数の元非特定人物パターンを負例とした識別器の生成を行う。本実施形態の識別器は、実施形態１と同様に、ガウスカーネルを用いた非線形ＳＶＭである。
Ｓ１２６において、識別器データ出力部１１６は、Ｓ１２５での識別器の生成結果を外部に出力して、図１２の処理を終了する。例えば、識別器データ出力部１１６は、Ｓ１２５で学習された識別器のデータを補助記憶装置１３に記録することで、出力する。

以上、本実施形態の処理により、情報処理装置１０は、入力された顔画像が、特定の人物の顔画像であるか否かを精度良く識別する識別器を生成することが可能になる。本実施形態の処理により生成された識別器は、人物Ａと類似する人物のデータを学習に用いるため、人物Ａと類似する人物の顔画像が入力された場合に、人物Ａの顔画像ではないと、正しく判定することができる可能性が高くなる。このように、情報処理装置１０は、他の実施形態のような、異常なデータを検出する識別器の生成だけでなく、特定の人物の顔画像であるか否かといった、一般的なパターン識別を行う識別器の生成もできる。
尚、本実施形態では、人物Ｂと類似する人物Ｂ'のデータのみを変換して学習に利用したが、人物Ｂ'のデータを特定カテゴリのデータとして変換規則を求め、その変換規則により変換した人物Ｂのデータを、追加で学習に利用してもよい。また、情報処理装置１０は、人物Ｂと人物Ｂ'といった１つの組合せだけでなく、その他の人物の組合せを用い、それぞれに対して変換規則を求め、その変換規則により変換したデータを更に追加するようにすると好適である。

＜その他の実施形態＞
上記示した実施の形態では、情報処理装置１０は、全て変換規則として線形変換を用いた。しかし、情報処理装置１０は、変換規則として、基底関数を用いた非線形変換を用いることも可能である。より具体的には、例えば、情報処理装置１０は、Ｄ個の基底関数（例えば、ガウス基底関数）を用い、まず、元タスク学習データのパターンそれぞれに対して、Ｄ個の基底関数それぞれにおける値を求める。そして、それをＤ次元のベクトルと考えることにより、元タスク学習データのそれぞれのパターンが、Ｄ次元のベクトルに変換される。後は、変換先のパターンの次元数がｄであった場合、変換のための行列Ａとして、Ｄ行ｄ列の行列を用意し、その行列Ａの各成分の値を、上記示した実施形態と同様の方法で求めるようにすればよい。このように、情報処理装置１０は、変換規則として、非線形変換を用いることも可能である。
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサがプログラムを読み出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではない。
例えば、上述した情報処理装置１０の機能構成の一部又は全てをハードウェアとして情報処理装置１０に実装してもよい。

２０目標タスク学習データ入力部
２１元タスク学習データ入力部
２３変換規則算出部
２４変換処理部
２５識別器生成部

Claims

目標とするタスクである第１のタスクにおいて、第１のカテゴリに属する複数の学習データを、目標タスク学習データとして、取得する第１の取得手段と、
前記第１のタスクとは異なる第２のタスクにおいて、前記第１のカテゴリに属する学習データと前記第１のカテゴリとは異なる第２のカテゴリに属する学習データとを含む複数の学習データを、元タスク学習データとして、取得する第２の取得手段と、
前記目標タスク学習データの前記第１のカテゴリに属する複数の学習データに係る第１の分布と、前記元タスク学習データの前記第１のカテゴリに属する複数の学習データに係る第２の分布との差異に基づいて、前記元タスク学習データを変換するための変換パラメータを調整する調整手段と、
前記調整手段により調整された前記変換パラメータに基づいて、前記元タスク学習データを変換する変換手段と、
前記変換手段によって変換された元タスク学習データと、前記目標タスク学習データとに基づいて、前記第１のタスクに係る識別器を生成する生成手段と、
を有する情報処理装置。
前記調整手段は、前記第１の分布と前記第２の分布との密度分布が近づくように、前記変換パラメータを調整する請求項１記載の情報処理装置。
前記調整手段は、前記第１の分布と前記第２の分布とのＬ２距離の推定値を局所最小化するように、前記変換パラメータを調整する請求項２記載の情報処理装置。
前記調整手段は、前記第１の分布と前記第２の分布との相対ピアソン距離の推定値を局所最小化するように、前記変換パラメータを調整する請求項２記載の情報処理装置。
前記調整手段は、勾配法を用いて、前記第１の分布と前記第２の分布との差異を局所最小化するように、前記変換パラメータを調整する請求項２乃至４何れか１項記載の情報処理装置。
前記第２のタスクを前記第１のタスクに類似するタスクとして探索する探索手段を有し、
前記第２の取得手段は、前記探索手段によって探索された第２のタスクの学習データを、前記元タスク学習データとして取得する請求項１乃至５何れか１項記載の情報処理装置。
前記変換手段は、前記元タスク学習データの内、前記第２のカテゴリに属する学習データを変換し、
前記生成手段は、前記目標タスク学習データと、前記変換手段により変換された前記第２のカテゴリに属する学習データとを用いて、前記識別器を生成する請求項１乃至６何れか１項記載の情報処理装置。
前記生成手段は、前記目標タスク学習データと、前記変換手段により変換された前記元タスク学習データと、に基づいて前記識別器の生成に用いるための特徴量を選択し、前記選択した特徴量に基づいて、前記識別器を生成する請求項１乃至６何れか１項記載の情報処理装置。
前記生成手段により生成された前記識別器を用いて、識別の対象とする入力データが、前記第１のカテゴリに属するか否かを識別する識別手段、
を更に有する請求項１乃至８何れか１項記載の情報処理装置。
情報処理装置が実行する情報処理方法であって、
目標とするタスクである第１のタスクにおいて、第１のカテゴリに属する複数の学習データを、目標タスク学習データとして、取得する第１の取得ステップと、
前記第１のタスクとは異なる第２のタスクにおいて、前記第１のカテゴリに属する学習データと前記第１のカテゴリとは異なる第２のカテゴリに属する学習データとを含む複数の学習データを、元タスク学習データとして、取得する第２の取得ステップと、
前記目標タスク学習データの前記第１のカテゴリに属する複数の学習データに係る第１の分布と、前記元タスク学習データの前記第１のカテゴリに属する複数の学習データに係る第２の分布との差異に基づいて、前記元タスク学習データを変換するための変換パラメータを調整する調整ステップと、
前記調整ステップで調整された前記変換パラメータに基づいて、前記元タスク学習データを変換する変換ステップと、
前記変換ステップで変換された元タスク学習データと、前記目標タスク学習データとに基づいて、前記第１のタスクに係る識別器を生成する生成ステップと、
を含む情報処理方法。
コンピュータに、
目標とするタスクである第１のタスクにおいて、第１のカテゴリに属する複数の学習データを、目標タスク学習データとして、取得する第１の取得ステップと、
前記第１のタスクとは異なる第２のタスクにおいて、前記第１のカテゴリに属する学習データと前記第１のカテゴリとは異なる第２のカテゴリに属する学習データとを含む複数の学習データを、元タスク学習データとして、取得する第２の取得ステップと、
前記目標タスク学習データの前記第１のカテゴリに属する複数の学習データに係る第１の分布と、前記元タスク学習データの前記第１のカテゴリに属する複数の学習データに係る第２の分布との差異に基づいて、前記元タスク学習データを変換するための変換パラメータを調整する調整ステップと、
前記調整ステップで調整された前記変換パラメータに基づいて、前記元タスク学習データを変換する変換ステップと、
前記変換ステップで変換された元タスク学習データと、前記目標タスク学習データとに基づいて、前記第１のタスクに係る識別器を生成する生成ステップと、
を実行させるためのプログラム。