JPWO2018155412A1

JPWO2018155412A1 - 分類装置と分類方法並びにプログラム

Info

Publication number: JPWO2018155412A1
Application number: JP2019501326A
Authority: JP
Inventors: 康介西原; 紀彦田谷
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2017-02-21
Filing date: 2018-02-20
Publication date: 2020-01-09
Also published as: US20200234186A1; US11443233B2; WO2018155412A1

Abstract

未知の刺激に対しても当該刺激の属する分類グループを決定可能とする。分類装置は、入力データの特徴を抽出し、第１の記憶部に記憶された要素分類モデルに基づき、分類情報を出力する要素分類部を備えた符号化モジュールと、前記分類情報を受け、第２の記憶部に記憶された要素推定モデルに基づき、照合用のベクトルに変換する要素推定部を備えた統合モジュールと、前記照合用のベクトルと、意味モデルとして第３の記憶部に記憶された各グループの代表ベクトルとを照合して前記照合用のベクトルの属するグループを決定し、前記グループのグループＩＤを分類結果として出力する決定部を備えた決定モジュールと、を有する。

Description

［関連出願についての記載］
本発明は、日本国特許出願：特願２０１７−０３０２７２号（２０１７年２月２１日出願）の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
本発明は、分類装置と分類方法とプログラムに関する。

多くの専門領域で、人の能力にも匹敵する人工知能（Artificial Intelligence：AI）技術が利用されている。ディープラーニング技術を用いた画像認識では、学習した分類カテゴリーに対しては人と同程度の認識率を実現している。工場内での自動化はすでに実用化され、生産性向上に大きく貢献している。領域によっては人の能力を凌駕している。手続きがきちんと定義されており数値計算により答えを導くタイプの領域では、計算機の発達もあり、人より高速で正確に処理を行うことができるようになってきている。工場内の自動化や、囲碁・将棋ソフトなどが一例である。

現在のAIは、決められた事象を認識し、決められたように行動するシステムである。事前に認識する事象を特定し学習させること、事前に正しく行動を設計することが最も重要である。不確定な要素をいかに取り除くかが、システムの性能に影響する。事前に想定できる環境では、十分な性能を発揮できる。

例えば、外部刺激を認識（分類）する関連技術は、例えば図１に模式的に例示するように、外部刺激を不図示のセンサ等で取得しデジタルデータとして出力する入力装置１０１からの入力データ１０１１を受け取り、該入力データ１０１１の特徴量を抽出し内部情報（特徴ベクトル）として符号化する特徴抽出部１０２１を有する符号化モジュール１０２と、符号化モジュール１０２からの内部情報を予め記憶されている情報とのマッチング（照合）を行うことで、外部刺激に該当するグループを決定し、グループＩＤ（Identification：識別情報）１０３２を出力するマッチング部１０３１を有する決定モジュール１０３を備えている。外部刺激は、カメラ等の撮像手段で取得した画像データや画像データベース等に記憶された画像データであってもよい。

特徴量を抽出しクラスタリングを行う関連技術として、例えば特許文献１には、画像データベース中に存在する複数の画像データを類似した画像毎に自動で分類する画像分類装置が開示されている。この画像分類装置は、複数の画像データのそれぞれについて全体の特徴量を算出し、画像データのエッジを検出しエッジ部分の特徴量を算出する特徴量算出部と、画像全体の特徴量に基づき複数の画像データを複数のクラスタに分類する第１のクラスタリング部と、エッジ部分の特徴量に基づいて、第１のクラスタリング部で分類された複数のクラスタをさらに複数のクラスタに分類する第２のクラスタリング部と、複数の画像データのそれぞれについて画像の構図から被写体を構成する画素を決定し第２のクラスタリング部で分類された複数のクラスタを、被写体を構成する画素によって統合するクラスタ統合部を備えている。

図１の関連技術では、どのようにして内部情報として符号化するかという情報、及び、分類するグループを、事前に定義しておく必要がある。なお、抽出する特徴やグループを手動で設計する他、予め準備した学習データを用いて生成する方法も知られている。

国際公開第２００９／０７２４６６号

以下に関連技術の分析を与える。

図１を参照して説明した関連技術は、基本的に、事前に定義していない外部刺激に対応できない。図１において、例えば自律的に認知分類グループを獲得しながら、未知の刺激の入力に対しても該刺激の属する分類グループの決定を可能とする手法の実現が望まれる。

本発明は上記課題の認識に基づき創案されたものであって、その目的は、未知の刺激に対しても当該刺激の属する分類グループを決定可能とする装置、方法、プログラムを提供することである。

本発明の一つの形態によれば、入力データの特徴を抽出し、第１の記憶部に記憶された要素分類モデルに基づき、分類情報を出力する要素分類部を備えた符号化モジュールと、前記分類情報を受け、第２の記憶部に記憶された要素推定モデルに基づき、照合用のベクトルに変換する要素推定部を備えた統合モジュールと、前記照合用のベクトルと、意味モデルとして第３の記憶部に記憶された各グループの代表ベクトルとを照合して前記照合用ベクトルの属するグループを決定し、前記グループのグループＩＤ（Identification：ｗ識別情報）を分類結果として出力する決定部を備えた決定モジュールと、を備えた分類装置（発達的認知装置）が提供される。入力データは、例えば外部刺激をセンサ等でセンシングしたデジタルデータ等であってもよい。

本発明の一つの形態によれば、コンピュータによる分類方法であって、
入力データの特徴を抽出し、第１の記憶部に記憶された要素分類モデルに基づき、分類情報を出力する符号化ステップと、
前記分類情報を受け、第２の記憶部に記憶された要素推定モデルに基づき、照合用のベクトルに変換する統合ステップと、
前記照合用のベクトルと、意味モデルとして第３の記憶部に記憶された各グループの代表ベクトルとを照合して前記照合用ベクトルの属するグループを決定し、前記グループのグループＩＤを分類結果として出力する決定ステップと、
を含む分類方法（発達的認知方法）が提供される。

本発明の一つの形態によれば、入力データの特徴を抽出し、第１の記憶部に記憶された要素分類モデルに基づき、分類情報を出力する要素分類処理を含む符号化処理と、
前記分類情報を受け、第２の記憶部に記憶された要素推定モデルに基づき、照合用のベクトルに変換する要素推定処理を含む統合処理と、
前記照合用のベクトルと、意味モデルとして第３の記憶部に記憶された各グループの代表ベクトルとを照合して前記照合用ベクトルの属するグループを決定し、前記グループのグループＩＤを分類結果として出力する決定処理と、
をコンピュータに実行させるプログラム（発達的認知プログラム）が提供される。

本発明によれば、上記プログラムを記憶したコンピュータ読み出し可能な記録媒体（例えばＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、又は、ＥＥＰＲＯＭ（Electrically Erasable and Programmable ROM））等の半導体ストレージ、ＨＤＤ（Hard Disk Drive）、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）等のnon-transitory computer readable recording mediumが提供される。

本発明によれば、未知の刺激に対しても当該刺激の属する分類グループを決定可能とすることができる。

関連技術を説明する図である。第１の実施形態の構成を例示する図である。は、第１の実施形態を説明する図である。は、第１の実施形態を説明する図である。は、第１の実施形態を説明する図である。は、第１の実施形態を説明する図である。は、第１の実施形態を説明する図である。は、第１の実施形態を説明する図である。は、第１の実施形態を説明する図である。第１の実施形態の別の構成例を例示する図である。第２の実施形態の構成を例示する図である。第２の実施形態を説明する図である。は第２の実施形態を説明する図である。は第２の実施形態を説明する図である。は第２の実施形態を説明する図である。は第２の実施形態を説明する図である。は第２の実施形態を説明する図である。は第２の実施形態を説明する図である。は第２の実施形態を説明する図である。第２の実施形態の動作例を説明する流れ図である。第２の実施形態の動作例を説明する流れ図である。第２の実施形態の動作例を説明する流れ図である。第３の実施形態の構成を例示する図である。は第３の実施形態を説明する図である。は第３の実施形態を説明する図である。第３の実施形態の動作例を例示する流れ図である。第４の実施形態を例示する図である。

本発明の一形態のシステムは、外部から入力された刺激情報等の入力データをまとまりのある複数の要素に変換し、内部情報として内部に取り込む符号化モジュール（例えば図２の２０）と、それぞれの要素を解釈可能な表象表現に変換しベクトルとして統合する統合モジュール（例えば図２の３０）と、ベクトルを意味空間上にマッピングし、認知分類グループを決定する決定モジュール（例えば図２の４０）を備える。表象表現と認知分類グループを協調して更新することで、新しい入力に対してこれまで表現できなかった表象表現を獲得し、意味空間上で分散していた未知刺激を既知グループから弁別可能な認知分類グループに収束させることができる。

符号化モジュール（２０）と、決定モジュール（４０）に加え、統合モジュール（３０）を備えることで、認知分類グループと表象表現を自律的に獲得し、徐々に認知分類グループの数を増やしながら弁別能力を高めることができる。

＜実施の形態１＞
以下、例示的な第１の実施の形態について図面を参照して説明する。図２は、本発明の例示的な実施形態のシステム構成を例示する図である。第１の実施形態の分類システム１は、入力装置１０、符号化モジュール２０、統合モジュール３０、決定モジュール４０を備えている。これらのモジュールは、一つのユニット内に備えた装置構成としてもよい。この場合、分類システム１は分類装置（classifier）として構成される。あるいは、入力装置１０、符号化モジュール２０、統合モジュール３０、決定モジュール４０をそれぞれ、個別の装置として実装し、通信手段を介して互いに通信接続する構成としてもよい。さらに、例えば、統合モジュール３０と決定モジュール４０の組み合わせをサーバ等に実装し、入力装置１０と符号化モジュール２０を、サーバと通信接続するネットワークノード等に実装するようにしてもよい。

なお、図２において、矢線で示しているユニット間の情報／信号の向きは、実施形態の特徴を説明するための一例を示したものであり、信号の送受信を一方向性に制限するためのものではない。すなわち、ユニット間の双方向に信号を送受信する構成（ハンドシェイクや制御信号等のモジュール間での送受）を排除するためのものではない。図３Ａ、図４、図５、図１２についても同様である。

図２において、符号化モジュール２０は、外部刺激等を入力する入力装置１０から入力データとして受け、内部で処理できる内部情報として取り込む。特に制限されないが、入力装置１０は、センサやカメラ等であってもよい。センサは、例えば、振動情報、電流／電圧、温度情報、臭い、生体情報、画像情報や音響情報等のいずれかをセンシングするデバイスであってもよい。入力装置１０を有線又は無線通信手段を備えたＩｏＴ（Internet of Things）デバイスで構成し、符号化モジュール２０とネットワークを介して通信接続する構成としてもよい。あるいは、入力装置１０はすでにデータベース等の記憶装置に記憶されているセンシングデータや画像データを読み出して入力するインタフェースモジュールやコントローラであってもよい。

統合モジュール３０は、取り込まれた情報を照合に必要な要素情報に変換し統合ベクトルを生成する。

決定モジュール４０は、統合ベクトルを、意味モデルの代表ベクトル（分類されたグループの代表ベクトル）と照合し、外部刺激に対応する認知結果（グループＩＤ）４４を出力する。

より詳細には、符号化モジュール２０は、要素分類部２３、要素分類モデル学習部２１と、要素分類モデルを記憶する記憶装置２２を備えている。

要素分類モデル学習部２１は、抽出する特徴を入力データ（要素データ）から構成し、要素分類モデルを記憶装置２２に記憶する。要素分類モデル学習部２１は、決定モジュール４０で決定したグループＩＤを入力として、学習するようにしてもよい。

要素分類部２３は、記憶装置２２に記憶された要素分類モデルに基づき、要素データ毎に、入力されるデータの特徴を抽出して分類し、要素分類の集りである分類情報を出力する。

統合モジュール３０は、要素推定モデル学習部３１と、要素推定部３３と、要素推定モデルを記憶する記憶装置３２を備えている。

要素推定モデル学習部３１は、要素表現を、符号化モジュール２０の要素分類部２３から出力される分類情報と、入力データ（要素データ）に基づき、構成し、要素推定モデルとして記憶装置３２に記憶する。要素推定モデル学習部３１は、決定モジュール４０で決定したグループＩＤを入力として学習するようにしてもよい。

要素推定部３３は、符号化モジュール２０の要素分類部２３から出力される分類情報を入力し、記憶装置３２に記憶される要素推定モデルを参照して、照合に利用する要素表現に変換し、決定モジュール４０に出力する。

決定モジュール４０は、決定（Decision Making）部４２と、グループ更新・生成部４１、意味モデルを記憶する記憶装置４３を備えている。

グループ更新・生成部４１は、認知分類グループを統合情報から構成し、意味モデルとして記憶装置４３に記憶する。

決定部４２は、統合モジュール３０の要素推定部３３から出力される分類情報と、記憶装置４３に記憶された学習した意味モデルを照合し、分類される認知分類グループを決定する。

図３Ａ乃至図３Ｇは、図２のシステムにおけるデータ（情報）の流れに着目してその動作原理を説明する図である。図３Ａには、図２の構成とデータ（情報）が示されている。なお、図３Ａ乃至図３Ｇは、あくまで第１の実施形態の動作例を説明するための図であり、データ構造や内容や表現等は図３Ａ乃至図３Ｇの例に制限されるものでないことは勿論である。

入力装置１０は、データD=（d1,d2,d3,d4,d5）を入力し、符号化モジュール２０に出力する。データ=（d1,d2,d3,d4,d5）の一例を図３Ｂに示す。図３Ｂにおいて、縦軸は、例えばデータの大きさ（magnitude）、横軸は、例えばデータの位置、あるいは時間、あるいは他のパラメータであり、固定サイズの領域に区分される。

要素分類部２３は、入力データD=（d1,d2,d3,d4,d5）を受け、記憶装置２２に記憶された要素分類モデルに基づき、入力データの特徴を抽出し、要素分類の集りである分類情報X=(x1, x2)を出力する。ここで、x1は、図３Ｂのデータの波形のピーク（山）が存在する領域（何番目）を表している。d1に対する分割情報X=(x1,x2)=(2,5)は、データd1では、ピーク（山）が領域２、ピーク値が５であることを表している。この分割情報X=(x1,x2)は、データに対して抽出された特徴に対応する（図３Ｃ参照）。x1は、要素データ（類型）φ＝｛φ1, φ2,φ3,…｝に対応する要素分類モデルに基づき、分類される。x2は、ピークの大きさを表している。x2は、要素データ（類型）ψ＝｛ψ1, ψ2,…｝に対応する要素分類モデルに基づき、分類される。

要素分類モデル学習部２１は、要素データφ={φ2,φ1,φ1,φ2,φ3}、ψ={ψ2,ψ1,ψ1,ψ2,ψ3}に基づき要素分類モデルを構成して記憶装置２２に記憶する。φは、入力データの波形のピーク（山）の位置（領域）からなり、{φ2,φ1,φ1,φ2,φ3}は類型（ピーク位置）の集まりを表している。また、ψは波高等からなり、｛ψ2,ψ1,ψ1,ψ2,ψ3｝は、ピーク（山）の位置に対応する波高の集まりを表している。

要素分類部２３から出力される分割情報X=(x1,x2)（図３Ｃ参照）は、統合モジュール３０の要素推定部３３と、要素推定モデル学習部３１に供給される。なお、要素推定モデル学習部３１は、要素推定モデルの学習時に、分割情報X=(x1,x2)を受け取るようにしてもよい。

要素推定部３３は、記憶装置３２に記憶された要素推定モデルに基づき、要素表現ベクトルZ＝(z1,z2)に変換し、決定モジュール４０に出力する。図３Ｄは、記憶装置３２に記憶された要素推定モデルの一つを模式的に説明する図である。図３Ｄには、図面作成の都合で、p(φ| x1=1）のみが例示されているが、記憶装置３２に記憶された要素推定モデルとして、例えばp(φ| x1=2）、p(ψ| x2=5）等、p(φ| x1=1）以外の確率分布も含む。

p(φ|x1=1）は、入力される分類情報X=(x1,x2)について、x1＝１が与えられたときに、要素データ（類型）がφである確率（条件付き確率）である。同様に、p(ψ|x2=1)は、x2=1が与えられたときに、要素データ（類型）がψである確率（条件付き確率）である。図３Ｄの要素推定モデルでは、p(φ| x1=1）の横軸の要素データφiをφ1、φ2、φ3としている。図３Ｄに示す要素推定モデルでは、確率p(φ| x1=1）はφ3付近で最も高い値となる分布を有している。

要素推定部３３は、例えば図３Ｄに例示した要素推定モデル（確率p(φ|x1））に基づき、類型φk (k=1,…,3)のサンプリングを行い、その値をベクトルZの要素z1とする。特に制限されないが、要素推定部３３は、例えば、ナイーブベイス（Naive Bayes）等により、図３Ｄにおいて、x1=1に対して最も確からしい（確率p(φ|x1=1)の値が最も大きい）φ（≒φ3）を求める（図３Ｄの横軸φのφ1、φ2、φ3を仮に１、２、３と数値化した場合、z1は3に近い値となる）。

同様に、要素推定部３３は、要素推定モデル（確率p(ψ| x2））に基づき、類型ψk (k=1,2,…)のサンプリングを行い、その値をベクトルZの要素z2とする。その際、要素推定部３３は、例えば、x2=5に対して最も確からしい（確率の値p(ψ｜x2=5)が最も大きい）ψを求めるようにしてもよい。

図３Ｅに、要素推定部３３に入力される分類情報X=(x1,x2)と、これを確率p(φ|x1）、p(ψ｜x2）でサンプリングした表現ベクトル（照合用ベクトル）Z=(z1,z2)との対応を示す。要素推定部３３は、ベイジアン・アトラクタ（Bayesian Attractor）構成としてもよい。

決定部（Decision Making）４２は、図３Ｆに示すように、ベクトルZ=(z1,z2)（図３Ｅ）と、記憶装置４３に意味モデルとして記憶された各グループの代表ベクトルrg^１＝（g¹ ₁, g¹ ₂）との距離に基づき、ベクトルZの属するグループ（グループＩＤ）４４を決定する。図３Ｆの例では、２次元空間（φ、ψ）において、ベクトルZ（点で示す）とrg^１（矢印で示す）との距離が最小となるグループを決定する。グループの代表ベクトルrg^１＝（g¹ ₁, g¹ ₂）との距離が所定の閾値以上の場合、グループ更新・生成部４１は、新たなグループを生成してもよい。

図３Ｇの例では、x1=8の場合に、新たに要素データ（類型）φにφ4を追加したことで（φは｛φ1,φ2,φ3,φ4｝となる）、φ4での値（頻度）が増大し（確率p(φ4|x1=8)が増大）、φ4に対応するグループ分けが行われ、分類精度が上がる様子が示されている。

要素推定モデル学習部３１は、確率p(φ|x1)が予め定められた閾値を越さない場合には、例えば決定部４２からの通知（例えばグループＩＤ）に基づき、新しい類型φ4を追加するようにしてもよい(確率p(ψ|x2)についても同様である)。

グループ更新・生成部４１は、入力装置１０から入力された正解ラベルG＝｛G^１, G^１,G²,G^１,G³｝（グループの正解ラベル）を受け、記憶装置４３に意味モデルとして記憶される分類グループの代表ベクトルを生成するようにしてもよい。グループ更新・生成部４１は、決定部４２からのベクトルZに基づき、記憶装置４３に意味モデルとして記憶される分類グループの代表ベクトルを更新するようにしてもよい。

図４は、第１の実施形態の別の構成例を示す図である。図４を参照すると、統合モジュール３０は、入力装置１０から入力された付加データ１３と、要素推定部３３から出力される表現ベクトルZを統合したベクトル（統合ベクトル）を生成し、決定モジュール４０に出力する要素統合部３４を備えている。付加データ１３は入力データ１１の例えば属性情報であり、入力データ１１に対応させて入力される。入力データ１１が、被写体に動物を含む画像データの場合、付加データ１３は、後述されるように、動物の鳴き声等（特徴）の属性情報（デジタル信号）であってもよい。

＜実施の形態２＞
図５は、本発明の例示的な第２の実施形態の構成を説明する図である。図５を参照すると、符号化モジュール２０は、図２の構成に加えて、要素データ生成部２５を有する。

要素データ生成部２５は、記憶装置２４に記憶されている要素モデルを参照して、入力装置１０から入力された入力データから分類に必要なデータに変換する。変換方法は、記憶装置２４に要素モデルとして予め記憶されている。

要素データ生成部２５は、複数種類のデータを生成してもよく、生成したデータそれぞれを要素分類部２３に出力する。

特に制限されないが、要素データ生成部２５で行われるデータ変換としては、例えば、
・二値化変換、
・周波数変換、
・色空間変換、
・オブジェクト抽出、
・様々な信号処理フィルタを用いた変換
の少なくともいずれかを含む。

要素分類部２３は、生成された要素データ毎に、特徴を抽出して、分類し、それぞれを要素とする、要素分類の集合したデータを出力する。

要素分類モデル学習部２１は、生成されたデータ毎に抽出する特徴を構成し、要素分類モデルとして記憶装置２２に記憶する。分類の学習に、正解ラベル１４を用いた教師あり学習を行ってもよい。あるいは、自己組織的写像（Self-organizing maps：SOM）により、教師なし学習を行ってもよい。

統合モジュール３０の要素推定部３３は、符号化モジュール２０の要素分類部２３から出力される要素分類集合を受け取り、学習済みの解釈可能な表象表現ベクトルに変換する。

分類結果は観測誤差の影響で真の値から分布する。また、必ずしも人が解釈できる表現になるように設計されていない。教師なしで分類学習を行った場合、特に顕著である。

要素推定部３３は、分割要素に対する要素分類を、人が解釈できる安定した表象表現に変換する。変換は、要素毎に要素分類モデルを参照して行う。例えば、要素kにおいて、入力される分類結果をXk、変換される類型をφkとする。

Xkが与えられた時にφkに変換される確率pk(φk|Xk)が要素分類モデルとして記憶されている。この確率に基づいた類型φkのサンプリングを行い、その値を表現ベクトルZの要素とする。表現ベクトルZは、表象表現ベクトルとも称呼される。

要素推定モデル学習部３１は、事前に学習データを用いて要素分類モデルを生成し記憶装置３２に記憶する。

要素kにおいて取り得る表象が、i種ありi番目の類型をφkiとすると、それぞれの類型の出現頻度に応じてpk(φk|Xk)を構成する。図６の例では、要素kにおいて取り得る表象がi＝３種あるものとする。例えば、要素分類部２３による分類情報Xkが与えられた時に学習データがφkiである条件付き確率pki(φki|Xk)を構成する。φkiは当該要素軸φk上に定義された離散値であり、当該値で確率pki(φki|Xk)を近似する確率としてpk(φk|Xk)を構成する。例えばpk(φk|Xk)は、確率値やデータ数をパラメータとする標準分布（標準正規分布）の和として構成することができる。

事前学習で用いる学習データは、類型φki間の類似度等を基に、類型φkiの値を定義しておく。なお、一つの要素における表象の表現は１次元に限らず、N次元（N≧2の整数）に拡張可能である。

要素推定モデル学習部３１は、要素推定時に、確率pk(φk|Xk)、又は、どの類型φkiの確率pki(φki|Xk)も、予め定められた閾値を越さない場合には、自律的または外部からの指示によって、新しい類型φkiを追加することができる。図７Ａでは、類型φ１k,…,φ3kの確率pki(φki|Xk)がいずれも閾値以下であるため、図７Ｂに示すように、新しい類型φ４Kが追加されている。つまり、類型の数が１つ増える。

要素推定モデル学習部３１は、自律的な追加を行う場合、ｋ以外の別の要素における確率が特定類型に高い確率を持つときに行う。つまり、k軸だけで見ると、既存の表象で表現できないが、別の軸で見ると、既存の表象で表現できる場合である。

要素推定モデル学習部３１において、新しく追加する類型φkiの確率の学習には、別の軸で、既存類型に収束する入力データに対応するXkのみを用いる。それとは別に、類型を追加せずに、既存の類型を正解とするように確率を修正することも指示するようにしてもよい。新規類型に与える値は、既存類型との類似度を基に決定するようにしてもよい。あるいは、外部からの指示やインクリメントなどのルールに従ってもよい。

特に制限されないが、要素データ例として、例えば、テクスチャ、色、形状等の例を説明する。対応する要素分類は、それぞれ周波数スペクトラム、色スペクトラム、抽出オブジェクトの分類である。

テクスチャの類型φ1は、｛平坦、縞、網目など｝
色の類型φ2は、｛黄、灰、茶など｝
形の類型φ3は｛首長、首短、首中、・・・｝
などを学習データとして用意する。

これは、入力データが動物画像の場合、
トラを（縞、黄、首短）、
キリンを（網目、黄、首長）
などと表現することに相当する。入力データが画像の例で説明したが、画像に制限されるものでないことは勿論である。なお、類型φ1、φ2（φ3）等とインデックスk(k=1,2,3,…)で類型φkを区別する表記が用いられるが、図８Ｂ乃至図８Ｅ等では、見やすさのため、φ1、φ2(φ3)を、φ、ψ（η）等で表している。

要素統合部３４は、表現ベクトルZに、新しい要素として、入力装置１０から受け取った、付加データ１３を追加し、統合ベクトルを出力する。特に制限されないが、付加データは、鳴き声や匂いなどの属性であり、例えば入力データDに関連付けして入力される（例えば入力データ１１と付加データ１３を対として入力される）。

決定部（Decision Makingモジュール）４２は、入力された統合ベクトルZに最も近い代表ベクトルrgを探索し、その代表ベクトルrgが属するグループを、グループＩＤ４４として出力する。代表ベクトルrgは、意味空間に定義された、認知する分類グループを代表するベクトルである。

ベクトル間の近さは、例えば、距離を重み付きの二乗和で評価する。重みをwi、統合ベクトルをzi、グループgのrgiを代表ベクトルとすると、距離ｇは以下で与えられる。Σ iは総和演算子であり、ここでは、グループの個数分を総和する。
距離g ＝ Σ_i wi*|z_i - rg_i|²

統合ベクトルと代表ベクトルの距離が、どの代表ベクトルからも、予め定められた閾値以上である場合、未知のグループであるとする。

上記距離ｇにおいて、重みwiは特定要素の重要度を設定するためのパラメータであり、「選択的注意」とも呼ばれる。重みの設定は、単純には認知の目的に応じて静的に決めておくか、外部から設定する。要素分類部２３の分類精度などに応じて、動的に設定してもよい。

認知分類グループの数や代表ベクトルは、意味モデルとして記憶装置４３に記憶される。

グループ更新・生成部４１は、統合ベクトル及び正解ラベルを基に、分類グループの代表ベクトルを生成、更新する。統合ベクトルは、決定部４２から取得してもよい。正解ラベル１４は、入力装置１０から取得する。例えば、代表ベクトルは同じラベルを持つベクトルの中央値とする。グループ更新・生成部４１は、決定部４２で同定した統合ベクトルを用いて、決定したグループの代表ベクトルを更新するようにしてもよい。

グループ更新・生成部４１は、
・当該グループに属する過去全てのベクトルの中央値となるように更新する、
・ある一定のウィンドウ（時間窓）を設け、最近用いたベクトルの中央値とする、
・要素分類部２３の分類精度などに応じて、更新の貢献度や更新の有無を決定する、
等の処理を行うようにしてもよい。

グループ更新・生成部４１は、決定部４２で未知のグループと同定された統合ベクトルを用いて、グループを新規に生成するようにしてもよい。

グループ更新・生成部４１は、未知と同定されたベクトルが意味空間上である半径以内に一定数分布した場合、当該ベクトルの中央値として代表ベクトルを生成し、新規グループとして、意味モデルとして記憶装置４３に記憶する。

図８Ａ乃至図８Ｅは、図５を参照して説明した第２の実施形態のシステムのデータの処理の具体例の一例を説明する図である。要素データとして、図８Ｅに示すように、
φ＝｛縞々、平坦、網目｝={φ1,φ2,φ3}、
ψ＝｛白黒、灰色、黄色｝={ψ1,ψ2,ψ3}、
η＝｛首中、首短｝＝｛η1, η2｝
が、要素分類モデルに設定されているものとする。
図８Ａにおいて、入力データD（８１）として、d1（シマウマ）、d2（ゾウ）、d3（キリン）の各画像データ（静止画像）が入力される。

要素データ生成部２５は、テクスチャ、色、首比の要素データ（８２）をそれぞれ入力データD-={d1、d2、d3}から生成する。要素分類部２３は、要素データの特徴を、要素分類モデル(φ,ψ, η)に基づき分類し、入力データDの｛d1、d2、d3}に対応して、の分類情報X1=(x11,x12,x13)、(x21,x22,x23)、(x31,x32,x33)（８３）を出力する。ここで、(x11,x12)、（x21,x22)、（x31,x32）は、例えばヒストグラム、x13、x23、x33は例えば比率である。

要素推定部３３は、分類情報X=(x1,x2,x3)を受け、要素推定モデルに基づき、図８Ａにおける表現ベクトルZ＝(z1,z2,z3)（８４）を出力する。この例では、要素統合部３４は、付加データを付加せず、表現ベクトルZを統合ベクトルとして決定部４２に出力する。

決定部４２は、図８Ｂに示すように、統合モジュール３０からのベクトルZと、各グループG¹、G²、・・・の代表ベクトルｒｇの距離に基づき、ベクトルZが属するグループＩＤを決定する。

要素推定モデル学習部３１は、類型η1、η2の確率p(η|x3=2)が、予め定められた閾値を越さない場合には、新しい類型η3を追加するようにしてもよい。図８Ｃでは、類型η1、η2の確率p(η|x3=2)がいずれも閾値以下であるため、図８Ｄに示すように、新しい類型η3(首長)が追加されている。これにより、類型η3(首長)に基づく分類を可能とし、分解能が増大する。

次に第２の実施の形態の動作について説明する。

まず、図９を参照して、グループ決定を行う動作を説明する。

要素データ生成部２５は、入力データを分類に必要なデータに変換する（ステップＳ１１）。

要素データ生成部２５は、例えば、入力画像に対し、周波数変換、色空間変換、オブジェクト抽出を行い、周波数スペクトラム、色スペクトラム、オブジェクトを出力する。周波数変換及び色空間変換は抽出したオブジェクトに対して行ってもよい。

要素分類部２３は、生成されたデータ毎に特徴抽出及び分類し、それぞれを要素とする要素分類の集合データを出力する（ステップＳ１２）。

要素分類部２３は、例えば、周波数スペクトラム、色スペクトラムに対しては、ニューラルネットワークやサポートベクトルマシン(Support vector machine; SVM)等を用いて分類確率を持つデータ集合を生成する。

オブジェクトに対しては、オブジェクトのサブ領域を抽出し、１以上の領域毎の座標値を生成する。分類の数や領域の数は要素分類モデルを参照する。

要素推定部３３は入力されるデータ集合を表象表現ベクトルに変換する（ステップＳ１３）。

要素をkとする（kは、周波数、色、オブジェクトに対応して1から3の値と定義）。要素分類の各要素を、対応する表象ベクトルの要素（テクスチャ、色、形状）に変換する。表象の取り得る類型は学習済みであり、例えば、テクスチャは{平坦、縞、網目}、色は{黄、灰、茶}、形状は{縦長、横長、正方}などである。

表象表現ベクトルの要素kは、要素分類Xkが与えられた時の条件付き確率を基に生成される。取り得る類型をφkiとすると確率はpki(φki|Xk)で与えられる。

例えば、k=1（テクスチャ）において、
φ11=1、φ12=2、φ13=3（平坦、縞、網目をそれぞれ１，２，３）とする。

このテクスチャ軸上でテクスチャ類型を与える確率p1(φ1| Xk)を構成し、この確率を基にサンプリングを行う。

要素統合部３４は、表象表現ベクトルに新しい要素として付加データ（付加情報）１３を追加し、統合ベクトルを出力する（ステップＳ１４）。付加情報は、入力に関する属性値であり、鳴き声や匂いなど他のモダリティー由来の情報も統合することができる。

決定部４２は、入力された統合ベクトルに最も近い代表ベクトルを探索し、その代表ベクトルが属するグループをグループＩＤとして出力する（ステップＳ１５）。

ベクトル間の近さは、重み付きの二乗和で評価し、重みは目的に応じて外部から与える。

グループ更新・生成部４１は、探索された代表ベクトルを、入力された統合ベクトルを用いて更新する（ステップＳ１６）。

図９のステップＳ１５において、決定部４２は、入力された統合ベクトルに最も近い代表ベクトルを探索し、どの代表ベクトルからも閾値以上の距離の時は、未知のグループとして判断し、未知グループＩＤを出力する。

この場合、ステップＳ１６において、グループ更新・生成部４１は、未知グループＩＤを持つ統合ベクトルが意味空間上である半径以内に一定数分布した場合、当該ベクトルの中央値として代表ベクトルを生成し、新規グループを生成する。

次に、図１０を参照して、図７を参照して説明した要素軸（φｋ）の更新を行う動作について説明する。ステップＳ２１〜Ｓ２４までは、図９のＳ１１〜Ｓ１４と同じである。

決定部４２は、全ての要素軸で評価するとグループを形成しないが、一定数の軸のみで評価した場合にグループ生成の条件を満たす場合、グループＩＤを仮生成し、要素推定モデル学習部３１及び要素分類モデル学習部２１にフィードバックする（ステップＳ２５）。

例えば、色軸及びオブジェクト軸で既存の類型に収束するが、テクスチャ軸(k=1)では既存の類型に収束せず、既存類型の確率p1iが閾値を超えない場合である。

要素推定モデル学習部３１は、フィードバックされた、仮生成されたグループＩＤを受けると新しい類型（φ14=4：類型φk（k=1）の４項目、値を４とする）を追加することができる（ステップＳ２６）。

要素推定モデル学習部３１は、色軸及びオブジェクト軸が同じ類型に収束する入力の要素分類X1を用いて、p14(φ14|X1)を構成し、テクスチャ軸の確率p1を更新するようにしてもよい。新しい類型に与える値は、既存類型の最大値からインクリメントした値とする。追加する類型の値は外部より指示することができ、学習の有無も指示可能である。

要素分類モデル学習部２１は、フィードバックされた、仮生成されたグループＩＤを受けると、仮生成されたグループＩＤを正解ラベルとして、収束しない軸の要素分類モデルを更新することができる（ステップＳ２７）。正解ラベルは、装置外部より、入力装置１０を介して、指示することができ、学習の有無も指示可能である。入力装置１０は、外部からのデータを受信する通信インタフェース（トランシーバのレシーバ）や、キーボード等を含む入力インタフェースであってもよい。

次に、図１１を参照して、第２の実施形態において、事前学習を行う動作を説明する。ステップＳ３１、Ｓ３３、Ｓ３５、Ｓ３６、Ｓ３７はそれぞれ、図９のステップＳ１１、Ｓ１２、Ｓ１３、Ｓ１４、Ｓ１５と同じである。

要素分類モデル学習部２１は、要素データ生成部２５により生成されたデータを用いて要素分類モデルを学習する（ステップＳ３２）。ニューラルネットワークで分類を行う場合、正解ラベルを用いて、ニューラルネットワークの重みを学習する。

要素推定モデル学習部３１は、要素分類部２３より生成された分類情報Xkと、正解ラベル（類型φki）から、pki(φki|Xk)及びpk(φk|Xk)を構成する（ステップＳ３４）。

グループ更新・生成部４１は、同じ正解ラベル（グループＩＤ）をもつ要素統合部３４で生成された統合ベクトルの中央値を代表ベクトルとして生成し、グループを生成する（ステップＳ３８）。

学習データが終了したか判定し（ステップＳ３９）、学習データが無くなるまでステップＳ３１〜Ｓ３８を繰り返す。

なお、図５において、付加データ１３を付加しない場合、要素統合部３４を削除し、要素推定部３３の出力を、決定部４２へ出力するようにしてもとよい。

＜第３の実施形態＞
図１２は、本発明の第３の実施形態の構成を説明する図である。図１２を参照すると、要素データ生成部２５は、分割推定部２５１と、要素分割部２５２を備えている。分割推定部２５１は、例えば連続画像データ等の入力データを受け、入力データを分割するための特徴を抽出する。

抽出する分割特徴は、要素モデルとして記憶装置２４に記憶される。記憶装置２４の要素モデルは、分割推定部２５１が、分割の推定時に参照する。

要素分割部２５２は、分割特徴を基に、入力データを分割して出力する。符号化モジュール２０は、さらに要素モデル学習部２６を備えた構成としてもよい。要素モデル学習部２６は、入力データと分割情報から、要素モデルを構築することができる。

特に制限されないが、一例として、
・入力データ１１として、連続する動物の画像データ、
・分割情報１５として、関節座標情報、
・正解ラベル１４として、動物の種類、
とする。

動物は荒い近似では、骨格を基にした多関節剛体として近似できる。例えば、顔、首、胴、足、尾などの剛体パーツが関節で接続したオブジェクトとして表現でき、関節座標がわかればそれぞれのパーツが分割可能である。

関節座標とパーツの対応は、予め与えておく。この場合、分割推定部２５１は、分割特徴として関節座標を抽出する。

要素モデル学習部２６は、入力データである画像データと、分割情報１５である関節座標情報とを基に、要素モデルを構築する。

要素モデル学習部２６は、例えば、画像データを入力、関節座標情報を教師データとして、例えばディープラーニング技術で学習し、学習したネットワークモデルを、要素モデルとして、記憶装置２４に記憶するようにしてもよい。

要素モデル学習部２６は、未学習の時は、画像データの入力に対して、誤差の大きい関節座標を生成する。この誤差を最小にするようにモデルを構築する。

要素分割部２５２は、入力データ１１（画像）を、分割情報（関節座標）を基に、要素画像に分割する。

要素画像は、例えば、顔、首、胴、足、尾などに対応する画像である。

要素分類部２３は、分割された要素画像それぞれに対して分類を行う。例えば、ディープラーニング技術で分類を行うようにしてもよい。ネットワークモデルとして、要素分類モデル学習モジュールで学習したものを使ってもよいし、一般画像を使った学習済みのものを使ってもよい。要素分類部２３の出力は、例えば、分類確率を要素とするデータ集合であってもよい。

要素分類モデル学習部２１は、要素画像と、正解ラベルとを基に、要素分類モデルを構築することができる。

例えば、要素画像を入力とし、パーツラベル（例えば、縞の足や網目の胴など）を教師データとして、要素ごと（顔、首、胴、足、尾ごと）にディープラーニング技術で学習し、学習したネットワークモデルを要素分類モデルとして記憶する。

要素推定モデル学習部３１は、データが入力される毎に、適応的に確率pki(φki|Xk)及びpk(φk|Xk)を更新する。要素推定部３３による推定結果は、既知で同種のデータが連続して入力すると、特定の類型に対する確率が次第に高くなることが期待される（図１３（Ａ）、（Ｂ）参照）。図１３（Ｂ）には、図１３（Ａ）に対して、特定の類型φ２ｋに対する確率が高くなる様子が示されている。

例えば、同一のトラの動画像を入力としている場合などである。確率pk(φk|Xk)がどの領域でも閾値を超えない間は結果を出力せず、超えた場合に表象表現ベクトルを出力することもできる。要素推定部３３において、同種のデータが連続しデータが蓄積しても、確率pk(φk|Xk)、又は、どの類型φkiの確率pki(φki|Xk)も閾値を越さない場合、要素推定モデル学習モジュールは類型の追加や、既存類型に収束する更新を行うことができる。

要素統合部３４は、上記要素画像の表象表現ベクトルに、テクスチャ、色、形状などの表現ベクトルを統合することができる。入力データが画像の例で説明したが、画像に制限されるものでないことは勿論である。

次に、図１４を参照して、第３の実施の形態の動作について説明する。

以下では、適応学習を行う動作例を説明する。分割推定部２５１は、画像データを入力として関節座標を抽出する（ステップＳ４１）。例えば、ディープラーニング技術で関節座標を推定する。

要素分割部２５２は、入力画像を、関節座標を基に関節を両端とするパーツを含む要素画像に分割する（ステップＳ４２）。関節座標とパーツの対応は、予め与えておく。

要素分類部２３は、分割された要素画像それぞれに対し分類を行う（ステップＳ４３）。例えば、ディープラーニング技術で、要素分類を推定する。

要素推定モデル学習部３１は、データが入力される毎に確率pki(φki|Xk)及びpk(φk|Xk)を更新する（ステップＳ４４）。

要素推定モデル学習部３１は、確率pk(φk|Xk)が予め定められた閾値を超えるか判断する（ステップＳ４５）。

確率pk(φk|Xk)が閾値を超えている場合（ステップＳ４５のＹｅｓ分岐）、要素推定部３３では、確率pk(φk|Xk)を用いて表象表現ベクトルを生成し、要素統合部３４に出力する（ステップＳ４６）。確率pk(φk|Xk)が閾値を超えない場合には、同種のデータの蓄積があるか否かを判断する（ステップＳ５０）。同種のデータの蓄積がない場合には（ステップＳ５０のＮｏ分岐）、ステップＳ４１の処理に戻る。

同種データを連続して入力しても、どの領域でも確率pk(φk|Xk)が閾値を越さない場合（ステップＳ５０のＹｅｓ分岐）、要素推定モデル学習部３１は、類型の追加を行い（ステップＳ５１）、ステップＳ４１に戻る。

要素統合部３４は、要素画像の表象表現ベクトルに、テクスチャ、色、形状などの表象表現ベクトルを統合することができる（ステップＳ４６）。

ステップＳ４７、ステップＳ４８は、それぞれ、図９のステップＳ１５、ステップＳ１６と同様である。

次に、学習データが終了したか判定し（ステップＳ４９）、学習データが無くなるまでステップＳ４１〜Ｓ４８（ステップＳ５０、Ｓ５１も含み得る）の処理を繰り返す。

なお、図１２において、付加データ１３を付加しない場合、要素統合部３４を削除し、要素推定部３３の出力を、決定部４２へ出力するようにしてもよい。

前記した各実施形態によれば、入力データをまとまりのある要素に分割し、分割要素を解釈可能な表現に変換し、それを要素とする表現ベクトルを意味空間上でグルーピングし、分割要素の表現と意味空間上のグループを協調して操作することで、刺激弁別能力を高め、認知分類グループの新規獲得を可能にする。

大局的な環境刺激に対し分割要素は比較的単純な特徴を持つため、他軸と協調することで分割要素の表現を自律的に獲得でき、その組合せで評価することで弁別能力を高めることができる。分割要素を、追加獲得する類型値の表現に変換することで、自律的なグループ形成を観測可能にし、外部からの干渉を可能とする。要素表現を連続的に修正することで、少ないグループから始めてより多くの新規グループを獲得できる。

なお、上述の実施の形態における各手段（各処理部）は、ＩＣ（Integrated Circuit）回路などのハードウェア又はソフトウェア、もしくはその両方によって構成される。例えば、上記の各手段はコンピュータにより構成される。図１５は、このようなコンピュータ装置（分類装置）３００のハードウェア構成例を示している。コンピュータ装置３００は、プロセッサ３０１と、インタフェース３０２と、メモリ３０３とを備え、それぞれバス３０４を介して接続されている。インタフェース３０２は、データ入出力手段によりデータのやり取りに使われる。インタフェース３０２には、例えばネットワークデバイス、ファイルデバイス、センサデバイスが接続される。プロセッサ３０１は、インタフェース３０２を介して、各種情報を入出力する。プロセッサ３０１は、メモリ３０３に格納されたプログラムを実行する。メモリ３０３は、例えば、プロセッサ３０１によって実行されるプログラムを記憶するメインメモリを含む。メモリ３０３に記憶されているプログラムは、各手段の処理を実行するために、プロセッサ３０１に処理させるための命令群（instruction codes）を含む。なお、プロセッサ３０１はその内部に実行する命令を格納するメモリを備えた構成としてもよい。

すなわち、前記各実施形態の分類装置（符号化モジュール２０、統合モジュール３０、決定モジュール４０を含む）は、それぞれの処理のためのプログラムがプロセッサ３０１で実行されることにより実現することができる。あるいは、符号化モジュール２０、統合モジュール３０、決定モジュール４０をそれぞれ、図１５のコンピュータ装置３００で実現してもよい。

上記プロセッサ３０１で実行されるプログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ−ＲＯＭ（Read Only Memory）、ＣＤ−Ｒ、ＣＤ−Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

なお、図２、図３Ａ、図４、図５、図１２において、入力装置１０と符号化モジュール２０を端末側に実装し、統合モジュール３０と、決定モジュール４０を、端末と通信接続するサーバ装置に実装するようにしてもよい。この場合、サーバ装置は、クラウドサービスを提供すサーバとして構成としてもよい。

前記第２、第３の実施形態では、一例として、画像情報等の分類を例に説明したが、本発明は、センシングデバイス等で取得した信号（情報）から特徴を抽出して分類する各種装置、システムに適用可能である。

なお、上記の特許文献１の開示を、本書に引用をもって繰り込むものとする。本発明の全開示（請求の範囲を含む）の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素（各請求項の各要素、各実施例の各要素、各図面の各要素等を含む）の多様な組み合わせ乃至選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。

１分類システム（分類装置）
１０入力装置
１１入力データ
１２要素データ
１３付加データ
１４正解ラベル
１５分割情報
２０符号化モジュール
２１要素分類モデル学習部
２２記憶装置（要素分類モデル）
２３要素分類部
２４記憶装置（要素モデル）
２５要素データ生成部
２６要素モデル学習部
３０統合モジュール
３１要素推定モデル学習部
３２記憶装置（要素推定モデル）
３３要素推定部
３４要素統合部
４０決定モジュール
４１グループ更新・生成部
４２決定部
４３記憶装置（意味モデル）
４４グループＩＤ
８１入力データ（画像データ）
８２要素データ
８３分類情報
８４表現ベクトル
１０１入力装置
１０２符号化モジュール
１０３決定モジュール
２５１分割推定部
２５２要素分割部
３００コンピュータ装置
３０１プロセッサ
３０２インタフェース
３０３メモリ
３０４バス
１０１１入力データ
１０２１特徴抽出部
１０３１マッチング部
１０３２グループＩＤ

Claims

入力データの特徴を抽出し、第１の記憶部に記憶された要素分類モデルに基づき、分類情報を出力する要素分類部を備えた符号化モジュールと、
前記分類情報を受け、第２の記憶部に記憶された要素推定モデルに基づき、照合用のベクトルに変換する要素推定部を備えた統合モジュールと、
前記照合用のベクトルと、意味モデルとして第３の記憶部に記憶された各グループの代表ベクトルとを照合して前記照合用ベクトルの属するグループを決定し、前記グループのグループＩＤを分類結果として出力する決定部を備えた決定モジュールと、
を有する、ことを特徴とする分類装置。
前記決定モジュールにおいて、
前記決定部は、前記照合用のベクトルと、前記意味モデルとして学習された代表ベクトルとの距離を計算し、前記距離が所定値以下の場合、前記代表ベクトルが属するグループＩＤを決定し、
前記決定モジュールは、前記グループを前記照合用のベクトルから構成し意味モデルとして前記第３の記憶部に記憶するグループ更新・生成部をさらに備えた、ことを特徴とする請求項１に記載の分類装置。
前記統合モジュールは、
前記分類情報、及び入力された要素データに基づき、前記要素推定モデルを生成する要素推定モデル学習部をさらに備え、
前記要素推定モデル学習部は、前記決定部で決定したグループＩＤを入力として前記要素推定モデルを学習する、ことを特徴とする請求項１又は２に記載の分類装置。
前記統合モジュールは、
前記要素推定部で生成された前記ベクトルに、前記入力データに対応して入力された付加情報を付加した統合ベクトルを生成し、前記照合用のベクトルとして、前記決定モジュールに出力する要素統合部をさらに備えた、ことを特徴とする請求項３に記載の分類装置。
前記符号化モジュールは、
入力された要素データに基づき前記要素分類モデルを生成する要素分類モデル学習部をさらに備えた、ことを特徴とする請求項１乃至４のいずれか１項に記載の分類装置。
前記符号化モジュールは、
前記入力データを受け、前記要素分類部での分類に必要な要素データに変換する要素データ生成部をさらに備えた、ことを特徴とする請求項５に記載の分類装置。
前記要素データ生成部は、
前記入力データを受け、第４の記憶部に記憶された要素モデルに基づき、前記入力データを分割するための特徴を抽出する分割推定部と、
前記分割特徴に基づき、前記入力データを分割し、前記要素分類部に出力する要素分割部と、
を含む、ことを特徴とする請求項６に記載の分類装置。
コンピュータによる分類方法であって、
入力データの特徴を抽出し、第１の記憶部に記憶された要素分類モデルに基づき、分類情報を出力する要素分類処理を含む符号化ステップと、
前記分類情報を受け、第２の記憶部に記憶された要素推定モデルに基づき、照合用のベクトルに変換する統合ステップと、
前記照合用のベクトルと、意味モデルとして第３の記憶部に記憶された各グループの代表ベクトルとを照合して前記照合用ベクトルの属するグループを決定し、前記グループのグループＩＤを分類結果として出力する決定ステップと、
を含むことを特徴とする分類方法。
前記決定ステップは、
前記照合用のベクトルと、前記意味モデルとして学習された代表ベクトルとの距離を計算し、前記距離が所定値以下の場合、前記代表ベクトルが属するグループＩＤを決定するステップと、
前記グループを前記照合用のベクトルから構成し意味モデルとして前記第３の記憶部に記憶するステップと、
を含む、ことを特徴とする請求項８に記載の分類方法。
前記統合ステップは、
前記分類情報を受け、前記要素推定モデルに基づき、表現ベクトルに変換するステップと、
前記分類情報、及び入力された要素データに基づき、前記要素推定モデルを生成する要素推定モデル学習ステップと、
を含み、
前記要素推定モデル学習ステップでは、前記決定ステップで決定したグループＩＤを入力として前記要素推定モデルを学習する、ことを特徴とする請求項８又は９に記載の分類方法。
前記統合ステップは、
前記分類情報と前記要素推定モデルに基づき生成したベクトルに、前記入力データに対応して入力された付加情報を付加した統合ベクトルを生成し、前記照合用のベクトルとして、前記決定ステップに供給するステップを含む、ことを特徴とする請求項１０に記載の分類方法。
前記符号化ステップは、
入力された要素データに基づき前記要素分類モデルを生成する要素分類モデル学習ステップを含む、ことを特徴とする請求項８乃至１１のいずれか１項に記載の分類方法。
前記符号化ステップは、
前記入力データを受け、分類情報の作成に必要な要素データに変換する要素データ生成ステップをさらに含む、ことを特徴とする請求項１２に記載の分類方法。
前記要素データ生成ステップは、
前記入力データを受け、第４の記憶部に記憶された要素モデルに基づき、前記入力データを分割するための特徴を抽出する分割推定ステップと、
前記分割特徴に基づき、前記入力データを分割し、前記要素分類処理に出力する要素分割ステップと、
を含む、ことを特徴とする請求項１３に記載の分類方法。
入力データの特徴を抽出し、第１の記憶部に記憶された要素分類モデルに基づき、分類情報を出力する要素分類処理を含む符号化処理と、
前記分類情報を受け、第２の記憶部に記憶された要素推定モデルに基づき、照合用のベクトルに変換する要素推定処理を含む統合処理と、
前記照合用のベクトルと、意味モデルとして第３の記憶部に記憶された各グループの代表ベクトルとを照合して前記照合用ベクトルの属するグループを決定し、前記グループのグループＩＤを分類結果として出力する決定処理と、
をコンピュータに実行させる、ことを特徴とするプログラム。
前記決定処理は、
前記照合用のベクトルと、前記意味モデルとして学習された代表ベクトルとの距離を計算し、前記距離が所定値以下の場合、前記代表ベクトルが属するグループＩＤを決定する処理と、
前記グループを前記照合用のベクトルから構成し意味モデルとして前記第３の記憶部に記憶するグループ更新・生成処理を実行する、ことを特徴とする請求項１５に記載のプログラム。
前記統合処理は、
前記分類情報、及び入力された要素データに基づき、前記要素推定モデルを生成し、前記決定処理で決定したグループＩＤを入力として前記要素推定モデルを学習する要素推定モデル学習処理を実行する、ことを特徴とする請求項１５又は１６に記載のプログラム。
前記統合処理は、
前記要素推定処理で生成された前記ベクトルに、前記入力データに対応して入力された付加情報を付加した統合ベクトルを生成し、前記照合用のベクトルとして、前記決定処理に出力する要素統合処理をさらに実行する、ことを特徴とする請求項１７に記載のプログラム。
前記符号化処理は、
入力された要素データに基づき前記要素分類モデルを生成する要素分類モデル学習処理をさらに実行する、ことを特徴とする請求項１５乃至１８のいずれか１項に記載のプログラム。
前記符号化処理は、
前記入力データを受け、前記要素分類処理での分類に必要な要素データに変換する要素データ生成処理をさらに実行する、ことを特徴とする請求項１９に記載のプログラム。
前記要素データ生成処理は、
前記入力データを受け、第４の記憶部に記憶された要素モデルに基づき、前記入力データを分割するための特徴を抽出する分割推定処理と、
前記分割特徴に基づき、前記入力データを分割し、前記要素分類処理に出力する要素分割処理と、を実行する、ことを特徴とする請求項２０に記載のプログラム。