WO2016208260A1

WO2016208260A1 - 画像認識装置および画像認識方法

Info

Publication number: WO2016208260A1
Application number: PCT/JP2016/062357
Authority: WO
Inventors: 三友刈屋; 上野　晃
Original assignee: オリンパス株式会社
Priority date: 2015-06-22
Filing date: 2016-04-19
Publication date: 2016-12-29
Also published as: JP2017010255A; CN107710277A; US20180129914A1

Abstract

　入力された画像に対するサポートベクタマシン（ＳＶＭ）演算を行うＳＶＭ演算部と、画像認識の処理の途中で生成されるデータを一時的に保存するデータ保存部とを備え、ＳＶＭ演算部は、入力された画像に写されている対象物である認識対象物と認識する対象物である比較対象物とが類似している度合いを表す特徴値を算出する特徴値算出部と、教師データ群において同じ種類の比較対象物に分類された教師データに対応する特徴値を累積加算する累積加算部とを具備し、ＳＶＭ演算の処理において、特徴値算出部は、全ての教師データに対応する特徴値を算出してデータ保存部に保存させ、累積加算部は、同じ種類の比較対象物の特徴値を累積加算して、画像認識の処理において認識対象物を認識した結果として出力する。

Description

画像認識装置および画像認識方法

　本発明は、画像認識装置および画像認識方法に関する。
　本願は、２０１５年０６月２２日に、日本に出願された特願２０１５－１２４７８６号に基づき優先権を主張し、その内容をここに援用する。

　従来から、画像に写されている物体、つまり、被写体（対象物）や、画像が撮影されたシーンを認識する画像認識の技術がある（非特許文献１参照）。従来の画像認識の技術では、以下のような処理手順によって画像が写されたシーンを認識する。

（手順１）：入力された画像における代表的な局所パターン（ビジュアルワード）の集合を生成する。
（手順２）：ビジュアルワードに基づいて、入力された画像全体のヒストグラム（認識対象データ）を生成する。
（手順３）：認識対象データと大量の教師データのそれぞれとを比較して、入力された画像のシーンを認識する。

　ここで、教師データとは、大量の画像を対象物の種類ごとに分類してまとめたヒストグラムである。従来の画像認識の技術では、上述した手順３の処理において、例えば、ＳＶＭ（Ｓｕｐｐｏｒｔ　ｖｅｃｔｏｒ　ｍａｃｈｉｎｅ：サポートベクタマシン）演算などを行って、入力された画像に写っている対象物とそれぞれの教師データが表す対象物とがどれくらい類似しているかを表す特徴値を、それぞれの教師データごとに算出する。そして、最も特徴値が大きい教師データが表している対象物を、入力された画像に写っている対象物、または最も特徴値が大きい対象物が写っているシーンであると認識する。

　ここで、ＳＶＭ演算では、以下のような手順によって、それぞれの教師データごとに特徴値を算出している。

（手順３－１）：大量の教師データの中から１つの教師データを読み込む。
（手順３－２）：読み込んだ教師データと認識対象データとを比較して特徴値（カーネル）を算出する。
（手順３－３）：算出した特徴値を累積加算する。
（手順３－４）：累積加算したそれぞれの特徴値を、入力された画像に写っている対象物とそれぞれの教師データが表す対象物とが類似している度合いを表す類似度として出力する。

　なお、従来の画像認識の技術では、１つの対象物に対する類似度を出力するために、例えば、５０００個の教師データの中から、同じ種類の対象物に分類された１５００個の教師データを読み込み、１５００個の特徴値を累積加算して類似度として出力している。つまり、従来の画像認識の技術では、上述した手順３－１～手順３－３までの処理手順を１５００回繰り返すことによって、入力された画像に含まれる１つの対象物に対する類似度を、教師データにおいて分類された対象物ごとに出力している。

　また、従来の画像認識の技術では、入力された画像に含まれる認識対象の対象物の数、すなわち、シーンの数だけ、類似度を出力する。つまり、従来の画像認識の技術では、上述した手順３－１～手順３－４までの処理手順をシーンの数だけ繰り返すことによって、認識対象のそれぞれの対象物ごとの類似度を出力している。

柳井啓司，　"Ｂａｇ－ｏｆ－Ｋｅｙｐｏｉｎｔｓによるカテゴリー認識"，　第１４回　画像センシングシンポジウム（ＳＳＩＩ２００８），　２００８年６月１３日

　しかしながら、従来の画像認識の技術では、上述したように、１つの対象物に対する類似度を出力するために、多数（例えば、１５００個）の教師データの読み込みを行っている。そして、従来の画像認識の技術では、引き続き同じ画像に含まれる他の対象物に対する類似度を出力する際に、前回の類似度を出力するために教師データを読み込んで算出した特徴値を破棄して、別の種類の対象物に分類された多数の教師データの読み込みを再度行っている。このため、従来の画像認識の技術では、入力された画像に認識対象の対象物が複数含まれている場合には、対象物の数（シーン数）×多数の教師データの読み込みと特徴値の算出とが行われる。

　ところが、教師データにおいては、同じヒストグラムが、異なる複数種類の対象物に分類されている。つまり、異なる対象物で教師データが重複している場合がある。このため、従来の画像認識装置では、異なる対象物に対応した類似度を出力する場合において、同じ教師データの読み込みや、同じ教師データを用いて同じ特徴値を算出する演算を複数回行っている。この従来の画像認識装置における同じ教師データの読み込みや同じ特徴値の算出の繰り返し、つまり、重複した処理は、画像認識装置において画像認識の処理を行う際の負荷を増大させる要因となる。

　本発明は、上記の課題認識に基づいてなされたものであり、画像認識の処理を行う際の負荷を軽減することができる画像認識装置および画像認識方法を提供することを目的としている。

　本発明の第１の態様によれば、画像認識装置は、入力された画像に対する画像認識の処理を、認識する対象物である比較対象物の画像のヒストグラムである教師データを前記比較対象物の種類ごとに分類して複数含んだ教師データ群に基づいて行う画像認識装置であって、前記画像のビジュアルワードに基づいて生成されたヒストグラムに対するサポートベクタマシン（ＳＶＭ）演算を、前記教師データ群に含まれる複数の前記教師データのそれぞれに基づいて行うＳＶＭ演算部と、前記画像認識の処理の途中で生成されるデータを一時的に保存するデータ保存部と、を備え、前記ＳＶＭ演算部は、入力された前記画像のヒストグラムと、前記教師データが表す前記比較対象物のヒストグラムとを比較し、入力された前記画像に写されている対象物である認識対象物と前記比較対象物とが類似している度合いを表す特徴値を算出する特徴値算出部と、同じ種類の前記比較対象物に分類された前記教師データに対応する前記特徴値を累積加算する累積加算部と、を具備し、前記ＳＶＭ演算の処理において、前記特徴値算出部は、前記教師データ群に含まれる全ての前記教師データに対応する前記特徴値を、それぞれの前記教師データごとに算出し、算出した全ての前記特徴値を前記データ保存部に保存させ、前記累積加算部は、前記特徴値算出部が全ての前記特徴値を前記データ保存部に保存させた後に、保存された全ての前記特徴値の中から、同じ種類の前記比較対象物に分類された前記教師データに対応する前記特徴値を読み出して累積加算し、累積加算した前記特徴値を、前記画像認識の処理において前記認識対象物を認識した結果として出力する。

　本発明の第２の態様によれば、上記第１の態様の画像認識装置において、前記特徴値算出部は、前記教師データ群に含まれる前記教師データの数が、前記画像認識の処理において前記認識対象物を認識した全ての結果を出力するまでに前記累積加算部が前記データ保存部に保存された前記特徴値を読み出して累積加算する回数よりも少ない場合に、前記教師データ群に含まれる全ての前記教師データに対応する全ての前記特徴値を算出して前記データ保存部に保存させてもよい。

　本発明の第３の態様によれば、上記第２の態様の画像認識装置において、全ての前記教師データを１つにまとめた状態で可逆圧縮した形式で入力された前記教師データ群を解凍してそれぞれの前記教師データに復元する教師データ解凍部、をさらに備え、前記ＳＶＭ演算の処理において、前記教師データ解凍部は、前記教師データ群を解凍してそれぞれの前記教師データに復元し、前記特徴値算出部は、前記教師データ解凍部によって復元されたそれぞれの前記教師データに対応する全ての前記特徴値を算出して前記データ保存部に保存させてもよい。

　本発明の第４の態様によれば、上記第２の態様または上記第３の態様の画像認識装置において、前記画像認識の処理において排他的に演算の処理を行う、ビジュアルワード演算部と、ヒストグラム演算部と、前記ＳＶＭ演算部とによる前記データ保存部の利用を調停する調停部、をさらに備え、前記調停部は、前記データ保存部の利用を割り当てたいずれか１つの演算部による前記データ保存部へのアクセスに応じて前記データ保存部にアクセスしてもよい。

　本発明の第５の態様によれば、上記第４の態様の画像認識装置において、前記データ保存部は、前記ビジュアルワード演算部と、前記ヒストグラム演算部と、前記ＳＶＭ演算部とがそれぞれの処理を実行する際に前記データ保存部に一時的に保存する最大の量のデータを記憶することができる記憶容量を有してもよい。

　本発明の第６の態様によれば、画像認識方法は、入力された画像に対する画像認識の処理を、認識する対象物である比較対象物の画像のヒストグラムである教師データを前記比較対象物の種類ごとに分類して複数含んだ教師データ群に基づいて行う画像認識装置における画像認識方法であって、前記画像のビジュアルワードに基づいて生成されたヒストグラムに対するサポートベクタマシン（ＳＶＭ）演算を、前記教師データ群に含まれる複数の前記教師データのそれぞれに基づいて行うＳＶＭ演算ステップ、を含み、前記ＳＶＭ演算ステップは、入力された前記画像のヒストグラムと、前記教師データが表す前記比較対象物のヒストグラムとを比較し、入力された前記画像に写されている対象物である認識対象物と前記比較対象物とが類似している度合いを表す特徴値を算出する特徴値算出ステップと、同じ種類の前記比較対象物に分類された前記教師データに対応する前記特徴値を累積加算する累積加算ステップと、を含み、前記特徴値算出ステップにおいて、前記教師データ群に含まれる全ての前記教師データに対応する前記特徴値が、それぞれの前記教師データごとに算出され、算出した全ての前記特徴値が、前記画像認識の処理の途中で生成されるデータを一時的に保存するデータ保存部に保存され、前記累積加算ステップにおいて、前記特徴値算出ステップにおいて全ての前記特徴値が前記データ保存部に保存された後に、保存された全ての前記特徴値の中から、同じ種類の前記比較対象物に分類された前記教師データに対応する前記特徴値が読み出されて累積加算され、累積加算された前記特徴値が、前記画像認識の処理において前記認識対象物を認識した結果として出力される。

　上記各態様によれば、画像認識の処理を行う際の負荷を軽減することができるという効果が得られる。

本発明の第１の実施形態における画像認識装置の概略構成を示したブロック図である。本発明の第１の実施形態の画像認識装置において画像認識の処理を行う際のデータの流れを示した図である。本発明の第１の実施形態の画像認識装置における画像認識の処理の処理手順を示したフローチャートである。本発明の第２の実施形態における画像認識装置の概略構成を示したブロック図である。本発明の第２の実施形態の画像認識装置において画像認識の処理を行う際のデータの流れを示した図である。本発明の第３の実施形態における画像認識装置の概略構成を示したブロック図である。本発明の第３の実施形態の画像認識装置において画像認識の処理を行う際のデータの流れを示した図である。

（第１の実施形態）
　以下、本発明の実施形態について、図面を参照して説明する。図１は、本発明の第１の実施形態における画像認識装置の概略構成を示したブロック図である。図１において、画像認識装置１０は、ＳＶＭ（Ｓｕｐｐｏｒｔ　ｖｅｃｔｏｒ　ｍａｃｈｉｎｅ：サポートベクタマシン）演算部１１０と特徴値保存部１２０とを備えている。ＳＶＭ演算部１１０は、特徴値算出部１１１と累積加算部１１２とを備えている。なお、図１は、画像認識装置１０が画像認識の処理を行う際に用いるデータを保存するデータ保存部９０を併せて示し、画像認識装置１０を備えた画像認識システム１として示している。

　画像認識装置１０は、入力された画像に対して、画像に写っている物体、つまり、被写体（対象物）や画像が撮影されたシーンを認識する画像認識の処理を行い、様々な対象物の種類（カテゴリー）ごとに分類されたそれぞれの教師データとの類似度の情報を、画像認識の処理によって認識した被写体（対象物）が分類された対象物と類似している度合いを表す情報として出力する。なお、画像認識装置１０においても、画像認識の処理において、入力された画像における代表的な局所パターン（ビジュアルワード）の集合を生成するビジュアルワードの演算処理や、ビジュアルワードに基づいて入力された画像全体のヒストグラムを生成する演算処理など、従来の画像認識の技術と同様のそれぞれの処理を行う。以下の説明においては、入力された画像に対するビジュアルワードの演算処理や、ヒストグラムの演算処理が終了しているものとして説明する。

　データ保存部９０は、画像認識装置１０が画像認識の処理を行う際に用いる教師データ群９１０と、画像認識装置１０が画像認識の処理を行う対象の画像のヒストグラムである認識対象データ９５０とを保存している。データ保存部９０は、例えば、ＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などのメモリである。データ保存部９０は、画像認識装置１０からのデータの読み出し制御に応じて、保存している教師データ群９１０や認識対象データ９５０を、画像認識装置１０に出力する。なお、本発明においては、データ保存部９０にそれぞれのデータを保存する方法、つまり、データの書き込み制御に関しては、特に制限はしない。

　教師データ群９１０には、同じ対象物（以下、「比較対象物」という）が写っている大量の画像のヒストグラムが、画像認識装置１０において認識する比較対象物の種類ごとに分類されたそれぞれの教師データとして含まれている。ただし、それぞれのヒストグラムは、比較対象物の種類ごとに排他的ではなく、同じヒストグラムが異なる比較対象物の種類に対応している（重複している）ものもある。つまり、１つの教師データが、複数の比較対象物の種類に分類されていることもある。従って、教師データ群９１０に含まれる教師データの数は、それぞれの比較対象物の種類に対応するヒストグラムの数の合計数よりも少ない。

　例えば、教師データ群９１０が、人、犬、猫、花などの４種類の比較対象物の教師データを含んでいる場合、それぞれの比較対象物の種類ごとに、所定数、例えば、１５００個のヒストグラムが含まれている。つまり、教師データ群９１０には、比較対象物が「人」である１つの比較対象物に対して１５００個のヒストグラムを含み、同様に、比較対象物が「犬」、「猫」、「花」であるそれぞれの比較対象物に対しても、それぞれ１５００個のヒストグラムを含んでいる。すなわち、教師データ群９１０は、４種類のそれぞれの比較対象物に対応した所定数ずつのヒストグラム（合計で４×１５００＝６０００個のヒストグラム）を含んでいる。しかし、教師データ群９１０に含まれるそれぞれの比較対象物に分類されたヒストグラムは、複数の比較対象物で重複しているヒストグラムを含んでいるため、例えば、５０００個の教師データから構成されている。

　以下の説明においては、教師データ群９１０には４種類の比較対象物のそれぞれに分類される１５００個ずつ（合計６０００個）のヒストグラムが含まれているが、教師データ群９１０を構成する教師データの数は５０００個であるものとして説明する。つまり、以下の説明においては、教師データ群９１０が表す６０００個のヒストグラムの内、１０００個のヒストグラムが複数の比較対象物の種類に対応している（重複している）ものとして説明する。

　認識対象データ９５０は、例えば、画像認識システム１を搭載した撮影システムによって撮影された画像に写っている認識対象の対象物（以下、「認識対象物」という）や画像が撮影されたシーンを表す、画像全体のヒストグラムのデータである。つまり、認識対象データ９５０は、画像認識装置１０において画像認識の処理を行う認識対象物の特徴がヒストグラムで表されたデータである。認識対象データ９５０は、例えば、画像認識装置１０におけるビジュアルワードの演算処理およびヒストグラムの演算処理によって生成される。

　画像認識装置１０は、データ保存部９０に保存された教師データ群９１０に含まれるそれぞれの教師データに基づいて、データ保存部９０に保存された認識対象データ９５０に対して画像認識の処理を行い、それぞれの教師データとの類似度の情報を、教師データごとに出力する。

　ＳＶＭ演算部１１０は、画像認識の処理において、認識対象データ９５０が表す画像全体のヒストグラムと、教師データ群９１０に含まれるそれぞれの教師データが表す比較対象物のヒストグラムとを比較するＳＶＭ演算を行い、教師データ群９１０において分類された比較対象物の種類ごとに類似度を算出する。そして、ＳＶＭ演算部１１０は、認識対象データ９５０の全体に対する類似度の算出が完了したとき、すなわち、ＳＶＭ演算が完了したとき、ＳＶＭ演算によって算出したそれぞれの比較対象物の種類ごとの類似度を表す情報を、画像認識装置１０が画像認識の処理を行って認識した認識対象物の情報として出力する。

　特徴値算出部１１１は、データ保存部９０から読み出したそれぞれの教師データが表すヒストグラムと、認識対象データ９５０が表すヒストグラムとを比較し、それぞれの教師データごとに、認識対象データ９５０含まれる認識対象物と教師データが表す比較対象物とがどれくらい類似しているかを表す特徴値（カーネル）を算出する。特徴値算出部１１１は、それぞれの教師データごとに算出した特徴値のそれぞれを、特徴値保存部１２０に出力する。このとき、特徴値算出部１１１は、教師データ群９１０に含まれる教師データが表すヒストグラムのそれぞれと、認識対象データ９５０が表すヒストグラムとを比較して、全ての教師データに対応する特徴値を算出し、算出した全ての特徴値を特徴値保存部１２０に出力する。つまり、特徴値算出部１１１は、教師データ群９１０に含まれる５０００個の教師データに対応する５０００個の特徴値を算出して特徴値保存部１２０に出力する。なお、特徴値算出部１１１における特徴値の算出方法は、従来の画像認識の技術における特徴値の算出方法と同様であるため、詳細な説明は省略する。

　累積加算部１１２は、特徴値保存部１２０に保存されたそれぞれの教師データごとの特徴値の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値を読み出し、読み出したそれぞれの特徴値を累積加算する。つまり、累積加算部１１２は、特徴値保存部１２０に保存された全ての教師データに対応する特徴値の中から、同じ種類の比較対象物に分類された１５００個の特徴値を特徴値保存部１２０から読み出して累積加算する。そして、累積加算部１１２は、累積加算した特徴値を、分類された比較対象物と認識対象データ９５０に含まれる認識対象物との類似度の情報として出力する。すなわち、累積加算部１１２は、累積加算した特徴値を、画像認識の処理の結果として出力する。なお、累積加算部１１２における特徴値の累積加算の方法は、従来の画像認識の技術における特徴値の累積加算の方法と同様であるため、詳細な説明は省略する。

　特徴値保存部１２０は、ＳＶＭ演算部１１０内の特徴値算出部１１１が算出したそれぞれの教師データごとの特徴値を一時的に保存する。特徴値保存部１２０は、例えば、ＳＲＡＭ（Ｓｔａｔｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などのメモリである。特徴値保存部１２０は、特徴値算出部１１１からのデータの書き込み制御に応じて、特徴値算出部１１１から出力された５０００個の特徴値のそれぞれを保存する。また、特徴値保存部１２０は、ＳＶＭ演算部１１０内の累積加算部１１２からのデータの読み出し制御に応じて、保存している１５００個の特徴値を、累積加算部１１２に出力する。

　このように、画像認識装置１０は、それぞれの教師データに対応する特徴値を保存する特徴値保存部１２０を備える。そして、画像認識装置１０は、画像認識の処理におけるＳＶＭ演算において、教師データ群９１０に含まれる全ての教師データに対応する特徴値を算出して特徴値保存部１２０に保存した後に、特徴値保存部１２０に保存した特徴値の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値を読み出して累積加算して、それぞれの比較対象物の種類ごとの類似度を表す情報（画像認識の処理の結果）として出力する。

　ここで、画像認識装置１０が画像認識の処理を行う際のデータの流れについて説明する。図２は、本発明の第１の実施形態の画像認識装置１０において画像認識の処理を行う際のデータの流れを示した図である。図２には、画像認識装置１０が行う画像認識の処理におけるＳＶＭ演算の処理のデータの流れを示している。つまり、図２に示したデータの流れは、画像認識装置１０に入力された画像に対するビジュアルワードの演算処理、およびヒストグラムの演算処理が終了している状態から画像認識装置１０がＳＶＭ演算の処理を行う際のデータの流れを示している。

　画像認識装置１０におけるＳＶＭ演算の処理では、ＳＶＭ演算部１１０に備えた特徴値算出部１１１が、データ保存部９０から認識対象データ９５０を読み出す（経路Ｃ１－１）。さらに、特徴値算出部１１１は、データ保存部９０から教師データ群９１０に含まれる全ての教師データを順次読み出す（経路Ｃ１－２）。そして、特徴値算出部１１１は、読み出した認識対象データ９５０と教師データとのそれぞれに基づいて特徴値を算出し、算出した特徴値のそれぞれを、特徴値保存部１２０に一旦保存する。図２には、特徴値算出部１１１が算出したそれぞれの特徴値１２１を、特徴値保存部１２０に保存している状態を示している。

　その後、画像認識装置１０におけるＳＶＭ演算の処理では、ＳＶＭ演算部１１０に備えた累積加算部１１２が、特徴値算出部１１１が特徴値保存部１２０に保存した特徴値１２１の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値１２１を読み出して累積加算し、累積加算した特徴値を、読み出した特徴値１２１が表す種類の比較対象物との類似度を表す情報（画像認識の処理の結果）として出力する（経路Ｃ１－３）。

　次に、画像認識装置１０が画像認識の処理を行う際の動作について説明する。図３は、本発明の第１の実施形態の画像認識装置１０における画像認識の処理の処理手順を示したフローチャートである。なお、図３には、画像認識装置１０が行う画像認識の処理におけるＳＶＭ演算の処理の処理手順を示している。つまり、図３に示した処理手順は、画像認識装置１０に入力された画像に対するビジュアルワードの演算処理、およびヒストグラムの演算処理が終了している状態から画像認識装置１０がＳＶＭ演算の処理を行う際の処理手順を示している。

　なお、以下の説明においては、教師データ群９１０に４種類の比較対象物のそれぞれに対応する１５００個ずつ（合計６０００個）のヒストグラムが含まれており、教師データ群９１０が５０００個の教師データで構成されている（１０００個のヒストグラムが重複している）ものとして説明する。

　画像認識装置１０（ＳＶＭ演算部１１０）がＳＶＭ演算の処理を開始すると、ＳＶＭ演算部１１０に備えた特徴値算出部１１１は、まず、データ保存部９０から認識対象データ９５０を読み出す（図２の経路Ｃ１－１参照）。

　そして、画像認識装置１０（ＳＶＭ演算部１１０）は、ステップＳ１００から、それぞれの教師データに対してＳＶＭ演算を行う。ＳＶＭ演算では、まず、ステップＳ１００において、特徴値算出部１１１は、データ保存部９０に保存された教師データ群９１０に含まれる１個の教師データ（１つ目の教師データ）の読み出しを行う（図２の経路Ｃ１－２参照）。

　続いて、ステップＳ１１０において、特徴値算出部１１１は、読み出した１つ目の教師データが表すヒストグラムと、認識対象データ９５０が表すヒストグラムとを比較して特徴値を算出する。そして、ステップＳ１２０において、特徴値算出部１１１は、算出した１つ目の教師データに対応する特徴値を、特徴値保存部１２０に出力して保存させる。これにより、図２に示した１つ目の教師データに対応する特徴値１２１が、特徴値保存部１２０に保存される。

　続いて、ステップＳ１３０において、特徴値算出部１１１は、データ保存部９０に保存された教師データ群９１０に含まれる全ての教師データに対応するそれぞれの特徴値を、特徴値保存部１２０に保存が終了したか否か、つまり、全ての教師データの読み出しと特徴値の算出とが終了したか否かを判定する。

　ステップＳ１３０における判定の結果、全ての教師データに対応するそれぞれの特徴値、つまり、全ての特徴値の特徴値保存部１２０への保存が終了していない場合（ステップＳ１３０の“ＮＯ”）、特徴値算出部１１１は、ステップＳ１００に戻って、教師データ群９１０に含まれる次の１個の教師データ（２つ目の教師データ）の読み出しを行う（図２の経路Ｃ１－２参照）。そして、特徴値算出部１１１は、ステップＳ１１０～ステップＳ１３０の処理を、全ての特徴値の特徴値保存部１２０への保存が終了するまで繰り返す。教師データ群９１０は、５０００個の教師データで構成されているため、特徴値算出部１１１は、ステップＳ１００～ステップＳ１３０の処理を、５０００回繰り返す。

　ステップＳ１３０における判定の結果、全ての特徴値の特徴値保存部１２０への保存が終了した場合（ステップＳ１３０の“ＹＥＳ”）、特徴値算出部１１１は、ステップＳ２００に進む。

　続いて、ステップＳ２００において、ＳＶＭ演算部１１０に備えた累積加算部１１２は、特徴値保存部１２０に保存された同じ種類の比較対象物に分類された教師データに対応する１個の特徴値（１つ目の特徴値）の読み出しを行う（図２の経路Ｃ１－３参照）。

　続いて、ステップＳ２１０において、累積加算部１１２は、読み出した１つ目の特徴値を累積加算する。そして、ステップＳ２２０において、累積加算部１１２は、特徴値保存部１２０に保存された同じ種類の比較対象物に分類された教師データに対応する全ての特徴値の累積加算が終了したか否か、つまり、同じ種類の比較対象物の全ての特徴値の読み出しと特徴値の累積加算とが終了したか否かを判定する。

　ステップＳ２２０における判定の結果、同じ種類の比較対象物に分類された教師データに対応する全ての特徴値の累積加算が終了していない、つまり、今回出力する比較対象物との類似度の最終的な結果が得られていない場合（ステップＳ２２０の“ＮＯ”）、累積加算部１１２は、ステップＳ２００に戻って、特徴値保存部１２０に保存された同じ種類の比較対象物に分類された教師データに対応する次の１個の特徴値（２つ目の特徴値）の読み出しを行う（図２の経路Ｃ１－３参照）。そして、累積加算部１１２は、ステップＳ２１０～ステップＳ２２０の処理を、全ての特徴値の累積加算が終了するまで繰り返す。教師データ群９１０は、１種類の比較対象物に対応する１５００個のヒストグラムが含まれているため、累積加算部１１２は、ステップＳ２００～ステップＳ２２０の処理を、１５００回繰り返す。

　ステップＳ２２０における判定の結果、同じ種類の比較対象物に分類された教師データに対応する全ての特徴値の累積加算が終了した、つまり、今回出力する比較対象物との類似度の最終的な結果が得られた場合（ステップＳ２２０の“ＹＥＳ”）、累積加算部１１２は、ステップＳ３００に進む。

　続いて、ステップＳ３００において、累積加算部１１２は、ステップＳ２２０～ステップＳ２２０の処理で得られた累積加算した特徴値、つまり、今回出力する同じ種類に分類された比較対象物と認識対象データ９５０に含まれる認識対象物との類似度の情報（画像認識の処理の結果）を出力する。

　そして、ステップＳ３１０において、累積加算部１１２は、教師データ群９１０において分類された全ての種類の比較対象物の教師データに対応する全ての特徴値の累積加算が終了したか否か、つまり、全ての種類の比較対象物に対する画像認識が終了したか否かを判定する。

　ステップＳ３１０における判定の結果、全ての種類の比較対象物の教師データに対応する全ての特徴値の累積加算が終了していない、つまり、教師データ群９１０において分類された全ての比較対象物との類似度の情報の出力が終了していない場合（ステップＳ３１０の“ＮＯ”）、累積加算部１１２は、ステップＳ２００に戻る。そして、累積加算部１１２は、ステップＳ２００～ステップＳ３１０の処理、つまり、今回出力していない他の比較対象物との類似度の情報の算出と出力とを、全ての種類の比較対象物との類似度の情報の出力が終了するまで繰り返す。教師データ群９１０は、４種類の比較対象物のそれぞれに対応する教師データで構成されているため、累積加算部１１２は、ステップＳ２００～ステップＳ３１０の処理を、４回繰り返す。

　ステップＳ３１０における判定の結果、教師データ群９１０において分類された全ての比較対象物との類似度の情報の出力が終了した場合（ステップＳ３１０の“ＹＥＳ”）、画像認識装置１０（ＳＶＭ演算部１１０）は、それぞれの教師データに対するＳＶＭ演算の処理を完了する。

　上述した処理によって、画像認識装置１０では、画像認識の処理におけるＳＶＭ演算において、まず、データ保存部９０に保存されている教師データ群９１０に含まれるそれぞれの教師データを１回ずつ読み出して、全ての教師データに対応する特徴値を算出して特徴値保存部１２０に一旦保存する。その後、画像認識装置１０では、特徴値保存部１２０に保存した特徴値の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値を読み出して累積加算した特徴値を、それぞれの比較対象物の種類ごとの類似度を表す情報（画像認識の処理の結果）として出力する。これにより、画像認識装置１０では、従来の画像認識の処理におけるＳＶＭ演算のように、複数種類の比較対象物に分類されている同じ教師データ（重複している教師データ）を、それぞれの種類の比較対象物との類似度を出力するごとに複数回読み出すことなく、ＳＶＭ演算によって算出したそれぞれの比較対象物の種類ごとの類似度を表す情報を、画像認識の処理を行って認識した認識対象物の情報として出力することができる。

　このことにより、画像認識装置１０では、ＳＶＭ演算の処理を行う際にデータ保存部９０から教師データを読み出す回数、つまり、画像認識装置１０におけるデータ保存部９０へのアクセス回数を、従来の画像認識の処理においてＳＶＭ演算の処理を行う際に教師データを読み出す回数よりも少なくすることができる。しかも、画像認識装置１０では、それぞれの教師データに対応する特徴値を特徴値保存部１２０に一旦保存するため、読み出したそれぞれの教師データに対応する特徴値を算出する演算も１回ずつ行うのみであり、従来の画像認識の処理におけるＳＶＭ演算のように、重複して読み出した同じ教師データから同じ特徴値を算出する演算を複数回行うことなく、ＳＶＭ演算の処理を行う際の演算負荷も軽減することができる。

　より具体的には、従来の画像認識の処理におけるＳＶＭ演算では、４種類に分類されたそれぞれの比較対象物ごとに１５００個ずつの教師データをデータ保存部９０から読み出す、つまり、データ保存部９０へのアクセス回数が４種類×１５００個＝６０００回である。そして、従来の画像認識の処理におけるＳＶＭ演算では、それぞれの教師データに対応する特徴値を算出する演算を６０００回行う。これに対して画像認識装置１０では、ステップＳ１００～ステップＳ１３０の処理を、教師データ群９１０に含まれる教師データの個数（５０００個）と同じ回数だけ繰り返す、つまり、データ保存部９０へのアクセス回数は５０００回である。そして、画像認識装置１０では、それぞれの教師データに対応する特徴値を算出する演算の回数も５０００回である。

　第１の実施形態によれば、入力された画像に対する画像認識の処理を、認識する対象物である比較対象物の画像のヒストグラムである教師データを比較対象物の種類ごとに分類して複数含んだ教師データ群（教師データ群９１０）に基づいて行う画像認識装置（画像認識装置１０）であって、画像のビジュアルワードに基づいて生成されたヒストグラム（認識対象データ９５０）に対するサポートベクタマシン（ＳＶＭ）演算を、教師データ群９１０に含まれる複数の教師データのそれぞれに基づいて行うＳＶＭ演算部（ＳＶＭ演算部１１０）と、画像認識の処理の途中で生成されるデータを一時的に保存するデータ保存部（特徴値保存部１２０）と、を備え、ＳＶＭ演算部１１０は、入力された画像のヒストグラム（認識対象データ９５０）と、教師データが表す比較対象物のヒストグラムとを比較し、入力された画像に写されている対象物である認識対象物と比較対象物とが類似している度合いを表す特徴値を算出する特徴値算出部（特徴値算出部１１１）と、同じ種類の比較対象物に分類された教師データに対応する特徴値を累積加算する累積加算部（累積加算部１１２）と、を具備し、ＳＶＭ演算の処理において、特徴値算出部１１１は、教師データ群９１０に含まれる全ての教師データに対応する特徴値を、それぞれの教師データごとに算出し、算出した全ての特徴値を特徴値保存部１２０に保存させ、累積加算部１１２は、特徴値算出部１１１が全ての特徴値を特徴値保存部１２０に保存させた後に、保存された全ての特徴値の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値を読み出して累積加算し、累積加算した特徴値を、画像認識の処理において認識対象物を認識した結果として出力する画像認識装置（画像認識装置１０）が構成される。

　また、第１の実施形態によれば、特徴値算出部１１１は、教師データ群９１０に含まれる教師データの数が、画像認識の処理において認識対象物を認識した全ての結果を出力するまでに累積加算部１１２が特徴値保存部１２０に保存された特徴値を読み出して累積加算する回数よりも少ない場合に、教師データ群９１０に含まれる全ての教師データに対応する全ての特徴値を算出して特徴値保存部１２０に保存させる画像認識装置１０が構成される。

　また、第１の実施形態によれば、入力された画像に対する画像認識の処理を、認識する対象物である比較対象物の画像のヒストグラムである教師データを比較対象物の種類ごとに分類して複数含んだ教師データ群（教師データ群９１０）に基づいて行う画像認識装置（画像認識装置１０）における画像認識方法であって、画像のビジュアルワードに基づいて生成されたヒストグラム（認識対象データ９５０）に対するサポートベクタマシン（ＳＶＭ）演算を、教師データ群９１０に含まれる複数の教師データのそれぞれに基づいて行うＳＶＭ演算ステップ、を含み、ＳＶＭ演算ステップは、入力された画像のヒストグラム（認識対象データ９５０）と、教師データが表す比較対象物のヒストグラムとを比較し、入力された画像に写されている対象物である認識対象物と比較対象物とが類似している度合いを表す特徴値を算出する特徴値算出ステップと、同じ種類の比較対象物に分類された教師データに対応する特徴値を累積加算する累積加算ステップと、を含み、特徴値算出ステップにおいて、教師データ群９１０に含まれる全ての教師データに対応する特徴値が、それぞれの教師データごとに算出され、算出した全ての特徴値が、画像認識の処理の途中で生成されるデータを一時的に保存するデータ保存部（特徴値保存部１２０）に保存され、累積加算ステップにおいて、特徴値算出ステップにおいて全ての特徴値が特徴値保存部１２０に保存された後に、保存された全ての特徴値の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値が読み出されて累積加算され、累積加算された特徴値が、画像認識の処理において認識対象物を認識した結果として出力される画像認識方法が構成される。

　上記に述べたように、第１の実施形態の画像認識装置１０は、データ保存部９０に保存されている教師データ群９１０に含まれる全ての教師データに対応する特徴値を保存するための特徴値保存部１２０を備える。そして、第１の実施形態の画像認識装置１０は、画像認識の処理におけるＳＶＭ演算において、教師データ群９１０に含まれるそれぞれの教師データを１回ずつ読み出して算出した全ての教師データに対応する特徴値を特徴値保存部１２０に一旦保存する。その後、第１の実施形態の画像認識装置１０は、特徴値保存部１２０に保存した特徴値の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値を読み出して累積加算し、累積加算した特徴値を、ＳＶＭ演算によって算出したそれぞれの比較対象物の種類ごとの類似度を表す情報（画像認識の処理の結果）として出力する。つまり、第１の実施形態の画像認識装置１０では、データ保存部９０に保存されている教師データ群９１０に含まれるそれぞれの教師データを１回ずつ読み出すのみで、それぞれの比較対象物の種類ごとの類似度を表す情報を出力する。

　これにより、第１の実施形態の画像認識装置１０では、従来の画像認識の処理を行う画像認識装置のように、同じ教師データの読み込みや同じ特徴値の算出を複数回繰り返すことなく、それぞれの比較対象物の種類ごとの類似度を表す情報を、画像認識の処理を行って認識した認識対象物の情報（画像認識の処理の結果）として出力することができる。つまり、第１の実施形態の画像認識装置１０では、ＳＶＭ演算の処理を行う際にデータ保存部９０から教師データを読み出す回数（データ保存部９０へのアクセス回数）や、それぞれの教師データに対応する特徴値を算出する演算回数を、従来の画像認識の処理を行う画像認識装置よりも少なくすることができる。このことにより、第１の実施形態の画像認識装置１０では、画像認識の処理を行う際の負荷を、従来の画像認識の処理を行う画像認識装置よりも軽減することができる。なお、第１の実施形態の画像認識装置１０において画像認識の処理を行う際の負荷を軽減することができるということは、画像認識装置１０を備えた画像認識システム１における画像認識の処理の高効率化や処理速度の向上にもつながる。

　なお、第１の実施形態の画像認識装置１０では、ＳＶＭ演算部１１０に備えた特徴値算出部１１１が、データ保存部９０から認識対象データ９５０や教師データ群９１０に含まれるそれぞれの教師データを読み出す構成について説明した。しかし、データ保存部９０から認識対象データ９５０や教師データを読み出す構成や方法は、第１の実施形態に示した構成や方法に限定されるものではない。例えば、画像認識装置１０に、データ保存部９０との間でのデータの受け渡しをＤＭＡ（Ｄｉｒｅｃｔ　Ｍｅｍｏｒｙ　Ａｃｃｅｓｓ）によって行うＤＭＡ部を備え、このＤＭＡ部が、特徴値算出部１１１からの要求に応じて、ＤＭＡによってデータ保存部９０から取得した認識対象データ９５０やそれぞれの教師データを特徴値算出部１１１に伝送する構成であってもよい。

　また、第１の実施形態の画像認識装置１０では、４種類に分類されたそれぞれの比較対象物ごとに１５００個ずつのヒストグラムが含まれている５０００個の教師データで構成された教師データ群９１０を用いて画像認識の処理を行う場合の動作の一例を説明した。そして、第１の実施形態の画像認識装置１０では、従来の画像認識の処理において６０００回行う教師データの読み出しを、教師データ群９１０に含まれる教師データの個数と同じ回数だけ行うことによって、教師データの読み出し回数と特徴値を算出する演算の回数を低減することができるという効果を説明した。しかし、教師データ群９１０において分類される比較対象物の種類数や、教師データ群９１０を構成する教師データの数は、第１の実施形態において示した数に限定されるものではない。このため、画像認識装置１０において認識する比較対象物の種類数や、教師データ群９１０の構成によっては、第１の実施形態の画像認識装置１０における教師データの読み出し回数が、従来の画像認識の処理を行う画像認識装置と同じまたは多くなってしまうことも考えられる。

　例えば、教師データ群９１０が、第１の実施形態で説明した構成であっても、画像認識装置１０が３種類の比較対象物のみを認識する場合には、従来の画像認識の処理を行う画像認識装置による教師データの読み出し回数が４５００回であるのに対して、第１の実施形態の画像認識装置１０による教師データの読み出し回数は５０００回になってしまう。また、例えば、教師データ群９１０含まれる全てのヒストグラムが、比較対象物の種類ごとに排他的である場合には、従来の画像認識の処理を行う画像認識装置による教師データの読み出し回数と、第１の実施形態の画像認識装置１０による教師データの読み出し回数とは同じ回数になってしまう。このため、第１の実施形態の画像認識装置１０においても、認識する比較対象物の種類数や教師データ群９１０の構成によっては、従来の画像認識の処理を行う画像認識装置と同様の動作をするようにしてもよい。つまり、第１の実施形態の画像認識装置１０の動作を、認識する比較対象物の種類数や教師データ群９１０の構成に応じて、図３のフローチャートを用いて説明した動作、または従来の画像認識装置と同様の動作に切り替える構成にしてもよい。

　より具体的には、第１の実施形態の画像認識装置１０において、認識する比較対象物の種類数と、それぞれの比較対象物に対応するヒストグラムの数とを乗算した数、すなわち、認識するそれぞれの比較対象物に対応するヒストグラムの数を合計した数と、教師データ群９１０を構成する教師データの数とを比較する。なお、認識するそれぞれの比較対象物に対応するヒストグラムの数を合計した数は、従来の画像認識の処理を行う画像認識装置において教師データを読み出す回数である。そして、従来の画像認識の処理を行う画像認識装置において教師データを読み出す回数が、教師データ群９１０を構成する教師データの数以下である場合には、従来の画像認識装置と同様の動作を行うようにする。一方、従来の画像認識の処理を行う画像認識装置において教師データを読み出す回数が、教師データ群９１０を構成する教師データの数よりも多い場合には、図３のフローチャートを用いて説明した第１の実施形態の画像認識装置１０の動作を行うようにする。

　なお、従来の画像認識の処理を行う画像認識装置において教師データを読み出す回数は、認識する全ての種類の比較対象物との類似度の情報の出力が終了するまで、つまり、画像認識の処理におけるＳＶＭ演算の処理が終了するまでに、累積加算部１１２が特徴値保存部１２０に保存された特徴値を読み出して累積加算する回数に相当する。従って、累積加算部１１２が特徴値を読み出して累積加算する回数に基づいて、第１の実施形態の画像認識装置１０の動作を切り替える構成にしてもよい。つまり、教師データ群９１０を構成する教師データの数が、累積加算部１１２が特徴値を読み出して累積加算する回数以上である場合に、従来の画像認識装置と同様の動作を行い、累積加算部１１２が特徴値を読み出して累積加算する回数よりも少ない場合に、図３のフローチャートを用いて説明した第１の実施形態の画像認識装置１０の動作を行うように切り替える構成にしてもよい。

　なお、第１の実施形態の画像認識装置１０では、認識する比較対象物の種類ごとに分類された大量の画像のヒストグラムのそれぞれを教師データとして含む教師データ群９１０をデータ保存部９０に保存している場合について説明した。しかし、データ保存部９０に保存する教師データ群９１０の形式は、第１の実施形態に示した形式に限定されるものではない。例えば、認識する比較対象物の種類ごとに分類された大量の画像のヒストグラム（教師データ）を１つのデータとしてまとめた状態で可逆圧縮されてデータ保存部９０に保存されている場合も考えられる。

（第２の実施形態）
　次に、本発明の第２の実施形態について説明する。図４は、本発明の第２の実施形態における画像認識装置の概略構成を示したブロック図である。図４において、画像認識装置２０は、ＳＶＭ演算部１１０と、特徴値保存部１２０と、教師データ解凍部２３０と、を備えている。また、ＳＶＭ演算部１１０は、特徴値算出部１１１と累積加算部１１２とを備えている。なお、図４は、画像認識装置２０が画像認識の処理を行う際に用いるデータを保存するデータ保存部９０を併せて示し、画像認識装置２０を備えた画像認識システム２として示している。

　図４に示した画像認識装置２０は、図１に示した第１の実施形態の画像認識装置１０に、さらに、教師データ解凍部２３０を備えた構成である。なお、画像認識装置２０に備えたその他の構成要素は、図１に示した第１の実施形態の画像認識装置１０に備えた構成要素と同じ構成要素である。従って、以下の説明においては、画像認識装置２０の構成要素において、第１の実施形態の画像認識装置１０に備えた構成要素と同様の構成要素には同一の符号を付与して、それぞれの構成要素に関する詳細な説明は省略し、画像認識装置２０において第１の実施形態の画像認識装置１０と異なる構成要素および動作についてのみを説明する。

　画像認識装置２０も、第１の実施形態の画像認識装置１０と同様に、入力された画像に対して画像認識の処理を行い、それぞれの教師データとの類似度の情報を、画像認識の処理によって認識した認識対象物が比較対象物と類似している度合いを表す情報（画像認識の処理の結果）として出力する。ただし、画像認識装置２０は、ＳＶＭ演算の処理を、１つのデータとしてまとめて可逆圧縮した状態の教師データ（以下、「圧縮教師データ群９１１」という）に基づいて行う構成の画像認識装置である。なお、画像認識装置２０も、第１の実施形態の画像認識装置１０と同様に、ビジュアルワードの演算処理や、ヒストグラムの演算処理などの処理を行う。以下の説明においても、入力された画像に対するビジュアルワードの演算処理や、ヒストグラムの演算処理が終了しているものとして説明する。

　データ保存部９０は、画像認識装置２０が画像認識の処理を行う際に用いる圧縮教師データ群９１１と、画像認識装置２０が画像認識の処理を行う対象の認識対象データ９５０とを保存している。

　圧縮教師データ群９１１は、図１に示した第１の実施形態の画像認識装置１０を備えた画像認識システム１においてデータ保存部９０が保存していた教師データ群９１０と同様の教師データを、１つのデータとしてまとめた状態で可逆圧縮した構成の教師データ群である。例えば、圧縮教師データ群９１１が、人、犬、猫、花などの４種類の比較対象物の教師データを含んでいる場合、それぞれの比較対象物に対応する１５００個ずつ（合計６０００個）のヒストグラムを表す５０００個の教師データ（１０００個のヒストグラムが重複している）が全てまとめられた状態で可逆圧縮されて、１つのデータ（教師データ群）として構成されている。

　画像認識装置２０は、データ保存部９０に保存された圧縮教師データ群９１１に含まれるそれぞれの教師データに基づいて、データ保存部９０に保存された認識対象データ９５０に対して画像認識の処理を行い、それぞれの教師データとの類似度の情報（画像認識の処理の結果）を、教師データごとに出力する。

　教師データ解凍部２３０は、画像認識装置２０が画像認識の処理を行う際に用いる圧縮教師データ群９１１を解凍する。これにより、圧縮教師データ群９１１に含まれるそれぞれの教師データが、第１の実施形態の画像認識装置１０が画像認識の処理を行う際に用いる教師データ群９１０に含まれるそれぞれの教師データと同様の形式に復元される。そして、教師データ解凍部２３０は、解凍したそれぞれの教師データを、ＳＶＭ演算部１１０に出力する。

　ＳＶＭ演算部１１０は、画像認識の処理において、認識対象データ９５０が表す画像全体のヒストグラムと、教師データ解凍部２３０から出力されたそれぞれの教師データが表す比較対象物のヒストグラムとを比較するＳＶＭ演算を行い、圧縮教師データ群９１１において分類された比較対象物の種類ごとに類似度を算出する。そして、ＳＶＭ演算部１１０は、算出したそれぞれの類似度を表す情報を、画像認識装置２０が画像認識の処理を行って認識した認識対象物の情報として出力する。

　このように、画像認識装置２０は、可逆圧縮された状態の１つの圧縮教師データ群９１１を解凍する教師データ解凍部２３０を備える。そして、画像認識装置２０は、画像認識の処理におけるＳＶＭ演算に先だって、教師データ解凍部２３０が、圧縮教師データ群９１１に含まれるそれぞれの教師データを解凍する。また、画像認識装置２０も、第１の実施形態の画像認識装置１０と同様に、それぞれの教師データに対応する特徴値を保存する特徴値保存部１２０を備える。そして、画像認識装置２０は、第１の実施形態の画像認識装置１０と同様に、画像認識の処理におけるＳＶＭ演算において、教師データ解凍部２３０が解凍（復元）した全ての教師データに対応する特徴値を算出して特徴値保存部１２０に一旦保存する。その後、画像認識装置２０は、第１の実施形態の画像認識装置１０と同様に、特徴値保存部１２０に保存した特徴値の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値を読み出して累積加算して、それぞれの比較対象物の種類ごとの類似度を表す情報（画像認識の処理の結果）として出力する。

　ここで、画像認識装置２０が画像認識の処理を行う際のデータの流れについて説明する。図５は、本発明の第２の実施形態の画像認識装置２０において画像認識の処理を行う際のデータの流れを示した図である。図５には、図２に示した第１の実施形態の画像認識装置１０におけるデータの流れと同様に、画像認識装置２０が行う画像認識の処理におけるＳＶＭ演算の処理のデータの流れを示している。従って、図５に示したデータの流れも、画像認識装置２０に入力された画像に対するビジュアルワードの演算処理、およびヒストグラムの演算処理が終了している状態から画像認識装置２０がＳＶＭ演算の処理を行う際のデータの流れを示している。図５に示した画像認識装置２０におけるデータの流れには、図２に示した第１の実施形態の画像認識装置１０におけるデータの流れと同様のデータの流れを含んでいる。

　画像認識装置２０におけるＳＶＭ演算の処理では、ＳＶＭ演算部１１０に備えた特徴値算出部１１１が、第１の実施形態の画像認識装置１０におけるデータの流れと同様に、データ保存部９０から認識対象データ９５０を読み出す（経路Ｃ１－１）。その後、教師データ解凍部２３０が、データ保存部９０から圧縮教師データ群９１１を読み出して解凍し、解凍した全ての教師データを順次、ＳＶＭ演算部１１０内の特徴値算出部１１１に出力する（経路Ｃ２－２）。そして、特徴値算出部１１１は、読み出した認識対象データ９５０と、教師データ解凍部２３０から出力された教師データとのそれぞれに基づいて特徴値を算出し、算出した特徴値のそれぞれを、特徴値保存部１２０に一旦保存する。図５には、特徴値算出部１１１が算出したそれぞれの特徴値１２１を、特徴値保存部１２０に保存している状態を示している。

　その後、画像認識装置２０におけるＳＶＭ演算の処理では、ＳＶＭ演算部１１０に備えた累積加算部１１２が、第１の実施形態の画像認識装置１０におけるデータの流れと同様に、特徴値算出部１１１が特徴値保存部１２０に保存した特徴値１２１の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値１２１を読み出して累積加算する。そして、累積加算部１１２は、累積加算した特徴値を、読み出した特徴値１２１が表す種類の比較対象物との類似度を表す情報（画像認識の処理の結果）として出力する（経路Ｃ１－３）。

　なお、画像認識装置２０が行う画像認識の処理におけるＳＶＭ演算の処理の処理手順は、図３に示した第１の実施形態の画像認識装置１０が行う画像認識の処理におけるＳＶＭ演算の処理の処理手順と、教師データが異なるのみである。

　より具体的には、画像認識装置２０が図３に示したＳＶＭ演算の処理の処理手順を開始する前に、教師データ解凍部２３０がデータ保存部９０から圧縮教師データ群９１１を読み出して解凍する。以降、特徴値算出部１１１は、図３に示したステップＳ１００において、教師データ解凍部２３０から出力された１個の教師データ（１つ目の教師データ）を取得し、ステップＳ１１０～ステップＳ１３０の処理を、教師データ解凍部２３０から出力された教師データに対応する全ての特徴値の特徴値保存部１２０への保存が終了するまで繰り返す。つまり、特徴値算出部１１１は、圧縮教師データ群９１１に含まれる５０００個の教師データに対応する全ての特徴値の特徴値保存部１２０への保存が終了するまで、図３に示したステップＳ１００～ステップＳ１３０の処理を、５０００回繰り返す。

　その後、累積加算部１１２は、図３に示したステップＳ２００～ステップＳ２２０の処理を、全ての特徴値の累積加算が終了するまで繰り返し、さらに、ステップＳ２００～ステップＳ３１０の処理を、圧縮教師データ群９１１において分類された全ての種類の比較対象物との類似度の情報（画像認識の処理の結果）の出力が終了するまで繰り返す。つまり、画像認識装置２０でも、累積加算部１１２が、図３に示したステップＳ２００～ステップＳ２２０の処理を１５００回繰り返し、ステップＳ２００～ステップＳ３１０の処理を４回繰り返す。

　これにより、画像認識装置２０でも、第１の実施形態の画像認識装置１０と同様に、ＳＶＭ演算によって算出したそれぞれの比較対象物の種類ごとの類似度を表す情報を、画像認識の処理を行って認識した認識対象物の情報（画像認識の処理の結果）として出力することができる。

　第２の実施形態によれば、全ての教師データを１つにまとめた状態で可逆圧縮した形式で入力された教師データ群（圧縮教師データ群９１１）を解凍してそれぞれの教師データに復元する教師データ解凍部（教師データ解凍部２３０）、をさらに備え、ＳＶＭ演算の処理において、教師データ解凍部２３０は、圧縮教師データ群９１１を解凍してそれぞれの教師データに復元し、特徴値算出部（特徴値算出部１１１）は、教師データ解凍部２３０によって復元されたそれぞれの教師データに対応する全ての特徴値を算出してデータ保存部（特徴値保存部１２０）に保存させる画像認識装置（画像認識装置２０）が構成される。

　上記に述べたように、第２の実施形態の画像認識装置２０は、可逆圧縮された状態の１つの圧縮教師データ群９１１を解凍する教師データ解凍部２３０を備える。また、第２の実施形態の画像認識装置２０は、第１の実施形態の画像認識装置１０と同様に、教師データ解凍部２３０が解凍した、圧縮教師データ群９１１に含まれる全ての教師データに対応する特徴値を保存するための特徴値保存部１２０を備える。そして、第２の実施形態の画像認識装置２０は、画像認識の処理におけるＳＶＭ演算において、教師データ解凍部２３０が解凍した全ての教師データを用いて算出した全ての特徴値を特徴値保存部１２０に一旦保存した後に、特徴値保存部１２０に保存した特徴値の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値を読み出して累積加算して、それぞれの比較対象物の種類ごとの類似度を表す情報（画像認識の処理の結果）として出力する。つまり、第２の実施形態の画像認識装置２０では、データ保存部９０に保存されている圧縮教師データ群９１１を１回読み出すのみで、圧縮教師データ群９１１において分類されたそれぞれの比較対象物の種類ごとの類似度を表す情報を出力する。これにより、第２の実施形態の画像認識装置２０でも、第１の実施形態の画像認識装置１０と同様に、画像認識の処理を行う際の負荷を、従来の画像認識の処理を行う画像認識装置よりも軽減することができる。

　より具体的には、可逆圧縮された圧縮教師データ群９１１に基づいて画像認識の処理を行う場合、従来の画像認識の処理を行う画像認識装置では、最初に、圧縮教師データ群９１１を読み込んで解凍し、解凍した全ての教師データ（例えば、５０００個の教師データ）の中から、１つ目の種類の比較対象物に分類された教師データ（例えば、１５００個の教師データ）を用いて、１つ目の種類の比較対象物に対する類似度（画像認識の処理の結果）を出力する。その後、従来の画像認識の処理を行う画像認識装置は、前回解凍した全ての教師データを破棄して、圧縮教師データ群９１１の読み込みを再度行って解凍し、解凍した全ての教師データ（例えば、５０００個の教師データ）の中から、２つ目の種類の比較対象物に分類された教師データ（例えば、１５００個の教師データ）を用いて、２つ目の種類の比較対象物に対する類似度（画像認識の処理の結果）を出力する。このように、従来の画像認識の処理を行う画像認識装置では、圧縮教師データ群９１１の読み込みと解凍とを、画像認識の処理を行うそれぞれの比較対象物ごとに行い、都度、解凍したそれぞれの教師データを破棄する。つまり、従来の画像認識の処理を行う画像認識装置では、同じ圧縮教師データ群９１１の読み込みおよび解凍と、同じ教師データ（重複している教師データ）に対応する特徴値を算出する演算とを、複数回行っている。

　これに対して、第２の実施形態の画像認識装置２０は、データ保存部９０に保存されている圧縮教師データ群９１１を１回のみ読み出して解凍し、解凍した全ての教師データに対応する特徴値（例えば、５０００個の特徴値）を算出して特徴値保存部１２０に一旦保存する。その後、第２の実施形態の画像認識装置２０は、特徴値保存部１２０に保存した特徴値の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値（例えば、１５００個の特徴値）を読み出して累積加算した特徴値を、それぞれの比較対象物の種類ごとの類似度を表す情報（画像認識の処理の結果）として出力する。つまり、第２の実施形態の画像認識装置２０では、圧縮教師データ群９１１の読み込みおよび解凍と、同じ教師データ（重複している教師データ）に対応する特徴値を算出する演算とを、１回のみ行っている。すなわち、第２の実施形態の画像認識装置２０では、従来の画像認識の処理を行う画像認識装置のように、同じ教師データの読み込みや同じ特徴値の算出を複数回繰り返すことなく、それぞれの比較対象物の種類ごとの類似度を表す情報を、画像認識の処理を行って認識した認識対象物の情報として出力することができる。

　このように、第２の実施形態の画像認識装置２０では、ＳＶＭ演算の処理を行う際にデータ保存部９０から可逆圧縮された圧縮教師データ群９１１を読み出す回数（データ保存部９０へのアクセス回数）と、可逆圧縮された圧縮教師データ群９１１を解凍する演算回数と、解凍したそれぞれの教師データに対応する特徴値を算出する演算回数を、従来の画像認識の処理を行う画像認識装置よりも少なくすることができる。このことにより、第２の実施形態の画像認識装置２０でも、第１の実施形態の画像認識装置１０と同様に、画像認識の処理を行う際の負荷を、従来の画像認識の処理を行う画像認識装置よりも軽減することができる。なお、第２の実施形態の画像認識装置２０において画像認識の処理を行う際の負荷を軽減することができるということも、第１の実施形態の画像認識装置１０と同様に、画像認識装置２０を備えた画像認識システム２における画像認識の処理の高効率化や処理速度の向上につながる。

　なお、第２の実施形態の画像認識装置２０でも、第１の実施形態の画像認識装置１０と同様に、画像認識装置２０に備えたＤＭＡ部が、教師データ解凍部２３０からの要求に応じて、ＤＭＡによってデータ保存部９０から取得した圧縮教師データ群９１１を教師データ解凍部２３０に伝送する構成であってもよい。

　また、第２の実施形態の画像認識装置２０でも、第１の実施形態の画像認識装置１０と同様に、第２の実施形態の画像認識装置２０の動作を、認識する比較対象物の種類数や圧縮教師データ群９１１に含まれる教師データの構成に応じて、上述した動作、または従来の画像認識装置と同様の動作に切り替える構成にしてもよい。

　なお、第１の実施形態の画像認識装置１０および第２の実施形態の画像認識装置２０では、入力された画像に対するビジュアルワードの演算処理、およびヒストグラムの演算処理が終了しているものとして説明した。しかし、上述したように、第１の実施形態の画像認識装置１０や第２の実施形態の画像認識装置２０においても、従来の画像認識の処理を行う画像認識装置と同様に、入力された画像に対するビジュアルワードの演算処理や、ヒストグラムの演算処理などの処理を行っている。そして、一般的に、画像認識装置においては、ビジュアルワードの演算処理やヒストグラムの演算処理において用いるデータを一時的に保存するための保存部（メモリ）として、例えば、ＳＲＡＭなどを備えている。

（第３の実施形態）
　次に、本発明の第３の実施形態について説明する。図６は、本発明の第３の実施形態における画像認識装置の概略構成を示したブロック図である。図６において、画像認識装置３０は、ＳＶＭ演算部１１０と、特徴値保存部１２０と、調停部３４０と、ビジュアルワード演算部３５０と、ヒストグラム演算部３６０と、を備えている。また、ＳＶＭ演算部１１０は、特徴値算出部１１１と累積加算部１１２とを備えている。なお、図６は、画像認識装置３０が画像認識の処理を行う際に用いるデータを保存するデータ保存部９０を併せて示し、画像認識装置３０を備えた画像認識システム３として示している。

　図６に示した画像認識装置３０は、図１に示した第１の実施形態の画像認識装置１０に備えたビジュアルワード演算部３５０とヒストグラム演算部３６０とを示し、さらに、調停部３４０を備えた構成である。なお、画像認識装置３０に備えたその他の構成要素は、図１に示した第１の実施形態の画像認識装置１０に備えた構成要素と同じ構成要素である。従って、以下の説明においては、画像認識装置３０の構成要素において、第１の実施形態の画像認識装置１０に備えた構成要素と同様の構成要素には同一の符号を付与して、それぞれの構成要素に関する詳細な説明は省略し、画像認識装置３０において第１の実施形態の画像認識装置１０と異なる構成要素および動作についてのみ説明する。

　画像認識装置３０も、第１の実施形態の画像認識装置１０と同様に、入力された画像に対して画像認識の処理を行い、それぞれの教師データとの類似度の情報を、画像認識の処理によって認識した認識対象物が比較対象物と類似している度合いを表す情報（画像認識の処理の結果）として出力する。ただし、画像認識装置３０は、特徴値保存部１２０を、ＳＶＭ演算部１１０と、ビジュアルワード演算部３５０と、ヒストグラム演算部３６０とのそれぞれで共有する構成の画像認識装置である。

　ビジュアルワード演算部３５０は、例えば、画像認識システム３を搭載した撮影システムによって撮影された画像に対するビジュアルワードを生成するビジュアルワードの演算処理を行う。より具体的には、ビジュアルワード演算部３５０は、画像認識装置３０に入力された画像における代表的な局所パターン（ビジュアルワード）の集合を生成する演算を行う。ビジュアルワード演算部３５０は、入力された画像におけるそれぞれのビジュアルワードを生成する演算を行う際に、演算途中のデータなどを一時的に保存する保存部（メモリ）として、特徴値保存部１２０を利用する。そして、ビジュアルワード演算部３５０は、最終的に生成したビジュアルワードの集合のデータを、データ保存部９０に出力して保存させる。なお、ビジュアルワード演算部３５０におけるビジュアルワードの演算処理の方法は、従来の画像認識の技術におけるビジュアルワードの演算処理の方法と同様であるため、詳細な説明は省略する。

　ヒストグラム演算部３６０は、ビジュアルワードに基づいて、例えば、画像認識システム３を搭載した撮影システムによって撮影された画像全体のヒストグラムを生成するヒストグラムの演算処理を行う。より具体的には、ヒストグラム演算部３６０は、ビジュアルワード演算部３５０によって生成されて保存されたそれぞれのビジュアルワードのデータをデータ保存部９０から読み出し、読み出したそれぞれのビジュアルワードのデータに基づいて、入力された画像全体のヒストグラムを生成する演算を行う。ヒストグラム演算部３６０は、入力された画像全体のヒストグラムを生成する演算を行う際に、演算途中のデータなどを一時的に保存する保存部（メモリ）として、特徴値保存部１２０を利用する。そして、ヒストグラム演算部３６０は、最終的に生成したヒストグラムのデータを、データ保存部９０に出力して保存させる。なお、ヒストグラム演算部３６０におけるヒストグラムの演算処理の方法は、従来の画像認識の技術におけるヒストグラムの演算処理の方法と同様であるため、詳細な説明は省略する。

　画像認識装置３０では、ヒストグラム演算部３６０が最終的に生成したヒストグラムのデータが、認識対象データ９５０である。図６には、データ保存部９０に、教師データ群９１０と、ヒストグラム演算部３６０が生成した認識対象データ９５０とを保存している状態を示している。

　調停部３４０は、画像認識装置３０が画像認識の処理を実行する際に、画像認識装置３０内の構成要素、つまり、ビジュアルワード演算部３５０、ヒストグラム演算部３６０、およびＳＶＭ演算部１１０による特徴値保存部１２０の利用を調停する。なお、画像認識装置３０では、ビジュアルワード演算部３５０と、ヒストグラム演算部３６０と、ＳＶＭ演算部１１０とのそれぞれによる処理は、排他的に行われる。より具体的には、画像認識装置３０では、最初に、ビジュアルワード演算部３５０が、入力された画像におけるビジュアルワードの集合のデータを生成する。次に、ヒストグラム演算部３６０が、入力された画像全体のヒストグラムを生成する。最後に、ＳＶＭ演算部１１０が、教師データ群９１０において分類された比較対象物の種類ごとに類似度を算出して画像認識装置３０が画像認識の処理を行って認識した認識対象物の情報（画像認識の処理の結果）として出力する。

　従って、調停部３４０は、画像認識装置３０が画像認識の処理を実行する際のそれぞれの演算処理の段階において、特徴値保存部１２０を利用する構成要素を、排他的に割り当てる。より具体的には、ビジュアルワード演算部３５０が入力された画像におけるそれぞれのビジュアルワードを生成するビジュアルワードの演算処理の段階では、ビジュアルワード演算部３５０を、特徴値保存部１２０を利用する構成要素として割り当てる。その後、ヒストグラム演算部３６０が入力された画像全体のヒストグラム（認識対象データ９５０）を生成るヒストグラムの演算処理の段階では、ヒストグラム演算部３６０を、特徴値保存部１２０を利用する構成要素として割り当てる。最後に、ＳＶＭ演算部１１０が、教師データ群９１０において分類されたそれぞれの比較対象物の種類ごとの類似度を表す情報を出力するＳＶＭ演算の処理の段階では、ＳＶＭ演算部１１０を、特徴値保存部１２０を利用する構成要素として割り当てる。

　そして、調停部３４０は、特徴値保存部１２０を利用する構成要素として割り当てたそれぞれの構成要素から出力された、特徴値保存部１２０へのデータの書き込み制御および特徴値保存部１２０からのデータの読み出し制御に応じて、特徴値保存部１２０へのアクセスを行う。

　特徴値保存部１２０は、調停部３４０によって利用が割り当てられた画像認識装置３０内の構成要素が一時的に保存するデータを保存する。特徴値保存部１２０がデータを保存することができる記憶容量は、調停部３４０によって利用が割り当てられる画像認識装置３０内の構成要素がそれぞれの処理を実行する際に特徴値保存部１２０に保存する最大の量のデータを記憶することができる記憶容量である。つまり、特徴値保存部１２０の記憶容量は、ビジュアルワード演算部３５０、ヒストグラム演算部３６０、およびＳＶＭ演算部１１０の内、特徴値保存部１２０に最も多くのデータを保存する構成要素が処理を実行する際に必要な最大の記憶容量と同じ記憶容量である。

　なお、一般的に、画像認識装置においては、ビジュアルワードの演算処理において最も多くの演算途中のデータなどを一時的に保存する。従って、特徴値保存部１２０の記憶容量は、ビジュアルワード演算部３５０がビジュアルワードの集合のデータを生成する処理を行う際に必要な量のデータを記憶することができる記憶容量である。

　このように、画像認識装置３０は、特徴値保存部１２０の利用を調停する調停部３４０を備え、特徴値保存部１２０を、ＳＶＭ演算部１１０と、ビジュアルワード演算部３５０と、ヒストグラム演算部３６０とのそれぞれで共有する。これにより、画像認識装置３０では、画像認識の処理におけるＳＶＭ演算の処理を行う際にデータ保存部９０から教師データを読み出す回数（データ保存部９０へのアクセス回数）を低減するために、例えば、ＳＲＡＭなどの保存部（メモリ）を特徴値保存部１２０として専用に備えることなく、特徴値算出部１１１が算出したそれぞれの教師データごとの特徴値を特徴値保存部１２０に保存する構成にすることができる。

　ここで、画像認識装置３０が画像認識の処理を行う際のデータの流れについて説明する。図７は、本発明の第３の実施形態の画像認識装置３０において画像認識の処理を行う際のデータの流れを示した図である。図７には、図２に示した第１の実施形態の画像認識装置１０におけるデータの流れと同様に、画像認識装置３０が行う画像認識の処理におけるＳＶＭ演算の処理のデータの流れを示している。従って、図７に示したデータの流れも、画像認識装置３０に入力された画像に対してビジュアルワード演算部３５０が実行するビジュアルワードの演算処理、およびヒストグラム演算部３６０がビジュアルワードに基づいて実行するヒストグラムの演算処理が終了している状態から画像認識装置３０がＳＶＭ演算の処理を行う際のデータの流れを示している。なお、図７に示した画像認識装置３０におけるデータの流れには、図２に示した第１の実施形態の画像認識装置１０におけるデータの流れと同様のデータの流れを含んでいる。

　画像認識装置３０におけるＳＶＭ演算の処理では、ＳＶＭ演算部１１０に備えた特徴値算出部１１１が、データ保存部９０から認識対象データ９５０を読み出す（経路Ｃ３－１）。さらに、特徴値算出部１１１は、データ保存部９０から教師データ群９１０に含まれる全ての教師データを順次読み出す（経路Ｃ１－２）。そして、特徴値算出部１１１は、読み出した認識対象データ９５０と教師データとのそれぞれに基づいて特徴値を算出し、算出した特徴値のそれぞれを、調停部３４０を介して特徴値保存部１２０に出力して一旦保存する。図７には、特徴値算出部１１１が算出したそれぞれの特徴値１２１を、特徴値保存部１２０に保存している状態を示している。

　その後、画像認識装置３０におけるＳＶＭ演算の処理では、ＳＶＭ演算部１１０に備えた累積加算部１１２が、特徴値算出部１１１が特徴値保存部１２０に保存した特徴値１２１の中から、同じ種類の比較対象物に分類された教師データに対応する特徴値１２１を、調停部３４０を介して読み出す。そして、累積加算部１１２は、読み出したそれぞれの特徴値１２１を累積加算し、累積加算した特徴値を、読み出した特徴値１２１が表す種類の比較対象物との類似度を表す情報（画像認識の処理の結果）として出力する（経路Ｃ３－３）。

　なお、画像認識装置３０が行う画像認識の処理におけるＳＶＭ演算の処理の処理手順は、特徴値保存部１２０に特徴値を保存する際、および特徴値保存部１２０から特徴値の読み込みを行う際に、調停部３４０を介してそれぞれの特徴値のデータが受け渡しされる以外は、図３に示した第１の実施形態の画像認識装置１０が行う画像認識の処理におけるＳＶＭ演算の処理の処理手順と同様である。

　より具体的には、画像認識装置３０が図３に示したＳＶＭ演算の処理の処理手順を開始した後、特徴値算出部１１１は、図３に示したステップＳ１２０において、それぞれの教師データに対応する特徴値を、調停部３４０を介して特徴値保存部１２０に出力して保存させる。また、累積加算部１１２は、図３に示したステップＳ２００において、特徴値保存部１２０に保存された同じ種類の比較対象物に分類された教師データに対応するそれぞれの特徴値を、調停部３４０を介して読み出す。画像認識装置３０が行うＳＶＭ演算の処理の処理手順は、上述したステップＳ１００とステップＳ２００とにおいてそれぞれの特徴値が伝送される経路が異なる以外は、第１の実施形態の画像認識装置１０が行うＳＶＭ演算の処理の処理手順と同様である。つまり、画像認識装置３０におけるＳＶＭ演算の処理自体は、第１の実施形態の画像認識装置１０と同様である。

　これにより、画像認識装置３０でも、第１の実施形態の画像認識装置１０と同様に、ＳＶＭ演算によって算出したそれぞれの比較対象物の種類ごとの類似度を表す情報を、画像認識の処理を行って認識した認識対象物の情報（画像認識の処理の結果）として出力することができる。

　第３の実施形態によれば、画像認識の処理において排他的に演算の処理を行う、ビジュアルワード演算部（ビジュアルワード演算部３５０）と、ヒストグラム演算部（ヒストグラム演算部３６０）と、ＳＶＭ演算部（ＳＶＭ演算部１１０）とによるデータ保存部（特徴値保存部１２０）の利用を調停する調停部（調停部３４０）、をさらに備え、調停部３４０は、特徴値保存部１２０の利用を割り当てたいずれか１つの演算部（ビジュアルワード演算部３５０、ヒストグラム演算部３６０、またはＳＶＭ演算部１１０）による特徴値保存部１２０へのアクセスに応じて特徴値保存部１２０にアクセスする画像認識装置（画像認識装置３０）が構成される。

　また、第３の実施形態によれば、特徴値保存部１２０は、ビジュアルワード演算部３５０と、ヒストグラム演算部３６０と、ＳＶＭ演算部１１０とがそれぞれの処理を実行する際に特徴値保存部１２０に一時的に保存する最大の量のデータを記憶することができる記憶容量を有する画像認識装置３０が構成される。

　上記に述べたように、第３の実施形態の画像認識装置３０は、第１の実施形態の画像認識装置１０と同様に、ＳＶＭ演算において教師データ群９１０に含まれる全ての教師データに対応する特徴値を保存するための特徴値保存部１２０を備える。そして、第３の実施形態の画像認識装置３０でも、第１の実施形態の画像認識装置１０と同様に、画像認識の処理におけるＳＶＭ演算において、教師データ群９１０に含まれる全ての教師データに対応する特徴値を特徴値保存部１２０に一旦保存した後に、同じ種類の比較対象物に分類された教師データに対応する特徴値を読み出して累積加算し、それぞれの比較対象物の種類ごとの類似度を表す情報（画像認識の処理の結果）として出力する。これにより、第３の実施形態の画像認識装置３０でも、第１の実施形態の画像認識装置１０と同様に、画像認識の処理を行う際の負荷を、従来の画像認識の処理を行う画像認識装置よりも軽減することができる。なお、第３の実施形態の画像認識装置３０において画像認識の処理を行う際の負荷を軽減することができるということも、第１の実施形態の画像認識装置１０と同様に、画像認識装置３０を備えた画像認識システム３における画像認識の処理の高効率化や処理速度の向上につながる。

　また、第３の実施形態の画像認識装置３０では、調停部３４０を備え、特徴値保存部１２０を、画像認識装置３０内の構成要素（ビジュアルワード演算部３５０、ヒストグラム演算部３６０、およびＳＶＭ演算部１１０）で共有する。これにより、第３の実施形態の画像認識装置３０では、ＳＶＭ演算部１１０以外の構成要素が利用する保存部（メモリ）を、ＳＶＭ演算部１１０がＳＶＭ演算の処理を行う際に教師データ群９１０に含まれる全ての教師データに対応する特徴値を保存するための特徴値保存部１２０として利用することができる。このことにより、第３の実施形態の画像認識装置３０は、ＳＶＭ演算部１１０が利用する専用の保存部（メモリ）として特徴値保存部１２０を備えることなく、第１の実施形態の画像認識装置１０と同様の効果を得ることができる。なお、第３の実施形態の画像認識装置３０においてＳＶＭ演算部１１０が利用する専用の特徴値保存部１２０を備える必要がないということは、画像認識装置３０の回路規模の増大を抑えることができるということにもつながる。

　なお、第３の実施形態の画像認識装置３０も、第１の実施形態の画像認識装置１０と同様に、画像認識装置３０にＤＭＡ部を備えた構成であってもよい。また、第３の実施形態の画像認識装置３０も、第１の実施形態の画像認識装置１０と同様に、認識する比較対象物の種類数や教師データ群９１０の構成に応じて、第３の実施形態の画像認識装置３０の動作を切り替える構成にしてもよい。

　なお、第３の実施形態の画像認識装置３０では、第１の実施形態の画像認識装置１０に調停部３４０を備えた構成について説明したが、第２の実施形態の画像認識装置２０に調停部３４０を備えた構成にしてもよい。この場合、第２の実施形態の画像認識装置２０と同様の効果に加えて、特徴値保存部１２０を他の構成要素と共有することによる上述した効果を得ることができる。

　上記に述べたように、本発明の各実施形態によれば、画像認識装置に、画像認識の処理におけるＳＶＭ演算において用いる全ての教師データに対応する特徴値を全て保存するための特徴値保存部を備える。そして、本発明の各実施形態では、画像認識の処理におけるＳＶＭ演算において、それぞれの教師データに１回ずつアクセスして、それぞれの教師データに対応する特徴値を全て算出して特徴値保存部に一旦保存する。その後、本発明の各実施形態では、特徴値保存部に保存した特徴値の中から、同じ種類の対象物に分類された教師データに対応する特徴値を読み出して累積加算して、それぞれの対象物の種類ごとの類似度を表す情報（画像認識の処理の結果）として出力する。これにより、本発明の各実施形態では、従来の画像認識装置のように、同じ教師データにアクセスして同じ特徴値を算出するという重複した処理を行うことがなく、画像認識装置においてＳＶＭ演算の処理を行う際の演算負荷を軽減することができる。

　さらに、本発明の各実施形態では、画像認識装置に、可逆圧縮された教師データ群を解凍するための教師データ解凍部を備える。そして、本発明の各実施形態では、教師データ解凍部が、ＳＶＭ演算に先だって可逆圧縮された教師データ群を解凍する。その後、本発明の各実施形態では、教師データ解凍部が解凍したそれぞれの教師データに対応する特徴値を全て算出して特徴値保存部に一旦保存した後に、同じ種類の対象物に分類された教師データに対応する特徴値を累積加算し、それぞれの対象物の種類ごとの類似度を表す情報（画像認識の処理の結果）として出力する。これにより、本発明の各実施形態では、ＳＶＭ演算において用いる教師データが可逆圧縮された形式である場合でも、つまり、教師データの形式に関係なく、画像認識装置においてＳＶＭ演算の処理を行う際の演算負荷を、従来の画像認識装置よりも軽減することができる。

　また、本発明の各実施形態では、画像認識装置に、特徴値保存部を利用する構成要素を調停する調停部を備える。そして、本発明の各実施形態では、特徴値保存部を、画像認識装置において排他的に処理を行う複数の構成要素で共有する。これにより、本発明の各実施形態では、ＳＶＭ演算において利用する専用の保存部として特徴値保存部を備えることなく、画像認識装置の回路規模の増大を抑えた状態で、画像認識装置においてＳＶＭ演算の処理を行う際の演算負荷を、従来の画像認識装置よりも軽減することができる。

　これらのことにより、本発明の各実施形態では、画像認識装置を備えた画像認識システムでは、画像認識の処理を効率的に行うことができ、画像認識の処理速度を向上させることができる。

　なお、本発明の各実施形態では、教師データ群９１０や圧縮教師データ群９１１が、４種類のそれぞれの比較対象物に対応した１５００個ずつのヒストグラムを含み、５０００個の教師データで構成されている場合の例で説明した。しかし、教師データ群９１０や圧縮教師データ群９１１が表す比較対象物の種類数は、本発明の各実施形態で説明した数に限定されるものではない。また、教師データ群９１０や圧縮教師データ群９１１に含まれる教師データの数も、本発明の各実施形態で説明した数に限定されるものではない。例えば、教師データ群９１０や圧縮教師データ群９１１が表すそれぞれの比較対象物に対応したヒストグラムの数が、ある比較対象物に対応したヒストグラムは１５００個であり、他の比較対象物に対応したヒストグラムは１２００個であるなど、それぞれの比較対象物で同じ数ではないことも考えられる。

　このような場合であっても、本発明の考え方を適用し、上述したように、認識する比較対象物の種類数や教師データの構成に応じて動作に切り替えることによって、本発明と同様の効果を得ることができる。つまり、本発明の考え方を適用した画像認識の処理を行うために全ての教師データを読み出す回数と、従来の画像認識の処理を行うために比較対象物の種類ごとに対応する教師データを読み出す回数とを比較し、教師データを読み出す回数が少ない方の画像認識の処理を行うように動作を切り替える。より具体的には、認識するそれぞれの比較対象物に対応するヒストグラムの数を合計した数、すなわち、従来の画像認識の処理において教師データを読み出す回数と、本発明の考え方を適用した画像認識の処理において全ての教師データを読み出す回数とを比較し、教師データを読み出す回数が少ない方の画像認識の処理を行うように動作を切り替える。これにより、教師データ群９１０や圧縮教師データ群９１１が表す比較対象物の種類数や、教師データ群９１０や圧縮教師データ群９１１に含まれる教師データの数が、本発明の各実施形態で説明した例と異なる場合でも、本発明と同様の効果を得ることができる。

　以上、本発明の好ましい実施形態を説明したが、本発明はこれら実施形態およびその変形例に限定されることはない。本発明の趣旨を逸脱しない範囲で、構成の付加、省略、置換、およびその他の変更が可能である。
　また、本発明は前述した説明によって限定されることはなく、添付のクレームの範囲によってのみ限定される。

　上記各実施形態によれば、画像認識の処理を行う際の負荷を軽減することができる画像認識装置および画像認識方法を提供することができる。

　１，２，３　画像認識システム
　１０，２０，３０　画像認識装置
　１１０　ＳＶＭ演算部
　１１１　特徴値算出部
　１１２　累積加算部
　１２０　特徴値保存部（データ保存部）
　２３０　教師データ解凍部
　３４０　調停部
　３５０　ビジュアルワード演算部
　３６０　ヒストグラム演算部
　９０　データ保存部
　９１０　教師データ群
　９１１　圧縮教師データ群（教師データ群）
　９５０　認識対象データ

Claims

　入力された画像に対する画像認識の処理を、認識する対象物である比較対象物の画像のヒストグラムである教師データを前記比較対象物の種類ごとに分類して複数含んだ教師データ群に基づいて行う画像認識装置であって、
　前記画像のビジュアルワードに基づいて生成されたヒストグラムに対するサポートベクタマシン（ＳＶＭ）演算を、前記教師データ群に含まれる複数の前記教師データのそれぞれに基づいて行うＳＶＭ演算部と、
　前記画像認識の処理の途中で生成されるデータを一時的に保存するデータ保存部と、
　を備え、
　前記ＳＶＭ演算部は、
　　入力された前記画像のヒストグラムと、前記教師データが表す前記比較対象物のヒストグラムとを比較し、入力された前記画像に写されている対象物である認識対象物と前記比較対象物とが類似している度合いを表す特徴値を算出する特徴値算出部と、
　　同じ種類の前記比較対象物に分類された前記教師データに対応する前記特徴値を累積加算する累積加算部と、
　を具備し、
　前記ＳＶＭ演算の処理において、
　　前記特徴値算出部は、前記教師データ群に含まれる全ての前記教師データに対応する前記特徴値を、それぞれの前記教師データごとに算出し、算出した全ての前記特徴値を前記データ保存部に保存させ、
　　前記累積加算部は、前記特徴値算出部が全ての前記特徴値を前記データ保存部に保存させた後に、保存された全ての前記特徴値の中から、同じ種類の前記比較対象物に分類された前記教師データに対応する前記特徴値を読み出して累積加算し、累積加算した前記特徴値を、前記画像認識の処理において前記認識対象物を認識した結果として出力する、
　画像認識装置。
　前記特徴値算出部は、
　前記教師データ群に含まれる前記教師データの数が、前記画像認識の処理において前記認識対象物を認識した全ての結果を出力するまでに前記累積加算部が前記データ保存部に保存された前記特徴値を読み出して累積加算する回数よりも少ない場合に、前記教師データ群に含まれる全ての前記教師データに対応する全ての前記特徴値を算出して前記データ保存部に保存させる、
　請求項１に記載の画像認識装置。
　全ての前記教師データを１つにまとめた状態で可逆圧縮した形式で入力された前記教師データ群を解凍してそれぞれの前記教師データに復元する教師データ解凍部、をさらに備え、
　前記ＳＶＭ演算の処理において、
　　前記教師データ解凍部は、前記教師データ群を解凍してそれぞれの前記教師データに復元し、
　　前記特徴値算出部は、前記教師データ解凍部によって復元されたそれぞれの前記教師データに対応する全ての前記特徴値を算出して前記データ保存部に保存させる、
　請求項２に記載の画像認識装置。
　前記画像認識の処理において排他的に演算の処理を行う、ビジュアルワード演算部と、
　ヒストグラム演算部と、
　前記ＳＶＭ演算部とによる前記データ保存部の利用を調停する調停部、
　をさらに備え、
　前記調停部は、前記データ保存部の利用を割り当てたいずれか１つの演算部による前記データ保存部へのアクセスに応じて前記データ保存部にアクセスする、
　請求項２または請求項３に記載の画像認識装置。
　前記データ保存部は、前記ビジュアルワード演算部と、前記ヒストグラム演算部と、前記ＳＶＭ演算部とがそれぞれの処理を実行する際に前記データ保存部に一時的に保存する最大の量のデータを記憶することができる記憶容量を有する、
　請求項４に記載の画像認識装置。
　入力された画像に対する画像認識の処理を、認識する対象物である比較対象物の画像のヒストグラムである教師データを前記比較対象物の種類ごとに分類して複数含んだ教師データ群に基づいて行う画像認識装置における画像認識方法であって、
　前記画像のビジュアルワードに基づいて生成されたヒストグラムに対するサポートベクタマシン（ＳＶＭ）演算を、前記教師データ群に含まれる複数の前記教師データのそれぞれに基づいて行うＳＶＭ演算ステップ、
　を含み、
　前記ＳＶＭ演算ステップは、
　　入力された前記画像のヒストグラムと、前記教師データが表す前記比較対象物のヒストグラムとを比較し、入力された前記画像に写されている対象物である認識対象物と前記比較対象物とが類似している度合いを表す特徴値を算出する特徴値算出ステップと、
　　同じ種類の前記比較対象物に分類された前記教師データに対応する前記特徴値を累積加算する累積加算ステップと、
　を含み、
　　前記特徴値算出ステップにおいて、前記教師データ群に含まれる全ての前記教師データに対応する前記特徴値が、それぞれの前記教師データごとに算出され、算出した全ての前記特徴値が、前記画像認識の処理の途中で生成されるデータを一時的に保存するデータ保存部に保存され、
　　前記累積加算ステップにおいて、前記特徴値算出ステップにおいて全ての前記特徴値が前記データ保存部に保存された後に、保存された全ての前記特徴値の中から、同じ種類の前記比較対象物に分類された前記教師データに対応する前記特徴値が読み出されて累積加算され、累積加算された前記特徴値が、前記画像認識の処理において前記認識対象物を認識した結果として出力される、
　画像認識方法。