JP2000101437A - コ―ドブック方式によるデ―タ分析装置および方法、デ―タ認識装置および方法、記録媒体 - Google Patents

コ―ドブック方式によるデ―タ分析装置および方法、デ―タ認識装置および方法、記録媒体

Info

Publication number
JP2000101437A
JP2000101437A JP11067087A JP6708799A JP2000101437A JP 2000101437 A JP2000101437 A JP 2000101437A JP 11067087 A JP11067087 A JP 11067087A JP 6708799 A JP6708799 A JP 6708799A JP 2000101437 A JP2000101437 A JP 2000101437A
Authority
JP
Japan
Prior art keywords
frequency distribution
data
code
codebook
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11067087A
Other languages
English (en)
Inventor
Tadahiro Omi
忠弘 大見
Koji Kotani
光司 小谷
Akira Nakada
明良 中田
Makoto Imai
誠 今井
Masahiro Yoda
正宏 譽田
Tatsuro Morimoto
達郎 森本
Takemi Yonezawa
岳美 米澤
Toshiyuki Nozawa
俊之 野沢
Takahiro Nakayama
貴裕 中山
Masanori Fujibayashi
正典 藤林
Takehisa Nitta
雄久 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ULTLA CLEAN TECHNOLOGY KAIHATSU KENKYUSHO KK
Original Assignee
ULTLA CLEAN TECHNOLOGY KAIHATSU KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ULTLA CLEAN TECHNOLOGY KAIHATSU KENKYUSHO KK filed Critical ULTLA CLEAN TECHNOLOGY KAIHATSU KENKYUSHO KK
Priority to JP11067087A priority Critical patent/JP2000101437A/ja
Publication of JP2000101437A publication Critical patent/JP2000101437A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 画像や音声等の分析・認識処理を実時間の範
囲で高精度に行うことができるようにする。 【解決手段】 あらかじめ用意されたコードブックの中
から、入力データより抽出される複数のベクトルに類似
したコードベクトルを夫々探し出してそれに対応するコ
ードを出力するコードブック方式圧縮部102と、出力
されたコード列を用いて出力コードの頻度分布を生成す
る頻度分布生成部104とを備え、入力データに対して
マッチングを行った後の出力コード列を用いて頻度分布
を生成することでデータ分析を行い、更には、この頻度
分布の違いからデータ認識を行うようにすることによ
り、フーリエ変換に代表される周波数変換処理などの極
めて計算量の多い処理を施すことなく、入力データの分
析や認識処理を行うことができるようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はコードブック方式に
よるデータ分析装置および方法、データ認識装置および
方法、記録媒体に関するものである。
【0002】
【従来の技術】従来、画像や音声の分析・認識などを行
う処理においては、それぞれの空間的あるいは時間的デ
ータを周波数データに変換して周波数スペクトルを求
め、そのスペクトル形状を解析する方法がとられてき
た。
【0003】
【発明が解決しようとする課題】しかしながら、この方
法によると、空間あるいは時間軸のデータを周波数軸の
データに変換するために、フーリエ変換等の極めて計算
量の多い処理を施さなければならなかった。そのため、
分析・認識処理に多くの時間を要し、実時間応答を目的
としたシステムに組み込むことは困難であった。
【0004】また、人物認識や音声認識など、マン・マ
シンインターフェイスを扱う部分に応用する場合、周波
数解析による処理がそのようなインターフェイス部分を
扱うのに最適なものであるとは限らない。したがって、
人間とシステムとが混在するような「インターフェイス
の領域」を扱うために、簡単なアルゴリズムで高速な処
理能力を持ったマン・マシンインターフェイス技術を実
現することが渇望されていた。
【0005】本発明はこのような実情に鑑みて成された
ものであり、画像や音声等の分析・認識処理を実時間の
範囲で高精度に行うことができるようにすることを目的
とする。
【0006】
【課題を解決するための手段】本発明のコードブック方
式によるデータ分析装置は、少なくとも1つ以上のデー
タを有するデータ列から成るベクトルを複数備えたコー
ドブックの中から、入力データより抽出される複数のベ
クトルに類似したコードベクトルを夫々探し出して、そ
れに対応するコードを出力するマッチング手段と、上記
マッチング手段より出力されるコード列を用いて、出力
コードの頻度分布を生成する頻度分布生成手段とを備え
たことを特徴とする。ここで、上記頻度分布生成手段
は、一部分のコードに対する頻度分布を生成するように
しても良い。また、上記入力データは、画像データもし
くは音声データであっても良い。
【0007】また、本発明のコードブック方式によるデ
ータ認識装置は、少なくとも1つ以上のデータを有する
データ列から成るベクトルを複数備えたコードブックの
中から、入力データより抽出される複数のベクトルに類
似したコードベクトルを夫々探し出して、それに対応す
るコードを出力するマッチング手段と、上記マッチング
手段より出力されるコード列を用いて、出力コードの頻
度分布を生成する頻度分布生成手段と、少なくとも1つ
以上の頻度分布の情報を記憶する頻度分布記憶手段と、
上記頻度分布生成手段により生成された上記入力データ
に関する頻度分布と上記頻度分布記憶手段内の各頻度分
布とを比較し、上記頻度分布記憶手段に記憶されている
各頻度分布の中から、所定の比較関数によって特定され
る頻度分布を選び出す比較手段とを備えたことを特徴と
する。
【0008】ここで、上記頻度分布は、一部分のコード
に対する頻度分布であっても良い。例えば、上記コード
ブックが、ベクトルを構成するブロック内で各要素のデ
ータ値がある方向に徐々に変化する第1のパターンのコ
ードベクトルと、上記ブロック内で各要素のデータ値が
急激に変化する第2のパターンのコードベクトルとから
構成され、上記頻度分布が、上記第1のパターンに対応
するコードの頻度分布のみであっても良い。
【0009】本発明の他の態様では、上記比較手段によ
る比較の結果、上記所定の比較関数によって選び出され
た頻度分布もしくはこれに対応する認識情報を表示手段
に表示することを特徴とする。また、上記比較手段によ
る比較の結果、上記所定の比較関数によって選び出され
る頻度分布が上記頻度分布記憶手段内にない場合、当該
生成された頻度分布を上記頻度分布記憶手段に登録する
頻度分布登録手段を備えても良い。また、上記比較手段
による比較の結果、上記所定の比較関数によって選び出
された頻度分布もしくはこれに対応する認識情報を出力
する応答出力手段と、上記応答出力手段からの出力に基
づくユーザの反応に応じて、上記比較の結果が正しいも
のであるかどうかを判断し、間違っている場合は上記頻
度分布記憶手段に対して上記生成された頻度分布を登録
し、あるいは上記頻度分布記憶手段に記憶されている頻
度分布に対して書き換えを行う頻度分布登録・修正手段
とを備えても良い。
【0010】本発明のその他の態様では、少なくとも1
つ以上のデータを有するデータ列から成るベクトルを複
数備えたコードブックの中から、入力データより抽出さ
れる複数のベクトルに類似したコードベクトルを夫々探
し出して、それに対応するコードを出力するマッチング
手段と、上記マッチング手段より出力されるコード列を
用いて、出力コードの頻度分布を生成する頻度分布生成
手段と、上記頻度分布生成手段により生成された出力コ
ードの頻度分布に基づいて、各出力コードの頻度を2値
で表した特徴データ列を生成する特徴データ列生成手段
と、少なくとも1つ以上の特徴データ列を記憶する特徴
データ列記憶手段と、上記特徴データ列生成手段により
生成された上記入力データに関する特徴データ列と上記
特徴データ列記憶手段内の各特徴データ列とを比較し、
上記特徴データ列記憶手段に記憶されている各特徴デー
タ列の中から、所定の比較関数によって特定される特徴
データ列を選び出す比較手段とを備えたことを特徴とす
る。
【0011】ここで、上記特徴データ列は、一部分のコ
ードに対する特徴データ列であっても良い。例えば、上
記コードブックが、ベクトルを構成するブロック内で各
要素のデータ値がある方向に徐々に変化する第1のパタ
ーンのコードベクトルと、上記ブロック内で各要素のデ
ータ値が急激に変化する第2のパターンのコードベクト
ルとから構成され、上記特徴データ列が、上記第1のパ
ターンに対応するコードの特徴データ列のみであっても
良い。
【0012】本発明のその他の態様では、上記比較手段
による比較の結果、上記所定の比較関数によって選び出
された特徴データ列もしくはこれに対応する認識情報を
表示手段に表示することを特徴とする。また、上記比較
手段による比較の結果、上記所定の比較関数によって選
び出される特徴データ列が上記特徴データ列記憶手段内
にない場合、当該生成された特徴データ列を上記特徴デ
ータ列記憶手段に登録する特徴データ列登録手段を備え
ても良い。また、上記比較手段による比較の結果、上記
所定の比較関数によって選び出された特徴データ列もし
くはこれに対応する認識情報を出力する応答出力手段
と、上記応答出力手段からの出力に基づくユーザの反応
に応じて、上記比較の結果が正しいものであるかどうか
を判断し、間違っている場合は上記特徴データ列記憶手
段に対して上記生成された特徴データ列を登録し、ある
いは上記特徴データ列記憶手段に記憶されている特徴デ
ータ列に対して書き換えを行う特徴データ列登録・修正
手段とを備えても良い。
【0013】本発明のその他の態様では、上記入力デー
タは、画像データもしくは音声データであることを特徴
とする。ここで、上記入力データである画像データ中か
ら人物の顔部分のみを抽出する画像処理手段を備え、上
記抽出した顔部分についてのみ上記出力コードの頻度分
布を生成するようにしても良い。また、上記マッチング
手段は、上記顔部分から抽出される複数ブロックのベク
トルに対して夫々マッチング処理を行うようにしても良
い。
【0014】本発明のその他の態様では、少なくとも1
つ以上のデータを有するデータ列から成るベクトルであ
って、当該ベクトルを構成するブロック内で各要素のデ
ータ値がある方向に徐々に変化する第1のパターンのコ
ードベクトルと、上記ブロック内で各要素のデータ値が
急激に変化する第2のパターンのコードベクトルとを備
えたコードブックを記憶するコードブック記憶手段と、
上記コードブックの中から、入力データより抽出される
複数のベクトルに類似したコードベクトルを夫々探し出
して、それに対応するコードを出力するマッチング手段
と、上記マッチング手段より出力されるコード列のう
ち、上記第1のパターンおよび上記第2のパターンの何
れか一方に対応するコード列に対して出力コードの頻度
分布を生成する頻度分布生成手段と、少なくとも1つ以
上の頻度分布の情報を記憶する頻度分布記憶手段と、上
記頻度分布生成手段により生成された上記入力データに
関する頻度分布と上記頻度分布記憶手段内の各頻度分布
とを比較し、上記頻度分布記憶手段に記憶されている各
頻度分布の中から、所定の比較関数によって特定される
頻度分布を選び出す比較手段とを備えたことを特徴とす
る。
【0015】また、本発明のコードブック方式によるデ
ータ分析方法は、少なくとも1つ以上のデータを有する
データ列から成るベクトルを複数備えたコードブックの
中から、入力データより抽出される複数のベクトルに類
似したコードベクトルを夫々探し出して、それに対応す
るコードを出力するマッチングステップと、上記マッチ
ングステップで出力されたコード列を用いて、出力コー
ドの頻度分布を生成する頻度分布生成ステップとを有
し、上記入力データに対して上記マッチングを行った後
の出力コード列を用いて上記頻度分布を生成するように
したことを特徴とする。
【0016】本発明の他の態様では、少なくとも1つ以
上のデータを有するデータ列から成るベクトルを複数備
えたコードブックの中から、入力データより抽出される
複数のベクトルに類似したコードベクトルを夫々探し出
して、それに対応するコードを出力するマッチングステ
ップと、上記マッチングステップで出力されたコード列
を用いて、出力コードの頻度分布を生成する頻度分布生
成ステップと、上記頻度分布生成ステップで生成された
上記入力データに関する頻度分布と、頻度分布記憶部に
あらかじめ記憶されている少なくとも1つ以上の頻度分
布とを比較し、上記頻度分布記憶部に記憶されている各
頻度分布の中から、所定の比較関数によって特定される
頻度分布を選び出す比較ステップとを有し、上記入力デ
ータに対して上記マッチングを行った後の出力コード列
を用いて上記頻度分布を生成し、上記生成した頻度分布
に対応する頻度分布を上記頻度分布記憶部から選び出す
ようにしたことを特徴とする。
【0017】本発明のその他の態様では、少なくとも1
つ以上のデータを有するデータ列から成るベクトルを複
数備えたコードブックの中から、入力データより抽出さ
れる複数のベクトルに類似したコードベクトルを夫々探
し出して、それに対応するコードを出力するマッチング
ステップと、上記マッチングステップで出力されたコー
ド列を用いて、出力コードの頻度分布を生成する頻度分
布生成ステップと、上記頻度分布生成ステップで生成さ
れた出力コードの頻度分布に基づいて、各出力コードの
頻度を2値で表した特徴データ列を生成する特徴データ
列生成ステップと、上記特徴データ列生成ステップで生
成された上記入力データに関する特徴データ列と、特徴
データ列記憶部にあらかじめ記憶されている少なくとも
1つ以上の特徴データ列とを比較し、上記特徴データ列
記憶部に記憶されている各特徴データ列の中から、所定
の比較関数によって特定される特徴データ列を選び出す
比較ステップとを有し、上記入力データに対して上記マ
ッチングを行った後の出力コード列を用いて上記頻度分
布を生成するとともに、上記生成した頻度分布から特徴
データ列を生成し、生成した特徴データ列に対応する特
徴データ列を上記特徴データ列記憶部から選び出すよう
にしたことを特徴とする。
【0018】また、本発明のコンピュータ読み取り可能
な記録媒体は、請求項1、4、8〜10、14〜15の
何れか1項に記載の各手段としてコンピュータを機能さ
せるためのプログラムを記録したことを特徴とする。ま
た、請求項19〜21の何れか1項に記載の各ステップ
をコンピュータに実行させるためのプログラムを記録す
るようにしても良い。
【0019】
【発明の実施の形態】(第1の実施形態)以下に、本発
明の一実施形態を図面を用いて詳細に説明する。図1
は、第1の実施形態によるコードスペクトル分析装置の
基本的な構成を示すブロック図である。なお、この図1
において、制御回路および制御線は図示を省略してあ
る。
【0020】図1において、本実施形態のコードスペク
トル分析装置107は、入力データ記憶部101に記憶
されている一定量(例えば19200×16バイト)の
データに対して、以下に述べるようなコードブック方式
による分析処理を行い、その結果を出力部106から出
力する。なお、上記入力データ記憶部101には、入力
データが一定の順序で記憶されている。
【0021】図1に示すように、本実施形態のコードス
ペクトル分析装置107は、コードブック方式圧縮部1
02、コードブック記憶部103、出力コードの頻度分
布生成部104および頻度分布記憶部105を備えてい
る。上記コードブック方式圧縮部102は、コードブッ
ク記憶部103に記憶されているコードブックを用い
て、入力データ記憶部101から読み出された複数バイ
トのデータ(一例として16バイトのベクトルデータ)
から圧縮コードを生成する。
【0022】コードブック記憶部103に記憶されてい
るコードブックは、複数(例えば2048個)のベクト
ルデータの集合である。また、このコードブックを構成
する個々のベクトルデータは、上記入力データ記憶部1
01から読み出されるデータと同じ次元数を持ったパタ
ーンデータ(16バイトのベクトルデータ)である。以
下、上記入力データ記憶部101から読み出されるデー
タを入力ベクトル、コードブック記憶部103に記憶さ
れているデータをコードベクトルと称する。
【0023】上記圧縮コードは、入力データ記憶部10
1より入力された入力ベクトルと、コードブック記憶部
103に格納されている各コードベクトルとの相関から
求める。すなわち、コードブック方式圧縮部102は、
上記入力ベクトルデータと各コードベクトルデータとを
夫々比較することにより、入力ベクトルと最も似通った
パターンのコードベクトルをコードブック中から見つけ
出して、そのパターンに対応するコードを出力する。こ
の出力されるコードは、例えば、コードブック記憶部1
03に格納されているデータヘのポインタ(アドレス)
である。
【0024】コードブック方式圧縮部102より出力さ
れるコードの数は、入力データの量による。上述したよ
うに、入力データ記憶部101からは一定量のデータ
(例えば19200×16バイト)が順次入力され、コ
ードブック方式圧縮部102で順次処理される。そのた
め、出力コードとしては、入力データ分(例えば192
00個のコード)が順次出力される。
【0025】出力コードの頻度分布生成部104は、コ
ードブック方式圧縮部102から順次出力されるコード
(アドレス)の頻度分布を生成するものである。また、
頻度分布記憶部105は、コードブック記憶部103に
記憶されているコードベクトルの数(例えば2048
個)分だけの記憶領域を持ち、その記憶領域にはそれぞ
れ、コードブック方式圧縮部102から出力される各コ
ードの使用頻度の情報が頻度分布生成部104によって
書き込まれる。
【0026】図2に、上記頻度分布生成部104の動作
原理を示す。なお、図2において、頻度分布生成部10
4および頻度分布記憶部105は、図1に示したものと
同一のものである。上述したように、頻度分布記憶部1
05は、コードブックを構成するコードベクトルの数分
だけ記憶領域を持ち、それぞれの記憶領域にはアドレス
が付けられている。このアドレスは、コードブック方式
圧縮部102から出力されるコードの値と対応してい
る。
【0027】頻度分布記憶部105内の各記憶領域の頻
度値は、データが入力される前の段階で“0”にリセッ
トしておく。そして、コードブック方式圧縮部102か
ら順次出力されるコードの値によって、頻度分布生成部
104が頻度分布記憶部105内の対応するアドレスの
記憶領域の頻度値を順次インクリメントしていく。図2
には、コードブック方式圧縮部102からコード値
“4”が出力され、それに対応するアドレスの頻度値を
1つインクリメントしている例が示されている。
【0028】以上の処理を決められた数の入力データ
(ここでは、例えば19200個の入力ベクトル)につ
いて行うと、最終的に頻度分布記憶部105には、入力
データに対するコードブック方式圧縮部102の出力コ
ードの頻度分布が生成されることになる。この生成され
た頻度分布のことを、以下では「コードブックスペクト
ル」と呼ぶことにする。生成されたコードブックスペク
トルは、出力部106を介して外部に出力される。
【0029】次に、入力データの例として画像データを
入力する場合を考える。ここでは、例えば1ピクセルが
8ビット(=1バイト)で表された640×480ピク
セルの画像を入力データ記憶部101に記憶しておくも
のとする。コードブック方式圧縮部102には、16バ
イト分のデータを1ベクトルとして入力する。16バイ
トのとり方として、画像の4×4ピクセルのブロックを
1ベクトルとして、ブロック毎に順次入力する。
【0030】一方、コードブック記憶部103に格納さ
れているコードブックは、ここでは2048個のコード
ベクトルで構成され、1つのコードベクトルは16バイ
トのデータで構成されている。また、コードブック方式
圧縮部102での処理として、ここではコードブック方
式圧縮部102に入力された入力ベクトルと、コードブ
ック記憶部103に格納されているコードベクトルとの
マンハッタン距離(差分絶対値距離)を計算し、最も距
離の短いものに対応するポインタ(アドレス)を出力コ
ードとして出力することにする。
【0031】全ての画像データ(19200個の入力ベ
クトル)を入力し、コードブック方式圧縮部102によ
るマッチング処理が終了すると、最終的に頻度分布記憶
部105には、例えば図3のような出力コードの頻度分
布(コードブックスペクトル)が生成されることにな
る。図3において、横軸はコード値(0〜2047)を
示し、縦軸は各コードの使用頻度を示している。
【0032】入力する画像が異なると、その画像データ
からブロック毎に抽出される複数の入力ベクトルのデー
タも当然に異なってくる。これにより、この入力ベクト
ルに類似するものとしてコードブック方式圧縮部102
によりコードブック中から探し出されるコードベクトル
も当然に異なってくる。そのため、出力されるコードの
使用頻度(コードブックスペクトル)は、対象とする画
像に特有なものとなる。つまり、コードブック方式圧縮
部102より出力されるコードの頻度分布を求めること
により、入力データの分析を行うことができる。
【0033】以上のように、本実施形態によれば、フー
リエ変換に代表される周波数変換処理などの極めて計算
量の多い処理を施すことなく、コードブック方式圧縮部
102でベクトル量子化処理を行い、これにより出力さ
れるコードの使用頻度分布を求めるという簡単な処理を
行うだけで入力データの分析を行うことができる。これ
により、入力データの分析処理を高精度かつ短時間で行
うことができるようになる。
【0034】(第2の実施形態)次に、本発明の第2の
実施形態について説明する。第2の実施形態は、図1に
示したコードスペクトル分析装置107を利用した画像
認識システムについて説明するものである。図4に、コ
ードブックスペクトルを用いた人物認識のための基本的
な構成を示す。
【0035】図4において、図1に示したブロックと同
じブロックには同一の符号を付している。画像入力部4
01は、例えば人物の正面から見た顔の画像をデータと
して取り込むものである。ここでは、例えば1ピクセル
がRGB各8ビットの階調を持った640×480ピク
セルの画像データを取り込む。なお、この実施形態では
640×480ピクセルの画像を例に挙げているが、こ
れに限定されるものではない。
【0036】画像処理部402は、画像入力部401で
得られた画像データを加工する。例えば、入力された画
像データ中から背景、服の部分などを取り除き、顔面と
髪の毛のみから成る画像を取り出し、その大きさをそろ
えたりする処理を行う。この画像処理部402の目的
は、コードブックスペクトルを用いた人物認識を容易に
する(それぞれの人の顔でコードブックスペクトルの違
いを明確にする)ための処理であり、そのために行うの
であればどんな処理(例えば、目や鼻等を抜き出した
り、顔の何らかの特徴量を抽出したりするような従来の
認識で用いられているような画像処理)であっても構わ
ない。
【0037】この画像処理部402はまた、画像入力部
401で抽出された顔面と髪の毛のみから成るRGBの
画像信号を、輝度信号(Y信号)と色信号(U信号、V
信号)とから成る画像信号に変換する。そして、このよ
うに変換したY信号のみをコードスペクトル分析装置1
07に供給することにより、実際の処理を行うデータは
Y信号のみとする。
【0038】図5は、この画像処理部402における処
理手順の例を示すフローチャートである。以下、このフ
ローチャートに従って説明する。図5において、ステッ
プS0で画像入力部401より取り込まれた画像データ
は、画像処理部402に与えられる。画像処理部402
では、まずステップS1において、上記取り込んだ画像
データ中から背景部分を取り除く処理を行う。これは、
各ピクセル毎に、例えば上記取り込んだ画像データの輝
度値から背景画像とする輝度値を引き、その差が所定の
値より小さくなったピクセルは背景画像であるとして輝
度を最大値(=255)にセットすることによって実現
できる。
【0039】次に、ステップS2で顔面と首の境目の窪
んだ所を検出し、ステップS3で左右の窪んだ所の2点
間の中心位置を検出する。さらに、ステップS4で上記
検出した中心位置から画像の下方に沿って所定の処理を
行うことにより、顎の部分を検出する。そして、ステッ
プS5で、上記検出した顎の先端より下側の画像(首の
部分など)をクリアする(例えば最大輝度値で置き換え
る)処理を行う。
【0040】そして、ステップS6で顔面と首の境目の
左側輪郭を検出した後、ステップS7で顔面と首の境目
の右側輪郭を検出する。以上の処理により、画像入力部
401より入力された画像データ中から背景、服、首の
部分をすべて取り除き、顔面と髪の毛のみから成る画像
を生成する。以下に述べる人物認識処理は、このように
して取り出された画像に対して行われる。
【0041】コードブック方式圧縮部102は、図1に
示したものと同等のものであり、画像処理部402で得
られた画像に対して、具体的に次の操作を行う。すなわ
ち、画像処理部402で処理された画像の左上を起点と
して、そこから右方向へ向かって4×4ピクセルのブロ
ックを順次取り出す。右端まで取り出したら、取り出す
位置を1ブロック分下にずらして左端から再び取り出し
て行き、それを繰り返すことにより全画面分のブロック
を取り出す。
【0042】そして、取り出した各ブロックに対して、
コードブック記憶部103に多数登録されているコード
ベクトルの中から最もパターンの似ている(絶対値差分
距離の最も短い)ものを順次選び出し、そに対応するア
ドレスを出力コードとして出力する。例えば640×4
80ピクセルの画像を処理する場合、19200個のブ
ロックが取り出されて処理されるので、出力コードも1
9200個となる。
【0043】なお、この例でコードブック記憶部103
には、4×4ピクセルのパターン画像が多数登録されて
いて、それぞれのブロックにはアドレスが割り当てられ
ている。そして、入力ベクトルと最も似ているパターン
に対応するアドレスがコードブック方式圧縮部102よ
り出力コードとして順次出力される。この実施形態では
コードブックに2048個のブロック(コードベクト
ル)を登録しているが、登録数は本実施形態によって限
定されるものではない。
【0044】出力コードの頻度分布生成部104および
頻度分布記憶部105も図1に示したものと同等のもの
であり、コードブック方式圧縮部102から出力される
コードの頻度分布(コードブックスペクトル)を生成す
る。
【0045】コードブックスペクトル記憶部404に
は、様々な人の顔について上記のようなコードブックス
ペクトルの生成を行い、それによって得られた複数のコ
ードブックスペクトルがあらかじめ格納されている。第
1の実施形態で述べたように、異なる人の顔から生成し
たコードブックスペクトルは夫々異なっている。それぞ
れのコードブックスペクトルにはアドレスが割り当てら
れていて、そのアドレスが誰の顔のコードブックスペク
トルなのかを示している。
【0046】コードブックスペクトル比較部403は、
コードスペクトル分析装置107で生成されたある人の
顔のコードブックスペクトルと、コードブックスペクト
ル記憶部404に格納されている個々人の顔のコードブ
ックスペクトルとを比較し、入力画像のコードブックス
ペクトルと最もパターンの似ているものをコードブック
スペクトル記憶部404から選び出し、そのアドレスを
出力する。そのアドレスが認識された人物を示してい
る。なお、ここでは最もパターンの似ているものを選び
出しているが、これに限定されない。要は、所定の比較
関数によって特定される頻度分布を選び出すようにすれ
ば良い。
【0047】以上のように、第2の実施形態によれば、
コードスペクトル分析装置107により分析されたコー
ドブックスペクトルを用い、あらかじめ登録された複数
のコードブックスペクトルとの比較という簡単な処理を
行うだけで、コードブックスペクトルの違いから人物の
認識を行うことができる。これにより、人物認識の処理
を高精度かつ短時間で行うことができるようになる。
【0048】(第3の実施形態)次に、本発明の第3の
実施形態について説明する。第3の実施形態は、第2の
実施形態で述べたようなコードブックスペクトルを用い
た人物認識システムに対して、コードブックスペクトル
を自動的に登録・修正するようにしたシステムを説明す
るものである。図6は、第3の実施形態による人物認識
システムの構成を示すブロック図である。
【0049】図6において、図4に示した符号と同一の
符号を付したものは、同一の機能を有するものであるの
で、これについての詳細な説明は省略する。認識対象人
物に対する応答部601は、コードブックスペクトル比
較部403で認識された結果に基づいて、認識対象であ
る人物に対して何らかの働きかけ(例えば声をかけた
り、名前を尋ねたり、認識結果を表示したりする処理)
を行い、認識した結果をチェックするためのものであ
る。
【0050】もし、その認識された人物がコードブック
スペクトル記憶部404に未登録の人物であったり(す
なわち、所定の比較関数によって選び出される頻度分布
がない場合)、認識結果が誤りだと判断されたりした場
合には、コードブックスペクトルの登録・修正部602
により、コードブックスペクトル記憶部404に対して
コードブックスペクトルの書き込みあるいは書き換えを
行う。なお、認識結果の応答は、必ずしも認識された人
物本人に対して行う必要はない。
【0051】このように構成した本実施形態によれば、
人物認識の処理を行いながら新たなコードブックスペク
トルを逐次データベースとして登録したり、適切でない
コードブックスペクトルを逐次修正したりすることを自
動的に行うことができ、システムのメンテナンスを簡単
に行うことができる。また、このようなメンテナンスを
行うことにより、認識率を高めることもできる。
【0052】(第4の実施形態)次に、本発明の第4の
実施形態について説明する。第4の実施形態は、人物認
識システムの他の構成例について説明するものである。
図7は、本実施形態による人物認識システムの構成を示
すブロック図である。なお、図7において、図4に示し
た符号と同一の符号を付したものは、同一の機能を有す
るものであるので、これについての詳細な説明は省略す
る。
【0053】図7に示すように、本実施形態のコードス
ペクトル分析装置700は、図4に示したコードスペク
トル分析装置107の構成に加えて、頻度分布記憶部1
05の後段に特徴データ列生成部701を備えている。
また、図4のコードブック記憶部103の代わりにコー
ドブック記憶部702が設けられ、後述するような基本
的なパターンのコードベクトルのみが記憶されている。
さらに、このコードスペクトル分析装置700の出力段
には、特徴データ列比較部703およびコードブック特
徴データ列記憶部704が備えられている。
【0054】上記コードブック記憶部702には、ベタ
パターン用に生成されたコードベクトルと、エッジパタ
ーン用に生成されたコードベクトルとを合わせて、例え
ば321個のパターン画像が記憶されている。本実施形
態において、ベタパターンとは、ブロック内で各ピクセ
ルの輝度値がある方向に向かって徐々に変化するパター
ンを言い、エッジパターンとは、ブロック内で各ピクセ
ルの輝度値が急激に変化するパターンのことを言う。
【0055】ベタパターンのコードベクトルとしては、
例えば図8(a)に示すように、8つの方向に単調に変
化するパターンのコードベクトルを複数登録する。すな
わち、4×4ピクセル単位で構成されるブロックのエッ
ジ部分(上下左右の各辺および四隅の各点)の何れかを
始点として、各ピクセルの輝度値が徐々に変化するパタ
ーンである。なお、ここでは8個のパターンのみを示し
ているが、実際には始点の輝度値や輝度変化の度合いな
どにバリエーションを持たせて、例えば32個のベタパ
ターンを登録している。
【0056】また、エッジパターンのコードベクトルと
しては、例えば図8(b)に示すように、輝度値の変化
が急激なパターンのコードベクトルを複数登録する。な
お、ここでは12個のパターンのみを示しているが、ベ
タパターンと同様にバリエーションを持たせて、あるい
はここに示した以外のパターンも含めて多数のエッジパ
ターンを登録している。本実施形態では、コードブック
記憶部702の先頭アドレスから順に32個のベタパタ
ーンを記憶し、その次にエッジパターンを記憶してい
る。
【0057】特徴データ列生成部701は、頻度分布記
憶部105に記憶された出力コードの頻度分布(コード
ブックスペクトル)を用いて、所定の特徴データ列を生
成する。以下に、この特徴データ列の生成処理について
図9を用いて説明する。図9は、頻度分布生成部104
により生成され、頻度分布記憶部105に記憶された頻
度分布情報に基づくコードブックスペクトルの例を示し
ている。なお、ここではコード番号を50番までしか示
していないが、実際には321番まである。
【0058】この図9から分かるように、人物認識を行
うために入力画像として人の顔を用いた場合、0番〜3
2番までのコードが非常によく使用されており、その他
のコードはあまり使用されていない。0番〜31番まで
のコード番号は、上述したようにベタパターンを示して
おり、33番以降のコード番号はエッジパターンを示し
ている。なお、32番のコード番号は背景のパターンを
示している。
【0059】このように、一般に、人の顔画像は各ピク
セルの輝度値が全体的に滑らかに変化するパターンが大
半を占めており、その変化は単調で、変化量は非常に小
さいものであるため、本実施形態のコードブックを用い
てコードブックスペクトルを求めると、ほとんどのブロ
ックでベタパターンのコードベクトルが使用される。こ
れは、ベタパターンの頻度分布さえ分かれば人物認識を
行うことが可能であることを意味している。
【0060】そこで、特徴データ列生成部701は、こ
のベタパターンの出力コードに関する部分のコードブッ
クスペクトルのみを用いて、以下に説明するような特徴
データ列を生成する。すなわち、図9に示したように、
0番〜31番までの32個の出力コードの使用頻度のう
ち、例えば上位15位までのコードにはフラグ値として
“1”を与え、それ以外のコードにはフラグ値として
“0”を与える。これにより、32個の出力コードの使
用頻度が、“0”および“1”の2値を用いたデータ列
で表される。これが特徴データ列である。
【0061】特徴データ列比較部703は、特徴データ
列生成部701により生成されたある人の顔の特徴デー
タ列と、コードブック特徴データ列記憶部704に記憶
されている、様々な人の顔についてあらかじめ生成され
た特徴データ列とを比較する。そして、その一致度が最
も大きいものをコードブック特徴データ列記憶部704
から選び出し、それに対応するアドレスを出力する。そ
のアドレスが認識された人物を示している。
【0062】図10は、本実施形態による人物認識シス
テムの処理手順を示すフローチャートである。図10に
おいて、まずステップS11で、画像処理部402で生
成された顔面のみの画像を格納したメモリ(図示せず)
の先頭アドレスを変数Wresultに入れるとともに、ステ
ップS12で、コードブック方式圧縮部102でのベク
トル量子化による出力コードの頻度分布結果を格納する
ためのメモリ(頻度分布記憶部105)の先頭アドレス
を変数Wvectorに入れる。
【0063】さらに、ステップS13でカウンタWcnt
の値を0にリセットした後、ステップS14に進み、現
在のカウンタWcnt の値が4より大きいかどうかを判断
する。ここで、カウンタWcnt の値が4以下の場合はス
テップS15に進む。一方、4より大きい場合は更にス
テップS16でカウンタWcnt の値が7より大きいかど
うかを判断し、7より大きければステップS17に進
む。カウンタWcnt の値が4<Wcnt ≦7の場合は、ス
テップS23にジャンプする。
【0064】ステップS15では、コードブック方式圧
縮部102におけるベクトル量子化のスタートアドレス
Wvctsを Wvcts=Wresult+640×Wcnt のようにセットする。また、ステップS17では、コー
ドブック方式圧縮部102におけるベクトル量子化のス
タートアドレスWvctsを Wvcts=Wresult+Wcnt −4 のようにセットする。
【0065】このようにしてベクトル量子化のスタート
アドレスWvctsをセットしたら、次にステップS18
で、コードブック方式圧縮部102においてベクトル量
子化を実行し、入力ベクトルとコードブック中の各コー
ドベクトルとのマッチングをとる。これにより、画像中
の各ブロック毎に入力ベクトルと類似したコードベクト
ルのコード(例えばコードブック記憶部103内のアド
レス)を出力する。ステップS19では、頻度分布生成
部104により出力コードの頻度分布を生成し、その結
果を変数Wvectorで示される頻度分布記憶部105の領
域に格納する。
【0066】次に、ステップS20で、上記格納した出
力コードの頻度分布から、コード番号が0番〜31番ま
でのベタパターンに関する頻度分布のみを取り出す。こ
のとき、頻度が高い順に上位32個のコードの頻度分布
を取り出すようにしても良い。さらに、ステップS21
で、その取り出した部分的な頻度分布から、図9に示し
たような特徴ヒストグラムを生成する。そして、ステッ
プS22でカウンタWcnt の値を1つ増やした後、ステ
ップS14の処理に戻る。
【0067】また、ステップS23では、特徴データ列
生成部701により、上記ステップS21で生成された
特徴ヒストグラムから特徴データ列を生成する。例え
ば、図示しない一時記憶メモリに格納された特徴ヒスト
グラムを頻度の大きい順にソートし、16番目の値を記
憶する。そして、上記特徴ヒストグラムを構成している
各出力コードの頻度が上記16番目の頻度より大きいか
どうかを判断し、大きい場合にはフラグ値として“1”
をセットし、小さい場合には“0”をセットする。これ
により、各出力コードの頻度を2値で表した特徴データ
列を生成する。
【0068】そして、ステップS24で、特徴データ列
比較部703は、上記のように生成された入力画像の特
徴データ列と、コードブック特徴データ列記憶部704
にあらかじめ記憶されている様々な人物画像の特徴デー
タ列とのマッチングをとり、その一致度に基づいて、上
記入力画像の人物を特定する。
【0069】例えば、32個の出力コードのうち、20
個以上の出力コードでフラグ値が一致した場合は、その
特徴データ列に対応する人物の名前をコードブック特徴
データ列記憶部704内のデータベースから読み出し
て、表示する。一方、コードブック特徴データ列記憶部
704内の何れのパターンも、一致したフラグ値の個数
が20個に満たない場合は、そのある人物について生成
された特徴データ列をデータベースに追加するととも
に、登録された人物の名前を入力してデータベースに書
き込むようにする。
【0070】以上のように、第4の実施形態によれば、
2値で表した簡単な特徴データ列のマッチングにより人
物認識を行うことができ、しかもその特徴データ列はベ
タパターンのコードに対応する32個のデータだけで構
成されているので、マッチング処理を非常に簡単かつ短
時間に行うことができ、人物認識の処理を更に短時間で
行うことができるようになる。
【0071】なお、この第4の実施形態では、ベタパタ
ーンの32個の出力コードのうち、ほぼ中間値である上
位15位を境としてフラグ値を“0”あるいは“1”に
設定するようにしたが、これに限定されるものではな
く、任意の上位n位を境としてフラグ値を設定するよう
にすることが可能である。また、32個あるベタパター
ンの中でも、特に顔の特徴をよく表しているベタパター
ンが存在するので、そのようなベタパターンに対して
は、コードブックスペクトルを生成する際に頻度に重み
付けをするようにしても良い。
【0072】また、上記第4の実施形態では、すべての
コードについて頻度分布を生成した後で、重要な部分の
みを取り出して特徴データ列を生成しているが、始めか
らこの重要な部分のコードについてのみ頻度分布を生成
するようにしても良い。このことは、第1〜第3の実施
形態にも適用可能である。また、以上の各実施形態で
は、入力データとして画像データを用いているが、音声
データを用いてもよく、同様にして音声認識を行うこと
が可能である。
【0073】(第5の実施形態)次に、本発明の第5の
実施形態について説明する。第5の実施形態は、人物認
識システムの更に他の構成例について説明するものであ
る。図11は、本実施形態による人物認識システムの構
成を示すブロック図である。なお、図11において、図
4および図7に示した符号と同一の符号を付したもの
は、同一の機能を有するものであるので、これについて
の詳細な説明は省略する。
【0074】図11に示すように、本実施形態のコード
スペクトル分析装置1100は、図7で説明したコード
ブック記憶部702を備え、図8に示したような基本的
なパターンのコードベクトルのみを記憶している。
【0075】また、本実施形態では、第4の実施形態と
同様に、コードブック記憶部702に記憶されている3
21パターンのコードベクトルのうち、アドレス0〜3
1に記憶されている32個のベタパターンの使用頻度に
注目する。そこで、出力コードの頻度分布生成部110
1では、この32パターンについてのみ頻度分布(コー
ドブックスペクトル)を求める。よって、頻度分布記憶
部1102は、少なくとも32パターン分の記憶領域を
有していれば良い。
【0076】コードブックスペクトル記憶部1104に
は、様々な人の顔について上記基本的なコードベクトル
を用いてコードブックスペクトルの生成を行い、それに
よって得られた複数のコードブックスペクトルがあらか
じめ格納されている。
【0077】コードブックスペクトル比較部1103
は、コードスペクトル分析装置1101で生成されたあ
る人の顔のコードブックスペクトルと、コードブックス
ペクトル記憶部1104に格納されている個々人の顔の
コードブックスペクトルとを比較し、入力画像のコード
ブックスペクトルと最もパターンの似ているものをコー
ドブックスペクトル記憶部1104から選び出し、その
アドレスを出力する。例えば、両コードブックスペクト
ルのマンハッタン距離(差分絶対値距離)を計算し、最
も距離の短いものに対応するアドレスを出力する。この
出力されたアドレスが、認識された人物を示している。
【0078】以上のように、第5の実施形態によれば、
ベタパターンの出力コードに関する32個の頻度分布だ
けで人物認識を行うことができ、かつ、第4の実施形態
のように、出力コードの頻度分布を求めた後に閾値処理
によって特徴データ列を生成するという複雑な処理をし
なくても良いので、人物認識の処理速度を更に高速化す
ることができる。また、頻度分布から求めた特徴データ
列ではなく、頻度分布そのものから人物認識を行ってい
るので、認識率を向上させることもできる。
【0079】なお、上記第5の実施形態では、1枚の入
力画像に対して1回のベクトル量子化を施した後で出力
コードの頻度分布を求めているが、ベクトル量子化を複
数回(例えば16回)繰り返して行い、それぞれの回ご
とに求めた頻度特性を加算したものを対象として人物認
識を行うようにしても良い。
【0080】また、第5の実施形態でも上記第3の実施
形態と同様に、図6に示したように認識対象人物に対す
る応答部601とコードブックスペクトルの登録・修正
部602とを設けても良い。そして、例えば、コードブ
ックスペクトル比較部1103での比較の結果求めたマ
ンハッタン距離の最小値があらかじめ設定しておいた範
囲に入っていない場合に、コードブックスペクトル記憶
部1104に該当するデータがないと判断して、コード
ブックスペクトルの登録モードに自動的に移行するよう
にしても良い。
【0081】また、上記第4、第5の実施形態では、コ
ードブック記憶部702に記憶されている321パター
ンのコードベクトルのうち、ベタパターンの使用頻度に
注目して人物画像の認識を行っているが、エッジパター
ンが多く含まれるような画像(ほとんどのブロックでエ
ッジパターンのコードベクトルが使用されるような画
像)に対しては、エッジパターンに関する頻度分布だけ
でその画像認識を行うことができる。
【0082】(その他の実施形態)上記様々な実施形態
に示した各機能ブロックおよび処理手順は、ハードウェ
アにより構成しても良いし、CPUあるいはMPU、R
OMおよびRAM等からなるマイクロコンピュータシス
テムによって構成し、その動作をROMやRAMに格納
された作業プログラムに従って実現するようにしても良
い。また、上記各機能ブロックの機能を実現するように
当該機能を実現するためのソフトウェアのプログラムを
RAMに供給し、そのプログラムに従って上記各機能ブ
ロックを動作させることによって実施したものも、本発
明の範疇に含まれる。
【0083】この場合、上記ソフトウェアのプログラム
自体が上述した各実施形態の機能を実現することにな
り、そのプログラム自体、およびそのプログラムをコン
ピュータに供給するための手段、例えばかかるプログラ
ムを格納した記録媒体は本発明を構成する。かかるプロ
グラムを記憶する記録媒体としては、上記ROMやRA
Mの他に、例えばフロッピーディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−I、CD−R、CD−RW、DVD、zip、磁気テ
ープ、あるいは不揮発性のメモリカード等を用いること
ができる。
【0084】また、コンピュータが供給されたプログラ
ムを実行することにより、上述の実施形態の機能が実現
されるだけでなく、そのプログラムがコンピュータにお
いて稼働しているOS(オペレーティングシステム)あ
るいは他のアプリケーションソフト等の共同して上述の
実施形態の機能が実現される場合にもかかるプログラム
は本発明の実施形態に含まれることは言うまでもない。
【0085】さらに、供給されたプログラムがコンピュ
ータの機能拡張ボードやコンピュータに接続された機能
拡張ユニットに備わるメモリに格納された後、そのプロ
グラムの指示に基づいてその機能拡張ボードや機能拡張
ユニットに備わるCPU等が実際の処理の一部または全
部を行い、その処理によって上述した実施形態の機能が
実現される場合にも本発明に含まれることは言うまでも
ない。
【0086】
【発明の効果】本発明は上述したように、あらかじめ用
意されたコードブックの中から、入力データより抽出さ
れる複数のベクトルに類似したコードベクトルを夫々探
し出してそれに対応するコードを出力するマッチング手
段と、マッチング手段より出力されたコード列を用いて
出力コードの頻度分布を生成する頻度分布生成手段とを
備え、入力データに対してマッチングを行った後の出力
コード列を用いて頻度分布を生成することでデータ分析
を行い、更には、この頻度分布の違いからデータ認識を
行うようにしたので、フーリエ変換に代表される周波数
変換処理などの極めて計算量の多い処理を施すことなく
入力データの分析や認識を行うことができ、入力データ
の分析・認識処理を高精度かつ短時間で行うことができ
る。
【0087】これにより、例えば人物認識や音声認識な
どのように人間とシステムとが混在するようなインター
フェイスの領域を扱うために、簡単なアルゴリズムで高
速な処理能力を持ったマン・マシンインターフェイス技
術を確立することができ、人物や音声等を高精度かつ高
速に認識できるシステムを提供することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態によるコードスペクト
ル分析装置の構成を示すブロック図である。
【図2】図1に示した頻度分布生成部の動作原理を説明
するための図である。
【図3】出力コードの使用頻度分布に基づくコードブッ
クスペクトルの例を示す図である。
【図4】本発明の第2の実施形態を示す図であり、コー
ドブックスペクトルを用いた人物認識システムの構成を
示すブロック図である。
【図5】図4に示した画像処理部の処理手順の例を示す
フローチャートである。
【図6】本発明の第3の実施形態を示す図であり、コー
ドブックスペクトルを自動的に登録・修正するようにし
た人物認識システムの構成を示すブロック図である。
【図7】本発明の第4の実施形態による人物認識システ
ムの構成を示すブロック図である。
【図8】図7のコードブック記憶部に記憶されるコード
ベクトルの例を示す図である。
【図9】本発明の第4の実施形態で用いる特徴量データ
列について説明するための図である。
【図10】本発明の第4の実施形態による人物認識シス
テムの処理手順の例を示すフローチャートである。
【図11】本発明の第5の実施形態による人物認識シス
テムの構成を示すブロック図である。
【符号の説明】
101 入力データ記憶部 102 コードブック方式圧縮部 103 コードブック記憶部 104 出力コードの頻度分布生成部 105 頻度分布記憶部 106 出力部 107 コードスペクトル分析装置 401 画像入力部 402 画像処理部 403 コードブックスペクトル比較部 404 コードブックスペクトル記憶部 601 認識対象人物に対する応答部 602 コードブックスペクトルの登録・修正部 700 コードスペクトル分析装置 701 特徴データ列生成部 702 コードブック記憶部 703 特徴データ列比較部 704 コードブック特徴データ列記憶部 1100 コードスペクトル分析装置 1101 出力コードの頻度分布生成部 1102 頻度分布記憶部 1103 コードブックスペクトル比較部 1104 コードブックスペクトル記憶部
フロントページの続き (72)発明者 小谷 光司 千葉県千葉市美浜区稲毛海岸5丁目5−2 −206 (72)発明者 中田 明良 東京都足立区加平二丁目12番5号 (72)発明者 今井 誠 宮城県仙台市青葉区荒巻字青葉(無番地) 東北大学内 (72)発明者 譽田 正宏 宮城県仙台市青葉区荒巻字青葉(無番地) 東北大学内 (72)発明者 森本 達郎 宮城県仙台市青葉区荒巻字青葉(無番地) 東北大学内 (72)発明者 米澤 岳美 宮城県仙台市青葉区荒巻字青葉(無番地) 東北大学内 (72)発明者 野沢 俊之 宮城県仙台市青葉区荒巻字青葉(無番地) 東北大学内 (72)発明者 中山 貴裕 宮城県仙台市青葉区荒巻字青葉(無番地) 東北大学内 (72)発明者 藤林 正典 宮城県仙台市青葉区荒巻字青葉(無番地) 東北大学内 (72)発明者 新田 雄久 東京都文京区本郷4丁目1番4号 株式会 社ウルトラクリーンテクノロジー開発研究 所内

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも1つ以上のデータを有するデ
    ータ列から成るベクトルを複数備えたコードブックの中
    から、入力データより抽出される複数のベクトルに類似
    したコードベクトルを夫々探し出して、それに対応する
    コードを出力するマッチング手段と、 上記マッチング手段より出力されるコード列を用いて、
    出力コードの頻度分布を生成する頻度分布生成手段とを
    備えたことを特徴とするコードブック方式によるデータ
    分析装置。
  2. 【請求項2】 上記頻度分布生成手段は、一部分のコー
    ドに対する頻度分布を生成することを特徴とする請求項
    1に記載のコードブック方式によるデータ分析装置。
  3. 【請求項3】 上記入力データは、画像データもしくは
    音声データであることを特徴とする請求項1または2に
    記載のコードブック方式によるデータ分析装置。
  4. 【請求項4】 少なくとも1つ以上のデータを有するデ
    ータ列から成るベクトルを複数備えたコードブックの中
    から、入力データより抽出される複数のベクトルに類似
    したコードベクトルを夫々探し出して、それに対応する
    コードを出力するマッチング手段と、 上記マッチング手段より出力されるコード列を用いて、
    出力コードの頻度分布を生成する頻度分布生成手段と、 少なくとも1つ以上の頻度分布の情報を記憶する頻度分
    布記憶手段と、 上記頻度分布生成手段により生成された上記入力データ
    に関する頻度分布と上記頻度分布記憶手段内の各頻度分
    布とを比較し、上記頻度分布記憶手段に記憶されている
    各頻度分布の中から、所定の比較関数によって特定され
    る頻度分布を選び出す比較手段とを備えたことを特徴と
    するコードブック方式によるデータ認識装置。
  5. 【請求項5】 上記頻度分布は、一部分のコードに対す
    る頻度分布であることを特徴とする請求項4に記載のコ
    ードブック方式によるデータ認識装置。
  6. 【請求項6】 上記コードブックは、ベクトルを構成す
    るブロック内で各要素のデータ値がある方向に徐々に変
    化する第1のパターンのコードベクトルと、上記ブロッ
    ク内で各要素のデータ値が急激に変化する第2のパター
    ンのコードベクトルとから構成され、 上記頻度分布は、上記第1のパターンに対応するコード
    の頻度分布のみであることを特徴とする請求項5に記載
    のコードブック方式によるデータ認識装置。
  7. 【請求項7】 上記比較手段による比較の結果、上記所
    定の比較関数によって選び出された頻度分布もしくはこ
    れに対応する認識情報を表示手段に表示することを特徴
    とする請求項4〜6の何れか1項に記載のコードブック
    方式によるデータ認識装置。
  8. 【請求項8】 上記比較手段による比較の結果、上記所
    定の比較関数によって選び出される頻度分布が上記頻度
    分布記憶手段内にない場合、当該生成された頻度分布を
    上記頻度分布記憶手段に登録する頻度分布登録手段を備
    えたことを特徴とする請求項4〜6の何れか1項に記載
    のコードブック方式によるデータ認識装置。
  9. 【請求項9】 上記比較手段による比較の結果、上記所
    定の比較関数によって選び出された頻度分布もしくはこ
    れに対応する認識情報を出力する応答出力手段と、 上記応答出力手段からの出力に基づくユーザの反応に応
    じて、上記比較の結果が正しいものであるかどうかを判
    断し、間違っている場合は上記頻度分布記憶手段に対し
    て上記生成された頻度分布を登録し、あるいは上記頻度
    分布記憶手段に記憶されている頻度分布に対して書き換
    えを行う頻度分布登録・修正手段とを備えたことを特徴
    とする請求項4〜6の何れか1項に記載のコードブック
    方式によるデータ認識装置。
  10. 【請求項10】 少なくとも1つ以上のデータを有する
    データ列から成るベクトルを複数備えたコードブックの
    中から、入力データより抽出される複数のベクトルに類
    似したコードベクトルを夫々探し出して、それに対応す
    るコードを出力するマッチング手段と、 上記マッチング手段より出力されるコード列を用いて、
    出力コードの頻度分布を生成する頻度分布生成手段と、 上記頻度分布生成手段により生成された出力コードの頻
    度分布に基づいて、各出力コードの頻度を2値で表した
    特徴データ列を生成する特徴データ列生成手段と、 少なくとも1つ以上の特徴データ列を記憶する特徴デー
    タ列記憶手段と、 上記特徴データ列生成手段により生成された上記入力デ
    ータに関する特徴データ列と上記特徴データ列記憶手段
    内の各特徴データ列とを比較し、上記特徴データ列記憶
    手段に記憶されている各特徴データ列の中から、所定の
    比較関数によって特定される特徴データ列を選び出す比
    較手段とを備えたことを特徴とするコードブック方式に
    よるデータ認識装置。
  11. 【請求項11】 上記特徴データ列は、一部分のコード
    に対する特徴データ列であることを特徴とする請求項1
    0に記載のコードブック方式によるデータ認識装置。
  12. 【請求項12】 上記コードブックは、ベクトルを構成
    するブロック内で各要素のデータ値がある方向に徐々に
    変化する第1のパターンのコードベクトルと、上記ブロ
    ック内で各要素のデータ値が急激に変化する第2のパタ
    ーンのコードベクトルとから構成され、 上記特徴データ列は、上記第1のパターンに対応するコ
    ードの特徴データ列のみであることを特徴とする請求項
    11に記載のコードブック方式によるデータ認識装置。
  13. 【請求項13】 上記比較手段による比較の結果、上記
    所定の比較関数によって選び出された特徴データ列もし
    くはこれに対応する認識情報を表示手段に表示すること
    を特徴とする請求項10〜12の何れか1項に記載のコ
    ードブック方式によるデータ認識装置。
  14. 【請求項14】 上記比較手段による比較の結果、上記
    所定の比較関数によって選び出される特徴データ列が上
    記特徴データ列記憶手段内にない場合、当該生成された
    特徴データ列を上記特徴データ列記憶手段に登録する特
    徴データ列登録手段を備えたことを特徴とする請求項1
    0〜12の何れか1項に記載のコードブック方式による
    データ認識装置。
  15. 【請求項15】 上記比較手段による比較の結果、上記
    所定の比較関数によって選び出された特徴データ列もし
    くはこれに対応する認識情報を出力する応答出力手段
    と、 上記応答出力手段からの出力に基づくユーザの反応に応
    じて、上記比較の結果が正しいものであるかどうかを判
    断し、間違っている場合は上記特徴データ列記憶手段に
    対して上記生成された特徴データ列を登録し、あるいは
    上記特徴データ列記憶手段に記憶されている特徴データ
    列に対して書き換えを行う特徴データ列登録・修正手段
    とを備えたことを特徴とする請求項10〜12の何れか
    1項に記載のコードブック方式によるデータ認識装置。
  16. 【請求項16】 上記入力データは、画像データもしく
    は音声データであることを特徴とする請求項4〜15の
    何れか1項に記載のコードブック方式によるデータ認識
    装置。
  17. 【請求項17】 上記入力データである画像データ中か
    ら人物の顔部分のみを抽出する画像処理手段を備え、 上記抽出した顔部分についてのみ上記出力コードの頻度
    分布を生成することを特徴とする請求項16に記載のコ
    ードブック方式によるデータ認識装置。
  18. 【請求項18】 上記マッチング手段は、上記顔部分か
    ら抽出される複数ブロックのベクトルに対して夫々マッ
    チング処理を行うことを特徴とする請求項17に記載の
    コードブック方式によるデータ認識装置。
  19. 【請求項19】 少なくとも1つ以上のデータを有する
    データ列から成るベクトルを複数備えたコードブックの
    中から、入力データより抽出される複数のベクトルに類
    似したコードベクトルを夫々探し出して、それに対応す
    るコードを出力するマッチングステップと、 上記マッチングステップで出力されたコード列を用い
    て、出力コードの頻度分布を生成する頻度分布生成ステ
    ップとを有し、 上記入力データに対して上記マッチングを行った後の出
    力コード列を用いて上記頻度分布を生成するようにした
    ことを特徴とするコードブック方式によるデータ分析方
    法。
  20. 【請求項20】 少なくとも1つ以上のデータを有する
    データ列から成るベクトルを複数備えたコードブックの
    中から、入力データより抽出される複数のベクトルに類
    似したコードベクトルを夫々探し出して、それに対応す
    るコードを出力するマッチングステップと、 上記マッチングステップで出力されたコード列を用い
    て、出力コードの頻度分布を生成する頻度分布生成ステ
    ップと、 上記頻度分布生成ステップで生成された上記入力データ
    に関する頻度分布と、頻度分布記憶部にあらかじめ記憶
    されている少なくとも1つ以上の頻度分布とを比較し、
    上記頻度分布記憶部に記憶されている各頻度分布の中か
    ら、所定の比較関数によって特定される頻度分布を選び
    出す比較ステップとを有し、 上記入力データに対して上記マッチングを行った後の出
    力コード列を用いて上記頻度分布を生成し、上記生成し
    た頻度分布に対応する頻度分布を上記頻度分布記憶部か
    ら選び出すようにしたことを特徴とするコードブック方
    式によるデータ認識方法。
  21. 【請求項21】 少なくとも1つ以上のデータを有する
    データ列から成るベクトルを複数備えたコードブックの
    中から、入力データより抽出される複数のベクトルに類
    似したコードベクトルを夫々探し出して、それに対応す
    るコードを出力するマッチングステップと、 上記マッチングステップで出力されたコード列を用い
    て、出力コードの頻度分布を生成する頻度分布生成ステ
    ップと、 上記頻度分布生成ステップで生成された出力コードの頻
    度分布に基づいて、各出力コードの頻度を2値で表した
    特徴データ列を生成する特徴データ列生成ステップと、 上記特徴データ列生成ステップで生成された上記入力デ
    ータに関する特徴データ列と、特徴データ列記憶部にあ
    らかじめ記憶されている少なくとも1つ以上の特徴デー
    タ列とを比較し、上記特徴データ列記憶部に記憶されて
    いる各特徴データ列の中から、所定の比較関数によって
    特定される特徴データ列を選び出す比較ステップとを有
    し、 上記入力データに対して上記マッチングを行った後の出
    力コード列を用いて上記頻度分布を生成するとともに、
    上記生成した頻度分布から特徴データ列を生成し、生成
    した特徴データ列に対応する特徴データ列を上記特徴デ
    ータ列記憶部から選び出すようにしたことを特徴とする
    コードブック方式によるデータ認識方法。
  22. 【請求項22】 請求項1、4、8〜10、14〜15
    の何れか1項に記載の各手段としてコンピュータを機能
    させるためのプログラムを記録したことを特徴とするコ
    ンピュータ読み取り可能な記録媒体。
  23. 【請求項23】 請求項19〜21の何れか1項に記載
    の各ステップをコンピュータに実行させるためのプログ
    ラムを記録したことを特徴とするコンピュータ読み取り
    可能な記録媒体。
  24. 【請求項24】 少なくとも1つ以上のデータを有する
    データ列から成るベクトルであって、当該ベクトルを構
    成するブロック内で各要素のデータ値がある方向に徐々
    に変化する第1のパターンのコードベクトルと、上記ブ
    ロック内で各要素のデータ値が急激に変化する第2のパ
    ターンのコードベクトルとを備えたコードブックを記憶
    するコードブック記憶手段と、 上記コードブックの中から、入力データより抽出される
    複数のベクトルに類似したコードベクトルを夫々探し出
    して、それに対応するコードを出力するマッチング手段
    と、 上記マッチング手段より出力されるコード列のうち、上
    記第1のパターンおよび上記第2のパターンの何れか一
    方に対応するコード列に対して出力コードの頻度分布を
    生成する頻度分布生成手段と、 少なくとも1つ以上の頻度分布の情報を記憶する頻度分
    布記憶手段と、 上記頻度分布生成手段により生成された上記入力データ
    に関する頻度分布と上記頻度分布記憶手段内の各頻度分
    布とを比較し、上記頻度分布記憶手段に記憶されている
    各頻度分布の中から、所定の比較関数によって特定され
    る頻度分布を選び出す比較手段とを備えたことを特徴と
    するコードブック方式によるデータ認識装置。
JP11067087A 1998-04-17 1999-03-12 コ―ドブック方式によるデ―タ分析装置および方法、デ―タ認識装置および方法、記録媒体 Pending JP2000101437A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11067087A JP2000101437A (ja) 1998-04-17 1999-03-12 コ―ドブック方式によるデ―タ分析装置および方法、デ―タ認識装置および方法、記録媒体

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP12428598 1998-04-17
JP20886398 1998-07-24
JP10-208863 1998-07-24
JP10-124285 1998-07-24
JP11067087A JP2000101437A (ja) 1998-04-17 1999-03-12 コ―ドブック方式によるデ―タ分析装置および方法、デ―タ認識装置および方法、記録媒体

Publications (1)

Publication Number Publication Date
JP2000101437A true JP2000101437A (ja) 2000-04-07

Family

ID=27299344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11067087A Pending JP2000101437A (ja) 1998-04-17 1999-03-12 コ―ドブック方式によるデ―タ分析装置および方法、デ―タ認識装置および方法、記録媒体

Country Status (1)

Country Link
JP (1) JP2000101437A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004081872A1 (ja) * 2003-03-11 2004-09-23 Tadahiro Ohmi データ分析装置およびデータ認識装置
US6996257B2 (en) 2000-12-19 2006-02-07 Matsushita Electric Industrial Co., Ltd. Method for lighting- and view -angle-invariant face description with first- and second-order eigenfeatures
JP2012108656A (ja) * 2010-11-16 2012-06-07 Nippon Hoso Kyokai <Nhk> 画像特徴量算出装置および画像特徴量算出プログラム
WO2012133028A1 (ja) * 2011-03-25 2012-10-04 株式会社ニコン 電子機器、選択方法、取得方法、電子装置、合成方法および合成プログラム
JP2012203657A (ja) * 2011-03-25 2012-10-22 Nikon Corp 電子機器及び取得方法
JP2012221401A (ja) * 2011-04-13 2012-11-12 Nikon Corp 電子機器及び選択方法
JP2012221033A (ja) * 2011-04-05 2012-11-12 Nikon Corp 電子機器及び選択方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6996257B2 (en) 2000-12-19 2006-02-07 Matsushita Electric Industrial Co., Ltd. Method for lighting- and view -angle-invariant face description with first- and second-order eigenfeatures
WO2004081872A1 (ja) * 2003-03-11 2004-09-23 Tadahiro Ohmi データ分析装置およびデータ認識装置
US7436999B2 (en) 2003-03-11 2008-10-14 Tadahiro Ohmi Data analysis device and data recognition device
JP2012108656A (ja) * 2010-11-16 2012-06-07 Nippon Hoso Kyokai <Nhk> 画像特徴量算出装置および画像特徴量算出プログラム
WO2012133028A1 (ja) * 2011-03-25 2012-10-04 株式会社ニコン 電子機器、選択方法、取得方法、電子装置、合成方法および合成プログラム
JP2012203657A (ja) * 2011-03-25 2012-10-22 Nikon Corp 電子機器及び取得方法
JP2012221033A (ja) * 2011-04-05 2012-11-12 Nikon Corp 電子機器及び選択方法
JP2012221401A (ja) * 2011-04-13 2012-11-12 Nikon Corp 電子機器及び選択方法

Similar Documents

Publication Publication Date Title
US20200160179A1 (en) Recognition system and recognition method
KR101033098B1 (ko) 실시간 얼굴 검출 장치
JP5361524B2 (ja) パターン認識システム及びパターン認識方法
US8103058B2 (en) Detecting and tracking objects in digital images
US20210406305A1 (en) Image deformation control method and device and hardware device
JP2004005457A (ja) 2次icaを利用した顔認識法及びその装置
CN114724222B (zh) 一种基于多模态的ai数字人情感分析方法
JPH09293082A (ja) 画像検索装置及び画像検索方法
JP2000101437A (ja) コ―ドブック方式によるデ―タ分析装置および方法、デ―タ認識装置および方法、記録媒体
CN112950640A (zh) 视频人像分割方法、装置、电子设备及存储介质
KR100602576B1 (ko) 얼굴 인식 방법 및 이를 이용한 인물 검색/표시 방법
JP4632830B2 (ja) 画像検索方法及び画像検索装置
JP2004272801A (ja) データ分析装置およびデータ認識装置
JP3676577B2 (ja) ベクトル量子化装置および方法、記録媒体
JP2000040966A (ja) データ圧縮装置および方法、データ伸長装置および方法、データ圧縮伸長システム、記録媒体
JP3242224B2 (ja) 手書文字認識装置
JP2004094379A (ja) 類似画像検索装置
JP2000201078A (ja) デ―タ圧縮装置および方法、デ―タ伸長装置および方法、デ―タ圧縮伸長システムおよび方法、コ―ドブックの作成方法、記録媒体
JP2000022961A (ja) ベクトル量子化で用いるコードブックの作成装置および方法、ベクトル量子化装置、記録媒体
KR101063139B1 (ko) 크기 변화, 회전, 절삭에 강인한 내용기반 영상 검색 방법 및 장치
JP2002203241A (ja) コードブック方式によるデータ認識装置、データ認識方法および記録媒体
WO2021245819A1 (ja) 学習装置、学習済みモデル生成方法、及び、記録媒体
JP2969819B2 (ja) 画像認識装置
JPH0631516Y2 (ja) エンベロ−プ近似装置
Sampat Real-time Face Detection in Full-HD Video

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060217

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20070525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080722

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081118