JP3342864B2

JP3342864B2 - 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法

Info

Publication number: JP3342864B2
Application number: JP2000277749A
Authority: JP
Inventors: 教博神内; 博司山口
Original assignee: 株式会社エントロピーソフトウェア研究所
Priority date: 2000-09-13
Filing date: 2000-09-13
Publication date: 2002-11-11
Anticipated expiration: 2020-09-13
Also published as: US7006970B2; DE60141875D1; AU766266B2; EP1189207A3; CA2357255A1; EP1189207B1; US20020055839A1; HK1045016A1; EP1189207A2; HK1045016B; JP2002091481A; CA2357255C; AU7000301A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、標準情報と入力情
報との間の類似度を検出する方法と、その類似度検出値
を用いて入力情報が標準情報であるか否かの認識あるい
は入力情報が異常であるか否かの判定を行う方法に関す
る。より詳しくは、本発明は、人間が発声する音声につ
いて標準音声と入力音声との間の類似度を検出する方法
と、その検出値を用いて音声を認識する方法に関し、ま
た、運転中の設備等が発する音や振動についての振動波
の類似度検出方法と、その類似度検出値に基づいて機械
の異常を判定する方法に関し、更に、文字や模様につい
ての画像の類似度検出方法と、その類似度検出値を用い
て画像を認識する方法にも関する。また、立体の類似度
検出方法と、その類似度検出値を用いて立体を認識する
方法に関し、更に、動画像の類似度検出方法と、その類
似度検出値を用いて動画像を認識する方法にも関する。

【０００２】

【従来の技術】人間が発声する音声をコンピュータが自
動認識する音声認識装置においては、予めコンピュータ
に登録した既知の音声を標準音声とし、新たにコンピュ
ータに入力した未知の音声を入力音声としたとき、標準
音声と入力音声との間の類似度を検出し、その類似度の
検出値により入力音声を認識する手段が装備されてい
る。

【０００３】従来の音声の類似度検出では、標準音声の
パワースペクトルなどの特徴量を成分とする標準パター
ン行列を予め登録しておき、入力音声の特徴量を成分と
する入力パターン行列を作成し、標準パターン行列と入
力パターン行列との間のユークリッド距離や角度を算出
する方法を採っている。また、従来の音声認識では、上
記ユークリッド距離や角度の算出値と任意に設定した許
容値とを比較して音声の認識を行う方法を採っている。
即ち、特徴量の種類の数と同じ次元のパターン空間を考
え、標準パターン行列の点と入力パターン行列の点との
間の直線的な距離（ユークリッド距離）や角度を表す類
似性尺度を用いて、２つのパターン行列の類似程度を数
値化し、その数値に基づいて音声の認識を行っている。

【０００４】第１の例として、図３９、図４０は、平坦
なパワースペクトル形状を持つ標準音声２０、及び、こ
の標準音声と同じエネルギーを持つがパワースペクトル
形状の特徴が異なる入力音声２１、２２、２３につい
て、標準音声２０のパワースペクトルを成分とする７行
９列の標準パターン行列２０Ａを予め登録しておき、各
入力音声２１、２２、２３のパワースペクトルを成分と
する７行９列の入力パターン行列２１Ａ、２２Ａ、２３
Ａを作成し、標準パターン行列２０Ａと各入力パターン
行列２１Ａ、２２Ａ、２３Ａとの間の類似性尺度とし
て、ユークリッド距離または角度の余弦ｅ２１、ｅ２
２、ｅ２３を算出する様子を模式的に示したものであ
る。

【０００５】ここで、各入力音声２１、２２、２３は、
変数αについて、図４０中に示されるγ、δ、ε、ζ、
η、θの関係を持っているものとする。つまり、標準音
声２０のパワースペクトル形状に対する各入力音声２
１、２２、２３のパワースペクトル形状の変化が、図４
０に示す関係で、変数αにより規定されるものとしてい
る。ユークリッド距離は標準パターン行列と入力パター
ン行列の各成分毎の差の２乗和の平方根として求めら
れ、また、角度の余弦は２つのパターン行列の各成分ご
との積の和を、標準パターン行列の各成分の２乗和の平
方根と入力パターン行列の各成分の２乗和の平方根で除
算して求められる。

【０００６】第２の例として、図４１、図４２は、パワ
ースペクトル形状に２個のピークを持つ標準音声２４、
及び、この標準音声と同じエネルギーを持つがピークの
位置が異なる入力音声２５、２６、２７について、標準
音声２４のパワースペクトルを成分とする７行９列の標
準パターン行列２４Ａを予め登録しておき、各入力音声
２５、２６、２７のパワースペクトルを成分とする７行
９列の入力パターン行列２５Ａ、２６Ａ、２７Ａを作成
し、標準パターン行列と各入力パターン行列との間の類
似性尺度として、ユークリッド距離または角度の余弦ｅ
２５、ｅ２６、ｅ２７を算出する様子を模式的に示した
ものである。

【０００７】ここで、標準音声２４、及び、各入力音声
２５、２６、２７は、変数βについて、図４２中に示さ
れるω、φの関係を持っているものとする。つまり、標
準音声２４のパワースペクトル形状に対する各入力音声
２５、２６、２７のパワースペクトル形状の変化が、図
４２に示す関係で、変数βにより規定されるものとして
いる。

【０００８】

【発明が解決しようとする課題】ところが、ユークリッ
ド距離や角度などを類似性尺度に用いた場合、パワース
ペクトル形状が異なる複数の入力音声について、標準音
声からのユークリッド距離や角度の算出値が同じになる
ことがある。このような場合には、特徴が異なる入力音
声を区別できなくなり、このことが音声の類似度検出を
不正確にする要因となっている。以下、詳しく説明す
る。

【０００９】第１の例として、図４３は、図４０におけ
る変数αの値を０から１まで増加させたときに、ユーク
リッド距離の算出値ｅ２１、ｅ２２、ｅ２３が変化する
様子を示したものである。図４４は、同じく図４０にお
ける変数αの値を０から１まで増加させたときに、角度
の余弦の算出値ｅ２１、ｅ２２、ｅ２３が変化する様子
を示したものである。

【００１０】図４３と図４４から、この例では、ユーク
リッド距離及び角度の余弦の値は常にｅ２１＝ｅ２２＝
ｅ２３であることが分かり、変数αの値が増加するにつ
れて、ユークリッド距離の値ｅ２１、ｅ２２、ｅ２３は
増加し、また、角度の余弦の値ｅ２１、ｅ２２、ｅ２３
は減少することが分かる。角度の余弦の値ｅ２１、ｅ２
２、ｅ２３が減少することは、角度の値が増加すること
である。

【００１１】ところで、一般に、白色雑音のパワースペ
クトル形状は平坦であり、音声の摩擦子音／ｓ／につい
てもそのパワースペクトル形状が平坦に近いものが多
い。ただし、摩擦子音／ｓ／については、パワースペク
トル形状が平坦に近いといっても、その形状が時間とと
もに少し変動する「スペクトル強度のゆらぎ」現象も観
測される。

【００１２】そこで、図３９、図４０において、変数α
が小さい場合について、仮に、入力音声２１、２２は摩
擦子音／ｓ／の「スペクトル強度のゆらぎ」であり、入
力音声２３は摩擦子音／ｓ／とは異なる音声であると考
えてみる。

【００１３】図４３、図４４から分かるように、入力音
声を規定する変数αの値が同じときには、標準音声２０
からのユークリッド距離や角度の値は３個の入力音声２
１、２２、２３とも同じになるため、それらの値と任意
に設定した許容値とを比較した場合、３個の入力音声が
ともに標準音声であると判定されるか、逆に、３個の入
力音声ともに標準音声でないと判定されることになり、
区別できない。

【００１４】第２の例として、図４５は、図４２におけ
る変数βの値を０から１まで増加させたときに、ユーク
リッド距離の算出値ｅ２５、ｅ２６、ｅ２７が変化する
様子を示したものである。図４６は、同じく図４２にお
ける変数βの値を０から１まで増加させたときに、角度
の余弦の算出値ｅ２５、ｅ２６、ｅ２７が変化する様子
を示したものである。

【００１５】図４５と図４６から、この例では、ユーク
リッド距離及び角度の余弦の値は常にｅ２５＝ｅ２６＝
ｅ２７であることが分かり、変数βの値が増加するにつ
れて、ユークリッド距離の値ｅ２５、ｅ２６、ｅ２７は
増加し、角度の余弦の値ｅ２５、ｅ２６、ｅ２７は減少
することが分かる。角度の余弦の値ｅ２５、ｅ２６、ｅ
２７が減少することは、角度の値が増加することであ
る。

【００１６】ところで、一般に、音声のパワースペクト
ル形状にはホルマントと呼ばれる複数のピークが観測さ
れる。ただし、音声のホルマントについては、同じ音声
であっても、パワースペクトル形状のピーク周波数が少
し変動する「周波数のずれ」現象やピーク位置が時間的
に少し変動する「時間のずれ」現象も観測される。

【００１７】そこで、図４１、図４２において、仮に、
入力音声２５は標準音声２４と同じ音声であって、その
ピークに「周波数のずれ」または「時間のずれ」が発生
したものであり、入力音声２６、２７は標準音声２４と
は異なる音声であると考えてみる。

【００１８】図４５、図４６から分かるように、標準音
声及び入力音声を規定する変数βの値が同じときには、
標準音声２４からのユークリッド距離や角度の値は３個
の入力音声２５、２６、２７とも同じになるため、それ
らの値と任意に設定した許容値とを比較した場合、３個
の入力音声がともに標準音声であると判定されるか、逆
に、３個の入力音声ともに標準音声でないと判定される
ことになり、区別できない。

【００１９】このように、従来の音声の類似度検出方法
では、音声の類似度を正確に検出することができず、音
声を認識する上で十分に満足のいく精度が得られないと
いう問題がある。

【００２０】その理由は、従来の音声の類似度検出方法
では、２つのパターン行列のユークリッド距離あるいは
角度の値を類似性尺度としているために、標準パターン
行列がなす形状と入力パターン行列がなす形状との差
を、形状距離として数値化できないからである。

【００２１】一方で、標準音声のパワースペクトルを成
分とする標準パターン行列を予め登録する場合、「スペ
クトル強度のゆらぎ」、「周波数のずれ」、「時間のず
れ」のある個々の標準音声を多数の標準パターン行列と
して登録しておく方法が考えられるが、コンピュータの
記憶容量や処理時間の問題から標準パターン行列の登録
個数には制限があるため、この方法を用いて、標準音声
の「スペクトル強度のゆらぎ」、または、標準音声の
「周波数のずれ」、または、標準音声の「時間のずれ」
と、標準音声とは異なる音声とを判別することには限界
がある。

【００２２】また、特開平１０−２５３４４４号公報
（特願平９−６１００７号：発明の名称：異常音の検出
方法及びその検出値を用いた機械の異常判定方法、並び
に、振動波の類似度検出方法及びその検出値を用いた音
声認識方法）において、標準パターンベクトル（１次
元）と入力パターンベクトル（１次元）との間の形状距
離値の算出方法について説明しているが、標準パターン
行列（２次元）と入力パターン行列（２次元）との間の
形状距離値の算出方法、並びに、標準パターン行列層
（３次元）と入力パターン行列層（３次元）との間の形
状距離値の算出方法についての説明はない。

【００２３】本発明は、上記問題を解決するためになさ
れたものであり、第１の目的は標準パターン行列と入力
パターン行列から、２つのパターン行列間の正確な形状
距離値を求めることができる音声の類似度検出方法を提
供することにある。また、本発明の第２の目的は音声の
類似度検出値から高い精度で音声認識を行うことができ
る方法を提供することにある。

【００２４】また、本発明の第３の目的は標準パターン
行列と入力パターン行列から、２つのパターン行列間の
正確な形状距離値を求めることができる振動波の類似度
検出方法を提供することにある。また、本発明の第４の
目的は振動波の類似度検出値から高い精度で機械の異常
判定を行うことができる判定方法を提供することにあ
る。

【００２５】本発明の第５の目的は標準パターン行列と
入力パターン行列から、２つのパターン行列間の正確な
形状距離値を求めることができる画像の類似度検出方法
を提供することにある。また、本発明の第６の目的は画
像の類似度検出値から高い精度で画像認識を行うことが
できる方法を提供することにある。

【００２６】本発明の第７の目的は標準パターン行列層
と入力パターン行列層から、２つのパターン行列層間の
正確な形状距離値を求めることができる立体の類似度検
出方法を提供することにある。また、本発明の第８の目
的は立体の類似度検出値から高い精度で立体認識を行う
ことができる方法を提供することにある。

【００２７】本発明の第９の目的は標準パターン行列層
と入力パターン行列層から、２つのパターン行列層間の
正確な形状距離値を求めることができる動画像の類似度
検出方法を提供することにある。また、本発明の第１０
の目的は動画像の類似度検出値から高い精度で動画像認
識を行うことができる方法を提供することにある。

【００２８】なお、本発明は、特開平１０−２５３４４
４号公報（特願平９−６１００７号）において説明され
ている形状距離値の算出方法を２次元に拡張して音声認
識、機械の異常判定、及び、画像認識に適用できるよう
にし、更に、３次元に拡張して立体認識、及び、動画像
認識に適用できるようにしたものである。

【００２９】

【課題を解決するための手段】上記の課題を解決するた
め、請求項１に係る発明は音声の類似度検出方法であ
り、（ａ）標準音声の特徴量を成分とする標準パターン
行列と、入力音声の特徴量を成分とする入力パターン行
列とを作成すること、（ｂ）パターン行列の指定成分ご
とに異なる分散の値をもつ正規分布を作成し、上記正規
分布の値を成分とする基準パターン正ベクトル及び基準
パターン負ベクトルを作成すること、（ｃ）パターン行
列の各成分について、パターン行列の指定成分と各成分
との間の長さを求め、基準パターン正ベクトル及び基準
パターン負ベクトルの中心から上記長さだけ離れた位置
に最も近い基準パターン正ベクトル及び基準パターン負
ベクトルの成分番号を算出し、入力パターン行列の成分
値が標準パターン行列の成分値より大きいとき、その差
の絶対値だけ基準パターン正ベクトルの上記成分番号の
成分値を増加させ、入力パターン行列の成分値が標準パ
ターン行列の成分値より小さいとき、その差の絶対値だ
け基準パターン負ベクトルの上記成分番号の成分値を増
加させること、（ｄ）基準パターン正ベクトルの尖度と
基準パターン負ベクトルの尖度との差の値を算出するこ
と、（ｅ）上記尖度の差の値を算出するに際し、パター
ン行列の指定成分を各成分の位置に移動しながら尖度の
差の値を求めること、（ｆ）上記尖度の差の値の２乗
和、あるいは同２乗和の平方根を、標準パターン行列と
入力パターン行列との間の形状距離値とすることを特徴
とする。

【００３０】請求項２に係る発明の音声の類似度検出方
法は、請求項１に係る発明において、前記パターン行列
の指定成分ごとに異なる分散の値をもつ正規分布に代え
て、パターン行列の指定成分ごとに異なる分散の値をも
つ矩形など任意の基準形状を作成し、上記基準形状の値
を成分とする基準パターン正ベクトル及び基準パターン
負ベクトルを作成することを特徴とする。

【００３１】また、請求項３に係る発明は音声認識方法
であり、請求項１または２に係る発明の音声の類似度検
出方法で標準音声の特徴量を成分とする標準パターン行
列と入力音声の特徴量を成分とする入力パターン行列と
の間の形状距離を求め、求めた形状距離値と任意に設定
した許容値を比較し、形状距離値が許容値を越えたとき
入力音声は標準音声でないと判定し、形状距離値が許容
値内のとき入力音声が標準音声であると判定することを
特徴とする。

【００３２】次に、請求項４に係る発明は振動波の類似
度検出方法であり、（ａ）標準振動波の特徴量を成分と
する標準パターン行列と、入力振動波の特徴量を成分と
する入力パターン行列とを作成すること、（ｂ）パター
ン行列の指定成分ごとに異なる分散の値をもつ正規分布
を作成し、上記正規分布の値を成分とする基準パターン
正ベクトル及び基準パターン負ベクトルを作成するこ
と、（ｃ）パターン行列の各成分について、パターン行
列の指定成分と各成分との間の長さを求め、基準パター
ン正ベクトル及び基準パターン負ベクトルの中心から上
記長さだけ離れた位置に最も近い基準パターン正ベクト
ル及び基準パターン負ベクトルの成分番号を算出し、入
力パターン行列の成分値が標準パターン行列の成分値よ
り大きいとき、その差の絶対値だけ基準パターン正ベク
トルの上記成分番号の成分値を増加させ、入力パターン
行列の成分値が標準パターン行列の成分値より小さいと
き、その差の絶対値だけ基準パターン負ベクトルの上記
成分番号の成分値を増加させること、（ｄ）基準パター
ン正ベクトルの尖度と基準パターン負ベクトルの尖度と
の差の値を算出すること、（ｅ）上記尖度の差の値を算
出するに際し、パターン行列の指定成分を各成分の位置
に移動しながら尖度の差の値を求めること、（ｆ）上記
尖度の差の値の２乗和、あるいは同２乗和の平方根を、
標準パターン行列と入力パターン行列との間の形状距離
値とすることを特徴とする。

【００３３】請求項５に係る発明の振動波の類似度検出
方法は、請求項４に係る発明において、前記パターン行
列の指定成分ごとに異なる分散の値をもつ正規分布に代
えて、パターン行列の指定成分ごとに異なる分散の値を
もつ矩形など任意の基準形状を作成し、上記基準形状の
値を成分とする基準パターン正ベクトル及び基準パター
ン負ベクトルを作成することを特徴とする。

【００３４】また、請求項６に係る発明は機械の異常判
定方法であり、請求項４または５に係る発明の振動波の
類似度検出方法で標準振動波の特徴量を成分とする標準
パターン行列と入力振動波の特徴量を成分とする入力パ
ターン行列との間の形状距離を求め、求めた形状距離値
と任意に設定した許容値を比較し、形状距離値が許容値
を越えたとき異常と判定し、形状距離値が許容値内のと
き正常と判定することを特徴とする。

【００３５】次に、請求項７に係る発明は画像の類似度
検出方法であり、（ａ）標準画像の特徴量を成分とする
標準パターン行列と、入力画像の特徴量を成分とする入
力パターン行列とを作成すること、（ｂ）パターン行列
の指定成分ごとに異なる分散の値をもつ正規分布を作成
し、上記正規分布の値を成分とする基準パターン正ベク
トル及び基準パターン負ベクトルを作成すること、
（ｃ）パターン行列の各成分について、パターン行列の
指定成分と各成分との間の長さを求め、基準パターン正
ベクトル及び基準パターン負ベクトルの中心から上記長
さだけ離れた位置に最も近い基準パターン正ベクトル及
び基準パターン負ベクトルの成分番号を算出し、入力パ
ターン行列の成分値が標準パターン行列の成分値より大
きいとき、その差の絶対値だけ基準パターン正ベクトル
の上記成分番号の成分値を増加させ、入力パターン行列
の成分値が標準パターン行列の成分値より小さいとき、
その差の絶対値だけ基準パターン負ベクトルの上記成分
番号の成分値を増加させること、（ｄ）基準パターン正
ベクトルの尖度と基準パターン負ベクトルの尖度との差
の値を算出すること、（ｅ）上記尖度の差の値を算出す
るに際し、パターン行列の指定成分を各成分の位置に移
動しながら尖度の差の値を求めること、（ｆ）上記尖度
の差の値の２乗和、あるいは同２乗和の平方根を、標準
パターン行列と入力パターン行列との間の形状距離値と
することを特徴とする。

【００３６】請求項８に係る発明の画像の類似度検出方
法は、請求項７に係る発明において、前記パターン行列
の指定成分ごとに異なる分散の値をもつ正規分布に代え
て、パターン行列の指定成分ごとに異なる分散の値をも
つ矩形など任意の基準形状を作成し、上記基準形状の値
を成分とする基準パターン正ベクトル及び基準パターン
負ベクトルを作成することを特徴とする。

【００３７】また、請求項９に係る発明は画像認識方法
であり、請求項７または８に係る発明の画像の類似度検
出方法で標準画像の特徴量を成分とする標準パターン行
列と入力画像の特徴量を成分とする入力パターン行列と
の間の形状距離を求め、求めた形状距離値と任意に設定
した許容値を比較し、形状距離値が許容値を越えたとき
入力画像は標準画像でないと判定し、形状距離値が許容
値内のとき入力画像が標準画像であると判定することを
特徴とする。

【００３８】次に、請求項１０に係る発明は立体の類似
度検出方法であり、（ａ）標準立体の特徴量を成分とす
る標準パターン行列層と、入力立体の特徴量を成分とす
る入力パターン行列層とを作成すること、（ｂ）パター
ン行列層の指定成分ごとに異なる分散の値をもつ正規分
布を作成し、上記正規分布の値を成分とする基準パター
ン正ベクトル及び基準パターン負ベクトルを作成するこ
と、（ｃ）パターン行列層の各成分について、パターン
行列層の指定成分と各成分との間の長さを求め、基準パ
ターン正ベクトル及び基準パターン負ベクトルの中心か
ら上記長さだけ離れた位置に最も近い基準パターン正ベ
クトル及び基準パターン負ベクトルの成分番号を算出
し、入力パターン行列層の成分値が標準パターン行列層
の成分値より大きいとき、その差の絶対値だけ基準パタ
ーン正ベクトルの上記成分番号の成分値を増加させ、入
力パターン行列層の成分値が標準パターン行列層の成分
値より小さいとき、その差の絶対値だけ基準パターン負
ベクトルの上記成分番号の成分値を増加させること、
（ｄ）基準パターン正ベクトルの尖度と基準パターン負
ベクトルの尖度との差の値を算出すること、（ｅ）上記
尖度の差の値を算出するに際し、パターン行列層の指定
成分を各成分の位置に移動しながら尖度の差の値を求め
ること、（ｆ）上記尖度の差の値の２乗和、あるいは同
２乗和の平方根を、標準パターン行列層と入力パターン
行列層との間の形状距離値とすることを特徴とする。

【００３９】請求項１１に係る発明の立体の類似度検出
方法は、請求項１０に係る発明において、前記パターン
行列層の指定成分ごとに異なる分散の値をもつ正規分布
に代えて、パターン行列層の指定成分ごとに異なる分散
の値をもつ矩形など任意の基準形状を作成し、上記基準
形状の値を成分とする基準パターン正ベクトル及び基準
パターン負ベクトルを作成することを特徴とする。

【００４０】また、請求項１２に係る発明は立体認識方
法であり、請求項１０または１１に係る発明の立体の類
似度検出方法で標準立体の特徴量を成分とする標準パタ
ーン行列層と入力立体の特徴量を成分とする入力パター
ン行列層との間の形状距離を求め、求めた形状距離値と
任意に設定した許容値を比較し、形状距離値が許容値を
越えたとき入力立体は標準立体でないと判定し、形状距
離値が許容値内のとき入力立体が標準立体であると判定
することを特徴とする。

【００４１】次に、請求項１３に係る発明は動画像の類
似度検出方法であり、（ａ）標準動画像の特徴量を成分
とする標準パターン行列層と、入力動画像の特徴量を成
分とする入力パターン行列層とを作成すること、（ｂ）
パターン行列層の指定成分ごとに異なる分散の値をもつ
正規分布を作成し、上記正規分布の値を成分とする基準
パターン正ベクトル及び基準パターン負ベクトルを作成
すること、（ｃ）パターン行列層の各成分について、パ
ターン行列層の指定成分と各成分との間の長さを求め、
基準パターン正ベクトル及び基準パターン負ベクトルの
中心から上記長さだけ離れた位置に最も近い基準パター
ン正ベクトル及び基準パターン負ベクトルの成分番号を
算出し、入力パターン行列層の成分値が標準パターン行
列層の成分値より大きいとき、その差の絶対値だけ基準
パターン正ベクトルの上記成分番号の成分値を増加さ
せ、入力パターン行列層の成分値が標準パターン行列層
の成分値より小さいとき、その差の絶対値だけ基準パタ
ーン負ベクトルの上記成分番号の成分値を増加させるこ
と、（ｄ）基準パターン正ベクトルの尖度と基準パター
ン負ベクトルの尖度との差の値を算出すること、（ｅ）
上記尖度の差の値を算出するに際し、パターン行列層の
指定成分を各成分の位置に移動しながら尖度の差の値を
求めること、（ｆ）上記尖度の差の値の２乗和、あるい
は同２乗和の平方根を、標準パターン行列層と入力パタ
ーン行列層との間の形状距離値とすることを特徴とす
る。

【００４２】請求項１４に係る発明の動画像の類似度検
出方法は、請求項１３に係る発明において、前記パター
ン行列層の指定成分ごとに異なる分散の値をもつ正規分
布に代えて、パターン行列層の指定成分ごとに異なる分
散の値をもつ矩形など任意の基準形状を作成し、上記基
準形状の値を成分とする基準パターン正ベクトル及び基
準パターン負ベクトルを作成することを特徴とする。

【００４３】また、請求項１５に係る発明は動画像認識
方法であり、請求項１３または１４に係る発明の動画像
の類似度検出方法で標準動画像の特徴量を成分とする標
準パターン行列層と入力動画像の特徴量を成分とする入
力パターン行列層との間の形状距離を求め、求めた形状
距離値と任意に設定した許容値を比較し、形状距離値が
許容値を越えたとき入力動画像は標準動画像でないと判
定し、形状距離値が許容値内のとき入力動画像が標準動
画像であると判定することを特徴とする。

【００４４】

【発明の実施の形態】以下、本発明の実施の形態を説明
する。

【００４５】［原理説明］基準形状として正規分布を用
いる場合について、本発明の原理を説明する。

【００４６】統計解析の分野において、正規分布は多く
の現象のモデルとして使われている。そこで、注目する
現象が正規分布に従っているか否かを確かめることが重
要となり、このために「尖度」という統計量が用いられ
ている。尖度値は、注目する現象が正規分布に従ってい
るときは「３」に等しく、正規分布よりも尖った分布の
ときは「３」より大きく、反対に、正規分布よりもなだ
らかな分布のときは「３」より小さくなる。このこと
は、正規分布の分散の値にかかわらず、常に成り立つ。

【００４７】そこで、標準パターン行列（或いは標準パ
ターン行列層）と入力パターン行列（或いは入力パター
ン行列層）との間の形状変化を、正規分布の値を成分と
する基準パターンベクトルの形状変化に置き換え、この
基準パターンベクトルの形状変化の大きさを尖度の変化
量として数値化することにより、標準パターン行列（或
いは標準パターン行列層）と入力パターン行列（或いは
入力パターン行列層）との類似の程度を形状距離値とし
て算出することができる。ただし、一般に、ベクトル形
状の尖度の計算式においては、ベクトルの成分値が負の
場合には定義できない。つまり、標準パターン行列（或
いは標準パターン行列層）の成分値と入力パターン行列
（或いは入力パターン行列層）の成分値のあらゆる大小
関係に対して、基準パターンベクトルの成分値が非負で
ある必要がある。

【００４８】そこで具体的には、パターン行列（或いは
パターン行列層）の指定成分ごとに異なる分散の値をも
つ正規分布を作成し、上記正規分布の値を成分とする基
準パターン正ベクトルと、同正規分布の値を成分とする
基準パターン負ベクトルを予め作成しておく。ここで、
パターン行列に係わる上記分散の値の算出方法は、正規
分布の中心線がパターン行列の指定成分の点を通り、か
つ、パターン行列が成す平面に垂直になるようにし、上
記中心線を軸として正規分布を回転したとき、正規分布
の主要部分がパターン行列全体を覆うようにするもので
ある。また、パターン行列層に係わる上記分散の値の算
出方法は、パターン行列に係わる上記分散の値の算出方
法を１次元だけ拡張する（パターン行列層に係わる上記
分散の値の算出方法について幾何学的な表現はできな
い）。そして、パターン行列（或いはパターン行列層）
の各成分について、パターン行列（或いはパターン行列
層）の指定成分と各成分との間の長さを求め、基準パタ
ーン正ベクトル及び基準パターン負ベクトルの中心から
上記長さだけ離れた位置に最も近い基準パターン正ベク
トル及び基準パターン負ベクトルの成分番号を算出し、
入力パターン行列（或いは入力パターン行列層）の成分
値が標準パターン行列（或いは標準パターン行列層）の
成分値より大きいときは、その差の絶対値だけ基準パタ
ーン正ベクトルの上記成分番号の成分値を増加させ、小
さいときは、基準パターン負ベクトルの上記成分番号の
成分値を増加させる。次に、形状変化した基準パターン
正ベクトルと基準パターン負ベクトルについてそれぞれ
の尖度を算出し、２つの尖度の差の値を求める。

【００４９】その際、正規分布の中心と標準パターン行
列及び入力パターン行列（或いは標準パターン行列層及
び入力パターン行列層）の各成分との位置関係により形
状変化した基準パターン正ベクトルと基準パターン負ベ
クトルの各尖度が異なるので、正規分布の中心をパター
ン行列（或いはパターン行列層）各成分の位置に移動し
ながら尖度の差の値を求め、これらの差の値の２乗和の
平方根、或いは、２乗和自身を標準パターン行列（或い
は標準パターン行列層）と入力パターン行列（或いは入
力パターン行列層）との間の形状距離値として検出す
る。

【００５０】このような形状距離値は、標準音声と入力
音声との間のパターン行列形状変化を正確に検出するも
のであり、標準振動波と入力振動波との間の類似度を正
確に検出するものであり、標準画像と入力画像との間の
類似度を正確に検出するものである。また、標準立体と
入力立体との間のパターン行列層形状変化を正確に検出
するものであり、標準動画像と入力動画像との間の類似
度を正確に検出するものである。

【００５１】従って、上記のように得られる形状距離値
を用いて音声認識を行うことにより、標準パターン行列
と入力パターン行列との間の形状変化を正確に検出する
ことができ、音声認識の精度を著しく向上させることが
できる。また、このような形状距離値を用いて機械の異
常判定を行うことにより、標準パターン行列と入力パタ
ーン行列との間の形状変化を正確に検出することがで
き、機械の異常検知の精度を著しく向上させることがで
きる。また、このような形状距離値を用いて画像認識を
行うことにより、標準パターン行列と入力パターン行列
との間の形状変化を正確に検出することができ、画像認
識の精度を著しく向上させることができる。また、この
ような形状距離値を用いて立体認識を行うことにより、
標準パターン行列層と入力パターン行列層との間の形状
変化を正確に検出することができ、立体認識の精度を著
しく向上させることができる。また、このような形状距
離値を用いて動画像認識を行うことにより、標準パター
ン行列層と入力パターン行列層との間の形状変化を正確
に検出することができ、動画像認識の精度を著しく向上
させることができる。

【００５２】なお、基準形状が矩形など、正規分布以外
のものであっても、上記の説明は成立する。

【００５３】［実施例］以下、本発明の実施例を添付図
面に基づいて説明する。本実施例では、２つのパターン
行列（２次元）間の類似度検出値を用いた音声認識方
法、機械の異常判定方法、画像認識方法について、更
に、２つのパターン行列層（３次元）間の類似度検出値
を用いた立体認識方法、動画像認識方法について順を追
って説明する。

【００５４】（Ｉ）音声認識方法音声の類似度検出方法及びその検出値を用いた音声認識
方法について述べる。本実施例では、音声認識を行うた
めに、音声の周波数分布の時間変化（声紋）を正規化し
て標準パターン行列と入力パターン行列とを作成し、こ
れらパターン行列間の形状変化を、正規分布の値を成分
とする基準パターンベクトルの形状変化に置き換え、こ
の基準パターンベクトルの形状変化の大きさを尖度の変
化量として数値化することにより音声の類似度を検出
し、更に、その検出値を用いて音声認識を行うものとす
る。

【００５５】図１は、音声の類似度を検出するための測
定装置の構造を示しており、１はマイクロホンである。
マイクロホン１は発声者の近傍の定位置に配置され、人
間が発声する音声を測定し、信号として出力する。マイ
クロホン１の出力信号は、それぞれが異なる通過周波数
帯域を持つ複数ｍ₁個の帯域通過フィルタ２に入力さ
れ、音声の周波数成分波が抽出されてＡＤ変換器３に入
力され、各ＡＤ変換器３において同時刻に且つ周期的に
ディジタル信号に変換されてコンピュータ等の演算装置
４に入力される。また、演算装置４は、マイクロホン１
の出力信号に基づき、以下のように音声の類似度検出処
理を行うように構成されている。ここで、ｉ₁（ｉ₁＝
１，２，・・・，ｍ₁）番目の帯域通過フィルタ２の中心周
波数はｆｉ₁に設定されており、その出力信号がｉ₁番目
のＡＤ変換器３に入力されるものとする。

【００５６】次に、図１の測定装置構造を用いて行う音
声の類似度検出処理手順について説明する。

【００５７】ただし、音声のパワースペクトルを抽出す
る方法として様々なものが考案されているが、本実施例
では、歴史的にも古く、性能が安定しているアナログ帯
域通過フィルタ群による方法を用いた場合について、処
理手順を説明する。図２は、帯域通過フィルタ２群の周
波数ゲイン特性の一例を示したものであり、音声をｉ ₁
番目の帯域通過フィルタに通すことにより、中心周波数
がｆｉ₁の帯域の周波数成分波を抽出できることが分か
る。このように、それぞれの帯域通過フィルタを構成し
ておけば、音声の周波数分布の特徴が抽出できる。

【００５８】図１に示すように、ｉ₁番目のＡＤ変換器
３の出力信号を時刻ｔの関数としてｘｉ₁（ｔ）（ｉ₁＝
１，２，・・・，ｍ₁）とした時、関数ｘｉ₁（ｔ）はｉ₁番
目の帯域通過フィルタ２を通して抽出した音声の周波数
成分波である。図３は、関数ｘｉ₁（ｔ）の一例を示し
たものである。図３に示すように、ｉ₂番目の時刻をｔ
ｉ₂（ｉ₂＝１，２，・・・，ｍ₂）として、関数ｘｉ
₁（ｔ）を各時刻ごとに区切って測定することにより音
声の周波数分布の時間変化の特徴が抽出できる。そのた
め、ｉ₁番目の周波数帯域におけるｉ₂番目の時刻のパワ
ースペクトルＰｉ₁ｉ₂は次の数１により算出できる。た
だし、数１において、関数ｘｉ₁（ｔ）の２乗和を計算
する時間長Ｔは、時間的に変化する音声の特徴が顕著に
現れるように任意に設定しておく。

【００５９】

【数１】

【００６０】本実施例では、正規化パワースペクトルを
用いる。即ち、一般に、音声の類似度検出では、音量よ
りも音質が重要な要因になることが多い。この場合は、
パワースペクトルの形状変化を検出することが重要であ
り、このためには、数１のパワースペクトルＰｉ₁ｉ₂
を全エネルギーで正規化して使用した方が都合が良い。
ｉ₁番目の周波数帯域におけるｉ₂番目の時刻の正規化パ
ワースペクトルｐｉ₁ｉ₂は、次の数２により算出でき
る。

【００６１】

【数２】

【００６２】図４（ａ）は数１により算出したパワース
ペクトルの一例を示したものであり、図４（ｂ）は同図
（ａ）のパワースペクトルを数２を用いて正規化したも
のであるが、これらから、パワースペクトルと正規化パ
ワースペクトルとは相似形であることが分かる。

【００６３】次に、標準音声の正規化パワースペクトル
ｐｉ₁ｉ₂（ｉ₁＝１，２，・・・，ｍ₁）（ｉ₂＝１，２，・・
・，ｍ₂）を成分とする標準パターン行列Ｈと、入力音声
の正規化パワースペクトルｐｉ₁ｉ₂（ｉ₁＝１，２，・・
・，ｍ₁）（ｉ₂＝１，２，・・・，ｍ₂）を成分とする入力
パターン行列Ｎを作成する。この標準パターン行列Ｈ及
び入力パターン行列Ｎを、次の数３のように表現してお
く。ただし、数３は、標準音声及び入力音声の正規化パ
ワースペクトルの形状を、パターン行列のｍ₁×ｍ₂個の
成分値で表現したものである。

【００６４】

【数３】

【００６５】また、図５（ａ）は、標準パターン行列Ｈ
を（周波数−時間）平面で表現したものであり、同図
（ｂ）は、入力パターン行列Ｎを同平面で表現したもの
である。更に、図６は、図５（ａ）、（ｂ）における同
平面の縦の長さと横の長さを１にした（周波数−時間）
正規化平面を示している。なお、本実施例では、図２に
示した帯域通過フィルタ群のそれぞれの帯域幅が異なっ
ている場合であっても、図６において、各成分の間の長
さが等間隔になるように作図するものとする。従って、
図６中に示すように、成分間の縦の長さは１／（ｍ₁−
１）、成分間の横の長さは１／（ｍ₂−１）になる。

【００６６】次の数４は、正規分布の確率密度関数の式
である。ただし、μは平均値、σ²は分散である。

【００６７】

【数４】

【００６８】図７（ａ）は、平均値μ＝０、分散σｊ₁
ｊ₂ ²としたとき、数４の正規分布のグラフ（正規曲線）
を示したものである。また、図７（ｂ）、（ｃ）におい
て正規曲線の関数値に等しい高さの棒グラフを示してい
るが、この棒グラフの高さの値を成分とする基準パター
ン正ベクトルＫｊ₁ｊ₂ ⁽⁺⁾を図７（ｂ）のように作成
し、また、同棒グラフの高さの値を成分とする基準パタ
ーン負ベクトルＫｊ₁ｊ₂ ^(-)を図７（ｃ）のように作成
し、次の数５のように表現しておく。数５は正規分布の
形状をベクトルのｍ₀個の成分値で表現したものであ
り、数３は行列（２次元）であるのに対し、数５はベク
トル（１次元）である。図７から分かるように、これら
一対の基準パターンベクトルＫｊ₁ｊ₂ ⁽⁺⁾、Ｋｊ₁ｊ₂ ^(-)
は相等なベクトルである。なお、数５中の添数ｊ₁ｊ
₂は、図６に示す点（ｊ₁，ｊ₂）に対応するものであ
り、数５中のｍ₀は数３中のｍ₁及びｍ₂と異なる任意の
自然数であってよい。

【００６９】

【数５】

【００７０】正規分布の平均値μ及び分散σｊ₁ｊ
₂ ²は、正規分布の形状の特徴をベクトルのｍ₀個の成分
値で表現できる範囲の任意の値に設定して良いが、ここ
では、平均値が基準パターンベクトル成分の中央の位置
にあり、分散が以下に述べる値に等しい場合を考える。
また、ここではｍ₀が奇数の場合を考えているが、ｍ₀が
偶数の場合にも同様の議論が成り立つ。

【００７１】図８は、平均値μ＝０、分散σ²としたと
き、数４の正規曲線を示したものであり、その尖度値は
「３」に等しい。ここで、図８中の記号（ｉ）で示すｙ
の範囲においてｆ（ｙ）の値が正規曲線の値より増加し
たとき、尖度値は「３」より大きくなり、記号（ii）で
示すｙの範囲においてｆ（ｙ）の値が正規曲線の値より
増加したとき、尖度値は「３」より小さくなる。また、
記号（ｉ）と（ii）の境界部分のｙ（ｙ＝−０．７σの
近傍、または、ｙ＝＋０．７σの近傍）において、ｆ
（ｙ）の値が正規曲線の値より増加したとき、尖度値の
変化量は少なく、尖度値は「３」に近い値になる。一
方、記号（iii)で示すｙの範囲においてｆ（ｙ）の値が
正規曲線の値より増加したとき、尖度値は「３」より大
きくなったり小さくなったりする不安定な動きになる。
このことは、正規分布の分散σ²の値にかかわらず、常
に成り立つ。

【００７２】そこで、標準パターン行列と入力パターン
行列との間の形状変化を、正規分布の値を成分とする基
準パターンベクトルの形状変化に置き換え、この基準パ
ターンベクトルの形状変化の大きさを尖度の変化量とし
て数値化するためには、−２．１σ≦ｙ≦＋２．１σの
範囲（図８中の記号（ｉ）と（ii）で示すｙの範囲）に
おいてｆ（ｙ）の値が増加するようにすれば、尖度値が
安定したものとなる。本実施例では、尖度値が「３」よ
り大きくなるｙの範囲と、「３」より小さくなるｙの範
囲が同程度の割合になるように、−１．４σ≦ｙ≦＋
１．４σの範囲を使用する。

【００７３】一方、図６において、（周波数−時間）正
規化平面上の点（ｊ₁，ｊ₂）、及び、点（ｉ₁，ｉ₂）を
示している。また、同平面上のすべての点の中で、点
（ｊ₁，ｊ₂）から最も遠い点（ｍ₁，１）も示してい
る。従って、点（ｊ₁，ｊ₂）と点（ｉ₁，ｉ₂）との間の
長さλｉ₁ｉ₂ｊ₁ｊ₂は、次の数６により算出できる。同
様に、点（ｊ₁，ｊ₂）と点（ｍ₁，１）との間の長さλ
ｍ₁１ｊ₁ｊ₂は、次の数７により算出できる。λｍ₁１ｊ
₁ｊ₂は、点（ｊ₁，ｊ₂）と各点との間の長さの最大値で
ある。

【００７４】

【数６】

【００７５】

【数７】

【００７６】図９は、図６に示す（周波数−時間）正規
化平面を３次元で表示したものである。図９において、
正規分布の中心線が点（ｊ₁，ｊ₂）を通り、かつ、（周
波数−時間）正規化平面に垂直であり、また、正規分布
のｙ軸が点（ｍ₁，１）を通る正規曲線を示している。
また、正規分布の中心線が点（ｊ₁，ｊ₂）を通り、か
つ、上記平面に垂直であり、また、正規分布のｙ軸が点
（ｉ₁，ｉ₂）を通る正規曲線も示している。ここで、こ
れら２つの正規曲線の分散σｊ₁ｊ₂ ²は、同じ値である
ものとする。従って、上記中心線を軸として正規曲線を
回転したとき、これら２つの正規曲線は一致する。

【００７７】また、図７（ａ）に示す正規曲線は、図９
に示す２つの正規曲線を重ねて２次元で表示したもので
ある。図７（ａ）において、点（ｊ₁，ｊ₂）をｙ＝０に
対応させ、点（ｍ₁，１）をｙ＝−１．４σｊ₁ｊ₂に対
応させている。従って、点（ｉ₁，ｉ₂）はｙ＝０とｙ＝
−１．４σｊ₁ｊ₂の間のｙの値に対応することになる。

【００７８】また、点（ｊ₁，ｊ₂）と点（ｍ₁，１）と
の間の長さλｍ₁１ｊ₁ｊ₂は数７より算出できるが、図
７（ａ）に示すｙ軸上の０と−１．４σｊ₁ｊ₂との間の
長さでもある。従って、次の数８より、正規分布の分散
の値が算出できる。

【００７９】

【数８】

【００８０】上記の方法により正規分布の分散の値を算
出すれば、正規分布の主要成分（数８の場合には−１．
４σ≦ｙ≦＋１．４σの範囲）が（周波数−時間）正規
化平面全体を覆うようにできる。即ち、数８より求めた
正規分布の分散の値を数４に適用することにより正規曲
線が決定され、更に、図７（ｂ）、（ｃ）、及び、数５
に適用することにより基準パターン正ベクトルＫｊ₁ｊ₂
⁽⁺⁾及び基準パターン負ベクトルＫｊ₁ｊ₂ ^(-)が作成でき
る。

【００８１】ここで、パターン行列の指定成分としてｊ
₁ｊ₂成分をｊ₁＝１〜ｍ₁、ｊ₂＝１〜ｍ₂の中の一組の値
に固定しておいた上で、パターン行列のｉ₁ｉ₂成分（ｉ
₁＝１，２，・・・，ｍ₁）（ｉ₂＝１，２，・・・，ｍ₂）のそ
れぞれについて考える。点（ｊ₁，ｊ₂）と点（ｉ₁，
ｉ₂）との間の長さλｉ₁ｉ₂ｊ₁ｊ₂は数６より算出でき
るが、図７（ａ）に示すように、λｉ₁ｉ₂ｊ₁ｊ₂は正規
分布の平均値からの偏差の値でもある。

【００８２】一方、図７（ｃ）に示すように、基準パタ
ーンベクトルの各成分番号の間の長さをΔｙｊ₁ｊ₂とし
たとき、成分番号ｉ₀（ｉ₀＝１，２，・・・，ｍ₀）に対応
する正規分布の平均値からの偏差の値Ｌｊ₁ｊ₂ｉ₀は、
次の数９により算出できる。なお、ここでは、基準パタ
ーンベクトルの各成分番号の間の長さが等間隔である場
合を考える。また、数９において（ｍ₀＋１）／２は基
準パターンベクトルの中央の成分番号である。

【００８３】

【数９】

【００８４】図７（ａ）、（ｂ）、（ｃ）に、上記λｉ
₁ｉ₂ｊ₁ｊ₂とＬｊ₁ｊ₂ｉ₀との関係を示す。同図（ａ）
において、λｉ₁ｉ₂ｊ₁ｊ₂は点（ｊ₁，ｊ₂）と点
（ｉ₁，ｉ₂）との間の長さであることを示している。ま
た、同図（ｂ）、（ｃ）において、基準パターン正ベク
トル及び基準パターン負ベクトルの中心からλｉ₁ｉ₂ｊ
₁ｊ₂だけ離れた位置に最も近い基準パターン正ベクトル
及び基準パターン負ベクトルの成分番号がｉ₀であり、
成分番号ｉ₀に対応する正規分布の平均値からの偏差の
値がＬｊ₁ｊ₂ｉ₀であることを示している。

【００８５】即ち、パターン行列のｊ₁ｊ₂成分とｉ₁ｉ₂
成分が与えられたとき、数６よりこれら２点間の長さλ
ｉ₁ｉ₂ｊ₁ｊ₂が算出され、次に、基準パターンベクトル
について成分番号ｉ₀、正規分布の平均値からの偏差の
値Ｌｊ₁ｊ₂ｉ₀、及び、成分値ｋｊ₁ｊ₂ ⁽⁺⁾ｉ₀とｋｊ₁ｊ
₂ ^(-)ｉ₀が得られることになる。

【００８６】ここで、基準パターンベクトルの成分の個
数ｍ₀を十分に大きく（Δｙｊ₁ｊ₂を十分に小さく）し
ておけば、λｉ₁ｉ₂ｊ₁ｊ₂の値とＬｊ₁ｊ₂ｉ₀の値との
間の誤差を十分に小さくすることができ、精度の高い計
算結果が得られる。また、成分番号ｉ₀と成分番号（ｍ₀
−ｉ₀+１）は正規分布の平均値に関して対称であるた
め、ｉ₀の代わりに（ｍ₀−ｉ₀+１）を用いてもよい。

【００８７】次に、標準パターン行列Ｈと入力パターン
行列Ｎとの間の形状変化を、基準パターン正ベクトルＫ
ｊ₁ｊ₂ ⁽⁺⁾及び基準パターン負ベクトルＫｊ₁ｊ₂ ^(-)の形
状変化に置き換える。即ち、パターン行列のｉ₁ｉ₂成分
（ｉ₁＝１，２，・・・，ｍ₁）（ｉ₂＝１，２，・・・，
ｍ₂）について、標準パターン行列Ｈの成分値ｈｉ₁ｉ₂
と入力パターン行列Ｎの成分値ｎｉ₁ｉ₂との間の変化量
の絶対値は｜ｎｉ₁ｉ₂−ｈｉ₁ｉ₂｜であるが、次の数１
０に示すように、ｎｉ₁ｉ₂がｈｉ₁ｉ₂より大きいとき基
準パターン正ベクトルＫｊ₁ｊ₂ ⁽⁺⁾の成分値ｋｊ₁ｊ₂ ⁽⁺⁾
ｉ₀をこの変化量の絶対値｜ｎｉ₁ｉ₂−ｈｉ₁ｉ₂｜だけ
増加させ、ｎｉ₁ｉ₂がｈｉ₁ｉ₂より小さいとき基準パタ
ーン負ベクトルＫｊ₁ｊ₂ ^(-)の成分値ｋｊ₁ｊ₂ ^(-)ｉ₀を
この変化量の絶対値｜ｎｉ₁ｉ₂−ｈｉ₁ｉ₂｜だけ増加さ
せる。

【００８８】

【数１０】

【００８９】従って、数８により正規分布の分散の値を
算出し、数１０により基準パターンベクトルの成分値ｋ
ｊ₁ｊ₂ ⁽⁺⁾ｉ₀及びｋｊ₁ｊ₂ ^(-)ｉ₀を増加させるようにす
れば、パターン行列のｊ₁ｊ₂成分とｉ₁ｉ₂成分のあらゆ
る組み合わせに対して、−１．４σ≦ｙ≦＋１．４σの
範囲においてｆ（ｙ）の値が増加するようにできる。

【００９０】次に、図１０〜図１６の模式図に示す典型
例を用いて、数１０を説明する。これら図１０〜図１６
の各（ａ）、（ｂ）は、パターン行列のｍ₁×ｍ₂個の成
分値を行列形状として図形で表現したものであり、ま
た、これら図１０〜図１６の各（ｃ）は、ベクトルのｍ
₀個の成分値をベクトル形状として図形で表現したもの
である。なお、全体のパターン行列の中で１つの成分の
パワースペクトルだけが増加した場合、数２により正規
化を行うと、その成分の正規化パワースペクトルの増加
とともに、他の成分の正規化パワースペクトルが相対的
に減少することになるが、図１０〜図１６では、表示を
簡単にし且つ理解を容易にするため、入力パターン行列
形状の着目している成分についてのみ増減を表示し、他
の成分については変化がないものとしている。また、基
準パターン負ベクトル形状は、基準パターン正ベクトル
形状との対比を容易にするため、上下を逆に表示してい
る。

【００９１】パターン行列の指定成分としてｊ₁ｊ₂成分
を図６及び図９に示す位置に固定し、正規分布の中心線
がｊ₁ｊ₂成分を通る場合について、図１０〜図１６を説
明すると下記の通りである。（１）図１０は、標準パターン行列形状と入力パターン
行列形状が等しい例を示したものである。この場合、基
準パターン正ベクトル及び基準パターン負ベクトルは共
に正規分布の形状から変化はない。（２）図１１は、標準パターン行列形状に対して入力パ
ターン行列形状のｊ₁ｊ₂成分だけがδ₁増加した例を示
したものである。この場合には、基準パターン正ベクト
ル形状の中央部分が同じ値δ₁だけ増加し、基準パター
ン負ベクトル形状に変化はない。（３）図１２は、標準パターン行列形状に対して入力パ
ターン行列形状のｊ₁ｊ₂成分だけがδ₂減少した例を示
したものである。この場合には、基準パターン正ベクト
ル形状に変化はなく、基準パターン負ベクトル形状の中
央部分が同じ値δ ₂だけ増加する。（４）図１３は、標準パターン行列形状に対して入力パ
ターン行列形状のｍ₁１成分だけがδ₃増加した例を示し
たものである。この場合には、同図（ｂ）に示すよう
に、ｊ₁ｊ₂成分とｍ₁１成分との間の長さはλｍ₁１ｊ₁
ｊ₂であり、同図（ｃ）に示すように、基準パターン正
ベクトル形状の中心からλｍ₁１ｊ₁ｊ₂だけ離れた位置
に最も近い基準パターン正ベクトル形状の成分番号は２
であり、この基準パターン正ベクトル形状の成分番号２
の成分値がδ₃だけ増加している。一方、基準パターン
負ベクトル形状に変化はない。（５）図１４は、標準パターン行列形状に対して入力パ
ターン行列形状のｍ₁１成分だけがδ₄減少した例を示し
たものである。この場合には、同図（ｂ）に示すよう
に、ｊ₁ｊ₂成分とｍ₁１成分との間の長さはλｍ₁１ｊ₁
ｊ₂であり、同図（ｃ）に示すように、基準パターン負
ベクトル形状の中心からλｍ₁１ｊ₁ｊ₂だけ離れた位置
に最も近い基準パターン負ベクトル形状の成分番号は２
であり、この基準パターン負ベクトル形状の成分番号２
の成分値がδ₄だけ増加している。一方、基準パターン
正ベクトル形状に変化はない。（６）図１５は、標準パターン行列形状に対して入力パ
ターン行列形状のｉ₁ｉ₂成分だけがδ₅増加した例を示
したものである。この場合にも、同図（ｂ）に示すよう
に、ｊ₁ｊ₂成分とｉ₁ｉ₂成分との間の長さはλｉ₁ｉ₂ｊ
₁ｊ₂であり、同図（ｃ）に示すように、基準パターン正
ベクトル形状の中心からλｉ₁ｉ₂ｊ₁ｊ₂だけ離れた位置
に最も近い基準パターン正ベクトル形状の成分番号はｉ
₀であり、この基準パターン正ベクトル形状の成分番号
ｉ₀の成分値がδ₅だけ増加している。（７）図１６は、標準パターン行列形状に対して入力パ
ターン行列形状のｉ₁ｉ₂成分だけがδ₆減少した例を示
したものである。この場合にも、同図（ｂ）に示すよう
に、ｊ₁ｊ₂成分とｉ₁ｉ₂成分との間の長さはλｉ₁ｉ₂ｊ
₁ｊ₂であり、同図（ｃ）に示すように、基準パターン負
ベクトル形状の中心からλｉ₁ｉ₂ｊ₁ｊ₂だけ離れた位置
に最も近い基準パターン負ベクトル形状の成分番号がｉ
₀であり、この基準パターン負ベクトル形状の成分番号
ｉ₀の成分値がδ₆だけ増加している。

【００９２】図１０〜図１６においては標準パターン行
列形状及び入力パターン行列形状の典型例を示したが、
通常の場合には、標準パターン行列形状に対して入力パ
ターン行列形状の殆どの部分が変化するので、数６は変
化した全ての部分について長さの計算を行い、数１０は
変化した全ての部分について形状変化の計算を行うもの
である。また、数１０は、絶対的な形状を問題にしてい
るのではなく、相対的な形状変化を問題にしているた
め、任意形状の標準パターン行列及び入力パターン行列
について適用が可能である。

【００９３】次に、数１０により形状変化した一対の基
準パターンベクトル（基準パターン正ベクトルＫｊ₁ｊ₂
⁽⁺⁾と基準パターン負ベクトルＫｊ₁ｊ₂ ^(-)）につい
て、それぞれの形状変化の大きさを、尖度の変化量とし
て数値化する。

【００９４】ここで、基準パターン正ベクトルＫｊ₁ｊ₂
⁽⁺⁾の尖度Ａｊ₁ｊ₂ ⁽⁺⁾、及び、基準パターン負ベクトル
Ｋｊ₁ｊ₂ ^(-)の尖度Ａｊ₁ｊ₂ ^(-)は、それぞれ次の数１１
により算出できる。ただし、数１１中のＬｊ₁ｊ₂ｉ
₀（ｉ₀＝１，２，・・・，ｍ₀）は、図１０に示すように、
正規分布の平均値からの偏差の値であり、数９により正
規分布の形状の特徴を表現できる範囲の任意の値に設定
しておく。

【００９５】

【数１１】

【００９６】数１１より算出される尖度の値Ａｊ₁ｊ₂
⁽⁺⁾及びＡｊ₁ｊ₂ ^(-)は、正規分布の平均値（中心）のま
わりの４次の積率と、２次の積率の２乗との比である。

【００９７】なお、正規分布に限らず、数１１より、任
意の基準形状の尖度の値を算出できる。

【００９８】前述したように、一般に、ベクトル形状の
尖度の計算式においては、ベクトルの成分値が負の場合
には定義できず、標準パターン行列の成分値と入力パタ
ーン行列の成分値のあらゆる大小関係に対して、基準パ
ターンベクトルの成分値が非負である必要がある。

【００９９】このため、初期値が同形状の基準パターン
正ベクトルＫｊ₁ｊ₂ ⁽⁺⁾及び、基準パターン負ベクトル
Ｋｊ₁ｊ₂ ^(-)を作成しておき、数１０ではそれらの成分
値の変化が非減少になるようにし、数１１においてそれ
ぞれの尖度Ａｊ₁ｊ₂ ⁽⁺⁾、Ａｊ₁ｊ₂ ^(-)を算出するように
している。

【０１００】次に、基準パターン正ベクトルの尖度Ａｊ
₁ｊ₂ ⁽⁺⁾と基準パターン負ベクトルの尖度Ａｊ₁ｊ₂ ^(-)の
２つの変化量から、尖度の差の値（Ａｊ₁ｊ₂ ⁽⁺⁾−Ａｊ₁
ｊ₂ ^(-)）を以て、標準パターン行列と入力パターン行
列の類似の程度を表す形状変化量Ｄｊ₁ｊ₂とする。

【０１０１】例えば、数５により正規分布形状に初期設
定された２つの基準パターンベクトルＫｊ₁ｊ₂ ⁽⁺⁾及び
Ｋｊ₁ｊ₂ ^(-)の尖度の値は、共に３に等しい。そのた
め、数１０により形状変化した基準パターン正ベクトル
及び基準パターン負ベクトルの尖度の変化量は、それぞ
れ｛Ａｊ₁ｊ₂ ⁽⁺⁾−３｝及び｛Ａｊ₁ｊ₂ ^(-)−３｝とな
る。即ち、正方向の変化量は｛Ａｊ₁ｊ₂ ⁽⁺⁾−３｝、ま
た負方向の変化量は｛Ａｊ₁ｊ ₂ ^(-)−３｝となり、全体
の変化量はこの差の値となる。従って、次の数１２よ
り、形状変化量Ｄｊ₁ｊ₂が算出できる。

【０１０２】

【数１２】

【０１０３】次に、図１０〜図１６に示した標準パター
ン行列形状及び入力パターン行列形状の典型例それぞれ
の場合について、数１２より算出される形状変化量Ｄｊ
₁ｊ₂が示す値について考えてみると、以下の通りであ
る。（１）図１０に示すように、標準パターン行列形状と入
力パターン行列形状が等しい場合には、Ａｊ₁ｊ₂ ⁽⁺⁾＝
３かつＡｊ₁ｊ₂ ^(-)＝３より、形状変化量Ｄｊ₁ｊ₂＝０
になる。（２）また、図１１に示すように、標準パターン行列形
状に対して入力パターン行列形状のｊ₁ｊ₂成分が増加し
た場合には、Ａｊ₁ｊ₂ ⁽⁺⁾＞３かつＡｊ₁ｊ₂ ^(-)＝３によ
り、Ｄｊ₁ｊ₂＞０となる。（３）図１２に示すように、標準パターン行列形状に対
して入力パターン行列形状のｊ₁ｊ₂成分が減少した場合
には、Ａｊ₁ｊ₂ ⁽⁺⁾＝３かつＡｊ₁ｊ₂ ^(-)＞３により、Ｄ
ｊ₁ｊ₂＜０になる。（４）一方、図１３に示すように、標準パターン行列形
状に対して入力パターン行列形状のｊ₁ｊ₂成分から遠く
離れた部分が増加した場合には、Ａｊ₁ｊ₂ ⁽⁺⁾＜３かつ
Ａｊ₁ｊ₂ ^(-)＝３により、Ｄｊ₁ｊ₂＜０となる。（５）図１４に示すように、標準パターン行列形状に対
して入力パターン行列形状のｊ₁ｊ₂成分から遠く離れた
部分が減少した場合には、Ａｊ₁ｊ₂ ⁽⁺⁾＝３かつＡｊ₁ｊ
₂ ^(-)＜３により、Ｄｊ₁ｊ₂＞０になる。（６）図１５に示すように、標準パターン行列形状に対
して入力パターン行列形状のｊ₁ｊ₂成分から中程度離れ
た部分が増加した場合には、図８における記号（ｉ）と
（ii）の境界部分のｙ（ｙ＝−０．７σの近傍、また
は、ｙ＝＋０．７σの近傍）においてｆ（ｙ）の値が正
規曲線より増加することになり尖度値の変化量が少ない
ため、Ａｊ₁ｊ₂ ⁽⁺⁾≒３かつＡｊ₁ｊ₂ ^(-)＝３により、Ｄ
ｊ₁ｊ₂≒０となる。（７）図１６に示すように、標準パターン行列形状に対
して入力パターン行列形状のｊ₁ｊ₂成分から中程度離れ
た部分が減少した場合には、図８における記号（ｉ）と
（ii）の境界部分のｙ（ｙ＝−０．７σの近傍、また
は、ｙ＝＋０．７σの近傍）においてｆ（ｙ）の値が正
規曲線より増加することになり尖度値の変化量が少ない
ため、Ａｊ₁ｊ₂ ⁽⁺⁾＝３かつＡｊ₁ｊ₂ ^(-)≒３により、Ｄ
ｊ₁ｊ₂≒０となる。

【０１０４】即ち、正規分布の中央付近（パターン行列
形状のｊ₁ｊ₂成分の近傍）において、入力音声の正規化
パワースペクトルが標準音声の正規化パワースペクトル
に対して相対的に強くなったときは、形状変化量Ｄｊ₁
ｊ₂は正の値で、かつ，相対強度に比例して増加する。
逆に、正規分布の中央付近において、入力音声の正規化
パワースペクトルが標準音声の正規化パワースペクトル
に対して相対的に弱くなったときは、形状変化量Ｄｊ₁
ｊ₂は負の値で、かつ，相対強度に比例して減少する。

【０１０５】そこで、正規分布の平均値を標準パターン
行列形状の各成分位置に順次移動させた場合について、
各位置での形状変化量を求める。図１７は標準パターン
行列形状に対して入力パターン行列形状のｉ₁ｉ₂成分だ
けが増加した例を示す。図１８は、図１７の例におい
て、正規分布の平均値が点（ｊ₁，ｊ₂）（ｊ₁＝１，
２，・・・，ｍ₁）（ｊ₂＝１，２，・・・，ｍ₂）の位置に移
動したときのそれぞれの場合について、異なる分散の値
をもつ正規分布、及び、正規分布の平均値と点（ｉ ₁，
ｉ₂）との間の長さλｉ₁ｉ₂ｊ₁ｊ₂（ｊ₁＝１，２，・・
・，ｍ₁）（ｊ₂＝１，２，・・・，ｍ₂）を示したものであ
る。また、図１９は、図１８のそれぞれの場合につい
て、基準パターン正ベクトル形状及び基準パターン負ベ
クトル形状を示したものである。

【０１０６】図１８では、点（ｊ₁，ｊ₂）（ｊ₁＝１，
２，・・・，ｍ₁）（ｊ₂＝１，２，・・・，ｍ₂）のそれぞれ
の場合について、（周波数−時間）正規化平面上のすべ
ての点の中で点（ｊ₁，ｊ₂）から最も遠い点を数７に適
用して点（ｊ₁，ｊ₂）と各点との間の長さの最大値を求
め、数８により点（ｊ₁，ｊ₂）ごとに異なる分散の値を
もつ正規分布を作成している。従って、正規分布の中心
線が点（ｊ₁，ｊ₂）を通り、かつ、上記平面に垂直にな
るようにし、上記中心線を軸として正規分布を回転した
とき、正規分布の主要部分が正規分布の平均値の位置に
かかわらず常に上記平面全体を覆うようにできる。これ
にともない、図１９では、点（ｊ₁，ｊ₂）のそれぞれの
場合に対応して、基準パターン正ベクトル形状及び基準
パターン負ベクトル形状は異なるものになっている。

【０１０７】図１７では、同図（ａ）の標準パターン行
列形状に対して、同図（ｂ）の入力パターン行列形状の
ｉ₁ｉ₂成分がδ増加しているが、図１８において、正規
分布の平均値と点（ｉ₁，ｉ₂）との間の長さλｉ₁ｉ₂ｊ
₁ｊ₂（ｊ₁＝１，２，・・・，ｍ ₁）（ｊ₂＝１，２，・・・，
ｍ₂）を示し、図１９においては、それぞれの基準パタ
ーン正ベクトル形状においてのみ、その中心からλｉ₁
ｉ₂ｊ₁ｊ₂だけ離れた位置に最も近い基準パターン正ベ
クトル形状の成分番号に対応する部分が同じ値δだけ増
加し、基準パターン負ベクトル形状に変化がないことを
示している。

【０１０８】また、正規分布の平均値が標準パターン行
列形状の中心位置から離れている場合、図１８中の記号
アで示す部分は、標準パターン行列及び入力パターン行
列の成分番号（ｉ₁＝１，２，・・・，ｍ₁）（ｉ₂＝１，
２，・・・，ｍ₂）に対応していないため、これに対応する
基準パターン正ベクトル形状においては、常に値の変化
はない。

【０１０９】ここで、数１１において、正規分布の平均
値からの偏差の値Ｌｊ₁ｊ₂ｉ₀は、２乗または４乗され
ている。一方、基準パターン正ベクトル形状及び基準パ
ターン負ベクトル形状においては、成分番号ｉ₀と成分
番号（ｍ₀−ｉ₀+１）は正規分布の平均値に関して対称
である。このため、正規分布の平均値からの偏差の値Ｌ
ｊ₁ｊ₂ｉ₀の２乗の値または４乗の値は、Ｌｊ₁ｊ₂（ｍ₀
−ｉ₀+１）の２乗の値または４乗の値に等しい。従っ
て、成分番号ｉ₀の代わりに成分番号（ｍ₀−ｉ₀+１）を
用いてもよい。

【０１１０】なお、特開平１０−２５３４４４号公報
（特願平９−６１００７号）の段落［００６６］におい
ては「図１１中の記号イで示す部分は、基準パターン正
ベクトル及び基準パターン負ベクトルの値の作成範囲外
であるため、破線で示す入力パターンベクトルの変化に
かかわらず、常に値の変化はない」としているが、本発
明においては、例えば数７及び数８により点（ｊ₁，
ｊ₂）ごとに異なる分散の値をもつ正規分布を作成し、
正規分布の主要部分が正規分布の平均値の位置にかかわ
らず常にパターン行列全体を覆うようにしたため、標準
パターン行列及び入力パターン行列のすべての成分番号
について常に値を変化させることが可能になった。これ
により、標準パターン行列と入力パターン行列との間の
形状変化のすべてが尖度の値に反映するようになり、類
似度検出性能が向上する。

【０１１１】このようにして、正規分布の平均値を標準
パターン行列形状のｊ₁ｊ₂成分（ｊ ₁＝１，２，・・・，ｍ
₁）（ｊ₂＝１，２，・・・，ｍ₂）の位置に移動させたと
きのそれぞれの場合について、前記と同様の数７，数
８、数５、数９、数６、数１０，数１１，数１２を順に
用いた処理手順により形状変化量Ｄｊ₁ｊ₂（ｊ₁＝１，
２，・・・，ｍ₁）（ｊ₂＝１，２，・・・，ｍ₂）を算出す
る。この様子が図１８及び図１９に示されている。ただ
し、図１９に示すように、数１１におけるＬｊ₁ｊ₂ｉ₀
（ｉ₀＝１，２，・・・，ｍ₀）は、移動した正規分布のそ
れぞれの平均値からの偏差の値であり、また、ｋｊ₁ｊ₂
⁽⁺⁾ｉ₀及びｋｊ₁ｊ₂ ^(-)ｉ₀（ｉ₀＝１，２，・・・，ｍ₀）
は、このＬｊ₁ｊ₂ｉ₀に対応するものである。

【０１１２】図２０は、数５〜数１２を用いて、ｍ₁×
ｍ₂個の形状変化量Ｄｊ₁ｊ₂を算出する処理手順を示し
たフローチャートである。ここでは、数３により標準パ
ターン行列Ｈ及び入力パターン行列Ｎを作成した後の処
理手順を示しており、図２０中のステップＳ３−１〜Ｓ
３−９は図２４中のステップＳ３の詳細でもある。

【０１１３】図２０において、最初のステップＳ３−１
では、ｊ₁＝１，ｊ₂＝１と初期設定しておき、次のステ
ップＳ３−２からステップＳ３−７では、ｊ₂＝ｍ₂まで
ｊ₂を１ずつ増加し、ステップＳ３−２からステップＳ
３−９では、ｊ₁＝ｍ₁までｊ ₁を１ずつ増加して形状変
化量Ｄｊ₁ｊ₂を算出するループに入る。

【０１１４】この形状変化量算出ループ内のステップＳ
３−２では、ループを回る毎に、１対の基準パターンベ
クトル（基準パターン正ベクトルＫｊ₁ｊ₂ ⁽⁺⁾と基準パ
ターン負ベクトルＫｊ₁ｊ₂ ^(-)）を数７、数８、数５、
数９を順に用いて作成する。即ち、数７により点
（ｊ₁，ｊ₂）と各点との間の長さの最大値を求め、数８
により正規分布の分散の値を算出し、数５及び数９によ
り正規分布の値を成分とする基準パターン正ベクトル及
び基準パターン負ベクトルを作成する。次に、ステップ
Ｓ３−３からステップＳ３−５では、数６、数１０、数
１１、数１２を順に用いて形状変化量Ｄｊ₁ｊ₂を算出す
る。即ち、ステップＳ３−３で、（周波数−時間）正規
化平面上の各点について、数６により点（ｊ₁，ｊ₂）と
各点との間の長さを求め、基準パターン正ベクトル及び
基準パターン負ベクトルの中心から上記長さだけ離れた
位置に最も近い基準パターン正ベクトル及び基準パター
ン負ベクトルの成分番号を算出し、数１０により基準パ
ターン正ベクトルＫｊ₁ｊ₂ ⁽⁺⁾及び基準パターン負ベク
トルＫｊ₁ｊ₂ ^(-)の形状を変化させ、ステップＳ３−４
で、数１１を用いて基準パターン正ベクトルの尖度Ａｊ
₁ｊ₂ ⁽⁺⁾及び基準パターン負ベクトルの尖度Ａｊ₁ｊ₂ ^(-)
を算出し、ステップＳ３−５で、数１２を用いて形状変
化量Ｄｊ₁ｊ₂を算出する。

【０１１５】このような処理手順により、ｊ₁ｊ₂成分
（ｊ₁＝１，２，・・・，ｍ₁）（ｊ₂＝１，２，・・・，
ｍ₂）に対応するそれぞれの場合についてｍ₁×ｍ₂個の
形状変化量Ｄｊ₁ｊ₂を算出することができる。

【０１１６】図２１は、図１７〜図１９で示した標準パ
ターン行列形状及び入力パターン行列形状について、図
２０の処理手順を用いて算出したパターン行列の成分別
形状変化量の模式図である。

【０１１７】正規分布の平均値が、図１８及び図１９の
ように標準パターン行列形状に対して入力パターン行列
形状が増加した部分と同じ位置に移動したとき、図２１
のように形状変化量は最大となり（同図中、Ｄｉ₁ｉ₂で
示す部分）、離れた位置に移動したとき負の値になるこ
とが分かる。

【０１１８】なお、特開平１０−２５３４４４号公報
（特願平９−６１００７）の段落［００７６］におい
て、［また、さらに離れた位置に移動したときは、図１
１中の記号イで示す部分が現れるため、図１３のように
形状変化量は０となる（同図中、中心周波数ｆ１の帯域
に対応するもの）。」としているが、本発明において
は、標準パターン行列及び入力パターン行列のすべての
成分番号について常に値を変化させることを可能にした
ため形状変化量が０に固定されることがなくなった。こ
れにより、標準パターン行列と入力パターン行列との間
の形状変化のすべてが尖度の値に反映するようになり、
類似度検出性能が向上する。

【０１１９】このように、形状変化量Ｄｊ₁ｊ₂、即
ち、形状変化した基準パターン正ベクトルの尖度と基準
パターン負ベクトルの尖度との差（Ａｊ₁ｊ₂ ⁽⁺⁾−Ａｊ₁
ｊ₂ ^(-) ）は、標準パターン行列形状に対して入力パター
ン行列形状が増加した部分と同じ位置に基準形状の中心
が移動した場合において、その値が増加することにな
る。

【０１２０】即ち、入力音声の正規化パワースペクトル
が、標準音声の正規化パワースペクトルに対してパター
ン行列のどの成分においてどの程度強くなっているか
を、形状変化量として検出することができる。

【０１２１】次に、上記のようにして得られたｍ₁×ｍ₂
個の形状変化量Ｄｊ₁ｊ₂（ｊ₁＝１，２，・・・，ｍ₁）
（ｊ₂＝１，２，・・・，ｍ₂）を用いて、標準パターン行
列形状と入力パターン行列形状との差を、２つのパター
ン行列間の１個の形状距離値として数値化する。

【０１２２】この形状距離値はｍ₁×ｍ₂個の形状変化量
Ｄｊ₁ｊ₂の積算であると考えられる。従って、次の数１
３より、形状距離値ｄを算出できる。

【０１２３】

【数１３】

【０１２４】数１３ではｍ₁×ｍ₂個の形状変化量Ｄｊ₁
ｊ₂の２乗和の平方根を形状距離値としているが、次の
数１４のように、ｍ₁×ｍ₂個の形状変化量Ｄｊ₁ｊ₂の２
乗和自身を形状距離値ｄとすることもできる。

【０１２５】

【数１４】

【０１２６】以上で形状距離値の算出方法を述べたが、
次に、この方法を用いて図３９、図４０に示した標準音
声２０及び入力音声２１、２２、２３について、標準パ
ターン行列２０Ａと各入力パターン行列２１Ａ、２２
Ａ、２３Ａとの間の形状距離値ｄ２１、ｄ２２，ｄ２３
を算出することを考えてみる。

【０１２７】図２２は、図４０における変数αの値を０
から１まで増加させたとき、形状距離値ｄ２１、ｄ２
２、ｄ２３が変化する様子を示したものである。この図
２２から、図３９、図４０の例では、形状距離値は常に
ｄ２１＝ｄ２２＜ｄ２３であり、αの値が増加するにつ
れて、形状距離値ｄ２１、ｄ２２、ｄ２３も増加するこ
とが分かる。

【０１２８】ここで、図３９、図４０の例で変数αが小
さい場合について、仮に、入力音声２１と入力音声２２
は摩擦子音／ｓ／の「スペクトル強度のゆらぎ」であ
り、入力音声２３は摩擦子音／ｓ／とは異なる音声であ
るとする。

【０１２９】従来は標準音声からのユークリッド距離や
角度の値を用いているため、図３９、図４０において入
力音声２１、２２、２３の変数αの値が同じときには、
図４３及び図４４に示したように、入力音声２１、２２
が標準音声であり、入力音声２３は標準音声でないこと
を判定できなかった。

【０１３０】これに対し、本発明では、入力音声２１、
２２、２３のαの値が同じときでも、図２２に２つの白
丸印５、６で示すように、標準音声からの形状距離値ｄ
２１、ｄ２２、ｄ２３と任意に設定した許容値とを比較
することにより、白丸印６の入力音声は標準音声であ
り、白丸印５の入力音声は標準音声でないと判定するこ
とができる。つまり、摩擦子音／ｓ／の入力音声２１、
２２と、摩擦子音／ｓ／とは異なる入力音声２３とを区
別できる。

【０１３１】更に、上記の形状距離値の算出方法を用い
て図４１、図４２に示した標準音声２４及び入力音声２
５、２６、２７について、標準パターン行列２４Ａと各
入力パターン行列２５Ａ、２６Ａ、２７Ａとの間の形状
距離値ｄ２５、ｄ２６、ｄ２７を算出することを考えて
みる。

【０１３２】図２３は、図４２における変数βの値を０
から１まで増加させたとき、形状距離値ｄ２５、ｄ２
６、ｄ２７が変化する様子を示したものである。この図
２３から、図４１、図４２の例では、形状距離値は常に
ｄ２５＜ｄ２６＜ｄ２７であり、βの値が増加するにつ
れて、形状距離値ｄ２５、ｄ２６、ｄ２７も増加するこ
とが分かる。

【０１３３】ここで、図４１、図４２の例で、仮に、入
力音声２５は標準音声２４と同じ音声であって、そのピ
ークに「周波数のずれ」または「時間のずれ」が発生し
たものであり、入力音声２６と入力音声２７は標準音声
２４とは異なる音声であるとする。

【０１３４】従来は標準音声からのユークリッド距離や
角度の値を用いているため、図４１、図４２において入
力音声２５、２６、２７の変数βの値が同じときには、
図４５及び図４６に示したように、入力音声２５が標準
音声であり、入力音声２６、２７は標準音声でないこと
を判定できなかった。

【０１３５】これに対し、本発明では、入力音声２５、
２６、２７のβの値が同じときでも、図２３に３つの白
丸印７、８、９で示すように、標準音声からの形状距離
値ｄ２５、ｄ２６、ｄ２７と任意に設定した許容値とを
比較することにより、白丸印９の入力音声は標準音声で
あり、白丸印７、８の入力音声は標準音声でないと判定
することができる。つまり、標準音声２４と同じ入力音
声２５と、標準音声２４とは異なる入力音声２６、２７
とを区別できる。

【０１３６】また、図４１、図４２において、標準音声
２４のピークに対する入力音声２５、２６、２７のピー
クの［周波数のずれ」または「時間のずれ」の大きさ
は、入力音声２５、２６、２７の順に大きくなってい
る。一方、図２３において、形状距離値はｄ２５＜ｄ２
６＜ｄ２７となっており、形状距離値を用いれば、これ
らピークの［周波数のずれ」または「時間のずれ」の大
きさも検出できる。

【０１３７】次に、以上で述べた音声の類似度検出方法
を用いてコンピュータが連続的に音声の類似度を検出
し、音声を認識する一例を図２４を参照して説明する。

【０１３８】図２４はコンピュータが音声を認識するた
めのフローチャートである。図２４において、ステップ
Ｓ１では標準音声から標準パターン行列を予め作成して
おく。次のステップＳ２では入力音声から入力パターン
行列を作成し、ステップＳ３では形状変化量Ｄｊ₁ｊ
₂（ｊ₁＝１，２，・・・，ｍ₁）（ｊ₂＝１，２，・・・，
ｍ₂）を算出する。ここで、ステップＳ３の形状変化量
の算出手順は、前述した図２０におけるステップＳ３−
１からステップＳ３−９により構成される。そして、ス
テップＳ４では形状距離値ｄを算出し、ステップＳ５で
は許容値と比較して判定を行う。判定の後、再び、ステ
ップＳ２からの処理を繰り返す。

【０１３９】このような処理手順により、音声を連続的
に認識することができる。形状距離値ｄが許容値を越え
たとき、ステップＳ６で入力音声は標準音声でないと判
定し、形状距離値ｄが許容値内のとき、ステップＳ７で
入力音声は標準音声であると判定する。

【０１４０】ところで、一般に、音声認識においては、
例えば／ａ／、／ｉ／、／ｕ／、／ｅ／、／ｏ／という
音声のように、入力音声が複数の音声のうちのどれであ
るかを認識することが多い。このような場合には、／ａ
／、／ｉ／、／ｕ／、／ｅ／、／ｏ／というそれぞれの
音声を別々の標準音声と考え、これらの標準音声から５
個の標準パターン行列を作成しておく。

【０１４１】次に、入力音声からは１個の入力パターン
行列を作成し、この入力パターン行列と上記５個の各標
準パターン行列との間の形状距離値を算出し、これらの
形状距離値のうちの最小値と、任意に設定した許容値と
を比較し、最小の形状距離値が許容値を越えていないと
きには、入力音声は最小の形状距離値を与える標準音声
であると判定し、越えたときには入力音声は５個の標準
音声のいずれでもないと判定する。

【０１４２】図２５は、上記の処理手順を実現するた
め、音声の類似度検出装置としてブロック図で示したも
のである。図２５において、１０はパターンベクトル生
成器、１１はパターン行列生成器、１２は比較器、１
３、１４、１５は計算器である。

【０１４３】パターンベクトル生成器１０は、正規分布
の値を成分とする基準パターン正ベクトルＫｊ₁ｊ₂ ⁽⁺⁾
及び基準パターン負ベクトルＫｊ₁ｊ₂ ^(-)を生成し、パ
ターン行列生成器１１は、標準音声の特徴量を成分とす
る標準パターン行列Ｈと、入力音声の特徴量を成分とす
る入力パターン行列Ｎとを生成する。比較器１２は、パ
ターン行列の各成分について、入力パターン行列の成分
値が標準パターン行列の成分値より大きいか否かを比較
する。計算器１３は、パターン行列の指定成分と各成分
との間の長さを求め、基準パターンベクトルの中心から
上記長さだけ離れた位置に最も近い基準パターンベクト
ルの成分番号を算出し、入力パターン行列の成分値が標
準パターン行列の成分値より大きいとき、その差の絶対
値だけ基準パターン正ベクトルＫｊ₁ｊ₂ ⁽⁺⁾の上記成分
番号の成分値を増加させ、入力パターン行列の成分値が
標準パターン行列の成分値より小さいとき、その差の絶
対値だけ基準パターン負ベクトルＫｊ₁ｊ₂ ^(-)の上記成
分番号の成分値を増加させる。計算器１４は、上記増加
手段１３により生成された基準パターン正ベクトルＫｊ
₁ｊ₂ ⁽⁺⁾の尖度と上記増加手段１３により生成された基
準パターン負ベクトルＫｊ₁ｊ₂ ^(-)の尖度との差の値を
算出する。ここで、尖度の差の値を算出するに際し、パ
ターン行列の指定成分を各成分の位置に移動しながら尖
度の差の値を求める。計算器１５は、上記尖度の差の値
の２乗和の平方根を算出することにより、標準パターン
行列と入力パターン行列の間の形状距離値ｄを得る。

【０１４４】以上要するに、図２４に示すように、標準
音声の特徴量を成分とする標準パターン行列と、入力音
声の特徴量を成分とする入力パターン行列とを作成し
（ステップＳ１〜Ｓ２）、パターン行列の指定成分ごと
に異なる分散の値をもつ基準形状を作成し、上記基準形
状の値を成分とする基準パターン正ベクトル及び基準パ
ターン負ベクトルを作成し、パターン行列の指定成分
（基準形状の中心）を標準パターン行列のｊ₁＝1 〜
ｍ₁，ｊ₂＝１〜ｍ₂各成分位置に順次合わせながら、標
準パターン行列と入力パターン行列間の形状の変化を、
基準パターン正ベクトルと基準パターン負ベクトルの形
状変化に置き換え、これら基準パターン正ベクトルと基
準パターン負ベクトルの尖度の変化量を数値化して形状
変化量Ｄｊ₁ｊ₂とし（ステップＳ３）、形状変化量Ｄｊ
₁ｊ₂（ｊ₁＝1 ，２，…，ｍ₁）（ｊ₂＝１，２，…，ｍ
₂）から標準音声と入力音声のパターン行列形状につい
ての形状距離値ｄを算出することにより（ステップＳ
４）、正確な音声の類似度検出値を得ることができる。
また、この音声類似度検出値（形状距離値ｄ）を任意に
設定した許容値と比較し（ステップＳ５）、形状距離値
ｄが許容値を越えたとき入力音声は標準音声でないと判
定し（ステップＳ６）、形状距離値ｄが許容値内のとき
入力音声は標準音声であると判定する（ステップＳ７）
ことにより、正確な音声認識結果を得ることができる。

【０１４５】（II）機械の異常判定方法次に、振動波の類似度検出方法及びその検出値を用いた
機械の異常判定方法について述べる。本実施例では、機
械の異常判定を行うために、振動波の周波数分布の時間
変化を正規化して標準パターン行列と入力パターン行列
とを作成し、これらパターン行列間の形状変化を、正規
分布の値を成分とする基準パターンベクトルの形状変化
に置き換え、この基準パターンベクトルの形状変化の大
きさを尖度の変化量として数値化することにより振動波
の類似度を検出し、更に、その検出値を用いて機械の異
常判定を行うものとする。

【０１４６】図１において、マイクロホンの代わりに、
適宜な振動センサにより機械の振動波を測定する。図１
に示すように、ｉ₁番目のＡＤ変換器３の出力信号を時
刻ｔの関数としてｘｉ₁（ｔ）（ｉ₁＝１，２，・・・，
ｍ₁）とした時、関数ｘｉ₁（ｔ）はｉ₁番目の帯域通過
フィルタ２を通して抽出した振動波の周波数成分波であ
る。また、図３において、ｉ₂番目の時刻をｔｉ₂（ｉ₂
＝１，２，・・・，ｍ₂）として、関数ｘｉ₁（ｔ）を各時
刻ごとに区切って測定することにより振動波の周波数分
布の時間変化の特徴が抽出できる。そのため、ｉ₁番目
の周波数帯域におけるｉ₂番目の時刻のパワースペクト
ルＰｉ₁ｉ₂は数１により算出できる。ただし、関数ｘｉ
₁（ｔ）の２乗和を計算する時間長Ｔは、時間的に変化
する振動波の特徴が顕著に現れるように任意に設定して
おく。

【０１４７】以上で述べた音声の類似度検出処理手順
を、上記で算出した振動波のパワースペクトルＰｉ₁ｉ₂
に適用し、機械の異常判定を行う。

【０１４８】具体的には、標準振動波の特徴量を成分と
する標準パターン行列と入力振動波の特徴量を成分とす
る入力パターン行列とを作成し、これらのパターン行列
形状変化を基準パターン正ベクトル及び基準パターン負
ベクトルの形状変化に置き換えて、この形状変化の大き
さを尖度の変化量とし、基準パターン正ベクトルと基準
パターン負ベクトルの尖度の差から、標準パターン行列
と入力パターン行列との間の形状距離値を算出し、得ら
れた形状距離値と任意に設定した許容値とを比較し、形
状距離値が許容値を越えたとき機械は異常であると判定
し、形状距離値が許容値内のとき正常であると判定す
る。

【０１４９】（III)画像認識方法次に、画像の類似度検出方法及びその検出値を用いた画
像認識方法について述べる。本実施例では、画像認識を
行うために、画像の濃度パターンを正規化して標準パタ
ーン行列と入力パターン行列とを作成し、これらパター
ン行列間の形状変化を、正規分布の値を成分とする基準
パターンベクトルの形状変化に置き換え、この基準パタ
ーンベクトルの形状変化の大きさを尖度の変化量として
数値化することにより画像の類似度を検出し、更に、そ
の検出値を用いて画像認識を行うものとする。

【０１５０】図２６は、アルファベット”Ｅ”の画像の
一例である。同図に示されるように、画像はｘ方向及び
ｙ方向をそれぞれｍ₁個及びｍ₂個に区切ったｍ₁×ｍ₂個
の画素により構成される。ここで、ｘ方向にｉ₁番目、
かつ、ｙ方向にｉ₂番目の画素における画像の濃度をＰ
ｉ₁ｉ₂とすると、正規化濃度ｐｉ₁ｉ₂は数２により算出
できる。

【０１５１】次に、標準画像の正規化濃度ｐｉ₁ｉ₂（ｉ
₁＝１，２，・・・，ｍ₁）（ｉ₂＝１，２，・・・，ｍ₂）を成
分とする標準パターン行列Ｈと、入力画像の正規化濃度
ｐｉ ₁ｉ₂（ｉ₁＝１，２，・・・，ｍ₁）（ｉ₂＝１，２，・・
・，ｍ₂）を成分とする入力パターン行列Ｎを作成する。
この標準パターン行列Ｈ及び入力パターン行列Ｎを、数
３のように表現しておく。ただし、数３は、標準画像及
び入力画像の正規化濃度の形状を、パターン行列のｍ₁
×ｍ₂個の成分値で表現したものであると読み替える。

【０１５２】また、図２７（ａ）は、標準パターン行列
Ｈを（ｘ−ｙ）平面で表現したものであり、同図（ｂ）
は、入力パターン行列Ｎを同平面で表現したものであ
る。

【０１５３】先に述べた音声の類似度検出処理手順を、
上記で作成した画像の標準パターン行列Ｈ及び入力パタ
ーン行列Ｎに適用し、画像認識を行う。

【０１５４】具体的には、標準画像の特徴量を成分とす
る標準パターン行列と入力画像の特徴量を成分とする入
力パターン行列とを作成し、これらのパターン行列形状
変化を基準パターン正ベクトル及び基準パターン負ベク
トルの形状変化に置き換えて、この形状変化の大きさを
尖度の変化量とし、基準パターン正ベクトルと基準パタ
ーン負ベクトルの尖度の差から、標準パターン行列と入
力パターン行列との間の形状距離値を算出し、得られた
形状距離値と任意に設定した許容値とを比較し、形状距
離値が許容値を越えたとき入力画像は標準画像でないと
判定し、形状距離値が許容値内のとき入力画像が標準画
像であると判定する。

【０１５５】［実験例］次に、図２８、図２９及び図３
０（ａ）、（ｂ）、（ｃ）を参照して実験例を説明す
る。図２８、図２９は、記号”＋”の濃度形状を持つ標
準画像１６、及び、この標準画像と全画素の濃度の合計
が同じであるが横線の位置が異なる入力画像１７、１
８、１９について、標準画像１６の濃度を成分とする７
行９列の標準パターン行列１６Ａを予め登録しておき、
また、各入力画像１７、１８、１９の濃度を成分とする
７行９列の入力パターン行列１７Ａ、１８Ａ、１９Ａを
作成し、標準パターン行列１６Ａと各入力パターン行列
１７Ａ、１８Ａ、１９Ａとの間の類似性尺度として、ユ
ークリッド距離または角度の余弦ｅ１７、ｅ１８、ｅ１
９、及び、本発明による形状距離ｄ１７、ｄ１８、ｄ１
９を算出する様子を模式的に示したものである。なお、
図２９では、表示を簡単にするため、標準パターン行列
Ｈ及び入力パターン行列Ｎの成分値を正規化しないで表
示している。

【０１５６】図３０（ａ）、（ｂ）、（ｃ）は、それぞ
れ実験で得られたユークリッド距離値ｅ１７、ｅ１８、
ｅ１９、角度の余弦値ｅ１７、ｅ１８、ｅ１９、及び、
形状距離値ｄ１７、ｄ１８、ｄ１９を棒グラフで示した
ものである。

【０１５７】上述の如く、図３０（ａ）、（ｂ）、
（ｃ）は同一の測定データからユークリッド距離値、角
度の余弦値、及び、形状距離値を算出し、標準画像と入
力画像との間のそれぞれの距離値を棒グラフで表したも
のであり、図３０（ａ）、（ｂ）、（ｃ）によれば、以
下のことがいえる。（１）図２８、図２９において、標準画像１６の横線に
対する入力画像１７、１８、１９の横線の「位置のず
れ」の大きさは、入力画像１７、１８、１９の順に大き
くなっている。図３０（ａ）、（ｂ）においては、ユー
クリッド距離、角度の余弦ともにｅ１７＝ｅ１８＝ｅ１
９となっており、ユークリッド距離や角度の余弦を用い
ても、これら横線の「位置のずれ」の大きさを検出でき
ない。一方、図３０（ｃ）において、形状距離はｄ１７
＜ｄ１８＜ｄ１９となっており、形状距離を用いれば、
これら横線の「位置のずれ」の大きさを検出できる。（２）図２８、図２９において、仮に、入力画像１７は
標準画像１６と同じ画像であって、その横線に「位置の
ずれ」が発生したものであり、入力画像１８と入力画像
１９は標準画像１６とは異なる画像であるとする。ここ
で、ユークリッド距離や角度の余弦を用いたとき、図３
０（ａ）、（ｂ）において許容値をどのような位置に設
定しても、入力画像１７が標準画像であり、入力画像１
８、１９は標準画像でないことを判定できない。一方、
形状距離を用いたとき、図３０（ｃ）に示す位置に許容
値を設定したならば、入力画像１７は標準画像であり、
入力画像１８、１９は標準画像でないと判定することが
できる。

【０１５８】以上の実験結果より、ユークリッド距離ま
たは角度の余弦を用いるよりも形状距離を用いる方が、
より正確に画像の類似度の検出が行えることが理解でき
る。

【０１５９】（IV）立体認識方法次に、立体の類似度検出方法及びその検出値を用いた立
体認識方法について述べる。本実施例では、立体認識を
行うために、立体の密度（単位体積の質量）パターンを
正規化して標準パターン行列層と入力パターン行列層と
を作成し、これらパターン行列層間の形状変化を、正規
分布の値を成分とする基準パターンベクトルの形状変化
に置き換え、この基準パターンベクトルの形状変化の大
きさを尖度の変化量として数値化することにより立体の
類似度を検出し、更に、その検出値を用いて立体認識を
行うものとする。

【０１６０】ここでは、先に述べた音声、振動波、画像
等、２つのパターン行列（２次元）間の類似度検出方法
を、２つのパターン行列層（３次元）間の類似度検出方
法に拡張する。

【０１６１】図３１は、立体の密度（単位体積の質量）
分布を示したものである。同図に示されるように、立体
はｘ方向、ｙ方向、ｚ方向をそれぞれｍ₁個、ｍ₂個、ｍ
₃個に区切ったｍ₁×ｍ₂×ｍ₃個の区画により構成され
る。ここで、ｘ方向にｉ₁番目、かつ、ｙ方向にｉ₂番
目、かつ、ｚ方向にｉ₃番目の区画における立体の密度
をＰｉ₁ｉ₂ｉ₃とすると、正規化密度ｐｉ₁ｉ₂ｉ₃は、数
２の代わりに、次の数１５により算出できる。

【０１６２】

【数１５】

【０１６３】次に、標準立体の正規化密度ｐｉ₁ｉ₂ｉ₃
（ｉ₁＝１，２，・・・，ｍ₁）（ｉ₂＝１，２，・・・，ｍ₂）
（ｉ₃＝１，２，・・・，ｍ₃）を成分とする標準パターン
行列層Ｈと、入力立体の正規化密度ｐｉ₁ｉ₂ｉ₃（ｉ₁＝
１，２，・・・，ｍ₁）（ｉ₂＝１，２，・・・，ｍ₂）（ｉ₃＝
１，２，・・・，ｍ₃）を成分とする入力パターン行列層Ｎ
を作成する。この標準パターン行列層Ｈ及び入力パター
ン行列層Ｎを、数３の代わりに、次の数１６、数１７の
ように表現しておく。ただし、数１６は標準立体の正規
化密度の形状を、数１７は入力立体の正規化密度の形状
を、パターン行列層のｍ₁×ｍ₂×ｍ₃個の成分値で表現
したものである。

【０１６４】

【数１６】

【０１６５】

【数１７】

【０１６６】また、図３２は、標準パターン行列層Ｈを
（ｘ−ｙ−ｚ）空間で表現したものであり、図３３は、
入力パターン行列層Ｎを同空間で表現したものである。
更に、図３４は、図３２、図３３における同空間の縦の
長さと横の長さと高さの長さを１にした（ｘ−ｙ−ｚ）
正規化空間を示している。従って、図中に示すように、
成分間の縦の長さは１／（ｍ₁−１）、成分間の横の長
さは１／（ｍ₂−１）、成分間の高さの長さは１／（ｍ₃
−１）になる。

【０１６７】図３５（ａ）は、平均値μ＝０、分散σｊ
₁ｊ₂ｊ₃ ²としたとき、数４の正規分布のグラフ（正規曲
線）を示したものである。また、図３５（ｂ）、（ｃ）
において正規曲線の関数値に等しい高さの棒グラフを示
しているが、この棒グラフの高さの値を成分とする基準
パターン正ベクトルＫｊ₁ｊ₂ｊ₃ ⁽⁺⁾を図３５（ｂ）のよ
うに作成し、また、同棒グラフの高さの値を成分とする
基準パターン負ベクトルＫｊ₁ｊ₂ｊ₃ ^(-)を図３５（ｃ）
のように作成し、数５の代わりに、次の数１８のように
表現しておく。数１８は正規分布の形状をベクトルのｍ
₀個の成分値で表現したものであり、数１６、数１７は
行列層（３次元）であるのに対し、数１８はベクトル
（１次元）である。図３５から分かるように、これら一
対の基準パターンベクトルＫｊ₁ｊ₂ｊ₃ ⁽⁺⁾、Ｋｊ₁ｊ₂ｊ
₃ ^(-)は相等なベクトルである。なお、数１８中の添数ｊ
₁ｊ₂ｊ₃は、図３４に示す点（ｊ₁，ｊ₂，ｊ₃）に対応す
るものであり、数１８中のｍ₀は数１６、数１７中の
ｍ₁、ｍ₂及びｍ₃と異なる任意の自然数であってよい。

【０１６８】

【数１８】

【０１６９】一方、図３４において、（ｘ−ｙ−ｚ）正
規化空間内の点（ｊ₁，ｊ₂，ｊ₃）、及び、点（ｉ₁，ｉ
₂，ｉ₃）を示している。また、同空間内のすべての点の
中で、点（ｊ₁，ｊ₂，ｊ₃）から最も遠い点（ｍ₁，１，
１）も示している。従って、点（ｊ₁，ｊ₂，ｊ₃）と点
（ｉ₁，ｉ₂，ｉ₃）との間の長さλｉ₁ｉ₂ｉ₃ｊ₁ｊ₂ｊ₃
は、数６の代わりに、次の数１９により算出できる。同
様に、点（ｊ₁，ｊ₂，ｊ₃）と点（ｍ₁，１，１）との間
の長さλｍ₁１１ｊ₁ｊ₂ｊ₃は、数７の代わりに、次の数
２０により算出できる。λｍ₁１１ｊ₁ｊ₂ｊ₃は、点（ｊ
₁，ｊ₂，ｊ₃）と各点との間の長さの最大値である。

【０１７０】

【数１９】

【０１７１】

【数２０】

【０１７２】また、図７（ａ）に示す正規曲線は、図９
に示す２つの正規曲線を重ねて２次元で表示したもので
あったが、図３５（ａ）に示す正規曲線は、これと同様
な考えで、図９を１次元だけ拡張したものである（これ
について幾何学的な表現はできない）。図３５（ａ）に
おいて、点（ｊ₁，ｊ₂，ｊ₃）をｙ＝０に対応させ、点
（ｍ₁，１，１）をｙ＝−１．４σｊ₁ｊ₂ｊ₃に対応させ
ている。従って、点（ｉ₁，ｉ₂，ｉ₃）はｙ＝０とｙ＝
−１．４σｊ₁ｊ₂ｊ₃の間のｙの値に対応することにな
る。

【０１７３】また、点（ｊ₁，ｊ₂，ｊ₃）と点（ｍ₁，
１，１）との間の長さλｍ₁１１ｊ₁ｊ ₂ｊ₃は数２０より
算出できるが、図３５（ａ）に示すｙ軸上の０と−１．
４σｊ ₁ｊ₂ｊ₃との間の長さでもある。従って、数８の
代わりに、次の数２１より、正規分布の分散の値が算出
できる。

【０１７４】

【数２１】

【０１７５】上記の方法により正規分布の分散の値を算
出すれば、正規分布の主要成分（数２１の場合には−
１．４σ≦ｙ≦＋１．４σの範囲）が（ｘ−ｙ−ｚ）正
規化空間全体を覆うようにできる。即ち、数２１より求
めた正規分布の分散の値を数４に適用することにより正
規曲線が決定され、更に、図３５（ｂ）、（ｃ）、及
び、数１８に適用することにより基準パターン正ベクト
ルＫｊ₁ｊ₂ｊ₃ ⁽⁺⁾及び基準パターン負ベクトルＫｊ₁ｊ₂
ｊ₃ ^(-)が作成できる。

【０１７６】ここで、パターン行列層の指定成分として
ｊ₁ｊ₂ｊ₃成分をｊ₁＝１〜ｍ₁、ｊ₂＝１〜ｍ₂、ｊ₃＝１
〜ｍ₃の中の一組の値に固定しておいた上で、パターン
行列層のｉ₁ｉ₂ｉ₃成分（ｉ₁＝１，２，・・・，ｍ₁）（ｉ
₂＝１，２，・・・，ｍ₂）（ｉ₃＝１，２，・・・，ｍ₃）のそ
れぞれについて考える。点（ｊ₁，ｊ₂，ｊ₃）と点
（ｉ₁，ｉ₂，ｉ₃）との間の長さλｉ₁ｉ₂ｉ₃ｊ₁ｊ₂ｊ₃
は数１９より算出できるが、図３５（ａ）に示すよう
に、λｉ₁ｉ₂ｉ₃ｊ₁ｊ₂ｊ₃は正規分布の平均値からの偏
差の値でもある。

【０１７７】一方、図３５（ｃ）に示すように、基準パ
ターンベクトルの各成分番号の間の長さをΔｙｊ₁ｊ₂ｊ
₃としたとき、成分番号ｉ₀（ｉ₀＝１，２，・・・，ｍ₀）
に対応する正規分布の平均値からの偏差の値Ｌｊ₁ｊ₂ｊ
₃ｉ₀は、数９の代わりに、次の数２２により算出でき
る。なお、ここでは、基準パターンベクトルの各成分番
号の間の長さが等間隔である場合を考える。また、数２
２において（ｍ₀＋１）／２は基準パターンベクトルの
中央の成分番号である。

【０１７８】

【数２２】

【０１７９】図３５（ａ）、（ｂ）、（ｃ）に、上記λ
ｉ₁ｉ₂ｉ₃ｊ₁ｊ₂ｊ₃とＬｊ₁ｊ₂ｊ₃ｉ₀との関係を示す。
同図（ａ）において、λｉ₁ｉ₂ｉ₃ｊ₁ｊ₂ｊ₃は点
（ｊ₁，ｊ ₂，ｊ₃）と点（ｉ₁，ｉ₂，ｉ₃）との間の長さ
であることを示している。また、同図（ｂ）、（ｃ）に
おいて、基準パターン正ベクトル及び基準パターン負ベ
クトルの中心からλｉ₁ｉ₂ｉ₃ｊ₁ｊ₂ｊ₃だけ離れた位置
に最も近い基準パターン正ベクトル及び基準パターン負
ベクトルの成分番号がｉ₀であり、成分番号ｉ₀に対応す
る正規分布の平均値からの偏差の値がＬｊ₁ｊ₂ｊ₃ｉ₀で
あることを示している。

【０１８０】即ち、パターン行列層のｊ₁ｊ₂ｊ₃成分と
ｉ₁ｉ₂ｉ₃成分が与えられたとき、数１９よりこれら２
点間の長さλｉ₁ｉ₂ｉ₃ｊ₁ｊ₂ｊ₃が算出され、次に、基
準パターンベクトルについて成分番号ｉ₀、正規分布の
平均値からの偏差の値Ｌｊ₁ｊ₂ｊ₃ｉ₀、及び、成分値ｋ
ｊ₁ｊ₂ｊ₃ ⁽⁺⁾ｉ₀とｋｊ₁ｊ₂ｊ₃ ^(-)ｉ₀が得られることに
なる。

【０１８１】ここで、基準パターンベクトルの成分の個
数ｍ₀を十分に大きく（Δｙｊ₁ｊ₂ｊ₃を十分に小さく）
しておけば、λｉ₁ｉ₂ｉ₃ｊ₁ｊ₂ｊ₃の値とＬｊ₁ｊ₂ｊ₃
ｉ₀の値との間の誤差を十分に小さくすることができ、
精度の高い計算結果が得られる。また、成分番号ｉ₀と
成分番号（ｍ₀−ｉ₀+１）は正規分布の平均値に関して
対称であるため、ｉ₀の代わりに（ｍ₀−ｉ₀+１）を用い
てもよい。

【０１８２】次に、標準パターン行列層Ｈと入力パター
ン行列層Ｎとの間の形状変化を、基準パターン正ベクト
ルＫｊ₁ｊ₂ｊ₃ ⁽⁺⁾及び基準パターン負ベクトルＫｊ₁ｊ₂
ｊ₃ ⁽ ^-)の形状変化に置き換える。即ち、パターン行列層
のｉ₁ｉ₂ｉ₃成分（ｉ₁＝１，２，・・・，ｍ₁）（ｉ₂＝
１，２，・・・，ｍ₂）（ｉ₃＝１，２，・・・，ｍ₃）につい
て、標準パターン行列層Ｈの成分値ｈｉ₁ｉ₂ｉ₃と入力
パターン行列層Ｎの成分値ｎｉ₁ｉ₂ｉ₃との間の変化量
の絶対値は｜ｎｉ₁ｉ₂ｉ₃−ｈｉ₁ｉ₂ｉ₃｜であるが、数
１０の代わりに，次の数２３に示すように、ｎｉ₁ｉ₂ｉ
₃がｈｉ₁ｉ₂ｉ₃より大きいとき基準パターン正ベクトル
Ｋｊ₁ｊ₂ｊ₃ ⁽⁺⁾の成分値ｋｊ₁ｊ₂ｊ₃ ⁽⁺⁾ｉ ₀をこの変化
量の絶対値｜ｎｉ₁ｉ₂ｉ₃−ｈｉ₁ｉ₂ｉ₃｜だけ増加さ
せ、ｎｉ₁ｉ₂ｉ₃がｈｉ₁ｉ₂ｉ₃より小さいとき基準パタ
ーン負ベクトルＫｊ₁ｊ₂ｊ₃ ^(-)の成分値ｋｊ₁ｊ₂ｊ₃ ^(-)
ｉ₀をこの変化量の絶対値｜ｎｉ₁ｉ₂ｉ₃−ｈｉ₁ｉ₂ｉ₃
｜だけ増加させる。

【０１８３】

【数２３】

【０１８４】従って、数２１により正規分布の分散の値
を算出し、数２３により基準パターンベクトルの成分値
ｋｊ₁ｊ₂ｊ₃ ⁽⁺⁾ｉ₀及びｋｊ₁ｊ₂ｊ₃ ^(-)ｉ₀を増加させる
ようにすれば、パターン行列層のｊ₁ｊ₂ｊ₃成分とｉ₁ｉ
₂ｉ₃成分のあらゆる組み合わせに対して、−１．４σ≦
ｙ≦＋１．４σの範囲においてｆ（ｙ）の値が増加する
ようにできる。

【０１８５】通常の場合には、標準パターン行列層形状
に対して入力パターン行列層形状の殆どの部分が変化す
るので、数１９は変化した全ての部分について長さの計
算を行い、数２３は変化した全ての部分について形状変
化の計算を行うものである。また、数２３は、絶対的な
形状を問題にしているのではなく、相対的な形状変化を
問題にしているため、任意形状の標準パターン行列層及
び入力パターン行列層について適用が可能である。

【０１８６】次に、数２３により形状変化した一対の基
準パターンベクトル（基準パターン正ベクトルＫｊ₁ｊ₂
ｊ₃ ⁽⁺⁾と基準パターン負ベクトルＫｊ₁ｊ₂ｊ₃ ^(-)）に
ついて、それぞれの形状変化の大きさを、尖度の変化量
として数値化する。

【０１８７】ここで、基準パターン正ベクトルＫｊ₁ｊ₂
ｊ₃ ⁽⁺⁾の尖度Ａｊ₁ｊ₂ｊ₃ ⁽⁺⁾、及び、基準パターン負ベ
クトルＫｊ₁ｊ₂ｊ₃ ^(-)の尖度Ａｊ₁ｊ₂ｊ₃ ^(-)は、数１１
の代わりに、それぞれ次の数２４により算出できる。た
だし、数２４中のＬｊ₁ｊ₂ｊ ₃ｉ₀（ｉ₀＝１，２，・・・，
ｍ₀）は、図１０と同様に、正規分布の平均値からの偏
差の値であり、数２２により正規分布の形状の特徴を表
現できる範囲の任意の値に設定しておく。

【０１８８】

【数２４】

【０１８９】数２４より算出される尖度の値Ａｊ₁ｊ₂ｊ
₃ ⁽⁺⁾及びＡｊ₁ｊ₂ｊ₃ ^(-)は、正規分布の平均値（中心）
のまわりの４次の積率と、２次の積率の２乗との比であ
る。

【０１９０】なお、正規分布に限らず、数２４より、任
意の基準形状の尖度の値を算出できる。

【０１９１】前述したように、一般に、ベクトル形状の
尖度の計算式においては、ベクトルの成分値が負の場合
には定義できず、標準パターン行列層の成分値と入力パ
ターン行列層の成分値のあらゆる大小関係に対して、基
準パターンベクトルの成分値が非負である必要がある。

【０１９２】このため、初期値が同形状の基準パターン
正ベクトルＫｊ₁ｊ₂ｊ₃ ⁽⁺⁾及び、基準パターン負ベクト
ルＫｊ₁ｊ₂ｊ₃ ^(-)を作成しておき、数２３ではそれらの
成分値の変化が非減少になるようにし、数２４において
それぞれの尖度Ａｊ₁ｊ₂ｊ₃ ⁽ ⁺⁾、Ａｊ₁ｊ₂ｊ₃ ^(-)を算出
するようにしている。

【０１９３】次に、基準パターン正ベクトルの尖度Ａｊ
₁ｊ₂ｊ₃ ⁽⁺⁾と基準パターン負ベクトルの尖度Ａｊ₁ｊ₂ｊ
₃ ^(-)の２つの変化量から、尖度の差の値（Ａｊ₁ｊ₂ｊ₃
⁽⁺⁾−Ａｊ₁ｊ₂ｊ₃ ^(-)）を以て、標準パターン行列層と
入力パターン行列層の類似の程度を表す形状変化量Ｄｊ
₁ｊ₂ｊ₃とする。

【０１９４】例えば、数１８により正規分布形状に初期
設定された２つの基準パターンベクトルＫｊ₁ｊ₂ｊ₃ ⁽⁺⁾
及びＫｊ₁ｊ₂ｊ₃ ^(-)の尖度の値は、共に３に等しい。そ
のため、数２３により形状変化した基準パターン正ベク
トル及び基準パターン負ベクトルの尖度の変化量は、そ
れぞれ｛Ａｊ₁ｊ₂ｊ₃ ⁽⁺⁾−３｝及び｛Ａｊ₁ｊ₂ｊ₃ ^(-)−
３｝となる。即ち、正方向の変化量は｛Ａｊ₁ｊ₂ｊ₃ ⁽⁺⁾
−３｝、また負方向の変化量は｛Ａｊ₁ｊ₂ｊ₃ ^(-)−３｝
となり、全体の変化量はこの差の値となる。従って、数
１２の代わりに、次の数２５より、形状変化量Ｄｊ₁ｊ₂
ｊ₃が算出できる。

【０１９５】

【数２５】

【０１９６】次に、数２５より算出される形状変化量Ｄ
ｊ₁ｊ₂ｊ₃が示す値について考えてみる。即ち、正規分
布の中央付近（パターン行列層形状のｊ₁ｊ₂ｊ₃成分の
近傍）において、入力立体の正規化密度が標準立体の正
規化密度に対して相対的に強くなったときは、形状変化
量Ｄｊ₁ｊ₂ｊ₃は正の値で、かつ、相対強度に比例して
増加する。逆に、正規分布の中央付近において、入力立
体の正規化密度が標準立体の正規化密度に対して相対的
に弱くなったときは、形状変化量Ｄｊ₁ｊ₂ｊ₃は負の値
で、かつ、相対強度に比例して減少する。

【０１９７】そこで、正規分布の平均値を標準パターン
行列層形状の各成分位置に順次移動させた場合につい
て、各位置での形状変化量を求める。即ち、正規分布の
平均値を標準パターン行列層形状のｊ₁ｊ₂ｊ₃成分（ｊ₁
＝１，２，・・・，ｍ₁）（ｊ₂＝１，２，・・・，ｍ₂）（ｊ
₃＝１，２，・・・，ｍ₃）の位置に移動させたときのそれ
ぞれの場合について、前記と同様の数２０、数２１、数
１８、数２２、数１９、数２３、数２４、数２５を順に
用いた処理手順により形状変化量Ｄｊ₁ｊ₂ｊ₃（ｊ₁＝
１，２，・・・，ｍ₁）（ｊ₂＝１，２，・・・，ｍ₂）（ｊ₃
＝１，２，・・・，ｍ₃）を算出する。

【０１９８】ただし、点（ｊ₁，ｊ₂，ｊ₃）（ｊ₁＝１，
２，・・・，ｍ₁）（ｊ₂＝１，２，・・・，ｍ₂）（ｊ₃＝
１，２，・・・，ｍ₃）のそれぞれの場合について、（ｘ−
ｙ−ｚ）正規化空間内のすべての点の中で点（ｊ₁，
ｊ₂，ｊ₃）から最も遠い点を数２０に適用して点
（ｊ₁，ｊ₂，ｊ₃）と各点との間の長さの最大値を求
め、数２１により点（ｊ₁，ｊ₂，ｊ₃）ごとに異なる分
散の値をもつ正規分布を作成し、上記正規分布の値を成
分とする基準パターン正ベクトルＫｊ₁ｊ₂ｊ₃ ⁽⁺⁾及び基
準パターン負ベクトルＫｊ₁ｊ₂ｊ₃ ^(-)を作成する。

【０１９９】また、数２４におけるＬｊ₁ｊ₂ｊ₃ｉ₀（ｉ
₀＝１，２，・・・，ｍ₀）は、移動した正規分布のそれぞ
れの平均値からの偏差の値であり、また、ｋｊ₁ｊ₂ｊ₃
⁽⁺⁾ｉ ₀及びｋｊ₁ｊ₂ｊ₃ ^(-)ｉ₀（ｉ₀＝１，２，・・・，
ｍ₀）は、このＬｊ₁ｊ₂ｊ₃ｉ₀に対応するものである。

【０２００】このような処理手順により、ｊ₁ｊ₂ｊ₃成
分（ｊ₁＝１，２，・・・，ｍ₁）（ｊ₂＝１，２，・・・，ｍ
₂）（ｊ₃＝１，２，・・・，ｍ₃）に対応するそれぞれの場
合についてｍ₁×ｍ₂×ｍ₃個の形状変化量Ｄｊ₁ｊ₂ｊ₃を
算出することができる。

【０２０１】このようにして算出した形状変化量Ｄｊ₁
ｊ₂ｊ₃、即ち、形状変化した基準パターン正ベクトル
の尖度と基準パターン負ベクトルの尖度との差（Ａｊ₁
ｊ₂ｊ₃ ⁽ ⁺⁾−Ａｊ₁ｊ₂ｊ₃ ^(-)）は、標準パターン行列層
形状に対して入力パターン行列層形状が増加した部分と
同じ位置に基準形状の中心が移動した場合において、そ
の値が増加することになる。

【０２０２】即ち、入力立体の正規化密度が、標準立体
の正規化密度に対してパターン行列層のどの成分におい
てどの程度強くなっているかを、形状変化量として検出
することができる。

【０２０３】次に、上記のようにして得られたｍ₁×ｍ₂
×ｍ₃個の形状変化量Ｄｊ₁ｊ₂ｊ₃（ｊ₁＝１，２，・・・，
ｍ₁）（ｊ₂＝１，２，・・・，ｍ₂）（ｊ₃＝１，２，・・・，
ｍ₃）を用いて、標準パターン行列層形状と入力パター
ン行列層形状との差を、２つのパターン行列層間の１個
の形状距離値として数値化する。

【０２０４】この形状距離値はｍ₁×ｍ₂×ｍ₃個の形状
変化量Ｄｊ₁ｊ₂ｊ₃の積算であると考えられる。従っ
て、数１３の代わりに、次の数２６より、形状距離値ｄ
を算出できる。

【０２０５】

【数２６】

【０２０６】数２６ではｍ₁×ｍ₂×ｍ₃個の形状変化量
Ｄｊ₁ｊ₂ｊ₃の２乗和の平方根を形状距離値としている
が、数１４の代わりに、次の数２７のように、ｍ₁×ｍ₂
×ｍ₃個の形状変化量Ｄｊ₁ｊ₂ｊ₃の２乗和自身を形状距
離値ｄとすることもできる。

【０２０７】

【数２７】

【０２０８】以上のようにして算出した標準パターン行
列層と入力パターン行列層との間の形状距離値を用い
て、立体認識を行う。

【０２０９】具体的には、標準立体の特徴量を成分とす
る標準パターン行列層と入力立体の特徴量を成分とする
入力パターン行列層とを作成し、これらのパターン行列
層形状変化を基準パターン正ベクトル及び基準パターン
負ベクトルの形状変化に置き換えて、この形状変化の大
きさを尖度の変化量とし、基準パターン正ベクトルと基
準パターン負ベクトルの尖度の差から、標準パターン行
列層と入力パターン行列層との間の形状距離値を算出
し、得られた形状距離値と任意に設定した許容値とを比
較し、形状距離値が許容値を越えたとき入力立体は標準
立体でないと判定し、形状距離値が許容値内のとき入力
立体が標準立体であると判定する。

【０２１０】（Ｖ）動画像認識方法動画像の類似度検出方法及びその検出値を用いた動画像
認識方法について述べる。本実施例では、動画像認識を
行うために、動画像の濃度パターンを正規化して標準パ
ターン行列層と入力パターン行列層とを作成し、これら
パターン行列層間の形状変化を、正規分布の値を成分と
する基準パターンベクトルの形状変化に置き換え、この
基準パターンベクトルの形状変化の大きさを尖度の変化
量として数値化することにより動画像の類似度を検出
し、更に、その検出値を用いて動画像認識を行うものと
する。

【０２１１】図３６は、アルファベット”Ｅ”を筆記す
るペンの動きを時間を追って撮影した動画像の一例であ
る。同図に示されるように、動画像は時間を追って撮影
したｍ₃枚の画像により構成され、各画像はｘ方向及び
ｙ方向をそれぞれｍ₁個及びｍ ₂個に区切ったｍ₁×ｍ₂個
の画素により構成される。ここで、ｘ方向にｉ₁番目、
かつ、ｙ方向にｉ₂番目、かつ、ｉ₃番目の時刻の画素に
おける動画像の濃度をＰｉ₁ｉ₂ｉ₃とすると、正規化濃
度ｐｉ₁ｉ₂ｉ₃は数１５により算出できる。

【０２１２】次に、標準動画像の正規化濃度ｐｉ₁ｉ₂ｉ
₃（ｉ₁＝１，２，・・・，ｍ₁）（ｉ₂＝１，２，・・・，
ｍ₂）（ｉ₃＝１，２，・・・，ｍ₃）を成分とする標準パタ
ーン行列層Ｈと、入力動画像の正規化濃度ｐｉ₁ｉ₂ｉ₃
（ｉ₁＝１，２，・・・，ｍ₁）（ｉ ₂＝１，２，・・・，ｍ₂）
（ｉ₃＝１，２，・・・，ｍ₃）を成分とする入力パターン
行列層Ｎを作成する。この標準パターン行列層Ｈ及び入
力パターン行列層Ｎを、数１６、数１７のように表現し
ておく。ただし、数１６、数１７はそれぞれ、標準動画
像及び入力動画像の正規化濃度の形状を、パターン行列
層のｍ₁×ｍ₂×ｍ₃個の成分値で表現したものである。

【０２１３】また、図３７は、標準パターン行列層Ｈを
（ｘ−ｙ−時間）空間で表現したものであり、図３８
は、入力パターン行列層Ｎを同空間で表現したものであ
る。

【０２１４】以上に述べた立体の類似度検出処理手順
を、上記で作成した動画像の標準パターン行列層Ｈ及び
入力パターン行列層Ｎに適用し、動画像認識を行う。

【０２１５】具体的には、標準動画像の特徴量を成分と
する標準パターン行列層と入力動画像の特徴量を成分と
する入力パターン行列層とを作成し、これらのパターン
行列層形状変化を基準パターン正ベクトル及び基準パタ
ーン負ベクトルの形状変化に置き換えて、この形状変化
の大きさを尖度の変化量とし、基準パターン正ベクトル
と基準パターン負ベクトルの尖度の差から、標準パター
ン行列層と入力パターン行列層との間の形状距離値を算
出し、得られた形状距離値と任意に設定した許容値とを
比較し、形状距離値が許容値を越えたとき入力動画像は
標準動画像でないと判定し、形状距離値が許容値内のと
き入力動画像が標準動画像であると判定する。

【０２１６】以上で、２つのパターン行列（２次元）間
の類似度検出値を用いた音声認識方法、機械の異常判定
方法、画像認識方法、また、２つのパターン行列層（３
次元）間の類似度検出値を用いた立体認識方法、動画像
認識方法のそれぞれについての説明を終わる。

【０２１７】なお、以上の各実施例は、パターン行列
（或いはパターン行列層）の指定成分ごとに異なる分散
の値をもつ正規分布を作成して、形状距離値を算出した
ものであったが、コンピュータの記憶容量の節約や処理
時間の短縮のため、パターン行列（或いはパターン行列
層）の指定成分のすべてにおいて同じ分散の値をもつ１
個の代表的な正規分布を作成して、形状距離値を算出し
ても良い。

【０２１８】この場合、パターン行列のｊ₁ｊ₂成分とｉ
₁ｉ₂成分（或いはパターン行列層のｊ₁ｊ₂ｊ₃成分とｉ₁
ｉ₂ｉ₃成分）のあらゆる組み合わせに対して、図８に示
す正規分布の−２．１σ≦ｙ≦＋２．１σの範囲（図８
中の記号（ｉ）と（ii）で示すｙの範囲）においてｆ
（ｙ）の値が増加するようにしておく。

【０２１９】また、以上の各実施例は、基準形状として
正規分布を用いて形状距離値を算出したものであった
が、基準形状として矩形など任意の形状を用いて形状距
離値を算出しても良い。

【０２２０】このことは、形状変化量Ｄｊ₁ｊ₂（或いは
形状変化量Ｄｊ₁ｊ₂ｊ₃）は基準形状の初期化時の尖度
に影響されないことが数１２（或いは数２５）から分か
ることにより、理解されよう。

【０２２１】また、以上の各実施例は、アナログ帯域通
過フィルタ群を用いて音声、または、振動波のパワース
ペクトルを抽出したものであったが、高速フーリエ変換
等を用いてパワースペクトルを抽出しても良い。

【０２２２】また、以上の各実施例は、音声、または、
振動波の特徴量としてパワースペクトルを用いて、形状
距離値を算出したものであったが、音声、または、振動
波の特徴量として複数個の線形予測係数等を用いて、形
状距離値を算出しても良い。

【０２２３】また、以上の各実施例は、立体の特徴量と
して密度を用いて、形状距離値を算出したものであった
が、立体の特徴量として３次元ＣＴ（コンピュータ断層
撮影）画像の濃度等を用いて、形状距離値を算出しても
良い。

【０２２４】更に、以上の各実施例は、音声、振動波、
画像、立体、動画像について標準パターン行列（或いは
標準パターン行列層）と入力パターン行列（或いは入力
パターン行列層）との間の形状距離値を算出したもので
あったが、一般には、平面、空間を問わず任意の図形や
模様について標準パターン行列（或いは標準パターン行
列層）と入力パターン行列（或いは入力パターン行列
層）との間の形状距離値を算出し、得られた形状距離値
を以って図形や模様の類似度検出を行うことができる。
また、この類似度検出値に基づいて図形や模様に関する
解析等、各種処理を行うことができる。

【０２２５】

【発明の効果】以上のように、この発明の音声の類似度
検出方法では、標準パターン行列と入力パターン行列と
の間の形状変化を、基準形状の値を成分とする基準パタ
ーンベクトルの形状変化に置き換え、この形状変化の大
きさを尖度の変化量として数値化し形状距離値として算
出するので、ユークリッド距離や角度など従来の類似性
尺度では区別できない音声でも、パターン行列の形状差
からこれらの区別を行うことができ、正確な音声の類似
度検出値を得ることができる。

【０２２６】また、本発明の音声認識方法では、正確な
音声の類似度検出値に基づいて音声認識を行うので、判
定の基準が信頼性の高いものとなり、音声認識の精度を
著しく向上できる利点がある。

【０２２７】更に、本発明の振動波の類似度検出方法で
は、標準パターン行列と入力パターン行列との間の形状
変化を、基準形状の値を成分とする基準パターンベクト
ルの形状変化に置き換え、この形状変化の大きさを尖度
の変化量として数値化し形状距離値として算出するの
で、ユークリッド距離や角度など従来の類似性尺度では
区別できない振動波でも、パターン行列の形状差からこ
れらの区別を行うことができ、正確な振動波の類似度検
出値を得ることができる。

【０２２８】また、本発明の機械の異常判定方法では、
正確な振動波の類似度検出値に基づいて異常の判定を行
うので、判定の基準が信頼性の高いものとなり、機械の
異常検知の精度を著しく向上できる利点がある。

【０２２９】更に、本発明の画像の類似度検出方法で
は、標準パターン行列と入力パターン行列との間の形状
変化を、基準形状の値を成分とする基準パターンベクト
ルの形状変化に置き換え、この形状変化の大きさを尖度
の変化量として数値化し形状距離値として算出するの
で、ユークリッド距離や角度など従来の類似性尺度では
区別できない画像でも、パターン行列の形状差からこれ
らの区別を行うことができ、正確な画像の類似度検出値
を得ることができる。

【０２３０】また、本発明の画像認識方法では、正確な
画像の類似度検出値に基づいて画像認識を行うので、判
定の基準が信頼性の高いものとなり、画像認識の精度を
著しく向上できる利点がある。

【０２３１】更に、本発明の立体の類似度検出方法で
は、標準パターン行列層と入力パターン行列層との間の
形状変化を、基準形状の値を成分とする基準パターンベ
クトルの形状変化に置き換え、この形状変化の大きさを
尖度の変化量として数値化し形状距離値として算出する
ので、ユークリッド距離や角度など従来の類似性尺度で
は区別できない立体でも、パターン行列層の形状差から
これらの区別を行うことができ、正確な立体の類似度検
出値を得ることができる。

【０２３２】また、本発明の立体認識方法では、正確な
立体の類似度検出値に基づいて立体認識を行うので、判
定の基準が信頼性の高いものとなり、立体認識の精度を
著しく向上できる利点がある。

【０２３３】更に、本発明の動画像の類似度検出方法で
は、標準パターン行列層と入力パターン行列層との間の
形状変化を、基準形状の値を成分とする基準パターンベ
クトルの形状変化に置き換え、この形状変化の大きさを
尖度の変化量として数値化し形状距離値として算出する
ので、ユークリッド距離や角度など従来の類似性尺度で
は区別できない動画像でも、パターン行列層の形状差か
らこれらの区別を行うことができ、正確な動画像の類似
度検出値を得ることができる。

【０２３４】また、本発明の動画像認識方法では、正確
な動画像の類似度検出値に基づいて動画像認識を行うの
で、判定の基準が信頼性の高いものとなり、動画像認識
の精度を著しく向上できる利点がある。

【図面の簡単な説明】

【図１】本発明の一実施例における音声、または、振動
波の測定装置の構造を示すブロック図。

【図２】帯域通過フィルタ群の周波数ゲイン特性の一例
を示す図。

【図３】帯域通過フィルタを通して抽出した音声、また
は、振動波の周波数成分波からパワースペクトルの時間
変化の特徴を抽出する方法を示す図。

【図４】パワースペクトルの一例と、その正規化パワー
スペクトルを示す図。

【図５】標準パターン行列と入力パターン行列を（周波
数−時間）平面で表現する方法を示す図。

【図６】（周波数−時間）正規化平面を示す図。

【図７】正規曲線と、その値を成分とする基準パターン
正ベクトルおよび基準パターン負ベクトルの一例を示す
図。

【図８】正規曲線の形状変化と尖度値の関係を示す図。

【図９】（周波数−時間）正規化平面を３次元で示す
図。

【図１０】ｊ₁ｊ₂成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、形状が同じ場合のパターン行列
を示す図。

【図１１】ｊ₁ｊ₂成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図１０の標準パターン行列形状
に対し入力パターン行列形状のｊ₁ｊ₂成分が増加したも
の、及び、そのときの基準パターン正ベクトルの形状変
化を示す図。

【図１２】ｊ₁ｊ₂成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図１０の標準パターン行列形状
に対し入力パターン行列形状のｊ₁ｊ₂成分が減少したも
の、及び、そのときの基準パターン負ベクトルの形状変
化を示す図。

【図１３】ｊ₁ｊ₂成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図１０の標準パターン行列形状
に対し入力パターン行列形状のｍ₁１成分が増加したも
の、及び、そのときの基準パターン正ベクトルの形状変
化を示す図。

【図１４】ｊ₁ｊ₂成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図１０の標準パターン行列形状
に対し入力パターン行列形状のｍ₁１成分が減少したも
の、及び、そのときの基準パターン負ベクトルの形状変
化を示す図。

【図１５】ｊ₁ｊ₂成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図１０の標準パターン行列形状
に対し入力パターン行列形状のｉ₁ｉ₂成分が増加したも
の、及び、そのときの基準パターン正ベクトルの形状変
化を示す図。

【図１６】ｊ₁ｊ₂成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図１０の標準パターン行列形状
に対し入力パターン行列形状のｉ₁ｉ₂成分が減少したも
の、及び、そのときの基準パターン負ベクトルの形状変
化を示す図。

【図１７】標準パターン行列と、同パターン行列に対し
ｉ₁ｉ₂成分が増加した入力パターン行列の形状例を示す
図。

【図１８】正規分布の平均値が移動したときの正規分布
の分散の値の変化例、及び、正規分布の平均値と点（ｉ
₁，ｉ₂）との間の長さの変化例を示す図。

【図１９】正規分布の平均値が移動したときの基準パタ
ーン正ベクトル及び基準パターン負ベクトルの形状変化
例を示す図。

【図２０】形状変化量（基準パターン正ベクトルと基準
パターン負ベクトルの尖度の差）を算出するためのフロ
ーチャートを示すブロック図。

【図２１】パターン行列の成分別形状変化量を示す図。

【図２２】図４０中のαに対し、標準パターン行列と入
力パターン行列との間の形状距離値が変化する様子を示
す図。

【図２３】図４２中のβに対し、標準パターン行列と入
力パターン行列との間の形状距離値が変化する様子を示
す図。

【図２４】音声を認識するためのフローチャートを示す
ブロック図。

【図２５】音声の類似度検出装置の構造を示すブロック
図。

【図２６】アルファベット”Ｅ”の画像の一例を示す
図。

【図２７】標準パターン行列と入力パターン行列を（ｘ
−ｙ）平面で表現する方法を示す図。

【図２８】標準画像と入力画像の濃度の例を示す図。

【図２９】図２８に対応した標準画像と入力画像のパタ
ーン行列の例を示す図。

【図３０】実験結果として、上段に、標準画像と、標準
画像と同じ入力画像及び標準画像とは異なる入力画像と
の間のユークリッド距離値の棒グラフを、中段に、標準
画像と、標準画像と同じ入力画像及び標準画像とは異な
る入力画像との間の角度の余弦値の棒グラフを、下段
に、標準画像と、標準画像と同じ入力画像及び標準画像
とは異なる入力画像との間の形状距離値の棒グラフを示
す図。

【図３１】立体の密度分布を示す図。

【図３２】標準パターン行列層を（ｘ−ｙ−ｚ）空間で
表現する方法を示す図。

【図３３】入力パターン行列層を（ｘ−ｙ−ｚ）空間で
表現する方法を示す図。

【図３４】（ｘ−ｙ−ｚ）正規化空間を示す図。

【図３５】正規曲線と、その値を成分とする基準パター
ン正ベクトルおよび基準パターン負ベクトルの一例を示
す図。

【図３６】アルファベット”Ｅ”を筆記するペンの動き
を時間を追って撮影した動画像の一例を示す図。

【図３７】標準パターン行列層を（ｘ−ｙ−時間）空間
で表現する方法を示す図。

【図３８】入力パターン行列層を（ｘ−ｙ−時間）空間
で表現する方法を示す図。

【図３９】標準音声と入力音声のパワースペクトルの例
を示す図。

【図４０】図３９に対応した標準音声と入力音声のパタ
ーン行列の例を示す図。

【図４１】標準音声と入力音声のパワースペクトルの他
の例を示す図。

【図４２】図４１に対応した標準音声と入力音声のパタ
ーン行列の例を示す図。

【図４３】従来技術に関して、図４０中の変数αに対
し、パターン行列間のユークリッド距離値が変化する様
子を示す図。

【図４４】従来技術に関して、図４０中の変数αに対
し、パターン行列間の角度の余弦値が変化する様子を示
す図。

【図４５】従来技術に関して、図４２中の変数βに対
し、パターン行列間のユークリッド距離値が変化する様
子を示す図。

【図４６】従来技術に関して、図４２中の変数βに対
し、パターン行列間の角度の余弦値が変化する様子を示
す図。

【符号の説明】

１マイクロホン２帯域通過フィルタ３ＡＤ変換器４演算装置５許容値より形状距離値が大きい入力音声を表す白丸６許容値より形状距離値が小さい入力音声を表す白丸７許容値より形状距離値が大きい入力音声を表す白丸８許容値より形状距離値が大きい入力音声を表す白丸９許容値より形状距離値が小さい入力音声を表す白丸１０パターンベクトル生成器１１パターン行列生成器１２比較器１３基準パターンベクトルの成分値の増加器１４尖度の差の計算器１５形状距離の計算器１６標準画像１７標準画像と同じ入力画像１８標準画像とは異なる入力画像１９標準画像とは異なる入力画像２０標準音声２１標準音声と同じ入力音声２２標準音声と同じ入力音声２３標準音声とは異なる入力音声２４標準音声２５標準音声と同じ入力音声２６標準音声とは異なる入力音声２７標準音声とは異なる入力音声Ｄｊ₁ｊ₂パターン行列間の形状変化量Ｄｊ₁ｊ₂ｊ₃パターン行列層間の形状変化量ｄ１７標準画像と、標準画像と同じ入力画像との間の
形状距離値ｄ１８、ｄ１９標準画像と、標準画像とは異なる入力
画像との間の形状距離値ｄ２１、ｄ２２標準音声と、標準音声と同じ入力音声
との間の形状距離値ｄ２３標準音声と、標準音声とは異なる入力音声との
間の形状距離値ｄ２５標準音声と、標準音声と同じ入力音声との間の
形状距離値ｄ２６、ｄ２７標準音声と、標準音声とは異なる入力
音声との間の形状距離値

フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩＧ１０Ｌ 3/00 ５３１Ｆ５３１Ｎ (56)参考文献特開平10−253444（ＪＰ，Ａ) 特公平４−59638（ＪＰ，Ｂ２) 草薙、平田、神内、山口、濱田、榊原，形状距離パターンマッチング法を用いた異常音検出，日本音響学会2000年春季研究発表会講演論文集，日本，社団法人日本音響学会，2000年３月15日，Ｉ、３−６−４，ｐ．509−510 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 15/10 G01H 17/00 G06K 9/62 G06T 7/00 G06T 7/20 (54)【発明の名称】音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法

Claims

(57)【特許請求の範囲】

【請求項１】（ａ）標準音声の特徴量を成分とする標
準パターン行列と、入力音声の特徴量を成分とする入力
パターン行列とを作成すること、（ｂ）パターン行列の
指定成分ごとに異なる分散の値をもつ正規分布を作成
し、上記正規分布の値を成分とする基準パターン正ベク
トル及び基準パターン負ベクトルを作成すること、
（ｃ）パターン行列の各成分について、パターン行列の
指定成分と各成分との間の長さを求め、基準パターン正
ベクトル及び基準パターン負ベクトルの中心から上記長
さだけ離れた位置に最も近い基準パターン正ベクトル及
び基準パターン負ベクトルの成分番号を算出し、入力パ
ターン行列の成分値が標準パターン行列の成分値より大
きいとき、その差の絶対値だけ基準パターン正ベクトル
の上記成分番号の成分値を増加させ、入力パターン行列
の成分値が標準パターン行列の成分値より小さいとき、
その差の絶対値だけ基準パターン負ベクトルの上記成分
番号の成分値を増加させること、（ｄ）基準パターン正
ベクトルの尖度と基準パターン負ベクトルの尖度との差
の値を算出すること、（ｅ）上記尖度の差の値を算出す
るに際し、パターン行列の指定成分を各成分の位置に移
動しながら尖度の差の値を求めること、（ｆ）上記尖度
の差の値の２乗和、あるいは同２乗和の平方根を、標準
パターン行列と入力パターン行列との間の形状距離値と
することを特徴とする音声の類似度検出方法。
【請求項２】前記パターン行列の指定成分ごとに異な
る分散の値をもつ正規分布に代えて、パターン行列の指
定成分ごとに異なる分散の値をもつ矩形など任意の基準
形状を作成し、上記基準形状の値を成分とする基準パタ
ーン正ベクトル及び基準パターン負ベクトルを作成する
ことを特徴とする請求項１に記載の音声の類似度検出方
法。
【請求項３】請求項１または２に記載の音声の類似度
検出方法で標準音声の特徴量を成分とする標準パターン
行列と入力音声の特徴量を成分とする入力パターン行列
との間の形状距離を求め、求めた形状距離値と任意に設
定した許容値を比較し、形状距離値が許容値を越えたと
き入力音声は標準音声でないと判定し、形状距離値が許
容値内のとき入力音声が標準音声であると判定すること
を特徴とする音声認識方法。
【請求項４】（ａ）標準振動波の特徴量を成分とする
標準パターン行列と、入力振動波の特徴量を成分とする
入力パターン行列とを作成すること、（ｂ）パターン行
列の指定成分ごとに異なる分散の値をもつ正規分布を作
成し、上記正規分布の値を成分とする基準パターン正ベ
クトル及び基準パターン負ベクトルを作成すること、
（ｃ）パターン行列の各成分について、パターン行列の
指定成分と各成分との間の長さを求め、基準パターン正
ベクトル及び基準パターン負ベクトルの中心から上記長
さだけ離れた位置に最も近い基準パターン正ベクトル及
び基準パターン負ベクトルの成分番号を算出し、入力パ
ターン行列の成分値が標準パターン行列の成分値より大
きいとき、その差の絶対値だけ基準パターン正ベクトル
の上記成分番号の成分値を増加させ、入力パターン行列
の成分値が標準パターン行列の成分値より小さいとき、
その差の絶対値だけ基準パターン負ベクトルの上記成分
番号の成分値を増加させること、（ｄ）基準パターン正
ベクトルの尖度と基準パターン負ベクトルの尖度との差
の値を算出すること、（ｅ）上記尖度の差の値を算出す
るに際し、パターン行列の指定成分を各成分の位置に移
動しながら尖度の差の値を求めること、（ｆ）上記尖度
の差の値の２乗和、あるいは同２乗和の平方根を、標準
パターン行列と入力パターン行列との間の形状距離値と
することを特徴とする振動波の類似度検出方法。
【請求項５】前記パターン行列の指定成分ごとに異な
る分散の値をもつ正規分布に代えて、パターン行列の指
定成分ごとに異なる分散の値をもつ矩形など任意の基準
形状を作成し、上記基準形状の値を成分とする基準パタ
ーン正ベクトル及び基準パターン負ベクトルを作成する
ことを特徴とする請求項４に記載の振動波の類似度検出
方法。
【請求項６】請求項４または５に記載の振動波の類似
度検出方法で標準振動波の特徴量を成分とする標準パタ
ーン行列と入力振動波の特徴量を成分とする入力パター
ン行列との間の形状距離を求め、求めた形状距離値と任
意に設定した許容値を比較し、形状距離値が許容値を越
えたとき異常と判定し、形状距離値が許容値内のとき正
常と判定することを特徴とする機械の異常判定方法。
【請求項７】（ａ）標準画像の特徴量を成分とする標
準パターン行列と、入力画像の特徴量を成分とする入力
パターン行列とを作成すること、（ｂ）パターン行列の
指定成分ごとに異なる分散の値をもつ正規分布を作成
し、上記正規分布の値を成分とする基準パターン正ベク
トル及び基準パターン負ベクトルを作成すること、
（ｃ）パターン行列の各成分について、パターン行列の
指定成分と各成分との間の長さを求め、基準パターン正
ベクトル及び基準パターン負ベクトルの中心から上記長
さだけ離れた位置に最も近い基準パターン正ベクトル及
び基準パターン負ベクトルの成分番号を算出し、入力パ
ターン行列の成分値が標準パターン行列の成分値より大
きいとき、その差の絶対値だけ基準パターン正ベクトル
の上記成分番号の成分値を増加させ、入力パターン行列
の成分値が標準パターン行列の成分値より小さいとき、
その差の絶対値だけ基準パターン負ベクトルの上記成分
番号の成分値を増加させること、（ｄ）基準パターン正
ベクトルの尖度と基準パターン負ベクトルの尖度との差
の値を算出すること、（ｅ）上記尖度の差の値を算出す
るに際し、パターン行列の指定成分を各成分の位置に移
動しながら尖度の差の値を求めること、（ｆ）上記尖度
の差の値の２乗和、あるいは同２乗和の平方根を、標準
パターン行列と入力パターン行列との間の形状距離値と
することを特徴とする画像の類似度検出方法。
【請求項８】前記パターン行列の指定成分ごとに異な
る分散の値をもつ正規分布に代えて、パターン行列の指
定成分ごとに異なる分散の値をもつ矩形など任意の基準
形状を作成し、上記基準形状の値を成分とする基準パタ
ーン正ベクトル及び基準パターン負ベクトルを作成する
ことを特徴とする請求項７に記載の画像の類似度検出方
法。
【請求項９】請求項７または８に記載の画像の類似度
検出方法で標準画像の特徴量を成分とする標準パターン
行列と入力画像の特徴量を成分とする入力パターン行列
との間の形状距離を求め、求めた形状距離値と任意に設
定した許容値を比較し、形状距離値が許容値を越えたと
き入力画像は標準画像でないと判定し、形状距離値が許
容値内のとき入力画像が標準画像であると判定すること
を特徴とする画像認識方法。
【請求項１０】（ａ）標準立体の特徴量を成分とする
標準パターン行列層と、入力立体の特徴量を成分とする
入力パターン行列層とを作成すること、（ｂ）パターン
行列層の指定成分ごとに異なる分散の値をもつ正規分布
を作成し、上記正規分布の値を成分とする基準パターン
正ベクトル及び基準パターン負ベクトルを作成するこ
と、（ｃ）パターン行列層の各成分について、パターン
行列層の指定成分と各成分との間の長さを求め、基準パ
ターン正ベクトル及び基準パターン負ベクトルの中心か
ら上記長さだけ離れた位置に最も近い基準パターン正ベ
クトル及び基準パターン負ベクトルの成分番号を算出
し、入力パターン行列層の成分値が標準パターン行列層
の成分値より大きいとき、その差の絶対値だけ基準パタ
ーン正ベクトルの上記成分番号の成分値を増加させ、入
力パターン行列層の成分値が標準パターン行列層の成分
値より小さいとき、その差の絶対値だけ基準パターン負
ベクトルの上記成分番号の成分値を増加させること、
（ｄ）基準パターン正ベクトルの尖度と基準パターン負
ベクトルの尖度との差の値を算出すること、（ｅ）上記
尖度の差の値を算出するに際し、パターン行列層の指定
成分を各成分の位置に移動しながら尖度の差の値を求め
ること、（ｆ）上記尖度の差の値の２乗和、あるいは同
２乗和の平方根を、標準パターン行列層と入力パターン
行列層との間の形状距離値とすることを特徴とする立体
の類似度検出方法。
【請求項１１】前記パターン行列層の指定成分ごとに
異なる分散の値をもつ正規分布に代えて、パターン行列
層の指定成分ごとに異なる分散の値をもつ矩形など任意
の基準形状を作成し、上記基準形状の値を成分とする基
準パターン正ベクトル及び基準パターン負ベクトルを作
成することを特徴とする請求項１０に記載の立体の類似
度検出方法。
【請求項１２】請求項１０または１１に記載の立体の
類似度検出方法で標準立体の特徴量を成分とする標準パ
ターン行列層と入力立体の特徴量を成分とする入力パタ
ーン行列層との間の形状距離を求め、求めた形状距離値
と任意に設定した許容値を比較し、形状距離値が許容値
を越えたとき入力立体は標準立体でないと判定し、形状
距離値が許容値内のとき入力立体が標準立体であると判
定することを特徴とする立体認識方法。
【請求項１３】（ａ）標準動画像の特徴量を成分とす
る標準パターン行列層と、入力動画像の特徴量を成分と
する入力パターン行列層とを作成すること、（ｂ）パターン行列層の指定成分ごとに異なる分散の値
をもつ正規分布を作成し、上記正規分布の値を成分とす
る基準パターン正ベクトル及び基準パターン負ベクトル
を作成すること、（ｃ）パターン行列層の各成分について、パターン行列
層の指定成分と各成分との間の長さを求め、基準パター
ン正ベクトル及び基準パターン負ベクトルの中心から上
記長さだけ離れた位置に最も近い基準パターン正ベクト
ル及び基準パターン負ベクトルの成分番号を算出し、入
力パターン行列層の成分値が標準パターン行列層の成分
値より大きいとき、その差の絶対値だけ基準パターン正
ベクトルの上記成分番号の成分値を増加させ、入力パタ
ーン行列層の成分値が標準パターン行列層の成分値より
小さいとき、その差の絶対値だけ基準パターン負ベクト
ルの上記成分番号の成分値を増加させること、（ｄ）基準パターン正ベクトルの尖度と基準パターン負
ベクトルの尖度との差の値を算出すること、（ｅ）上記尖度の差の値を算出するに際し、パターン行
列層の指定成分を各成分の位置に移動しながら尖度の差
の値を求めること、（ｆ）上記尖度の差の値の２乗和、あるいは同２乗和の
平方根を、標準パターン行列層と入力パターン行列層と
の間の形状距離値とすることを特徴とする動画像の類似
度検出方法。
【請求項１４】前記パターン行列層の指定成分ごとに
異なる分散の値をもつ正規分布に代えて、パターン行列
層の指定成分ごとに異なる分散の値をもつ矩形など任意
の基準形状を作成し、上記基準形状の値を成分とする基
準パターン正ベクトル及び基準パターン負ベクトルを作
成することを特徴とする請求項１３に記載の動画像の類
似度検出方法。
【請求項１５】請求項１３または１４に記載の動画像
の類似度検出方法で標準動画像の特徴量を成分とする標
準パターン行列層と入力動画像の特徴量を成分とする入
力パターン行列層との間の形状距離を求め、求めた形状
距離値と任意に設定した許容値を比較し、形状距離値が
許容値を越えたとき入力動画像は標準動画像でないと判
定し、形状距離値が許容値内のとき入力動画像が標準動
画像であると判定することを特徴とする動画像認識方
法。