JP3342864B2 - 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法 - Google Patents

音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法

Info

Publication number
JP3342864B2
JP3342864B2 JP2000277749A JP2000277749A JP3342864B2 JP 3342864 B2 JP3342864 B2 JP 3342864B2 JP 2000277749 A JP2000277749 A JP 2000277749A JP 2000277749 A JP2000277749 A JP 2000277749A JP 3342864 B2 JP3342864 B2 JP 3342864B2
Authority
JP
Japan
Prior art keywords
value
component
pattern
pattern matrix
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000277749A
Other languages
English (en)
Other versions
JP2002091481A (ja
Inventor
教博 神内
博司 山口
Original Assignee
株式会社エントロピーソフトウェア研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エントロピーソフトウェア研究所 filed Critical 株式会社エントロピーソフトウェア研究所
Priority to JP2000277749A priority Critical patent/JP3342864B2/ja
Priority to DE60141875T priority patent/DE60141875D1/de
Priority to EP01121566A priority patent/EP1189207B1/en
Priority to US09/951,211 priority patent/US7006970B2/en
Priority to AU70003/01A priority patent/AU766266B2/en
Priority to CA002357255A priority patent/CA2357255C/en
Publication of JP2002091481A publication Critical patent/JP2002091481A/ja
Priority to HK02106431.2A priority patent/HK1045016B/zh
Application granted granted Critical
Publication of JP3342864B2 publication Critical patent/JP3342864B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、標準情報と入力情
報との間の類似度を検出する方法と、その類似度検出値
を用いて入力情報が標準情報であるか否かの認識あるい
は入力情報が異常であるか否かの判定を行う方法に関す
る。より詳しくは、本発明は、人間が発声する音声につ
いて標準音声と入力音声との間の類似度を検出する方法
と、その検出値を用いて音声を認識する方法に関し、ま
た、運転中の設備等が発する音や振動についての振動波
の類似度検出方法と、その類似度検出値に基づいて機械
の異常を判定する方法に関し、更に、文字や模様につい
ての画像の類似度検出方法と、その類似度検出値を用い
て画像を認識する方法にも関する。また、立体の類似度
検出方法と、その類似度検出値を用いて立体を認識する
方法に関し、更に、動画像の類似度検出方法と、その類
似度検出値を用いて動画像を認識する方法にも関する。
【0002】
【従来の技術】人間が発声する音声をコンピュータが自
動認識する音声認識装置においては、予めコンピュータ
に登録した既知の音声を標準音声とし、新たにコンピュ
ータに入力した未知の音声を入力音声としたとき、標準
音声と入力音声との間の類似度を検出し、その類似度の
検出値により入力音声を認識する手段が装備されてい
る。
【0003】従来の音声の類似度検出では、標準音声の
パワースペクトルなどの特徴量を成分とする標準パター
ン行列を予め登録しておき、入力音声の特徴量を成分と
する入力パターン行列を作成し、標準パターン行列と入
力パターン行列との間のユークリッド距離や角度を算出
する方法を採っている。また、従来の音声認識では、上
記ユークリッド距離や角度の算出値と任意に設定した許
容値とを比較して音声の認識を行う方法を採っている。
即ち、特徴量の種類の数と同じ次元のパターン空間を考
え、標準パターン行列の点と入力パターン行列の点との
間の直線的な距離(ユークリッド距離)や角度を表す類
似性尺度を用いて、2つのパターン行列の類似程度を数
値化し、その数値に基づいて音声の認識を行っている。
【0004】第1の例として、図39、図40は、平坦
なパワースペクトル形状を持つ標準音声20、及び、こ
の標準音声と同じエネルギーを持つがパワースペクトル
形状の特徴が異なる入力音声21、22、23につい
て、標準音声20のパワースペクトルを成分とする7行
9列の標準パターン行列20Aを予め登録しておき、各
入力音声21、22、23のパワースペクトルを成分と
する7行9列の入力パターン行列21A、22A、23
Aを作成し、標準パターン行列20Aと各入力パターン
行列21A、22A、23Aとの間の類似性尺度とし
て、ユークリッド距離または角度の余弦e21、e2
2、e23を算出する様子を模式的に示したものであ
る。
【0005】ここで、各入力音声21、22、23は、
変数αについて、図40中に示されるγ、δ、ε、ζ、
η、θの関係を持っているものとする。つまり、標準音
声20のパワースペクトル形状に対する各入力音声2
1、22、23のパワースペクトル形状の変化が、図4
0に示す関係で、変数αにより規定されるものとしてい
る。ユークリッド距離は標準パターン行列と入力パター
ン行列の各成分毎の差の2乗和の平方根として求めら
れ、また、角度の余弦は2つのパターン行列の各成分ご
との積の和を、標準パターン行列の各成分の2乗和の平
方根と入力パターン行列の各成分の2乗和の平方根で除
算して求められる。
【0006】第2の例として、図41、図42は、パワ
ースペクトル形状に2個のピークを持つ標準音声24、
及び、この標準音声と同じエネルギーを持つがピークの
位置が異なる入力音声25、26、27について、標準
音声24のパワースペクトルを成分とする7行9列の標
準パターン行列24Aを予め登録しておき、各入力音声
25、26、27のパワースペクトルを成分とする7行
9列の入力パターン行列25A、26A、27Aを作成
し、標準パターン行列と各入力パターン行列との間の類
似性尺度として、ユークリッド距離または角度の余弦e
25、e26、e27を算出する様子を模式的に示した
ものである。
【0007】ここで、標準音声24、及び、各入力音声
25、26、27は、変数βについて、図42中に示さ
れるω、φの関係を持っているものとする。つまり、標
準音声24のパワースペクトル形状に対する各入力音声
25、26、27のパワースペクトル形状の変化が、図
42に示す関係で、変数βにより規定されるものとして
いる。
【0008】
【発明が解決しようとする課題】ところが、ユークリッ
ド距離や角度などを類似性尺度に用いた場合、パワース
ペクトル形状が異なる複数の入力音声について、標準音
声からのユークリッド距離や角度の算出値が同じになる
ことがある。このような場合には、特徴が異なる入力音
声を区別できなくなり、このことが音声の類似度検出を
不正確にする要因となっている。以下、詳しく説明す
る。
【0009】第1の例として、図43は、図40におけ
る変数αの値を0から1まで増加させたときに、ユーク
リッド距離の算出値e21、e22、e23が変化する
様子を示したものである。図44は、同じく図40にお
ける変数αの値を0から1まで増加させたときに、角度
の余弦の算出値e21、e22、e23が変化する様子
を示したものである。
【0010】図43と図44から、この例では、ユーク
リッド距離及び角度の余弦の値は常にe21=e22=
e23であることが分かり、変数αの値が増加するにつ
れて、ユークリッド距離の値e21、e22、e23は
増加し、また、角度の余弦の値e21、e22、e23
は減少することが分かる。角度の余弦の値e21、e2
2、e23が減少することは、角度の値が増加すること
である。
【0011】ところで、一般に、白色雑音のパワースペ
クトル形状は平坦であり、音声の摩擦子音/s/につい
てもそのパワースペクトル形状が平坦に近いものが多
い。ただし、摩擦子音/s/については、パワースペク
トル形状が平坦に近いといっても、その形状が時間とと
もに少し変動する「スペクトル強度のゆらぎ」現象も観
測される。
【0012】そこで、図39、図40において、変数α
が小さい場合について、仮に、入力音声21、22は摩
擦子音/s/の「スペクトル強度のゆらぎ」であり、入
力音声23は摩擦子音/s/とは異なる音声であると考
えてみる。
【0013】図43、図44から分かるように、入力音
声を規定する変数αの値が同じときには、標準音声20
からのユークリッド距離や角度の値は3個の入力音声2
1、22、23とも同じになるため、それらの値と任意
に設定した許容値とを比較した場合、3個の入力音声が
ともに標準音声であると判定されるか、逆に、3個の入
力音声ともに標準音声でないと判定されることになり、
区別できない。
【0014】第2の例として、図45は、図42におけ
る変数βの値を0から1まで増加させたときに、ユーク
リッド距離の算出値e25、e26、e27が変化する
様子を示したものである。図46は、同じく図42にお
ける変数βの値を0から1まで増加させたときに、角度
の余弦の算出値e25、e26、e27が変化する様子
を示したものである。
【0015】図45と図46から、この例では、ユーク
リッド距離及び角度の余弦の値は常にe25=e26=
e27であることが分かり、変数βの値が増加するにつ
れて、ユークリッド距離の値e25、e26、e27は
増加し、角度の余弦の値e25、e26、e27は減少
することが分かる。角度の余弦の値e25、e26、e
27が減少することは、角度の値が増加することであ
る。
【0016】ところで、一般に、音声のパワースペクト
ル形状にはホルマントと呼ばれる複数のピークが観測さ
れる。ただし、音声のホルマントについては、同じ音声
であっても、パワースペクトル形状のピーク周波数が少
し変動する「周波数のずれ」現象やピーク位置が時間的
に少し変動する「時間のずれ」現象も観測される。
【0017】そこで、図41、図42において、仮に、
入力音声25は標準音声24と同じ音声であって、その
ピークに「周波数のずれ」または「時間のずれ」が発生
したものであり、入力音声26、27は標準音声24と
は異なる音声であると考えてみる。
【0018】図45、図46から分かるように、標準音
声及び入力音声を規定する変数βの値が同じときには、
標準音声24からのユークリッド距離や角度の値は3個
の入力音声25、26、27とも同じになるため、それ
らの値と任意に設定した許容値とを比較した場合、3個
の入力音声がともに標準音声であると判定されるか、逆
に、3個の入力音声ともに標準音声でないと判定される
ことになり、区別できない。
【0019】このように、従来の音声の類似度検出方法
では、音声の類似度を正確に検出することができず、音
声を認識する上で十分に満足のいく精度が得られないと
いう問題がある。
【0020】その理由は、従来の音声の類似度検出方法
では、2つのパターン行列のユークリッド距離あるいは
角度の値を類似性尺度としているために、標準パターン
行列がなす形状と入力パターン行列がなす形状との差
を、形状距離として数値化できないからである。
【0021】一方で、標準音声のパワースペクトルを成
分とする標準パターン行列を予め登録する場合、「スペ
クトル強度のゆらぎ」、「周波数のずれ」、「時間のず
れ」のある個々の標準音声を多数の標準パターン行列と
して登録しておく方法が考えられるが、コンピュータの
記憶容量や処理時間の問題から標準パターン行列の登録
個数には制限があるため、この方法を用いて、標準音声
の「スペクトル強度のゆらぎ」、または、標準音声の
「周波数のずれ」、または、標準音声の「時間のずれ」
と、標準音声とは異なる音声とを判別することには限界
がある。
【0022】また、特開平10−253444号公報
(特願平9−61007号:発明の名称:異常音の検出
方法及びその検出値を用いた機械の異常判定方法、並び
に、振動波の類似度検出方法及びその検出値を用いた音
声認識方法)において、標準パターンベクトル(1次
元)と入力パターンベクトル(1次元)との間の形状距
離値の算出方法について説明しているが、標準パターン
行列(2次元)と入力パターン行列(2次元)との間の
形状距離値の算出方法、並びに、標準パターン行列層
(3次元)と入力パターン行列層(3次元)との間の形
状距離値の算出方法についての説明はない。
【0023】本発明は、上記問題を解決するためになさ
れたものであり、第1の目的は標準パターン行列と入力
パターン行列から、2つのパターン行列間の正確な形状
距離値を求めることができる音声の類似度検出方法を提
供することにある。また、本発明の第2の目的は音声の
類似度検出値から高い精度で音声認識を行うことができ
る方法を提供することにある。
【0024】また、本発明の第3の目的は標準パターン
行列と入力パターン行列から、2つのパターン行列間の
正確な形状距離値を求めることができる振動波の類似度
検出方法を提供することにある。また、本発明の第4の
目的は振動波の類似度検出値から高い精度で機械の異常
判定を行うことができる判定方法を提供することにあ
る。
【0025】本発明の第5の目的は標準パターン行列と
入力パターン行列から、2つのパターン行列間の正確な
形状距離値を求めることができる画像の類似度検出方法
を提供することにある。また、本発明の第6の目的は画
像の類似度検出値から高い精度で画像認識を行うことが
できる方法を提供することにある。
【0026】本発明の第7の目的は標準パターン行列層
と入力パターン行列層から、2つのパターン行列層間の
正確な形状距離値を求めることができる立体の類似度検
出方法を提供することにある。また、本発明の第8の目
的は立体の類似度検出値から高い精度で立体認識を行う
ことができる方法を提供することにある。
【0027】本発明の第9の目的は標準パターン行列層
と入力パターン行列層から、2つのパターン行列層間の
正確な形状距離値を求めることができる動画像の類似度
検出方法を提供することにある。また、本発明の第10
の目的は動画像の類似度検出値から高い精度で動画像認
識を行うことができる方法を提供することにある。
【0028】なお、本発明は、特開平10−25344
4号公報(特願平9−61007号)において説明され
ている形状距離値の算出方法を2次元に拡張して音声認
識、機械の異常判定、及び、画像認識に適用できるよう
にし、更に、3次元に拡張して立体認識、及び、動画像
認識に適用できるようにしたものである。
【0029】
【課題を解決するための手段】上記の課題を解決するた
め、請求項1に係る発明は音声の類似度検出方法であ
り、(a)標準音声の特徴量を成分とする標準パターン
行列と、入力音声の特徴量を成分とする入力パターン行
列とを作成すること、(b)パターン行列の指定成分ご
とに異なる分散の値をもつ正規分布を作成し、上記正規
分布の値を成分とする基準パターン正ベクトル及び基準
パターン負ベクトルを作成すること、(c)パターン行
列の各成分について、パターン行列の指定成分と各成分
との間の長さを求め、基準パターン正ベクトル及び基準
パターン負ベクトルの中心から上記長さだけ離れた位置
に最も近い基準パターン正ベクトル及び基準パターン負
ベクトルの成分番号を算出し、入力パターン行列の成分
値が標準パターン行列の成分値より大きいとき、その差
の絶対値だけ基準パターン正ベクトルの上記成分番号の
成分値を増加させ、入力パターン行列の成分値が標準パ
ターン行列の成分値より小さいとき、その差の絶対値だ
け基準パターン負ベクトルの上記成分番号の成分値を増
加させること、(d)基準パターン正ベクトルの尖度と
基準パターン負ベクトルの尖度との差の値を算出するこ
と、(e)上記尖度の差の値を算出するに際し、パター
ン行列の指定成分を各成分の位置に移動しながら尖度の
差の値を求めること、(f)上記尖度の差の値の2乗
和、あるいは同2乗和の平方根を、標準パターン行列と
入力パターン行列との間の形状距離値とすることを特徴
とする。
【0030】請求項2に係る発明の音声の類似度検出方
法は、請求項1に係る発明において、前記パターン行列
の指定成分ごとに異なる分散の値をもつ正規分布に代え
て、パターン行列の指定成分ごとに異なる分散の値をも
つ矩形など任意の基準形状を作成し、上記基準形状の値
を成分とする基準パターン正ベクトル及び基準パターン
負ベクトルを作成することを特徴とする。
【0031】また、請求項3に係る発明は音声認識方法
であり、請求項1または2に係る発明の音声の類似度検
出方法で標準音声の特徴量を成分とする標準パターン行
列と入力音声の特徴量を成分とする入力パターン行列と
の間の形状距離を求め、求めた形状距離値と任意に設定
した許容値を比較し、形状距離値が許容値を越えたとき
入力音声は標準音声でないと判定し、形状距離値が許容
値内のとき入力音声が標準音声であると判定することを
特徴とする。
【0032】次に、請求項4に係る発明は振動波の類似
度検出方法であり、(a)標準振動波の特徴量を成分と
する標準パターン行列と、入力振動波の特徴量を成分と
する入力パターン行列とを作成すること、(b)パター
ン行列の指定成分ごとに異なる分散の値をもつ正規分布
を作成し、上記正規分布の値を成分とする基準パターン
正ベクトル及び基準パターン負ベクトルを作成するこ
と、(c)パターン行列の各成分について、パターン行
列の指定成分と各成分との間の長さを求め、基準パター
ン正ベクトル及び基準パターン負ベクトルの中心から上
記長さだけ離れた位置に最も近い基準パターン正ベクト
ル及び基準パターン負ベクトルの成分番号を算出し、入
力パターン行列の成分値が標準パターン行列の成分値よ
り大きいとき、その差の絶対値だけ基準パターン正ベク
トルの上記成分番号の成分値を増加させ、入力パターン
行列の成分値が標準パターン行列の成分値より小さいと
き、その差の絶対値だけ基準パターン負ベクトルの上記
成分番号の成分値を増加させること、(d)基準パター
ン正ベクトルの尖度と基準パターン負ベクトルの尖度と
の差の値を算出すること、(e)上記尖度の差の値を算
出するに際し、パターン行列の指定成分を各成分の位置
に移動しながら尖度の差の値を求めること、(f)上記
尖度の差の値の2乗和、あるいは同2乗和の平方根を、
標準パターン行列と入力パターン行列との間の形状距離
値とすることを特徴とする。
【0033】請求項5に係る発明の振動波の類似度検出
方法は、請求項4に係る発明において、前記パターン行
列の指定成分ごとに異なる分散の値をもつ正規分布に代
えて、パターン行列の指定成分ごとに異なる分散の値を
もつ矩形など任意の基準形状を作成し、上記基準形状の
値を成分とする基準パターン正ベクトル及び基準パター
ン負ベクトルを作成することを特徴とする。
【0034】また、請求項6に係る発明は機械の異常判
定方法であり、請求項4または5に係る発明の振動波の
類似度検出方法で標準振動波の特徴量を成分とする標準
パターン行列と入力振動波の特徴量を成分とする入力パ
ターン行列との間の形状距離を求め、求めた形状距離値
と任意に設定した許容値を比較し、形状距離値が許容値
を越えたとき異常と判定し、形状距離値が許容値内のと
き正常と判定することを特徴とする。
【0035】次に、請求項7に係る発明は画像の類似度
検出方法であり、(a)標準画像の特徴量を成分とする
標準パターン行列と、入力画像の特徴量を成分とする入
力パターン行列とを作成すること、(b)パターン行列
の指定成分ごとに異なる分散の値をもつ正規分布を作成
し、上記正規分布の値を成分とする基準パターン正ベク
トル及び基準パターン負ベクトルを作成すること、
(c)パターン行列の各成分について、パターン行列の
指定成分と各成分との間の長さを求め、基準パターン正
ベクトル及び基準パターン負ベクトルの中心から上記長
さだけ離れた位置に最も近い基準パターン正ベクトル及
び基準パターン負ベクトルの成分番号を算出し、入力パ
ターン行列の成分値が標準パターン行列の成分値より大
きいとき、その差の絶対値だけ基準パターン正ベクトル
の上記成分番号の成分値を増加させ、入力パターン行列
の成分値が標準パターン行列の成分値より小さいとき、
その差の絶対値だけ基準パターン負ベクトルの上記成分
番号の成分値を増加させること、(d)基準パターン正
ベクトルの尖度と基準パターン負ベクトルの尖度との差
の値を算出すること、(e)上記尖度の差の値を算出す
るに際し、パターン行列の指定成分を各成分の位置に移
動しながら尖度の差の値を求めること、(f)上記尖度
の差の値の2乗和、あるいは同2乗和の平方根を、標準
パターン行列と入力パターン行列との間の形状距離値と
することを特徴とする。
【0036】請求項8に係る発明の画像の類似度検出方
法は、請求項7に係る発明において、前記パターン行列
の指定成分ごとに異なる分散の値をもつ正規分布に代え
て、パターン行列の指定成分ごとに異なる分散の値をも
つ矩形など任意の基準形状を作成し、上記基準形状の値
を成分とする基準パターン正ベクトル及び基準パターン
負ベクトルを作成することを特徴とする。
【0037】また、請求項9に係る発明は画像認識方法
であり、請求項7または8に係る発明の画像の類似度検
出方法で標準画像の特徴量を成分とする標準パターン行
列と入力画像の特徴量を成分とする入力パターン行列と
の間の形状距離を求め、求めた形状距離値と任意に設定
した許容値を比較し、形状距離値が許容値を越えたとき
入力画像は標準画像でないと判定し、形状距離値が許容
値内のとき入力画像が標準画像であると判定することを
特徴とする。
【0038】次に、請求項10に係る発明は立体の類似
度検出方法であり、(a)標準立体の特徴量を成分とす
る標準パターン行列層と、入力立体の特徴量を成分とす
る入力パターン行列層とを作成すること、(b)パター
ン行列層の指定成分ごとに異なる分散の値をもつ正規分
布を作成し、上記正規分布の値を成分とする基準パター
ン正ベクトル及び基準パターン負ベクトルを作成するこ
と、(c)パターン行列層の各成分について、パターン
行列層の指定成分と各成分との間の長さを求め、基準パ
ターン正ベクトル及び基準パターン負ベクトルの中心か
ら上記長さだけ離れた位置に最も近い基準パターン正ベ
クトル及び基準パターン負ベクトルの成分番号を算出
し、入力パターン行列層の成分値が標準パターン行列層
の成分値より大きいとき、その差の絶対値だけ基準パタ
ーン正ベクトルの上記成分番号の成分値を増加させ、入
力パターン行列層の成分値が標準パターン行列層の成分
値より小さいとき、その差の絶対値だけ基準パターン負
ベクトルの上記成分番号の成分値を増加させること、
(d)基準パターン正ベクトルの尖度と基準パターン負
ベクトルの尖度との差の値を算出すること、(e)上記
尖度の差の値を算出するに際し、パターン行列層の指定
成分を各成分の位置に移動しながら尖度の差の値を求め
ること、(f)上記尖度の差の値の2乗和、あるいは同
2乗和の平方根を、標準パターン行列層と入力パターン
行列層との間の形状距離値とすることを特徴とする。
【0039】請求項11に係る発明の立体の類似度検出
方法は、請求項10に係る発明において、前記パターン
行列層の指定成分ごとに異なる分散の値をもつ正規分布
に代えて、パターン行列層の指定成分ごとに異なる分散
の値をもつ矩形など任意の基準形状を作成し、上記基準
形状の値を成分とする基準パターン正ベクトル及び基準
パターン負ベクトルを作成することを特徴とする。
【0040】また、請求項12に係る発明は立体認識方
法であり、請求項10または11に係る発明の立体の類
似度検出方法で標準立体の特徴量を成分とする標準パタ
ーン行列層と入力立体の特徴量を成分とする入力パター
ン行列層との間の形状距離を求め、求めた形状距離値と
任意に設定した許容値を比較し、形状距離値が許容値を
越えたとき入力立体は標準立体でないと判定し、形状距
離値が許容値内のとき入力立体が標準立体であると判定
することを特徴とする。
【0041】次に、請求項13に係る発明は動画像の類
似度検出方法であり、(a)標準動画像の特徴量を成分
とする標準パターン行列層と、入力動画像の特徴量を成
分とする入力パターン行列層とを作成すること、(b)
パターン行列層の指定成分ごとに異なる分散の値をもつ
正規分布を作成し、上記正規分布の値を成分とする基準
パターン正ベクトル及び基準パターン負ベクトルを作成
すること、(c)パターン行列層の各成分について、パ
ターン行列層の指定成分と各成分との間の長さを求め、
基準パターン正ベクトル及び基準パターン負ベクトルの
中心から上記長さだけ離れた位置に最も近い基準パター
ン正ベクトル及び基準パターン負ベクトルの成分番号を
算出し、入力パターン行列層の成分値が標準パターン行
列層の成分値より大きいとき、その差の絶対値だけ基準
パターン正ベクトルの上記成分番号の成分値を増加さ
せ、入力パターン行列層の成分値が標準パターン行列層
の成分値より小さいとき、その差の絶対値だけ基準パタ
ーン負ベクトルの上記成分番号の成分値を増加させるこ
と、(d)基準パターン正ベクトルの尖度と基準パター
ン負ベクトルの尖度との差の値を算出すること、(e)
上記尖度の差の値を算出するに際し、パターン行列層の
指定成分を各成分の位置に移動しながら尖度の差の値を
求めること、(f)上記尖度の差の値の2乗和、あるい
は同2乗和の平方根を、標準パターン行列層と入力パタ
ーン行列層との間の形状距離値とすることを特徴とす
る。
【0042】請求項14に係る発明の動画像の類似度検
出方法は、請求項13に係る発明において、前記パター
ン行列層の指定成分ごとに異なる分散の値をもつ正規分
布に代えて、パターン行列層の指定成分ごとに異なる分
散の値をもつ矩形など任意の基準形状を作成し、上記基
準形状の値を成分とする基準パターン正ベクトル及び基
準パターン負ベクトルを作成することを特徴とする。
【0043】また、請求項15に係る発明は動画像認識
方法であり、請求項13または14に係る発明の動画像
の類似度検出方法で標準動画像の特徴量を成分とする標
準パターン行列層と入力動画像の特徴量を成分とする入
力パターン行列層との間の形状距離を求め、求めた形状
距離値と任意に設定した許容値を比較し、形状距離値が
許容値を越えたとき入力動画像は標準動画像でないと判
定し、形状距離値が許容値内のとき入力動画像が標準動
画像であると判定することを特徴とする。
【0044】
【発明の実施の形態】以下、本発明の実施の形態を説明
する。
【0045】[原理説明]基準形状として正規分布を用
いる場合について、本発明の原理を説明する。
【0046】統計解析の分野において、正規分布は多く
の現象のモデルとして使われている。そこで、注目する
現象が正規分布に従っているか否かを確かめることが重
要となり、このために「尖度」という統計量が用いられ
ている。尖度値は、注目する現象が正規分布に従ってい
るときは「3」に等しく、正規分布よりも尖った分布の
ときは「3」より大きく、反対に、正規分布よりもなだ
らかな分布のときは「3」より小さくなる。このこと
は、正規分布の分散の値にかかわらず、常に成り立つ。
【0047】そこで、標準パターン行列(或いは標準パ
ターン行列層)と入力パターン行列(或いは入力パター
ン行列層)との間の形状変化を、正規分布の値を成分と
する基準パターンベクトルの形状変化に置き換え、この
基準パターンベクトルの形状変化の大きさを尖度の変化
量として数値化することにより、標準パターン行列(或
いは標準パターン行列層)と入力パターン行列(或いは
入力パターン行列層)との類似の程度を形状距離値とし
て算出することができる。ただし、一般に、ベクトル形
状の尖度の計算式においては、ベクトルの成分値が負の
場合には定義できない。つまり、標準パターン行列(或
いは標準パターン行列層)の成分値と入力パターン行列
(或いは入力パターン行列層)の成分値のあらゆる大小
関係に対して、基準パターンベクトルの成分値が非負で
ある必要がある。
【0048】そこで具体的には、パターン行列(或いは
パターン行列層)の指定成分ごとに異なる分散の値をも
つ正規分布を作成し、上記正規分布の値を成分とする基
準パターン正ベクトルと、同正規分布の値を成分とする
基準パターン負ベクトルを予め作成しておく。ここで、
パターン行列に係わる上記分散の値の算出方法は、正規
分布の中心線がパターン行列の指定成分の点を通り、か
つ、パターン行列が成す平面に垂直になるようにし、上
記中心線を軸として正規分布を回転したとき、正規分布
の主要部分がパターン行列全体を覆うようにするもので
ある。また、パターン行列層に係わる上記分散の値の算
出方法は、パターン行列に係わる上記分散の値の算出方
法を1次元だけ拡張する(パターン行列層に係わる上記
分散の値の算出方法について幾何学的な表現はできな
い)。そして、パターン行列(或いはパターン行列層)
の各成分について、パターン行列(或いはパターン行列
層)の指定成分と各成分との間の長さを求め、基準パタ
ーン正ベクトル及び基準パターン負ベクトルの中心から
上記長さだけ離れた位置に最も近い基準パターン正ベク
トル及び基準パターン負ベクトルの成分番号を算出し、
入力パターン行列(或いは入力パターン行列層)の成分
値が標準パターン行列(或いは標準パターン行列層)の
成分値より大きいときは、その差の絶対値だけ基準パタ
ーン正ベクトルの上記成分番号の成分値を増加させ、小
さいときは、基準パターン負ベクトルの上記成分番号の
成分値を増加させる。次に、形状変化した基準パターン
正ベクトルと基準パターン負ベクトルについてそれぞれ
の尖度を算出し、2つの尖度の差の値を求める。
【0049】その際、正規分布の中心と標準パターン行
列及び入力パターン行列(或いは標準パターン行列層及
び入力パターン行列層)の各成分との位置関係により形
状変化した基準パターン正ベクトルと基準パターン負ベ
クトルの各尖度が異なるので、正規分布の中心をパター
ン行列(或いはパターン行列層)各成分の位置に移動し
ながら尖度の差の値を求め、これらの差の値の2乗和の
平方根、或いは、2乗和自身を標準パターン行列(或い
は標準パターン行列層)と入力パターン行列(或いは入
力パターン行列層)との間の形状距離値として検出す
る。
【0050】このような形状距離値は、標準音声と入力
音声との間のパターン行列形状変化を正確に検出するも
のであり、標準振動波と入力振動波との間の類似度を正
確に検出するものであり、標準画像と入力画像との間の
類似度を正確に検出するものである。また、標準立体と
入力立体との間のパターン行列層形状変化を正確に検出
するものであり、標準動画像と入力動画像との間の類似
度を正確に検出するものである。
【0051】従って、上記のように得られる形状距離値
を用いて音声認識を行うことにより、標準パターン行列
と入力パターン行列との間の形状変化を正確に検出する
ことができ、音声認識の精度を著しく向上させることが
できる。また、このような形状距離値を用いて機械の異
常判定を行うことにより、標準パターン行列と入力パタ
ーン行列との間の形状変化を正確に検出することがで
き、機械の異常検知の精度を著しく向上させることがで
きる。また、このような形状距離値を用いて画像認識を
行うことにより、標準パターン行列と入力パターン行列
との間の形状変化を正確に検出することができ、画像認
識の精度を著しく向上させることができる。また、この
ような形状距離値を用いて立体認識を行うことにより、
標準パターン行列層と入力パターン行列層との間の形状
変化を正確に検出することができ、立体認識の精度を著
しく向上させることができる。また、このような形状距
離値を用いて動画像認識を行うことにより、標準パター
ン行列層と入力パターン行列層との間の形状変化を正確
に検出することができ、動画像認識の精度を著しく向上
させることができる。
【0052】なお、基準形状が矩形など、正規分布以外
のものであっても、上記の説明は成立する。
【0053】[実施例]以下、本発明の実施例を添付図
面に基づいて説明する。本実施例では、2つのパターン
行列(2次元)間の類似度検出値を用いた音声認識方
法、機械の異常判定方法、画像認識方法について、更
に、2つのパターン行列層(3次元)間の類似度検出値
を用いた立体認識方法、動画像認識方法について順を追
って説明する。
【0054】(I)音声認識方法 音声の類似度検出方法及びその検出値を用いた音声認識
方法について述べる。本実施例では、音声認識を行うた
めに、音声の周波数分布の時間変化(声紋)を正規化し
て標準パターン行列と入力パターン行列とを作成し、こ
れらパターン行列間の形状変化を、正規分布の値を成分
とする基準パターンベクトルの形状変化に置き換え、こ
の基準パターンベクトルの形状変化の大きさを尖度の変
化量として数値化することにより音声の類似度を検出
し、更に、その検出値を用いて音声認識を行うものとす
る。
【0055】図1は、音声の類似度を検出するための測
定装置の構造を示しており、1はマイクロホンである。
マイクロホン1は発声者の近傍の定位置に配置され、人
間が発声する音声を測定し、信号として出力する。マイ
クロホン1の出力信号は、それぞれが異なる通過周波数
帯域を持つ複数m1個の帯域通過フィルタ2に入力さ
れ、音声の周波数成分波が抽出されてAD変換器3に入
力され、各AD変換器3において同時刻に且つ周期的に
ディジタル信号に変換されてコンピュータ等の演算装置
4に入力される。また、演算装置4は、マイクロホン1
の出力信号に基づき、以下のように音声の類似度検出処
理を行うように構成されている。ここで、i1(i1
1,2,・・・,m1)番目の帯域通過フィルタ2の中心周
波数はfi1に設定されており、その出力信号がi1番目
のAD変換器3に入力されるものとする。
【0056】次に、図1の測定装置構造を用いて行う音
声の類似度検出処理手順について説明する。
【0057】ただし、音声のパワースペクトルを抽出す
る方法として様々なものが考案されているが、本実施例
では、歴史的にも古く、性能が安定しているアナログ帯
域通過フィルタ群による方法を用いた場合について、処
理手順を説明する。図2は、帯域通過フィルタ2群の周
波数ゲイン特性の一例を示したものであり、音声をi 1
番目の帯域通過フィルタに通すことにより、中心周波数
がfi1の帯域の周波数成分波を抽出できることが分か
る。このように、それぞれの帯域通過フィルタを構成し
ておけば、音声の周波数分布の特徴が抽出できる。
【0058】図1に示すように、i1番目のAD変換器
3の出力信号を時刻tの関数としてxi1(t)(i1
1,2,・・・,m1)とした時、関数xi1(t)はi1
目の帯域通過フィルタ2を通して抽出した音声の周波数
成分波である。図3は、関数xi1(t)の一例を示し
たものである。図3に示すように、i2番目の時刻をt
2(i2=1,2,・・・,m2)として、関数xi
1(t)を各時刻ごとに区切って測定することにより音
声の周波数分布の時間変化の特徴が抽出できる。そのた
め、i1番目の周波数帯域におけるi2番目の時刻のパワ
ースペクトルPi12は次の数1により算出できる。た
だし、数1において、関数xi1(t)の2乗和を計算
する時間長Tは、時間的に変化する音声の特徴が顕著に
現れるように任意に設定しておく。
【0059】
【数1】
【0060】本実施例では、正規化パワースペクトルを
用いる。即ち、一般に、音声の類似度検出では、音量よ
りも音質が重要な要因になることが多い。この場合は、
パワースペクトルの形状変化を検出することが重要であ
り、このためには、数1のパワースペクトルPi12
を全エネルギーで正規化して使用した方が都合が良い。
1番目の周波数帯域におけるi2番目の時刻の正規化パ
ワースペクトルpi12 は、次の数2により算出でき
る。
【0061】
【数2】
【0062】図4(a)は数1により算出したパワース
ペクトルの一例を示したものであり、図4(b)は同図
(a)のパワースペクトルを数2を用いて正規化したも
のであるが、これらから、パワースペクトルと正規化パ
ワースペクトルとは相似形であることが分かる。
【0063】次に、標準音声の正規化パワースペクトル
pi12(i1=1,2,・・・,m1)(i2=1,2,・・
・,m2)を成分とする標準パターン行列Hと、入力音声
の正規化パワースペクトルpi12(i1=1,2,・・
・,m1)(i2=1,2,・・・,m2)を成分とする入力
パターン行列Nを作成する。この標準パターン行列H及
び入力パターン行列Nを、次の数3のように表現してお
く。ただし、数3は、標準音声及び入力音声の正規化パ
ワースペクトルの形状を、パターン行列のm1×m2個の
成分値で表現したものである。
【0064】
【数3】
【0065】また、図5(a)は、標準パターン行列H
を(周波数−時間)平面で表現したものであり、同図
(b)は、入力パターン行列Nを同平面で表現したもの
である。更に、図6は、図5(a)、(b)における同
平面の縦の長さと横の長さを1にした(周波数−時間)
正規化平面を示している。なお、本実施例では、図2に
示した帯域通過フィルタ群のそれぞれの帯域幅が異なっ
ている場合であっても、図6において、各成分の間の長
さが等間隔になるように作図するものとする。従って、
図6中に示すように、成分間の縦の長さは1/(m1
1)、成分間の横の長さは1/(m2−1)になる。
【0066】次の数4は、正規分布の確率密度関数の式
である。ただし、μは平均値、σ2は分散である。
【0067】
【数4】
【0068】図7(a)は、平均値μ=0、分散σj1
2 2としたとき、数4の正規分布のグラフ(正規曲線)
を示したものである。また、図7(b)、(c)におい
て正規曲線の関数値に等しい高さの棒グラフを示してい
るが、この棒グラフの高さの値を成分とする基準パター
ン正ベクトルKj12 (+)を図7(b)のように作成
し、また、同棒グラフの高さの値を成分とする基準パタ
ーン負ベクトルKj12 (-)を図7(c)のように作成
し、次の数5のように表現しておく。数5は正規分布の
形状をベクトルのm0個の成分値で表現したものであ
り、数3は行列(2次元)であるのに対し、数5はベク
トル(1次元)である。図7から分かるように、これら
一対の基準パターンベクトルKj12 (+)、Kj12 (-)
は相等なベクトルである。なお、数5中の添数j1
2は、図6に示す点(j1,j2)に対応するものであ
り、数5中のm0は数3中のm1及びm2と異なる任意の
自然数であってよい。
【0069】
【数5】
【0070】正規分布の平均値μ及び分散σj1
2 2は、正規分布の形状の特徴をベクトルのm0個の成分
値で表現できる範囲の任意の値に設定して良いが、ここ
では、平均値が基準パターンベクトル成分の中央の位置
にあり、分散が以下に述べる値に等しい場合を考える。
また、ここではm0が奇数の場合を考えているが、m0
偶数の場合にも同様の議論が成り立つ。
【0071】図8は、平均値μ=0、分散σ2としたと
き、数4の正規曲線を示したものであり、その尖度値は
「3」に等しい。ここで、図8中の記号(i)で示すy
の範囲においてf(y)の値が正規曲線の値より増加し
たとき、尖度値は「3」より大きくなり、記号(ii)で
示すyの範囲においてf(y)の値が正規曲線の値より
増加したとき、尖度値は「3」より小さくなる。また、
記号(i)と(ii)の境界部分のy(y=−0.7σの
近傍、または、y=+0.7σの近傍)において、f
(y)の値が正規曲線の値より増加したとき、尖度値の
変化量は少なく、尖度値は「3」に近い値になる。一
方、記号(iii)で示すyの範囲においてf(y)の値が
正規曲線の値より増加したとき、尖度値は「3」より大
きくなったり小さくなったりする不安定な動きになる。
このことは、正規分布の分散σ2の値にかかわらず、常
に成り立つ。
【0072】そこで、標準パターン行列と入力パターン
行列との間の形状変化を、正規分布の値を成分とする基
準パターンベクトルの形状変化に置き換え、この基準パ
ターンベクトルの形状変化の大きさを尖度の変化量とし
て数値化するためには、−2.1σ≦y≦+2.1σの
範囲(図8中の記号(i)と(ii)で示すyの範囲)に
おいてf(y)の値が増加するようにすれば、尖度値が
安定したものとなる。本実施例では、尖度値が「3」よ
り大きくなるyの範囲と、「3」より小さくなるyの範
囲が同程度の割合になるように、−1.4σ≦y≦+
1.4σの範囲を使用する。
【0073】一方、図6において、(周波数−時間)正
規化平面上の点(j1,j2)、及び、点(i1,i2)を
示している。また、同平面上のすべての点の中で、点
(j1,j2)から最も遠い点(m1,1)も示してい
る。従って、点(j1,j2)と点(i1,i2)との間の
長さλi1212は、次の数6により算出できる。同
様に、点(j1,j2)と点(m1,1)との間の長さλ
11j12は、次の数7により算出できる。λm11j
12は、点(j1,j2)と各点との間の長さの最大値で
ある。
【0074】
【数6】
【0075】
【数7】
【0076】図9は、図6に示す(周波数−時間)正規
化平面を3次元で表示したものである。図9において、
正規分布の中心線が点(j1,j2)を通り、かつ、(周
波数−時間)正規化平面に垂直であり、また、正規分布
のy軸が点(m1,1)を通る正規曲線を示している。
また、正規分布の中心線が点(j1,j2)を通り、か
つ、上記平面に垂直であり、また、正規分布のy軸が点
(i1,i2)を通る正規曲線も示している。ここで、こ
れら2つの正規曲線の分散σj12 2は、同じ値である
ものとする。従って、上記中心線を軸として正規曲線を
回転したとき、これら2つの正規曲線は一致する。
【0077】また、図7(a)に示す正規曲線は、図9
に示す2つの正規曲線を重ねて2次元で表示したもので
ある。図7(a)において、点(j1,j2)をy=0に
対応させ、点(m1,1)をy=−1.4σj12に対
応させている。従って、点(i1,i2)はy=0とy=
−1.4σj12の間のyの値に対応することになる。
【0078】また、点(j1,j2)と点(m1,1)と
の間の長さλm11j12は数7より算出できるが、図
7(a)に示すy軸上の0と−1.4σj12との間の
長さでもある。従って、次の数8より、正規分布の分散
の値が算出できる。
【0079】
【数8】
【0080】上記の方法により正規分布の分散の値を算
出すれば、正規分布の主要成分(数8の場合には−1.
4σ≦y≦+1.4σの範囲)が(周波数−時間)正規
化平面全体を覆うようにできる。即ち、数8より求めた
正規分布の分散の値を数4に適用することにより正規曲
線が決定され、更に、図7(b)、(c)、及び、数5
に適用することにより基準パターン正ベクトルKj12
(+)及び基準パターン負ベクトルKj12 (-)が作成でき
る。
【0081】ここで、パターン行列の指定成分としてj
12成分をj1=1〜m1、j2=1〜m2の中の一組の値
に固定しておいた上で、パターン行列のi12成分(i
1=1,2,・・・,m1)(i2=1,2,・・・,m2)のそ
れぞれについて考える。点(j1,j2)と点(i1
2)との間の長さλi1212は数6より算出でき
るが、図7(a)に示すように、λi1212は正規
分布の平均値からの偏差の値でもある。
【0082】一方、図7(c)に示すように、基準パタ
ーンベクトルの各成分番号の間の長さをΔyj12とし
たとき、成分番号i0(i0=1,2,・・・,m0)に対応
する正規分布の平均値からの偏差の値Lj120は、
次の数9により算出できる。なお、ここでは、基準パタ
ーンベクトルの各成分番号の間の長さが等間隔である場
合を考える。また、数9において(m0+1)/2は基
準パターンベクトルの中央の成分番号である。
【0083】
【数9】
【0084】図7(a)、(b)、(c)に、上記λi
1212とLj120との関係を示す。同図(a)
において、λi1212は点(j1,j2)と点
(i1,i2)との間の長さであることを示している。ま
た、同図(b)、(c)において、基準パターン正ベク
トル及び基準パターン負ベクトルの中心からλi12
12だけ離れた位置に最も近い基準パターン正ベクトル
及び基準パターン負ベクトルの成分番号がi0であり、
成分番号i0に対応する正規分布の平均値からの偏差の
値がLj120であることを示している。
【0085】即ち、パターン行列のj12成分とi12
成分が与えられたとき、数6よりこれら2点間の長さλ
1212が算出され、次に、基準パターンベクトル
について成分番号i0、正規分布の平均値からの偏差の
値Lj120、及び、成分値kj12 (+)0とkj1
2 (-)0が得られることになる。
【0086】ここで、基準パターンベクトルの成分の個
数m0を十分に大きく(Δyj12を十分に小さく)し
ておけば、λi1212の値とLj120の値との
間の誤差を十分に小さくすることができ、精度の高い計
算結果が得られる。また、成分番号i0と成分番号(m0
−i0+1)は正規分布の平均値に関して対称であるた
め、i0の代わりに(m0−i0+1)を用いてもよい。
【0087】次に、標準パターン行列Hと入力パターン
行列Nとの間の形状変化を、基準パターン正ベクトルK
12 (+)及び基準パターン負ベクトルKj12 (-)の形
状変化に置き換える。即ち、パターン行列のi12成分
(i1=1,2,・・・,m1 )(i2=1,2,・・・,
2)について、標準パターン行列Hの成分値hi12
と入力パターン行列Nの成分値ni12との間の変化量
の絶対値は|ni12−hi12|であるが、次の数1
0に示すように、ni12がhi12より大きいとき基
準パターン正ベクトルKj12 (+)の成分値kj12 (+)
0をこの変化量の絶対値|ni12−hi12|だけ
増加させ、ni12がhi12より小さいとき基準パタ
ーン負ベクトルKj12 (-)の成分値kj12 (-)0
この変化量の絶対値|ni12−hi12|だけ増加さ
せる。
【0088】
【数10】
【0089】従って、数8により正規分布の分散の値を
算出し、数10により基準パターンベクトルの成分値k
12 (+)0及びkj12 (-)0を増加させるようにす
れば、パターン行列のj12成分とi12成分のあらゆ
る組み合わせに対して、−1.4σ≦y≦+1.4σの
範囲においてf(y)の値が増加するようにできる。
【0090】次に、図10〜図16の模式図に示す典型
例を用いて、数10を説明する。これら図10〜図16
の各(a)、(b)は、パターン行列のm1×m2個の成
分値を行列形状として図形で表現したものであり、ま
た、これら図10〜図16の各(c)は、ベクトルのm
0個の成分値をベクトル形状として図形で表現したもの
である。なお、全体のパターン行列の中で1つの成分の
パワースペクトルだけが増加した場合、数2により正規
化を行うと、その成分の正規化パワースペクトルの増加
とともに、他の成分の正規化パワースペクトルが相対的
に減少することになるが、図10〜図16では、表示を
簡単にし且つ理解を容易にするため、入力パターン行列
形状の着目している成分についてのみ増減を表示し、他
の成分については変化がないものとしている。また、基
準パターン負ベクトル形状は、基準パターン正ベクトル
形状との対比を容易にするため、上下を逆に表示してい
る。
【0091】パターン行列の指定成分としてj12成分
を図6及び図9に示す位置に固定し、正規分布の中心線
がj12成分を通る場合について、図10〜図16を説
明すると下記の通りである。 (1)図10は、標準パターン行列形状と入力パターン
行列形状が等しい例を示したものである。この場合、基
準パターン正ベクトル及び基準パターン負ベクトルは共
に正規分布の形状から変化はない。 (2)図11は、標準パターン行列形状に対して入力パ
ターン行列形状のj12成分だけがδ1増加した例を示
したものである。この場合には、基準パターン正ベクト
ル形状の中央部分が同じ値δ1だけ増加し、基準パター
ン負ベクトル形状に変化はない。 (3)図12は、標準パターン行列形状に対して入力パ
ターン行列形状のj12成分だけがδ2減少した例を示
したものである。この場合には、基準パターン正ベクト
ル形状に変化はなく、基準パターン負ベクトル形状の中
央部分が同じ値δ 2だけ増加する。 (4)図13は、標準パターン行列形状に対して入力パ
ターン行列形状のm11成分だけがδ3増加した例を示し
たものである。この場合には、同図(b)に示すよう
に、j12成分とm11成分との間の長さはλm11j1
2であり、同図(c)に示すように、基準パターン正
ベクトル形状の中心からλm11j12だけ離れた位置
に最も近い基準パターン正ベクトル形状の成分番号は2
であり、この基準パターン正ベクトル形状の成分番号2
の成分値がδ3だけ増加している。一方、基準パターン
負ベクトル形状に変化はない。 (5)図14は、標準パターン行列形状に対して入力パ
ターン行列形状のm11成分だけがδ4減少した例を示し
たものである。この場合には、同図(b)に示すよう
に、j12成分とm11成分との間の長さはλm11j1
2であり、同図(c)に示すように、基準パターン負
ベクトル形状の中心からλm11j12だけ離れた位置
に最も近い基準パターン負ベクトル形状の成分番号は2
であり、この基準パターン負ベクトル形状の成分番号2
の成分値がδ4だけ増加している。一方、基準パターン
正ベクトル形状に変化はない。 (6)図15は、標準パターン行列形状に対して入力パ
ターン行列形状のi12成分だけがδ5増加した例を示
したものである。この場合にも、同図(b)に示すよう
に、j12成分とi12成分との間の長さはλi12
12であり、同図(c)に示すように、基準パターン正
ベクトル形状の中心からλi1212だけ離れた位置
に最も近い基準パターン正ベクトル形状の成分番号はi
0であり、この基準パターン正ベクトル形状の成分番号
0の成分値がδ5だけ増加している。 (7)図16は、標準パターン行列形状に対して入力パ
ターン行列形状のi12成分だけがδ6減少した例を示
したものである。この場合にも、同図(b)に示すよう
に、j12成分とi12成分との間の長さはλi12
12であり、同図(c)に示すように、基準パターン負
ベクトル形状の中心からλi1212だけ離れた位置
に最も近い基準パターン負ベクトル形状の成分番号がi
0であり、この基準パターン負ベクトル形状の成分番号
0の成分値がδ6だけ増加している。
【0092】図10〜図16においては標準パターン行
列形状及び入力パターン行列形状の典型例を示したが、
通常の場合には、標準パターン行列形状に対して入力パ
ターン行列形状の殆どの部分が変化するので、数6は変
化した全ての部分について長さの計算を行い、数10は
変化した全ての部分について形状変化の計算を行うもの
である。また、数10は、絶対的な形状を問題にしてい
るのではなく、相対的な形状変化を問題にしているた
め、任意形状の標準パターン行列及び入力パターン行列
について適用が可能である。
【0093】次に、数10により形状変化した一対の基
準パターンベクトル(基準パターン正ベクトルKj12
(+)と基準パターン負ベクトルKj12 (-) )につい
て、それぞれの形状変化の大きさを、尖度の変化量とし
て数値化する。
【0094】ここで、基準パターン正ベクトルKj12
(+)の尖度Aj12 (+)、及び、基準パターン負ベクトル
Kj12 (-)の尖度Aj12 (-)は、それぞれ次の数11
により算出できる。ただし、数11中のLj12
0(i0=1,2,・・・,m0)は、図10に示すように、
正規分布の平均値からの偏差の値であり、数9により正
規分布の形状の特徴を表現できる範囲の任意の値に設定
しておく。
【0095】
【数11】
【0096】数11より算出される尖度の値Aj12
(+)及びAj12 (-)は、正規分布の平均値(中心)のま
わりの4次の積率と、2次の積率の2乗との比である。
【0097】なお、正規分布に限らず、数11より、任
意の基準形状の尖度の値を算出できる。
【0098】前述したように、一般に、ベクトル形状の
尖度の計算式においては、ベクトルの成分値が負の場合
には定義できず、標準パターン行列の成分値と入力パタ
ーン行列の成分値のあらゆる大小関係に対して、基準パ
ターンベクトルの成分値が非負である必要がある。
【0099】このため、初期値が同形状の基準パターン
正ベクトルKj12 (+)及び、基準パターン負ベクトル
Kj12 (-)を作成しておき、数10ではそれらの成分
値の変化が非減少になるようにし、数11においてそれ
ぞれの尖度Aj12 (+)、Aj12 (-)を算出するように
している。
【0100】次に、基準パターン正ベクトルの尖度Aj
12 (+)と基準パターン負ベクトルの尖度Aj12 (-)
2つの変化量から、尖度の差の値(Aj12 (+)−Aj1
2 (-) )を以て、標準パターン行列と入力パターン行
列の類似の程度を表す形状変化量Dj12とする。
【0101】例えば、数5により正規分布形状に初期設
定された2つの基準パターンベクトルKj12 (+)及び
Kj12 (-)の尖度の値は、共に3に等しい。そのた
め、数10により形状変化した基準パターン正ベクトル
及び基準パターン負ベクトルの尖度の変化量は、それぞ
れ{Aj12 (+)−3}及び{Aj12 (-)−3}とな
る。即ち、正方向の変化量は{Aj12 (+)−3}、ま
た負方向の変化量は{Aj1 2 (-)−3}となり、全体
の変化量はこの差の値となる。従って、次の数12よ
り、形状変化量Dj12が算出できる。
【0102】
【数12】
【0103】次に、図10〜図16に示した標準パター
ン行列形状及び入力パターン行列形状の典型例それぞれ
の場合について、数12より算出される形状変化量Dj
12が示す値について考えてみると、以下の通りであ
る。 (1)図10に示すように、標準パターン行列形状と入
力パターン行列形状が等しい場合には、Aj12 (+)
3かつAj12 (-)=3より、形状変化量Dj12=0
になる。 (2)また、図11に示すように、標準パターン行列形
状に対して入力パターン行列形状のj12成分が増加し
た場合には、Aj12 (+)>3かつAj12 (-)=3によ
り、Dj12>0となる。 (3)図12に示すように、標準パターン行列形状に対
して入力パターン行列形状のj12成分が減少した場合
には、Aj12 (+)=3かつAj12 (-)>3により、D
12<0になる。 (4)一方、図13に示すように、標準パターン行列形
状に対して入力パターン行列形状のj12成分から遠く
離れた部分が増加した場合には、Aj12 (+)<3かつ
Aj12 (-)=3により、Dj12<0となる。 (5)図14に示すように、標準パターン行列形状に対
して入力パターン行列形状のj12成分から遠く離れた
部分が減少した場合には、Aj12 (+)=3かつAj1
2 (-)<3により、Dj12>0になる。 (6)図15に示すように、標準パターン行列形状に対
して入力パターン行列形状のj12成分から中程度離れ
た部分が増加した場合には、図8における記号(i)と
(ii)の境界部分のy(y=−0.7σの近傍、また
は、y=+0.7σの近傍)においてf(y)の値が正
規曲線より増加することになり尖度値の変化量が少ない
ため、Aj12 (+)≒3かつAj12 (-)=3により、D
12≒0となる。 (7)図16に示すように、標準パターン行列形状に対
して入力パターン行列形状のj12成分から中程度離れ
た部分が減少した場合には、図8における記号(i)と
(ii)の境界部分のy(y=−0.7σの近傍、また
は、y=+0.7σの近傍)においてf(y)の値が正
規曲線より増加することになり尖度値の変化量が少ない
ため、Aj12 (+)=3かつAj12 (-)≒3により、D
12≒0となる。
【0104】即ち、正規分布の中央付近(パターン行列
形状のj12成分の近傍)において、入力音声の正規化
パワースペクトルが標準音声の正規化パワースペクトル
に対して相対的に強くなったときは、形状変化量Dj1
2は正の値で、かつ,相対強度に比例して増加する。
逆に、正規分布の中央付近において、入力音声の正規化
パワースペクトルが標準音声の正規化パワースペクトル
に対して相対的に弱くなったときは、形状変化量Dj1
2は負の値で、かつ,相対強度に比例して減少する。
【0105】そこで、正規分布の平均値を標準パターン
行列形状の各成分位置に順次移動させた場合について、
各位置での形状変化量を求める。図17は標準パターン
行列形状に対して入力パターン行列形状のi12成分だ
けが増加した例を示す。図18は、図17の例におい
て、正規分布の平均値が点(j1,j2)(j1=1,
2,・・・,m1 )(j2=1,2,・・・,m2)の位置に移
動したときのそれぞれの場合について、異なる分散の値
をもつ正規分布、及び、正規分布の平均値と点(i 1
2)との間の長さλi1212(j1=1,2,・・
・,m1 )(j2=1,2,・・・,m2)を示したものであ
る。また、図19は、図18のそれぞれの場合につい
て、基準パターン正ベクトル形状及び基準パターン負ベ
クトル形状を示したものである。
【0106】図18では、点(j1,j2)(j1=1,
2,・・・,m1 )(j2=1,2,・・・,m2)のそれぞれ
の場合について、(周波数−時間)正規化平面上のすべ
ての点の中で点(j1,j2)から最も遠い点を数7に適
用して点(j1,j2)と各点との間の長さの最大値を求
め、数8により点(j1,j2)ごとに異なる分散の値を
もつ正規分布を作成している。従って、正規分布の中心
線が点(j1,j2)を通り、かつ、上記平面に垂直にな
るようにし、上記中心線を軸として正規分布を回転した
とき、正規分布の主要部分が正規分布の平均値の位置に
かかわらず常に上記平面全体を覆うようにできる。これ
にともない、図19では、点(j1,j2)のそれぞれの
場合に対応して、基準パターン正ベクトル形状及び基準
パターン負ベクトル形状は異なるものになっている。
【0107】図17では、同図(a)の標準パターン行
列形状に対して、同図(b)の入力パターン行列形状の
12成分がδ増加しているが、図18において、正規
分布の平均値と点(i1,i2)との間の長さλi12
12(j1=1,2,・・・,m 1 )(j2=1,2,・・・,
2)を示し、図19においては、それぞれの基準パタ
ーン正ベクトル形状においてのみ、その中心からλi1
212だけ離れた位置に最も近い基準パターン正ベ
クトル形状の成分番号に対応する部分が同じ値δだけ増
加し、基準パターン負ベクトル形状に変化がないことを
示している。
【0108】また、正規分布の平均値が標準パターン行
列形状の中心位置から離れている場合、図18中の記号
アで示す部分は、標準パターン行列及び入力パターン行
列の成分番号(i1=1,2,・・・,m1 )(i2=1,
2,・・・,m2)に対応していないため、これに対応する
基準パターン正ベクトル形状においては、常に値の変化
はない。
【0109】ここで、数11において、正規分布の平均
値からの偏差の値Lj120は、2乗または4乗され
ている。一方、基準パターン正ベクトル形状及び基準パ
ターン負ベクトル形状においては、成分番号i0と成分
番号(m0−i0+1)は正規分布の平均値に関して対称
である。このため、正規分布の平均値からの偏差の値L
120の2乗の値または4乗の値は、Lj12(m0
−i0+1)の2乗の値または4乗の値に等しい。従っ
て、成分番号i0の代わりに成分番号(m0−i0+1)を
用いてもよい。
【0110】なお、特開平10−253444号公報
(特願平9−61007号)の段落[0066]におい
ては「図11中の記号イで示す部分は、基準パターン正
ベクトル及び基準パターン負ベクトルの値の作成範囲外
であるため、破線で示す入力パターンベクトルの変化に
かかわらず、常に値の変化はない」としているが、本発
明においては、例えば数7及び数8により点(j1
2)ごとに異なる分散の値をもつ正規分布を作成し、
正規分布の主要部分が正規分布の平均値の位置にかかわ
らず常にパターン行列全体を覆うようにしたため、標準
パターン行列及び入力パターン行列のすべての成分番号
について常に値を変化させることが可能になった。これ
により、標準パターン行列と入力パターン行列との間の
形状変化のすべてが尖度の値に反映するようになり、類
似度検出性能が向上する。
【0111】このようにして、正規分布の平均値を標準
パターン行列形状のj12成分(j 1=1,2,・・・,m
1 )(j2=1,2,・・・,m2)の位置に移動させたと
きのそれぞれの場合について、前記と同様の数7,数
8、数5、数9、数6、数10,数11,数12を順に
用いた処理手順により形状変化量Dj12(j1=1,
2,・・・,m1 )(j2=1,2,・・・,m2)を算出す
る。この様子が図18及び図19に示されている。ただ
し、図19に示すように、数11におけるLj120
(i0=1,2,・・・,m0)は、移動した正規分布のそ
れぞれの平均値からの偏差の値であり、また、kj12
(+)0及びkj12 (-)0(i0=1,2,・・・,m0
は、このLj120に対応するものである。
【0112】図20は、数5〜数12を用いて、m1×
2 個の形状変化量Dj12を算出する処理手順を示し
たフローチャートである。ここでは、数3により標準パ
ターン行列H及び入力パターン行列Nを作成した後の処
理手順を示しており、図20中のステップS3−1〜S
3−9は図24中のステップS3の詳細でもある。
【0113】図20において、最初のステップS3−1
では、j1=1,j2=1と初期設定しておき、次のステ
ップS3−2からステップS3−7では、j2=m2まで
2を1ずつ増加し、ステップS3−2からステップS
3−9では、j1=m1までj 1を1ずつ増加して形状変
化量Dj12を算出するループに入る。
【0114】この形状変化量算出ループ内のステップS
3−2では、ループを回る毎に、1対の基準パターンベ
クトル(基準パターン正ベクトルKj12 (+)と基準パ
ターン負ベクトルKj12 (-) )を数7、数8、数5、
数9を順に用いて作成する。即ち、数7により点
(j1,j2)と各点との間の長さの最大値を求め、数8
により正規分布の分散の値を算出し、数5及び数9によ
り正規分布の値を成分とする基準パターン正ベクトル及
び基準パターン負ベクトルを作成する。次に、ステップ
S3−3からステップS3−5では、数6、数10、数
11、数12を順に用いて形状変化量Dj12を算出す
る。即ち、ステップS3−3で、(周波数−時間)正規
化平面上の各点について、数6により点(j1,j2)と
各点との間の長さを求め、基準パターン正ベクトル及び
基準パターン負ベクトルの中心から上記長さだけ離れた
位置に最も近い基準パターン正ベクトル及び基準パター
ン負ベクトルの成分番号を算出し、数10により基準パ
ターン正ベクトルKj12 (+)及び基準パターン負ベク
トルKj12 (-)の形状を変化させ、ステップS3−4
で、数11を用いて基準パターン正ベクトルの尖度Aj
12 (+)及び基準パターン負ベクトルの尖度Aj12 (-)
を算出し、ステップS3−5で、数12を用いて形状変
化量Dj12を算出する。
【0115】このような処理手順により、j12成分
(j1=1,2,・・・,m1 )(j2=1,2,・・・,
2)に対応するそれぞれの場合についてm1×m2個の
形状変化量Dj12を算出することができる。
【0116】図21は、図17〜図19で示した標準パ
ターン行列形状及び入力パターン行列形状について、図
20の処理手順を用いて算出したパターン行列の成分別
形状変化量の模式図である。
【0117】正規分布の平均値が、図18及び図19の
ように標準パターン行列形状に対して入力パターン行列
形状が増加した部分と同じ位置に移動したとき、図21
のように形状変化量は最大となり(同図中、Di12
示す部分)、離れた位置に移動したとき負の値になるこ
とが分かる。
【0118】なお、特開平10−253444号公報
(特願平9−61007)の段落[0076]におい
て、[また、さらに離れた位置に移動したときは、図1
1中の記号イで示す部分が現れるため、図13のように
形状変化量は0となる(同図中、中心周波数f1の帯域
に対応するもの)。」としているが、本発明において
は、標準パターン行列及び入力パターン行列のすべての
成分番号について常に値を変化させることを可能にした
ため形状変化量が0に固定されることがなくなった。こ
れにより、標準パターン行列と入力パターン行列との間
の形状変化のすべてが尖度の値に反映するようになり、
類似度検出性能が向上する。
【0119】このように、形状変化量Dj12 、即
ち、形状変化した基準パターン正ベクトルの尖度と基準
パターン負ベクトルの尖度との差(Aj12 (+)−Aj1
2 (-) )は、標準パターン行列形状に対して入力パター
ン行列形状が増加した部分と同じ位置に基準形状の中心
が移動した場合において、その値が増加することにな
る。
【0120】即ち、入力音声の正規化パワースペクトル
が、標準音声の正規化パワースペクトルに対してパター
ン行列のどの成分においてどの程度強くなっているか
を、形状変化量として検出することができる。
【0121】次に、上記のようにして得られたm1×m2
個の形状変化量Dj12(j1=1,2,・・・,m1
(j2=1,2,・・・,m2)を用いて、標準パターン行
列形状と入力パターン行列形状との差を、2つのパター
ン行列間の1個の形状距離値として数値化する。
【0122】この形状距離値はm1×m2個の形状変化量
Dj12の積算であると考えられる。従って、次の数1
3より、形状距離値dを算出できる。
【0123】
【数13】
【0124】数13ではm1×m2個の形状変化量Dj1
2の2乗和の平方根を形状距離値としているが、次の
数14のように、m1×m2個の形状変化量Dj12の2
乗和自身を形状距離値dとすることもできる。
【0125】
【数14】
【0126】以上で形状距離値の算出方法を述べたが、
次に、この方法を用いて図39、図40に示した標準音
声20及び入力音声21、22、23について、標準パ
ターン行列20Aと各入力パターン行列21A、22
A、23Aとの間の形状距離値d21、d22,d23
を算出することを考えてみる。
【0127】図22は、図40における変数αの値を0
から1まで増加させたとき、形状距離値d21、d2
2、d23が変化する様子を示したものである。この図
22から、図39、図40の例では、形状距離値は常に
d21=d22<d23であり、αの値が増加するにつ
れて、形状距離値d21、d22、d23も増加するこ
とが分かる。
【0128】ここで、図39、図40の例で変数αが小
さい場合について、仮に、入力音声21と入力音声22
は摩擦子音/s/の「スペクトル強度のゆらぎ」であ
り、入力音声23は摩擦子音/s/とは異なる音声であ
るとする。
【0129】従来は標準音声からのユークリッド距離や
角度の値を用いているため、図39、図40において入
力音声21、22、23の変数αの値が同じときには、
図43及び図44に示したように、入力音声21、22
が標準音声であり、入力音声23は標準音声でないこと
を判定できなかった。
【0130】これに対し、本発明では、入力音声21、
22、23のαの値が同じときでも、図22に2つの白
丸印5、6で示すように、標準音声からの形状距離値d
21、d22、d23と任意に設定した許容値とを比較
することにより、白丸印6の入力音声は標準音声であ
り、白丸印5の入力音声は標準音声でないと判定するこ
とができる。つまり、摩擦子音/s/の入力音声21、
22と、摩擦子音/s/とは異なる入力音声23とを区
別できる。
【0131】更に、上記の形状距離値の算出方法を用い
て図41、図42に示した標準音声24及び入力音声2
5、26、27について、標準パターン行列24Aと各
入力パターン行列25A、26A、27Aとの間の形状
距離値d25、d26、d27を算出することを考えて
みる。
【0132】図23は、図42における変数βの値を0
から1まで増加させたとき、形状距離値d25、d2
6、d27が変化する様子を示したものである。この図
23から、図41、図42の例では、形状距離値は常に
d25<d26<d27であり、βの値が増加するにつ
れて、形状距離値d25、d26、d27も増加するこ
とが分かる。
【0133】ここで、図41、図42の例で、仮に、入
力音声25は標準音声24と同じ音声であって、そのピ
ークに「周波数のずれ」または「時間のずれ」が発生し
たものであり、入力音声26と入力音声27は標準音声
24とは異なる音声であるとする。
【0134】従来は標準音声からのユークリッド距離や
角度の値を用いているため、図41、図42において入
力音声25、26、27の変数βの値が同じときには、
図45及び図46に示したように、入力音声25が標準
音声であり、入力音声26、27は標準音声でないこと
を判定できなかった。
【0135】これに対し、本発明では、入力音声25、
26、27のβの値が同じときでも、図23に3つの白
丸印7、8、9で示すように、標準音声からの形状距離
値d25、d26、d27と任意に設定した許容値とを
比較することにより、白丸印9の入力音声は標準音声で
あり、白丸印7、8の入力音声は標準音声でないと判定
することができる。つまり、標準音声24と同じ入力音
声25と、標準音声24とは異なる入力音声26、27
とを区別できる。
【0136】また、図41、図42において、標準音声
24のピークに対する入力音声25、26、27のピー
クの[周波数のずれ」または「時間のずれ」の大きさ
は、入力音声25、26、27の順に大きくなってい
る。一方、図23において、形状距離値はd25<d2
6<d27となっており、形状距離値を用いれば、これ
らピークの[周波数のずれ」または「時間のずれ」の大
きさも検出できる。
【0137】次に、以上で述べた音声の類似度検出方法
を用いてコンピュータが連続的に音声の類似度を検出
し、音声を認識する一例を図24を参照して説明する。
【0138】図24はコンピュータが音声を認識するた
めのフローチャートである。図24において、ステップ
S1では標準音声から標準パターン行列を予め作成して
おく。次のステップS2では入力音声から入力パターン
行列を作成し、ステップS3では形状変化量Dj1
2(j1=1,2,・・・,m1 )(j2=1,2,・・・,
2)を算出する。ここで、ステップS3の形状変化量
の算出手順は、前述した図20におけるステップS3−
1からステップS3−9により構成される。そして、ス
テップS4では形状距離値dを算出し、ステップS5で
は許容値と比較して判定を行う。判定の後、再び、ステ
ップS2からの処理を繰り返す。
【0139】このような処理手順により、音声を連続的
に認識することができる。形状距離値dが許容値を越え
たとき、ステップS6で入力音声は標準音声でないと判
定し、形状距離値dが許容値内のとき、ステップS7で
入力音声は標準音声であると判定する。
【0140】ところで、一般に、音声認識においては、
例えば/a/、/i/、/u/、/e/、/o/という
音声のように、入力音声が複数の音声のうちのどれであ
るかを認識することが多い。このような場合には、/a
/、/i/、/u/、/e/、/o/というそれぞれの
音声を別々の標準音声と考え、これらの標準音声から5
個の標準パターン行列を作成しておく。
【0141】次に、入力音声からは1個の入力パターン
行列を作成し、この入力パターン行列と上記5個の各標
準パターン行列との間の形状距離値を算出し、これらの
形状距離値のうちの最小値と、任意に設定した許容値と
を比較し、最小の形状距離値が許容値を越えていないと
きには、入力音声は最小の形状距離値を与える標準音声
であると判定し、越えたときには入力音声は5個の標準
音声のいずれでもないと判定する。
【0142】図25は、上記の処理手順を実現するた
め、音声の類似度検出装置としてブロック図で示したも
のである。図25において、10はパターンベクトル生
成器、11はパターン行列生成器、12は比較器、1
3、14、15は計算器である。
【0143】パターンベクトル生成器10は、正規分布
の値を成分とする基準パターン正ベクトルKj12 (+)
及び基準パターン負ベクトルKj12 (-)を生成し、パ
ターン行列生成器11は、標準音声の特徴量を成分とす
る標準パターン行列Hと、入力音声の特徴量を成分とす
る入力パターン行列Nとを生成する。比較器12は、パ
ターン行列の各成分について、入力パターン行列の成分
値が標準パターン行列の成分値より大きいか否かを比較
する。計算器13は、パターン行列の指定成分と各成分
との間の長さを求め、基準パターンベクトルの中心から
上記長さだけ離れた位置に最も近い基準パターンベクト
ルの成分番号を算出し、入力パターン行列の成分値が標
準パターン行列の成分値より大きいとき、その差の絶対
値だけ基準パターン正ベクトルKj12 (+)の上記成分
番号の成分値を増加させ、入力パターン行列の成分値が
標準パターン行列の成分値より小さいとき、その差の絶
対値だけ基準パターン負ベクトルKj12 (-)の上記成
分番号の成分値を増加させる。計算器14は、上記増加
手段13により生成された基準パターン正ベクトルKj
12 (+)の尖度と上記増加手段13により生成された基
準パターン負ベクトルKj12 (-)の尖度との差の値を
算出する。ここで、尖度の差の値を算出するに際し、パ
ターン行列の指定成分を各成分の位置に移動しながら尖
度の差の値を求める。計算器15は、上記尖度の差の値
の2乗和の平方根を算出することにより、標準パターン
行列と入力パターン行列の間の形状距離値dを得る。
【0144】以上要するに、図24に示すように、標準
音声の特徴量を成分とする標準パターン行列と、入力音
声の特徴量を成分とする入力パターン行列とを作成し
(ステップS1〜S2)、パターン行列の指定成分ごと
に異なる分散の値をもつ基準形状を作成し、上記基準形
状の値を成分とする基準パターン正ベクトル及び基準パ
ターン負ベクトルを作成し、パターン行列の指定成分
(基準形状の中心)を標準パターン行列のj1=1 〜
1,j2=1〜m2各成分位置に順次合わせながら、標
準パターン行列と入力パターン行列間の形状の変化を、
基準パターン正ベクトルと基準パターン負ベクトルの形
状変化に置き換え、これら基準パターン正ベクトルと基
準パターン負ベクトルの尖度の変化量を数値化して形状
変化量Dj12とし(ステップS3)、形状変化量Dj
12 (j1=1 ,2,…,m1)(j2=1,2,…,m
2)から標準音声と入力音声のパターン行列形状につい
ての形状距離値dを算出することにより(ステップS
4)、正確な音声の類似度検出値を得ることができる。
また、この音声類似度検出値(形状距離値d)を任意に
設定した許容値と比較し(ステップS5)、形状距離値
dが許容値を越えたとき入力音声は標準音声でないと判
定し(ステップS6)、形状距離値dが許容値内のとき
入力音声は標準音声であると判定する(ステップS7)
ことにより、正確な音声認識結果を得ることができる。
【0145】(II)機械の異常判定方法 次に、振動波の類似度検出方法及びその検出値を用いた
機械の異常判定方法について述べる。本実施例では、機
械の異常判定を行うために、振動波の周波数分布の時間
変化を正規化して標準パターン行列と入力パターン行列
とを作成し、これらパターン行列間の形状変化を、正規
分布の値を成分とする基準パターンベクトルの形状変化
に置き換え、この基準パターンベクトルの形状変化の大
きさを尖度の変化量として数値化することにより振動波
の類似度を検出し、更に、その検出値を用いて機械の異
常判定を行うものとする。
【0146】図1において、マイクロホンの代わりに、
適宜な振動センサにより機械の振動波を測定する。図1
に示すように、i1番目のAD変換器3の出力信号を時
刻tの関数としてxi1(t)(i1=1,2,・・・,
1)とした時、関数xi1(t)はi1番目の帯域通過
フィルタ2を通して抽出した振動波の周波数成分波であ
る。また、図3において、i2番目の時刻をti2(i2
=1,2,・・・,m2)として、関数xi1(t)を各時
刻ごとに区切って測定することにより振動波の周波数分
布の時間変化の特徴が抽出できる。そのため、i1番目
の周波数帯域におけるi2番目の時刻のパワースペクト
ルPi12は数1により算出できる。ただし、関数xi
1(t)の2乗和を計算する時間長Tは、時間的に変化
する振動波の特徴が顕著に現れるように任意に設定して
おく。
【0147】以上で述べた音声の類似度検出処理手順
を、上記で算出した振動波のパワースペクトルPi12
に適用し、機械の異常判定を行う。
【0148】具体的には、標準振動波の特徴量を成分と
する標準パターン行列と入力振動波の特徴量を成分とす
る入力パターン行列とを作成し、これらのパターン行列
形状変化を基準パターン正ベクトル及び基準パターン負
ベクトルの形状変化に置き換えて、この形状変化の大き
さを尖度の変化量とし、基準パターン正ベクトルと基準
パターン負ベクトルの尖度の差から、標準パターン行列
と入力パターン行列との間の形状距離値を算出し、得ら
れた形状距離値と任意に設定した許容値とを比較し、形
状距離値が許容値を越えたとき機械は異常であると判定
し、形状距離値が許容値内のとき正常であると判定す
る。
【0149】(III)画像認識方法 次に、画像の類似度検出方法及びその検出値を用いた画
像認識方法について述べる。本実施例では、画像認識を
行うために、画像の濃度パターンを正規化して標準パタ
ーン行列と入力パターン行列とを作成し、これらパター
ン行列間の形状変化を、正規分布の値を成分とする基準
パターンベクトルの形状変化に置き換え、この基準パタ
ーンベクトルの形状変化の大きさを尖度の変化量として
数値化することにより画像の類似度を検出し、更に、そ
の検出値を用いて画像認識を行うものとする。
【0150】図26は、アルファベット”E”の画像の
一例である。同図に示されるように、画像はx方向及び
y方向をそれぞれm1個及びm2個に区切ったm1×m2
の画素により構成される。ここで、x方向にi1番目、
かつ、y方向にi2番目の画素における画像の濃度をP
12とすると、正規化濃度pi12は数2により算出
できる。
【0151】次に、標準画像の正規化濃度pi12(i
1=1,2,・・・,m1)(i2=1,2,・・・,m2)を成
分とする標準パターン行列Hと、入力画像の正規化濃度
pi 12(i1=1,2,・・・,m1)(i2=1,2,・・
・,m2)を成分とする入力パターン行列Nを作成する。
この標準パターン行列H及び入力パターン行列Nを、数
3のように表現しておく。ただし、数3は、標準画像及
び入力画像の正規化濃度の形状を、パターン行列のm1
×m2個の成分値で表現したものであると読み替える。
【0152】また、図27(a)は、標準パターン行列
Hを(x−y)平面で表現したものであり、同図(b)
は、入力パターン行列Nを同平面で表現したものであ
る。
【0153】先に述べた音声の類似度検出処理手順を、
上記で作成した画像の標準パターン行列H及び入力パタ
ーン行列Nに適用し、画像認識を行う。
【0154】具体的には、標準画像の特徴量を成分とす
る標準パターン行列と入力画像の特徴量を成分とする入
力パターン行列とを作成し、これらのパターン行列形状
変化を基準パターン正ベクトル及び基準パターン負ベク
トルの形状変化に置き換えて、この形状変化の大きさを
尖度の変化量とし、基準パターン正ベクトルと基準パタ
ーン負ベクトルの尖度の差から、標準パターン行列と入
力パターン行列との間の形状距離値を算出し、得られた
形状距離値と任意に設定した許容値とを比較し、形状距
離値が許容値を越えたとき入力画像は標準画像でないと
判定し、形状距離値が許容値内のとき入力画像が標準画
像であると判定する。
【0155】[実験例]次に、図28、図29及び図3
0(a)、(b)、(c)を参照して実験例を説明す
る。図28、図29は、記号”+”の濃度形状を持つ標
準画像16、及び、この標準画像と全画素の濃度の合計
が同じであるが横線の位置が異なる入力画像17、1
8、19について、標準画像16の濃度を成分とする7
行9列の標準パターン行列16Aを予め登録しておき、
また、各入力画像17、18、19の濃度を成分とする
7行9列の入力パターン行列17A、18A、19Aを
作成し、標準パターン行列16Aと各入力パターン行列
17A、18A、19Aとの間の類似性尺度として、ユ
ークリッド距離または角度の余弦e17、e18、e1
9、及び、本発明による形状距離d17、d18、d1
9を算出する様子を模式的に示したものである。なお、
図29では、表示を簡単にするため、標準パターン行列
H及び入力パターン行列Nの成分値を正規化しないで表
示している。
【0156】図30(a)、(b)、(c)は、それぞ
れ実験で得られたユークリッド距離値e17、e18、
e19、角度の余弦値e17、e18、e19、及び、
形状距離値d17、d18、d19を棒グラフで示した
ものである。
【0157】上述の如く、図30(a)、(b)、
(c)は同一の測定データからユークリッド距離値、角
度の余弦値、及び、形状距離値を算出し、標準画像と入
力画像との間のそれぞれの距離値を棒グラフで表したも
のであり、図30(a)、(b)、(c)によれば、以
下のことがいえる。 (1)図28、図29において、標準画像16の横線に
対する入力画像17、18、19の横線の「位置のず
れ」の大きさは、入力画像17、18、19の順に大き
くなっている。図30(a)、(b)においては、ユー
クリッド距離、角度の余弦ともにe17=e18=e1
9となっており、ユークリッド距離や角度の余弦を用い
ても、これら横線の「位置のずれ」の大きさを検出でき
ない。一方、図30(c)において、形状距離はd17
<d18<d19となっており、形状距離を用いれば、
これら横線の「位置のずれ」の大きさを検出できる。 (2)図28、図29において、仮に、入力画像17は
標準画像16と同じ画像であって、その横線に「位置の
ずれ」が発生したものであり、入力画像18と入力画像
19は標準画像16とは異なる画像であるとする。ここ
で、ユークリッド距離や角度の余弦を用いたとき、図3
0(a)、(b)において許容値をどのような位置に設
定しても、入力画像17が標準画像であり、入力画像1
8、19は標準画像でないことを判定できない。一方、
形状距離を用いたとき、図30(c)に示す位置に許容
値を設定したならば、入力画像17は標準画像であり、
入力画像18、19は標準画像でないと判定することが
できる。
【0158】以上の実験結果より、ユークリッド距離ま
たは角度の余弦を用いるよりも形状距離を用いる方が、
より正確に画像の類似度の検出が行えることが理解でき
る。
【0159】(IV)立体認識方法 次に、立体の類似度検出方法及びその検出値を用いた立
体認識方法について述べる。本実施例では、立体認識を
行うために、立体の密度(単位体積の質量)パターンを
正規化して標準パターン行列層と入力パターン行列層と
を作成し、これらパターン行列層間の形状変化を、正規
分布の値を成分とする基準パターンベクトルの形状変化
に置き換え、この基準パターンベクトルの形状変化の大
きさを尖度の変化量として数値化することにより立体の
類似度を検出し、更に、その検出値を用いて立体認識を
行うものとする。
【0160】ここでは、先に述べた音声、振動波、画像
等、2つのパターン行列(2次元)間の類似度検出方法
を、2つのパターン行列層(3次元)間の類似度検出方
法に拡張する。
【0161】図31は、立体の密度(単位体積の質量)
分布を示したものである。同図に示されるように、立体
はx方向、y方向、z方向をそれぞれm1個、m2個、m
3個に区切ったm1×m2×m3個の区画により構成され
る。ここで、x方向にi1番目、かつ、y方向にi2
目、かつ、z方向にi3番目の区画における立体の密度
をPi123とすると、正規化密度pi123は、数
2の代わりに、次の数15により算出できる。
【0162】
【数15】
【0163】次に、標準立体の正規化密度pi123
(i1=1,2,・・・,m1)(i2=1,2,・・・,m2
(i3=1,2,・・・,m3)を成分とする標準パターン
行列層Hと、入力立体の正規化密度pi123(i1
1,2,・・・,m1)(i2=1,2,・・・,m2)(i3
1,2,・・・,m3)を成分とする入力パターン行列層N
を作成する。この標準パターン行列層H及び入力パター
ン行列層Nを、数3の代わりに、次の数16、数17の
ように表現しておく。ただし、数16は標準立体の正規
化密度の形状を、数17は入力立体の正規化密度の形状
を、パターン行列層のm1×m2×m3個の成分値で表現
したものである。
【0164】
【数16】
【0165】
【数17】
【0166】また、図32は、標準パターン行列層Hを
(x−y−z)空間で表現したものであり、図33は、
入力パターン行列層Nを同空間で表現したものである。
更に、図34は、図32、図33における同空間の縦の
長さと横の長さと高さの長さを1にした(x−y−z)
正規化空間を示している。従って、図中に示すように、
成分間の縦の長さは1/(m1−1)、成分間の横の長
さは1/(m2−1)、成分間の高さの長さは1/(m3
−1)になる。
【0167】図35(a)は、平均値μ=0、分散σj
123 2としたとき、数4の正規分布のグラフ(正規曲
線)を示したものである。また、図35(b)、(c)
において正規曲線の関数値に等しい高さの棒グラフを示
しているが、この棒グラフの高さの値を成分とする基準
パターン正ベクトルKj123 (+)を図35(b)のよ
うに作成し、また、同棒グラフの高さの値を成分とする
基準パターン負ベクトルKj123 (-)を図35(c)
のように作成し、数5の代わりに、次の数18のように
表現しておく。数18は正規分布の形状をベクトルのm
0個の成分値で表現したものであり、数16、数17は
行列層(3次元)であるのに対し、数18はベクトル
(1次元)である。図35から分かるように、これら一
対の基準パターンベクトルKj123 (+)、Kj12
3 (-)は相等なベクトルである。なお、数18中の添数j
123は、図34に示す点(j1,j2,j3)に対応す
るものであり、数18中のm0は数16、数17中の
1、m2及びm3と異なる任意の自然数であってよい。
【0168】
【数18】
【0169】一方、図34において、(x−y−z)正
規化空間内の点(j1,j2,j3)、及び、点(i1,i
2,i3)を示している。また、同空間内のすべての点の
中で、点(j1,j2,j3)から最も遠い点(m1,1,
1)も示している。従って、点(j1,j2,j3)と点
(i1,i2,i3)との間の長さλi123123
は、数6の代わりに、次の数19により算出できる。同
様に、点(j1,j2,j3)と点(m1,1,1)との間
の長さλm111j123は、数7の代わりに、次の数
20により算出できる。λm111j123は、点(j
1,j2,j3)と各点との間の長さの最大値である。
【0170】
【数19】
【0171】
【数20】
【0172】また、図7(a)に示す正規曲線は、図9
に示す2つの正規曲線を重ねて2次元で表示したもので
あったが、図35(a)に示す正規曲線は、これと同様
な考えで、図9を1次元だけ拡張したものである(これ
について幾何学的な表現はできない)。図35(a)に
おいて、点(j1,j2,j3)をy=0に対応させ、点
(m1,1,1)をy=−1.4σj123に対応させ
ている。従って、点(i1,i2,i3)はy=0とy=
−1.4σj123の間のyの値に対応することにな
る。
【0173】また、点(j1,j2,j3)と点(m1
1,1)との間の長さλm111j1 23は数20より
算出できるが、図35(a)に示すy軸上の0と−1.
4σj 123との間の長さでもある。従って、数8の
代わりに、次の数21より、正規分布の分散の値が算出
できる。
【0174】
【数21】
【0175】上記の方法により正規分布の分散の値を算
出すれば、正規分布の主要成分(数21の場合には−
1.4σ≦y≦+1.4σの範囲)が(x−y−z)正
規化空間全体を覆うようにできる。即ち、数21より求
めた正規分布の分散の値を数4に適用することにより正
規曲線が決定され、更に、図35(b)、(c)、及
び、数18に適用することにより基準パターン正ベクト
ルKj123 (+)及び基準パターン負ベクトルKj12
3 (-)が作成できる。
【0176】ここで、パターン行列層の指定成分として
123成分をj1=1〜m1、j2=1〜m2、j3=1
〜m3の中の一組の値に固定しておいた上で、パターン
行列層のi123成分(i1=1,2,・・・,m1)(i
2=1,2,・・・,m2)(i3=1,2,・・・,m3)のそ
れぞれについて考える。点(j1,j2,j3)と点
(i1,i2,i3)との間の長さλi123123
は数19より算出できるが、図35(a)に示すよう
に、λi123123は正規分布の平均値からの偏
差の値でもある。
【0177】一方、図35(c)に示すように、基準パ
ターンベクトルの各成分番号の間の長さをΔyj12
3としたとき、成分番号i0(i0=1,2,・・・,m0
に対応する正規分布の平均値からの偏差の値Lj12
30は、数9の代わりに、次の数22により算出でき
る。なお、ここでは、基準パターンベクトルの各成分番
号の間の長さが等間隔である場合を考える。また、数2
2において(m0+1)/2は基準パターンベクトルの
中央の成分番号である。
【0178】
【数22】
【0179】図35(a)、(b)、(c)に、上記λ
123123とLj1230との関係を示す。
同図(a)において、λi123123は点
(j1,j 2,j3)と点(i1,i2,i3)との間の長さ
であることを示している。また、同図(b)、(c)に
おいて、基準パターン正ベクトル及び基準パターン負ベ
クトルの中心からλi123123だけ離れた位置
に最も近い基準パターン正ベクトル及び基準パターン負
ベクトルの成分番号がi0であり、成分番号i0に対応す
る正規分布の平均値からの偏差の値がLj1230
あることを示している。
【0180】即ち、パターン行列層のj123成分と
123成分が与えられたとき、数19よりこれら2
点間の長さλi123123が算出され、次に、基
準パターンベクトルについて成分番号i0、正規分布の
平均値からの偏差の値Lj1230、及び、成分値k
123 (+)0とkj123 (-)0が得られることに
なる。
【0181】ここで、基準パターンベクトルの成分の個
数m0を十分に大きく(Δyj123を十分に小さく)
しておけば、λi123123の値とLj123
0の値との間の誤差を十分に小さくすることができ、
精度の高い計算結果が得られる。また、成分番号i0
成分番号(m0−i0+1)は正規分布の平均値に関して
対称であるため、i0の代わりに(m0−i0+1)を用い
てもよい。
【0182】次に、標準パターン行列層Hと入力パター
ン行列層Nとの間の形状変化を、基準パターン正ベクト
ルKj123 (+)及び基準パターン負ベクトルKj12
3 ( -)の形状変化に置き換える。即ち、パターン行列層
のi123成分(i1=1,2,・・・,m1 )(i2
1,2,・・・,m2)(i3=1,2,・・・,m3)につい
て、標準パターン行列層Hの成分値hi123と入力
パターン行列層Nの成分値ni123との間の変化量
の絶対値は|ni123−hi123|であるが、数
10の代わりに,次の数23に示すように、ni12
3がhi123より大きいとき基準パターン正ベクトル
Kj123 (+)の成分値kj123 (+) 0をこの変化
量の絶対値|ni123−hi123|だけ増加さ
せ、ni123がhi123より小さいとき基準パタ
ーン負ベクトルKj123 (-)の成分値kj123 (-)
0をこの変化量の絶対値|ni123−hi123
|だけ増加させる。
【0183】
【数23】
【0184】従って、数21により正規分布の分散の値
を算出し、数23により基準パターンベクトルの成分値
kj123 (+)0及びkj123 (-)0を増加させる
ようにすれば、パターン行列層のj123成分とi1
23成分のあらゆる組み合わせに対して、−1.4σ≦
y≦+1.4σの範囲においてf(y)の値が増加する
ようにできる。
【0185】通常の場合には、標準パターン行列層形状
に対して入力パターン行列層形状の殆どの部分が変化す
るので、数19は変化した全ての部分について長さの計
算を行い、数23は変化した全ての部分について形状変
化の計算を行うものである。また、数23は、絶対的な
形状を問題にしているのではなく、相対的な形状変化を
問題にしているため、任意形状の標準パターン行列層及
び入力パターン行列層について適用が可能である。
【0186】次に、数23により形状変化した一対の基
準パターンベクトル(基準パターン正ベクトルKj12
3 (+)と基準パターン負ベクトルKj123 (-) )に
ついて、それぞれの形状変化の大きさを、尖度の変化量
として数値化する。
【0187】ここで、基準パターン正ベクトルKj12
3 (+)の尖度Aj123 (+)、及び、基準パターン負ベ
クトルKj123 (-)の尖度Aj123 (-)は、数11
の代わりに、それぞれ次の数24により算出できる。た
だし、数24中のLj12 30(i0=1,2,・・・,
0)は、図10と同様に、正規分布の平均値からの偏
差の値であり、数22により正規分布の形状の特徴を表
現できる範囲の任意の値に設定しておく。
【0188】
【数24】
【0189】数24より算出される尖度の値Aj12
3 (+)及びAj123 (-)は、正規分布の平均値(中心)
のまわりの4次の積率と、2次の積率の2乗との比であ
る。
【0190】なお、正規分布に限らず、数24より、任
意の基準形状の尖度の値を算出できる。
【0191】前述したように、一般に、ベクトル形状の
尖度の計算式においては、ベクトルの成分値が負の場合
には定義できず、標準パターン行列層の成分値と入力パ
ターン行列層の成分値のあらゆる大小関係に対して、基
準パターンベクトルの成分値が非負である必要がある。
【0192】このため、初期値が同形状の基準パターン
正ベクトルKj123 (+)及び、基準パターン負ベクト
ルKj123 (-)を作成しておき、数23ではそれらの
成分値の変化が非減少になるようにし、数24において
それぞれの尖度Aj123 ( +)、Aj123 (-)を算出
するようにしている。
【0193】次に、基準パターン正ベクトルの尖度Aj
123 (+)と基準パターン負ベクトルの尖度Aj12
3 (-)の2つの変化量から、尖度の差の値(Aj123
(+)−Aj123 (-) )を以て、標準パターン行列層と
入力パターン行列層の類似の程度を表す形状変化量Dj
123とする。
【0194】例えば、数18により正規分布形状に初期
設定された2つの基準パターンベクトルKj123 (+)
及びKj123 (-)の尖度の値は、共に3に等しい。そ
のため、数23により形状変化した基準パターン正ベク
トル及び基準パターン負ベクトルの尖度の変化量は、そ
れぞれ{Aj123 (+)−3}及び{Aj123 (-)
3}となる。即ち、正方向の変化量は{Aj123 (+)
−3}、また負方向の変化量は{Aj123 (-)−3}
となり、全体の変化量はこの差の値となる。従って、数
12の代わりに、次の数25より、形状変化量Dj12
3が算出できる。
【0195】
【数25】
【0196】次に、数25より算出される形状変化量D
123が示す値について考えてみる。即ち、正規分
布の中央付近(パターン行列層形状のj123成分の
近傍)において、入力立体の正規化密度が標準立体の正
規化密度に対して相対的に強くなったときは、形状変化
量Dj123は正の値で、かつ、相対強度に比例して
増加する。逆に、正規分布の中央付近において、入力立
体の正規化密度が標準立体の正規化密度に対して相対的
に弱くなったときは、形状変化量Dj123は負の値
で、かつ、相対強度に比例して減少する。
【0197】そこで、正規分布の平均値を標準パターン
行列層形状の各成分位置に順次移動させた場合につい
て、各位置での形状変化量を求める。即ち、正規分布の
平均値を標準パターン行列層形状のj123成分(j1
=1,2,・・・,m1 )(j2=1,2,・・・,m2)(j
3=1,2,・・・,m3)の位置に移動させたときのそれ
ぞれの場合について、前記と同様の数20、数21、数
18、数22、数19、数23、数24、数25を順に
用いた処理手順により形状変化量Dj123(j1
1,2,・・・,m1 )(j2=1,2,・・・,m2)(j3
=1,2,・・・,m3)を算出する。
【0198】ただし、点(j1,j2,j3)(j1=1,
2,・・・,m1 )(j2=1,2,・・・,m2)(j3
1,2,・・・,m3)のそれぞれの場合について、(x−
y−z)正規化空間内のすべての点の中で点(j1
2,j3)から最も遠い点を数20に適用して点
(j1,j2,j3)と各点との間の長さの最大値を求
め、数21により点(j1,j2,j3)ごとに異なる分
散の値をもつ正規分布を作成し、上記正規分布の値を成
分とする基準パターン正ベクトルKj123 (+)及び基
準パターン負ベクトルKj123 (-)を作成する。
【0199】また、数24におけるLj1230(i
0=1,2,・・・,m0)は、移動した正規分布のそれぞ
れの平均値からの偏差の値であり、また、kj123
(+) 0及びkj123 (-)0(i0=1,2,・・・,
0)は、このLj1230に対応するものである。
【0200】このような処理手順により、j123
分(j1=1,2,・・・,m1 )(j2=1,2,・・・,m
2)(j3=1,2,・・・,m3)に対応するそれぞれの場
合についてm1×m2×m3個の形状変化量Dj123
算出することができる。
【0201】このようにして算出した形状変化量Dj1
23 、即ち、形状変化した基準パターン正ベクトル
の尖度と基準パターン負ベクトルの尖度との差(Aj1
23 ( +)−Aj123 (-) )は、標準パターン行列層
形状に対して入力パターン行列層形状が増加した部分と
同じ位置に基準形状の中心が移動した場合において、そ
の値が増加することになる。
【0202】即ち、入力立体の正規化密度が、標準立体
の正規化密度に対してパターン行列層のどの成分におい
てどの程度強くなっているかを、形状変化量として検出
することができる。
【0203】次に、上記のようにして得られたm1×m2
×m3個の形状変化量Dj123(j1=1,2,・・・,
1)(j2=1,2,・・・,m2)(j3=1,2,・・・,
3)を用いて、標準パターン行列層形状と入力パター
ン行列層形状との差を、2つのパターン行列層間の1個
の形状距離値として数値化する。
【0204】この形状距離値はm1×m2×m3個の形状
変化量Dj123の積算であると考えられる。従っ
て、数13の代わりに、次の数26より、形状距離値d
を算出できる。
【0205】
【数26】
【0206】数26ではm1×m2×m3個の形状変化量
Dj123の2乗和の平方根を形状距離値としている
が、数14の代わりに、次の数27のように、m1×m2
×m3個の形状変化量Dj123の2乗和自身を形状距
離値dとすることもできる。
【0207】
【数27】
【0208】以上のようにして算出した標準パターン行
列層と入力パターン行列層との間の形状距離値を用い
て、立体認識を行う。
【0209】具体的には、標準立体の特徴量を成分とす
る標準パターン行列層と入力立体の特徴量を成分とする
入力パターン行列層とを作成し、これらのパターン行列
層形状変化を基準パターン正ベクトル及び基準パターン
負ベクトルの形状変化に置き換えて、この形状変化の大
きさを尖度の変化量とし、基準パターン正ベクトルと基
準パターン負ベクトルの尖度の差から、標準パターン行
列層と入力パターン行列層との間の形状距離値を算出
し、得られた形状距離値と任意に設定した許容値とを比
較し、形状距離値が許容値を越えたとき入力立体は標準
立体でないと判定し、形状距離値が許容値内のとき入力
立体が標準立体であると判定する。
【0210】(V)動画像認識方法 動画像の類似度検出方法及びその検出値を用いた動画像
認識方法について述べる。本実施例では、動画像認識を
行うために、動画像の濃度パターンを正規化して標準パ
ターン行列層と入力パターン行列層とを作成し、これら
パターン行列層間の形状変化を、正規分布の値を成分と
する基準パターンベクトルの形状変化に置き換え、この
基準パターンベクトルの形状変化の大きさを尖度の変化
量として数値化することにより動画像の類似度を検出
し、更に、その検出値を用いて動画像認識を行うものと
する。
【0211】図36は、アルファベット”E”を筆記す
るペンの動きを時間を追って撮影した動画像の一例であ
る。同図に示されるように、動画像は時間を追って撮影
したm3枚の画像により構成され、各画像はx方向及び
y方向をそれぞれm1個及びm 2個に区切ったm1×m2
の画素により構成される。ここで、x方向にi1番目、
かつ、y方向にi2番目、かつ、i3番目の時刻の画素に
おける動画像の濃度をPi123とすると、正規化濃
度pi123は数15により算出できる。
【0212】次に、標準動画像の正規化濃度pi12
3(i1=1,2,・・・,m1)(i2=1,2,・・・,
2)(i3=1,2,・・・,m3)を成分とする標準パタ
ーン行列層Hと、入力動画像の正規化濃度pi123
(i1=1,2,・・・,m1)(i 2=1,2,・・・,m2
(i3=1,2,・・・,m3)を成分とする入力パターン
行列層Nを作成する。この標準パターン行列層H及び入
力パターン行列層Nを、数16、数17のように表現し
ておく。ただし、数16、数17はそれぞれ、標準動画
像及び入力動画像の正規化濃度の形状を、パターン行列
層のm1×m2×m3個の成分値で表現したものである。
【0213】また、図37は、標準パターン行列層Hを
(x−y−時間)空間で表現したものであり、図38
は、入力パターン行列層Nを同空間で表現したものであ
る。
【0214】以上に述べた立体の類似度検出処理手順
を、上記で作成した動画像の標準パターン行列層H及び
入力パターン行列層Nに適用し、動画像認識を行う。
【0215】具体的には、標準動画像の特徴量を成分と
する標準パターン行列層と入力動画像の特徴量を成分と
する入力パターン行列層とを作成し、これらのパターン
行列層形状変化を基準パターン正ベクトル及び基準パタ
ーン負ベクトルの形状変化に置き換えて、この形状変化
の大きさを尖度の変化量とし、基準パターン正ベクトル
と基準パターン負ベクトルの尖度の差から、標準パター
ン行列層と入力パターン行列層との間の形状距離値を算
出し、得られた形状距離値と任意に設定した許容値とを
比較し、形状距離値が許容値を越えたとき入力動画像は
標準動画像でないと判定し、形状距離値が許容値内のと
き入力動画像が標準動画像であると判定する。
【0216】以上で、2つのパターン行列(2次元)間
の類似度検出値を用いた音声認識方法、機械の異常判定
方法、画像認識方法、また、2つのパターン行列層(3
次元)間の類似度検出値を用いた立体認識方法、動画像
認識方法のそれぞれについての説明を終わる。
【0217】なお、以上の各実施例は、パターン行列
(或いはパターン行列層)の指定成分ごとに異なる分散
の値をもつ正規分布を作成して、形状距離値を算出した
ものであったが、コンピュータの記憶容量の節約や処理
時間の短縮のため、パターン行列(或いはパターン行列
層)の指定成分のすべてにおいて同じ分散の値をもつ1
個の代表的な正規分布を作成して、形状距離値を算出し
ても良い。
【0218】この場合、パターン行列のj12成分とi
12成分(或いはパターン行列層のj123成分とi1
23成分)のあらゆる組み合わせに対して、図8に示
す正規分布の−2.1σ≦y≦+2.1σの範囲(図8
中の記号(i)と(ii)で示すyの範囲)においてf
(y)の値が増加するようにしておく。
【0219】また、以上の各実施例は、基準形状として
正規分布を用いて形状距離値を算出したものであった
が、基準形状として矩形など任意の形状を用いて形状距
離値を算出しても良い。
【0220】このことは、形状変化量Dj12(或いは
形状変化量Dj123)は基準形状の初期化時の尖度
に影響されないことが数12(或いは数25)から分か
ることにより、理解されよう。
【0221】また、以上の各実施例は、アナログ帯域通
過フィルタ群を用いて音声、または、振動波のパワース
ペクトルを抽出したものであったが、高速フーリエ変換
等を用いてパワースペクトルを抽出しても良い。
【0222】また、以上の各実施例は、音声、または、
振動波の特徴量としてパワースペクトルを用いて、形状
距離値を算出したものであったが、音声、または、振動
波の特徴量として複数個の線形予測係数等を用いて、形
状距離値を算出しても良い。
【0223】また、以上の各実施例は、立体の特徴量と
して密度を用いて、形状距離値を算出したものであった
が、立体の特徴量として3次元CT(コンピュータ断層
撮影)画像の濃度等を用いて、形状距離値を算出しても
良い。
【0224】更に、以上の各実施例は、音声、振動波、
画像、立体、動画像について標準パターン行列(或いは
標準パターン行列層)と入力パターン行列(或いは入力
パターン行列層)との間の形状距離値を算出したもので
あったが、一般には、平面、空間を問わず任意の図形や
模様について標準パターン行列(或いは標準パターン行
列層)と入力パターン行列(或いは入力パターン行列
層)との間の形状距離値を算出し、得られた形状距離値
を以って図形や模様の類似度検出を行うことができる。
また、この類似度検出値に基づいて図形や模様に関する
解析等、各種処理を行うことができる。
【0225】
【発明の効果】以上のように、この発明の音声の類似度
検出方法では、標準パターン行列と入力パターン行列と
の間の形状変化を、基準形状の値を成分とする基準パタ
ーンベクトルの形状変化に置き換え、この形状変化の大
きさを尖度の変化量として数値化し形状距離値として算
出するので、ユークリッド距離や角度など従来の類似性
尺度では区別できない音声でも、パターン行列の形状差
からこれらの区別を行うことができ、正確な音声の類似
度検出値を得ることができる。
【0226】また、本発明の音声認識方法では、正確な
音声の類似度検出値に基づいて音声認識を行うので、判
定の基準が信頼性の高いものとなり、音声認識の精度を
著しく向上できる利点がある。
【0227】更に、本発明の振動波の類似度検出方法で
は、標準パターン行列と入力パターン行列との間の形状
変化を、基準形状の値を成分とする基準パターンベクト
ルの形状変化に置き換え、この形状変化の大きさを尖度
の変化量として数値化し形状距離値として算出するの
で、ユークリッド距離や角度など従来の類似性尺度では
区別できない振動波でも、パターン行列の形状差からこ
れらの区別を行うことができ、正確な振動波の類似度検
出値を得ることができる。
【0228】また、本発明の機械の異常判定方法では、
正確な振動波の類似度検出値に基づいて異常の判定を行
うので、判定の基準が信頼性の高いものとなり、機械の
異常検知の精度を著しく向上できる利点がある。
【0229】更に、本発明の画像の類似度検出方法で
は、標準パターン行列と入力パターン行列との間の形状
変化を、基準形状の値を成分とする基準パターンベクト
ルの形状変化に置き換え、この形状変化の大きさを尖度
の変化量として数値化し形状距離値として算出するの
で、ユークリッド距離や角度など従来の類似性尺度では
区別できない画像でも、パターン行列の形状差からこれ
らの区別を行うことができ、正確な画像の類似度検出値
を得ることができる。
【0230】また、本発明の画像認識方法では、正確な
画像の類似度検出値に基づいて画像認識を行うので、判
定の基準が信頼性の高いものとなり、画像認識の精度を
著しく向上できる利点がある。
【0231】更に、本発明の立体の類似度検出方法で
は、標準パターン行列層と入力パターン行列層との間の
形状変化を、基準形状の値を成分とする基準パターンベ
クトルの形状変化に置き換え、この形状変化の大きさを
尖度の変化量として数値化し形状距離値として算出する
ので、ユークリッド距離や角度など従来の類似性尺度で
は区別できない立体でも、パターン行列層の形状差から
これらの区別を行うことができ、正確な立体の類似度検
出値を得ることができる。
【0232】また、本発明の立体認識方法では、正確な
立体の類似度検出値に基づいて立体認識を行うので、判
定の基準が信頼性の高いものとなり、立体認識の精度を
著しく向上できる利点がある。
【0233】更に、本発明の動画像の類似度検出方法で
は、標準パターン行列層と入力パターン行列層との間の
形状変化を、基準形状の値を成分とする基準パターンベ
クトルの形状変化に置き換え、この形状変化の大きさを
尖度の変化量として数値化し形状距離値として算出する
ので、ユークリッド距離や角度など従来の類似性尺度で
は区別できない動画像でも、パターン行列層の形状差か
らこれらの区別を行うことができ、正確な動画像の類似
度検出値を得ることができる。
【0234】また、本発明の動画像認識方法では、正確
な動画像の類似度検出値に基づいて動画像認識を行うの
で、判定の基準が信頼性の高いものとなり、動画像認識
の精度を著しく向上できる利点がある。
【図面の簡単な説明】
【図1】本発明の一実施例における音声、または、振動
波の測定装置の構造を示すブロック図。
【図2】帯域通過フィルタ群の周波数ゲイン特性の一例
を示す図。
【図3】帯域通過フィルタを通して抽出した音声、また
は、振動波の周波数成分波からパワースペクトルの時間
変化の特徴を抽出する方法を示す図。
【図4】パワースペクトルの一例と、その正規化パワー
スペクトルを示す図。
【図5】標準パターン行列と入力パターン行列を(周波
数−時間)平面で表現する方法を示す図。
【図6】(周波数−時間)正規化平面を示す図。
【図7】正規曲線と、その値を成分とする基準パターン
正ベクトルおよび基準パターン負ベクトルの一例を示す
図。
【図8】正規曲線の形状変化と尖度値の関係を示す図。
【図9】(周波数−時間)正規化平面を3次元で示す
図。
【図10】j12成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、形状が同じ場合のパターン行列
を示す図。
【図11】j12成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のj12成分が増加したも
の、及び、そのときの基準パターン正ベクトルの形状変
化を示す図。
【図12】j12成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のj12成分が減少したも
の、及び、そのときの基準パターン負ベクトルの形状変
化を示す図。
【図13】j12成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のm11成分が増加したも
の、及び、そのときの基準パターン正ベクトルの形状変
化を示す図。
【図14】j12成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のm11成分が減少したも
の、及び、そのときの基準パターン負ベクトルの形状変
化を示す図。
【図15】j12成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のi12成分が増加したも
の、及び、そのときの基準パターン正ベクトルの形状変
化を示す図。
【図16】j12成分をパターン行列の指定成分とした
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のi12成分が減少したも
の、及び、そのときの基準パターン負ベクトルの形状変
化を示す図。
【図17】標準パターン行列と、同パターン行列に対し
12成分が増加した入力パターン行列の形状例を示す
図。
【図18】正規分布の平均値が移動したときの正規分布
の分散の値の変化例、及び、正規分布の平均値と点(i
1,i2)との間の長さの変化例を示す図。
【図19】正規分布の平均値が移動したときの基準パタ
ーン正ベクトル及び基準パターン負ベクトルの形状変化
例を示す図。
【図20】形状変化量(基準パターン正ベクトルと基準
パターン負ベクトルの尖度の差)を算出するためのフロ
ーチャートを示すブロック図。
【図21】パターン行列の成分別形状変化量を示す図。
【図22】図40中のαに対し、標準パターン行列と入
力パターン行列との間の形状距離値が変化する様子を示
す図。
【図23】図42中のβに対し、標準パターン行列と入
力パターン行列との間の形状距離値が変化する様子を示
す図。
【図24】音声を認識するためのフローチャートを示す
ブロック図。
【図25】音声の類似度検出装置の構造を示すブロック
図。
【図26】アルファベット”E”の画像の一例を示す
図。
【図27】標準パターン行列と入力パターン行列を(x
−y)平面で表現する方法を示す図。
【図28】標準画像と入力画像の濃度の例を示す図。
【図29】図28に対応した標準画像と入力画像のパタ
ーン行列の例を示す図。
【図30】実験結果として、上段に、標準画像と、標準
画像と同じ入力画像及び標準画像とは異なる入力画像と
の間のユークリッド距離値の棒グラフを、中段に、標準
画像と、標準画像と同じ入力画像及び標準画像とは異な
る入力画像との間の角度の余弦値の棒グラフを、下段
に、標準画像と、標準画像と同じ入力画像及び標準画像
とは異なる入力画像との間の形状距離値の棒グラフを示
す図。
【図31】立体の密度分布を示す図。
【図32】標準パターン行列層を(x−y−z)空間で
表現する方法を示す図。
【図33】入力パターン行列層を(x−y−z)空間で
表現する方法を示す図。
【図34】(x−y−z)正規化空間を示す図。
【図35】正規曲線と、その値を成分とする基準パター
ン正ベクトルおよび基準パターン負ベクトルの一例を示
す図。
【図36】アルファベット”E”を筆記するペンの動き
を時間を追って撮影した動画像の一例を示す図。
【図37】標準パターン行列層を(x−y−時間)空間
で表現する方法を示す図。
【図38】入力パターン行列層を(x−y−時間)空間
で表現する方法を示す図。
【図39】標準音声と入力音声のパワースペクトルの例
を示す図。
【図40】図39に対応した標準音声と入力音声のパタ
ーン行列の例を示す図。
【図41】標準音声と入力音声のパワースペクトルの他
の例を示す図。
【図42】図41に対応した標準音声と入力音声のパタ
ーン行列の例を示す図。
【図43】従来技術に関して、図40中の変数αに対
し、パターン行列間のユークリッド距離値が変化する様
子を示す図。
【図44】従来技術に関して、図40中の変数αに対
し、パターン行列間の角度の余弦値が変化する様子を示
す図。
【図45】従来技術に関して、図42中の変数βに対
し、パターン行列間のユークリッド距離値が変化する様
子を示す図。
【図46】従来技術に関して、図42中の変数βに対
し、パターン行列間の角度の余弦値が変化する様子を示
す図。
【符号の説明】
1 マイクロホン 2 帯域通過フィルタ 3 AD変換器 4 演算装置 5 許容値より形状距離値が大きい入力音声を表す白丸 6 許容値より形状距離値が小さい入力音声を表す白丸 7 許容値より形状距離値が大きい入力音声を表す白丸 8 許容値より形状距離値が大きい入力音声を表す白丸 9 許容値より形状距離値が小さい入力音声を表す白丸 10 パターンベクトル生成器 11 パターン行列生成器 12 比較器 13 基準パターンベクトルの成分値の増加器 14 尖度の差の計算器 15 形状距離の計算器 16 標準画像 17 標準画像と同じ入力画像 18 標準画像とは異なる入力画像 19 標準画像とは異なる入力画像 20 標準音声 21 標準音声と同じ入力音声 22 標準音声と同じ入力音声 23 標準音声とは異なる入力音声 24 標準音声 25 標準音声と同じ入力音声 26 標準音声とは異なる入力音声 27 標準音声とは異なる入力音声 Dj12 パターン行列間の形状変化量 Dj123 パターン行列層間の形状変化量 d17 標準画像と、標準画像と同じ入力画像との間の
形状距離値 d18、d19 標準画像と、標準画像とは異なる入力
画像との間の形状距離値 d21、d22 標準音声と、標準音声と同じ入力音声
との間の形状距離値 d23 標準音声と、標準音声とは異なる入力音声との
間の形状距離値 d25 標準音声と、標準音声と同じ入力音声との間の
形状距離値 d26、d27 標準音声と、標準音声とは異なる入力
音声との間の形状距離値
フロントページの続き (51)Int.Cl.7 識別記号 FI G10L 3/00 531F 531N (56)参考文献 特開 平10−253444(JP,A) 特公 平4−59638(JP,B2) 草薙、平田、神内、山口、濱田、榊 原,形状距離パターンマッチング法を用 いた異常音検出,日本音響学会2000年春 季研究発表会講演論文集,日本,社団法 人日本音響学会,2000年3月15日,I、 3−6−4,p.509−510 (58)調査した分野(Int.Cl.7,DB名) G10L 15/10 G01H 17/00 G06K 9/62 G06T 7/00 G06T 7/20 (54)【発明の名称】 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法 及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を 用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並 びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】 (a)標準音声の特徴量を成分とする標
    準パターン行列と、入力音声の特徴量を成分とする入力
    パターン行列とを作成すること、(b)パターン行列の
    指定成分ごとに異なる分散の値をもつ正規分布を作成
    し、上記正規分布の値を成分とする基準パターン正ベク
    トル及び基準パターン負ベクトルを作成すること、
    (c)パターン行列の各成分について、パターン行列の
    指定成分と各成分との間の長さを求め、基準パターン正
    ベクトル及び基準パターン負ベクトルの中心から上記長
    さだけ離れた位置に最も近い基準パターン正ベクトル及
    び基準パターン負ベクトルの成分番号を算出し、入力パ
    ターン行列の成分値が標準パターン行列の成分値より大
    きいとき、その差の絶対値だけ基準パターン正ベクトル
    の上記成分番号の成分値を増加させ、入力パターン行列
    の成分値が標準パターン行列の成分値より小さいとき、
    その差の絶対値だけ基準パターン負ベクトルの上記成分
    番号の成分値を増加させること、(d)基準パターン正
    ベクトルの尖度と基準パターン負ベクトルの尖度との差
    の値を算出すること、(e)上記尖度の差の値を算出す
    るに際し、パターン行列の指定成分を各成分の位置に移
    動しながら尖度の差の値を求めること、(f)上記尖度
    の差の値の2乗和、あるいは同2乗和の平方根を、標準
    パターン行列と入力パターン行列との間の形状距離値と
    することを特徴とする音声の類似度検出方法。
  2. 【請求項2】 前記パターン行列の指定成分ごとに異な
    る分散の値をもつ正規分布に代えて、パターン行列の指
    定成分ごとに異なる分散の値をもつ矩形など任意の基準
    形状を作成し、上記基準形状の値を成分とする基準パタ
    ーン正ベクトル及び基準パターン負ベクトルを作成する
    ことを特徴とする請求項1に記載の音声の類似度検出方
    法。
  3. 【請求項3】 請求項1または2に記載の音声の類似度
    検出方法で標準音声の特徴量を成分とする標準パターン
    行列と入力音声の特徴量を成分とする入力パターン行列
    との間の形状距離を求め、求めた形状距離値と任意に設
    定した許容値を比較し、形状距離値が許容値を越えたと
    き入力音声は標準音声でないと判定し、形状距離値が許
    容値内のとき入力音声が標準音声であると判定すること
    を特徴とする音声認識方法。
  4. 【請求項4】 (a)標準振動波の特徴量を成分とする
    標準パターン行列と、入力振動波の特徴量を成分とする
    入力パターン行列とを作成すること、(b)パターン行
    列の指定成分ごとに異なる分散の値をもつ正規分布を作
    成し、上記正規分布の値を成分とする基準パターン正ベ
    クトル及び基準パターン負ベクトルを作成すること、
    (c)パターン行列の各成分について、パターン行列の
    指定成分と各成分との間の長さを求め、基準パターン正
    ベクトル及び基準パターン負ベクトルの中心から上記長
    さだけ離れた位置に最も近い基準パターン正ベクトル及
    び基準パターン負ベクトルの成分番号を算出し、入力パ
    ターン行列の成分値が標準パターン行列の成分値より大
    きいとき、その差の絶対値だけ基準パターン正ベクトル
    の上記成分番号の成分値を増加させ、入力パターン行列
    の成分値が標準パターン行列の成分値より小さいとき、
    その差の絶対値だけ基準パターン負ベクトルの上記成分
    番号の成分値を増加させること、(d)基準パターン正
    ベクトルの尖度と基準パターン負ベクトルの尖度との差
    の値を算出すること、(e)上記尖度の差の値を算出す
    るに際し、パターン行列の指定成分を各成分の位置に移
    動しながら尖度の差の値を求めること、(f)上記尖度
    の差の値の2乗和、あるいは同2乗和の平方根を、標準
    パターン行列と入力パターン行列との間の形状距離値と
    することを特徴とする振動波の類似度検出方法。
  5. 【請求項5】 前記パターン行列の指定成分ごとに異な
    る分散の値をもつ正規分布に代えて、パターン行列の指
    定成分ごとに異なる分散の値をもつ矩形など任意の基準
    形状を作成し、上記基準形状の値を成分とする基準パタ
    ーン正ベクトル及び基準パターン負ベクトルを作成する
    ことを特徴とする請求項4に記載の振動波の類似度検出
    方法。
  6. 【請求項6】 請求項4または5に記載の振動波の類似
    度検出方法で標準振動波の特徴量を成分とする標準パタ
    ーン行列と入力振動波の特徴量を成分とする入力パター
    ン行列との間の形状距離を求め、求めた形状距離値と任
    意に設定した許容値を比較し、形状距離値が許容値を越
    えたとき異常と判定し、形状距離値が許容値内のとき正
    常と判定することを特徴とする機械の異常判定方法。
  7. 【請求項7】 (a)標準画像の特徴量を成分とする標
    準パターン行列と、入力画像の特徴量を成分とする入力
    パターン行列とを作成すること、(b)パターン行列の
    指定成分ごとに異なる分散の値をもつ正規分布を作成
    し、上記正規分布の値を成分とする基準パターン正ベク
    トル及び基準パターン負ベクトルを作成すること、
    (c)パターン行列の各成分について、パターン行列の
    指定成分と各成分との間の長さを求め、基準パターン正
    ベクトル及び基準パターン負ベクトルの中心から上記長
    さだけ離れた位置に最も近い基準パターン正ベクトル及
    び基準パターン負ベクトルの成分番号を算出し、入力パ
    ターン行列の成分値が標準パターン行列の成分値より大
    きいとき、その差の絶対値だけ基準パターン正ベクトル
    の上記成分番号の成分値を増加させ、入力パターン行列
    の成分値が標準パターン行列の成分値より小さいとき、
    その差の絶対値だけ基準パターン負ベクトルの上記成分
    番号の成分値を増加させること、(d)基準パターン正
    ベクトルの尖度と基準パターン負ベクトルの尖度との差
    の値を算出すること、(e)上記尖度の差の値を算出す
    るに際し、パターン行列の指定成分を各成分の位置に移
    動しながら尖度の差の値を求めること、(f)上記尖度
    の差の値の2乗和、あるいは同2乗和の平方根を、標準
    パターン行列と入力パターン行列との間の形状距離値と
    することを特徴とする画像の類似度検出方法。
  8. 【請求項8】 前記パターン行列の指定成分ごとに異な
    る分散の値をもつ正規分布に代えて、パターン行列の指
    定成分ごとに異なる分散の値をもつ矩形など任意の基準
    形状を作成し、上記基準形状の値を成分とする基準パタ
    ーン正ベクトル及び基準パターン負ベクトルを作成する
    ことを特徴とする請求項7に記載の画像の類似度検出方
    法。
  9. 【請求項9】 請求項7または8に記載の画像の類似度
    検出方法で標準画像の特徴量を成分とする標準パターン
    行列と入力画像の特徴量を成分とする入力パターン行列
    との間の形状距離を求め、求めた形状距離値と任意に設
    定した許容値を比較し、形状距離値が許容値を越えたと
    き入力画像は標準画像でないと判定し、形状距離値が許
    容値内のとき入力画像が標準画像であると判定すること
    を特徴とする画像認識方法。
  10. 【請求項10】 (a)標準立体の特徴量を成分とする
    標準パターン行列層と、入力立体の特徴量を成分とする
    入力パターン行列層とを作成すること、(b)パターン
    行列層の指定成分ごとに異なる分散の値をもつ正規分布
    を作成し、上記正規分布の値を成分とする基準パターン
    正ベクトル及び基準パターン負ベクトルを作成するこ
    と、(c)パターン行列層の各成分について、パターン
    行列層の指定成分と各成分との間の長さを求め、基準パ
    ターン正ベクトル及び基準パターン負ベクトルの中心か
    ら上記長さだけ離れた位置に最も近い基準パターン正ベ
    クトル及び基準パターン負ベクトルの成分番号を算出
    し、入力パターン行列層の成分値が標準パターン行列層
    の成分値より大きいとき、その差の絶対値だけ基準パタ
    ーン正ベクトルの上記成分番号の成分値を増加させ、入
    力パターン行列層の成分値が標準パターン行列層の成分
    値より小さいとき、その差の絶対値だけ基準パターン負
    ベクトルの上記成分番号の成分値を増加させること、
    (d)基準パターン正ベクトルの尖度と基準パターン負
    ベクトルの尖度との差の値を算出すること、(e)上記
    尖度の差の値を算出するに際し、パターン行列層の指定
    成分を各成分の位置に移動しながら尖度の差の値を求め
    ること、(f)上記尖度の差の値の2乗和、あるいは同
    2乗和の平方根を、標準パターン行列層と入力パターン
    行列層との間の形状距離値とすることを特徴とする立体
    の類似度検出方法。
  11. 【請求項11】 前記パターン行列層の指定成分ごとに
    異なる分散の値をもつ正規分布に代えて、パターン行列
    層の指定成分ごとに異なる分散の値をもつ矩形など任意
    の基準形状を作成し、上記基準形状の値を成分とする基
    準パターン正ベクトル及び基準パターン負ベクトルを作
    成することを特徴とする請求項10に記載の立体の類似
    度検出方法。
  12. 【請求項12】 請求項10または11に記載の立体の
    類似度検出方法で標準立体の特徴量を成分とする標準パ
    ターン行列層と入力立体の特徴量を成分とする入力パタ
    ーン行列層との間の形状距離を求め、求めた形状距離値
    と任意に設定した許容値を比較し、形状距離値が許容値
    を越えたとき入力立体は標準立体でないと判定し、形状
    距離値が許容値内のとき入力立体が標準立体であると判
    定することを特徴とする立体認識方法。
  13. 【請求項13】 (a)標準動画像の特徴量を成分とす
    る標準パターン行列層と、入力動画像の特徴量を成分と
    する入力パターン行列層とを作成すること、 (b)パターン行列層の指定成分ごとに異なる分散の値
    をもつ正規分布を作成し、上記正規分布の値を成分とす
    る基準パターン正ベクトル及び基準パターン負ベクトル
    を作成すること、 (c)パターン行列層の各成分について、パターン行列
    層の指定成分と各成分との間の長さを求め、基準パター
    ン正ベクトル及び基準パターン負ベクトルの中心から上
    記長さだけ離れた位置に最も近い基準パターン正ベクト
    ル及び基準パターン負ベクトルの成分番号を算出し、入
    力パターン行列層の成分値が標準パターン行列層の成分
    値より大きいとき、その差の絶対値だけ基準パターン正
    ベクトルの上記成分番号の成分値を増加させ、入力パタ
    ーン行列層の成分値が標準パターン行列層の成分値より
    小さいとき、その差の絶対値だけ基準パターン負ベクト
    ルの上記成分番号の成分値を増加させること、 (d)基準パターン正ベクトルの尖度と基準パターン負
    ベクトルの尖度との差の値を算出すること、 (e)上記尖度の差の値を算出するに際し、パターン行
    列層の指定成分を各成分の位置に移動しながら尖度の差
    の値を求めること、 (f)上記尖度の差の値の2乗和、あるいは同2乗和の
    平方根を、標準パターン行列層と入力パターン行列層と
    の間の形状距離値とすることを特徴とする動画像の類似
    度検出方法。
  14. 【請求項14】 前記パターン行列層の指定成分ごとに
    異なる分散の値をもつ正規分布に代えて、パターン行列
    層の指定成分ごとに異なる分散の値をもつ矩形など任意
    の基準形状を作成し、上記基準形状の値を成分とする基
    準パターン正ベクトル及び基準パターン負ベクトルを作
    成することを特徴とする請求項13に記載の動画像の類
    似度検出方法。
  15. 【請求項15】 請求項13または14に記載の動画像
    の類似度検出方法で標準動画像の特徴量を成分とする標
    準パターン行列層と入力動画像の特徴量を成分とする入
    力パターン行列層との間の形状距離を求め、求めた形状
    距離値と任意に設定した許容値を比較し、形状距離値が
    許容値を越えたとき入力動画像は標準動画像でないと判
    定し、形状距離値が許容値内のとき入力動画像が標準動
    画像であると判定することを特徴とする動画像認識方
    法。
JP2000277749A 2000-09-13 2000-09-13 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法 Expired - Fee Related JP3342864B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2000277749A JP3342864B2 (ja) 2000-09-13 2000-09-13 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法
EP01121566A EP1189207B1 (en) 2000-09-13 2001-09-10 Voices similarity measurement
DE60141875T DE60141875D1 (de) 2000-09-13 2001-09-10 Messung des Ähnlichkeitsgrads der Stimme
AU70003/01A AU766266B2 (en) 2000-09-13 2001-09-11 Method for detecting similarity between standard information and input information and method for judging the input information by use of detected result of the similarity
US09/951,211 US7006970B2 (en) 2000-09-13 2001-09-11 Method for detecting similarity between standard information and input information and method for judging the input information by use of detected result of the similarity
CA002357255A CA2357255C (en) 2000-09-13 2001-09-12 Method for detecting similarity between standard information and input information and method for judging the input information by use of detected result of the similarity
HK02106431.2A HK1045016B (zh) 2000-09-13 2002-08-30 聲音相似性量度

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000277749A JP3342864B2 (ja) 2000-09-13 2000-09-13 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法

Publications (2)

Publication Number Publication Date
JP2002091481A JP2002091481A (ja) 2002-03-27
JP3342864B2 true JP3342864B2 (ja) 2002-11-11

Family

ID=18763020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000277749A Expired - Fee Related JP3342864B2 (ja) 2000-09-13 2000-09-13 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法

Country Status (7)

Country Link
US (1) US7006970B2 (ja)
EP (1) EP1189207B1 (ja)
JP (1) JP3342864B2 (ja)
AU (1) AU766266B2 (ja)
CA (1) CA2357255C (ja)
DE (1) DE60141875D1 (ja)
HK (1) HK1045016B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9552831B2 (en) 2015-02-02 2017-01-24 West Nippon Expressway Engineering Shikoku Company Limited Method for detecting abnormal sound and method for judging abnormality in structure by use of detected value thereof, and method for detecting similarity between oscillation waves and method for recognizing voice by use of detected value thereof

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3422787B1 (ja) 2002-03-13 2003-06-30 株式会社エントロピーソフトウェア研究所 画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法
JP4098539B2 (ja) * 2002-03-15 2008-06-11 富士通株式会社 プロファイル情報の推薦方法、プログラム及び装置
US7366666B2 (en) * 2003-10-01 2008-04-29 International Business Machines Corporation Relative delta computations for determining the meaning of language inputs
US7742914B2 (en) * 2005-03-07 2010-06-22 Daniel A. Kosek Audio spectral noise reduction method and apparatus
US7707032B2 (en) * 2005-10-20 2010-04-27 National Cheng Kung University Method and system for matching speech data
WO2008007616A1 (fr) * 2006-07-13 2008-01-17 Nec Corporation Dispositif, procédé et programme d'alarme relatif à une entrée de murmure non audible
WO2008115435A1 (en) * 2007-03-19 2008-09-25 Dolby Laboratories Licensing Corporation Noise variance estimator for speech enhancement
JP2010017216A (ja) * 2008-07-08 2010-01-28 Ge Medical Systems Global Technology Co Llc 音声データ処理装置,音声データ処理方法、および、イメージング装置
US8826455B2 (en) * 2009-02-17 2014-09-02 International Business Machines Corporation Method and apparatus for automated assignment of access permissions to users
CN101593517B (zh) * 2009-06-29 2011-08-17 北京市博汇科技有限公司 一种音频比对系统及其音频能量比对方法
US8801537B1 (en) * 2011-03-10 2014-08-12 Callaway Golf Company Adjustable golf club shaft and hosel assembly
CN104992713B (zh) * 2015-05-14 2018-11-13 电子科技大学 一种快速广播音频比对方法
CN110910899B (zh) * 2019-11-27 2022-04-08 杭州联汇科技股份有限公司 一种实时音频信号一致性对比检测方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4155072A (en) * 1976-12-17 1979-05-15 Ricoh Company, Ltd. Character recognition apparatus
JPS6273391A (ja) * 1985-09-27 1987-04-04 Toshiba Corp パタ−ン認識学習装置
JPH02195400A (ja) * 1989-01-24 1990-08-01 Canon Inc 音声認識装置
JPH03120598A (ja) * 1989-10-03 1991-05-22 Canon Inc 音声認識方法及び装置
JPH04194999A (ja) * 1990-11-27 1992-07-14 Sharp Corp 学習を用いた動的計画法
US5594807A (en) * 1994-12-22 1997-01-14 Siemens Medical Systems, Inc. System and method for adaptive filtering of images based on similarity between histograms
JP3426905B2 (ja) * 1997-03-14 2003-07-14 東京瓦斯株式会社 異常音の検出方法及びその検出値を用いた機械の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法
JP3422787B1 (ja) * 2002-03-13 2003-06-30 株式会社エントロピーソフトウェア研究所 画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
草薙、平田、神内、山口、濱田、榊原,形状距離パターンマッチング法を用いた異常音検出,日本音響学会2000年春季研究発表会講演論文集,日本,社団法人日本音響学会,2000年3月15日,I、3−6−4,p.509−510

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9552831B2 (en) 2015-02-02 2017-01-24 West Nippon Expressway Engineering Shikoku Company Limited Method for detecting abnormal sound and method for judging abnormality in structure by use of detected value thereof, and method for detecting similarity between oscillation waves and method for recognizing voice by use of detected value thereof

Also Published As

Publication number Publication date
US7006970B2 (en) 2006-02-28
DE60141875D1 (de) 2010-06-02
AU766266B2 (en) 2003-10-09
EP1189207A3 (en) 2003-08-13
CA2357255A1 (en) 2002-03-13
EP1189207B1 (en) 2010-04-21
US20020055839A1 (en) 2002-05-09
HK1045016A1 (en) 2002-11-08
EP1189207A2 (en) 2002-03-20
HK1045016B (zh) 2010-11-12
JP2002091481A (ja) 2002-03-27
CA2357255C (en) 2010-03-09
AU7000301A (en) 2002-03-14

Similar Documents

Publication Publication Date Title
JP3342864B2 (ja) 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法
JP6061693B2 (ja) 異常診断装置およびこれを用いた異常診断方法
CN104865550A (zh) 声源方向估计设备和声源方向估计方法
JP4960416B2 (ja) 話者クラスタリング装置および話者クラスタリング方法
Csapó et al. Error analysis of extracted tongue contours from 2D ultrasound images
CN1441906A (zh) 波形检测装置和使用该装置的状态监视系统
Upadhya et al. Discriminating Parkinson and healthy people using phonation and cepstral features of speech
US10043276B2 (en) Image processing method, image processing apparatus, robot apparatus, program, and recording medium
US11721357B2 (en) Voice processing method and voice processing apparatus
JP3426905B2 (ja) 異常音の検出方法及びその検出値を用いた機械の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法
JP3422787B1 (ja) 画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法
KR102205806B1 (ko) 호흡상태 분류기의 생성 방법 및 생성한 호흡상태 분류기를 이용한 호흡상태 판단 방법
JP2008185845A (ja) 1次元信号の変換値からのhlac特徴抽出方法および装置
Yu et al. Multidimensional acoustic analysis for voice quality assessment based on the GRBAS scale
JP4839970B2 (ja) 韻律識別装置及び方法、並びに音声認識装置及び方法
JP2019035902A (ja) 距離測定装置、データ変換装置、距離測定方法、及びプログラム
Castro-Cabrera et al. A comparison between time-frequency and cepstral feature representations for the classification of seismic-volcanic signals
Heeringa et al. The implementation of methods in Visible Vowels
JP2004357050A (ja) 波形品質評価システム及び波形品質評価方法
Elen et al. A comparison of classification methods for diagnosis of Parkinson's
Gillich et al. Problem of detecting damage through natural frequency changes
WO2020014354A1 (en) System and method for indexing sound fragments containing speech
JP2019149028A (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
JP2013120467A (ja) 信号特徴抽出装置および信号特徴抽出方法
Thayoob et al. Preprocessing of acoustic emission signals from partial discharge in oil-pressboard insulation system

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020730

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080823

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090823

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees