JP3342864B2 - 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法 - Google Patents
音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法Info
- Publication number
- JP3342864B2 JP3342864B2 JP2000277749A JP2000277749A JP3342864B2 JP 3342864 B2 JP3342864 B2 JP 3342864B2 JP 2000277749 A JP2000277749 A JP 2000277749A JP 2000277749 A JP2000277749 A JP 2000277749A JP 3342864 B2 JP3342864 B2 JP 3342864B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- component
- pattern
- pattern matrix
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 124
- 238000001514 detection method Methods 0.000 title claims description 79
- 230000005856 abnormality Effects 0.000 title claims description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 529
- 239000013598 vector Substances 0.000 claims abstract description 325
- 239000007787 solid Substances 0.000 claims description 42
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 description 51
- 238000010586 diagram Methods 0.000 description 41
- 230000014509 gene expression Effects 0.000 description 38
- 230000007423 decrease Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 7
- 238000011524 similarity measure Methods 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 239000004615 ingredient Substances 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000002591 computed tomography Methods 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
報との間の類似度を検出する方法と、その類似度検出値
を用いて入力情報が標準情報であるか否かの認識あるい
は入力情報が異常であるか否かの判定を行う方法に関す
る。より詳しくは、本発明は、人間が発声する音声につ
いて標準音声と入力音声との間の類似度を検出する方法
と、その検出値を用いて音声を認識する方法に関し、ま
た、運転中の設備等が発する音や振動についての振動波
の類似度検出方法と、その類似度検出値に基づいて機械
の異常を判定する方法に関し、更に、文字や模様につい
ての画像の類似度検出方法と、その類似度検出値を用い
て画像を認識する方法にも関する。また、立体の類似度
検出方法と、その類似度検出値を用いて立体を認識する
方法に関し、更に、動画像の類似度検出方法と、その類
似度検出値を用いて動画像を認識する方法にも関する。
動認識する音声認識装置においては、予めコンピュータ
に登録した既知の音声を標準音声とし、新たにコンピュ
ータに入力した未知の音声を入力音声としたとき、標準
音声と入力音声との間の類似度を検出し、その類似度の
検出値により入力音声を認識する手段が装備されてい
る。
パワースペクトルなどの特徴量を成分とする標準パター
ン行列を予め登録しておき、入力音声の特徴量を成分と
する入力パターン行列を作成し、標準パターン行列と入
力パターン行列との間のユークリッド距離や角度を算出
する方法を採っている。また、従来の音声認識では、上
記ユークリッド距離や角度の算出値と任意に設定した許
容値とを比較して音声の認識を行う方法を採っている。
即ち、特徴量の種類の数と同じ次元のパターン空間を考
え、標準パターン行列の点と入力パターン行列の点との
間の直線的な距離(ユークリッド距離)や角度を表す類
似性尺度を用いて、2つのパターン行列の類似程度を数
値化し、その数値に基づいて音声の認識を行っている。
なパワースペクトル形状を持つ標準音声20、及び、こ
の標準音声と同じエネルギーを持つがパワースペクトル
形状の特徴が異なる入力音声21、22、23につい
て、標準音声20のパワースペクトルを成分とする7行
9列の標準パターン行列20Aを予め登録しておき、各
入力音声21、22、23のパワースペクトルを成分と
する7行9列の入力パターン行列21A、22A、23
Aを作成し、標準パターン行列20Aと各入力パターン
行列21A、22A、23Aとの間の類似性尺度とし
て、ユークリッド距離または角度の余弦e21、e2
2、e23を算出する様子を模式的に示したものであ
る。
変数αについて、図40中に示されるγ、δ、ε、ζ、
η、θの関係を持っているものとする。つまり、標準音
声20のパワースペクトル形状に対する各入力音声2
1、22、23のパワースペクトル形状の変化が、図4
0に示す関係で、変数αにより規定されるものとしてい
る。ユークリッド距離は標準パターン行列と入力パター
ン行列の各成分毎の差の2乗和の平方根として求めら
れ、また、角度の余弦は2つのパターン行列の各成分ご
との積の和を、標準パターン行列の各成分の2乗和の平
方根と入力パターン行列の各成分の2乗和の平方根で除
算して求められる。
ースペクトル形状に2個のピークを持つ標準音声24、
及び、この標準音声と同じエネルギーを持つがピークの
位置が異なる入力音声25、26、27について、標準
音声24のパワースペクトルを成分とする7行9列の標
準パターン行列24Aを予め登録しておき、各入力音声
25、26、27のパワースペクトルを成分とする7行
9列の入力パターン行列25A、26A、27Aを作成
し、標準パターン行列と各入力パターン行列との間の類
似性尺度として、ユークリッド距離または角度の余弦e
25、e26、e27を算出する様子を模式的に示した
ものである。
25、26、27は、変数βについて、図42中に示さ
れるω、φの関係を持っているものとする。つまり、標
準音声24のパワースペクトル形状に対する各入力音声
25、26、27のパワースペクトル形状の変化が、図
42に示す関係で、変数βにより規定されるものとして
いる。
ド距離や角度などを類似性尺度に用いた場合、パワース
ペクトル形状が異なる複数の入力音声について、標準音
声からのユークリッド距離や角度の算出値が同じになる
ことがある。このような場合には、特徴が異なる入力音
声を区別できなくなり、このことが音声の類似度検出を
不正確にする要因となっている。以下、詳しく説明す
る。
る変数αの値を0から1まで増加させたときに、ユーク
リッド距離の算出値e21、e22、e23が変化する
様子を示したものである。図44は、同じく図40にお
ける変数αの値を0から1まで増加させたときに、角度
の余弦の算出値e21、e22、e23が変化する様子
を示したものである。
リッド距離及び角度の余弦の値は常にe21=e22=
e23であることが分かり、変数αの値が増加するにつ
れて、ユークリッド距離の値e21、e22、e23は
増加し、また、角度の余弦の値e21、e22、e23
は減少することが分かる。角度の余弦の値e21、e2
2、e23が減少することは、角度の値が増加すること
である。
クトル形状は平坦であり、音声の摩擦子音/s/につい
てもそのパワースペクトル形状が平坦に近いものが多
い。ただし、摩擦子音/s/については、パワースペク
トル形状が平坦に近いといっても、その形状が時間とと
もに少し変動する「スペクトル強度のゆらぎ」現象も観
測される。
が小さい場合について、仮に、入力音声21、22は摩
擦子音/s/の「スペクトル強度のゆらぎ」であり、入
力音声23は摩擦子音/s/とは異なる音声であると考
えてみる。
声を規定する変数αの値が同じときには、標準音声20
からのユークリッド距離や角度の値は3個の入力音声2
1、22、23とも同じになるため、それらの値と任意
に設定した許容値とを比較した場合、3個の入力音声が
ともに標準音声であると判定されるか、逆に、3個の入
力音声ともに標準音声でないと判定されることになり、
区別できない。
る変数βの値を0から1まで増加させたときに、ユーク
リッド距離の算出値e25、e26、e27が変化する
様子を示したものである。図46は、同じく図42にお
ける変数βの値を0から1まで増加させたときに、角度
の余弦の算出値e25、e26、e27が変化する様子
を示したものである。
リッド距離及び角度の余弦の値は常にe25=e26=
e27であることが分かり、変数βの値が増加するにつ
れて、ユークリッド距離の値e25、e26、e27は
増加し、角度の余弦の値e25、e26、e27は減少
することが分かる。角度の余弦の値e25、e26、e
27が減少することは、角度の値が増加することであ
る。
ル形状にはホルマントと呼ばれる複数のピークが観測さ
れる。ただし、音声のホルマントについては、同じ音声
であっても、パワースペクトル形状のピーク周波数が少
し変動する「周波数のずれ」現象やピーク位置が時間的
に少し変動する「時間のずれ」現象も観測される。
入力音声25は標準音声24と同じ音声であって、その
ピークに「周波数のずれ」または「時間のずれ」が発生
したものであり、入力音声26、27は標準音声24と
は異なる音声であると考えてみる。
声及び入力音声を規定する変数βの値が同じときには、
標準音声24からのユークリッド距離や角度の値は3個
の入力音声25、26、27とも同じになるため、それ
らの値と任意に設定した許容値とを比較した場合、3個
の入力音声がともに標準音声であると判定されるか、逆
に、3個の入力音声ともに標準音声でないと判定される
ことになり、区別できない。
では、音声の類似度を正確に検出することができず、音
声を認識する上で十分に満足のいく精度が得られないと
いう問題がある。
では、2つのパターン行列のユークリッド距離あるいは
角度の値を類似性尺度としているために、標準パターン
行列がなす形状と入力パターン行列がなす形状との差
を、形状距離として数値化できないからである。
分とする標準パターン行列を予め登録する場合、「スペ
クトル強度のゆらぎ」、「周波数のずれ」、「時間のず
れ」のある個々の標準音声を多数の標準パターン行列と
して登録しておく方法が考えられるが、コンピュータの
記憶容量や処理時間の問題から標準パターン行列の登録
個数には制限があるため、この方法を用いて、標準音声
の「スペクトル強度のゆらぎ」、または、標準音声の
「周波数のずれ」、または、標準音声の「時間のずれ」
と、標準音声とは異なる音声とを判別することには限界
がある。
(特願平9−61007号:発明の名称:異常音の検出
方法及びその検出値を用いた機械の異常判定方法、並び
に、振動波の類似度検出方法及びその検出値を用いた音
声認識方法)において、標準パターンベクトル(1次
元)と入力パターンベクトル(1次元)との間の形状距
離値の算出方法について説明しているが、標準パターン
行列(2次元)と入力パターン行列(2次元)との間の
形状距離値の算出方法、並びに、標準パターン行列層
(3次元)と入力パターン行列層(3次元)との間の形
状距離値の算出方法についての説明はない。
れたものであり、第1の目的は標準パターン行列と入力
パターン行列から、2つのパターン行列間の正確な形状
距離値を求めることができる音声の類似度検出方法を提
供することにある。また、本発明の第2の目的は音声の
類似度検出値から高い精度で音声認識を行うことができ
る方法を提供することにある。
行列と入力パターン行列から、2つのパターン行列間の
正確な形状距離値を求めることができる振動波の類似度
検出方法を提供することにある。また、本発明の第4の
目的は振動波の類似度検出値から高い精度で機械の異常
判定を行うことができる判定方法を提供することにあ
る。
入力パターン行列から、2つのパターン行列間の正確な
形状距離値を求めることができる画像の類似度検出方法
を提供することにある。また、本発明の第6の目的は画
像の類似度検出値から高い精度で画像認識を行うことが
できる方法を提供することにある。
と入力パターン行列層から、2つのパターン行列層間の
正確な形状距離値を求めることができる立体の類似度検
出方法を提供することにある。また、本発明の第8の目
的は立体の類似度検出値から高い精度で立体認識を行う
ことができる方法を提供することにある。
と入力パターン行列層から、2つのパターン行列層間の
正確な形状距離値を求めることができる動画像の類似度
検出方法を提供することにある。また、本発明の第10
の目的は動画像の類似度検出値から高い精度で動画像認
識を行うことができる方法を提供することにある。
4号公報(特願平9−61007号)において説明され
ている形状距離値の算出方法を2次元に拡張して音声認
識、機械の異常判定、及び、画像認識に適用できるよう
にし、更に、3次元に拡張して立体認識、及び、動画像
認識に適用できるようにしたものである。
め、請求項1に係る発明は音声の類似度検出方法であ
り、(a)標準音声の特徴量を成分とする標準パターン
行列と、入力音声の特徴量を成分とする入力パターン行
列とを作成すること、(b)パターン行列の指定成分ご
とに異なる分散の値をもつ正規分布を作成し、上記正規
分布の値を成分とする基準パターン正ベクトル及び基準
パターン負ベクトルを作成すること、(c)パターン行
列の各成分について、パターン行列の指定成分と各成分
との間の長さを求め、基準パターン正ベクトル及び基準
パターン負ベクトルの中心から上記長さだけ離れた位置
に最も近い基準パターン正ベクトル及び基準パターン負
ベクトルの成分番号を算出し、入力パターン行列の成分
値が標準パターン行列の成分値より大きいとき、その差
の絶対値だけ基準パターン正ベクトルの上記成分番号の
成分値を増加させ、入力パターン行列の成分値が標準パ
ターン行列の成分値より小さいとき、その差の絶対値だ
け基準パターン負ベクトルの上記成分番号の成分値を増
加させること、(d)基準パターン正ベクトルの尖度と
基準パターン負ベクトルの尖度との差の値を算出するこ
と、(e)上記尖度の差の値を算出するに際し、パター
ン行列の指定成分を各成分の位置に移動しながら尖度の
差の値を求めること、(f)上記尖度の差の値の2乗
和、あるいは同2乗和の平方根を、標準パターン行列と
入力パターン行列との間の形状距離値とすることを特徴
とする。
法は、請求項1に係る発明において、前記パターン行列
の指定成分ごとに異なる分散の値をもつ正規分布に代え
て、パターン行列の指定成分ごとに異なる分散の値をも
つ矩形など任意の基準形状を作成し、上記基準形状の値
を成分とする基準パターン正ベクトル及び基準パターン
負ベクトルを作成することを特徴とする。
であり、請求項1または2に係る発明の音声の類似度検
出方法で標準音声の特徴量を成分とする標準パターン行
列と入力音声の特徴量を成分とする入力パターン行列と
の間の形状距離を求め、求めた形状距離値と任意に設定
した許容値を比較し、形状距離値が許容値を越えたとき
入力音声は標準音声でないと判定し、形状距離値が許容
値内のとき入力音声が標準音声であると判定することを
特徴とする。
度検出方法であり、(a)標準振動波の特徴量を成分と
する標準パターン行列と、入力振動波の特徴量を成分と
する入力パターン行列とを作成すること、(b)パター
ン行列の指定成分ごとに異なる分散の値をもつ正規分布
を作成し、上記正規分布の値を成分とする基準パターン
正ベクトル及び基準パターン負ベクトルを作成するこ
と、(c)パターン行列の各成分について、パターン行
列の指定成分と各成分との間の長さを求め、基準パター
ン正ベクトル及び基準パターン負ベクトルの中心から上
記長さだけ離れた位置に最も近い基準パターン正ベクト
ル及び基準パターン負ベクトルの成分番号を算出し、入
力パターン行列の成分値が標準パターン行列の成分値よ
り大きいとき、その差の絶対値だけ基準パターン正ベク
トルの上記成分番号の成分値を増加させ、入力パターン
行列の成分値が標準パターン行列の成分値より小さいと
き、その差の絶対値だけ基準パターン負ベクトルの上記
成分番号の成分値を増加させること、(d)基準パター
ン正ベクトルの尖度と基準パターン負ベクトルの尖度と
の差の値を算出すること、(e)上記尖度の差の値を算
出するに際し、パターン行列の指定成分を各成分の位置
に移動しながら尖度の差の値を求めること、(f)上記
尖度の差の値の2乗和、あるいは同2乗和の平方根を、
標準パターン行列と入力パターン行列との間の形状距離
値とすることを特徴とする。
方法は、請求項4に係る発明において、前記パターン行
列の指定成分ごとに異なる分散の値をもつ正規分布に代
えて、パターン行列の指定成分ごとに異なる分散の値を
もつ矩形など任意の基準形状を作成し、上記基準形状の
値を成分とする基準パターン正ベクトル及び基準パター
ン負ベクトルを作成することを特徴とする。
定方法であり、請求項4または5に係る発明の振動波の
類似度検出方法で標準振動波の特徴量を成分とする標準
パターン行列と入力振動波の特徴量を成分とする入力パ
ターン行列との間の形状距離を求め、求めた形状距離値
と任意に設定した許容値を比較し、形状距離値が許容値
を越えたとき異常と判定し、形状距離値が許容値内のと
き正常と判定することを特徴とする。
検出方法であり、(a)標準画像の特徴量を成分とする
標準パターン行列と、入力画像の特徴量を成分とする入
力パターン行列とを作成すること、(b)パターン行列
の指定成分ごとに異なる分散の値をもつ正規分布を作成
し、上記正規分布の値を成分とする基準パターン正ベク
トル及び基準パターン負ベクトルを作成すること、
(c)パターン行列の各成分について、パターン行列の
指定成分と各成分との間の長さを求め、基準パターン正
ベクトル及び基準パターン負ベクトルの中心から上記長
さだけ離れた位置に最も近い基準パターン正ベクトル及
び基準パターン負ベクトルの成分番号を算出し、入力パ
ターン行列の成分値が標準パターン行列の成分値より大
きいとき、その差の絶対値だけ基準パターン正ベクトル
の上記成分番号の成分値を増加させ、入力パターン行列
の成分値が標準パターン行列の成分値より小さいとき、
その差の絶対値だけ基準パターン負ベクトルの上記成分
番号の成分値を増加させること、(d)基準パターン正
ベクトルの尖度と基準パターン負ベクトルの尖度との差
の値を算出すること、(e)上記尖度の差の値を算出す
るに際し、パターン行列の指定成分を各成分の位置に移
動しながら尖度の差の値を求めること、(f)上記尖度
の差の値の2乗和、あるいは同2乗和の平方根を、標準
パターン行列と入力パターン行列との間の形状距離値と
することを特徴とする。
法は、請求項7に係る発明において、前記パターン行列
の指定成分ごとに異なる分散の値をもつ正規分布に代え
て、パターン行列の指定成分ごとに異なる分散の値をも
つ矩形など任意の基準形状を作成し、上記基準形状の値
を成分とする基準パターン正ベクトル及び基準パターン
負ベクトルを作成することを特徴とする。
であり、請求項7または8に係る発明の画像の類似度検
出方法で標準画像の特徴量を成分とする標準パターン行
列と入力画像の特徴量を成分とする入力パターン行列と
の間の形状距離を求め、求めた形状距離値と任意に設定
した許容値を比較し、形状距離値が許容値を越えたとき
入力画像は標準画像でないと判定し、形状距離値が許容
値内のとき入力画像が標準画像であると判定することを
特徴とする。
度検出方法であり、(a)標準立体の特徴量を成分とす
る標準パターン行列層と、入力立体の特徴量を成分とす
る入力パターン行列層とを作成すること、(b)パター
ン行列層の指定成分ごとに異なる分散の値をもつ正規分
布を作成し、上記正規分布の値を成分とする基準パター
ン正ベクトル及び基準パターン負ベクトルを作成するこ
と、(c)パターン行列層の各成分について、パターン
行列層の指定成分と各成分との間の長さを求め、基準パ
ターン正ベクトル及び基準パターン負ベクトルの中心か
ら上記長さだけ離れた位置に最も近い基準パターン正ベ
クトル及び基準パターン負ベクトルの成分番号を算出
し、入力パターン行列層の成分値が標準パターン行列層
の成分値より大きいとき、その差の絶対値だけ基準パタ
ーン正ベクトルの上記成分番号の成分値を増加させ、入
力パターン行列層の成分値が標準パターン行列層の成分
値より小さいとき、その差の絶対値だけ基準パターン負
ベクトルの上記成分番号の成分値を増加させること、
(d)基準パターン正ベクトルの尖度と基準パターン負
ベクトルの尖度との差の値を算出すること、(e)上記
尖度の差の値を算出するに際し、パターン行列層の指定
成分を各成分の位置に移動しながら尖度の差の値を求め
ること、(f)上記尖度の差の値の2乗和、あるいは同
2乗和の平方根を、標準パターン行列層と入力パターン
行列層との間の形状距離値とすることを特徴とする。
方法は、請求項10に係る発明において、前記パターン
行列層の指定成分ごとに異なる分散の値をもつ正規分布
に代えて、パターン行列層の指定成分ごとに異なる分散
の値をもつ矩形など任意の基準形状を作成し、上記基準
形状の値を成分とする基準パターン正ベクトル及び基準
パターン負ベクトルを作成することを特徴とする。
法であり、請求項10または11に係る発明の立体の類
似度検出方法で標準立体の特徴量を成分とする標準パタ
ーン行列層と入力立体の特徴量を成分とする入力パター
ン行列層との間の形状距離を求め、求めた形状距離値と
任意に設定した許容値を比較し、形状距離値が許容値を
越えたとき入力立体は標準立体でないと判定し、形状距
離値が許容値内のとき入力立体が標準立体であると判定
することを特徴とする。
似度検出方法であり、(a)標準動画像の特徴量を成分
とする標準パターン行列層と、入力動画像の特徴量を成
分とする入力パターン行列層とを作成すること、(b)
パターン行列層の指定成分ごとに異なる分散の値をもつ
正規分布を作成し、上記正規分布の値を成分とする基準
パターン正ベクトル及び基準パターン負ベクトルを作成
すること、(c)パターン行列層の各成分について、パ
ターン行列層の指定成分と各成分との間の長さを求め、
基準パターン正ベクトル及び基準パターン負ベクトルの
中心から上記長さだけ離れた位置に最も近い基準パター
ン正ベクトル及び基準パターン負ベクトルの成分番号を
算出し、入力パターン行列層の成分値が標準パターン行
列層の成分値より大きいとき、その差の絶対値だけ基準
パターン正ベクトルの上記成分番号の成分値を増加さ
せ、入力パターン行列層の成分値が標準パターン行列層
の成分値より小さいとき、その差の絶対値だけ基準パタ
ーン負ベクトルの上記成分番号の成分値を増加させるこ
と、(d)基準パターン正ベクトルの尖度と基準パター
ン負ベクトルの尖度との差の値を算出すること、(e)
上記尖度の差の値を算出するに際し、パターン行列層の
指定成分を各成分の位置に移動しながら尖度の差の値を
求めること、(f)上記尖度の差の値の2乗和、あるい
は同2乗和の平方根を、標準パターン行列層と入力パタ
ーン行列層との間の形状距離値とすることを特徴とす
る。
出方法は、請求項13に係る発明において、前記パター
ン行列層の指定成分ごとに異なる分散の値をもつ正規分
布に代えて、パターン行列層の指定成分ごとに異なる分
散の値をもつ矩形など任意の基準形状を作成し、上記基
準形状の値を成分とする基準パターン正ベクトル及び基
準パターン負ベクトルを作成することを特徴とする。
方法であり、請求項13または14に係る発明の動画像
の類似度検出方法で標準動画像の特徴量を成分とする標
準パターン行列層と入力動画像の特徴量を成分とする入
力パターン行列層との間の形状距離を求め、求めた形状
距離値と任意に設定した許容値を比較し、形状距離値が
許容値を越えたとき入力動画像は標準動画像でないと判
定し、形状距離値が許容値内のとき入力動画像が標準動
画像であると判定することを特徴とする。
する。
いる場合について、本発明の原理を説明する。
の現象のモデルとして使われている。そこで、注目する
現象が正規分布に従っているか否かを確かめることが重
要となり、このために「尖度」という統計量が用いられ
ている。尖度値は、注目する現象が正規分布に従ってい
るときは「3」に等しく、正規分布よりも尖った分布の
ときは「3」より大きく、反対に、正規分布よりもなだ
らかな分布のときは「3」より小さくなる。このこと
は、正規分布の分散の値にかかわらず、常に成り立つ。
ターン行列層)と入力パターン行列(或いは入力パター
ン行列層)との間の形状変化を、正規分布の値を成分と
する基準パターンベクトルの形状変化に置き換え、この
基準パターンベクトルの形状変化の大きさを尖度の変化
量として数値化することにより、標準パターン行列(或
いは標準パターン行列層)と入力パターン行列(或いは
入力パターン行列層)との類似の程度を形状距離値とし
て算出することができる。ただし、一般に、ベクトル形
状の尖度の計算式においては、ベクトルの成分値が負の
場合には定義できない。つまり、標準パターン行列(或
いは標準パターン行列層)の成分値と入力パターン行列
(或いは入力パターン行列層)の成分値のあらゆる大小
関係に対して、基準パターンベクトルの成分値が非負で
ある必要がある。
パターン行列層)の指定成分ごとに異なる分散の値をも
つ正規分布を作成し、上記正規分布の値を成分とする基
準パターン正ベクトルと、同正規分布の値を成分とする
基準パターン負ベクトルを予め作成しておく。ここで、
パターン行列に係わる上記分散の値の算出方法は、正規
分布の中心線がパターン行列の指定成分の点を通り、か
つ、パターン行列が成す平面に垂直になるようにし、上
記中心線を軸として正規分布を回転したとき、正規分布
の主要部分がパターン行列全体を覆うようにするもので
ある。また、パターン行列層に係わる上記分散の値の算
出方法は、パターン行列に係わる上記分散の値の算出方
法を1次元だけ拡張する(パターン行列層に係わる上記
分散の値の算出方法について幾何学的な表現はできな
い)。そして、パターン行列(或いはパターン行列層)
の各成分について、パターン行列(或いはパターン行列
層)の指定成分と各成分との間の長さを求め、基準パタ
ーン正ベクトル及び基準パターン負ベクトルの中心から
上記長さだけ離れた位置に最も近い基準パターン正ベク
トル及び基準パターン負ベクトルの成分番号を算出し、
入力パターン行列(或いは入力パターン行列層)の成分
値が標準パターン行列(或いは標準パターン行列層)の
成分値より大きいときは、その差の絶対値だけ基準パタ
ーン正ベクトルの上記成分番号の成分値を増加させ、小
さいときは、基準パターン負ベクトルの上記成分番号の
成分値を増加させる。次に、形状変化した基準パターン
正ベクトルと基準パターン負ベクトルについてそれぞれ
の尖度を算出し、2つの尖度の差の値を求める。
列及び入力パターン行列(或いは標準パターン行列層及
び入力パターン行列層)の各成分との位置関係により形
状変化した基準パターン正ベクトルと基準パターン負ベ
クトルの各尖度が異なるので、正規分布の中心をパター
ン行列(或いはパターン行列層)各成分の位置に移動し
ながら尖度の差の値を求め、これらの差の値の2乗和の
平方根、或いは、2乗和自身を標準パターン行列(或い
は標準パターン行列層)と入力パターン行列(或いは入
力パターン行列層)との間の形状距離値として検出す
る。
音声との間のパターン行列形状変化を正確に検出するも
のであり、標準振動波と入力振動波との間の類似度を正
確に検出するものであり、標準画像と入力画像との間の
類似度を正確に検出するものである。また、標準立体と
入力立体との間のパターン行列層形状変化を正確に検出
するものであり、標準動画像と入力動画像との間の類似
度を正確に検出するものである。
を用いて音声認識を行うことにより、標準パターン行列
と入力パターン行列との間の形状変化を正確に検出する
ことができ、音声認識の精度を著しく向上させることが
できる。また、このような形状距離値を用いて機械の異
常判定を行うことにより、標準パターン行列と入力パタ
ーン行列との間の形状変化を正確に検出することがで
き、機械の異常検知の精度を著しく向上させることがで
きる。また、このような形状距離値を用いて画像認識を
行うことにより、標準パターン行列と入力パターン行列
との間の形状変化を正確に検出することができ、画像認
識の精度を著しく向上させることができる。また、この
ような形状距離値を用いて立体認識を行うことにより、
標準パターン行列層と入力パターン行列層との間の形状
変化を正確に検出することができ、立体認識の精度を著
しく向上させることができる。また、このような形状距
離値を用いて動画像認識を行うことにより、標準パター
ン行列層と入力パターン行列層との間の形状変化を正確
に検出することができ、動画像認識の精度を著しく向上
させることができる。
のものであっても、上記の説明は成立する。
面に基づいて説明する。本実施例では、2つのパターン
行列(2次元)間の類似度検出値を用いた音声認識方
法、機械の異常判定方法、画像認識方法について、更
に、2つのパターン行列層(3次元)間の類似度検出値
を用いた立体認識方法、動画像認識方法について順を追
って説明する。
方法について述べる。本実施例では、音声認識を行うた
めに、音声の周波数分布の時間変化(声紋)を正規化し
て標準パターン行列と入力パターン行列とを作成し、こ
れらパターン行列間の形状変化を、正規分布の値を成分
とする基準パターンベクトルの形状変化に置き換え、こ
の基準パターンベクトルの形状変化の大きさを尖度の変
化量として数値化することにより音声の類似度を検出
し、更に、その検出値を用いて音声認識を行うものとす
る。
定装置の構造を示しており、1はマイクロホンである。
マイクロホン1は発声者の近傍の定位置に配置され、人
間が発声する音声を測定し、信号として出力する。マイ
クロホン1の出力信号は、それぞれが異なる通過周波数
帯域を持つ複数m1個の帯域通過フィルタ2に入力さ
れ、音声の周波数成分波が抽出されてAD変換器3に入
力され、各AD変換器3において同時刻に且つ周期的に
ディジタル信号に変換されてコンピュータ等の演算装置
4に入力される。また、演算装置4は、マイクロホン1
の出力信号に基づき、以下のように音声の類似度検出処
理を行うように構成されている。ここで、i1(i1=
1,2,・・・,m1)番目の帯域通過フィルタ2の中心周
波数はfi1に設定されており、その出力信号がi1番目
のAD変換器3に入力されるものとする。
声の類似度検出処理手順について説明する。
る方法として様々なものが考案されているが、本実施例
では、歴史的にも古く、性能が安定しているアナログ帯
域通過フィルタ群による方法を用いた場合について、処
理手順を説明する。図2は、帯域通過フィルタ2群の周
波数ゲイン特性の一例を示したものであり、音声をi 1
番目の帯域通過フィルタに通すことにより、中心周波数
がfi1の帯域の周波数成分波を抽出できることが分か
る。このように、それぞれの帯域通過フィルタを構成し
ておけば、音声の周波数分布の特徴が抽出できる。
3の出力信号を時刻tの関数としてxi1(t)(i1=
1,2,・・・,m1)とした時、関数xi1(t)はi1番
目の帯域通過フィルタ2を通して抽出した音声の周波数
成分波である。図3は、関数xi1(t)の一例を示し
たものである。図3に示すように、i2番目の時刻をt
i2(i2=1,2,・・・,m2)として、関数xi
1(t)を各時刻ごとに区切って測定することにより音
声の周波数分布の時間変化の特徴が抽出できる。そのた
め、i1番目の周波数帯域におけるi2番目の時刻のパワ
ースペクトルPi1i2は次の数1により算出できる。た
だし、数1において、関数xi1(t)の2乗和を計算
する時間長Tは、時間的に変化する音声の特徴が顕著に
現れるように任意に設定しておく。
用いる。即ち、一般に、音声の類似度検出では、音量よ
りも音質が重要な要因になることが多い。この場合は、
パワースペクトルの形状変化を検出することが重要であ
り、このためには、数1のパワースペクトルPi1i2
を全エネルギーで正規化して使用した方が都合が良い。
i1番目の周波数帯域におけるi2番目の時刻の正規化パ
ワースペクトルpi1i2 は、次の数2により算出でき
る。
ペクトルの一例を示したものであり、図4(b)は同図
(a)のパワースペクトルを数2を用いて正規化したも
のであるが、これらから、パワースペクトルと正規化パ
ワースペクトルとは相似形であることが分かる。
pi1i2(i1=1,2,・・・,m1)(i2=1,2,・・
・,m2)を成分とする標準パターン行列Hと、入力音声
の正規化パワースペクトルpi1i2(i1=1,2,・・
・,m1)(i2=1,2,・・・,m2)を成分とする入力
パターン行列Nを作成する。この標準パターン行列H及
び入力パターン行列Nを、次の数3のように表現してお
く。ただし、数3は、標準音声及び入力音声の正規化パ
ワースペクトルの形状を、パターン行列のm1×m2個の
成分値で表現したものである。
を(周波数−時間)平面で表現したものであり、同図
(b)は、入力パターン行列Nを同平面で表現したもの
である。更に、図6は、図5(a)、(b)における同
平面の縦の長さと横の長さを1にした(周波数−時間)
正規化平面を示している。なお、本実施例では、図2に
示した帯域通過フィルタ群のそれぞれの帯域幅が異なっ
ている場合であっても、図6において、各成分の間の長
さが等間隔になるように作図するものとする。従って、
図6中に示すように、成分間の縦の長さは1/(m1−
1)、成分間の横の長さは1/(m2−1)になる。
である。ただし、μは平均値、σ2は分散である。
j2 2としたとき、数4の正規分布のグラフ(正規曲線)
を示したものである。また、図7(b)、(c)におい
て正規曲線の関数値に等しい高さの棒グラフを示してい
るが、この棒グラフの高さの値を成分とする基準パター
ン正ベクトルKj1j2 (+)を図7(b)のように作成
し、また、同棒グラフの高さの値を成分とする基準パタ
ーン負ベクトルKj1j2 (-)を図7(c)のように作成
し、次の数5のように表現しておく。数5は正規分布の
形状をベクトルのm0個の成分値で表現したものであ
り、数3は行列(2次元)であるのに対し、数5はベク
トル(1次元)である。図7から分かるように、これら
一対の基準パターンベクトルKj1j2 (+)、Kj1j2 (-)
は相等なベクトルである。なお、数5中の添数j1j
2は、図6に示す点(j1,j2)に対応するものであ
り、数5中のm0は数3中のm1及びm2と異なる任意の
自然数であってよい。
2 2は、正規分布の形状の特徴をベクトルのm0個の成分
値で表現できる範囲の任意の値に設定して良いが、ここ
では、平均値が基準パターンベクトル成分の中央の位置
にあり、分散が以下に述べる値に等しい場合を考える。
また、ここではm0が奇数の場合を考えているが、m0が
偶数の場合にも同様の議論が成り立つ。
き、数4の正規曲線を示したものであり、その尖度値は
「3」に等しい。ここで、図8中の記号(i)で示すy
の範囲においてf(y)の値が正規曲線の値より増加し
たとき、尖度値は「3」より大きくなり、記号(ii)で
示すyの範囲においてf(y)の値が正規曲線の値より
増加したとき、尖度値は「3」より小さくなる。また、
記号(i)と(ii)の境界部分のy(y=−0.7σの
近傍、または、y=+0.7σの近傍)において、f
(y)の値が正規曲線の値より増加したとき、尖度値の
変化量は少なく、尖度値は「3」に近い値になる。一
方、記号(iii)で示すyの範囲においてf(y)の値が
正規曲線の値より増加したとき、尖度値は「3」より大
きくなったり小さくなったりする不安定な動きになる。
このことは、正規分布の分散σ2の値にかかわらず、常
に成り立つ。
行列との間の形状変化を、正規分布の値を成分とする基
準パターンベクトルの形状変化に置き換え、この基準パ
ターンベクトルの形状変化の大きさを尖度の変化量とし
て数値化するためには、−2.1σ≦y≦+2.1σの
範囲(図8中の記号(i)と(ii)で示すyの範囲)に
おいてf(y)の値が増加するようにすれば、尖度値が
安定したものとなる。本実施例では、尖度値が「3」よ
り大きくなるyの範囲と、「3」より小さくなるyの範
囲が同程度の割合になるように、−1.4σ≦y≦+
1.4σの範囲を使用する。
規化平面上の点(j1,j2)、及び、点(i1,i2)を
示している。また、同平面上のすべての点の中で、点
(j1,j2)から最も遠い点(m1,1)も示してい
る。従って、点(j1,j2)と点(i1,i2)との間の
長さλi1i2j1j2は、次の数6により算出できる。同
様に、点(j1,j2)と点(m1,1)との間の長さλ
m11j1j2は、次の数7により算出できる。λm11j
1j2は、点(j1,j2)と各点との間の長さの最大値で
ある。
化平面を3次元で表示したものである。図9において、
正規分布の中心線が点(j1,j2)を通り、かつ、(周
波数−時間)正規化平面に垂直であり、また、正規分布
のy軸が点(m1,1)を通る正規曲線を示している。
また、正規分布の中心線が点(j1,j2)を通り、か
つ、上記平面に垂直であり、また、正規分布のy軸が点
(i1,i2)を通る正規曲線も示している。ここで、こ
れら2つの正規曲線の分散σj1j2 2は、同じ値である
ものとする。従って、上記中心線を軸として正規曲線を
回転したとき、これら2つの正規曲線は一致する。
に示す2つの正規曲線を重ねて2次元で表示したもので
ある。図7(a)において、点(j1,j2)をy=0に
対応させ、点(m1,1)をy=−1.4σj1j2に対
応させている。従って、点(i1,i2)はy=0とy=
−1.4σj1j2の間のyの値に対応することになる。
の間の長さλm11j1j2は数7より算出できるが、図
7(a)に示すy軸上の0と−1.4σj1j2との間の
長さでもある。従って、次の数8より、正規分布の分散
の値が算出できる。
出すれば、正規分布の主要成分(数8の場合には−1.
4σ≦y≦+1.4σの範囲)が(周波数−時間)正規
化平面全体を覆うようにできる。即ち、数8より求めた
正規分布の分散の値を数4に適用することにより正規曲
線が決定され、更に、図7(b)、(c)、及び、数5
に適用することにより基準パターン正ベクトルKj1j2
(+)及び基準パターン負ベクトルKj1j2 (-)が作成でき
る。
1j2成分をj1=1〜m1、j2=1〜m2の中の一組の値
に固定しておいた上で、パターン行列のi1i2成分(i
1=1,2,・・・,m1)(i2=1,2,・・・,m2)のそ
れぞれについて考える。点(j1,j2)と点(i1,
i2)との間の長さλi1i2j1j2は数6より算出でき
るが、図7(a)に示すように、λi1i2j1j2は正規
分布の平均値からの偏差の値でもある。
ーンベクトルの各成分番号の間の長さをΔyj1j2とし
たとき、成分番号i0(i0=1,2,・・・,m0)に対応
する正規分布の平均値からの偏差の値Lj1j2i0は、
次の数9により算出できる。なお、ここでは、基準パタ
ーンベクトルの各成分番号の間の長さが等間隔である場
合を考える。また、数9において(m0+1)/2は基
準パターンベクトルの中央の成分番号である。
1i2j1j2とLj1j2i0との関係を示す。同図(a)
において、λi1i2j1j2は点(j1,j2)と点
(i1,i2)との間の長さであることを示している。ま
た、同図(b)、(c)において、基準パターン正ベク
トル及び基準パターン負ベクトルの中心からλi1i2j
1j2だけ離れた位置に最も近い基準パターン正ベクトル
及び基準パターン負ベクトルの成分番号がi0であり、
成分番号i0に対応する正規分布の平均値からの偏差の
値がLj1j2i0であることを示している。
成分が与えられたとき、数6よりこれら2点間の長さλ
i1i2j1j2が算出され、次に、基準パターンベクトル
について成分番号i0、正規分布の平均値からの偏差の
値Lj1j2i0、及び、成分値kj1j2 (+)i0とkj1j
2 (-)i0が得られることになる。
数m0を十分に大きく(Δyj1j2を十分に小さく)し
ておけば、λi1i2j1j2の値とLj1j2i0の値との
間の誤差を十分に小さくすることができ、精度の高い計
算結果が得られる。また、成分番号i0と成分番号(m0
−i0+1)は正規分布の平均値に関して対称であるた
め、i0の代わりに(m0−i0+1)を用いてもよい。
行列Nとの間の形状変化を、基準パターン正ベクトルK
j1j2 (+)及び基準パターン負ベクトルKj1j2 (-)の形
状変化に置き換える。即ち、パターン行列のi1i2成分
(i1=1,2,・・・,m1 )(i2=1,2,・・・,
m2)について、標準パターン行列Hの成分値hi1i2
と入力パターン行列Nの成分値ni1i2との間の変化量
の絶対値は|ni1i2−hi1i2|であるが、次の数1
0に示すように、ni1i2がhi1i2より大きいとき基
準パターン正ベクトルKj1j2 (+)の成分値kj1j2 (+)
i0をこの変化量の絶対値|ni1i2−hi1i2|だけ
増加させ、ni1i2がhi1i2より小さいとき基準パタ
ーン負ベクトルKj1j2 (-)の成分値kj1j2 (-)i0を
この変化量の絶対値|ni1i2−hi1i2|だけ増加さ
せる。
算出し、数10により基準パターンベクトルの成分値k
j1j2 (+)i0及びkj1j2 (-)i0を増加させるようにす
れば、パターン行列のj1j2成分とi1i2成分のあらゆ
る組み合わせに対して、−1.4σ≦y≦+1.4σの
範囲においてf(y)の値が増加するようにできる。
例を用いて、数10を説明する。これら図10〜図16
の各(a)、(b)は、パターン行列のm1×m2個の成
分値を行列形状として図形で表現したものであり、ま
た、これら図10〜図16の各(c)は、ベクトルのm
0個の成分値をベクトル形状として図形で表現したもの
である。なお、全体のパターン行列の中で1つの成分の
パワースペクトルだけが増加した場合、数2により正規
化を行うと、その成分の正規化パワースペクトルの増加
とともに、他の成分の正規化パワースペクトルが相対的
に減少することになるが、図10〜図16では、表示を
簡単にし且つ理解を容易にするため、入力パターン行列
形状の着目している成分についてのみ増減を表示し、他
の成分については変化がないものとしている。また、基
準パターン負ベクトル形状は、基準パターン正ベクトル
形状との対比を容易にするため、上下を逆に表示してい
る。
を図6及び図9に示す位置に固定し、正規分布の中心線
がj1j2成分を通る場合について、図10〜図16を説
明すると下記の通りである。 (1)図10は、標準パターン行列形状と入力パターン
行列形状が等しい例を示したものである。この場合、基
準パターン正ベクトル及び基準パターン負ベクトルは共
に正規分布の形状から変化はない。 (2)図11は、標準パターン行列形状に対して入力パ
ターン行列形状のj1j2成分だけがδ1増加した例を示
したものである。この場合には、基準パターン正ベクト
ル形状の中央部分が同じ値δ1だけ増加し、基準パター
ン負ベクトル形状に変化はない。 (3)図12は、標準パターン行列形状に対して入力パ
ターン行列形状のj1j2成分だけがδ2減少した例を示
したものである。この場合には、基準パターン正ベクト
ル形状に変化はなく、基準パターン負ベクトル形状の中
央部分が同じ値δ 2だけ増加する。 (4)図13は、標準パターン行列形状に対して入力パ
ターン行列形状のm11成分だけがδ3増加した例を示し
たものである。この場合には、同図(b)に示すよう
に、j1j2成分とm11成分との間の長さはλm11j1
j2であり、同図(c)に示すように、基準パターン正
ベクトル形状の中心からλm11j1j2だけ離れた位置
に最も近い基準パターン正ベクトル形状の成分番号は2
であり、この基準パターン正ベクトル形状の成分番号2
の成分値がδ3だけ増加している。一方、基準パターン
負ベクトル形状に変化はない。 (5)図14は、標準パターン行列形状に対して入力パ
ターン行列形状のm11成分だけがδ4減少した例を示し
たものである。この場合には、同図(b)に示すよう
に、j1j2成分とm11成分との間の長さはλm11j1
j2であり、同図(c)に示すように、基準パターン負
ベクトル形状の中心からλm11j1j2だけ離れた位置
に最も近い基準パターン負ベクトル形状の成分番号は2
であり、この基準パターン負ベクトル形状の成分番号2
の成分値がδ4だけ増加している。一方、基準パターン
正ベクトル形状に変化はない。 (6)図15は、標準パターン行列形状に対して入力パ
ターン行列形状のi1i2成分だけがδ5増加した例を示
したものである。この場合にも、同図(b)に示すよう
に、j1j2成分とi1i2成分との間の長さはλi1i2j
1j2であり、同図(c)に示すように、基準パターン正
ベクトル形状の中心からλi1i2j1j2だけ離れた位置
に最も近い基準パターン正ベクトル形状の成分番号はi
0であり、この基準パターン正ベクトル形状の成分番号
i0の成分値がδ5だけ増加している。 (7)図16は、標準パターン行列形状に対して入力パ
ターン行列形状のi1i2成分だけがδ6減少した例を示
したものである。この場合にも、同図(b)に示すよう
に、j1j2成分とi1i2成分との間の長さはλi1i2j
1j2であり、同図(c)に示すように、基準パターン負
ベクトル形状の中心からλi1i2j1j2だけ離れた位置
に最も近い基準パターン負ベクトル形状の成分番号がi
0であり、この基準パターン負ベクトル形状の成分番号
i0の成分値がδ6だけ増加している。
列形状及び入力パターン行列形状の典型例を示したが、
通常の場合には、標準パターン行列形状に対して入力パ
ターン行列形状の殆どの部分が変化するので、数6は変
化した全ての部分について長さの計算を行い、数10は
変化した全ての部分について形状変化の計算を行うもの
である。また、数10は、絶対的な形状を問題にしてい
るのではなく、相対的な形状変化を問題にしているた
め、任意形状の標準パターン行列及び入力パターン行列
について適用が可能である。
準パターンベクトル(基準パターン正ベクトルKj1j2
(+)と基準パターン負ベクトルKj1j2 (-) )につい
て、それぞれの形状変化の大きさを、尖度の変化量とし
て数値化する。
(+)の尖度Aj1j2 (+)、及び、基準パターン負ベクトル
Kj1j2 (-)の尖度Aj1j2 (-)は、それぞれ次の数11
により算出できる。ただし、数11中のLj1j2i
0(i0=1,2,・・・,m0)は、図10に示すように、
正規分布の平均値からの偏差の値であり、数9により正
規分布の形状の特徴を表現できる範囲の任意の値に設定
しておく。
(+)及びAj1j2 (-)は、正規分布の平均値(中心)のま
わりの4次の積率と、2次の積率の2乗との比である。
意の基準形状の尖度の値を算出できる。
尖度の計算式においては、ベクトルの成分値が負の場合
には定義できず、標準パターン行列の成分値と入力パタ
ーン行列の成分値のあらゆる大小関係に対して、基準パ
ターンベクトルの成分値が非負である必要がある。
正ベクトルKj1j2 (+)及び、基準パターン負ベクトル
Kj1j2 (-)を作成しておき、数10ではそれらの成分
値の変化が非減少になるようにし、数11においてそれ
ぞれの尖度Aj1j2 (+)、Aj1j2 (-)を算出するように
している。
1j2 (+)と基準パターン負ベクトルの尖度Aj1j2 (-)の
2つの変化量から、尖度の差の値(Aj1j2 (+)−Aj1
j2 (-) )を以て、標準パターン行列と入力パターン行
列の類似の程度を表す形状変化量Dj1j2とする。
定された2つの基準パターンベクトルKj1j2 (+)及び
Kj1j2 (-)の尖度の値は、共に3に等しい。そのた
め、数10により形状変化した基準パターン正ベクトル
及び基準パターン負ベクトルの尖度の変化量は、それぞ
れ{Aj1j2 (+)−3}及び{Aj1j2 (-)−3}とな
る。即ち、正方向の変化量は{Aj1j2 (+)−3}、ま
た負方向の変化量は{Aj1j 2 (-)−3}となり、全体
の変化量はこの差の値となる。従って、次の数12よ
り、形状変化量Dj1j2が算出できる。
ン行列形状及び入力パターン行列形状の典型例それぞれ
の場合について、数12より算出される形状変化量Dj
1j2が示す値について考えてみると、以下の通りであ
る。 (1)図10に示すように、標準パターン行列形状と入
力パターン行列形状が等しい場合には、Aj1j2 (+)=
3かつAj1j2 (-)=3より、形状変化量Dj1j2=0
になる。 (2)また、図11に示すように、標準パターン行列形
状に対して入力パターン行列形状のj1j2成分が増加し
た場合には、Aj1j2 (+)>3かつAj1j2 (-)=3によ
り、Dj1j2>0となる。 (3)図12に示すように、標準パターン行列形状に対
して入力パターン行列形状のj1j2成分が減少した場合
には、Aj1j2 (+)=3かつAj1j2 (-)>3により、D
j1j2<0になる。 (4)一方、図13に示すように、標準パターン行列形
状に対して入力パターン行列形状のj1j2成分から遠く
離れた部分が増加した場合には、Aj1j2 (+)<3かつ
Aj1j2 (-)=3により、Dj1j2<0となる。 (5)図14に示すように、標準パターン行列形状に対
して入力パターン行列形状のj1j2成分から遠く離れた
部分が減少した場合には、Aj1j2 (+)=3かつAj1j
2 (-)<3により、Dj1j2>0になる。 (6)図15に示すように、標準パターン行列形状に対
して入力パターン行列形状のj1j2成分から中程度離れ
た部分が増加した場合には、図8における記号(i)と
(ii)の境界部分のy(y=−0.7σの近傍、また
は、y=+0.7σの近傍)においてf(y)の値が正
規曲線より増加することになり尖度値の変化量が少ない
ため、Aj1j2 (+)≒3かつAj1j2 (-)=3により、D
j1j2≒0となる。 (7)図16に示すように、標準パターン行列形状に対
して入力パターン行列形状のj1j2成分から中程度離れ
た部分が減少した場合には、図8における記号(i)と
(ii)の境界部分のy(y=−0.7σの近傍、また
は、y=+0.7σの近傍)においてf(y)の値が正
規曲線より増加することになり尖度値の変化量が少ない
ため、Aj1j2 (+)=3かつAj1j2 (-)≒3により、D
j1j2≒0となる。
形状のj1j2成分の近傍)において、入力音声の正規化
パワースペクトルが標準音声の正規化パワースペクトル
に対して相対的に強くなったときは、形状変化量Dj1
j2は正の値で、かつ,相対強度に比例して増加する。
逆に、正規分布の中央付近において、入力音声の正規化
パワースペクトルが標準音声の正規化パワースペクトル
に対して相対的に弱くなったときは、形状変化量Dj1
j2は負の値で、かつ,相対強度に比例して減少する。
行列形状の各成分位置に順次移動させた場合について、
各位置での形状変化量を求める。図17は標準パターン
行列形状に対して入力パターン行列形状のi1i2成分だ
けが増加した例を示す。図18は、図17の例におい
て、正規分布の平均値が点(j1,j2)(j1=1,
2,・・・,m1 )(j2=1,2,・・・,m2)の位置に移
動したときのそれぞれの場合について、異なる分散の値
をもつ正規分布、及び、正規分布の平均値と点(i 1,
i2)との間の長さλi1i2j1j2(j1=1,2,・・
・,m1 )(j2=1,2,・・・,m2)を示したものであ
る。また、図19は、図18のそれぞれの場合につい
て、基準パターン正ベクトル形状及び基準パターン負ベ
クトル形状を示したものである。
2,・・・,m1 )(j2=1,2,・・・,m2)のそれぞれ
の場合について、(周波数−時間)正規化平面上のすべ
ての点の中で点(j1,j2)から最も遠い点を数7に適
用して点(j1,j2)と各点との間の長さの最大値を求
め、数8により点(j1,j2)ごとに異なる分散の値を
もつ正規分布を作成している。従って、正規分布の中心
線が点(j1,j2)を通り、かつ、上記平面に垂直にな
るようにし、上記中心線を軸として正規分布を回転した
とき、正規分布の主要部分が正規分布の平均値の位置に
かかわらず常に上記平面全体を覆うようにできる。これ
にともない、図19では、点(j1,j2)のそれぞれの
場合に対応して、基準パターン正ベクトル形状及び基準
パターン負ベクトル形状は異なるものになっている。
列形状に対して、同図(b)の入力パターン行列形状の
i1i2成分がδ増加しているが、図18において、正規
分布の平均値と点(i1,i2)との間の長さλi1i2j
1j2(j1=1,2,・・・,m 1 )(j2=1,2,・・・,
m2)を示し、図19においては、それぞれの基準パタ
ーン正ベクトル形状においてのみ、その中心からλi1
i2j1j2だけ離れた位置に最も近い基準パターン正ベ
クトル形状の成分番号に対応する部分が同じ値δだけ増
加し、基準パターン負ベクトル形状に変化がないことを
示している。
列形状の中心位置から離れている場合、図18中の記号
アで示す部分は、標準パターン行列及び入力パターン行
列の成分番号(i1=1,2,・・・,m1 )(i2=1,
2,・・・,m2)に対応していないため、これに対応する
基準パターン正ベクトル形状においては、常に値の変化
はない。
値からの偏差の値Lj1j2i0は、2乗または4乗され
ている。一方、基準パターン正ベクトル形状及び基準パ
ターン負ベクトル形状においては、成分番号i0と成分
番号(m0−i0+1)は正規分布の平均値に関して対称
である。このため、正規分布の平均値からの偏差の値L
j1j2i0の2乗の値または4乗の値は、Lj1j2(m0
−i0+1)の2乗の値または4乗の値に等しい。従っ
て、成分番号i0の代わりに成分番号(m0−i0+1)を
用いてもよい。
(特願平9−61007号)の段落[0066]におい
ては「図11中の記号イで示す部分は、基準パターン正
ベクトル及び基準パターン負ベクトルの値の作成範囲外
であるため、破線で示す入力パターンベクトルの変化に
かかわらず、常に値の変化はない」としているが、本発
明においては、例えば数7及び数8により点(j1,
j2)ごとに異なる分散の値をもつ正規分布を作成し、
正規分布の主要部分が正規分布の平均値の位置にかかわ
らず常にパターン行列全体を覆うようにしたため、標準
パターン行列及び入力パターン行列のすべての成分番号
について常に値を変化させることが可能になった。これ
により、標準パターン行列と入力パターン行列との間の
形状変化のすべてが尖度の値に反映するようになり、類
似度検出性能が向上する。
パターン行列形状のj1j2成分(j 1=1,2,・・・,m
1 )(j2=1,2,・・・,m2)の位置に移動させたと
きのそれぞれの場合について、前記と同様の数7,数
8、数5、数9、数6、数10,数11,数12を順に
用いた処理手順により形状変化量Dj1j2(j1=1,
2,・・・,m1 )(j2=1,2,・・・,m2)を算出す
る。この様子が図18及び図19に示されている。ただ
し、図19に示すように、数11におけるLj1j2i0
(i0=1,2,・・・,m0)は、移動した正規分布のそ
れぞれの平均値からの偏差の値であり、また、kj1j2
(+)i0及びkj1j2 (-)i0(i0=1,2,・・・,m0)
は、このLj1j2i0に対応するものである。
m2 個の形状変化量Dj1j2を算出する処理手順を示し
たフローチャートである。ここでは、数3により標準パ
ターン行列H及び入力パターン行列Nを作成した後の処
理手順を示しており、図20中のステップS3−1〜S
3−9は図24中のステップS3の詳細でもある。
では、j1=1,j2=1と初期設定しておき、次のステ
ップS3−2からステップS3−7では、j2=m2まで
j2を1ずつ増加し、ステップS3−2からステップS
3−9では、j1=m1までj 1を1ずつ増加して形状変
化量Dj1j2を算出するループに入る。
3−2では、ループを回る毎に、1対の基準パターンベ
クトル(基準パターン正ベクトルKj1j2 (+)と基準パ
ターン負ベクトルKj1j2 (-) )を数7、数8、数5、
数9を順に用いて作成する。即ち、数7により点
(j1,j2)と各点との間の長さの最大値を求め、数8
により正規分布の分散の値を算出し、数5及び数9によ
り正規分布の値を成分とする基準パターン正ベクトル及
び基準パターン負ベクトルを作成する。次に、ステップ
S3−3からステップS3−5では、数6、数10、数
11、数12を順に用いて形状変化量Dj1j2を算出す
る。即ち、ステップS3−3で、(周波数−時間)正規
化平面上の各点について、数6により点(j1,j2)と
各点との間の長さを求め、基準パターン正ベクトル及び
基準パターン負ベクトルの中心から上記長さだけ離れた
位置に最も近い基準パターン正ベクトル及び基準パター
ン負ベクトルの成分番号を算出し、数10により基準パ
ターン正ベクトルKj1j2 (+)及び基準パターン負ベク
トルKj1j2 (-)の形状を変化させ、ステップS3−4
で、数11を用いて基準パターン正ベクトルの尖度Aj
1j2 (+)及び基準パターン負ベクトルの尖度Aj1j2 (-)
を算出し、ステップS3−5で、数12を用いて形状変
化量Dj1j2を算出する。
(j1=1,2,・・・,m1 )(j2=1,2,・・・,
m2)に対応するそれぞれの場合についてm1×m2個の
形状変化量Dj1j2を算出することができる。
ターン行列形状及び入力パターン行列形状について、図
20の処理手順を用いて算出したパターン行列の成分別
形状変化量の模式図である。
ように標準パターン行列形状に対して入力パターン行列
形状が増加した部分と同じ位置に移動したとき、図21
のように形状変化量は最大となり(同図中、Di1i2で
示す部分)、離れた位置に移動したとき負の値になるこ
とが分かる。
(特願平9−61007)の段落[0076]におい
て、[また、さらに離れた位置に移動したときは、図1
1中の記号イで示す部分が現れるため、図13のように
形状変化量は0となる(同図中、中心周波数f1の帯域
に対応するもの)。」としているが、本発明において
は、標準パターン行列及び入力パターン行列のすべての
成分番号について常に値を変化させることを可能にした
ため形状変化量が0に固定されることがなくなった。こ
れにより、標準パターン行列と入力パターン行列との間
の形状変化のすべてが尖度の値に反映するようになり、
類似度検出性能が向上する。
ち、形状変化した基準パターン正ベクトルの尖度と基準
パターン負ベクトルの尖度との差(Aj1j2 (+)−Aj1
j2 (-) )は、標準パターン行列形状に対して入力パター
ン行列形状が増加した部分と同じ位置に基準形状の中心
が移動した場合において、その値が増加することにな
る。
が、標準音声の正規化パワースペクトルに対してパター
ン行列のどの成分においてどの程度強くなっているか
を、形状変化量として検出することができる。
個の形状変化量Dj1j2(j1=1,2,・・・,m1)
(j2=1,2,・・・,m2)を用いて、標準パターン行
列形状と入力パターン行列形状との差を、2つのパター
ン行列間の1個の形状距離値として数値化する。
Dj1j2の積算であると考えられる。従って、次の数1
3より、形状距離値dを算出できる。
j2の2乗和の平方根を形状距離値としているが、次の
数14のように、m1×m2個の形状変化量Dj1j2の2
乗和自身を形状距離値dとすることもできる。
次に、この方法を用いて図39、図40に示した標準音
声20及び入力音声21、22、23について、標準パ
ターン行列20Aと各入力パターン行列21A、22
A、23Aとの間の形状距離値d21、d22,d23
を算出することを考えてみる。
から1まで増加させたとき、形状距離値d21、d2
2、d23が変化する様子を示したものである。この図
22から、図39、図40の例では、形状距離値は常に
d21=d22<d23であり、αの値が増加するにつ
れて、形状距離値d21、d22、d23も増加するこ
とが分かる。
さい場合について、仮に、入力音声21と入力音声22
は摩擦子音/s/の「スペクトル強度のゆらぎ」であ
り、入力音声23は摩擦子音/s/とは異なる音声であ
るとする。
角度の値を用いているため、図39、図40において入
力音声21、22、23の変数αの値が同じときには、
図43及び図44に示したように、入力音声21、22
が標準音声であり、入力音声23は標準音声でないこと
を判定できなかった。
22、23のαの値が同じときでも、図22に2つの白
丸印5、6で示すように、標準音声からの形状距離値d
21、d22、d23と任意に設定した許容値とを比較
することにより、白丸印6の入力音声は標準音声であ
り、白丸印5の入力音声は標準音声でないと判定するこ
とができる。つまり、摩擦子音/s/の入力音声21、
22と、摩擦子音/s/とは異なる入力音声23とを区
別できる。
て図41、図42に示した標準音声24及び入力音声2
5、26、27について、標準パターン行列24Aと各
入力パターン行列25A、26A、27Aとの間の形状
距離値d25、d26、d27を算出することを考えて
みる。
から1まで増加させたとき、形状距離値d25、d2
6、d27が変化する様子を示したものである。この図
23から、図41、図42の例では、形状距離値は常に
d25<d26<d27であり、βの値が増加するにつ
れて、形状距離値d25、d26、d27も増加するこ
とが分かる。
力音声25は標準音声24と同じ音声であって、そのピ
ークに「周波数のずれ」または「時間のずれ」が発生し
たものであり、入力音声26と入力音声27は標準音声
24とは異なる音声であるとする。
角度の値を用いているため、図41、図42において入
力音声25、26、27の変数βの値が同じときには、
図45及び図46に示したように、入力音声25が標準
音声であり、入力音声26、27は標準音声でないこと
を判定できなかった。
26、27のβの値が同じときでも、図23に3つの白
丸印7、8、9で示すように、標準音声からの形状距離
値d25、d26、d27と任意に設定した許容値とを
比較することにより、白丸印9の入力音声は標準音声で
あり、白丸印7、8の入力音声は標準音声でないと判定
することができる。つまり、標準音声24と同じ入力音
声25と、標準音声24とは異なる入力音声26、27
とを区別できる。
24のピークに対する入力音声25、26、27のピー
クの[周波数のずれ」または「時間のずれ」の大きさ
は、入力音声25、26、27の順に大きくなってい
る。一方、図23において、形状距離値はd25<d2
6<d27となっており、形状距離値を用いれば、これ
らピークの[周波数のずれ」または「時間のずれ」の大
きさも検出できる。
を用いてコンピュータが連続的に音声の類似度を検出
し、音声を認識する一例を図24を参照して説明する。
めのフローチャートである。図24において、ステップ
S1では標準音声から標準パターン行列を予め作成して
おく。次のステップS2では入力音声から入力パターン
行列を作成し、ステップS3では形状変化量Dj1j
2(j1=1,2,・・・,m1 )(j2=1,2,・・・,
m2)を算出する。ここで、ステップS3の形状変化量
の算出手順は、前述した図20におけるステップS3−
1からステップS3−9により構成される。そして、ス
テップS4では形状距離値dを算出し、ステップS5で
は許容値と比較して判定を行う。判定の後、再び、ステ
ップS2からの処理を繰り返す。
に認識することができる。形状距離値dが許容値を越え
たとき、ステップS6で入力音声は標準音声でないと判
定し、形状距離値dが許容値内のとき、ステップS7で
入力音声は標準音声であると判定する。
例えば/a/、/i/、/u/、/e/、/o/という
音声のように、入力音声が複数の音声のうちのどれであ
るかを認識することが多い。このような場合には、/a
/、/i/、/u/、/e/、/o/というそれぞれの
音声を別々の標準音声と考え、これらの標準音声から5
個の標準パターン行列を作成しておく。
行列を作成し、この入力パターン行列と上記5個の各標
準パターン行列との間の形状距離値を算出し、これらの
形状距離値のうちの最小値と、任意に設定した許容値と
を比較し、最小の形状距離値が許容値を越えていないと
きには、入力音声は最小の形状距離値を与える標準音声
であると判定し、越えたときには入力音声は5個の標準
音声のいずれでもないと判定する。
め、音声の類似度検出装置としてブロック図で示したも
のである。図25において、10はパターンベクトル生
成器、11はパターン行列生成器、12は比較器、1
3、14、15は計算器である。
の値を成分とする基準パターン正ベクトルKj1j2 (+)
及び基準パターン負ベクトルKj1j2 (-)を生成し、パ
ターン行列生成器11は、標準音声の特徴量を成分とす
る標準パターン行列Hと、入力音声の特徴量を成分とす
る入力パターン行列Nとを生成する。比較器12は、パ
ターン行列の各成分について、入力パターン行列の成分
値が標準パターン行列の成分値より大きいか否かを比較
する。計算器13は、パターン行列の指定成分と各成分
との間の長さを求め、基準パターンベクトルの中心から
上記長さだけ離れた位置に最も近い基準パターンベクト
ルの成分番号を算出し、入力パターン行列の成分値が標
準パターン行列の成分値より大きいとき、その差の絶対
値だけ基準パターン正ベクトルKj1j2 (+)の上記成分
番号の成分値を増加させ、入力パターン行列の成分値が
標準パターン行列の成分値より小さいとき、その差の絶
対値だけ基準パターン負ベクトルKj1j2 (-)の上記成
分番号の成分値を増加させる。計算器14は、上記増加
手段13により生成された基準パターン正ベクトルKj
1j2 (+)の尖度と上記増加手段13により生成された基
準パターン負ベクトルKj1j2 (-)の尖度との差の値を
算出する。ここで、尖度の差の値を算出するに際し、パ
ターン行列の指定成分を各成分の位置に移動しながら尖
度の差の値を求める。計算器15は、上記尖度の差の値
の2乗和の平方根を算出することにより、標準パターン
行列と入力パターン行列の間の形状距離値dを得る。
音声の特徴量を成分とする標準パターン行列と、入力音
声の特徴量を成分とする入力パターン行列とを作成し
(ステップS1〜S2)、パターン行列の指定成分ごと
に異なる分散の値をもつ基準形状を作成し、上記基準形
状の値を成分とする基準パターン正ベクトル及び基準パ
ターン負ベクトルを作成し、パターン行列の指定成分
(基準形状の中心)を標準パターン行列のj1=1 〜
m1,j2=1〜m2各成分位置に順次合わせながら、標
準パターン行列と入力パターン行列間の形状の変化を、
基準パターン正ベクトルと基準パターン負ベクトルの形
状変化に置き換え、これら基準パターン正ベクトルと基
準パターン負ベクトルの尖度の変化量を数値化して形状
変化量Dj1j2とし(ステップS3)、形状変化量Dj
1j2 (j1=1 ,2,…,m1)(j2=1,2,…,m
2)から標準音声と入力音声のパターン行列形状につい
ての形状距離値dを算出することにより(ステップS
4)、正確な音声の類似度検出値を得ることができる。
また、この音声類似度検出値(形状距離値d)を任意に
設定した許容値と比較し(ステップS5)、形状距離値
dが許容値を越えたとき入力音声は標準音声でないと判
定し(ステップS6)、形状距離値dが許容値内のとき
入力音声は標準音声であると判定する(ステップS7)
ことにより、正確な音声認識結果を得ることができる。
機械の異常判定方法について述べる。本実施例では、機
械の異常判定を行うために、振動波の周波数分布の時間
変化を正規化して標準パターン行列と入力パターン行列
とを作成し、これらパターン行列間の形状変化を、正規
分布の値を成分とする基準パターンベクトルの形状変化
に置き換え、この基準パターンベクトルの形状変化の大
きさを尖度の変化量として数値化することにより振動波
の類似度を検出し、更に、その検出値を用いて機械の異
常判定を行うものとする。
適宜な振動センサにより機械の振動波を測定する。図1
に示すように、i1番目のAD変換器3の出力信号を時
刻tの関数としてxi1(t)(i1=1,2,・・・,
m1)とした時、関数xi1(t)はi1番目の帯域通過
フィルタ2を通して抽出した振動波の周波数成分波であ
る。また、図3において、i2番目の時刻をti2(i2
=1,2,・・・,m2)として、関数xi1(t)を各時
刻ごとに区切って測定することにより振動波の周波数分
布の時間変化の特徴が抽出できる。そのため、i1番目
の周波数帯域におけるi2番目の時刻のパワースペクト
ルPi1i2は数1により算出できる。ただし、関数xi
1(t)の2乗和を計算する時間長Tは、時間的に変化
する振動波の特徴が顕著に現れるように任意に設定して
おく。
を、上記で算出した振動波のパワースペクトルPi1i2
に適用し、機械の異常判定を行う。
する標準パターン行列と入力振動波の特徴量を成分とす
る入力パターン行列とを作成し、これらのパターン行列
形状変化を基準パターン正ベクトル及び基準パターン負
ベクトルの形状変化に置き換えて、この形状変化の大き
さを尖度の変化量とし、基準パターン正ベクトルと基準
パターン負ベクトルの尖度の差から、標準パターン行列
と入力パターン行列との間の形状距離値を算出し、得ら
れた形状距離値と任意に設定した許容値とを比較し、形
状距離値が許容値を越えたとき機械は異常であると判定
し、形状距離値が許容値内のとき正常であると判定す
る。
像認識方法について述べる。本実施例では、画像認識を
行うために、画像の濃度パターンを正規化して標準パタ
ーン行列と入力パターン行列とを作成し、これらパター
ン行列間の形状変化を、正規分布の値を成分とする基準
パターンベクトルの形状変化に置き換え、この基準パタ
ーンベクトルの形状変化の大きさを尖度の変化量として
数値化することにより画像の類似度を検出し、更に、そ
の検出値を用いて画像認識を行うものとする。
一例である。同図に示されるように、画像はx方向及び
y方向をそれぞれm1個及びm2個に区切ったm1×m2個
の画素により構成される。ここで、x方向にi1番目、
かつ、y方向にi2番目の画素における画像の濃度をP
i1i2とすると、正規化濃度pi1i2は数2により算出
できる。
1=1,2,・・・,m1)(i2=1,2,・・・,m2)を成
分とする標準パターン行列Hと、入力画像の正規化濃度
pi 1i2(i1=1,2,・・・,m1)(i2=1,2,・・
・,m2)を成分とする入力パターン行列Nを作成する。
この標準パターン行列H及び入力パターン行列Nを、数
3のように表現しておく。ただし、数3は、標準画像及
び入力画像の正規化濃度の形状を、パターン行列のm1
×m2個の成分値で表現したものであると読み替える。
Hを(x−y)平面で表現したものであり、同図(b)
は、入力パターン行列Nを同平面で表現したものであ
る。
上記で作成した画像の標準パターン行列H及び入力パタ
ーン行列Nに適用し、画像認識を行う。
る標準パターン行列と入力画像の特徴量を成分とする入
力パターン行列とを作成し、これらのパターン行列形状
変化を基準パターン正ベクトル及び基準パターン負ベク
トルの形状変化に置き換えて、この形状変化の大きさを
尖度の変化量とし、基準パターン正ベクトルと基準パタ
ーン負ベクトルの尖度の差から、標準パターン行列と入
力パターン行列との間の形状距離値を算出し、得られた
形状距離値と任意に設定した許容値とを比較し、形状距
離値が許容値を越えたとき入力画像は標準画像でないと
判定し、形状距離値が許容値内のとき入力画像が標準画
像であると判定する。
0(a)、(b)、(c)を参照して実験例を説明す
る。図28、図29は、記号”+”の濃度形状を持つ標
準画像16、及び、この標準画像と全画素の濃度の合計
が同じであるが横線の位置が異なる入力画像17、1
8、19について、標準画像16の濃度を成分とする7
行9列の標準パターン行列16Aを予め登録しておき、
また、各入力画像17、18、19の濃度を成分とする
7行9列の入力パターン行列17A、18A、19Aを
作成し、標準パターン行列16Aと各入力パターン行列
17A、18A、19Aとの間の類似性尺度として、ユ
ークリッド距離または角度の余弦e17、e18、e1
9、及び、本発明による形状距離d17、d18、d1
9を算出する様子を模式的に示したものである。なお、
図29では、表示を簡単にするため、標準パターン行列
H及び入力パターン行列Nの成分値を正規化しないで表
示している。
れ実験で得られたユークリッド距離値e17、e18、
e19、角度の余弦値e17、e18、e19、及び、
形状距離値d17、d18、d19を棒グラフで示した
ものである。
(c)は同一の測定データからユークリッド距離値、角
度の余弦値、及び、形状距離値を算出し、標準画像と入
力画像との間のそれぞれの距離値を棒グラフで表したも
のであり、図30(a)、(b)、(c)によれば、以
下のことがいえる。 (1)図28、図29において、標準画像16の横線に
対する入力画像17、18、19の横線の「位置のず
れ」の大きさは、入力画像17、18、19の順に大き
くなっている。図30(a)、(b)においては、ユー
クリッド距離、角度の余弦ともにe17=e18=e1
9となっており、ユークリッド距離や角度の余弦を用い
ても、これら横線の「位置のずれ」の大きさを検出でき
ない。一方、図30(c)において、形状距離はd17
<d18<d19となっており、形状距離を用いれば、
これら横線の「位置のずれ」の大きさを検出できる。 (2)図28、図29において、仮に、入力画像17は
標準画像16と同じ画像であって、その横線に「位置の
ずれ」が発生したものであり、入力画像18と入力画像
19は標準画像16とは異なる画像であるとする。ここ
で、ユークリッド距離や角度の余弦を用いたとき、図3
0(a)、(b)において許容値をどのような位置に設
定しても、入力画像17が標準画像であり、入力画像1
8、19は標準画像でないことを判定できない。一方、
形状距離を用いたとき、図30(c)に示す位置に許容
値を設定したならば、入力画像17は標準画像であり、
入力画像18、19は標準画像でないと判定することが
できる。
たは角度の余弦を用いるよりも形状距離を用いる方が、
より正確に画像の類似度の検出が行えることが理解でき
る。
体認識方法について述べる。本実施例では、立体認識を
行うために、立体の密度(単位体積の質量)パターンを
正規化して標準パターン行列層と入力パターン行列層と
を作成し、これらパターン行列層間の形状変化を、正規
分布の値を成分とする基準パターンベクトルの形状変化
に置き換え、この基準パターンベクトルの形状変化の大
きさを尖度の変化量として数値化することにより立体の
類似度を検出し、更に、その検出値を用いて立体認識を
行うものとする。
等、2つのパターン行列(2次元)間の類似度検出方法
を、2つのパターン行列層(3次元)間の類似度検出方
法に拡張する。
分布を示したものである。同図に示されるように、立体
はx方向、y方向、z方向をそれぞれm1個、m2個、m
3個に区切ったm1×m2×m3個の区画により構成され
る。ここで、x方向にi1番目、かつ、y方向にi2番
目、かつ、z方向にi3番目の区画における立体の密度
をPi1i2i3とすると、正規化密度pi1i2i3は、数
2の代わりに、次の数15により算出できる。
(i1=1,2,・・・,m1)(i2=1,2,・・・,m2)
(i3=1,2,・・・,m3)を成分とする標準パターン
行列層Hと、入力立体の正規化密度pi1i2i3(i1=
1,2,・・・,m1)(i2=1,2,・・・,m2)(i3=
1,2,・・・,m3)を成分とする入力パターン行列層N
を作成する。この標準パターン行列層H及び入力パター
ン行列層Nを、数3の代わりに、次の数16、数17の
ように表現しておく。ただし、数16は標準立体の正規
化密度の形状を、数17は入力立体の正規化密度の形状
を、パターン行列層のm1×m2×m3個の成分値で表現
したものである。
(x−y−z)空間で表現したものであり、図33は、
入力パターン行列層Nを同空間で表現したものである。
更に、図34は、図32、図33における同空間の縦の
長さと横の長さと高さの長さを1にした(x−y−z)
正規化空間を示している。従って、図中に示すように、
成分間の縦の長さは1/(m1−1)、成分間の横の長
さは1/(m2−1)、成分間の高さの長さは1/(m3
−1)になる。
1j2j3 2としたとき、数4の正規分布のグラフ(正規曲
線)を示したものである。また、図35(b)、(c)
において正規曲線の関数値に等しい高さの棒グラフを示
しているが、この棒グラフの高さの値を成分とする基準
パターン正ベクトルKj1j2j3 (+)を図35(b)のよ
うに作成し、また、同棒グラフの高さの値を成分とする
基準パターン負ベクトルKj1j2j3 (-)を図35(c)
のように作成し、数5の代わりに、次の数18のように
表現しておく。数18は正規分布の形状をベクトルのm
0個の成分値で表現したものであり、数16、数17は
行列層(3次元)であるのに対し、数18はベクトル
(1次元)である。図35から分かるように、これら一
対の基準パターンベクトルKj1j2j3 (+)、Kj1j2j
3 (-)は相等なベクトルである。なお、数18中の添数j
1j2j3は、図34に示す点(j1,j2,j3)に対応す
るものであり、数18中のm0は数16、数17中の
m1、m2及びm3と異なる任意の自然数であってよい。
規化空間内の点(j1,j2,j3)、及び、点(i1,i
2,i3)を示している。また、同空間内のすべての点の
中で、点(j1,j2,j3)から最も遠い点(m1,1,
1)も示している。従って、点(j1,j2,j3)と点
(i1,i2,i3)との間の長さλi1i2i3j1j2j3
は、数6の代わりに、次の数19により算出できる。同
様に、点(j1,j2,j3)と点(m1,1,1)との間
の長さλm111j1j2j3は、数7の代わりに、次の数
20により算出できる。λm111j1j2j3は、点(j
1,j2,j3)と各点との間の長さの最大値である。
に示す2つの正規曲線を重ねて2次元で表示したもので
あったが、図35(a)に示す正規曲線は、これと同様
な考えで、図9を1次元だけ拡張したものである(これ
について幾何学的な表現はできない)。図35(a)に
おいて、点(j1,j2,j3)をy=0に対応させ、点
(m1,1,1)をy=−1.4σj1j2j3に対応させ
ている。従って、点(i1,i2,i3)はy=0とy=
−1.4σj1j2j3の間のyの値に対応することにな
る。
1,1)との間の長さλm111j1j 2j3は数20より
算出できるが、図35(a)に示すy軸上の0と−1.
4σj 1j2j3との間の長さでもある。従って、数8の
代わりに、次の数21より、正規分布の分散の値が算出
できる。
出すれば、正規分布の主要成分(数21の場合には−
1.4σ≦y≦+1.4σの範囲)が(x−y−z)正
規化空間全体を覆うようにできる。即ち、数21より求
めた正規分布の分散の値を数4に適用することにより正
規曲線が決定され、更に、図35(b)、(c)、及
び、数18に適用することにより基準パターン正ベクト
ルKj1j2j3 (+)及び基準パターン負ベクトルKj1j2
j3 (-)が作成できる。
j1j2j3成分をj1=1〜m1、j2=1〜m2、j3=1
〜m3の中の一組の値に固定しておいた上で、パターン
行列層のi1i2i3成分(i1=1,2,・・・,m1)(i
2=1,2,・・・,m2)(i3=1,2,・・・,m3)のそ
れぞれについて考える。点(j1,j2,j3)と点
(i1,i2,i3)との間の長さλi1i2i3j1j2j3
は数19より算出できるが、図35(a)に示すよう
に、λi1i2i3j1j2j3は正規分布の平均値からの偏
差の値でもある。
ターンベクトルの各成分番号の間の長さをΔyj1j2j
3としたとき、成分番号i0(i0=1,2,・・・,m0)
に対応する正規分布の平均値からの偏差の値Lj1j2j
3i0は、数9の代わりに、次の数22により算出でき
る。なお、ここでは、基準パターンベクトルの各成分番
号の間の長さが等間隔である場合を考える。また、数2
2において(m0+1)/2は基準パターンベクトルの
中央の成分番号である。
i1i2i3j1j2j3とLj1j2j3i0との関係を示す。
同図(a)において、λi1i2i3j1j2j3は点
(j1,j 2,j3)と点(i1,i2,i3)との間の長さ
であることを示している。また、同図(b)、(c)に
おいて、基準パターン正ベクトル及び基準パターン負ベ
クトルの中心からλi1i2i3j1j2j3だけ離れた位置
に最も近い基準パターン正ベクトル及び基準パターン負
ベクトルの成分番号がi0であり、成分番号i0に対応す
る正規分布の平均値からの偏差の値がLj1j2j3i0で
あることを示している。
i1i2i3成分が与えられたとき、数19よりこれら2
点間の長さλi1i2i3j1j2j3が算出され、次に、基
準パターンベクトルについて成分番号i0、正規分布の
平均値からの偏差の値Lj1j2j3i0、及び、成分値k
j1j2j3 (+)i0とkj1j2j3 (-)i0が得られることに
なる。
数m0を十分に大きく(Δyj1j2j3を十分に小さく)
しておけば、λi1i2i3j1j2j3の値とLj1j2j3
i0の値との間の誤差を十分に小さくすることができ、
精度の高い計算結果が得られる。また、成分番号i0と
成分番号(m0−i0+1)は正規分布の平均値に関して
対称であるため、i0の代わりに(m0−i0+1)を用い
てもよい。
ン行列層Nとの間の形状変化を、基準パターン正ベクト
ルKj1j2j3 (+)及び基準パターン負ベクトルKj1j2
j3 ( -)の形状変化に置き換える。即ち、パターン行列層
のi1i2i3成分(i1=1,2,・・・,m1 )(i2=
1,2,・・・,m2)(i3=1,2,・・・,m3)につい
て、標準パターン行列層Hの成分値hi1i2i3と入力
パターン行列層Nの成分値ni1i2i3との間の変化量
の絶対値は|ni1i2i3−hi1i2i3|であるが、数
10の代わりに,次の数23に示すように、ni1i2i
3がhi1i2i3より大きいとき基準パターン正ベクトル
Kj1j2j3 (+)の成分値kj1j2j3 (+)i 0をこの変化
量の絶対値|ni1i2i3−hi1i2i3|だけ増加さ
せ、ni1i2i3がhi1i2i3より小さいとき基準パタ
ーン負ベクトルKj1j2j3 (-)の成分値kj1j2j3 (-)
i0をこの変化量の絶対値|ni1i2i3−hi1i2i3
|だけ増加させる。
を算出し、数23により基準パターンベクトルの成分値
kj1j2j3 (+)i0及びkj1j2j3 (-)i0を増加させる
ようにすれば、パターン行列層のj1j2j3成分とi1i
2i3成分のあらゆる組み合わせに対して、−1.4σ≦
y≦+1.4σの範囲においてf(y)の値が増加する
ようにできる。
に対して入力パターン行列層形状の殆どの部分が変化す
るので、数19は変化した全ての部分について長さの計
算を行い、数23は変化した全ての部分について形状変
化の計算を行うものである。また、数23は、絶対的な
形状を問題にしているのではなく、相対的な形状変化を
問題にしているため、任意形状の標準パターン行列層及
び入力パターン行列層について適用が可能である。
準パターンベクトル(基準パターン正ベクトルKj1j2
j3 (+)と基準パターン負ベクトルKj1j2j3 (-) )に
ついて、それぞれの形状変化の大きさを、尖度の変化量
として数値化する。
j3 (+)の尖度Aj1j2j3 (+)、及び、基準パターン負ベ
クトルKj1j2j3 (-)の尖度Aj1j2j3 (-)は、数11
の代わりに、それぞれ次の数24により算出できる。た
だし、数24中のLj1j2j 3i0(i0=1,2,・・・,
m0)は、図10と同様に、正規分布の平均値からの偏
差の値であり、数22により正規分布の形状の特徴を表
現できる範囲の任意の値に設定しておく。
3 (+)及びAj1j2j3 (-)は、正規分布の平均値(中心)
のまわりの4次の積率と、2次の積率の2乗との比であ
る。
意の基準形状の尖度の値を算出できる。
尖度の計算式においては、ベクトルの成分値が負の場合
には定義できず、標準パターン行列層の成分値と入力パ
ターン行列層の成分値のあらゆる大小関係に対して、基
準パターンベクトルの成分値が非負である必要がある。
正ベクトルKj1j2j3 (+)及び、基準パターン負ベクト
ルKj1j2j3 (-)を作成しておき、数23ではそれらの
成分値の変化が非減少になるようにし、数24において
それぞれの尖度Aj1j2j3 ( +)、Aj1j2j3 (-)を算出
するようにしている。
1j2j3 (+)と基準パターン負ベクトルの尖度Aj1j2j
3 (-)の2つの変化量から、尖度の差の値(Aj1j2j3
(+)−Aj1j2j3 (-) )を以て、標準パターン行列層と
入力パターン行列層の類似の程度を表す形状変化量Dj
1j2j3とする。
設定された2つの基準パターンベクトルKj1j2j3 (+)
及びKj1j2j3 (-)の尖度の値は、共に3に等しい。そ
のため、数23により形状変化した基準パターン正ベク
トル及び基準パターン負ベクトルの尖度の変化量は、そ
れぞれ{Aj1j2j3 (+)−3}及び{Aj1j2j3 (-)−
3}となる。即ち、正方向の変化量は{Aj1j2j3 (+)
−3}、また負方向の変化量は{Aj1j2j3 (-)−3}
となり、全体の変化量はこの差の値となる。従って、数
12の代わりに、次の数25より、形状変化量Dj1j2
j3が算出できる。
j1j2j3が示す値について考えてみる。即ち、正規分
布の中央付近(パターン行列層形状のj1j2j3成分の
近傍)において、入力立体の正規化密度が標準立体の正
規化密度に対して相対的に強くなったときは、形状変化
量Dj1j2j3は正の値で、かつ、相対強度に比例して
増加する。逆に、正規分布の中央付近において、入力立
体の正規化密度が標準立体の正規化密度に対して相対的
に弱くなったときは、形状変化量Dj1j2j3は負の値
で、かつ、相対強度に比例して減少する。
行列層形状の各成分位置に順次移動させた場合につい
て、各位置での形状変化量を求める。即ち、正規分布の
平均値を標準パターン行列層形状のj1j2j3成分(j1
=1,2,・・・,m1 )(j2=1,2,・・・,m2)(j
3=1,2,・・・,m3)の位置に移動させたときのそれ
ぞれの場合について、前記と同様の数20、数21、数
18、数22、数19、数23、数24、数25を順に
用いた処理手順により形状変化量Dj1j2j3(j1=
1,2,・・・,m1 )(j2=1,2,・・・,m2)(j3
=1,2,・・・,m3)を算出する。
2,・・・,m1 )(j2=1,2,・・・,m2)(j3=
1,2,・・・,m3)のそれぞれの場合について、(x−
y−z)正規化空間内のすべての点の中で点(j1,
j2,j3)から最も遠い点を数20に適用して点
(j1,j2,j3)と各点との間の長さの最大値を求
め、数21により点(j1,j2,j3)ごとに異なる分
散の値をもつ正規分布を作成し、上記正規分布の値を成
分とする基準パターン正ベクトルKj1j2j3 (+)及び基
準パターン負ベクトルKj1j2j3 (-)を作成する。
0=1,2,・・・,m0)は、移動した正規分布のそれぞ
れの平均値からの偏差の値であり、また、kj1j2j3
(+)i 0及びkj1j2j3 (-)i0(i0=1,2,・・・,
m0)は、このLj1j2j3i0に対応するものである。
分(j1=1,2,・・・,m1 )(j2=1,2,・・・,m
2)(j3=1,2,・・・,m3)に対応するそれぞれの場
合についてm1×m2×m3個の形状変化量Dj1j2j3を
算出することができる。
j2j3 、即ち、形状変化した基準パターン正ベクトル
の尖度と基準パターン負ベクトルの尖度との差(Aj1
j2j3 ( +)−Aj1j2j3 (-) )は、標準パターン行列層
形状に対して入力パターン行列層形状が増加した部分と
同じ位置に基準形状の中心が移動した場合において、そ
の値が増加することになる。
の正規化密度に対してパターン行列層のどの成分におい
てどの程度強くなっているかを、形状変化量として検出
することができる。
×m3個の形状変化量Dj1j2j3(j1=1,2,・・・,
m1)(j2=1,2,・・・,m2)(j3=1,2,・・・,
m3)を用いて、標準パターン行列層形状と入力パター
ン行列層形状との差を、2つのパターン行列層間の1個
の形状距離値として数値化する。
変化量Dj1j2j3の積算であると考えられる。従っ
て、数13の代わりに、次の数26より、形状距離値d
を算出できる。
Dj1j2j3の2乗和の平方根を形状距離値としている
が、数14の代わりに、次の数27のように、m1×m2
×m3個の形状変化量Dj1j2j3の2乗和自身を形状距
離値dとすることもできる。
列層と入力パターン行列層との間の形状距離値を用い
て、立体認識を行う。
る標準パターン行列層と入力立体の特徴量を成分とする
入力パターン行列層とを作成し、これらのパターン行列
層形状変化を基準パターン正ベクトル及び基準パターン
負ベクトルの形状変化に置き換えて、この形状変化の大
きさを尖度の変化量とし、基準パターン正ベクトルと基
準パターン負ベクトルの尖度の差から、標準パターン行
列層と入力パターン行列層との間の形状距離値を算出
し、得られた形状距離値と任意に設定した許容値とを比
較し、形状距離値が許容値を越えたとき入力立体は標準
立体でないと判定し、形状距離値が許容値内のとき入力
立体が標準立体であると判定する。
認識方法について述べる。本実施例では、動画像認識を
行うために、動画像の濃度パターンを正規化して標準パ
ターン行列層と入力パターン行列層とを作成し、これら
パターン行列層間の形状変化を、正規分布の値を成分と
する基準パターンベクトルの形状変化に置き換え、この
基準パターンベクトルの形状変化の大きさを尖度の変化
量として数値化することにより動画像の類似度を検出
し、更に、その検出値を用いて動画像認識を行うものと
する。
るペンの動きを時間を追って撮影した動画像の一例であ
る。同図に示されるように、動画像は時間を追って撮影
したm3枚の画像により構成され、各画像はx方向及び
y方向をそれぞれm1個及びm 2個に区切ったm1×m2個
の画素により構成される。ここで、x方向にi1番目、
かつ、y方向にi2番目、かつ、i3番目の時刻の画素に
おける動画像の濃度をPi1i2i3とすると、正規化濃
度pi1i2i3は数15により算出できる。
3(i1=1,2,・・・,m1)(i2=1,2,・・・,
m2)(i3=1,2,・・・,m3)を成分とする標準パタ
ーン行列層Hと、入力動画像の正規化濃度pi1i2i3
(i1=1,2,・・・,m1)(i 2=1,2,・・・,m2)
(i3=1,2,・・・,m3)を成分とする入力パターン
行列層Nを作成する。この標準パターン行列層H及び入
力パターン行列層Nを、数16、数17のように表現し
ておく。ただし、数16、数17はそれぞれ、標準動画
像及び入力動画像の正規化濃度の形状を、パターン行列
層のm1×m2×m3個の成分値で表現したものである。
(x−y−時間)空間で表現したものであり、図38
は、入力パターン行列層Nを同空間で表現したものであ
る。
を、上記で作成した動画像の標準パターン行列層H及び
入力パターン行列層Nに適用し、動画像認識を行う。
する標準パターン行列層と入力動画像の特徴量を成分と
する入力パターン行列層とを作成し、これらのパターン
行列層形状変化を基準パターン正ベクトル及び基準パタ
ーン負ベクトルの形状変化に置き換えて、この形状変化
の大きさを尖度の変化量とし、基準パターン正ベクトル
と基準パターン負ベクトルの尖度の差から、標準パター
ン行列層と入力パターン行列層との間の形状距離値を算
出し、得られた形状距離値と任意に設定した許容値とを
比較し、形状距離値が許容値を越えたとき入力動画像は
標準動画像でないと判定し、形状距離値が許容値内のと
き入力動画像が標準動画像であると判定する。
の類似度検出値を用いた音声認識方法、機械の異常判定
方法、画像認識方法、また、2つのパターン行列層(3
次元)間の類似度検出値を用いた立体認識方法、動画像
認識方法のそれぞれについての説明を終わる。
(或いはパターン行列層)の指定成分ごとに異なる分散
の値をもつ正規分布を作成して、形状距離値を算出した
ものであったが、コンピュータの記憶容量の節約や処理
時間の短縮のため、パターン行列(或いはパターン行列
層)の指定成分のすべてにおいて同じ分散の値をもつ1
個の代表的な正規分布を作成して、形状距離値を算出し
ても良い。
1i2成分(或いはパターン行列層のj1j2j3成分とi1
i2i3成分)のあらゆる組み合わせに対して、図8に示
す正規分布の−2.1σ≦y≦+2.1σの範囲(図8
中の記号(i)と(ii)で示すyの範囲)においてf
(y)の値が増加するようにしておく。
正規分布を用いて形状距離値を算出したものであった
が、基準形状として矩形など任意の形状を用いて形状距
離値を算出しても良い。
形状変化量Dj1j2j3)は基準形状の初期化時の尖度
に影響されないことが数12(或いは数25)から分か
ることにより、理解されよう。
過フィルタ群を用いて音声、または、振動波のパワース
ペクトルを抽出したものであったが、高速フーリエ変換
等を用いてパワースペクトルを抽出しても良い。
振動波の特徴量としてパワースペクトルを用いて、形状
距離値を算出したものであったが、音声、または、振動
波の特徴量として複数個の線形予測係数等を用いて、形
状距離値を算出しても良い。
して密度を用いて、形状距離値を算出したものであった
が、立体の特徴量として3次元CT(コンピュータ断層
撮影)画像の濃度等を用いて、形状距離値を算出しても
良い。
画像、立体、動画像について標準パターン行列(或いは
標準パターン行列層)と入力パターン行列(或いは入力
パターン行列層)との間の形状距離値を算出したもので
あったが、一般には、平面、空間を問わず任意の図形や
模様について標準パターン行列(或いは標準パターン行
列層)と入力パターン行列(或いは入力パターン行列
層)との間の形状距離値を算出し、得られた形状距離値
を以って図形や模様の類似度検出を行うことができる。
また、この類似度検出値に基づいて図形や模様に関する
解析等、各種処理を行うことができる。
検出方法では、標準パターン行列と入力パターン行列と
の間の形状変化を、基準形状の値を成分とする基準パタ
ーンベクトルの形状変化に置き換え、この形状変化の大
きさを尖度の変化量として数値化し形状距離値として算
出するので、ユークリッド距離や角度など従来の類似性
尺度では区別できない音声でも、パターン行列の形状差
からこれらの区別を行うことができ、正確な音声の類似
度検出値を得ることができる。
音声の類似度検出値に基づいて音声認識を行うので、判
定の基準が信頼性の高いものとなり、音声認識の精度を
著しく向上できる利点がある。
は、標準パターン行列と入力パターン行列との間の形状
変化を、基準形状の値を成分とする基準パターンベクト
ルの形状変化に置き換え、この形状変化の大きさを尖度
の変化量として数値化し形状距離値として算出するの
で、ユークリッド距離や角度など従来の類似性尺度では
区別できない振動波でも、パターン行列の形状差からこ
れらの区別を行うことができ、正確な振動波の類似度検
出値を得ることができる。
正確な振動波の類似度検出値に基づいて異常の判定を行
うので、判定の基準が信頼性の高いものとなり、機械の
異常検知の精度を著しく向上できる利点がある。
は、標準パターン行列と入力パターン行列との間の形状
変化を、基準形状の値を成分とする基準パターンベクト
ルの形状変化に置き換え、この形状変化の大きさを尖度
の変化量として数値化し形状距離値として算出するの
で、ユークリッド距離や角度など従来の類似性尺度では
区別できない画像でも、パターン行列の形状差からこれ
らの区別を行うことができ、正確な画像の類似度検出値
を得ることができる。
画像の類似度検出値に基づいて画像認識を行うので、判
定の基準が信頼性の高いものとなり、画像認識の精度を
著しく向上できる利点がある。
は、標準パターン行列層と入力パターン行列層との間の
形状変化を、基準形状の値を成分とする基準パターンベ
クトルの形状変化に置き換え、この形状変化の大きさを
尖度の変化量として数値化し形状距離値として算出する
ので、ユークリッド距離や角度など従来の類似性尺度で
は区別できない立体でも、パターン行列層の形状差から
これらの区別を行うことができ、正確な立体の類似度検
出値を得ることができる。
立体の類似度検出値に基づいて立体認識を行うので、判
定の基準が信頼性の高いものとなり、立体認識の精度を
著しく向上できる利点がある。
は、標準パターン行列層と入力パターン行列層との間の
形状変化を、基準形状の値を成分とする基準パターンベ
クトルの形状変化に置き換え、この形状変化の大きさを
尖度の変化量として数値化し形状距離値として算出する
ので、ユークリッド距離や角度など従来の類似性尺度で
は区別できない動画像でも、パターン行列層の形状差か
らこれらの区別を行うことができ、正確な動画像の類似
度検出値を得ることができる。
な動画像の類似度検出値に基づいて動画像認識を行うの
で、判定の基準が信頼性の高いものとなり、動画像認識
の精度を著しく向上できる利点がある。
波の測定装置の構造を示すブロック図。
を示す図。
は、振動波の周波数成分波からパワースペクトルの時間
変化の特徴を抽出する方法を示す図。
スペクトルを示す図。
数−時間)平面で表現する方法を示す図。
正ベクトルおよび基準パターン負ベクトルの一例を示す
図。
図。
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、形状が同じ場合のパターン行列
を示す図。
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のj1j2成分が増加したも
の、及び、そのときの基準パターン正ベクトルの形状変
化を示す図。
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のj1j2成分が減少したも
の、及び、そのときの基準パターン負ベクトルの形状変
化を示す図。
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のm11成分が増加したも
の、及び、そのときの基準パターン正ベクトルの形状変
化を示す図。
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のm11成分が減少したも
の、及び、そのときの基準パターン負ベクトルの形状変
化を示す図。
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のi1i2成分が増加したも
の、及び、そのときの基準パターン正ベクトルの形状変
化を示す図。
場合について、標準パターン行列形状と入力パターン行
列形状の典型例として、図10の標準パターン行列形状
に対し入力パターン行列形状のi1i2成分が減少したも
の、及び、そのときの基準パターン負ベクトルの形状変
化を示す図。
i1i2成分が増加した入力パターン行列の形状例を示す
図。
の分散の値の変化例、及び、正規分布の平均値と点(i
1,i2)との間の長さの変化例を示す図。
ーン正ベクトル及び基準パターン負ベクトルの形状変化
例を示す図。
パターン負ベクトルの尖度の差)を算出するためのフロ
ーチャートを示すブロック図。
力パターン行列との間の形状距離値が変化する様子を示
す図。
力パターン行列との間の形状距離値が変化する様子を示
す図。
ブロック図。
図。
図。
−y)平面で表現する方法を示す図。
ーン行列の例を示す図。
画像と同じ入力画像及び標準画像とは異なる入力画像と
の間のユークリッド距離値の棒グラフを、中段に、標準
画像と、標準画像と同じ入力画像及び標準画像とは異な
る入力画像との間の角度の余弦値の棒グラフを、下段
に、標準画像と、標準画像と同じ入力画像及び標準画像
とは異なる入力画像との間の形状距離値の棒グラフを示
す図。
表現する方法を示す図。
表現する方法を示す図。
ン正ベクトルおよび基準パターン負ベクトルの一例を示
す図。
を時間を追って撮影した動画像の一例を示す図。
で表現する方法を示す図。
で表現する方法を示す図。
を示す図。
ーン行列の例を示す図。
の例を示す図。
ーン行列の例を示す図。
し、パターン行列間のユークリッド距離値が変化する様
子を示す図。
し、パターン行列間の角度の余弦値が変化する様子を示
す図。
し、パターン行列間のユークリッド距離値が変化する様
子を示す図。
し、パターン行列間の角度の余弦値が変化する様子を示
す図。
形状距離値 d18、d19 標準画像と、標準画像とは異なる入力
画像との間の形状距離値 d21、d22 標準音声と、標準音声と同じ入力音声
との間の形状距離値 d23 標準音声と、標準音声とは異なる入力音声との
間の形状距離値 d25 標準音声と、標準音声と同じ入力音声との間の
形状距離値 d26、d27 標準音声と、標準音声とは異なる入力
音声との間の形状距離値
Claims (15)
- 【請求項1】 (a)標準音声の特徴量を成分とする標
準パターン行列と、入力音声の特徴量を成分とする入力
パターン行列とを作成すること、(b)パターン行列の
指定成分ごとに異なる分散の値をもつ正規分布を作成
し、上記正規分布の値を成分とする基準パターン正ベク
トル及び基準パターン負ベクトルを作成すること、
(c)パターン行列の各成分について、パターン行列の
指定成分と各成分との間の長さを求め、基準パターン正
ベクトル及び基準パターン負ベクトルの中心から上記長
さだけ離れた位置に最も近い基準パターン正ベクトル及
び基準パターン負ベクトルの成分番号を算出し、入力パ
ターン行列の成分値が標準パターン行列の成分値より大
きいとき、その差の絶対値だけ基準パターン正ベクトル
の上記成分番号の成分値を増加させ、入力パターン行列
の成分値が標準パターン行列の成分値より小さいとき、
その差の絶対値だけ基準パターン負ベクトルの上記成分
番号の成分値を増加させること、(d)基準パターン正
ベクトルの尖度と基準パターン負ベクトルの尖度との差
の値を算出すること、(e)上記尖度の差の値を算出す
るに際し、パターン行列の指定成分を各成分の位置に移
動しながら尖度の差の値を求めること、(f)上記尖度
の差の値の2乗和、あるいは同2乗和の平方根を、標準
パターン行列と入力パターン行列との間の形状距離値と
することを特徴とする音声の類似度検出方法。 - 【請求項2】 前記パターン行列の指定成分ごとに異な
る分散の値をもつ正規分布に代えて、パターン行列の指
定成分ごとに異なる分散の値をもつ矩形など任意の基準
形状を作成し、上記基準形状の値を成分とする基準パタ
ーン正ベクトル及び基準パターン負ベクトルを作成する
ことを特徴とする請求項1に記載の音声の類似度検出方
法。 - 【請求項3】 請求項1または2に記載の音声の類似度
検出方法で標準音声の特徴量を成分とする標準パターン
行列と入力音声の特徴量を成分とする入力パターン行列
との間の形状距離を求め、求めた形状距離値と任意に設
定した許容値を比較し、形状距離値が許容値を越えたと
き入力音声は標準音声でないと判定し、形状距離値が許
容値内のとき入力音声が標準音声であると判定すること
を特徴とする音声認識方法。 - 【請求項4】 (a)標準振動波の特徴量を成分とする
標準パターン行列と、入力振動波の特徴量を成分とする
入力パターン行列とを作成すること、(b)パターン行
列の指定成分ごとに異なる分散の値をもつ正規分布を作
成し、上記正規分布の値を成分とする基準パターン正ベ
クトル及び基準パターン負ベクトルを作成すること、
(c)パターン行列の各成分について、パターン行列の
指定成分と各成分との間の長さを求め、基準パターン正
ベクトル及び基準パターン負ベクトルの中心から上記長
さだけ離れた位置に最も近い基準パターン正ベクトル及
び基準パターン負ベクトルの成分番号を算出し、入力パ
ターン行列の成分値が標準パターン行列の成分値より大
きいとき、その差の絶対値だけ基準パターン正ベクトル
の上記成分番号の成分値を増加させ、入力パターン行列
の成分値が標準パターン行列の成分値より小さいとき、
その差の絶対値だけ基準パターン負ベクトルの上記成分
番号の成分値を増加させること、(d)基準パターン正
ベクトルの尖度と基準パターン負ベクトルの尖度との差
の値を算出すること、(e)上記尖度の差の値を算出す
るに際し、パターン行列の指定成分を各成分の位置に移
動しながら尖度の差の値を求めること、(f)上記尖度
の差の値の2乗和、あるいは同2乗和の平方根を、標準
パターン行列と入力パターン行列との間の形状距離値と
することを特徴とする振動波の類似度検出方法。 - 【請求項5】 前記パターン行列の指定成分ごとに異な
る分散の値をもつ正規分布に代えて、パターン行列の指
定成分ごとに異なる分散の値をもつ矩形など任意の基準
形状を作成し、上記基準形状の値を成分とする基準パタ
ーン正ベクトル及び基準パターン負ベクトルを作成する
ことを特徴とする請求項4に記載の振動波の類似度検出
方法。 - 【請求項6】 請求項4または5に記載の振動波の類似
度検出方法で標準振動波の特徴量を成分とする標準パタ
ーン行列と入力振動波の特徴量を成分とする入力パター
ン行列との間の形状距離を求め、求めた形状距離値と任
意に設定した許容値を比較し、形状距離値が許容値を越
えたとき異常と判定し、形状距離値が許容値内のとき正
常と判定することを特徴とする機械の異常判定方法。 - 【請求項7】 (a)標準画像の特徴量を成分とする標
準パターン行列と、入力画像の特徴量を成分とする入力
パターン行列とを作成すること、(b)パターン行列の
指定成分ごとに異なる分散の値をもつ正規分布を作成
し、上記正規分布の値を成分とする基準パターン正ベク
トル及び基準パターン負ベクトルを作成すること、
(c)パターン行列の各成分について、パターン行列の
指定成分と各成分との間の長さを求め、基準パターン正
ベクトル及び基準パターン負ベクトルの中心から上記長
さだけ離れた位置に最も近い基準パターン正ベクトル及
び基準パターン負ベクトルの成分番号を算出し、入力パ
ターン行列の成分値が標準パターン行列の成分値より大
きいとき、その差の絶対値だけ基準パターン正ベクトル
の上記成分番号の成分値を増加させ、入力パターン行列
の成分値が標準パターン行列の成分値より小さいとき、
その差の絶対値だけ基準パターン負ベクトルの上記成分
番号の成分値を増加させること、(d)基準パターン正
ベクトルの尖度と基準パターン負ベクトルの尖度との差
の値を算出すること、(e)上記尖度の差の値を算出す
るに際し、パターン行列の指定成分を各成分の位置に移
動しながら尖度の差の値を求めること、(f)上記尖度
の差の値の2乗和、あるいは同2乗和の平方根を、標準
パターン行列と入力パターン行列との間の形状距離値と
することを特徴とする画像の類似度検出方法。 - 【請求項8】 前記パターン行列の指定成分ごとに異な
る分散の値をもつ正規分布に代えて、パターン行列の指
定成分ごとに異なる分散の値をもつ矩形など任意の基準
形状を作成し、上記基準形状の値を成分とする基準パタ
ーン正ベクトル及び基準パターン負ベクトルを作成する
ことを特徴とする請求項7に記載の画像の類似度検出方
法。 - 【請求項9】 請求項7または8に記載の画像の類似度
検出方法で標準画像の特徴量を成分とする標準パターン
行列と入力画像の特徴量を成分とする入力パターン行列
との間の形状距離を求め、求めた形状距離値と任意に設
定した許容値を比較し、形状距離値が許容値を越えたと
き入力画像は標準画像でないと判定し、形状距離値が許
容値内のとき入力画像が標準画像であると判定すること
を特徴とする画像認識方法。 - 【請求項10】 (a)標準立体の特徴量を成分とする
標準パターン行列層と、入力立体の特徴量を成分とする
入力パターン行列層とを作成すること、(b)パターン
行列層の指定成分ごとに異なる分散の値をもつ正規分布
を作成し、上記正規分布の値を成分とする基準パターン
正ベクトル及び基準パターン負ベクトルを作成するこ
と、(c)パターン行列層の各成分について、パターン
行列層の指定成分と各成分との間の長さを求め、基準パ
ターン正ベクトル及び基準パターン負ベクトルの中心か
ら上記長さだけ離れた位置に最も近い基準パターン正ベ
クトル及び基準パターン負ベクトルの成分番号を算出
し、入力パターン行列層の成分値が標準パターン行列層
の成分値より大きいとき、その差の絶対値だけ基準パタ
ーン正ベクトルの上記成分番号の成分値を増加させ、入
力パターン行列層の成分値が標準パターン行列層の成分
値より小さいとき、その差の絶対値だけ基準パターン負
ベクトルの上記成分番号の成分値を増加させること、
(d)基準パターン正ベクトルの尖度と基準パターン負
ベクトルの尖度との差の値を算出すること、(e)上記
尖度の差の値を算出するに際し、パターン行列層の指定
成分を各成分の位置に移動しながら尖度の差の値を求め
ること、(f)上記尖度の差の値の2乗和、あるいは同
2乗和の平方根を、標準パターン行列層と入力パターン
行列層との間の形状距離値とすることを特徴とする立体
の類似度検出方法。 - 【請求項11】 前記パターン行列層の指定成分ごとに
異なる分散の値をもつ正規分布に代えて、パターン行列
層の指定成分ごとに異なる分散の値をもつ矩形など任意
の基準形状を作成し、上記基準形状の値を成分とする基
準パターン正ベクトル及び基準パターン負ベクトルを作
成することを特徴とする請求項10に記載の立体の類似
度検出方法。 - 【請求項12】 請求項10または11に記載の立体の
類似度検出方法で標準立体の特徴量を成分とする標準パ
ターン行列層と入力立体の特徴量を成分とする入力パタ
ーン行列層との間の形状距離を求め、求めた形状距離値
と任意に設定した許容値を比較し、形状距離値が許容値
を越えたとき入力立体は標準立体でないと判定し、形状
距離値が許容値内のとき入力立体が標準立体であると判
定することを特徴とする立体認識方法。 - 【請求項13】 (a)標準動画像の特徴量を成分とす
る標準パターン行列層と、入力動画像の特徴量を成分と
する入力パターン行列層とを作成すること、 (b)パターン行列層の指定成分ごとに異なる分散の値
をもつ正規分布を作成し、上記正規分布の値を成分とす
る基準パターン正ベクトル及び基準パターン負ベクトル
を作成すること、 (c)パターン行列層の各成分について、パターン行列
層の指定成分と各成分との間の長さを求め、基準パター
ン正ベクトル及び基準パターン負ベクトルの中心から上
記長さだけ離れた位置に最も近い基準パターン正ベクト
ル及び基準パターン負ベクトルの成分番号を算出し、入
力パターン行列層の成分値が標準パターン行列層の成分
値より大きいとき、その差の絶対値だけ基準パターン正
ベクトルの上記成分番号の成分値を増加させ、入力パタ
ーン行列層の成分値が標準パターン行列層の成分値より
小さいとき、その差の絶対値だけ基準パターン負ベクト
ルの上記成分番号の成分値を増加させること、 (d)基準パターン正ベクトルの尖度と基準パターン負
ベクトルの尖度との差の値を算出すること、 (e)上記尖度の差の値を算出するに際し、パターン行
列層の指定成分を各成分の位置に移動しながら尖度の差
の値を求めること、 (f)上記尖度の差の値の2乗和、あるいは同2乗和の
平方根を、標準パターン行列層と入力パターン行列層と
の間の形状距離値とすることを特徴とする動画像の類似
度検出方法。 - 【請求項14】 前記パターン行列層の指定成分ごとに
異なる分散の値をもつ正規分布に代えて、パターン行列
層の指定成分ごとに異なる分散の値をもつ矩形など任意
の基準形状を作成し、上記基準形状の値を成分とする基
準パターン正ベクトル及び基準パターン負ベクトルを作
成することを特徴とする請求項13に記載の動画像の類
似度検出方法。 - 【請求項15】 請求項13または14に記載の動画像
の類似度検出方法で標準動画像の特徴量を成分とする標
準パターン行列層と入力動画像の特徴量を成分とする入
力パターン行列層との間の形状距離を求め、求めた形状
距離値と任意に設定した許容値を比較し、形状距離値が
許容値を越えたとき入力動画像は標準動画像でないと判
定し、形状距離値が許容値内のとき入力動画像が標準動
画像であると判定することを特徴とする動画像認識方
法。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000277749A JP3342864B2 (ja) | 2000-09-13 | 2000-09-13 | 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法 |
EP01121566A EP1189207B1 (en) | 2000-09-13 | 2001-09-10 | Voices similarity measurement |
DE60141875T DE60141875D1 (de) | 2000-09-13 | 2001-09-10 | Messung des Ähnlichkeitsgrads der Stimme |
AU70003/01A AU766266B2 (en) | 2000-09-13 | 2001-09-11 | Method for detecting similarity between standard information and input information and method for judging the input information by use of detected result of the similarity |
US09/951,211 US7006970B2 (en) | 2000-09-13 | 2001-09-11 | Method for detecting similarity between standard information and input information and method for judging the input information by use of detected result of the similarity |
CA002357255A CA2357255C (en) | 2000-09-13 | 2001-09-12 | Method for detecting similarity between standard information and input information and method for judging the input information by use of detected result of the similarity |
HK02106431.2A HK1045016B (zh) | 2000-09-13 | 2002-08-30 | 聲音相似性量度 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000277749A JP3342864B2 (ja) | 2000-09-13 | 2000-09-13 | 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002091481A JP2002091481A (ja) | 2002-03-27 |
JP3342864B2 true JP3342864B2 (ja) | 2002-11-11 |
Family
ID=18763020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000277749A Expired - Fee Related JP3342864B2 (ja) | 2000-09-13 | 2000-09-13 | 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7006970B2 (ja) |
EP (1) | EP1189207B1 (ja) |
JP (1) | JP3342864B2 (ja) |
AU (1) | AU766266B2 (ja) |
CA (1) | CA2357255C (ja) |
DE (1) | DE60141875D1 (ja) |
HK (1) | HK1045016B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9552831B2 (en) | 2015-02-02 | 2017-01-24 | West Nippon Expressway Engineering Shikoku Company Limited | Method for detecting abnormal sound and method for judging abnormality in structure by use of detected value thereof, and method for detecting similarity between oscillation waves and method for recognizing voice by use of detected value thereof |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3422787B1 (ja) | 2002-03-13 | 2003-06-30 | 株式会社エントロピーソフトウェア研究所 | 画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法 |
JP4098539B2 (ja) * | 2002-03-15 | 2008-06-11 | 富士通株式会社 | プロファイル情報の推薦方法、プログラム及び装置 |
US7366666B2 (en) * | 2003-10-01 | 2008-04-29 | International Business Machines Corporation | Relative delta computations for determining the meaning of language inputs |
US7742914B2 (en) * | 2005-03-07 | 2010-06-22 | Daniel A. Kosek | Audio spectral noise reduction method and apparatus |
US7707032B2 (en) * | 2005-10-20 | 2010-04-27 | National Cheng Kung University | Method and system for matching speech data |
WO2008007616A1 (fr) * | 2006-07-13 | 2008-01-17 | Nec Corporation | Dispositif, procédé et programme d'alarme relatif à une entrée de murmure non audible |
WO2008115435A1 (en) * | 2007-03-19 | 2008-09-25 | Dolby Laboratories Licensing Corporation | Noise variance estimator for speech enhancement |
JP2010017216A (ja) * | 2008-07-08 | 2010-01-28 | Ge Medical Systems Global Technology Co Llc | 音声データ処理装置,音声データ処理方法、および、イメージング装置 |
US8826455B2 (en) * | 2009-02-17 | 2014-09-02 | International Business Machines Corporation | Method and apparatus for automated assignment of access permissions to users |
CN101593517B (zh) * | 2009-06-29 | 2011-08-17 | 北京市博汇科技有限公司 | 一种音频比对系统及其音频能量比对方法 |
US8801537B1 (en) * | 2011-03-10 | 2014-08-12 | Callaway Golf Company | Adjustable golf club shaft and hosel assembly |
CN104992713B (zh) * | 2015-05-14 | 2018-11-13 | 电子科技大学 | 一种快速广播音频比对方法 |
CN110910899B (zh) * | 2019-11-27 | 2022-04-08 | 杭州联汇科技股份有限公司 | 一种实时音频信号一致性对比检测方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4155072A (en) * | 1976-12-17 | 1979-05-15 | Ricoh Company, Ltd. | Character recognition apparatus |
JPS6273391A (ja) * | 1985-09-27 | 1987-04-04 | Toshiba Corp | パタ−ン認識学習装置 |
JPH02195400A (ja) * | 1989-01-24 | 1990-08-01 | Canon Inc | 音声認識装置 |
JPH03120598A (ja) * | 1989-10-03 | 1991-05-22 | Canon Inc | 音声認識方法及び装置 |
JPH04194999A (ja) * | 1990-11-27 | 1992-07-14 | Sharp Corp | 学習を用いた動的計画法 |
US5594807A (en) * | 1994-12-22 | 1997-01-14 | Siemens Medical Systems, Inc. | System and method for adaptive filtering of images based on similarity between histograms |
JP3426905B2 (ja) * | 1997-03-14 | 2003-07-14 | 東京瓦斯株式会社 | 異常音の検出方法及びその検出値を用いた機械の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法 |
JP3422787B1 (ja) * | 2002-03-13 | 2003-06-30 | 株式会社エントロピーソフトウェア研究所 | 画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法 |
-
2000
- 2000-09-13 JP JP2000277749A patent/JP3342864B2/ja not_active Expired - Fee Related
-
2001
- 2001-09-10 DE DE60141875T patent/DE60141875D1/de not_active Expired - Lifetime
- 2001-09-10 EP EP01121566A patent/EP1189207B1/en not_active Expired - Lifetime
- 2001-09-11 AU AU70003/01A patent/AU766266B2/en not_active Ceased
- 2001-09-11 US US09/951,211 patent/US7006970B2/en not_active Expired - Fee Related
- 2001-09-12 CA CA002357255A patent/CA2357255C/en not_active Expired - Fee Related
-
2002
- 2002-08-30 HK HK02106431.2A patent/HK1045016B/zh not_active IP Right Cessation
Non-Patent Citations (1)
Title |
---|
草薙、平田、神内、山口、濱田、榊原,形状距離パターンマッチング法を用いた異常音検出,日本音響学会2000年春季研究発表会講演論文集,日本,社団法人日本音響学会,2000年3月15日,I、3−6−4,p.509−510 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9552831B2 (en) | 2015-02-02 | 2017-01-24 | West Nippon Expressway Engineering Shikoku Company Limited | Method for detecting abnormal sound and method for judging abnormality in structure by use of detected value thereof, and method for detecting similarity between oscillation waves and method for recognizing voice by use of detected value thereof |
Also Published As
Publication number | Publication date |
---|---|
US7006970B2 (en) | 2006-02-28 |
DE60141875D1 (de) | 2010-06-02 |
AU766266B2 (en) | 2003-10-09 |
EP1189207A3 (en) | 2003-08-13 |
CA2357255A1 (en) | 2002-03-13 |
EP1189207B1 (en) | 2010-04-21 |
US20020055839A1 (en) | 2002-05-09 |
HK1045016A1 (en) | 2002-11-08 |
EP1189207A2 (en) | 2002-03-20 |
HK1045016B (zh) | 2010-11-12 |
JP2002091481A (ja) | 2002-03-27 |
CA2357255C (en) | 2010-03-09 |
AU7000301A (en) | 2002-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3342864B2 (ja) | 音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法 | |
JP6061693B2 (ja) | 異常診断装置およびこれを用いた異常診断方法 | |
CN104865550A (zh) | 声源方向估计设备和声源方向估计方法 | |
JP4960416B2 (ja) | 話者クラスタリング装置および話者クラスタリング方法 | |
Csapó et al. | Error analysis of extracted tongue contours from 2D ultrasound images | |
CN1441906A (zh) | 波形检测装置和使用该装置的状态监视系统 | |
Upadhya et al. | Discriminating Parkinson and healthy people using phonation and cepstral features of speech | |
US10043276B2 (en) | Image processing method, image processing apparatus, robot apparatus, program, and recording medium | |
US11721357B2 (en) | Voice processing method and voice processing apparatus | |
JP3426905B2 (ja) | 異常音の検出方法及びその検出値を用いた機械の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法 | |
JP3422787B1 (ja) | 画像の類似度検出方法及びその検出値を用いた画像認識方法、並びに、音声の類似度検出方法及びその検出値を用いた音声認識方法、並びに、振動波の類似度検出方法及びその検出値を用いた機械の異常判定方法、並びに、動画像の類似度検出方法及びその検出値を用いた動画像認識方法、並びに、立体の類似度検出方法及びその検出値を用いた立体認識方法 | |
KR102205806B1 (ko) | 호흡상태 분류기의 생성 방법 및 생성한 호흡상태 분류기를 이용한 호흡상태 판단 방법 | |
JP2008185845A (ja) | 1次元信号の変換値からのhlac特徴抽出方法および装置 | |
Yu et al. | Multidimensional acoustic analysis for voice quality assessment based on the GRBAS scale | |
JP4839970B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JP2019035902A (ja) | 距離測定装置、データ変換装置、距離測定方法、及びプログラム | |
Castro-Cabrera et al. | A comparison between time-frequency and cepstral feature representations for the classification of seismic-volcanic signals | |
Heeringa et al. | The implementation of methods in Visible Vowels | |
JP2004357050A (ja) | 波形品質評価システム及び波形品質評価方法 | |
Elen et al. | A comparison of classification methods for diagnosis of Parkinson's | |
Gillich et al. | Problem of detecting damage through natural frequency changes | |
WO2020014354A1 (en) | System and method for indexing sound fragments containing speech | |
JP2019149028A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
JP2013120467A (ja) | 信号特徴抽出装置および信号特徴抽出方法 | |
Thayoob et al. | Preprocessing of acoustic emission signals from partial discharge in oil-pressboard insulation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020730 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080823 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090823 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |