JPS59219800A - 音声パターン比較方法 - Google Patents
音声パターン比較方法Info
- Publication number
- JPS59219800A JPS59219800A JP9475083A JP9475083A JPS59219800A JP S59219800 A JPS59219800 A JP S59219800A JP 9475083 A JP9475083 A JP 9475083A JP 9475083 A JP9475083 A JP 9475083A JP S59219800 A JPS59219800 A JP S59219800A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- patterns
- frequency
- time
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
良1欠■
本発明は、音声認識装置に関する。
良末韮遣
近年、マン・マシン対話の実現のために音声認識装置が
実用化されつつあるが、音声の認識において重要な部分
は、辞書登録された特徴パターンと入力音声の特徴パタ
ーンの照合部である。通常、この音声特徴パターンの照
合には次の二つの問題点があり、その−は、発声毎に音
声長が変動することであり、その二は発声者によってホ
ルマントが異り周波数変動があることである。前記その
−の変動吸収のためには動的計画法(D P)によるパ
ターンマツチング法が知られている。このDPマツチン
グ法は時間方向の変動吸収のために比較すべき二つのパ
ターン間の類似度が最大になるようにパターンの時間長
を伸縮するものである゛が、この方法は二つのパターン
間のあらゆる対応づけとして類似度を求めるものである
ため、演算量が多く、また周波数変動を吸収するために
は膨゛大なりP演算が必要となる。なお、前記その二の
周波数変動を吸収する方法は未だに確立されていない。
実用化されつつあるが、音声の認識において重要な部分
は、辞書登録された特徴パターンと入力音声の特徴パタ
ーンの照合部である。通常、この音声特徴パターンの照
合には次の二つの問題点があり、その−は、発声毎に音
声長が変動することであり、その二は発声者によってホ
ルマントが異り周波数変動があることである。前記その
−の変動吸収のためには動的計画法(D P)によるパ
ターンマツチング法が知られている。このDPマツチン
グ法は時間方向の変動吸収のために比較すべき二つのパ
ターン間の類似度が最大になるようにパターンの時間長
を伸縮するものである゛が、この方法は二つのパターン
間のあらゆる対応づけとして類似度を求めるものである
ため、演算量が多く、また周波数変動を吸収するために
は膨゛大なりP演算が必要となる。なお、前記その二の
周波数変動を吸収する方法は未だに確立されていない。
旦−一一一的
本発明は、上述のごとき実情に鑑みてなされたもので、
少ない演算量によって時間変動と周波数変動の両方を吸
収して精度よくパターンを照合し得るようにした音声パ
ターン照合装置を提供しよう−とするものである。
少ない演算量によって時間変動と周波数変動の両方を吸
収して精度よくパターンを照合し得るようにした音声パ
ターン照合装置を提供しよう−とするものである。
4−−1
本発明の構成について、以下、実施例に基づいて説明す
る。
る。
最初に、第1図及び第2図を参照しながら通常のDrマ
ツチ、フグ法について説明する。
ツチ、フグ法について説明する。
まず、第1図において、(a)図のパターンと(b)図
のパターンを比較することを考えるが、同図には、音声
パターンを時間軸方向に一定間隔でサンプリングしたパ
ターン1.2・・・ が示されており、これら各パター
ン1,2・・・ をフレームと呼んでいる。このDr法
は、まず(a)図の第1フレームと(b)図の第1フレ
ームを対応づけて二つの波形の差を求め、第2図の斜線
部を求める。以下同様にして(a)図の第1フレームと
(b)図の第2フレーム、(a) 図のitフレームと
(b)図の第3フレーム・・・・・・ (a)図の第2
フレームと(b) 図の第1フレーム、(a)図の第2
フレームと(b)図の第2フレーム・・・・・・ と対
応づけ、その波形差が一番少なくなるようにフレーム間
、つまり時間軸の対応をつけるものである。そのため、
(a) 、 (b)が同一人物の発声した音声であるよ
うな周波数変動が少ないパターンに関しては有効である
が、例えば第2図の破線と実線の波形のように波形が似
ているにもかかわらず、周波数にずれがある場合にはこ
れを同一波形とみなすことができない。このような現象
は(a)と(b)の音声の発声者が異なった場合に起こ
るが、これには個人のホルマント差が影響している。
のパターンを比較することを考えるが、同図には、音声
パターンを時間軸方向に一定間隔でサンプリングしたパ
ターン1.2・・・ が示されており、これら各パター
ン1,2・・・ をフレームと呼んでいる。このDr法
は、まず(a)図の第1フレームと(b)図の第1フレ
ームを対応づけて二つの波形の差を求め、第2図の斜線
部を求める。以下同様にして(a)図の第1フレームと
(b)図の第2フレーム、(a) 図のitフレームと
(b)図の第3フレーム・・・・・・ (a)図の第2
フレームと(b) 図の第1フレーム、(a)図の第2
フレームと(b)図の第2フレーム・・・・・・ と対
応づけ、その波形差が一番少なくなるようにフレーム間
、つまり時間軸の対応をつけるものである。そのため、
(a) 、 (b)が同一人物の発声した音声であるよ
うな周波数変動が少ないパターンに関しては有効である
が、例えば第2図の破線と実線の波形のように波形が似
ているにもかかわらず、周波数にずれがある場合にはこ
れを同一波形とみなすことができない。このような現象
は(a)と(b)の音声の発声者が異なった場合に起こ
るが、これには個人のホルマント差が影響している。
本発明は、上記DPマツチング法の欠点を解決するため
になされたもので、その動作原理について第3図を参照
しながら説明する。まず、前述のごとくしてサンプリン
グされたパターンを、周波数軸方向及び時間軸方向にサ
ンプリングし、周波数の低い方から順にi=1,2.・
・・・・・工1時間軸方向をj=1,2,3.・・・・
・・Jとし、二つのパターンをA (i、j) 、 B
(i、j)で表わす。次、に辞書登itべきパターン
はフィルタ一群でi=1.2゜・・・・・・Iまで分け
、閾値を設けて2値化して登録する(A (i、j)
、J A = ’ I・・・Ja)。一方、認識音声は
同様に2値化されたあと、細線化されてB(Lj) 、
j B = 1 、2 、・・・JBとなる。ここ
でjaとjBの対応づけが問題になるが、この対応づけ
を第3図に示す?第3図において、i −j 、、a面
上でA(i、jA)を表わすと(a)図のようになりB
(i、jB)をi jB面で表わすと(b)図のよう
になる。ただし、2値化して0.1にしたうち1の部分
を斜線で表わしている。この時、jAとjsのサンプル
点の作るメツシュ(ja、jB)各点におけるAC’
l J A )とB(i、ja)の類似度r(ja、j
e)を次式で定義し、■ ・・・・・・(1) J A” ’ + J B= 1からja + jeま
での類似度の累計をR(ja、jB−)で表わした時、
・・・・・・ (2) となるような(JA IJB )を決定して行く(ただ
し1Ilaxは(内の最大値を採用することを示してい
る)。なお、上記(1)式は積をとっているが、これは
理論演算でも良いし、B(i、je)のiを変化させて
「l」を抽出し、その部分だけ演算をしても良い。また
(2)式の結゛果をフレームfiI+Jで正規化するこ
とも考えられる。また各パターンの始端と終端は各々対
応づけるものとする。
になされたもので、その動作原理について第3図を参照
しながら説明する。まず、前述のごとくしてサンプリン
グされたパターンを、周波数軸方向及び時間軸方向にサ
ンプリングし、周波数の低い方から順にi=1,2.・
・・・・・工1時間軸方向をj=1,2,3.・・・・
・・Jとし、二つのパターンをA (i、j) 、 B
(i、j)で表わす。次、に辞書登itべきパターン
はフィルタ一群でi=1.2゜・・・・・・Iまで分け
、閾値を設けて2値化して登録する(A (i、j)
、J A = ’ I・・・Ja)。一方、認識音声は
同様に2値化されたあと、細線化されてB(Lj) 、
j B = 1 、2 、・・・JBとなる。ここ
でjaとjBの対応づけが問題になるが、この対応づけ
を第3図に示す?第3図において、i −j 、、a面
上でA(i、jA)を表わすと(a)図のようになりB
(i、jB)をi jB面で表わすと(b)図のよう
になる。ただし、2値化して0.1にしたうち1の部分
を斜線で表わしている。この時、jAとjsのサンプル
点の作るメツシュ(ja、jB)各点におけるAC’
l J A )とB(i、ja)の類似度r(ja、j
e)を次式で定義し、■ ・・・・・・(1) J A” ’ + J B= 1からja + jeま
での類似度の累計をR(ja、jB−)で表わした時、
・・・・・・ (2) となるような(JA IJB )を決定して行く(ただ
し1Ilaxは(内の最大値を採用することを示してい
る)。なお、上記(1)式は積をとっているが、これは
理論演算でも良いし、B(i、je)のiを変化させて
「l」を抽出し、その部分だけ演算をしても良い。また
(2)式の結゛果をフレームfiI+Jで正規化するこ
とも考えられる。また各パターンの始端と終端は各々対
応づけるものとする。
第4図は、上記動作原理に従って構成された本発明の一
実施例を示すブロック線図で、図中、lはマイク、2は
フィルタ一群、3は音−区間検出部、4は2値化部、5
はスイッチ、6は辞書部、7は細線化部、8は類似度計
算部、°9はja、’jB変化部、lOは類似度検出部
、llはR計算部、12はJa又はjeを1ステップ歩
進する歩進部、13はRの最大算出部、14は認識結果
出力部で、本発明によると、(a)のパターンが周波数
軸方向に幅をもち、(b)のパターンの幅がせまいため
、発声者によって周波数が変動し、そのため(b)のパ
ターンが周波数軸方向に変動しても(a)のパターン幅
からはみ出さない限りその変動を吸収することができる
。
実施例を示すブロック線図で、図中、lはマイク、2は
フィルタ一群、3は音−区間検出部、4は2値化部、5
はスイッチ、6は辞書部、7は細線化部、8は類似度計
算部、°9はja、’jB変化部、lOは類似度検出部
、llはR計算部、12はJa又はjeを1ステップ歩
進する歩進部、13はRの最大算出部、14は認識結果
出力部で、本発明によると、(a)のパターンが周波数
軸方向に幅をもち、(b)のパターンの幅がせまいため
、発声者によって周波数が変動し、そのため(b)のパ
ターンが周波数軸方向に変動しても(a)のパターン幅
からはみ出さない限りその変動を吸収することができる
。
第5図は、本発明の他の実施例を示す図で、この実施例
は、辞書部6の前にピーク検出部15を設け、該ピーク
検出部15によって音声の特〆麦パターンの周波数上の
ピークを検出し、そのパターンを辞書部に登録しておき
、他方、照合すべきパターンが入力された時に、これを
ある閾値で0゜1に2値化しくこの時1になる部分を特
徴量分布部と称する)、これと辞書パターンの類似度を
前記式(2)に従って動的計画法によって最矢になるよ
うに時間伸縮を行なって照合するようにしたものである
。
は、辞書部6の前にピーク検出部15を設け、該ピーク
検出部15によって音声の特〆麦パターンの周波数上の
ピークを検出し、そのパターンを辞書部に登録しておき
、他方、照合すべきパターンが入力された時に、これを
ある閾値で0゜1に2値化しくこの時1になる部分を特
徴量分布部と称する)、これと辞書パターンの類似度を
前記式(2)に従って動的計画法によって最矢になるよ
うに時間伸縮を行なって照合するようにしたものである
。
処−一一釆
以上の説明から明らかなように、本発明によると、少な
い演算量で時間変動と周波数変動の両方を吸収すること
ができる精度の高いパターン照合装置を提供することが
できる。
い演算量で時間変動と周波数変動の両方を吸収すること
ができる精度の高いパターン照合装置を提供することが
できる。
第1図及び第2図は、DPマツチング法を説明するため
の図、第3図は、本発明の詳細な説明するための図、第
4図及び第5図は、それぞれ本発明の詳細な説明するた
めのブロック線図である。 l・・・マイク、2・・・フィルタ一群、3・・・音声
区間検出部、4・・・2値化部、5・・・スイッチ、6
・・・辞書部、7・・・細線化部、8・・・類似度計算
部、9・・・jA+Je変化部、10・・・最大類似度
算出部、11・・・R算出部、12・・・ja(js)
歩進部、13・・・R最大算出部、14・・・結果出力
部、15・・・ピーク検出部。 −72:
の図、第3図は、本発明の詳細な説明するための図、第
4図及び第5図は、それぞれ本発明の詳細な説明するた
めのブロック線図である。 l・・・マイク、2・・・フィルタ一群、3・・・音声
区間検出部、4・・・2値化部、5・・・スイッチ、6
・・・辞書部、7・・・細線化部、8・・・類似度計算
部、9・・・jA+Je変化部、10・・・最大類似度
算出部、11・・・R算出部、12・・・ja(js)
歩進部、13・・・R最大算出部、14・・・結果出力
部、15・・・ピーク検出部。 −72:
Claims (2)
- (1)周波数上の特徴量の時間変化として表現されるパ
ターンを比較するパターン比較装置において、比較すべ
き二つのパターンのうち少くとも一方のパターンを2値
化し、周波数軸方向の特徴量分布幅を細化する操作をし
た後に、該パターンの細化された部分が他方のパターン
の特徴量分布上に対応づくように動的計画法によって時
間長を整合させて照合する°ようにしたことを特徴とす
る音声パターン照合装置。 - (2)周波数の特徴量の時間変化として表現されるパタ
ーンを比較照合するパターン比較装置において、比較す
べき二つのパターンのうち少くとも一方のパターンの周
波軸上のピークを時間方向へ連らねたパターンに変換し
、該パターンのピーク連結部が他方のパターンの特徴量
分布↓に対応づくように動的計画法によって時間長を整
合させて照合するようにしたことを特徴とする音声パタ
ーン照合装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9475083A JPS59219800A (ja) | 1983-05-27 | 1983-05-27 | 音声パターン比較方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9475083A JPS59219800A (ja) | 1983-05-27 | 1983-05-27 | 音声パターン比較方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59219800A true JPS59219800A (ja) | 1984-12-11 |
JPH0527120B2 JPH0527120B2 (ja) | 1993-04-20 |
Family
ID=14118797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9475083A Granted JPS59219800A (ja) | 1983-05-27 | 1983-05-27 | 音声パターン比較方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59219800A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04264598A (ja) * | 1990-11-05 | 1992-09-21 | Internatl Business Mach Corp <Ibm> | 人間の音声を認識するための方法及び装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5023941A (ja) * | 1973-07-02 | 1975-03-14 |
-
1983
- 1983-05-27 JP JP9475083A patent/JPS59219800A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5023941A (ja) * | 1973-07-02 | 1975-03-14 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04264598A (ja) * | 1990-11-05 | 1992-09-21 | Internatl Business Mach Corp <Ibm> | 人間の音声を認識するための方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH0527120B2 (ja) | 1993-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS5972496A (ja) | 単音識別装置 | |
JPS5844500A (ja) | 音声認識方式 | |
Elenius et al. | Effects of emphasizing transitional or stationary parts of the speech signal in a discrete utterance recognition system | |
JPS59219800A (ja) | 音声パターン比較方法 | |
JP2666296B2 (ja) | 音声認識装置 | |
JPS635395A (ja) | 音声認識装置 | |
JPS63173100A (ja) | キ−ワ−ド抽出装置 | |
JPS62293299A (ja) | 音声認識方法 | |
JPS6344699A (ja) | 音声認識装置 | |
JPS61233791A (ja) | 音声認識装置における音声区間検出方式 | |
JP2655637B2 (ja) | 音声パターン照合方式 | |
JPS61200596A (ja) | 連続音声認識装置 | |
JP2602271B2 (ja) | 連続音声中の子音識別方式 | |
JPS61252595A (ja) | 音声認識処理方式 | |
JPS6069694A (ja) | 語頭子音のセグメンテ−ション法 | |
JPH0229700A (ja) | 音声パターン照合方式 | |
JPS6069699A (ja) | 音声パタ−ン作成装置 | |
JPS63223698A (ja) | 単音節音声認識装置 | |
JPH0792675B2 (ja) | 音声認識装置 | |
JPS6336679B2 (ja) | ||
JPS63318600A (ja) | 音声認識方式 | |
JPH0254560B2 (ja) | ||
JPS61203498A (ja) | 音声認識装置の予備選択方式 | |
JPH02235099A (ja) | 音声認識装置 | |
JPS61259299A (ja) | 音声パタ−ン照合方式 |