JPS6126680B2 - - Google Patents

Info

Publication number
JPS6126680B2
JPS6126680B2 JP6271480A JP6271480A JPS6126680B2 JP S6126680 B2 JPS6126680 B2 JP S6126680B2 JP 6271480 A JP6271480 A JP 6271480A JP 6271480 A JP6271480 A JP 6271480A JP S6126680 B2 JPS6126680 B2 JP S6126680B2
Authority
JP
Japan
Prior art keywords
feature parameters
voice
unknown
speech
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP6271480A
Other languages
English (en)
Other versions
JPS56159696A (en
Inventor
Isamu Nose
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6271480A priority Critical patent/JPS56159696A/ja
Publication of JPS56159696A publication Critical patent/JPS56159696A/ja
Publication of JPS6126680B2 publication Critical patent/JPS6126680B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は音声認識装置に関し、特に未知音声の
特徴パラメータと標準音声の特徴パラメータ間に
おける距離測定に関する。
従来の音声認識装置においては未知音声を8〜
24チヤネル程度の帯域フイルタ群により周波数分
析を行い、分析結果は10〜20ms毎に標本化され
る。未知音声を時間軸(i)上で標本化したものを未
知音声の特徴パラメータとして用いる方法、ある
いは情報量圧縮の為に、いくつかの標本点の集ま
り毎に平均特徴パラメータを求めてそれを新たな
時間軸標本点とする方法等がある。識別はこれら
の未知音声の特徴パラメータを用い、未知音声の
特徴パラメータとあらかじめ登録音声として用意
してある各音声の特徴パラメータとを比較して、
両者間の距離を計算して距離の一番小さい標準音
声を識別結果としている。
距離測定について今少し詳述すると、未知音声
の一つの時間軸標本点iの一群の特徴パラメータ
Pi、及び認識対象としての標準音声の一つの時間
軸標本点jの一群の特徴パラメータQjを対象と
して、対応する周波数軸標本点の特徴パラメータ
間の距離を測定し、それらの測定量を加算する単
位段階を有する。単位段階での距離をD(Pi、
Qj)とし、距離測定の評価関数を絶対値関数と
すれば、次のようになる。
D(Pi、Qj)=|Pi−Qj|=|P(i、1) −Q(j、1)|+|P(i、2) −Q(j、2)|+………+|P(i、k)−
Q(j、k)|。
但し、Pi=〔P(i、1)、P(i、2)、……
…、P(i、k)〕。
Qj=〔Q(j、1)、Q(j、2)、………、Q
(j、k)〕。
P( )は未知音声の個々の特徴パラメータ、
Q( )は標準音声の個々の特徴パラメータ、
( )内のi、jは時間軸標本点、1〜kはフイ
ルタ対応の周波数標本点である。
未知音声と標準音声との距離は、両音声の時間
軸標本点を一定の法則に従つてつき合せて複数の
単位段階で距離を測定し、これらの組合せで決定
する。
時間軸標本点のつき合せ方は、時間軸方向の線
形マツチングあるいは非線形マツチングの2通り
があるが、いずれにしても前記距離尺度を用いて
計算している。
同一人が同一語を発声しても周波数スペクトル
を時間軸、周波数軸について調べるとかなり異な
つているので、距離D(Pi、Qj)が同じ言葉を
発声した場合と違う言葉を発声した場合で余り差
が明確にでない場合があり、これらは認識不能、
誤認識の原因の一つとして問題であつた。
本発明の目的はこれらの欠点を除去するため、
周波数スペクトルの変化に着目して未知音声と標
準音声の距離に重み付けしたもので、すなわち、
本発明は同一語の発声でスペクトルの傾斜が変化
することは、希であることに着目し、スペクトル
の傾斜パターンを比較してその比較結果に従つて
個々の特徴パラメータ間の測定量、若しくは各時
間軸標本点の一群の測定量に重みづけを行なわせ
るようにしたもので、云わば、距離測定にホルマ
ント位置情報を加味したものである。
第1図は本発明の1実施例を示したものであ
り、1は未知音声特徴パラメータメモリ、2は標
準音声特徴パラメータメモリ、3は第1レジス
タ、4は第2レジスタ、5は第1スペクトル変化
量計算部、6は第3レジスタ、7は第4レジス
タ、8は第2スペクトル変化量計算部、9は重み
づけ計算部、10は距離計算部である。
第1図に示した未知音声特徴パラメータメモリ
1(以下未知音声メモリという)への未知音声の
特徴の格納、並びに標準音声特徴パラメータメモ
リ2(以下標準音声メモリという)への標準音声
の特徴の格納までの回路は省略している。
ここで未知音声メモリに格納される未知音声の
特徴をP(i、f)とし、標準メモリ2に格納さ
れる標準音声の特徴をQn(i、f)とする。こ
こでnは各標準音声対応の番号、iは音声区間の
分割に対して順次付された番号で、fは各フイル
タ出力に対応して付された番号を示す。未知音声
のi番目の時間標本点の各フイルタ対応の特聴は
次の如く示され、全体の集合を未知音声特徴パラ
メータPiとして示す。
Pi=〔P(i、0)、P(i、1)、………、P
(i、k)〕 但し、kはフイルタ番号に対応するものであ
る。又、番号nの標準音声のj番目の音声区間の
各フイルタ対応の特徴は次の如く示され、全体の
集合を標準音声特徴パラメータQjnとして示す。
Qjn〕〔Qn(j、0)、Qn(j、1)、 ………、Qn(j、k)〕 未知音声の特徴パラメータPiと標準音声の特徴
パラメータQjnのつきあわせ方は時間軸方向の線
形マツチングあるいは非線形マツチングにより行
なわれるものである。
未知音声メモリ1に格納された未知音声の特徴
パラメータPiは順次各フイルタ対応の特徴P
(i、0)、P(i、1)………P(i、k)の順
に第1レジスタ3に入力される。この第1レジス
タ3に入力された各特徴P(i、f)は次のステ
ツプでレジスタ4にシフトされる。この第2レジ
スタ4と第1レジスタ3に格納されている特徴P
(i、f)、P(i、f+1)は第1スペクトル変
化量計算部5に入力されて、各隣接フイルタ出力
間の周波数スペクトル変化量を計算する。
ここで、第1スペクトル変化量計算部5で計算
される各隣接フイルタ間のスペクトル変化量は (P(i、1)−P(i、2))、(P(i、2) −P(i、3))………、(P(i、k−1) −P(i、k)、(P(i、k)−A) である。但し、Aは特徴P(i、k)を計算する
ために用いるもので、ある特定の定数である。こ
こで P(i、f)−P(i、f+1)=ΔP(i、f) として、スペクトル変化量の大きさに応じて次の
如く決められた3値の符号系列からなる第1スペ
クトル傾斜符号S1が ΔP(i、f)<−V2の時 S1=1 −V2ΔP(i、f)V1の時 S1=0 ΔP(i、f)>V1の時 S1=−1 の形で出力される。
ここでV1、並びにV2はそれぞれある一定の正
数である。
又、同様に、入力側スペクトル変化量計算と同
期して比較対象である番号nの標準音声の音声区
間jの特徴パラメータQjnの各フイルタ対応の特
徴Qn(j、0)、Qn(j、1)………、Qn
(j、k)が順次第3レジスタ6に入力される。
第3レジスタ6に入力された各特徴Qn(j、
f)は順次第4レジスタ7にシフトされる。この
第3レジスタ6及び第4レジスタ7に格納された
各特徴Qn(j、f)、Qn(j、f+1)は第2
スペクトル変化量計算部8に入力されて、各隣接
フイルタ出力間の周波数スペクトル変化量を計算
する。この第2スペクトル変化量計算部で計算さ
れる各隣接フイルタ間のスペクトル変化量はそれ
ぞれ (Qn(j、1)−Qn(j、2))、 (Qn(j、2)−Qn(j、3))………… (Qn(j、k−1)−Qn(j、k)、 (Qn(j、k)−A) である。ここで Qn(j、f)−Qn(j、f+1) =ΔQn(j、f) として、このスペクトル変化量の大きさに応じて
次の如く決めた3値の符号系列からなる第2スペ
クトル傾斜符号S2が ΔQn(j、f)<−V2の時 S2=1 −V2ΔQn(j、f)V1の時 S2=0 ΔQn(j、f)>V1の時 S2=−1 の形で出力される。
前記第1スペクトル傾斜符号S1並びに第2スペ
クトル傾斜符号S2はそれぞれ重みづけ計算部9に
入力されて、両者の比較を行い、重み係数Wを、 S1=S2であればW=W1 S1≠S2であればW=W2 として距離計算部10に出力する。又、距離計算
部10には第2レジスタ4に格納された未知音声
の特徴P(i、f)と第4レジスタ8に格納され
た標準音声の特徴Qn(j、f)とが入力され、
未知音声の特徴パラメータPiと標準音声の特徴パ
ラメータQjnとの間の距離D(Pi、Qin)が両者間
の絶対値距離に重みをつけて、次の如く計算され
る。
D(Pi、Qjn)=|Pi−Qjn| =W・|P(i、1)−Qn(j、1)| +W・|P(i、2)−Qn(j、2)| +………+W・|P(i、k)−Qn(i、k)
| 尚、フイルタ数が8個程度であれば前記重み係
数WはW1=1、W2=8程度が良い。
以上説明したように第1の実施例では、未知音
声の特徴パラメータ内、並びに標準音声の特徴パ
ラメータ内での各隣接フイルタ出力同志のスペク
トルの傾斜を調べ、傾斜の異なるマツチングは距
離が大きくなる様に重みづけをしている。一搬
に、同一語を発声するとスペクトルの傾斜迄変化
する事はあまりないので重みづけにより異なる発
声の語句間での距離が十分とれるので認識精度が
向上する利点がある。
第1の実施例は周波数スペクトルの変化を3値
の符号系列で考え、必ず符号が一致しないと重み
を大きくしているが、符号が+と−の極端な対応
のみ重みを大きくするとしても同様の効果が生じ
る。すなわち、入力スペクトル傾斜符号S1と登録
スペクトル傾斜符号S2間にSi・S2=−1の関係が
成り立つ場合W=W2で、他はW=W1とする。
又、各スペクトル傾斜符号S1,S2のとる値が3
値の符号系列ではなく、2値の符号系列であると
しても十分効果がある。
又、前記実施例では特徴パラメータ間の個々の
測定量毎に重みを異ならせたが、計算量圧縮のた
めに、ある時間軸標本点における未知音声の一群
の特徴パラメータとある時間軸標本点における標
準音声の一群の特徴パラメータとの総合測定量毎
に異ならせても十分効果がある。なお、この場
合、未知音声の傾斜パターンと標準音声の傾斜パ
ターンとの間とがハミング距離で1程度異なつて
いても、同一パターンと見做した方がよい。
本発明は入力音声と登録音声のマツチング時に
スペクトルの傾斜でマツチング時の重みづけを行
つているので、マツチング距離が十分とれ、音声
認識装置に利用することができる。
【図面の簡単な説明】
図は本発明の一実施例のブロツク図。 1……未知音声特徴パラメータメモリ、2……
標準音声特徴パラメータメモリ、3……第1レジ
スタ、4……第2レジスタ、5……第1スペクト
ル変化量計算部、6……第3レジスタ、7……第
4レジスタ、8……第2スペクトル変化量計算
部、9……重みづけ計算部、10……距離計算
部。

Claims (1)

    【特許請求の範囲】
  1. 1 未知音声を複数のフイルタで周波数分析し
    て、未知音声のスペクトルに関する特徴パラメー
    タを各時間標本点毎に抽出する手段と、同一時間
    標本点に属する特徴パラメータの各群を対象とし
    て周波数軸上で隣接する特徴パラメータ間のスペ
    クトル傾斜を測定して、特徴パラメータの前記各
    群毎に傾斜パターンを作成する手段と、認識の対
    象となる標準音声毎に前記特徴パラメータと同種
    類の特徴パラメータを蓄積している手段と、未知
    音声の前記傾斜パターンと同種類の傾斜パターン
    を前記標準音声に関して作成し、若しくは前記標
    準音声に関して蓄積している手段と、未知音声の
    一つの時間軸標本点に属する一群の特徴パラメー
    タと標準音声の一つの時間軸標本点に属する一群
    の特徴パラメータを対象として、対応する周波数
    標本点の特徴パラメータ同志の距離を測定し、そ
    の測定量を加算する単位段階を含み、予め定めら
    れた形式に従つた複数の前記単位段階の組合せに
    よつて未知音声と標準音声との距離を測定する距
    離測定手段とを備え、前記各単位段階毎に未知音
    声の傾斜パターンと標準音声の傾斜パターンとを
    比較し、その比較結果に応じて前記各単位段階の
    各周波数標本点対応の距離測定量若しくは各単位
    段階での距離測定量に重みづけを行なわせること
    を特徴とした音声認識装置。
JP6271480A 1980-05-14 1980-05-14 Voice recognizing device Granted JPS56159696A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6271480A JPS56159696A (en) 1980-05-14 1980-05-14 Voice recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6271480A JPS56159696A (en) 1980-05-14 1980-05-14 Voice recognizing device

Publications (2)

Publication Number Publication Date
JPS56159696A JPS56159696A (en) 1981-12-09
JPS6126680B2 true JPS6126680B2 (ja) 1986-06-21

Family

ID=13208269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6271480A Granted JPS56159696A (en) 1980-05-14 1980-05-14 Voice recognizing device

Country Status (1)

Country Link
JP (1) JPS56159696A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59222900A (ja) * 1983-06-02 1984-12-14 沖電気工業株式会社 音声認識方法
JPS6019200A (ja) * 1983-07-13 1985-01-31 沖電気工業株式会社 音声認識方法
JPS60129800A (ja) * 1983-12-16 1985-07-11 沖電気工業株式会社 音声認識方式

Also Published As

Publication number Publication date
JPS56159696A (en) 1981-12-09

Similar Documents

Publication Publication Date Title
US4100370A (en) Voice verification system based on word pronunciation
Secrest et al. An integrated pitch tracking algorithm for speech systems
Tiwari MFCC and its applications in speaker recognition
US4624011A (en) Speech recognition system
US5056150A (en) Method and apparatus for real time speech recognition with and without speaker dependency
EP0691024B1 (en) A method and apparatus for speaker recognition
US4956865A (en) Speech recognition
Ali et al. Gender recognition system using speech signal
US4078154A (en) Voice recognition system using locus of centroid of vocal frequency spectra
Jing et al. Speaker recognition based on principal component analysis of LPCC and MFCC
US5159637A (en) Speech word recognizing apparatus using information indicative of the relative significance of speech features
CA1232686A (en) Speech recognition
JPS6126680B2 (ja)
AU2018102038A4 (en) A Speaker Identification Method Based on DTW Algorithm
WO1994022132A1 (en) A method and apparatus for speaker recognition
US5425127A (en) Speech recognition method
JP2577891B2 (ja) 単語音声予備選択装置
JPH0426479B2 (ja)
JPH0221598B2 (ja)
Pol et al. USE OF MEL FREQUENCY CEPSTRAL COEFFICIENTS FOR THE IMPLEMENTATION OF A SPEAKER RECOGNITION SYSTEM
Sugiyama et al. Frequency weighted LPC spectral matching measures
JPH01185599A (ja) 音声認識装置
JPS61141500A (ja) 単語音声認識装置
JPS58136098A (ja) 認識パタ−ン学習方式
JPS60200296A (ja) 音声認識装置