JPS59219800A - 音声パターン比較方法 - Google Patents

音声パターン比較方法

Info

Publication number
JPS59219800A
JPS59219800A JP9475083A JP9475083A JPS59219800A JP S59219800 A JPS59219800 A JP S59219800A JP 9475083 A JP9475083 A JP 9475083A JP 9475083 A JP9475083 A JP 9475083A JP S59219800 A JPS59219800 A JP S59219800A
Authority
JP
Japan
Prior art keywords
pattern
patterns
frequency
time
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9475083A
Other languages
English (en)
Other versions
JPH0527120B2 (ja
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP9475083A priority Critical patent/JPS59219800A/ja
Publication of JPS59219800A publication Critical patent/JPS59219800A/ja
Publication of JPH0527120B2 publication Critical patent/JPH0527120B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 良1欠■ 本発明は、音声認識装置に関する。
良末韮遣 近年、マン・マシン対話の実現のために音声認識装置が
実用化されつつあるが、音声の認識において重要な部分
は、辞書登録された特徴パターンと入力音声の特徴パタ
ーンの照合部である。通常、この音声特徴パターンの照
合には次の二つの問題点があり、その−は、発声毎に音
声長が変動することであり、その二は発声者によってホ
ルマントが異り周波数変動があることである。前記その
−の変動吸収のためには動的計画法(D P)によるパ
ターンマツチング法が知られている。このDPマツチン
グ法は時間方向の変動吸収のために比較すべき二つのパ
ターン間の類似度が最大になるようにパターンの時間長
を伸縮するものである゛が、この方法は二つのパターン
間のあらゆる対応づけとして類似度を求めるものである
ため、演算量が多く、また周波数変動を吸収するために
は膨゛大なりP演算が必要となる。なお、前記その二の
周波数変動を吸収する方法は未だに確立されていない。
旦−一一一的 本発明は、上述のごとき実情に鑑みてなされたもので、
少ない演算量によって時間変動と周波数変動の両方を吸
収して精度よくパターンを照合し得るようにした音声パ
ターン照合装置を提供しよう−とするものである。
4−−1 本発明の構成について、以下、実施例に基づいて説明す
る。
最初に、第1図及び第2図を参照しながら通常のDrマ
ツチ、フグ法について説明する。
まず、第1図において、(a)図のパターンと(b)図
のパターンを比較することを考えるが、同図には、音声
パターンを時間軸方向に一定間隔でサンプリングしたパ
ターン1.2・・・ が示されており、これら各パター
ン1,2・・・ をフレームと呼んでいる。このDr法
は、まず(a)図の第1フレームと(b)図の第1フレ
ームを対応づけて二つの波形の差を求め、第2図の斜線
部を求める。以下同様にして(a)図の第1フレームと
(b)図の第2フレーム、(a) 図のitフレームと
(b)図の第3フレーム・・・・・・ (a)図の第2
フレームと(b) 図の第1フレーム、(a)図の第2
フレームと(b)図の第2フレーム・・・・・・ と対
応づけ、その波形差が一番少なくなるようにフレーム間
、つまり時間軸の対応をつけるものである。そのため、
(a) 、 (b)が同一人物の発声した音声であるよ
うな周波数変動が少ないパターンに関しては有効である
が、例えば第2図の破線と実線の波形のように波形が似
ているにもかかわらず、周波数にずれがある場合にはこ
れを同一波形とみなすことができない。このような現象
は(a)と(b)の音声の発声者が異なった場合に起こ
るが、これには個人のホルマント差が影響している。
本発明は、上記DPマツチング法の欠点を解決するため
になされたもので、その動作原理について第3図を参照
しながら説明する。まず、前述のごとくしてサンプリン
グされたパターンを、周波数軸方向及び時間軸方向にサ
ンプリングし、周波数の低い方から順にi=1,2.・
・・・・・工1時間軸方向をj=1,2,3.・・・・
・・Jとし、二つのパターンをA (i、j) 、 B
 (i、j)で表わす。次、に辞書登itべきパターン
はフィルタ一群でi=1.2゜・・・・・・Iまで分け
、閾値を設けて2値化して登録する(A (i、j) 
、J A = ’ I・・・Ja)。一方、認識音声は
同様に2値化されたあと、細線化されてB(Lj) 、
  j B = 1 、2 、・・・JBとなる。ここ
でjaとjBの対応づけが問題になるが、この対応づけ
を第3図に示す?第3図において、i −j 、、a面
上でA(i、jA)を表わすと(a)図のようになりB
(i、jB)をi  jB面で表わすと(b)図のよう
になる。ただし、2値化して0.1にしたうち1の部分
を斜線で表わしている。この時、jAとjsのサンプル
点の作るメツシュ(ja、jB)各点におけるAC’ 
l J A )とB(i、ja)の類似度r(ja、j
e)を次式で定義し、■ ・・・・・・(1) J A” ’ + J B= 1からja + jeま
での類似度の累計をR(ja、jB−)で表わした時、
・・・・・・ (2) となるような(JA IJB )を決定して行く(ただ
し1Ilaxは(内の最大値を採用することを示してい
る)。なお、上記(1)式は積をとっているが、これは
理論演算でも良いし、B(i、je)のiを変化させて
「l」を抽出し、その部分だけ演算をしても良い。また
(2)式の結゛果をフレームfiI+Jで正規化するこ
とも考えられる。また各パターンの始端と終端は各々対
応づけるものとする。
第4図は、上記動作原理に従って構成された本発明の一
実施例を示すブロック線図で、図中、lはマイク、2は
フィルタ一群、3は音−区間検出部、4は2値化部、5
はスイッチ、6は辞書部、7は細線化部、8は類似度計
算部、°9はja、’jB変化部、lOは類似度検出部
、llはR計算部、12はJa又はjeを1ステップ歩
進する歩進部、13はRの最大算出部、14は認識結果
出力部で、本発明によると、(a)のパターンが周波数
軸方向に幅をもち、(b)のパターンの幅がせまいため
、発声者によって周波数が変動し、そのため(b)のパ
ターンが周波数軸方向に変動しても(a)のパターン幅
からはみ出さない限りその変動を吸収することができる
第5図は、本発明の他の実施例を示す図で、この実施例
は、辞書部6の前にピーク検出部15を設け、該ピーク
検出部15によって音声の特〆麦パターンの周波数上の
ピークを検出し、そのパターンを辞書部に登録しておき
、他方、照合すべきパターンが入力された時に、これを
ある閾値で0゜1に2値化しくこの時1になる部分を特
徴量分布部と称する)、これと辞書パターンの類似度を
前記式(2)に従って動的計画法によって最矢になるよ
うに時間伸縮を行なって照合するようにしたものである
処−一一釆 以上の説明から明らかなように、本発明によると、少な
い演算量で時間変動と周波数変動の両方を吸収すること
ができる精度の高いパターン照合装置を提供することが
できる。
【図面の簡単な説明】
第1図及び第2図は、DPマツチング法を説明するため
の図、第3図は、本発明の詳細な説明するための図、第
4図及び第5図は、それぞれ本発明の詳細な説明するた
めのブロック線図である。 l・・・マイク、2・・・フィルタ一群、3・・・音声
区間検出部、4・・・2値化部、5・・・スイッチ、6
・・・辞書部、7・・・細線化部、8・・・類似度計算
部、9・・・jA+Je変化部、10・・・最大類似度
算出部、11・・・R算出部、12・・・ja(js)
歩進部、13・・・R最大算出部、14・・・結果出力
部、15・・・ピーク検出部。 −72:

Claims (2)

    【特許請求の範囲】
  1. (1)周波数上の特徴量の時間変化として表現されるパ
    ターンを比較するパターン比較装置において、比較すべ
    き二つのパターンのうち少くとも一方のパターンを2値
    化し、周波数軸方向の特徴量分布幅を細化する操作をし
    た後に、該パターンの細化された部分が他方のパターン
    の特徴量分布上に対応づくように動的計画法によって時
    間長を整合させて照合する°ようにしたことを特徴とす
    る音声パターン照合装置。
  2. (2)周波数の特徴量の時間変化として表現されるパタ
    ーンを比較照合するパターン比較装置において、比較す
    べき二つのパターンのうち少くとも一方のパターンの周
    波軸上のピークを時間方向へ連らねたパターンに変換し
    、該パターンのピーク連結部が他方のパターンの特徴量
    分布↓に対応づくように動的計画法によって時間長を整
    合させて照合するようにしたことを特徴とする音声パタ
    ーン照合装置。
JP9475083A 1983-05-27 1983-05-27 音声パターン比較方法 Granted JPS59219800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9475083A JPS59219800A (ja) 1983-05-27 1983-05-27 音声パターン比較方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9475083A JPS59219800A (ja) 1983-05-27 1983-05-27 音声パターン比較方法

Publications (2)

Publication Number Publication Date
JPS59219800A true JPS59219800A (ja) 1984-12-11
JPH0527120B2 JPH0527120B2 (ja) 1993-04-20

Family

ID=14118797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9475083A Granted JPS59219800A (ja) 1983-05-27 1983-05-27 音声パターン比較方法

Country Status (1)

Country Link
JP (1) JPS59219800A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04264598A (ja) * 1990-11-05 1992-09-21 Internatl Business Mach Corp <Ibm> 人間の音声を認識するための方法及び装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5023941A (ja) * 1973-07-02 1975-03-14

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5023941A (ja) * 1973-07-02 1975-03-14

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04264598A (ja) * 1990-11-05 1992-09-21 Internatl Business Mach Corp <Ibm> 人間の音声を認識するための方法及び装置

Also Published As

Publication number Publication date
JPH0527120B2 (ja) 1993-04-20

Similar Documents

Publication Publication Date Title
JPS5972496A (ja) 単音識別装置
JPS5844500A (ja) 音声認識方式
Elenius et al. Effects of emphasizing transitional or stationary parts of the speech signal in a discrete utterance recognition system
JPS59219800A (ja) 音声パターン比較方法
JP2666296B2 (ja) 音声認識装置
JPS635395A (ja) 音声認識装置
JPS63173100A (ja) キ−ワ−ド抽出装置
JPS62293299A (ja) 音声認識方法
JPS6344699A (ja) 音声認識装置
JPS61233791A (ja) 音声認識装置における音声区間検出方式
JP2655637B2 (ja) 音声パターン照合方式
JPS61200596A (ja) 連続音声認識装置
JP2602271B2 (ja) 連続音声中の子音識別方式
JPS61252595A (ja) 音声認識処理方式
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPH0229700A (ja) 音声パターン照合方式
JPS6069699A (ja) 音声パタ−ン作成装置
JPS63223698A (ja) 単音節音声認識装置
JPH0792675B2 (ja) 音声認識装置
JPS6336679B2 (ja)
JPS63318600A (ja) 音声認識方式
JPH0254560B2 (ja)
JPS61203498A (ja) 音声認識装置の予備選択方式
JPH02235099A (ja) 音声認識装置
JPS61259299A (ja) 音声パタ−ン照合方式