JPS60166999A - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JPS60166999A
JPS60166999A JP2328584A JP2328584A JPS60166999A JP S60166999 A JPS60166999 A JP S60166999A JP 2328584 A JP2328584 A JP 2328584A JP 2328584 A JP2328584 A JP 2328584A JP S60166999 A JPS60166999 A JP S60166999A
Authority
JP
Japan
Prior art keywords
frequency
input
spectrum
circuit
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2328584A
Other languages
English (en)
Inventor
光生 下谷
日比野 昌弘
憲司 嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2328584A priority Critical patent/JPS60166999A/ja
Publication of JPS60166999A publication Critical patent/JPS60166999A/ja
Priority to US07/228,149 priority patent/US4833714A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] この発明は単語音声認識装置に関し、特に、音声の特徴
抽出をピッチの定数倍の共振周波数を持つディジタルフ
ィルタで行なうピッチ適応型の単語音声認識装置におい
て、特徴パラメータ間の距離を計算する方法に関する。
[従来技術〕 第1図は従来のピッy−適応式単語音声認識装置の電気
的構成を示すブロック図である。まず、第1図を参照し
て従来の単回音声認識装置の構成について説明する。第
1図において、マイクロホン11から入力された音声信
号は、マイクロホンアンプ12に人力されて増幅された
後、AGC回路13に与えられる。AGC回路13は、
入力信号の大きさが変動しても、一定出力が得られるよ
うに、その内部に設けられた増幅器の利得を自動的に1
1mするものである。AGC回路13の出力は、A/D
変換回路14に与えられ、ディジタル信号に変換きれる
。A/D変換回路14の出力は、波形メモリ15に与え
られる。この波形メモリ15は、1フレームの入力波形
データを一時記憶するものである。波形メモリ15の出
力は特徴抽出部2に与えられる。− 特徴抽出部2はピッチ周期抽出回路21とフィルタ係数
設定回路22とディジタルフィルタ23とレベル計算回
路25と始終端検出回路6を含む。
ピッチ周期抽出回路21は波形メモリ15に一時記憶さ
れた1フレームの入力音声波形におけるピッチ周波数を
抽出するものである。フィルタ係数設定回路22はピッ
チ周期抽出回路21によって抽出された入力音声波形の
ピッチ周波数に基づいて、フィルタの共振周波数がピッ
チ周波数の整数倍となるようにフィルタ係数を設定する
ためのものである。ディジタルフィルタ23はフィルタ
係数設定回路21で設定されたフィルタ係数に応じてフ
ィルタ係数を決定する。レベル計算回路25は波形メモ
リ15に一時記憶された入力音声波形レベルを計算する
ものである。このレベル計算回路25の出力は認識処理
部5と始終端検出回路6とに与えられる。始終端検出回
路6はレベル計算回路25で計算されたレベルを用いて
入力音声信号の始終端を検出するものである。
認識処理部5に関連して設けられる入カバターンメモリ
3は特徴抽出部2で分析された音声の特徴パラメータを
一時記憶するものである。また、登録パターンメモリ4
は登録時に分析抽出された登録語の特徴パラメータある
いは標準音声の特徴パラメータを記憶して、認識処理部
5に与えるためのものである。認識処理部5は入カバタ
ーンメモリ3に記憶された特徴パラメータと登録パター
ンメモリ4に予め登録されている特徴パラメータとを用
いてUS処理を行なう。なお、認識処理部5はたとえば
マイクロプロセッサを中心にして構成される。
上述の第1図に示した1IBi音声認識装置においては
、音声波形を一定時間のフレームに分割し、フレームご
とにピッチ周波数の整数倍における周波数スペクトラム
を特徴パラメータとして抽出する。認識処理時には、登
録単語と入力単語のフレーム間における音韻の差異を表
わす数値として、比較すべきフレーム間の距離が特徴パ
ラメータを用いて計算され、この値を使用してマツチン
グ処理が行なわれる。
第2図は第1図に示した認識処理部5に含まれる距離計
算部の構成を示すブロック図である。第2図において、
距離計算部51は入カバターンメモリに記憶されている
分析された音声の特徴パラメータと、登録パターンメモ
リ4に記憶されている標準音声の特徴パラメータにおけ
るフレーム間の距離を計算するものである。この距離計
算部51はパラメータ一時記憶メモリ511と512と
チェビシェフ距離計算回路513とを含む。パラメータ
ー詩記憶メモリ511は入カバターンメモリに記憶され
ている1フレ一ム分の特徴パラメータを一時記憶するも
のであり、パラメータ一時記憶メモリ512は登録パタ
ーンメモリに記憶されている1フレ一ム分の特徴パラメ
ータを一時記憶するものである。そして、チェとシェフ
距離計算回路513はパラメータ一時記憶メモリ511
に一時記憶した内容と、パラメータ一時記憶メモリ51
2に一時記憶した内容とのチェビシェフ距離を計算する
ものである。チェごシェフ距離計算回路513によって
計算されたチェビシェフ距離はマツチング処理部52に
与えられ、マツチング処連部52は入カバターンメモリ
3に記憶している分析された音声の特徴パラメータと標
準音声の特徴パラメータとのマツチングを行なう。
次に、第1図および第2図を参照して従来の単語音声認
識装置における動作について説明する。
マイクロホン11で取込まれた音声信号はマイクロホン
アンプ12によって増幅されてAGC回路13に与えら
れる。AGC回路13は音声信号の入力波形の最高値が
一定水準となるように調整し、A/D変換回路14に与
える。A/D変換回路14は所定のサンプリング点ごと
に入力波形をディジタル信号にコード化する。1フレ一
ム分のサンプリングデータは波形メモリ15に与えられ
て一時記憶される。波形メモリ15に記憶された波形デ
ータはレベル計算回路25とピッチ周期抽出回路21に
入力される。レベル計算回路25は波形メモリ15から
与えられた波形データのレベルを計算し、その計算結果
を認識処理部5と始終端検出回路6とに与える。
始終端検出回路6はレベル計算回路25からの計算結果
に基づいて、音声信号の入力波形の始端と終端とを検出
して音声信号区間の判定を行ない、その判定結果を認識
処理vS5に与える。ピッチ周期抽出回路21は波形メ
モリ15から与えられた波形データに塁づいて、そのピ
ッチ周期を抽出して認識処理部5とフィルタ係a設定回
路22とに与える。フィルタ係数設定回路22はピッチ
周期抽出回路21が計算したピッチ周期に基づいて、デ
ィジタルフィルタ23がピッチ周波数の整数倍における
共振周波数をもつJ:うにフィルタ係数をディジタルフ
ィルタ23に設定する。ディジタルフィルタ23は、フ
ィルタ係数設定回路22によって設定されたフィルタ係
数に基づいて、波形メモリ15から与えられた波形デー
タにおける1フレ一ム分の周波数スペクトラムを計算す
る。
上述の一連の動作により、特徴抽出部2は1単語分の特
徴パラメータとして、ピッチ周波数時系列[pi]、ス
ペクトラム時系列パターン[C1m]、(i=1.2・
・・I)、(1=1.2・・・M)。
(■:分析11Nのフレーム数2Mニスペクトラム分析
のためのフィルタのllりを得る。このようにして得ら
れた1単語分の特徴パラメータ【よ登録モードにおいて
は登録パターンメモリ4に記憶され、g識モードにおい
ては入カバターンメモリ3に記憶した後、認識処理部5
がパターンマツチングの手法により認識処理を行なう。
!!!gfil処理部5は第2図に示すように、入カバ
ターンと登録パターンとのフレーム間における距離を計
算する距離計痺部51を有するが、入カッ(ターンメモ
リ3に記憶されている特徴パラメータを[fp; L 
[a;イコとし、登録パターンメモリ4に記憶されてい
るマツチングを行なうためのテンプレートの特徴パラメ
ータをピッチ周波数時系列[fljl、スペクトラム時
系列パターン[bjff、]。
(j−1,2,・・・、J)とすると、入カバターンの
フレームiと登録パターンのフレームjとの距離d(1
,j)は d(i、j)=Σ(ai、 −bjm 1−(1)ff
lx+ となる。この計算を行なうために、マツチング処理部5
2が入カバターンメモリ3と登録パターンメモリ4とに
制御IA(:! 号を与えると、入カバターンメモリ3
から’II −(aI I+a+ 2・・’alll’
l)がパラメータ一時記憶メモリ511に与えられ、登
録パターンメモリ4からbJ” (bJ、* b 9’
+ ”’ *b j、y、 )がパラメータ一時記憶メ
モリ512に与えられた後、チェビシェフ距離計算回路
513が前述の第(1)式の計算を行なって、d(i、
J)をめる。距離計算回路51が計算したd (1゜j
)を用いてマツチング処理部52は周知のパターンマツ
チングの手法を用いてマツチング処理を行なう。そして
、入カバターンと登録パターンとのマツチング距離がめ
られ、最小のマツチング距離を持つ登録パターンが認識
結果として選ばれる。
上述のごとく、従来の単語音声認識装置における特徴抽
出方法は、aI、ll とJmとの差を距離計算の主要
な値としているが、a−はf、iX…の周波数スペクト
ラムであり、bjmはt)jxIllの周波数スペクト
ラムである。ところが、fト と[、J は一般に等し
くないので、異なる周波数でスペクトラムを比較するこ
とになり、fP; とf)j とが大きく異なると、特
徴パラメータと1ノで不適当であり、V&識性能が下が
るという欠点があった。
[発明の概要] それゆえに、この発明の主たる目的は、スペクトルパタ
ーンを周波数軸上で正規化する手段を設けることにより
、より効果的な距離をめ、認識性能の優れた111語音
声認識装置を提供することである。
この発明の上述の目的およびその他の目的と特徴はJX
下に図面を参照して行なう詳細な説明から一層明らかと
なろう。
[発明の実開1 第3図はこの発明の一実施例による距離計算部の構成を
示すブロック図である。この第3図はスペクトラムの比
較を行なうための周波数を記憶する定比較周波数メモリ
514と、それぞれが入カバターンメモリ3と登録パタ
ーンメモリ4とのスペクトラムパターンに対して、周波
数軸上の正規化を行なうために、定比較周波数に合わせ
て1次た以外は前述の第1図および第2図と同じである
したがって、以下の説明では、距離計算8II51の動
作以外は前述の第1図と同じであるため、その詳細な動
作説明を省略する。
第4図はこの発明の一実施例によるスペクトラムパター
ンの補間の方法を示す図である。次に、第4図を参照し
てこの発明の一実施例の具体的な動作について説明づる
。1次補間回路515は、入カバターンメモリ3からフ
レーム1のスベク]・ラムパターン’ 1−(a+ l
a2 、l+、a、 )を受取り、かつ定比較周波数メ
モリ514から定比較周波arc−(fc+、fcz 
s・・、1cn )、n−1゜2、・・・、NO(NO
は比較周波数の個数)を受取ると、rcnに合わせて、
fr+ ・(k+1>>rcn≧rP+ ・11なる整
数りをめる。第4図は補間の様子を示しているが、1次
補簡口路515はM4図に示すごとり、aIlc とa
rK+’を用い、線形1次補門により、周波数fC2に
対応するスペクトラムacInを産出する。
以上の手順によりめた補間スペクトラムflc+−(a
c+++ac+z +”・+aCINc)Gよノ<ラメ
ータ一時記憶メモリ511に記憶される。同じ手順によ
り、登録パターンメモリ4から出力されるスペクトラム
パターンbJ は1次補間回路516によって補間され
、bcj =(E’cj + * bcJ 2 +”’
+be ’ N e )となり、パラメーター特記憶メ
モリ512に記憶される。チェビシェフ距離計算回路5
13は、ac、と11c、i の値を用1.%て距離d
(i、、1) d(i、j)−Σl aCl 1t−bejll l・
・・ (2) を計算する。
求められたd(+、J)を使用してマツチング処理部5
2は前述の第1図の説明と同様の手法によりマツチング
処理を行なう。
なお、上述の実施例では、認識処@!時に周波数軸上の
正規化を行なったが、音声入力時にスペク[・ラムパタ
ーンの周波数軸上の正炭化を行な11〜、得られたパタ
ーンa c + 、l −1,2,・”、I。
bcj 1J−1,2,・・・、Jを予め入カバターン
メモリ3または登録パターンメモリ4に記憶するように
構成してもよい。
また、上述の実施例では、補間を線形1次補間で行なっ
たが、2次以上の補間方法を用いるようにしてもよい。
さらに、上述の実施例では、定比較周波数に合わせるよ
うに、スペクトラムパターンの補間を行なったが、補間
を行なわずに定比較周波数に最も近い周波数を持つスペ
クトラムを選択し、パラメータ一時記憶メモリ511.
512へ出力しても同等の効果を得ることができる。
第5図はこの発明の他の実施例における距離計算部の構
成を示すブロック図である。この第5図に示した実施例
は、入カバターンのピッチ周波数と登録パターンのピッ
チ周波数との比較を行なうピッチ周波数比較回路517
と、このピッチ周波数比較回路517の出力に応じて入
カバターンと登録パターンのスペクトラムパラメータを
1次福間回路515へ転送するかあるいはバラメーター
時記憶メモリ512t\転送づるかを決定する転送切換
回路518を新たに設番プ、定比較周波数メモリ514
と1次補間回路516を削除した以外は前述の第3図と
同じである。
第6図は第5図に示した実施例によるスペクトラムパタ
ーンの補間を示す図である。次に、第6図を参照してこ
の発明の他の実施例の動作について説明する。ピッチ周
波数比較回路517は、入カバターンメモリ3からrr
+を受取るとともに、登録パターンメモリ4から「ドを
受取ると、その大小比較を行ない、その結果を転送切換
回路518に与える。転送切換回路518はfrl ≧
「tJの場合は、第5図に示した入力端aと出力端dと
を接続しかつ入力端すと出力端Cとを接続する。
逆に、f P l ”I の場合は入力端aと出力端C
とを接続しかつ入力端すと出力端dとを接続する。
ここでは、説明の便宜上、fPI≧f#j として話を
進める。入カバターンメモリ3のスペクトラムパターン
a1はパラメータ一時記憶メモリ512に入力され、5
111パターンメモリ4のスペクトラムパターンb、は
f P I 1ftjとともに1次補間回路515に入
力される。
次に、fP、の整数倍の周波数でスベク、ドラムを比較
するために、 f)jxh≦rP+ xi<f、jX(h+1)・・・
(3) を満足する整数りをめ、bjKとす1.ヤ、とを用いて
、線形1次補間により周波数f2.x−に対応するスベ
ク!・ルtコ一を梓出する。前述の第(3)式における
計純と線形1次補間は、+++=1からMb<Mまで行
なわれる。ここで、Mbはスペクトラムの比較を行なう
周波数軸上の上限周波数r1AXによって決まる値であ
る。上述の動作により、1次補間回路515はj、7−
(j Jl l tj2 1・・・、j、jr+b )
をめ、パラメータ一時記憶メモリ511に埴を出力する
。チェビシェフ距離計算回路513はa、とtj の値
を用いて距離d(+。
j) d(i、J)−Σl a l+n −tjm l −(
4)ell を計算する。得られたd(+、、J)を使用してマツチ
ング処理部52はマツチング処理を行なう。
なお、上述の実施例では、ピッチ周波数の低い方に合わ
せて周波数軸上の補間を行なったが、ピッチ周波数の高
い方に合わせて補間を行なうようにしてもよい。
また、補間を行なうのは入カバターン側か登録パターン
側のいずれであってもよい。
[発明の効果] 以上のように、この発明によれば、入力された音声信号
のスペクトラムパターンを抽出し、このスペクトラムパ
ターンの周波数軸上の正規化を行なう周波数正規化手段
を設けるようにしたので、ピッチ周波数が大きく異なる
音響波形であっても、音韻の差を的確に距離として捉え
ることができ、認識性能の優れた単語名声0!識装置を
得ることができる。
【図面の簡単な説明】
第1図は従来のピッチ適応型の単市音声認11!装置の
電気的構成を示すブロック図である。第2図は従来の単
筒音声m識装置における距離計算部の構成を示すブロッ
ク図である。第3図はこの発明の一実施例による距離計
算部の構成を示すブロック図である。第4図はこの発明
の一実施例によってスペクトラムパターンを補間する方
法を説明づるための図である。第5図はこの発明の他の
実施例における距離計算部の構成を示すブロック図であ
る。第6図は第5図に示した実h−例によるスペクトラ
ムパターンの補間方法を示す図である。 図において、1は音声入力部、2は特徴抽出部、3は入
カバターンメモリ、4は登録パターンメモリ、5はV&
識処理部、6は始終端検出回路、11はマイクロホン、
12はマイクロボンアンプ、13はAGO回路、14は
A/D変換回路、15は波形メモリ、21はピッチ周期
抽出回路、22はフィルタ係数設定回路、23はディジ
タルフィルタ、25はレベル計算回路、51は距離計算
部、52はマツチング処理部、511.512はパラメ
ーター峙記憶メモリ、513はチェビシェフ距離計算回
路、514は定比較周波数メモリ、515.516は1
次補間回路、517はピッチ周波数比較回路、518は
転送切換回路を示す。 代理人 大 岩 増 雄 手続補正書(自発) 昭和59年7 角9 日 事件の表示 特願昭 59−23285号発明の名称 単語音声認識装置 補正をする者 代表者片山仁へ部 代理人 5、補正の対象 明細書の発明の詳細な説明の欄および図面6、補正の内
容 (1) 明細書第12頁第7行の1次に、」を[次に、
第3図および」に訂正する。 (2) 明細書第12頁第13行および第14行のrf
c=(rc++fcz、−、fcrl)、n−1,2,
・、 NCJをrf c −(f c +、fc2 、
・・・、rcN C) Jに訂正する。 (3) 明細書第12頁第16行のrf c n≧r、
、−hなる整数h」をrf c n≧f、、−になる整
数k」に訂正する。 (4) 明細書第12頁第19行の「周波数fC2Jを
「周波数f’cnJに訂正する。 (5) 明細書第13頁第11行の第(2)式を下記の
とおりに訂正する。 記 d(i、J)−Σl ac+n ficj nl・・・
 (2) (6) 明細書第15頁第6行の「次に、」を[次に、
第5図および」に訂正する。 (7) 図面の第1図を別紙のとおり。 以上 手続補正書(自発) 昭和59年8 イ1 日 2、発明の名称 単語音声認識装置 3、補正をする者 事件との関係 特許出願人 住 所 東京都千代田区丸の内二丁目2番3号名 称 
(601)三菱電機株式会社 代表者片山仁八部 4、代理人 5、補正の対象 明細書の発明の詳細な説明の欄 6、補正の内容 明細書第16頁の第(3)式を下記のとおりに訂正する
。 記 ftjXk ≦f p lXI <11JX (k +
1 )・・・ (3) 以上

Claims (2)

    【特許請求の範囲】
  1. (1) 音声を電気信号に変換して入力するための音声
    信号入力手段、 予め設定されるフィルタ係数に応じて、その共振周波数
    が変化しかつ前記音声信号入力手段から入力された音声
    信号のスペクトラムデータを特徴パラメータとして抽出
    するディジタルフィルタを含む特徴パラメータ抽出手段
    、 前記特徴抽出手段で抽出された認識すべき単語音声の特
    徴パラメータを記憶する入カバターン記憶手段、 前記特徴パラメータ抽出手段で抽出された複数個の単語
    音声の特徴パラメータを予め記憶する登録パターン記憶
    手段、 前記入カバターン記憶手段に記憶された入力音声の特徴
    パラメータと、前記登録パターン記憶手段に記憶された
    複数個の単語音声の特徴パラメータとの類似度を計算し
    、音声の1!識処理を行なう音声ia*処理手段、およ
    び 前記特徴パラメータ抽出手段によって抽出されたスペク
    トラムデータにおける周波数軸上の正規化を行なう周波
    数正着化手段を備えた、単語音声認識装置。
  2. (2) 前記周波数正規化手段は、予め定められた定比
    較周波数に合わせるようにスペクトラムパターンの補間
    を行なう補間手段を含む、特許請求の範囲第1項記載の
    単語音声認識側L(3) 前記周波数正規化手段は、比
    較するスペクトラムパターンのいずれか一方のパターン
    を他方のピッチ周波数に合わせるように補間を行なう手
    段を含む、特許請求の範囲第1項記載の単語音声Wgi
    l帽L
JP2328584A 1983-09-30 1984-02-10 単語音声認識装置 Pending JPS60166999A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2328584A JPS60166999A (ja) 1984-02-10 1984-02-10 単語音声認識装置
US07/228,149 US4833714A (en) 1983-09-30 1988-08-04 Speech recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2328584A JPS60166999A (ja) 1984-02-10 1984-02-10 単語音声認識装置

Publications (1)

Publication Number Publication Date
JPS60166999A true JPS60166999A (ja) 1985-08-30

Family

ID=12106329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2328584A Pending JPS60166999A (ja) 1983-09-30 1984-02-10 単語音声認識装置

Country Status (1)

Country Link
JP (1) JPS60166999A (ja)

Similar Documents

Publication Publication Date Title
US5056150A (en) Method and apparatus for real time speech recognition with and without speaker dependency
JPS5850360B2 (ja) 音声認識装置における前処理方法
JPS634200B2 (ja)
JP3493033B2 (ja) 音声認識用回路装置
CA1164569A (en) System for extraction of pole/zero parameter values
WO1998037543A1 (en) Method and apparatus for training a speaker recognition system
JPS60166999A (ja) 単語音声認識装置
US5425127A (en) Speech recognition method
JPS60166993A (ja) 単語音声認識装置
JPH0461359B2 (ja)
JPS5888797A (ja) 音声認識装置
JPS6229798B2 (ja)
JPS5977498A (ja) 音声特徴パラメータの圧縮装置
JPH0459638B2 (ja)
JPS625298A (ja) 音声認識装置
JPS6346496A (ja) 音声認識装置
JPS5999500A (ja) 音声認識方法
JPH035595B2 (ja)
JPH0146078B2 (ja)
JPS6210697A (ja) 音声認識装置
WO1991002348A1 (en) Speech recognition using spectral line frequencies
JPH0736491A (ja) ピッチ抽出装置
JPS6273299A (ja) 音声認識方式
JPS62293299A (ja) 音声認識方法
JPS59116797A (ja) 音声認識装置の自動利得制御方法