JPS59195699A - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JPS59195699A
JPS59195699A JP58070264A JP7026483A JPS59195699A JP S59195699 A JPS59195699 A JP S59195699A JP 58070264 A JP58070264 A JP 58070264A JP 7026483 A JP7026483 A JP 7026483A JP S59195699 A JPS59195699 A JP S59195699A
Authority
JP
Japan
Prior art keywords
word
label
distance
registered
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58070264A
Other languages
English (en)
Inventor
真哉 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP58070264A priority Critical patent/JPS59195699A/ja
Publication of JPS59195699A publication Critical patent/JPS59195699A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は音韻ラベル系列によって記述された登録単語
辞書と、入力単語音声とのパターン間距離を、少ない計
算量で時間軸に非線形なノくターンマツチングを行なう
ことによって計算する単語音声認識装置に関するもので
ある。
第1図を工従来の時間軸に非線形なパターンマツチング
を行なう単語音声認識装置の一例を示す構成図である。
単語音声は発声きれるたびに継続時間が変りその時間構
造も線形ではない。この仙でな性質を付つ不等長な二つ
の単語のパターン間距離を効率的に計算するのに第1図
に示す様な従来の装置で(ちダイナミックプログラミン
グマツチング法(以下DPマツチング法と呼ぶ)という
時間軸に非線形な変換を施すパターンマツチング法が用
いられてきた。
第1図でマイクロホン(1)から入力された単語背戸波
形は(2)は、音声分析特徴抽出回路(3)内で分析を
受け、特徴ベクトルの時系列A−a、a2a5・・・a
□ に変換され、入力特徴パターンとして入カバターン
メモ1月4)に格納される。祈鎮パターンメモリ(6)
にはあらかじめ作成されたに個の音韻%徴パターンP、
 P2・・・PKとそれらのラベル11,112・・・
lKが格納されている。距離マトリクス計算回路(5)
では、入力も徴パターンA=a1a2・・・aエ と音
韻パターンp、 p2・・・I)xによって距離マトリ
クスを作成し、距離マトリクスメモリ(7)に格納する
。距離マトリクスメモリ(7)の中のdiktji査目
の入力特徴ベクトルa、とに香目の音韻特徴ベクトルp
kとの距離である。
後続のモード切換スイッチ(8)は学習/認識モードの
切換を行なうもので、単語音声の登録操作時には破線、
認識操作時[&ま実線に倒される。
今、単語音声の登録時を考える。スイッチ(8〕は破線
側に倒れ、ラベル付は回路(9)では、距離マトリクス
メモリ(7)内の距離マトリクスを用いて、入力特徴パ
ターンAの各フレームa工毎にそのフレームとの距離が
最小となった音韻特徴ベクトルpkを求める。さらにそ
れらの音韻特徴ベクトルpkに対応するラベルlkを音
韻パターンメモリよシ取シ出し、音韻ラベル系列L−4
?3/、15・・・を作成する。音韻ラベル系列りは一
旦音韻ラベル系列メモHf)に悟納され、単語辞1メモ
IJ fIII内に単語登録毎に順次@納されて行く。
ひと辿シの登録が終了すると、モード切換スイッチ(8
+に実勝に倒され認識が行なわれる。認識時には距離マ
) IJクスメモリ(7)内の距離マトリクスはスイッ
チ(8)を通り距離計算回路f121に送られる。距離
計算回路0)5では単語辞書メモリ011の中の音韻ラ
ベル系列で記述されている単語Wnと入力特徴パターン
A=a、a2・・・al  との距19[nをDpマツ
チング法によって計算する。
今、単語Wnのラベル系列Ln=’3 ’711 ’5
・・・1IVC対応する音韻ベクトルの系列P=p31
)7p、  p5・・・p工をB=b、b2b3b4・
・・b、 (Jは系列の個数)と書き換えるとDPマツ
チング法で距離計算を行なう二つの特徴パターンは となる。第2図にDpマツチング法によるA、  B両
パターンの時間対応の例を示す。A、E両パターンの時
間対応すなわち時間変換関数&ji−j平面上の格子点
C=(i、j)の系列Fで表現することができる。
F=C:tll、 C(21・・・C(kl・・・C(
Kl       ・・・(2)ただしC(kl= (
1(kl、 j(kl)とする。
また2時間軸の極端な変形を許さないことの一つの反映
として点列Fの存在する範囲7fc(31式で示す整合
窓関数で制限する。
li (kl  j (kl≦γ γ:正の定数   
   ・・・(3)二つの特徴ベクトルa1とbjとの
距離k d(cl= a□jとすると点列Fに沿ってと
った距離の荷重平均&工になる。S (klは非負の定
数でそのイ直&工時間変換関数を点列で近似するときの
方式によって定められる。またa(c)=d工、はすで
に計算された距肉廿マトリクスから直接引用する。
(4)式において点列Fを変化させたときの最/J11
直で二つのパターンAとBの距離D(A、B)を定義す
ると。
M−Σ S (kl 1r=1 となる。DPマツチング法では(5)式の最小化問題を
次の様な方法で解く。まず2Mを定数化する方法として
s tk+を対称形と呼ばれる+6+式で定義する。
5(kl= (1(kl−1(k−1) )+(j(k
l−j (k−リ)・・・+61このときM=I+Jと
なる。次に部分点列C(11CF2+・・・C(k)に
対する部分和g (C(kl) 1(71式で考える。
(7)式を用いて次の3段階で(5)式のD(A、B)
を計算する。
■初期設定g(1,1)=2d11およびj=1■j1
=max (1* j−γ) i2 =min (j十
γ、I)として土を11から12まで1ずつ増しながら
(7)式によってg(i+j)を計算する。
■jがJ[等しくなければjtlだけ増して■へ行く等
しければD(A、B)=g(1,J)7’Mとする。
以上がDPマツチング法による特徴パターンAとBの距
離D(A、B)の計算法である。距離計算回路+I2)
では入力特徴パターンAと単語辞書に登録された総ての
単語w1との間の距離IDPマツチング法で計算し、距
離が最小となった単語w、。
(min)を認識結果日として出力する。
さて、DPマツチング法では二つの特徴パターンA、B
の間の距離D(A、B)を計算ブるために。
整合窓内の総ての部分距離g (i、j)を計鉋、する
必要があり、また各g(ilj)は(7)式の様な三つ
の候補値の中から選択されるということで、計算量が非
常に多いという欠点があった。
この発明はこの欠点を除去するため比較的簡易なパター
ン間距離計算法により少ない計算量で時間軸に非線形な
マツチングを行なうものである。
第3図に本発明の実施例を示す。
第3図中マイクロホン11+からラベル、lJ’lJメ
モリαQ4では第1図中のものと同じなので説明を省略
する。
まずモード切換スイッチ(81を破線に倒した学習モー
ドの場合を説明する。ラベル系列メモリ00)に格納さ
れたラベル系列L=/!、l!、137・・・はラベル
系列置処理回路04:で以下のような再処jSを施され
る。
■ラベル系列を数フレーム単位に区切シ、その区間内を
1つのラベルで置き拗える(ラベルの平滑化)。例えば
3フレ一ム単位にラベル系列を区切った場合その中のラ
ベル金(82式の様に変換する。
1516113→131. A3A5g51.−+13
13i3・・・(8+ i、 l、 IK、−+1313i3  z、 z21
154213212(中間のラベル) ■平滑化されたラベル系列で、同一ラベルが継続する区
間全体をそのラベル名と継続長の2つの情報で表現する
(ラベルの圧縮)。
例えば■で平滑されたラベル系列が L’=l、 7,7. l、l、l、l、A、A、 x
、 13713.・・・(9)のときこのラベル系列は
圧縮ラベル系列仝と継続長Tに変換される 圧縮ラベル系列光と継続長′fは一旦圧絹うベル系列メ
モリa51に格納され、圧縮単語辞書メモ1,11Jω
に、単語の登録毎VC順次格納されてゆく。
−通りの単語登録が終了するとモード切換スイッチ(8
)は実線の認識モードに切換えられ認識が行なわれる。
認識モードでは、入力%徴パターンA−a、a2・・・
a工に各登録単語W1 とのパターン間距離を、簡易距
離計算回路t171で計算し、距離最小となった単語w
、 (min)を認識結果113・とじて出力する。
簡易距離計算回路[+71では、入力特徴パターンAと
笠録単飴W1との距離′ff:■入力師徴パターンA=
a、a2・・・a工の各フレームに、登録単語Wj−の
圧縮ラベル系列中の音韻ljを2時間軸に非線形な伸動
ヲ許しながら順次割当てていく。■入力特徴パターンの
aiとそれに割当てられた音韻ljとの距離a、e距離
マトリクスから引用し、入力特徴パターンAの始端から
終端までその距離を加算する。という方法で形算する。
第4図に音韻の割当ての様子を示す。圧縮ラベル系列t
の中のめる音韻ら を入力%徴パターンに割当てるには
以下のステップを用いる。
■ljの継続長t、かうljの最小継続長t8Lと最大
継続長tbを決める。
■最小継続長−フレームだけ、音韻l、を入力特徴パタ
ーンAに割g当てる。
a ■ta以上のフレームに対してはそのフレームa工とl
jの距離d1jが次の音’k Z j−1−+との距#
1cdi、十、より犬になるまでl、の即j当てを続け
、距離大となった時点で6+、の割当てを開始する。
ここで1.の割当てフレーム数は最大継続長以内とし、
最大継続長に達したときはl  割当てj+i を開始する。
入力性徴パターンA=a、a2・・・a工の各フレーム
に対する音韻l、の割当てはljの最大最小継続長条件
と、各フレームとlj及び1.+、との距離値の比較に
よって簡単に決定することができるので、簡易部内11
計算回路071内での入力特徴パターンAと登録単語W
1との距離計算搦:は非常に少ない。
しかも音韻らを割当てる範囲には非線形な伸縮が許され
る。従って本発明では入力特徴パターンAと登録単語辞
書中の単語W□との間での2時間IIqIIに非線形な
変換をか11すパターンマツチングを少ない計算量で実
現できる。
以上は認識を行う単語を使用者かあらかじめ登録する。
特定話者単語音声認識装蝕の場合について説明したが、
この発明げ話者を限定しない不特定請者単語音声認識装
(MVcも使用してよい。
その際、単語辞書は台数の話者による単語音声データか
らあらかじめ作成し、でおくもので1一つの単語につい
て複数話者から14tられたいくつかの代表的な音素系
列を単語辞書として登録する。
以上のようにこの発明によれは、入力された単語音声と
、登録されている単語辞書との距離を簡単な非縁形マツ
チングを行なって計算するので。
少ない計算量で、非線形に伸縮する時間構造を4ぐつ単
語間の距離を計算することができZ・。
【図面の簡単な説明】
第1図は従来の単語音声認識装置の一例、第2図はDP
マツチング法によるパターンA、Bの時間対応図、第3
図は本発明による単語音声認識装置の一実施例を示す図
、第4図は入力%徴パターンと圧羅1ラベA/系列の対
応図である。 図中111 &Yマイクロホン、(2)は入力音声波形
、(3)をま音声分析他機抽出回路、(4)は入カバタ
ーンメモリ、(5)は距離マトリクス計算回路、(6)
は廿飾パターンメモリ、(7)は距離マトリクスメモリ
、  Lal&Xモー)”切換スイッチ、+9)はラベ
ル付は回路、 (11))&’:!音―ラベルM列メモ
リ、0旧ま単語辞書メモリ、ロヵは距離計算回路、 +
131は認識結果、0]はラベル系列再処理回路、aS
++ま圧縮ラベル系列メモリ、aS+は圧縮単語辞書メ
モリ、(171は簡易距離計算回路である。 代理人 大 岩 #l 雄

Claims (1)

    【特許請求の範囲】
  1. 単語音声登録時に音韻ラベル付は回路によって登録単語
    音声を音韻ラベル系列に変換し、前記音韻ラベル系列を
    登録単語メモリに登録し、単語音声認識時に距離計算回
    路で前記登録単語メモリ中の各登録単語音声の音韻ラベ
    ル系列と入力単語音声とのパターンマツチングを行う単
    語音声認識装置において、前記登録単語音声の音韻ラベ
    ル系列を圧縮して圧縮音韻ラベル系列として登録単語メ
    モリに登録するラベル系列圧絹回路を備え、距離計算回
    路で前記登録単語音声の圧縮音韻ラベル系列を入力単語
    音声に始端から順に蟲てはめることで前記圧縮晋徊ラベ
    ル系列と入力単語音声とのパターンマツチングを行うこ
    とを%徴とする単語音声認識装置。
JP58070264A 1983-04-21 1983-04-21 単語音声認識装置 Pending JPS59195699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58070264A JPS59195699A (ja) 1983-04-21 1983-04-21 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58070264A JPS59195699A (ja) 1983-04-21 1983-04-21 単語音声認識装置

Publications (1)

Publication Number Publication Date
JPS59195699A true JPS59195699A (ja) 1984-11-06

Family

ID=13426492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58070264A Pending JPS59195699A (ja) 1983-04-21 1983-04-21 単語音声認識装置

Country Status (1)

Country Link
JP (1) JPS59195699A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60158498A (ja) * 1984-01-27 1985-08-19 株式会社リコー パターン照合装置
JPS62217297A (ja) * 1986-03-19 1987-09-24 富士通株式会社 単語音声認識装置
JP2011022621A (ja) * 2006-10-20 2011-02-03 Toshiba Tec Corp パターンマッチング装置及び方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60158498A (ja) * 1984-01-27 1985-08-19 株式会社リコー パターン照合装置
JPH0582599B2 (ja) * 1984-01-27 1993-11-19 Ricoh Kk
JPS62217297A (ja) * 1986-03-19 1987-09-24 富士通株式会社 単語音声認識装置
JP2011022621A (ja) * 2006-10-20 2011-02-03 Toshiba Tec Corp パターンマッチング装置及び方法

Similar Documents

Publication Publication Date Title
EP0388067B1 (en) Speech recognition system
US4400828A (en) Word recognizer
EP0109190B1 (en) Monosyllable recognition apparatus
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
JP2595495B2 (ja) パタンマッチング装置
JPH0469400B2 (ja)
US4488243A (en) Dynamic time warping arrangement
JP2898568B2 (ja) 声質変換音声合成装置
JPS59195699A (ja) 単語音声認識装置
US4790017A (en) Speech processing feature generation arrangement
JPH01204099A (ja) 音声認識装置
JPH0823758B2 (ja) 話者適応形音声認識装置
EP0238693B1 (en) Speech recognition system and method using statistical models for words
JPS59161782A (ja) パタ−ン・マツチング方法
JP2561553B2 (ja) 標準話者選択装置
JP3008520B2 (ja) 標準パタン作成装置
JP3003353B2 (ja) タスク適応標準パターン学習装置
JPH11212587A (ja) 音声認識における雑音適応方法
Nurul et al. Distinctive phonetic feature (DPF) based phone segmentation using 2-stage multilayer neural networks
JPS6170595A (ja) 音声認識方式
Cheng et al. Speech Recognition Using Linear Prediction Residue and a Reduced Feature Space
JPS6310439B2 (ja)
JPH0361955B2 (ja)
JPH0320759B2 (ja)
JPS5915298A (ja) 音韻識別方式