JPH0575117B2 - - Google Patents

Info

Publication number
JPH0575117B2
JPH0575117B2 JP61031179A JP3117986A JPH0575117B2 JP H0575117 B2 JPH0575117 B2 JP H0575117B2 JP 61031179 A JP61031179 A JP 61031179A JP 3117986 A JP3117986 A JP 3117986A JP H0575117 B2 JPH0575117 B2 JP H0575117B2
Authority
JP
Japan
Prior art keywords
dissimilarity
matching
pattern
time length
input pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61031179A
Other languages
English (en)
Other versions
JPS62187897A (ja
Inventor
Masao Watari
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP61031179A priority Critical patent/JPS62187897A/ja
Priority to US07/015,458 priority patent/US4794645A/en
Publication of JPS62187897A publication Critical patent/JPS62187897A/ja
Publication of JPH0575117B2 publication Critical patent/JPH0575117B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は連続音声認識装置に関し、特に文法に
従つて連続発声された文音声を認識する装置の改
良に関する。
(従来技術) 音声認識装置の中でも文法に従つて発声された
文音声を認識する装置は、計算機プログラムや限
定業務用文章あるいは航空管制や各種機器の制御
用指令などの認識ができ広範囲な応用分野を有し
ている。文法の拘束が与えられている場合には、
その文法規則を利用することによつて誤認識を防
止できることが原理的に知られている。特に連続
数字認識において、入力音声に桁数の制約がある
場合、その制約を規則化することにより認識率を
改善することができる。
このような文法に従つて連続に発声された文音
声を認識する手法が特願昭56−199098号明細書に
記載されている。この原理は大略次のとおりであ
る。文法をオートマトンaで表現し、そのオート
マトンaを次のように定義する。
a=(Κ,Σ,Δ,po,F) …(1) ここで、 Κ:状態pの集合{p|p=1,2,・・,π} Σ:入力単語nの集合{n|n=1,2,…,
N} Δ:状態遷移規則{(p,q,n)}ここで、
(p,q,n)はpn→gなる状態遷移を意味
する。
pp:初期状態。以後はp=0で示す。
F:最終状態集合F⊂K 次に前記オートマトンaに従つて単語n〓Σを
連続して発声して得られる音声パタンAを A=a1,a2,…,ai,…,aI …(2) で示し、これを(未知)入力パタンと呼ぶ。各単
語n〓Σに対して標準的なパタン Bn=〓n 1,〓n 2,…〓n j,…〓n j …(3) を用意し、これを単語標準パタンと呼ぶ。この単
語標準パタンをオートマトンaに従つて接続する
ことによつて得られる連続音声標準パタンC=
Bn 1,Bn 2,…,Bnxと入力パタンAとのDPマツチ
ングを行い、2つのパタンの相互に異なる度合を
表わす量(以下相異度と称する)を算出し、最小
の相異度を与える単語系列を認識結果とする。
ここで最小の相異度を次のような動的計画の手
法で求める。初期条件 T(0,0)=0 T(i,q)=∽,i≠0,q≠0 G(p,n,j)=∽ …(4) とし、i=1よりIまで順次(5)式の境界条件を基
に(6)式の漸化式を(p,q,n)〓Δなるすべて
の対(p,n)について計算する。すなわち、対
(p,n)について境界条件 G(p,n,o)=T(i−1,p) H(p,n,o)=i−1 …(5) とし、漸化式 g(j)=d(j)+minG(p,n,j) G(p,n,j−1) G(p,n,j−2) …(6) h(j)=H(p,n,j^) …(7) ただしj^は(6)式の右辺における最小のG(p,
n,j′)を与えるj′である。
をj=1よりJnまで(n番目の標準パターンの始
端より終端まで)計算し、g(j),n(j)をそ
れぞれG(p,n,j),H(p,n,j)に格納
する。ここでd(j)は入力パターン時刻iにお
ける特徴ベクトルaiとn番目の標準パターン時刻
jにおける特徴ベクトルbj nとの間の距離であり、
例えばチエビシエフ距離 d(j)=Dis(an,〓n j)=K Σk=1 |ank−bn jk| …(8) として求めることができる。
次に単語の境界における最小化として iff T(i,q)>G(p,n,Jn)…(9) then T(i,q)=G(p,n,Jn) N(i,q)=n P(i,q)=p L(i,q)=H(p,n,Jn) を計算する。
すなわち、(6)式の漸化式では第3図に示すよう
に標準パタン軸に沿つた縦1列の計算を各対
(p,n)ついて算出し、この縦1列の計算を入
力パタン軸に沿つて移動させ、終端i=Iまで求
める。
入力パタンの認識結果は、判定処理として次の
ような手続により求められる。
q^argmin[T(I,q)] …(10) 初期条件 q=q^,i=I …(11) 認識単語 n^=N(i,q) 単語始点 l^=L(i,q) 状態遷移 p=P(i,q) …(12) もしp≠0ならばq=p^,i=l^として12を繰り
返す。p^=0ならば終了。
以上説明した方法では、第3図に示すように入
力パターンの始端および終端はあらかじめ検出し
て定められたものとしている。しかしながら始端
および終端は通常音声のパワー、スペクトル等を
用いて求められるが、SNの変化やノイズの影響
によつて検出を誤ることがよく起る。この音声検
出誤りが生じると入力パターンの語頭または語尾
に無音部が付加されたり、語頭語尾がカツトされ
たりし、誤認識の原因となつている。この音声検
出誤りの影響を少なくするため、始端および終端
を一意に定めず、第4図に示すように始端近傍か
ら終端近傍までの入力パターンと標準パターンを
マツチングさせる方法が電子通信学会論文誌Vol.
J66−D,No.11 1983年の第1318頁から第1325頁
に記載されている。しかしながら、この方法では
前記文献の第1320頁の(i)に記載されているよ
うに始端近傍の初期値をdδ×(i−1)としてお
り、本来の始端より前の区間での相異度をdδ×
(i−1)と仮定していることと等価である。こ
のdδはあらかじめある値に設定しておくが、そ
の値の決定が難しいという問題点があつた。ま
た、この方法は疑似的に始端フリーなDPマツチ
ングを行うものであり、正しい始端フリーなDP
マツチングは実現されていなかつた。
一方、始端近傍の初期値をゼロとし、DPマツ
チングの漸化式を標準パターン時間長に比例した
形とすれば、先頭の単語の標準パターンの終端で
は、始端近傍のどこの点からでも特徴ベクトル距
離を標準パターンのフレーム数の回数加算するこ
ととなり、正しくマツチングが行われる。しかし
ながら、複数の単語の連結した標準パターンとマ
ツチングを行う場合、DPマツチングの漸化式を
標準パターン時間長に比例した形を採用すると、
連結された標準パターンの総時間長が小さい方が
有利となり、正しいマツチングが行われない。例
えば連続数字を認識する場合桁数が少ない方が有
利となるため、数字の脱落によるエラーが多くな
る。
(発明が解決しようとする問題点) 始端近傍から終端近傍までの入力パターンと標
準パターンをマツチングさせる場合、従来方法で
は疑似的なマツチングであつたり、標準パターン
が短い方が有利となつたりして脱落エラーが多く
なる欠点があつた。
本発明の目的は、前記欠点を解消し、音声検出
誤りの影響の少なく、かつ認識率の高い連続音声
認識装置を提供することにある。
(問題点を解決するための手段) 本発明は、有限状態オートマトンの初期状態に
おける標準パターンと入力パターンの始端近傍部
分との間にて標準パターンの時間長に比例した相
異度を求める始端DPマツチング部と、前記始端
部DPマツチング部にて求められた相異度を仮始
端位置からの入力パターン時間長に比例した相異
度に変換する相異度変換部と、前記距離変換部に
て変換された相異度を境界条件とし有限状態オー
トマトンの初期状態を除く各状態において標準パ
ターンと入力パターンとの間にて入力パターン時
間長に比例した相異度を求める本体DPマツチン
グ部と、最終状態の終端近傍における入力パター
ン時間長にて正規化された正規化相違度の最小値
を求める終端判定部と、前記終端判定部にて求め
られた最小正規化相異度から得られたDPマツチ
ングパスに沿つて標準パターンの系列を定めるこ
とによつて認識結果を得る結果判定部とを備える
ことを特徴とする。
(作用) 本発明の作用について図面を参照しながら説明
する。第4図に示すように入力パターンの始端近
傍i=is1,…,is2から開始されるDPマツチング
は標準パターン時間長に比例した漸化式を用いて
行われる。すなわち初期条件を T(i,q)=∽ ただしq=0かつis1iis2のときは T(i,q)=0 …(13) とし、状態遷移規則Δ={(p,q,n)}がR個
あるとし、その中でp=0(初期状態)となる規
則(p,q,n)すべてについて次に示すDPマ
ツチングを行う。境界条件を g(i−1,0)=T(i−1,0) h(i−1,0)=i−1 …(14) とし漸化式 g(i,j)=d(i,j)+ming(i,
j−1) g(i−1,j−1) g(i−2,j−1) …(15) h(i,j)=hi^,j−1) …(16) ただしi^は(15)式の右辺における最小のg(i′,
j−1)を与えるi′である。
をi=1よりIまで、j=1よりJnまで求める。
ここで、p=0(初期状態)より開始されたDP
マツチングの結果g(i,Jn)は標準パターン時
間長に比例した値である。このg(i,Jn)を入
力パターン時間長に比例した値G(i)に変換す
る。すなわち、入力パターンの始端をi=isであ
ると仮定し、その点からの入力パターン時間長に
比例した値とする。
G(i)=i−is/Jn・g(i,Jn)…(17) 続いて、単語境界の最小化としてi=1よりI
まで各状態qについて if T(i,q)>G(i) then T(i,q)=G(i) N(i,q)=n P(i,q)=0 L(i,q)=h(i,Jn) …(18) を計算する。
次に、初期状態以外(p≠0)における標準パ
ターンとのDPマツチングは従来と同様に行われ
る。すなわち、(p,q,n)〓Δのp≠0であ
るすべての(p,n)について境界条件をi=1
よりIまで g(i−1,0)=T(i−1,p) h(i−1,0)=i−1 …(19) とし、漸化式 g(i,j)=d(i,j)+ming(i−
1,j) g(i−1,j−1) g(i−1,j−2) …(20) h(i,j)=h(i−1,j^) …(21) ただしj^は(20)式の右辺における最小のg(i
−1,j′)を与えるj′である。
をi=1によりIまでj=1よりJnまで求める。
続いて単語境界の最小化としてi=1よりIまで
各状態qについて if T(i,q)>g(i,Jn) then T(i,q)=g(i,Jn) N(i,q)=n P(i,q)=p L(i,q)=h(i,Jn) …(22) を計算する。
終端の判定として第4図に示すように最終状態
の終端近傍i=ie1からie2までにおける正規化相
異度の最小値を求める。すなわちq〓F(最終状
態集合)なる各qにおいて終端近傍i=ie1より
ie2まで if V>1/i・T(i,q) then V=1/i・T(i,q) Ie=i Qe=q …(23) を計算する。この結果得られたIeが終端時刻であ
り、Vが最小正規化相異度である。
最後に、最小正規化相異度が得られたDPマツ
チングパスに沿つて標準パターンの系列を定め認
識結果を得る。この処理は次のような手続により
求められる。
初期条件 q=Qe,i=Ie 認識単語 n^=N(i,q) 単語始点 l^=L(i,q) 状態遷移 p^=P(i,q) …(24) もしp^≠0ならq=p^,i=l^として(24)を繰り
返す。p^=0ならば終了する。
(実施例 1) 本発明による第1の実施例を図面を用いて説明
する。第1図は本発明の第1の実施例を示すブロ
ツク図であり、第5図、第6図はそれぞれ第1図
の実施例の一部詳細構成を示すブロツク図、第7
図は第1図における動作の時間関係を示すタイム
チヤート、第9図a〜hは第1図における動作の
流れを示すフローチヤートである。
入力パターンと標準パターンの連結パターンと
のDPマツチングを計算する方法としてレベルビ
イルデイング(Level Building)法と呼ばれる
方法があり、アイ・イー・イー・イートランザク
シヨンズオンアコーステイツクス、スピーチ、ア
ンドシグナルプロセツシイング(IEEE
TRANSACTIONS ON ACOUSTICS,
SPEECH AND SIGNAL PROCESSING)誌、
VOL ASSP−29,No.2 APRIL1981第284頁か
ら第297頁に記載されている。実施例1は、
Level Building法を基に本発明の原理である始
端終端フリーなDPマツチングが実行できるよう
に改良したものである。
標準パタンメモリ部130には単語セツトΣに
含まれる単語nの標準パタンBnが記憶されてお
り、オートマトン記憶部230には状態遷移規則
(p,q,n)と最終状態Fの指定情報が記憶さ
れている。
マイクロホン100より未知入力音声が入力さ
れると入力部110によつて周波数分析がなされ
特徴を示すベクトルaiに変換され順次入力パタン
メモリ部120に送られる。また、入力部110
には音声レベルを検知することによつて音声区間
を決定する機能が与えられており、音声区間中で
は「1」その他では「0」なる音声区間信号Sを
発生する。制御部240は、この音声区間信号S
の立上がりの時刻において初期化パルスSET1
発生する(第7図)。これによつて式(13)および
第9図aのブロツク10に対応する初期化がTメ
モリ200に対してなされる。
以上の初期化が終了すると、状態遷移規則
(p,q,n)の中でp=0(初期状態)である
(p,n,q)の対について始端DPマツチング部
310にて相異度の計算が開始される。始めに式
(14)および第9図aのブロツク11に対応する境
界条件のセツトが、制御部240よりの信号
SET2によつてDPマツチング用ワークメモリg
メモリ330とhメモリ340に対して行われ
る。続いて制御部240よりの標準パターン時刻
信号jおよび入力パターン時刻信号i1がそれぞれ
1よりJnまで、1よりIまで変化する。各(i,
j)において第9図bのブロツク12に対応する
漸化式の計算が、始端DPマツチング部310に
て行われる。すなわち、入力パターンのiフレー
ムと第n番目の標準パターンのjフレームが読み
出され、(8)式に示す特徴ベクトル間距離d(i,
j)が距離計算部300にて求められる。続いて
始端DPマツチング部310にて(15),(16)式に示
した漸化式の計算が行われる。この始端DPマツ
チング部310には特願昭56−197841の第12図
に示したDPマツチング部を用いることができる。
以上の計算が終了すると、標準パターンの終端
時刻Jnにおける相異度g(i,Jn)が得られる。
続いて、第9図cのブロツク13に対応する処理
として相異度変換部350にて相異度g(i,Jn
が入力パターン時間長に比例した値に変換され
る。すなわち式(17)に示す割算が実行され、G
(i)が得られる。
次に制御部240より発せられた信号i2に従つ
て第9図cのブロツク14に示した比較が行われ
る。すなわち、式(18)に示した単語境界の最小化
が行われる。信号i2とqに従つてテーブルメモリ
T200よりT(i,q)が読み出され、相異度
変換部350より出力されたG(i)と比較回路
170により比較し、T(i,q)>G(i)の場
合Wp信号が発せられ、G(i),n,o,h(i,
Jn)がテーブルメモリT(i,q),N(i,q),
P(i,q),L(i,q)にそれぞれ書き込まれ
る。
以上の処理によつて状態遷移規則(p,q,
n)の中でp=0(初期状態)である(p,q,
n)について計算が終了する。p≠0である
(p,q,n)について本部DPマツチング部32
0に相異度が計算される。始めに式(19)および第
9図dのブロツク15に対応する境界条件のセツ
トが、制御部240よりの信号SET2によつて
DPマツチング用ワークメモリgメモリ330と
hメモリ340に対して行われる。
続いて、制御部240よりの標準パターン時刻
信号jおよび入力パターン時刻信号i1がそれぞれ
Jnまで、1よりIまで変化する。各(i,j)に
おいて第9図eのブロツク16に対応する漸化式
の計算が本体DPマツチング部320にて行われ
る。すなわち、入力パターンのiフレームと第n
番目の標準パターンのjフレームが読み出され、
(8)式に示す特徴ベクトル間距離d(i,j)が距
離計算部300にて求められる。続いて本体DP
マツチング部320にて式(20),(21)に示した漸
化式の計算が行われる。この本体DPマツチング
部320には特願昭56−197841の第12図に示し
たDPマツチング部を用いることができる。
以上計算が終了すると、標準パターンの終端時
刻Jnにおける相異度g(i,Jn)が得られる。
次に制御部240より発せられた信号i2に従つ
て第9図fのブロツク17に示した比較が行われ
る。すなわち、式(22)に示した単語境界の最小化
が行われる。信号i2とqに従つてテーブルメモリ
T200よりT(i,q)が読み出され、相異度
変換部350より出力されたG(i)と比較回路
170により比較し、T(i,q)>G(i)の場
合Wp信号が発せられ、G(i),n,o,h(i,
Jn)がテーブルメモリT(i,q),N(i,q),
P(i,q),L(i,q)にそれぞれ書き込まれ
る。
以上の処理によつて状態遷移規則(p,q,
n)の中でp≠0なる(p,q,n)について計
算が終了する。
すべての状態遷移規則(p,q,n)について
相異度の計算が終了した誤、終端判定部400に
て終端位置が求められる。終端判定部400は第
5図に示すように構成され、式(23)および第9図
gのブロツク18に対応する計算を行う。制御部
240より与えられる信号最終状態q3と終端近傍
の時刻i3によりTテーブルメモリ200よりT
(i,q)が読み出され割算器401にて正規化
相異度1/i・T(i,q)が求められる。正規
化相異度1/i・T(i,q)とそれ以前に求め
られた最小正規化相異度Vとを比較回路403に
て比較し、V>1/i・T(i,q)なる場合に
WV信号が発せられ1/i・T(i,q),i,q
がそれぞれVレジスタ402、Ieレジスタ40
4、Qeレジスタ405に書き込まれる。q〓F
なるすべてのqの終端近傍i=ie1よりi=ie2
での処理が行われ、最小正規化相異度が得られる
終端位置Ieと状態Qeが得られる。
最後に、最小正規化相異度が得られたDPマツ
チングパスに沿つて認識結果を結果判定部220
にて求める。結果判定部220は第6図に示すよ
うに構成され、式(24)および第9図hのブロツク
19に対応する計算を行う。終端判定部400よ
り与えられる状態Qeと終端時刻Ieを初期条件とし
て判定制御部227はi=Ie,q=Qeとしてアド
レス信号i4,q4をテーブルメモリ190,21
0,180に発し、N(i,q),L(i,q),P
(i,q)を読み出す。このN(i,q)は認識結
果として出力され、L(i,q),P(i,q)は
次のi,qとなる。この処理をq^がゼロとなるま
で繰り返すことにより順次認識結果が得られる。
(実施例 2) 実施例2を図面を用いて説明する。第2図は本
発明の第2の実施例を示すブロツク図であり、第
8図は第2図における動作の時間関係を示すタイ
ムチヤート、第10図a〜fは第2図における動
作の流れを示すフローチヤートである。
入力パターンと標準パターンの連結パターンの
DPマツチングを計算する方法として、CWDP法
と呼ばれる方法があり、特願昭56−199078に記載
されている。実施例2は、CWDP法を基に本発
明の原理である始端終端フリーなDPマツチング
が実行できるよう改良したものである。
実施例2が実施例1と異なる部分について以下
に説明する。DPマツチング用ワークメモリがgi
メモリ331gi-1メモリ332、gi-2メモリ33
3、hiメモリ341、hi-1メモリ342、hi-2メモ
リ343の6種ある。相異度の計算が入力パター
ン時刻iに沿つて行われる。すなわち、始めに制
御部240よりの信号SET1により第10図aの
ブロツク10に対応する初期化がTメモリ200
に対してなされる。続いて各入力パターン時刻i
について状態遷移規則i(p,n,q)をオート
マトン記憶部230より読み出し、p=0のとき
は始端DPマツチング部310にて相異度の計算
を行い、p≠0のときは本体DPマツチング部3
20にて相異度の計算を行う。始端の相異度計算
は、始に制御部240よりの信号SET2により第
10図aのブロツク11に対応する境界条件のセ
ツトが行われる。続いて標準パターン時刻信号j
が1よりJnまで変化し、第10図bのブロツク1
2に対応する漸化式の計算が、始端DPマツチン
グ部310にて行われる。標準パターン時刻がJn
となつた時、第10図bのブロツク13に対応す
る相異度の変換が相異度変換部350にて行われ
る。続いて、第10図bのブロツク14に対応す
る単語境界の最小化が、比較回路170を用いて
行われる。最後に制御部240よりの信号SET3
により第10図dのブロツク20に対応するワー
クメモリの更新を行う。
一方、始端以外の相異度計算は、始に制御部2
40よりの信号SET2により第10図cのブロツ
ク15に対応する境界条件のセツトが行われる。
続いて標準パターン時刻信号jが1よりJnまで変
化し、第10図cのブロツク16に対応する漸化
式の計算が本体DPマツチング部320にて行わ
れる。標準パターン時刻がJnとなつた時、第10
図Cのブロツク17に対応する単語境界が最小化
が、比較回路170を用いて行われる。最後に制
御部240よりの信号SET3により第10図dの
ブロツク21に対応するワークメモリの更新を行
う。
以上の処理をすべての状態遷移規則rについて
求め、さらに入力パターン時刻iを1からIまで
求める。終端判定および認識結果の判定は実施例
1と同様の処理にて求められる(第10図e及び
f)。
以上、本発明を実施例に基づいて説明したが、
これらの記載は本発明の権利範囲を限定するもの
ではない。実施例2では特願昭56−199098に記載
しているようなCWDP法を基にしているが、
CWDP法と同一の結果が得られ、データの転送
量が少なくなる方法にも本発明の原理である始端
終端フリーなDPマツチングを適用することがで
きる。すなわち特願昭58−239303に記載されてい
るブロツクワイズDP法、特願昭59−67116に記載
されている修正DPマツチング計算部をもつブロ
ツクワイズDP法、特願昭59−68015に記載されて
いるブロツクを標準パターン軸に対して斜めに傾
けた斜めブロツクワイズDP法、特願昭59−
267830に記載されている標準パターン長によつて
ブロツク巾を変化させる可変斜めブロツクワイズ
DP法などにも本発明の原理である始端終端フリ
ーがDPマツチングを適用できることは明白であ
る。また、前記のCWDP法と同一の結果が得ら
れるオートマトン制御2段DP法が特願昭54−
104669に記載されており、この方法にも本発明の
原理を適用できる。
(発明の効果) 本発明の連続音声認識装置では、始端近傍では
標準パターン時間長に比例した相異度を計算し、
前記相異度を入力パターン時間長に比例した値に
変換し、それ以降の相異度は入力パターン時間長
に比例した値として求めることにより、始端終端
フリーなDPマツチングを実現している。これに
より音声検出誤りの影響を減少させ、誤認識率を
小さくすることができる。
【図面の簡単な説明】
第1図、第2図は本発明の連続音声認識装置の
第1および第2の実施例を示すブロツク図、第3
図は従来技術を説明するための図、第4図は本発
明の作用を説明するための図、第5図、第6図は
第1図の実施例の一部詳細構成を示す部分ブロツ
ク図、第7図、第8図は第1図、第2図それぞれ
における動作の時間関係を示すタイムチヤート、
第9図a〜h、第10図a〜fは第1図、第2図
それぞれにおける動作の流れを示すフローチヤー
トである。

Claims (1)

    【特許請求の範囲】
  1. 1 連続して発声された音声を有限状態オートマ
    トンにより指定される標準パターンの連結パター
    ンとDPマツチングを行い、最小の相異度が得ら
    れる標準パターンの系列を求めることにより認識
    する連続音声認識装置において、有限状態オート
    マトンの初期状態における標準パターンと入力パ
    ターンの始端近傍部分との間にて標準パターンの
    時間長に比例した相異度を求める始端DPマツチ
    ング部と、前記始端部DPマツチング部にて求め
    られた相異度を仮始端位置からの入力パターン時
    間長に比例した相異度に変換する相異度変換部
    と、前記距離変換部にて変換された相異度を境界
    条件とし有限状態オートマトンの初期状態を除く
    各状態において標準パターンと入力パターンとの
    間にて入力パターン時間長に比例した相異度を求
    める本体DPマツチング部と、最終状態の終端近
    傍における入力パターン時間長にて正規化された
    正規化相異度の最小値を求める終端判定部と、前
    記終端判定部にて求められた最小正規化相異度が
    得られたDPマツチングパスに沿つて標準パター
    ンの系列を定めることによつて認識結果を得る結
    果判定部とを持つことを特徴とする連続音声認識
    装置。
JP61031179A 1986-02-14 1986-02-14 連続音声認識装置 Granted JPS62187897A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP61031179A JPS62187897A (ja) 1986-02-14 1986-02-14 連続音声認識装置
US07/015,458 US4794645A (en) 1986-02-14 1987-02-17 Continuous speech recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61031179A JPS62187897A (ja) 1986-02-14 1986-02-14 連続音声認識装置

Publications (2)

Publication Number Publication Date
JPS62187897A JPS62187897A (ja) 1987-08-17
JPH0575117B2 true JPH0575117B2 (ja) 1993-10-19

Family

ID=12324218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61031179A Granted JPS62187897A (ja) 1986-02-14 1986-02-14 連続音声認識装置

Country Status (2)

Country Link
US (1) US4794645A (ja)
JP (1) JPS62187897A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5228110A (en) * 1989-09-15 1993-07-13 U.S. Philips Corporation Method for recognizing N different word strings in a speech signal
JPH04182700A (ja) * 1990-11-19 1992-06-30 Nec Corp 音声認識装置
JP3077944B2 (ja) * 1990-11-28 2000-08-21 シャープ株式会社 信号再生装置
US5222190A (en) * 1991-06-11 1993-06-22 Texas Instruments Incorporated Apparatus and method for identifying a speech pattern
JP3576272B2 (ja) * 1995-06-22 2004-10-13 シャープ株式会社 音声認識装置および方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5876893A (ja) * 1981-10-30 1983-05-10 日本電気株式会社 音声認識装置
JPS58132298A (ja) * 1982-02-01 1983-08-06 日本電気株式会社 窓制限付パタンマツチング装置
US4677678A (en) * 1984-07-10 1987-06-30 The United States Of America As Represented By The Department Of Health And Human Services Active hearing protectors

Also Published As

Publication number Publication date
US4794645A (en) 1988-12-27
JPS62187897A (ja) 1987-08-17

Similar Documents

Publication Publication Date Title
JPH0159600B2 (ja)
EP0378212B1 (en) Continuous speech recognition apparatus
JPH029359B2 (ja)
JPH0575117B2 (ja)
JPH0247760B2 (ja)
JPH03120598A (ja) 音声認識方法及び装置
JPS61145599A (ja) 連続音声認識装置
JPH08123469A (ja) 句境界確率計算装置および句境界確率利用連続音声認識装置
JP2997007B2 (ja) 音声パターンマッチング方法
JPS6147999A (ja) 音声認識装置
JPH0211919B2 (ja)
JPH0436400B2 (ja)
JPS6313099A (ja) 連続音声認識装置
JPH0355836B2 (ja)
JPH0449954B2 (ja)
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
JPH0336436B2 (ja)
JPS62111295A (ja) 音声認識装置
JPH0346840B2 (ja)
JPS58179900A (ja) 音声認識装置における音声特徴パタ−ン作成装置
JPH022159B2 (ja)
JPH0320759B2 (ja)
JPH01321498A (ja) 音声認識装置
JPS63236094A (ja) 音声認識方法
JPH02118696A (ja) 音声標準パタン登録方式