JPS62144199A - 連続音声認識装置 - Google Patents

連続音声認識装置

Info

Publication number
JPS62144199A
JPS62144199A JP60283043A JP28304385A JPS62144199A JP S62144199 A JPS62144199 A JP S62144199A JP 60283043 A JP60283043 A JP 60283043A JP 28304385 A JP28304385 A JP 28304385A JP S62144199 A JPS62144199 A JP S62144199A
Authority
JP
Japan
Prior art keywords
matching
continuous
frame
input pattern
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60283043A
Other languages
English (en)
Inventor
桜庭 孝宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60283043A priority Critical patent/JPS62144199A/ja
Publication of JPS62144199A publication Critical patent/JPS62144199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 連続音声認識装置において、音声の入力パターンを標準
パターンと連続DP照合を行い、得られた照合距離の極
小値のフレームから終端(又は始端)候補を求め、その
候補の位置するフレームから始端(又は終端)方向への
DP照合を行って部分区間照合距離を求め、この部分区
間照合距離の合計が最小となる様にDP処理を行って認
識結果を求める。
〔産業上の利用分野〕
本発明は、複数の単語を連続的に発声した音声を認識す
る連続音声認識装置、特に動的計画法(Dynamic
 programming 、以下DPという)により
行う連続音声の認識を効率良く行う様に改良した連続音
声認識装置に関する。
〔従来の技術〕
音声単語は同じ単語を同じ様に発声しても、その音声パ
ターンは変化し、特に時間軸方向に伸縮する為、その音
声認識を困難にしている。更に複数の単語が連続して発
声される連続音声の場合は、これに加えて各単語の区切
り目が不明瞭である為、一層その音声認識を困難にして
いる。
この様な連続音声を高い認識率をもって効率良く認識す
る方法として、2段DP照合方式による連続音声認識処
理が用いられている(例えば、[日経エレクトロニクス
J 11.7.1983年pp、171〜207参照)
この2段DP照合による連続音声認識方式は高い認識率
が得られるが、一般に演算量が極めて多い為に認識処理
に長時間を要するという欠点があった。
そこで、2段DP照合による連続音声認識処理における
演算量を減らして処理時間を大幅に短縮させ、効率良く
連続音声認識を行うことが出来る様に改良した連続音声
認識装置が同一出願人によって提案されている(例えば
、特願昭59−227087)又は特願昭59−227
089参照)。
第6図は、前記先願発明(特願昭59−227089)
基本構成をブロック図で示したものである。
第6図において、連続DP照合部220は、人力された
音声の入力パターンを標準パターン辞書部210に格納
されている複数の標準パターンについて始端をフリー状
態とする連続DP照合を実行してその連iDP照合距離
を出力する。
端部候補選択処理部230は、連続DP照合部220よ
り入力された連続DP照合距離を所定闇値(DRTH)
と比較して候補となる標準パターンを限定し、更にこの
限定された標準パターンから入力パターンの各フレーム
毎にそのフレームう終端(又は始端)とする複数個の標
準パターンを候補として選択して出力する。
単語始終端レベルDP処理部240は、逆時間(又は順
時間)DP照合を行うことにより、前記選択された候補
の始端(又は終端)を決定してその終始端のDP距離(
部分区間照合距離)を求め、更に、この部分区間照合距
離に基づいて部分区間候補を選択して出力する。この候
補の始端(又は始端)へのDP距離を求める処理は、単
語始終端レベルDPと呼ばれる。
文レベルDP処理部250は、入力された部分区間候補
の部分区間照合距離から入力パターンの各桁毎の部分区
間照合距離の合計が最小となる組合せをDP照合により
求め、その結果から入力パターンが何桁入力であるかを
判別して認識結果を求める。
以上の様に、始端をフリー状態とする連続DP照合を行
うことにより区間別候補を求める演算量が大幅に減少し
、更に連続DP照合の結果から終端(又は始端)候補の
フレームを限定しているので、従来の2段DP照合によ
る連続音声認識方式よりも、大幅に認識処理時間を短縮
して効率良く連続音声の認識を行うことが出来る。
なお、前記先願発明については、後記「3、発明の詳細
な説明」中において本願発明に関する詳細な説明と関連
して更に詳しく説明する。
〔発明が解決しようとする問題点〕
前述の先願発明では、入力パターンと複数の標準パター
ンとを連続照合を行い、その結果与えられる入力パター
ンの各フレーム毎を終端(又は始端)とする標準パター
ン毎のDP距離から各フレーム毎の終端(又は始端)候
補を選択していた。
従って、入力パターンの全フレームに終端(又は始端)
候補が存在することになるので、以降の単語始終端レベ
ルDPをそれら全部の候補について行わなければならな
かった。この為、それだけ演算量が多く、認識処理時間
の短縮化が妨げられて早いレスポンスタイムが得られな
いという問題があった。
本発明は、連続DP照合の結果から終端(又は始点)候
補の存在するフレームを限定し、この限定された候補に
ついて以降の単語始終端レベルDPを行うことにより先
願発明より演算量を大幅に減少し、早いレスポンスタイ
ムをもって極めて効率良く連続音声の認識を行うことが
出来る連続音声認識装置を提供することを目的とする。
〔問題点を解決するための手段〕
前記先願発明における前述の問題点を解決する為に本発
明が講じた手段を、第1図を参照して説明する。
第1図は、本発明の構成をブロック図で示したものであ
る。
第1図において、110は標準パターン辞書部で、複数
の音声単語の標準パターンが格納されている。
120は連3iDP照合部で、連続音声の人カバターン
を標準パターン辞書部110に格納されている複数の標
準パターンについて連続動的計画法による照合(連iD
p照合)を実行する。
130は端部候補限定選択処理部で、連続DP照合部1
20の照合結果から極小値の存在するフレームを選択し
、入力パターンのそのフレーム毎にそのフレームを終端
(又は始端)とする複数個の標準パターンを終端(又は
始端)候補として選択する。
140は単語始終端レベルDP処理部で、前記選択され
た候補が位置するフレームから始端(又は終端)方向へ
の動的計画法による照合(DP照合)を行って部分区間
の照合距離を求める。
150は文レベルDP処理部で、単語始終端レベルDP
処理部140より入力された部分区間照合距離に基づい
て入力パターンの各桁毎に部分区間照合距離の合計が最
小となる組合せを動的計画法による照合(DP照合)に
より求め、その結果から入力パターンが何桁入力である
かを判別して認識結果を求める。
なお、標準パターン辞書部110、連続DP照合部12
0、単語始終端レベルDP処理部140及び文レベルD
P処理部150の各構成は、前述の先願発明の対応する
各構成210,220,240及び250と同じである
〔作 用〕
第1図の作用を、第2図及び第3図を参照して説明する
第2図は連続動的計画法による照合法(連続DP照合法
)の説明図、第3図は逆時間動的計画法による照合法(
逆時間DP照合法)の説明図である。
連続DP照合部120は、連続音声の入力パターンを標
準パターン辞書部110に格納されている複数の標準パ
ターンについて連MDP照合を実行する。
連続DP照合法は、第2図(A)に示す様に、入力パタ
ーンと標準パターンを横軸と縦軸にとり、入力パターン
の任意のフレームを終端(又は始端)とし且つ始端(又
は終端)はフリーとなるDP照合を行う方法である。こ
の連MDP照合を行うことにより、入力パターンの各フ
レーム毎にそのフレームを終端(又は始端)とした最適
卒照合経路(第2図(A)の太線)が抽出されて、その
連続DP照合距離が求められる。
第2図(B)は、この様にして求められた入力フレーム
と連続DP照合距離の関係を示したものである。横軸は
入力フレームを示し、縦軸は時間正規化された連続DP
照合距離(DR)を示している。又、DRTHは閾値で
、これよりDR値の少いフレームは、その標準パターン
の終端フレームと合致している可能性の高いものである
前述の先願発明はこの様な闇値DRT)tを設け、この
DRTH以下のフレーム、即ちE。−E 、、及び1F
bs〜F’ba内に存在する全てのフレームを終端候補
選択の候補として単語始終端レベルDPを行うものであ
った。その為、単語始終端レベルDPの演xtが多く、
早いレスポンスタイムが得られなかった。
然しなから、その後の実験によれば、第2図(B)のD
R値特性の極小点Fat〜F□4及びFbl〜F、3.
について単語始終端レベルDPを行えば、前述の先願発
明より大幅に少い演算量で先願発明の様にF ax”’
 F me及びF bi−F be内に存在する全ての
フレームについて単語始終端レベルDPを行った場合と
同様な結果が得られることが明らかになった。
本発明は、この新規に知見に基づいて、終端(又は始端
)候補の存在するフレームを限定し、以後の単語始終端
レベルDPの演算量を大幅に減少させる様にしたもので
ある。
即ち、端部候補限定選択部130は、連続DP照合部1
20の照合結果である連続DP照合距離から、その極小
値の存在するフレームを選択し、入力パターンのそのフ
レーム毎にそのフレームを終端(又は始端)とする複数
個の標準パターンを終端(又は始端)候補として選択す
る。
単語始終端レベルDP処理部140は、前記選択された
候補について、その候補が位置するフレームから始端(
又は終端)方向への動的計画法てによる照合(DP照合
)を行って部分区間の照合距離を求める。
第3図は、終端候補がその位置するフレームから始端方
向へのDP照合を示したものである。その照合方法は通
常の順時間方向のDP照合を単にパターンを時間方向に
反転して照合することによって行われ、逆時間DP照合
と呼ばれる。
文レベルDP処理部150は、単語始終端レベルDP処
理部140より入力された部分区間照合距離から入力パ
ターンの各桁毎に部分区間照合距離の合計が最小となる
組合せをDP照合により求め、その結果から入力パター
ンが何桁入力であるかを判別して認識結果を求める。
なお、連′ftDP照合部120、単語始終端レベルD
P処理部140及び文しヘルDP処理部150の各処理
動作は、前述の先願発明の対応する各構成220.24
0及び250と同じである。
以上の様に、終端(又は始端)候補の存在するフレーム
を大幅に限定する様にしたので、従来の2段DP照合に
よる連続音声認識方式よりはもちろんのこと、前述の先
願発明よりも始終端レベルDP照合を行う量が大幅に減
少して、早いレスポンスタイムをもって極めて効率良く
連続音声認識を行うことが出来る。
〔実施例〕
本発明の一実施例を、第2図〜第5図を参照シて説明す
る。
第4図は本発明の一実施例の構成の説明図、第5図は同
実施例の終端候補選択部の動作説明図である。第2図及
び第3図については、既に説明した通りである。
第4図に示す本発明の一実施例は、第1図の連続DP照
合部120において順時間方向に連続DP照合を行い(
単語終端レベルDP)、単語始終端レベルDP処理部1
40において逆時間DP照合を行う場合の実施例を示し
たものである。
(A)実施例の構成 第4図において、標準パターン辞書部110、連続DP
照合部120、端部候補限定選択部130、単語始終端
レベルDP処理部140及び文レベルDP処理部150
については、第1図で説明した通りである。
端部候補限定選択部130において、131は終端候補
フレーム限定部で、連続DP照合部120から入力され
た連続DP照合距離を正規化し、その値が極小値となる
フレームを選択することにより終端フレーム候補を限定
する。132は終端候補選択部で、限定された終端フレ
ーム候補中からその正規化された連Vt D P照合距
離の最小のものから特定個数を終端候補として選択する
単語始終端レベルDP処理部140において、141は
逆時間DP照合部で、選択された終端候補を逆時間方向
にDP照合することにより始端を決定してその始終端の
DP照合距離を求める。142は部分区間候補選択部で
、始終端DP照合距離を正規化し、その値に基づいて部
分機関候補を選択する。
文レベルDP処理部150において、151は文しヘル
DP照合部で、単語始終端レベルDP処理部140より
入力された部分区間候補の部分区間照合距離に基づいて
、最適な単語の結合をDP照合により求める。152は
認識結果処理部で、文レベルDP照合部151の結果に
基づいて入力パターンが何桁入力であるかを判別して認
識結果を求める。
160はマイクロホン、170は入力された連続音声の
特徴を抽出して音声の入力パターンに変換する音声特徴
抽出部、180はこの音声の入力パターンが格納される
入力パターンバッファである。
(B)実施例の動作 使用者は、マイクロホン160から連続単語からなる連
続音声を入力し、音声特徴抽出部170において特徴抽
出を行って照合用の音声の入力パターンに変換し、入力
パターンバッファ180に格納する。
連続DP照合部120は、入力パターンバッファ180
から読み出された入力パターンを標準パターン辞書部1
10に格納しである複数の標乍パターンと照合する。
このときの音声の人カバターンAを次の様に表わす。
A=a(1)、a(21,a(3m ・a(ml −a
(r)ここで、a (mlはフレームmにおけるパラメ
ータで、例えば周波数方向を16チヤンネルに区分して
各区分におけるパワースペクトル値で表われ、一般にベ
クトル量である。最後の■は入力パターンの終端フレー
ムで、且つ入力パターンへの語長を意味する。
なお、フレームは音声区間(正しくは窓関数によって切
り出した音声区間)のことであり、例えば単語の各文字
が明瞭に発音された場合の各文字区間は、それぞれ音声
区間を形成する。
同様に、標準パターン辞書部110に格納されている標
準パターンは、単語nの標準パターンをB (n)とし
て、次の様に表わす。
B(nl= b (1,nLb(2,n) + Hb(
j、n) + Hb(J(nLn)ここで、b(Ln)
は、単語nのフレームjにおけるパラメータで、入力音
声と同様に例えば16チヤンネルのパワースペクトル値
で表わされるベクトル量である。J (n)は単語nの
終端フレームで、且つ標準パターンB (n)の語長を
表わす。
(B−1)連続DP照合部120の動作(単語終端レベ
ルDP) 人カバターンAと標準パターンB (nlとの連VtD
P照合により、入力パターンAの各フレーム毎にそのフ
レームを終端とした最適な照合距離が抽出されて連続D
P照合距離が求まる。この結果より入力パターンA中に
標準パターンB(0)が存在しそうか、そして、存在し
そうな場合に入力パターンAのどのフレームを終端とす
るかが容易に求められる。
入力パターンのmフレームを終端とする標準パターンB
 (nlの連続DP照合距離をDC(m、n)で表現す
ることにする。連続DP照合部120からは、このD 
C(m、n)が出力される。
以上の連続DP照合部120において行われた処理は、
単語終端レベルDPと呼ばれている。
(B−2)終端候補フレーム限定部131の動作連続D
P照合距離Dc (m + n)は、このままでは単語
nの標準パターンB (n)の個々の語長J (nlに
よって短いもの程その値が小さくなる傾向が出る為、入
力パターンA及び標準パターンB (n)の各パターン
長の和で各DC(m、n)の値を割って時間正規化を行
う。正規化された連続DP照合距離DC(m、n)をD
 R(ml n)とすると、D R(m、n)は下式で
表わされる。
D R(m、n)  = D C(m、n) / 2 
J (nlここで、2 J fn+を用いる理由は、入
力パターンAが標準パターンB (n)と正しくマンチ
ングした場合には、対応する入力パターン長はJ (n
lに近い値をとると想定されるからである。もし、何ら
かの手法で連続DP照合距離Dc (ml n)のmに
対する始端L(m、n)が判明している場合には、DR
(m、n)は次式で求められる。
DR(m、n)  −DC(m、n) /(J(n)+
 (m−L(m、n)  + 1) )第2図(A)は
連続DP照合経路を示したものであり、第2図(B)は
各連続DP照合経路における正規化連MDP照合距離D
Rを示したものである。
このD R(m、n)は、第2図(A)の太線で示す様
に標準パターンB(ロ)(せんだい)とうまく照合する
様な経路を通ったフレーム(入力パターンの各「ぜんだ
い」の部分)では、第2図CB)の示す様に値が小さく
、そうでないフレームでは大きい値をとる。
従って、このD R(m、n)の特性からその標準パタ
ーンの終端フレームを他の標準パターンのDR値と比較
すること無しに限定することが出来る。
先ず、第2図(B)に示す様に、正規化連続DP照合距
離DRに成る闇値DRTHを設け、このDRTHより小
さければ、そのフレームはその標準パターンの終端フレ
ームと合致している可能性が高いとする。DRTHより
大きいものは標準パターンの終端フレームと合致する可
能性が低いとして以降の終端候補選択の候補には含めな
い様にする。
前述の先願発明は、DRTH以下のフレーム、即ちF 
as〜F aa及びF be”” F be内に存在す
る全てのフレームを終端候補選択の候補とするものであ
り、その為、単語始終端レベルDPの演算量が多くなっ
て早いレスポンスタイムが得られなかった。
この実施例では、この問題点を解決する為にDRTHよ
り小さい区間の極小値の存在するフレームを、その標準
パターンの終端フレームの可能性と合致する可能性が高
いとし、そうでなければ終端フレームの可能性が低いと
して、以降の終端候補選択の候補に含めない様にする。
これにより、以降の単語始終端レベルDPの演算量を大
幅に減少させることが出来る。
この限定されたD R(m、n)をD S (m、n)
  とし、DRTHより小さく且つ極小値を取るフレー
ム以外は最大値を設定して区別出来る様にする。
(B−3)終端候補選択部132の動作終端候補選択部
132は、このD S (m、n)をmフレーム毎に0
個の終端候補を選択する。もしそのフレームに終端候補
が0個以下しかない場合には、全部を採用する。このC
の値が小さいと演算精度が低下し、大きいと演算量が多
くなるので、両者を考慮して選定される。もちろん、候
補が無い場合には、そのフレームには終端候補がないも
のとする。
以上に様にして選択された終端候補の単語nをN E 
(m + c)に設定する。終端候補が無い場合は、“
0”を設定する。
第5図は、DRTH以下の連続するフレーム内での極小
値のフレームを終端候補とした場合のDS(m、n)と
N E (m、c)の例を示したものである。
D S (m + n )はn毎に異なった距離特性を
示し、このNflMlのD S (m、n)をmフレー
ム毎に値の小さいものから最大0個(第5図の例では2
個)選択して、そのnをmフレームを終端とする候補と
して、NE(m、c)に設定する。また、入力パターン
の終端フレームには性質上必ず候補が存在する筈である
ので、その終端フレームに必ず候補が残る様にする。
(B−4)逆時間DP照合部141の動作逆時間DP照
合部141は、NE(m、c)に示される終端候補を、
第3図に示す様に逆時間方向にDP照合することにより
始端を決定してその始終端即ち部分区間のDP照合距離
を求める。この処理は逆時間DP照合と呼ばれる。
逆時間DP照合は、通常の順時間方向のDP照合を単に
パターンを時間方向に反転して照合する様にしたもので
、これにより、入力パターンAの部分区間(1−m)の
DP照合距離D I (1,m、c)が求められる。
(B−5)部分区間候補選択部142の動作部分区間候
補選択部142は、逆時間DP照合部141で求められ
たD I (1,m、c)を部分パターン長(m−1+
1)  と標準パターン長J (NE(m、c))の和
で割って時間正規化する。この時間正規化された部分区
間のDP照合距離をD I R(’1 + m + c
)とすると、次式で求められる。
D I R(Lm、c) −D I (Lm、c) / (J (N E (m、
c)+(m−1+1))次に部分区間候補選択部142
は、このDIR(t + ml c)をCについて最小
のもので選択してD(1、m)とし、対応する標準パタ
ーンnをNS(+、m)に設定する。もし終端候補が無
いmの場合は、NS(Lm)に“0″を設定し、D(L
m)に最大値を設定しておく。即ち、 D(1,m) =mtn [D I R(1,m、c)
 ]NS(1,m) =NE [m、arg min 
(D I R(1,m、c) )コで表わされる。
ここで、“arg min ”は、()内の最小化条件
を満足するCを選定する機能をもったオベレー ゛りで
ある。
このD(Lm)とN S (1,m)によって入力パタ
ーンの部分パターン(1−m)の最適な照合距離(D(
1、m))と照合相手(N S (1,m) )が決定
されることになる。
(B76)文しベルDP照合部151の動作文レベルD
P照合部151は、単語始終端レベルDP処理部140
より入力されたD(Lm)とNS(Lm)を用いて、最
適な単語の結合をDP照合により求める。
ここで、連続単語中の各単語を先頭がら1折目、2折目
・・・X桁目という表現で位置関係を表現することにす
る。
(イ)1折目の設定 1折目は、入力パターンの始端フレームからmフレーム
の部分区間の距離をT (m、 l)に設定する。
即ち、 T (m、1)  = D (Lm) 又、その標準語の始端がどこにあるがを、LT(m、 
1)に設定する。即ち、 LT(m、l) =1 ここで、部分区間候補が存在しないD(Lm)について
は処理は行わず、N T (m、 1)に“0”を、T
 (m、 1)に最大値を設定しておく。
(ロ)X桁目の設定 X桁目では、lの位置が未定の為、次のDP漸化式で決
定する。即ち、 この場合もD(1,m)とmについて部分区間候補が存
在しない場合は処理しないで、N T (m + X)
に“0″を、T (m + x )に最大値を、またL
T(m、x)には(不定値で良いが)“1”を設定して
おく。
(13−7)認識結果処理部152の動作認識結果処理
部152は、文しベルDP照合部151により送られた
T(m、x)  、NT(m、x)及びLT(m、x)
中のT(m、x)から、先ず入力単語の桁数Xを、次式
から求める。
X =arg min [T(T、x)/x ]ここで
、■は入力パターンの終端フレームである。
次に、認識結果処理部152は、X桁の認識結果をL 
T (m、 x)とN T (m、 x)がら次の(伺
及び(ロ)によって求める。ここで、X桁の認識結果を
N R(X)とし、又N R(X)の始端フレームをL
 (Xlとする。
(イ)X桁目の認識結果 NR(X)=NT(LX) L(χ) =LT(I、X) (ロ)x−7折目の認識結果 NR(X−y)   =NT  [L(X−y+1)、
X−y  コL(X−1)   =LT  [L(X−
y+1)、X−y  E以上の様にして、認識結果N 
R(X)が求められる。
なお、本実施例では順時間方向に連続DP照合を行う単
語終端レベルDPにより終端候補を求めているが、本発
明はこの実施例に限定されるものでなく、逆時間方向に
連続DP照合を行って始端候補を求め(単語始端レベル
DP)、単語始終端レベルDPで順時間のDPにより、
部分区間候補を求める場合も含むものである。
〔発明の効果〕
以上説明した様に、本発明は終端(又は始端)候補の存
在するフレームを大幅に限定する様にしたので、従来の
2段DP照合法による連続音声認識方式よりはもちろん
のこと、前述の先願発明よりも始終端レベルDP照合を
行う量を大幅に減少して、早いレスポンスタイムをもっ
て極めて効率良く連続音声認識を行うことが出来る。
【図面の簡単な説明】
第1図・・本発明の構成のブロック説明図、第2図・・
連続動的計画法による照合法(連続DP照合法)の説明
図、 第3図・・逆時間動的計画法による照合法(逆時間DP
照合法)の説明図、 第4図・・本発明の一実施例の構成の説明図、第5図・
・同実施例の終端候補選択部の動作説明図、 第6図・・先願発明の基本構成のブロック説明図。 第1図及び第4図において、 110・・・標準パターン辞書部、120・・・連続D
P照合部、130・・・端部候補限定選択部、140・
・・単語始終端レベルDP処理部、150・・・文しベ
ルDP処理部。

Claims (1)

  1. 【特許請求の範囲】 複数の単語が連続的に発声された音声を音声特徴抽出部
    において入力パターンに変換し、該入力パターンを複数
    の標準パターンと照合して区間別候補を選択し、各区間
    の照合距離が最小となるものを求めて認識を得る連続音
    声認識装置において、(a)入力パターンを複数の標準
    パターンについて連続動的計画法による照合を行う連続
    DP照合部(120)と、 (b)連続DP照合部120の照合結果から極小値の存
    在するフレームを選択し、入力パターンのそのフレーム
    毎にそのフレームを終端(又は始端)とする複数個の標
    準パターンを終端(又は始端)候補として選択する端部
    候補限定選択部(130)と、 (c)前記選択された候補が位置するフレームから始端
    (又は終端)方向への動的計画法による照合を行って部
    分区間の照合距離を求める単語始終端レベルDP処理部
    (140)と、 (d)単語始終端レベルDP処理部140より入力され
    た部分区間照合距離に基づいて入力パターンの各桁毎に
    部分区間照合距離の合計が最小となる組合せを動的計画
    法による照合により求め、その結果から入力パターンが
    何桁入力であるかを判別して認識結果を求める文レベル
    DP処理部(150)、 を備えたことを特徴とする連続音声認識装置。
JP60283043A 1985-12-18 1985-12-18 連続音声認識装置 Pending JPS62144199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60283043A JPS62144199A (ja) 1985-12-18 1985-12-18 連続音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60283043A JPS62144199A (ja) 1985-12-18 1985-12-18 連続音声認識装置

Publications (1)

Publication Number Publication Date
JPS62144199A true JPS62144199A (ja) 1987-06-27

Family

ID=17660470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60283043A Pending JPS62144199A (ja) 1985-12-18 1985-12-18 連続音声認識装置

Country Status (1)

Country Link
JP (1) JPS62144199A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0530935U (ja) * 1991-07-26 1993-04-23 尚己 石田 小型情報機器の打鍵補助具

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0530935U (ja) * 1991-07-26 1993-04-23 尚己 石田 小型情報機器の打鍵補助具

Similar Documents

Publication Publication Date Title
WO2020258661A1 (zh) 基于循环神经网络和声学特征的说话人分离方法及装置
JPS61252594A (ja) 音声パタ−ン照合方式
WO2021098318A1 (zh) 应答方法、终端及存储介质
JP2024508196A (ja) 拡張された自己注意によってコンテキストを取り込むための人工知能システム
JPS6360919B2 (ja)
US5974381A (en) Method and system for efficiently avoiding partial matching in voice recognition
JPS62144199A (ja) 連続音声認識装置
US4790017A (en) Speech processing feature generation arrangement
US11587554B2 (en) Control apparatus, voice interaction apparatus, voice recognition server, and program
US7231352B2 (en) Method for computer-supported speech recognition, speech recognition system and control device for controlling a technical system and telecommunications device
JP2921059B2 (ja) 連続音声認識装置
Silaghi et al. A new evaluation criteria for keyword spotting techniques and a new algorithm.
JPH0336436B2 (ja)
JPS58159598A (ja) 単音節音声認識方式
JP3100208B2 (ja) 音声認識装置
JP3144203B2 (ja) ベクトル量子化装置
JP2665543B2 (ja) 音声認識装置
JPS61105600A (ja) 連続音声認識装置
JPH10111697A (ja) 音声反応装置と音声認識装置
JPS6131878B2 (ja)
JPS58159600A (ja) 単音節音声認識方式
JPS61105599A (ja) 連続音声認識装置
JP3473704B2 (ja) 音声認識装置
JPH0336437B2 (ja)
JPH0336438B2 (ja)