JPH0296800A - 連続音声認識装置 - Google Patents

連続音声認識装置

Info

Publication number
JPH0296800A
JPH0296800A JP63250555A JP25055588A JPH0296800A JP H0296800 A JPH0296800 A JP H0296800A JP 63250555 A JP63250555 A JP 63250555A JP 25055588 A JP25055588 A JP 25055588A JP H0296800 A JPH0296800 A JP H0296800A
Authority
JP
Japan
Prior art keywords
cumulative value
similarity
matching path
probability
cumulative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63250555A
Other languages
English (en)
Inventor
Kazunaga Yoshida
吉田 和永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63250555A priority Critical patent/JPH0296800A/ja
Priority to CA002000033A priority patent/CA2000033C/en
Priority to DE68928522T priority patent/DE68928522T2/de
Priority to EP89118306A priority patent/EP0362785B1/en
Priority to US07/416,560 priority patent/US5029212A/en
Publication of JPH0296800A publication Critical patent/JPH0296800A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、単語等を連続的に発声した連続音声を認識す
る連続音声認識装置の改良に関するものである。
(従来の技術) 従来、音声を認識する方法として、例えば(社)′iJ
L子情報通信学会編、中耕を一著「確率モデルによる音
声認識1(以下文献1と称す)の第29頁に述べられて
いるような[隠れマルコフモデル1(以下HMMと呼ぶ
)を用いた方法があった。この方法では、まず、音声パ
ターンの生成過程をマルコフ過程により状態遷移モデル
としてモデル化する。この状態遷移モデルがHMMであ
る。観測された音声パターンが、このHMMにより生成
される確率を求めることにより音声を認識する。
この方法を用いて単語を認識する場合を考える。まず、
認識対象となる単語毎にHMMを作成しておく。この作
成方法については文献1に詳しく述べられている。音声
パターンが人力されると、各HMMに対する生成確率が
計算され、最も高い確率を与えるHMMに対する単語が
認識結果となる。この生成確率は、音声パターンと各H
MMの間の類似度と考えることもでき、その場合、HM
Mは標準パターンと等価になる。HMMに対する生成確
率は、例えば文献1の第40頁に述べられているような
前向きバスアルゴリズムにより求めることができる。
また、このHMMを用いて単語を連続的に発声した連続
音声を認識することも可能である。以下、連続音声認識
の例として単語を単位とした場合について述べるが、文
献1の第90頁以降に述べられているように、音素等の
さまざまな認識単位を用いる場合も同様に扱うことがで
きる。単語を単位とした連続音声の認識は、文献1の第
46頁に述べられているようにビタビアルゴリズムを用
いることにより実現できる。
(発明が解決しようとする問題点) 連続音声認識に用いるビタビアルゴリズムでは、単語生
成確率を、最大確率を与えるマッチングパス(2つのパ
ターンの時刻点の対応付は軌跡)上の確率の積より求め
るという近似的な方法となっている。このため、すべて
のマッチングパス上の確率より生成確率を求める前向き
バスアルゴリズムと比較して′、一般に認識率が悪くな
るという欠点を有する。
一方、前向きバスアルゴリズムではマッチングパスを一
意に決定できない。そのため、連続音声認識を行う場合
、単語列の組合せを総当たりで求めない限り認識結果を
求めることができないという欠点があった。
また、単語間の確率計算はビタビアルゴリズムに基づい
て行い、単語内は前向きバスアルゴリズムを用いる方法
は、単語内のマッチングパスを求められなくても文献1
の第46頁に述べられているような2段DPマツチング
を用いることにより実現できる。しかし、2段DPマツ
チング法はフレーム同期処理ができないため、計算量が
大幅に増加するという欠点があった。
本発明は、認識性能が高い前向きバスアルゴリズムを基
本として、単語内でマッチングパスを求められるように
することにより、計算量が少なく、かつ高性能な連続音
声認識装置を提供することを目的とする。
(問題点を解決するための手段) 本願の第1の発明による連続音声認識装置は、予め定め
られた認識単位の標準パターンを結合して連続音声を認
識する連続音声認識装置において、標準パターンを記憶
しておく標準パターンメモリ部と、人力された音声パタ
ーンと標準パターンの各時刻点間の類似度を求める類似
度計算部と、前記音声パターン上のある時刻点までのマ
ッチングパスに対して求められた前記類似度の累積値の
和と前記類似度の積を新しい累積値として求める累積値
計算部と、前記累積値を記憶しておく累積値メモリ部と
、前記累積値の最大値を与えるマッチングパスを記憶し
ておくマッチングパスメモリ部と、前記記憶された累積
値およびマッチングパスより認識結果を求める結果処理
部とを有する。
本願の第2の発明による連続音声認識装置は、前記本願
の第1の発明に加え、マッチングパスメモリ部中に記憶
されているマッチングパスより求められた認識単位の始
端位置が、類似度の最大値を与えるマッチングパスに対
する始端位置と一致するマッチングパスに対して求めら
れた累積値の和と前記類似度の積を新しい累積値として
求める累積値計算部を有する。
本願の第3の発明による連続音声認識装置は、前記本願
の第1の発明に加え、結果処理部により求められたマッ
チングパスに対する認識結果の全部または一部が、類似
度の累積値の最大値を与えるマッチングパスに対する認
識結果と一致するマッチングパスに対して求められた累
積値の和と前記類似度の積を新しい累積値として求める
累積値計算部を有する。
(作用) 本発明による連続音声認識装置の作用について説明する
。本発明では、文献1に述べられているHMMを用いた
連続単語認識において、単語間の確率計算はビタビアル
ゴリズムに基づいて行う。すなわち、音声パターン上の
時刻点りまでの単語列の認識結果は、その時刻点tにお
ける最大確率を与えるものとする。一方、単語内の確率
計算では、前向きバスアルゴリズムを用いると共に、マ
ッチングパスを求められるようにする。
本願の第1の発明では、生成確率は、前向きバスアルゴ
リズムを用いて確率の累積値である前向き確率を求める
ことにより計算する。マッチングパスは、その時刻点に
おける前向き確率の最大を与えるマッチングパスを保存
することにより求める。これにより、生成確率は認識性
能の高い前向きバスアルゴリズムで求められ、かつマッ
チングパスを求めることが可能となる。以下、この方法
を説明する。
観測された音声パターンを特徴ベクトルの時系列として
(Odl≦t≦T)のように表す。単語のHMMの状態
j(1≦j≦に1:単語の始端状態、J:単語の終端状
態)において音声パターンOtが観測される確率をbj
(Ot)、状態iからjに遷移する確率をaijとする
と、時刻点し、状態jにおける前向き確率α(j、t)
は、前向きバスアルゴリズムにより、以下に示す漸化式
により求められる。
αθ、t)=  Za(i、t−1)−aij−bj(
Ot)     (1)15i≦J また、認識結果を求めるには、単語の終端点の時刻にお
いて、認識結果と共に、その単語の始端点の位置をバン
クトレースして求め保存する。各時刻点tのフレームに
おいて、最良の認識結果を与えた単語Wの始端点の1フ
レーム前の時刻は、以下に示すバックポインタr(j、
t)を用いることにより求めることができる。すなわち
、単語のHMMにおける始端状態1では、 6(1,t)=t−1 とし、単語内で(1)式により前向き確率を求めると同
時に、 e(j、t)=e(argmax(a(i、t−1)−
arj)、t−1)    (2)l≦i:aJ のごとく、最良の確率を与えるマッチングパスに対する
始端点の位置を伝播させる。ここで、argrpax(
x(i))はx(i)の最大値を与えるiを示す。
単語の終端状態Jにおいて求められたバックポインタe
(J、t)には、単語始端点の1フレーム前の時刻Sが
保存されている。前向き確率α(J、t)が最大である
単語名Wとその単語の始端点の1フレーム前の時刻Sを
、結果単語メモリRw(t) = wと結果始端点メモ
リRs(t)=sに保存しておく。
入力された音声パターンの終端Tまで認識が完了した時
点で、保存されている単語の始端点の位置を順次たどる
ことにより単語列の認識結果が得られる。すなわち、以
下の手順で求めることができる。
■t=Tをセットする。
■認識結果w = Rw(t)を出力。t=−馬(t)
をセット。
■L<1の場合終了。それ以外■にもどる。
出力された認識結果を逆順にならべたものが単語列の認
識結果Rとなる。
最大確率を与えるマッチングパスの、前向き確率への貢
献度が大きいならば以上述べた方法により高精度に認識
結果を求めることができる。しかし、(1)式において
前向き確率を求め場合、a(i、t−1)をバックトレ
ースした単語の始端点が異なる可能性がある。始端点が
異なると、それに対する単語列の認識結果も異なる可能
性があり、その場合(1)式の計算は、様々な単語列に
対する前向き確率を加え合わせてしまうことになり好ま
しくない。
本願の第2の発明では、求められた前向き確率のその時
刻点における最大値を与えるマッチングパスと始端点が
一致するマツチングパスの前向き確率のみを加算するこ
とにより前向き確率を求める。すなわち、(1)式の前
向き確率の計算を以下のように変形する。
ima)(= argmax(a(i、t −1)a;
j)      (3)l≦i;<J この計算は(1)式の計算において t’(i、t−1)=e(imax+j  ’)を満た
す前向き確率のみを加算するものであり、処理Iの増加
はわずかである。バンクポインタeは、(2)式により
求めることができる。
これにより、ある始端点に対しては認識結果は一意に定
まるので、異なる認識結果に対する前向き確率を加える
問題はなくなる。しかし、同じ認識結果が得られている
にもかかわらず、始端点の位置が若干具なるマッチング
パスについては前向き確率が加えられなくなるため、誤
差が生じる可能性がある。
本願の第3の発明では、それまでの認識結果が最大6V
 Iを与えるマッチングパスと同じマッチングパスにつ
いては始端点の位置が異なっても確率を加え合わせるこ
とより前向き確率を求める。最大確率に近い前向き確率
を持つマッチングパスは始端点の位置がずれていても同
じ認識結果である可能性が高いので、この方法は有効で
ある。この方法を実現するため、それまでの認識結果を
(2)式のバックポインタと同様に伝播させる。すなわ
ち、結果ポインタr(j、t)を用意し、単語のHMM
における始y1■点(状態1)では r(1,t)=c                (
5)とする。ここで、Cはそれ以前に認識された単語列
をコード化したものである。単語内では、imBx=a
rgmax(a(i、t−1)・aij)      
 (6)1≦i≦J rθ+j) ”r(1rnax+L1)       
     (7)のように結果ポインタを計算しておく
。前向き確率は以下のように求める。
これにより、認識結果が同じ確率のみを加えて前向き確
率が求められるので、前向き確率を高精度に求めること
ができる。
ここでは、それ以前に認識された単語列をコードCとし
てコード化して結果ポインタr(j、t)に保持させて
いる。認識された単語数が多い場合、コードCが大きく
なり比較処理の処理量が多くなるおそれがある。これに
対処するため、全ての認識結果をコード化する代わりに
、過去数単語分の認識結果のみをコード化することによ
りコードCを適度な大きさとすることができる。
(実施例) 本発明による連続音声認識装置の実施例について図面を
参照して説明する。第1図は本願の第1の発明による一
実施例を示す構成図である。単語単位の標準パターンは
、(1)式に示されているようなHMMのパラメータで
ある観測確率テーブルbj(0)、遷移確率aijとし
て標準パターンメモリ部1に保持されている。入力され
た音声パターンOtは、観測確率計算部2において、観
測確率テーブルbj(0)を用いて音声パターンの観測
1iil率bj(Ot)が求められる。この観測(iI
′$は文献1の第37頁に述べられているようなベクト
ル量子化等により求められる。
累積値メモリ部3には、前向き確率a(j、t)が保持
されている。初期値として、a(1,1)= 1.0、
その他のj、tに対しては0.0の値となっている。ま
た、マツチングパスメモリ部4には、マッチングパスに
対する始端点の位置を示すパックポインタeθ、1)が
保持されている。初期値として、単語の始端に対する状
態j==1において6(1,t)=t−1なる値がセッ
トされる。
時刻tに対する観測確率bj(Ot)が求められると、
標準パターンメモリ部1から遷移確率aij、累積値メ
モリ部3から前向き確率a(j、f、−1)が順次読み
だされ、遷移確率計算部5において積a(i、t−1)
・aijが求められる。この値は観測確率bj(Ot)
と共に、前向き確率計算部6において式(1)に従って
前向き確率aθ、1)が求められる。求められた前向き
確率αθ、1)は累積値メモリ部3に保持される。
これと同時に、積α(i、t  1)、aljは最大値
検出部7に入力され、式(3)に従って最大値を与える
iである1maXが求められる。マッチングパスメモリ
部4では、読みだされたimaxよりバンクポインタr
(j、t)が(2)式に従って計算され保持される。
時刻りに対して上述の処理が完了すると、最終状態Jに
対する前向き確率α(J、t)およびバンクポインタe
(J、t)が読みだされ、結果処理部8において文献1
の第49頁に示されている方法により、最良の認識結果
が保持される。以上の処理が音声パターンの終端の時刻
Tまで終了すると、保持されている単語の始端の位置を
すでに述べた方法により順次たどることにより単語列の
認識結果Rが得られる。
次に本願の第2の発明による一実施例について説明する
。第2図は本願の第2の発明による一実施例を示す構成
図である。
本願の第1の発明と同様に、累積値メモリ部23には、
前向き確率αa、t)が保持されている。初期値として
、α(1,1)=1.0、その他のj、tに対しては0
.0の値となっている。また、マッチングパスメモリ部
24にて、単語の始端に対する状態j=1においてe(
1,t)=t−1なる値がセットされる。
時刻L&:、対する観測確率bj(Ot)が、観測確率
計算部22において求められると、標準パターンメモリ
部21から遷移確率aij、累積値メモリ部23から前
向き確率α(j、t−1)が順次読みだされ、遷移確率
計算部25において積α(i、t−1)・aijが求め
られる。この値は、最大値検出部27に人力され、式(
3)に従って最大値を与えるiである1maXが求めら
れる。マッチングパスメモリ部24では、読みだされた
1maXよりバンクポインタe(3,t)が(2)式に
従って計算され保持される。
バックボンイタ比較部29では、マッチングパスメモリ
部24から読みだされた最大値を与えるe(1maJ 
1)と状態iG:対し順次読みだされたe(i、t−1
)が比較され、一致した場合の状態icが出力される。
前向き確率計算部26において式(4)に従って、積α
(i、t−1)・aijの状態icに対する和と観測確
率bj(Ot)の積が前向き確率a(j、t)として求
められる。求められた前向き確率a(j、t)は累積値
メモリ部23に保持される。
本願の第1の発明と同様に、時刻りに対して上述の処理
が完了すると、最終状態Jに対する前向き確$a(J、
t)およびバックポインタC(J、t)が読みだされ、
結果処理部28において、最良の認識結果が保持される
。以上の処理が音声パターンの終端の時刻Tまで終了す
ると、保存されている単語の始端の位置をすでに述べた
方法により順次たどることにより単語列の認識結果Rが
得られる。
次に本願の第3の発明による一実施例について説明する
。第3図は本願の第3の発明による一実施例を示す構成
図である。
本願の第1の発明と同様に、累積値メモリ部33には、
前向き確率a(i、t)が保持されている。初期値とし
てα(14,) = 1.0、その他のj、tに月して
は0.0の値となっている。また、マッチングパスメモ
リ部34にて、単語の始端に対する状態j=1において
C(i、t)=t−iなる値がセットされる。
また、結果メモリ部39には、結果ボ・インタr(j、
t)が保持されている。初期値としては(5)式に示さ
れているように、コード化した2識結果Cがセットされ
ている。
時刻しに対する観測確r$bj(Ot)が、観測確率計
算部32において求められると、標準パターンメモリ部
31から遷移確率aij、累積値メモリ部33から前向
き確率a(j、t−1)が順次読みだされ、遷移確率計
算部35において積a(i、t −1)、aijが求め
られる。この値は、最大値検出部37に人力され、式(
3)に従って最大値を与えるiである1maXが求めら
れる。マッチングパスメモリ部34では、読みだされた
1maXよりバックポインタeO,t)が(2)式に従
って計算され保持される。同様に結果メモリ部39では
、読みだされたimaxより結果ポインタr(j、t)
が(7)式に従って計算され保持される。
結果比較部40では、結果メモリ部39から読みだされ
た最大値を与える結果ポインタ r(”maLtl)と、状態iに対し順次読みだされた
r(i、t−1)が比較され、一致した場合の状態ic
が出力される。前向き確率計算部36において式(8)
に従って、積α(i、t−1)・aijの状態icに対
する和と観測確率bj(01,)の積が前向き確率aθ
、1)として求められる。求められた前向き確率a(j
、t)は、累積値メモリ部33に保持される。
本願の第1の発明と同林に、時刻上に対して上述の処理
が完了すると、最終状態Jに対する前向き確率a(J、
t)およびバックポインタe(J、t)が読みだされ、
結果処理部38において、最良の認識結果が保持される
。同時に最良の認識結果はコード化され認識結果Cとし
て結果メモリ部39に出力する。結果メモリ部39では
(5)式に示されているように、結果ポインタr(j、
t)の初期値として保持される。
以上の処理が音声パターンの終端の時刻Tまで終了する
と、保存されている単語の始端の位置をすでに述べた方
法により順次たどることにより単語列の認識結果Rが得
られる。
(発明の効果) 本発明によれば、計算量が少なくかつ高性能な連続音声
認識装置を実現することができる。
【図面の簡単な説明】
第1図は、本願発明による第1の発明による一実施例を
示す構成図、第2図は、本願発明による第2の発明によ
る一実施例を示す構成図2、第3図は、本願発明による
第3の発明による一実施例を示す(14成図である。 図において。 1.21.31・・・標準パターンメモリ部、2,22
.32・・・絶対fit率計算部、3,23.33・・
・累積値メモリ部、4.24.34・・・マッチングパ
スメモリ部、5,25.35・・・遷移確率計算部、6
,26.36・・・前向き確率計算部、?、27.37
・・・最大値検出部、8,28.38・・・結果処理部
、29・・・バックポインタ比較部、39・・・結果メ
モリ部、40・・・結果比較部、 をそれぞれ示す。

Claims (3)

    【特許請求の範囲】
  1. (1)予め定められた認識単位の標準パターンを結合し
    て連続音声を認識する連続音声認識装置において、標準
    パターンを記憶しておく標準パターンメモリ部と、入力
    された音声パターンと標準パターンの各時刻点間の類似
    度を求める類似度計算部と、前記音声パターン上のある
    時刻点までの各マッチングパスに対して求められた前記
    類似度の累積値の和と前記類似度の積を新しい累積値と
    して求める累積値計算部と、前記累積値を記憶しておく
    累積値メモリ部と、前記累積値の最大値を与えるマッチ
    ングパスを記憶しておくマッチングパスメモリ部と、前
    記記憶された累積値およびマッチングパスより認識結果
    を求める結果処理部とを有して成ることを特徴とする連
    続音声認識装置。
  2. (2)マッチングパスメモリ部中に記憶されているマッ
    チングパスより求められた認識単位の始端位置が、類似
    度の最大値を与えるマッチングパスに対する始端位置と
    一致するマッチングパスに対して求められた累積値の和
    と前記類似度の積を新しい累積値として求める累積値計
    算部を有する請求項1記載の連続音声認識装置。
  3. (3)結果処理部により求められたマッチングパスに対
    する認識結果の全部または一部が、類似度の累積値の最
    大値を与えるマッチングパスに対する認識結果と一致す
    るマッチングパスに対して求められた累積値の和と前記
    類似度の積を新しい累積値として求める累積値計算部を
    有する請求項1記載の連続音声認識装置。
JP63250555A 1988-10-03 1988-10-03 連続音声認識装置 Pending JPH0296800A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP63250555A JPH0296800A (ja) 1988-10-03 1988-10-03 連続音声認識装置
CA002000033A CA2000033C (en) 1988-10-03 1989-10-02 Continuous speech recognition unit
DE68928522T DE68928522T2 (de) 1988-10-03 1989-10-03 Einrichtung zur Erkennung kontinuierlicher Sprache
EP89118306A EP0362785B1 (en) 1988-10-03 1989-10-03 Continuous speech recognition unit
US07/416,560 US5029212A (en) 1988-10-03 1989-10-03 Continuous speech recognition unit using forward probabilities

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63250555A JPH0296800A (ja) 1988-10-03 1988-10-03 連続音声認識装置

Publications (1)

Publication Number Publication Date
JPH0296800A true JPH0296800A (ja) 1990-04-09

Family

ID=17209653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63250555A Pending JPH0296800A (ja) 1988-10-03 1988-10-03 連続音声認識装置

Country Status (5)

Country Link
US (1) US5029212A (ja)
EP (1) EP0362785B1 (ja)
JP (1) JPH0296800A (ja)
CA (1) CA2000033C (ja)
DE (1) DE68928522T2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0776878B2 (ja) * 1991-10-31 1995-08-16 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声認識方法および装置
JPH05257492A (ja) * 1992-03-13 1993-10-08 Toshiba Corp 音声認識方式
JPH0772840B2 (ja) * 1992-09-29 1995-08-02 日本アイ・ビー・エム株式会社 音声モデルの構成方法、音声認識方法、音声認識装置及び音声モデルの訓練方法
US5627939A (en) * 1993-09-03 1997-05-06 Microsoft Corporation Speech recognition system and method employing data compression
GB2285700B (en) * 1994-01-12 1998-06-24 Drallim Ind Monitoring apparatus and method
US5615286A (en) * 1995-05-05 1997-03-25 Bell Communications Research, Inc. Method for determining a most likely sequence of states
JP3453456B2 (ja) * 1995-06-19 2003-10-06 キヤノン株式会社 状態共有モデルの設計方法及び装置ならびにその状態共有モデルを用いた音声認識方法および装置
JP3885523B2 (ja) * 2001-06-20 2007-02-21 日本電気株式会社 サーバ・クライアント型音声認識装置及び方法
US7260530B2 (en) * 2002-02-15 2007-08-21 Bevocal, Inc. Enhanced go-back feature system and method for use in a voice portal
JP4194433B2 (ja) * 2003-07-07 2008-12-10 キヤノン株式会社 尤度算出装置および方法
JP6596309B2 (ja) * 2015-11-11 2019-10-23 株式会社東芝 分析装置および分析方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4783804A (en) * 1985-03-21 1988-11-08 American Telephone And Telegraph Company, At&T Bell Laboratories Hidden Markov model speech recognition arrangement
US4748670A (en) * 1985-05-29 1988-05-31 International Business Machines Corporation Apparatus and method for determining a likely word sequence from labels generated by an acoustic processor
JPH06105394B2 (ja) * 1986-03-19 1994-12-21 株式会社東芝 音声認識方式
US4831550A (en) * 1986-03-27 1989-05-16 International Business Machines Corporation Apparatus and method for estimating, from sparse data, the probability that a particular one of a set of events is the next event in a string of events
US4852180A (en) * 1987-04-03 1989-07-25 American Telephone And Telegraph Company, At&T Bell Laboratories Speech recognition by acoustic/phonetic system and technique

Also Published As

Publication number Publication date
EP0362785B1 (en) 1998-01-07
DE68928522D1 (de) 1998-02-12
CA2000033C (en) 1994-06-14
DE68928522T2 (de) 1998-08-27
CA2000033A1 (en) 1990-04-03
EP0362785A3 (en) 1992-05-13
EP0362785A2 (en) 1990-04-11
US5029212A (en) 1991-07-02

Similar Documents

Publication Publication Date Title
Qi et al. Voiced-unvoiced-silence classifications of speech using hybrid features and a network classifier
Jelinek et al. 25 Continuous speech recognition: Statistical methods
JP3114468B2 (ja) 音声認識方法
JPS62231995A (ja) 音声認識方法
JPH01102599A (ja) 音声認識方法
JPWO2008087934A1 (ja) 拡張認識辞書学習装置と音声認識システム
JPH0296800A (ja) 連続音声認識装置
JPH08227298A (ja) クラスタ化された単語間及び/又は句間の調音結合を使用した音声認識
JPH02186398A (ja) 連続音声認識装置
JPH029359B2 (ja)
JP2002358097A (ja) 音声認識装置
JPH0486899A (ja) 標準パターン適応化方式
JPH01204099A (ja) 音声認識装置
CN113284487B (zh) 基于语音识别结果的匹配方法
JP3368989B2 (ja) 音声認識方法
KR100560916B1 (ko) 인식 후 거리를 이용한 음성인식 방법
JP3090204B2 (ja) 音声モデル学習装置及び音声認識装置
JP3291073B2 (ja) 音声認識方式
Nakagawa et al. Speech recognition using hidden Markov models based on segmental statistics
JPS6147999A (ja) 音声認識装置
Yu et al. A Multi-State NN/HMM Hybrid Method for High Performance Speech Recognition
JP2986703B2 (ja) 音声認識装置
JPH05303391A (ja) 音声認識装置
JPH08248983A (ja) 音声認識装置
Nurul et al. Distinctive phonetic feature (DPF) based phone segmentation using 2-stage multilayer neural networks