JPH01251100A - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JPH01251100A
JPH01251100A JP63078827A JP7882788A JPH01251100A JP H01251100 A JPH01251100 A JP H01251100A JP 63078827 A JP63078827 A JP 63078827A JP 7882788 A JP7882788 A JP 7882788A JP H01251100 A JPH01251100 A JP H01251100A
Authority
JP
Japan
Prior art keywords
similarity
conversion
posterior probability
word
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63078827A
Other languages
English (en)
Other versions
JP2739950B2 (ja
Inventor
Hideo Segawa
英生 瀬川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63078827A priority Critical patent/JP2739950B2/ja
Priority to EP19890303217 priority patent/EP0335739A3/en
Priority to US07/331,287 priority patent/US5023912A/en
Publication of JPH01251100A publication Critical patent/JPH01251100A/ja
Application granted granted Critical
Publication of JP2739950B2 publication Critical patent/JP2739950B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Image Analysis (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、音声認識や文字認識において求められる類似
度値(又は距離)を事後確率へ変換して認識精度を高め
るようにしたパターン認識装置に係わり、特に登録語量
の内容に基づく事前確率を事後確率に反映させるように
したパターン認識装置に関する。
(従来の技術) 従来より、連続して入力される音声や文字を、単語列や
文字列単位で認識するパターン認識装置が知られている
。その一つとして複合類似度法を用いた連続数字音声認
識アルゴリズムについて説明する。
連続発声された入力音声は一定時間毎のフレームに分割
される。いま、1フレームからmフレームまでの入力音
声区間[1,m]について考えると、音声認識の前処理
においては、音声が1フレーム入力される毎にスペクト
ル変化が抽出され、その大きさにによって単語境界候補
が求められる。
そして、この単語境界候補が求められる度に単語認識部
が起動される。
単語認識部においては、[1,mコを二つの部分区間、
即ち、 [1,kil [ki、m] に分割する。klは、単語境界候補である。
[1,kllは、単語列W「に相当する部分音声区間で
、[kl、m]は一つの単語wiに相当する単語音声区
間である。ここで、単語列W1は、Wi −wi +w
i           ・・・(1)で表され、これ
がiフレームで分割されたときの音声区間[1,m]の
認識単語列候補となる。この認識単語列候補W1を全て
のkl  (i−1,2゜・・・、n)に関して求め、
これによって得られた候補のうち最大の類似度値を有す
る単語列Wが音声区間[1,m]の認識単語列となる。
但し、nは単語列認識時に記憶する部分区間に対応する
認識単語列の数であり、システムが設定するパラメータ
である。このアルゴリズムでmを順次増やしていくこと
で、全音声区間の認識単語列を求めることができる。
ところで、このような連続音声認識の方法では、入力単
語数が未知であることから、入力音声パターンLを正確
に単語列Wであると認識するには、その前提として検出
された音声区間が正しく単語と対応しているかどうかを
考慮する必要がある。
これを考慮することなしに単純に類似度を組合わせて単
語列認識を行なっても、類似度は確率的な尺度ではない
ので、認識率を上げることはできない。
そこで、従来より、得られた類似度を事後確率に変換し
、これを類似度よりも精度の高い評価値として用いるこ
とも行われている。
即ち、いま、単語集合C−(cl、c2.・・・。
cnlの要素により、構成されているn単語の入力単語
列 W−wl w2 =・−・−wn     wl E 
Cに関し、 ■ 単語境界を正確に認識すること。
■ 各々の単語音声区間の内容を正確に認識すること。
の二条性を満たすように音声認識を行なう場合を考える
。ここで、第5図に示すように、単語wlがそれぞれ部
分音声区間におけるパターンノlと対応し、 L−、l’1)2・・・・・・、i7nを満たすとする
このとき、それぞれの音声区間が正しく対応している単
語に認識される確率は、単語列Wに文法構造が全くなけ
れば、wiとwjとは独立事象とみなせるから(i+j
)、 と表わせる。また、P(WIL)の計算を行なう際、乗
算を繰返すことを避けるために、両辺の対数をとり、 と対数尤度を求めることも多い。ここで、P (wl 
 1)i)は、区間ノlであるときに、それがwlであ
る条件付き確率であり、これが求める事後確率となる。
そこで、このような事後確率の分布をテーブルとして備
えておき、得られた類似度値を上記事後確率に変換する
ことで、高い認識率を得ることができる。
しかしながら、事後確率P(wII)I)を求めるのは
事実上困難であるため、通常は、確率値の代わりに、直
接類似度値を求めたら、適当なバイアスをかけることに
より、確率値に近似していた。例えば浮田らは、第6図
に示すような、なる指数関数で近似した(“A 5pe
akerIndependent Recogniti
on AIgor1th+* I’orConnect
ed Word Boundary IIypothe
slzer、Proc。
ICASSP、Tokyo、April、198G) 
、上記(4)式の対数をとり、A−BSmax −1,
0を利用すると、となり、類似度SからS waxとい
う固定したバイアスを引くことで、類似度を確率値に変
換している。連続数字音声認識にこの尺度を利用した場
合、バイアスS LIaxは0.96に設定されている
しかし、一般に事後確率曲線は固定した曲線ではなく、
諸量数、語量の内容(似た諸量が多い等)に依存する性
質の量である。したがって、上記のように固定的な曲線
のみに基づいて事後確率へ変換する従来の方法は、高精
度の認識を行なうことができないという問題があった。
(発明が解決しようとする課E) このように、類似度から事後確率への変換を行なって類
似度の評価を行なう従来のパターン認識装置にあっては
、事後確率を得るための変換曲線として、予め諸量辞書
の内容や語数に応じた曲線を求めることが困難であるこ
とから固定的な曲線によって近似していたため、高精度
の認識が不可能であった。
そこで、本発明は、諸量内容の学習によって容易に求め
られるパラメータに基づいて、類似度−事後確率変換を
行ない、より高精度な認識が可能なパターン認識装置を
提供することを目的とする。
[発明の構成] 、 (課題を解決するための手段) 本発明は、入カバターンの特徴と各カテゴリについての
標準パターンとから求められた類似度を事後確率に変換
する事後確率変換手段を以下のような変換パラメータ記
憶部と、変換演算部とで構成するか、若しくはこれらの
機能を1つにまとめたテーブルで構成したことを特徴と
している。
即ち、変換パラメータ記憶部は、予め与えられた学習パ
ターンと各カテゴリの標準パターンとの類似度演算によ
る認識処理で正しく認識された類似度の分布を規定する
パラメータ(α、β)と誤認識された類似度の分布を規
定するパラメータ(α、β)と、両パラメータの分布か
ら事後確率を求めるのに必要な重み係数ωとからなるパ
ラメータセットを各カテゴリ毎に記憶している。
また、変換演算部は、前記類似演算部で求められた類似
度と、上記変換パラメータ記憶部に格納されたパラメー
タセットとにより事後確率を算出するものである。
(作用) いま、部分音声パターンノIをその属性である単語認識
結果とその類似度値(特に複合類似度を例にあげる)と
に分類すると、事後確率P (wl  1)l)は、 P(wII)l ) →P (wl  ITi Asi
 )・・・(8) 但し、TIは複合類似度法によるノlの認識結果がwl
である事象 Slは単語wiに関するノiの複合 類似度 と置換える。さらに上記(6)式は、ベイズの定理を用
いることにより、 P (wl  ITS ASi) −P (Sl  1 TI Awl’)  ・P (T
lΔW1)/(P (81l TI Awl ) P 
(TI Awl )+P  (SI  ITI  Δπ
)  P  (TI  Aπ))−P (Sl  l 
TI Awl ) /4P (Sl  l TI Aw
l )・・・(7) と変形することができる。但し、ここで、フ1−は、パ
ターンノ1がwlのカテゴリに属さないという事象を表
す。
次に、上記(7)式中のそれぞれの統計量について考察
する。
まず、P (St  ITI Awl)について考える
P (SS  ITiΔWi)は、複合類似度法による
認識結果がWlで、かつ入力データのカテゴリがwlで
ある事象が生ずる確率であり、この曲線は、以下の式で
近似できる。
P (Sl  1 TI Awl ) ここで、α、βは学習データにより得られるパラメタで
、αは複合類似度法で吸収されなかった成分数、βはそ
の分散である。このパラメータの推定方法は、例えば、
瀬用英生、「複合類似度法における類似度値の分布につ
いて」 (信学技報PR1187−18.1987年8
月)にも示さレテイルヨうに、全カテゴリを1回発声す
れば1サンプル分求まる性質のもので、かつそれらの有
効な推定量を求めるには、サンプル数も数十程度で良い
次にP (Sl  1TI A)1−)について考える
P (Sl  l Ti Awl )は、複合類似度法
にょうる認識結果がwlであるが、入力データのカテゴ
リはwlでない事象が生ずる確率である。連続音声認識
のときには、特に;1−が問題となり、誤認識を起こし
易いカテゴリの組合わせだけでなく、単語のカテゴリに
は属さないパターンで誤認識を起こし易いような単語コ
ンチクスト、例えば、■ ある単語の一部分 (例)  “6 [rokul” −e ’ 6−9 [roku−kyuu ] ”■ 
単語と単語のわたりの部分 (例)      ’  3 − 1   [5an−
icj  コ “→ ’ 3 − 2 − 1  [5
an−ni−icjコ ”■ 二つの単語パターンの併
合 (例)     “ 2 − 2   [nl−nl 
 ]  ”→″2[nll″ を調べ、それらの類似度の分布についても推定しなけれ
ばいけない。類似度の分布に関しては、前記(8)式で
近似可能である。この類似度の分布のパラメータは、(
8)式の(αl、βI)と区別するために、(α1.β
l)とする。これらも、パラメータ(αI、βl)と同
様、容易に求められる。
最後に、P (TiΔw1 ) /P (Ti Awl
 )について考察する。この量は、ベイズ確率における
事前確率に相当しており、カテゴリの出現頻度の比に相
当している。ここで、P (Ti Awl )は、部分
空間法による認識結果がwIで、かつ入カバターンがw
lである事象が生ずる確率を表す。
この統計量は学習過程において、 P (TI Awl ) / P (TI Awl )
綱 ω として求められていく。このωを重み係数とする。
このように、上記のパラメータセットはいずれも学習に
よって容易に求められる。得られる量である。
そして、パターン認識時においては、得られた類似度S
lに応じて必要なパラメータセットα。
β、α、β、ωを変換パラメータ記憶部から適宜読出し
、変換演算部で前記(7)式に基づく演算を行なうこと
により、類似度値を所望の事後確率に変換することが出
来る。また、変換演算部は、複雑な演算を含んでいるの
で、これを変換パラメータ記憶部と統合してテーブル化
すれば、処理速度の向上が図れる。
したがって、本発明によれば、少ないデータ量で精度の
良い事後確率変換手段を構成でき、これにより認識精度
の向上が図れる。
(実施例) 以下、図面に基づいて本発明の一実施例について説明す
る。
第1図は、本発明を連続数字音声認識に適用した場合の
単語列認識装置の構成を示す図である。
音声入力部1は、連続発声された音声を所定の電気信号
に変換して前処理部2に供給する。前処理部2は、音響
処理部3、スペクトル変化抽出部4、音声始終端決定部
5及び単語境界候補生成部6により構成されている。音
響処理部3は、入力される音声データを、フレーム毎に
例えば8〜30チヤネルのフィルタバンクによりスベク
奈ル分析して特徴パターンを抽出する。スペクトル変化
抽出部4は、フレーム毎のスペクトルデータUm間の差
ΔUを抽出する。音声始終端決定部5は、抽出されたス
ペクトル変化の大きさに基づいて音声の始端及び終端を
検出する。更に単語境界候補生成部6は、スペクトル変
化ΔUが所定のしきい値θよりも大きいときに、そのフ
レームを単語境界候補klとして出力する。
境界候補ki  (i−1〜n)によって得られるn個
の単語区間候補[kl、m]に対応する各特徴パターン
は、単語認識部7に与えられ、ここで単語辞書8を用い
た単語認識に供される。各単語区間候補の単語認識候補
は、類似度−事後確率変換部9で事後確率に変換され、
単語列認識部10に与えられる。単語列認識部10では
、認識単語列候補登録部11に登録されている各単語列
区間[1,に目(i−1〜n)についての単語列候補と
、上記事後確率に変換された類似度とを統合して単語列
認識を行う。これによって得られた単語列認識候補は認
識単語列候補登録部11に格納される。そして、音声始
終端決定部5により音声の終端が検出されたら、登録さ
れた単語列候補のうち最も類似度の高い候補を認識単語
として出力する。
第2図に類似度−事後確率変換部9の構成を示す。この
類似度−事後確率変換部9は、変換演算部21と変換パ
ラメータ記憶部22とにより構成されている。変換パラ
メータ記憶部22は、α、β  正解パターンの類似度
分布 α、β  不正解パターンの類似度分布ω    正解
パターンと不正解パターンに関する事前確率の比 の各パラメータを各カテゴリ毎に記憶したテーブルであ
る。これらのパラメータセットは、いずれも学習によっ
て得られる。第3図に、この学習のアルゴリズムを示す
即ち、学習処理は、第一学習過程31と第二学習過程3
2とからなる。第一学習過程31では、教師データとし
て与えられる単語境界データと単語カテゴリとに従って
単語列を発声し、複合類似度法に基づく単語音声テンプ
レートを作成する。
第二学習過程32では、教師データとして与えられる単
語境界データと単語カテゴリとに従って再度単語列を発
声し、単語音声区間候補を生成するとともに、生成され
た単語区間候補データに基づいて前記第一学習過程で得
られた単語音声テンプレートとの単語類似度計算を行な
い、単語類似度データと単語認識結果とを得る。そして
、その結果と与えられた教師データとから正解データ及
び不正解データの類似度分布及びカテゴリの出現頻度を
それぞれ求め、類似度値に関する事後確率曲線を求める
このような学習の結果、得られた事後確率の曲線は、例
えば第4図に示すような曲線となる。
学習を前カテゴリについて行なうと、全カテゴリについ
てのパラメタ(αI、βl、αl、βl。
ω)が求められるので、これを変換パラメータ記憶部2
2に記憶しておく。
変換演算部21は、 P  (Sl  l  TI  Awl  )P  (
SI  ITl  Awl) の両式に類似度を変換した後、 P (wi  lT1Δ81) −P (Si  l TI Awl ) /(P (S
i  ITI Awl ) +P  (Sil T1  Δπ)IIω)    ・
・・(ll)なる変換式により、事後確率を求める。
このように、本実施例の装置にによれば、類似度−事後
確率変換部を簡単な学習処理によって作成することがで
き、得られた変換部を使用して高い精度の認識処理を行
なうことができる。
なお、事後確率への変換に際しては、認識カテゴリ毎に
異なる変換曲線を用いることが望ましいが、認識カテゴ
リ結果により共通の変換曲線を用いるため、 なる式を用いるようにしても良い。
また、変換演算部は、複雑な演算を含んでいるので、変
換演算部と変換パラメータ記憶部とを統合してテーブル
化しておくようにしても良い。この場合には、変換処理
を高速化できる。
なお、本発明は、特に音声認識に限らず、文字認識にも
適用可能である。
[発明の効果] 以上述べたように、本発明によれば、少ないサンプル数
で正確な事後確率変換パラメータを得ることができ、こ
れを用いて認識処理の精度を大幅に向上させることがで
きる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る連続音声数字認識装置
のブロック図、第2図は同装置における類似度−事後確
率変換部の構成を示すブロック図、第3図は同変換部に
おけるパラメータの学習過程を示す流れ図、第4図は同
学習過程で得られる事後確率曲線を示す図、第5図は音
声パターンと単語列との対応を示す図、第6図は従来の
近似的な変換関数を示す図である。 1・・・音声入力部、2・・・前処理部、3・・・音響
処理部、4・・・スペクトル変化抽出部、5・・・音声
始終端決定部、6・・・単語境界候補生成部、8・・・
単語認識部、8・・・単語辞書、9・・・類似度−事後
確率変換部、10・・・単語列認識部、11・・・認識
単語列候補登録部。 出願人代理人 弁理士 鈴江武彦 第2図 31 葛−学ビ止程 阜謁奮声テンプレート      有イ収友−屓11変
狭パラメタ(a、β)、(iiJ)、ω

Claims (2)

    【特許請求の範囲】
  1. (1)入力されたパターンの特徴を抽出する特徴抽出部
    と、各カテゴリについての標準パターンを記憶した辞書
    と、前記特徴抽出部で抽出された特徴と前記辞書に記憶
    された標準パターンとの類似度を算出する類似度演算部
    と、この類似度演算部で求められた類似度を事後確率に
    変換する事後確率変換手段とを具備したパターン認識装
    置において、 前記事後確率変換手段は、予め与えられた学習パターン
    と各カテゴリの標準パターンとの類似度演算による認識
    処理で正しく認識された類似度の分布を規定するパラメ
    ータ(α、β)と誤認識された類似度の分布を規定する
    パラメータ(α、β)と、両パラメータの分布から事後
    確率を求めるのに必要な重み係数ωとからなるパラメー
    タセットを各カテゴリ毎に記憶した類似度−事後確率変
    換パラメータ記憶部と、前記類似演算部で求められた類
    似度と、上記変換パラメータ記憶部に格納されたパラメ
    ータセットとにより事後確率を算出するものであること
    を特徴とするパターン認識装置。
  2. (2)前記変換パラメータ記憶部と前記変換演算部の代
    わりに、これらの機能を1つにまとめたテーブルを備え
    たことを特徴とする請求項1記載のパターン認識装置。
JP63078827A 1988-03-31 1988-03-31 パターン認識装置 Expired - Lifetime JP2739950B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP63078827A JP2739950B2 (ja) 1988-03-31 1988-03-31 パターン認識装置
EP19890303217 EP0335739A3 (en) 1988-03-31 1989-03-31 Pattern recognition system
US07/331,287 US5023912A (en) 1988-03-31 1989-03-31 Pattern recognition system using posterior probabilities

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63078827A JP2739950B2 (ja) 1988-03-31 1988-03-31 パターン認識装置

Publications (2)

Publication Number Publication Date
JPH01251100A true JPH01251100A (ja) 1989-10-06
JP2739950B2 JP2739950B2 (ja) 1998-04-15

Family

ID=13672663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63078827A Expired - Lifetime JP2739950B2 (ja) 1988-03-31 1988-03-31 パターン認識装置

Country Status (3)

Country Link
US (1) US5023912A (ja)
EP (1) EP0335739A3 (ja)
JP (1) JP2739950B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007171944A (ja) * 1996-10-02 2007-07-05 Sri Internatl 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム
JP2011065370A (ja) * 2009-09-16 2011-03-31 Toshiba Corp パターン認識方法、文字認識方法、パターン認識プログラム、文字認識プログラム、パターン認識装置および文字認識装置
JP2013246677A (ja) * 2012-05-28 2013-12-09 Toshiba Corp パターン認識用辞書の学習装置、パターン認識装置、コーディング装置、区分装置、および、パターン認識用辞書の学習方法

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2085887A1 (en) * 1990-06-21 1991-12-22 Kentyn Reynolds Method and apparatus for wave analysis and event recognition
US5182773A (en) * 1991-03-22 1993-01-26 International Business Machines Corporation Speaker-independent label coding apparatus
US5621857A (en) * 1991-12-20 1997-04-15 Oregon Graduate Institute Of Science And Technology Method and system for identifying and recognizing speech
JP3114468B2 (ja) 1993-11-25 2000-12-04 松下電器産業株式会社 音声認識方法
US5835890A (en) * 1996-08-02 1998-11-10 Nippon Telegraph And Telephone Corporation Method for speaker adaptation of speech models recognition scheme using the method and recording medium having the speech recognition method recorded thereon
US5874939A (en) * 1996-12-10 1999-02-23 Motorola, Inc. Keyboard apparatus and method with voice recognition
US6137863A (en) * 1996-12-13 2000-10-24 At&T Corp. Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition
US6061654A (en) * 1996-12-16 2000-05-09 At&T Corp. System and method of recognizing letters and numbers by either speech or touch tone recognition utilizing constrained confusion matrices
US6154579A (en) * 1997-08-11 2000-11-28 At&T Corp. Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6141661A (en) * 1997-10-17 2000-10-31 At&T Corp Method and apparatus for performing a grammar-pruning operation
US6205428B1 (en) 1997-11-20 2001-03-20 At&T Corp. Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers
US6122612A (en) * 1997-11-20 2000-09-19 At&T Corp Check-sum based method and apparatus for performing speech recognition
US6223158B1 (en) 1998-02-04 2001-04-24 At&T Corporation Statistical option generator for alpha-numeric pre-database speech recognition correction
US6205261B1 (en) 1998-02-05 2001-03-20 At&T Corp. Confusion set based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6400805B1 (en) 1998-06-15 2002-06-04 At&T Corp. Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition
US7937260B1 (en) * 1998-06-15 2011-05-03 At&T Intellectual Property Ii, L.P. Concise dynamic grammars using N-best selection
JP2001160067A (ja) * 1999-09-22 2001-06-12 Ddi Corp 類似文書検索方法および該類似文書検索方法を利用した推薦記事通知サービスシステム
US6343656B1 (en) 2000-03-23 2002-02-05 Intevep, S.A. System and method for optimizing production from a rod-pumping system
GB2364814A (en) * 2000-07-12 2002-02-06 Canon Kk Speech recognition
US6636842B1 (en) 2000-07-15 2003-10-21 Intevep, S.A. System and method for controlling an industrial process utilizing process trajectories
US6629077B1 (en) 2000-11-22 2003-09-30 Universal Electronics Inc. Universal remote control adapted to receive voice input
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7283954B2 (en) * 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US6900361B2 (en) * 2001-05-08 2005-05-31 Battelle Memorial Institute Process for lactose conversion to polyols
US7269546B2 (en) * 2001-05-09 2007-09-11 International Business Machines Corporation System and method of finding documents related to other documents and of finding related words in response to a query to refine a search
US6925433B2 (en) * 2001-05-09 2005-08-02 International Business Machines Corporation System and method for context-dependent probabilistic modeling of words and documents
MXPA03010237A (es) * 2001-05-10 2004-03-16 Dolby Lab Licensing Corp Mejoramiento del funcionamiento de transitorios en sistemas de codificacion de audio de baja tasa de transferencia de bitios mediante la reduccion del pre-ruido.
WO2016181474A1 (ja) * 2015-05-11 2016-11-17 株式会社東芝 パターン認識装置、パターン認識方法およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63225300A (ja) * 1987-03-16 1988-09-20 株式会社東芝 パタ−ン認識装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007171944A (ja) * 1996-10-02 2007-07-05 Sri Internatl 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム
JP2011065370A (ja) * 2009-09-16 2011-03-31 Toshiba Corp パターン認識方法、文字認識方法、パターン認識プログラム、文字認識プログラム、パターン認識装置および文字認識装置
KR101145967B1 (ko) * 2009-09-16 2012-05-15 가부시끼가이샤 도시바 패턴 인식 방법, 문자 인식 방법, 패턴 인식 장치 및 문자 인식 장치
JP2013246677A (ja) * 2012-05-28 2013-12-09 Toshiba Corp パターン認識用辞書の学習装置、パターン認識装置、コーディング装置、区分装置、および、パターン認識用辞書の学習方法

Also Published As

Publication number Publication date
JP2739950B2 (ja) 1998-04-15
US5023912A (en) 1991-06-11
EP0335739A3 (en) 1991-08-28
EP0335739A2 (en) 1989-10-04

Similar Documents

Publication Publication Date Title
JPH01251100A (ja) パターン認識装置
US6278970B1 (en) Speech transformation using log energy and orthogonal matrix
US8271283B2 (en) Method and apparatus for recognizing speech by measuring confidence levels of respective frames
Silva et al. Average divergence distance as a statistical discrimination measure for hidden Markov models
JP3298858B2 (ja) 低複雑性スピーチ認識器の区分ベースの類似性方法
US8942977B2 (en) System and method for speech recognition using pitch-synchronous spectral parameters
US20080189109A1 (en) Segmentation posterior based boundary point determination
Kourd et al. Arabic isolated word speaker dependent recognition system
JP2625998B2 (ja) 特徴抽出方式
US7043430B1 (en) System and method for speech recognition using tonal modeling
JP3628245B2 (ja) 言語モデル生成方法、音声認識方法及びそのプログラム記録媒体
JP3477751B2 (ja) 連続単語音声認識装置
JP2853418B2 (ja) 音声認識方法
Laleye et al. An algorithm based on fuzzy logic for text-independent fongbe speech segmentation
Manor et al. Voice trigger system using fuzzy logic
JPH04264596A (ja) 雑音下音声認識方法
WO2001039179A1 (en) System and method for speech recognition using tonal modeling
JP2577891B2 (ja) 単語音声予備選択装置
JPH0643893A (ja) 音声認識方法
JPH1097269A (ja) 音声検出装置及び方法
Kaland Contour clustering
JPH0554678B2 (ja)
LC et al. Implementation Of Speech Recognition System
CN115273801A (zh) 基于人工智能的语音合成方法、装置、计算机设备及介质
IL95869A (en) Boundary relaxation for speech pattern recognition