JP2739950B2 - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JP2739950B2
JP2739950B2 JP63078827A JP7882788A JP2739950B2 JP 2739950 B2 JP2739950 B2 JP 2739950B2 JP 63078827 A JP63078827 A JP 63078827A JP 7882788 A JP7882788 A JP 7882788A JP 2739950 B2 JP2739950 B2 JP 2739950B2
Authority
JP
Japan
Prior art keywords
similarity
posterior probability
word
recognition
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63078827A
Other languages
English (en)
Other versions
JPH01251100A (ja
Inventor
英生 瀬川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63078827A priority Critical patent/JP2739950B2/ja
Priority to US07/331,287 priority patent/US5023912A/en
Priority to EP19890303217 priority patent/EP0335739A3/en
Publication of JPH01251100A publication Critical patent/JPH01251100A/ja
Application granted granted Critical
Publication of JP2739950B2 publication Critical patent/JP2739950B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Image Analysis (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、音声認識や文字認識において求められる類
似度値(又は距離)を事後確率へ変換して認識精度を高
めるようにしたパターン認識装置に係わり、特に登録語
彙の内容に基づく事前確率を事後確率に反映させるよう
にしたパターン認識装置に関する。
(従来の技術) 従来より、連続して入力される音声や文字を、単語列
や文字列単位で認識するパターン認識装置が知られてい
る。その一つとして複合類似度法を用いた連続数字音声
認識アルゴリズムについて説明する。
連続発声された入力音声は一定時間毎のフレームに分
割される。いま、1フレームからmフレームまでの入力
音声区間[1,m]について考えると、音声認識の前処理
においては、音声が1フレーム入力される毎にスペクト
ル変化が抽出され、その大きさによって単語境界候補が
求められる。そして、この単語境界候補に求められる度
に単語認識部が起動される。
単語認識部においては、[1,m]を二つの部分区間、
即ち、 [1,ki] [ki,m] に分割する。kiは、単語境界候補である。[1,ki]は、
単語列wに相当する部分音声区間で[ki,m]は一つの
単語wiに相当する単語音声区間である。ここで、単語列
Wiは、 Wi=w+wi …(1) で表され、これがiフレームで分割されたときの音声区
間[1,m]の認識単語列候補となる。この認識単語列候
補Wiを全てのki(i=1,2,…,n)に関して求め、これに
よって得られた候補のうち最大の類似度値を有する単語
列Wが音声区間[1,m]の認識単語列となる。但し、n
は単語列認識時に記憶する部分区間に対応する認識単語
列の数であり、システムが認定するパラメータである。
このアルゴリズムでmを順次増やしていくことで、全音
声区間の認識単語列を求めることができる。
ところで、このような連続音声認識の方法では、入力
単語数が未知であることから、入力音声パターンLを正
確に単語列Wであると認識するには、その前提として検
出された音声区間が正しく単語と対応しているかどうか
を考慮する必要がある。これを考慮することなしに単純
に類似度を組合わせて単語列認識を行なっても、類似度
は確率的な尺度ではないので、認識率を上げることはで
きない。
そこで、従来より、得られた類似度を事後確率に変換
し、これを類似度よりも精度の高い評価値として用いら
れることも行われている。
即ち、いま、単語集合C={c1,c2,…,Ci}の要素に
より、構成されているn単語の入力単語列 W=w1w2……wn wi∈C に関し、 単語境界を正確に認識すること。
各々の単語音声区間の内容を正確に認識すること。
の二条件を満たすように音声認識を行なう場合を考え
る。ここで、第5図に示すように、単語wiがそれぞれ部
分音声区間におけるパターンl1と対応し、 L=l1l2……ln を満たすとする。
このとき、それぞれの音声区間が正しく対応している
単語に認識される確率は、単語列Wに文法構造が全くな
ければ、wiとwjとは独立事象とみなせるから(i≠
j)、 と表わせる。また、P(W|L)の計算を行なう際、乗算
を繰返すことを避けるために、両辺の対数をとり、 と対数尤度を求めることも多い。ここで、P(wi|li)
は、区間liであるときに、それがwiである条件付き確率
であり、これが求める事後確率となる。
そこで、このような事後確率の分布をテーブルとして
備えておき、得られた類似度値を上記事後確率に変換す
ることで、高い認識率を得ることができる。
しかしながら、事後確率P(wi|li)を求めるのは事
実上困難であるため、通常は、確率値の代わりに、直接
類似度値を求めたら、適当なバイアスをかけることによ
り、確率値に近時していた。例えば、浮田らは、第6図
に示すような、 なる指数関数で近似した(“A Speaker Independent Re
cognition Algorithm for Connected Word Boundary Hy
pothesizer",Proc.ICASSP,Tokyo,April,1986)。上記
(4)式の対数をとり、A・BSmax=1.0を利用すると、 となり、類似度SからSmaxという固定したバイアスを引
くことで、類似度を確率値に変換している。連続数字音
声認識にこの尺度を利用した場合、バイアスSmaxは0.96
に設定されている。
しかし、一般に事後確率曲線は固定した曲線ではな
く、語彙数、語彙の内容(似た語彙が多い等)に依存す
る性質の量である。したがって、上記のように固定的な
曲線のみに基づいて事後確率へ変換する従来の方法は、
高精度の認識を行うことができないという問題があっ
た。
(発明が解決しようとする課題) このように、類似度から事後確率への変換を行なって
類似度の評価を行なう従来のパターン認識装置にあって
は、事後確率を得るための変換曲線として、予め語彙辞
書の内容や語数に応じた曲線を求めることが困難である
ことから固定的な曲線によって近似していたため、高精
度の認識が不可能であった。
そこで、本発明は、語彙内容の学習によって容易に求
められるパラメータに基づいて、類似度−事後確率変換
を行ない、より高精度な認識が可能なパターン認識装置
を提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、入力パターンの特徴と各カテゴリについて
の標準パターンとから求められた類似度を事後確率に変
換する事後確率変換手段を以下のような類似度−事後確
率変換パラメータ記憶手段と、変換演算手段とで構成す
るか、若しくはこれらの機能を1つにまとめたテーブル
で構成したことを特徴としている。
即ち、類似度−事後確率変換パラメータ記憶手段は、
予め与えられた学習パターンと各カテゴリの標準パター
ンとの類似度演算による認識処理で正しく認識された類
似度の分布を規定するパラメータ(α,β)と誤認識さ
れた類似度の分布を規定するパラメータ(,)と、
両パラメータの分布から事後確率を求めるのに必要な重
み係数ωとからなるパラメータセットを各カテゴリ毎に
記憶している。
また、変換演算手段は、前記類似度演算手段で求めら
れた類似度と、上記類似度−事後確率変換パラメータ記
憶手段に格納されたパラメータセットとにより事後確率
を算出するものである。
(作用) いま、部分音声パターンliをその属性である単語認識
結果とその類似度値(特に複合類似度を例にあげる)と
に分類すると、事後確率P(wi|li)は、 P(wi|li)→P(wi|TiΛsi) …(6) 但し、Tiは複合類似度法によるliの認識結果がwiであ
る事象 Siは単語wiに関するliの複合類似度 と置換える。さらに上記(6)式は、ベイズの定理を用
いることにより、 と変形することができる。但し、ここで、▲▼は、
パターンliがwiのカテゴリに属さないという事象を表
す。
次に、上記(7)式中のそれぞれの統計量について考
察する。
まず、P(Si|TiΛwi)について考える。P(Si|TiΛ
wi)は、複合類似度法による認識結果がwiで、かつ入力
データのカテゴリがwiである事象が生ずる確率であり、
この曲線は、以下の式で近似できる。
ここで、α,βは学習データにより得られるパラメタ
で、αは複合類似度法で吸収されなかった成分数、βは
その分散である。このパラメータの推定方法は、例え
ば、瀬川英生,「複合類似度法における類似度値の分布
について」(信学技報PRU87−18,1987年6月)にも示さ
れているように、全カテゴリを1回発声すれば1サンプ
ル分求まる性質のもので、かつそれらの有効な推定量を
求めるには、サンプル数も数十程度で良い。
次にP(Si|TiΛ▲▼)について考える。P(Si|
TiΛ▲▼)は、複合類似度法にようる認識結果wiで
あるが、入力データのカテゴリはwiでない事象が生ずる
確率である。連続音声認識のときには、特に▲▼が
問題となり、誤認識を起こし易いカテゴリの組合わせだ
けでなく、単語のカテゴリには属さないパターンで誤認
識を起こし易いような単語コンテクスト、例えば、 ある単語の一部分 (例) “6[roku]” →“6−9[roku−kyuu]” 単語と単語のわたりの部分 (例) “3−1[san−ici]” →“3−2−1[san−ni−ici]” 二つの単語パターンの併合 (例) “2−2[ni−ni]” →“2[ni]” を調べ、それらの類似度の分布についても推定しなけれ
ばならない。類似度の分布に関しては、前記(8)式で
近似可能である。この類似度の分布のパラメータは、
(8)式の(αi,βi)と区別するために、(▲
▼,▲▼)とする。これらも、パラメータ(αi,β
i)と同様、容易に求められる。
最後に、P(TiΛwi)/P(TiΛ▲▼)について考
察する。この量は、ベイズ確率における事前確率に相当
しており、カテゴリの出現頻度の比に相当している。こ
こで、P(TiΛwi)は、部分空間法による認識結果がwi
で、かつ入力パターンがwiである事象が生ずる確率を表
す。
この統計量は学習過程において、 として求められていく。このωを重み係数とする。
このように、上記のパラメータセットはいずれも学習
によって容易に求められる。得られる量である。
そして、パターン認識時においては、得られた類似度
Siに応じて必要なパラメータセットα,β,,,ω
を変換パラメータ記憶部から適宜読出し、変換演算手段
で前記(7)式に基づく演算を行なうことにより、類似
度値を所望の事後確率に変換することが出来る。また、
変換演算手段は、複雑な演算を含んでいるので、これを
類似度−事後確率変換パラメータ記憶手段と統合してテ
ーブル化すれば、処理速度の向上が図れる。
したがって、本発明によれば、少ないデータ量で精度
の良い事後確率変換手段を構成でき、これにより認識精
度の向上が図れる。
(実施例) 以下、図面に基づいて本発明の一実施例について説明
する。
第1図は、本発明を連続数字音声認識に適用した場合
の単語列認識装置の構成を示す図である。
音声入力部1は、連続発声された音声を所定の電気信
号に変換して前処理部2に供給する。前処理部2は、音
響処理部3、スペクトル変化抽出部4、音声終始端決定
部5及び単語境界候補生成部6により構成されている。
音響処理部3は、入力される音声データを、フレーム毎
に例えば8〜30チャンネルのフィルタバンクによりスペ
クトル分析して特徴パターンを抽出する。スペクトル変
化抽出部4は、フレーム毎のスペクトルデータUm間の差
ΔU=|Um−Um−1|を抽出する。音声始終端決定部5
は、抽出されたスペクトル変化の大きさに基づいて音声
の始端及び終端を検出する。更に単語境界候補生成部6
は、スペクトル変化ΔUが所定のしきい値θよりも大き
いときに、そのフレームを単語境界候補kiとして出力す
る。
境界候補ki(i=1〜n)によって得られるn個の単
語区間候補[ki,m]に対応する各特徴パターンは、単語
認識部7に与えられ、ここで単語辞書8を用いた単語認
識に供される。各単語区間候補の単語認識候補は、類似
度−事後確率変換部9で事後確率に変換され、単語列認
識部10に与えられる。単語列認識部10では、認識単語列
候補登録部11に登録されている各単語列区間[1,ki]
(i=1〜n)についての単語列候補と、上記事後確率
に変換された類似度とを統合して単語列認識を行う。こ
れによって得られた単語列認識候補は認識単語列候補登
録部11に格納される。そして、音声始終端決定部5によ
り音声の終端が検出されたら、登録された単語列候補の
うち最も類似度の高い候補を認識単語として出力する。
第2図に類似度−事後確率変換部9の構成を示す。こ
の類似度−事後確率変換部9は、変換演算部21と変換パ
ラメータ記憶部22とにより構成されている。変換パラメ
ータ記憶部22は、 α,β 正解パターンの類似度分布 , 不正解パターンの類似度分布 ω 正解パターンと不正解パターンに関する事前
確率の比 の各パラメータを各カテゴリ毎に記憶したテーブルであ
る。これらのパラメータセットは、いずれも学習によっ
て得られる。第3図に、この学習のアルゴリズムを示
す。
即ち、学習処理は、第一学習過程31と第二学習過程32
とからなる。第一学習過程31では、教師データとして与
えられる単語境界データと単語カテゴリとに従って単語
列を発声し、複合類似度法に基づく単語音声テンプレー
トを作成する。第二学習過程32では、教師データとして
与えられる単語境界データと単語カテゴリとに従って再
度単語列を発声し、単語音声区間候補を生成するととも
に、生成された単語区間候補データに基づいて前記第一
学習過程で得られた単語音声テンプレートとの単語類似
度計算を行ない、単語類似度データと単語認識結果とを
得る。そして、その結果と与えられた教師データとから
正解データ及び不正解データの類似度分布及びカテゴリ
の出現頻度をそれぞれ求め、類似度値に関する事後確率
曲線を求める。
このような学習の結果、得られた事後確率の曲線は、
例えば第4図に示すような曲線となる。
学習を前カテゴリについて行なうと、全カテゴリにつ
いてのパラメタ(αi,βi,▲▼,▲▼,ω)が
求められるので、これを変換パラメータ記憶部22に記憶
しておく。
変換演算部21は、 の両式に類似度を変換した後、 なる変換式により、事後確率を求める。
このように、本実施例の装置にによれば、類似度−事
後確率変換部を簡単な学習処理によって作成することが
でき、得られた変換部を使用して高い精度の認識処理を
行なうことができる。
なお、事後確率への変換に際しては、認識カテゴリ毎
に異なる変換曲線を用いることが望ましいが、認識カテ
ゴリ結果により共通の変換曲線を用いるため、 なる式を用いるようにしても良い。
また、変換演算部は、複雑な演算を含んでいるので、
変換演算部と変換パラメータ記憶部とを統合してテーブ
ル化しておくようにしても良い。この場合には、変換処
理を高速化できる。
なお、本発明は、特に音声認識に限らず、文字認識に
も適用可能である。
[発明の効果] 以上述べたように、本発明によれば、少ないサンプル
数で正確な事後確率変換パラメータを得ることができ、
これを用いて認識処理の精度を大幅に向上させることが
できる。
【図面の簡単な説明】 第1図は本発明の一実施例に係る連続音声数字認識装置
のブロック図、第2図は同装置における類似度−事後確
率変換部の構成を示すブロック図、第3図は同変換部に
おけるパラメータの学習過程を示す流れ図、第4図は同
学習過程で得られる事後確率曲線を示す図、第5図は音
声パターンと単語列との対応を示す図、第6図は従来の
近似的な変換関数を示す図である。 1……音声入力部、2……前処理部、3……音響処理
部、4……スペクトル変化抽出部、5……音声始終端決
定部、6……単語境界候補生成部、8……単語認識部、
8……単語辞書、9……類似度−事後確率変換部、10…
…単語列認識部、11……認識単語列候補登録部。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力されたパターンの特徴を抽出する特徴
    抽出手段と、各カテゴリについての標準パターンを記憶
    した辞書手段と、前記特徴抽出手段で抽出された特徴と
    前記辞書手段に記憶された標準パターンとの類似度を算
    出する類似度演算手段と、この類似度演算手段で求めら
    れた類似度を事後確率に変換する事後確率変換手段を具
    備したパターン認識装置において、 前記事後確率変換手段は、 予め与えられた学習パターンと各カテゴリの標準パター
    ンとの類似度演算による認識処理で正しく認識された類
    似度の分布を規定するパラメータ(α,β)と誤認識さ
    れた類似度の分布を規定するパラメータ(,)と、
    両パラメータの分布から事後確率を求めるのに必要な重
    み係数ωとからなるパラメータセットを各カテゴリ毎に
    記憶した類似度−事後確率変換パラメータ記憶手段と、 前記類似度演算手段で求められた類似度と、前記類似度
    −事後確率変換パラメータ記憶手段に格納されたパラメ
    ータセットとにより事後確率を算出する変換演算手段と
    を有することを特徴とするパターン認識装置。
  2. 【請求項2】前記類似度−事後確率変換パラメータ記憶
    手段と前記変換演算手段の代わりに、これらの機能を1
    つにまとめたテーブルを備えたことを特徴とする請求項
    1に記載のパターン認識装置。
JP63078827A 1988-03-31 1988-03-31 パターン認識装置 Expired - Lifetime JP2739950B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP63078827A JP2739950B2 (ja) 1988-03-31 1988-03-31 パターン認識装置
US07/331,287 US5023912A (en) 1988-03-31 1989-03-31 Pattern recognition system using posterior probabilities
EP19890303217 EP0335739A3 (en) 1988-03-31 1989-03-31 Pattern recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63078827A JP2739950B2 (ja) 1988-03-31 1988-03-31 パターン認識装置

Publications (2)

Publication Number Publication Date
JPH01251100A JPH01251100A (ja) 1989-10-06
JP2739950B2 true JP2739950B2 (ja) 1998-04-15

Family

ID=13672663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63078827A Expired - Lifetime JP2739950B2 (ja) 1988-03-31 1988-03-31 パターン認識装置

Country Status (3)

Country Link
US (1) US5023912A (ja)
EP (1) EP0335739A3 (ja)
JP (1) JP2739950B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3114468B2 (ja) 1993-11-25 2000-12-04 松下電器産業株式会社 音声認識方法
EP2299385A1 (en) 2009-09-16 2011-03-23 Kabushiki Kaisha Toshiba Pattern recognition method, character recognition method, pattern recognition apparatus, and character recognition apparatus

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991019989A1 (en) * 1990-06-21 1991-12-26 Reynolds Software, Inc. Method and apparatus for wave analysis and event recognition
US5182773A (en) * 1991-03-22 1993-01-26 International Business Machines Corporation Speaker-independent label coding apparatus
US5621857A (en) * 1991-12-20 1997-04-15 Oregon Graduate Institute Of Science And Technology Method and system for identifying and recognizing speech
US5835890A (en) * 1996-08-02 1998-11-10 Nippon Telegraph And Telephone Corporation Method for speaker adaptation of speech models recognition scheme using the method and recording medium having the speech recognition method recorded thereon
JP4394752B2 (ja) * 1996-10-02 2010-01-06 エスアールアイ インターナショナル 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム
US5874939A (en) * 1996-12-10 1999-02-23 Motorola, Inc. Keyboard apparatus and method with voice recognition
US6137863A (en) * 1996-12-13 2000-10-24 At&T Corp. Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition
US6061654A (en) * 1996-12-16 2000-05-09 At&T Corp. System and method of recognizing letters and numbers by either speech or touch tone recognition utilizing constrained confusion matrices
US6154579A (en) * 1997-08-11 2000-11-28 At&T Corp. Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6141661A (en) * 1997-10-17 2000-10-31 At&T Corp Method and apparatus for performing a grammar-pruning operation
US6205428B1 (en) 1997-11-20 2001-03-20 At&T Corp. Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers
US6122612A (en) * 1997-11-20 2000-09-19 At&T Corp Check-sum based method and apparatus for performing speech recognition
US6223158B1 (en) 1998-02-04 2001-04-24 At&T Corporation Statistical option generator for alpha-numeric pre-database speech recognition correction
US6205261B1 (en) 1998-02-05 2001-03-20 At&T Corp. Confusion set based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US7937260B1 (en) 1998-06-15 2011-05-03 At&T Intellectual Property Ii, L.P. Concise dynamic grammars using N-best selection
US6400805B1 (en) 1998-06-15 2002-06-04 At&T Corp. Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition
JP2001160067A (ja) * 1999-09-22 2001-06-12 Ddi Corp 類似文書検索方法および該類似文書検索方法を利用した推薦記事通知サービスシステム
US6343656B1 (en) 2000-03-23 2002-02-05 Intevep, S.A. System and method for optimizing production from a rod-pumping system
GB2364814A (en) * 2000-07-12 2002-02-06 Canon Kk Speech recognition
US6636842B1 (en) 2000-07-15 2003-10-21 Intevep, S.A. System and method for controlling an industrial process utilizing process trajectories
US6629077B1 (en) 2000-11-22 2003-09-30 Universal Electronics Inc. Universal remote control adapted to receive voice input
US7283954B2 (en) * 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US6900361B2 (en) * 2001-05-08 2005-05-31 Battelle Memorial Institute Process for lactose conversion to polyols
US7269546B2 (en) * 2001-05-09 2007-09-11 International Business Machines Corporation System and method of finding documents related to other documents and of finding related words in response to a query to refine a search
US6925433B2 (en) * 2001-05-09 2005-08-02 International Business Machines Corporation System and method for context-dependent probabilistic modeling of words and documents
DE60225130T2 (de) * 2001-05-10 2009-02-26 Dolby Laboratories Licensing Corp., San Francisco Verbesserung der transientenleistung bei kodierern mit niedriger bitrate durch unterdrückung des vorgeräusches
JP5992206B2 (ja) * 2012-05-28 2016-09-14 株式会社東芝 パターン認識用辞書の学習装置、パターン認識装置、コーディング装置、区分装置、および、パターン認識用辞書の学習方法
WO2016181474A1 (ja) * 2015-05-11 2016-11-17 株式会社東芝 パターン認識装置、パターン認識方法およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63225300A (ja) * 1987-03-16 1988-09-20 株式会社東芝 パタ−ン認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3114468B2 (ja) 1993-11-25 2000-12-04 松下電器産業株式会社 音声認識方法
EP2299385A1 (en) 2009-09-16 2011-03-23 Kabushiki Kaisha Toshiba Pattern recognition method, character recognition method, pattern recognition apparatus, and character recognition apparatus
US8457413B2 (en) 2009-09-16 2013-06-04 Kabushiki Kaisha Toshiba Pattern recognition method, character recognition method, pattern recognition apparatus, and character recognition apparatus

Also Published As

Publication number Publication date
EP0335739A2 (en) 1989-10-04
EP0335739A3 (en) 1991-08-28
US5023912A (en) 1991-06-11
JPH01251100A (ja) 1989-10-06

Similar Documents

Publication Publication Date Title
JP2739950B2 (ja) パターン認識装置
TWI396184B (zh) 一種語音辨認所有語言及用語音輸入單字的方法
US6230129B1 (en) Segment-based similarity method for low complexity speech recognizer
CN112015874A (zh) 学生心理健康陪伴对话系统
JPH0372997B2 (ja)
Rabiner et al. Some performance benchmarks for isolated work speech recognition systems
Al-Haddad et al. Robust speech recognition using fusion techniques and adaptive filtering
Dave et al. Speech recognition: A review
KR100897555B1 (ko) 음성 특징벡터 추출장치 및 방법과 이를 채용하는음성인식시스템 및 방법
Birla A robust unsupervised pattern discovery and clustering of speech signals
White Speech recognition: a tutorial overview
JP3444108B2 (ja) 音声認識装置
Chandra Keyword spotting system for Tamil isolated words using Multidimensional MFCC and DTW algorithm
Aggarwal et al. Application of genetically optimized neural networks for hindi speech recognition system
Duchnowski A new structure for automatic speech recognition
Chit et al. Myanmar continuous speech recognition system using fuzzy logic classification in speech segmentation
CN114298019A (zh) 情绪识别方法、装置、设备、存储介质、程序产品
Sharma et al. Speech recognition of Punjabi numerals using synergic HMM and DTW approach
JP2502880B2 (ja) 音声認識方法
Manor et al. Voice trigger system using fuzzy logic
Laleye et al. An algorithm based on fuzzy logic for text-independent fongbe speech segmentation
Messaoud et al. Automatic segmentation of the clean speech signal
Fotinea et al. Emotion in speech: Towards an integration of linguistic, paralinguistic, and psychological analysis
Pan et al. Mandarin vowel pronunciation quality evaluation by a novel formant classification method and its combination with traditional algorithms
Zubi et al. Building a System for Arabic Dialects Identification based on Speech Recognition using Hidden Markov Models (HMMs)