JP2980026B2 - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JP2980026B2 JP2980026B2 JP8136689A JP13668996A JP2980026B2 JP 2980026 B2 JP2980026 B2 JP 2980026B2 JP 8136689 A JP8136689 A JP 8136689A JP 13668996 A JP13668996 A JP 13668996A JP 2980026 B2 JP2980026 B2 JP 2980026B2
- Authority
- JP
- Japan
- Prior art keywords
- memory
- distance
- speech recognition
- time
- units
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
Description
し、特に安価で簡単に構成できる装置によって高速に音
声を認識できる音声認識装置に関するものである。
て、NTTアドバンステクノロジ株式会社発行、Law
rence Rabiner,Billing−Hwa
ngjuang著、古井貞煕監訳「音声認識の基礎」
(1995年11月 以下参考文献1という)の第4章
242頁から288頁に記載されているDPマッチング
を用いた方法がある。
法のほかに、隠れマルコフモデル(以下、HMMとい
う)を用いた音声認識方法も第6章102頁から182
頁に記載されている。
いたものであり、特に、HMMを用いた音声認識方法の
一つであるビタビアルゴリズムを用いた音声認識の処理
方法は基本的には前述の参考文献1に示されているDP
マッチングを用いた方法と同じである。このため、本明
細書では参考文献1に記載されているDPマッチングを
用いた従来の音声認識方法を以下に説明する。
グを用いた従来の音声認識方法は、まず入力された音声
をフレーム毎に分け、フレーム毎にその特徴aiの時系
列パターンで構成される入力パターンAに変換される。
は特徴bjの時系列パターンとしてあらあかじめ用意さ
れている。
数) これら入力パターンAと標準パターンBとのパターン間
距離D(A,B)は、以下のDPマッチングの手続きに
より求められる。
パターンの特徴bjの距離を表し、また式(6)は漸化
式の代表的なもので、参考文献1に記載されているもの
である。図5に漸化式計算の対象を説明した(i,j)
平面を示す。
るような(i,j)平面上で(1,1)の初期値をもと
にして各格子点について順次漸化式計算を行う。その結
果を累積値g(i,j)としてその都度累積値メモリに
書き込んでゆき、次の格子点での漸化式計算に用い、そ
の結果を新たな累積値として累積値メモリを書き換え
る。このようにして、音声の入力パターンの特徴aiが
入力されるごとに入力パターンのフレームiに対して標
準パターンのフレームj=1,…Jの距離計算(5式)
と漸化式計算(6式)が行われる。結局、入力パターン
の特徴aiに対しては標準パターンを格納したメモリ
(標準パターンメモリ)からの標準パターンの特徴bj
の読み込みはフレームi毎にJ回、また、累積値メモリ
に対する累積値g(i,j)の書き出し・書き込みはそ
れぞれフレームi毎にJ回行われる。
得る必要があるため、上記の処理を短時間で行う必要が
ある。認識対象単語数が多くなると上記Jの値は大きく
なり、さらに高速の処理が要求される。この高速の処理
のためには、標準パターンメモリや累積値メモリへの読
み書きを高速に行う必要があり、これらのメモリには特
に高速動作可能な高価なメモリが用いられる。
には日本電気株式会社製のマイクロプロセッサV830
(μPD705100)のようなデータの読み書きが高
速に行える内部メモリと低速動作の外部メモリとを組み
合わせて処理する方法がある。このような方法の一例と
しては例えば特開昭60−130799号公報(以下、
参考文献2という)がある。この参考文献2では、入力
パターンに対する複数のフレームをまとめてひとつのブ
ロック(以下、「時間ブロック」という)とし、その時
間ブロック単位に(i,j)平面における漸化式計算を
行い、ブロック内の計算を高速な内部メモリを用いて行
うことにより全体として高速な処理を達成している。
を時間ブロック単位に計算する手順を示した概念図であ
る。ある一定のフレーム数IL分の入力パターンがそろ
った時点で、標準パターンのフレームjに関して、累積
値計算開始フレームisからis+IL−1までのフレ
ームiに対し距離計算(5式)および漸化式計算(6
式)を行う。これをj=1,…,Jにわたって行う。1
つの時間ブロックの計算終了後、is+ILを次の時間
ブロックの累積値計算開始フレームisとする。
計算は次の手順で行われている。この時、漸化式計算を
行うために、外部メモリには累積値g(i,j)(j=
1,…,J)を保持する領域(容量Jの累積値メモリ)
を確保し、内部メモリには累積値g(i,j)(i=i
s,…,is+IL−1)を保持する領域(容量ILの
ワークメモリ)を確保している。
メモリから特徴bjを読み込んで内部メモリに保持し、
内部メモリ中の入力パターンの特徴ai(i=is,
…,is+IL−1)との距離d(i,j)を計算す
る。距離d(i,j)が計算されると、次の漸化式計算
では、累積値メモリからg(is−1,j)を読み出
し、ワークメモリ中のg(is−1,j−1)と式
(6)を用いてg(is,j)を計算する。算出された
g(is,j)は次のフレームis+1での漸化式計算
に用いられると共にワークメモリに保持され、j=j+
1における漸化式計算に用いられる。これらの距離計算
および漸化式計算をi−is,…,is+IL−1にわ
たって繰り返し行う。最後に、g(is+IL−2,
j)から算出されたg(is+IL−1,j)が累積値
メモリに書き込まれる。以上の一連の動作をj=1から
Jまで繰り返す。
ブロック内では、J毎の外部メモリに対する標準パター
ンの読み出しは1回、累積値g(i,j)の読み書きの
操作もそれぞれ1回となる。このように、各時間ブロッ
ク内のフレーム数IL分の計算における外部メモリから
の標準パターンの読み出しと外部メモリへの累積値の読
み書きの頻度が参考文献1のPDマッチングを用いた方
法に比べて1/ILになる。このほかの処理は高速な内
部メモリを使って行えるので、安価な低速メモリを外部
メモリに用いても高速な音声認識が可能となる。
例えば参考文献1の第8章247頁から260頁に示さ
れているように、音節や音素など単語より小さいサブワ
ード単位に標準パターン(以下、「サブワード標準パタ
ーン」という)を準備する方法もある。このサブワード
標準パターンを用いて単語を認識する場合には、サブワ
ード標準パターンを連結して単語標準パターンを作成
し、それと入力パターンとの間でDPマッチングを行っ
ている。この場合、特に処理工数の低減のために、サブ
ワード標準パターン単位で距離計算を行った後、それら
の距離値を用いて単語標準パターン単位で漸化式計算を
行っている。
り高速で音声認識するために、参考文献2のようなブロ
ック単位に処理を行う方法を参考文献1のサブワード標
準パターンを用いた音声認識に適用する場合には、単語
標準パターン単位での漸化式計算をする時に、サブワー
ド標準パターン単位で算出した距離値をサブワードの出
現に応じて読み出す必要がある。しかしながら、サブワ
ードの出現には規則性が無く、サブワード標準パターン
単位で算出した距離値の読み出しにも規則性が無い。こ
のため、距離値を記憶しておく高速動作の可能な内部メ
モリとしては、サブワード標準パターンの全フレームの
長さの距離値を時間ブロックの長さ全体にわたって記憶
しておけるだけの大容量の高速メモリが必要になる。特
に、このような大容量のメモリをマイクロプロセッサの
内部メモリとして準備することは、マイクロプロセッサ
の価格を著しく高いものにしてしまう欠点がある。
はなく単語標準パターン単位で行えば高速な内部メモリ
の必要容量を小さくできるが、同一のサブワード標準パ
ターンに対する距離計算を何度も行う必要があり、処理
工数が多くなってしまう。このため、高速での音声認識
処理が出来なくなる欠点がある。
に鑑みてなされたもので、安価で高速処理の可能な音声
認識装置を提供することを目的とする。
動作の可能なメモリを用いて音声認識を高速で行うこと
が可能な音声認識装置を提供することにある。
容量が少ない安価なマイクロプロセッサを用いて実現可
能な音声認識装置を提供することにある。
ード単位に作成された標準パターンを記憶し、音声を入
力してフレーム毎にその特徴の時系列である入力パター
ンを求め、複数のフレームの入力パターンを時間ブロッ
クとしてまとめ、時間ブロック単位に入力パターンと前
記標準パターンとの距離を計算し、計算した時間ブロッ
ク単位の距離を記憶し、前記時間ブロック単位の距離を
記憶するメモリから高速アクセス可能なメモリへ前記時
間ブロック単位の距離を転送し、以前に漸化式計算結果
を累積した累積値と前記時間ブロック単位の距離とを時
間ブロック単位に漸化式計算し、この計算結果を累積
し、累積した累積値から音声認識結果を求める音声認識
装置を得る。
有する音声認識装置を得る。
パターンを蓄えておくサブワード標準パターンメモリ 2.入力されてくる音声をフレーム毎にその特徴の時系
列である入力パターンを求める分析部 3.この分析部で求められた入力パターンを格納する入
力パターンメモリ 4.複数のフレームの入力パターンをまとめて一つのブ
ロック(以下、時間ブロックという)とし、その時間ブ
ロック単位に各フレームにおける入力パターンと標準パ
ターンとの距離を計算する距離計算部 5.距離計算部で計算された時間ブロック単位の距離値
を格納する第1距離メモリ 6.距離計算部で計算された時間ブロック単位の距離値
を格納し、第1の距離メモリよりも高速にデータの読み
書きが行える第2の距離メモリ 7.認識対象単語に関する情報を保持する辞書メモリ 8.辞書メモリに保持されている情報を用いて必要な時
間ブロック単位の距離値を第1の距離メモリから時間ブ
ロック単位で抽出して第2の距離メモリに時間ブロック
単位で転送する距離抽出部 9.距離の累積値を格納する累積値メモリ 10.辞書メモリに保持されている認識対象単語に関す
る情報と第2の距離メモリに格納されている距離と累積
値メモリに格納されている累積値を用いて時間ブロック
単位に新たな距離の累積値を求め、その新たな距離の累
積値を累積値メモリに格納する漸化式計算部および 11.累積値メモリに格納された距離の累積値から認識
結果を決定して出力する認識結果決定部 本発明によればサブワード標準パターン単位に算出され
た距離d(i,j)を時間ブロック単位に第1の距離メ
モリから読み出すことにより、第1の距離メモリを低速
動作のメモリとしても高速な処理が可能となり、音声認
識動作を高速で行うことが可能となる。特に、距離d
(i,j)を時間ブロック単位に読み出す場合には第1
のメモリ内で距離d(i,j)データを連続するアドレ
スに格納しておけば、ブロックでの一括転送が可能であ
り、さらに高速の処理が可能となる。
リには1つの時間ブロック内の距離d(i,j)データ
だけ格納する容量があれば良いので少ない容量ですむ。
高速動作の可能なメモリは高価であり、容量が小さいだ
け安く音声認識装置を実現できる。また、小さい容量で
あれば、マイクロプロセッサ内に内部メモリとして組み
込むことも容易であり、主要部品であるマイクロプロセ
ッサも安く実現できる。
場合でも、安価な構成で高速に音声認識の処理が達成で
きる。
して説明する。
声認識装置を示すブロック図であり、図2および図3は
この第1の実施の形態による処理手順を示すフローチャ
ートである。
の音声データは分析部1で音声の入力パターンが抽出さ
れる。抽出された音声の入力パターンは入力パターンメ
モリ2に格納される。単語より小さな音節や音素などの
サブワードが予め選出されており、その標準パターンが
サブワード標準パターンメモリ4に予め格納されてい
る。これら入力パターンメモリ2の入力パターンとサブ
ワード標準パターンメモリ4内のサブワード標準パター
ンとはそれらの距離を距離計算部3で計算され、その結
果の距離値を第1距離メモリ5に格納する。認識対象単
語毎に認識対象単語を構成するサブワード列の情報は辞
書メモリ9に予め格納されている。距離抽出部6では、
辞書メモリ9のサブワード列情報に基づいて漸化式計算
に必要な距離値を第1距離メモリ5から読み出し、ブロ
ック転送によって第2距離メモリ8に転送して格納す
る。漸化式計算部7では累積値メモリ10に記憶されて
いる1つ前の時間ブロックの漸化式計算で得られた累積
値と第2距離メモリ内の距離値とを用いて漸化式計算を
ワークメモリ11、g1レジスタ12およびg2レジス
タ13を用いて行う。この漸化式計算でワークメモリ1
1は計算途中の1つの時間ブロック内のフレーム数分の
累積値を一時的に記憶するのに用いられ、漸化式計算の
処理の継続は辞書メモリ9のサブワード列情報によって
制御される。累積値メモリ10の累積値は結果決定部1
4に送られ、累積値の内容に応じて認識単語が結果出力
部16から出力される。
4、第1距離メモリ5、辞書メモリ9および累積値メモ
リ10は高速動作は要求されず、むしろ大容量のものが
要求されるので外部メモリ18としてその他の主要部を
内蔵するマイクロプロセッサに接続される。一方、入力
パターンメモリ2、第2距離メモリ8およびワークメモ
リ11は小容量でもよく、高速動作が要求されるのでマ
イクロプロセッサの内部に組み込まれる。なお、これら
入力パターンメモリ2、第2距離メモリ8およびワーク
メモリ11は高速動作を損なわないようにマイクロプロ
セッサの内部メモリとして構成した方が望ましいが、高
速動作が可能なメモリを用いてマイクロプロセッサに外
づけして用いても構わない。また、距離抽出部6では第
1距離メモリ5から第2距離メモリ8への距離値データ
の転送にブロック転送が用いられる。このブロック転送
では、図4に示すように、1つの時間ブロック転送が用
いられる。このブロック転送では、図4に示すように、
1つの時間ブロック内のフレームisからフレームis
+IL−1の距離値データが第1距離メモリ5から第2
距離メモリ8に1度にまとめて転送されるので処理を高
速に実施できる。
1のブロック図と共に図2および図3のフローチャート
を参照して説明する。尚、図2と図3は連続する処理の
流れを示しているが、便宜上これらを分けて示してい
る。
1)。累積値メモリ10のg(0,j)に“∞”を、g
(0,0)に“0”をそれぞれ初期値としてセットす
る。また、累積値計算開始フレームisの初期値として
“1”をセットする。さらに、サブワード標準パターン
Bがサブワード標準パターンメモリ4に格納される。辞
書メモリ9には認識対象単語W1を構成するサブワード
列情報{S1,S2,…,SN}(Nは単語W1の総サ
ブワード数)が格納される。
力音声に対してメルケプストラム分析等の音声分析が施
されて、音声の特徴が抽出される(ステップS2)。こ
のメルケプストラム分析については東海大学出版社から
出版されている古井貞煕著「ディジタル音声処理」に詳
しく説明されている。抽出された音声の特徴は入力パタ
ーンaiとして入力パターンメモリ2に格納されてい
る。入力音声は順次音声分析が施されて入力パターンa
iが順次入力パターンメモリ2に格納される。
s,…,ais+IL(ILは1つの時間ブロック内の
フレーム数)が入力パターンメモリ2内に格納されたら
(ステップS3)、距離計算部3での距離計算が開始さ
れる。入力パターンメモリ2から1つの入力パターンa
iが入力されるたびに、サブワード標準パターンメモリ
4からサブワード標準パターンの各フレームのパターン
b1,…,bK(Kはサブワード標準パターンの総フレ
ーム数)を順次読み出し(ステップS4)、入力パター
ンaiとの距離計算を標準パターンBのフレーム数回行
い(ステップS5)、1つの時間ブロックに対する距離
計算を実行する。各距離計算の結果の距離値d(i,
k)(i=is,…,is+IL−1;k=1,…,
K)は第1距離メモリ5に格納される(ステップS
6)。
レームのパターンb1,…,bkも入力パターンaiと
同様にメルケプストラム分析により抽出された特徴値と
同じ形式を持った値であり、入力パターンaiとサブワ
ード標準パターンの各フレームのパターンbkとの距離
値d(i,k)(i=is,…,is+IL−1;k=
1,…,K)は次の式(8)により求められる。
IL−1;k=1,…,K)は1つの時間ブロック内で
連続するように第1距離メモリ5内に格納される。
ワード情報{S1,S2,…SN}に基づいて単語Wに
対する1つの時間ブロック分の漸化式計算が以下の手順
で行われる。
われる。ワークメモリ11内のg(i,0)(i=i
s,…,is+IL−1)に“∞”を、jに初期値
“1”をそれぞれセットする。
すなわち、n=1,2,…,NのN回以下の3〜11を
繰り返し実行する(ステップS16)。
ワード標準パターンBSnのフレームk’=1,2,
…,KSn(KSnは標準パターンBSの総フレーム
数)のフレームk’に対して以下の4〜11を繰り返し
実行する。
されたサブワード標準パターンBSnのフレームk’に
対する1つの時間ブロック分の距離値d(is,k’)
〜d(is+IL−1,k’)を第2距離メモリ8にブ
ロック転送する(ステップS8,S9)。この時、第2
距離メモリ8としてキャッシュメモリを用いれば、既に
必要なデータがキャッシュメモリに格納されているかど
うかを自動的に判別し、既に格納されている時にはその
ままキャッシュメモリ内のデータを用いるというキャッ
シュ機能によってステップ8の判定機能を実行できる。
ら累積値g(is−1,j)を読み込んでg1レジスタ
12に格納する(ステップS10)。
(i=is,…,is+IL−1に対して以下の7〜9
を漸化式計算部7が繰り返し実行する。
リ8からd(i,j)として読み込み(ステップS1
1)、ワークメモリ11に保持されているg(i−1,
j−1)とg1レジスタ12に保持されているg(i−
1,j)とを用いて式(6)の漸化式計算を実行し、得
られた値g(i,j)をg2レジスタ13に保持する
(ステップS12)。
2の内容であるg(i−1,j)をg(i−1,j−
1)として書き込む(ステップS13)。
の内容であるg(i,j)を書き込む。
にg1レジスタ12の内容であるg(is+IL−1,
j)を書き込み(ステップS15)。
語Wに対して終了したら、累積値計算開始フレームをi
s=js+ILとし、ステップS2に戻る。
が終了したら(ステップS17)、結果決定部14で累
積値メモリ10の中の単語の終端フレームの累積値の中
で最も小さい値を与える単語W1を認識単語として出力
する(ステップS18)。
識される。
で行われるDPマッチングにパス{g(i−1,j−
1),g(i−1,)}を用いているが、他のパスを用
いることもできる。例えば、参考文献1ではDPマッチ
ングにパス{g(i−1,j−2),g(i−1,j−
1),g(i−1,j)}を用いており(参考文献1の
第4章256頁から288頁)、このようなパスを用い
ることも可能である。
1で説明されているHMMを用いた方法を適用すること
も可能である。この場合には、式(3)〜(7)の代わ
りに同参考文献1の第6章126頁から128頁に示さ
れている式が用いられる。
動作速度の遅いメモリを用いても少ない容量の高速動作
の可能なメモリを利用することにより音声の認識処理に
要する時間を低減することが出来る。
が行われ、その際、サブワード標準パターン単位で距離
計算を行い、その距離値を時間ブロック単位で読み書き
動作の速いメモリに転送して、漸化式計算はこの読み書
き動作の速いメモリから距離値を読み出して行っている
から、動作速度の遅いメモリを用いる処理を極めて短時
間で済ますことが出来るからである。
であるが、このようなメモリの使用は少なくてすむた
め、音声認識装置を安価に構成することが出来る。さら
に、このように少ないメモリであればマイクロプロセッ
サ内にも比較的容易に組み込むことが出来るので装置全
体を小さく構成することが出来る。
ある。
半部を示すフローチャートである。
続部を示すフローチャートである。
ック転送を説明する図である。
る図である。
(i,j)平面上で説明する図である。
Claims (8)
- 【請求項1】 サブワード単位に作成された標準パター
ンを記憶し、音声を入力してフレーム毎にその特徴の時
系列である入力パターンを求め、複数のフレームの入力
パターンを時間ブロックとしてまとめ、時間ブロック単
位に入力パターンと前記標準パターンとの距離を計算
し、計算した時間ブロック単位の距離を記憶し、前記時
間ブロック単位の距離を記憶するメモリから高速アクセ
ス可能なメモリへ前記時間ブロック単位の距離を転送
し、以前に漸化式計算結果を累積した累積値と前記時間
ブロック単位の距離とを時間ブロック単位に漸化式計算
し、この計算結果を累積し、累積した累積値から音声認
識結果を求めることを特徴とする音声認識装置。 - 【請求項2】 前記高速アクセス可能なメモリは音声認
識装置を構成するマイクロプロセッサに内蔵されている
ことを特徴とする請求項1記載の音声認識装置。 - 【請求項3】 前記高速アクセス可能なメモリはキャッ
シュメモリであることを特徴とする請求項1記載の音声
認識装置。 - 【請求項4】 予めサブワード単位に作成された標準パ
ターンを蓄えておくサブワード標準パターンメモリと、 入力されてくる音声をフレーム毎にその特徴の時系列で
ある入力パターンを求める分析部と、 前記分析部で求められた前記入力パターンを格納する入
力パターンメモリと、 複数のフレームの前記入力パターンをまとめて一つの時
間ブロックとし、その時間ブロック単位に各フレームに
おける前記入力パターンと前記標準パターンとの距離を
計算する距離計算部と、 前記距離計算部で計算された時間ブロック単位の距離値
を格納する第1の距離メモリと、 前記距離計算部で計算された時間ブロック単位の距離値
を前記第1の距離メモリからの転送を受けて格納する、
前記第1の距離メモリよりも高速にデータの読み書きが
行える第2の距離メモリと、 認識対象単語に関する情報を保持する辞書メモリと、 距離の累積値を格納する累積値メモリと、 前記辞書メモリに保持されている前記認識対象単語に関
する情報と前記第2の距離メモリに格納されている距離
値と前記累積値メモリに格納されている累積値を用いて
時間ブロック単位に新たな距離の累積値を求め、その新
たな距離の累積値を前記累積値メモリに格納する漸化式
計算部と、 前記累積値メモリに格納された距離の累積値から認識結
果を決定して出力する認識結果決定部とを有することを
特徴とする音声認識装置。 - 【請求項5】 前記音声認識装置はさらに距離抽出部を
有し、該距離抽出部は、前記辞書メモリに保持されてい
る前記情報を用いて、必要な時間ブロック単位の距離値
を前記第1の距離メモリから時間ブロック単位で抽出し
て前記第2の距離メモリに時間ブロック単位でブロック
転送することを特徴とする請求項4に記載の音声認識装
置。 - 【請求項6】 前記第2の距離メモリはキャッシュメモ
リであることを特徴とする請求項5記載の音声認識装
置。 - 【請求項7】 前記入力パターンメモリと前記第2の距
離メモリとは前記第1の距離メモリよりも高速で動作可
能なメモリで構成されていることを特徴とする請求項4
記載の音声認識装置。 - 【請求項8】 前記第2の距離メモリはキャッシュメモ
リであることを特徴とする請求項7記載の音声認識装
置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8136689A JP2980026B2 (ja) | 1996-05-30 | 1996-05-30 | 音声認識装置 |
CA002206505A CA2206505A1 (en) | 1996-05-30 | 1997-05-29 | Speech recognition system |
US08/864,914 US5909665A (en) | 1996-05-30 | 1997-05-29 | Speech recognition system |
EP97108686A EP0810583A3 (en) | 1996-05-30 | 1997-05-30 | Speech recognition system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8136689A JP2980026B2 (ja) | 1996-05-30 | 1996-05-30 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09319392A JPH09319392A (ja) | 1997-12-12 |
JP2980026B2 true JP2980026B2 (ja) | 1999-11-22 |
Family
ID=15181179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8136689A Expired - Fee Related JP2980026B2 (ja) | 1996-05-30 | 1996-05-30 | 音声認識装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5909665A (ja) |
EP (1) | EP0810583A3 (ja) |
JP (1) | JP2980026B2 (ja) |
CA (1) | CA2206505A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2216224A1 (en) * | 1997-09-19 | 1999-03-19 | Peter R. Stubley | Block algorithm for pattern recognition |
US6195639B1 (en) | 1999-05-14 | 2001-02-27 | Telefonaktiebolaget Lm Ericsson (Publ) | Matching algorithm for isolated speech recognition |
US6697457B2 (en) | 1999-08-31 | 2004-02-24 | Accenture Llp | Voice messaging system that organizes voice messages based on detected emotion |
US6275806B1 (en) * | 1999-08-31 | 2001-08-14 | Andersen Consulting, Llp | System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters |
US6353810B1 (en) | 1999-08-31 | 2002-03-05 | Accenture Llp | System, method and article of manufacture for an emotion detection system improving emotion recognition |
US6427137B2 (en) | 1999-08-31 | 2002-07-30 | Accenture Llp | System, method and article of manufacture for a voice analysis system that detects nervousness for preventing fraud |
US7590538B2 (en) * | 1999-08-31 | 2009-09-15 | Accenture Llp | Voice recognition system for navigating on the internet |
US6463415B2 (en) | 1999-08-31 | 2002-10-08 | Accenture Llp | 69voice authentication system and method for regulating border crossing |
US7222075B2 (en) * | 1999-08-31 | 2007-05-22 | Accenture Llp | Detecting emotions using voice signal analysis |
US6151571A (en) * | 1999-08-31 | 2000-11-21 | Andersen Consulting | System, method and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters |
EP1317749B1 (en) | 2000-07-31 | 2007-05-09 | Eliza Corporation | Method of and system for improving accuracy in a speech recognition system |
EP1271346A1 (en) * | 2001-06-28 | 2003-01-02 | Nokia Corporation | Method for searching data in at least two databases |
US6879954B2 (en) * | 2002-04-22 | 2005-04-12 | Matsushita Electric Industrial Co., Ltd. | Pattern matching for large vocabulary speech recognition systems |
US8255216B2 (en) * | 2006-10-30 | 2012-08-28 | Nuance Communications, Inc. | Speech recognition of character sequences |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5569880A (en) * | 1978-11-22 | 1980-05-26 | Nec Corp | Pattern recognition unit |
US4592086A (en) * | 1981-12-09 | 1986-05-27 | Nippon Electric Co., Ltd. | Continuous speech recognition system |
JP2595495B2 (ja) * | 1982-09-03 | 1997-04-02 | 日本電気株式会社 | パタンマッチング装置 |
JPS5998387A (ja) * | 1982-11-26 | 1984-06-06 | Nec Corp | メモリ回路 |
US4712243A (en) * | 1983-05-09 | 1987-12-08 | Casio Computer Co., Ltd. | Speech recognition apparatus |
JPS60179797A (ja) * | 1983-10-27 | 1985-09-13 | 日本電気株式会社 | パタンマツチング装置 |
JPS62220998A (ja) * | 1986-03-22 | 1987-09-29 | 工業技術院長 | 音声認識装置 |
EP0283902B1 (en) * | 1987-03-16 | 1993-06-30 | Nec Corporation | Pattern matching system |
JP2841404B2 (ja) * | 1989-01-12 | 1998-12-24 | 日本電気株式会社 | 連続音声認識装置 |
JPH04362698A (ja) * | 1991-06-11 | 1992-12-15 | Canon Inc | 音声認識方法及び装置 |
-
1996
- 1996-05-30 JP JP8136689A patent/JP2980026B2/ja not_active Expired - Fee Related
-
1997
- 1997-05-29 US US08/864,914 patent/US5909665A/en not_active Expired - Lifetime
- 1997-05-29 CA CA002206505A patent/CA2206505A1/en not_active Abandoned
- 1997-05-30 EP EP97108686A patent/EP0810583A3/en not_active Withdrawn
Non-Patent Citations (1)
Title |
---|
日本音響学会平成8年度秋季研究発表会講演論文集▲I▼ 2−Q−26「マルチメディアRISCによる半音節を単位とした音声認識」p.181−182(平成8年9月26日発表) |
Also Published As
Publication number | Publication date |
---|---|
US5909665A (en) | 1999-06-01 |
EP0810583A3 (en) | 1998-10-07 |
JPH09319392A (ja) | 1997-12-12 |
CA2206505A1 (en) | 1997-11-30 |
EP0810583A2 (en) | 1997-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7366669B2 (en) | Acoustic model creation method as well as acoustic model creation apparatus and speech recognition apparatus | |
JP2980026B2 (ja) | 音声認識装置 | |
JP2692581B2 (ja) | 音響カテゴリ平均値計算装置及び適応化装置 | |
US7299179B2 (en) | Three-stage individual word recognition | |
JP3459712B2 (ja) | 音声認識方法及び装置及びコンピュータ制御装置 | |
CN112750445A (zh) | 语音转换方法、装置和系统及存储介质 | |
JP2000293191A (ja) | 音声認識装置及び音声認識方法並びにその方法に用いられる木構造辞書の作成方法 | |
JPH0582599B2 (ja) | ||
WO2003060878A1 (fr) | Appareil de reconnaissance de la parole continue, procede de reconnaissance de la parole continue, programme de reconnaissance de la parole continue et support d'enregistrement de programme | |
JP2003208195A5 (ja) | ||
JP2964881B2 (ja) | 音声認識装置 | |
JP2001312293A (ja) | 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体 | |
JPH0346839B2 (ja) | ||
JP3477751B2 (ja) | 連続単語音声認識装置 | |
JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
JP3252802B2 (ja) | 音声認識装置 | |
JP3315565B2 (ja) | 音声認識装置 | |
JP3148322B2 (ja) | 音声認識装置 | |
US20240144934A1 (en) | Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium | |
JP2000099077A (ja) | 音声認識装置 | |
JP2862306B2 (ja) | 音声認識装置 | |
JPS60164800A (ja) | 音声認識装置 | |
JP3009709B2 (ja) | 日本語音声認識方法 | |
JPH09198078A (ja) | 音声認識装置 | |
JP2002006883A (ja) | 音声認識装置および音声認識方法、並びに、プログラム記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990817 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080917 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080917 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090917 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090917 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100917 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100917 Year of fee payment: 11 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100917 Year of fee payment: 11 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110917 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110917 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120917 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120917 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130917 Year of fee payment: 14 |
|
LAPS | Cancellation because of no payment of annual fees |