JPH06301400A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH06301400A
JPH06301400A JP5087127A JP8712793A JPH06301400A JP H06301400 A JPH06301400 A JP H06301400A JP 5087127 A JP5087127 A JP 5087127A JP 8712793 A JP8712793 A JP 8712793A JP H06301400 A JPH06301400 A JP H06301400A
Authority
JP
Japan
Prior art keywords
duration
unit
recognition
speech
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5087127A
Other languages
English (en)
Inventor
Yumi Takizawa
由実 滝沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5087127A priority Critical patent/JPH06301400A/ja
Priority to US08/225,630 priority patent/US5526466A/en
Priority to KR1019940007784A priority patent/KR0134158B1/ko
Publication of JPH06301400A publication Critical patent/JPH06301400A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は音声認識装置に関するもので、入力
音声の音声区間長と認識単位の継続時間の相互関係とを
用いて、次に認識しようとする認識単位の継続時間を予
測し、予測された継続時間を用いて照合および認識結果
の決定を行うことにより、同入力音声内の認識単位毎の
継続時間の差が現実的な場合のみ、認識候補として成立
させることで、高性能で高速な音声認識装置を提供する
ことを目的とする。 【構成】 入力音声の始終端を検出する音声区間検出部
3と、検出された音声区間長を用いて入力音声の認識単
位毎の継続時間を予測する継続時間予測部5と、予測し
た継続時間を利用して、認識単位毎の標準音声と入力音
声との照合および認識結果決定を行う照合部7から構成
されている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識装置に関する
ものである。
【0002】
【従来の技術】近年、不特定話者の音声認識装置におい
て、認識技術の発達と共に、小語彙だけでなく大語彙の
認識装置が開発されてきている。小語彙の認識では、標
準音声を学習する際に、予め多数話者にて全語彙を発声
してもらい、語彙全体を1つの認識単位として学習して
いた。しかし、同じ方法を大語彙に用いる場合、話者に
発声してもらう語彙数が膨大となるため現実的に学習が
困難となる。そこで、大語彙の認識では、語彙全体を小
区間に分割し、各小区間を認識単位として学習を行う方
法を採用している。これにより大語彙全てを予め発声す
る必要はなく、各認識単位を最低1つ含む語彙セットを
発声するだけで、学習が可能となる。
【0003】以下、図面を参照しながら、上述したよう
な従来の音声認識装置について説明を行う。ここでは、
認識単位が音節の場合の認識装置について述べる。
【0004】図6は、従来の単語音声認識装置のブロッ
ク図である。1は音声入力端子、2は分析部、3は音声
区間検出部、4は単語標準音声作成部、18は照合部、
8は認識結果出力端子、9は音節標準音声作成部、11
は単語辞書、12は音節標準音声保管バッファ、14は
スイッチ、15はメモリバッファである。
【0005】まず標準音声学習時には、予め単語単位で
発声された標準音声を音節単位に区分けしておき、音節
毎に音声を音声入力端子1より入力する。次に分析部2
で認識に必要なスペクトル情報が分析される。スペクト
ル情報としては、たとえばLPCケプストラム法を用い
れば所定の単位時間(以後フレームという)に所定の個
数を1組としたLPCケプストラム係数が特徴パラメー
タとして算出される。上記分析処理を、所定の個数の学
習音声データが終わるまで繰り返す。次に音節標準音声
作成部9で、音節毎に分析されたデータをクラスタリン
グし、各クラスタの中心データを音節標準音声保管バッ
ファ12に保管する。
【0006】認識時には、入力音声が音声入力端子1か
ら入力され、分析部2でフレーム毎にスペクトル情報が
分析される。分析方法は学習時と同様である。次に音声
区間検出部3で分析部にてLPCケプストラム0係数
(0次係数は、音声パワー情報である)を用いて音声区
間を検出する。音声区間条件は下記2条件である。 (1)音声パワー(0次係数値)が一定以上である。 (2)条件(1)を満たすフレームが一定個数以上継続
している。
【0007】単語辞書11には認識すべき単語名が音節
列として記載されている。次に単語標準音声作成部で、
上記単語辞書の各単語の音節列に従って、音節標準音声
保管パターンの音節標準音声を連結させ、各単語標準音
声を作成する。
【0008】次に照合部で、上記で作成された単語標準
音声と入力音声との照合を行う。照合は、各単語毎に、
(数3)に従ってiフレームまでの距離Dを求め、これ
を単語区間の始端から終端まで行った結果、距離値Dが
最小となる単語を認識結果として、結果出力端子より出
力する。
【0009】
【数3】
【0010】なおスイッチ14は、学習時にはバッファ
15に、認識時には音声区間検出部3に特徴パラメータ
を出力するように動作する。
【0011】
【発明が解決しようとする課題】しかしながら上記従来
法の標準音声は、単語単位ではなく音節単位で作成され
るため、単語単位の標準音声には反映される単語内の各
音節の相互関係に関する情報は、上記方法では音節標準
音声に反映されない。そのため、各音節の継続時間の相
互関係も考慮されておらず、同単語内の各音節のマッチ
ング区間が不自然にばらついている場合でも、距離値さ
え小さければ、認識結果として成立してしまうという課
題を有していた。
【0012】
【課題を解決するための手段】上記課題に鑑み、本発明
では、単語内の各音節継続時間は、全て同一の入力音声
区間長を用いて予測しているために、予測された各音節
の継続時間の間の関係は考慮されている。故に、同単語
内の各音節のマッチング区間が現実的な場合のみ、認識
候補として成立させることが可能となり、より高性能な
装置の実現が可能となる。
【0013】また、継続時間を予測する際に、上記の手
法に加え、さらに認識単位の継続時間を左右する要因も
用いて予測することにより、上記装置と同様に従来の課
題を解決し、より正確に予測が行われろことで、より高
性能な装置の実現が可能となる。
【0014】また、継続時間を予測する際に、上記の手
法に加え、認識単位の継続時間を左右する要因毎に、各
要因において同カテゴリーに属する認識単位の平均継続
時間を求める平均継続時間も用いて予測することによ
り、上記装置と同様に従来の課題を解決し、より正確に
予測が行われろことで、より高性能な装置の実現が可能
となる。
【0015】また、継続時間を予測する際に、上記の手
法に加え、認識単位の継続時間を左右する要因毎の認識
単位の平均継続時間と音声区間長とを用いて、(数1)
により継続時間を予測することにより、上記装置と同様
に従来の課題を解決し、より正確に予測が行われろこと
で、より高性能な装置の実現が可能となる。
【0016】また、継続時間を予測する際に、上記の手
法に加え、認識単位の継続時間を左右する要因毎の認識
単位の平均継続時間と音声区間長とを用いて、(数2)
により継続時間を予測することにより、上記装置と同様
に従来の課題を解決し、より正確に予測が行われろこと
で、より高性能な装置の実現が可能となる。
【0017】また、各音節のマッチング区間が予測され
た音節継続時間の値と近くなるように照合を行うことに
より、上記装置と同様に従来の課題を解決し、高性能な
装置の実現が可能となる。また、各認識単位の終端をを
予測値付近に限定することで、照合処理の高速化も可能
となる。
【0018】また、予測された認識単位の継続時間予測
値を用いて入力音声における認識単位毎の境界を決定
し、決定した境界付近に各認識単位の終端があるように
照合及び認識結果決定を行うことにより、上記装置と同
様に従来の課題を解決し、高性能な装置の実現が可能と
なる。また、各認識単位の終端をを境界付近に限定する
ことで、照合処理の高速化も可能となる。
【0019】
【作用】この構成によって、同単語内の各音節のマッチ
ング区間が現実的な場合のみ、認識候補として成立し、
高性能な音声認識装置の実現が可能となる。
【0020】
【実施例】以下、本発明の実施例について図を参照しな
がら説明する。
【0021】(実施例1)図1は本発明第1の実施例に
おける単語音声認識装置のブロック図である。1は音声
入力端子、2は分析部、3は音声区間検出部、4は単語
標準音声作成部、5は音節継続時間予測部、6は照合区
間決定部、7は照合部、8は認識結果出力端子、9は音
節標準音声作成部、10は重み算出部、11は単語辞
書、12は音節標準音声保管バッファ、13は平均継続
時間保管バッファ、14はスイッチ、15はバッファメ
モリである。また図2、図3は重み算出部10と継続時
間予測部5との詳細図である。図2、図3において、1
01は重み正規化部、102は要因平均部、103は予
測値算出部、6は照合範囲決定部、105は継続時間カ
ウンタ、106は平均継続時間算出部である。前記従来
例と同じものは、同一の番号を付与している。
【0022】以上のように構成された音声認識装置につ
いて以下その動作について説明する。
【0023】まず標準音声学習時には、予め単語単位で
発声された標準音声を音節単位に区分けしておき、音節
毎に音声を音声入力端子1より入力する。次に分析部2
で認識に必要なスペクトル情報が分析される。スペクト
ル情報としては、たとえばLPCケプストラム法を用い
ればフレーム毎に所定の個数を1組としたLPCケプス
トラム係数が特徴パラメータとして算出され、バッファ
メモリ15に保管される。上記分析処理を、所定の個数
の学習音声データが終わるまで繰り返す。
【0024】次に音節標準音声作成部9で、バッファメ
モリ15に保管されたデータをクラスタリングし、各ク
ラスタの中心データを音節標準音声保管バッファ12に
保管する。
【0025】次に重み算出部10で、バッファメモリ1
5に保管されたデータを(1)その音節の種類毎、(2)単語
内でその音節先行する音節の種類毎、(3)単語内でその
音節に後続する音節の種類毎に、それそれクラス分けを
行い、各々の平均継続時間f1,f2,f3を算出す
る。まず、各音節データの継続時間を継続時間カウンタ
ー105で算出する。たとえば、各データの所定の個数
を1組としたLPCケプストラム係数列の数をカウント
すればよい。次に平均継続時間算出部106で、各音節
の種類毎の継続時間の平均値を算出し、上記各音節の種
類毎に平均継続時間保管バッファ13に保管する。
【0026】認識時には、入力音声が音声入力端子1か
ら入力され、分析部2でフレーム毎にスペクトル情報が
分析される。分析方法は学習時と同様である。次に音声
区間検出部3で分析部にてLPCケプストラム0次係数
(0次係数は、音声パワー情報である)を用いて音声区
間を検出する。音声区間条件は下記2条件である。 (1)音声パワー(0次係数値)が一定以上である。 (2)条件(1)を満たすフレームが一定個数以上継続
している。
【0027】次に単語標準音声作成部4で、単語辞書1
1に記載されている単語の音節列に従って、音節標準音
声保管バッファ12にある音節標準音声を連結して単語
標準音声を作成する。方法は従来法と同様である。
【0028】次に継続時間予測部5で、学習時に求めら
れている各要因毎の平均音節区間f1,f2,f3と、
音声区間長Lを用いて、(数1)に従って音節継続時間
を予測する。
【0029】まず重み正規化部101で、要因毎に各音
節に相当する平均継続時間を単語全体の平均継続時間
で、(数4)のように正規化する。
【0030】
【数4】
【0031】次に、要因平均部102で、全ての要因
(本実施例の場合は、先行音声の種類、当該音節の種
類、後続音節の種類の3要因)を考慮するために、上記
正規化された平均継続時間を(数5)のように重み付け
加算し、予測値算出部103で、上記値を音声区間長に
(数6)のように掛けて音節継続時間予測値を算出す
る。ただし、(数5)におけるα値は、本実施例では要
因に依らず一定値とし、要因数(実施例では3)分の1
(=1/3)を用いた。
【0032】
【数5】
【0033】
【数6】
【0034】次に照合範囲決定部6で、n番目の音節の
継続時間は予測された継続時間の±β内に存在するとし
て照合範囲をこの範囲に限定して、照合部7で従来例の
数3に基づいて、音声の始端から終端まで照合し、距離
値Dを算出する。たとえば、n-1番目の音節の終端がjフ
レームであった場合、n番目の音節の終端の範囲が(数
7)に示した範囲になるように照合する。
【0035】
【数7】
【0036】単語標準音声作成部から照合までの処理を
単語辞書に記載されている全単語について行い、距離値
Dの値が最小となる単語を最終認識結果として、認識結
果出力部より出力する。なおスイッチ14は、学習時に
はバッファ15に、認識時には音声区間検出部3に特徴
パラメータを出力するように動作する。
【0037】以上のように、本実施例によれば、予め、
重み算出部で、音節継続時間を左右する要因毎に平均音
節継続時間を算出しておき、継続時間予測部で、入力音
声の音声区間長と上記平均継続時間とを用いて、(数
1)を用いて認識しようとする入力音声の認識単位毎の
継続時間を予測し、照合部で予測した継続時間を中心と
する一定範囲で照合することにより、同入力音声内の音
節毎の継続時間の差が現実的な場合のみ、認識候補とし
て成立させることが可能となり、より高性能な装置の実
現が可能となる。同時に、照合区間を限定していること
で高速の照合処理が可能となる。
【0038】(実施例2)次に、本発明第2の実施例に
ついて図を参照しながら説明する。本実施例における構
成は、図1の語音声認識装置、図3の重み算出部9の詳
細図に示す構成と同様である。また図4は継続時間予測
部5の詳細図である。107は学習音声継続時間予測
部、108は入力音声継続時間予測部である。前記従来
例と同じものは,同一の番号を付与している。
【0039】まず標準音声学習時には、上記実施例1と
同様に、音節標準音声を作成し保管バッファに保管し、
重み算出部で、要因毎の平均継続時間を算出し、重み保
管バッファに保管する。
【0040】認識時には、入力音声が音声入力端子1か
ら入力され、分析部2でフレーム毎にスペクトル情報が
分析される。分析方法は学習時と同様である。次に音声
区間検出部3で分析部にてLPCケプストラム0次係数
(0次係数は、音声パワー情報である)を用いて音声区
間を検出する。音声区間条件は下記2条件である。 (1)音声パワー(0次係数値)が一定以上である。 (2)条件(1)を満たすフレームが一定個数以上継続
している。
【0041】次に単語標準音声作成部4で、単語辞書1
1に記載されている単語の音節列に従って、音節標準音
声保管バッファ12にある音節標準音声を連結して単語
標準音声を作成する。方法は従来法と同様である。
【0042】次に音節継続時間予測部5で、学習時に求
められている各要因毎の平均音節区間f1,f2,f3
と、音声区間長Lを用いて、(数1)に従って音節継続
時間を予測する。
【0043】まず学習音声継続時間予測部107で、学
習音声における各音節の継続時間を、予め学習された要
因毎の平均音節継続時間f1,f2,f3に重み付けし
て加算する(数8)を用いて予測する。次に入力音声継
続時間予測部108で、音声区間長を用いて、上記学習
音声における音節継続時間の値を入力音声用に変換し
(数9)、予測値とする。ただし、(数8)におけるα
値は、本実施例では要因に依らず一定値とし、要因数
(実施例では3)分の1(=1/3)を用いた。
【0044】
【数8】
【0045】
【数9】
【0046】次に照合範囲決定部6で、n番目の音節の
継続時間は(数10)に示した範囲に存在するとして照
合範囲をこの範囲に限定し、照合部7で従来例の数7に
基づいて、音声の始端から終端まで照合し、距離値Dを
算出する。
【0047】
【数10】
【0048】単語標準音声作成部から照合までの処理を
単語辞書に記載されている全単語について行い、距離値
Dの値が最小となる単語を最終認識結果として、認識結
果出力部より出力する。なおスイッチ14は、学習時に
はバッファ15に、認識時には音声区間検出部3に特徴
パラメータを出力するように動作する。
【0049】以上のように、本実施例によれば、予め、
重み算出部で、音節継続時間を左右する要因毎に平均音
節継続時間を算出しておき、継続時間予測部で、入力音
声の音声区間長と上記平均継続時間とを用いて、(数
2)を用いて認識しようとする入力音声の認識単位毎の
継続時間を予測し、照合部で予測した継続時間を中心と
する一定範囲で照合することにより、同入力音声内の音
節毎の継続時間の差が現実的な場合のみ、認識候補とし
て成立させることが可能となり、より高性能な装置の実
現が可能となる。同時に、照合区間を限定していること
で高速の照合処理が可能となる。
【0050】(実施例3)次に、本発明第3の実施例に
ついて図を参照しながら説明する。図5は本発明第3の
実施例における単語音声認識装置のブロック図である。
1は音声入力端子、2は分析部、3は音声区間検出部、
4は単語標準音声作成部、5は音節継続時間予測部、1
5は境界決定部、7は照合部、8は認識結果出力端子、
9は音節標準音声作成部、10は重み算出部、11は単
語辞書、12は音節標準音声保管バッファ、13は平均
継続時間保管バッファ、14はスイッチ、15はバッフ
ァメモリである。また、図3は重み算出部10の詳細
図、図4は継続時間予測部5の詳細図であり、先の実施
例と同様である。
【0051】まず標準音声学習時には、上記実施例1と
同様に、音節標準音声を作成し保管バッファに保管し、
重み算出部で、要因毎の平均継続時間を算出し、重み保
管バッファに保管する。
【0052】認識時には、入力音声が音声入力端子1か
ら入力され、分析部2でフレーム毎にスペクトル情報が
分析される。分析方法は学習時と同様である。次に音声
区間検出部3で分析部にてLPCケプストラム0次係数
(0次係数は、音声パワー情報である)を用いて音声区
間を検出する。音声区間条件は下記2条件である。 (1)音声パワー(0次係数値)が一定以上である。 (2)条件(1)を満たすフレームが一定個数以上継続
している。
【0053】次に単語標準音声作成部4で、単語辞書1
1に記載されている単語の音節列に従って、音節標準音
声保管バッファ12にある音節標準音声を連結して単語
標準音声を作成する。方法は従来法と同様である。
【0054】次に音節継続時間予測部5で、学習時に求
められている各要因毎の平均音節区間f1,f2,f3
と、音声区間長Lを用いて、請求項第5項の数2に従っ
て音節継続時間を予測する。
【0055】まず学習音声継続時間予測部107で、学
習音声における各音節の継続時間を、予め学習された要
因毎の平均音節継続時間f1,f2,f3に重み付けし
て加算する(数8)を用いて予測する。次に入力音声継
続時間予測部108で、音声区間長を用いて、上記学習
音声における音節継続時間の値を入力音声用に変換し
(数9)、予測値とする。ただし、(数8)におけるα
値は、本実施例では要因に依らず一定値とし、要因数
(実施例では3)分の1(=1/3)を用いた。
【0056】次に境界決定部15で、n-1番目の音節とn
番目の音節との境界を、(数9)に示すk(n-1) と定義
し、照合部6でn-1番目の音節のマッチングの終端iがk
(n-1)付近になるように数10のように従来例の(数
3)のように照合を行う。
【0057】単語標準音声作成部から照合までの処理を
単語辞書に記載されている全単語について行い、距離値
Dの値が最小となる単語を最終認識結果として、認識結
果出力部より出力する。なおスイッチ13は、学習時に
はバッファ15に、認識時には音声区間検出部3に特徴
パラメータを出力するように動作する。
【0058】以上のように、本実施例によれば、予め、
重み算出部で、音節継続時間を左右する要因毎に平均音
節継続時間を算出しておき、継続時間予測部で、入力音
声の音声区間長と上記平均継続時間とを用いて、(数
2)を用いて認識しようとする入力音声の認識単位毎の
継続時間を予測し、照合部で予測した継続時間を用いて
音節の境界を決定し、境界付近を各音節のマッチングの
終端となるように照合を行うことにより、同入力音声内
の音節毎の継続時間の差が現実的な場合のみ、認識候補
として成立させることができるため、より高性能な装置
の実現が可能となる。
【0059】同時に、照合区間を限定していることで高
速の照合処理が可能となる。
【0060】
【発明の効果】以上のように本発明の音声認識装置は、
音声区間検出部で検出された音声区間長を用いて、継続
時間予測部で入力音声の認識単位の継続時間を予測し、
予測した継続時間を用いて、照合及び認識結果決定を行
うことにより、同単語内の各音節のマッチング区間が現
実的な場合のみ、認識候補として成立させることが可能
となり、より高性能な装置の実現が可能となる。
【0061】また、上記のものに加えて、さらに重み算
出部で認識単位の継続時間を左右する要因も用いて重み
を算出し、音声区間長と左記の重みを用いて認識単位の
継続時間を予測し、予測した継続時間を用いて、照合及
び認識結果決定を行うことにより、さらに予測性能が向
上し、さらに高性能な装置の実現が可能となる。
【0062】また、上記のものに加えて、さらに平均継
続時間算出部で認識単位の継続時間を左右する要因毎
に、各要因において同カテゴリーに属する認識単位の平
均継続時間を求め、音声区間長と左記の平均継続時間を
用いて認識単位の継続時間を予測し、予測した継続時間
を用いて、照合及び認識結果決定を行うことにより、さ
らに予測性能が向上し、さらに高性能な装置の実現が可
能となる。
【0063】また、上記のものに加えて、継続時間予測
部で、算出された平均継続時間(数1内のfj(t))を用
いて予め各要因毎に音声区間全長の平均継続時間と各認
識単位の平均継続時間との比を求めておき、その比を要
因全体で重みづけしながら加算した値を用いて音声区間
長Lから入力音声の認識単位毎の継続時間の予測値を算
出し、予測した継続時間を用いて、照合及び認識結果決
定を行うことにより、さらに予測性能が向上し、さらに
高性能な装置の実現が可能となる。
【0064】また上記のものに加えて、継続時間予測部
で、算出された平均継続時間(数2内のf(i))を用いて
予め学習音声における認識単位毎の継続時間を予測して
おき、この予測値を用いて音声区間全長Lから入力音声
の認識単位毎の継続時間の予測値を算出し、予測した継
続時間を用いて、照合及び認識結果決定を行うことによ
り、さらに予測性能が向上し、さらに高性能な装置の実
現が可能となる。
【0065】また上記のものに加えて、照合区間決定部
で、各認識単位の照合区間が予測された継続時間予測値
付近となるように照合区間を決定し、照合部で、決定し
た照合区間内で、各認識単位が照合されるように照合及
び認識結果決定を行うことにより、さらに予測性能が向
上し、さらに高性能な装置の実現が可能となる。また、
照合区間を限定していることで高速の照合処理が可能と
なる。
【0066】また上記のものに加えて、境界検出部で、
予測された認識単位の継続時間予測値を用いて入力音声
における認識単位毎の境界を決定し、照合部で、決定し
た境界付近に各認識単位の終端があるように照合及び認
識結果決定を行うことにより、さらに予測性能が向上
し、さらに高性能な装置の実現が可能となる。また、照
合区間を限定していることで高速の照合処理が可能とな
る。
【図面の簡単な説明】
【図1】本発明の実施例における音声認識装置のブロッ
ク図
【図2】本発明の実施例における重み算出部のブロック
【図3】本発明の実施例における継続時間予測部のブロ
ック図
【図4】本発明の実施例における継続時間予測部のブロ
ック図
【図5】本発明の実施例における音声認識装置のブロッ
ク図
【図6】従来例における音声認識装置のブロック図
【符号の説明】 1 信号入力端子 2 分析部 3 音声区間検出部 4 単語標準音声作成部 5 継続時間予測部 6 照合区間決定部 7 照合部 8 認識結果出力端子 9 音節標準音声作成部 10 重み算出部 11 単語辞書 12 音節標準音声保管バッファ 13 平均継続時間保管バッファ 14 スイッチ 15 バッファメモリ

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】入力音声の始終端を検出する音声区間検出
    部と、検出された音声区間長を用いて入力音声の認識単
    位毎の継続時間を予測する継続時間予測部と、予測した
    継続時間を利用して、認識単位毎の標準音声と入力音声
    との照合および認識結果決定を行う照合部とからなるこ
    とを特徴とする音声認識装置。
  2. 【請求項2】認識単位の継続時間を左右する要因を用い
    て重みを算出する重み算出部と、音声区間検出部で検出
    された音声区間長と重み算出部で算出された重みとを用
    いて、入力音声の認識単位毎の継続時間を予測する継続
    時間予測部と、予測した継続時間を利用して照合または
    認識結果決定を行う照合部とからなることを特徴とする
    請求項1記載の音声認識装置。
  3. 【請求項3】認識単位の継続時間を左右する要因毎に、
    各要因において同カテゴリーに属する認識単位の平均継
    続時間を求める平均継続時間算出部と、音声区間検出部
    で検出された音声区間長と平均継続時間算出部で算出さ
    れた平均継続時間を用いて、入力音声の認識単位毎の継
    続時間を予測する継続時間予測部と、予測した継続時間
    を利用して照合及び認識結果決定を行う照合部とからな
    ることを特徴とする請求項1記載の音声認識装置。
  4. 【請求項4】算出された平均継続時間(数1内のfj
    (i))を用いて、予め各要因毎に音声区間全長の平均継
    続時間と各認識単位の平均継続時間との比を求めてお
    き、その比を要因全体で重みづけしながら加算した値を
    用いて、音声区間全長Lから以下に示す(数1)に基づ
    いて入力音声の認識単位毎の継続時間の予測値を算出す
    る継続時間予測部と、予測した継続時間を利用して照合
    及び認識結果決定を行う照合部とからなることを特徴と
    する請求項3記載の音声認識装置。 【数1】
  5. 【請求項5】算出された平均継続時間f(i)を用いて、予
    め学習音声における認識単位毎の継続時間を予測してお
    き、この予測値を用いて、音声区間全長Lから以下に示
    す(数2)に基づいて入力音声の認識単位毎の継続時間
    の予測値を算出する継続時間予測部と、予測した継続時
    間を利用して照合および認識結果決定を行う照合部とか
    らなることを特徴とする請求項3記載の音声認識装置。 【数2】
  6. 【請求項6】予測された認識単位の継続時間予測値を用
    いて各音節のマッチング区間が予測された音節継続時間
    値と近い値になるように照合及び認識結果決定を行う照
    合部とからなることを特徴とする請求項2記載の音声認
    識装置。
  7. 【請求項7】予測された認識単位の継続時間予測値を用
    いて入力音声における認識単位毎の境界を決定する境界
    検出部と、決定した境界付近に各認識単位の終端がある
    ように照合及び認識結果決定を行う照合部とからなるこ
    とを特徴とする請求項2記載の音声認識装置。
JP5087127A 1993-04-14 1993-04-14 音声認識装置 Pending JPH06301400A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP5087127A JPH06301400A (ja) 1993-04-14 1993-04-14 音声認識装置
US08/225,630 US5526466A (en) 1993-04-14 1994-04-11 Speech recognition apparatus
KR1019940007784A KR0134158B1 (ko) 1993-04-14 1994-04-14 음성인식장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5087127A JPH06301400A (ja) 1993-04-14 1993-04-14 音声認識装置

Publications (1)

Publication Number Publication Date
JPH06301400A true JPH06301400A (ja) 1994-10-28

Family

ID=13906301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5087127A Pending JPH06301400A (ja) 1993-04-14 1993-04-14 音声認識装置

Country Status (1)

Country Link
JP (1) JPH06301400A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100381188B1 (ko) * 2000-09-15 2003-04-23 엘지전자 주식회사 진공 청소기용 파워 브러쉬 어셈블리

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100381188B1 (ko) * 2000-09-15 2003-04-23 엘지전자 주식회사 진공 청소기용 파워 브러쉬 어셈블리

Similar Documents

Publication Publication Date Title
US6108628A (en) Speech recognition method and apparatus using coarse and fine output probabilities utilizing an unspecified speaker model
US8271283B2 (en) Method and apparatus for recognizing speech by measuring confidence levels of respective frames
JP4202124B2 (ja) 話者独立音声認識システムのための音声テンプレートを構成するための方法及び装置
EP1355295A2 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
JP2006215564A (ja) 自動音声認識システムにおける単語精度予測方法、及び装置
JPH07506198A (ja) 複合エキスパート
KR101014086B1 (ko) 음성 처리 장치 및 방법, 및 기록 매체
JP2000172295A (ja) 低複雑性スピ―チ認識器の区分ベ―スの類似性方法
CN112750445A (zh) 语音转换方法、装置和系统及存储介质
Toruk et al. Short utterance speaker recognition using time-delay neural network
JP4666129B2 (ja) 発声速度正規化分析を用いた音声認識装置
JP3444108B2 (ja) 音声認識装置
KR20040038419A (ko) 음성을 이용한 감정인식 시스템 및 감정인식 방법
JP2001312293A (ja) 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体
JPH0772899A (ja) 音声認識装置
JP3114389B2 (ja) 音声認識装置
JPH06301400A (ja) 音声認識装置
EP1488410B1 (en) Distortion measure determination in speech recognition
JP2001083978A (ja) 音声認識装置
JP3868798B2 (ja) 音声認識装置
Dutta et al. A comparative study on feature dependency of the Manipuri language based phonetic engine
JP3293191B2 (ja) 音声認識装置
JPH07210197A (ja) 話者識別方法
JPH0997095A (ja) 音声認識装置
JP2658426B2 (ja) 音声認識方法