JP2008107408A - 音声認識装置 - Google Patents
音声認識装置 Download PDFInfo
- Publication number
- JP2008107408A JP2008107408A JP2006287803A JP2006287803A JP2008107408A JP 2008107408 A JP2008107408 A JP 2008107408A JP 2006287803 A JP2006287803 A JP 2006287803A JP 2006287803 A JP2006287803 A JP 2006287803A JP 2008107408 A JP2008107408 A JP 2008107408A
- Authority
- JP
- Japan
- Prior art keywords
- acoustic
- score
- standard pattern
- word
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】音声認識装置の使用環境を表す指標として、音声信号のSNRを計算するSNR計算部8と、SNR計算部8により計算されたSNRに応じて音響スコアと継続時間長スコアの重み係数αを計算する重み係数計算部9とを設ける。これにより、騒音が大きい場合でも高い音声認識率を保持することができる。
【選択図】図1
Description
従来の音声認識装置の構成は、例えば、以下の非特許文献1,2に詳細に開示されているが、音声を認識する際に用いる音響スコアと継続時間長スコアの寄与度は、予め定められた比率としている。
また、マイクやA/D変換器の周波数特性が、音響標準パタンを作成する際に使用された音声信号の周波数特性と異なる場合には音響スコアが低下するため、音響スコアと継続時間長スコアの寄与度のバランスが悪くなり、音声の認識率が低下することがある課題があった。
図1はこの発明の実施の形態1による音声認識装置を示す構成図であり、図において、音声区間検出部1はユーザから発声された音声を含む音声信号(入力信号)を入力すると、その音声信号の中に含まれている音声を検出して、その音声信号における音声区間(音声が含まれている区間)を検出する処理を実施する。なお、音声区間検出部1は音声区間検出手段を構成している。
音響分析部2は入力した音声信号のうち、音声区間検出部1により検出された音声区間の音声信号に対する音響分析を実施して、その音声区間の音響特徴量を抽出する処理を実施する。なお、音響分析部2は音響分析手段を構成している。
継続時間長標準パタン格納部4は短い音声片単位の継続時間長の標準パタンである継続時間長標準パタンを格納しているメモリである。
「継続時間長標準パタン」は、照合処理部10が後述する照合処理を実施したとき、音声片単位の継続時間の妥当性が高い場合には、高い照合スコアを出力させる標準パタンである。
また、「音声片」は、例えば、音節や音素であり、音響標準パタンにHMM(Hidden Markov Model)を用いる場合には1状態の単位の音声である。
音響標準パタン格納部5は音声片単位の音響標準パタンを格納しているメモリである。
単語音響標準パタン作成部7は音響標準パタン格納部5に格納されている音響標準パタンを参照して、単語辞書3に格納されている各単語に対応する単語音響標準パタンを作成する処理を実施する。
なお、継続時間長標準パタン格納部4、音響標準パタン格納部5、単語継続時間長標準パタン作成部6及び単語音響標準パタン作成部7から標準パタン作成手段が構成されている。
重み係数計算部9はSNR計算部8により計算されたSNRに応じて音響スコアと継続時間長スコアの重み係数αを計算する処理を実施する。
なお、SNR計算部8及び重み係数計算部9から重み係数算出手段が構成されている。
認識結果出力部11は照合処理部10により算出された照合スコアが高い上位数個の単語を音声認識結果として出力する処理を実施する。なお、認識結果出力部11は認識結果出力手段を構成している。
図2はこの発明の実施の形態1による音声認識装置の処理内容を示すフローチャートである。
音声区間検出部1は、ユーザから発声された音声を含む音声信号を入力すると(ステップST1)、その音声信号の中に含まれている音声を検出して、その音声信号における音声区間(音声が含まれている区間)を検出する(ステップST2)。
ここで、音声信号は、ユーザから発声された音声を含む信号がデジタル化されたものである。
音声信号のデジタル化には、例えば、サンプリング周波数が16KHz、量子化ビット数が16ビットのPCM(Pulse Code Modulation)符号化が用いられる。
なお、音声区間検出部1における音声区間の検出処理は、例えば、非特許文献2の8.2節に開示されている方法を利用すればよいので、詳細な処理内容は省略する。
ここで、SNRは、音声のパワーと、周囲の騒音のパワーとのパワー比である。SNRが高い場合には、相対的に音声パワーが大きく品質の良い音声であると言える。一方、SNRが低い場合には、相対的に騒音パワーが大きく品質の悪い音声と言える。
以下、重み係数αの計算方法について説明する。
まず、音響スコアと継続時間長スコアを用いる音声の認識処理においては、認識対象単語i(iは単語番号)を仮定する場合のスコアLiは、下記の式(4)で表される。
Li=Ai+Di (4)
ただし、Aiは単語iを仮定する場合の音響スコア、Diは単語iを仮定する場合の継続時間長スコアである。
また、継続時間長スコアDiは、単語iを構成する音声片(音素、音節、HMMの状態など)毎の継続時間を求め、後述する単語継続時間長標準パタン作成部6により作成される単語継続時間長標準パタンを用いて計算する継続時間長の妥当性を表すスコアである。
その理由は、音響標準パタン格納部5に格納されている音響標準パタン(照合処理部10が照合に用いる音響標準パタン)が、周囲に騒音が無い状況で発声した音声から作成されているので、騒音が混入している音声信号と不整合が生じるからである。
一方、継続時間長スコアDiは、周囲の騒音の影響によってスコアが低下することが無い。
したがって、音響スコアと継続時間長スコアの重み係数αが従来のように固定値であるとすると、周囲に騒音が存在する場合は、音響スコアAiの低下に伴ってスコアLiに占める音響スコアAiの比率が低くなり、誤認識を引き起こす可能性が高くなる。
即ち、重み係数計算部9は、下記の式(5)に示すように、周囲の騒音が大きくなり、SNRが悪くなるほど、重み係数αを小さな値に設定する。
これにより、騒音の影響で音響スコアAiが低下しても、継続時間長スコアとの寄与度のバランスを適正に保つことが可能になり、誤認識を減らすことができる。
α=y+SNR×z (5)
ただし、yは定数、zは正の定数である。
また、重み係数αの上限値と下限値を予め設定して、重み係数αの変動範囲を制限してもよい。
この場合、音響標準パタン格納部5に格納されている音響標準パタンを作成したときのSNRと、SNR計算部8により計算されたSNRとの差が大きくなると、不整合により音響スコアAiが低下する。
したがって、音響標準パタン格納部5に格納されている音響標準パタンを作成したときのSNRと、SNR計算部8により計算されたSNRとの差が小さい場合には、音響スコアAiと継続時間長スコアDiの重み係数αを大きな値に設定する。
一方、音響標準パタン格納部5に格納されている音響標準パタンを作成したときのSNRと、SNR計算部8により計算されたSNRとの差が大きい場合には、音響スコアAiと継続時間長スコアDiの重み係数αを小さな値に設定する。
これにより、音響スコアAiと継続時間長スコアDiの比率のバランスが適正に保たれて認識率が向上する。
音響特徴量は、音声信号を5ミリ秒〜20ミリ秒程度の一定時間間隔のフレームで切り出し、そのフレームに対する音響分析を実施して得られる音響特徴量ベクトルの時系列O=[o(1),o(2),・・・,o(T)](Tは総フレーム数)である。
なお、音響特徴量は、少ない情報量で音声の特徴を表現することができるものであり、例えば、ケプストラムの1次から12次元、ケプストラムの1次から12次元の動的特徴及び対数パワーの動的特徴の物理量で構成する特徴量ベクトルである。
単語辞書3には、音声認識の対象となる単語のテキスト表記[W(1),W(2),・・・,W(N)](括弧内は単語番号、Nは総単語数)が格納されている。
例えば、認識対象が地名の場合には、W(1)が「よこはま」、W(2)が「かまくら」、W(3)が「ふじさわ」・・・として、単語辞書3に格納されている。
後述する照合処理部10が照合処理を実施したとき、音声片単位の継続時間の妥当性が高い場合には、高いスコアを出力する標準パタンである。
ここで、音声片は、例えば、音節や音素であり、音響標準パタンにHMMを用いる場合には1状態の単位の音声である。
状態s(n)(nは状態番号)の継続時間長標準パタンψ(n)は、照合処理を実施したとき、状態s(n)に連続して割り当てられるフレーム数を継続時間長として、その妥当性をスコアとして出力する。
状態s(n)において、τフレーム連続した場合の継続時間長スコアdn(τ)は、例えば、下記の式(6)に示すような確率値で与えることができる。
dn(τ)=P(τ|Ψ(n)) (6)
単語や文をHMMで構成した際に含まれる状態s(n)の個数がC(s(n))、τフレーム連続した回数がC(τ,s(n))とすると、P(τ|Ψ(n))は、下記のように求められる。
P(τ|Ψ(n))=C(τ,s(n))/C(s(n)) (7)
その他、継続時間長の平均値と分散を求め、ガウス分布を仮定した確率密度関数を利用して、P(τ|Ψ(n))を求めるようにしてもよい。
例えば、音節と状態系列の対応が図3のような場合には、単語iのテキスト表記が「よこはま」であれば、音節「よ」に対応する継続時間長標準パタンの系列ψ(76)、ψ(92)、ψ(104)、音節「こ」に対応する継続時間長標準パタンの系列ψ(4)、ψ(9)、ψ(5)、音節「は」に対応する継続時間長標準パタンの系列ψ(10)、ψ(30)、ψ(21)、音節「ま」に対応する継続時間長標準パタンの系列ψ(101)、ψ(200)、ψ(202)を並べたものが単語継続時間長標準パタンΨ(i)になる。
音響標準パタン格納部5に格納されている音響標準パタンは、音声片単位の音響標準パタンであり、音響分析部2により抽出される音響特徴量Oに対して音響的なスコアを計算するためのものである。
音響的なスコアを計算する方法としては、例えば、HMMを用いることができる。HMMについては、非特許文献1に詳細が記載されているので説明は省略する。
以下、音声片単位がHMMの1状態の場合を例にして、単語音響標準パタンの作成方法について説明する。
単語iの単語音響標準パタン[Λ(1),Λ(2),・・・,Λ(N)](括弧内は単語番号、Nは総単語数)は、音節と状態系列の対応を予め定義しておき、単語辞書3に登録されている単語のテキスト表記W(i)にしたがって音響標準パタンを連結することにより作成する。
例えば、音節と状態系列の対応が図3のような場合には、単語iのテキスト表記が「よこはま」であれば、音節「よ」に対応する音響標準パタンの系列λ(76)、λ(92)、λ(104)、音節「こ」に対応する音響標準パタンの系列λ(4)、λ(9)、λ(5)、音節「は」に対応する音響標準パタンの系列λ(10)、λ(30)、λ(21)、音節「ま」に対応する音響標準パタンの系列λ(101)、λ(200)、λ(202)を並べたものが単語音響標準パタンΛ(i)になる。
音声片がHMMの1状態に相当する場合には、認識対象単語iの照合スコアLiは、下記の式(8)で表される。
最適状態系列Qは、例えば、非特許文献1の3章で説明されているViterbiアルゴリズムで求めることが可能である。
logP(O,Q|Λ(i))は音響スコアに相当する。HMMを用いた音響スコア計算については、非特許文献1の3章に記載されている。
図4において、横軸はフレーム時刻、縦軸は状態である。S(i,k)は単語iのk番目の状態を示し、矢印が最適パスを表している。
図4の例では、状態S(i,1)に4フレーム、状態S(i,2)に1フレーム、状態S(i,3)に3フレーム、状態S(i,4)に1フレーム、状態S(i,5)に1フレームが継続時間になっている。この場合の継続時間長スコアは、下記の式(10)で表される。
図5はこの発明の実施の形態2による音声認識装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
騒音パワー計算部21は音声認識装置の使用環境を表す指標として、音声区間検出部1により検出された音声区間ではない非音声区間のパワーから騒音パワーを計算する処理を実施する。
重み係数計算部22は騒音パワー計算部21により計算された騒音パワーに応じて音響スコアと継続時間長スコアの重み係数αを計算する処理を実施する。
なお、騒音パワー計算部21及び重み係数計算部22から重み係数算出手段が構成されている。
図6はこの発明の実施の形態2による音声認識装置の処理内容を示すフローチャートである。
以下、重み係数αの計算方法について説明する。
まず、音響スコアと継続時間長スコアを用いる音声の認識処理においては、認識対象単語iを仮定する場合のスコアLiは、前述の式(4)で表される。
その理由は、上述したように、音響標準パタン格納部5に格納されている音響標準パタン(照合処理部10が照合に用いる音響標準パタン)が、周囲に騒音が無い状況で発声した音声から作成されているので、騒音が混入している音声信号と不整合が生じるからである。
一方、継続時間長スコアDiは、周囲の騒音の影響によってスコアが低下することが無い。
したがって、音響スコアと継続時間長スコアの重み係数αが従来のように固定値であるとすると、周囲に騒音が存在する場合は、音響スコアAiの低下に伴ってスコアLiに占める音響スコアAiの比率が低くなり、誤認識を引き起こす可能性が高くなる。
即ち、重み係数計算部22は、下記の式(12)に示すように、周囲の騒音が大きくなり、騒音パワーNoiが大きくなるほど、重み係数αを小さな値に設定する。
これにより、騒音の影響で音響スコアAiが低下しても、継続時間長スコアとの寄与度のバランスを適正に保つことが可能になり、誤認識を減らすことができる。
α=y−Noi×z (12)
ただし、yは定数、zは正の定数である。
また、重み係数αの上限値と下限値を予め設定して、重み係数αの変動範囲を制限してもよい。
この場合、音響標準パタン格納部5に格納されている音響標準パタンを作成したときの騒音パワーと、騒音パワー計算部21により計算された騒音パワーとの差が大きくなると、不整合により音響スコアAiが低下する。
したがって、音響標準パタン格納部5に格納されている音響標準パタンを作成したときの騒音パワーと、騒音パワー計算部21により計算された騒音パワーとの差が小さい場合には、音響スコアAiと継続時間長スコアDiの重み係数αを大きな値に設定する。
一方、音響標準パタン格納部5に格納されている音響標準パタンを作成したときの騒音パワーと、騒音パワー計算部21により計算された騒音パワーとの差が大きい場合には、音響スコアAiと継続時間長スコアDiの重み係数αを小さな値に設定する。
これにより、音響スコアAiと継続時間長スコアDiの比率のバランスが適正に保たれて認識率が向上する。
図7はこの発明の実施の形態3による音声認識装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
音節全接続辞書31は全ての音節が接続可能であることを表す辞書である。例えば、図9に示すように、音節がネットワーク状に接続されている言語制約が音節全接続辞書31である。
音節全接続音響標準パタン作成部32は音節全接続辞書31と音響標準パタン格納部5に格納されている音響標準パタンを参照して、音節全接続音響標準パタンを作成する処理を実施する。
重み係数計算部34は音節全接続照合部33により算出された照合スコアLsに応じて音響スコアと継続時間長スコアの重み係数αを計算する処理を実施する。
なお、音節全接続辞書31、音節全接続音響標準パタン作成部32、音節全接続照合部33及び重み係数計算部34から重み係数算出手段が構成されている。
図8はこの発明の実施の形態3による音声認識装置の処理内容を示すフローチャートである。
ここで、音節全接続辞書31は全ての音節が接続可能であることを表す辞書であり、例えば、図9に示すように、音節がネットワーク状に接続されている言語制約が音節全接続辞書31である。
音節全接続音響標準パタンには、音節標準パタンΛs(1)〜Λs(Ns)(Nsは音節数)と、全音素が接続可能であるという接続ルール情報が含まれる。
照合スコアLsは、下記の式(13)に示すように、音響分析部2により抽出された音響特徴量Oに対して、照合スコアLsが最大になる音節標準パタンの最適系列Λs(p1),Λs(p2),・・・,Λs(pM)(pjは最適系列のj番目の音節番号)を求めることで計算する。
ここでは、音節全接続標準パタンを用いることでスコアを計算したが、音素全接続標準パタンやHMMの状態全接続標準パタンでスコアを計算するようにしてもよい。
以下、重み係数αの計算方法について説明する。
音節全接続照合部33により算出される照合スコアLsは、音声信号が音響標準パタン格納部5に格納されている音響標準パタンを学習した音声と、周波数特性や背景騒音環境が異なる場合には低い値となる。
この場合には、照合処理部10が計算する認識対象単語iの音響スコアAiも低い値になる。
例えば、下記の式(14)を用いることで、音節全接続照合スコアLsから重み係数αを求めることが可能である。
α=y+Ls×z (14)
ただし、yは定数、zは正の定数である。
なお、重み係数αの上限値と下限値を予め設定して、重み係数αの変動範囲を制限してもよい。
図10はこの発明の実施の形態4による音声認識装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
騒音標準パタン格納部41は周囲の騒音が大きくてSNRが低い音声の音響特徴量が入力されると高いスコアを出力させる騒音標準パタンを格納している。
騒音音響スコア計算部42は音響分析部2により抽出された音声区間の音響特徴量Oと騒音標準パタン格納部41に格納されている騒音標準パタンを照合して、騒音音響スコアLnoを計算する処理を実施する。
重み係数計算部43は騒音音響スコア計算部42により計算された騒音音響スコアLnoに応じて音響スコアと継続時間長スコアの重み係数αを計算する処理を実施する。
なお、騒音標準パタン格納部41、騒音音響スコア計算部42及び重み係数計算部43から重み係数算出手段が構成されている。
図11はこの発明の実施の形態4による音声認識装置の処理内容を示すフローチャートである。
騒音標準パタン格納部41に格納されている騒音標準パタンは、周囲の騒音が大きくて、SNRが低い音声の音響特徴量が入力されると、高いスコアを出力させる標準パタンである。騒音標準パタンは、例えば、色々な騒音データで学習した1状態のHMMで構成することができる。
騒音音響スコアLnoは、下記の式(15)によって計算することができる。
Lno=P(O|λno) (15)
ただし、λnoは騒音標準パタンである。
以下、重み係数αの計算方法について説明する。
まず、音響スコアと継続時間長スコアを用いる音声の認識処理においては、認識対象単語iを仮定する場合のスコアLiは、前述の式(4)で表される。
一方、継続時間長スコアDiは、周囲の騒音の影響によってスコアが低下することが無い。
したがって、音響スコアと継続時間長スコアの重み係数αが従来のように固定値であるとすると、周囲に騒音が存在する場合は、音響スコアAiの低下に伴ってスコアLiに占める音響スコアAiの比率が低くなり、誤認識を引き起こす可能性が高くなる。
即ち、重み係数計算部43は、下記の式(16)に示すように、騒音が存在してSNRが悪くなり、騒音音響スコアLnoが大きくなると、音響スコアAiが低下するので、重み係数αを小さな値に設定する。
これにより、騒音の影響で音響スコアAiが低下しても、継続時間長スコアとの寄与度のバランスを適正に保つことが可能になり、誤認識を減らすことができる。
α=y−Lno×z (16)
ただし、yは定数、zは正の定数である。
なお、重み係数αの上限値と下限値を予め設定して、重み係数αの変動範囲を制限してもよい。
Claims (5)
- 入力信号の中に含まれている音声を検出して、上記入力信号における音声区間を検出する音声区間検出手段と、上記音声区間検出手段により検出された音声区間に対する音響分析を実施して、上記音声区間の音響特徴量を抽出する音響分析手段と、音声認識対象の単語を格納している単語辞書と、上記単語辞書に格納されている各単語に対応する継続時間長の標準パタン及び音響の標準パタンを作成する標準パタン作成手段と、使用環境に適する音響スコアと継続時間長スコアの重み係数を算出する重み係数算出手段と、上記重み係数算出手段により算出された重み係数と上記標準パタン作成手段により作成された標準パタンを用いて、上記音響分析手段により抽出された音声区間の音響特徴量と上記単語辞書に格納されている各単語を照合し、各単語の照合スコアを算出する照合手段と、上記照合手段により算出された照合スコアが高い上位数個の単語を音声認識結果として出力する認識結果出力手段とを備えた音声認識装置。
- 重み係数算出手段は、入力信号の信号対雑音比を算出し、上記信号対雑音比に応じて音響スコアと継続時間長スコアの重み係数を算出することを特徴とする請求項1記載の音声認識装置。
- 重み係数算出手段は、音声区間検出手段により検出された音声区間ではない非音声区間のパワーから騒音パワーを算出し、上記騒音パワーに応じて音響スコアと継続時間長スコアの重み係数を算出することを特徴とする請求項1記載の音声認識装置。
- 重み係数算出手段は、音節全接続辞書と音響標準パタンを参照して、音節全接続の音響標準パタンを作成し、上記音節全接続の音響標準パタンと音響分析手段により抽出された音声区間の音響特徴量を照合して照合スコアを算出し、上記照合スコアに応じて音響スコアと継続時間長スコアの重み係数を算出することを特徴とする請求項1記載の音声認識装置。
- 重み係数算出手段は、音響分析手段により抽出された音声区間の音響特徴量と騒音標準パタンを照合して照合スコアを算出し、上記照合スコアに応じて音響スコアと継続時間長スコアの重み係数を算出することを特徴とする請求項1記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006287803A JP4749990B2 (ja) | 2006-10-23 | 2006-10-23 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006287803A JP4749990B2 (ja) | 2006-10-23 | 2006-10-23 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008107408A true JP2008107408A (ja) | 2008-05-08 |
JP4749990B2 JP4749990B2 (ja) | 2011-08-17 |
Family
ID=39440826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006287803A Expired - Fee Related JP4749990B2 (ja) | 2006-10-23 | 2006-10-23 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4749990B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101240588B1 (ko) | 2012-12-14 | 2013-03-11 | 주식회사 좋은정보기술 | 오디오-영상 융합 음성 인식 방법 및 장치 |
US9262694B2 (en) | 2011-12-16 | 2016-02-16 | Nec Corporation | Dictionary learning device, pattern matching apparatus, method for learning dictionary and storage medium |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08211897A (ja) * | 1995-02-07 | 1996-08-20 | Toyota Motor Corp | 音声認識装置 |
JP2004184856A (ja) * | 2002-12-05 | 2004-07-02 | Toyota Motor Corp | 音声認識装置 |
-
2006
- 2006-10-23 JP JP2006287803A patent/JP4749990B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08211897A (ja) * | 1995-02-07 | 1996-08-20 | Toyota Motor Corp | 音声認識装置 |
JP2004184856A (ja) * | 2002-12-05 | 2004-07-02 | Toyota Motor Corp | 音声認識装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9262694B2 (en) | 2011-12-16 | 2016-02-16 | Nec Corporation | Dictionary learning device, pattern matching apparatus, method for learning dictionary and storage medium |
KR101240588B1 (ko) | 2012-12-14 | 2013-03-11 | 주식회사 좋은정보기술 | 오디오-영상 융합 음성 인식 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP4749990B2 (ja) | 2011-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11514901B2 (en) | Anchored speech detection and speech recognition | |
US11270685B2 (en) | Speech based user recognition | |
US10755709B1 (en) | User recognition for speech processing systems | |
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
EP2048655B1 (en) | Context sensitive multi-stage speech recognition | |
JP4274962B2 (ja) | 音声認識システム | |
EP1936606B1 (en) | Multi-stage speech recognition | |
JP4911034B2 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
EP1701338B1 (en) | Speech recognition method | |
CN111566729A (zh) | 用于远场和近场声音辅助应用的利用超短语音分段进行的说话者标识 | |
RU2393549C2 (ru) | Способ и устройство для распознавания речи | |
JP5200712B2 (ja) | 音声認識装置、音声認識方法及びコンピュータプログラム | |
US20070239444A1 (en) | Voice signal perturbation for speech recognition | |
JP6699748B2 (ja) | 対話装置、対話方法及び対話用コンピュータプログラム | |
EP1734509A1 (en) | Method and system for speech recognition | |
Williams | Knowing what you don't know: roles for confidence measures in automatic speech recognition | |
Grewal et al. | Isolated word recognition system for English language | |
JP2004325635A (ja) | 音声処理装置、音声処理方法、音声処理プログラム、および、プログラム記録媒体 | |
JP4749990B2 (ja) | 音声認識装置 | |
JP2000194392A (ja) | 騒音適応型音声認識装置及び騒音適応型音声認識プログラムを記録した記録媒体 | |
JP2002189487A (ja) | 音声認識装置および音声認識方法 | |
KR20100111544A (ko) | 음성인식을 이용한 발음 교정 시스템 및 그 방법 | |
JP3615088B2 (ja) | 音声認識方法及び装置 | |
JPH11338492A (ja) | 話者認識装置 | |
JP3698511B2 (ja) | 音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080703 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110518 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4749990 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140527 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |