JP2011154341A - 音声認識装置、音声認識方法および音声認識プログラム - Google Patents
音声認識装置、音声認識方法および音声認識プログラム Download PDFInfo
- Publication number
- JP2011154341A JP2011154341A JP2010178952A JP2010178952A JP2011154341A JP 2011154341 A JP2011154341 A JP 2011154341A JP 2010178952 A JP2010178952 A JP 2010178952A JP 2010178952 A JP2010178952 A JP 2010178952A JP 2011154341 A JP2011154341 A JP 2011154341A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- recognition
- voice
- data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】音声認識装置1は、音声取得部2、蓄積部3、音声認識部4、判定部5および生成部6を有する。音声認識部4は、音声取得部2により取得された音声データを認識して第1の認識率を取得する。判定部5は、第1の認識率が所定の閾値以上である場合には音声データの認識結果を出力すべきものと判定する。生成部6は、第1の認識率が前記所定の閾値よりも小さい場合には、蓄積部3内の音声データを分析した結果に基づいて、蓄積部3内の音声データを補正した補正音声信号データを生成する。音声認識部4は、さらに、補正音声データを認識して第2の認識率を取得する。判定部5は、さらに、第2の認識率と第1の認識率とを比較し、高い側の認識率が得られたときの音声データの認識結果を出力すべきものと判定する。
【選択図】図1
Description
図2は、実施例2に係る音声認識装置の構成を示す図である。図2に示すように、音声認識装置100は、音声取得用マイクロホン110、アナログデジタル変換器120、スイッチ130および音声認識部140を有する。さらに、音声認識装置100は、図2に示すように、認識結果判定器150、データバッファ160、音声波形分析器170、音声波形補正器180および音声認識用パラメータ制御器190を有する。
(2)閾値B≦スコア<閾値A 遅延イベント出力
(3)スコア<閾値B 認識結果棄却
Vf0(t)>Thf0⇒Sf0(t)・・・(1)
Vf1(t)>Thf1⇒Sf1(t)・・・(2)
・・・
Vf7(t)>Thf7⇒Sf7(t)・・・(3)
図11および図12は、実施例2に係る音声認識装置による処理の流れを示す図である。
上述してきたように、実施例2によれば、音声認識装置100は、1回目の音声信号データの信頼度を示すスコアが所定の閾値を超えていない場合には、音声信号データの認識結果を出力せず、音声信号データの再認識処理を行う。このように、音声認識装置100は、複数の処理部を並列に動作させるのではなく、1つの音声認識部140で音声認識処理を行うので、音声認識処理に要するコストを抑えられる。また、1回目の音声信号データの認識処理で所定の信頼度が得られなかった場合にのみ、補正を施した音声信号データの再認識処理を実行するので、音声認識処理に要する処理時間を抑えられる。
8192≦Xmax<32767の場合 ・・・ 再音声認識フラグ無効
8192>Xmax,Xmax≧32767の場合 ・・・ 再音声認識フラグ有効
β=24576/xmax
αk+1=αk+(β―αk)×μ
ここで、μはステップサイズを示し、例えば0.1とする。なお、ステップサイズとは、ループゲインを意味する。
2048≦Xmax<8192の場合 γ=8192/xmax
Xmax>32767の場合 γ=32767/xmax
上述してきたように、実施例3によれば、音声認識装置200は、データバッファ260に蓄えられている音声信号データを用いて、次の音声認識に用いるゲイン値を更新する。このようなことから、実施例3によれば、次に音声認識の対象となる音声信号データの認識率をより向上させることができる。
図15は、実施例4に係る音声認識装置の構成を示す図である。図15に示すように、実施例4に係る音声認識装置300は、実施例3に係る音声認識装置200と基本的に同様の構成を有する。すなわち、音声取得用マイクロホン310は音声取得用マイクロホン210と同様に動作する。また、アナログデジタル変換器320はアナログデジタル変換器220と同様に動作する。また、スイッチ330はスイッチ230と同様に動作する。また、音声認識部340は音声認識部240と同様に動作する。また、認識結果判定器350は認識結果判定器250と同様に動作する。これに対して、音声認識装置300のゲイン検出器380およびゲイン補正器390は、音声認識装置200のゲイン検出器280およびゲイン補正器290とは異なる動作を実行する。以下、図16を参照しつつ、まず、ゲイン検出器380について説明する。
(A)gmax<crej
→再音声認識フラグ無効、データバッファを棄却
(B)crej≦gmax<cmin
→再音声認識フラグ有効、補正式(1)によりデータバッファを補正
(C)cmin≦gmax<cmax
→再音声認識フラグ無効、データバッファの補正なし
(D)cmax≦gmax
→再音声認識フラグ有効、補正式(2)によりデータバッファを補正
(E)csat≦smax・・・
→再音声認識フラグ無効、データバッファを棄却
上述してきたように、実施例4では、音声信号データのゲインを目標レベルに調整する場合に、非音声区間の雑音レベルの変動を抑制するので、音声認識率を低下させないようにすることができる。
図20は、実施例5に係るゲイン検出器の構成を示す図である。図20に示すように、実施例5に係るゲイン検出器380は、雑音レベル推定器388を有する点が、実施例4に係るゲイン検出器380とは異なる。
上述してきたように、実施例5では、非音声区間の雑音の振幅レベルに応じて「crej」を動的に設定するので、入力される雑音の程度に応じて、音声信号を再認識するか否か、データバッファを棄却するか否かを適切に導出できる。
上述してきたように、実施例6では、振幅レベルが「crej」以下のデータについて負ゲイン補正を行わない。例えば、上述した図17の17−2では、振幅レベルが「crej」以下のデータについて負ゲイン補正を行わない。よって、実施例6によれば、非音声区間の振幅レベルの変動をより抑えることができる。
例えば、図2に示した音声認識装置100の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、音声認識装置100の分散・統合の具体的形態は図示のものに限られず、例えば、音声波形分析器170と音声波形補正器180とを機能的または物理的に統合する。このように、音声認識装置100の全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、例えば、上述の実施例で説明した音声認識装置100〜300の各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することもできる。なお、音声認識装置100の各種の処理については、例えば、図11や図12、図17等を参照されたい。
前記音声取得部により取得された発話音声の音声データを蓄積する蓄積部と、
前記音声取得部により取得された発話音声の音声データを認識し、当該認識の結果に応じた第1の信頼度を取得する音声認識部と、
前記音声認識部により取得された第1の信頼度が所定の閾値以上である場合には前記音声データの認識結果を出力すべきものと判定する判定部と、
前記第1の信頼度が前記所定の閾値よりも小さい場合に、前記蓄積部に蓄積されている音声データを分析し、当該分析した結果に基づいて前記蓄積されている音声データを補正することにより補正音声データを生成する生成部と
を有し、
前記音声認識部は、さらに、前記補正音声データを認識し、当該認識の結果に応じた第2の信頼度を取得し、
前記判定部は、さらに、前記第2の信頼度と前記第1の信頼度とを比較し、高い側の信頼度が得られたときの音声データの認識結果を出力すべきものと判定することを特徴とする音声認識装置。
前記発話特徴取得部により取得された発話特徴に応じて、前記音声認識部が前記補正音声データの認識に用いる認識パラメータを制御するパラメータ制御部と
をさらに有することを特徴とする付記1に記載の音声認識装置。
前記蓄積部は、前記検出された音声区間に基づいて前記音声データを音声区間と雑音区間とに分割し、
前記生成部は、前記音声データの音声区間および雑音区間をそれぞれ分析することにより、前記音声区間のパワーレベルおよび雑音区間のノイズレベルを取得し、当該取得したパワーレベルに応じたゲイン倍率および当該取得したノイズレベルに応じた減算率を用いて前記音声データを補正することにより前記補正音声データを生成することを特徴とする付記2に記載の音声認識装置。
前記蓄積部により蓄積された音声データの振幅の絶対値の中から当該振幅の最大値を検出し、当該検出した最大値を用いて、前記音声取得部により次に取得される音声データを補正するためのゲイン値を算出するゲイン値算出部と、
前記ゲイン値算出部により算出されたゲイン値に応じて、前記音声取得部により取得された音声データのゲイン補正に用いるゲイン値を更新するゲイン更新部と
を有することを特徴とする付記1に記載の音声認識装置。
前記生成部は、前記蓄積部により蓄積された音声データの振幅の絶対値の中から検出された当該振幅の最大値と前記再認識用ゲイン値とを用いて、前記蓄積部により蓄積された音声データを補正することにより前記補正音声データを生成することを特徴とする付記1に記載の音声認識装置。
ユーザの発話音声を取得する音声取得ステップと、
前記音声取得ステップにより取得された発話音声の音声データを蓄積部に蓄積する蓄積ステップと、
前記音声取得ステップにより取得された発話音声の音声データを前記音声認識エンジンに入力することにより、当該音声認識エンジンによる音声データの認識結果に応じた第1の信頼度を取得する第1の音声認識ステップと、
前記第1の音声認識ステップにより取得された第1の信頼度が所定の閾値以上である場合には前記音声データの認識結果を出力すべきものと判定する第1の判定ステップと、
前記第1の信頼度が前記所定の閾値よりも小さい場合に、前記蓄積ステップにより蓄積部に蓄積されている音声データを分析し、当該分析した結果に基づいて前記蓄積されている音声データを補正することにより補正音声データを生成する生成ステップと、
前記生成ステップにより生成された前記補正音声データを前記音声認識エンジンに入力することにより、当該音声認識エンジンによる補正音声データの認識結果に応じた第2の信頼度を取得する第2の音声認識ステップと、
前記第2の音声認識ステップにより取得された前記第2の信頼度と、前記第1の音声認識ステップにより取得された前記第1の信頼度とを比較し、高い側の信頼度が得られたときの音声データの認識結果を出力すべきものと判定する第2の判定ステップと
を含んだことを特徴とする音声認識方法。
ユーザの発話音声を取得する音声取得手順と、
前記音声取得手順により取得された発話音声の音声データを蓄積部に蓄積する蓄積手順と、
前記音声取得手順により取得された発話音声の音声データを前記音声認識エンジンに入力することにより、当該音声認識エンジンによる音声データの認識結果に応じた第1の信頼度を取得する第1の音声認識手順と、
前記第1の音声認識手順により取得された第1の信頼度が所定の閾値以上である場合には前記音声データの認識結果を出力すべきものと判定する第1の判定手順と、
前記第1の信頼度が前記所定の閾値よりも小さい場合に、前記蓄積手順により蓄積部に蓄積されている音声データを分析し、当該分析した結果に基づいて前記蓄積されている音声データを補正することにより補正音声データを生成する生成手順と、
前記生成手順により生成された前記補正音声データを前記音声認識エンジンに入力することにより、当該音声認識エンジンによる補正音声データの認識結果に応じた第2の信頼度を取得する第2の音声認識手順と、
前記第2の音声認識手順により取得された前記第2の信頼度と、前記第1の音声認識手順により取得された前記第1の信頼度とを比較し、高い側の信頼度が得られたときの音声データの認識結果を出力すべきものと判定する第2の判定手順と
をコンピュータに実行させることを特徴とする音声認識プログラム。
2 音声取得部
3 蓄積部
4 音声認識部
5 判定部
6 生成部
100 音声認識装置
110 音声取得用マイクロホン
120 アナログデジタル変換器
130 スイッチ
140 音声認識部
150 認識結果判定器
160 データバッファ
170 音声波形分析器
171 ノイズレベル検出器
172 最適信号振幅演算器
173 スペクトログラム計算器
174 発話特徴検出器
180 音声波形補正器
190 音声認識用パラメータ制御器
191 単音節用単語辞書
192 長音用単語辞書
193 音素モデル
200 音声認識装置
210 音声取得用マイクロホン
220 アナログデジタル変換器
230 スイッチ
240 音声認識部
250 認識結果判定器
260 データバッファ
270 ゲイン補正器
280 ゲイン検出器
281 最大値検出器
282 ゲイン補正器
283 閾値判定器
284 最適ゲイン計算器
285 ゲイン更新器
286 ゲインメモリ
287 補正用ゲイン計算器
290 ゲイン補正器
300 音声認識装置
310 音声取得用マイクロホン
320 アナログデジタル変換器
330 スイッチ
340 音声認識部
350 認識結果判定器
360 データバッファ
370 ゲイン補正器
380 ゲイン検出器
381 最大値検出器
382 ゲイン補正器
383 閾値判定器
384 最適ゲイン計算器
385 ゲイン更新器
386 ゲインメモリ
387 補正用ゲイン計算器
388 雑音レベル推定器
390 ゲイン補正器
400 コンピュータ
401 入力装置
402 モニタ
403 RAM
403a 各種データ
404 ROM
405 CPU
405a 音声認識プロセス
406 HDD
406a 音声認識プログラム
Claims (7)
- ユーザの発話音声を取得する音声取得部と、
前記音声取得部により取得された発話音声の音声データを蓄積する蓄積部と、
前記音声取得部により取得された発話音声の音声データを認識し、当該認識の結果に応じた第1の信頼度を取得する音声認識部と、
前記音声認識部により取得された第1の信頼度が所定の閾値以上である場合には前記音声データの認識結果を出力すべきものと判定する判定部と、
前記第1の信頼度が前記所定の閾値よりも小さい場合に、前記蓄積部に蓄積されている音声データを分析し、当該分析した結果に基づいて前記蓄積されている音声データを補正することにより補正音声データを生成する生成部と
を有し、
前記音声認識部は、さらに、前記補正音声データを認識し、当該認識の結果に応じた第2の信頼度を取得し、
前記判定部は、さらに、前記第2の信頼度と前記第1の信頼度とを比較し、高い側の信頼度が得られたときの音声データの認識結果を出力すべきものと判定することを特徴とする音声認識装置。 - 前記蓄積部に蓄積されている音声データの周波数の時間変化に基づいて、当該音声データが単音節発話または長音発話のいずれの発話特徴を取得する発話特徴取得部と、
前記発話特徴取得部により取得された発話特徴に応じて、前記音声認識部が前記補正音声データの認識に用いる認識パラメータを制御するパラメータ制御部と
をさらに有することを特徴とする請求項1に記載の音声認識装置。 - 前記音声取得部により取得された音声データをゲイン補正するゲイン補正部と、
前記蓄積部により蓄積された音声データの振幅の絶対値の中から当該振幅の最大値を検出し、当該検出した最大値を用いて、前記音声取得部により次に取得される音声データを補正するためのゲイン値を算出するゲイン値算出部と、
前記ゲイン値算出部により算出されたゲイン値に応じて、前記音声取得部により取得された音声データのゲイン補正に用いるゲイン値を更新するゲイン更新部と
を有することを特徴とする請求項1に記載の音声認識装置。 - 前記蓄積部により蓄積された音声データを再認識する場合に、再認識対象となる音声データのゲイン補正に用いる再認識用ゲイン値を算出する再認識用ゲイン値算出部をさらに有し、
前記生成部は、前記蓄積部により蓄積された音声データの振幅の絶対値の中から検出された当該振幅の最大値と前記再認識用ゲイン値とを用いて、該蓄積部により蓄積された音声データを補正することにより前記補正音声データを生成することを特徴とする請求項1に記載の音声認識装置。 - 前記生成部は、前記音声データの振幅に応じて、該振幅の小さい箇所よりも該振幅の大きい箇所の方が該振幅の調整が行われるようにゲインを上げる補正または下げる補正を行うことにより、前記補正音声データを生成することを特徴とする請求項4に記載の音声認識装置。
- 音声認識エンジンを用いて音声認識装置が音声データの認識を行う音声認識方法であって、
ユーザの発話音声を取得する音声取得ステップと、
前記音声取得ステップにより取得された発話音声の音声データを蓄積部に蓄積する蓄積ステップと、
前記音声取得ステップにより取得された発話音声の音声データを前記音声認識エンジンに入力することにより、当該音声認識エンジンによる音声データの認識結果に応じた第1の信頼度を取得する第1の音声認識ステップと、
前記第1の音声認識ステップにより取得された第1の信頼度が所定の閾値以上である場合には前記音声データの認識結果を出力すべきものと判定する第1の判定ステップと、
前記第1の信頼度が前記所定の閾値よりも小さい場合に、前記蓄積ステップにより蓄積部に蓄積されている音声データを分析し、当該分析した結果に基づいて前記蓄積されている音声データを補正することにより補正音声データを生成する生成ステップと、
前記生成ステップにより生成された前記補正音声データを前記音声認識エンジンに入力することにより、当該音声認識エンジンによる補正音声データの認識結果に応じた第2の信頼度を取得する第2の音声認識ステップと、
前記第2の音声認識ステップにより取得された前記第2の信頼度と、前記第1の音声認識ステップにより取得された前記第1の信頼度とを比較し、高い側の信頼度が得られたときの音声データの認識結果を出力すべきものと判定する第2の判定ステップと
を含んだことを特徴とする音声認識方法。 - 音声認識エンジンを用いた音声データの認識処理をコンピュータに実行させる音声認識プログラムであって、
ユーザの発話音声を取得する音声取得手順と、
前記音声取得手順により取得された発話音声の音声データを蓄積部に蓄積する蓄積手順と、
前記音声取得手順により取得された発話音声の音声データを前記音声認識エンジンに入力することにより、当該音声認識エンジンによる音声データの認識結果に応じた第1の信頼度を取得する第1の音声認識手順と、
前記第1の音声認識手順により取得された第1の信頼度が所定の閾値以上である場合には前記音声データの認識結果を出力すべきものと判定する第1の判定手順と、
前記第1の信頼度が前記所定の閾値よりも小さい場合に、前記蓄積手順により蓄積部に蓄積されている音声データを分析し、当該分析した結果に基づいて前記蓄積されている音声データを補正することにより補正音声データを生成する生成手順と、
前記生成手順により生成された前記補正音声データを前記音声認識エンジンに入力することにより、当該音声認識エンジンによる補正音声データの認識結果に応じた第2の信頼度を取得する第2の音声認識手順と、
前記第2の音声認識手順により取得された前記第2の信頼度と、前記第1の音声認識手順により取得された前記第1の信頼度とを比較し、高い側の信頼度が得られたときの音声データの認識結果を出力すべきものと判定する第2の判定手順と
をコンピュータに実行させることを特徴とする音声認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010178952A JP2011154341A (ja) | 2009-12-28 | 2010-08-09 | 音声認識装置、音声認識方法および音声認識プログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009298882 | 2009-12-28 | ||
JP2009298882 | 2009-12-28 | ||
JP2010178952A JP2011154341A (ja) | 2009-12-28 | 2010-08-09 | 音声認識装置、音声認識方法および音声認識プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011154341A true JP2011154341A (ja) | 2011-08-11 |
Family
ID=44540325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010178952A Pending JP2011154341A (ja) | 2009-12-28 | 2010-08-09 | 音声認識装置、音声認識方法および音声認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011154341A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015069600A (ja) * | 2013-09-30 | 2015-04-13 | 株式会社東芝 | 音声翻訳システム、方法およびプログラム |
CN105590624A (zh) * | 2014-11-10 | 2016-05-18 | 现代自动车株式会社 | 车辆中的语音识别系统及其方法 |
WO2017068826A1 (ja) * | 2015-10-23 | 2017-04-27 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JPWO2021019775A1 (ja) * | 2019-08-01 | 2021-11-04 | 三菱電機株式会社 | 多言語音声認識装置および多言語音声認識方法 |
JP7446900B2 (ja) | 2020-04-16 | 2024-03-11 | 株式会社日立製作所 | 対話装置、対話システム及び対話方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001215996A (ja) * | 2000-01-31 | 2001-08-10 | Sumitomo Electric Ind Ltd | 音声認識装置 |
JP2004198597A (ja) * | 2002-12-17 | 2004-07-15 | Advanced Telecommunication Research Institute International | 音声認識装置および文分類装置としてコンピュータを動作させるコンピュータプログラム、階層化された言語モデルを作成する方法を実現する様にコンピュータを動作させるコンピュータプログラム、および記憶媒体 |
JP2007057844A (ja) * | 2005-08-24 | 2007-03-08 | Fujitsu Ltd | 音声認識システムおよび音声処理システム |
-
2010
- 2010-08-09 JP JP2010178952A patent/JP2011154341A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001215996A (ja) * | 2000-01-31 | 2001-08-10 | Sumitomo Electric Ind Ltd | 音声認識装置 |
JP2004198597A (ja) * | 2002-12-17 | 2004-07-15 | Advanced Telecommunication Research Institute International | 音声認識装置および文分類装置としてコンピュータを動作させるコンピュータプログラム、階層化された言語モデルを作成する方法を実現する様にコンピュータを動作させるコンピュータプログラム、および記憶媒体 |
JP2007057844A (ja) * | 2005-08-24 | 2007-03-08 | Fujitsu Ltd | 音声認識システムおよび音声処理システム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015069600A (ja) * | 2013-09-30 | 2015-04-13 | 株式会社東芝 | 音声翻訳システム、方法およびプログラム |
CN105590624A (zh) * | 2014-11-10 | 2016-05-18 | 现代自动车株式会社 | 车辆中的语音识别系统及其方法 |
CN105590624B (zh) * | 2014-11-10 | 2020-11-03 | 现代自动车株式会社 | 车辆中的语音识别系统及其方法 |
WO2017068826A1 (ja) * | 2015-10-23 | 2017-04-27 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JPWO2021019775A1 (ja) * | 2019-08-01 | 2021-11-04 | 三菱電機株式会社 | 多言語音声認識装置および多言語音声認識方法 |
JP7038919B2 (ja) | 2019-08-01 | 2022-03-18 | 三菱電機株式会社 | 多言語音声認識装置および多言語音声認識方法 |
JP7446900B2 (ja) | 2020-04-16 | 2024-03-11 | 株式会社日立製作所 | 対話装置、対話システム及び対話方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180114525A1 (en) | Method and system for acoustic data selection for training the parameters of an acoustic model | |
EP2048655B1 (en) | Context sensitive multi-stage speech recognition | |
US6553342B1 (en) | Tone based speech recognition | |
JP4911034B2 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
JP2011033680A (ja) | 音声処理装置及び方法、並びにプログラム | |
EP2083417B1 (en) | Sound processing device and program | |
JP6759898B2 (ja) | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム | |
JP2011154341A (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JPH10133693A (ja) | 音声認識装置 | |
JP2015068897A (ja) | 発話の評価方法及び装置、発話を評価するためのコンピュータプログラム | |
JP5647455B2 (ja) | 音声に含まれる吸気音を検出する装置、方法、及びプログラム | |
KR101122590B1 (ko) | 음성 데이터 분할에 의한 음성 인식 장치 및 방법 | |
JP6996185B2 (ja) | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム | |
KR101122591B1 (ko) | 핵심어 인식에 의한 음성 인식 장치 및 방법 | |
JP5621786B2 (ja) | 音声検出装置、音声検出方法、および音声検出プログラム | |
JPH06110488A (ja) | 音声検出方法および音声検出装置 | |
US20090063149A1 (en) | Speech retrieval apparatus | |
JP4349415B2 (ja) | 音信号処理装置およびプログラム | |
KR20100111544A (ko) | 음성인식을 이용한 발음 교정 시스템 및 그 방법 | |
JP5157474B2 (ja) | 音処理装置およびプログラム | |
JP4749990B2 (ja) | 音声認識装置 | |
Khalifa et al. | Statistical modeling for speech recognition | |
JP2001005483A (ja) | 単語音声認識方法及び単語音声認識装置 | |
JP2001083978A (ja) | 音声認識装置 | |
JP2011180308A (ja) | 音声認識装置及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130604 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140402 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150106 |