JP2009187000A - ユーザ音声診断装置及びユーザ音声診断方法 - Google Patents
ユーザ音声診断装置及びユーザ音声診断方法 Download PDFInfo
- Publication number
- JP2009187000A JP2009187000A JP2009003711A JP2009003711A JP2009187000A JP 2009187000 A JP2009187000 A JP 2009187000A JP 2009003711 A JP2009003711 A JP 2009003711A JP 2009003711 A JP2009003711 A JP 2009003711A JP 2009187000 A JP2009187000 A JP 2009187000A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- physical quantity
- user
- guidance
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】ユーザ音声診断装置10の音声信号入力部101は、ユーザの発声による音声信号を入力し、物理量算出部102は、入力された音声信号に基づいて母音間距離と話者固有度の両方を含む物理量を算出する。物理量提示部103は、算出された物理量をユーザに提示する。
【選択図】 図2
Description
従来から、音声認識性能に大きく影響を与える物理量として、発声音量や発声速度だけではなく、音声の信号対雑音比(SNR:Signal to Noise Ratio)が知られている。さらに、最近の研究から、母音の発音がはっきりしているかの指標となる「母音間距離」や、標準的な声質か標準的でない声質かの指標となる「話者固有度」等の物理量も大きく影響することが判明した。しかしながら、従来においては、音声認識性能に影響を与える物理量を改善し、音声認識性能を向上させる方法は存在しなかった。
本発明はこのような従来の課題を解決するためになされたものであり、その目的は、音声認識性能に影響を与えるユーザ音声の物理量の改善を支援する音声診断装置及びユーザ音声診断方法を提供することにある。
本発明によれば、物理量提示手段はレーダーチャートにより各物理量の全体のバランスを容易に示すことができる。
本発明によれば、物理量提示手段はレーダーチャートの表示領域を安全領域と危険領域との少なくとも2つの領域に分類して表示するため、ユーザは自己の発声が音声認識に適しているのか否かを視覚的に把握でき、どのような点を意識して発声すべきかを容易に認識することができる。
本発明によれば、誘導手段がガイダンスを出力することにより、ユーザの発声を改善させ、音声認識性能を向上させることが可能となる。
本発明によれば、誘導手段は安全領域から最も距離が離れている物理量から順にユーザを誘導することができるため、効率的にユーザを誘導することができる。
本発明によれば、誘導手段はガイダンスと共に模範音声を出力するため、ユーザの発声を容易に改善させることができる。
本発明によれば、誘導手段がガイダンスと模範音声を別々のスピーカから出力することで、ユーザはガイダンスと模範音声とを区別して聞き易い。
本発明によれば、物理量提示手段が模範音声の物理量をレーダーチャート表示するため、ユーザは模範音声とユーザ音声との物理量の差をレーダーチャート上で視覚的に容易に認識することができる。
本発明によれば、誘導手段は模範音声を出力した後に復唱誘導ガイダンスを出力するため、ユーザは復唱誘導ガイダンスに従って模範音声を真似て発声することができ、容易に発声を改善することができる。
本発明によれば、物理量提示手段は模範音声の物理量と再度入力された音声信号の物理量とを重ね合わせてレーダーチャート表示するため、ユーザは自己の発声が改善したのかをレーダーチャート上で容易に確認することができる。
本発明によれば、ユーザが再度発声しても物理量が危険領域に留まっている場合は、音声認識に使用する音響モデルを別の音響モデルに置換することができるため、ユーザに何度も発声させるという手間をかけずに音声認識性能を向上させることができる。
本発明によれば、文字のフォント等によりユーザの発声の物理量を視覚的に把握することが容易となる。
請求項13に記載の発明は、請求項1から12の何れか1項に記載のユーザ音声診断装置において、前記物理量提示手段は、前記物理量の代わりに前記物理量の偏差値を提示することを特徴とする。
本発明によれば、物理量提示手段は物理量の偏差値を提示するため、物理量の偏りを容易に認識できる。
本発明によれば、物理量提示手段は偏差値を分類した段階値を提示するため、ユーザの音声の認識性能を容易に把握できる。
本発明によれば、ユーザ音声診断装置は1回の音声信号の入力毎に物理量の算出及び提示を行うため、ユーザの発声の手間をかけずに効率的に処理を行うことができる。
本発明によれば、ユーザ音声診断装置は音声信号の複数回分の入力について物理量の算出及び提示を行うため、より精度の高い診断を行うことができ、より適切なユーザの誘導を行うことができる。
本発明によれば、ユーザの発声により入力された音声信号に基づいて母音間距離と話者固有度の両方を含む物理量を算出し、該物理量の少なくとも一つをユーザに提示するため、音声認識性能に影響を与えるユーザの母音間距離や話者固有度等の物理量の少なくとも一つをユーザに認識させ改善させることが可能となる。
(ユーザ音声診断装置の構成)
図1は、本発明の実施の形態に係るユーザ音声診断装置10のハードウェア構成を示すブロック図である。ユーザ音声診断装置10は、ユーザの発声による空気振動を音声信号に変換するマイクロホン(microphone)11、液晶ディスプレイ等で構成された表示装置12、音声を出力する2つのスピーカ13,14、全体を制御するCPU(Central Processing Unit)15、メモリやハードディスク等の記憶装置16を含んで構成される。記憶装置16には、音声の物理量を算出及び診断するためのプログラム、物理量を算出するために使用される標準的な音声のパターンである標準パターン、ユーザの誘導のために出力される模範音声データやガイダンス等が記憶されている。また、ユーザ音声診断装置10は、データの授受が可能なように音声認識装置20に接続されている。
音声信号入力部101は、マイクロホン11やA/Dコンバータ(不図示)等で構成され、ユーザの発声によりマイクロホン11に入力されたアナログの音声信号をデジタルの音声信号に変換して物理量算出部102に供給する。
物理量算出部102は、音声信号入力部101により入力された音声信号から物理量を算出する。物理量の算出方法としては、例えば、音声信号から一定周期のフレーム毎の特徴パラメータ系列を抽出し、当該抽出した特徴パラメータ系列から物理量を算出する。物理量には、母音間距離、話者固有度、発声速度、発声音量、SNR等が存在する。
また、SNR(=20×log10(音声のパワー/雑音のパワー))は、SNNR(=20×log10((音声のパワー+雑音のパワー)/雑音のパワー))であってもよい。
物理量提示部103は、物理量算出部102が計算した物理量をそのまま、又は診断した上でユーザに提示する。提示の方法としては、表示装置12に表示してもよいし、スピーカ13,14を用いて音声で通知してもよい。表示装置12に表示する場合には、例えば、図3に示すようなレーダーチャートを表示することができる。ここで、「レーダーチャート」とは、グラフの縦軸に相当する評価軸を複数軸以上中心から放射状に配置したグラフであり、複数の評価項目がある場合に全体のバランスを見るのに適したグラフである。さらに、物理量提示部103は、算出した物理量と、音声認識性能の高い模範音声の物理量とを重ね合わせてレーダーチャート表示することが可能である。
例えば、物理量提示部103は、算出した物理量が、複数の話者の音声信号に基づいて作成された標準パターンの分布群のどこに位置するかを示すための情報として、物理量の偏差値を算出して提示する。物理量の偏差値の算出方法としては、例えば式(2)に示す一般的な計算式を用いて、ユーザの物理量が平均値の場合には偏差値が「50」、標準偏差が「10」となるように計算する。
誘導部104は、ユーザの発声を音声ガイダンスにより誘導する。具体的には、レーダーチャート表示された物理量のうちの少なくとも1つが危険領域に含まれている場合、誘導部104は、当該危険領域に含まれている物理量が安全領域に含まれるようにユーザの発声を誘導するための音声ガイダンスをスピーカ13から出力する。図3に示すレーダーチャートにおいて色分けされた領域のうち最も外側の領域が危険領域である場合、3つの物理量(母音間距離、発声音量、発声速度)のうち母音間距離が危険領域に含まれているため、誘導部104は、例えば「もう少し滑舌良くお話ください」という音声ガイダンスを出力する。
また、誘導部104は、音声ガイダンスをスピーカ13から出力した場合、模範音声を別のスピーカ14から出力する。さらに、誘導部104は、模範音声を出力した後、ユーザに望ましい音声の復唱を促すための復唱誘導ガイダンスを出力する。なお、誘導部104による誘導は音声ガイダンスに限らず、例えば、文字を表示することによるガイダンスであってもよい。
模範音声記憶部105は、模範音声として再生して出力するための模範音声データを記憶装置16に記憶する。
なお、物理量算出部102、物理量提示部103及び誘導部104は、ユーザ音声診断装置10のCPU15が記憶装置16に記憶されているプログラムを実行することにより実現される機能である。
次に、音声認識装置20の構成について説明する。図6に示すように、音声認識装置20は、ユーザ音声診断装置10から取得した音声信号を特徴パラメータの系列に変換する音響分析部22と、音響分析部22で得られた特徴パラメータの系列を音響モデル21と照合して最も類似度の高い音声を認識結果とする照合部23と、を含んで構成される。これらの機能構成は、音声認識装置20の図示せぬCPUがメモリに記憶されたプログラムを実行することにより実現される。
次に、図7を参照して実施例1について説明する。まず、ユーザ音声診断装置10の音声信号入力部101は、ユーザの発声による音声信号を取り込む(ステップS101)。
次に、物理量算出部102は、入力された音声信号から、一定周期のフレーム毎の特徴パラメータを抽出する(ステップS104)。次に、物理量算出部102は、抽出された特徴パラメータと標準パターンを用いて、母音間距離、話者固有度、発声速度、発声音量、SNR等の物理量を算出する(ステップS107)。
をレーダーチャート、もしくはフォントや書体などで表示する(ステップS113)。
以上のように、ステップS110においてユーザの音声の特徴を標準パターンの分布に基づいて診断した結果が、ステップS113においてユーザに視覚的に把握可能となるように表示されるため、ユーザはステップS116において音声ガイダンスの誘導を受ける前にどのような点を意識して発声すべきかを知ることができるので、効率的な誘導が可能となる。なおステップS113においてユーザがより容易に視覚的に把握できるように、算出した物理量の一部のみを提示してもよい。
次に、図8を参照して、実施例2について説明する。実施例1では、ステップS104以降の処理が、ステップS101での1回のユーザの発声による音声信号の入力毎に行われる。これに対して、実施例2では、ステップS104以降の処理が、複数回(所定の回数)のユーザの発声による音声信号の入力毎に(ステップS102の判断がYESの場合に)行われる。
次に、図9を参照して実施例3について説明する。ステップS101からステップS113(音声取り込み、特徴パラメータ系列抽出、物理量算出、診断、表示)までの処理は、実施例1における処理と同じである。
ステップS114においては、診断の結果、すべての物理量が安全領域にあると判断した場合は(ステップS114;NO)、処理を中止する。一方、1つでも物理量が危険領域にあると判断した場合は(ステップS114;YES)、誘導部104は、危険領域にある物理量が安全領域に含まれるように音声ガイダンスで誘導する(ステップS116)。この際に複数の物理量が危険領域にある場合は、安全指数が最も小さい(つまり、音声認識性能が最も低い)物理量について誘導を行う。なお、安全領域から最も距離が遠い物理量について誘導を行ってもよい。誘導部104が誘導を行った後、音声信号入力部101は再び音声を取り込み(ステップS101)、上記と同じ処理を繰り返す。
以上のように、実施例3においては誘導を繰り返すので、ユーザは直前の誘導でどの程度正しく発声が出来るようになったかを安全指数を見て確認することができる。また複数の物理量が危険領域に含まれる場合は、安全指数の小さいものから誘導を行うので、効率的な誘導が可能になる。
次に、図10を参照して実施例4について説明する。実施例3では、ステップS104以降の処理が、ステップS101での1回のユーザの発声による音声信号の入力毎に行われる。これに対して、実施例4では、ステップS104以降の処理が、複数回(所定の回数)のユーザの発声による音声信号の入力毎に(ステップS102の判断がYESの場合に)行われる。
実施例4の実施例3との違いは、実施例2の実施例1との違いと同様に、所定の回数だけ音声信号を取り込み、当該取り込んだ所定の回数分の音声信号について物理量算出処理及び表示処理を行う点にある。したがって、実施例4では、実施例2と同様に、より精度の高い診断を行い、より適切な誘導を行うことが可能となる。
次に、図11を参照して実施例5について説明する。ステップS101〜114まで処理は実施例3における処理と同様である。ステップS115において、誘導部104は、ステップS116における誘導が所定の回数だけ繰り返されたか否かを判定する。所定の回数だけ誘導が繰り返されたと判定した場合(ステップS115;YES)、誘導部104はそれ以上の誘導を行わず、音声認識に使用する音響モデルを別の音響モデルに置換すべきことを音声認識装置20に通知して(ステップS117)、処理を終了する。
次に、図12を参照して実施例6について説明する。実施例5では、ステップS104以降の処理が、ステップS101における1回のユーザの発声による音声信号の入力毎に行われる。これに対して、実施例6では、ステップS104以降の処理が、複数回(所定の回数)のユーザの発声による音声信号の入力毎に(ステップS102の判断がYESの場合に)行われる。
図18及び図19に示すグラフから、左上隅に分布する(つまり、話者固有度が大きく母音間距離が小さい)と音声認識性能が低下し、右下隅に分布する(つまり、話者固有度が小さく母音間距離が大きい)と音声認識性能が上がることがわかる。また、図20に示すグラフは、音声認識性能が低い領域と高い領域とに分離していることがわかる。したがって、母音間距離及び話者固有度は音声認識性能に大きな影響を与える物理量であり、音声認識性能が低い領域の話者を高い領域に誘導することで、音声認識性能が大きく改善することがわかる。
また、音声認識装置20にユーザ音声診断装置10を接続して、音声認識装置20にとって好適な入力音声の範囲をユーザにフィードバックすることにより、その範囲に収まるようにユーザの発声を誘導することができる。さらに、何度かユーザの発声の誘導を行ってもすべての物理量が安全領域に含まれるように誘導できない場合には、音声認識装置20で使用される音響モデルをユーザの音声認識に適した音響モデルに置換することができるため、全てのユーザに精度の良い音声認識性能を提供することが可能となる。
11 マイクロホン
12 表示装置
13,14 スピーカ
16 記憶装置
101 音声信号入力部
102 物理量算出部
103 物理量提示部
1031 診断機能
104 誘導部
105 模範音声記憶部
20 音声認識装置
21 音響モデル
22 音響分析部
23 照合部
Claims (17)
- 前記物理量提示手段は、前記物理量をレーダーチャート表示することを特徴とする請求項1に記載のユーザ音声診断装置。
- 前記物理量提示手段は、前記レーダーチャートの表示領域を、音声認識性能が比較的高い物理量が分布する安全領域と、音声認識性能が比較的低い物理量が分布する危険領域と、の少なくとも2つの領域に分類して表示することを特徴とする請求項2に記載のユーザ音声診断装置。
- 前記レーダーチャート表示された物理量のうちの少なくとも1つが前記危険領域に含まれている場合、該危険領域に含まれている物理量が前記安全領域に含まれるようにユーザの発声を誘導するためのガイダンスを出力する誘導手段をさらに備えることを特徴とする請求項3に記載のユーザ音声診断装置。
- 前記危険領域に含まれている前記物理量が2つ以上存在する場合、
前記誘導手段は、前記物理量のうち前記安全領域から最も距離が遠い物理量が前記安全領域に含まれるようにユーザの発声を誘導するためのガイダンスを出力することを特徴とする請求項4に記載のユーザ音声診断装置。 - 音声認識性能が比較的高い模範音声データを予め記憶する模範音声記憶手段をさらに備え、
前記誘導手段は、前記ガイダンスを出力すると共に、前記模範音声データを再生した模範音声を出力することを特徴とする請求項4又は5に記載のユーザ音声診断装置。 - 前記誘導手段は、前記ガイダンスを第1のスピーカから出力し、前記模範音声を第2のスピーカから出力することを特徴とする請求項6に記載のユーザ音声診断装置。
- 前記物理量提示手段は、
前記模範音声の物理量を前記レーダーチャート表示することを特徴とする請求項6又は7に記載のユーザ音声診断装置。 - 前記誘導手段は、前記模範音声を出力した後、ユーザに望ましい音声を復唱させるための復唱誘導ガイダンスを出力することを特徴とする請求項6から8の何れか1項に記載のユーザ音声診断装置。
- 前記物理量提示手段は、前記模範音声の物理量と、前記復唱誘導ガイダンスが出力された後にユーザの発声により再度入力された音声信号の物理量とを重ね合わせてレーダーチャート表示することを特徴とする請求項9に記載のユーザ音声診断装置。
- 再度入力された前記ユーザの発声による音声信号の物理量が前記危険領域に含まれる場合は、
前記誘導手段は、音声認識に使用する音響モデルを別の音響モデルに置換すべき旨を音声認識装置に通知することを特徴とする請求項10に記載のユーザ音声診断装置。 - 前記物理量提示手段は、ユーザの発音に対応する文字のフォントと、該文字の大きさと、該文字の書体と、該文字間の間隔と、の少なくとも1つを用いて前記物理量を表示することを特徴とする請求項1に記載のユーザ音声診断装置。
- 前記物理量提示手段は、前記物理量の代わりに該物理量の偏差値を提示することを特徴とする請求項1から12の何れか1項に記載のユーザ音声診断装置。
- 前記物理量提示手段は、前記物理量の代わりに該物理量の偏差値を分類した段階値を提示することを特徴とする請求項1から12の何れか1項に記載のユーザ音声診断装置。
- 前記物理量算出手段及び前記物理量提示手段による処理は、前記音声信号入力手段への1回の音声信号の入力毎に行われることを特徴とする請求項1から14の何れか1項に記載のユーザ音声診断装置。
- 前記物理量算出手段及び前記物理量提示手段による処理は、前記音声信号入力手段への音声信号の複数回分の入力について行われることを特徴とする請求項1から14の何れか1項に記載のユーザ音声診断装置。
- ユーザの発声による音声信号を入力する音声信号入力ステップと、
前記音声信号入力ステップにおいて入力された音声信号に基づいて、母音間距離と話者固有度の両方を含む物理量を算出する物理量算出ステップと、
前記物理量算出ステップにおいて算出された物理量の少なくとも一つをユーザに提示する物理量提示ステップと
を備えることを特徴とするユーザ音声診断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009003711A JP5185841B2 (ja) | 2008-01-10 | 2009-01-09 | ユーザ音声診断装置及びユーザ音声診断方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008003260 | 2008-01-10 | ||
JP2008003260 | 2008-01-10 | ||
JP2009003711A JP5185841B2 (ja) | 2008-01-10 | 2009-01-09 | ユーザ音声診断装置及びユーザ音声診断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009187000A true JP2009187000A (ja) | 2009-08-20 |
JP5185841B2 JP5185841B2 (ja) | 2013-04-17 |
Family
ID=41070248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009003711A Expired - Fee Related JP5185841B2 (ja) | 2008-01-10 | 2009-01-09 | ユーザ音声診断装置及びユーザ音声診断方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5185841B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012220701A (ja) * | 2011-04-08 | 2012-11-12 | Hitachi Ltd | 音声合成装置及びその合成音声修正方法 |
CN109903777A (zh) * | 2019-01-15 | 2019-06-18 | 华南理工大学 | 一种基于元音谱空间衰减率的异常说话人与正常说话人区分方法 |
JP2019164232A (ja) * | 2018-03-19 | 2019-09-26 | 株式会社リコー | 共有端末、方法、プログラム、共有システム及び方法 |
JP2020144213A (ja) * | 2019-03-06 | 2020-09-10 | Kddi株式会社 | モデル間距離を用いた発音評価用のプログラム、装置及び方法 |
WO2021212717A1 (zh) * | 2020-04-24 | 2021-10-28 | 中科新悦(苏州)科技有限公司 | 音频数据分析方法、电子设备及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109727608B (zh) * | 2017-10-25 | 2020-07-24 | 香港中文大学深圳研究院 | 一种基于中文语音的病态嗓音评估系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61107373A (ja) * | 1984-10-31 | 1986-05-26 | 富士通株式会社 | 発声訓練装置 |
-
2009
- 2009-01-09 JP JP2009003711A patent/JP5185841B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61107373A (ja) * | 1984-10-31 | 1986-05-26 | 富士通株式会社 | 発声訓練装置 |
Non-Patent Citations (2)
Title |
---|
CSNG200200044005; 山本 一公 Kazumasa YAMAMOTO: '発話スタイルの違いが音声認識に及ぼす影響についての検討 A Study on Differences of Speaking Style and' 電子情報通信学会技術研究報告 Vol.99 No.121 IEICE Technical Report 第99巻, 19990618, 社団法人電子情報通信学会 The Institute of Electro * |
JPN6012060224; 山本 一公 Kazumasa YAMAMOTO: '発話スタイルの違いが音声認識に及ぼす影響についての検討 A Study on Differences of Speaking Style and' 電子情報通信学会技術研究報告 Vol.99 No.121 IEICE Technical Report 第99巻, 19990618, 社団法人電子情報通信学会 The Institute of Electro * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012220701A (ja) * | 2011-04-08 | 2012-11-12 | Hitachi Ltd | 音声合成装置及びその合成音声修正方法 |
JP2019164232A (ja) * | 2018-03-19 | 2019-09-26 | 株式会社リコー | 共有端末、方法、プログラム、共有システム及び方法 |
JP7091745B2 (ja) | 2018-03-19 | 2022-06-28 | 株式会社リコー | 表示端末、プログラム、情報処理システム及び方法 |
CN109903777A (zh) * | 2019-01-15 | 2019-06-18 | 华南理工大学 | 一种基于元音谱空间衰减率的异常说话人与正常说话人区分方法 |
CN109903777B (zh) * | 2019-01-15 | 2020-10-27 | 华南理工大学 | 一种基于元音谱空间衰减率的异常说话人与正常说话人区分方法 |
JP2020144213A (ja) * | 2019-03-06 | 2020-09-10 | Kddi株式会社 | モデル間距離を用いた発音評価用のプログラム、装置及び方法 |
JP7039511B2 (ja) | 2019-03-06 | 2022-03-22 | Kddi株式会社 | モデル間距離を用いた発音評価用のプログラム、装置及び方法 |
WO2021212717A1 (zh) * | 2020-04-24 | 2021-10-28 | 中科新悦(苏州)科技有限公司 | 音频数据分析方法、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5185841B2 (ja) | 2013-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dahake et al. | Speaker dependent speech emotion recognition using MFCC and Support Vector Machine | |
CN106782607B (zh) | 确定热词适合度 | |
Friedland et al. | Prosodic and other long-term features for speaker diarization | |
JP4911034B2 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
US20140207457A1 (en) | False alarm reduction in speech recognition systems using contextual information | |
JP5185841B2 (ja) | ユーザ音声診断装置及びユーザ音声診断方法 | |
EP2048655A1 (en) | Context sensitive multi-stage speech recognition | |
KR20080050311A (ko) | 음성 처리 장치 및 음성 처리 방법 및 프로그램 | |
JP5752060B2 (ja) | 情報処理装置、大語彙連続音声認識方法及びプログラム | |
JP2021152682A (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP2009128675A (ja) | 音声を認識する装置、方法およびプログラム | |
JP2016062069A (ja) | 音声認識方法、及び音声認識装置 | |
JP4769098B2 (ja) | 音声認識信頼度推定装置、その方法、およびプログラム | |
JP4353202B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
Grewal et al. | Isolated word recognition system for English language | |
US20230148275A1 (en) | Speech synthesis device and speech synthesis method | |
JP3444108B2 (ja) | 音声認識装置 | |
JP4839970B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JPH1185190A (ja) | 音声認識装置及び音声認識方法 | |
JP4259100B2 (ja) | 音声認識用未知発話検出装置及び音声認識装置 | |
JP7159655B2 (ja) | 感情推定システムおよびプログラム | |
KR20100088461A (ko) | 음성 신호를 이용한 감정 인식 장치 및 방법 | |
JP2002189487A (ja) | 音声認識装置および音声認識方法 | |
KR20100094182A (ko) | 음성 신호를 이용한 감정 인식 장치 및 방법 | |
JP4610451B2 (ja) | 音声認識装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130118 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160125 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
LAPS | Cancellation because of no payment of annual fees |