JP2007017733A - 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体 - Google Patents
入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体 Download PDFInfo
- Publication number
- JP2007017733A JP2007017733A JP2005199749A JP2005199749A JP2007017733A JP 2007017733 A JP2007017733 A JP 2007017733A JP 2005199749 A JP2005199749 A JP 2005199749A JP 2005199749 A JP2005199749 A JP 2005199749A JP 2007017733 A JP2007017733 A JP 2007017733A
- Authority
- JP
- Japan
- Prior art keywords
- input
- unit
- parameter
- presentation
- similarity calculation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 パラメータ抽出部2は入力音声から各パラメータ値を抽出する。入力提示部7は、演算情報テーブル8およびターゲットパラメータ9に基づいて類似度演算用ターゲットパラメータを生成し、視覚的または聴覚的に提示する。類似度演算部4は、上記抽出された各パラメータ値と上記生成された各ターゲットパラメータ値との差分の二乗の重み付き和を、類似度として算出する。操作部5は、上記算出された類似度に従って対象に操作を行う。したがって、上記類似度演算用ターゲットパラメータのごとく予め指定されたパラメータとの類似度や、2つの音声入力から抽出されたパラメータの類似度や、代表的な音声入力から抽出されたパラメータと複数の音声入力から抽出されたパラメータとの類似度等、類似度演算方法を様々変えることによって、複数の音声入力に関連付けた操作を行うことが可能になる。
【選択図】図1
Description
入力された音声を音声データに変換する音声データ入力部と、
上記音声データ入力部に入力すべき音声の内容と音響パラメータの大きさおよび変動とを含む提示情報の提示を行う入力提示部と、
上記音声データ入力部で得られた音声データから音響パラメータを抽出するパラメータ抽出部と、
上記パラメータ抽出部で抽出された音響パラメータの値と予め設定されたターゲットパラメータの値との差に基づく類似度を算出する類似度演算部と、
上記類似度演算部で算出された類似度に応じて、予め定められた操作を行う操作部と
を備えたことを特徴としている。
上記入力提示部は、上記類似度演算部によって上記類似度を算出する際に用いられる類似度演算用ターゲットパラメータを生成し、この生成された類似度演算用ターゲットパラメータの大きさおよび変動を含む提示情報の提示を行うようになっている。
上記入力提示部は、上記類似度演算用ターゲットパラメータの大きさおよび変動を含む提示情報を、テキストの表示,画像の表示,上記テキストあるいは画像の表示形状,上記テキストあるいは画像の色,上記テキストあるいは画像の表示位置,上記テキストあるいは画像の動きおよびそれらの組み合わせによって提示するようになっている。
上記入力提示部は、上記類似度演算用ターゲットパラメータの大きさおよび変動を含む提示情報を、音声によって提示するようになっている。
上記入力提示部は、上記類似度演算用ターゲットパラメータの大きさおよび変動を含む提示情報を、テキスト音声合成によって生成された合成音声によって提示するようになっている。
上記類似度演算部は、上記予め設定されたターゲットパラメータとして、上記入力提示部によって生成された類似度演算用ターゲットパラメータを用いるようになっている。
上記類似度演算部の演算結果に基づいて、上記入力された音声から抽出された音響パラメータの上記予め設定されたターゲットパラメータに対する誤差を演算し、この演算結果を提示する誤差情報提示部を備えている。
少なくとも、
入力された音声を音声データに変換する音声データ入力部と、
上記音声データ入力部に入力すべき音声の内容と音響パラメータの大きさおよび変動とを含む提示情報を生成して提示する入力提示部と、
上記音声データ入力部に入力すべき音声の入力開始のタイミングを提示する入力タイミング提示部と、
上記音声データ入力部によって得られた音声データから音響パラメータを抽出するパラメータ抽出部と
を備えた複数の入力装置と、
上記複数の入力装置の各パラメータ抽出部で抽出された音響パラメータの値と予め設定されたターゲットパラメータの値との差に基づく類似度を、各入力装置毎に算出する類似度演算部と、
上記類似度演算部で算出された上記類似度に応じて、予め定められた操作を行う操作部と
を備えたことを特徴としている。
上記各入力装置の上記入力提示部は、
上記生成した提示情報を他の入力装置の入力提示部に送信すると共に、他の入力装置の入力提示部から送信されてきた提示情報を受信する提示データ通信部と、
上記生成した提示情報および上記提示データ通信部を介して受信した他の入力装置の入力提示部からの提示情報の少なくとも何れか一方を表示する表示部と
を備えている。
上記各入力装置の上記入力提示部は、
上記類似度演算部によって上記類似度を算出する際に用いられる類似度演算用ターゲットパラメータを生成する類似度演算用ターゲットパラメータ生成部と、
上記生成された類似度演算用ターゲットパラメータを他の入力装置の入力提示部に送信すると共に、他の入力装置の入力提示部から送信されてきた類似度演算用ターゲットパラメータを受信するターゲットパラメータ通信部と、
予め音響パラメータに表示形状を割り当てて成る割り当て情報に従って、上記生成された類似度演算用ターゲットパラメータおよび上記ターゲットパラメータ通信部を介して受信した他の入装置の入力提示部からの類似度演算用ターゲットパラメータの少なくとも何れか一方に表示形状を割り当てる表示割り当て部と、
上記類似度演算用ターゲットパラメータの値と上記表示割り当て部による上記類似度演算用ターゲットパラメータに対する表示形状の割り当て結果とに基づいて、上記類似度演算用ターゲットパラメータの値の表示形状を決定する形状決定部と、
上記類似度演算用ターゲットパラメータの値を上記決定された表示形状で表示する表示部と
を備えている。
上記複数の入力装置は、サーバを有する通信ネットワークで接続されており、
上記類似度演算部は、上記複数の入力装置の何れかあるいは上記サーバに搭載されており、
上記入力タイミング提示部は、上記類似度演算部が搭載された入力装置あるいは上記類似度演算部が搭載されたサーバから与えられた指令によって、音声の入力開始のタイミングの提示を行うようになっている。
上記類似度演算部の演算結果に基づいて、上記入力された音声から抽出された音響パラメータの上記予め設定されたターゲットパラメータに対する誤差を演算し、この演算結果を提示する誤差情報提示部を備えている。
上記各入力装置には、他の入力装置の音声データ入力部に入力された音声のモニタリングを行うモニタリング部を備えている。
上記モニタリング部は、
上記音声データ入力部によって得られた音声データを他の入力装置のモニタリング部に送信する入力音声送信部と、
他の入力装置のモニタリング部から送信されてきた音声データを受信すると共に、この受信した音声データに基づいて、他の入力装置に入力された音声を提示する音声提示部と
を備えている。
上記モニタリング部は、
上記パラメータ抽出部で抽出された音響パラメータを他の入力装置のモニタリング部に送信するパラメータ送信部と、
他の入力装置のモニタリング部から送信されてきた音響パラメータを受信すると共に、上記割り当て情報に従って、上記受信した各音響パラメータに表示形状を割り当てる表示割り当て部と、
上記受信した音響パラメータの値と上記表示割り当て部による上記音響パラメータに対する表示形状の割り当て結果とに基づいて、上記受信した音響パラメータの値の表示形状を決定する形状決定部と、
上記受信した音響パラメータの値を上記決定された表示形状で表示する表示部と
を備えている。
上記類似度演算部は、上記ターゲットパラメータの値として、上記複数の入力装置のうちの何れか1つの入力装置のパラメータ抽出部で抽出された音響パラメータの値を用いている。
上記類似度演算部は、上記各ターゲットパラメータの値として、上記複数の入力装置のパラメータ抽出部で抽出された音響パラメータの値の統計値を用いる。
上記音響パラメータは、入力音声の基本周波数,振幅,パワー,音素の継続時間長,入力音声の継続時間長,音声入力までの時間の夫々に関する統計値,瞬時値,変化量およびアクセント位置,音声認識結果,話者識別結果,音声認識時の演算で得られるスコアのうち、少なくとも1つである。
上記音響パラメータは、入力音声の基本周波数,振幅,パワー,音素の継続時間長,入力音声の継続時間長,音声入力までの時間の夫々に関する統計値,瞬時値,変化量およびアクセント位置,音声認識結果,話者識別結果,音声認識時の演算で得られるスコアのうち、少なくとも1つである。
当該入力装置は、サーバを有する通信ネットワークに接続されており、
上記入力提示部,パラメータ抽出部,類似度演算部および操作部のうちの少なくとも何れか1つは、上記サーバに搭載されている。
上記複数の入力装置は、サーバを有する通信ネットワークで接続されており、
上記類似度演算部,操作部および何れか1つの上記入力装置における入力提示部,入力タイミング提示部,パラメータ抽出部のうちの少なくとも何れか1つは、上記サーバに搭載されている。
入力すべき音声の内容と音響パラメータの大きさおよび変動とを含む提示情報の提示を行う入力提示ステップと、
入力された音声を音声データに変換する音声入力ステップと、
上記得られた音声データから音響パラメータを抽出するパラメータ抽出ステップと、
上記抽出された音響パラメータの値と予め設定されたターゲットパラメータの値との差に基づく類似度を算出する類似度演算ステップと、
上記算出された類似度に応じて、予め定められた操作を行う操作ステップと
を備えたことを特徴としている。
コンピュータを、
上記入力装置における音声データ入力部,入力提示部,パラメータ抽出部,類似度演算部および操作部
として機能させる。
コンピュータを、
上記入力システムにおける音声データ入力部,入力提示部,入力タイミング提示部,パラメータ抽出部,類似度演算部および操作部
として機能させる。
上記入力処理プログラムが記録されている。
図1は、本実施の形態の入力装置における機能的構成を示すブロック図である。以下、図1に従って、各部の構成と音声が入力された場合の各部の動作とについて説明する。
このパラメータ値は、上記デジタル音声信号において有声音から得られる略相似的な波の繰り返しのパターンを示す基本周波数であり、入力されたデジタル音声信号の全域または一部区間から得られるピッチ(基本周波数)の統計値,瞬時値および変化量である。このパラメータ「ピッチ」の抽出は、入力音声から得られたデジタル音声信号そのものの自己相関や、上記デジタル音声信号に対してLPC分析やPARCOR分析を行ったものに対する残差波形の自己相関を利用してその繰り返し周期を検討することによって行われる。また、上述した方法だけでなく、一般的に様々なピッチ抽出法が存在し、特に上述のピッチ抽出法に限定されるものではない
(2)[アクセント位置]
このパラメータ値は、一般的に用いられるアクセント位置であり、音声の単位である音節(子音+母音)毎のピッチ値を算出し、単語内でピッチ値が急激に減少する直前の音節位置を求めることによって抽出される。
このパラメータ値は、入力されたデジタル音声信号の全域または一部区間から得られる振幅値の統計値,瞬時値および変化量である。
このパラメータ値は、入力されたデジタル音声信号の全域または一部区間から得られる振幅値の二乗値に対する統計値,瞬時値および変化量である。
このパラメータ値は、各音素の継続時間の統計値,瞬時値および変化量であり、音声認識結果に割り当てられた音素のセグメントから、音素毎の継続時間長を計算することによって得られる。図8における音素1〜音素6夫々の継続時間長が、各音素の継続時間長である。
このパラメータ値は、入力音声の区間における全継続時間長であり、図8における各音素の継続時間長の総和である。
このパラメータ値は、入力開始から実際に音声入力が開始される(つまり、有音区間が開始する)までの時間である。
ここで、 N:類似度算出に用いるパラメータの数
IPi:入力音声から抽出されたパラメータの値
TPi:類似度演算用ターゲットパラメータの値
Wi:重み。
本実施の形態は、複数の入力装置を用いて類似度による操作を行うものに関する。図9は、複数の入力によって操作を行う場合の例として、2つの入力装置を用いて対象の操作を行う入力システムの機能的構成を示すブロック図である。入力装置Sおよび入力装置C夫々の構成は、上記第1実施の形態における入力装置と略同様である。但し、入力音声が複数になるため、発声のタイミングの提示処理や上記入力提示部でのデータの同期処理等が必要になる。以下、図9に従って、本実施の形態における入力システムの構成および動作について簡単に説明する。
(A)複数の入力装置S,Cのうちの任意の入力装置において入力音声から抽出されたパラメータをターゲットのパラメータ(類似度演算用ターゲットパラメータ)として、各入力装置S,C毎に、入力音声から抽出されたパラメータの値と上記類似度演算用ターゲットパラメータの値との類似度を算出する。
(B)複数の入力装置S,Cにおいて入力音声から抽出された総てのパラメータの各パラメータ毎の平均値を、ターゲットのパラメータ(類似度演算用ターゲットパラメータ)として、各入力装置S,C毎に、入力音声から抽出されたパラメータの値と上記類似度演算用ターゲットパラメータの値との類似度を算出する。
(C)予め本入力システムで提示される類似度演算用ターゲットパラメータ(例えば、入力装置Sの入力提示部37で生成された類似度演算用ターゲットパラメータ)を用いて、各入力装置S,C毎に、入力音声から抽出されたパラメータの値と上記類似度演算用ターゲットパラメータの値との類似度を算出する。
等が可能である。
2,32,42…パラメータ抽出部、
3,33,43…音声認識部、
4,34…類似度演算部、
5,35…操作部、
6,36…誤差情報提示部、
7,37,47…入力提示部、
8,38…演算情報テーブル、
9,39…ターゲットパラメータ、
11,51,61…類似度演算用ターゲットパラメータ生成部、
12,52,63,67,79…表示割り当て部、
13,53,64,68,80…形状決定部、
14,55,59,65,69,81…表示部、
21…テキスト音声合成部、
22,24…音声出力部、
23…音声選択部、
25…提示音声データベース(DB)、
40,50…入力タイミング提示部、
54,58…提示データ通信部、
62,66…ターゲットパラメータ通信部、
71,73…入力音声送出部、
72,74…音声提示部、
75,77…パラメータ送出部、
76,78…パラメータ提示部。
Claims (25)
- 入力された音声を音声データに変換する音声データ入力部と、
上記音声データ入力部に入力すべき音声の内容と音響パラメータの大きさおよび変動とを含む提示情報の提示を行う入力提示部と、
上記音声データ入力部で得られた音声データから音響パラメータを抽出するパラメータ抽出部と、
上記パラメータ抽出部で抽出された音響パラメータの値と予め設定されたターゲットパラメータの値との差に基づく類似度を算出する類似度演算部と、
上記類似度演算部で算出された類似度に応じて、予め定められた操作を行う操作部と
を備えたことを特徴とする入力装置。 - 請求項1に記載の入力装置において、
上記入力提示部は、上記類似度演算部によって上記類似度を算出する際に用いられる類似度演算用ターゲットパラメータを生成し、この生成された類似度演算用ターゲットパラメータの大きさおよび変動を含む提示情報の提示を行うようになっていることを特徴とする入力装置。 - 請求項2に記載の入力装置において、
上記入力提示部は、上記類似度演算用ターゲットパラメータの大きさおよび変動を含む提示情報を、テキストの表示,画像の表示,上記テキストあるいは画像の表示形状,上記テキストあるいは画像の色,上記テキストあるいは画像の表示位置,上記テキストあるいは画像の動きおよびそれらの組み合わせによって提示するようになっていることを特徴とする入力装置。 - 請求項2に記載の入力装置において、
上記入力提示部は、上記類似度演算用ターゲットパラメータの大きさおよび変動を含む提示情報を、音声によって提示するようになっていることを特徴とする入力装置。 - 請求項4に記載の入力装置において、
上記入力提示部は、上記類似度演算用ターゲットパラメータの大きさおよび変動を含む提示情報を、テキスト音声合成によって生成された合成音声によって提示するようになっていることを特徴とする入力装置。 - 請求項2に記載の入力装置において、
上記類似度演算部は、上記予め設定されたターゲットパラメータとして、上記入力提示部によって生成された類似度演算用ターゲットパラメータを用いるようになっていることを特徴とする入力装置。 - 請求項1に記載の入力装置において、
上記類似度演算部の演算結果に基づいて、上記入力された音声から抽出された音響パラメータの上記予め設定されたターゲットパラメータに対する誤差を演算し、この演算結果を提示する誤差情報提示部を備えたことを特徴とする入力装置。 - 少なくとも、
入力された音声を音声データに変換する音声データ入力部と、
上記音声データ入力部に入力すべき音声の内容と音響パラメータの大きさおよび変動とを含む提示情報を生成して提示する入力提示部と、
上記音声データ入力部に入力すべき音声の入力開始のタイミングを提示する入力タイミング提示部と、
上記音声データ入力部によって得られた音声データから音響パラメータを抽出するパラメータ抽出部と
を備えた複数の入力装置と、
上記複数の入力装置の各パラメータ抽出部で抽出された音響パラメータの値と予め設定されたターゲットパラメータの値との差に基づく類似度を、各入力装置毎に算出する類似度演算部と、
上記類似度演算部で算出された上記類似度に応じて、予め定められた操作を行う操作部と
を備えたことを特徴とする入力システム。 - 請求項8に記載の入力システムにおいて、
上記各入力装置の上記入力提示部は、
上記生成した提示情報を他の入力装置の入力提示部に送信すると共に、他の入力装置の入力提示部から送信されてきた提示情報を受信する提示データ通信部と、
上記生成した提示情報および上記提示データ通信部を介して受信した他の入力装置の入力提示部からの提示情報の少なくとも何れか一方を表示する表示部と
を備えたことを特徴とする入力システム。 - 請求項8に記載の入力システムにおいて、
上記各入力装置の上記入力提示部は、
上記類似度演算部によって上記類似度を算出する際に用いられる類似度演算用ターゲットパラメータを生成する類似度演算用ターゲットパラメータ生成部と、
上記生成された類似度演算用ターゲットパラメータを他の入力装置の入力提示部に送信すると共に、他の入力装置の入力提示部から送信されてきた類似度演算用ターゲットパラメータを受信するターゲットパラメータ通信部と、
予め音響パラメータに表示形状を割り当てて成る割り当て情報に従って、上記生成された類似度演算用ターゲットパラメータおよび上記ターゲットパラメータ通信部を介して受信した他の入装置の入力提示部からの類似度演算用ターゲットパラメータの少なくとも何れか一方に表示形状を割り当てる表示割り当て部と、
上記類似度演算用ターゲットパラメータの値と上記表示割り当て部による上記類似度演算用ターゲットパラメータに対する表示形状の割り当て結果とに基づいて、上記類似度演算用ターゲットパラメータの値の表示形状を決定する形状決定部と、
上記類似度演算用ターゲットパラメータの値を上記決定された表示形状で表示する表示部と
を備えたことを特徴とする入力システム。 - 請求項8に記載の入力システムにおいて、
上記複数の入力装置は、サーバを有する通信ネットワークで接続されており、
上記類似度演算部は、上記複数の入力装置の何れかあるいは上記サーバに搭載されており、
上記入力タイミング提示部は、上記類似度演算部が搭載された入力装置あるいは上記類似度演算部が搭載されたサーバから与えられた指令によって、音声の入力開始のタイミングの提示を行うようになっている
ことを特徴とする入力システム。 - 請求項8に記載の入力システムにおいて、
上記類似度演算部の演算結果に基づいて、上記入力された音声から抽出された音響パラメータの上記予め設定されたターゲットパラメータに対する誤差を演算し、この演算結果を提示する誤差情報提示部を備えたことを特徴とする入力システム。 - 請求項8に記載の入力システムにおいて、
上記各入力装置には、他の入力装置の音声データ入力部に入力された音声のモニタリングを行うモニタリング部を備えたことを特徴とする入力システム。 - 請求項13に記載の入力システムにおいて、
上記モニタリング部は、
上記音声データ入力部によって得られた音声データを他の入力装置のモニタリング部に送信する入力音声送信部と、
他の入力装置のモニタリング部から送信されてきた音声データを受信すると共に、この受信した音声データに基づいて、他の入力装置に入力された音声を提示する音声提示部と
を備えたことを特徴とする入力システム。 - 請求項13に記載の入力システムにおいて、
上記モニタリング部は、
上記パラメータ抽出部で抽出された音響パラメータを他の入力装置のモニタリング部に送信するパラメータ送信部と、
他の入力装置のモニタリング部から送信されてきた音響パラメータを受信すると共に、上記割り当て情報に従って、上記受信した各音響パラメータに表示形状を割り当てる表示割り当て部と、
上記受信した音響パラメータの値と上記表示割り当て部による上記音響パラメータに対する表示形状の割り当て結果とに基づいて、上記受信した音響パラメータの値の表示形状を決定する形状決定部と、
上記受信した音響パラメータの値を上記決定された表示形状で表示する表示部と
を備えたことを特徴とする入力システム。 - 請求項8に記載の入力システムにおいて、
上記類似度演算部は、上記ターゲットパラメータの値として、上記複数の入力装置のうちの何れか1つの入力装置のパラメータ抽出部で抽出された音響パラメータの値を用いることを特徴とする入力システム。 - 請求項8に記載の入力システムにおいて、
上記類似度演算部は、上記各ターゲットパラメータの値として、上記複数の入力装置のパラメータ抽出部で抽出された音響パラメータの値の統計値を用いることを特徴とする入力システム。 - 請求項1に記載の入力装置において、
上記音響パラメータは、入力音声の基本周波数,振幅,パワー,音素の継続時間長,入力音声の継続時間長,音声入力までの時間の夫々に関する統計値,瞬時値,変化量およびアクセント位置,音声認識結果,話者識別結果,音声認識時の演算で得られるスコアのうち、少なくとも1つであることを特徴とする入力装置。 - 請求項8に記載の入力システムにおいて、
上記音響パラメータは、入力音声の基本周波数,振幅,パワー,音素の継続時間長,入力音声の継続時間長,音声入力までの時間の夫々に関する統計値,瞬時値,変化量およびアクセント位置,音声認識結果,話者識別結果,音声認識時の演算で得られるスコアのうち、少なくとも1つであることを特徴とする入力システム。 - 請求項1に記載の入力装置において、
当該入力装置は、サーバを有する通信ネットワークに接続されており、
上記入力提示部,パラメータ抽出部,類似度演算部および操作部のうちの少なくとも何れか1つは、上記サーバに搭載されている
ことを特徴とする入力装置。 - 請求項8に記載の入力システムにおいて、
上記複数の入力装置は、サーバを有する通信ネットワークで接続されており、
上記類似度演算部,操作部および何れか1つの上記入力装置における入力提示部,入力タイミング提示部,パラメータ抽出部のうちの少なくとも何れか1つは、上記サーバに搭載されている
ことを特徴とする入力システム。 - 入力すべき音声の内容と音響パラメータの大きさおよび変動とを含む提示情報の提示を行う入力提示ステップと、
入力された音声を音声データに変換する音声入力ステップと、
上記得られた音声データから音響パラメータを抽出するパラメータ抽出ステップと、
上記抽出された音響パラメータの値と予め設定されたターゲットパラメータの値との差に基づく類似度を算出する類似度演算ステップと、
上記算出された類似度に応じて、予め定められた操作を行う操作ステップと
を備えたことを特徴とする入力方法。 - コンピュータを、
請求項1における音声データ入力部,入力提示部,パラメータ抽出部,類似度演算部および操作部
として機能させることを特徴とする入力処理プログラム。 - コンピュータを、
請求項8における音声データ入力部,入力提示部,入力タイミング提示部,パラメータ抽出部,類似度演算部および操作部
として機能させることを特徴とする入力処理プログラム。 - 請求項23あるいは請求項24に記載の入力処理プログラムが記録されたことを特徴とするコンピュータ読出し可能なプログラム記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005199749A JP2007017733A (ja) | 2005-07-08 | 2005-07-08 | 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005199749A JP2007017733A (ja) | 2005-07-08 | 2005-07-08 | 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007017733A true JP2007017733A (ja) | 2007-01-25 |
Family
ID=37754955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005199749A Pending JP2007017733A (ja) | 2005-07-08 | 2005-07-08 | 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007017733A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014524599A (ja) * | 2011-08-24 | 2014-09-22 | センソリー・インコーポレイテッド | 音声認識システムにおいて、誤った肯定を低減すること |
JP2019514045A (ja) * | 2016-03-21 | 2019-05-30 | アマゾン テクノロジーズ インコーポレイテッド | 話者照合方法及びシステム |
US10923111B1 (en) | 2019-03-28 | 2021-02-16 | Amazon Technologies, Inc. | Speech detection and speech recognition |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07319380A (ja) * | 1994-05-20 | 1995-12-08 | Nec Corp | 発声訓練装置 |
JPH08179789A (ja) * | 1994-12-26 | 1996-07-12 | Sharp Corp | 音声情報表示装置 |
JPH1138863A (ja) * | 1997-07-17 | 1999-02-12 | Fuji Xerox Co Ltd | 言語情報装置 |
JPH11296060A (ja) * | 1998-04-15 | 1999-10-29 | Ricoh Co Ltd | 教育機器 |
JP2001265211A (ja) * | 2000-01-14 | 2001-09-28 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 外国語学習装置、外国語学習方法および媒体 |
JP2002091472A (ja) * | 2000-09-19 | 2002-03-27 | Nippon Hoso Kyokai <Nhk> | 音声言語の韻律表示装置、再生装置、類似度判定装置、音声言語処理装置、および記録媒体 |
-
2005
- 2005-07-08 JP JP2005199749A patent/JP2007017733A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07319380A (ja) * | 1994-05-20 | 1995-12-08 | Nec Corp | 発声訓練装置 |
JPH08179789A (ja) * | 1994-12-26 | 1996-07-12 | Sharp Corp | 音声情報表示装置 |
JPH1138863A (ja) * | 1997-07-17 | 1999-02-12 | Fuji Xerox Co Ltd | 言語情報装置 |
JPH11296060A (ja) * | 1998-04-15 | 1999-10-29 | Ricoh Co Ltd | 教育機器 |
JP2001265211A (ja) * | 2000-01-14 | 2001-09-28 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 外国語学習装置、外国語学習方法および媒体 |
JP2002091472A (ja) * | 2000-09-19 | 2002-03-27 | Nippon Hoso Kyokai <Nhk> | 音声言語の韻律表示装置、再生装置、類似度判定装置、音声言語処理装置、および記録媒体 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014524599A (ja) * | 2011-08-24 | 2014-09-22 | センソリー・インコーポレイテッド | 音声認識システムにおいて、誤った肯定を低減すること |
JP2019514045A (ja) * | 2016-03-21 | 2019-05-30 | アマゾン テクノロジーズ インコーポレイテッド | 話者照合方法及びシステム |
US11514901B2 (en) | 2016-03-21 | 2022-11-29 | Amazon Technologies, Inc. | Anchored speech detection and speech recognition |
US10923111B1 (en) | 2019-03-28 | 2021-02-16 | Amazon Technologies, Inc. | Speech detection and speech recognition |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105788589B (zh) | 一种音频数据的处理方法及装置 | |
CN109949783B (zh) | 歌曲合成方法及系统 | |
US7949523B2 (en) | Apparatus, method, and computer program product for processing voice in speech | |
WO2010004978A1 (ja) | 音声合成モデル生成装置、音声合成モデル生成システム、通信端末、及び音声合成モデル生成方法 | |
JP2006517037A (ja) | 韻律的模擬語合成方法および装置 | |
US10229702B2 (en) | Conversation evaluation device and method | |
JP6111802B2 (ja) | 音声対話装置及び対話制御方法 | |
US9711123B2 (en) | Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program recorded thereon | |
JP2007140200A (ja) | 語学学習装置およびプログラム | |
JP2015014665A (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP2007017733A (ja) | 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体 | |
JP4808641B2 (ja) | 似顔絵出力装置およびカラオケ装置 | |
JP2015087649A (ja) | 発話制御装置、方法、発話システム、プログラム、及び発話装置 | |
JP2010060846A (ja) | 合成音声評価システム及び合成音声評価方法 | |
US20220148570A1 (en) | Speech interpretation device and system | |
CN111276113B (zh) | 基于音频生成按键时间数据的方法和装置 | |
JP6522679B2 (ja) | 発話制御装置、方法、発話システム、及びプログラム | |
JP6221253B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP6807491B1 (ja) | 補聴器用合成音声セットの修正方法 | |
CN113255313B (zh) | 音乐生成方法、装置、电子设备和存储介质 | |
KR20190002003A (ko) | 음성 합성 방법 및 장치 | |
US20240153482A1 (en) | Non-transitory computer-readable medium and voice generating system | |
KR20170059665A (ko) | 외국어 리듬 동작 감지 센서 기반의 운동 학습 장치, 그리고 이를 이용한 운동 학습 방법 | |
JP6508567B2 (ja) | カラオケ装置、カラオケ装置用プログラム、およびカラオケシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070822 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100809 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110329 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110816 |