JP2013200423A - 音声対話支援装置、方法、およびプログラム - Google Patents
音声対話支援装置、方法、およびプログラム Download PDFInfo
- Publication number
- JP2013200423A JP2013200423A JP2012068328A JP2012068328A JP2013200423A JP 2013200423 A JP2013200423 A JP 2013200423A JP 2012068328 A JP2012068328 A JP 2012068328A JP 2012068328 A JP2012068328 A JP 2012068328A JP 2013200423 A JP2013200423 A JP 2013200423A
- Authority
- JP
- Japan
- Prior art keywords
- data
- unit
- voice
- user
- reproduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
【解決手段】音声対話支援装置100において、分割部102は、語および音響を含む音声データを、語の特性および音響の特性のうちの1以上の特性に応じて分割して複数の分割音声データを得る。分析部103は、分割音声データごとに語の特性および音響の特性に関する分析結果を得る。表現検出部105は、利用者による発話および利用者による動作の少なくともどちらか一方により利用者の指示および利用者の状態のどちらか一方を示す1以上の手がかり表現を、分割音声データごとに検出する。推定部108は、手がかり表現が検出された場合、分析結果に基づいて、手がかり表現が検出される前に発話された音声に対応する1以上の分割音声データから、分割音声データを1以上の再生データとして推定する。出力部110は、再生データを出力する。
【選択図】図1
Description
本実施形態に係る音声対話支援装置の利用例について図1を参照して説明する。
本実施形態に係る音声対話支援装置100は、音声取得部101、分割処理部102、音声データ分析部103、データ蓄積部104、手がかり表現検出部105、再生指示部106、再生終了指示部107、再生箇所推定部108、再生速度設定部109、音声出力部110、話者認識部111、発話速度測定部112、発話間隔測定部113、雑音検出部114、音声認識部115および重要表現抽出部116を含む。
分割処理部102は、音声取得部101から音声データを受け取り、語の特性および音響の特性の少なくとも1つの特性に応じて音声データを分割して複数の分割音声データを得る。分割処理部102の分割処理については、図2および図3を参照して後述する。
音声データ分析部103は、分割処理部102から分割音声データを受け取る。音声データ分析部103は、後述する話者認識部111、発話速度測定部112、発話間隔測定部113、雑音検出部114、音声認識部115および重要表現抽出部116のそれぞれを制御して、分割音声データに含まれる語の特性および音響の特性のうちの1以上の特性に関して分析した分析結果を得る。
データ蓄積部104は、音声データ分析部103から分割音声データと分析結果とを受け取り、分割音声データと分析結果とを対応づけて分析データとして蓄積する。
再生指示部106は、手がかり表現検出部105から手がかり表現の処理結果を受け取り、音声データの再生を指示する再生指示信号を生成する。再生指示部106の動作については、図5を参照して後述する。
再生終了指示部107は、手がかり表現検出部105から手がかり表現の処理結果を受け取り、音声データの再生終了を指示する再生終了指示信号を生成する。再生終了指示部107の動作については、図6を参照して後述する。
再生箇所推定部108は、再生指示部106から再生指示信号を、再生終了指示部107から再生終了指示信号を、データ蓄積部104から分析データをそれぞれ受け取る。再生箇所推定部108は、分析データに基づいて手がかり表現が検出される前に発話された音声に対応する分割音声データから、再生すべき分割音声データを再生データとして順次抽出する。再生箇所推定部108の動作については、図7Aおよび図7Bを参照して後述する。
再生速度設定部109は、再生箇所推定部108から再生データを受け取り、再生データの再生速度を設定する。再生速度設定部109の動作については、図8および図9を参照して後述する。
音声出力部110は、再生速度設定部109から再生速度が設定された再生データを受け取り、設定された速度で再生データを再生して、音声を出力する。なお、再生速度設定部109において速度が設定されない場合は、通常の対話における対話速度で再生データの音声を出力すればよい。
発話速度測定部112は、音声データ分析部103から分割音声データを受け取り、分割音声データに含まれる語および音響から、分割音声データの発話速度を測定する。
発話間隔測定部113は、音声データ分析部103から分割音声データを受け取り、分割音声データに含まれる音響に基づいて発話間の間隔を示す発話間隔を測定する。
雑音検出部114は、音声データ分析部103から分割音声データを受け取り、分割音声データに含まれる音響から音声以外の環境音(以下、ここでは雑音)を検出する。
音声認識部115は、音声データ分析部103から分割音声データを受け取り、分割音声データに含まれる語をテキストデータとして変換する。
重要表現抽出部116は、音声認識部115からテキストデータを受け取り、テキストデータから重要表現を抽出する。重要表現は、対話中にキーワードとなりえる語であり、例えば、地名、人名、数量表現などの固有表現や、専門用語である。
ステップS201では、音声データに対して音声認識を行い、音声データをテキストデータに変換する。音声認識は、一般的な音声認識処理を行えばよいので、ここでの説明は省略する。
ステップS202では、音声データを形態素解析し、文節の切れ目でテキストデータを分割する。形態素解析も、一般的な形態素解析を用いればよいので、ここでの説明は省略する。以上で分割処理を終了する。
ステップS301では、音声データに含まれる音響に基づいて話者認識を行い、話者の変わり目で分割する。話者認識処理は、一般的な話者認識処理を行えばよいので、ここでの説明は省略する。なお、第1の実施形態に係る話者認識部111が音声取得部101から音声データを取得して認識処理を行い、話者認識部111が分割処理部102に認識結果を送ってもよい。
ステップS302では、無音区間を検出し、無音区間を切れ目として音声データを分割する。無音区間の検出は、例えば、閾値以上の期間、音声データに含まれる音響の音量が一定値以下であれば、無音区間として検出すればよい。以上で処理を終了する。このようにすることで、音声データを話者と発話との区切りで分割することができる。
手がかりリスト400は、手がかり表現401、話者および動作者402、発話間隔403、音量404、状態405および結果406がそれぞれ対応づけられる。なお、図4中、「N/A」は該当する情報が存在しないことを示す。
話者および動作者402は、手がかり表現を行った者(すなわち、手がかり語を発話した者、または手がかり動作を行った者)が、第1の実施形態に係る音声対話支援装置100の利用者であるかどうかを示す。手がかり発話間隔403は、直前の対話から手がかり表現が発話または動作されるまでの間隔の長さを示す。音量404は、発話された手がかり語の音量の大きさを示す。状態405は、データ蓄積部104に蓄積(録音)された音声データが再生されているかどうかを示す。結果406は、音声対話支援装置100の利用者がどのような状態であるか、または音声対話支援装置100のその後の処理を示す。具体的には、音声を聞き逃したことを示す「聞き逃し」、利用者自身の発言を忘れたことを示す「内容忘れ」、音声データの再生を終了することを示す「再生終了」、および、再生を続けることを示す「再生続行」が挙げられる。
例えば、「えっ」という語が発話され、発話した話者が利用者であり、発話音量が大きく、音声データが再生されていない場合を想定する。この場合、手がかり表現検出部105は、手がかりリスト400を参照することで、利用者が対話相手の発言を聞き逃したことを示す「聞き逃し」が発生したことを検出できる。
また、「えーと」という語が発話され、発話した話者が利用者であり、発話音量が大きく、音声データが再生されていない場合を想定する。この場合、手がかり発話間隔が短ければ、手がかり表現検出部105は「聞き逃し」が発生したことを検出する。逆に、手がかり発話間隔が長ければ、手がかり表現検出部105は、自分自身の発言内容を忘れたことを示す「内容忘れ」であることを検出する。
ステップS501では、手がかり表現検出部105の検出結果を受け取る。
ステップS502では、手がかり表現検出部105の検出結果が「聞き逃し」であるかどうかを判定する。検出結果が聞き逃しである場合はステップS503に進み、聞き逃しでない場合はステップS504に進む。
ステップS503では、利用者以外の音声データの再生を指示する再生指示信号を生成し、処理を終了する。
ステップS504では、手がかり表現検出部105の検出結果が「内容忘れ」であるかどうかを判定する。検出結果が内容忘れである場合はステップS505に進み、検出結果が内容忘れでない場合は処理を終了する。
ステップS505では、利用者の音声データの再生を指示する再生指示信号を生成し、処理を終了する。
ステップS602では、手がかり表現検出部105の検出結果が「再生終了」であるかどうかを判定する。検出結果が再生終了である場合はステップS603に進み、検出結果が再生終了でない場合は処理を終了する。
ステップS603では、音声データの再生の終了を指示する再生終了指示信号を生成し、処理を終了する。
ステップS701では、再生指示部106および再生終了指示部107から判定結果を受け取る。
ステップS702では、再生指示部106の判定結果が「聞き逃し」であるかどうか、すなわち再生指示部106から利用者以外の発話(分割音声データ)を再生するための再生指示信号を受け取ったかどうかを判定する。聞き逃しである場合はステップS703に進み、聞き逃しでない場合は「A」に進む。処理Aについては、図7Bを参照して後述する。
ステップS703では、データ蓄積部104にアクセスして、聞き逃しが発生した時点、すなわち、図4中の結果406が「聞き逃し」である手がかり語と一致する分割音声データの1つ前の発話の番号を変数iに設定し、i番目のデータを読み出す。iはゼロ以上の整数である。
ステップS705では、音声データのi番目の発話をした話者が利用者以外であるかどうかを判定する。利用者以外である場合はステップS706に進み、利用者である場合はステップS712に進む。
ステップS706では、音声データのi番目の発話に含まれる雑音の大きさが閾値より大きいかどうかを判定する。雑音の大きさが閾値より大きい場合はステップS710に進み、雑音の大きさが閾値以下である場合はステップS707に進む。
ステップS707では、音声データのi番目の発話の速度が閾値より速いかどうかを判定する。発話の速度が閾値より速い場合はステップS710に進み、発話の速度が閾値以下である場合はステップS708に進む。
ステップS710では、音声データのi番目の発話を再生データであると推定する。
ステップS711では、再生終了指示部107の判定結果が「再生終了」であるかどうかを判定する。判定結果が再生終了である場合は処理を終了し、判定結果が再生終了でない場合はステップS712に進む。
ステップS713では、少なくとも1回は音声データが再生されたかどうかを判定する。音声データが再生された場合は処理を終了し、1回も音声データが再生されていない場合はステップS714に進む。
ステップS714では、聞き逃しが発生した時点の1つ前の発話を再生データであると推定し、処理を終了する。
ステップS715では、再生指示部106の判定結果が「内容忘れ」であるかどうかを判定する。内容忘れである場合はステップS716に進み、内容忘れでない場合は処理を終了する。
ステップS716では、データ蓄積部104にアクセスして、内容忘れが発生した時点、すなわち、図4中の結果406が「内容忘れ」である手がかり語と一致する分割音声データの1つ前の発話の番号を変数iに設定し、i番目のデータを読み出す。
ステップS717では、δがゼロより大きいかどうかを判定する。δがゼロより大きい場合はステップS718に進み、δがゼロ以下である場合はステップS724に進む。
ステップS719では、音声データのi番目の発話間隔が閾値よりも長いかどうかを判定する。発話間隔が閾値よりも長い場合はステップS721に進み、発話間隔が閾値以下である場合はステップS720に進む。
ステップS720では、音声データのi番目の発話が重要表現を含むかどうかを判定する。重要表現を含む場合はステップS721に進み、重要表現を含まない場合はステップS723に進む。
ステップS722では、再生終了指示部107の判定結果が「再生終了」であるかどうかを判定する。判定結果が再生終了である場合は処理を終了し、判定結果が再生終了でない場合はステップS723に進む。
ステップS723では、変数iとパラメータδとをそれぞれ1つずつデクリメントし、ステップS717に戻り同様の処理を繰り返す。
ステップS724では、少なくとも1回は音声データが再生されたかどうかを判定する。音声データが再生された場合は処理を終了し、1回も音声データが再生されていない場合はステップS725に進む。
ステップS725では、内容忘れが発生した時点の1つ前の発話が再生データであると推定し、処理を終了する。
ステップS801では、再生指示部106の判定結果を受け取る。
ステップS802では、判定結果が「聞き逃し」であるかどうかを判定する。聞き逃しである場合はステップS803に進み、聞き逃しでない場合はステップS804に進む。
ステップS803では、聞き逃しの場合は利用者が対話の内容を把握できていないと考えられるので、再生データの再生速度が遅くなるように設定する。具体的には、分割音声データの発話速度の平均値を算出し、再生データの再生速度の値が平均値よりも小さくなるように設定すればよい。または、一般的な発話速度の値を予め設定し、再生データの再生速度の値が一般的な発話速度の値よりも小さくなるように設定すればよい。
ステップS804では、判定結果が「内容忘れ」であるかどうかを判定する。内容忘れである場合はステップS805に進み、内容忘れでない場合は、処理を終了する。
ステップS805では、内容忘れの場合は内容に関する何らかのキーワードを思い出しさえすれば全体の内容を思い出すことができると考えられ、さらに利用者に素早く内容を思い出させることが好ましいので、再生データの再生速度が速くなるよう設定する。具体的には、発話速度の平均値よりも再生速度の値が大きくなるように設定すればよい。以上で再生速度設定部109の動作を終了する。
ステップS901では、再生指示部106および再生終了指示部107から処理結果を受け取る。
ステップS902では、処理結果が「聞き逃し」であるかどうかを判定する。聞き逃しである場合はステップS903に進み、聞き逃しでない場合はステップS910に進む。
ステップS903では、データ蓄積部104にアクセスして、聞き逃しが発生した時点の1つ前の発話の番号を変数iに設定し、i番目のデータを読み出す。
ステップS904では、δがゼロより大きいかどうかを判定する。δがゼロより大きい場合はステップS905に進み、δがゼロである場合はステップS911に進む。
ステップS905では、音声データのi番目の発話をした話者が利用者以外であるかどうかを判定する。利用者以外である場合はステップS906に進み、利用者である場合はステップS913に進む。
ステップS907では、音声データのi番目の発話の速度が閾値より速いかどうかを判定する。発話の速度が閾値より速い場合はステップS911に進み、発話の速度が閾値以下である場合はステップS908に進む。
ステップS908では、音声データのi番目の発話が音声認識に失敗したかどうかを判定する。音声認識に失敗した場合はステップS910に進み、音声認識に失敗していない、つまり音声認識に成功した場合はステップS909に進む。
ステップS908では、音声データのi番目の発話が重要表現を含むかどうかを判定する。重要表現を含む場合はステップS911に進み、重要表現を含まない場合はステップS913に進む。
ステップS910では、音声データの再生速度を通常の対話速度に設定する。通常の対話速度とは、例えば、利用者の対話速度の履歴から、対話速度の平均値を計算すればよい。
ステップS912では、再生終了指示部107の処理結果が「再生終了」であるかどうかを判定する。処理結果が再生終了である場合は処理を終了し、処理結果が再生終了でない場合はステップS913に進む。
ステップS913では、変数iとパラメータδとをそれぞれ1つずつデクリメントし、ステップS904に戻り同様の処理を繰り返す。
ステップS915では、音声データの再生速度を通常の対話速度に設定し、処理を終了する。
ステップS916では、再生指示部106の処理結果が「内容忘れ」であるかどうかを判定する。内容忘れである場合は、ステップS917に進み、内容忘れでない場合は、処理を終了する。
ステップS917では、内容忘れの場合は利用者に素早く内容を思い出させるため、音声データの再生速度を通常の対話速度よりも速く設定する。以上で再生速度設定部109の動作を終了する。このように再生速度設定部109の処理により、再生データの雑音が大きいときや音声認識に失敗しているときは、通常の対話速度で再生し、再生データの発話の速度が大きい場合、再生データに重要表現が含まれる場合は、再生速度を遅くすることで利用者が内容を把握しやすくなる。
音声取得部101に入力される音声対話の一例を図10に示す。図10(a)および図10(b)は、太郎、花子および桃子の一連の対話を示す。桃子が本実施形態に係る音声対話支援装置の利用者である。
図11Aは、図10(a)の音声データが分析された分析データのテーブルを示し、図11Bは、図10(b)の音声データが分析された分析データのテーブルを示す。
データ蓄積部104には、番号1101、分割音声データ1102、話者1103、速度1104、音量1105、雑音1106、発話間隔1107、音声認識1108および重要表現1109の項目がそれぞれ対応づけられて格納される。番号1101と分割音声データ1102とは、分割処理部102の処理結果であり、番号1101は音声対話における発話順に付与される。ここでは、話者の区切りと無音区間とを切れ目として、発話の区切りごとに分割される。
話者1103は、話者認識部111の処理結果であり、ここでは「利用者」および「利用者以外」の2種類で記述しているが、「太郎」、「花子」、「桃子」といったように話者を特定して記述してもよい。
速度1104は、発話速度測定部112の処理結果であり、ここでは「速」、「中」および「遅」の3種類で記述しているが、測定で得られた速度値を記述してもよい。
発話間隔1107は、発話間隔測定部113の処理結果であり、ここでは「長」、「中」および「短」の3種類で記述しているが、測定された時間を記述してもよい。
音声認識1108は、音声認識部115の処理結果であり、ここでは「成功」および「失敗」の2種類で記述しているが、より細かい分類を記載してもよく、音声認識処理の途中で出力される尤度情報でもよい。
重要表現1109は、重要表現抽出部116の処理結果であり、重要表現として該当する語がなければ「N/A」と記述される。
具体的には、例えば、番号1101「1」、分割音声データ1102「ねえねえ」、話者1103「利用者以外」、速度1104「中」、音量1105「中」、雑音1106「小」、発話間隔1107「短」、音声認識1108「成功」および重要表現1109「N/A」がそれぞれ対応づけられる。
手がかり表現検出部105は、図11Aに示す番号1101「9」の分割音声データ1102「えっ」が発話された時点で、手がかりリストを参照し、「えっ」という語が聞き逃しを示唆する手がかり語であると検出する。再生指示部106は、「聞き逃し」の検出結果を受け取って、利用者以外の分割音声データの再生指示信号を生成する。その後、再生箇所推定部108が、図7Aのフローチャートに示す動作を行い、再生すべき分割音声データ(再生データ)を推定する。図11Aの例では、番号1101「9」の分割音声データ1102「えっ」から順に、番号1101を遡っていき、番号1101「8」の分割音声データ1102「桃子さんは」が重要表現を含むので、分割音声データ1102「桃子さんは」を再生データと推定する。
さらに、再生速度設定部109は、図9のフローチャートに示す動作を行い、「桃子さんは」が重要表現を含むことから再生速度を遅く設定し、音声出力部110で再生データを再生する。なお、利用者から再生終了を指示する発話(図4の「オーケー」または「了解」)がされていないので、音声データの再生を続行する。
番号1101「2」の分割音声データ1102「DDランドって知ってる」は、音声認識1108に失敗しているので再生データと推定する。再生速度設定部109では、音声データ「DDランドって知ってる」の再生速度を通常の対話速度に設定し、音声出力部110で再生データを再生する。ここで、これ以上遡っても再生データとなりえる分割音声データがないので、再生を終了する。
上述の処理により、利用者である桃子は、一般的に知られていない固有名詞を含んでいるために音声認識に失敗したフレーズ「DDランドって知ってる」か、雑音が大きくて聞きづらかった「先月リニューアルオープンしたんだって」のいずれかを聞き逃した可能性が高い。よって、これらの音声データを再生することにより効率的に対話を支援することができる。
番号1101「20」の分割音声データ1102「もう一回」がなされた時点で、手がかり表現検出部105が手がかりリストを参照し、「もう一回」という語が聞き逃しを示唆する手がかり語であると検出する。再生指示部106は、聞き逃しの検出結果を受け取って、利用者以外の分割音声データの再生指示を生成する。その後、再生箇所推定部108は、番号1101「19」の分割音声データ1102「午前10時に川崎駅で待ち合わせましょう」が重要表現(「午前10時」および「川崎駅」)を含むので、「午前10時に川崎駅で待ち合わせましょう」を再生データと推定する。さらに、再生速度設定部109は、重要表現を含む分割音声データ1102「午前10時に川崎駅で待ち合わせましょう」の再生速度を遅く設定して、再生データを再生する。
番号1101「21」の分割音声データ1102「了解」がなされた時点で、手がかり表現検出部105は分割音声データが「再生終了」を指示する手がかり語であると検出し、再生終了指示部107が再生終了指示信号を生成することで、再生データの再生が終了する。
桃子は、待ち合わせ時間と場所とを再度確認したかったので、「もう一回」と発話した可能性が高く、重要表現を含む再生データを再生することで効率的な対話を支援することができる。
第1の実施形態では、分割処理部102において分割された1つの分割音声データ全体を再生する例を示しているが、第2の実施形態では、1つの分割音声データの一部を抽出して再生する点が異なる。
第2の実施形態に係る音声対話支援装置について、図12を参照して説明する。
第2の実施形態に係る音声対話支援装置1200は、音声取得部101、分割処理部102、音声データ分析部103、データ蓄積部104、手がかり表現検出部105、再生指示部106、再生終了指示部107、再生箇所推定部108、再生速度設定部109、音声出力部110、話者認識部111、発話速度測定部112、発話間隔測定部113、雑音検出部114、音声認識部115、重要表現抽出部116および部分データ抽出部1201を含む。
部分データ抽出部1201以外の構成については、第1の実施形態と同様の動作を行うので、ここでの説明は省略する。
部分データ抽出部1201は、再生箇所推定部108から再生データを受け取り、再生データから部分データを抽出する。
ステップS1301では、再生箇所推定部108から再生データを受け取る。
ステップS1302では、再生データが音声認識に失敗したかどうかを判定する。音声認識に失敗した場合はステップS1303に進み、音声認識に失敗していない、つまり音声認識に成功した場合は、ステップS1304に進む。
ステップS1303では、再生データの雑音が閾値よりも大きいかどうかを判定する。雑音が閾値よりも大きい場合はステップS1304に進み、雑音が閾値よりも小さい場合はステップS1305に進む。
ステップS1304では、再生箇所全体の音声データを再生対象として、処理を終了する。
ステップS1305では、再生データが重要表現を含むかどうかを判定する。重要表現を含む場合はステップS1306に進み、重要表現を含まない場合はステップS1307に進む。
ステップS1307では、再生データが名詞を含むかどうかを判定する。名詞を含む場合はステップS1308に進み、名詞を含まない場合はステップS1309に進む。
ステップS1308では、再生データのうちの名詞部分を部分データとして再生対象とする。
ステップS1309では、再生データが用言を含むかどうかを判定する。用言は、例えば、動詞、形容詞、形容動詞である。用言を含む場合はステップS1310に進み、用言を含まない場合は処理を終了する。
ステップS1310では、再生データのうちの用言部分を基本形に変形し、部分データとして再生対象とする。
ステップS1311では、用言部分が否定助動詞を含むかどうかを判定する。否定助動詞を含む場合はステップS1312に進み、否定助動詞を含まない場合は処理を終了する。
ステップS1312では、用言に否定助動詞を付加する。以上で部分データ抽出部1201の処理を終了する。なお、ここでは用言に意味を付加する上で重要な助動詞として否定助動詞を取り上げたが、他の重要な助動詞、例えば、受身助動詞、使役助動詞、希望助動詞などについても、用言部分に含まれるかどうかを判定し、含まれる場合には用言に付加するようにしてもよい。
このようにすることで、計算量が多い演算処理をサーバ側で行うことができるので、端末側の処理量を減らすことができる。よって、端末の構成を簡潔にすることができる。
第1の実施形態および第2の実施形態に係る音声対話支援装置をプログラムとして実現する場合のコンピュータの一例について図14を参照して説明する。
コンピュータ1400は、中央演算処理装置(以下、CPUともいう)1401、メモリ1402、磁気ディスクドライブ1403、入力受付部1404、入出力部1405、入力装置1406および外部装置1407を含む。
磁気ディスクドライブ1403は、コンピュータを音声対話支援装置の各構成として機能させるためのプログラムおよび付随するデータを格納する。
メモリ1402は、実行中のプログラムおよび実行中のプログラムが扱うデータを一時記憶する。
CPU1401は、メモリ1402に記憶されたプログラムを読み出して実行する。
入力受付部1404は、後述の入力装置1406から音響信号の入力を受け付ける。
入出力部1405は、再生対象の音声データを後述の外部装置1407に出力する。
入力装置1406は、例えばマイクロフォンであり、音声や周囲雑音を集音する。
外部装置1407は、例えばイヤホンであり、入力装置1406から受け取った音声データを外部に出力する。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワークなどのMW(ミドルウェア)などが本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネットなどにより伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコンなども含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (10)
- 語および音響を含む音声データを、該語の特性および該音響の特性のうちの1以上の特性に応じて分割して複数の分割音声データを得る分割部と、
前記分割音声データごとに前記語の特性および前記音響の特性のうちの1以上の特性に関する分析結果を得る分析部と、
利用者による発話および該利用者による動作の少なくともどちらか一方により該利用者の指示および該利用者の状態のどちらか一方を示す1以上の手がかり表現を、前記分割音声データごとに検出する手がかり表現検出部と、
前記手がかり表現が検出された場合、前記分析結果に基づいて、該手がかり表現が検出される前に発話された音声に対応する1以上の前記分割音声データから、分割音声データを1以上の再生データとして推定する推定部と、
前記再生データを出力する出力部と、を具備することを特徴とする音声対話支援装置。 - 前記表現検出部において検出された前記手がかり表現が前記再生データの再生を終了することを示す場合、再生を終了することを示す終了指示信号を生成する終了指示部をさらに具備することを特徴とする請求項1に記載の音声対話支援装置。
- 前記音声データが利用者の発話であるかどうかを判定する話者認識部をさらに具備し、
前記推定部は、前記手がかり表現が利用者以外の発言を聞き逃したことを示す場合は、利用者以外の発話を示す第1音声データの中から再生データを推定することを特徴とする請求項1または請求項2に記載の音声対話支援装置。 - 前記音声データをテキストデータに変換する音声認識部と、
前記テキストデータから、対話中のキーワードとなりえる重要表現を抽出する重要表現抽出部と、
前記音声データに含まれる音声以外の雑音を検出する雑音検出部と、
前記音声データの発話速度を測定する速度測定部と、をさらに具備し、
前記分析部は、前記音声認識部、前記重要表現抽出部、前記雑音検出部および前記速度測定部の処理結果に基づいて前記分析結果を得、
前記推定部は、前記手がかり表現が利用者以外の発言を聞き逃したことを示す場合は、前記第1音声データの中から、音声認識に失敗したかどうか、前記重要表現を含むかどうか、前記雑音が第1閾値以上であるかどうか、および前記発話速度が第2閾値以上であるかどうかの少なくとも1つを満たす第2音声データ、および該手がかり表現の1つ前に発話された第3音声データの少なくともどちらか1つを再生データとして得ることを特徴とする請求項1から請求項3のいずれか1項に記載の音声対話支援装置。 - 前記音声データが利用者の発話であるかどうかを判定する話者認識部をさらに具備し、
前記推定部は、前記手がかり表現が利用者自身の発言に関する内容忘れであることを示す場合は、該利用者の発話を示す第4音声データの中から再生データを推定することを特徴とする請求項1から請求項4のいずれか1項に記載の音声対話支援装置。 - 前記音声データをテキストデータに変換する音声認識部と、
前記テキストデータから、対話中のキーワードとなりえる重要表現を抽出する重要表現抽出部と、
前記音声データにおける発話間の間隔を測定する間隔測定部と、をさらに具備し、
前記分析部は、前記音声認識部、前記重要表現抽出部および前記間隔測定部の処理結果に基づいて前記分析結果を得、
前記推定部は、前記手がかり表現が利用者自身の発言に関する内容忘れであることを示す場合は、利用者の発話を示す第4音声データの中から、前記重要表現を含むか、前記間隔が第3閾値以上であるか、の少なくとも1つを満たす第5音声データ、および該手がかり表現の1つ前に発話された第6音声データの少なくともどちらか1つを再生データとして得ることを特徴とする請求項1から請求項3のいずれか1項に記載の音声対話支援装置。 - 前記再生データに前記重要表現、名詞および用言の少なくとも1つが含まれる場合、再生箇所から該重要表現、該名詞および該用言のうち該当する語、用言が含まれる場合、用言に付随する意味的に重要な助動詞を部分データとして抽出する部分データ抽出部をさらに具備し、
前記出力部は、前記部分データが抽出された場合は、部分データのみを出力することを特徴とする請求項4または請求項6に記載の音声対話支援装置。 - 前記分析結果に基づいて、前記再生データの再生速度を設定する速度設定部をさらに具備することを特徴とする請求項1から請求項6のいずれか1項に記載の音声対話支援装置。
- 語および音響を含む音声データを、該語の特性および該音響の特性のうちの1以上の特性に応じて分割して複数の分割音声データを得、
前記分割音声データごとに前記語の特性および前記音響の特性のうちの1以上の特性に関する分析結果を得、
利用者による発話および該利用者による動作の少なくともどちらか一方により該利用者の指示および該利用者の状態のどちらか一方を示す1以上の手がかり表現を、前記分割音声データごとに検出し、
前記手がかり表現が検出された場合、前記分析結果に基づいて、該手がかり表現が検出される前に発話された音声に対応する1以上の前記分割音声データから、分割音声データを1以上の再生データとして推定し、
前記再生データを出力することを具備することを特徴とする音声対話支援方法。 - コンピュータを、
語および音響を含む音声データを、該語の特性および該音響の特性のうちの1以上の特性に応じて分割して複数の分割音声データを得る分割手段と、
前記分割音声データごとに前記語の特性および前記音響の特性のうちの1以上の特性に関する分析結果を得る分析手段と、
利用者による発話および該利用者による動作の少なくともどちらか一方により該利用者の指示および該利用者の状態のどちらか一方を示す1以上の手がかり表現を、前記分割音声データごとに検出する手がかり表現検出手段と、
前記手がかり表現が検出された場合、前記分析結果に基づいて、該手がかり表現が検出される前に発話された音声に対応する1以上の前記分割音声データから、分割音声データを1以上の再生データとして推定する推定手段と、
前記再生データを出力する出力手段として機能させるための音声対話支援プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012068328A JP2013200423A (ja) | 2012-03-23 | 2012-03-23 | 音声対話支援装置、方法、およびプログラム |
US13/728,533 US20130253924A1 (en) | 2012-03-23 | 2012-12-27 | Speech Conversation Support Apparatus, Method, and Program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012068328A JP2013200423A (ja) | 2012-03-23 | 2012-03-23 | 音声対話支援装置、方法、およびプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015202738A Division JP6143824B2 (ja) | 2015-10-14 | 2015-10-14 | 音声対話支援装置、方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013200423A true JP2013200423A (ja) | 2013-10-03 |
Family
ID=49213180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012068328A Pending JP2013200423A (ja) | 2012-03-23 | 2012-03-23 | 音声対話支援装置、方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20130253924A1 (ja) |
JP (1) | JP2013200423A (ja) |
Cited By (110)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3136388A1 (en) | 2015-08-31 | 2017-03-01 | Fujitsu Limited | Utterance condition determination apparatus and method |
JP2017215971A (ja) * | 2015-09-08 | 2017-12-07 | アップル インコーポレイテッド | メディア環境内におけるインテリジェント自動アシスタント |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10354652B2 (en) | 2015-12-02 | 2019-07-16 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US10390213B2 (en) | 2014-09-30 | 2019-08-20 | Apple Inc. | Social reminders |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US10553215B2 (en) | 2016-09-23 | 2020-02-04 | Apple Inc. | Intelligent automated assistant |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10657966B2 (en) | 2014-05-30 | 2020-05-19 | Apple Inc. | Better resolution when referencing to concepts |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10681212B2 (en) | 2015-06-05 | 2020-06-09 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US10692504B2 (en) | 2010-02-25 | 2020-06-23 | Apple Inc. | User profiling for voice input processing |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
US10741181B2 (en) | 2017-05-09 | 2020-08-11 | Apple Inc. | User interface for correcting recognition errors |
US10748546B2 (en) | 2017-05-16 | 2020-08-18 | Apple Inc. | Digital assistant services based on device capabilities |
JP2020129080A (ja) * | 2019-02-08 | 2020-08-27 | 三浦 浩之 | 音声認識システム |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10930282B2 (en) | 2015-03-08 | 2021-02-23 | Apple Inc. | Competing devices responding to voice triggers |
US10942703B2 (en) | 2015-12-23 | 2021-03-09 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10942702B2 (en) | 2016-06-11 | 2021-03-09 | Apple Inc. | Intelligent device arbitration and control |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11010127B2 (en) | 2015-06-29 | 2021-05-18 | Apple Inc. | Virtual assistant for media playback |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US11070949B2 (en) | 2015-05-27 | 2021-07-20 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US11120372B2 (en) | 2011-06-03 | 2021-09-14 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US11126400B2 (en) | 2015-09-08 | 2021-09-21 | Apple Inc. | Zero latency digital assistant |
US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11217251B2 (en) | 2019-05-06 | 2022-01-04 | Apple Inc. | Spoken notifications |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US11237797B2 (en) | 2019-05-31 | 2022-02-01 | Apple Inc. | User activity shortcut suggestions |
US11269678B2 (en) | 2012-05-15 | 2022-03-08 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11380310B2 (en) | 2017-05-12 | 2022-07-05 | Apple Inc. | Low-latency intelligent automated assistant |
US11388291B2 (en) | 2013-03-14 | 2022-07-12 | Apple Inc. | System and method for processing voicemail |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11468282B2 (en) | 2015-05-15 | 2022-10-11 | Apple Inc. | Virtual assistant in a communication session |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11500672B2 (en) | 2015-09-08 | 2022-11-15 | Apple Inc. | Distributed personal assistant |
US11516537B2 (en) | 2014-06-30 | 2022-11-29 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11532306B2 (en) | 2017-05-16 | 2022-12-20 | Apple Inc. | Detecting a trigger of a digital assistant |
US11580990B2 (en) | 2017-05-12 | 2023-02-14 | Apple Inc. | User-specific acoustic models |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11657813B2 (en) | 2019-05-31 | 2023-05-23 | Apple Inc. | Voice identification in digital assistant systems |
US11656884B2 (en) | 2017-01-09 | 2023-05-23 | Apple Inc. | Application integration with a digital assistant |
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11798547B2 (en) | 2013-03-15 | 2023-10-24 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US11809483B2 (en) | 2015-09-08 | 2023-11-07 | Apple Inc. | Intelligent automated assistant for media search and playback |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
US11928604B2 (en) | 2005-09-08 | 2024-03-12 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9043204B2 (en) * | 2012-09-12 | 2015-05-26 | International Business Machines Corporation | Thought recollection and speech assistance device |
JP6164076B2 (ja) * | 2013-12-17 | 2017-07-19 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
CN105702263B (zh) * | 2016-01-06 | 2019-08-30 | 清华大学 | 语音重放检测方法和装置 |
EP3244408A1 (en) * | 2016-05-09 | 2017-11-15 | Sony Mobile Communications, Inc | Method and electronic unit for adjusting playback speed of media files |
US20220101848A1 (en) * | 2019-06-05 | 2022-03-31 | Hewlett-Packard Development Company, L.P. | Missed utterance resolutions |
US11138978B2 (en) | 2019-07-24 | 2021-10-05 | International Business Machines Corporation | Topic mining based on interactionally defined activity sequences |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240577A (ja) * | 1985-08-16 | 1987-02-21 | Toshiba Corp | 音声対話装置 |
JPH08106298A (ja) * | 1994-08-09 | 1996-04-23 | Toshiba Corp | 対話処理装置及び対話処理方法 |
JPH1125112A (ja) * | 1997-07-04 | 1999-01-29 | N T T Data:Kk | 対話音声処理方法及び装置、記録媒体 |
JP2000267687A (ja) * | 1999-03-19 | 2000-09-29 | Mitsubishi Electric Corp | 音声応答装置 |
JP2004513445A (ja) * | 2000-10-30 | 2004-04-30 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 個人のインタラクションをシミュレートし、ユーザの情緒状態及び/又は性格に反応するユーザインタフェース/エンタテインメントデバイス |
JP2005202035A (ja) * | 2004-01-14 | 2005-07-28 | Toshiba Corp | 対話情報分析装置 |
JP2007108518A (ja) * | 2005-10-14 | 2007-04-26 | Sharp Corp | 音声録音再生装置 |
JP2011090483A (ja) * | 2009-10-22 | 2011-05-06 | Fujitsu Ltd | 情報処理装置およびプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6374225B1 (en) * | 1998-10-09 | 2002-04-16 | Enounce, Incorporated | Method and apparatus to prepare listener-interest-filtered works |
US7191129B2 (en) * | 2002-10-23 | 2007-03-13 | International Business Machines Corporation | System and method for data mining of contextual conversations |
US7672845B2 (en) * | 2004-06-22 | 2010-03-02 | International Business Machines Corporation | Method and system for keyword detection using voice-recognition |
US7680661B2 (en) * | 2008-05-14 | 2010-03-16 | Nuance Communications, Inc. | Method and system for improved speech recognition |
US8886663B2 (en) * | 2008-09-20 | 2014-11-11 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
US8548812B2 (en) * | 2008-12-22 | 2013-10-01 | Avaya Inc. | Method and system for detecting a relevant utterance in a voice session |
US8654952B2 (en) * | 2009-08-20 | 2014-02-18 | T-Mobile Usa, Inc. | Shareable applications on telecommunications devices |
-
2012
- 2012-03-23 JP JP2012068328A patent/JP2013200423A/ja active Pending
- 2012-12-27 US US13/728,533 patent/US20130253924A1/en not_active Abandoned
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240577A (ja) * | 1985-08-16 | 1987-02-21 | Toshiba Corp | 音声対話装置 |
JPH08106298A (ja) * | 1994-08-09 | 1996-04-23 | Toshiba Corp | 対話処理装置及び対話処理方法 |
JPH1125112A (ja) * | 1997-07-04 | 1999-01-29 | N T T Data:Kk | 対話音声処理方法及び装置、記録媒体 |
JP2000267687A (ja) * | 1999-03-19 | 2000-09-29 | Mitsubishi Electric Corp | 音声応答装置 |
JP2004513445A (ja) * | 2000-10-30 | 2004-04-30 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 個人のインタラクションをシミュレートし、ユーザの情緒状態及び/又は性格に反応するユーザインタフェース/エンタテインメントデバイス |
JP2005202035A (ja) * | 2004-01-14 | 2005-07-28 | Toshiba Corp | 対話情報分析装置 |
JP2007108518A (ja) * | 2005-10-14 | 2007-04-26 | Sharp Corp | 音声録音再生装置 |
JP2011090483A (ja) * | 2009-10-22 | 2011-05-06 | Fujitsu Ltd | 情報処理装置およびプログラム |
Cited By (173)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11928604B2 (en) | 2005-09-08 | 2024-03-12 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
US11023513B2 (en) | 2007-12-20 | 2021-06-01 | Apple Inc. | Method and apparatus for searching using an active ontology |
US10381016B2 (en) | 2008-01-03 | 2019-08-13 | Apple Inc. | Methods and apparatus for altering audio output signals |
US11900936B2 (en) | 2008-10-02 | 2024-02-13 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10643611B2 (en) | 2008-10-02 | 2020-05-05 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11348582B2 (en) | 2008-10-02 | 2022-05-31 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
US10692504B2 (en) | 2010-02-25 | 2020-06-23 | Apple Inc. | User profiling for voice input processing |
US10417405B2 (en) | 2011-03-21 | 2019-09-17 | Apple Inc. | Device access using voice authentication |
US11120372B2 (en) | 2011-06-03 | 2021-09-14 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US11350253B2 (en) | 2011-06-03 | 2022-05-31 | Apple Inc. | Active transport based notifications |
US11069336B2 (en) | 2012-03-02 | 2021-07-20 | Apple Inc. | Systems and methods for name pronunciation |
US11269678B2 (en) | 2012-05-15 | 2022-03-08 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11321116B2 (en) | 2012-05-15 | 2022-05-03 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
US11636869B2 (en) | 2013-02-07 | 2023-04-25 | Apple Inc. | Voice trigger for a digital assistant |
US11862186B2 (en) | 2013-02-07 | 2024-01-02 | Apple Inc. | Voice trigger for a digital assistant |
US11557310B2 (en) | 2013-02-07 | 2023-01-17 | Apple Inc. | Voice trigger for a digital assistant |
US10978090B2 (en) | 2013-02-07 | 2021-04-13 | Apple Inc. | Voice trigger for a digital assistant |
US11388291B2 (en) | 2013-03-14 | 2022-07-12 | Apple Inc. | System and method for processing voicemail |
US11798547B2 (en) | 2013-03-15 | 2023-10-24 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10657961B2 (en) | 2013-06-08 | 2020-05-19 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US11727219B2 (en) | 2013-06-09 | 2023-08-15 | Apple Inc. | System and method for inferring user intent from speech inputs |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11670289B2 (en) | 2014-05-30 | 2023-06-06 | Apple Inc. | Multi-command single utterance input method |
US11810562B2 (en) | 2014-05-30 | 2023-11-07 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10657966B2 (en) | 2014-05-30 | 2020-05-19 | Apple Inc. | Better resolution when referencing to concepts |
US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10878809B2 (en) | 2014-05-30 | 2020-12-29 | Apple Inc. | Multi-command single utterance input method |
US10497365B2 (en) | 2014-05-30 | 2019-12-03 | Apple Inc. | Multi-command single utterance input method |
US11257504B2 (en) | 2014-05-30 | 2022-02-22 | Apple Inc. | Intelligent assistant for home automation |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US10714095B2 (en) | 2014-05-30 | 2020-07-14 | Apple Inc. | Intelligent assistant for home automation |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US11699448B2 (en) | 2014-05-30 | 2023-07-11 | Apple Inc. | Intelligent assistant for home automation |
US11838579B2 (en) | 2014-06-30 | 2023-12-05 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11516537B2 (en) | 2014-06-30 | 2022-11-29 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10431204B2 (en) | 2014-09-11 | 2019-10-01 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10453443B2 (en) | 2014-09-30 | 2019-10-22 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10390213B2 (en) | 2014-09-30 | 2019-08-20 | Apple Inc. | Social reminders |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US11087759B2 (en) | 2015-03-08 | 2021-08-10 | Apple Inc. | Virtual assistant activation |
US11842734B2 (en) | 2015-03-08 | 2023-12-12 | Apple Inc. | Virtual assistant activation |
US10930282B2 (en) | 2015-03-08 | 2021-02-23 | Apple Inc. | Competing devices responding to voice triggers |
US11468282B2 (en) | 2015-05-15 | 2022-10-11 | Apple Inc. | Virtual assistant in a communication session |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US11070949B2 (en) | 2015-05-27 | 2021-07-20 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display |
US10681212B2 (en) | 2015-06-05 | 2020-06-09 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11947873B2 (en) | 2015-06-29 | 2024-04-02 | Apple Inc. | Virtual assistant for media playback |
US11010127B2 (en) | 2015-06-29 | 2021-05-18 | Apple Inc. | Virtual assistant for media playback |
EP3136388A1 (en) | 2015-08-31 | 2017-03-01 | Fujitsu Limited | Utterance condition determination apparatus and method |
US10096330B2 (en) | 2015-08-31 | 2018-10-09 | Fujitsu Limited | Utterance condition determination apparatus and method |
US11126400B2 (en) | 2015-09-08 | 2021-09-21 | Apple Inc. | Zero latency digital assistant |
US11550542B2 (en) | 2015-09-08 | 2023-01-10 | Apple Inc. | Zero latency digital assistant |
JP2017215971A (ja) * | 2015-09-08 | 2017-12-07 | アップル インコーポレイテッド | メディア環境内におけるインテリジェント自動アシスタント |
US11809483B2 (en) | 2015-09-08 | 2023-11-07 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10379715B2 (en) | 2015-09-08 | 2019-08-13 | Apple Inc. | Intelligent automated assistant in a media environment |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
JP2018502345A (ja) * | 2015-09-08 | 2018-01-25 | アップル インコーポレイテッド | メディア環境内におけるインテリジェント自動アシスタント |
US11500672B2 (en) | 2015-09-08 | 2022-11-15 | Apple Inc. | Distributed personal assistant |
US11853536B2 (en) | 2015-09-08 | 2023-12-26 | Apple Inc. | Intelligent automated assistant in a media environment |
US10956006B2 (en) | 2015-09-08 | 2021-03-23 | Apple Inc. | Intelligent automated assistant in a media environment |
US11954405B2 (en) | 2015-09-08 | 2024-04-09 | Apple Inc. | Zero latency digital assistant |
US11809886B2 (en) | 2015-11-06 | 2023-11-07 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11886805B2 (en) | 2015-11-09 | 2024-01-30 | Apple Inc. | Unconventional virtual assistant interactions |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10354652B2 (en) | 2015-12-02 | 2019-07-16 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10942703B2 (en) | 2015-12-23 | 2021-03-09 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US11069347B2 (en) | 2016-06-08 | 2021-07-20 | Apple Inc. | Intelligent automated assistant for media exploration |
US10733993B2 (en) | 2016-06-10 | 2020-08-04 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11657820B2 (en) | 2016-06-10 | 2023-05-23 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11037565B2 (en) | 2016-06-10 | 2021-06-15 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10942702B2 (en) | 2016-06-11 | 2021-03-09 | Apple Inc. | Intelligent device arbitration and control |
US11152002B2 (en) | 2016-06-11 | 2021-10-19 | Apple Inc. | Application integration with a digital assistant |
US11809783B2 (en) | 2016-06-11 | 2023-11-07 | Apple Inc. | Intelligent device arbitration and control |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US11749275B2 (en) | 2016-06-11 | 2023-09-05 | Apple Inc. | Application integration with a digital assistant |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10553215B2 (en) | 2016-09-23 | 2020-02-04 | Apple Inc. | Intelligent automated assistant |
US11656884B2 (en) | 2017-01-09 | 2023-05-23 | Apple Inc. | Application integration with a digital assistant |
US10741181B2 (en) | 2017-05-09 | 2020-08-11 | Apple Inc. | User interface for correcting recognition errors |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10847142B2 (en) | 2017-05-11 | 2020-11-24 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US11599331B2 (en) | 2017-05-11 | 2023-03-07 | Apple Inc. | Maintaining privacy of personal information |
US11380310B2 (en) | 2017-05-12 | 2022-07-05 | Apple Inc. | Low-latency intelligent automated assistant |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US11538469B2 (en) | 2017-05-12 | 2022-12-27 | Apple Inc. | Low-latency intelligent automated assistant |
US11862151B2 (en) | 2017-05-12 | 2024-01-02 | Apple Inc. | Low-latency intelligent automated assistant |
US11837237B2 (en) | 2017-05-12 | 2023-12-05 | Apple Inc. | User-specific acoustic models |
US11580990B2 (en) | 2017-05-12 | 2023-02-14 | Apple Inc. | User-specific acoustic models |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US10909171B2 (en) | 2017-05-16 | 2021-02-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US11532306B2 (en) | 2017-05-16 | 2022-12-20 | Apple Inc. | Detecting a trigger of a digital assistant |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US11675829B2 (en) | 2017-05-16 | 2023-06-13 | Apple Inc. | Intelligent automated assistant for media exploration |
US10748546B2 (en) | 2017-05-16 | 2020-08-18 | Apple Inc. | Digital assistant services based on device capabilities |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US11710482B2 (en) | 2018-03-26 | 2023-07-25 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11854539B2 (en) | 2018-05-07 | 2023-12-26 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11900923B2 (en) | 2018-05-07 | 2024-02-13 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11487364B2 (en) | 2018-05-07 | 2022-11-01 | Apple Inc. | Raise to speak |
US11907436B2 (en) | 2018-05-07 | 2024-02-20 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11169616B2 (en) | 2018-05-07 | 2021-11-09 | Apple Inc. | Raise to speak |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11360577B2 (en) | 2018-06-01 | 2022-06-14 | Apple Inc. | Attention aware virtual assistant dismissal |
US10684703B2 (en) | 2018-06-01 | 2020-06-16 | Apple Inc. | Attention aware virtual assistant dismissal |
US11630525B2 (en) | 2018-06-01 | 2023-04-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US11495218B2 (en) | 2018-06-01 | 2022-11-08 | Apple Inc. | Virtual assistant operation in multi-device environments |
US11009970B2 (en) | 2018-06-01 | 2021-05-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US10984798B2 (en) | 2018-06-01 | 2021-04-20 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10403283B1 (en) | 2018-06-01 | 2019-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11431642B2 (en) | 2018-06-01 | 2022-08-30 | Apple Inc. | Variable latency device coordination |
US10720160B2 (en) | 2018-06-01 | 2020-07-21 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10944859B2 (en) | 2018-06-03 | 2021-03-09 | Apple Inc. | Accelerated task performance |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11893992B2 (en) | 2018-09-28 | 2024-02-06 | Apple Inc. | Multi-modal inputs for voice commands |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
JP2020129080A (ja) * | 2019-02-08 | 2020-08-27 | 三浦 浩之 | 音声認識システム |
JP7296214B2 (ja) | 2019-02-08 | 2023-06-22 | 浩之 三浦 | 音声認識システム |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11783815B2 (en) | 2019-03-18 | 2023-10-10 | Apple Inc. | Multimodality in digital assistant systems |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11217251B2 (en) | 2019-05-06 | 2022-01-04 | Apple Inc. | Spoken notifications |
US11705130B2 (en) | 2019-05-06 | 2023-07-18 | Apple Inc. | Spoken notifications |
US11675491B2 (en) | 2019-05-06 | 2023-06-13 | Apple Inc. | User configurable task triggers |
US11888791B2 (en) | 2019-05-21 | 2024-01-30 | Apple Inc. | Providing message response suggestions |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11360739B2 (en) | 2019-05-31 | 2022-06-14 | Apple Inc. | User activity shortcut suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11237797B2 (en) | 2019-05-31 | 2022-02-01 | Apple Inc. | User activity shortcut suggestions |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11657813B2 (en) | 2019-05-31 | 2023-05-23 | Apple Inc. | Voice identification in digital assistant systems |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
US11924254B2 (en) | 2020-05-11 | 2024-03-05 | Apple Inc. | Digital assistant hardware abstraction |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
US11750962B2 (en) | 2020-07-21 | 2023-09-05 | Apple Inc. | User identification using headphones |
Also Published As
Publication number | Publication date |
---|---|
US20130253924A1 (en) | 2013-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2013200423A (ja) | 音声対話支援装置、方法、およびプログラム | |
CN108228132B (zh) | 语音启用装置及其中执行的方法 | |
CN100394438C (zh) | 信息处理装置及其方法 | |
JP2019117623A (ja) | 音声対話方法、装置、デバイス及び記憶媒体 | |
US8909537B2 (en) | Device capable of playing music and method for controlling music playing in electronic device | |
WO2017154282A1 (ja) | 音声処理装置および音声処理方法 | |
JP2014240940A (ja) | 書き起こし支援装置、方法、及びプログラム | |
JP5638479B2 (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP5731998B2 (ja) | 対話支援装置、対話支援方法および対話支援プログラム | |
JP2011253374A (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
US20190079918A1 (en) | Controlling playback of speech-containing audio data | |
WO2018047421A1 (ja) | 音声処理装置、情報処理装置、音声処理方法および情報処理方法 | |
JP2013025299A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP2015060127A (ja) | 音声同時処理装置、方法およびプログラム | |
US20190155843A1 (en) | A secure searchable media object | |
JP2018185561A (ja) | 対話支援システム、対話支援方法、及び対話支援プログラム | |
JP3881620B2 (ja) | 話速可変装置及び話速変換方法 | |
KR20110053397A (ko) | 검색 키워드를 이용한 멀티미디어 파일 검색 방법 및 그 휴대기기 | |
JP6143824B2 (ja) | 音声対話支援装置、方法、およびプログラム | |
JP4622728B2 (ja) | 音声再生装置および音声再生処理プログラム | |
JP2011170622A (ja) | コンテンツ提供システム、コンテンツ提供方法、およびコンテンツ提供プログラム | |
JP6723033B2 (ja) | 情報処理装置、情報処理システム、サーバ、端末装置、情報処理方法及びプログラム | |
WO2017085815A1 (ja) | 困惑状態判定装置、困惑状態判定方法、及びプログラム | |
KR101611224B1 (ko) | 오디오 인터페이스 | |
JP4353084B2 (ja) | 映像再生方法及び装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131205 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131212 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131219 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131226 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140109 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140325 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141216 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150213 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150714 |