JP2007121577A - 音声再生装置 - Google Patents

音声再生装置 Download PDF

Info

Publication number
JP2007121577A
JP2007121577A JP2005312002A JP2005312002A JP2007121577A JP 2007121577 A JP2007121577 A JP 2007121577A JP 2005312002 A JP2005312002 A JP 2005312002A JP 2005312002 A JP2005312002 A JP 2005312002A JP 2007121577 A JP2007121577 A JP 2007121577A
Authority
JP
Japan
Prior art keywords
question
voice
text
user
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005312002A
Other languages
English (en)
Inventor
Masaya Hanazono
正也 花園
Takashi Nishiyama
高史 西山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP2005312002A priority Critical patent/JP2007121577A/ja
Publication of JP2007121577A publication Critical patent/JP2007121577A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】ユーザの操作に応じて合成音声によって再生出力したテキスト内容に対してユーザが疑問を発した際に、ユーザの疑問に対する応答内容を効率良く、また冗長性がなく提示することができる音声再生装置を提供することにある。
【解決手段】音声認識部12は、マイクロホン11で受け付けたユーザの音声によって形成される構文が疑問文か否かを判定するとともに、疑問文の場合疑問を示す疑問キーワードを抽出する疑問対象抽出部124を備えている。そして位置特定手段13は、音声合成部15によって生成されスピーカ16から再生出力済みで、読上げ内容格納14に格納されているテキストの内容に対して疑問キーワードを検索してユーザの疑問に対する答えに相応する箇所を特定し、この特定した箇所の合成音声を音声合成部で生成させてスピーカ16から再生出力させる。
【選択図】図1

Description

本発明は、キッチンナビゲーション、カーナビゲーション、電子メール読上げ、ニュース読上げなどに適用できる音声再生装置に関するものである。
従来から合成音声でテキストを読み上げる装置が種々提供されているが、読み上げるテキストを聞き逃した場合に、最初から再び再生させるのは効率的でないため、読み上げられた結果を任意の時間長だけ遡って再度聞くことができる音声合成装置が提供されている(例えば、特許文献1)。
また単語や文節単位で読上げ開始位置を変更する、音声合成装置も提供されている(例えば、特許文献2)。
更に意味的な切れ目や発声に適した文節の切れ目に読上げ位置を設ける音声応答装置や音声合成装置も提供されている(特許文献3,特許文献4)。
特開2004−61625公報(公報1頁左欄の(解決手段)) 特開平2−45868号公報(公報2頁左上欄第16行乃至右下欄第3行) 特開2000−267687公報(段落番号0006) 特開2001−331191公報(段落番号0006〜0007))
特許文献1乃至4に開示されている何れの装置も、テキストの読上げ単位を短くすることにより、聞き直しの時間を短くすることで課題の解決を図っているものであるが、何れの場合も、ユーザが聞き直しを求めるキーワード(例えば数詞情報など)のみを提示することはできない。つまり、一定の単位で遡ってそのまま音声を再生した場合、ユーザが求めるキーワード以外の情報も同時に再生されるということや、遡る位置を誤るとユーザが求めていないテキスト内容しか、再生されないという可能性があった。
本発明は上述の点に鑑みて為されたもので、その目的とするところは、ユーザの操作に応じて合成音声によって再生出力したテキスト内容に対してユーザが疑問を発した際に、ユーザの疑問に対する応答内容を効率良く、また冗長性がなく提示することができる音声再生装置を提供することにある。
上述の目的を達成するために請求項1の発明では、ユーザの操作に応じて予め備えられているテキストを合成音声で音声出力手段から再生出力させる音声再生装置において、ユーザからの音声を受け付ける音声受付手段と、該音声受付手段で受け付けた音声によって形成される構文が疑問文か否かを判定するとともに、疑問文の場合疑問を示す疑問キーワードを抽出する疑問対象抽出手段と、前記音声合成部から出力済みの合成音声の内容に対して、前記疑問キーワードを検索してユーザの疑問に対する答えに相応する箇所を特定する位置特定手段とを備え、前記位置特定手段により特定した箇所を応答の音声として合成音声により前記音声出力手段から出力させることを特徴とする。
請求項1の発明によれば、ユーザの操作に応じて合成音声によって再生出力したテキスト内容に対してユーザが疑問を発した際に、ユーザの疑問に対する応答内容を効率良く、また冗長性がなく提示することができる。
請求項2の発明では、請求項1の発明において、前記位置特定手段は、前記疑問対象抽出手段により抽出した前記疑問キーワードの文言情報に基づいて特定することを特徴とする。
請求項2の発明によれば、ユーザが発した疑問キーワードに対応する部分のみを文言情報で確実に抽出し、ユーザの問いに答えることが可能となる。
請求項3の発明では、請求項2の発明において、前記位置特定手段は、前記疑問キーワードの文言情報が単位を表す場合、当該疑問キーワードを検索して当該疑問キーワードの前にある数詞情報を特定することを特徴とする。
請求項3の発明によれば、単位を示す疑問キーワードであれば、それに数詞情報の検索を効率良く特定できる。
請求項4の発明では、請求項1乃至3の何れかの発明において、前記位置特定手段は、前記疑問対象抽出手段により抽出した前記疑問キーワードが複数あった場合、受け付けた音声中から答えに相応する箇所を特定するための補助キーワードを抽出し、当該補助キーワードに基づいて当該箇所を特定することを特徴とする。
請求項4の発明によれば、複数箇所に疑問キーワードがある場合でも、適切にユーザが求めるものを答えることが可能になる。
請求項5の発明では、請求項1乃至4の何れかの発明において、前記音声出力手段から再生出力するテキスト部分を格納する読上げ内容格納を備え、前記位置特定手段は、格納されたテキスト部分内から答えに相応する箇所を特定することを特徴とする。
請求項5の発明によれば、既に読み上げたテキスト内容を蓄積しておくことで、検索効率を高めユーザの応答待ち時間を少なくすることができ、しかもテキストの位置情報を示すチャプタを、読み上げたテキストに付与することが不要となる。
請求項6の発明では、請求項5の発明において、前記位置特定手段は、現在のテキスト出力位置から、最も近い答えに相応する箇所を特定することを特徴とする。
請求項6の発明によれば、ユーザは補助キーワードをたくさんいう必要がなく、疑問キーワードさえ含んでいれば検索をすることが可能となる。
請求項7の発明では、請求項1乃至6の何れかの発明において、前記疑問対象抽出手段により疑問キーワードが抽出された場合に、テキストの再生出力を停止させるテキスト読上げ手段を備えたことを特徴とする。
請求項7の発明によれば、疑問とは無関係な音声入力を受理せず、確実で効率の良い処理が可能となる。
請求項8の発明では、請求項7の発明において、前記音声出力手段において再生出力されたテキスト部分を格納するテキスト記憶手段を備え、該テキスト記憶手段に格納されたテキスト部分を参照し、該テキスト部分に続くテキストを前記音声出力手段より再生出力させることを特徴とする。
請求項8の発明によれば、読み上げるテキストの効率的な伝達が可能となる。
請求項9の発明では、請求項1乃至8の何れかの発明において、前記テキストが料理レシピであることを特徴とする。
請求項9の発明によれば、再生出力される料理レシピの内容に従って調理を行う場合にユーザが聞き逃しても、聞き逃した箇所を効率良く再生することができるため、調理に遅れを生じさせることがなく、調理器等に組み込むことでユーザの利便性が向上する。
本発明は、ユーザの操作に応じて合成音声によって再生出力したテキスト内容に対してユーザが疑問を発した際に、ユーザの疑問に対する応答内容を効率良く、また冗長性がなく提示することができるという効果がある。
以下本発明を実施形態により説明する。
(実施形態1)
本実施形態は、料理の作り方を敢えてくれるキッチンナビゲーションシステム(或いは、カーナビゲーションシステム・メール読上げ・またニュース読上げなど)のテキスト読上げをしてくれる音声対話システムに適用されるもので、図1に示すように構成される。
つまり本実施形態では、ユーザの音声を受け付ける音声受付手段、つまり音声入力インターフェースとしてマイクロホン11を備えるとともに、テキストを合成音声で再生出力するための音声出力手段として、音声合成信号を生成する音声合成部15とスピーカ16とを備えている。
音声合成部15は、本実施形態装置を組み込んだシステムのアプリケーション17からユーザの操作に対応する音声合成命令を受け、この命令に基づいて読上げ内容格納部14に格納しているレシピ情報等のユーザに提供するテキスト情報を音声合成信号に変換してスピーカ16から合成音声により再生させるようになっている。この音声合成する際に辞書格納部19から必要な単語情報(品詞情報やアクセント情報を含む)を参照する。
またマイクロホン11から入力されたユーザの音声を認識するための音声認識部12を備えており、この音声認識部12には入力した音声を分析する音響分析部121と、ユーザ音声で形成される構文の文法を制約する文法格納部122と、ユーザ音声で形成される構文中の単語を解析するための辞書格納部123と、ユーザの疑問対象(以後、疑問キーワードという)を抽出する疑問対象抽出部(疑問対象抽出手段)124とから構成されている。
疑問抽出部124は、統計的に適合したものを出力するHMM(Hidden Markov Model)に基づく音声認識の原理に従うことができるもので、辞書格納部123の辞書とパターンマッチング(PatternMatching)により適合度を見て、ユーザの音声に含まれる疑問キーワードを抽出し、その疑問キーワードを位置特定部(位置特定手段)13へ出力するようになっている。
位置特定部13は、疑問キーワードを読上げ内容格納14に格納されているテキスト情報から検索し、ユーザの疑問(質問する)内容を特定する処理を行う。
音声合成部15に付設される停止位置記憶部18は、ユーザの疑問音声の割り込みに対し、再生中のテキストの合成音声を停止し応答音声を出力した際の、再度停止した場所から合成音声を出力することを可能とするための記憶部である。
次に本実施形態の動作を図2のフローチャートに基づいて説明する。
まず、音声合成部15がアプリケーション17から音声合成命令を受信すると(ステップSl)、音声合成部15は読上げ内容格納19からテキスト情報を読み込み、音声合成信号に変換し、スピーカ16より合成音声として再生出力する(ステップS2)。この合成音声の出力中にマイクロホン11を通して入ってきたユーザの音声が音声認識部12で検知されると、この音声により形成された構文が疑問文か否かを音響分析部121並びに疑問対象抽出部124により判断する(ステップS3)。この判断方法としては、例えば入力音声のピッチ(基本周波数)パターンを観測し、語尾の値が上昇していれば疑問文と判断する方法がある。ここでの語尾とは、例えばユーザの音声の末尾5モーラ程度とする。このモーラとは、大凡、日本語の「カナ」に相応し、このモーラの値は音声認識部12により得られる音声認識結果、すなわちテキスト情報から割り出すことが可能である。
また音声認識結果。すなわちテキスト情報そのものから判断するということが考えられる。例えば、「何」、「何だって」、「かな」といった疑問符と同時に生起する確率が高いとされる語尾を予め登録しておき、この登録情報を参照することで。ユーザ音声が疑問文かどうか判断することが可能である。また、これらを組み合わせて、入力されたユーザ音声が疑問文か否かを判別しても良い。
さてステップS3においてユーザの疑問音声を検知した場合、疑問対象抽出部124から音声合成部15へ現在出力中の合成音声を停止させる指示を出力して停止状態にする(ステップS4)。つまり疑問対象抽出部124がテキスト読上げ停止手段として機能する。また既に合成音声の出力が終了している場合においても、停止状態を確認するなどの処理を施し、次の処理(ステップS5)に移行する。
尚、ここでは出力中の合成音声がマイクロホン11を通じて音声認識される可能性があるため、バージイン(割り込み発話)機能を備えている方が望ましい。例えば、出力中の合成音声を解析し、この音響的特徴量は音声認識の対象外にするようキャンセル処理を施すことや、文法格納部122で予め想定されるテキスト以外は受理できないようにするといった方法がある。
さてステップS5では合成音声の停止位置を停止位置記憶部17に格納する。この格納する情報とは時間に相応する情報(チャプタ)を指す。
停止位置の格納後、音声認識部12の疑問相性抽出部124では文法格納部122に格納されている文法に従って、ユーザが疑問としている対象を抽出する(ステップS6)。この疑問キーワードの文言情報の抽出方法としては文法格納部122に図3のようなネットワーク文法を保持しておき。音声認識結果が何れかの形式で出力されるように制限をかけておく。これにより所定の部位の情報のみ(例えば、”QUANTITY”や“TIME”に当たる情報)を抽出することが可能となる、尚、この文法ネットワークを取り入れたアルゴリズムは、例えば(鹿野他,「音声認識システム」,オーム社発行,ISBN4−274−13228−5 参照)で示される公知のものを実装している。
また、疑問キーワード(例えば、“cc(単位)’’)が複数存在した場合は、補助キーワード(例えば、“牛乳”)などをユーザに発声してもらうことで対応する。或いは、全検索結果をユーザに提示することでも良いとする。
上述の方法で、ユーザの疑問キーワード(図3の例では、“cc(シーシー)”。“グラム”、“分(フン、プン)’’)等の単位を示すキーワードを抽出した後、この情報と、読上げ内容格納14内に格納されている情報とから、位置特定部13はユーザが求める情報の位置を特定する(ステップS7)。ここで例を挙げると、音声合成命令に応じて「100ccの牛乳と20グラムのバターを混ぜます」という合成音声が再生出力され、ユーザが何ccの牛乳であったかを確認したいとし、「何ccだって?」という質問の音声を発すると、ステップS6で“cc”の単語が抽出され、再生された合成音声内容からこの単語を検索する。
このとき、「何cc?」に対する答えが複数候補として挙がることが考えられるが、一つは直前の数詞情報を提示するという解がある。また数詞情報に関する候補を全てユーザに提示するとしても良い。得られた位置をもとに遡り(ステップS8)、ユーザが求める情報を含めた音声を出力させる(ステップS2に戻る)。尚、この遡る単位は、形態素、文節、文章が挙げられる。
そしてユーザの音声受付と疑問キーワードの検知がステップS3でなければ、システムでの待ち受け終了となるまで、ユーザの疑問音声を待ち受け(ステップS9)、アプリケーション17から終了命令がきたら待ち受けを終了とする(ステップS9)。
尚アプリケーション17から音声合成命令を受け取ると、音声合成部15を動作させ、また音声認識部24を待ち受け状態としたりする処理や、終了命令を受け取ると待ち受け状態を終了する処理など音声出力装置全体の信号処理を担うものとして演算処理部(図示せず)を備えているものとする。
本実施形態は、以上のような構成を有して音声対話処理を行うことにより、ユーザが、求める情報を効率的に再出力させることができる。
(実施形態2)
本実施形態は、図4に示すように、検索処理時間を短縮するために、読上げ内容格納部14内のテキスト情報を音声合成したものを一時的に格納するためのテキスト記憶部20と、位置特定部13より特定したユーザが求める情報を文章としてユーザに伝達するための文法を格納している文法格納部21と、この文法格納部21と辞書格納部19からの文法と語彙、また位置特定部13から抽出した答えとなる単語とを用いて文章を組み立てる読上げ内容生成部22とを設けた点で実施形態1の構成と相違している、尚その他の構成は基本的には実施形態1と同じであるので、同じ符号、名称を付す。
次に本実施形態の動作を図5に示すフローチャートにより説明する。
まずアプリケーション17から音声合成部15が音声合成命令を受信すると(ステップSl)、読上げ内容格納部14はテキスト情報のパケットを音声合成部15へ送信する。このパケットとは単語、文節、文章といった単位で扱う。また同時に読上げ内容格納部14からテキスト記憶部20にもテキスト情報のパケットが送信され、このパケットはテキスト記憶部20で逐次記憶される(ステップS2)。
音声合成部15は受信したテキスト情報を音声合成信号に変換し、スピーカ16より合成音声として再生出力する(ステップS3)。
この合成音声出力中は、読上げ内容格納部14から出力内容のテキスト情報のパケットを音声合成部15へ送信し続ける。そして、音声認識部12において受け付けたユーザの音声から疑問キーワードが抽出されて疑問情報抽出部124から一時停止命令がきた場合(ステップS4)、パケット送信を一時停止する(ステップS5)。
次に、疑問情報抽出部124は疑問キーワードから文法格納部122に格納されている文法に従ってユーザが疑問としている対象を抽出する(ステップS6)。そしてユーザの音声から得られた疑問キーワードに基づいてテキスト記憶部20に記憶したパケット内を検索してターゲット位置(以後“アンサーキーワード“という)を求める(ステップS7)。この方法として、例えば品詞情報を参照し、数詞である単語のみを抽出する方法を採用する。また、ユーザの質問形式を参考にすることもできる。例えば、「○○はいくつ?」とユーザが訊いた場合、答えは「数詞」となり、「○○はどこだって?」と訊いた場合は、答えは、「一般名詞−地名」といったように、質問形式により答えの品詞を制限することができ、この品詞に相応する部分を抽出することもできる。これにより、より確実な答えをユーザに返すことが可能となる。
ユーザに応答するためのテキストを生成する(ステップS8)。既に得られたアンサーキーワードと、疑問キーワードを組み
合わせる。例えば、アンサーキーワードが“100”で、疑問キーワードが単位の“cc”である場合、読上げ内容生成部22は文法格納部21の文法に従って「100ccです」、または「○○は100ccです」といったようなテキストを生成する(ステップS8)。この生成されたテキストのパケットは、音声合成部15に送信されて音声合成信号に変換され、スピーカ16から合成音声によりユーザに応答音声が出力される(ステップS9)。この応答音声の出力後、読上げ内容格納部14では更に音声合成部15に送信するテキスト情報がないかを確認する(ステップS10)。つまり、アプリケーション17があるシナリオで生成すべき音声が終わっているかを確認することと同意である。そして音声合成するテキスト情報がまだある場合はステップS2に戻り、なければステップSl11に進み、ユーザからの質問を待ち受けるかどうかを判定する。つまりアプリケーション21側から終了命令がなければ、ステップS2に戻り、終了命令があれば待ち受けを終了する。
尚アプリケーション17から音声合成命令を受け取ると、音声合成部15を動作させ、また音声認識部24を待ち受け状態としたりする処理や、終了命令を受け取ると待ち受け状態を終了する処理など音声出力装置全体の信号処理を担うものとして演算処理部(図示せず)を備えているものとする。
本実施形態は以上のような構成を有して、音声対話処理を行うことにより、ユーザが求める情報を効率的に再出力させることができる。
ところで、本発明の音声再生装置は、比較的リアルタイム性の高い音声対話を対象としており、既に合成音声で読み上げたテキスト文をユーザの疑問に対応して検索し再出力させるようなっているが、既に読み上げたテキスト文のみならず、これから読み上げる予定の合成文章も検索対象とするとしても良い。この場合の手順としては、次のようになる。
まずユーザの発話を音声認識部12で認識して、単語「○○」を求める。この求めた単語○○」が、今合成音声により読み上げているテキスト文全体の中にあるかを検索し、あればその位置を位置特定部13で求め、この求めた位置からテキスト文を合成音声で読み上げる。例えば、天気情報を毎日自動的に音声で提供してくれる天気配信システムがあるとする。このシステムでは毎日天気情報を提供してくれるため、ユーザはこのシステムが出力する内容や順序を知っている。そして、該システムが、例えば「今日の大阪の天気は雨で降水確率は80%です。気温は30度で蒸し暑い天気となるでしょう。明日の天気は‥」というテキスト内容を読み上げるものとする。ここでユーザが、この天気情報の音声が始まったとき(“今日の…”)に、明日の情報を知りたくなったとする。そこで、ユーザは「明日の天気は?」と問い合わせるとすると、システム側では、“明日の天気は“というテキスト文を、読み上げたテキスト文から検索し、その位置が見つかれば、そこまで飛び音声出力を開始する。つまり、「明日の天気は、雨のち曇りで…」というように先の文章にジャンプする。このように、未読の読上げテキスト箇所も検索することで。システムはより柔軟な応対ができるものとなる。
実施形態1の構成図である。 実施形態1の動作説明用フローチャートである。 実施形態1に用いる文法ネットワークの説明図である。 実施形態2の構成図である。 実施形態2の動作説明用フローチャートである。
符号の説明
11 マイクロホン
12 音声認識部
121 音響分析部
122 文法格納部
123 辞書格納部
124 疑問対象抽出手段
13 位置特定手段
14 読上げ内容格納
15 音声合成部
16 スピーカ
17 アプリケーション
18 停止位置記憶部
19 辞書格納部

Claims (9)

  1. ユーザの操作に応じて予め備えられているテキストを合成音声で音声出力手段から再生出力させる音声再生装置において、
    ユーザからの音声を受け付ける音声受付手段と、
    該音声受付手段で受け付けた音声によって形成される構文が疑問文か否かを判定するとともに、疑問文の場合疑問を示す疑問キーワードを抽出する疑問対象抽出手段と、
    前記音声合成部から出力済みの合成音声の内容に対して、前記疑問キーワードを検索してユーザの疑問に対する答えに相応する箇所を特定する位置特定手段とを備え、
    前記位置特定手段により特定した箇所を応答の音声として合成音声により前記音声出力手段から出力させることを特徴とする音声再生装置。
  2. 前記位置特定手段は、前記疑問対象抽出手段により抽出した前記疑問キーワードの文言情報に基づいて特定することを特徴とする請求項1記載の音声再生装置。
  3. 前記位置特定手段は、前記疑問キーワードの文言情報が単位を表す場合、当該疑問キーワードを検索して当該疑問キーワードの前にある数詞情報を特定することを特徴とする請求項2記載の音声再生装置。
  4. 前記位置特定手段は、前記疑問対象抽出手段により抽出した前記疑問キーワードが複数あった場合、受け付けた音声中から答えに相応する箇所を特定するための補助キーワードを抽出し、当該補助キーワードに基づいて当該箇所を特定することを特徴とする請求項1乃至3の何れか記載の音声再生装置。
  5. 前記音声出力手段から再生出力するテキスト部分を格納する読上げ内容格納を備え、前記位置特定手段は、格納されたテキスト部分内から答えに相応する箇所を特定することを特徴とする請求項1乃至4の何れか記載の音声再生装置。
  6. 前記位置特定手段は、現在のテキスト出力位置から、最も近い答えに相応する箇所を特定することを特徴とする請求項5記載の音声再生装置。
  7. 前記疑問対象抽出手段により疑問キーワードが抽出された場合に、テキストの再生出力を停止させるテキスト読上げ手段を備えたことを特徴とする音声再生装置
  8. 前記音声出力手段において再生出力されたテキスト部分を格納するテキスト記憶手段を備え、該テキスト記憶手段に格納されたテキスト部分を参照し、該テキスト部分に続くテキストを前記音声出力手段より再生出力させることを特徴とする請求項7記載の音声再生装置。
  9. 前記テキストが料理レシピであることを特徴とする請求項1乃至8の何れか記載の記載の音声再生装置。
JP2005312002A 2005-10-26 2005-10-26 音声再生装置 Withdrawn JP2007121577A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005312002A JP2007121577A (ja) 2005-10-26 2005-10-26 音声再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005312002A JP2007121577A (ja) 2005-10-26 2005-10-26 音声再生装置

Publications (1)

Publication Number Publication Date
JP2007121577A true JP2007121577A (ja) 2007-05-17

Family

ID=38145501

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005312002A Withdrawn JP2007121577A (ja) 2005-10-26 2005-10-26 音声再生装置

Country Status (1)

Country Link
JP (1) JP2007121577A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020086028A (ja) * 2018-11-20 2020-06-04 東京瓦斯株式会社 情報処理装置およびプログラム
DE112019006199T5 (de) 2018-12-13 2021-09-23 Sony Group Corporation Datenverarbeitungsvorrichtung, Datenverarbeitungssystem und Datenverarbeitungsverfahren und Programm
US12002460B2 (en) 2018-12-13 2024-06-04 Sony Group Corporation Information processing device, information processing system, and information processing method, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020086028A (ja) * 2018-11-20 2020-06-04 東京瓦斯株式会社 情報処理装置およびプログラム
JP7284571B2 (ja) 2018-11-20 2023-05-31 東京瓦斯株式会社 情報処理装置およびプログラム
DE112019006199T5 (de) 2018-12-13 2021-09-23 Sony Group Corporation Datenverarbeitungsvorrichtung, Datenverarbeitungssystem und Datenverarbeitungsverfahren und Programm
US12002460B2 (en) 2018-12-13 2024-06-04 Sony Group Corporation Information processing device, information processing system, and information processing method, and program

Similar Documents

Publication Publication Date Title
US10917758B1 (en) Voice-based messaging
KR100812109B1 (ko) 자연어 인터페이스 제어 시스템
US20230317074A1 (en) Contextual voice user interface
JP4481972B2 (ja) 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム
US10147416B2 (en) Text-to-speech processing systems and methods
US9542929B2 (en) Systems and methods for providing non-lexical cues in synthesized speech
JP2002527829A (ja) 自動照会方法およびシステム
JP5824829B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
KR101836430B1 (ko) 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버
US9691389B2 (en) Spoken word generation method and system for speech recognition and computer readable medium thereof
US11798559B2 (en) Voice-controlled communication requests and responses
US11715472B2 (en) Speech-processing system
JP2011504624A (ja) 自動同時通訳システム
US20240087562A1 (en) Interactive content output
US11783824B1 (en) Cross-assistant command processing
JP2007121577A (ja) 音声再生装置
US11582174B1 (en) Messaging content data storage
US11735178B1 (en) Speech-processing system
US10854196B1 (en) Functional prerequisites and acknowledgments
JP4042435B2 (ja) 音声自動質問応答装置
US11393451B1 (en) Linked content in voice user interface
US11176930B1 (en) Storing audio commands for time-delayed execution
JP2001042883A (ja) テキスト音声合成装置
JP2004309682A (ja) 音声対話方法、音声対話端末装置、音声対話センタ装置、音声対話プログラム
JP2001166785A (ja) 音声対話コーパスの作成装置及び方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090106