JP4103085B2 - 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体 - Google Patents
異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体 Download PDFInfo
- Publication number
- JP4103085B2 JP4103085B2 JP2003375204A JP2003375204A JP4103085B2 JP 4103085 B2 JP4103085 B2 JP 4103085B2 JP 2003375204 A JP2003375204 A JP 2003375204A JP 2003375204 A JP2003375204 A JP 2003375204A JP 4103085 B2 JP4103085 B2 JP 4103085B2
- Authority
- JP
- Japan
- Prior art keywords
- dialogue
- language
- unit
- terminal unit
- response content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
すなわち、機械による同時通訳を考えるとき、(1)音声認識レベル、(2)言語間の変換(翻訳)のレベル、(3)音声合成のレベル、の3つに分けて考えられる。第1のレベルは、入力された音声を単語の系列に変換(翻訳)するか(単語単位の音声認識の場合)、またはVCあるいは単音節のようなより基本的な音響音声単位の系列として認識され、辞書と簡単な文法により単語の系列に変換する(NTT R&D 2000年3月号(メディア処理技術)(非特許文献2参照))。
第3のレベルは、単語またはその系列からなる句、文のようなものが、それから音声を発生するに必要な情報に変換され、音声が発生される(音声の合成と認識(総合電子出版社発行)(非特許文献4参照)。
第1の対話者が第1の言語で第1の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第2の言語に翻訳した翻訳結果を第2の端末部に伝達し、第2の対話者が第2の言語で第2の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第1の言語に翻訳した翻訳結果を第1の端末部に伝達する第5のステップをさらに有し、
(a)自由発話状態と、(b)対話理解状態のいずれかの状態を有し、
(a)自由発話状態の場合は、前記第5のステップを繰り返し実行するとともに、予め対話シナリオと関連付けて前記対話制御部に記憶したキーフレーズを前記認識結果が含むならば、状態を前記(b)対話状態に変更するか、
(b)対話理解状態の場合は、前記第1から第4のステップを実行し、
前記第1のステップにおいて、前記(1)から(3)に加えて、(4)状態を(b)対話理解状態に変更するか、のいずれかを選択実行することも特徴としている。
第1の対話者が第1の言語で第1の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第2の言語に翻訳した翻訳結果を第2の端末部に伝達し、
第2の対話者からの第2の言語による入力を受け付け、入力があった場合には、
前記(1)の場合に、前記決定した応答内容を第1の端末部に伝達せず、該入力を第1の言語に翻訳して該第1の端末部に伝達し、
前記第3のステップは、さらに、
第2の対話者が第2の言語で第2の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第1の言語に翻訳した翻訳した翻訳結果を第1の端末部に伝達し、
第1の対話者からの第1の言語による入力を受け付け、入力があった場合には、
前記(1’)の場合に、前記決定した応答内容を第2の端末部に伝達せずに、該入力を第2の言語に翻訳して第2の端末部に伝達することも特徴としている。
また、予め記憶した対話シナリオで想定していない発話を対話者が行った場合でも、システムが対話シナリオに沿って不自然に応答することなく、対話者間の対話を続行して意思疎通を実現することができる。
(装置の構成)
図1は、本発明の実施形態に係る異言語間対話処理装置のブロック構成図である。
本実施形態の異言語間対話処理装置(対話システム)は、図1に示すように、音声認識部11および発話理解部12と結合した端末部10と、音声認識部21および発話理解部22と結合した端末部20と、対話シナリオ記憶部40および定型対話文データ記憶部50が参照可能で、かつ機械翻訳部31と結合した対話制御部30とから構成されている。
端末部10には対話者Aが、端末部20には対話者Bが、それぞれ音声で入力するとともに、出力した音声を聞く役目を行う。
まず、対話システムは、対話制御部30が対話シナリオ記憶部40を参照し、対話端末部10を介して対話者Aに、または端末部20を介して対話者Bに発話を求める。発話を求められた対話者A,Bは、端末部10,20を介して発話を入力し、その発話を端末部10,20と結合した音声認識部11,21を使用して音声認識結果を得る。
次の処理の選択肢としては、入力した対話者AまたはB側の端末部10または20で扱う言語で、音声合成や画面表示により、発話理解結果に応じた応答内容を、定型対話文データ記憶部50に記載された定型対話文を使って伝達し、入力した対話者A,Bに次の発話を求めるか、あるいは、入力した対話者がAなら別の端末部20を介して端末部20で扱う言語で、入力した対話者がBなら別の端末部10を介して端末部10で扱う言語で、音声合成や画面表示により、発話理解結果に応じた応答内容を、定型対話文データ記憶部50に記載された定型対話文と、機械翻訳部31の翻訳結果と、を使って伝達し、入力した対話者がAなら別の対話者Bに、入力した対話者がBなら別の対話者Aに、次の発話を求めるか、あるいは、対話を終了するか、のいずれか一つを選択する。
端末部10,20での発話入力においては、音声認識だけでなく、対話者A,Bが文字認識装置で入力し、システムが文字認識する方法や、対話者がキーボード入力した文字列をシステムがそのまま受理する方法を併用して、本実施形態を実施することも可能である。
端末部10,20での、定型対話文を使った発話内容の伝達においては、音声合成装置で音声出力する方法、あるいは画面表示による方法、あるいは音声合成装置での音声出力と画面表示を併用する方法、により本実施形態を実施することが可能である。
図2は、本発明の実施形態に係る対話シナリオの例を示す説明図である。
図1の対話シナリオ記憶部40には、図2に示すようなフォーマットで内容が記憶されている。すなわち、対話シナリオ記憶部40は、対話状態、発話理解結果、応答先、応答内容、次の対話状態の各項目を持つ表形式で構成され、初期状態の対話状態から始まり終了状態の対話状態となるまで対話が継続する間の対話状態の推移を、それぞれの対話状態で得られたシステムの発話理解結果それぞれに対して、システムがどの対話者を応答先として、どのような応答内容で応答を行い、その結果、どの次対話状態になるかを規定している。
キーフレーズが含まれている発話があったときのみに、対応づけられている対話シナリオを実行することで、対話シナリオで想定していない発話があっても、対話シナリオに沿った不自然な応答を対話者に伝達することを避けることができる。
図9では、キーフレーズ『予約』,『席を取る』に対応づけて、図2に示す予約シナリオを記憶し、キーフレーズ『注文』に対応づけて、注文シナリオを記憶している。注文シナリオは、予約シナリオと同様に、対話者から注文の品名や数量を聞き出す対話シナリオである。キーフレーズは、複数の単語であったり、それらの単語の発音記号であってもよい。
図9のように、複数の対話シナリオを用意しておけば、対話者の所望する対話の状況に応じてそれらの対話シナリオを使い分けることが可能となる。
図3は、本発明の実施形態に係る定型対話文データの例を示す説明図である。
図3では、応答内容ごとに、対応する定型対話文を用意した定型対話文データが示されている。応答内容から日本語や英語などの対話文を生成する具体的方法として、図2のような対話シナリオに指定された応答内容に対応する定型対話文を図3に示すような定型文対話データから求め、求めた定型対話文を使って対話文を生成する。なお、ここで、定型対話文データを参照する方法の代わりに、自然言語文生成の従来技術を利用して、応答内容から日本語や英語などの対話文を生成する方法により、本発明を実施することも可能である。
図4は、本発明の実施形態に係る対話の例を示す説明図である。
図4では、図2の対話シナリオと、図3の定型対話文データに従って、レストランやホテル等の予約を受け付ける異言語間対話の例を示している。
以下、図2に示す対話シナリオと図3に示す応答内容ごとの定型対話文データに従って、図4の対話が行われるプロセスを説明する。
対話は初期状態の対話状態から開始され、システムは応答先に指定された端末部10に対して図2で指定された応答内容として予約の日時を聞く。
図4の対話例では、『予約の日時をおっしゃってください』という応答に対して、対話者Aが『19日7時でお願いしたいんですけれど。』と発話しており、システムはその発話に対して〔日にち=X,時刻=Y〕を具体化した日にち=29日、時刻=7時、のように日にちの方を音声認識部11で誤認識し、発話理解部21で誤った発話理解をしている。
対話者Bは“Yes,it’s possible”と英語で発話を行い、音声認識部21による認識結果からシステムが〔予約可〕と発話理解部22で発話理解して、応答内容〔予約可を確認〕に対する定型対話文“Shall I go ahead and tell the customer their request is possible?”を端末部20を通じて対話者Bに応答する。対話状態はB10から次対話状態B11に遷移し、B11で対話者Bの発話“Yes”を音声認識部21で認識し、〔肯定〕と発話理解部22で発話理解する。
このような対話処理によりシステムを介した対話者Aと対話者Bの対話を続けていき、対話状態A90に遷移したものとする。遷移した対話状態A90で対話者Aの発話を音声認識部11で認識し、〔確認〕という理解結果が発話理解部12で得られ、応答内容〔対話終了を確認〕に対する定型対話文『終了しますか。』を対話者Aに端末部10を介して伝え、次対話状態A91に遷移する。ここで、対話者Aが『はい、終わります。』と発話し、音声認識部11による認識結果からシステムがこれを〔肯定〕と発話理解部12で発話理解し、端末部10を介して〔対話終了を伝達〕に対する定型対話文『ありがとうございました。』を対話者Aに伝える。ここで、次対話状態が終了状態となるので、対話は終了となる。
図5は、本発明の第1の実施例に係る異言語間対話処理方法の処理フローチャートである。
第1の実施例では、音声認識部11,21では音声認識の従来技術、発話理解部12,22では発話理解の従来技術を利用する。応答内容を伝達し、応答を求める文を生成する方法として、定型対話文データ記憶部50のデータおよび従来の機械翻訳技術を利用するか、自然言語文生成および機械翻訳の従来技術を利用する。
図1の対話制御部30は、対話者Aが第1の言語により第1の端末部10を介して発話した文を音声認識部11により認識し(ステップ201)、発話された文の内容を発話理解部12により理解し、予め対話シナリオ記憶部40に記憶した対話シナリオを参照し(ステップ202)、発話を理解した結果により、次の処理を選択する(ステップ203)。
すなわち、(1)対話者Aが利用する端末部10に対する応答内容を決定し、該応答内容を第1の言語で対話者Aが利用する該端末部10に伝達するか(ステップ204)、あるいは、(2)対話者Bが利用する端末部20に対する応答内容を決定し、該応答内容を第2の言語で対話者Bが利用する端末部20に伝達するか(ステップ205)、あるいは、(3)対話を終了するか(ステップ206)、のいずれかを選択実行する。
第2の言語による対話者Bの発話を端末部20を介して受信し、受信した発話内容を音声認識部21により認識し(ステップ209)、該発話の内容を発話理解部22により理解し、予め対話シナリオ記憶部40に記憶した対話シナリオを参照し(ステップ210)、発話を理解した結果により、次の処理を選択する(ステップ211)。すなわち、(1’)対話者Bが利用する端末部20に対する応答内容を決定し、該応答内容を第2の言語で対話者Bが利用する該端末部20に伝達するか(ステップ212)、あるいは、(2’)対話者Aが利用する端末部10に対する応答内容を決定し、該応答内容を第1の言語で対話者Aが利用する端末部10に伝達するか(ステップ213)、あるいは、(3’)対話を終了するか(ステップ214)、のいずれかを選択実行する。
図6は、本発明の第2の実施例に係る異言語間対話処理方法の処理フローチャートである。
第2の実施例においては、対話者の端末部10,20に応答内容を伝達する場合、対話シナリオ記憶部40に記載された応答内容ごとに、定型対話文データ記憶部50内に定型対話文を用意しておき、照合した応答内容が指定する定型対話文を使用して応答内容を伝達する。
すなわち、対話シナリオを参照し(ステップ301)、対話シナリオの応答内容ごとに定型対話文データ記憶部50に登録された定型対話文を参照する(ステップ302)。参照した定型対話文に、XかYなどの変項部分があるかどうかを調べ(ステップ303)、なければ、照合した応答内容が指定する定型対話文をそのまま用いて応答内容を端末部10,20に伝達する(ステップ304)。
図7および図8は、本発明の第3の実施例に係る異言語間対話処理方法のフローチャートである。
第3の実施例においては、対話制御部30が(a)自由発話状態か、(b)対話理解状態のいずれかの状態を持つ。また、対話シナリオ記憶部40には、図9に示すような複数の対話シナリオをキーフレーズと対応づけて記憶している。
まず、対話制御部30の状態を(a)自由発話状態に設定する(ステップ401)。
対話制御部30の状態が、(a)自由発話状態の場合(ステップ402)は、対話者Aが第1の言語により第1の端末部10を介して発話した文を音声認識部11により認識し(ステップ403)、対話シナリオ記憶部40に記憶しているキーフレーズを音声認識結果に含むかを判定する(ステップ404)。キーフレーズを含む場合には、状態を(b)対話理解状態に変更し、当該キーフレーズに対応づけて記憶されている対話シナリオを次ステップより参照するために一次記憶メモリに読み込む(ステップ410)。
対話制御部30の状態が(b)対話理解状態の場合、図8のフローチャートを実行する(ステップ402)。対話制御部30は、対話者Aが第1の言語により第1の端末部10を介して発話した文を音声認識部11により認識し(ステップ501)、発話された文の内容を発話理解部12により理解し、ステップ410で一次記憶メモリに読み込んだ対話シナリオを参照し(ステップ502)、第1の実施例と同様に(1)〜(3)のいずれかの処理を選択し、実行する(ステップ503)。
対話者Bからの入力がない場合は、第1の実施例と同様に、対話者Aが利用する端末部10に対する応答内容を決定し、該応答内容を第1の言語で端末部10に伝達する。対話者Bからの入力があった場合は、前記決定した応答内容を端末部10に伝達せずに、該入力を機械翻訳部31によって第1の言語に翻訳した翻訳結果を端末部10に伝達する(ステップ5041)。その後、直前に対話者Aに伝達した応答内容を用いて再び対話者Aに応答を求める(ステップ507)。
同様にして、端末者Bによる発話も処理する(ステップ509〜516)。
ステップ503、あるいはステップ511において、(3)対話が終了するが選択された場合、図7のフローチャートに戻る。すなわち、対話制御部30の状態を(a)自由発話状態に変更し(ステップ401)、音声認識結果にキーフレーズが含まれない限り、図7のフローチャートに示す対話が実行される。
図10の*1の部分は、対話制御部30の状態が(a)自由発話状態である対話を示し、*2の部分は、(b)対話理解状態である対話を示す。それぞれの発話における括弧内の文は、音声認識結果が機械翻訳部31によって翻訳され、そのまま相手の対話者に伝達された文を示す。
*1の部分に示す対話では、対話シナリオでは想定していない挨拶などの対話を、そのまま他方の対話者に伝えることで、意思の疎通を実現している。
対話者Bの発話にキーフレーズ『予約』が含まれているため、この後の対話では予約シナリオが実行される。ここで、対話者Bの発話に他のキーフレーズが含まれていれば、他のシナリオ(例えば、前記注文シナリオ)を実行することができ、対話者の所望する対話を選択して実現することができる。
そして、対話シナリオの実行が終了すれば、(a)自由発話状態となり、再びキーフレーズが含まれた発話がなされるまで、対話者の発話を音声認識し、音声認識結果を翻訳して他方の対話者に伝える。図10の対話では、予約が完了した後に、『Thank you very much.』と『What more can I help?』という発話が対話者Bによってなされている。図2に示す予約シナリオでは、予約を完了した後の対話については想定されていないが、第3の実施例によれば、これらの発話が音声認識され、機械翻訳により翻訳され、他方の対話者に伝えられる。
ここで、対話者Aが『注文できますか?』とキーフレーズを含む発話を行なえば、キーフレーズに対応づけて記憶されている注文シナリオを実行して、対話を進めることも可能である。
このような実施形態の方法および装置を使用することにより、一方の対話者が他方の対話者と異なる言語を使用して発話を行う対話で、対話者の発話した内容を誤って認識した場合であっても、最終的には、予約の可否を問い合わせ予約を受け付けるなどの対話の目的を達成させることができる。
なお、図5に示す処理フローをコード化してプログラムとし、これをCD−ROMなどの記録媒体に格納しておけば、プログラムの販売や貸付けなどの場合には便利であり、また、対話システムのコンピュータに記録媒体を装着して、プログラムをインストールして実行させることにより、本発明を容易に実現させることが可能である。
12…発話理解部、21…音声認識部、22…発話理解部、
31…機械翻訳部、40…対話シナリオ記憶部、
50…定型対話文データ記憶部。
Claims (16)
- それぞれ異なる言語を使用する利用者により対話を行うための複数の端末部を対話制御部を介して接続し、該対話制御部により端末部の利用者間の意思疎通を図る異言語間対話処理方法であって、
第1の対話者が第1の言語で第1の端末部を介して発話した文を音声認識部により認識し、発話された文の内容を発話理解部により理解し、該対話制御部において、予め記憶した対話シナリオを参照し、前記発話を理解した結果により、(1)第1の対話者が利用する第1の端末部に対する応答内容を決定し、該応答内容を第1の言語で該第1の端末部に伝達するか、あるいは、(2)第2の対話者が利用する第2の端末部に対する応答内容を決定し、該応答内容を第2の言語で該第2の端末部に伝達するか、あるいは、(3)対話を終了するか、のいずれかを選択実行する第1のステップと、
前記(1)の場合には、第1の対話者の第1の端末部に、応答内容に対する発話を求め、前記第1のステップを繰り返し実行し、前記(2)の場合には、第2の対話者が利用する第2の端末部に応答内容に対する発話を求める第2のステップと、
第2の対話者が第2の言語で第2の端末部を介して発話した場合、発話した発話内容を音声認識部により認識し、該発話の内容を発話理解部により理解し、該対話制御部において、予め記憶した対話シナリオを参照し、該発話を理解した結果により、(1’)第2の対話者が利用する第2の端末部に対する応答内容を決定し、該応答内容を第2の言語で該第2の端末部に伝達するか、あるいは、(2’)第1の対話者が利用する第1の端末部に対する応答内容を決定し、該応答内容を第1の言語で該第1の端末部に伝達するか、あるいは、(3’)対話を終了するか、のいずれかを選択実行する第3のステップと、
前記(1’)の場合には、第2の対話者が利用する第2の端末部に、応答内容に対する発話を求め、前記第3のステップを繰り返し実行し、前記(2’)の場合には、第1の対話者が利用する第1の端末部に、応答内容に対する発話を求め、前記第1のステップを繰り返し実行する第4のステップと
を有することを特徴とする異言語間対話処理方法。 - 前記対話制御部は、前記対話者が利用する端末部に応答内容を伝達する場合、対話シナリオに記載された応答内容ごとに定型対話文を用意しておき、照合した応答内容が指定する定型対話文を使用して応答内容を伝達する請求項1記載の異言語間対話処理方法。
- 前記対話制御部は、前記対話者が利用する端末部に応答内容を伝達する場合、特に、最も直前に発話を行った対話者とは異なる対話者の端末部に上記応答内容を伝達する場合、すなわち、請求項1記載の(2)あるいは(2’)の場合には、該定型対話文、あるいは、該定型対話文の一部に対して機械翻訳部による変換結果を組み合わせて、応答内容を伝達することを特徴とする請求項2記載の異言語間対話処理方法。
- 前記対話制御部において、
第1の対話者が第1の言語で第1の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第2の言語に翻訳した翻訳結果を第2の端末部に伝達し、第2の対話者が第2の言語で前記第2の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第1の言語に翻訳した翻訳結果を第1の端末部に伝達する第5のステップをさらに有し、(a)自由発話状態と(b)対話理解状態のいずれかの状態を有し、
(a)自由発話状態の場合には、前記第5のステップを繰り返し実行するとともに、予め対話シナリオと関連付けて前記対話制御部に記憶したキーフレーズを前記認識結果が含むならば、状態を前記(b)対話状態に変更するか、
(b)対話理解状態の場合には、前記第1から第4のステップを実行し、
前記第1のステップにおいて、前記(1)から(3)に加えて、(4)状態を(b)対話理解状態に変更するか、のいずれかを選択実行し、
前記第3のステップにおいて、前記(1’)から(3’)に加えて、(4’)状態を(b)対話理解状態に変更するか、のいずれかを選択実行する
ことを特徴とする請求項1から3までのいずれか一項に記載の異言語間対話方法。 - 前記第1のステップは、さらに、
第1の対話者が第1の言語で第1の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第2の言語に翻訳した翻訳結果を第2の端末部に伝達し、
第2の対話者からの第2の言語による入力を受け付け、入力があった場合には、
前記(1)の場合に、前記決定した応答内容を第1の端末部に伝達せずに、該入力を第1の言語に翻訳して該第1の端末部に伝達し、
前記第3のステップは、さらに、
第2の対話者が第2の言語で第2の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第1の言語に翻訳した翻訳結果を第1の端末部に伝達し、
第1の対話者からの第1の言語による入力を受け付け、入力があった場合には、
前記(1’)の場合に、前記決定した応答内容を第2の端末部に伝達せずに、該入力を第2の言語に翻訳して第2の端末部に伝達する
ことを特徴とする請求項1から4までのいずれか一項に記載の異言語間対話方法。 - それぞれ異なる言語を使用する利用者により対話を行うための複数の端末部を対話制御部を介して接続し、該対話制御部により端末部の利用者間の意思疎通を図る異言語間対話処理装置であって、
第1の対話者が第1の言語で第1の端末部を介して発話した文を音声認識する音声認識部と、
該音声認識の結果から発話された文の内容を理解する発話理解部と、
予め記憶した対話シナリオを参照し、前記発話を理解した結果により、(1)第1の対話者が利用する第1の端末部に対する応答内容を決定し、該応答内容を第1の言語で該第1の端末部に伝達するか、あるいは、(2)第2の対話者が利用する第2の端末部に対する応答内容を決定し、該応答内容を第2の言語で該第2の端末部に伝達するか、あるいは、(3)対話を終了するか、のいずれかを選択実行する第1の手段、
前記(1)の場合には、第1の対話者が利用する端末部に、応答内容に対する発話を求め、前記第1の手段を繰り返し実行し、前記(2)の場合には、第2の対話者が利用する第2の端末部に応答内容に対する発話を求める第2の手段、
第2の対話者が第2の言語で第2の端末部を介して発話し、発話した発話内容を音声認識部により認識し、該発話の内容を発話理解部により理解し、対話制御部において、予め記憶した対話シナリオを参照し、該発話を理解した結果により、(1’)第2の対話者が利用する第2の端末部に対する応答内容を決定し、該応答内容を第2の言語により該第2の端末部に伝達するか、あるいは、(2’)第1の対話者が利用する第1の端末部に対する応答内容を決定し、該応答内容を第1の言語で該第1の端末部に伝達するか、あるいは、(3’)対話を終了するか、のいずれかを選択実行する第3の手段、
前記(1’)の場合には、第2の対話者が利用する第2の端末部に、応答内容に対する発話を求め、前記(2’)の場合には、第1の対話者が利用する第1の端末部に、応答内容に対する発話を求め、前記第3の手段を繰り返し実行し、前記第1の手段を繰り返し実行する第4の手段
を備えた対話制御部とを有することを特徴とする異言語間対話処理装置。 - 前記対話制御部は、前記対話者の端末部に応答内容を伝達する場合に、対話シナリオに記載された応答内容ごとに定型対話文を記憶する定型対話文データ記憶部をさらに備え、
前記対話制御部は、該定型対話文と照合した応答内容が指定する定型対話文を使用して該応答内容を端末部に伝達することを特徴とする請求項6記載の異言語間対話処理装置。 - 前記対話制御部は、最も直前に発話を行った対話者とは異なる対話者が利用する端末部に、該応答内容を伝達する場合、すなわち、請求項4記載の(2)あるいは(2’)の場合には、
該定型対話文、あるいは、該定型対話文の一部に対して機械翻訳部による変換結果を組み合わせて、応答内容を伝達することを特徴とする請求項7記載の異言語間対話処理装置。 - 前記対話制御部は、第1の対話者が第1の言語で第1の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第2の言語に翻訳した翻訳結果を第2の端末部に伝達し、第2の対話者が第2の言語で前記第2の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第1の言語に翻訳した翻訳結果を第1の端末部に伝達する第5の手段をさらに有し、
(a)自由発話状態と(b)対話理解状態のいずれかの状態を有し、(a)自由発話状態の場合には、第5の手段を繰り返し実行するとともに、予め対話シナリオと関連付けて前記対話制御部に記憶したキーフレーズを前記認識結果が含むならば、状態を前記(b)対話状態に変更するか、
(b)対話理解状態の場合には、前記第1から第4の手段を実行し、
前記第1の手段において、前記(1)から(3)に加えて、(4)状態を(b)対話理解状態に変更するか、のいずれかを選択実行し、
前記第3の手段において、前記(1’)から(3’)に加えて、(4’)状態を(b)対話理解状態に変更するか、のいずれかを選択実行する
ことを特徴とする請求項6から8までのいずれか一項に記載の異言語間対話処理装置。 - 前記第5の手段は、さらに、第1の対話者が第1の言語で第1の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第2の言語に翻訳した翻訳結果を第2の端末部に伝達し、
第2の対話者からの第2の言語による入力を受け付け、入力があった場合には、
前記(1)の場合に、前記決定した応答内容を第1の端末部に伝達せずに、該入力を第1の言語に翻訳して該第1の端末部に伝達し、
前記第3の手段は、さらに、
第2の対話者が第2の言語で第2の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第1の言語に翻訳した翻訳結果を第1の端末部に伝達し、
第1の対話者からの第1の言語による入力を受け付け、入力があった場合には、
前記(1’)の場合に、前記決定した応答内容を第2の端末部に伝達せずに、該入力を第2の言語に翻訳して第2の端末部に伝達する
ことを特徴とする請求項6から9までのいずれか一項に記載の異言語間対話処理装置。 - それぞれ異なる言語を使用する利用者により対話を行うための複数の端末部を対話制御部を介して接続し、該対話制御部により端末部の利用者間の意思疎通を図る異言語間対話処理用プログラムであって、
該対話制御部のコンピュータに、第1の対話者が第1の言語で第1の端末部を介して発話した文を音声認識部により認識する手順、発話された文の内容を発話理解部により理解する手順、予め記憶した対話シナリオを参照し、前記発話を理解した結果により、(1)第1の対話者が利用する端末部に対する応答内容を決定し、該応答内容を第1の言語で該第1の端末部に伝達するか、あるいは、(2)第2の対話者が利用する第2の端末部に対する応答内容を決定し、該応答内容を第2の言語で該第2の端末部に伝達するか、あるいは、(3)対話を終了するか、のいずれかを選択実行する対話制御部における第1の手順、
前記(1)の場合には、第1の対話者が利用する第1の端末部に、応答内容に対する発話を求め、前記第1の手順を繰り返し実行し、前記(2)の場合には、第2の対話者の端末部に伝達内容に対する発話を求める対話制御部における第2の手順、
第2の対話者が第2の言語で第2の端末部を介して発話し、発話した発話内容を音声認識部により認識し、該発話の内容を発話理解部により理解する手順、予め記憶した対話シナリオを参照し、対話制御部において、該発話を理解した結果により、(1’)第2の対話者が利用する第2の端末部に対する応答内容を決定し、該応答内容を第2の言語により該第2の端末部に伝達するか、あるいは、(2’)第1の対話者が利用する第1の端末部に対する応答内容を決定し、該応答内容を第1の言語で該第1の端末部に伝達するか、あるいは、(3’)対話を終了するか、のいずれかを選択実行する対話制御部における第3の手順、
前記(1’)の場合には、第2の対話者が利用する第2の端末部に、応答内容に対する発話を求め、前記第3の手順を繰り返し実行し、前記(2’)の場合には、第1の対話者の端末部に、応答内容に対する応答を求め、前記第1の手順を繰り返し実行する対話制御部における第4の手順を、それぞれ実行させるための異言語間対話処理用プログラム。 - 請求項11に記載の異言語間対話処理用プログラムにおいて、
前記対話制御部のコンピュータに、対話者が利用する端末部に応答内容を伝達する場合、対話シナリオごとに用意された定型対話文を参照する手順、照合した応答内容が指定する定型対話文を使用して応答内容を伝達する手順を、それぞれ実行させるための異言語間対話処理用プログラム。 - 請求項12に記載の異言語間対話処理用プログラムにおいて、
前記対話制御部のコンピュータに、最も直前に発話を行った対話者とは異なる対話者が利用する端末部に、上記応答内容を伝達する場合には、該定型対話文、あるいは、該定型対話文の一部に対して機械翻訳部による変換結果を組み合わせて、応答内容を伝達する手順を、実行させるための異言語間対話処理用プログラム。 - 請求項11から13までのいずれかに記載の異言語間対話処理用プログラムにおいて、
前記対話制御部のコンピュータに、第1の対話者が第1の言語で第1の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第2の言語に翻訳した翻訳結果を第2の端末部に伝達し、第2の対話者が第2の言語で前記第2の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第1の言語に翻訳した翻訳結果を第1の端末部に伝達する第5の手順をさらに実行させ、
(a)自由発話状態と(b)対話理解状態のいずれかの状態を有し、(a)自由発話状態の場合には、前記第5の手順を繰り返し実行するとともに、予め対話シナリオと関連付けて前記対話制御部に記憶したキーフレーズを前記認識結果が含むならば、状態を前記(b)対話状態に変更し、(b)対話理解状態の場合には、前記第1から第4の手順を実行させ、
前記第1の手順において、前記(1)から(3)に加えて、(4)状態を(b)対話理解状態に変更するか、のいずれかを選択実行する手順、
前記第3の手段において、前記(1’)から(3’)に加えて、(4’)状態を(b)対話理解状態に変更するか、のいずれかを選択実行する手順を実行させるための異言語間対話処理用プログラム。 - 前記対話制御部のコンピュータに実行させる前記第5の手順は、さらに、第1の対話者が第1の言語で第1の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第2の言語に翻訳した翻訳結果を第2の端末部に伝達する手順、
第2の対話者からの第2の言語による入力を受け付け、入力があった場合には、
前記(1)の場合に、前記決定した応答内容を第1の端末部に伝達せずに、該入力を第1の言語に翻訳して該第1の端末部に伝達する手順であり、
前記第3の手順は、さらに、第2の対話者が第2の言語で第2の端末部を介して発話した文を前記音声認識部により認識し、該認識結果を第1の言語に翻訳した翻訳結果を第1の端末部に伝達する手順、
第1の対話者からの第1の言語による入力を受け付け、入力があった場合には、
前記(1’)の場合に、前記決定した応答内容を第2の端末部に伝達せずに、該入力を第2の言語に翻訳して第2の端末部に伝達する手順であることを特徴とする請求項11から14までのいずれか一項に記載の異言語間対話処理用プログラム。 - 請求項11から請求項15までのいずれかに記載の異言語間対話処理用プログラムを記録したことを特徴とするコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003375204A JP4103085B2 (ja) | 2003-05-20 | 2003-11-05 | 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003141802 | 2003-05-20 | ||
JP2003375204A JP4103085B2 (ja) | 2003-05-20 | 2003-11-05 | 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005004716A JP2005004716A (ja) | 2005-01-06 |
JP4103085B2 true JP4103085B2 (ja) | 2008-06-18 |
Family
ID=34106420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003375204A Expired - Fee Related JP4103085B2 (ja) | 2003-05-20 | 2003-11-05 | 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4103085B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4849662B2 (ja) * | 2005-10-21 | 2012-01-11 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
JP4888996B2 (ja) * | 2005-10-21 | 2012-02-29 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
JP2007114621A (ja) * | 2005-10-21 | 2007-05-10 | Aruze Corp | 会話制御装置 |
JP4846336B2 (ja) * | 2005-10-21 | 2011-12-28 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
JP4849663B2 (ja) * | 2005-10-21 | 2012-01-11 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
JP2009193532A (ja) * | 2008-02-18 | 2009-08-27 | Oki Electric Ind Co Ltd | 対話管理装置、方法及びプログラム、並びに意識抽出システム |
JP5152314B2 (ja) * | 2010-12-16 | 2013-02-27 | 沖電気工業株式会社 | 対話管理装置、方法及びプログラム、並びに意識抽出システム |
JP2017167659A (ja) | 2016-03-14 | 2017-09-21 | 株式会社東芝 | 機械翻訳装置、方法、およびプログラム |
-
2003
- 2003-11-05 JP JP2003375204A patent/JP4103085B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005004716A (ja) | 2005-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101042119B1 (ko) | 음성 이해 시스템, 및 컴퓨터 판독가능 기록 매체 | |
JP4768969B2 (ja) | 高度対話型インターフェースに対する理解同期意味オブジェクト | |
US6801897B2 (en) | Method of providing concise forms of natural commands | |
CA2493265C (en) | System and method for augmenting spoken language understanding by correcting common errors in linguistic performance | |
EP2282308B1 (en) | Multi-slot dialog system and method | |
KR101211796B1 (ko) | 외국어 학습 장치 및 그 제공 방법 | |
JP5967569B2 (ja) | 音声処理システム | |
JP2002540479A (ja) | クライアントサーバ音声認識 | |
JP2007093789A (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP2001100781A (ja) | 音声処理装置および音声処理方法、並びに記録媒体 | |
JP6150268B2 (ja) | 単語登録装置及びそのためのコンピュータプログラム | |
WO2006097975A1 (ja) | 音声認識プログラム | |
USH2187H1 (en) | System and method for gender identification in a speech application environment | |
WO2018043138A1 (ja) | 情報処理装置および情報処理方法、並びにプログラム | |
JP2011504624A (ja) | 自動同時通訳システム | |
JP4103085B2 (ja) | 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体 | |
US8355484B2 (en) | Methods and apparatus for masking latency in text-to-speech systems | |
EP1899955B1 (en) | Speech dialog method and system | |
JP6397641B2 (ja) | 自動通訳装置及び方法 | |
JP2002041084A (ja) | 対話処理システム | |
JP7132206B2 (ja) | 案内システム、案内システムの制御方法、およびプログラム | |
JP3526549B2 (ja) | 音声認識装置、方法及び記録媒体 | |
Furui | Toward the ultimate synthesis/recognition system. | |
JP2001013992A (ja) | 音声理解装置 | |
JP2000242295A (ja) | 音声認識装置および音声対話装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060405 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080229 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080313 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110404 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120404 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130404 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140404 Year of fee payment: 6 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |