JP2005345681A - 異言語間対話処理方法および装置 - Google Patents

異言語間対話処理方法および装置 Download PDF

Info

Publication number
JP2005345681A
JP2005345681A JP2004164309A JP2004164309A JP2005345681A JP 2005345681 A JP2005345681 A JP 2005345681A JP 2004164309 A JP2004164309 A JP 2004164309A JP 2004164309 A JP2004164309 A JP 2004164309A JP 2005345681 A JP2005345681 A JP 2005345681A
Authority
JP
Japan
Prior art keywords
dialogue
dialog
output
unit
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004164309A
Other languages
English (en)
Inventor
Akira Kataoka
明 片岡
Naoki Asanoma
直樹 麻野間
Yamato Takahashi
大和 高橋
Setsuo Yamada
節夫 山田
Kura Furuse
蔵 古瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004164309A priority Critical patent/JP2005345681A/ja
Publication of JP2005345681A publication Critical patent/JP2005345681A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】対話者が相手の対話者に伝達したい事柄をどのような順番で伝達するかを、対話者の望む自由な順番で伝達することができるようにし、対話者にとって自由な対話が実現できるようにした異言語間対話処理方法およびその装置を提供すること。
【解決手段】異言語間対話処理装置を構成する端末部が、複数の出力文を記憶することができる出力文記憶部と、複数の対話状態を記憶することができる対話状態記憶部を有するように構成し、出力記憶部に記憶されている複数の出力文のうちいずれかを出力し(ステップ501)、対話者の発話から抽出されたキーワードと、対話状態記憶部に記憶されているいずれかの対話状態との組合せのうち、対話シナリオに記述されている条件に合うものがあれば(ステップ502〜ステップ504)、対話シナリオに記述されている動作を選択する(ステップ505〜ステップ510)ように構成した点にある。
【選択図】 図4

Description

本発明は、それぞれ異なる言語を使用する対話者の間の意思疎通を可能にする異言語間対話処理方法およびその装置に関するものである。
従来の異言語間対話処理装置に関する技術では、一方の話者がある言語で入力した全ての発話内容を音声認識処理装置で認識し、それを機械翻訳装置で別の言語に翻訳して、音声合成装置などにより別の言語で別の話者に伝達する方法を用いていた(非特許文献1参照)。しかしながら、現状の音声認識処理装置はその性能が十分でないため、入力した発話内容と異なる音声認識結果が得られることが多く、また、機械翻訳装置の性能も十分でないため、発話内容と異なる内容に翻訳され、相手の対話者に伝達されることもあった。そのため、対話者が相手の対話者に正しく意思を伝達することが困難であった。
そこで、非特許文献2における異言語間対話処理装置では、対話の目的ごとに、対話者の間でやり取りされる対話の流れを対話シナリオとして予め記述しておき、異言語間対話処理装置は、この対話シナリオに沿って対話を制御する。すなわち、対話者の発話を発話理解した結果に応じて、発話理解結果を対話者自身に確認するか、または、他方の対話者にその理解結果の翻訳を含む応答を伝達する。この処理により、対話者自身に正しいと確認され、かつ、相手言語に変換可能な応答のみを伝達することが可能になり、必ずしも正しい結果を出力するとは限らない現状の技術レベルの音声認識装置や機械翻訳の技術を使った場合でも、異なる言語を使用する対話者間の意思疎通を実現している。
Kiyoshi Yamabana, Ken Hanazawa, Ryosuke Isotani, Seiya Osada, Akitoshi Okumura, and Takao Watanabe."A Speech Translation System with Mobile Wireless Clients."In the Companion Volume to the Proceedings of 41 Annual Meeting of the Association for Computational; Linguistics(ACL 2003),July 2003. Akira Kataoka, Yamato Takahashi, Setsuo Yamada, Naoki Asanoma and Osamu Furuse."Agent-Mediated Architecture for Efficient Goal-Oriented Communication across Langueges."In Proceeding of Asian Symposium on Natural language Processing to Overcome Language Barriers, the 1st International Joint Conference on Natural Language Processing (IJC-NLP-04).March 2004.
本発明は、非特許文献2に示される異言語間対話処理装置をさらに改良した、異言語間対話処理方法およびその装置を提供することを目的とするものである。
より具体的には、上記非特許文献2における異言語間対話処理装置では、対話者が相手の対話者に伝達したい事柄をどのような順番で伝達するかは、予め記憶された対話シナリオによって決まっており、対話者の発話から抽出されたキーワードによって、異言語間対話処理装置の次の動作は一つに決定されていたのを、対話者の望む自由な順番で伝達することができるように、つまり、対話者にとって自由な対話が実現できるようにした異言語間対話処理方法およびその装置を提供することを目的とするものである。
いい換えれば、本発明の目的は、対話処理装置が、異なる言語を利用する対話者間の対話を対話シナリオに沿って制御する異言語間対話処理方法または装置において、対話者が相手の対話者に伝達したい事柄を、対話シナリオに記述された順番だけでなく、対話者の望む順番で伝達することを可能とする、自由な対話を実現することにある。
本発明の原理は、端末部が、複数の出力文を記憶することができる出力文記憶部と、複数の対話状態を記憶することができる対話状態記憶部を有することにある。つまり、出力記憶部に記憶されている複数の出力文のうちいずれかを出力し、対話者の発話から抽出されたキーワードと、対話状態記憶部に記憶されているいずれかの対話状態との組合せのうち、対話シナリオに記述されている条件に合うものがあれば、対話シナリオに記述されている動作を選択し、次の出力文を出力文記憶部に記憶するか、次の対話状態を対話状態記憶部に記憶するか、他方の対話者の利用する端末部の対話状態記憶部に次の対話状態を記憶するように構成した点にある。
具体的には、本発明に係る異言語間対話処理方法は、それぞれの対話者が利用する端末部を複数接続してなる異言語間対話装置における異言語間対話処理方法であって、対話者(発話者)の発話を音声認識した音声認識結果から、予めキーワード辞書に記憶されているキーワードを抽出し、このキーワードと、対話状態記憶部に複数個記憶されている現在の対話の状態を示す対話状態との組合せを条件として、この条件を満たすときの前記端末部の動作を記述した対話シナリオを参照して対話制御部の次の動作を決定する際に、前記抽出されたキーワードと前記対話状態記憶部に複数個記憶されている対話状態のいずれかとに応じて前記対話シナリオに記述された条件を参照して、(1)対話者A(発話者)に出力する出力文を決定して前記出力文記憶部に当該出力文を記憶する、(2)前記対話者Aの端末部aの次の対話状態を決定して前記対話状態記憶部に当該対話状態を記憶する、(3)前記対話者Aと異なる対話者Bに出力する出力文を決定し、対話者Aの端末部aと異なる対話者Bの端末部bの出力文記憶部に出力文を記憶する、(4)前記端末部bの次の対話状態を決定し、当該端末部bの対話状態記憶部に当該対話状態を記憶する、のいずれかの動作を行うことを特徴とする。
本発明に係る異言語間対話処理方法において、前記(1)の動作を実行する際には、前記対話シナリオに記述されている定型文に、前記抽出されたキーワードを埋め込むことによって、前記出力文を決定し、また、前記(3)の動作を実行する際には、前記対話シナリオに記述されている定型文に、前記抽出されたキーワードを機械翻訳した結果を埋め込むことによって、前記出力文を決定することを特徴とする。
一方、本発明に係る異言語間対話処理装置は、異なる言語を使用する複数の対話者が意思の疎通を図るために、それぞれの対話者が利用する端末部を複数接続した異言語間対話処理装置であって、前記端末部は、当該端末部を利用する対話者に出力する出力文を複数文記憶する出力文記憶部と、この出力文記憶部に記憶されている出力文から一文を選択し出力部に出力する出力制御部と、この出力制御部により選択・出力された出力文を対話者に提示する前記出力部と、対話者の発話を音声認識する音声認識部と、この音声認識部が音声認識した音声認識結果から、予めキーワード辞書に記憶されたキーワードを抽出する発話理解部と、現在の対話の状態を示す対話状態を複数個記憶する対話状態記憶部と、キーワードと対話状態との組合せを条件として、この条件を満たすときの前記端末部の動作を記述した対話シナリオと、前記発話理解部が抽出したキーワードと前記対話状態記憶部に複数個記憶されている対話状態のいずれかとに応じて、前記対話シナリオに記述された条件を参照して、(1)一方の対話者(発話者)Aに出力する出力文を決定し、前記出力文記憶部に当該出力文を記憶する、(2)前記対話者Aの端末部aの次の対話状態を決定し、前記対話状態記憶部に当該対話状態を記憶する、(3)前記対話者Aと異なる対話者Bに出力する出力文を決定し、対話者Aの端末部aと異なる対話者Bの端末部bの出力文記憶部に出力文を記憶する、(4)前記端末部bの次の対話状態を決定し、当該端末部bの対話状態記憶部に当該対話状態を記憶する、のいずれかの動作を行う対話制御部とを有することを特徴とする。
ここで、前記対話制御部は、前記(1)の動作を実行する際には、前記対話シナリオに記述されている定型文に、前記発話理解部が抽出したキーワードを埋め込むことによって、前記出力文を決定するものであり、前記(3)の動作を実行する際には、前記対話シナリオに記述されている定型文に、前記発話理解部が抽出したキーワードを機械翻訳した結果を埋め込むことによって、前記出力文を決定するものであることを特徴とする。
なお、本発明に係る異言語間対話処理方法は、これをコンピュータのプログラム制御により実行させることが好ましく、本発明は、このためのコンピュータ制御用プログラム、並びにこのプログラムを記録したコンピュータにより読み取り可能な記録媒体として商品化することも可能である。
以下に詳述するように、本発明によれば、それぞれの端末部の出力文記憶部は複数の出力文を記憶することができ、かつ、対話状態記憶部は複数の対話状態を記憶することができる。これにより、それぞれ異なる言語を利用する対話者の間の対話を対話シナリオに沿って制御する異言語間対話処理装置において、複数の対話状態を同時に制御することが可能となり、対話者が他方の対話者に伝達すべき事柄を自由な順番で伝達することが可能になる。これにより、対話者にとって、より自由な対話が実現されるという顕著な効果が得られる。
以下に、添付の図面に示す好適実施形態に基づいて、本発明を詳細に説明する。
(全体構成)
図1は、本発明の実施形態に係る異言語間対話処理装置のブロック構成図である。本実施形態に係る異言語間対話処理装置は、図1に示すように、対話者Aが利用する端末部100と、対話者Bが利用する端末部200が接続されて構成されている。
対話者Aが利用する端末部100は、対話者Aからの入力を受付ける入力部101と、音声認識処理を司る音声認識部102と、音声認識部102による音声認識結果からキーワード辞書110を参照してキーワードを抽出する発話理解部103と、この端末部100における処理全体の制御を行う対話制御部104と、対話者に出力する出力文を複数文記憶する出力文記憶部105と、対話状態を複数個記憶する対話状態記憶部106と、翻訳部107と、対話者に提示する情報を出力する出力部108と、キーワードと対話状態の組合せを条件として、この条件を満たすときの端末部の動作を記述した対話シナリオを記憶する対話シナリオ記憶部109と、キーワード辞書110とから構成される。
対話者Bが利用する端末部200は、端末部100と同様に、対話者Bからの入力を受付ける入力部201と、音声認識処理を司る音声認識部202と、音声認識部202による音声認識結果からキーワード辞書210を参照してキーワードを抽出する発話理解部203と、この端末部200における処理全体の制御を行う対話制御部204と、対話者に出力する出力文を複数文記憶する出力文記憶部205と、対話状態を複数個記憶する対話状態記憶部206と、翻訳部207と、対話者に提示する情報を出力する出力部208と、キーワードと対話状態の組合せを条件として、この条件を満たすときの端末部の動作を記述した対話シナリオを記憶する対話シナリオ記憶部209と、キーワード辞書210とから構成される。
以下、上述のように構成される本実施形態に係る異言語間対話処理装置の基本的な動作を説明する。
まず、対話制御部104は、出力記憶部105に出力文が記憶されていれば、記憶されている出力文から一つを選択する。選択された出力文は出力部108によって対話者Aに提示される。以下に説明する実施例では、複数の出力文から一つを選択する際に、記憶された時刻が古いものから順に選択していくとして説明を行うが、記憶された時刻が最も新しいものから順に選択していく方法を採ってもよい。また、出力文を対話者に出力する方法は、音声合成装置によって音声出力するほか、ディスプレイ装置に出力文を表示することによっても実施可能である。
次に、対話者Aは、入力部101を介して発話を入力する。音声認識部102は、入力された発話を音声認識して文字列に変換する。音声認識には、従来技術を利用することができる。発話理解部103は、キーワード辞書110を参照して、音声認識結果の文字列からキーワードを抽出する。対話制御部104は、対話シナリオ記憶部109を参照して、抽出されたキーワードと対話状態記憶部106に記憶された対話状態との組合せのうち、対話シナリオに記述された条件に合うものがあれば、下記の(1)から(4)のいずれかの動作、あるいは、それらの組合せを実行する。
すなわち、
(1)対話シナリオ記憶部109に記憶されている定型文に、抽出されたキーワードを埋め込んで出力文を生成し、出力文記憶部105に記憶する、
(2)対話シナリオ記憶部109に記憶されている次の対話状態を対話状態記憶部106に記憶する、
(3)抽出したキーワードを翻訳部107が日本語に翻訳し、対話シナリオ記憶部109に記憶されている定型文に、翻訳されたキーワードを埋め込んで出力文を生成し、端末部200の対話制御部204に送信する。端末部200の対話制御部204は、送信された出力文を出力文記憶部205に記憶する、
(4)対話シナリオ記憶部109に記憶されている端末部200の次の対話状態を端末部200の対話制御部204に送信する。対話制御部204は、送信された対話状態を対話状態記憶部206に記憶する、
のいずれかである。
ここで翻訳部107および翻訳部207がキーワードを翻訳する機械翻訳技術には、従来技術を利用することができる。
なお、以下では、対話者Aが英語を用いて対話を行い、対話者Bが日本語を用いて対話を行う場合を例に挙げて、辞書の構成等をより具体的に説明する。
(キーワード辞書)
図2−Aと図2−Bに、本発明の実施形態に係るキーワード辞書に記憶されている内容の一例を示す。図2−Aは端末部100のキーワード辞書110に記憶される英語のキーワードの例を示し、図2−Bは端末部200のキーワード辞書210に記憶される日本語のキーワードの例を示す。それぞれのキーワードは、その意味ごとにクラスにまとめられている。例えば、図2−Aでは、対話者が肯定を示したと判断されるキーワードを〔Yes〕というクラスにまとめて記憶している。キーワードは単語でなくても、句や文であっても、それらの発音記号であっても、本発明は実施可能である。
(対話シナリオ)
図3−Aと図3−Bに、本発明の実施形態に係る対話シナリオ記憶部に記憶されている内容の一例を示す。ここでは、レストランの予約受付係と顧客が、レストランの予約を行う対話を例とする。図3−Aと図3−Bとは、予約受付係が顧客に予約の日付と時間を尋ね、顧客が日付と時間を答える、という対話を実行するための対話シナリオである。
図1において対話者Aが予約受付係で、対話者Bが顧客である。
図3−Aは、端末部100の対話シナリオ記憶部109に記憶される、対話者Aと端末部100のやり取りを記述した対話シナリオの例である。また、図3−Bは、端末部200の対話シナリオ記憶部209に記憶される、対話者Bと端末部200とのやり取りを記述した対話シナリオの例である。
それぞれの対話シナリオには、対話状態と対話者の発話から抽出されたキーワードとを条件として、その条件を満たすときに、それぞれの端末部の出力文記憶部に記憶する定型文と、それぞれの端末部の対話状態記憶部に記憶する対話状態が記述されている。図3−Aと図3−Bにおいて、対話状態が「NULL」の行は、対話状態に関する条件がないことを示し、抽出キーワードが「なし」の行は、対話者Aの発話にキーワードが含まれないことを条件としていることを示す。
ここで、具体的に対話シナリオの記述について具体的に説明する。
図3−Aの番号301の行では、対話状態が「NULL」であるため対話状態に関する条件はなく、対話者Aの発話に〔What time〕クラスのキーワードが含まれていれば、端末部200の出力文記憶部205に「What time do you close?」という出力文を記憶し、対話状態記憶部206に「A00」を記憶する。
また、図3−Bの番号401の行では、対話状態記憶部206に「A00」が記憶されていて、かつ、対話者Bの発話に〔日付〕クラスのキーワードが含まれていれば、「〔日付〕でよろしいですね?」という定型文の〔日付〕の部分に、対話者Bの発話に含まれている〔日付〕クラスのキーワードを埋め込んで出力文を生成し出力文記憶部205に記憶し、さらに、対話状態記憶部206に「A01」を記憶する。
また、図3−Bの番号403の行では、対話状態記憶部206に「A01」が記憶されていて、かつ対話者Bの発話に〔肯定〕クラスのキーワードが含まれていれば、「He wants a reservation on 〔日付〕」という定型文の〔日付〕の部分に、対話者Bの発話から抽出された〔日付〕クラスのキーワードを機械翻訳した結果を埋め込んで出力文を生成し、出力文記憶部105に記憶する。
(対話例)
図4は、本実施形態に係る異言語間対話処理装置におけるそれぞれの端末部の動作を示すフローチャートである。図5は、本実施形態に係る異言語間対話処理装置における端末部が他の端末部から対話状態または出力文を送信されたときの動作を示すフローチャートである。図6は、本実施形態に係る異言語間対話処理装置を用いて対話者Aと対話者Bとの間で行われる対話の例を示す。図6における対話例では、図3−Aおよび図3−Bに示す対話シナリオに従って対話が制御されており、対話者Aと対話者Bとがレストランの予約を行うために対話を行う。
以下では、図4および図5に示すフローチャートに沿って、図6に例示したような対話がなされる際の対話処理装置の動作例を説明する。
まず、端末部100では、対話制御部104が出力文記憶部105から出力文を一つ選択する(ステップ501)。ここでは、出力文記憶部105に出力文は記憶されていないので、何も出力しない。次に、入力部101は、対話者Aの発話を受け付け、音声認識部102により、音声認識する(ステップ502)。対話者Aは、「What date would he like to reserve?」(対話例701)と発話している。発話理解部103は、図2−Aに示すキーワード辞書110を参照して、音声認識結果から、〔What date〕クラスであるキーワード〔What date〕を抽出する(ステップ503)。
また、対話制御部104は、対話状態記憶部106に記憶されている対話状態と抽出されたキーワードとの組合せが、図3−Aに示す対話シナリオ記憶部109に記憶されている対話シナリオの条件を満たすかを調べる(ステップ504)。ここで、抽出キーワード〔What date〕が、図3−Aの番号301の行の条件を満たすので、次の動作を行う(ステップ505)。すなわち、対話シナリオに従って出力文「予約は何日ですか?」という出力文と対話状態「A00」を対話制御部204に送信する(ステップ508,ステップ509)。これに対応して、端末部200の対話制御部204は、送信された対話状態を対話状態記憶部206に記憶し(ステップ601,ステップ602)、送信された出力文を出力文記憶部205に記憶する(ステップ603)。
端末部200も同様に、図4に示すフローチャートに従って動作する。対話制御部204は、出力文記憶部205から出力文を一つ選択する。この時、出力文記憶部205には出力文「予約は何日ですか?」が記憶されているので、この出力文が選択され、出力部208によって対話者Bに提示される(ステップ501,対話例702)。提示された出力文は、出力文記憶部205から削除される。入力部201は、対話者Bの発話を受け付け、音声認識を行う(ステップ502)。この対話例では、対話者Bは、「日曜日でお願いします」という発話を入力する(対話例703)。
発話理解部203は、図3−Bに示すキーワード辞書210を参照して〔日付〕クラスであるキーワード「日曜日」を抽出する(ステップ503)。対話状態記憶部206に記憶されている「A00」と抽出キーワード〔日付〕とが図3−Bの番号401の行の条件を満たす(ステップ504)ので、「〔日付〕でよろしいですか?」という定型文に抽出されたキーワード「日曜日」を埋め込んだ出力文「日曜日でよろしいですか?」を出力文記憶部205に記憶する(ステップ506)。また、対話状態「A01」を対話状態記憶部206に記憶する(ステップ507)。そして、対話状態記憶部206から次の動作を決定するのに使用された対話状態「A00」を削除する(ステップ510)。
以下では、上記と同様の動作を行うところは説明を省略するが、図4および図5に示すフローチャートに従って、それぞれの端末部が動作を続ける。
対話例704において、対話者Aがクラス〔What time〕を含む発話を行うと、端末部200の出力文記憶部205に出力文「予約は何時ですか?」が記憶され、対話状態記憶部206に対話状態「B00」が記憶される。すなわち、このとき、出力文記憶部205には「日曜日でよろしいですか?」と「予約は何時ですか?」の2つの出力文が記憶されており、また、対話状態記憶部206には、対話状態「A01」と「B00」の2つの対話状態が記憶されていいる。このように、複数の出力文、または、複数の対話状態を記憶することができるため、同時に複数の流れを制御することが可能である。
対話例705で出力文「日曜日でよろしいですか?」が出力された後、対話例706で「はい、そうです」と対話者Bが発話している。このとき、対話状態記憶部206に記憶されている対話状態「A01」と該発話に含まれる〔肯定〕クラスのキーワードとが図3−Bの番号403の条件を満たす。そのため、既に抽出されているキーワード「日曜日」を機械翻訳した結果である「Sunday」を、定型文「He wants a reservation on 〔日付〕」に埋め込んだ出力文「He wants a reservation on Sunday」が出力記憶部105に記憶される。そのあと、対話例708において出力文「予約は何時ですか?」が出力される。
これは、対話例704の対話者Aの発話の直後に記憶された出力文である。つまり、図6における対話例では、予約の日付を聞くための対話と、予約の時間を聞くための対話という2つの対話の流れを、本発明による異言語間対話処理装置は制御している。このように、本発明によれば、複数の出力文、または複数の対話状態を記憶することができるため、対話者が他方の対話者に伝達すべき事柄を自由な順番で伝達することができる。
対話例709以降も対話は同様に進行し、対話例712において端末部100が対話者Aに予約時間を伝えて終了している。
上記実施形態によれば、それぞれの端末部の出力文記憶部が複数の出力文を記憶することができ、かつ、対話状態記憶部が複数の対話状態を記憶することができるようになる。これにより、それぞれ異なる言語を利用する対話者の間の対話を対話シナリオに沿って制御する異言語間対話処理装置において、複数の対話状態を同時に制御することが可能となるので、対話者が他方の対話者に伝達すべき事柄を自由な順番で伝達することが可能になり、対話者にとって、より自由な対話が実現されるという効果が得られる。
なお、上記実施形態は、本発明の一例を示したものであり、本発明はこれに限定されるものではなく、本発明の趣旨を変更しない範囲内で適宜の変更・改良を行ってもよいことはいうまでもない。
また、前述の通り、本発明に係る異言語間対話処理方法は、これをコンピュータのプログラム制御により実行させることが好ましく、本発明は、このためのコンピュータ制御用プログラム、並びにこのプログラムを記録したコンピュータにより読み取り可能な記録媒体としても商品化可能である。
本発明の実施形態に係る異言語間対話処理装置のブロック構成図である。 図1におけるキーワード辞書110に記憶される内容例を示す図である。 図1におけるキーワード辞書210に記憶される内容例を示す図である。 図1における対話シナリオ記憶部109に記憶された対話シナリオの一例を示す図である。 図1における対話シナリオ記憶部209に記憶された対話シナリオの一例を示す図である。 図1におけるそれぞれの端末部の動作を示すフローチャートである。 図1におけるそれぞれの端末部が他の端末部から出力文、または、対話状態を送信されたときの動作を示すフローチャートである。 本発明の実施形態に係る異言語間対話処理装置を利用した対話の例を示す図である。
符号の説明
100,200 端末部
101,201 入力部
102,202 音声認識部
103,203 発話理解部
104,204 対話制御部
105,205 出力文記憶部
106,206 対話状態記憶部
107,207 翻訳部
108,208 出力部
109,209 対話シナリオ記憶部
110,210 キーワード辞書
501〜510,601〜603 処理ステップ
701〜711 対話例

Claims (8)

  1. それぞれの対話者が利用する端末部を複数接続してなる異言語間対話装置における異言語間対話処理方法であって、
    対話者(発話者)の発話を音声認識した音声認識結果から、予めキーワード辞書に記憶されているキーワードを抽出し、
    このキーワードと、対話状態記憶部に複数個記憶されている現在の対話の状態を示す対話状態との組合せを条件として、この条件を満たすときの前記端末部の動作を記述した対話シナリオを参照して対話制御部の次の動作を決定する際に、
    前記抽出されたキーワードと前記対話状態記憶部に複数個記憶されている対話状態のいずれかとに応じて前記対話シナリオに記述された条件を参照して、(1)対話者A(発話者)に出力する出力文を決定して前記出力文記憶部に当該出力文を記憶する、(2)前記対話者Aの端末部aの次の対話状態を決定して前記対話状態記憶部に当該対話状態を記憶する、(3)前記対話者Aと異なる対話者Bに出力する出力文を決定し、対話者Aの端末部aと異なる対話者Bの端末部bの出力文記憶部に出力文を記憶する、(4)前記端末部bの次の対話状態を決定し、当該端末部bの対話状態記憶部に当該対話状態を記憶する、のいずれかの動作を行う
    ことを特徴とする異言語間対話処理方法。
  2. 前記(1)の動作を実行する際には、前記対話シナリオに記述されている定型文に、前記抽出されたキーワードを埋め込むことによって、前記出力文を決定することを特徴とする請求項1に記載の異言語間対話処理方法。
  3. 前記(3)の動作を実行する際には、前記対話シナリオに記述されている定型文に、前記抽出されたキーワードを機械翻訳した結果を埋め込むことによって、前記出力文を決定することを特徴とする請求項1または2に記載の異言語間対話処理方法。
  4. 異なる言語を使用する複数の対話者が意思の疎通を図るために、それぞれの対話者が利用する端末部を複数接続した異言語間対話処理装置であって、
    前記端末部は、当該端末部を利用する対話者に出力する出力文を複数文記憶する出力文記憶部と、
    この出力文記憶部に記憶されている出力文から一文を選択し出力部に出力する出力制御部と、
    この出力制御部により選択・出力された出力文を対話者に提示する前記出力部と、
    対話者の発話を音声認識する音声認識部と、
    この音声認識部が音声認識した音声認識結果から、予めキーワード辞書に記憶されたキーワードを抽出する発話理解部と、
    現在の対話の状態を示す対話状態を複数個記憶する対話状態記憶部と、
    キーワードと対話状態との組合せを条件として、この条件を満たすときの前記端末部の動作を記述した対話シナリオと、
    前記発話理解部が抽出したキーワードと前記対話状態記憶部に複数個記憶されている対話状態のいずれかとに応じて、前記対話シナリオに記述された条件を参照して、(1)一方の対話者(発話者)Aに出力する出力文を決定し、前記出力文記憶部に当該出力文を記憶する、(2)前記対話者Aの端末部aの次の対話状態を決定し、前記対話状態記憶部に当該対話状態を記憶する、(3)前記対話者Aと異なる対話者Bに出力する出力文を決定し、対話者Aの端末部aと異なる対話者Bの端末部bの出力文記憶部に出力文を記憶する、(4)前記端末部bの次の対話状態を決定し、当該端末部bの対話状態記憶部に当該対話状態を記憶する、のいずれかの動作を行う対話制御部と
    を有することを特徴とする異言語間対話処理装置。
  5. 前記対話制御部は、前記(1)の動作を実行する際には、前記対話シナリオに記述されている定型文に、前記発話理解部が抽出したキーワードを埋め込むことによって、前記出力文を決定することを特徴とする請求項4に記載の異言語間対話処理装置。
  6. 前記対話制御部は、前記(3)の動作を実行する際には、前記対話シナリオに記述されている定型文に、前記発話理解部が抽出したキーワードを機械翻訳した結果を埋め込むことによって、前記出力文を決定することを特徴とする請求項4または5に記載の異言語間対話処理装置。
  7. 請求項1〜3のいずれか1項に記載の異言語間対話処理方法をコンピュータのプログラム制御により実行させるためのプログラム。
  8. 請求項7に記載のプログラムを記録したコンピュータにより読み取り可能な記録媒体。
JP2004164309A 2004-06-02 2004-06-02 異言語間対話処理方法および装置 Pending JP2005345681A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004164309A JP2005345681A (ja) 2004-06-02 2004-06-02 異言語間対話処理方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004164309A JP2005345681A (ja) 2004-06-02 2004-06-02 異言語間対話処理方法および装置

Publications (1)

Publication Number Publication Date
JP2005345681A true JP2005345681A (ja) 2005-12-15

Family

ID=35498136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004164309A Pending JP2005345681A (ja) 2004-06-02 2004-06-02 異言語間対話処理方法および装置

Country Status (1)

Country Link
JP (1) JP2005345681A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008516294A (ja) * 2004-10-13 2008-05-15 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 対話システムの忠実度を向上させる方法及びシステム
JP2016062357A (ja) * 2014-09-18 2016-04-25 株式会社東芝 音声翻訳装置、方法およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008516294A (ja) * 2004-10-13 2008-05-15 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 対話システムの忠実度を向上させる方法及びシステム
JP4809358B2 (ja) * 2004-10-13 2011-11-09 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 対話システムの忠実度を向上させる方法及びシステム
US8463611B2 (en) 2004-10-13 2013-06-11 Hewlett-Packard Development Company, L.P. Method and system for improving the fidelity of a dialog system
JP2016062357A (ja) * 2014-09-18 2016-04-25 株式会社東芝 音声翻訳装置、方法およびプログラム

Similar Documents

Publication Publication Date Title
Sherwani et al. Speech vs. touch-tone: Telephony interfaces for information access by low literate users
JP5405672B2 (ja) 外国語学習装置及び対話システム
RU2352979C2 (ru) Синхронное понимание семантических объектов для высокоинтерактивного интерфейса
US20090144048A1 (en) Method and device for instant translation
US20100217591A1 (en) Vowel recognition system and method in speech to text applictions
WO2017200074A1 (ja) 対話方法、対話システム、対話装置、及びプログラム
US20130226576A1 (en) Conference Call Service with Speech Processing for Heavily Accented Speakers
JP2011504624A (ja) 自動同時通訳システム
US20120215521A1 (en) Software Application Method to Translate an Incoming Message, an Outgoing Message, or an User Input Text
Alkhalifa et al. Enssat: wearable technology application for the deaf and hard of hearing
JPWO2017200079A1 (ja) 対話方法、対話システム、対話装置、およびプログラム
JPH07129594A (ja) 自動通訳システム
JP2005249829A (ja) 音声認識を行うコンピュータネットワークシステム
JP2018181018A (ja) 会話提供装置、会話提供方法及びプログラム
Hämäläinen et al. The EASR Corpora of European Portuguese, French, Hungarian and Polish Elderly Speech
JP4103085B2 (ja) 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体
JP2005345681A (ja) 異言語間対話処理方法および装置
JP6601625B2 (ja) 対話方法、対話システム、対話装置、およびプログラム
Wang et al. A prototype automatic simultaneous interpretation system
JPWO2017200077A1 (ja) 対話方法、対話システム、対話装置、及びプログラム
JP2018163581A (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP2017182394A (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP6383748B2 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP6110539B1 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
Kodirov et al. Implementation of web application based on Augmentative and Alternative Communication (AAC) method for People with Hearing and Speech Impairment