JP2008243222A - コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム - Google Patents

コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム Download PDF

Info

Publication number
JP2008243222A
JP2008243222A JP2008119590A JP2008119590A JP2008243222A JP 2008243222 A JP2008243222 A JP 2008243222A JP 2008119590 A JP2008119590 A JP 2008119590A JP 2008119590 A JP2008119590 A JP 2008119590A JP 2008243222 A JP2008243222 A JP 2008243222A
Authority
JP
Japan
Prior art keywords
utterance
phrase
important
important phrase
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2008119590A
Other languages
English (en)
Inventor
Satoshi Kamaya
聡史 釜谷
Tetsuro Chino
哲朗 知野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008119590A priority Critical patent/JP2008243222A/ja
Publication of JP2008243222A publication Critical patent/JP2008243222A/ja
Abandoned legal-status Critical Current

Links

Images

Abstract

【課題】発話者間の理解が不一致のまま会話が進められることを回避するコミュニケーション支援装置を提供する。
【解決手段】第1発話から重要語句を抽出する抽出条件と、第1発話から抽出した重要語句を第1発話に対応して発話された第2発話に関連付けて出力する関連付け方法とを対応づけて記憶する重要語句規則記憶部111と、第1発話および第2発話の入力を受付ける入力受付部101と、記憶された抽出条件に基づいて、受付けた第1発話から重要語句を抽出する重要語句抽出部102と、抽出する際に用いた抽出条件に対応づけられた関連付け方法に基づいて、抽出した重要語句を、第2発話に関連付けて出力する重要語句付加部103と、重要語句が関連付けられた第2発話を、第2の言語で翻訳する翻訳部104と、重要語句が関連付けられた第2発話を出力する出力制御部106とを備えた。
【選択図】 図1

Description

この発明は、複数の言語間の翻訳を行うことによりコミュニケーションを支援するコミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラムに関するものである。
近年、グローバル化の進展や計算機ネットワーク技術の発展などに伴い、異言語間でコミュニケーションをとる機会が増加している。一方、自然言語処理技術の進展に伴い、例えば日本語で書かれた任意のテキストを、英語などの他言語テキストに変換する機械翻訳装置が開発され、実用化されている。
また、音声処理技術の進展に伴い、電子データとしてある自然言語文字列を、音声出力に変換する音声合成装置や、ユーザによる音声発話を入力とし、これを文字列変換することで、音声による自然言語文字列の入力を可能にする音声入力装置が開発され、実用化されている。
以上述べたような、自然言語処理技術および音声処理技術の進展に伴い、これら技術を統合し、異なる言語を母語とする者同士のコミュニケーションを支援するコミュニケーション支援装置の実現への期待が高まっている。
頑健な音声翻訳装置を実現するためには、多様な発話を高精度に認識する音声認識装置や、幅広い表現を的確に翻訳可能な翻訳装置が必要不可欠であるが、従来の音声翻訳装置では、正しく認識または訳出が行われない事例が散見される。
例えば、英語話者が発話した「I have a room for 50 dollars a night.」をコミュニケーション支援装置が翻訳する際、「I have a room for 15 dollars a night.」と誤認識して日本語に翻訳したとする。この場合、文法や文脈などに問題はないため、日本語話者は翻訳された日本語が正しいことを前提として次の発話を行う。したがって部屋の値段が「15 dollars」と「50 dollars」とで異なる理解のまま、対話が進められる場合があった。
このように発話者間の理解が不一致のまま対話が進められる問題に対処する方法として、従来は、音声認識結果や音声翻訳結果が発話者の意図と合致か否かを確認するために原言語の認識結果を発話者にフィードバックする方式や、原言語の音声翻訳結果である目的言語文を、再度、原言語文に翻訳し直して原言語発話者にフィードバックする技術などが提案されている。
例えば、特許文献1では、音声翻訳装置において原言語入力者が入力した原言語の音声翻訳処理結果を、再度原言語の合成音声に変換して、原言語入力者にフィードバックする技術が提案されている。
特開2001−222531号公報
しかしながら、特許文献1などの方法では、自己の発話の認識結果や翻訳結果を確認し、修正を加えてから相手側に提示する必要があるため、会話が中断される場合が多く、円滑なコミュニケーションを阻害するという問題があった。
本発明は、上記に鑑みてなされたものであって、円滑な会話を妨げずに、発話者間の理解が不一致のまま会話が進められることを回避することができるコミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、複数の言語間の翻訳を行うことによりコミュニケーションを支援するコミュニケーション支援装置において、発話から重要語句を抽出する際の抽出条件と、抽出した重要語句を、重要語句を抽出した発話より後に発話された発話に関連付けて出力する際の関連付け方法とを対応づけて記憶する規則記憶手段と、発話の入力を受付ける入力受付手段と、前記規則記憶手段に記憶された前記抽出条件に基づいて、前記入力受付手段が受付けた第1の言語により発話された第1発話から重要語句を抽出する抽出手段と、前記入力受付手段が受付けた前記第1発話を、第1の言語から第2の言語に翻訳する翻訳手段と、前記翻訳手段が翻訳した前記第1発話を出力する出力手段と、前記抽出手段が重要語句を抽出する際に用いた前記抽出条件に対応づけられた前記関連付け方法に基づいて、前記抽出手段が抽出した重要語句を、前記出力手段により出力された前記第1発話の直後に発話され、前記入力受付手段が受付けた第2の言語による第2発話に関連付ける関連付け手段と、を備え、前記翻訳手段は、さらに前記関連付け手段により重要語句が関連付けられた前記第2発話を、第2の言語から第1の言語に翻訳し、前記出力手段は、さらに前記第2発話に関連づけられた重要語句と、前記翻訳手段が翻訳した前記第2発話とを出力することを特徴とする。
また、本発明は、上記装置を実行することができるコミュニケーション支援方法およびコミュニケーション支援プログラムである。
本発明によれば、対話中の重要語句を翻訳結果に関連付けて対話相手に提示することができるため、対話の中で重要語句の確認を対話相手に促すことが可能となる。このため、円滑な会話を妨げずに、発話者間の理解が不一致のまま会話が進められることを回避することができるという効果を奏する。
以下に添付図面を参照して、この発明にかかるコミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラムの最良な実施の形態を詳細に説明する。
一般に、コミュニケーション支援装置を対話相手が準備できない場合や、特に、利用者が所有するコミュニケーション支援装置を共有できない状況下においては、対話相手が自身の発話内容の認識結果や翻訳結果を確認し、修正することは非常に困難である。
また、例えば、対話相手が初対面の人間に機器を向けられることに抵抗を感じる場合があるという問題がある。また、利用者側としても機器の盗難を危惧し、積極的な共有状態を作ることに抵抗を感じる場合もある。また、所有者である利用者に比べて、対話相手が機器に不慣れである可能性が非常に高い。このため、対話を開始する前に、機器の操作方法や、表示内容、出力の意味などを説明し理解させる必要があるが、利用者、対話相手双方にとって非常に負担の大きい作業となる。このため、従来のように、認識結果や訳出結果の修正を行う装置の場合は、対話間で理解に齟齬が生じていても、認識結果や訳出結果の修正が適切に実行できない状況に陥るという問題がある。
(第1の実施の形態)
第1の実施の形態にかかるコミュニケーション支援装置は、対話中の重要語句を抽出し、抽出した重要語句を翻訳結果に関連付けて出力するものである。したがって対話の中で確認すべき内容を対話相手に提示することができ、上述のような問題を回避することが可能となる。
以下では、日本語と英語間の通訳コミュニケーションを前提として説明するが、原言語および目的言語の組み合わせはこれに限るものではなく、あらゆる言語の組み合わせについて適用することができる。また、以下では日本語および英語のいずれもが原言語または目的言語となりうる。すなわち、例えば、日本語話者が発話した場合、原言語文は日本語の文、目的言語文は英語の文となり、英語話者が発話した場合、原言語文は英語の文、目的言語文は日本語の文となる。
図1は、第1の実施の形態にかかるコミュニケーション支援装置100の構成を示すブロック図である。同図に示すように、コミュニケーション支援装置100は、入力受付部101と、重要語句抽出部102と、重要語句付加部103と、翻訳部104と、換言部105と、出力制御部106と、重要語句規則記憶部111と、発話履歴記憶部112と、換言情報記憶部113とを備えている。
重要語句規則記憶部111は、発話内容から重要語句を抽出するための条件と、抽出した重要語句を発話の翻訳結果に関連付けて出力する際の付加方法とを含む重要語句規則を記憶するものである。
図2は、重要語句規則記憶部111に記憶された重要語句規則のデータ構造の一例を示す説明図である。同図に示すように、重要語句規則は、一意に識別するための識別子であるIDと、重要語句を抽出するための抽出条件と、抽出した重要語句を翻訳結果へ関連づける方法を記載した重要語句付加方法とを対応付けた構造となっている。ただし、IDは以降の説明を簡便に進めるために付与した補足的な要素であり、各規則を個別に区別できるならば必須項目ではない。
抽出条件としては、予め定められた検索対象語句を有する語句を重要語句として抽出するキーワード条件と、発話の用例に含まれる予め定められた重要語句に対応する語句を重要語句として抽出する例文条件とを指定することができる。
例えば、同図の抽出条件201は、キーワード条件の一例を示している。キーワード条件である抽出条件201は、金額表現であるという条件を満たす語句を発話中から重要語句として抽出するという条件を示している。なお、例文条件と区別するため、キーワード条件には記号「$」を先頭に付記して表すようにしている。
また、例えば、同図の抽出条件203は、例文条件の一例を示している。例文条件である抽出条件203は、発話の用例中の重要語句を予め特定しており、記号「<>」で括ることで重要語句であることを表している。すなわち、抽出条件203は、「Do you have an invention card?」に類似する発話が入力されたとき、入力された発話からから「<an invention card>」に対応する語句を重要語句として抽出するという条件を示している。
重要語句付加方法には、翻訳結果に付加する際に変化させずに直接付加する定型部と、抽出条件に従い抽出された重要語句を埋め込む変数部からなる文が記述されている。すなわち、この文の変数部に重要語句を埋め込んで、入力された発話に付加して出力することを表している。同図に示すように、変数部は、[重要語句]のように表現する。
例えば、重要語句付加方法202は、抽出条件201によって重要語句が抽出された場合に、抽出された重要語句を「Did you say」の後に埋め込んだ文を、翻訳結果に付加して出力するという方法を示している。
また、重要語句付加方法204は、抽出条件203によって重要語句が抽出された場合に、抽出された重要語句を「I have」の後に埋め込んだ文を、翻訳結果に付加して出力するという方法を示している。
発話履歴記憶部112は、コミュニケーション支援装置100を介してなされた双方の話者の発話の履歴を記憶するものである。発話履歴記憶部112は、最新の発話に対して付加する重要語句を、過去の発話から抽出するために参照される。
図3は、発話履歴記憶部112に記憶された発話履歴のデータ構造の一例を示す説明図である。同図に示すように、発話履歴は、原言語または目的言語による発話内容と、発話から抽出された重要語句と、重要語句を抽出する際に適用した重要語句規則のIDとを対応づけた構造となっている。
同図では、1発話を1レコードとする表形式で記憶するようにしており、同図において下のレコードほど新しい発話となるように記憶している。また、発話から重要語句が抽出されなかった場合は、重要語句およびID欄は空欄となる。
例えば、同図では、発話内容301は日本語話者による発話であり、発話内容301からは重要語句が抽出されなかったため重要語句およびID欄が空欄とされている例が示されている。また、発話内容302は発話内容301に対して英語話者が発話した内容であり、発話内容302から「50 dollars」が重要語句304として抽出された例が示されている。さらに、発話内容303は発話内容302に対して日本語話者が発話した内容であり、発話内容303からは重要語句が抽出されなかった例が示されている。
換言情報記憶部113は、任意の語句と同一の言語における同じ意味内容で表現形式の異なる別の語句である換言語句の情報(換言情報)を記憶するものである。換言情報記憶部113は、過去の発話から抽出した重要語句をそのまま付加するのではなく、別の語句で換言して出力することにより、発話者間の理解の不一致を回避するために利用される。
図4は、換言情報記憶部113に記憶された換言情報のデータ構造の一例を示す説明図である。同図に示すように、換言情報は、換言対象となる変換前語句と、換言結果である変換後語句とを対応付けた構造となっている。
例えば、同図の変換前語句401(「car」)が、同図の変換後語句402(「automobile」)に変換されることを表している。
なお、重要語句規則記憶部111、発話履歴記憶部112、および換言情報記憶部113は、HDD(Hard Disk Drive)、光ディスク、メモリカード、RAM(Random Access Memory)などの一般的に利用されているあらゆる記憶手段により構成することができる。
入力受付部101は、利用者からの音声入力を受付け、受付けた音声に対し音声認識処理を行い、認識結果である原言語によるテキストデータの入力を受付けるものである。このとき、入力手段として、キーボード、ポインティングデバイス、手書き文字認識などの一般的に用いられているあらゆる入力方法と併用、あるいは代用して構成してもよい。
この際に行われる音声認識処理は、LPC分析、隠れマルコフモデル(HMM:Hidden Markov Model)、ダイナミックプログラミング、ニューラルネットワーク、Nグラム言語モデルなどを用いた、一般的に利用されているあらゆる音声認識方法を適用することができる。
重要語句抽出部102は、重要語句規則記憶部111に記憶された抽出条件を参照しながら入力された発話中の重要語句を抽出するものである。
具体的には、重要語句抽出部102は、キーワード条件である抽出条件を満たす語句を入力された発話の中から検索し、検索した語句を重要語句として抽出する。また、重要語句抽出部102は、入力された発話と同一の例文または類似する例文を例文条件である抽出条件から検索し、検索した例文中の重要語句部分に対応する語句を発話中の重要語句として抽出する。
なお、キーワード条件の抽出条件を満たす語句を検索するとは、キーワード条件で指定された語句と同一の語句を検索する場合だけでなく、類似する語句を検索する場合も含む。類似する語句には、キーワード条件で指定された語句と意味内容が同一である語句や、構造的または表層的な一致の度合いが予め定められた値より大きい語句が含まれる。
この際には、構文解析、意味解析などの一般的な自然言語解析処理を適用することができ、さらに構造的または表層的な一致の度合いを最大とする割当て方を計算するためには動的計画法などの、従来から用いられているあらゆる技術を適用することができる。
また、例文条件を使用して類似する例文を検索する場合は、例えば、特許第3135221号公報に記載された方法などの、従来から用いられているあらゆる類似例文検索技術を適用することができる。
重要語句抽出部102おいて、1つの発話に対して、適用可能な抽出条件が複数存在する場合は、予め定められた優先度が最大の抽出条件を適用する。例えば、例文条件を優先して適用するため、キーワード条件より高い優先度に設定しておく。また、例文条件間では、より発話内容との類似度が高い例文に対応する例文条件を適用するように構成してもよい。さらに、先に登録された抽出条件、すなわち、IDが小さい抽出条件を優先して適用するように構成してもよい。なお、すべての抽出条件または優先度順に予め定められた個数の抽出条件を複数適用して重要語句を複数抽出するように構成してもよい。
重要語句付加部103は、対話相手の発話から抽出された重要語句を、抽出の際に重要語句抽出部102が適用した抽出条件に対応づけられた重要語句付加方法によって、入力された発話に関連付けて出力するものである。
例えば、図2の抽出条件201により金額表現が重要語句として抽出された場合、対応する重要語句付加方法202を適用し、「Did you say」の後に抽出した重要語句である金額を表す語句を埋め込んだ文を、入力された発話に付加して出力する。
なお、重要語句付加部103は、翻訳の目的言語で翻訳済みの文を、入力された発話に付加して出力するように構成してもよい。この場合は、原言語および目的言語双方で記述された文を重要語句規則記憶部111の重要語句付加方法欄に記載し、出力する言語に応じて適切な言語により記述された文に重要語句を埋め込んで出力する。これにより、翻訳の目的言語で翻訳済みの文を付加して出力することが可能となる。
翻訳部104は、重要語句が付加された発話を目的言語文に翻訳するものである。なお、翻訳部104より行われる翻訳処理は、一般的なトランスファ方式、用例ベース方式、統計ベース方式、中間言語方式の機械翻訳システムにおいて利用されているあらゆる方法を適用することができる。
なお、重要語句付加部103が翻訳済みの重要語句を含む文を付加して出力する構成の場合は、翻訳部104は、入力された発話のみを翻訳する。
換言部105は、換言情報記憶部113に記憶された換言情報を参照し、重要語句付加部103よって付与された重要語句の訳語を、換言語句に変換するものである。
なお、換言部105は、翻訳部104が翻訳する前の発話に関連付けられた重要語句を換言語句に置換するように構成してもよい。この場合は、翻訳部104は、換言語句で置換された重要語句が付加された発話を目的言語文に翻訳する。
出力制御部106は、換言部105により換言語句に変換された重要語句と、翻訳部104が翻訳した翻訳結果とを出力するものである。この際、翻訳結果を目的言語である英語の合成音声として出力する。出力制御部106により行われる音声合成処理は、音声素片編集音声合成、フォルマント音声合成、音声コーパスベースの音声合成、テキストトゥスピーチなどの一般的に利用されているあらゆる方法を適用することができる。
なお、出力制御部106による音声出力は、テキストを画面表示するディスプレイなどの表示装置による目的言語のテキスト出力や、プリンタなどへのテキスト印刷により目的言語文を出力などの種々の出力、表示手段と併用、あるいは代用して構成してもよい。
次に、このように構成された第1の実施の形態にかかるコミュニケーション支援装置100によるコミュニケーション支援処理について説明する。図5は、第1の実施の形態におけるコミュニケーション支援処理の全体の流れを示すフローチャートである。
まず、入力受付部101が、原言語文Siの入力を受付ける(ステップS501)。具体的には、入力受付部101は、音声により入力された原言語文を音声認識し、その認識結果である原言語のテキストデータである原言語文Siの入力を受付ける。
次に、重要語句抽出部102が、受付けた原言語文Siから重要語句を抽出する重要語句抽出処理を実行する(ステップS502)。重要語句抽出処理の詳細については後述する。
なお、ステップS502の重要語句抽出処理は、入力された最新の発話から重要語句を抽出処理であり、この処理で抽出された重要語句は、これ以降にさらに入力された発話に対して付加されうる語句となる。また、ステップS503以降で重要語句付加部103により付加される重要語句は、ステップS502で最新の発話から抽出した重要語句ではなく、過去の発話から抽出した重要語句である。
次に、重要語句付加部103は、発話履歴記憶部112から、1発話前のレコードRを取得する(ステップS503)。次に、重要語句付加部103は、レコードR内に重要語句が存在するか否かを判断する(ステップS504)。
重要語句が存在する場合(ステップS504:YES)、重要語句付加部103は、レコードR内の重要語句付加方法により、原言語文Siに重要語句を付加し、訳出対象文Stとして出力する(ステップS505)。
重要語句が存在しない場合(ステップS504:NO)、重要語句付加部103は、原言語文Siを訳出対象文Stとして出力する(ステップS506)。
次に、翻訳部104が、訳出対象文Stを翻訳し、目的言語文Toを出力する(ステップS507)。なお、翻訳部104による翻訳では、例えばトランスファ方式の翻訳の場合は、形態素解析、構文解析、意味解析等の自然言語処理で用いられる各種辞書(図示せず)が参照される。また、例えば用例ベース方式の翻訳の場合は、原言語と目的言語による対訳の用例を記憶した辞書(図示せず)等が参照される。
次に、換言部105が、訳出対象文Stに重要語句が付加されているか否かを判断する(ステップS508)。付加されている場合は(ステップS508:YES)、換言部105は、換言情報記憶部113を検索し、重要語句に対応する換言語句が存在するか否かを判断する(ステップS509)。
換言語句が存在する場合は(ステップS509:YES)、換言部105は、検索した換言語句で重要語句を置換した目的言語文Toを出力する(ステップS510)。
ステップS508で訳出対象文Stに重要語句が付加されていないと判断された場合(ステップS508:NO)、ステップS509で換言語句が存在しないと判断された場合(ステップS509:NO)、またはステップS510で換言部105が目的言語文Toを出力した後、出力制御部106は、Toを目的言語の音声で音声合成し、その結果を出力する(ステップS511)。
次に、ステップS502の重要語句抽出処理の詳細について説明する。図6は、第1の実施の形態における重要語句抽出処理の全体の流れを示すフローチャートである。
まず、重要語句抽出部102は、重要語句規則記憶部111から、原言語文Siに適合する例文条件である抽出条件Kを検索する(ステップS601)。具体的には、重要語句抽出部102は、類似例文検索技術を用いて原言語文Siと同一または類似する例文が記載された例文条件を検索する。
次に、重要語句抽出部102は、抽出条件Kが検索されたか否かを判断し(ステップS602)、抽出条件Kが検索されなかった場合(ステップS602:NO)、重要語句規則記憶部111から、原言語文Siに適合するキーワード条件である抽出条件Kを検索する(ステップS603)。
具体的には、重要語句抽出部102は、キーワード条件に記載された語句が、原言語文Siの中に含まれるか否かを検索し、検索された場合は、対応するキーワード条件を原言語文Siに適合する抽出条件Kとして取得する。
次に、重要語句抽出部102は、キーワード条件Kが検索されたか否かを判断し(ステップS604)、キーワード条件Kが検索されなかった場合(ステップS604:NO)、原言語文Siには重要語句が含まれないものとして重要語句抽出処理を終了する。
ステップS602で例文条件である抽出条件Kが検索された場合(ステップS602:YES)、または、ステップS604でキーワード条件である抽出条件Kが検索された場合は(ステップS604:YES)、重要語句抽出部102は、抽出条件Kにより重要語句Iを抽出する(ステップS605)。
例えば、「Do you have any cards? 」という原言語文Siが入力された場合、図2の例文条件である抽出条件203が適合する抽出条件Kとして検索される(ステップS601)。さらに、抽出条件203の「<an invention card>」に対応する部分として、原言語文Siから「cards」が重要語句Iとして抽出される(ステップS605)。
次に、重要語句抽出部102は、原言語文Si、重要語句I、抽出条件Kに対応するIDを発話履歴記憶部112に保存し(ステップS606)、重要語句抽出処理を終了する。
上述のような手順により、ステップS605で抽出された重要語句が、ステップS505で原言語文Siに付加され、ステップS507で翻訳されてステップS511で対話相手に出力される。この際、認識結果が正しいか否かを判断する処理などが含まれていないため、会話が中断されることがなく、円滑にコミュニケーションを継続することが可能となる。さらに、重要語句が付加された翻訳結果が対話相手に出力されるため、認識が不一致のまま会話が進められる可能性を低減することができる。
次に、第1の実施の形態におけるコミュニケーション支援処理の具体例について説明する。図7は、相互に発話される文の一例を示した説明図である。また、図8は、図7で示した文が発話されたときに発話履歴記憶部112に記憶される情報の一例を示す説明図である。さらに、図9は、コミュニケーション支援装置100が出力する出力文の一例を示す説明図である。
以下では、日本語話者による発話であり、「もっと安い部屋はありませんか?」を意味する図7の日本語701が既に入力され、図8の発話内容801に示すレコードが発話履歴記憶部112に保持されていることを前提とする。また、重要語句規則記憶部111および換言情報記憶部113には、それぞれ図2および図4に示す情報が記憶されていることを前提とする。
この状態で、英語話者が英語702(「Well, we have a room for 50 dollars a night. 」)を発話したとする。この場合、入力受付部101が英語702の入力を受付け、原言語文Siとする。
ここでは、入力受付部101が、入力された音声を「Well, we have a room for 15 dollars a night. 」と誤って認識し、原言語文Siとして出力したと仮定する(ステップS501)。
次に、重要語句抽出処理が実行される(ステップS502)。まず、重要語句抽出部102は、重要語句規則記憶部111を参照して、原言語文Siに類似する例文条件を検索する(ステップS601)。図2のような重要語句規則記憶部111からは類似する例文が検索されないため(ステップS602:NO)、原言語文Siに適合するキーワード条件を検索する(ステップS603)。
この例では、原言語文Siに金額表現(「15 dollars」)が含まれるため、図2のキーワード条件である抽出条件201が検索され、「15 dollars」が重要語句Iとして抽出される(ステップS605)。
これにより、原言語文Si(「Well, we have a room for 15 dollars a night. 」)、重要語句I(「15 dollars」)、適合した抽出条件のID(「1」)が発話履歴記憶部112に記憶される(ステップS606)。このときの発話履歴記憶部112は、図8に示したような状態となる。
次に、重要語句付加部103は、発話履歴記憶部112を参照し、原言語文Siの1発話前のレコードとして、図8の発話内容801(「もっと安い部屋はありませんか?」)に対応するレコードRを取得する(ステップS503)。取得したレコードRは、重要語句を含まないため(ステップS504:NO)、原言語文Siが訳出対象文Stとして出力される(ステップS506)。
次に、翻訳部104が訳出対象文Stを翻訳して目的言語文Toを出力する(ステップS507)。また、重要語句が付加されていないため(ステップS508:NO)、出力制御部106により目的言語文Toが音声合成して出力される(ステップS511)。この結果、原言語文Si(「Well, we have a room for 15 dollars a night. 」)を翻訳した日本語の文(「ええっと、一晩15ドルの部屋があります。」)が出力される。
続いて、日本語話者が日本語703(「それにします。」)を発話したとする。この場合、入力受付部101が日本語703の入力を受付け、原言語文Siとする。
ここでは、入力受付部101が、入力された音声を正しく認識し、原言語文Siとして出力したと仮定する(ステップS501)。
次に、重要語句抽出処理が実行される(ステップS502)。まず、重要語句抽出部102は、重要語句規則記憶部111を参照して、原言語文Siに類似する例文条件を検索する(ステップS601)。図2のような重要語句規則記憶部111からは類似する例文が検索されないため(ステップS602:NO)、原言語文Siに適合するキーワード条件を検索する(ステップS603)。
図2のような重要語句規則記憶部111からは適合するキーワード条件も検索されないため(ステップS604:NO)、原言語文Siのみが発話履歴記憶部112に保存される(ステップS606)。
次に、重要語句付加部103は、発話履歴記憶部112を参照し、原言語文Siの1発話前のレコードとして、図8の発話内容802(「Well, we have a room for 15 dollars a night. 」)に対応するレコードRを取得する(ステップS503)。取得したレコードRは、重要語句を含むため(ステップS504:YES)、レコードR内のID=1に対応する重要語句付加方法に従い、原言語文Siに「Did you say 15 dollars? 」を付加した訳出対象文Stが出力される(ステップS505)。
次に、翻訳部104が訳出対象文Stを翻訳して目的言語文Toを出力する(ステップS507)。なお、この例では付加した文(「Did you say 15 dollars? 」)は既に目的言語である英語で記述されているため、翻訳部104は翻訳を行う必要はない。
また、訳出対象文Stに重要語句が付加されているため(ステップS508:YES)、換言語句の検索処理が実行されるが(ステップS509)、図4の換言情報記憶部113には該当する重要語句が存在しないため(ステップS509:NO)、出力制御部106により目的言語文Toが音声合成して出力される(ステップS511)。この結果、原言語文Si(「それにします。」)を翻訳し、重要語句が付加された英語の文として、図9に示す出力文901(「Did you say 15 dollars? I'll take it」)が出力される。
以上のような処理により、英語話者が発話した「Well, I have a room for 50 dollars a night. 」が、「Well, I have a room for 15 dollars a night. 」と認識された例のように、重要な部分が誤認識された場合であっても、日本語話者の発話の訳出結果に重要な部分の訳出結果(「15 dollars. 」)を付加して出力することができる。
このため、重要語句の認識結果を対話相手が確認できるように提示し、かつ、利用者発話の訳出タイミングに合わせて提示することができる。したがって、対話者間のコミュニケーションや、利用者とコミュニケーション支援装置100との間の処理に影響を与えることなく処理内容を確認することが可能となる。
次に、第1の実施の形態におけるコミュニケーション支援処理の別の具体例について説明する。図10は、相互に発話される文の一例を示した説明図である。また、図11は、図10で示した文が発話されたときに発話履歴記憶部112に記憶される情報の一例を示す説明図である。さらに、図12は、コミュニケーション支援装置100が出力する出力文の一例を示す説明図である。
以下では、発話履歴記憶部112には発話内容が記憶されていない空の状態であることを前提とする。また、重要語句規則記憶部111および換言情報記憶部113には、それぞれ図2および図4に示す情報が記憶されていることを前提とする。
この状態で、英語話者が図10に示す英語1001(「Do you have any cards? 」)を発話したとする。この場合、入力受付部101が英語1001の入力を受付け、原言語文Siとする。
ここでは、入力受付部101が、入力された音声を「Do you have any cars? 」と誤って認識し、原言語文Siとして出力したと仮定する(ステップS501)。
次に、重要語句抽出処理が実行される(ステップS502)。まず、重要語句抽出部102は、重要語句規則記憶部111を参照して、原言語文Siに類似する例文条件を検索する(ステップS601)。この例では、図2のような重要語句規則記憶部111から、例文条件である抽出条件203が検索される(ステップS602:YES)。
また、抽出条件203の重要語句の部分に対応する語句「cars」が重要語句Iとして抽出される(ステップS605)。
これにより、原言語文Si(「Do you have any cars? 」)、重要語句I(「cars」)、適合した抽出条件のID(「4」)が発話履歴記憶部112に記憶される(ステップS606)。このときの発話履歴記憶部112には、図11の英語1101、重要語句1103、ID1104が記憶された状態となる。
次に、重要語句付加部103は、発話履歴記憶部112を参照するが、原言語文Siの1発話前のレコードが存在せず重要語句が取得できないため(ステップS504:NO)、原言語文Siが訳出対象文Stとして出力される(ステップS506)。
次に、翻訳部104が訳出対象文Stを翻訳して目的言語文Toを出力する(ステップS507)。また、重要語句が付加されていないため(ステップS508:NO)、出力制御部106により目的言語文Toが音声合成して出力される(ステップS511)。この結果、原言語文Si(「Do you have any cars? 」)を翻訳した日本語の文(「車を持っていますか?」)が出力される。
続いて、日本語話者が図10に示す日本語1002(「はい。」)を発話したとする。この場合、入力受付部101が日本語1002の入力を受付け、原言語文Siとする。
ここでは、入力受付部101が、入力された音声を正しく認識し、原言語文Siとして出力したと仮定する(ステップS501)。
次に、重要語句抽出処理が実行される(ステップS502)。まず、重要語句抽出部102は、重要語句規則記憶部111を参照して、原言語文Siに類似する例文条件を検索する(ステップS601)。図2のような重要語句規則記憶部111からは類似する例文が検索されないため(ステップS602:NO)、原言語文Siに適合するキーワード条件を検索する(ステップS603)。
図2のような重要語句規則記憶部111からは適合するキーワード条件も検索されないため(ステップS604:NO)、原言語文Siのみが発話履歴記憶部112に保存される(ステップS606)。このときの発話履歴記憶部112は、図11に示したように、英語1101、日本語1102が格納された状態となる。
次に、重要語句付加部103は、発話履歴記憶部112を参照し、原言語文Siの1発話前のレコードとして、図11の英語1101(「Do you have any cars? 」)に対応するレコードRを取得する(ステップS503)。取得したレコードRは、重要語句を含むため(ステップS504:YES)、レコードR内のID=4に対応する重要語句付加方法に従い、原言語文Siに「I have cars. 」を付加した訳出対象文Stが出力される(ステップS505)。
次に、翻訳部104が訳出対象文Stを翻訳して目的言語文Toを出力する(ステップS507)。なお、この例では付加した文(「I have cars. 」)は既に目的言語である英語で記述されているため、翻訳部104は翻訳を行う必要はない。
次に、訳出対象文Stに重要語句が付加されているため(ステップS508:YES)、換言語句の検索処理が実行される(ステップS509)。この例では、図4の換言情報記憶部113から重要語句「cars」の換言語句として「automobiles」が存在するため(ステップS509:YES)、目的言語文Toの重要語句を換言語句で置換する(ステップS510)。
次に、出力制御部106により目的言語文Toが音声合成して出力される(ステップS511)。この結果、原言語文Si(「はい。」)を翻訳し、換言語句に置換された重要語句が付加された英語の文として、図12に示す出力文1201(「Yes,I have automobiles. 」)が出力される。
以上のような処理により、英語話者が発話した「 Do you have cards? 」が、「Do you have cars? 」と認識された例のように、重要な部分が誤認識された場合であっても、日本語話者の発話の訳出結果に重要な部分を換言して訳出した結果(「automobiles」)を付加して出力することができる。
このため、重要語句を単純に聞き返すだけでなく、対話相手の発話内容と異なる表現で訳出することができる。したがって、発話内容の認識結果の確認をより効果的に実行することが可能となる。
なお、重要語句の付加の可否を利用者に問い合わせ、重要語句を付加して出力するか否かを制御するように構成してもよい。また、出力制御部106が、重要語句付加部103によって付加された重要語句や、換言部105において換言された重要語句を、その他の部分と異なる方法で出力するように構成してもよい。
例えば、音声合成して出力する際の出力音声の音量や声質などの音声の属性を変えて出力するように構成してもよい。また、画面またはプリンタに出力する際に、付加された部分に下線を引く、または、フォントサイズ、スタイル、フォントの色を変更するなどの加工を加えて出力するように構成してもよい。これにより、対話相手が重要語句であることを容易に認識することができるようになる。
このように、第1の実施の形態にかかるコミュニケーション支援装置は、対話中の重要語句を抽出して翻訳結果に関連付けて対話相手に提示することができるため、対話の中で重要語句の確認を対話相手に促すことが可能となる。また、抽出した重要語句を、対話相手の発話内容と異なる表現で訳出することができるため、対話相手の発話内容が正しく認識され、訳出されたことをより適切に確認させることが可能となる。このため、円滑な会話を妨げずに、発話者間の理解が不一致のまま会話が進められることを回避することができる。
(第2の実施の形態)
第2の実施の形態にかかるコミュニケーション支援装置は、発話の意図を解析し、予め定められた発話意図に対応する発話の場合のみ、重要語句の付加処理を実行するものである。
図13は、第2の実施の形態にかかるコミュニケーション支援装置1300の構成を示すブロック図である。同図に示すように、コミュニケーション支援装置1300は、入力受付部101と、重要語句抽出部102と、重要語句付加部1303と、翻訳部104と、換言部105と、出力制御部106と、発話意図解析部1307と、重要語句規則記憶部111と、発話履歴記憶部1312と、換言情報記憶部113と、付加条件記憶部1314とを備えている。
第2の実施の形態では、発話意図解析部1307と付加条件記憶部1314とを追加したこと、および、重要語句付加部1303の機能が第1の実施の形態と異なっている。また、発話履歴記憶部1312のデータ構造が第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかるコミュニケーション支援装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。
付加条件記憶部1314は、重要語句の付加処理を実行する条件である付加条件を記憶するものであり、発話意図に応じて付加処理の実行可否を制御するために参照される。
図14は、付加条件記憶部1314に記憶された付加条件のデータ構造の一例を示す説明図である。同図に示すように、付加条件は、発話意図と、付加処理を実行するか否かを示す付加処理フラグとを対応付けた構造となっている。
発話意図欄には、後述する発話意図解析部1307により解析された発話意図または発話意図の組合せが指定される。同図では、例えば発話意図1401は、2つの発話がそれぞれ質問と回答という発話意図を有する場合の発話意図の組合せを示している。また、例えば発話意図1403は、1つの発話が挨拶という発話意図を有する場合の発話意図を示している。
付加処理フラグ欄には、付加処理を実行する場合のフラグを示すYes、または付加処理を実行しない場合のフラグを示すNoのいずれかが指定される。同図では、例えば付加処理フラグ1402(「Yes」)は、発話意図が質問と回答の組合せである場合は、付加処理を実行することを示している。また、例えば付加処理フラグ1404(「No」)は、発話意図が挨拶の場合は、付加処理を実行しないことを示している。
なお、付加条件記憶部1314の付加条件の付加処理フラグ欄を省略し、付加処理を実行する場合の発話意図のみを指定するように構成してもよい。この場合、付加条件記憶部1314に記憶されていない発話意図の場合は、付加処理を実行しないものと判断する。
発話履歴記憶部1312は、各発話内容について、発話意図を対応づけて格納する点が、第1の実施の形態の発話履歴記憶部112と異なっている。
図15は、発話履歴記憶部1312に記憶された発話履歴のデータ構造の一例を示す説明図である。同図に示すように、発話履歴は、発話内容と、重要語句と、発話意図と、重要語句規則のIDとを対応づけた構造となっている。
発話意図欄には、後述する発話意図解析部1307が解析した各発話の発話意図を格納する。発話意図としては、例えば、質問、回答、承諾、依頼、挨拶などが指定できる。
例えば、同図の発話内容1501に対しては、「質問」という発話意図1504が対応づけられる。また、発話内容1502に対しては、「回答」という発話意図1505が対応づけられる。また、発話内容1503に対しては、「承諾」という発話意図1506が対応づけられる。発話内容1502からは、重要語句として重要語句1507が抽出される。
発話意図解析部1307は、入力受付部101が受付けた原言語文に対し、原言語の語彙情報、文法規則を参照した形態素解析、構文解析、係り受け解析、意味解析、文脈解析などの自然言語解析処理を行うことによって、原言語文が表している意味内容の解釈である原言語解釈を出力するものである。
また、発話意図解析部1307は、発話履歴記憶部1312の対話履歴を参照し、談話の構造と併せて現在入力されている原言語文が持つ発話意図を解析し、解析結果を出力するものである。
例えば、発話意図解析部1307は、「バス停はどこですか?」という「質問」の発話意図を持った発話に対し、「郵便局の前です。」という発話が入力されたとき、この発話が前の発話に対する「回答」の発話意図を持つ発話である、という解析を行う。
ここで、発話意図解析部1307における自然言語解析処理は、A*アルゴリズムを用いた形態素解析や、アーリー法、チャート法、一般化LR法による構文解析、あるいは、Shankのスクリプト、談話表示理論に基づく文脈解析や談話解析など、一般的に広く知られ、利用されているあらゆる方法を適用することができる。
なお、形態素情報、構文情報、意味情報などを格納した自然言語処理用の辞書を、HDD、光ディスク、メモリカード、RAMなどの一般的に利用されている記憶手段に格納し、これらを参照しながら各自然言語解析処理が実行される。
重要語句付加部1303は、発話履歴記憶部1312を参照しながら、入力受付部101が入力を受付けた発話に対して、重要語句の付加処理を実施するか否かを判断する点が、第1の実施の形態における重要語句付加部103と異なっている。
具体的には、重要語句付加部1303は、発話履歴記憶部1312から、最新の発話の発話意図と、1発話前の発話の発話意図とを取得し、取得した発話意図の組合せまたは最新の発話の発話意図が、付加条件記憶部1314の発話意図欄に記載された条件と一致するか否かを判断する。そして、一致する発話意図が存在する場合には、対応する付加処理フラグを付加条件記憶部1314から取得し、付加処理の実行可否を判断する。
次に、このように構成された第2の実施の形態にかかるコミュニケーション支援装置1300によるコミュニケーション支援処理について説明する。図16は、第2の実施の形態におけるコミュニケーション支援処理の全体の流れを示すフローチャートである。
まず、入力受付部101が、原言語文Siの入力を受付ける(ステップS1601)。本処理は、第1の実施の形態におけるステップS501と同様である。
次に、発話意図解析部1307が、原言語文Siを解析し、発話意図INTを出力する(ステップS1602)。具体的には、発話意図解析部1307は、発話履歴記憶部1312に記憶された過去の発話と、入力された原言語文Siとを参照し、文脈解析などの自然言語処理により、原言語文Siの発話意図を解析し出力する。
次に、重要語句抽出部102が、重要語句抽出処理を実行する(ステップS1603)。第2の実施の形態における重要語句抽出処理は、ステップS606で発話意図INTも同時に発話履歴記憶部1312に保存する点が第1の実施の形態と異なっている。それ以外の重要語句抽出処理の全体の流れは第1の実施の形態における図6に示したフローチャートと同様であるのでその説明を省略する。
次に、重要語句付加部1303は、原言語文Siが重要語句付加対象か否かを判断する(ステップS1604)。例えば、発話履歴記憶部1312から、1発話前の発話の発話意図として「質問」が取得され、最新の発話の発話意図が「回答」であった場合、図14に示すような付加条件記憶部1314の発話意図1401と一致するため、対応する付加処理フラグ1402(Yes)を取得し、付加処理を実行する、すなわち、重要語句付加対象であると判断する。
重要語句付加対象である場合は(ステップS1604:YES)、重要語句付加部1303は、発話履歴記憶部1312から、1発話前のレコードRを取得する(ステップS1605)。重要語句付加対象でない場合は(ステップS1604:NO)、重要語句付加部1303は、原言語文Siを訳出対象文Stとして出力する(ステップS1608)。
このように、発話意図を考慮して重要語句の付加処理の実行可否を判断することができるため、重要語句を常に確認するのではなく、効果的なタイミングで重要語句を確認することが可能となり、対話の流れを途切れさせることなく円滑なコミュニケーション支援が可能となる。
ステップS1606からステップS1613までの、重要語句付加処理、翻訳処理、換言処理、出力処理は、第1の実施の形態にかかるコミュニケーション支援装置100におけるステップS504からステップS511までと同様の処理なので、その説明を省略する。
次に、第2の実施の形態におけるコミュニケーション支援処理の具体例について説明する。図17は、発話履歴記憶部1312に記憶される情報の一例を示す説明図である。
以下では、付加条件記憶部1314には、図14に示す情報が記憶されていることを前提とする。
この状態で、日本語話者が日本語1701(「もっと安い部屋はありませんか?」)を発話したとする。この場合、入力受付部101が日本語1701の入力を受付け、原言語文Siとする(ステップS1602)。
次に、発話意図解析部1307は、日本語1701が「質問」の発話意図を有することを解析し、出力する(ステップS1602)。出力された発話意図は発話意図解析部1307に格納される(図17の発話意図1703)。
この後、重要語句付加部1303は、発話履歴記憶部1312を参照して、原言語文Siが重要語句付加対象か否かを判断する(ステップS1604)。この段階では、発話履歴記憶部1312には、日本語1701のみが格納されており、さらに発話意図「質問」に対しては付加条件記憶部1314にレコードが存在しないため、重要語句付加対象でないと判断される(ステップS1604:NO)。
一方、日本語1701に対して英語話者が英語1702(「Well, we have a room for 15 dollars a night.」)を発話したとすると、入力受付部101が英語1702の入力を受付け、原言語文Siとする(ステップS1602)。
次に、発話意図解析部1307は、英語1702が「回答」の発話意図を有することを解析し、出力する(ステップS1602)。出力された発話意図は発話意図解析部1307に格納される(図17の発話意図1704)。なお、この場合は重要語句として図17の重要語句1705が抽出され(ステップS605)、発話意図解析部1307に記憶される(ステップS606)。
重要語句付加部1303は、発話履歴記憶部1312を参照して、原言語文Siが重要語句付加対象か否かを判断する(ステップS1604)。この段階では、発話履歴記憶部1312には、日本語1701および英語1702が格納されており、これらの発話意図の組合せは、「質問」「回答」となる。この組合せは、図14の付加条件記憶部1314の発話意図1401と一致するため、重要語句付加対象であると判断される(ステップS1604:YES)。
したがって、重要語句付加部1303は、ステップS1605からステップS1607までの処理を実行し、重要語句の検索および付加処理を行う。
このように、第2の実施の形態にかかるコミュニケーション支援装置では、発話意図を解析し、予め定められた発話意図に対応する発話の場合のみ、重要語句の付加処理を実行することができる。このため、効果的なタイミングで重要語句を確認することが可能となり、対話の流れを途切れさせることなく円滑なコミュニケーション支援が可能となる。
(第3の実施の形態)
第3の実施の形態にかかるコミュニケーション支援装置は、発話中の照応表現の指示対象である先行詞を特定し、先行詞の修飾語または被修飾語に重要語句が含まれる場合に、発話中の照応表現に当該重要語句を含む修飾語または被修飾語を付加して出力するものである。
図18は、第3の実施の形態にかかるコミュニケーション支援装置1800の構成を示すブロック図である。同図に示すように、コミュニケーション支援装置1800は、入力受付部101と、重要語句抽出部102と、重要語句付加部1803と、翻訳部104と、換言部105と、出力制御部106と、発話意図解析部1307と、照応解析部1808と、重要語句規則記憶部111と、発話履歴記憶部1312と、換言情報記憶部113と、付加条件記憶部1314とを備えている。
第2の実施の形態では、照応解析部1808を追加したこと、および重要語句付加部1803の機能が第1の実施の形態と異なっている。その他の構成および機能は、第2の実施の形態にかかるコミュニケーション支援装置1300の構成を表すブロック図である図13と同様であるので、同一符号を付し、ここでの説明は省略する。
照応解析部1808は、発話履歴記憶部1312に記憶された過去の発話履歴を参照し、原言語発話中に現れる代名詞などの表現が、過去の発話内に現れた名詞句などの表現と同じ内容や対象を表すことを検出する照応解析処理を行うものである。検出した原言語発話中に現れる代名詞などの発話中の他の対象を指し示す表現を照応表現という。また、照応表現が指し示す指示対象を先行詞という。
例えば、照応解析部1808は、第1の発話として「こちらの服は、少し大きめのサイズになっています。」が入力され、続いて第2の発話として「それを買います。」が入力された場合、第2の発話における代名詞である照応表現「それ」に対応する先行詞を解析し、第1の発話中の「服」であることを特定する。
なお、照応解析部1808により実行される照応解析処理は、キャッシュモデルや、中心化理論に基づく文脈解析を利用し、代名詞の先行詞を推定する方法などの、従来から用いられているあらゆる方法を適用することができる。
重要語句付加部1803は、照応解析部1808が入力された原言語文の照応表現と、過去の発話中の対応する先行詞を検出した場合に、検出した先行詞の被修飾語または修飾語に重要語句が含まれる場合、入力された原言語文の照応表現に先行詞の被修飾語または修飾語を関連付けて出力するものである。
なお、照応表現および先行詞が検出されなかった場合の処理は、第2の実施の形態にかかる重要語句付加部1303の処理と同様である。
次に、このように構成された第3の実施の形態にかかるコミュニケーション支援装置1800によるコミュニケーション支援処理について説明する。図19は、第3の実施の形態におけるコミュニケーション支援処理の全体の流れを示すフローチャートである。
ステップS1901からステップS1906までの、入力受付処理、発話意図解析処理、重要語句抽出処理、重要語句存在確認処理は、第2の実施の形態にかかるコミュニケーション支援装置1300におけるステップS1601からステップS1606までと同様の処理なので、その説明を省略する。
ステップS1906で1発話前のレコードRに重要語句が存在すると判断された場合(ステップS1906:YES)、照応解析部1808が、原言語文Siについて照応解析を実行し、先行詞が含まれる発話のレコードRaを発話履歴記憶部1312から取得する(ステップS1907)。
次に、重要語句付加部1803は、レコードRaが取得されたか否か、すなわち、照応表現および対応する先行詞が検出されたか否かを判断する(ステップS1908)。レコードRaが取得された場合は(ステップS1908:YES)、重要語句付加部1803は、レコードRaに含まれる先行詞に重要語句が付随しているか否かを判断する(ステップS1909)。
ここで、先行詞に重要語句が付随しているとは、先行詞の修飾語または被修飾語から重要語句が抽出できることをいう。重要語句の抽出は、原言語文から重要語句を抽出すると同様に、重要語句規則記憶部111を参照して、適合する抽出条件を検索することにより行う。
ステップS1909で先行詞に重要語句が付随していると判断された場合は(ステップS1909:YES)、重要語句付加部1803は、付随する重要語句を原言語文Si中の照応表現に付随させた訳出対象文Stを出力する(ステップS1910)。
付随する重要語句とは、重要語句を含む修飾語または被修飾語をいう。また、付随する重要語句を照応表現に付随させるとは、照応表現を修飾するように重要語句を含む修飾語を付加すること、または、照応表現から修飾されるように重要語句を含む被修飾語を付加することをいう。
ステップS1911からステップS1917までの、重要語句付加処理、翻訳処理、換言処理、出力処理は、第2の実施の形態にかかるコミュニケーション支援装置1300におけるステップS1607からステップS1613までと同様の処理なので、その説明を省略する。
次に、第3の実施の形態におけるコミュニケーション支援処理の具体例について説明する。図20は、コミュニケーション支援装置1800が出力する出力文の一例を示す説明図である。
以下では、日本語話者による発話であり、「もっと安い部屋はありませんか?」を意味する図7の日本語701、および、英語話者により発話された英語702が既に入力され、図8に示すレコードが発話履歴記憶部1312に保持されていることを前提とする。また、重要語句規則記憶部111および換言情報記憶部113には、それぞれ図2および図4に示す情報が記憶されていることを前提とする。
この状態で、日本語話者が、「I'll take it」を意味する日本語703(「それにします。」)を発話したとする。この場合、入力受付部101が日本語703の入力を受付け、原言語文Siとする。
ここでは、入力受付部101が、入力された音声を正しく認識し、原言語文Siとして出力したと仮定する(ステップS1901)。また、発話意図解析部1307により、発話意図が「承諾」であると解析される(ステップS1902)。
次に、重要語句抽出処理が実行されるが(ステップS1903)、適合する抽出条件が検索されないため(ステップS604:NO)、原言語文Siのみが発話履歴記憶部1312に保存される(ステップS606)。
次に、発話意図の関係から重要語句付加対象か否かが判断される(ステップS1904)。ここでは、1発話前の発話の発話意図が「回答」であり、入力された発話の発話意図が「承諾」であるため、図14に対応する発話意図の組合せが存在し、重要語句付加対象であると判断される(ステップS1904:YES)。
次に、重要語句付加部1803は、発話履歴記憶部1312を参照し、原言語文Siの1発話前のレコードとして、図8の発話内容802(「Well, we have a room for 15 dollars a night. 」)に対応するレコードRを取得する(ステップS1905)。取得したレコードRは、重要語句を含むため(ステップS1906:YES)、照応解析部1808により照応解析処理が実行される。この処理で、原言語文Si(「それにします。」)から、「it」を意味する日本語の照応表現(「それ」)が検出され、対応する先行詞として図8の発話内容802から「room」が取得される。すなわち、発話内容802に対応するレコードがレコードRaとして取得される(ステップS1907)。
レコードRaが取得されたため(ステップS1908:YES)、重要語句付加部1803は、レコードRaに含まれる先行詞「room」に重要語句が付随しているか否かを判断する(ステップS1909)。この場合、先行詞「room」には修飾語「for 15 dollars」が付随しており、「15 dollars」は金額表現であるため重要語句である。したがって、先行詞に重要語句が付随していると判断される(ステップS1909:YES)。
次に、重要語句付加部1803は、原言語文Si中の照応表現に修飾語を付随させた訳出対象文Stを出力する(ステップS1910)。この例では、「it」を意味する日本語の照応表現(「それ」)の部分に、修飾語「for 15 dollars」を付随させた訳出対象文St(「それ for 15 dollarsにします。」)が出力される。
次に、翻訳部104が訳出対象文Stを翻訳して目的言語文Toを出力する(ステップS1913)。
また、訳出対象文Stに重要語句が付加されているため(ステップS1914:YES)、換言語句の検索処理が実行されるが(ステップS1915)、図4の換言情報記憶部113には該当する重要語句が存在しないため(ステップS1915:NO)、出力制御部106により目的言語文Toが音声合成して出力される(ステップS1917)。この結果、原言語文Si(「それにします。」)を翻訳し、重要語句が付加された英語の文として、図20に示す出力文2001(「I'll take it for 15 dollars.」)が出力される。
以上のような処理により、英語話者が発話した「Well, I have a room for 50 dollars a night. 」が、「Well, I have a room for 15 dollars a night. 」と認識された例のように、重要な部分が誤認識された場合であっても、日本語話者の発話の訳出結果に重要な部分の訳出結果(「15 dollars. 」)を付加して出力することができる。
このように、第3の実施の形態にかかるコミュニケーション支援装置では、発話中の照応表現の指示対象である先行詞を特定し、先行詞の修飾語または被修飾語に重要語句が含まれる場合に、発話中の照応表現に当該重要語句を含む修飾語または被修飾語を付加して出力することができる。このため、先行詞に重要語句が修飾語または被修飾語として付随する場合に、当該先行詞に対応する照応表現に適切に重要語句を付加することができる。
第1〜第3の実施の形態にかかるコミュニケーション支援装置は、CPU(Central Processing Unit)などの制御装置と、ROM(Read Only Memory)やRAM(Random Access Memory)などの記憶装置と、HDD(Hard Disk Drive)、CD(Compact Disc)ドライブ装置などの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボードやマウスなどの入力装置を備えており、通常のコンピュータを利用したハードウェア構成となっている。
なお、第1〜第3の実施の形態にかかるコミュニケーション支援装置で実行されるコミュニケーション支援プログラムは、ROM(Read Only Memory)等に予め組み込まれて提供される。
第1〜第3の実施の形態にかかるコミュニケーション支援装置で実行されるコミュニケーション支援プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
さらに、第1〜第3の実施の形態にかかるコミュニケーション支援装置で実行されるコミュニケーション支援プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、第1〜第3の実施の形態にかかるコミュニケーション支援装置で実行されるコミュニケーション支援プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
第1〜第3の実施の形態にかかるコミュニケーション支援装置で実行されるコミュニケーション支援プログラムは、上述した各部(入力受付部、重要語句抽出部、重要語句付加部、翻訳部、換言部、出力制御部、発話意図解析部、照応解析部)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(Central Processing Unit)が上記ROMからコミュニケーション支援プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、各部が主記憶装置上に生成されるようになっている。
以上のように、本発明にかかるコミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラムは、音声入力または文字入力した原言語文を目的言語に翻訳して文字出力または音声出力する装置に適している。
第1の実施の形態にかかるコミュニケーション支援装置の構成を示すブロック図である。 重要語句規則記憶部に記憶された重要語句規則のデータ構造の一例を示す説明図である。 発話履歴記憶部に記憶された発話履歴のデータ構造の一例を示す説明図である。 換言情報記憶部に記憶された換言情報のデータ構造の一例を示す説明図である。 第1の実施の形態におけるコミュニケーション支援処理の全体の流れを示すフローチャートである。 第1の実施の形態における重要語句抽出処理の全体の流れを示すフローチャートである。 相互に発話される文の一例を示した説明図である。 発話履歴記憶部に記憶される情報の一例を示す説明図である。 コミュニケーション支援装置が出力する出力文の一例を示す説明図である。 相互に発話される文の一例を示した説明図である。 発話履歴記憶部に記憶される情報の一例を示す説明図である。 コミュニケーション支援装置が出力する出力文の一例を示す説明図である。 第2の実施の形態にかかるコミュニケーション支援装置の構成を示すブロック図である。 付加条件記憶部に記憶された付加条件のデータ構造の一例を示す説明図である。 発話履歴記憶部に記憶された発話履歴のデータ構造の一例を示す説明図である。 第2の実施の形態におけるコミュニケーション支援処理の全体の流れを示すフローチャートである。 発話履歴記憶部に記憶される情報の一例を示す説明図である。 第3の実施の形態にかかるコミュニケーション支援装置の構成を示すブロック図である。 第3の実施の形態におけるコミュニケーション支援処理の全体の流れを示すフローチャートである。 コミュニケーション支援装置が出力する出力文の一例を示す説明図である。
符号の説明
100 コミュニケーション支援装置
101 入力受付部
102 重要語句抽出部
103 重要語句付加部
104 翻訳部
105 換言部
106 出力制御部
111 重要語句規則記憶部
112 発話履歴記憶部
113 換言情報記憶部
201 抽出条件
202 重要語句付加方法
203 抽出条件
204 重要語句付加方法
301、302、303 発話内容
304 重要語句
401 変換前語句
402 変換後語句
701、703 日本語
702 英語
801、802 発話内容
901 出力文
1001 英語
1002 日本語
1101 英語
1102 日本語
1103 重要語句
1104 ID
1201 出力文
1300 コミュニケーション支援装置
1303 重要語句付加部
1307 発話意図解析部
1312 発話履歴記憶部
1314 付加条件記憶部
1401、1403 発話意図
1402、1404 付加処理フラグ
1501、1502、1503 発話内容
1504、1505、1506 発話意図
1507 重要語句
1701 日本語
1702 英語
1703、1704 発話意図
1705 重要語句
1800 コミュニケーション支援装置
1803 重要語句付加部
1808 照応解析部
2001 出力文

Claims (8)

  1. 複数の言語間の翻訳を行うことによりコミュニケーションを支援するコミュニケーション支援装置において、
    発話から重要語句を抽出する際の抽出条件と、抽出した重要語句を、重要語句を抽出した発話より後に発話された発話に関連付けて出力する際の関連付け方法とを対応づけて記憶する規則記憶手段と、
    発話の入力を受付ける入力受付手段と、
    前記規則記憶手段に記憶された前記抽出条件に基づいて、前記入力受付手段が受付けた第1の言語により発話された第1発話から重要語句を抽出する抽出手段と、
    前記入力受付手段が受付けた前記第1発話を、第1の言語から第2の言語に翻訳する翻訳手段と、
    前記翻訳手段が翻訳した前記第1発話を出力する出力手段と、
    前記抽出手段が重要語句を抽出する際に用いた前記抽出条件に対応づけられた前記関連付け方法に基づいて、前記抽出手段が抽出した重要語句を、前記出力手段により出力された前記第1発話の直後に発話され、前記入力受付手段が受付けた第2の言語による第2発話に関連付ける関連付け手段と、を備え、
    前記翻訳手段は、さらに前記関連付け手段により重要語句が関連付けられた前記第2発話を、第2の言語から第1の言語に翻訳し、
    前記出力手段は、さらに前記第2発話に関連づけられた重要語句と、前記翻訳手段が翻訳した前記第2発話とを出力することを特徴とするコミュニケーション支援装置。
  2. 前記規則記憶手段は、予め定められた検索対象語句を重要語句として発話から抽出する際の前記抽出条件と、抽出した重要語句を予め定められた位置に埋め込んだ語句を、重要語句を抽出した発話より後に発話された発話に関連付けて出力する際の前記関連付け方法とを対応づけて記憶し、
    前記抽出手段は、前記規則記憶手段に記憶された前記抽出条件に基づいて、前記検索対象語句と同一または類似の語句を前記入力受付手段が受付けた前記第1発話から重要語句として抽出し、
    前記関連付け手段は、前記抽出手段が重要語句を抽出する際に用いた前記抽出条件に対応づけられた前記関連付け方法に基づいて、前記抽出手段が抽出した重要語句を予め定められた位置に埋め込んだ語句を前記第2発話に関連付けることを特徴とする請求項1に記載のコミュニケーション支援装置。
  3. 前記規則記憶手段は、予め定められた発話の用例に含まれる予め定められた重要語句である重要語句用例に対応する語句を重要語句として発話から抽出する際の前記抽出条件と、抽出した重要語句を予め定められた位置に埋め込んだ語句を、重要語句を抽出した発話より後に発話された発話に関連付けて出力する際の前記関連付け方法とを対応づけて記憶し、
    前記抽出手段は、前記規則記憶手段に記憶された前記抽出条件に基づいて、前記入力受付手段が受付けた前記第1発話と同一または類似の前記用例を前記規則記憶手段から検索し、検索した前記用例に含まれる前記重要語句用例に対応する語句を前記入力受付手段が受付けた前記第1の発話に含まれる語句の中から重要語句として抽出し、
    前記関連付け手段は、前記抽出手段が重要語句を抽出する際に用いた前記抽出条件に対応づけられた前記関連付け方法に基づいて、前記抽出手段が抽出した重要語句を予め定められた位置に埋め込んだ語句を前記第2発話に関連付けることを特徴とする請求項1に記載のコミュニケーション支援装置。
  4. 前記第1発話および前記第2発話の発話の履歴を記憶する発話履歴記憶手段と、
    前記発話履歴記憶手段に記憶された前記発話の履歴と、前記入力受付手段が受付けた前記第2発話とに基づき、前記入力受付手段が受付けた前記第2発話の発話意図を解析する発話意図解析手段と、をさらに備え、
    前記関連付け手段は、前記入力受付手段が受付けた前記第2発話の発話意図が予め定められた発話意図と一致する場合に、前記抽出手段が重要語句を抽出する際に用いた前記抽出条件に対応づけられた前記関連付け方法に基づいて、前記抽出手段が抽出した重要語句を、前記第2発話に関連付けることを特徴とする請求項1に記載のコミュニケーション支援装置。
  5. 前記入力受付手段が受付けた前記第2発話の意味内容を解析し、前記入力受付手段が受付けた前記第2発話に含まれる発話中の他の対象を指し示す表現である照応表現の指示対象を、前記発話履歴記憶手段に記憶された前記発話の履歴から取得する照応解析手段をさらに備え、
    前記関連付け手段は、前記照応解析手段が取得した前記指示対象の被修飾語または修飾語に前記抽出手段が抽出した重要語句が含まれる場合、前記第2発話に含まれる前記照応表現に前記指示対象の被修飾語または修飾語を関連付けることを特徴とする請求項1に記載のコミュニケーション支援装置。
  6. 任意の語句と、前記任意の語句と同じ意味内容で表現形式の異なる換言語句とを対応づけて記憶する換言情報記憶手段と、
    前記翻訳手段が翻訳した前記第2発話に関連付けられた重要語句に対応する前記換言語句を前記換言情報記憶手段から検索し、前記翻訳手段が翻訳した前記第2発話に関連付けられた重要語句を、検索した前記換言語句で置換する換言手段と、をさらに備え、
    前記出力手段は、前記翻訳手段が翻訳した前記第1発話と、前記換言手段が前記換言語句で置換した重要語句と、前記翻訳手段が翻訳した前記第2発話を出力することを特徴とする請求項1に記載のコミュニケーション支援装置。
  7. 複数の言語間の翻訳を行うことによりコミュニケーションを支援するコミュニケーション支援装置で実行されるコミュニケーション支援方法において、
    入力受付手段が、第1の言語により発話された第1発話の入力を受付ける第1入力受付ステップと、
    抽出手段が、発話から重要語句を抽出する際の抽出条件と、抽出した重要語句を、重要語句を抽出した発話より後に発話された発話に関連付けて出力する際の関連付け方法とを対応づけて記憶する規則記憶手段に記憶された前記抽出条件に基づいて、前記第1入力受付ステップが受付けた前記第1発話から重要語句を抽出する抽出ステップと、
    翻訳手段が、前記第1入力受付ステップが受付けた第1発話を、第1の言語から第2の言語に翻訳する第1翻訳ステップと、
    出力手段が、前記第1翻訳ステップが翻訳した前記第1発話を出力する第1出力ステップと、
    入力受付手段が、前記第1出力ステップにより出力された前記第1発話の直後に発話された第2の言語による第2発話の入力を受付ける第2入力受付ステップと、
    関連付け手段が、前記抽出ステップが重要語句を抽出する際に用いた前記抽出条件に対応づけられた前記関連付け方法に基づいて、前記抽出ステップが抽出した重要語句を、前記第2入力受付ステップが受付けた前記第2発話に関連付ける関連付けステップと、
    翻訳手段が、前記関連付けステップにより重要語句が関連付けられた前記第2発話を、第2の言語から第1の言語に翻訳する第2翻訳ステップと、
    出力手段が、前記第2発話に関連づけられた重要語句と、前記第2翻訳ステップが翻訳した前記第2発話とを出力する第2出力ステップと、
    を備えたことを特徴とするコミュニケーション支援方法。
  8. コンピュータを、
    発話の入力を受付ける入力受付手段と、
    発話から重要語句を抽出する際の抽出条件と、抽出した重要語句を、重要語句を抽出した発話より後に発話された発話に関連付けて出力する際の関連付け方法とを対応づけて記憶する規則記憶手段に記憶された前記抽出条件に基づいて、前記入力受付手段が受付けた第1の言語により発話された第1発話から重要語句を抽出する抽出手段と、
    前記入力受付手段が受付けた前記第1発話を、第1の言語から第2の言語に翻訳する翻訳手段と、
    前記翻訳手段が翻訳した前記第1発話を出力する出力手段と、
    前記抽出手段が重要語句を抽出する際に用いた前記抽出条件に対応づけられた前記関連付け方法に基づいて、前記抽出手段が抽出した重要語句を、前記出力手段により出力された前記第1発話の直後に発話され、前記入力受付手段が受付けた第2の言語による第2発話に関連付ける関連付け手段と、として機能させ、
    前記翻訳手段は、さらに前記関連付け手段により重要語句が関連付けられた前記第2発話を、第2の言語から第1の言語に翻訳し、
    前記出力手段は、さらに前記第2発話に関連づけられた重要語句と、前記翻訳手段が翻訳した前記第2発話とを出力することを特徴とするコミュニケーション支援プログラム。
JP2008119590A 2008-05-01 2008-05-01 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム Abandoned JP2008243222A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008119590A JP2008243222A (ja) 2008-05-01 2008-05-01 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008119590A JP2008243222A (ja) 2008-05-01 2008-05-01 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006043181A Division JP2007220045A (ja) 2006-02-20 2006-02-20 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム

Publications (1)

Publication Number Publication Date
JP2008243222A true JP2008243222A (ja) 2008-10-09

Family

ID=39914398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008119590A Abandoned JP2008243222A (ja) 2008-05-01 2008-05-01 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム

Country Status (1)

Country Link
JP (1) JP2008243222A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9507774B2 (en) 2013-09-30 2016-11-29 Kabushiki Kaisha Toshiba Systems, method and program product for speech translation
US10055406B2 (en) 2015-09-08 2018-08-21 Samsung Electronics Co., Ltd. Server, user terminal, and method for controlling server and user terminal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9507774B2 (en) 2013-09-30 2016-11-29 Kabushiki Kaisha Toshiba Systems, method and program product for speech translation
US10055406B2 (en) 2015-09-08 2018-08-21 Samsung Electronics Co., Ltd. Server, user terminal, and method for controlling server and user terminal

Similar Documents

Publication Publication Date Title
JP2007220045A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
EP1330816B1 (en) Language independent voice-based user interface
JP4050755B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US8954333B2 (en) Apparatus, method, and computer program product for processing input speech
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6266642B1 (en) Method and portable apparatus for performing spoken language translation
US6356865B1 (en) Method and apparatus for performing spoken language translation
US6952665B1 (en) Translating apparatus and method, and recording medium used therewith
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US6374224B1 (en) Method and apparatus for style control in natural language generation
US6446041B1 (en) Method and system for providing audio playback of a multi-source document
US20140358544A1 (en) Systems and methods for adaptive proper name entity recognition and understanding
JP2001100781A (ja) 音声処理装置および音声処理方法、並びに記録媒体
JP5336805B2 (ja) 音声翻訳装置、方法、およびプログラム
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
EP3005152A1 (en) Systems and methods for adaptive proper name entity recognition and understanding
JP2006030326A (ja) 音声合成装置
JP2008243222A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2003162524A (ja) 言語処理装置
JP2001117922A (ja) 翻訳装置および翻訳方法、並びに記録媒体
JP2001100788A (ja) 音声処理装置および音声処理方法、並びに記録媒体
JP2001117583A (ja) 音声認識装置および音声認識方法、並びに記録媒体

Legal Events

Date Code Title Description
A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20100129