JP4058071B2 - 用例翻訳装置、用例翻訳方法および用例翻訳プログラム - Google Patents

用例翻訳装置、用例翻訳方法および用例翻訳プログラム Download PDF

Info

Publication number
JP4058071B2
JP4058071B2 JP2005336931A JP2005336931A JP4058071B2 JP 4058071 B2 JP4058071 B2 JP 4058071B2 JP 2005336931 A JP2005336931 A JP 2005336931A JP 2005336931 A JP2005336931 A JP 2005336931A JP 4058071 B2 JP4058071 B2 JP 4058071B2
Authority
JP
Japan
Prior art keywords
language
examples
translation
unit
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005336931A
Other languages
English (en)
Other versions
JP2007141133A (ja
Inventor
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005336931A priority Critical patent/JP4058071B2/ja
Priority to US11/519,811 priority patent/US8185372B2/en
Priority to CNA2006101486703A priority patent/CN1971554A/zh
Publication of JP2007141133A publication Critical patent/JP2007141133A/ja
Application granted granted Critical
Publication of JP4058071B2 publication Critical patent/JP4058071B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

この発明は、用例を用いて入力された発話を翻訳し、翻訳結果を出力する用例翻訳装置、用例翻訳方法および用例翻訳プログラムに関するものである。
近年、異なる言語を母語とする人同士のコミュニケーションを支援する音声翻訳装置の実用化に対する期待が高まっている。このような音声翻訳装置は、基本的には、音声を認識する手段、音声認識の結果得られた文字列を翻訳する手段、翻訳の結果得られた文字列を音声で合成する手段を用い、音声認識処理、翻訳処理、音声合成処理を順次実行することにより構成できる。
利用者が発話した音声を認識して文字情報を出力する音声認識システムは、すでにパッケージソフトなどの形態で実用化されている。また、書き言葉(テキスト)を入力とした機械翻訳システムについても、同様にパッケージソフトなどの形態で実用化されている。音声合成システムについても、すでに実用に供せられており、これらソフトウェアを適宜利用することで、音声翻訳装置を実現することは可能である。
ところが、現状では、100%の精度で音声認識することは困難であり、書き言葉を対象にした機械翻訳であっても原文には訳語の曖昧性や係り受けの曖昧性が含まれる場合があり意図通りの翻訳結果を出力できない場合が存在するといった課題が存在する。また、音声入力では文法的に正しくない文も入力されうるため、音声認識の過程で誤りが生じ、誤りを含む入力を対象に機械翻訳を行わなければならないといった課題も存在する。これらの要因により、実用に値する音声翻訳装置を実現するのが困難な状況にある。
特に、原言語の発話者が目的言語を理解することができない場合、音声翻訳装置が発話者の意図通りの翻訳結果を出力しているか否かを確認することができないため、音声認識や機械翻訳で生じる誤りや解析の曖昧性への対応が必須となっている。
機械翻訳は、原言語(例えば日本語)の文を目的言語(例えば英語)へ変換するものであるが、この変換方式によって、ルールベース機械翻訳、統計ベース機械翻訳、用例ベース機械翻訳に大別することができる。
ルールベース機械翻訳は、形態素解析手段や構文解析手段を有し、原言語文から文の構造を解析し、その構造に基づいて目的言語の構文構造への変換(トランスファー)を行う方式である。構文解析やトランスファーのための処理知識は、あらかじめルールの形式で登録しておき、翻訳装置はそのルールを解釈しながら翻訳処理を行う。パッケージソフト等で実用化されている機械翻訳システムは、この方式に基づくシステムが大半である。
ルールベース機械翻訳では、実用に値する精度のよい機械翻訳を実現するために膨大なルールを用意する必要があるが、このようなルールを人手で作成するには多大なコストがかかる。これを解決するため、統計ベース機械翻訳のアイデアが提唱され、それ以降、活発に研究開発が進められている。
統計ベース機械翻訳は、原言語文と目的言語による対訳文を大規模に準備し(対訳コーパスと呼ぶ)、このコーパスから翻訳を行う変換ルールとその確率値を求める手法であり、確率値の最も高い変換ルールを適用されるような翻訳結果を求めるものである。現在、統計ベース機械翻訳を用いた音声翻訳のプロトタイプシステムが構築されている。
用例ベース機械翻訳は、統計ベース機械翻訳と同様に原言語と目的言語との対訳コーパスを用いる。入力文と類似する原文を対訳コーパスから検索し、検索された原文と対応する目的言語文を翻訳結果とする方式である。ルールベース機械翻訳や統計ベース機械翻訳は、変換ルール等の適用に関して曖昧性が生じる可能性があり、その結果、原言語の発話者の意図と異なる翻訳結果が出力される可能性をなくすことはできない。
これに対し、用例ベース機械翻訳は、対訳コーパスで検索された原言語文に対応する対訳文がそのまま用いられる。検索された原文は原言語の発話者が確認することができ、また、対訳文は人手であらかじめ作成されているものであるから、翻訳の過程で誤りが生じることが少ない機械翻訳方式といえる。ただし、大規模な対訳コーパスを整備したとしても、入力する可能性があるすべての文をあらかじめ用意することはできない。用例ベース機械翻訳では、入力文と類似する用例が検索できなければ、翻訳は失敗するので、ルールベース機械翻訳や統計ベース機械翻訳など適用範囲の広い機械翻訳方式と相補的に用いる必要がある。
用例ベース機械翻訳を用いることで、対訳コーパスから入力文と類似する原文が検索されれば、正しい翻訳が得られる可能性が高くなる。しかし、ある原文に対して訳は1つに限られず、会話の状況や文脈で異なる訳にしなければならない場合がある。すなわち、あらかじめ人手で用例が作成したとしても、対訳文に曖昧性が生じる場合がある。このような場合、複数の対訳文のうちいずれを選択するかを利用者に提示して選択させる方法もあるが、目的言語を理解できない原言語発話者は、適切な対訳文を選択することは不可能である。
そこで、訳文に関する言語情報を原言語によって表示することによって、目的言語に関する知識を有さない発話者が、原言語に対する正しい対訳文を選択することを可能とするような解説表示機能を有する翻訳装置が提案されている(例えば、特許文献1)。
具体的には、例えば、複数の意味(用法)を有する単語を含む英語の原言語文を日本語に翻訳し、複数の日本語の対訳文候補が生成された場合、各対訳文とともに、各対訳文の翻訳時に適用した用法と同じ用法で単語を用いた英語の例文を対応づけて表示する。そして、発話者が原言語文の用法と同じ用法の例文を選択することにより、選択した例文に対応づけられた日本語の対訳文を正しい対訳文として選択することができる。
特開平05−128150号公報
しかしながら、特許文献1の方法では、単語の用法、言語の時制、またはアスペクト(相)などの言語情報を参照して正しい対訳文を推測する必要があるため、対訳文選択の処理負担が増大するという問題があった。
すなわち、例えば、本来の発話意図と異なる意味を有する複数の例文を読み、いずれの部分に曖昧性が生じているかを判断し、その上で正しい例文を選択する必要があるため、判断の負担が増加するとともに、正しい訳文を選択して発話相手に提示するまでの処理時間も増大するという問題があった。
本発明は、上記に鑑みてなされたものであって、対訳文に曖昧性が生じた場合に、原言語による用例を選択して利用者に提示することにより、利用者が適切な用例を容易に選択することができる用例翻訳装置、用例翻訳方法および用例翻訳プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、用例翻訳装置において、第1言語の用例と、前記第1言語の用例と同じ意味内容を含む第2言語の用例とを対応づけて記憶する対訳用例記憶手段と、第1言語の文の入力を受付ける入力受付手段と、前記入力受付手段が受付けた前記第1言語の文に基づいて、前記対訳用例記憶手段から前記第1言語の用例を検索する第1用例検索手段と、前記第1用例検索手段が検索した前記第1言語の用例に対応づけられた少なくとも1つの前記第2言語の用例を検索する第2用例検索手段と、前記第2用例検索手段が検索した前記第2言語の用例が複数存在するか否かを判定する判定手段と、前記判定手段が前記第2言語の用例が複数存在すると判定した場合に、複数の前記第2言語の用例のそれぞれについて、前記第2言語の用例に対応づけられた前記第1言語の用例を前記対訳用例記憶手段から取得する第1取得手段と、前記第1取得手段が取得した前記第1言語の用例に対応づけられた前記第2言語の用例を前記対訳用例記憶手段から取得する第2取得手段と、前記第2取得手段が取得した前記第2言語の用例の個数が最も少ない前記第1言語の用例を、出力する用例の選択肢として生成する選択肢生成手段と、前記選択肢生成手段が生成した前記用例の選択肢を出力する出力制御手段と、を備えたことを特徴とする。
また、本発明は、用例翻訳装置において、ネットワークを介して接続され、第1言語の用例と同じ意味内容を含む第2言語の用例とを対応づけて記憶する対訳用例記憶手段を備えた用例管理サーバに対して、第1言語の文、前記第1言語の用例、または前記第2言語の用例を送信し、前記用例管理サーバが返信した前記第1言語の用例、または前記第2言語の用例を受信する通信手段と、前記第1言語の文の入力を受付ける入力受付手段と、前記入力受付手段が受付けた前記第1言語の文に基づいて、前記第1言語の用例を、前記通信手段を介して前記用例管理サーバの前記対訳用例記憶手段から検索する第1用例検索手段と、前記第1用例検索手段が検索した前記第1言語の用例に対応づけられた少なくとも1つの前記第2言語の用例を、前記通信手段を介して前記用例管理サーバの前記対訳用例記憶手段から検索する第2用例検索手段と、前記第2用例検索手段が検索した前記第2言語の用例が複数存在するか否かを判定する判定手段と、前記判定手段が前記第2言語の用例が複数存在すると判定した場合に、複数の前記第2言語の用例のそれぞれについて、前記第2言語の用例に対応づけられた前記第1言語の用例を、前記通信手段を介して前記対訳用例記憶手段から取得する第1取得手段と、前記第1取得手段が取得した前記第1言語の用例に対応づけられた前記第2言語の用例を、前記通信手段を介して前記対訳用例記憶手段から取得する第2取得手段と、前記第2取得手段が取得した前記第2言語の用例の個数が最も少ない前記第1言語の用例を、出力する用例の選択肢として生成する選択肢生成手段と、前記選択肢生成手段が生成した前記用例の選択肢を出力する出力制御手段と、を備えたことを特徴とする。
また、本発明は、上記装置を実行することができる用例翻訳方法および用例翻訳プログラムである。
本発明によれば、入力された原言語文と同様の意味内容を有する用例のうち、より曖昧性の少ない原言語文の用例を選択肢として利用者に提示することができる。このため、利用者は適切な用例を容易に判断でき、利用者の発話意図と異なる訳文が出力される可能性を低減することができるという効果を奏する。
以下に添付図面を参照して、この発明にかかる用例翻訳装置、用例翻訳方法および用例翻訳プログラムの最良な実施の形態を詳細に説明する。
(第1の実施の形態)
第1の実施の形態にかかる用例翻訳装置は、原言語文の用例と対訳文の用例とを多対多の関係で記憶した対訳コーパスを用いることを前提とし、入力された原言語文に対する対訳文の用例が複数存在する場合に、当該対訳文の用例に対応づけられた原言語文の用例のうち、曖昧性の少ない用例を選択肢として利用者に提示するものである。
なお、以下では、日本語を原言語、英語を翻訳の目的言語として翻訳処理を実行することを前提として説明するが、原言語および目的言語の組み合わせはこれに限るものではなく、あらゆる言語の組み合わせについて適用することができる。
図1は、第1の実施の形態にかかる用例翻訳装置100の構成を示すブロック図である。同図に示すように、用例翻訳装置100は、対訳用例記憶部111と、入力受付部101と、用例検索部102と、曖昧性検出部103と、選択肢生成部104と、出力制御部105とを備えている。
対訳用例記憶部111は、原言語による文やフレーズなどの用例と、原言語文の用例に対する対訳文の用例とを対応づけて記憶するものであり、HDD(Hard Disk Drive)、光ディスク、メモリカード、RAM(Random Access Memory)などの一般的に利用されているあらゆる記憶手段により構成することができる。
図2は、対訳用例記憶部111に格納される対訳コーパスのデータ構造の一例を模式的に示した説明図である。同図に示すように、対訳用例記憶部111は、日本語用例と、当該日本語用例と同じ意味の英語用例とを対応づけて格納している。日本語用例と英語用例とを連結する直線が対応関係を示している。
なお、日本語用例と同じ意味の英語用例が複数存在する場合は、当該日本語用例を始点とした複数の直線により複数の英語用例と対応づけられる。同様に、英語用例と同じ意味の日本語用例が複数存在する場合は、当該日本語用例を始点とした複数の直線により複数の日本語用例と対応づけられる。このように、日本語用例と英語用例とは、多対多の関係により対応づけられている。
入力文が日本語の場合、原言語は日本語となり、日本語用例と関連付けられている英語用例が目的言語の訳文となる。また、入力文が英語の場合、原言語は英語となり、英語用例と関連付けられている日本語用例が目的言語の訳文となる。すなわち、原言語と目的言語とは相対的なものであり、いずれの翻訳方向であるかに依存する。以下、説明を簡単にするため、図面や説明は日本語から英語への翻訳を前提とするが、英語から日本語への翻訳に対しても同様の処理を行うことにより、本実施の形態の用例翻訳装置を実現することができる。
入力受付部101は、キーボード、マウス、ボタン等の入力デバイスを用いて利用者が入力した原言語文を受付けるものである。また、後述する出力制御部105が出力した用例の選択肢から、利用者が選択した用例の入力を受付けるものである。
なお、マイクなどから入力された原言語文による音声を受付け、受付けた音声を音声認識して音声認識結果を出力する音声認識部(図示せず)を備え、入力受付部101は、音声認識部により出力された音声認識結果を入力された原言語文として受付けるように構成してもよい。
また、ペン入力デバイスなどから入力された原言語文による文字情報を受付け、受付けた文字情報を文字認識して文字認識結果を出力する文字認識部(図示せず)を備え、入力受付部101は、文字認識部により出力された文字認識結果を入力された原言語文として受付けるように構成してもよい。
用例検索部102は、入力受付部101が受付けた原言語文と一致する用例または類似する用例を対訳用例記憶部111から検索するものである。類似する用例も検索するのは、入力文と完全に一致する原言語文の用例を検索するだけでは、意味的に類似する用例を有効に利用できないためである。ただし、完全一致する用例だけを検索するように構成してもよい。
用例検索部102は、例えば、以下の(1)式で定義される単語列の編集距離distを算出し、編集距離distが予め定められた閾値を越えない用例を検索する。
dist = (I + D + 2ΣSEMDIST) / (Linput + Lexample)・・・(1)
ここで、Linputは入力文の単語数、Lexampleは原言語文の用例の単語数、Iは挿入単語数、Dは削除単語数、SEMDISTは置換語の意味距離を表す。
なお、類似する用例を検索する方法は上記方法に限られるものではなく、入力文と意味内容が類似する用例を検索する方法であれば、あらゆる方法を適用することができる。
曖昧性検出部103は、対訳用例記憶部111に記憶されている対訳関係を参照し、原言語文の用例の対訳文が曖昧性を有することを検出するものである。具体的には、曖昧性検出部103は、用例検索部102が検索した原言語文の用例に対応づけられた対訳文の用例が複数存在するか否かを判断することにより、対訳文が曖昧であるか否かを検出する。
例えば、用例検索部102により、図2に示す日本語201が検索された場合、対応する英語の対訳文の用例は3つ存在するため、原言語文の用例の対訳文が曖昧性を有すると判断される。
選択肢生成部104は、曖昧性検出部103が原言語文の用例の対訳文が曖昧性を有することを検出した場合に、最も適切な対訳文が出力されるようにするために利用者に提示する原言語文の用例の選択肢を生成するものである。
具体的には、まず、選択肢生成部104は、曖昧性検出部103により対訳文の用例が複数存在することが検出された場合に、複数の対訳文の用例のそれぞれについて、対訳文の用例に対応づけられた原言語文の用例を対訳用例記憶部111から取得する。次に、選択肢生成部104は、取得した原言語文の用例に対応づけられた対訳文の用例を対訳用例記憶部111から取得する。最後に、選択肢生成部104は、取得した対訳文の用例の個数が最も少ない原言語文の用例を選択肢として生成する。
出力制御部105は、選択肢生成部104が生成した用例の選択肢を利用者に対して出力するものである。また、入力受付部101が、利用者により選択された用例の入力を受付けた場合、対応する訳文を利用者(対話相手)に出力するものである。
出力制御部105は、例えば、ディスプレイなどの文字列を画面に表示する表示デバイスに対して、生成した原言語文の用例の選択肢または目的言語による訳文を出力する。
なお、訳文を目的言語による音声に合成する音声合成部(図示せず)を備え、出力制御部105は、音声合成部により合成された目的言語による音声を出力するように構成してもよい。
次に、このように構成された第1の実施の形態にかかる用例翻訳装置100による用例翻訳処理について説明する。図3は、第1の実施の形態における用例翻訳処理の全体の流れを示すフローチャートである。
まず、入力受付部101が、利用者により入力された原言語による入力文を受付ける(ステップS301)。次に、用例検索部102が、入力文と一致または類似する原言語文の用例を、対訳用例記憶部111から検索する(ステップS302)。
通常、複数の用例が検索されるため、検索された各用例のそれぞれについて、以下の処理を実行する。なお、ステップS302で用例が検索されなかった場合は、翻訳に失敗した旨を出力し、再度入力を受付ける。
まず、曖昧性検出部103は、検索結果から用例を1つ選択する(ステップS303)。次に、曖昧性検出部103は、選択した用例に対応する対訳文の用例を対訳用例記憶部111から取得する(ステップS304)。
続いて、曖昧性検出部103は、複数の対訳文の用例が取得されたか否かを判断し(ステップS305)、複数の対訳文の用例が取得されない場合は(ステップS305:NO)、選択肢生成部104が選択した原言語文の用例を選択肢として生成する(ステップS306)。
複数の対訳文の用例が取得された場合は(ステップS305:YES)、複数の対訳文の用例の中から最も適切な対訳文の用例を選択可能とするような原言語文の用例の選択肢を生成するために、選択肢生成処理を実行する(ステップS307)。選択肢生成処理の詳細については後述する。
次に、曖昧性検出部103は、すべての検索結果の用例を処理したか否かを判断し(ステップS308)、すべての検索結果の用例を処理していない場合は(ステップS308:NO)、次の用例を選択して処理を繰り返す(ステップS303)。
すべての検索結果の用例を処理した場合は(ステップS308:YES)、出力制御部105は、選択肢生成部104が生成した用例の選択肢を画面に出力する(ステップS309)。
次に、入力受付部101は、画面に出力された用例の選択肢の中から利用者が選択した用例の入力を受付ける(ステップS310)。次に、出力制御部105が、利用者が選択した用例に対応する訳文を対訳用例記憶部111から取得し画面に出力する(ステップS311)。
次に、ステップS307の選択肢生成処理の詳細について説明する。図4は、第1の実施の形態における選択肢生成処理の全体の流れを示すフローチャートである。
まず、選択肢生成部104が、複数の対訳文の用例から未処理の対訳文の用例を1つ選択する(ステップS401)。次に、選択肢生成部104が、対訳用例記憶部111を参照し、選択した対訳文の用例に対応する原言語文の用例のうち、目的言語への対訳関係の数が最も少ない用例を選択する(ステップS402)。
なお、対訳関係の数が最も少ない原言語文の用例が複数存在した場合は、対訳用例記憶部111への格納順等により予め定められた優先度の高い用例を選択する。
次に、選択肢生成部104が、選択した原言語文の用例を、用例の選択肢として生成する(ステップS403)。次に、選択肢生成部104が、すべての対訳文の用例を処理したか否かを判断し(ステップS404)、すべての対訳文の用例を処理していない場合は(ステップS404:NO)、次の対訳文の用例を選択して処理を繰り返す(ステップS401)。
すべての対訳文の用例を処理した場合は(ステップS404:YES)、選択肢生成処理を終了する。
次に、曖昧性検出部103および選択肢生成部104が実行する曖昧性検出処理(ステップS305)および選択肢生成処理(ステップS307)の具体例について説明する。図5は、曖昧性検出処理および選択肢生成処理で参照される原言語文の用例と対訳文の用例との関係の一例を示す説明図である。
図5(a)は、原言語文の用例j0に対して、e1とe2とe3の3つの目的言語の用例が対応つけられている例を示している。このように、検索された原言語文の用例に対応する目的言語の用例が複数存在する場合、j0は訳が曖昧であることを意味する。すなわち、曖昧性検出部103は、原言語文の用例から対応付けられている目的言語の用例が一つだけなのか、複数であるのかを判定することにより、原言語に対する対訳文の曖昧性を検出することができる(ステップS305)。
図5(b)は、原言語文の用例j0に対して、目的言語の用例としてe1とe2とe3の3つの用例が対応付けられており、目的言語の用例e1、e2、e3からは逆向きに原言語文の4つの用例j0、j1、j2、j3に対応付けられている例を示している。
選択肢生成部104は、図5(b)に示す対訳関係を分析することにより選択肢を生成する。具体的には、対象となる目的言語の用例から対応付けられている各原言語文の用例から、その原言語文の用例から対応付けられている目的言語の用例数が最少のものを抽出し、抽出した原言語文の用例を選択肢として生成する。
例えば、図5(b)に示すように、原言語文の用例j0に対して、e1とe2とe3の3つの目的言語の用例候補が存在するが、目的言語の用例e1に対して、j0とj1が対応付けられている。そして、j0にはe1とe2とe3という3つの目的言語の用例が対応付けられ、j1にはe1とe2という2つの目的言語の用例が対応付けられている。この場合、j1が最も曖昧性が少ないので、j1が抽出される(ステップS402)。
また、目的言語の用例e2に対して、j0とj1とj2が対応付けられている。そして、j0にはe1とe2とe3という3つの目的言語の用例が対応付けられ、j1にはe1とe2という2つの目的言語の用例が対応付けられ、j2には1つの目的言語の用例e2のみが対応付けられている。この場合、対応関係はj2が最も曖昧性が少ないので、j2が抽出される(ステップS402)。
さらに、目的言語の用例e3に対して、j0とj3が対応付けられている。そして、j0にはe1とe2とe3という3つの目的言語の用例が対応付けられ、j3には1つの目的言語の用例e3のみが対応付けられている。この場合、j3が最も曖昧性が少ないので、j3が抽出される(ステップS402)。以上により、j1とj2とj3が、選択肢として生成される(ステップS403)。
次に、入力文や生成された選択肢を表示する表示画面について説明する。図6は、表示画面の内容の一例を示す模式図である。同図(a)は、入力文と用例の選択肢が表示された状態の表示画面の例が、同図(b)は、選択した用例に対する翻訳結果が表示された状態の表示画面の例が示されている。
同図(a)に示すように、表示画面の下部には利用者が入力した入力文が、表示画面の上部には選択肢生成部104が生成した用例の選択肢が表示されている。同図は、原言語文として、英語で「No,Thank you.」を意味する日本語601(「結構です。」)が入力された場合の例を示している。
ここでは、図2に示すような対訳コーパスが対訳用例記憶部111に記憶されていることを前提とする。この場合、上述のような処理により、選択肢として日本語602(「いいえ、結構です。」)と日本語603(「それで大丈夫です。」)の2つが提示される(ステップS309)。
原言語文を入力した利用者は、ペン、マウス、キーボード等の入力デバイスにより、提示された選択肢から、発話意図に合致する用例を選択することができる。同図では、利用者が日本語602をペンにより選択した様子が示されている。
入力受付部101は、入力デバイスを介して利用者からの選択入力を受付けた後(ステップS310)、同図(b)に示すように、日本語602(「いいえ、結構です。」)に対応する目的言語の用例である「No, thank you.」をディスプレイに出力する(ステップS311)。
次に、表示画面の別の構成例について説明する。図7は、表示画面の内容の別の例を示す模式図である。
対訳用例記憶部111に記憶されている情報によっては、曖昧性が最も少ない用例であっても、複数の目的言語の用例に対応づけられた用例が選択肢として生成される場合がある。このような場合、その原言語文の用例に対応づけられた訳文は曖昧性を有しているので、そのまま用例の選択肢として提示することには問題がある。
そこで、選択肢を提示する際に、選択肢生成部104で抽出された選択肢としての用例と、当該用例の訳文に曖昧性が有るか否かの情報を対応付けて表示するように構成してもよい。
図7では、対応する訳文に曖昧性が存在する原言語文の用例に下線を引くことにより、曖昧性のない用例と区別できるようにした例が示されている。なお、表示方法はこれに限られるものではなく、対訳文の用例が複数存在することを示す情報を関連づけて出力するものであればあらゆる表示方法を適用することができる。
例えば、下線以外の記号で該当する用例が識別できるように構成してもよいし、該当する用例の文字色や背景色を変更して表示するように構成してもよい。また、対応する訳文に曖昧性が存在する用例とそうでない用例とを別々にグループ化して、分離した表示欄に表示するように構成してもよい。
なお、上述の例では、ディスプレイと入力デバイスを有する携帯端末に本発明を適用したが、携帯電話またはデスクトップ端末などの他の形態の機器に対して本発明を適用することも可能である。
このように、第1の実施の形態にかかる用例翻訳装置では、入力された原言語文に対する対訳文の用例が複数存在する場合に、当該対訳文の用例に対応づけられた原言語文の用例のうち、曖昧性の少ない用例を選択肢として利用者に提示することができる。利用者は、入力文と意味が類似した用例の選択肢から発話意図に沿った用例を確認し、選択することができるため、適切な用例を容易に判断できるようになる。これにより、利用者の発話意図と異なる訳文が出力される可能性を低減することが可能となる。
(第2の実施の形態)
第2の実施の形態にかかる用例翻訳装置は、同じ意味内容を有する対訳文の用例が複数存在する場合に、同じ意味内容を有する対訳文の用例をまとめて1つの用例群として記憶し、当該用例群を1つの用例とみなして処理を行うものである。
第2の実施の形態では、対訳用例記憶部の構成が第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる用例翻訳装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。
第2の実施の形態における対訳用例記憶部111は、第1の実施の形態と同様に対訳コーパスを記憶するものである。対訳用例記憶部111は、原言語文の用例に対する対訳文の用例のうち、同じ意味内容を有する対訳文の用例が複数存在する場合に、当該複数の対訳文の用例をまとめて1つの用例群として記憶する点が第1の実施の形態と異なっている。
図8は、対訳用例記憶部111に格納される対訳コーパスのデータ構造の一例を模式的に示した説明図である。同図に示すように、日本語用例801に対応する対訳文の用例として同じ意味内容を有する2つの英語用例(「I Understand.」、「I see.」)が存在するが、英語用例802のように2つの英語用例を記号「:」で区切ってまとめて記憶している。
すなわち、第1の実施の形態のように同じ意味内容を有する英語用例であっても、別々の用例として独立の直線で対応づけて格納するのではなく、グループ化して1つの直線で対応づけて格納している。
このように同じ意味内容を有する用例をまとめて扱うことにより、不要な処理を行う不都合を回避することができる。例えば、第1の実施の形態では、同じ意味内容を有する用例であっても別々に対応づけて格納していたため、上述のステップS305で、対応する原言語文の用例は曖昧性を有するものと判断され、選択肢生成処理が実行される(ステップS307)。
一方、第2の実施の形態のように同じ意味内容を有する用例をまとめた用例群を他の用例と同様に扱うことにより、ステップS305では対応する原言語文の用例は曖昧性を有するものと判断されず、選択肢生成処理の実行を回避することができる。
このように用例群を1つの用例として扱うこと以外、第2の実施の形態にかかる用例翻訳装置による用例翻訳処理の全体の流れは、第1の実施の形態における用例翻訳処理の全体の流れを示すフローチャートである図3と同様であるので、その説明を省略する。
なお、利用者により上述のような用例群に対応する原言語文の用例が選択された場合は(ステップS310)、出力制御部105は、用例群の中から任意の1の用例を訳文として出力する(ステップS311)。
このように、第2の実施の形態にかかる用例翻訳装置では、同じ意味内容を有する対訳文の用例をまとめて1つの用例群として記憶し、当該用例群を1つの用例とみなして処理を行うため、曖昧性の検出処理および選択肢生成処理における不要な処理を排除することができる。
(第3の実施の形態)
用例ベース機械翻訳では、対訳コーパスのデータ量が膨大になる可能性がある。このため、特に記憶デバイスの容量が制限される携帯型の端末では、端末の内部に対訳コーパスを記憶するのではなく、通信デバイスを介して外部のサーバで管理されている用例を取得する構成が望ましい場合がある。
第3の実施の形態にかかる用例翻訳装置は、入力された原言語文に対応する用例を、通信部を介して対訳コーパスを管理する用例管理サーバから検索するものである。
図9は、第3の実施の形態にかかる用例翻訳装置900の構成を示すブロック図である。同図に示すように、用例翻訳装置900は、通信部912と、入力受付部101と、用例検索部102と、曖昧性検出部103と、選択肢生成部104と、出力制御部105とを備えている。また、用例翻訳装置900は、インターネット等のネットワークを介して、用例管理サーバ950と接続されている。
第3の実施の形態では、通信部912を追加したこと、および対訳用例記憶部111を削除したことが第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる用例翻訳装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。
用例管理サーバ950は、通信部941と、対訳用例記憶部951とを備えている。通信部941は、用例翻訳装置900からの用例の検索要求を受付け、検索結果である用例を用例翻訳装置900に返信する処理を制御するものである。
対訳用例記憶部951は、第1の実施の形態と同様に、対訳コーパスを記憶するものであり、その構造は第1の実施の形態における対訳用例記憶部111と同様であるのでその説明を省略する。
用例翻訳装置900の通信部912は、用例管理サーバ950に対して原言語文を送信し、送信した原言語文に対して用例管理サーバ950が検索して返信した用例を受信するものである。
次に、このように構成された第3の実施の形態にかかる用例翻訳装置900による用例翻訳処理について説明する。図10は、第3の実施の形態における用例翻訳処理の全体の流れを示すフローチャートである。
ステップS1001の入力文受付処理は、第1の実施の形態にかかる用例翻訳装置100におけるステップS301と同様の処理なので、その説明を省略する。
入力文を受付けた後、用例検索部102は、通信部912を介して、入力文と一致または類似する原言語文の用例を、用例管理サーバ950から取得する(ステップS1002)。
ステップS1003からステップS1011までの曖昧性検出処理、選択肢生成処理、出力処理は、第1の実施の形態にかかる用例翻訳装置100におけるステップS303からステップS311と同様の処理なので、その説明を省略する。
次に、このように構成された第3の実施の形態にかかる用例翻訳装置900による選択肢生成処理について説明する。図11は、第3の実施の形態における選択肢生成処理の全体の流れを示すフローチャートである。
ステップS1101の未処理用例選択処理は、第1の実施の形態にかかる用例翻訳装置100におけるステップS401と同様の処理なので、その説明を省略する。
未処理の用例を選択した後、選択肢生成部104は、通信部912を介して、選択した対訳文の用例に対応する原言語文の用例のうち、目的言語への対訳関係の数が最も少ない用例を、用例管理サーバ950から取得する(ステップS1102)。
ステップS1103からステップS1104までの選択肢生成処理、終了判定処理は、第1の実施の形態にかかる用例翻訳装置100におけるステップS403からステップS404と同様の処理なので、その説明を省略する。
このように、第3の実施の形態にかかる用例翻訳装置では、入力された原言語文に対応する用例を、通信部を介して対訳コーパスを管理する用例管理サーバから検索することができる。これにより、用例の管理処理を用例管理サーバに集約することが可能となり、用例の管理処理負担を軽減することができる。
なお、第1〜第3の実施の形態にかかる用例翻訳装置で実行される用例翻訳プログラムは、ROM(Read Only Memory)等に予め組み込まれて提供される。
第1〜第3の実施の形態にかかる用例翻訳装置で実行される用例翻訳プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
さらに、第1〜第3の実施の形態にかかる用例翻訳装置で実行される用例翻訳プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、第1〜第3の実施の形態にかかる用例翻訳装置で実行される用例翻訳プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
第1〜第3の実施の形態にかかる用例翻訳装置で実行される用例翻訳プログラムは、上述した各部(入力受付部、用例検索部、曖昧性検出部、選択肢生成部、出力制御部)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(Central Processing Unit)が上記ROMから用例翻訳プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、各部が主記憶装置上に生成されるようになっている。
以上のように、本発明にかかる用例翻訳装置、用例翻訳方法および用例翻訳プログラムは、異なる言語を母語とする人同士の対話を支援する音声翻訳装置に適している。
第1の実施の形態にかかる用例翻訳装置の構成を示すブロック図である。 対訳用例記憶部に格納される対訳コーパスのデータ構造の一例を模式的に示した説明図である。 第1の実施の形態における用例翻訳処理の全体の流れを示すフローチャートである。 第1の実施の形態における選択肢生成処理の全体の流れを示すフローチャートである。 原言語文の用例と対訳文の用例との関係の一例を示す説明図である。 表示画面の内容の一例を示す模式図である。 表示画面の内容の別の例を示す模式図である。 対訳用例記憶部に格納される対訳コーパスのデータ構造の一例を模式的に示した説明図である。 第3の実施の形態にかかる用例翻訳装置の構成を示すブロック図である。 第3の実施の形態における用例翻訳処理の全体の流れを示すフローチャートである。 第3の実施の形態における選択肢生成処理の全体の流れを示すフローチャートである。
符号の説明
100 用例翻訳装置
101 入力受付部
102 用例検索部
103 曖昧性検出部
104 選択肢生成部
105 出力制御部
111 対訳用例記憶部
201 日本語
601、602、603 日本語
801 日本語用例
802 英語用例
900 用例翻訳装置
912 通信部
941 通信部
950 用例管理サーバ
951 対訳用例記憶部

Claims (18)

  1. 第1言語の用例と、前記第1言語の用例と同じ意味内容を含む第2言語の用例とを対応づけて記憶する対訳用例記憶手段と、
    第1言語の文の入力を受付ける入力受付手段と、
    前記入力受付手段が受付けた前記第1言語の文に基づいて、前記対訳用例記憶手段から前記第1言語の用例を検索する第1用例検索手段と、
    前記第1用例検索手段が検索した前記第1言語の用例に対応づけられた少なくとも1つの前記第2言語の用例を検索する第2用例検索手段と、
    前記第2用例検索手段が検索した前記第2言語の用例が複数存在するか否かを判定する判定手段と、
    前記判定手段が前記第2言語の用例が複数存在すると判定した場合に、複数の前記第2言語の用例のそれぞれについて、前記第2言語の用例に対応づけられた前記第1言語の用例を前記対訳用例記憶手段から取得する第1取得手段と、
    前記第1取得手段が取得した前記第1言語の用例に対応づけられた前記第2言語の用例を前記対訳用例記憶手段から取得する第2取得手段と、
    前記第2取得手段が取得した前記第2言語の用例の個数が最も少ない前記第1言語の用例を、出力する用例の選択肢として生成する選択肢生成手段と、
    前記選択肢生成手段が生成した前記用例の選択肢を出力する出力制御手段と、
    を備えたことを特徴とする用例翻訳装置。
  2. 前記第1用例検索手段は、前記入力受付手段が受付けた前記第1言語の文と一致する前記第1言語の用例を前記用例記憶手段から検索することを特徴とする請求項1に記載の用例翻訳装置。
  3. 前記第1用例検索手段は、前記入力受付手段が受付けた前記第1言語の文との類似度が予め定められた閾値より大きい前記第1言語の用例を前記用例記憶手段から検索することを特徴とする請求項1に記載の用例翻訳装置。
  4. 前記第2用例検索手段は、前記第1用例検索手段が検索した前記第1言語の用例が複数存在する場合に、複数の前記第1言語の用例のそれぞれについて、前記第1言語の用例に対応づけられた少なくとも1つの前記第2言語の用例を検索することを特徴とする請求項1に記載の用例翻訳装置。
  5. 前記出力制御手段は、前記選択肢生成手段が生成した前記用例の選択肢のうち、対応する前記第2言語の用例が複数存在する前記用例の選択肢に、対応する前記第2言語の用例が複数存在することを示す情報を関連づけて出力することを特徴とする請求項1に記載の用例翻訳装置。
  6. 前記出力制御手段は、前記選択肢生成手段が生成した前記用例の選択肢のうち、対応する前記第2言語の用例が複数存在する前記用例の選択肢の表記に下線を付して出力することを特徴とする請求項5に記載の用例翻訳装置。
  7. 前記出力制御手段は、前記選択肢生成手段が生成した前記用例の選択肢のうち、対応する前記第2言語の用例が複数存在する前記用例の選択肢を、対応する前記第2言語の用例が複数存在しない前記用例の選択肢と分けて出力することを特徴とする請求項5に記載の用例翻訳装置。
  8. 前記選択肢生成手段は、取得した前記第2言語の用例の個数が最も少ない前記第1言語の用例が複数存在する場合に、取得した前記第2言語の用例の個数が最も少ない前記第1言語の用例のうち、予め定められた優先度が最も大きい用例を選択肢として生成することを特徴とする請求項1に記載の用例翻訳装置。
  9. 第1言語による音声を受付け、受付けた音声を音声認識して音声認識結果を出力する音声認識手段をさらに備え、
    前記入力受付手段は、前記音声認識手段が出力した音声認識結果を前記第1言語の文として受付けることを特徴とする請求項1に記載の用例翻訳装置。
  10. 第1言語による文字情報を受付け、受付けた文字情報を文字認識して文字認識結果を出力する文字認識手段をさらに備え、
    前記入力受付手段は、前記文字認識手段が出力した文字認識結果を前記第1言語の文として受付けることを特徴とする請求項1に記載の用例翻訳装置。
  11. 前記用例の選択肢を表示する表示手段をさらに備え、
    前記出力制御手段は、前記選択肢生成手段が生成した前記用例の選択肢を前記表示手段に出力することを特徴とする請求項1に記載の用例翻訳装置。
  12. 前記出力制御手段が出力した前記用例の選択肢の中から利用者が選択した用例に対応する第2言語の文を第2言語による音声に合成する音声合成手段をさらに備え、
    前記出力制御手段は、前記音声合成手段が合成した第2言語による音声を出力することを特徴とする請求項1に記載の用例翻訳装置。
  13. 前記対訳用例記憶手段は、前記第1言語の用例のうち同じ意味内容を有する前記第1言語の用例が複数存在する場合に、同じ意味内容を有する前記第1言語の用例をまとめて1つの用例群とし、前記第1言語の用例群を前記第2言語の用例と対応づけて記憶し、前記第2言語の用例のうち同じ意味内容を有する前記第2言語の用例が複数存在する場合に、同じ意味内容を有する前記第2言語の用例をまとめて1つの用例群とし、前記第2言語の用例群を前記第1言語の用例と対応づけて記憶し、
    前記第1用例検索手段は、前記対訳用例記憶手段から前記第1言語の用例または前記第1言語の用例群を検索し、
    前記第2用例検索手段は、前記第1用例検索手段が検索した前記第1言語の用例または前記第1言語の用例群に対応づけられた少なくとも1つの前記第2言語の用例または前記第2言語の用例群を検索し、
    前記判定手段は、前記第2用例検索手段が検索した前記第2言語の用例および前記第2言語の用例群の合計が2以上であるか否かを判定し、
    前記第1取得手段は、前記判定手段が前記第2言語または前記第2言語の用例群の個数の合計が2以上であることを検出した場合に、前記第2言語の用例または前記第2言語の用例群のそれぞれについて、前記第2言語の用例または前記第2言語の用例群に対応づけられた前記第1言語の用例または前記第1言語の用例群を前記対訳用例記憶手段から取得し、
    前記第2取得手段は、前記第1取得手段が取得した前記第1言語の用例または前記第1言語の用例群に対応づけられた前記第2言語の用例または前記第2言語の用例群を前記対訳用例記憶手段から取得し、
    前記選択肢生成手段は、前記第2取得手段が取得した前記第2言語の用例または前記第2言語の用例群の個数の合計が最も少ない前記第1言語の用例または前記第1言語の用例群を、出力する用例の選択肢として生成することを特徴とする請求項1に記載の用例翻訳装置。
  14. ネットワークを介して接続され、第1言語の用例と同じ意味内容を含む第2言語の用例とを対応づけて記憶する対訳用例記憶手段を備えた用例管理サーバに対して、第1言語の文、前記第1言語の用例、または前記第2言語の用例を送信し、前記用例管理サーバが返信した前記第1言語の用例、または前記第2言語の用例を受信する通信手段と、
    前記第1言語の文の入力を受付ける入力受付手段と、
    前記入力受付手段が受付けた前記第1言語の文に基づいて、前記第1言語の用例を、前記通信手段を介して前記用例管理サーバの前記対訳用例記憶手段から検索する第1用例検索手段と、
    前記第1用例検索手段が検索した前記第1言語の用例に対応づけられた少なくとも1つの前記第2言語の用例を、前記通信手段を介して前記用例管理サーバの前記対訳用例記憶手段から検索する第2用例検索手段と、
    前記第2用例検索手段が検索した前記第2言語の用例が複数存在するか否かを判定する判定手段と、
    前記判定手段が前記第2言語の用例が複数存在すると判定した場合に、複数の前記第2言語の用例のそれぞれについて、前記第2言語の用例に対応づけられた前記第1言語の用例を、前記通信手段を介して前記対訳用例記憶手段から取得する第1取得手段と、
    前記第1取得手段が取得した前記第1言語の用例に対応づけられた前記第2言語の用例を、前記通信手段を介して前記対訳用例記憶手段から取得する第2取得手段と、
    前記第2取得手段が取得した前記第2言語の用例の個数が最も少ない前記第1言語の用例を、出力する用例の選択肢として生成する選択肢生成手段と、
    前記選択肢生成手段が生成した前記用例の選択肢を出力する出力制御手段と、
    を備えたことを特徴とする用例翻訳装置。
  15. 用例翻訳装置で実行される用例翻訳方法であって、
    入力受付手段が、第1言語の文の入力を受付ける入力受付ステップと、
    第1用例検索手段が、前記入力受付ステップが受付けた前記第1言語の文に基づいて、第1言語の用例と、前記第1言語の用例と同じ意味内容を含む第2言語の用例とを対応づけて記憶する対訳用例記憶手段から前記第1言語の用例を検索する第1用例検索ステップと、
    第2用例検索手段が、前記第1用例検索ステップが検索した前記第1言語の用例に対応づけられた少なくとも1つの前記第2言語の用例を検索する第2用例検索ステップと、
    判定手段が、前記第2用例検索ステップが検索した前記第2言語の用例が複数存在するか否かを判定する判定ステップと、
    第1取得手段が、前記判定ステップが前記第2言語の用例が複数存在すると判定した場合に、複数の前記第2言語の用例のそれぞれについて、前記第2言語の用例に対応づけられた前記第1言語の用例を前記対訳用例記憶手段から取得する第1取得ステップと、
    第2取得手段が、前記第1取得ステップが取得した前記第1言語の用例に対応づけられた前記第2言語の用例を前記対訳用例記憶手段から取得する第2取得ステップと、
    選択肢生成手段が、前記第2取得ステップが取得した前記第2言語の用例の個数が最も少ない前記第1言語の用例を、出力する用例の選択肢として生成する選択肢生成ステップと、
    出力制御手段が、前記選択肢生成ステップが生成した前記用例の選択肢を出力する出力制御ステップと、
    を備えたことを特徴とする用例翻訳方法。
  16. 用例翻訳装置で実行される用例翻訳方法であって、
    入力受付手段が、第1言語の文の入力を受付ける入力受付ステップと、
    第1用例検索手段が、前記入力受付ステップが受付けた前記第1言語の文に基づいて、第1言語の用例を、ネットワークを介して接続され、前記第1言語の用例と同じ意味内容を含む第2言語の用例とを対応づけて記憶する対訳用例記憶手段を備えた用例管理サーバに対して、前記第1言語の文、前記第1言語の用例、または前記第2言語の用例を送信し、前記用例管理サーバが返信した前記第1言語の用例、または前記第2言語の用例を受信する通信手段を介して前記用例管理サーバの前記対訳用例記憶手段から検索する第1用例検索ステップと、
    第2用例検索手段が、前記第1用例検索ステップが検索した前記第1言語の用例に対応づけられた少なくとも1つの前記第2言語の用例を、前記通信手段を介して前記用例管理サーバの前記対訳用例記憶手段から検索する第2用例検索ステップと、
    判定手段が、前記第2用例検索ステップが検索した前記第2言語の用例が複数存在するか否かを判定する判定ステップと、
    第1取得手段が、前記判定ステップが前記第2言語の用例が複数存在すると判定した場合に、複数の前記第2言語の用例のそれぞれについて、前記第2言語の用例に対応づけられた前記第1言語の用例を、前記通信手段を介して前記対訳用例記憶手段から取得する第1取得ステップと、
    第2取得手段が、前記第1取得ステップが取得した前記第1言語の用例に対応づけられた前記第2言語の用例を、前記通信手段を介して前記対訳用例記憶手段から取得する第2取得ステップと、
    選択肢生成手段が、前記第2取得ステップが取得した前記第2言語の用例の個数が最も少ない前記第1言語の用例を、出力する用例の選択肢として生成する選択肢生成ステップと、
    出力制御手段が、前記選択肢生成ステップが生成した前記用例の選択肢を出力する出力制御ステップと、
    を備えたことを特徴とする用例翻訳方法。
  17. コンピュータを、
    第1言語の文の入力を受付ける入力受付手段と、
    前記入力受付手段が受付けた前記第1言語の文に基づいて、第1言語の用例と、前記第1言語の用例と同じ意味内容を含む第2言語の用例とを対応づけて記憶する対訳用例記憶手段から前記第1言語の用例を検索する第1用例検索手段と、
    前記第1用例検索手段が検索した前記第1言語の用例に対応づけられた少なくとも1つの前記第2言語の用例を検索する第2用例検索手段と、
    前記第2用例検索手段が検索した前記第2言語の用例が複数存在するか否かを判定する判定手段と、
    前記判定手段が前記第2言語の用例が複数存在すると判定した場合に、複数の前記第2言語の用例のそれぞれについて、前記第2言語の用例に対応づけられた前記第1言語の用例を前記対訳用例記憶手段から取得する第1取得手段と、
    前記第1取得手段が取得した前記第1言語の用例に対応づけられた前記第2言語の用例を前記対訳用例記憶手段から取得する第2取得手段と、
    前記第2取得手段が取得した前記第2言語の用例の個数が最も少ない前記第1言語の用例を、出力する用例の選択肢として生成する選択肢生成手段と、
    前記選択肢生成手段が生成した前記用例の選択肢を出力する出力制御手段と、
    として機能させるための用例翻訳プログラム。
  18. コンピュータを、
    第1言語の文の入力を受付ける入力受付手段と、
    前記入力受付手段が受付けた前記第1言語の文に基づいて、第1言語の用例を、ネットワークを介して接続され、前記第1言語の用例と同じ意味内容を含む第2言語の用例とを対応づけて記憶する対訳用例記憶手段を備えた用例管理サーバに対して、前記第1言語の文、前記第1言語の用例、または前記第2言語の用例を送信し、前記用例管理サーバが返信した前記第1言語の用例、または前記第2言語の用例を受信する通信手段を介して前記用例管理サーバの前記対訳用例記憶手段から検索する第1用例検索手段と、
    前記第1用例検索手段が検索した前記第1言語の用例に対応づけられた少なくとも1つの前記第2言語の用例を、前記通信手段を介して前記用例管理サーバの前記対訳用例記憶手段から検索する第2用例検索手段と、
    前記第2用例検索手段が検索した前記第2言語の用例が複数存在するか否かを判定する判定手段と、
    前記判定手段が前記第2言語の用例が複数存在すると判定した場合に、複数の前記第2言語の用例のそれぞれについて、前記第2言語の用例に対応づけられた前記第1言語の用例を、前記通信手段を介して前記対訳用例記憶手段から取得する第1取得手段と、
    前記第1取得手段が取得した前記第1言語の用例に対応づけられた前記第2言語の用例を、前記通信手段を介して前記対訳用例記憶手段から取得する第2取得手段と、
    前記第2取得手段が取得した前記第2言語の用例の個数が最も少ない前記第1言語の用例を、出力する用例の選択肢として生成する選択肢生成手段と、
    前記選択肢生成手段が生成した前記用例の選択肢を出力する出力制御手段と、
    として機能させるための用例翻訳プログラム。
JP2005336931A 2005-11-22 2005-11-22 用例翻訳装置、用例翻訳方法および用例翻訳プログラム Expired - Fee Related JP4058071B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005336931A JP4058071B2 (ja) 2005-11-22 2005-11-22 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
US11/519,811 US8185372B2 (en) 2005-11-22 2006-09-13 Apparatus, method and computer program product for translating speech input using example
CNA2006101486703A CN1971554A (zh) 2005-11-22 2006-11-22 使用样例来翻译语音输入的设备和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005336931A JP4058071B2 (ja) 2005-11-22 2005-11-22 用例翻訳装置、用例翻訳方法および用例翻訳プログラム

Publications (2)

Publication Number Publication Date
JP2007141133A JP2007141133A (ja) 2007-06-07
JP4058071B2 true JP4058071B2 (ja) 2008-03-05

Family

ID=38054599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005336931A Expired - Fee Related JP4058071B2 (ja) 2005-11-22 2005-11-22 用例翻訳装置、用例翻訳方法および用例翻訳プログラム

Country Status (3)

Country Link
US (1) US8185372B2 (ja)
JP (1) JP4058071B2 (ja)
CN (1) CN1971554A (ja)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4050755B2 (ja) * 2005-03-30 2008-02-20 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
JP4058071B2 (ja) * 2005-11-22 2008-03-05 株式会社東芝 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP4398966B2 (ja) * 2006-09-26 2010-01-13 株式会社東芝 機械翻訳を行う装置、システム、方法およびプログラム
CA2675208A1 (en) * 2007-01-10 2008-07-17 National Research Council Of Canada Means and method for automatic post-editing of translations
JP4791984B2 (ja) * 2007-02-27 2011-10-12 株式会社東芝 入力された音声を処理する装置、方法およびプログラム
JP2008305167A (ja) * 2007-06-07 2008-12-18 Toshiba Corp 原言語文を目的言語文に機械翻訳する装置、方法およびプログラム
US8365071B2 (en) * 2007-08-31 2013-01-29 Research In Motion Limited Handheld electronic device and associated method enabling phonetic text input in a text disambiguation environment and outputting an improved lookup window
US8413049B2 (en) * 2007-08-31 2013-04-02 Research In Motion Limited Handheld electronic device and associated method enabling the generation of a proposed character interpretation of a phonetic text input in a text disambiguation environment
JP5100445B2 (ja) * 2008-02-28 2012-12-19 株式会社東芝 機械翻訳する装置および方法
JP5112116B2 (ja) * 2008-03-07 2013-01-09 株式会社東芝 機械翻訳する装置、方法およびプログラム
US8615388B2 (en) * 2008-03-28 2013-12-24 Microsoft Corporation Intra-language statistical machine translation
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
JP2010176543A (ja) * 2009-01-30 2010-08-12 Toshiba Corp 翻訳装置、方法、及びプログラム
US9200512B2 (en) * 2009-04-15 2015-12-01 Schlumberger Technology Corporation Formation fluid evaluation
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20120215520A1 (en) * 2011-02-23 2012-08-23 Davis Janel R Translation System
US9257115B2 (en) * 2012-03-08 2016-02-09 Facebook, Inc. Device for extracting information from a dialog
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN105190607B (zh) * 2013-03-15 2018-11-30 苹果公司 通过智能数字助理的用户培训
US9195654B2 (en) * 2013-03-15 2015-11-24 Google Inc. Automatic invocation of a dialog user interface for translation applications
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
JP6226321B2 (ja) * 2013-10-23 2017-11-08 株式会社サン・フレア 翻訳支援システム、翻訳支援システムのサーバー、翻訳支援システムのクライアント、翻訳支援システムの制御方法、及びそのプログラム
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9483465B2 (en) * 2015-03-06 2016-11-01 Ricoh Company, Ltd. Language translation for multi-function peripherals
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
WO2016147328A1 (ja) * 2015-03-18 2016-09-22 三菱電機株式会社 多言語翻訳装置及び多言語翻訳方法
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10191899B2 (en) * 2016-06-06 2019-01-29 Comigo Ltd. System and method for understanding text using a translation of the text
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5418716A (en) * 1990-07-26 1995-05-23 Nec Corporation System for recognizing sentence patterns and a system for recognizing sentence patterns and grammatical cases
JPH05128150A (ja) 1991-10-30 1993-05-25 Ricoh Co Ltd 機械翻訳装置
JPH0916602A (ja) * 1995-06-27 1997-01-17 Sony Corp 翻訳装置および翻訳方法
US6356865B1 (en) * 1999-01-29 2002-03-12 Sony Corporation Method and apparatus for performing spoken language translation
US6243669B1 (en) * 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6223150B1 (en) * 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6278968B1 (en) * 1999-01-29 2001-08-21 Sony Corporation Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6778949B2 (en) * 1999-10-18 2004-08-17 Sony Corporation Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
US6928448B1 (en) * 1999-10-18 2005-08-09 Sony Corporation System and method to match linguistic structures using thesaurus information
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
EP1349079A1 (en) * 2002-03-28 2003-10-01 BRITISH TELECOMMUNICATIONS public limited company Machine translation
US7536293B2 (en) * 2003-02-24 2009-05-19 Microsoft Corporation Methods and systems for language translation
JP4076520B2 (ja) * 2004-05-26 2008-04-16 富士通株式会社 翻訳支援プログラムおよび単語対応付けプログラム
JP2006099296A (ja) * 2004-09-29 2006-04-13 Nec Corp 翻訳システム、翻訳通信システム、機械翻訳方法、および、プログラム
US7577562B2 (en) * 2004-11-04 2009-08-18 Microsoft Corporation Extracting treelet translation pairs
JP4058071B2 (ja) * 2005-11-22 2008-03-05 株式会社東芝 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
JP2007220045A (ja) * 2006-02-20 2007-08-30 Toshiba Corp コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US20080077262A1 (en) * 2006-09-08 2008-03-27 Apple Computer, Inc Distortion free stitching of digital media files

Also Published As

Publication number Publication date
JP2007141133A (ja) 2007-06-07
CN1971554A (zh) 2007-05-30
US8185372B2 (en) 2012-05-22
US20070118351A1 (en) 2007-05-24

Similar Documents

Publication Publication Date Title
JP4058071B2 (ja) 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
JP4050755B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US8924195B2 (en) Apparatus and method for machine translation
JP5121252B2 (ja) 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
JP4559946B2 (ja) 入力装置、入力方法および入力プログラム
JP5319655B2 (ja) 情報処理装置、情報処理方法、プログラム、およびプログラムを記録したコンピュータ読取り可能な記録媒体
JP5235344B2 (ja) 機械翻訳を行う装置、方法およびプログラム
JP2007004730A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
JP4740837B2 (ja) 音声認識における統計的言語モデリング方法、システム及び記録媒体
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
CN108986820B (zh) 用于语音翻译的方法、装置、电子设备和存储介质
JP5323652B2 (ja) 類似語決定方法およびシステム
JP5208795B2 (ja) 通訳装置、方法、及びプログラム
JP5300576B2 (ja) 検索装置、検索方法、および検索プログラム
JP2007206796A (ja) 文字処理装置、方法、プログラムおよび記録媒体
JP2022123566A (ja) 言語処理システム、言語処理方法および言語処理プログラム
JP2006024114A (ja) 機械翻訳装置および機械翻訳コンピュータプログラム
JP7483085B1 (ja) 情報処理システム、情報処理装置、情報処理方法、およびプログラム
KR20180054236A (ko) 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템 및 그 방법
US20240037129A1 (en) Search device, search method, and recording medium
JP2010039864A (ja) 形態素解析装置、形態素解析方法及びコンピュータプログラム
US20130080144A1 (en) Machine translation apparatus, a method and a non-transitory computer readable medium thereof
JP2006098552A (ja) 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法
JP6221339B2 (ja) 翻訳装置及び翻訳方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071214

R151 Written notification of patent or utility model registration

Ref document number: 4058071

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131221

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees