JP2000242642A - 翻訳処理方法及び翻訳処理装置 - Google Patents

翻訳処理方法及び翻訳処理装置

Info

Publication number
JP2000242642A
JP2000242642A JP11040282A JP4028299A JP2000242642A JP 2000242642 A JP2000242642 A JP 2000242642A JP 11040282 A JP11040282 A JP 11040282A JP 4028299 A JP4028299 A JP 4028299A JP 2000242642 A JP2000242642 A JP 2000242642A
Authority
JP
Japan
Prior art keywords
sentence
source language
information
translation
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11040282A
Other languages
English (en)
Inventor
Masato Shimakawa
真人 島川
Masanori Omote
雅則 表
Naoto Iwahashi
直人 岩橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP11040282A priority Critical patent/JP2000242642A/ja
Priority to PCT/JP2000/000907 priority patent/WO2000049523A1/ja
Publication of JP2000242642A publication Critical patent/JP2000242642A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 原言語文をその文脈やユーザの意図に沿った
高精度かつ高品質の目的言語文に翻訳する。 【解決手段】 翻訳装置10は、原言語文と目的言語文
との他に、原言語文に対する目的言語文に基づいて表現
に追加や変更をなした原言語による文であるユーザ確認
用原言語文や、このユーザ確認用原言語文の表現が用い
られる状況を説明する文である状況説明文や、同じくそ
の表現が用いられる状況に関連する画像及び音声である
状況説明画像及び状況説明音声や、原言語文に対する翻
訳結果の候補に適用する適用制約といった原言語文と目
的言語文とに関連する情報が記述された対訳情報を、対
訳情報データベース18に保持し、この対訳情報を用い
て、原言語文を目的言語文に翻訳する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された原言語
文を目的言語文へと翻訳する翻訳処理方法及び翻訳処理
装置に関する。
【0002】
【従来の技術】近年、入力された任意の言語文を異なる
言語文へと翻訳する翻訳システムが実用化されてきてい
る。この翻訳システムにおいては、翻訳精度と訳文品質
とを向上させることが目下重要視されているところであ
り、そのための様々な研究開発が行われている。
【0003】いわゆる構文トランスファ型の翻訳システ
ムは、原文と訳文との構文上の対応関係に注目して人手
により記述された多数の規則に基づいて翻訳を行う。
【0004】しかしながら、この構文トランスファ型の
翻訳システムにおいては、構文上の部分的な対応関係を
詳細に記述することが、必ずしも原文全体の翻訳精度の
向上につながるわけではない。また、構文トランスファ
型の翻訳システムにおいては、原文全体を考慮した構文
上の対応関係ではなく、構文上の部分的な対応関係によ
って選出された情報を用いて訳文全体の生成を行うた
め、自然な訳文を得ることが困難である。
【0005】また、いわゆる知識ベース翻訳システム
は、原文を翻訳する際に原文の意味を明示的に表現し、
比較的限定された範囲の対象分野の知識を効率よく概念
体系化した上で、この概念体系を用いた推論を行って翻
訳する。この知識ベース翻訳システムは、概念体系を用
いた推論を行うことによって、解析・生成時にともなう
曖昧性を解消し、高品質な翻訳を実現する。
【0006】しかしながら、知識ベース翻訳システムに
おいては、その規模の拡大にともない概念体系の一貫性
を保持することが困難となる。また、知識ベース翻訳シ
ステムにおいては、原文の意味を明示的に記述するため
に、膨大な時間や労力を要するといった問題もある。
【0007】さらに、いわゆる用例ベース翻訳システム
は、大量のコーパスを収集して利用することによって、
翻訳精度の向上を可能にしたものであり、他の翻訳方式
に比べて自然な訳文の生成が可能であるとされている。
【0008】しかしながら、この用例ベース翻訳システ
ムにおいては、一般に、用例との類似性を判定するため
にシソーラスを用いて概念空間における距離判定を行っ
たり、構文解析を行った上での構文構造の類似性判定を
行うといったように、判定基準が翻訳システム全体で一
意である。そのため、用例ベース翻訳システムにおいて
は、コーパスの数が十分でない場合に、その翻訳精度が
著しく低下する。したがって、用例ベース翻訳システム
においては、複合語の解析といった特定の用途を除いて
は、コーパスの整備に膨大な時間や労力を必要とし、実
用的なシステムを構築するのに足るものではない。
【0009】さらにまた、例えば特開平5−29008
2号公報や特開平10−11447号公報等に記載のよ
うに、対訳用例を抽象化した翻訳知識をパターンとして
記述し、入力した原文がこれらのパターンの組み合わせ
として構成できない場合には、より制約の弱いパターン
の集合を利用して翻訳を行ったり、上述した構文トラン
スファ型の翻訳を行う技術が存在する。このようにする
ことによって、この方法は、翻訳システム全体としての
メインテナンス性を保持した上で、特定の表現について
のみ自然な翻訳を可能とする。
【0010】しかしながら、この方法においては、パタ
ーンの組み合わせとして原文が構成できない場合には、
その翻訳精度が低下するという問題がある。その上、原
文が文脈やユーザの意図により複数の意味での解釈が可
能な場合があることから、この方法においては、パター
ンの組み合わせと適合する場合でも、必ずしもユーザの
意図した内容と合致する訳文が得られるとは限らない。
【0011】このような従来の翻訳システムは、入力さ
れた原文をいかなる場合においても完全に自動的に翻訳
して出力することを前提としている。そのため、従来の
翻訳システムに付随する上述した問題点は、この前提条
件のもとで、いかに翻訳精度や訳文品質を向上させるか
という観点から研究開発が行われていることに起因する
ものである。
【0012】
【発明が解決しようとする課題】ところで、従来の翻訳
システムは、言語データの整備等によって、その翻訳精
度が徐々に向上しつつあるものの、例えば訳文の言語で
ある目的言語の知識を全く持ち合わせていないユーザが
安心して利用できるものではなく、訳文品質も実用に耐
え得るような高精度のものではなかった。
【0013】本発明は、このような実情に鑑みてなされ
たものであり、入力された原文をいかなる場合において
も完全に自動的に翻訳して出力することを前提としてい
た従来の翻訳システムにおける問題点を解決して、従来
では不可能とされたユーザの意図に沿った高精度かつ高
品質の翻訳結果を得る翻訳処理方法及び翻訳処理装置を
提供することを目的とするものである。
【0014】
【課題を解決するための手段】上述した目的を達成する
本発明にかかる翻訳処理方法は、入力された任意の原言
語による文又は文の一部と、この原言語とは異なる任意
の目的言語による文又は文の一部とを対応付けた対訳情
報に基づき、原言語による文又は文の一部と、対訳情報
の組み合わせによって構成される文との一致性或いは類
似性を判定し、原言語による文又は文の一部を目的言語
による文又は文の一部に翻訳して出力する翻訳処理方法
であって、対訳情報には、原言語による文又は文の一部
と、この文又は文の一部の対訳である目的言語による文
又は文の一部と、原言語による文又は文の一部及び目的
言語による文又は文の一部に関連する関連情報とが記述
されていることを特徴としている。
【0015】このような本発明にかかる翻訳処理方法
は、原言語による文又は文の一部と、目的言語による文
又は文の一部との他に、これらの原言語による文又は文
の一部及び目的言語による文又は文の一部に関連する関
連情報とが記述された対訳情報を用いて、原言語による
文又は文の一部を、目的言語による文又は文の一部に翻
訳する。
【0016】また、上述した目的を達成する本発明にか
かる翻訳処理装置は、任意の原言語による文又は文の一
部を入力する入力手段と、原言語による文又は文の一部
と、この文又は文の一部の対訳である原言語とは異なる
任意の目的言語による文又は文の一部とが対応付けられ
て記述されるとともに、原言語による文又は文の一部及
び目的言語による文又は文の一部に関連する関連情報が
記述された対訳情報を記憶する記憶手段と、対訳情報に
基づき、原言語による文又は文の一部と、対訳情報の組
み合わせによって構成される文との一致性或いは類似性
を判定することによって、原言語による文又は文の一部
を解析して翻訳結果の候補を生成する解析手段と、原言
語による文又は文の一部の対訳である目的言語による文
又は文の一部を生成する目的言語文生成手段と、目的言
語文生成手段により生成された目的言語による文又は文
の一部を出力する出力手段とを備えることを特徴として
いる。
【0017】このように構成された本発明にかかる翻訳
処理装置は、原言語による文又は文の一部と、目的言語
による文又は文の一部との他に、これらの原言語による
文又は文の一部及び目的言語による文又は文の一部に関
連する関連情報とが記述された対訳情報を記憶手段に記
憶し、この対訳情報を用いて、原言語による文又は文の
一部を、目的言語による文又は文の一部に翻訳する。
【0018】
【発明の実施の形態】以下、本発明を適用した具体的な
実施の形態について図面を参照しながら詳細に説明す
る。
【0019】本発明を適用した実施の形態として図1に
示す翻訳装置10は、原言語文に対応する訳文である目
的言語文の品質を確保するために、いわゆる用例ベース
翻訳、パターンベース翻訳、テンプレートベース翻訳等
と称される翻訳方法と同様に、原言語文又はその一部
と、対応する目的言語文又はその一部との組みを翻訳処
理における基本情報(対訳情報)の一部とし、さらにこ
の対訳情報に原言語分に関連する情報を記述して、この
対訳情報の組み合わせによって構成される文との一致性
判定若しくは類似性判定を行うことで翻訳処理を行うも
のである。
【0020】なお、翻訳装置10は、原言語による文章
のみではなく、任意のフレーズや単語といった文章を構
成する単位をも翻訳可能とするものである。したがっ
て、以下の説明では、これらの翻訳対象となる文章、フ
レーズ、単語等を文と総称して用いるものとする。すな
わち、原言語文とは、原言語による文章、フレーズ、単
語等を示し、目的言語文とは、目的言語による文章、フ
レーズ、単語等を示すものである。
【0021】翻訳装置10は、図1に示すように、例え
ば音声や文字等による原言語文を入力して解析可能なデ
ータへと変換する入力手段である文入力部11と、後述
する対訳情報データベース18の中の対訳情報の組み合
わせによって構成される文と原言語文との一致性判定或
いは類似性判定を行う解析手段である文解析部12と、
原言語文に対する翻訳結果の候補が対訳情報に付与され
た適用制約を満たすか否かを判定する適用制約判定手段
である適用制約判定部13と、ユーザに提示する確認用
情報を生成するユーザ確認用情報生成部14と、このユ
ーザ確認用情報生成部14により生成された確認用情報
をユーザに提示するユーザ確認部15と、目的言語文を
生成する目的言語文生成手段である目的言語文生成部1
6と、この目的言語文生成部16により生成された目的
言語文を例えば音声や文字等により出力する出力手段で
ある翻訳結果出力部17と、各種対訳情報を保持する記
憶手段である対訳情報データベース18とを備える。
【0022】このような翻訳装置10は、まず文入力部
11によって、入力された原言語文に対して例えばデジ
タル化等の処理を施す。そして、翻訳装置10は、文解
析部12に対して処理が施された原言語文を入力し、こ
の文解析部12によって、入力した原言語文と対訳情報
データベース18の中の対訳情報の組み合わせによって
構成される文との一致性判定或いは類似性判定を行う。
このことにより、翻訳装置10は、原言語文における文
脈やユーザの意図を問わず、原言語文の構文に近い表現
を候補として生成する。
【0023】次に、翻訳装置10は、適用制約判定部1
3によって、生成された複数の候補が、各対訳情報毎に
個別に付与された適用制約を全て満たすかの判定を、全
ての候補のそれぞれに対して行う。すなわち、翻訳装置
10は、各対訳情報の適用可能性を示す判定基準を一意
のものを用いるのではなく、各対訳情報毎に適用制約を
記述している。そして、翻訳装置10は、この判定処理
の結果、複数の候補のうち、適用制約を全て満たさない
表現が存在していることを認識した場合には、この表現
を候補から除去する。このことにより、翻訳装置10
は、膨大な数のコーパスを有さなくとも高精度の翻訳が
可能となる。
【0024】なお、翻訳装置10においては、この判定
処理を文解析部12により行うようにしてもよい。ま
た、翻訳装置10においては、用例ベース翻訳システム
と同様に、シソーラスを用いた概念空間における距離と
いった一意の適用可能性の判定基準を用いることも可能
であるが、この場合、入力された原言語文と対訳情報の
組み合わせによって構成される文との一致性判定或いは
類似性判定の精度が多少低下する。
【0025】さらに、翻訳装置10は、この時点で候補
が全く存在しないことを認識した場合には、原言語文を
翻訳不可能である旨を例えば音声や文字等によりユーザ
に通知するとともに、別の表現での原言語文の入力を再
度行うようにユーザに要求する。このように、翻訳装置
10においては、入力された原言語文がいかなるもので
あっても翻訳するのではなく、適用可能性の判定処理を
行うことで、扱うことができない原言語文を拒否するこ
とができる。
【0026】次に、翻訳装置10は、ユーザ確認用情報
生成部14によって、選出された各候補を構成するそれ
ぞれの対訳情報に付与されている情報に基づき、ユーザ
に提示する情報を生成し、ユーザ確認部15によって、
生成された情報をユーザに提示する。これに応じて、ユ
ーザは、最も文脈、意図に合致した候補を選択する。す
なわち、翻訳装置10においては、原言語文がその文脈
やユーザの意図により複数の解釈が可能であり、対応す
る目的言語文が複数生成可能である場合に、最終的な目
的言語文を決定するために行うユーザへの確認に必要と
なる情報を生成する。
【0027】ここで、この「ユーザへの確認に必要とな
る情報」とは、目的言語文に意味が合致するように表現
に追加や変更がなされた原言語による文であるユーザ確
認用原言語文や、このユーザ確認用原言語文の表現が用
いられる状況を説明する文である状況説明文や、同じく
その表現が用いられる状況に関連する画像である状況説
明画像や、同じくその表現が用いられる状況に関連する
音声である状況説明音声のことを指す。
【0028】すなわち、ユーザ確認用原言語文とは、入
力された原言語文に対する目的言語文に基づいて、その
文脈或いはユーザの意図に関する表現が追加・変更され
た原言語による文であり、目的言語文を言い換えた文を
原言語により表現した文である。また、状況説明文と
は、原言語文による表現とは別に、その文脈或いはユー
ザの意図から考えられる状況を説明する文である。さら
に、状況説明画像及び状況説明音声とは、それぞれ、原
言語文による表現とは別に、その文脈或いはユーザの意
図に関連して、目的言語文が意味する内容を適切に表現
する画像及び音声である。なお、状況説明画像として
は、静止画像、動画像といった画像の種類に限定はな
い。
【0029】翻訳装置10は、ユーザ確認の際に、原言
語文に代わってユーザ確認用原言語文を用いることによ
って、より正確に文脈或いはユーザの意図を反映した翻
訳結果を生成することができる。また、翻訳装置10
は、ユーザ確認の際に、状況説明文、状況説明画像或い
は状況説明音声と、原言語文との双方を用いることによ
っても、文脈或いはユーザの意図を反映した翻訳結果を
生成することができる。なお、翻訳装置10は、入力さ
れた原言語文と、この原言語文に対応する対訳情報に記
述されるべきユーザ確認用原言語文とが同一である場
合、対訳情報へのユーザ確認用原言語文の記述を省略す
る。
【0030】このように、翻訳装置10は、入力された
原言語文に対応する目的言語文が複数生成可能である場
合に、これらの候補のうち、どの候補を最終的な翻訳結
果として出力すべきかをユーザに確認を求めて選択さ
せ、それに応じて、最終的に得られる目的言語文の意味
を判断する。そのため、ユーザは、特定の文脈や意図を
持って入力した原言語文に複数の解釈が存在すること
を、入力の時点では意識することはないが、翻訳装置1
0からの翻訳結果の確認のために、上述した情報をとも
なった複数の候補が提示されることで、その中から適切
なものを選択することができる。その結果、翻訳装置1
0は、原言語文の文脈やユーザの意図を推論等により決
定できない場合にも、正しい翻訳結果を生成することが
でき、翻訳精度の向上を図ることができる。
【0031】そして、翻訳装置10は、ユーザによる確
認及び選択後、目的言語文生成部16によって、ユーザ
が選択した候補に関連する対訳情報に基づいて、目的言
語文を生成し、翻訳結果出力部17によって、生成した
目的言語文を例えば音声や文字等により出力して、一連
の処理を終了する。
【0032】このような一連の処理を行うことによっ
て、翻訳装置10は、入力された原言語文毎の翻訳過程
を独立に処理することができる。
【0033】また、翻訳装置10は、対訳情報の内容を
変えることで、各翻訳過程が独立ではなく、ある原言語
文に対する翻訳処理が次に入力された原言語文の翻訳処
理に影響を与えて翻訳を行うこともできる。
【0034】すなわち、ある話題についての原言語文の
次に入力された原言語文は、同じ話題に関するものであ
る可能性が高い。そこで、翻訳装置10においては、こ
の特性を利用するために、図2及び図3に示すように、
対訳情報にさらに次に入力される原言語文を限定するた
めの情報を追加する。
【0035】ここで、この「次に入力される原言語文を
限定するための情報」とは、対訳情報へのリンク情報や
分野情報及び分野限定情報等を指す。
【0036】すなわち、図2に示すリンク情報とは、次
に入力される原言語文の文解析時に対象とする対訳情報
をごく少数に限定するために設けられるものであり、次
に入力される原言語文で用いられるべき対訳情報への関
連付け情報である。翻訳装置10においては、1つの対
訳情報に複数のリンク情報を記述してもよい。なお、翻
訳装置10においては、このリンク情報を用いる場合、
対訳情報にはリンク情報の他に、いかなる原言語文の後
に入力される原言語文であっても常に利用される対訳情
報を示すための共通情報フラグが記述される。
【0037】具体的には、図2に示すように、ある対訳
情報A中のリンク情報aは、対訳情報Bに、リンク情報
bは、対訳情報Cに、リンク情報nは、対訳情報Nに、
それぞれリンクしているものとすると、入力された原言
語文を文解析した際に、対訳情報Aを用いた場合には、
翻訳装置10は、次に入力された原言語文を文解析する
際には、各リンク情報a,b,・・・,nからのリンク
先である対訳情報B,C,・・・,Nのみを用いればよ
いことになる。
【0038】一方、図3に示す分野情報及び分野限定情
報とは、次に入力される原言語文の文解析時に対象とな
る分野を限定するために設けられる情報である。分野情
報は、その対訳情報が用いられる分野を示す情報が記述
されたものである。また、分野限定情報は、その対訳情
報を用いた原言語文の翻訳に引き続いて用いられるべき
対訳情報が属する分野を示す情報が記述されたものであ
る。翻訳装置10においては、これらの情報を1つの対
訳情報に複数記述してもよい。
【0039】翻訳装置10においては、これらのリンク
情報や分野情報及び分野限定情報を用いることにより、
例えば旅行会話のように比較的典型的な会話内容を翻訳
するような場合に、2つ目の原言語文以降の翻訳の際に
生成される候補を限定することができ、ユーザに選択を
求めることによる負担を軽減することができる。
【0040】以上のような翻訳装置10を2つ組み合わ
せることによって、双方向翻訳が可能な翻訳装置を構成
することもできる。すなわち、図4に示すように、上述
した翻訳装置10と同様の構成であり、入力した言語A
を原言語として目的言語である言語Bに翻訳するような
翻訳装置10aと、同じく翻訳装置10と同様の構成で
あり、翻訳装置10aにおける原言語と目的言語とを入
れ替え、入力した言語Bを原言語として目的言語である
言語Aに翻訳するような翻訳装置10bとを組み合わせ
た双方向翻訳装置20を考える。
【0041】このような双方向翻訳装置20において
は、一方のユーザからの入力を翻訳して出力した結果に
対して、その返答となる文を他方のユーザが入力する場
合がある。そこで、双方向翻訳装置20においては、一
方の翻訳用の対訳情報に、相手が次に入力する文を限定
する情報、すなわち、他方の翻訳用の対訳情報への関連
付けのための情報を付与して、より精度のよい翻訳を実
現する。
【0042】双方向翻訳装置20は、対訳情報データベ
ース18a,18b中の各対訳情報に、例えば、双方向
翻訳における対訳情報へのリンク情報や双方向翻訳にお
ける分野情報及び分野限定情報等を記述している。
【0043】すなわち、リンク情報とは、例えば、一方
の翻訳装置10aに入力された原言語文に対する他方の
翻訳装置10bからの応答の際に用いる対訳情報をごく
少数に限定するために設けられるものである。勿論、双
方向翻訳装置20においては、1つの対訳情報に複数の
リンク情報を記述してもよい。
【0044】ここで、具体的に説明するために、一方の
翻訳装置10aにおけるある対訳情報中のリンク情報
a,b,cは、それぞれ、他方の翻訳装置10bにおい
て互いに異なる対訳情報に、それぞれリンクしているも
のとし、翻訳装置10bにおけるある対訳情報中のリン
ク情報a,b,cは、それぞれ、翻訳装置10aにおい
て互いに異なる対訳情報に、それぞれリンクしているも
のとする。そして、一方の翻訳装置10aに入力された
言語Aによる原言語文の文解析時に、対訳情報データベ
ース18a中のある対訳情報を用いた場合には、双方向
翻訳装置20は、次に翻訳装置10bに入力された言語
Bによる原言語文を文解析する際に、対訳情報データベ
ース18a中のある対訳情報中の各リンク情報a,b,
cからのリンク先である対訳情報データベース18b中
の対訳情報のみを用いればよいことになる。また、この
ときの応答として、翻訳装置10bに入力された原言語
文の文解析時に、対訳情報データベース18b中のある
対訳情報を用いた場合には、双方向翻訳装置20は、次
に翻訳装置10aに入力された原言語文を文解析する際
に、対訳情報データベース18b中のある対訳情報中の
各リンク情報a,b,cからのリンク先である対訳情報
データベース18a中の対訳情報のみを用いればよい。
【0045】一方、分野情報及び分野限定情報とは、例
えば、一方の翻訳装置10aに入力された原言語文に対
する応答として、他方の翻訳装置10bに入力される原
言語文の文解析時に対象となる分野を限定するために設
けられる情報である。双方向翻訳装置20においては、
これらの情報を各翻訳装置10a,10bにおける1つ
の対訳情報に複数記述してもよい。
【0046】双方向翻訳装置20においては、これらの
リンク情報や分野情報及び分野限定情報を用いることに
より、例えば旅行会話のように比較的典型的な会話内容
を翻訳するような場合に、各翻訳装置10a,10bに
入力された原言語文のいずれに対しても、利用する対訳
情報を限定して翻訳の際に生成される候補を限定するこ
とができ、高精度かつ高品質の翻訳が可能となる。
【0047】また、双方向翻訳装置20は、実時間性を
ともなった翻訳を行い対話を支援する対話支援型翻訳機
として用いることもできる。この場合、双方向翻訳装置
20は、図5に示すように、例えば、一方の翻訳装置1
0aに入力した原言語文に対する応答に関する予測例
を、応答文、応答画像、応答音声等の応答予測情報とし
て対訳情報に記述しておく。そして、双方向翻訳装置2
0は、翻訳結果の出力とともに、翻訳装置10a側のユ
ーザに対して翻訳装置10b側の対話相手がどのような
応答をする可能性があるかを例示する。なお、応答画像
としては、静止画像であってもよく、動画像であっても
よい。
【0048】このようにすることによって、双方向翻訳
装置20は、ユーザの対話をスムーズに行わせることが
可能となる。
【0049】以上、本発明の実施の形態を適用した翻訳
装置10及びその応用例である双方向翻訳装置20につ
いて説明したが、これらをより具体的に説明するため
に、図6に外観平面図を示すような対話支援型の音声翻
訳機30について説明する。
【0050】音声翻訳機30は、図6に示すように、ユ
ーザとこのユーザに対する対話相手とが、当該音声翻訳
機30を挟んで互いに向き合う形態で利用するものであ
る。音声翻訳機30は、ユーザと対話相手との間で共用
する部分として、翻訳結果といった対話に必要な情報を
ユーザと対話相手とのそれぞれに合わせた向きに文字や
画像等により表示する液晶部31と、対話に必要な情報
を音声により出力するスピーカ32とを備え、ユーザと
対話相手とのそれぞれに専用の部分として、各種操作の
ための方向ボタン33a,33bと、OK/CANCE
L等を選択するための選択ボタン34a,34bと、ユ
ーザと対話相手とがそれぞれ音声を入力する際に押す音
声入力ボタン35a,35bと、ユーザと対話相手とが
それぞれ音声を入力するマイク36a,36bとを備え
る。
【0051】音声翻訳機30は、図7に示すように、ユ
ーザ側において、マイク36aから音声による原言語文
を入力してデジタル化する入力手段である音声入力部4
1aと、この音声入力部41aによりデジタル化された
原言語文に対して、音響処理及び統計言語モデルに基づ
いた連続単語認識を行う音声認識手段である音声認識部
42aと、この音声認識部42aからの出力を解析する
解析手段である文解析部43aと、原言語文に対する翻
訳結果の候補が後述する対訳情報データベース49aに
保持される対訳情報に付与された適用制約を満たすか否
かを判定する適用制約判定手段である適用制約判定部4
4aと、ユーザに提示する確認用情報を生成するユーザ
確認用情報生成部45aと、このユーザ確認用情報生成
部45aにより生成された確認用情報を液晶部31やス
ピーカ32へと出力するユーザ確認部46aと、目的言
語文を生成する目的言語文生成手段である目的言語文生
成部47aと、この目的言語文生成部47aにより生成
された目的言語文を液晶部31やスピーカ32へと出力
する出力手段である翻訳結果出力部48aと、各種対訳
情報を保持する記憶手段である対訳情報データベース4
9aと、音声認識部42aからの出力に対して適用する
限定条件を保持する音声認識対象限定手段である音声認
識対象限定部50aと、入力された原言語文に対して使
用する対訳情報選択条件を保持する対訳情報選択部51
aと、応答予測情報を生成する応答予測手段である応答
予測部52aと、この応答予測部52aにより生成され
た応答予測情報を出力する応答予測提示手段である応答
予測提示部53aとを備える。
【0052】また、音声翻訳機30は、対話相手側にお
いてもユーザ側と同様に、第2の入力手段である音声入
力部41bと、音声認識部42bと、第2の解析手段で
ある文解析部43bと、適用制約判定部44bと、ユー
ザ確認用情報生成部45bと、ユーザ確認部46bと、
第2の目的言語文生成手段である目的言語文生成部47
bと、第2の出力手段である翻訳結果出力部48bと、
第2の記憶手段である対訳情報データベース49bと、
音声認識対象限定部50bと、対訳情報選択部51b
と、応答予測部52bと、応答予測提示部53bとを備
える。
【0053】このような音声翻訳機30は、図8及び図
9に示すような一連の処理を行い、ユーザと対話相手と
の間の対話を支援しながら双方向翻訳を行う。なお、こ
こでは、ユーザが発した日本語による原言語文を対話相
手が理解可能な英語による目的言語文へと翻訳する場合
について説明することにする。
【0054】まず、音声翻訳機30は、図8に示すよう
に、ステップS1において、ユーザが音声入力ボタン3
5aを押しながらマイク36aに向かって発話すること
により入力された日本語による原言語文を、音声入力部
41aによって、デジタル化する。
【0055】次に、音声翻訳機30は、音声入力部41
aによりデジタル化された原言語文に対して、ステップ
S2において、音声認識部42aにより音響処理及び統
計言語モデルに基づいた連続単語認識を行う。この連続
単語認識処理としては、一般に広く用いられているHM
Mベースの認識技術等、様々な方法を適用することがで
きる。音声翻訳機30は、この連続単語認識処理により
ワードグラフを生成する。
【0056】そして、音声翻訳機30は、ステップS3
において、生成したワードグラフにう適用する限定条件
が音声認識対象限定部50aに保持されているか否かを
判別する。この限定条件とは、音声認識の精度を向上さ
せるために、音声認識部42aが対象とすべき範囲を限
定する情報であり、ユーザが次に入力する原言語文を限
定するための情報や相手が次に入力する原言語文を限定
するための情報等を指す。この限定条件としては、例え
ば、対訳情報に記述された原言語文の分野情報等、様々
なものが考えられるが、ここでは、後述するように、先
行して入力した原言語文における処理に用いられた対訳
情報中に関連付けられた対訳情報から生成された関連す
る自立語の集合とする。
【0057】ここで、音声翻訳機30は、限定条件が音
声認識対象限定部50aに保持されていないと判別した
場合には、ステップS5へと処理を移行する。すなわ
ち、原言語文を一番最初に入力した場合には、音声認識
対象限定部50aに限定条件が保持されていないため、
音声翻訳機30は、ステップS5における処理へと移行
する。
【0058】一方、音声翻訳機30は、限定条件が音声
認識対象限定部50aに保持されていると判別した場合
には、ステップS4において、生成したワードグラフに
対して限定条件を適用し、ワードグラフのサイズを縮小
して認識語彙の限定を行う。すなわち、音声翻訳機30
は、生成したワードグラフに、上述した自立語の集合に
含まれない自立語を含むノードが含まれている場合に
は、その部分を削除することでワードグラフ全体のサイ
ズを縮小する。
【0059】さらに、音声翻訳機30は、ステップS5
において、ワードグラフのサイズが所定のサイズを越え
ているか否かを判別する。
【0060】ここで、ワードグラフのサイズが所定のサ
イズを越えていない場合には、音声翻訳機30は、ステ
ップS7における処理へと移行する。
【0061】一方、ステップS4における処理後におい
てもワードグラフのサイズが大きい場合には、音声翻訳
機30は、ステップS6において、一度いわゆるN−B
est探索によるマーク付けを行い、出現する確率が高
いものに関連するノードを残し、そのパス中に含まれな
いノードを削除することによって、ワードグラフのサイ
ズを縮小し、ワードグラフのサイズが一定の大きさを越
えないようにする。
【0062】次に、音声翻訳機30は、ステップS7乃
至ステップS9において、音声認識部42aから出力さ
れたワードグラフに対して、文解析部43aにより解析
を行うとともに、適用制約判定部44aによる適用制約
判定処理を行う。これらの処理を図10及び図11に示
す対訳情報を参照しながら詳細に説明する。
【0063】音声翻訳機30は、図10に示すような対
訳情報を対訳情報データベース49aに保持している。
なお、実際には、同図に記述されている対訳情報中の各
項目のうち、原言語文及び目的言語文以外は、必要に応
じて記述される情報であり、全ての対訳情報エントリに
対して、全ての項目が記述されているわけではないこと
を断っておく。
【0064】音声翻訳機30は、ここでは、基本的に用
例ベース翻訳システムを基準とした装置であり、原言語
文と対訳情報の組み合わせによって構成される文との類
似性判定を行うことにより翻訳を行うが、大量の用例が
なくとも正確な翻訳ができるように、一般の類似性判定
処理に対して、以下に示す2点について変更を加えて処
理を行う。
【0065】まず、音声翻訳機30は、第1点目の変更
点として、文の構造に関する類似性判定を行う。すなわ
ち、通常の用例ベース翻訳システムの場合は、構文解析
を別途行い、その結果に基づいて類似性判定を行うが、
音声翻訳機30は、例えば品詞といった個々の用例に許
容される文法上のカテゴリを対訳情報に記述することに
よって、類似性判定の誤りをなくしている。また、音声
翻訳機30は、第2点目の変更点として、単語の意味に
関する類似性判定を行う。すなわち、通常の用例ベース
翻訳システムの場合は、シソーラスを用いて概念空間に
おける単語間の距離を定義し、その距離が一定値以下で
あることを確認することにより類似性判定を行うが、音
声翻訳機30は、個々の用例に対して、許容される範囲
で最大数の単語を含む意味カテゴリを記述することによ
って、類似性判定の誤りをなくしている。
【0066】このような変更を処理に加えることによっ
て、音声翻訳機30は、各対訳情報に対して、精度を低
下させる可能性のある部分についてさらに情報を記述す
ることにより精度低下を回避することが可能となるとと
もに、文法上のカテゴリの記述を非終端記号とみなすこ
とにより一般に広く用いられている文脈自由文法規則と
して各対訳情報を扱うことを可能としている。
【0067】音声翻訳機30における対訳情報の具体例
は、図11に示すようなものである。なお、同図におい
て用いられている各項目の意味は、表1に示すとおりで
ある。
【0068】
【表1】
【0069】音声翻訳機30においては、図11に示す
ように、例えば、「:S@1」や「電車:NP::乗り
物@1」といった対訳情報で用いられている各項は、右
辺及び左辺ともに、<表記>:<文法カテゴリ>:<f
eature>:<意味カテゴリ>@<リンク番号>と
なっており、必要のない項目及びデリミタは、省略可能
である。
【0070】ここで、<文法カテゴリ>は、上述した第
1点目の変更点に対応し、<意味カテゴリ>は、第2点
目の変更点に対応している。
【0071】<リンク番号>は、それぞれの文に記述さ
れている部分が関連しているリンク情報の番号を示して
おり、それぞれの文において同じ番号が付されている場
合には、同じリンク情報に関連していることを示すもの
である。
【0072】また、<feature>は、用言及び助
動詞の活用形や、その他の各種制約の記述に用いられる
ものである。
【0073】<LINKNEXT>や<LINKRES
P>等に記述されている番号は、対訳情報番号であり、
それぞれの対訳情報の先頭の「#」で始まる行に記述さ
れているものを指し示す。すなわち、対訳情報番号は、
その対訳情報が一意であることを保証しているファイル
名である。この対訳情報番号は、このままの記述では本
来ならば対訳情報の保守を困難にする可能性があるが、
音声翻訳機30においては、別途対訳情報オーサリング
システムを用いており、これらの情報を記述する際に
は、直接人手を用いることはなく、対訳情報の保守の困
難性を回避している。
【0074】このような音声翻訳機30は、対訳情報選
択部51aに保持されている後述する対訳情報選択条件
に基づいて図8中ステップS7において選択された対訳
情報の原言語文の部分のみに基づき、文解析部43aに
よって、入力された原言語文がどの対訳情報の組み合わ
せとして構成できるかを判定する。音声翻訳機30は、
例えば、対訳情報の原言語文の部分を文脈自由文法規則
とみなして、ワードグラフを入力とするいわゆるチャー
トパーサによって解析を行う。
【0075】なお、このチャートパーサは、例えば、
“田中穂積著,「自然言語解析の基礎」,産業図書,1
989”等に解説されているように、構文解析手法とし
て一般に用いられている手法であり、ここでは、その解
説を省略する。
【0076】音声翻訳機30は、このチャートパーサに
よる解析を行うことによって、ステップS8において、
音声認識結果のワードグラフから対訳情報の組として構
成した複数の文の候補を生成する。
【0077】そして、音声翻訳機30は、生成した複数
の候補うち、同じ対訳情報の組み合わせから構成される
ものが複数存在した場合には、ステップS9において、
通常の用例ベース翻訳システムと同様に類似度計算に基
づいて、最適な候補以外を削除するとともに、対訳情報
に適用制約が記述されている場合には、適用制約判定部
44aにより適用制約判定を行い、条件を満たさない候
補を削除する。
【0078】このような処理を行うことによって、音声
翻訳機30は、原言語文に対する最適な候補を生成す
る。
【0079】具体的には、音声翻訳機30は、図11に
示した対訳情報を保持している場合、例えば、ユーザに
より「二子玉川園経由の電車はどのくらいかかるか」と
入力され、音声認識が正しく行われた場合には、文解析
部43aによって、「対訳情報120と対訳情報283
との組み合わせで時間を尋ねる文」及び「対訳情報13
0と対訳情報283との組み合わせで費用を尋ねる文」
を候補として生成する。
【0080】次に、音声翻訳機30は、図9に示すよう
に、ステップS10において、候補が存在するか否かを
判別する。
【0081】ここで、候補が存在しない場合には、音声
翻訳機30は、ステップS20へと処理を移行し、例え
ば文字や画像等を液晶部31に表示したり、音声をスピ
ーカ32から出力することによって、候補が存在しない
旨をユーザに提示し、一連の処理を終了する。
【0082】一方、候補が存在する場合には、音声翻訳
機30は、ステップS11において、生成された候補に
基づき、ユーザ確認用情報生成部45aによって、ユー
ザ確認用情報の生成を行う。すなわち、音声翻訳機30
は、各対訳情報に記述されているユーザ確認用原言語文
と、そこに記述されているリンク情報とに基づいて、ユ
ーザ確認用原言語文を生成する。音声翻訳機30におい
ては、このユーザ確認用原言語文が、各対訳情報毎に記
述されている場合と、各対訳情報毎に記述されていない
場合とがある。例えば、音声翻訳機30においては、入
力された原言語文と、この原言語文に対応する対訳情報
に記述されるべきユーザ確認用原言語文とが同一である
場合、対訳情報へのユーザ確認用原言語文の記述が省略
される。このように各対訳情報毎に記述されていない場
合には、音声翻訳機30においては、その代わりに原言
語文をそのまま用いるものとする。
【0083】具体的には、音声翻訳機30は、先に図1
1に示した対訳情報120と対訳情報283との組み合
わせから「二子多摩川園経由の電車はどのくらい時間が
かかるか」というユーザ確認用原言語文を生成し、対訳
情報130と対訳情報283との組み合わせから「二子
多摩川園経由の電車はどのくらいお金がかかるか」とい
うユーザ確認用原言語文を生成する。
【0084】また、音声翻訳機30は、ユーザ確認用情
報として、状況説明文、状況説明画像、状況説明音声を
生成することもできる。これらの状況説明文、状況説明
画像、状況説明音声は、原言語文とは独立してその対訳
情報を解説するものである。そのため、音声翻訳機30
は、これらの状況説明文、状況説明画像、状況説明音声
が原言語文に関する対訳情報に記述されている場合に
は、これらの状況説明文、状況説明画像、状況説明音声
のそれぞれを、ユーザ確認用原言語文のように1つにま
とめる処理は行わず、単純に組の情報として生成し、出
力時に順に生成するものとする。
【0085】このようにして、音声翻訳機30は、生成
されたそれぞれの候補に応じて、その候補が有する意味
に対応したユーザ確認用情報を生成する。
【0086】続いて、音声翻訳機30は、図9中ステッ
プS12において、生成したユーザ確認用情報を、ユー
ザ確認部46aを介して液晶部31に表示したり、スピ
ーカ32から出力することによって、ユーザに提示す
る。
【0087】これに応じて、音声翻訳機30において
は、ステップS13において、ユーザにより、このユー
ザ確認用情報のうち、原言語文の文脈やユーザの意図等
に沿う最も適切な候補が選択される。
【0088】具体的には、音声翻訳機30は、例えば図
12に示すように、先に図11に示した対訳情報120
と対訳情報283との組み合わせから生成した「二子多
摩川園経由の電車はどのくらい時間がかかるか」という
ユーザ確認用原言語文と、対訳情報130と対訳情報2
83との組み合わせから生成した「二子多摩川園経由の
電車はどのくらいお金がかかるか」というユーザ確認用
原言語文とを液晶部31に表示する。また、音声翻訳機
30は、例えば図13に示すように、先に図11に示し
た対訳情報457から生成したあやまる状況における
「すみません」というユーザ確認用原言語文と、対訳情
報458から生成したお礼をいう状況における「すみま
せん」というユーザ確認用原言語文とを液晶部31に表
示するとともに、それらの状況を説明する画像を液晶部
31に表示し、それらの状況を説明する音声をスピーカ
32から出力する。これらのユーザ確認用情報の出力に
応じて、音声翻訳機30においては、ユーザが、方向ボ
タン33aを操作して選択する候補を選択可能な状態と
し、選択ボタン34aを押して決定する。
【0089】このように、音声翻訳機30は、ユーザ確
認用原言語文、状況説明文、状況説明画像、状況説明音
声を用いることによって、翻訳結果の目的言語文が表す
意味を様々な角度から正しくユーザに伝えることがで
き、これらをもとにユーザが選択することによって、文
脈やユーザの意図によって解釈が曖昧とされる原言語文
についても正しく翻訳することができる。
【0090】ユーザによる選択が行われた後、音声翻訳
機30は、図9中ステップS14において、目的言語文
生成部47aにより目的言語文を生成する。また、音声
翻訳機30は、対訳情報に応答文、応答画像、応答音声
が記述されている場合には、続くステップS15におい
て、応答予測部52aによりこれらの応答文、応答画
像、応答音声も合わせて生成する。音声翻訳機30は、
対訳情報中の応答文(原言語、目的言語)についてリン
ク情報が記述されている場合には、ユーザ確認用原言語
文と同様に、各対訳情報に記述されている応答文と、そ
こに記述されているリンク情報とに基づいて、応答文を
生成する。また、音声翻訳機30は、対訳情報中の応答
文(原言語、目的言語)についてリンク情報が記述され
ていない場合には、状況説明文と同様に、応答文のよう
に1つにまとめる処理は行わず、そのままの文を組にす
ることで応答文を生成する。さらに、音声翻訳機30
は、状況説明画像及び状況説明音声と同様に、応答画像
及び応答音声をそのまま組にすることで、応答画像及び
応答音声を生成する。
【0091】具体的には、音声翻訳機30は、原言語文
である「二子玉川園経由の電車はどのくらい時間がかか
るか」に対して、「How long will the train which vi
a Futakotamagawaen take?」を目的言語文として生成
し、「二子玉川園経由の電車はどのくらいお金がかかる
か」に対して、「How much will the train which runs
via Futakotamagawaen cost?」を目的言語文として生成
する。また、音声翻訳機30は、原言語文としてお礼を
いう状況における「すみません」を翻訳した場合には、
先に図11に示した対訳情報458を参照して、その応
答として「Youare welcome」という応答文を予測して生
成するとともに、その意味である「どういたしまして」
という応答文を予測して生成する。
【0092】なお、音声翻訳機30においては、これら
の応答文、応答画像、応答音声等が、各対訳情報につい
て複数存在する可能性があるため、これらの応答予測情
報を生成する際には、各対訳情報における応答文、応答
画像、応答音声を全てを扱う必要があることはいうまで
もない。
【0093】次に、音声翻訳機30は、図9中ステップ
S16において、対訳情報選択条件の設定を行う。すな
わち、音声翻訳機30は、現在の翻訳の結果によって、
次に入力される原言語文に対して用いる対訳情報を限定
するための処理を行う。
【0094】具体的には、音声翻訳機30は、先に図1
1に示した対訳情報120のように、<LINKNEX
T>に番号が記述されているような場合には、このよう
に記述された対訳情報と、いかなる状況下においても用
いられる汎用の対訳情報とだけを用いて、次に入力され
る原言語文に対して処理を行うことができるように、関
連する対訳情報を対訳情報選択部51aに記録する。こ
のようにして、音声翻訳機30は、次に入力される原言
語文の翻訳処理時において対訳情報選択条件が設定され
た状態となり、この対訳情報選択情報に基づいて、対訳
情報の選択時の対象範囲を限定して処理を行う。音声翻
訳機30は、このような限定条件を利用して処理を正し
く行えなかった場合には、これらの限定条件を外して再
度処理を行う。このようにすることによって、音声翻訳
機30は、文脈が切り替わった場合にも柔軟に対応する
ことができる。
【0095】また同様に、音声翻訳機30は、図11に
示した対訳情報120のように、<LINKRESP>
に番号が記述されているような場合には、図9中ステッ
プS17に示すように、この<LINKRESP>に記
述された情報によって、対話相手から入力された原言語
文を翻訳する逆方向翻訳における対訳情報選択条件を設
定し、対訳情報選択部51aに記録する。
【0096】さらに、音声翻訳機30は、続くステップ
S18において、この対訳情報選択条件に基づいて、音
声認識用の限定条件を設定し、音声認識対象限定部50
aに記録する。音声翻訳機30においては、音声認識部
42aがこの対訳情報をそのまま用いることができない
ため、音声認識対象限定部50aに記録された関連する
対訳情報に含まれる自立語のリストを生成して音声認識
対象限定部50aに保持し、この自立語のリストを音声
認識用の限定条件とする。
【0097】そして、音声翻訳機30は、ステップS1
9において、生成した目的言語文と応答予測情報とを、
それぞれ、翻訳結果出力部48a及び応答予測提示部5
3aを介して出力し、一連の処理を終了する。
【0098】具体的には、音声翻訳機30は、例えば図
14及び図15に示すように、生成した目的言語文と応
答予測情報とを、文字等により液晶部31に表示した
り、音声によりスピーカ32から出力する。
【0099】音声翻訳機30は、このような一連の処理
の後、対話相手若しくはユーザにより音声入力ボタン3
5b若しくは音声入力ボタン35aを押されることによ
って、原言語文を入力し、この原言語文に対する翻訳処
理を行い、以降これらの処理を繰り返す。なお、説明を
省略したが、音声翻訳機30は、対話相手側から入力さ
れた原言語文に対する処理も上述した一連の処理と同様
の内容であることは勿論である。
【0100】以上のように、本発明の実施の形態として
示した翻訳装置10、双方向翻訳装置20、音声翻訳機
30は、それぞれ、従来では不可能とされたユーザの意
図に沿った高精度かつ高品質の翻訳結果を得ることが可
能であり、高精度の翻訳システムを実現するものであ
る。特に、音声翻訳機30は、スムーズな対話を支援可
能であり、高精度で使いやすい音声翻訳システムを実現
するものである。
【0101】なお、上述した実施の形態として示した構
成は、本発明を実現するために具現化した一例として示
したものであって、本発明は、これらの構成に限定され
るものではない。例えば、本発明は、原言語文を音声に
より入力するばかりでなく、文字により入力した場合に
も容易に適用できることはいうに及ばない。
【0102】また、上述した実施の形態としては、用例
ベース翻訳システムをもとに構成した例を中心に説明し
たが、本発明は、例えばパターンベース翻訳やテンプレ
ートベース翻訳といった翻訳方法を適用してもよいこと
は勿論である。
【0103】
【発明の効果】以上詳細に説明したように、本発明にか
かる翻訳処理方法は、入力された任意の原言語による文
又は文の一部と、この原言語とは異なる任意の目的言語
による文又は文の一部とを対応付けた対訳情報に基づ
き、原言語による文又は文の一部と、対訳情報の組み合
わせによって構成される文との一致性或いは類似性を判
定し、原言語による文又は文の一部を目的言語による文
又は文の一部に翻訳して出力する翻訳処理方法であっ
て、対訳情報には、原言語による文又は文の一部と、こ
の文又は文の一部の対訳である目的言語による文又は文
の一部と、原言語による文又は文の一部及び目的言語に
よる文又は文の一部に関連する関連情報とが記述されて
いる。
【0104】したがって、本発明にかかる翻訳処理方法
は、原言語による文又は文の一部と、目的言語による文
又は文の一部との他に、これらの原言語による文又は文
の一部及び目的言語による文又は文の一部に関連する関
連情報とが記述された対訳情報を用いることによって、
原言語による文又は文の一部と、目的言語による文又は
文の一部とだけが記述された対訳情報を用いる場合に比
べ、利便性がよく、原言語による文又は文の一部の文脈
やユーザの意図に沿った高精度かつ高品質の翻訳結果を
得ることができ、円滑な対話を支援することができる。
【0105】また、本発明にかかる翻訳処理装置は、任
意の原言語による文又は文の一部を入力する入力手段
と、原言語による文又は文の一部と、この文又は文の一
部の対訳である原言語とは異なる任意の目的言語による
文又は文の一部とが対応付けられて記述されるととも
に、原言語による文又は文の一部及び目的言語による文
又は文の一部に関連する関連情報が記述された対訳情報
を記憶する記憶手段と、対訳情報に基づき、原言語によ
る文又は文の一部と、対訳情報の組み合わせによって構
成される文との一致性或いは類似性を判定することによ
って、原言語による文又は文の一部を解析して翻訳結果
の候補を生成する解析手段と、原言語による文又は文の
一部の対訳である目的言語による文又は文の一部を生成
する目的言語文生成手段と、目的言語文生成手段により
生成された目的言語による文又は文の一部を出力する出
力手段とを備える。
【0106】したがって、本発明にかかる翻訳処理装置
は、原言語による文又は文の一部と、目的言語による文
又は文の一部との他に、これらの原言語による文又は文
の一部及び目的言語による文又は文の一部に関連する関
連情報とが記述された対訳情報を用いることによって、
原言語による文又は文の一部と、目的言語による文又は
文の一部とだけが記述された対訳情報を用いて翻訳を行
う場合よりも、ユーザの使い勝手がよく、原言語による
文又は文の一部の文脈やユーザの意図に沿った高精度か
つ高品質の翻訳結果を得ることが可能となり、対話に用
いる際にもその進行を支援して円滑な対話を実現するこ
とが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態として示す翻訳装置の構成
を説明するブロック図である。
【図2】同翻訳装置が保持する対訳情報の一例を説明す
る図であって、リンク情報が記述された対訳情報を説明
する図である。
【図3】同翻訳装置が保持する対訳情報の一例を説明す
る図であって、分野情報及び分野限定情報が記述された
対訳情報を説明する図である。
【図4】同翻訳装置を組み合わせて構成した応用例であ
る双方向翻訳装置の構成を説明するブロック図である。
【図5】同双方向翻訳装置が保持する対訳情報の一例を
説明する図であって、応答予測情報が記述された対訳情
報を説明する図である。
【図6】同双方向翻訳装置をより具体的に構成した音声
翻訳機の外観を説明する平面図である。
【図7】同音声翻訳機の構成を説明するブロック図であ
る。
【図8】同音声翻訳機における一連の処理工程を説明す
る図である。
【図9】同音声翻訳機における一連の処理工程を説明す
る図であって、図8に示した処理工程に続いて行われる
処理工程を説明する図である。
【図10】同音声翻訳機が保持する対訳情報の一例を説
明する図である。
【図11】同音声翻訳機が保持する対訳情報の具体的な
一例を説明する図である。
【図12】同音声翻訳機において生成されたユーザ確認
用情報の一例を説明する図であって、このユーザ確認用
情報を液晶部により出力したときの様子を説明する図で
ある。
【図13】同音声翻訳機において生成されたユーザ確認
用情報の別の一例を説明する図であって、このユーザ確
認用情報を液晶部及びスピーカにより出力したときの様
子を説明する図である。
【図14】同音声翻訳機において生成された目的言語文
及び応答予測情報の一例を説明する図であって、これら
の目的言語文及び応答予測情報を液晶部及びスピーカに
より出力したときの様子を説明する図である。
【図15】同音声翻訳機において生成された目的言語文
及び応答予測情報の別の一例を説明する図であって、こ
れらの目的言語文及び応答予測情報を液晶部及びスピー
カにより出力したときの様子を説明する図である。
【符号の説明】
10,10a,10b 翻訳装置、 11,11a,1
1b 文入力部、 12,12a,12b,43a,4
3b 文解析部、 13,13a,13b,44a,4
4b 適用制約判定部、 14,14a,14b,45
a,45b ユーザ確認用情報生成部、 15,15
a,15b,46a,46b ユーザ確認部、 16,
16a,16b,47a,47b 目的言語文生成部、
17,17a,17b,48a,48b 翻訳結果出
力部、 18,18a,18b,49a,49b 対訳
情報データベース、 20 双方向翻訳装置、 30
音声翻訳機、 31 液晶部、 32 スピーカ、 4
1a,41b 音声入力部、42a,42b 音声認識
部、 50a,50b 音声認識対象限定部、 51
a,51b 対訳情報選択部、 52a,52b 応答
予測部、 53a,53b 応答予測提示部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 岩橋 直人 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5B091 AA03 BA03 CA21 CB12 CB32

Claims (34)

    【特許請求の範囲】
  1. 【請求項1】 入力された任意の原言語による文又は文
    の一部と、上記原言語とは異なる任意の目的言語による
    文又は文の一部とを対応付けた対訳情報に基づき、上記
    原言語による文又は文の一部と、上記対訳情報の組み合
    わせによって構成される文との一致性或いは類似性を判
    定し、上記原言語による文又は文の一部を上記目的言語
    による文又は文の一部に翻訳して出力する翻訳処理方法
    であって、 上記対訳情報には、上記原言語による文又は文の一部
    と、この文又は文の一部の対訳である上記目的言語によ
    る文又は文の一部と、上記原言語による文又は文の一部
    及び上記目的言語による文又は文の一部に関連する関連
    情報とが記述されていることを特徴とする翻訳処理方
    法。
  2. 【請求項2】 上記関連情報は、入力された上記原言語
    による文又は文の一部の対訳である上記目的言語による
    文又は文の一部が有する意味の解釈に支援となる情報で
    あることを特徴とする請求項1記載の翻訳処理方法。
  3. 【請求項3】 上記関連情報は、入力された上記原言語
    による文又は文の一部の対訳である上記目的言語による
    文又は文の一部の表現を言い換えた上記原言語による確
    認用原言語文を含むことを特徴とする請求項2記載の翻
    訳処理方法。
  4. 【請求項4】 入力された上記原言語による文又は文の
    一部と、この原言語による文又は文の一部に対応する対
    訳情報に記述されるべき確認用原言語文とが同一である
    場合には、上記対訳情報への上記確認用原言語文の記述
    を省略することを特徴とする請求項3記載の翻訳処理方
    法。
  5. 【請求項5】 上記関連情報は、上記確認用原言語文の
    表現が用いられる状況を説明する上記原言語による状況
    説明文、上記確認用原言語文の表現が用いられる状況に
    関連した状況説明画像又は上記確認用原言語文の表現が
    用いられる状況に関連した状況説明音声の少なくともい
    ずれか1つであることを特徴とする請求項3記載の翻訳
    処理方法。
  6. 【請求項6】 上記関連情報は、入力された上記原言語
    による文又は文の一部の次に入力される可能性が高い上
    記原言語による文又は文の一部に関連する対訳情報への
    関連付け情報であることを特徴とする請求項1記載の翻
    訳処理方法。
  7. 【請求項7】 上記関連情報は、入力された上記原言語
    による文又は文の一部の次に入力される可能性が高い上
    記原言語による文又は文の一部が属する分野を限定する
    ための分野情報であることを特徴とする請求項1記載の
    翻訳処理方法。
  8. 【請求項8】 上記関連情報は、入力された上記原言語
    による文又は文の一部に対する応答を予測した応答文、
    入力された上記原言語による文又は文の一部に対する応
    答を予測した応答画像又は入力された上記原言語による
    文又は文の一部に対する応答を予測した応答音声の少な
    くともいずれか1つであることを特徴とする請求項1記
    載の翻訳処理方法。
  9. 【請求項9】 上記関連情報は、入力された上記原言語
    による文又は文の一部とこの文又は文の一部の対訳であ
    る上記目的言語による文又は文の一部とを対応付けた対
    訳情報に基づき、上記原言語による文又は文の一部と、
    上記対訳情報の組み合わせによって構成される文との一
    致性或いは類似性の判定に用いられる適用制約であるこ
    とを特徴とする請求項1記載の翻訳処理方法。
  10. 【請求項10】 入力された上記原言語による文又は文
    の一部に対する翻訳結果の候補が上記適用制約を満たす
    か否かを判定し、 上記適用制約を満たす候補が存在しない場合には、上記
    原言語による文又は文の一部が翻訳不可能である旨を通
    知することを特徴とする請求項9記載の翻訳処理方法。
  11. 【請求項11】 上記目的言語による文又は文の一部を
    入力して上記原言語による文又は文の一部に翻訳するこ
    とを特徴とする請求項1記載の翻訳処理方法。
  12. 【請求項12】 上記関連情報は、入力された上記原言
    語による文又は文の一部に対する応答として次に入力さ
    れる可能性が高い上記目的言語による文又は文の一部に
    関連する対訳情報への関連付け情報であることを特徴と
    する請求項11記載の翻訳処理方法。
  13. 【請求項13】 上記関連情報は、入力された上記原言
    語による文又は文の一部に対する応答として次に入力さ
    れる可能性が高い上記目的言語による文又は文の一部が
    属する分野を限定するための分野情報であることを特徴
    とする請求項11記載の翻訳処理方法。
  14. 【請求項14】 音声にて上記原言語による文又は文の
    一部を入力して認識し、 生成した上記原言語による文又は文の一部の対訳である
    上記目的言語による文又は文の一部を音声により出力す
    ることを特徴とする請求項1記載の翻訳処理方法。
  15. 【請求項15】 上記関連情報は、入力された上記原言
    語による文又は文の一部の次に入力される可能性が高い
    上記原言語による文又は文の一部に関連する対訳情報へ
    の関連付け情報であって、 上記関連付け情報に基づいて、音声認識の対象とする上
    記原言語による文又は文の一部を限定する情報を生成す
    ることを特徴とする請求項14記載の翻訳処理方法。
  16. 【請求項16】 入力された上記原言語による文又は文
    の一部に対する応答を予測し、 予測して生成した応答予測情報を提示することを特徴と
    する請求項1記載の翻訳処理方法。
  17. 【請求項17】 上記応答予測情報は、入力された上記
    原言語による文又は文の一部に対応する対訳情報に上記
    関連情報として記述された応答文、入力された上記原言
    語による文又は文の一部に対応する対訳情報に上記関連
    情報として記述された応答画像又は入力された上記原言
    語による文又は文の一部に対応する対訳情報に上記関連
    情報として記述された応答音声の少なくともいずれか1
    つであることを特徴とする請求項16記載の翻訳処理方
    法。
  18. 【請求項18】 任意の原言語による文又は文の一部を
    入力する入力手段と、 上記原言語による文又は文の一部と、この文又は文の一
    部の対訳である上記原言語とは異なる任意の目的言語に
    よる文又は文の一部とが対応付けられて記述されるとと
    もに、上記原言語による文又は文の一部及び上記目的言
    語による文又は文の一部に関連する関連情報が記述され
    た対訳情報を記憶する記憶手段と、 上記対訳情報に基づき、上記原言語による文又は文の一
    部と、上記対訳情報の組み合わせによって構成される文
    との一致性或いは類似性を判定することによって、上記
    原言語による文又は文の一部を解析して翻訳結果の候補
    を生成する解析手段と、 上記原言語による文又は文の一部の対訳である上記目的
    言語による文又は文の一部を生成する目的言語文生成手
    段と、 上記目的言語文生成手段により生成された上記目的言語
    による文又は文の一部を出力する出力手段とを備えるこ
    とを特徴とする翻訳処理装置。
  19. 【請求項19】 上記関連情報は、上記入力手段により
    入力された上記原言語による文又は文の一部の対訳であ
    る上記目的言語による文又は文の一部が有する意味の解
    釈に支援となる情報であることを特徴とする請求項18
    記載の翻訳処理装置。
  20. 【請求項20】 上記関連情報は、上記入力手段により
    入力された上記原言語による文又は文の一部の対訳であ
    る上記目的言語による文又は文の一部の表現を言い換え
    た上記原言語による確認用原言語文を含むことを特徴と
    する請求項19記載の翻訳処理装置。
  21. 【請求項21】 上記入力手段により入力された上記原
    言語による文又は文の一部と、この原言語による文又は
    文の一部に対応する対訳情報に記述されるべき確認用原
    言語文とが同一である場合には、上記対訳情報への上記
    確認用原言語文の記述を省略することを特徴とする請求
    項20記載の翻訳処理装置。
  22. 【請求項22】 上記関連情報は、上記確認用原言語文
    の表現が用いられる状況を説明する上記原言語による状
    況説明文、上記確認用原言語文の表現が用いられる状況
    に関連した状況説明画像又は上記確認用原言語文の表現
    が用いられる状況に関連した状況説明音声の少なくとも
    いずれか1つであることを特徴とする請求項20記載の
    翻訳処理装置。
  23. 【請求項23】 上記関連情報は、上記入力手段により
    入力された上記原言語による文又は文の一部の次に入力
    される可能性が高い上記原言語による文又は文の一部に
    関連する対訳情報への関連付け情報であることを特徴と
    する請求項18記載の翻訳処理装置。
  24. 【請求項24】 上記関連情報は、上記入力手段により
    入力された上記原言語による文又は文の一部の次に入力
    される可能性が高い上記原言語による文又は文の一部が
    属する分野を限定するための分野情報であることを特徴
    とする請求項18記載の翻訳処理方法。
  25. 【請求項25】 上記関連情報は、上記入力手段により
    入力された上記原言語による文又は文の一部に対する応
    答を予測した応答文、上記入力手段により入力された上
    記原言語による文又は文の一部に対する応答を予測した
    応答画像又は上記入力手段により入力された上記原言語
    による文又は文の一部に対する応答を予測した応答音声
    の少なくともいずれか1つであることを特徴とする請求
    項18記載の翻訳処理装置。
  26. 【請求項26】 上記関連情報は、上記入力手段により
    入力された上記原言語による文又は文の一部とこの文又
    は文の一部の対訳である上記目的言語による文又は文の
    一部とを対応付けた対訳情報に基づき、上記原言語によ
    る文又は文の一部と、上記対訳情報の組み合わせによっ
    て構成される文との一致性或いは類似性の判定に用いら
    れる適用制約であることを特徴とする請求項18記載の
    翻訳処理装置。
  27. 【請求項27】 上記入力手段により入力された上記原
    言語による文又は文の一部に対する翻訳結果の候補が上
    記適用制約を満たすか否かを判定する適用制約判定手段
    をさらに備え、 上記適用制約判定手段による判定の結果、上記適用制約
    を満たす候補が存在しない場合には、上記原言語による
    文又は文の一部が翻訳不可能である旨の情報を出力する
    ことを特徴とする請求項26記載の翻訳処理装置。
  28. 【請求項28】 上記目的言語による文又は文の一部を
    入力する第2の入力手段と、 上記目的言語による文又は文の一部と、この文又は文の
    一部の対訳である上記原言語による文又は文の一部とが
    対応付けられて記述されるとともに、上記目的言語によ
    る文又は文の一部及び上記原言語による文又は文の一部
    に関連する関連情報が記述された対訳情報を記憶する第
    2の記憶手段と、 上記第2の記憶手段に記憶された対訳情報に基づき、上
    記目的言語による文又は文の一部と、上記対訳情報の組
    み合わせによって構成される文との一致性或いは類似性
    を判定することによって、上記目的言語による文又は文
    の一部を解析して翻訳結果の候補を生成する第2の解析
    手段と、 上記目的言語による文又は文の一部の対訳である上記原
    言語による文又は文の一部を生成する第2の目的言語文
    生成手段と、 上記第2の目的言語文生成手段により生成された上記原
    言語による文又は文の一部を出力する第2の出力手段と
    をさらに備えることを特徴とする請求項18記載の翻訳
    処理装置。
  29. 【請求項29】 上記関連情報は、上記入力手段により
    入力された上記原言語による文又は文の一部に対する応
    答として次に上記第2の入力手段により入力される可能
    性が高い上記目的言語による文又は文の一部に関連する
    対訳情報への関連付け情報であることを特徴とする請求
    項28記載の翻訳処理装置。
  30. 【請求項30】 上記関連情報は、上記入力手段により
    入力された上記原言語による文又は文の一部に対する応
    答として次に上記第2の入力手段により入力される可能
    性が高い上記目的言語による文又は文の一部が属する分
    野を限定するための分野情報であることを特徴とする請
    求項28記載の翻訳処理装置。
  31. 【請求項31】 音声にて上記入力手段により入力され
    た上記原言語による文又は文の一部を認識する音声認識
    手段をさらに備え、 上記出力手段は、生成された上記原言語による文又は文
    の一部の対訳である上記目的言語による文又は文の一部
    を音声により出力することを特徴とする請求項18記載
    の翻訳処理装置。
  32. 【請求項32】 上記関連情報は、上記入力手段により
    入力された上記原言語による文又は文の一部の次に入力
    される可能性が高い上記原言語による文又は文の一部に
    関連する対訳情報への関連付け情報であって、 上記関連付け情報に基づいて生成され、上記音声認識手
    段が対象とする上記原言語による文又は文の一部を限定
    する情報を記憶する音声認識対象限定手段をさらに備え
    ることを特徴とする請求項31記載の翻訳処理装置。
  33. 【請求項33】 上記入力手段により入力された上記原
    言語による文又は文の一部に対する応答を予測する応答
    予測手段と、 この応答予測手段により予測して生成した応答予測情報
    を提示する応答予測提示手段とをさらに備えることを特
    徴とする請求項18記載の翻訳処理装置。
  34. 【請求項34】 上記応答予測情報は、上記入力手段に
    より入力された上記原言語による文又は文の一部に対応
    する対訳情報に上記関連情報として記述された応答文、
    上記入力手段により入力された上記原言語による文又は
    文の一部に対応する対訳情報に上記関連情報として記述
    された応答画像又は上記入力手段により入力された上記
    原言語による文又は文の一部に対応する対訳情報に上記
    関連情報として記述された応答音声の少なくともいずれ
    か1つであることを特徴とする請求項33記載の翻訳処
    理装置。
JP11040282A 1999-02-18 1999-02-18 翻訳処理方法及び翻訳処理装置 Withdrawn JP2000242642A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP11040282A JP2000242642A (ja) 1999-02-18 1999-02-18 翻訳処理方法及び翻訳処理装置
PCT/JP2000/000907 WO2000049523A1 (fr) 1999-02-18 2000-02-17 Procede de traduction et dispositif de traduction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11040282A JP2000242642A (ja) 1999-02-18 1999-02-18 翻訳処理方法及び翻訳処理装置

Publications (1)

Publication Number Publication Date
JP2000242642A true JP2000242642A (ja) 2000-09-08

Family

ID=12576268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11040282A Withdrawn JP2000242642A (ja) 1999-02-18 1999-02-18 翻訳処理方法及び翻訳処理装置

Country Status (2)

Country Link
JP (1) JP2000242642A (ja)
WO (1) WO2000049523A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007004391A1 (ja) * 2005-07-06 2007-01-11 Matsushita Electric Industrial Co., Ltd. 対話支援装置
JP2008516294A (ja) * 2004-10-13 2008-05-15 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 対話システムの忠実度を向上させる方法及びシステム
US7512538B2 (en) 2005-07-13 2009-03-31 Panasonic Corporation Dialog supporting device
WO2017191711A1 (ja) * 2016-05-02 2017-11-09 ソニー株式会社 制御装置、制御方法およびコンピュータプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002236681A (ja) * 2001-02-09 2002-08-23 Inst Of Physical & Chemical Res 日常言語コンピューティングシステムおよびその方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03244077A (ja) * 1990-02-21 1991-10-30 Nec Corp 翻訳支援装置
JPH04310182A (ja) * 1991-04-09 1992-11-02 Nec Corp 機械翻訳装置
JP2870279B2 (ja) * 1992-01-13 1999-03-17 日本電気株式会社 訳語選択装置
JPH0877176A (ja) * 1994-09-07 1996-03-22 Hitachi Ltd 外国語翻訳装置
JPH07271794A (ja) * 1995-01-04 1995-10-20 Hitachi Ltd 会話翻訳装置
JP3716870B2 (ja) * 1995-05-31 2005-11-16 ソニー株式会社 音声認識装置および音声認識方法
JPH0916599A (ja) * 1995-06-26 1997-01-17 Sharp Corp 電子辞書装置
JPH09319750A (ja) * 1996-05-27 1997-12-12 Sharp Corp 通訳装置
JPH1097538A (ja) * 1996-09-25 1998-04-14 Sharp Corp 機械翻訳装置
JPH10228474A (ja) * 1997-02-14 1998-08-25 Technos Japan:Kk 双方向会話が可能な携帯型音声翻訳器
JPH10293761A (ja) * 1997-04-18 1998-11-04 Matsushita Electric Ind Co Ltd 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体
JPH10320397A (ja) * 1997-05-22 1998-12-04 Hitachi Ltd 携帯型音声翻訳端末

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008516294A (ja) * 2004-10-13 2008-05-15 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 対話システムの忠実度を向上させる方法及びシステム
JP4809358B2 (ja) * 2004-10-13 2011-11-09 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 対話システムの忠実度を向上させる方法及びシステム
US8463611B2 (en) 2004-10-13 2013-06-11 Hewlett-Packard Development Company, L.P. Method and system for improving the fidelity of a dialog system
WO2007004391A1 (ja) * 2005-07-06 2007-01-11 Matsushita Electric Industrial Co., Ltd. 対話支援装置
US7562006B2 (en) 2005-07-06 2009-07-14 Panasonic Corporation Dialog supporting device
US7512538B2 (en) 2005-07-13 2009-03-31 Panasonic Corporation Dialog supporting device
WO2017191711A1 (ja) * 2016-05-02 2017-11-09 ソニー株式会社 制御装置、制御方法およびコンピュータプログラム
US11170180B2 (en) 2016-05-02 2021-11-09 Sony Corporation Control device and control method

Also Published As

Publication number Publication date
WO2000049523A1 (fr) 2000-08-24

Similar Documents

Publication Publication Date Title
US6952665B1 (en) Translating apparatus and method, and recording medium used therewith
US6374224B1 (en) Method and apparatus for style control in natural language generation
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US9805718B2 (en) Clarifying natural language input using targeted questions
US7668718B2 (en) Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
JP4058071B2 (ja) 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
US20080133245A1 (en) Methods for speech-to-speech translation
JP2001506382A (ja) 分散システムにおけるパターン認識登録
JP2007220045A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2001100781A (ja) 音声処理装置および音声処理方法、並びに記録媒体
US20220180864A1 (en) Dialogue system, dialogue processing method, translating apparatus, and method of translation
JP2011504624A (ja) 自動同時通訳システム
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
Lee Speech translation
KR100684160B1 (ko) 개체명 인식을 이용한 대화 분석 장치 및 방법
US11615787B2 (en) Dialogue system and method of controlling the same
JP2000242642A (ja) 翻訳処理方法及び翻訳処理装置
KR20210051523A (ko) 도메인 자동 분류 대화 시스템
KR100400220B1 (ko) 대화 모델을 이용한 자동 통역 장치 및 방법
JPH07261793A (ja) 対話処理装置
JP4220151B2 (ja) 音声対話装置
JP2010197709A (ja) 音声認識応答方法、音声認識応答システム、及びそのプログラム
JP2001117752A (ja) 情報処理装置および情報処理方法、並びに記録媒体
JP2001100788A (ja) 音声処理装置および音声処理方法、並びに記録媒体
CN113515952B (zh) 一种用于蒙古语对话模型联合建模方法、系统及设备

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060509