JP2005018350A - 翻訳処理システム、翻訳処理方法及びプログラム - Google Patents

翻訳処理システム、翻訳処理方法及びプログラム Download PDF

Info

Publication number
JP2005018350A
JP2005018350A JP2003181253A JP2003181253A JP2005018350A JP 2005018350 A JP2005018350 A JP 2005018350A JP 2003181253 A JP2003181253 A JP 2003181253A JP 2003181253 A JP2003181253 A JP 2003181253A JP 2005018350 A JP2005018350 A JP 2005018350A
Authority
JP
Japan
Prior art keywords
language
translation
word
dictionary
unknown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003181253A
Other languages
English (en)
Inventor
Enko Sai
遠航 蔡
Etsuo Ito
悦雄 伊藤
Yumiko Yoshimura
裕美子 吉村
Takashi Shibuya
貴志 澁谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003181253A priority Critical patent/JP2005018350A/ja
Publication of JP2005018350A publication Critical patent/JP2005018350A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】第一言語の単語の中に未知語が存在する場合、第二言語の単語の属性を翻訳に反映し、第二言語国の人でも容易に理解する訳文を生成する。
【解決手段】入力される第一言語の単語が翻訳辞書に登録されているか否かを判断する判断する手段(25)と、未知語が存在する場合、第一言語及び第二言語の言語種別の関係を考慮しつつ第二言語に置き換える変換手段(26)と、この第二言語に置き換えた未知語が第二言語の単言語辞書に存在する場合、この第二言語の単語及び当該単語の属性を取得する属性取得手段(27)と、当該単語の属性を翻訳に反映し、訳文を生成する第二言語生成手段(28)とを設けた翻訳処理システムである。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、第一言語(原文)の一部の単語が翻訳辞書に登録されていない場合でも適正な翻訳処理を行う翻訳処理システム、翻訳処理方法及びプログラムに関する。
【0002】
【従来の技術】
従来、第一言語を所要とする第二言語に翻訳処理する翻訳処理システムでは、第一言語の翻訳時、第一言語の中の一部の単語が翻訳辞書に登録されていない場合が出てくる。このような翻訳辞書に登録されていない第一言語の単語(以下、未知語と呼ぶ)が存在する場合、以下のような方法により未知語を訳出する。
【0003】
その1つは、第一言語の単語が翻訳辞書に登録されていない場合、未知語であると判断し、その未知語である第一言語の単語をそのまま訳語として訳出する方法である。
【0004】
他の1つは、第一言語の単語の中に翻訳辞書に登録されていない未知語が存在する場合、翻訳処理を中止し、システムの表示部に未知語である旨及び未知語を表示し、ユーザに通知する方法である。
【0005】
ところで、以上のように翻訳辞書に登録されていない未知語が存在する場合、何れの方法においても、ユーザが自ら未知語を訳語とともに翻訳辞書に登録するか、或いはユーザの要望に基づき、システム開発者が未知語を訳語とともに翻訳辞書に登録すれば、第一言語の単語の中の未知語は問題なく訳出することが可能である。
【0006】
しかし、このような翻訳処理方法は、何れも翻訳の精度が低く、ユーザまたはシステム開発者の登録作業の手間が増え、しかも時々刻々未知語が発生することから、システム開発者は、ユーザの要望にタイムリーに対応することが難しいことから、常に適正な翻訳結果が得られないことが多くなる。
【0007】
この未知語の訳出の具体例としては、例えば中国語から英語に翻訳する例を挙げて説明する。
【0008】
今、原文となる表1の第1段目に記載する言語を翻訳するに際し、
【表1】
Figure 2005018350
【0009】
例えば表1の第2段目に記載する単語が未知語であると仮定する。このような未知語を翻訳する場合、表1の第3段目に記載するような訳文となる。
【0010】
さらに、原文中に混在する未知語を含めて翻訳処理する翻訳処理システムとして、次のように技術が提案されている(特開平8−137886号公報)。
【0011】
この翻訳処理システムは、第一言語の単語に関する文法情報を収録した第一言語辞書及び第二言語の単語に関する文法情報を収録した第二言語辞書が設けられ、原文中に含まれる各言語がどの言語に属する単語であるか識別し、第一言語の単語であれば第一言語辞書を参照し、第二言語の単語であれば第二言語辞書を参照し、当該単語の文法的意味を解析し、この解析結果に基づいて原文全体の意味構造を解析し、翻訳する構成である。
【0012】
【特許文献1】
特開平8−137886号公報(第3頁右欄49行〜第4頁左欄13行、第5頁左欄9行〜同頁同欄22行参照)
【0013】
【発明が解決しようとする課題】
従って、以上のような翻訳処理方法では、翻訳辞書に登録されていない未知語が存在する場合、ユーザによる翻訳処理に多くの手間及び時間がかかる問題がある。
【0014】
また、例えば英語を母国語とする人にとっては、表1の第3段目に記載する訳文の中に存在する表1の第2段目に記載する単語である訳文がどのような記号、意味内容を表すのか全く知らない人が殆どであり、ひいては原文の意味を的確に伝えることができない。
【0015】
従って、前述するように第一言語の中に未知語がある場合、その未知語を正確に訳出できず、第一の言語の未知語をそのまま第二の言語に訳出してしまう問題がある。
【0016】
また、第一の言語の中に未知語が存在する場合、当該未知語の意味属性などの属性が分からないために、翻訳の精度が低下してしまう。
【0017】
さらに、特開平8−137886号公報の技術においては、未知語は第二言語の単語に限定しており、未知語全体を対象としていない。このことは、第1表の第2段目に記載する単語が未知語として存在する場合、前述と同様の問題が生じ、原文の意味を的確に伝えることができない。
【0018】
本発明は上記事情にかんがみてなされたもので、第一言語の単語の中に未知語が存在する場合、当該未知語に関係する第二言語の単語や訳語の属性を翻訳に反映し、翻訳精度の向上を図る翻訳処理システム、翻訳処理方法及びプログラムを提供することを目的とする。
【0019】
【課題を解決するための手段】
(1) 上記課題を解決するために、本発明に係る翻訳処理システムは、第一言語の単語が翻訳辞書に登録されているか否かを判断する判断手段と、この判断手段により前記翻訳辞書に登録されていない単語(以下、未知語と呼ぶ)が存在する場合、当該未知語の前記第二言語の単語が前記第二言語の単言語辞書に存在する場合、当該第二言語の単語の属性を翻訳に反映し翻訳する翻訳処理手段とを設けた構成である。
【0020】
なお、翻訳処理手段としては、前記判断手段により未知語が存在すると判断された場合、第一言語及び第二言語の言語種別の関係を考慮しつつ第二言語に置き換える未知語変換手段と、この第二言語に置き換えた未知語に基づいて前記第二言語の単言語辞書による辞書引きを行い、前記第二言語の単語が存在する場合、この第二言語の単語及び当該単語の属性を抽出する属性取得手段と、この属性取得手段で取得される当該単語の属性を反映し翻訳する第二言語生成手段とを設けた構成としてもよい。
【0021】
本発明は以上のような構成とすることにより、第一言語の中の単語が第一言語から第二言語に翻訳する翻訳辞書に登録されていない場合、その登録されていない未知語の第二言語の単語が第二言語の単言語辞書の中に単語として存在する場合、第二言語の単語の属性を反映し翻訳するようにすれば、第一言語の意味を的確に伝達でき、ひいては翻訳精度の向上に寄与させることができる。
【0022】
なお、前記(1)では、翻訳処理システムについて述べたが、当該システムに使用する翻訳処理方法という形でも容易に実現でき、またシステムの一連の処理手段はプログラムにより実現することが可能である。
【0023】
(2) また、本発明に係る翻訳処理システムは、第一言語の単語が第1の翻訳辞書に登録されているか否かを判断する判断手段と、この判断手段により前記翻訳辞書に登録されていない未知語が存在する場合、前記第一言語に類似する第三言語を決定する類似言語決定手段と、この決定後、第一言語及び第三言語の言語種別の関係を考慮しつつ第三言語に置き換える未知語変換手段と、この第三言語に置き換えた未知語に基づいて前記第三言語から第二言語に翻訳する前記第2の翻訳辞書の辞書引きを行い、この第2の翻訳辞書に訳語が存在する場合、当該訳語及びこの訳語の属性を翻訳に反映する手段とを設けた構成であってもよい。
【0024】
このような構成によれば、第一言語に類似する第三言語から第二言語に翻訳する第2の翻訳辞書の辞書引きにより、第二言語の訳語を抽出でき、この訳語及びこの訳語の属性を翻訳に反映することにより、翻訳精度の向上を図ることが可能となる。
【0025】
なお、前記(2)では、翻訳処理システムについて述べたが、当該システムに使用する翻訳処理方法という形でも容易に実現でき、またシステムの一連の処理手段はプログラムにより実現することが可能である。
【0026】
【発明の実施の形態】
先ず、本発明の実施の形態を説明するに先立ち、翻訳の基本的な処理の流れについて図1を参照して説明する。
【0027】
一般に、原文である第一言語Aを所要とする第二言語Bに翻訳する場合、第一言語Aの文が入力されると(S1)、この入力文に対して辞書・文法規則を用いて形態素解析を行い、第一言語Aを構成する基本単位となる単語列を認定する(S2)。さらに、第一言語Aの単語列の単語相互の関係について構文解析を行い、第一言語Aの構造を表す構文木を取得する(S3)。さらに、この言語Aの構文木に対し、辞書・文法規則を用いて、目的とする第二言語Bに相当する中間表現である構文木に変換した後(S4)、第二言語Bの生成段階に入る。この生成段階は、語順並べ替え規則等に基づいて第二言語Bの単語列を生成し(S5)、さらに形態素生成によって第二言語Bの文を生成し出力する(S6)。
【0028】
ところで、本発明においては、第一言語Aの構文解析結果から目的言語Bの構文木に変換する際、第一言語Aの単語の一部に未知語が存在する場合、次の2つの変換手法を用いて翻訳処理を実行する。
【0029】
▲1▼ その1つ変換方法は、第一言語Aの単語の中に未知語が存在する場合、第二言語Bの単言語辞書で辞書引きを行い、第二言語Bに単語が存在する場合に当該単語がもつ属性を反映し、当該第二言語Bの単語を訳語に用いる方法である。
【0030】
▲2▼ 他の1つの変換方法は、第一言語Aの単語の中に未知語が存在する場合、類似関係にある第三言語Cを選択し、当該未知語を第三言語Cから第二言語Bに翻訳する際に使用される翻訳辞書で辞書引きを行い、第二言語Bに訳語があれば、当該訳語の属性を反映し、当該第二言語Bの訳語に用いる方法である。
【0031】
以下、本発明の実施の形態について図面を参照して説明する。
【0032】
(第1の実施の形態)
図2は本発明に係る翻訳処理システムの第1の実施の形態に示す構成図である。ここで、翻訳処理システムとは、ネットワーク上に接続される翻訳処理機能をもつ翻訳提供サーバに相当する場合、或いは単体の翻訳処理装置に相当する場合の両方を含むものとする。この単体の翻訳処理装置とは、例えばネットワークに接続されているユーザ端末であるとか、或いはネットワークに接続されていない一般の独立した情報処理装置であることもある。
【0033】
この翻訳処理システムは、第一言語である原文情報を入力する第一言語入力手段10と、翻訳処理制御部20と、この翻訳処理制御部20で翻訳処理された翻訳結果を出力する翻訳結果出力手段30とによって構成されている。
【0034】
第1言語入力手段10は、翻訳する原文情報や編集その他の制御指示等のコマンドを入力する役割を有し、ハード的には、例えば入力機器であるキーボード11、予め原文情報が格納されているファイル12、原文情報が伝送されてくるインターネット、専用線、LAN等のネットワーク13などが挙げられる。その他、マウス、トラックボール、タブレットなどのポインティングデバイス、光学式文字読取装置などがある。何れにせよ、原文情報を入力する機能をもつもののすべてが含まれる。
【0035】
前記翻訳処理制御部20には、第1言語入力手段11から入力される原文情報である第一言語を記憶する原文情報記憶部21、少なくとも第一言語を所要とする第二言語に翻訳し、第三言語を第二言語に翻訳する文法規則をもつ翻訳辞書や第二言語の単言語辞書を含む必要な辞書を備えた辞書記憶部22、第一言語の訳文情報その他の情報を記憶する訳文記憶部23及び翻訳処理制御部20自体がCPUで構成されている場合に翻訳処理用プログラムを格納するプログラム記録媒体24が接続されている。なお、これら記憶部21〜24は、通常,電子的,磁気的,機械的,光学的な手段を用いて所要とする情報を記録するものであり、必ずしもそれぞれが独立した記録部である必要はなく、例えば1つの外部記憶装置などに領域分けして所要とする情報を記録するものであればよい。
【0036】
前記翻訳処理制御部20は、機能的には、第一言語を所要とする第二言語に翻訳するに際し、辞書記憶部22の中の翻訳辞書の辞書引きによって第一言語の単語の中に未知語が存在するか否かを判断し、未知語が存在しない場合には辞書引きされた第二言語の単語を訳文記憶部23に格納する未知語判断手段25と、この判断手段25で未知語が存在すると判断された場合、第一言語と第二言語の言語種別の関係を考慮しつつ第二言語に置き換える変換処理を実施して適宜な記憶手段に記憶し、或いは適正な第二言語に置き換えられない場合には元の未知語に戻して次の処理機能に移す未知語変換手段26と、この未知語変換手段26から第二言語に置き換えた未知語を受けた場合、辞書記憶部22の第二言語の単言語辞書による辞書引きを行い、第二言語の単語が存在すれば、その第二言語の単語とともに当該単語の属性を取得する属性取得手段27と、以上のように第二言語の単語及び属性を取得した場合、この単語の属性を反映し当該単語を第二言語の訳語として生成する第二言語生成手段28とが設けられている。
【0037】
前記翻訳結果出力手段30は、翻訳処理制御部20で翻訳処理された翻訳結果を格納するファイル31、原文情報を含み、或いは原文情報を含まない翻訳結果だけを表示する表示装置32及びプリンタ33、翻訳処理された翻訳結果を所要とする端末などに伝送するインターネット、専用線、LAN等を含むネットワーク34などの何れか1つ以上が用いられている。
【0038】
従って、以上のような翻訳処理システムの実施の形態によれば、第一言語を第二言語に翻訳するに際し、第一言語の中の単語に未知語が存在する場合、未知語の第二言語の単語に関し、第二言語の単言語辞書に単語が存在するか否かを判断し、存在する場合には当該単語の属性を翻訳に反映するので、訳文生成時に未知語が減少するとともに、文の意味をより正確に伝達でき、翻訳精度を向上させることができる。また、ユーザはシステム開発者に頼らずに翻訳でき、翻訳処理の手間及び時間を大幅に低減化することができる。
【0039】
次に、以上のような翻訳処理システムの動作ないし本発明に係る翻訳処理方法及びプログラムによる一連の処理について図3を参照して説明する。
【0040】
翻訳処理システムの動作が開始すると、翻訳処理制御部20は、プログラム記録媒体24から翻訳処理プログラムを読取り、適宜な記憶手段に格納した後、この翻訳処理プログラムにより所要の処理を実行する。
【0041】
先ず、種々の入力形態により第一言語入力手段10から翻訳処理対象となる第一言語Aの文が入力される。ここで、翻訳処理制御部20は、第一言語の文が入力されると(ST1:第一言語入力ステップ)、当該第一言語の文を原文情報記憶部21に一時記憶した後、第一言語に関する辞書記憶部22に記憶される文法規則を含む翻訳辞書を用いて、形態素解析及び構文解析を実施し、第一言語Aの構造を表す構文木を取得する(ST2,ST3)。しかる後、この第一言語Aの構文木に着目し、この構文木にある全ての形態素に対し、第一言語Aから第二言語の翻訳に使用する翻訳辞書を用いて辞書引きを行い(ST4)、第一言語Aの単語の中に未知語が存在するか否かを判断する(ST5)。ここで、第一言語Aの単語から辞書引きにより適正な単語が得られた場合には第二言語の構文木として訳文記憶部23に記憶する。これらST2〜ST5は未知語判断ステップないし未知語判断機能に相当する。
【0042】
このステップST5による判断によって未知語が存在する場合、ステップST6に移行し、第一言語Aと第二言語Bの言語種別の関係を考慮しつつ第二言語に置き換える変換処理を実行する。なお、この変換処理については後記する。ステップST6の処理は、変換処理ステップないし変換処理機能に相当する。
【0043】
ところで、未知語変換処理において、適正な第二言語Bに置き換えられない場合、当該第二言語の未知語について、辞書記憶部22の中の第二言語の単言語辞書を用いて辞書引きを行い(ST7)、該当単語が存在するか否かを判断し(ST8)、存在する場合には当該第二言語Bの単語及びその単言語辞書の単語に登録されている意味属性などの属性を取得し(ST9)、当該属性を反映しつつ第二言語Bの単語を訳語とする第二言語の構文木を取得し、訳文記憶部23に格納する(ST10)。これらST7〜ST10は属性取得ステップないし属性取得機能に相当する。
【0044】
以上のようにして第一言語Aの未知語が第二言語Bの単言語辞書に存在する場合、これら単語及び属性から第二言語を生成し出力する(ST11:第二言語生成ステップ)。
【0045】
そして、第一言語Aの文を構成する全ての単語について第二言語Bの単語からなる文に生成するために同様の処理を繰り返し実行する(ST12、ST4〜ST11)。
【0046】
従って、以上のような実施の形態によれば、第一言語Aの未知語が存在する場合、当該未知語の第二言語Bの単語に関し、第二言語の単言語辞書に単語が存在する場合、第一言語Aの未知語は翻訳できない未知語でなくなり、例えば第二言語Bの単言語辞書から取得した単号を含む属性を翻訳処理に反映することにより、訳文を正しく生成することが可能となり、翻訳精度を向上させることができる。
【0047】
次に、図4は図3の中の未知語変換処理ステップないし未知語変換処理機能(ST6)の具体的な処理例を説明する図である。
【0048】
この未知語変換処理においては、ステップST5で第一言語の単語の中に未知語が存在すると判断された場合、当該未知語に関する変換対象言語Aと変換先言語Bが何れの言語種別であるかチェックする(ST21)。このチェック結果に基づき、変換対象言語Aと変換先言語Bが何れもアルファベット言語であれば(ST22)、未知語に関し、変換対象言語Aのアルファベット体系から変換先言語Bのアルファベット体系の読みに置き換え(ST23)、言語変換処理を終了する。仮に、変換対象言語A及び変換先言語Bの言語種別がアルファベット言語ではなくて漢字言語であれば(ST24)、未知語に関し、変換対象言語Aの漢字体系から変換先言語Bの漢字体系の読みに置き換え(ST25)、言語変換処理を終了する。
【0049】
また、未知語に関し、変換対象言語A及び変換先言語Bの言語種別が漢字言語ではなく、変換対象言語Aが漢字言語、変換先言語Bがアルファベット言語であれば(ST26)、未知語を変換対象言語Aの漢字体系から変換先言語Bのアルファベット体系のに置き換え(ST27)、言語変換処理を終了する。
【0050】
以上のようにして変換先言語Bの言語種別を特定するが、ステップST26において、変換対象言語Aが漢字言語、変換先言語Bがアルファベット言語でなく、逆に変換対象言語Aがアルファベット言語、変換先言語Bが漢字言語であれば、未知語を変換対象言語Aのアルファベット体系から変換先言語Bの漢字体系の漢字読みに置き換える(ST28)。
【0051】
ところで、何れの言語体系にも正しく置き換えができない場合(ST29)、未知語を元に戻し、未知語変換処理を終了する(ST30)。
【0052】
従って、以上のような翻訳処理方法及びプログラムの実施の形態によれば、翻訳処理システムと同様な作用効果を奏することができる。
【0053】
なお、第1の実施の形態に関し、中国語から英語に翻訳する例について説明する。今、表1の第1段目に記載する中国語を英語に翻訳する場合、図2の未知語判断手段25もしくは図3のステップST5で未知語が存在すると判断された場合、未知語変換手段26もしくはステップST6にて第二段目に記載する第一言語の単語の読みからアルファベット“dongzhi”に変換する(図4のST27)。そして、図2の属性抽出手段27もしくは図3のステップST7により、変換された“dongzhi”に基づき、英語の単言語辞書を調べる。この例では、単言語辞書に“dongzhi”に対応する単語が存在しないので、このまま第二段目に記載する第一言語の単語が訳文に用いられるが、“dongzhi”に対応する単語が存在する場合にはその単語及び単語の属性が翻訳に用いられる。
【0054】
(第2の実施の形態)
本発明に係る第2の実施の形態における翻訳処理システムは、図2と同様なハード的構成を有しているので、当該構成の説明は図2の説明に譲り、ここでは、特に異なる翻訳処理制御部20の機能的な構成について図5を参照して説明する。
【0055】
すなわち、この翻訳処理制御部20は、第一言語を所要とする第二言語に翻訳するに際し、辞書記憶部22の中の翻訳辞書を用いた辞書引きによって第一言語の単語の中に未知語が存在するか否かを判断し、未知語が存在しない場合には辞書引きされた第二言語の単語を訳文記憶部23に格納する未知語判断手段41(25)と、この判断手段41で未知語が存在すると判断された場合、類似言語リスト記憶部42を参照し、第一言語に類似する類似度が最も高い類似言語Cを決定する類似言語決定手段43と、この類似言語Cの決定後、当該未知語に関し、第一言語と類似言語C(第三言語)の言語種別の関係を考慮しつつ、第一言語の未知語を類似言語体系の読みに置き換える変換処理を実施して適宜な記憶手段に記憶し、或いは類似言語に置き換えられない場合には元の未知語に戻して次の処理機能に移す未知語変換手段44(26)と、第一言語の未知語に関し、決定された類似言語Cから第二言語Bの翻訳を行う為の翻訳辞書による辞書引きを行い、未知語の訳語及びその訳語の意味属性などの属性を取得する属性取得手段45(27)と、以上のように第二言語の訳語及び属性が得られた場合、これら属性から訳語が適正と判断された場合に第二言語の訳語を用いる第二言語生成手段46(28)とが設けられている。
【0056】
なお、類似言語リスト記憶部4に登録される類似言語リストは、自然言語の言語体系、使用している漢字やアルファベットの類似度などから作成されるリストである。
【0057】
従って、以上のような翻訳処理システムの実施の形態によれば、第一言語を第二言語に翻訳するに際し、第一言語の中の単語に未知語が存在する場合、第一言語に類似する類似言語Cを見つけ出し、この類似言語Cから第二言語Bに翻訳する翻訳辞書を用いて得られる第二言語の訳語及びこの訳語の属性を抽出し翻訳に反映するので、第一言語は翻訳できない未知語でなくなり、その翻訳辞書から取得した訳語及び当該訳語の属性により、訳文を正しく生成でき、翻訳精度の向上を図ることができる。また、訳文生成時に未知語が減少することにより、ユーザはシステム開発者に頼らずに翻訳でき、翻訳処理の手間及び時間を大幅に低減化することができる。
【0058】
次に、以上のような翻訳処理システムの動作ないし本発明に係る翻訳処理方法及びプログラムによる一連の処理について図6を参照して説明する。
【0059】
翻訳処理システムの動作が開始すると、翻訳処理処理部20は、プログラム記録媒体24´から翻訳処理プログラムを読取り、適宜な記憶手段に格納した後、この翻訳処理プログラムにより所要の処理を実行する。
【0060】
先ず、種々の入力形態により第一言語入力手段10から翻訳処理対象となる第一言語Aの文が入力される。ここで、翻訳処理制御部20は、第一言語の文が入力されると(ST31:第一言語入力ステップ)、当該第一言語の文を原文情報記憶部21に一時記憶した後、辞書記憶部22の中の翻訳辞書を用いて、形態素解析及び構文解析を実施し、第一言語Aの構造を表す構文木を抽出する(ST32,ST33)。しかる後、この第一言語Aの構文木に着目し、この構文木にある全ての形態素に対し、第一言語Aから第二言語の翻訳に使用する辞書記憶部22の翻訳辞書を用いて辞書引きを行い(ST34)、第一言語Aの単語の中に未知語が存在するか否かを判断する(ST35)。ここで、第一言語Aの単語から辞書引きにより適正な単語が得られた場合には第二言語の構文木としてデータ情報記憶部23に記憶する。これらST32〜ST35は未知語判断ステップないし未知語判断機能に相当する。
【0061】
このステップST35により未知語が存在すると判断された場合、予め類似言語リスト記憶部42に登録されている類似言語リストを参照し、第一言語に類似する類似度が最も高い類似言語Cを決定する(ST36:類似言語決定ステップ、類似言語決定機能)。
【0062】
このこの類似言語Cの決定後、当該未知語に関し、第一言語と類似言語C(第三言語)の言語種別の関係を考慮しつつ、前述する図4に示す一連の処理を実行し、第一言語の未知語を類似言語体系の読みに置き換える変換処理を実施して適宜な記憶手段に記憶し、或いは類似言語Cに置き換えられない場合には元の未知語に戻して次の処理機能に移す処理を実行する(ST37:変換処理ステップないし変換処理機能)。
【0063】
しかる後、第一言語Aの未知語に関し、決定された類似語Cから第二言語Bに翻訳する際に使用される辞書記憶部22の中の翻訳辞書で辞書引きを行い(ST38)、第二言語に該当する単語が存在するか否かを判断し(ST39)、存在しない場合には類似語Cの単語を構文木とし、存在する場合には辞書からその第二言語の訳語及び当該訳語の意味属性などの属性を抽出し(ST40)、第二言語の構文木として訳文記憶部23に記憶する(ST41)。これらST38〜ST41は属性取得ステップないし属性取得機能に相当する。
【0064】
以上のようにして第一言語Aの未知語が類似語Cから第二言語Bの翻訳に使用される翻訳辞書に存在する場合、これら単語及び属性から第二言語を生成し出力する(ST42:第二言語生成ステップ)。
【0065】
そして、第一言語Aの文を構成する全ての単語について第二言語Bの文に生成するために同様の処理を繰り返し実行する(ST43、ST344〜ST42)。
【0066】
従って、以上のような翻訳処理方法及びプログラムの実施の形態によれば、翻訳処理システムと同様な作用効果を奏することができる。
【0067】
なお、第2実施の形態に関し、中国語から英語に翻訳する例について説明する。今、表1の第1段目に記載する中国語を英語に翻訳する場合、図5の未知語判断手段41もしくは図6のステップST35で未知語が存在すると判断された場合、類似後決定手段43もしくはステップST36にて中国語に類似する言語を決定する。この場合、例えば日本語が類似語として決定されたものとする。そこで、未知語変換手段44もしくはステップST3により、未知語である表1の第2段目に記載する単語を日本語の“東芝”に変換する(図6のステップ40参照)。そこで、図5の属性抽出手段45もしくは図6のステップST38にて、“東芝”について、日本語から英語に翻訳する際に使用する翻訳辞書の辞書引きを行う。このとき、“東芝”の訳語“TOSHIBA”及びこの訳語“TOSHIBA”の属性(固有名詞、組織、複数系がないなど)を取得する(図6のST40参照)。その結果、図1表の第1段目の文は、翻訳によって「TOSHIBA present the new model personal computer.」という訳文を得ることができ、意味内容が分かる理想的な訳文となる。
【0068】
従って、このような訳文「TOSHIBA present the new model personal computer.」は、表1の第3段目に記載する訳文よりも翻訳精度が高く、英語を母国語とする人にも分かりやすい。また、ユーザの手間も全く必要なく、翻訳処理の高速化に貢献する。
【0069】
なお、本願発明は、上記実施の形態に限定されるものでなく、その要旨を逸脱しない範囲で種々変形して実施できる。
【0070】
(1) 上記実施の形態は、第1の実施の形態と第2の実施の形態とに分けて説明したが、これら2つの実施の形態を組み合わせた構成ないし方法であってもよい。例えば第1の実施の形態において、第一言語の単語の中の未知語が第二言語の単言語辞書にも存在しない場合、第2の実施の形態における第一言語に最も類似する類似度の高い第三言語を見つけ出し、この第三言語から第二言語を翻訳する翻訳辞書から第二言語の訳語を見つけ出し、この訳語及びこの訳語の属性を翻訳に反映させる翻訳処理システム及び翻訳処理方法であってもよい。また、逆に、第一言語の単語の中の未知語が第三言語から第二言語を翻訳する翻訳辞書から第二言語の訳語を見つけられない場合、第二言語の単言語辞書による辞書引きを行い、当該単言語辞書に単語が存在する場合、この単語の属性を翻訳に反映させてもよい。
【0071】
(2) 上記実施の形態では、何れも中国語から英語に翻訳する例を説明したが、例えば英日翻訳についても同様に適用できることは言うまでもない。
【0072】
今、「I’d like to have some sushi.」を英日翻訳する例について説明する。この例では、図2、図5の未知語判断手段25、41もしくは図3のステップST5、図6のステップST35にて、“sushi”が未知語として存在する。
【0073】
そこで、第1の実施の形態では、未知語変換手段26もしくは図3のステップST6で英語の“sushi”を日本語の“すし”に変換する(図4のST28参照)。そこで、属性抽出手段27もしくは図3のステップST7にて、“すし”を日本語の単言語辞書で辞書引きを行うと、勿論“すし”が単言語辞書に存在するので、この“すし”の属性(名詞、食べ物、複数形がないなど)を取得する(ST9)。従って、英語文「I’d like to have some sushi.」は、「私はすしを食べたい」と言う訳文となり、非常に理想的な訳文となる。
【0074】
因みに、“sushi”が未知語のままでは、“have”の訳語が定まらず、「私はいくらのsushiを持つ」という訳文となる。しかし、“sushi”を“すし”に変換して日本語の単言語辞書を調べることにより、“すし”が食べ物であり、“have”の訳語が“食べる”と訳すことができる。
【0075】
一方、第2の実施の形態では、図5の類似語決定手段43もしくは図6のステップST36にて英語に類似する言語を決定する。この場合、例えばドイツ語が決定されたとする。そこで、未知語変換手段44もしくは図6のステップST37で英語の“sushi”をドイツ語の“sushi”に変換する(図4のステップST23参照)。
【0076】
そこで、属性抽出手段45もしくは図6のステップST38にて、未知語“sushi”をドイツ語から日本語に翻訳する際に使用する翻訳辞書で調べる。ここで、存在しないと仮定すると、訳文は「私はいくらかのsushiを持つ」と訳され、第1の実施の形態における英語の未知語“sushi”をそのまま表現した場合と同様に意味不明な訳文となる。
【0077】
また、各実施の形態は可能な限り組み合わせて実施することが可能であり、その場合には組み合わせによる効果が得られる。さらに、上記各実施の形態には種々の上位,下位段階の発明が含まれており、開示された複数の構成要素の適宜な組み合わせにより種々の発明が抽出され得るものである。例えば問題点を解決するための手段に記載される全構成要件から幾つかの構成要件が省略されうることで発明が抽出された場合には、その抽出された発明を実施する場合には省略部分が周知慣用技術で適宜補われるものである。
【0078】
【発明の効果】
以上説明したように本発明によれば、第一言語の単語の中に未知語が存在する場合、第二言語の単言語辞書から未知語の単語を見つけ出し、この単語を含む当該単語の属性を翻訳に反映することにより、第二言語国の人でも理解する訳文を生成でき、翻訳精度の向上を図る翻訳処理システム、翻訳処理方法及びプログラムを提供できる。
【0079】
また、第一言語の単語の中に未知語が存在する場合、この第一言語に類似する第三言語から第二言語に翻訳する翻訳辞書に訳語が存在すれば、その訳語の属性を翻訳に反映することにより、第二言語国の人でも理解する訳文を生成でき、翻訳精度の向上を図る翻訳処理システム、翻訳処理方法及びプログラムを提供できる。
【図面の簡単な説明】
【図1】翻訳処理の基本的な流れを説明する図。
【図2】本発明に係る翻訳処理システムの第1の実施の形態を示す構成図。
【図3】図1に示す翻訳処理システムを用いた本発明に係る翻訳処理方法及びプログラムによる一連の処理の流れを説明する図。
【図4】図3及び後記する図6に示す未知語変換処理の具体的な処理例を説明する図。
【図5】本発明に係る翻訳処理システムのうち、特に翻訳処理制御部を説明する第2の実施の形態を示す構成図。
【図6】図5に示す翻訳処理システムを用いた本発明に係る翻訳処理方法及びプログラムによる一連の処理の流れを説明する図。
【符号の説明】
10…第一言語入力手段、20…翻訳処理制御部、25,41…未知語判断手段、26,44…未知語変換手段、27,45…属性取得手段、28,46…第二言語生成手段、43…類似語決定手段、30…翻訳結果出力手段。

Claims (10)

  1. 第一言語を第二言語に翻訳する翻訳処理システムにおいて、
    前記第一言語の単語が翻訳辞書に登録されているか否かを判断する判断手段と、
    この判断手段により前記翻訳辞書に登録されていない単語(以下、未知語と呼ぶ)が存在する場合、当該未知語の前記第二言語の単語が前記第二言語の単言語辞書に存在する場合、当該第二言語の単語の属性を翻訳に反映し翻訳する翻訳処理手段とを備えたことを特徴とする翻訳処理システム。
  2. 請求項1に記載の翻訳処理システムにおいて、
    前記翻訳処理手段は、前記判断手段により未知語が存在すると判断された場合、第一言語及び第二言語の言語種別の関係を考慮しつつ第二言語に置き換える未知語変換手段と、この第二言語に置き換えた未知語が前記第二言語の単言語辞書に存在する場合、この第二言語の単語及び当該単語の属性を取得する属性取得手段と、この属性取得手段で取得される単語の属性を翻訳に反映し、訳文を生成する第二言語生成手段とを設けたことを特徴とする翻訳処理システム。
  3. 第一言語を第二言語に翻訳する翻訳処理方法において、
    前記翻訳処理対象となる第一言語の文を入力する第一言語入力ステップと、このステップで入力される第一言語の文の単語が翻訳辞書に登録されているか否かを判断する判断ステップと、この判断ステップにより前記翻訳辞書に登録されていない未知語が存在する場合、当該未知語の前記第二言語の単語が前記第二言語の単言語辞書に存在する場合、この単語の属性を翻訳に反映し翻訳する翻訳処理ステップとを有することを特徴とする翻訳処理方法。
  4. 第一言語を第二言語に翻訳するコンピュータに、
    前記第一言語の文の単語が翻訳辞書に登録されているか否かを判断する判断機能と、この判断機能により前記翻訳辞書に登録されていない未知語が存在する場合、第一言語及び第二言語の言語種別の関係を考慮しつつ第二言語に置き換える未知語変換機能と、この第二言語に置き換えた未知語に基づいて前記第二言語の単言語辞書の辞書引きを行い、前記第二言語の単語が存在する場合、この第二言語の単語及び当該単語の属性を取得する属性取得機能と、この属性取得機能で取得される当該単語の属性を翻訳に反映し翻訳する第二言語生成機能とを実現させることを特徴とするプログラム。
  5. 第一言語を第二言語に翻訳する翻訳処理システムにおいて、
    前記第一言語の単語が第1の翻訳辞書に登録されているか否かを判断する判断手段と、
    この判断手段により前記翻訳辞書に登録されていない未知語が存在する場合、当該未知語が第三言語から第二言語に翻訳する際に使用される第2の翻訳辞書による辞書引きにより、当該第2の翻訳辞書に訳語が存在する場合、当該訳語及びこの訳語の属性を反映し翻訳する翻訳処理手段とを備えたことを特徴とする翻訳処理システム。
  6. 請求項5に記載の翻訳処理システムにおいて、
    前記翻訳処理手段は、前記判断手段により未知語が存在すると判断された場合、前記第一言語に類似する第三言語を決定する類似言語決定手段と、この決定後、第一言語及び第三言語の言語種別の関係を考慮しつつ第三言語に置き換える未知語変換手段と、この第三言語に置き換えた未知語に基づいて前記第三言語から第二言語に翻訳する前記第2の翻訳辞書の辞書引きを行い、この第2の翻訳辞書に訳語が存在する場合、当該訳語及びこの訳語の属性を翻訳に反映し翻訳する手段とを備えたことを特徴とする翻訳処理システム。
  7. 第一言語を第二言語に翻訳する翻訳処理方法において、
    前記翻訳処理対象となる第一言語の文を入力する第一言語入力ステップと、このステップで入力される第一言語の文の単語が翻訳辞書に登録されているか否かを判断する判断ステップと、この判断ステップにより前記翻訳辞書に登録されていない未知語が存在する場合、前記第一言語に類似する第三言語を決定する類似言語決定ステップと、この決定後、第一言語及び第三言語の言語種別の関係を考慮しつつ第三言語に置き換える未知語変換手段と、この第三言語に置き換えた未知語に基づいて前記第三言語から第二言語に翻訳する前記第2の翻訳辞書の辞書引きを行い、この第2の翻訳辞書に訳語が存在する場合、当該訳語及びこの訳語の属性を翻訳に反映するステップとを有することを特徴とする翻訳処理方法。
  8. 第一言語を第二言語に翻訳するコンピュータに、
    前記第一言語の文の単語が翻訳辞書に登録されているか否かを判断する判断機能と、この判断結果に基づいて前記未知語が存在する場合、前記第一言語に類似する第三言語を決定する類似言語決定機能と、この決定後、第一言語及び第三言語の言語種別の関係を考慮しつつ第三言語に置き換える未知語変換機能と、この第三言語に置き換えた未知語に基づいて前記第三言語から第二言語に翻訳する前記第2の翻訳辞書の辞書引きを行い、この第2の翻訳辞書に訳語が存在する場合、当該訳語及びこの訳語の属性を反映し、翻訳する機能とを実現させることを特徴とするプログラム。
  9. 第一言語を第二言語に翻訳する翻訳処理システムにおいて、
    前記第一言語の単語が翻訳辞書に登録されているか否かを判断する判断手段と、
    この判断手段により前記翻訳辞書に登録されていない未知語が存在する場合、当該未知語の前記第二言語の単語が前記第二言語の単言語辞書に存在するか否かを判断し、当該単言語辞書に存在する場合、当該第二言語の単語及びこの単語の属性を用いて翻訳する第1の翻訳処理手段と、
    この第1の翻訳処理手段により前記第二言語の単語が前記第二言語の単言語辞書に存在しない場合、第一言語に類似する第三言語を見つけ出し、この第三言語から第二言語を翻訳する翻訳辞書から第二言語の訳語が存在する場合、この訳語及びこの訳語の属性を用いて翻訳する第2の翻訳処理手段とを備えたことを特徴とする特徴とする翻訳処理システム。
  10. 第一言語を第二言語に翻訳する翻訳処理システムにおいて、
    前記第一言語の単語が翻訳辞書に登録されているか否かを判断する判断手段と、
    この判断手段により前記翻訳辞書に登録されていない未知語が存在する場合、第一言語に類似する第三言語を見つけ出し、この第三言語から第二言語を翻訳する翻訳辞書に第二言語の訳語が存在する場合、この訳語及びこの訳語の属性を用いて翻訳する第3の翻訳処理手段と、
    この第3の翻訳処理手段により第三言語から第二言語を翻訳する翻訳辞書に第二言語の訳語が存在しない場合、前記第一言語の未知語の前記第二言語の単語が前記第二言語の単言語辞書に存在するか否かを判断し、当該単言語辞書に存在する場合、当該第二言語の単語及びこの単語の属性を用いて翻訳する第4の翻訳処理手段とを備えたことを特徴とする翻訳処理システム。
JP2003181253A 2003-06-25 2003-06-25 翻訳処理システム、翻訳処理方法及びプログラム Pending JP2005018350A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003181253A JP2005018350A (ja) 2003-06-25 2003-06-25 翻訳処理システム、翻訳処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003181253A JP2005018350A (ja) 2003-06-25 2003-06-25 翻訳処理システム、翻訳処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2005018350A true JP2005018350A (ja) 2005-01-20

Family

ID=34182011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003181253A Pending JP2005018350A (ja) 2003-06-25 2003-06-25 翻訳処理システム、翻訳処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2005018350A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015082204A (ja) * 2013-10-22 2015-04-27 富士通株式会社 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015082204A (ja) * 2013-10-22 2015-04-27 富士通株式会社 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法

Similar Documents

Publication Publication Date Title
JP4237001B2 (ja) 文書のコロケーション誤りを自動的に検出するシステムおよび方法
JP4404211B2 (ja) マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
US9239826B2 (en) Method and system for generating new entries in natural language dictionary
KR101266361B1 (ko) 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법
JP2007257644A (ja) 訳語候補文字列予測に基づく訳語取得のためのプログラム、方法および装置
WO2005059771A1 (ja) 対訳判断装置、方法及びプログラム
JP2005216126A (ja) 他言語のテキスト生成方法及びテキスト生成装置
Sawalha et al. Fine-grain morphological analyzer and part-of-speech tagger for Arabic text
US20040254783A1 (en) Third language text generating algorithm by multi-lingual text inputting and device and program therefor
CN109815503B (zh) 一种人机交互翻译方法
JP2009205357A (ja) 中国語の品詞を判定する装置、方法およびプログラム
Salam et al. Developing the bangladeshi national corpus-a balanced and representative bangla corpus
JP2000163441A (ja) 辞書作成方法及び装置及び辞書作成プログラムを格納した記憶媒体及び検索要求作成方法及び装置及び検索要求作成プログラムを格納した記憶媒体及び多言語対応情報検索システム
JP2005018350A (ja) 翻訳処理システム、翻訳処理方法及びプログラム
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JP4843596B2 (ja) 機械翻訳装置及び機械翻訳プログラム
Sankaravelayuthan et al. English to tamil machine translation system using parallel corpus
KR950013129B1 (ko) 기계번역장치 및 방법
JP4313967B2 (ja) 自然言語変換システム
JP2011175306A (ja) 情報処理装置
JP2000250914A (ja) 機械翻訳方法、装置、および機械翻訳プログラムを記録した記録媒体
JP2947554B2 (ja) 機械翻訳装置
JP2608384B2 (ja) 機械翻訳装置及びその方法
JP2004326584A (ja) 対訳固有表現抽出装置及び方法、対訳固有表現抽出プログラム
JP3313810B2 (ja) アスペクト処理装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060516