JP3999808B2 - 翻訳システム、翻訳処理方法および翻訳処理用記録媒体 - Google Patents

翻訳システム、翻訳処理方法および翻訳処理用記録媒体 Download PDF

Info

Publication number
JP3999808B2
JP3999808B2 JP2007011814A JP2007011814A JP3999808B2 JP 3999808 B2 JP3999808 B2 JP 3999808B2 JP 2007011814 A JP2007011814 A JP 2007011814A JP 2007011814 A JP2007011814 A JP 2007011814A JP 3999808 B2 JP3999808 B2 JP 3999808B2
Authority
JP
Japan
Prior art keywords
document
translation
translated
dictionary
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2007011814A
Other languages
English (en)
Other versions
JP2007133906A (ja
Inventor
悦雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2007011814A priority Critical patent/JP3999808B2/ja
Publication of JP2007133906A publication Critical patent/JP2007133906A/ja
Application granted granted Critical
Publication of JP3999808B2 publication Critical patent/JP3999808B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

本発明は、辞書を構築するための翻訳システム、翻訳処理方法および翻訳処理用記録媒体に関する。
機械翻訳システムは、原文を翻訳処理するときに用いる訳語を記憶する翻訳辞書部およびある言語の原文に対して翻訳辞書から複数の訳語を取り出し、その中から適切と思われる1つの訳語を選択し所要の言語に翻訳する翻訳処理部などで構成されている。
ところで、翻訳辞書の構築にあっては、専門分野の辞書(書籍)から原文の各単語ごとに適切と思われる複数の訳語を取り出して翻訳辞書に登録するとか、或いは予め既に多数の対訳データが用意されていれば、その対訳データを用いて翻訳辞書を構築することは既に知られている。
しかしながら、以上のような翻訳辞書を構築するに際し、各原文の単語ごとに同一の意味、内容をもつ対訳データが大量に必要となるが、現在のところ実際の翻訳処理の実用に耐えうるだけの対訳データの入手が困難である。
また、翻訳辞書には各原文の単語ごとに複数の訳語が登録されているので、ある1つの原文の翻訳に対し、複数の訳語が選択対象として出てくることが多い。今、1つの原文である例えば「PC」に対して、日本語の訳語では例えば「パソコン」、「プログラム カウンター」、「プログラマブル コントローラ」、「プリント回路」、「加圧コンクリート」などが出てくるが、これらの中から何れを用いるかを判断する必要がある。従来の機械翻訳システムでは、文書の分野、他の語句との関係から適切な訳語を判断するが、例えば「girl」を「少女」と訳すか、「乙女」と訳すかはそのどちらでも判断できなかった。
さらに、翻訳辞書の構築にあっては、翻訳の品質を高める観点から、原文文書と訳文文書との対が必要となるが、これら対となる対応文書を得ることが難しい。
本発明は上記実情に鑑みてなされたもので、ある言語を翻訳するに際し、複数の訳語が存在する時、適切な訳語を迅速に選択可能とする翻訳システムを提供することにある。
さらに、本発明は、ある言語を翻訳するに際し、複数の訳語が存在する時、適切な訳語を迅速に選択する翻訳処理方法を提供することにある。
さらに、本発明は、ある言語を翻訳するに際し、複数の訳語が存在する時、適切な訳語を選択するための翻訳処理用記録媒体を提供することにある。
上記問題点を解決するために、請求項1に対応する発明は、ハイパーテキストの文書画面の行き先(URL)を指定し、WWWサーバから原文となる言語のホームページに係わる文書または当該文書のリンク先である原文となる言語のホームページに係わる文書を取り込んで記憶する原文文書取り込み手段と、入力部から翻訳対象原文が入力されると、当該翻訳対象原文について前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示し、複数の訳語が抽出されたとき、選択指示に従って選択し翻訳処理する翻訳処理手段と、前記原文文書取り込み手段によって取り込んで記憶した前記原文となる言語のホームページに係わる文書を前記翻訳対象原文として翻訳する際、前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示し、複数の訳語が存在するとき、前記原文となる言語のホームページに係わる文書にリンクされている対象言語の訳文の文書が存在するか否かを参照し、当該対象言語の訳文の文書が存在するとき、その訳文の文書を取り込み、当該訳文の文書の中に対応する訳語があれば、当該訳語を優先選択し、前記翻訳処理手段に渡して翻訳処理させる訳語選択参照手段とを設けた翻訳システムである。
この請求項1に対応する発明は、以上のような手段を講じたことにより、WWWサーバから原文となる言語のホームページに係わる文書を取り込み、翻訳辞書を用いて翻訳するが、このとき文書のある単語に複数の訳語があれば、原文となる言語のホームページに係わる文書のリンク先に訳語の言語をもつ文書の中に前記単語の訳語があれば、それを優先的に選択し翻訳するので、適切な訳語を用いて精度よく翻訳できる。
また、請求項2に対応する発明は、通信制御部、入力部、翻訳処理制御部、データ記憶部及び辞書・文法記憶部を備えた翻訳処理用コンピュータによって、翻訳対象原文を翻訳する翻訳処理方法であって、
前記翻訳処理制御部が、前記入力部からの指示に基づいてハイパーテキストに係わる文書の翻訳か否かを判断する判断ステップと、この判断ステップによってハイパーテキストに係わる文書でないと判断されたとき、前記入力部から入力される前記翻訳対象原文を前記データ記憶部に記憶すると共に前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示する第1の表示ステップと、複数の訳語が抽出されたとき、選択指示に従って選択し翻訳処理する翻訳処理ステップと、前記判断ステップによってハイパーテキストに係わる文書の翻訳と判断されたとき、ハイパーテキストの文書画面の行き先(URL)を指定し、前記通信制御部を介してWWWサーバから原文となる言語のホームページに係わる文書または当該文書のリンク先である原文となる言語のホームページに係わる文書を前記前記翻訳対象原文として取り込んで前記データ記憶部に記憶する原文文書取り込みステップと、この原文文書取り込みステップで取り込んだホームページに係わる文書について前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示する第2の表示ステップと、複数の訳語が抽出されたとき、前記原文となる言語のホームページに係わる文書にリンクされている前記対象言語の訳文の文書が存在するか否かを参照し、当該対象言語の訳文の文書が存在するとき、当該訳文の文書の中にある前記翻訳対象原文の単語に対応する訳語を優先選択して翻訳処理する訳語選択参照ステップとを備えることにより、適切な訳語を用いて精度よく翻訳できる。
さらに、請求項3に対応する発明は、通信制御部、入力部、翻訳処理制御部、データ記憶部及び辞書・文法記憶部を備えた翻訳処理用コンピュータによって、翻訳対象原文を翻訳するプログラムを記録した翻訳処理用記憶媒体であって、
前記翻訳処理用コンピュータに、
前記翻訳処理制御部によって、前記入力部からの指示に基づいてハイパーテキストに係わる文書の翻訳か否かを判断する判断手順と、この判断手順によってハイパーテキストに係わる文書でないと判断されたとき、前記入力部から入力される前記翻訳対象原文を前記データ記憶部に記憶すると共に前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示する第1の表示手順と、複数の訳語が抽出されたとき、選択指示に従って選択し翻訳処理する翻訳処理手順と、前記判断手順によってハイパーテキストに係わる文書の翻訳と判断されたとき、ハイパーテキストの文書画面の行き先(URL)を指定し、前記通信制御部を介してWWWサーバから原文となる言語のホームページに係わる文書または当該文書のリンク先である原文となる言語のホームページに係わる文書を前記前記翻訳対象原文として取り込んで前記データ記憶部に記憶する原文文書取り込み手順と、この原文文書取り込み手順で取り込んだホームページに係わる文書について前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示する第2の表示手順と、複数の訳語が抽出されたとき、前記原文となる言語のホームページに係わる文書にリンクされている前記対象言語の訳文の文書が存在するか否かを参照し、当該対象言語の訳文の文書が存在するとき、当該訳文の文書の中にある前記翻訳対象原文の単語に対応する訳語を優先選択して翻訳処理する訳語選択参照手順とを実現させるための前記プログラムを記録した前記翻訳処理用コンピュータ読み取り可能な翻訳処理用記録媒体である。
このような翻訳処理用記憶媒体によれば、ある言語を翻訳するに際し、複数の訳語が存在する時、適切な訳語を選択し翻訳処理できる。
本発明によれば、次のような種々の効果を奏する。
請求項1および2の発明では、WWWサーバから原文となるホームページに係わる文書を取り込んで翻訳するに際し、複数の訳語が存在する時、原文となるホームページに係わる文書のリンク先に訳語となるホームページに係わる文書があれば、当該文書に存在する訳語を優先的に選択し翻訳するので、適切な訳語を選択して精度の高い翻訳を行うことができる。
請求項3の発明では、WWWサーバから原文となるホームページに係わる文書を取り込んで翻訳するに際し、複数の訳語が存在する時、ホームページに係わる文書にとって適切な訳語を選択できる翻訳処理用記録媒体を提供できる。
(辞書構築支援システムに係わる発明の実施の形態)
図1は本発明に係わる辞書構築支援システムの一実施の形態を示す機能ブロック図である。
このシステムは、WWWブラウザで作成されるハイパーテキストなどの文書をもつコンピュータによって構成される機械翻訳システム1と、同じくコンピュータで構成され、例えば日本語ホームページに係わる文書および日本語ホームページと対の関係にある日本語以外の言語で作成されるホームページに係わる文書をもつ複数のWWWサーバ21、…、2nがネットワーク3に接続されている。
この機械翻訳システム1は、大きく分けて第1の言語を第2の言語に翻訳処理するための訳語を決定し登録する辞書構築支援システム10と、ある言語の原文に対して構築された翻訳辞書の訳語を用いて翻訳処理を行う翻訳処理構成部分20とから成る。
この辞書構築支援システム10は、入力部11、表示部12、辞書構築支援用記録媒体13、データ記憶部14、CPUで構成される辞書構築支援処理部15、同一内容判定部16および通信制御部17等によって構成されている。
入力部11は、ハイパーテキストの文書画面表示指示その他必要なデータ、コマンドを入力するもので、通常、キーボード、OCR、タブレット、マウス、ライトペン或いはFDD、ネットワークなどが用いられ、ハイパーテキストの文書画面の絵または文章などの行き先(URL)をマウスでクリックすることにより、行き先となるWWWサーバの例えば日本語および日本語以外の言語のホームページに係わる文書を取り込む機能をもっている。
前記表示部12は、ハイパーテキストの文書画面の表示、WWWサーバから取り込むホームページデータの表示その他入力部11から入力されるデータやデータ記憶部14に記憶されるデータ等を表示するものであって、CRT、ピットマップディスプレイ、投影される壁面やゴーグルなどが用いられる。
前記辞書構築支援用記録媒体13は、例えば後記する図3に示すような辞書構築支援用プログラムを格納するためのものであって、通常、磁気的、電気的、光学的、機械的などの記憶素子、つまり、FDD、CD ROM、磁気ディスク、光ディスクなどが用いられる。また、この記憶媒体13は、辞書構築支援用プログラムだけでなく、必要に応じて翻訳処理上必要なプログラム例えば画像表示用プログラム、通信制御用プログラムなどを記憶する。
前記データ記憶部14は、WWWサーバから取り込んだ日本語またおよび日本語以外の言語のホームページに係わる文書データや辞書構築支援処理過程のデータ、さらに入力部11から入力されたデータなどを記憶するものであって、磁気的、電気的、光学的、機械的な記憶素子などが用いられる。
前記辞書構築支援処理部15は、辞書構築支援用記録媒体13に記憶される辞書構築支援用プログラムを用いて辞書構築支援処理を実行したり、入力部11から入力されるホームページデータの取り込みアドレスまたはコマンドなどを出力する機能をもっている。
前記同一内容判定部16は、WWWサーバから取り込んだ例えば日本語ホームページに係わる文書と日本語以外の言語のホームページに係わる文書とが同一の意味、内容をもっているか否かを判定し、互いに同一の意味、内容をもっているとき、原文文書(例えば英語ホームページ文書)と訳文文書(例えば日本語ホームページ文書)が対応関係にあって対訳データ可能と判断する。この判定処理にあっては、一定の条件を必要とする。それは、両ホームページに係わる文書の中に存在するイメージデータ、グラフ、図柄、さらにリンク先などが同一であるとき、または割合が一定値以上のとき、両言語のホームページに記載される文章が同じ意味、内容を異なる2つの言語で表現していると判定する。さらに、この判定処理は、必ずしもイメージデータ、グラフ、図柄、さらにリンク先その他全部が完全に一致しても、記載されている文章が異なる場合もあるので、さらに文章どうしを比較し、少なくとも例えば80%以上同一であれば、残りの20%も同一であると判定してもよい。
前記通信制御部17は、リンク先アドレスの発信やホームページの取り込みアドレスまたはコマンドの発信、ホームページの取り込みなどを行う機能をもっている。
前記機械翻訳処理構成部分20は、ある言語の原文を所要とする他の言語に翻訳処理する従来公知の構成を用いるものであって、例えばある言語の原文を入力したり、他のコンピュータのFDから原文文書を入力したり、或いはネットワークから送られてくるデータを入力する入力部、この入力部から入力されるデータや翻訳結果を表示する表示部、翻訳辞書や翻訳上の文法等を記憶するデータ記憶部、入力部から入力される原文を翻訳辞書や翻訳上の文法を用いて所定の言語に翻訳する翻訳処理部その他必要な構成部分をもっている。
なお、機械翻訳処理構成部分20の入力部、表示部、データ記憶部は、辞書構築支援システム10の入力部11、表示部12、データ記憶部14等をそのまま用いてもよい。
次に、以上のような辞書構築支援システム10の動作を説明するに先立ち、WWWサーバのホームページに係わる文書を対訳データとすることの意義を説明する。
例えばインターネットのWWWサーバ21、…、2nの中には、自国語および外国語向けのホームページを作成し開示している場合があるが、例えば英語で記載されているホームページの文書に「日本語はここ」とか、逆に日本語のホームページの文書に「for English」とか記載されているとき、そのリンク先部分をクリックすれば、日本語と英語のホームページに係わる文書をダウンロードできる。しかし、これら両言語のホームページに係わる文書が同一の意味、内容をもつ保証はない。そこで、両言語のホームページに係わる文書が同一の意味、内容をもつか否かを判定し、同一の意味、内容をもつものであれば、両ホームページに記載される文章は対の関係にあり、非常に好ましい対訳データとなり、ひいては対訳データの量は大量に確保可能となる。
以上のようなインターネットのホームページの性質を踏まえて本発明システムを実現したものであり、以下、システムの動作を説明する。
入力部11からの指示に基づき、表示部12にハイパーテキストの初期画面或いは所要の画面を表示した後、画面上の行き先(URL)をクリックすると、辞書構築支援処理部15は、辞書構築支援用記録媒体13に格納されるプログラムを読み取って辞書構築支援処理を実行する。
この辞書構築支援処理は、入力部11からの指定に基づく行き先(URL)アドレスおよびホームページ取り込み用コマンドを通信管理制御部17を介して例えばWWWサーバ21に発信し、当該WWWサーバ21の例えば英語ホームページに係わる文書を取り込んでデータ記憶部14に記憶する一方、表示部12に表示する。
この英語ホームページに係わる文書から例えば「日本語はここ」と記載されているとき、そのリンク先部分をクリックし、日本語のホームページも取り込んでデータ記憶部14に記憶する一方、表示部12に表示する。逆に、日本語ホームページに係わる文書を取り込み、その文章の中に例えば「for English」と記載されている場合も同様にそのリンク先部分をクリックし、英語ホームページに係わる文書を取り込む。
しかる後、辞書構築支援処理部15は、両言語のホームページに係わる文書の意味、内容の同一性を同一内容判定部16に依頼する。この同一内容判定部16は、両ホームページに係わる文書の中に存在するイメージデータ、グラフ、図柄、さらにリンクする先などが同一であるか否かを判定する。通常、同じイメージデータ、グラフなどが使用されているとき、両言語のホームページに記載される文章の意味、内容が同じである場合が多いためである。
さらに、必要に応じて、イメージデータ、グラフ、図柄、さらにリンク先などのデータが同一であることを条件に、或いはこれらイメージデータ、グラフ、図柄、リンク先などのデータの同一を条件とせずに、両言語のホームページに記載される文章について、各言語の文法に基づいて文章を比較し、何%同一であるか否かを調べる。ここで、少なくとも80%以上同一であれば、他の残りの20未満の文章も同一であると判定し、辞書構築支援処理部15に通知する。
ここで、辞書構築支援処理部15は、日本語と英語のホームページに係わる文書から順次原文の単語と訳文の単語とを対の形で取り出し、対訳語としてデータ記憶部14または図示されていないが翻訳処理構成部分20の翻訳辞書に登録していく。
従って、以上のような実施の形態によれば、同一のWWWサーバの異なる両言語のホームページに係わる文書を取り込み、一定の条件のもとに同一性を調べ、両ホームページが同一であると判定するので、両言語のホームページに記載される文章を対訳データとして取得でき、国内および外国から発信されるホームページが無数存在することを考えれば、大量の対訳データを入手できる。しかも、辞書構築支援用プログラムに基づいて自動的に辞書構築支援処理を実行するので、それ程コストおよび時間を必要とせずに対訳データを入手でき、また精度の高い翻訳辞書を容易に構築することができる。
(翻訳処理方法および翻訳処理用記録媒体に係わる発明の実施の形態)
図2は翻訳処理用記録媒体を用いた辞書構築支援システムの一実施形態を示す図、図3は翻訳処理用記録媒体のプログラムを用いて翻訳処理を行う翻訳処理方法を説明するフローチャートである。なお、図2において図1と同一機能部分には同一の符号を付して説明する。
この辞書構築支援システム10は、多数のWWWサーバ2、…をもつコンピュータネットワーク3に接続されている。
入力部11は、ハイパーテキストの文書画面に基づきマウスなどで行き先(URL)をクリックし、行き先となるWWWサーバの例えば日本語および日本語以外の言語のホームページに係わる文書を取り込む指示を行う。通常、キーボード、OCR、タブレット、マウス、ライトペン或いはFDD、ネットワークなどが用いられる。
表示部12は、ハイパーテキストの文書画面の表示、WWWサーバから取り込むホームページに係わる文書の表示その他入力部11から入力されるデータやデータ記憶部14に記憶されるデータ等を表示するものであって、CRT、ピットマップディスプレイ、投影される壁面やゴーグルなどが用いられる。
辞書構築支援用記録媒体13は図3に示すフローチャートに示すプログラムが格納されている。データ記憶部14は図1で説明したような必要なデータを記憶する。
辞書構築支援処理本体部18は、CPUで構成され、辞書構築支援用記録媒体13に格納されるプログラムを読み取って、図1に示す辞書構築支援処理部15および同一内容判定部16と同様な機能を行う。機能分けすると、辞書構築支援処理本体部18は、あるWWWサーバ2から両ホームページの文書を取り込むホームページ取り込み機能、これら両ホームページの同一性を判定する同一性判定機能、両ホームページの文書が同一であるとき、原文文書と対訳文書とを対の形で翻訳辞書に登録する対訳データ登録機能を実現する。
次に、辞書構築支援処理本体部18が辞書構築支援用記録媒体13に格納されているプログラムに基づいて図3に示す辞書構築支援処理を実行する。
入力部11からの指示に基づき、表示部12にハイパーテキスト画面を表示した後、行き先(URL)をクリックすると、CPUで構成される辞書構築支援処理本体部18は、辞書構築支援用記録媒体13のプログラムを読み取って辞書構築支援処理を実行する。
この辞書構築支援処理本体部18は、ホームページ取り込み機能を実行する。つまり、行き先のクリックによって指定されたWWWサーバ2のある言語で記載されるホームページAを取り込んでデータ記憶部14に記憶するとともに、表示部12に表示する(ST1)。しかる後、このホームページAの中に他の言語で書かれたホームページを示す部分があるか否かを判断する(ST2)。ここで、他の言語で書かれたホームページを示す部分があれば、そのホームページBを読み込んで同様にデータ記憶部14に記憶するとともに、表示部12に表示する(ST3)。
次に、辞書構築支援処理本体部18は同一性判定機能を実行する。この同一性判定機能は、両ホームページA、Bの中からイメージデータ、グラフ、図柄、さらにリンクする先などの情報C、Dを抽出する(ST4)。そして、これら情報C、Dが予め定めた割合(例えば80%)以上一致するか否かを判断する(ST5)。ここで、情報C、Dが予め定めた割合以上一致すると、両ホームページに記載される文章は同一であると判定する。
さらに、必要に応じて、イメージデータ、グラフ、図柄、さらにリンクする先などのデータが予め定めた割合以上一致することを条件に、或いはこれらイメージデータ、グラフ、図柄、リンクする先などのデータの一定割合以上の同一を条件とせずに、両ホームページに記載される文章について、各言語の文法に基づいて文章を比較し、どの程度の割合で同一であるか否かを調べる。ここで、少なくとも80%以上同一であれば、他の残りの20未満の文章も同一であると判定する。
引き続き、辞書構築支援処理本体部18は、両ホームページに記載される文章が同一であると判定されたとき、両ホームページから順次原文の単語と訳文の単語とを対の形で取り出し、対訳データとしてデータ記憶部14または機械翻訳処理システムの翻訳辞書に順次登録する(ST6)。
以上のような翻訳処理方法の実施の形態によれば、特別に専門辞書や対訳データを見つけ出すことなく、異なる両言語のホームページから大量の対訳データを迅速、かつ、低コストで適当な時間に入手しつつ、正確な翻訳辞書を容易に構築することができる。
また、以上のような翻訳処理用記録媒体を用いた辞書構築支援システムによれば、同一のWWWサーバのある言語のホームページから他の言語のホームページを容易に探し出して取り込むことができる。また、両ホームページの中から一定の条件のもとに両ホームページに記載される文章の同一性をほぼ正確に判定できる。さらに、両ホームページに記載される文章が同一と判定したとき、かかる文章を原文文書と対訳文書とを対の形で取り出し、対訳データとして翻訳辞書に登録できる。
なお、記録媒体としては、CD−ROMを用いるが、それ以外には例えば磁気テープ、DVD−ROM、フロッピー(登録商標)ディスク、MO、MD、CD−R、メモリカードなどを用いてもよい。
(翻訳処理システムに係わる発明の実施の形態)
図4は本発明に係わる翻訳システムの一実施の形態を示す機能ブロック図である。
このシステムは、図1と同様に、WWWブラウザで作成されるハイパーテキストなどの文書をもつコンピュータによって構成される翻訳システム1がコンピュータネットワーク3を介して日本語以外の言語例えば第1の英語ホームページP1、そのリンク先となる第2の英語ホームページP2および日本語ホームページP3などをもつ少なくとも1台のWWWサーバ2、…が接続されている。
この翻訳システム1は、入力部31、表示部32、翻訳処理用記録媒体33、データ記憶部34、翻訳辞書や翻訳処理用文法を記憶する辞書・文法記憶部35、翻訳処理制御部36、訳語選択参照部37および通信制御部38等によって構成されている。
前記入力部31は、ハイパーテキストの文書画面表示指示その他必要なデータ、コマンドを入力するもので、通常、キーボード、OCR、タブレット、マウス、ライトペン或いはFDD、ネットワークなどが用いられ、ハイパーテキストの文書画面に基づきマウスなどで行き先(URL)をクリックし、WWWサーバ2から例えば日本語および日本語以外の言語のホームページに係わる文書を取り込む機能をもっている。
前記表示部32は、ハイパーテキストの文書画面の表示、WWWサーバ2から取り込むホームページデータに係わる文書の表示その他入力部31から入力されるデータなどを表示するものであって、CRT、ビットマップディスプレイ、投影される壁面やゴーグルなどが用いられる。
前記翻訳処理用記録媒体33は、ある言語の原文を所要の言語に翻訳する時に用いられるプログラムを格納するものであるが、その他例えば通信制御用プログラムや表示処理用プログラムなども格納されている。データ記憶部34は、ハイパーテキストの文書の表示画面データ、WWWサーバ2から取り込むホームページに係わる文書、入力部31から入力される翻訳原文その他翻訳処理によって得られる翻訳結果などを記憶する。辞書・文法記憶部35は、第1言語の原文単語を所要とする第2言語の単語に翻訳する訳語の他、第1言語の原文単語を第2言語の単語に翻訳するときの文法データが記憶されている。
これら翻訳処理用記録媒体33、データ記憶部34および辞書・文法記憶部35は、通常、磁気的、電気的、光学的、機械的などの記憶素子、つまり、FDD、CD ROM、磁気ディスク、光ディスクなどが用いられており、かつ、これらが一体または別体の記録媒体であってもよい。
前記翻訳処理制御部36は、翻訳処理用記録媒体33に記憶される翻訳処理用プログラムを用いて翻訳処理を実行したり、入力部31から入力されるホームページデータの取り込みコマンドなどを出力したり、各構成部分を統括制御する機能をもっている。
前記訳語選択参照部37は、翻訳処理制御部36において例えば英語ホームページに係わる文書を翻訳する時、辞書・文法記憶部35から複数の訳語が抽出された時、英語ホームページに係わる文書のリンク先に日本語のホームページに係わる文書が存在するとき、この日本語のホームページに係わる文書中に含まれている語句を訳語として優先的に選択し、翻訳処理制御部36に提供する機能をもっている。
前記通信制御部38は、URLアドレスの発信やホームページの取り込みコマンドの発信、ホームページデータの取り込みなどを行う機能をもっている。
前記通信制御部38は、URLアドレスの発信やホームページの取り込みコマンドの発信、ホームページデータの取り込みなどを行う機能をもっている。
次に、以上のような構成の翻訳システムの動作について説明する。
入力部31から翻訳すべき原文を入力すると、翻訳処理制御部6は、入力部31からの原文をデータ記憶部34に記憶した後、当該原文に関し、辞書・文法記憶部35の辞書から所要の言語に関連する文法規則にしたがって訳語を取り出して表示部32に表示し、複数の訳語があるとき適宜選択し、翻訳結果としてデータ記憶部34に記憶する。そして、原文の翻訳結果を表示部32に表示する。
ここで、翻訳処理制御部6は、例えば原文の収集がハイパーテキストに基づくホームページに係わる文書の翻訳の場合には次のような処理を行う。
先ず、予め翻訳処理制御部36が通信制御部38を介してWWWサーバ2から例えば英語ホームベージP1に係わる文書または当該文書のリンク先である例えば英語ホームページP2に係わる文書を取り込み、データ記憶部34に記憶し、かつ、表示部32に表示する。そして、翻訳処理制御部6において取り込んだ文書について、辞書・文法記憶部35の辞書および文法に従って翻訳処理を行う。
ところで、この原文である英語のホームページに係わる文書のある単語を翻訳する際、辞書・文法記憶部35から複数の訳語が抽出されたとき、前記WWWサーバ2の英語ホームページに係わる文書P1またはこの文書P1のリンク先である英語ホームページに係わる文書P2にリンクされている訳語言語つまり日本語ホームページに係わる文書P3があれば、当該文書P3を取り込んで訳語選択参照部37に記憶する。そして、この日本語ホームページに係わる文書P3の中に文書P1またはP2の単語に対応する訳語があれば、その訳語を優先的に選択し翻訳結果とするので、翻訳品質の向上を図ることができる。
従って、以上のような実施の形態によれば、WWWサーバ2の原文の文書を翻訳するとき、第1義的には辞書・文法記憶部35の訳語を用いて翻訳するが、複数の訳語あるとき、WWWサーバ2の原文文書にリンクされている訳語言語の文書の中に対応する訳語があるとき、その訳語を優先的に選択し翻訳結果とするので、翻訳品質の向上を図ることができる。
(翻訳処理方法および翻訳処理用記録媒体に係わる発明の実施の形態)
図5は翻訳処理用記録媒体の翻訳処理用プロブラムを読み取って所定の機能を実現する翻訳処理システムの一実施形態を示す図、図6は翻訳処理用プログラムを用いて翻訳処理を行う翻訳処理方法を説明するフローチャートである。なお、図5において図4と同一機能部分は同一の符号を付して説明する。
この翻訳処理システム1は、多数のWWWサーバ2、…をもつコンピュータネットワーク3に接続されている。
入力部11(通信制御部38)は、翻訳しようとする原文を入力する部分であって、例えばハイパーテキストの文書画面に基づきマウスなどで行き先(URL)をクリックし、行き先となるWWWサーバから例えば原文である英語ホームページに係わる文書または当該文書のリンク先である英語ホームページに係わる文書を取り込む指示を入力し、さらに翻訳処理制御指示や前記ホームページに係わる文書と同一の意味、内容をもつ日本語ホームページに係わる文書を取り込む指示を入力するものであって、通常、キーボード、OCR、タブレット、マウス、ライトペン或いはFDD、ネットワークなどが用いられる。表示部12は、ハイパーテキストの文書画面の表示、WWWサーバから取り込むホームページデータの表示、その他入力部11から入力される原文や翻訳結果を表示するものであって、CRT、ビットマップディスプレイ、投影される壁面やゴーグルなどが用いられる。
前記翻訳処理用記録媒体33は、ある言語の原文を所要の言語に翻訳する時に用いられるプログラムを格納するものであって、例えば図6に示すようなフローチャートに示す翻訳処理を実行する。データ記憶部34は、ハイパーテキストの文書の表示画面データ、WWWサーバ2から取り込む原文となるホームページに係わる文書またはそのリンク先の文書、その他翻訳結果のデータを記憶するものである。辞書・文法記憶部35は、第1言語の原文単語を所要とする第2言語の単語に翻訳する訳語を記憶する他、第1言語の原文単語を第2言語の単語に翻訳するときの文法データが記憶されている。これら翻訳処理用記録媒体33、データ記憶部34および辞書・文法記憶部35は、通常、磁気的、電気的、光学的、機械的などの記憶素子、つまり、FDD、CD ROM、磁気ディスク、光ディスクなどが用いられており、かつ、これらが一体または別体の記録媒体であってもよい。
前記翻駅処理制御本体部39は、CPUで構成され、翻訳処理用記録媒体13に格納されている翻訳処理プログラムを読み取って図6に示す翻訳処理を実行する機能をもっている。この翻訳処理制御本体部39について機能分けすると、WWWサーバ2から原文となる日本語以外の言語例えば英語ホームページに係わる文書およびその文書のリンク先の英語ホームページに係わる文書を取り込む原文取り込み機能、この原文取り込み機能によって取り込んだ原文に基づいて翻訳辞書から訳語を取り出して翻訳する翻訳処理機能、この翻訳処理機能の段階で複数の訳語を抽出したとき、前記英語ホームページに係わる文書からリンク先の日本語ホームページに係わる文書を取り込んで参照し、この文書に含まれる語句を優先的に訳語として選択する訳語選択参照機能を実現する。
次に、翻訳処理制御本体部39が翻訳処理用記録媒体33に格納されるプログラムに基づいて図6に示す翻訳処理を実行する。
翻訳処理制御本体部39においては、翻訳処理用記録媒体33のプログラムに基づいて原文取り込み機能を実現する。
すなわち、入力部31からの指示に基づき、ハイパーテキストの文書に係わる翻訳か否かを判断する(ST11)。ここで、一般の翻訳処理の場合には、従来公知の手段、つまり入力部31から入力される翻訳原文を受け、辞書・文法記憶部35の訳語を抽出し選択確認して翻訳結果を得る(ST12)。
ステップST11においてハイパーテキストの文書に係わる翻訳である場合には、行き先(URL)リンクをクリックするとともに、ホームページ取り込みコマンドを発信し、WWWサーバ2から原文となる例えば英語ホームページに係わる文書およびその文書のリンク先の英語ホームページに係わる文書を取り込み、データ記憶部34に記憶するとともに、表示部32に表示する(ST13)。
しかる後、翻訳処理制御本体部39は、翻訳処理用記録媒体33のプログラムに基づいて翻訳処理を実現する。この翻訳処理は、原文となる例えば英語ホームページに係わる文書について辞書・文法記憶部35の文法に従って辞書から順次訳語を抽出した後、原文である文書のある単語に関し、複数の訳語があるか否かを判断する(ST14)。ここで、訳語が1つしかないとき、その訳語を用いて翻訳結果を得る。
次に、翻訳処理制御本体部39は、翻訳処理用記録媒体33のプログラムに基づいて訳語選択参照機能を実現する。この訳語選択参照機能は、ステップST14においてある原文の1つの単語に複数の訳語が存在する場合、前記WWWサーバ2の前記英語ホームページに係わる文書のリンク先に日本語ホームページに係わる文書があるか否かを判断し(ST15)、日本語ホームページに係わる文書があれば、その文書を取り込んで訳語選択参照部35を格納する(ST16)。そして、前記原文である英語ホームページに係わる文書と日本語ホームページに係わる文書とを比較参照し、当該日本語ホームページに係わる文書の中に原文単語に対応する日本語の語句があれば、それを優先的に選択し、原文単語の訳語として採用し翻訳処理を実行する(ST17)。
従って、以上のような翻訳処理方法の実施の形態によれば、WWWサーバ2のハイパーテキストの文書である例えば英語ホームページに係わる文書またはそのリンク先である文書を翻訳するとき、一義的には辞書・文法記憶部35を用いて翻訳するが、その原文である文書のある単語に関し、複数の訳語が存在するとき、英語ホームページに係わる文書のリンク先に日本語ホームページに係わる文書または日本語に係わる文書があるとき、その日本語ホームページに係わる文書または日本語に係わる文書を参照し、その中から原文である文書のある単語に対応する日本語の訳語を優先的に選択し翻訳するので、辞書・文法記憶部35に選択訳語が不足している場合でも確実に翻訳できる。また、ハイパーテキストの文書においてその文書内にリンク先として英語に係わる文書および日本語に係わる文書があるとき、これらは内容的に同じ分野の文書で記述していることが多いので、日本語の訳語を優先的に選択して翻訳すれば、翻訳品質の向上を図ることができ、さらに翻訳処理の効率を上げることもできる。
また、以上のような翻訳処理用記録媒体33を用いた翻訳処理システムによれば、WWWサーバ2から原文となる例えば英語ホームページに係わる文書およびその文書のリンク先の英語ホームページに係わる文書を取り込み、辞書・文法記憶部35の文法に従って辞書から順次訳語を抽出し翻訳結果を得ることができる。
また、原文の1つの単語に複数の訳語が存在する場合、前記WWWサーバ2の英語ホームページに係わる文書のリンク先に日本語ホームページに係わる文書を取り出し、その文書を比較参照しながら最適な語句を見つけ出して翻訳処理を実現できる。
本発明に係わる辞書構築支援システムの一実施の形態を示す構成図。 辞書構築支援用記録媒体を説明するためのシステム構成図。 図2に示すシステムの動作および辞書構築支援方法を説明するフローチャート。 本発明に係わる翻訳システムの一実施の形態を示す構成図。 翻訳処理用記録媒体を説明するためのシステム構成図。 図4に示すシステムの動作および翻訳処理方法を説明するフローチャート。
符号の説明
1…翻訳システム
2、21、…、2n…WWWサーバ
3…コンピュータネットワーク
10…辞書構築支援システム
13…辞書構築支援用記録媒体
15…辞書構築支援処理部
16…同一内容判定部
18…辞書構築支援処理本体部
20…翻訳処理構成部分
21…ユーザ端末機
33…翻訳処理用記録媒体
36…翻訳処理制御部
37…訳語選択参照部
39…翻訳処理制御本体部

Claims (3)

  1. ハイパーテキストの文書画面の行き先(URL)を指定し、WWWサーバから原文となる言語のホームページに係わる文書または当該文書のリンク先である原文となる言語のホームページに係わる文書を取り込んで記憶する原文文書取り込み手段と、
    入力部から翻訳対象原文が入力されると、当該翻訳対象原文について前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示し、複数の訳語が抽出されたとき、選択指示に従って選択し翻訳処理する翻訳処理手段と、
    前記原文文書取り込み手段によって取り込んで記憶した前記原文となる言語のホームページに係わる文書を前記翻訳対象原文として翻訳する際、前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示し、複数の訳語が存在するとき、前記原文となる言語のホームページに係わる文書にリンクされている対象言語の訳文の文書が存在するか否かを参照し、当該対象言語の訳文の文書が存在するとき、その訳文の文書を取り込み、当該訳文の文書の中に対応する訳語があれば、当該訳語を優先選択し、前記翻訳処理手段に渡して翻訳処理させる訳語選択参照手段とを備えることを特徴とする翻訳システム。
  2. 通信制御部、入力部、翻訳処理制御部、データ記憶部及び辞書・文法記憶部を備えた翻訳処理用コンピュータによって、翻訳対象原文を翻訳する翻訳処理方法であって、
    前記翻訳処理制御部が、前記入力部からの指示に基づいてハイパーテキストに係わる文書の翻訳か否かを判断する判断ステップと、この判断ステップによってハイパーテキストに係わる文書でないと判断されたとき、前記入力部から入力される前記翻訳対象原文を前記データ記憶部に記憶すると共に前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示する第1の表示ステップと、複数の訳語が抽出されたとき、選択指示に従って選択し翻訳処理する翻訳処理ステップと、前記判断ステップによってハイパーテキストに係わる文書の翻訳と判断されたとき、ハイパーテキストの文書画面の行き先(URL)を指定し、前記通信制御部を介してWWWサーバから原文となる言語のホームページに係わる文書または当該文書のリンク先である原文となる言語のホームページに係わる文書を前記前記翻訳対象原文として取り込んで前記データ記憶部に記憶する原文文書取り込みステップと、この原文文書取り込みステップで取り込んだホームページに係わる文書について前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示する第2の表示ステップと、複数の訳語が抽出されたとき、前記原文となる言語のホームページに係わる文書にリンクされている前記対象言語の訳文の文書が存在するか否かを参照し、当該対象言語の訳文の文書が存在するとき、当該訳文の文書の中にある前記翻訳対象原文の単語に対応する訳語を優先選択して翻訳処理する訳語選択参照ステップとを備えることを特徴とする翻訳処理方法。
  3. 通信制御部、入力部、翻訳処理制御部、データ記憶部及び辞書・文法記憶部を備えた翻訳処理用コンピュータによって、翻訳対象原文を翻訳するプログラムを記録した翻訳処理用記憶媒体であって、
    前記翻訳処理用コンピュータに、
    前記翻訳処理制御部によって、前記入力部からの指示に基づいてハイパーテキストに係わる文書の翻訳か否かを判断する判断手順と、この判断手順によってハイパーテキストに係わる文書でないと判断されたとき、前記入力部から入力される前記翻訳対象原文を前記データ記憶部に記憶すると共に前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示する第1の表示手順と、複数の訳語が抽出されたとき、選択指示に従って選択し翻訳処理する翻訳処理手順と、前記判断手順によってハイパーテキストに係わる文書の翻訳と判断されたとき、ハイパーテキストの文書画面の行き先(URL)を指定し、前記通信制御部を介してWWWサーバから原文となる言語のホームページに係わる文書または当該文書のリンク先である原文となる言語のホームページに係わる文書を前記前記翻訳対象原文として取り込んで前記データ記憶部に記憶する原文文書取り込み手順と、この原文文書取り込み手順で取り込んだホームページに係わる文書について前記辞書・文法記憶部に記憶される辞書及び文法規則に従って訳語を取り出して表示する第2の表示手順と、複数の訳語が抽出されたとき、前記原文となる言語のホームページに係わる文書にリンクされている前記対象言語の訳文の文書が存在するか否かを参照し、当該対象言語の訳文の文書が存在するとき、当該訳文の文書の中にある前記翻訳対象原文の単語に対応する訳語を優先選択して翻訳処理する訳語選択参照手順とを実現させるための前記プログラムを記録した前記翻訳処理用コンピュータ読み取り可能な翻訳処理用記録媒体。
JP2007011814A 1997-03-11 2007-01-22 翻訳システム、翻訳処理方法および翻訳処理用記録媒体 Expired - Lifetime JP3999808B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007011814A JP3999808B2 (ja) 1997-03-11 2007-01-22 翻訳システム、翻訳処理方法および翻訳処理用記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP5630197 1997-03-11
JP2007011814A JP3999808B2 (ja) 1997-03-11 2007-01-22 翻訳システム、翻訳処理方法および翻訳処理用記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP10008593A Division JPH10312383A (ja) 1997-03-11 1998-01-20 翻訳システム、翻訳処理方法および翻訳処理用記録媒体

Publications (2)

Publication Number Publication Date
JP2007133906A JP2007133906A (ja) 2007-05-31
JP3999808B2 true JP3999808B2 (ja) 2007-10-31

Family

ID=38155452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007011814A Expired - Lifetime JP3999808B2 (ja) 1997-03-11 2007-01-22 翻訳システム、翻訳処理方法および翻訳処理用記録媒体

Country Status (1)

Country Link
JP (1) JP3999808B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833571B (zh) * 2010-04-13 2011-12-28 清华大学 一种从互联网上自动提取双语翻译词典的方法

Also Published As

Publication number Publication date
JP2007133906A (ja) 2007-05-31

Similar Documents

Publication Publication Date Title
US10114820B2 (en) Displaying original text in a user interface with translated text
CN100465956C (zh) 用于向网站添加个人化的值的系统、Web服务器和方法
US8046323B2 (en) Context based bookmark
US8494836B2 (en) Technology for selecting texts suitable as processing objects
JP2002278964A (ja) 翻訳支援装置、方法及び翻訳支援プログラム
US20140172413A1 (en) Short phrase language identification
JP2004334791A (ja) 機械翻訳装置、データ処理方法及びプログラム
CN111831384B (zh) 语言切换方法和装置、设备及存储介质
JP5204244B2 (ja) 誤訳の検出を支援する装置及び方法
CN109074326B (zh) 翻译系统
JP3999808B2 (ja) 翻訳システム、翻訳処理方法および翻訳処理用記録媒体
JP3467160B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
KR20000039748A (ko) 다국어 웹 문서 번역 서비스 장치 및 이를 이용한번역 서비스 방법
JP5153839B2 (ja) 対訳辞書生成装置、方法及びプログラム
CN101539914A (zh) 对网页进行可读化定制转换的技术方案
JPH10312383A (ja) 翻訳システム、翻訳処理方法および翻訳処理用記録媒体
JP2006309377A (ja) 文書検索装置および文書検索方法ならびにそのプログラムと記録媒体
KR20030045394A (ko) 인터넷상에서 제공되는 문서를 위한 자동 번역 시스템 및방법
JP5351879B2 (ja) 情報処理装置、方法及びプログラム
JPH11259477A (ja) 文書処理システムおよび記録媒体
Shah Enhancement to text alignment visualization
JPH09265469A (ja) ハイパーテキスト型文書の翻訳方法およびhtml文書の翻訳装置
JP2018142349A (ja) 翻訳システム
JP2020177474A (ja) ウェブページ多言語化装置、方法、プログラム、およびシステム
JPH10283357A (ja) 翻訳サーバ装置、サーバ翻訳処理方法、翻訳サーバ装置用記憶媒体及び翻訳サーバ装置を用いたネットワーク機械翻訳システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070809

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110817

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120817

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120817

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130817

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term