JPH10312383A - 翻訳システム、翻訳処理方法および翻訳処理用記録媒体 - Google Patents
翻訳システム、翻訳処理方法および翻訳処理用記録媒体Info
- Publication number
- JPH10312383A JPH10312383A JP10008593A JP859398A JPH10312383A JP H10312383 A JPH10312383 A JP H10312383A JP 10008593 A JP10008593 A JP 10008593A JP 859398 A JP859398 A JP 859398A JP H10312383 A JPH10312383 A JP H10312383A
- Authority
- JP
- Japan
- Prior art keywords
- document
- translation
- language
- homepage
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Transfer Between Computers (AREA)
- Machine Translation (AREA)
Abstract
にある。 【解決手段】 ハイパーテキストの文書画面のULRを
指定し、WWWサーバから異なる言語のホームページに
係わる文書を取り込む文書取り込み手段15と、この文
書取込み手段で取り込んだ両言語のホームページの文書
に存在するイメージデータ,グラフ,図柄,リンク先な
どのデータを比較し、同一の意味,内容を有するか否か
を判定する同一内容判定部16と、同一性有りと判定さ
れたとき、両言語のホームページに係わる文書から原文
と訳語との対をなす訳文データを取り出して翻訳辞書に
登録する手段15とを設けた辞書構築支援システム。
Description
めの辞書構築支援システム、機械翻訳システム、翻訳処
理方法および翻訳処理用記録媒体に関する。
るときに用いる訳語を記憶する翻訳辞書部およびある言
語の原文に対して翻訳辞書から複数の訳語を取り出し、
その中から適切と思われる1つの訳語を選択し所要の言
語に翻訳する翻訳処理部などで構成されている。
門分野の辞書(書籍)から原文の各単語ごとに適切と思
われる複数の訳語を取り出して翻訳辞書に登録すると
か、或いは予め既に多数の対訳データが用意されていれ
ば、その対訳データを用いて翻訳辞書を構築することは
既に知られている。
ような翻訳辞書を構築するに際し、各原文の単語ごとに
同一の意味,内容をもつ対訳データが大量に必要となる
が、現在のところ実際の翻訳処理の実用に耐えうるだけ
の対訳データの入手が困難である。
数の訳語が登録されているので、ある1つの原文の翻訳
に対し、複数の訳語が選択対象として出てくることが多
い。今、1つの原文である例えば「PC」に対して、日
本語の訳語では例えば「パソコン」、「プログラム カ
ウンター」、「プログラマブル コントローラ」、「プ
リント回路」、「加圧コンクリート」などが出てくる
が、これらの中から何れを用いるかを判断する必要があ
る。従来の機械翻訳システムでは、文書の分野、他の語
句との関係から適切な訳語を判断するが、例えば「gi
rl」を「少女」と訳すか、「乙女」と訳すかはそのど
ちらでも判断できなかった。
の品質を高める観点から、原文文書と訳文文書との対が
必要となるが、これら対となる対応文書を得ることが難
しい。
で、WWWサーバから辞書構築の対応文書を大量に取得
可能とする辞書構築支援システムを提供することにあ
る。また、本発明は、WWWサーバから辞書構築用の対
応文書を大量に取得する辞書構築支援方法を提供するこ
とにある。
んだ異なる言語のホームページに係わる文書から辞書構
築用の対応文書を取得するための辞書構築支援用記録媒
体を提供することにある。
際し、複数の訳語が存在する時、適切な訳語を迅速に選
択可能とする翻訳システムを提供することにある。さら
に、本発明は、ある言語を翻訳するに際し、複数の訳語
が存在する時、適切な訳語を迅速に選択する翻訳処理方
法を提供することにある。さらに、本発明は、ある言語
を翻訳するに際し、複数の訳語が存在する時、適切な訳
語を選択するための翻訳処理用記録媒体を提供すること
にある。
に、請求項1〜3に対応する発明は、ハイパーテキスト
の文書画面の行き先(ULR)を指定し、WWWサーバ
から第1言語のホームページに係わる文書を取り込むと
ともに、当該第1言語のホームページに係わる文書のリ
ンク先から第1言語以外の第2言語のホームページに係
わる文書を取り込む文書取り込み手段と、この文書取込
み手段で取り込んだ両言語のホームページの文書に存在
するイメージデータ,グラフ,図柄,リンク先などのデ
ータを比較し、同一の意味,内容を有するか否かを判定
する同一内容判定手段と、この判定手段によって同一性
有りと判定されたとき、両ホームページに係わる文書か
ら原文と訳語との対をなす訳文データを取り出して翻訳
辞書に登録する手段とを設けた辞書構築支援システムで
ある。
のような手段を講じたことにより、両言語のホームペー
ジの文書に存在するイメージデータ,グラフ,図柄,リ
ンク先などのデータが同一性を有するとき、両文書に記
載される文章の単語も同じ意味,内容をもって対応して
いるので、両文書から原文と訳語との対となる対訳デー
タを容易に入手できる。
から異なる言語のホームページに係わる文書を取り込む
文書取り込みステップと、この文書取り込みステップで
取り込んだ両言語のホームページの同一性を判定する同
一性判定ステップとを有し、同一性有りと判定されたと
き、両言語のホームページに係わる文章を翻訳辞書構築
用対訳データとして入手するので、WWWサーバから辞
書構築用の対応文書を大量に取得することができる。
ら翻訳辞書を構築するプログラムを記録した辞書構築支
援処理用記録媒体であって、辞書構築支援システムのコ
ンピュータに、前記ハイパーテキストの文書画面の行き
先(ULR)を指定し、WWWサーバから第1言語のホ
ームページに係わる文書を取り込むとともに、当該第1
言語のホームページに係わる文書のリンク先から第1言
語以外の第2言語のホームページに係わる文書を取り込
む文書取り込み機能と、この文書取り込み機能で取り込
んだ両ホームページの同一性を判定する同一性判定機能
と、この同一性判定機能によって同一性有りと判定され
たとき、両言語のホームページに係わる文書から原文と
訳語との対をなす訳文データを取り出し翻訳辞書に登録
する辞書構築データ登録機能とを実現させるためのプロ
グラムを記録したコンピュータ読み取り可能な辞書構築
支援処理用記録媒体である。
うな手段を講じたことにより、ハイパーテキストの文書
画面の行き先を指定すれば、行き先のWWWサーバから
異なる言語のホームページに係わる文書を取り込むこと
ができ、また同一性判定機能により、両言語のホームぺ
ージに係わる文書の中に存在する例えばイメージデー
タ,グラフ,図柄,リンク先などのデータに同一性を有
するとき、両言語のホームぺージに係わる文書に記載さ
れる文章が同一と判断し、原文と訳語とを対の形で取り
出して翻訳辞書の対訳データとして利用することができ
る。
ストの文書画面の行き先を指定し、WWWサーバから原
文となる言語のホームページに係わる文書または当該文
書のリンク先文書を取り込む原文文書取り込み手段と、
この原文文書取り込み手段によって取り込んだ原文とな
る言語のホームページに係わる文書または当該文書のリ
ンク先の文書を翻訳する際、複数の訳語が存在すると
き、前記原文となる言語のホームページに係わる文書の
リンク先に対訳言語の文書が存在するとき、当該対訳言
語の文書を参照し、その中に原文の単語に対応する訳語
があれば、当該訳語を優先選択して翻訳する訳語選択参
照手段とを設けた翻訳システムである。
うな手段を講じたことにより、WWWサーバから原文と
なる言語のホームページに係わる文書を取り込未、翻訳
辞書を用いて翻訳するが、このとき文書のある単語に複
数の訳語があれば、原文となる言語のホームページに係
わる文書のリンク先に訳語の言語をもつ文書の中に前記
単語の訳語があれば、それを優先的に選択し翻訳するの
で、適切な訳語を用いて精度よく翻訳できる。
から原文となる言語のホームページに係わる文書または
当該文書のリンク先文書を翻訳する際、原文となる言語
のホームページに係わる文書のリンク先の対訳言語の文
書を参照し、原文の単語に対応する訳語を選択し翻訳す
ることにより、適切な訳語を迅速に選択できる。
から原文となる言語のホームページに係わる文書または
当該文書のリンク先の文書を翻訳するプログラムを記録
した翻訳処理用記録媒体であって、翻訳システムのコン
ピュータに、前記ハイパーテキストの文書画面の行き先
(ULR)を指定し、WWWサーバから原文となるホー
ムページに係わる文書または当該文書のリンク先の文書
を取り込む文書取り込み機能と、この文書取り込み機能
によって取り込んだ原文となるホームページに係わる文
書または当該文書のリンク先の文書を翻訳辞書に登録す
る訳語を用いて翻訳処理する翻訳処理機能と、この翻訳
処理機能によって前記文書の翻訳をする際、複数の訳語
が存在するとき、前記原文となるホームページに係わる
文書のリンク先に対訳言語の文書が存在するとき、当該
対訳言語の文書を参照し、その中に原文の単語に対応す
る訳語があれば、当該訳語を優先選択して翻訳する訳語
選択参照機能とを実現させるためのプログラムを記録し
たコンピュータ読み取り可能な翻訳処理用記録媒体であ
る。このような翻訳処理用記憶媒体によれば、ある言語
を翻訳するに際し、複数の訳語が存在する時、適切な訳
語を選択し翻訳処理できる。
1は本発明に係わる辞書構築支援システムの一実施の形
態を示す機能ブロック図である。
れるハイパーテキストなどの文書をもつコンピュータに
よって構成される機械翻訳システム1と、同じくコンピ
ュータで構成され、例えば日本語ホームページに係わる
文書および日本語ホームページと対の関係にある日本語
以外の言語で作成されるホームページに係わる文書をも
つ複数のWWWサーバ21 ,…,2n がネットワーク3
に接続されている。
第1の言語を第2の言語に翻訳処理するための訳語を決
定し登録する辞書構築支援システム10と、ある言語の
原文に対して構築された翻訳辞書の訳語を用いて翻訳処
理を行う翻訳処理構成部分20とから成る。
11、表示部12、辞書構築支援用記録媒体13、デー
タ記憶部14、CPUで構成される辞書構築支援処理部
15、同一内容判定部16および通信制御部17等によ
って構成されている。
面表示指示その他必要なデータ,コマンドを入力するも
ので、通常,キーボード,OCR,タブレット,マウ
ス,ライトペン或いはFDD,ネットワークなどが用い
られ、ハイパーテキストの文書画面の絵または文章など
の行き先(ULR)をマウスでクリックすることによ
り、行き先となるWWWサーバの例えば日本語および日
本語以外の言語のホームページに係わる文書を取り込む
機能をもっている。
書画面の表示、WWWサーバから取り込むホームページ
データの表示その他入力部11から入力されるデータや
データ記憶部14に記憶されるデータ等を表示するもの
であって、CRT,ビットマップディスプレイ、投影さ
れる壁面やゴーグルなどが用いられる。
ば後記する図3に示すような辞書構築支援用プログラム
を格納するためのものであって、通常,磁気的,電気
的,光学的,機械的などの記憶素子、つまり,FDD,
CD ROM,磁気ディスク,光ディスクなどが用いら
れる。また、この記憶媒体13は、辞書構築支援用プロ
グラムだけでなく、必要に応じて翻訳処理上必要なプロ
グラム例えば画像表示用プログラム,通信制御用プログ
ラムなど記憶する。
ら取り込んだ日本語またおよび日本語以外の言語のホー
ムページに係わる文書データや辞書構築支援処理過程の
データ、さらに入力部11から入力されをデータなどを
記憶するものであって、磁気的,電気的,光学的,機械
的な記憶素子などが用いられる。
支援用記録媒体13に記憶される辞書構築支援用プログ
ラムを用いて辞書構築支援処理を実行したり、入力部1
1から入力されるホームページデータの取り込みアドレ
スまたはコマンドなどを出力する機能をもっている。
から取り込んだ例えば日本語ホームページに係わる文書
と日本語以外の言語のホームページに係わる文書とが同
一の意味,内容をもっているか否かを判定し、互いに同
一の意味,内容をもっているとき、原文文書((例えば
英語ホームページ文書)と訳文文書(例えば日本語ホー
ムページ文書)が対応関係にあって対訳データ可能と判
断する。この判定処理にあっては、一定の条件を必要と
する。それは、両ホームページに係わる文書の中に存在
するイメージデータ、グラフ、図柄、さらにリンク先な
どが同一であるとき、または割合が一定値以上のとき、
両言語のホームページに記載される文章が同じ意味,内
容を異なる2つの言語で表現していると判定する。さら
に、この判定処理は、必ずしもイメージデータ、グラ
フ、図柄、さらにリンク先その他全部が完全に一致して
も、記載されている文章が異なる場合もあるので、さら
に文章どうしを比較し、少なくとも例えば80%以上同
一であれば、残りの20%も同一であると判定してもよ
い。
の発信やホームページの取り込みアドレスまたはコマン
ドの発信、ホームページの取り込みなどを行う機能をも
っている。
語の原文を所要とする他の言語に翻訳処理する従来公知
の構成を用いるものであって、例えばある言語の原文を
入力したり、他のコンピュータのFDから原文文書を入
力したり、或いはネットワークから送られてくるデータ
を入力する入力部、この入力部から入力されるデータや
翻訳結果を表示する表示部、翻訳辞書や翻訳上の文法等
を記憶するデータ記憶部、入力部から入力される原文を
翻訳辞書や翻訳上の文法を用いて所定の言語に翻訳する
翻訳処理部その他必要な構成部分をもっている。
部、表示部、データ記憶部は、辞書構築支援システム0
の入力部11,表示部12、データ記憶部14等をその
まま用いてもよい。
10の動作を説明するに先立ち、WWWサーバのホーム
ページに係わる文書を対訳データとすることの意義を説
明する。
1 ,…,2n の中には、自国語および外国語向けのホー
ムページを作成し開示している場合があるが、例えば英
語で記載されているホームページの文書に「日本語はこ
こ」とか、逆に日本語のホームページの文書に「for
English」とか記載されているとき、そのリン
ク先部分をクリックすれば、日本語と英語のホームペー
ジに係わる文書をダウンロードできる。しかし、これら
両言語のホームページに係わる文書が同一の意味,内容
をもつ保証はない。そこで、両言語のホームページに係
わる文書が同一の意味,内容をもつか否かを判定し、同
一の意味,内容をもつものであれば、両ホームページに
記載される文章は対の関係にあり、非常に好ましい対訳
データとなり、ひいては対訳データの量は大量に確保可
能となる。
ジの性質を踏まえて本発明システムを実現したものであ
り、以下、システムの動作を説明する。入力部11から
の指示に基づき、表示部12にハイパーテキストの初期
画面或いは所要の画面を表示した後、画面上の行き先
(ULR)をクリックすると、辞書構築支援処理部15
は、辞書構築支援用記録媒体13に格納されるプログラ
ムを読み取って辞書構築支援処理を実行する。
の指定に基づく行き先(ULR)アドレスおよびホーム
ページ取り込み用コマンドを通信管理制御部17を介し
て例えばWWWサーバ21 に発信し、当該WWWサーバ
21 の例えば英語ホームページに係わる文書を取り込ん
でデータ記憶部14に記憶する一方、表示部12に表示
する。
えば「日本語はここ」と記載されているとき、そのリン
ク先部分をクリックし、日本語のホームページも取り込
んでデータ記憶部14に記憶する一方、表示部12に表
示する。逆に、日本語ホームページに係わる文書を取り
込み、その文章の中に例えば「for Englis
h」と記載されている場合も同様にそのリンク先部分を
クリックし、英語ホームページに係わる文書を取り込
む。
言語のホームページに係わる文書の意味,内容の同一性
を同一内容判定部16に依頼する。この同一内容判定部
16は、両ホームページに係わる文書の中に存在するイ
メージデータ,グラフ,図柄,さらにリンクする先など
が同一であるか否かを判定する。通常,同じイメージデ
ータ,グラフなどが使用されているとき、両言語のホー
ムページに記載される文章の意味,内容が同じである場
合が多いためである。
グラフ,図柄,さらにリンク先などのデータが同一であ
ることを条件に、或いはこれらイメージデータ,グラ
フ,図柄,リンク先などのデータの同一を条件とせず
に、両言語のホームページに記載される文章について、
各言語の文法に基づいて文章を比較し、何%同一である
か否かを調べる。ここで、少なくとも80%以上同一で
あれば、他の残りの20未満の文章も同一であると判定
し、辞書構築支援処理部15に通知する。
語と英語のホームページに係わる文書から順次原文の単
語と訳文の単語とを対の形で取り出し、対訳語としてデ
ータ記憶部14または図示されていないが翻訳処理構成
部分20の翻訳辞書に登録していく。
ば、同一のWWWサーバの異なる両言語のホームページ
に係わる文書を取り込み、一定の条件のもとに同一性を
調べ、両ホームページが同一であると判定するので、両
言語のホームページに記載される文章を対訳データとし
て取得でき、国内および外国から発信されるホームペー
ジが無数存在することを考えれば、大量の対訳データを
入手できる。しかも、辞書構築支援用プログラムに基づ
いて自動的に辞書構築支援処理を実行するので、それ程
コストおよび時間を必要とせずに対訳データを入手で
き、また精度の翻訳辞書を容易に構築することができ
る。 (翻訳処理方法および翻訳処理用記録媒体に係わる発明
の実施の形態)図2は翻訳処理用記録媒体を用いた辞書
構築支援システムの一実施形態を示す図、図3は翻訳処
理用記録媒体のプログラムを用いて翻訳処理を行う翻訳
処理方法を説明するフローチャートである。なお、図2
において図1と同一機能部分には同一の符号を付して説
明する。
WWWサーバ2,…をもつコンピュータネットワーク3
に接続されている。入力部11は、ハイパーテキストの
文書画面に基づきマウスなどで行き先(ULR)をクリ
ックし、行き先となるWWWサーバの例えば日本語およ
び日本語以外の言語のホームページに係わる文書を取り
込む指示を行う。通常,キーボード,OCR,タブレッ
ト,マウス,ライトペン或いはFDD,ネットワークな
どが用いられる。表示部12は、ハイパーテキストの文
書画面の表示、WWWサーバから取り込むホームページ
に係わる文書の表示その他入力部11から入力されるデ
ータやデータ記憶部14に記憶されるデータ等を表示す
るものであって、CRT,ビットマップディスプレイ、
投影される壁面やゴーグルなどが用いられる。辞書構築
支援用記録媒体13は図3に示すフローチャートに示す
プログラムが格納されている。データ記憶部14は図1
で説明したような必要なデータを記憶する。辞書構築支
援処理本体部18は、CPUで構成され、辞書構築支援
用記録媒体13に格納されるプログラムを読み取って、
図1に示す辞書構築支援処理部15および同一内容判定
部16と同様な機能を行う。機能分けすると、辞書構築
支援処理本体部18は、あるWWWサーバ2から両ホー
ムページの文書を取り込むホームページ取り込み機能、
これら両ホームページの同一性を判定する同一性判定機
能、両ホームページの文書が同一であるとき、原文文書
と対訳文書とを対の形で翻訳辞書に登録する対訳データ
登録機能を実現する。
構築支援用記録媒体13に格納されているプログラムに
基づいて図3に示す辞書構築支援処理を実行する。入力
部11からの指示に基づき、表示部12にハイパーテキ
スト画面を表示した後、行き先(ULR)をクリックす
ると、CPUで構成される辞書構築支援処理本体部18
は、辞書構築支援用記録媒体13のプログラムを読み取
って辞書構築支援処理を実行する。
ムページ取り込み機能を実行する。つまり、行き先のク
リックによって指定されたWWWサーバ2のある言語で
記載されるホームページAを取り込んでデータ記憶部1
4に記憶するとともに、表示部12に表示する(ST
1)。しかる後、このホームページAの中に他の言語で
書かれたホームページを示す部分があるか否かを判断す
る(ST2)。ここで、他の言語で書かれたホームペー
ジを示す部分があれば、そのホームページBを読み込ん
で同様にデータ記憶部14に記憶するとともに、表示部
12に表示する(ST3)。
性判定機能を実行する。この同一性判定機能は、両ホー
ムページA,Bの中からイメージデータ,グラフ,図
柄,さらにリンクする先などの情報C,Dを抽出する
(ST4)。そして、これら情報C,Dが予め定めた割
合(例えば80%)以上一致するか否かを判断する(S
T5)。ここで、情報C,Dが予め定めた割合以上一致
すると、両ホームページに記載される文章は同一である
と判定する。
グラフ,図柄,さらにリンクする先などのデータが予め
定めた割合以上一致することを条件に、或いはこれらイ
メージデータ,グラフ,図柄,リンクする先などのデー
タの一定割合以上の同一を条件とせずに、両ホームペー
ジに記載される文章について、各言語の文法に基づいて
文章を比較し、どの程度の割合で同一であるか否かを調
べる。ここで、少なくとも80%以上同一であれば、他
の残りの20未満の文章も同一であると判定する。
は、両ホームページに記載される文章が同一であると判
定されたとき、両ホームページから順次原文の単語と訳
文の単語とを対の形で取り出し、対訳データとしてデー
タ記憶部14または機械翻訳処理システムの翻訳辞書に
順次登録する(ST6)。
よれば、特別に専門辞書や対訳データを見つけ出すこと
なく、異なる両言語のホームページから大量の対訳デー
タを迅速、かつ、低コストで適当な時間に入手しつつ、
正確な翻訳辞書を容易に構築することができる。
を用いた辞書構築支援システムによれば、同一のWWW
サーバのある言語のホームページから他の言語のホーム
ページを容易に探し出て取り込むことができる。また、
両ホームページの中から一定の条件のもとに両ホームペ
ージに記載される文章の同一性をほぼ正確に判定でき
る。さらに、両ホームページに記載される文章が同一と
判定したとき、かかる文章を原文文書と対訳文書とを対
の形で取り出し、対訳データとして翻訳辞書に登録でき
る。
用いるが、それ以外には例えば磁気テープ、DVD−R
OM、フロッピーディスク、MO、MD、CD−R、メ
モリカードなどを用いてもよい。 (翻訳処理システムに係わる発明の実施の形態)図4は
本発明に係わる翻訳システムの一実施の形態を示す機能
ブロック図である。
ラウザで作成されるハイパーテキストなどの文書をもつ
コンピュータによって構成される翻訳システム1がコン
ピュータネットワーク3を介して日本語以外の言語例え
ば第1の英語ホームページP1、そのリンク先となる第
2の英語ホームページP2および日本語ホームページP
3などをもつ少なくとも1台のWWWサーバ2,…が接
続されている。
部32、翻訳処理用記録媒体33、データ記憶部34、
翻訳辞書や翻訳処理用文法を記憶する辞書・文法記憶部
35、翻訳処理制御部36、訳語選択参照部37および
通信制御部38等によって構成されている。
書画面表示指示その他必要なデータ,コマンドを入力す
るもので、通常,キーボード,OCR,タブレット,マ
ウス,ライトペン或いはFDD,ネットワークなどが用
いられ、ハイパーテキストの文書画面に基づきマウスな
どで行き先(ULR)をクリックし、WWWサーバ2か
ら例えば日本語および日本語以外の言語のホームページ
に係わる文書を取り込む機能をもっている。
書画面の表示、WWWサーバ2から取り込むホームペー
ジデータに係わる文書の表示その他入力部31から入力
されるデータなどを表示するものであって、CRT,ビ
ットマップディスプレイ、投影される壁面やゴーグルな
どが用いられる。
の原文を所要の言語に翻訳する時に用いられるプログラ
ムを格納するものであるが、その他例えば通信制御用プ
ログラムや表示処理用プログラムなども格納されてい
る。データ記憶部34は、ハイパーテキストの文書の表
示画面データ、WWWサーバ2から取り込むホームペー
ジに係わる文書、入力部31から入力される翻訳原文そ
の他翻訳処理によって得られる翻訳結果などを記憶す
る。辞書・文法記憶部35は、第1言語の原文単語を所
要とする第2言語の単語に翻訳する訳語の他、第1言語
の原文単語を第2言語の単語に翻訳するときの文法デー
タが記憶されている。
憶部34および辞書・文法記憶部35は、通常,磁気
的,電気的,光学的,機械的などの記憶素子、つまり,
FDD,CD ROM,磁気ディスク,光ディスクなど
が用いられており、かつ、これらが一体または別体の記
録媒体であってもよい。
録媒体33に記憶される翻訳処理用プログラムを用いて
翻訳処理を実行したり、入力部31から入力されるホー
ムページデータの取り込みコマンドなどを出力したり、
各構成部分を統括制御する機能をもっている。
部36において例えば英語ホームページに係わる文書を
翻訳する時、辞書・文法記憶ぶ35から複数の訳語が抽
出された時、英語ホームページに係わる文書のリンク先
に日本語のホームページに係わる文書が存在するとは、
この日本語のホームページに係わる文書中に含まれてい
る語句を訳語として優先的に選択し、翻訳処理制御部3
6に提供する機能をもっている。
発信やホームページの取り込みコマンドの発信、ホーム
ページデータの取り込みなどを行う機能をもっている。
次に、以上のような構成の翻訳システムの動作について
説明する。
と、翻訳処理制御部6は、入力部31からの原文をデー
タ記憶部34に記憶した後、当該原文に関し、辞書・文
法記憶部35の辞書から所要の言語に関連する文法規則
にしたがって訳語を取り出して表示部32に表示し、複
数の訳語があるとき適宜選択し、翻訳結果としてデータ
記憶部34に記憶する。そして、原文の翻訳結果を表示
部32に表示する。
の収集がハイパーテキストに基づくホームページに係わ
る文書の翻訳の場合には次のような処理を行う。先ず、
予め翻訳処理制御部36が通信制御部38を介してWW
Wサーバ2から例えば英語ホームベージP1に係わる文
書または当該文書のリンク先である例えば英語ホームペ
ージP2に係わる文書を取り込み、データ記憶部34に
記憶し、かつ、表示部32に表示する。そして、翻訳処
理制御部6において取り込んだ文書について、辞書・文
法記憶部35の辞書および文法に従って翻訳処理を行
う。
ージに係わる文書のある単語を翻訳する際、辞書・文法
記憶部35から複数の訳語が抽出されたとき、前記WW
Wサーバ2の英語ホームページに係わる文書P1または
この文書P1のリンク先である英語ホームページに係わ
る文書P2にリンクされている訳語言語つまり日本語ホ
ームページに係わる文書P3があれば、当該文書P3を
取り込んで訳語選択参照部37に記憶する。そして、こ
の日本語ホームページに係わる文書P3の中に文書P1
またはP2の単語に対応する訳語があれば、その訳語を
優先的に選択し翻訳結果とするので、翻訳品質の向上を
図ることができる。
ば、WWWサーバ2の原文の文書を翻訳するとき、第1
義的には辞書・文法記憶部35の訳語を用いて翻訳する
が、複数の訳語あるとき、WWWサーバ2の原文文書に
リンクされている訳語言語の文書の中に対応する訳語が
あるとき、その訳語を優先的に選択し翻訳結果とするの
で、翻訳品質の向上を図ることができる。 (翻訳処理方法および翻訳処理用記録媒体に係わる発明
の実施の形態)図5は翻訳処理用記録媒体の翻訳処理用
プロブラムを読み取って所定の機能を実現する翻訳処理
システムの一実施形態を示す図、図6は翻訳処理用プロ
グラムを用いて翻訳処理を行う翻訳処理方法を説明する
フローチャートである。なお、図5において図4と同一
機能部分は同一の符号を付して説明する。
サーバ2,…をもつコンピュータネットワーク3に接続
されている。入力部11(通信制御部38)は、翻訳し
ようとする原文を入力する部分であって、例えばハイパ
ーテキストの文書画面に基づきマウスなどで行き先(U
LR)をクリックし、行き先となるWWWサーバから例
えば原文である英語ホームページに係わる文書または当
該文書のリンク先である英語ホームページに係わる文書
を取り込む指示を入力し、さらに翻訳処理制御指示や前
記ホームページに係わる文書と同一の意味,内容をもつ
日本語ホームページに係わる文書を取り込む指示を入力
するものであって、通常,キーボード,OCR,タブレ
ット,マウス,ライトペン或いはFDD,ネットワーク
などが用いられる。表示部12は、ハイパーテキストの
文書画面の表示、WWWサーバから取り込むホームペー
ジデータの表示、その他入力部11から入力される原文
や翻訳結果を表示するものであって、CRT,ビットマ
ップディスプレイ、投影される壁面やゴーグルなどが用
いられる。
の原文を所要の言語に翻訳する時に用いられるプログラ
ムを格納するものであって、例えば図6に示すようなフ
ロチャートに示す翻訳処理を実行する。データ記憶部3
4は、ハイパーテキストの文書の表示画面データ、WW
Wサーバ2から取り込む原文となるホームページに係わ
る文書またはそのリンク先の文書、その他翻訳結果のデ
ータを記憶するものである。辞書・文法記憶部35は、
第1言語の原文単語を所要とする第2言語の単語に翻訳
する訳語を記憶する他、第1言語の原文単語を第2言語
の単語に翻訳するときの文法データが記憶されている。
これら翻訳処理用記録媒体33、データ記憶部34およ
び辞書・文法記憶部35は、通常,磁気的,電気的,光
学的,機械的などの記憶素子、つまり,FDD,CD
ROM,磁気ディスク,光ディスクなどが用いられてお
り、かつ、これらが一体または別体の記録媒体であって
もよい。
構成され、翻訳処理用記録媒体13に格納されている翻
訳処理プログラムを読み取って図6に示す翻訳処理を実
行する機能をもっている。この翻訳処理制御本体部39
について機能分けすると、WWWサーバ2から原文とな
る日本語以外の言語例えば英語ホームページに係わる文
書およびその文書のリンク先の英語ホームページに係わ
る文書を取り込む原文取り込み機能、この原文取り込み
機能によつて取り込んだ原文に基づいて翻訳辞書から訳
語を取り出して翻訳する翻訳処理機能、この翻訳処理機
能の段階で複数の訳語を抽出したとき、前記英語ホーム
ページに係わる文書からリンク先の日本語ホームページ
に係わる文書を取り込んで参照し、この文書に含まれる
語句を優先的に訳語として選択する訳語選択参照機能を
実現する。
用記録媒体33に格納されるプログラムに基づいて図6
に示す翻訳処理を実行する。翻訳処理制御本体部39に
おいては、翻訳処理用記録媒体33のプログラムに基づ
いて原文取り込み機能を実現する。
き、ハイパーテキストの文書に係わる翻訳か否かを判断
する(ST11)。ここで、一般の翻訳処理の場合に
は、従来公知の手段,つまり入力部31から入力される
翻訳原文を受け、辞書・文法記憶部35の訳語を抽出し
選択確認して翻訳結果を得る(ST12)。
トの文書に係わる翻訳である場合には、行き先(UL
R)リンクをクリックするとともに、ホームページ取り
込みコマンドを発信し、WWWサーバ2から原文となる
例えば英語ホームページに係わる文書およびその文書の
リンク先の英語ホームページに係わる文書を取り込み、
データ記憶部34に記憶するとともに、表示部32に表
示する(ST13)。
訳処理用記録媒体33のプログラムに基づいて翻訳処理
を実現する。この翻訳処理は、原文となる例えば英語ホ
ームページに係わる文書について辞書・文法記憶部35
の文法に従って辞書から順次訳語を抽出した後、原文で
ある文書のある単語に関し、複数の訳語があるか否かを
判断する(ST14)。ここで、訳語が1つしかないと
き、その訳語を用いて翻訳結果を得る。
理用記録媒体33のプログラムに基づいて訳語選択参照
機能を実現する。この訳語選択参照機能は、ステップS
T14においてある原文の1つの単語に複数の訳語が存
在する場合、前記WWWサーバ2の前記英語ホームペー
ジに係わる文書のリンク先に日本語ホームページに係わ
る文書があるか否かを判断し(ST15)、日本語ホー
ムページに係わる文書があれば、その文書を取り込んで
訳語選択参照部35を格納する(ST16)。そして、
前記原文である英語ホームページに係わる文書と日本語
ホームページに係わる文書とを比較参照し、当該日本語
ホームページに係わる文書の中に原文単語に対応する日
本語の語句があれば、それを優先的に選択し、原文単語
の訳語として採用し翻訳処理を実行する(ST17)。
の形態によれば、WWWサーバ2のハイパーテキストの
文書である例えば英語ホームページに係わる文書または
そのリンク先である文書を翻訳するとき、一義的には辞
書・文法記憶部35を用いて翻訳するが、その原文であ
る文書のある単語に関し、複数の訳語が存在するとき、
英語ホームページに係わる文書のリンク先に日本語ホー
ムページに係わる文書または日本語に係わる文書がある
とき、その日本語ホームページに係わる文書または日本
語に係わる文書を参照し、その中から原文である文書の
ある単語に対応する日本語の訳語を優先的に選択し翻訳
するので、辞書・文法記憶部35に選択訳語が不足して
いる場合でも確実に翻訳できる。また、ハイパーテキス
トの文書においてその文書内にリンク先として英語に係
わる文書および日本語に係わる文書があるとき、これら
は内容的に同じ分野の文書で記述していることが多いの
で、日本語の訳語を優先的に選択して翻訳すれば、翻訳
品質の向上を図ることができ、さらに翻訳処理の効率を
上げることもできる。
3を用いた翻訳処理システムによれば、WWWサーバ2
から原文となる例えば英語ホームページに係わる文書お
よびその文書のリンク先の英語ホームページに係わる文
書を取り込み、辞書・文法記憶部35の文法に従って辞
書から順次訳語を抽出し翻訳結果を得ることができる。
在する場合、前記WWWサーバ2の英語ホームページに
係わる文書のリンク先に日本語ホームページに係わる文
書を取り出し、その文書を比較参照しながら最適な語句
を見つけ出して翻訳処理を実現できる。
のような種々の効果を奏する。請求項1〜4の発明で
は、WWWサーバから異なる言語のホームぺージに係わ
る文書を取り込み、両言語のホームぺージに係わる文書
が同一性を有するとき、両言語のホームぺージに係わる
文書から原文と訳語との対をなす訳文データを入手する
ので、大量の訳文データを入手可能であり、しかも低コ
スト、かつ、迅速に翻訳辞書を構築可能である。
り込んだ異なる言語のホームページに係わる文書に基づ
いて翻訳辞書の構築築用対応文書を容易に取得可能な辞
書構築支援用記録媒体を提供できる。
バから原文となるホームページに係わる文書を取り込ん
で翻訳するに際し、複数の訳語が存在する時、原文とな
るホームページに係わる文書のリンク先に訳語となるホ
ームページに係わる文書があれば、当該文書に存在する
訳語を優先的に選択し翻訳するので、適切な訳語を選択
して精度の高い翻訳を行うことができる。
文となるホームページに係わる文書を取り込んで翻訳す
るに際し、複数の訳語が存在する時、ホームページに係
わる文書にとって適切な訳語を選択できる翻訳処理用記
録媒体を提供できる。
施の形態を示す構成図。
ステム構成図。
援方法を説明するフローチャート。
を示す構成図。
ム構成図。
法を説明するフローチャート。
Claims (8)
- 【請求項1】 WWWサーバから異なる言語で同一の
意味,内容を有するホームページに係わる文書を取り込
んで翻訳辞書用対訳データとして入手する機能を設けた
ことを特徴とする辞書構築支援システム。 - 【請求項2】 ハイパーテキストの文書画面の行き先
(ULR)を指定し、WWWサーバから第1言語のホー
ムページに係わる文書を取り込むとともに、当該第1言
語のホームページに係わる文書のリンク先から第1言語
以外の第2言語のホームページに係わる文書を取り込む
文書取り込み手段と、この文書取込み手段で取り込んだ
両言語のホームページに係わる文書の同一性を判定する
同一内容判定手段と、この判定手段によって同一性有り
と判定されたとき、両言語のホームページに係わる文書
から原文と訳語との対をなす訳文データを取り出して翻
訳辞書に登録する手段とを備えたことを特徴とする辞書
構築支援システム。 - 【請求項3】 同一内容判定手段は、両言語のホーム
ページに係わる文書に存在するイメージデータ,グラ
フ,図柄,リンク先などのデータを比較し、同一の意
味,内容を有するか否かを判定することを特徴とする請
求項2に記載の辞書構築支援システム。 - 【請求項4】 WWWサーバから異なる言語のホームペ
ージに係わる文書を取り込む文書取り込みステップと、
この文書取り込みステップで取り込んだ両言語のホーム
ページに係わる文書の同一性を判定する同一性判定ステ
ップとを有し、同一性有りと判定されたとき、両言語の
ホームページに係わる文書から翻訳辞書構築用対訳デー
タを入手することを特徴とする辞書構築支援方法。 - 【請求項5】 対訳データから翻訳辞書を構築するプ
ログラムを読込み可能に記録した辞書構築支援処理用記
録媒体であって、辞書構築支援システムのコンピュータ
に、 前記ハイパーテキストの文書画面の行き先(ULR)を
指定し、WWWサーバから第1言語のホームページに係
わる文書を取り込むとともに、当該第1言語のホームペ
ージに係わる文書のリンク先から第1言語以外の第2言
語のホームページに係わる文書を取り込む文書取り込み
機能と、 この文書取り込み機能で取り込んだ両ホームページに係
わる文書の同一性を判定する同一性判定機能と、 この同一性判定機能によって同一性有りと判定されたと
き、両言語のホームページに係わる文書から原文と訳語
との対をなす訳文データを取り出し翻訳辞書に登録する
辞書構築データ登録機能とを実現させるためのプログラ
ムを記録したコンピュータ読み取り可能な辞書構築支援
処理用記録媒体。 - 【請求項6】 ハイパーテキストの文書画面の行き先
(ULR)を指定し、WWWサーバから原文となる言語
のホームページに係わる文書または当該文書のリンク先
の文書を取り込む原文文書取り込み手段と、この原文文
書取り込み手段によって取り込んだ原文となる言語のホ
ームページに係わる文書または当該文書のリンク先の文
書を翻訳する際、複数の訳語が存在するとき、前記原文
となる言語のホームページに係わる文書のリンク先に対
訳言語の文書が存在するとき、当該対訳言語の文書を参
照し、その中に原文の単語に対応する訳語があれば、当
該訳語を優先選択して翻訳する訳語選択参照手段とを備
えたことを特徴とする翻訳システム。 - 【請求項7】 WWWサーバから原文となる言語のホ
ームページに係わる文書または当該文書のリンク先の文
書を翻訳するとき、前記原文となる言語のホームページ
に係わる文書のリンク先の対訳言語の文書を参照し、原
文の単語に対応する訳語を選択し翻訳することを特徴と
する翻訳処理方法。 - 【請求項8】 WWWサーバから原文となる言語のホ
ームページに係わる文書または当該文書のリンク先の文
書を翻訳するプログラムを読込み可能に記録した翻訳処
理用記録媒体であって、翻訳システムのコンピュータ
に、 前記ハイパーテキストの文書画面の行き先(ULR)を
指定し、WWWサーバから原文となるホームページに係
わる文書または当該文書のリンク先の文書を取り込む文
書取り込み機能と、 この文書取り込み機能によって取り込んだ原文となるホ
ームページに係わる文書または当該文書のリンク先の文
書を翻訳辞書に登録する訳語を用いて翻訳処理する翻訳
処理機能と、 この翻訳処理機能によって前記文書の翻訳をする際、複
数の訳語が存在するとき、前記原文となるホームページ
に係わる文書のリンク先に対訳言語の文書が存在すると
き、当該対訳言語の文書を参照し、その中に原文の単語
に対応する訳語があれば、当該訳語を優先選択して翻訳
する訳語選択参照機能と、 を実現させるためのプログラムを記録したコンピュータ
読み取り可能な翻訳処理用記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10008593A JPH10312383A (ja) | 1997-03-11 | 1998-01-20 | 翻訳システム、翻訳処理方法および翻訳処理用記録媒体 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9-56301 | 1997-03-11 | ||
JP5630197 | 1997-03-11 | ||
JP10008593A JPH10312383A (ja) | 1997-03-11 | 1998-01-20 | 翻訳システム、翻訳処理方法および翻訳処理用記録媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007011814A Division JP3999808B2 (ja) | 1997-03-11 | 2007-01-22 | 翻訳システム、翻訳処理方法および翻訳処理用記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10312383A true JPH10312383A (ja) | 1998-11-24 |
Family
ID=26343140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10008593A Pending JPH10312383A (ja) | 1997-03-11 | 1998-01-20 | 翻訳システム、翻訳処理方法および翻訳処理用記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10312383A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003006293A (ja) * | 2001-06-21 | 2003-01-10 | Mytrip Net Kk | 双方向通信ネットワークによる旅行の総合支援の提供及び取得方法、その通信システム並びにプログラム |
US7168040B2 (en) | 2000-03-31 | 2007-01-23 | Fujitsu Limited | Document processing apparatus and method for analysis and formation of tagged hypertext documents |
JP2012043233A (ja) * | 2010-08-20 | 2012-03-01 | Yahoo Japan Corp | 対訳辞書生成装置、方法及びプログラム |
JP2012133689A (ja) * | 2010-12-24 | 2012-07-12 | Yahoo Japan Corp | 情報処理装置、方法及びプログラム |
-
1998
- 1998-01-20 JP JP10008593A patent/JPH10312383A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7168040B2 (en) | 2000-03-31 | 2007-01-23 | Fujitsu Limited | Document processing apparatus and method for analysis and formation of tagged hypertext documents |
JP2003006293A (ja) * | 2001-06-21 | 2003-01-10 | Mytrip Net Kk | 双方向通信ネットワークによる旅行の総合支援の提供及び取得方法、その通信システム並びにプログラム |
JP2012043233A (ja) * | 2010-08-20 | 2012-03-01 | Yahoo Japan Corp | 対訳辞書生成装置、方法及びプログラム |
JP2012133689A (ja) * | 2010-12-24 | 2012-07-12 | Yahoo Japan Corp | 情報処理装置、方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11294968B2 (en) | Combining website characteristics in an automatically generated website | |
KR100936204B1 (ko) | 카피 앤드 페이스트 처리 방법, 장치 및 기록 매체 | |
US8046323B2 (en) | Context based bookmark | |
US8249859B2 (en) | Technology for selecting texts suitable as processing objects | |
JPH11250105A (ja) | 多言語情報検索方法およびシステム | |
JP2008140409A (ja) | 翻訳情報セグメント | |
JP5204244B2 (ja) | 誤訳の検出を支援する装置及び方法 | |
US20170109442A1 (en) | Customizing a website string content specific to an industry | |
US20110035433A1 (en) | Webpage display method, computer system, and program | |
JPH10312383A (ja) | 翻訳システム、翻訳処理方法および翻訳処理用記録媒体 | |
KR20000039748A (ko) | 다국어 웹 문서 번역 서비스 장치 및 이를 이용한번역 서비스 방법 | |
CN101576885A (zh) | 提取动态生成网页内容的技术方案 | |
CN101539914A (zh) | 对网页进行可读化定制转换的技术方案 | |
JP3999808B2 (ja) | 翻訳システム、翻訳処理方法および翻訳処理用記録媒体 | |
JP2000163441A (ja) | 辞書作成方法及び装置及び辞書作成プログラムを格納した記憶媒体及び検索要求作成方法及び装置及び検索要求作成プログラムを格納した記憶媒体及び多言語対応情報検索システム | |
JP2003296327A (ja) | 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム | |
JP3686312B2 (ja) | 訳語検索方法、訳語検索装置及び訳語検索プログラムを記録した記録媒体 | |
JPH11259477A (ja) | 文書処理システムおよび記録媒体 | |
JP7346891B2 (ja) | ウェブページ多言語化装置、方法、プログラム、およびシステム | |
JP4021813B2 (ja) | 複合語登録プログラムおよび登録装置 | |
Shah | Enhancement to text alignment visualization | |
US8875036B1 (en) | Post edit localization evaluation in offline context of an application | |
KR20010088527A (ko) | 번역 소프트웨어의 인터넷 웹 문서 쌍방향 번역 처리방법및 이 번역 소프트웨어를 탑재한 기록매체 | |
KR20010103545A (ko) | 광고 병행 인터넷 번역 기록매체, 시스템 및 장치 | |
JP2009054069A (ja) | 翻訳者選定方法、翻訳者選定装置、および翻訳者選定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061121 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070122 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20070122 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070122 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20070220 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070220 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070417 |