JPH0981549A - ハイパーテキストアクセス用翻訳方法 - Google Patents

ハイパーテキストアクセス用翻訳方法

Info

Publication number
JPH0981549A
JPH0981549A JP7234287A JP23428795A JPH0981549A JP H0981549 A JPH0981549 A JP H0981549A JP 7234287 A JP7234287 A JP 7234287A JP 23428795 A JP23428795 A JP 23428795A JP H0981549 A JPH0981549 A JP H0981549A
Authority
JP
Japan
Prior art keywords
translation
document
hypertext
user
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7234287A
Other languages
English (en)
Inventor
Keisuke Nakayama
中山  圭介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7234287A priority Critical patent/JPH0981549A/ja
Publication of JPH0981549A publication Critical patent/JPH0981549A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 【課題】ハイパーテキストにアクセスする際の、ユーザ
から見たレスポンス時間をより短縮させることを可能に
する。 【解決手段】ハイパーテキストのリンクの先にあるハイ
パーテキストに対してユーザからアクセス要求がある前
に予めアクセスし、リンクの先のハイパーテキストをバ
ックグラウンドで予め翻訳を開始しておく。また、ハイ
パーテキストのリンクの先にあるハイパーテキストに対
してユーザからアクセス要求がある前に予め翻訳を開始
しておく際に、リンクの先のハイパーテキストの中で次
にユーザがアクセスする可能性が高い文書を予測し、ア
クセスする可能性が高い文書については優先して翻訳し
ておく。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ハイパーテキスト
システムにアクセスする際の言語翻訳システムに係り、
特にインターネット等のネットワークを通じてWorl
d Wide Web(WWW)にアクセスする際のハ
イパーテキストアクセス用翻訳方法に関する。
【0002】
【従来の技術】近年、インターネットの普及に伴い、W
orld Wide Web(WWW)が注目を集めて
いる。WWWは、インターネットを通じて、世界中の情
報を自由にアクセスして情報収集を行なうことができる
等の利点を持っている。
【0003】ところが、世界中の情報に自由にアクセス
できるが、諸外国の情報は外国語で書かれているものが
殆どで、その際にその言語を得意としないユーザにとっ
ては、言語の壁が、情報収集の際のボトルネックとなる
という問題が発生している。
【0004】一方、近年計算機による自然言語処理技術
が高まり各種の文書処理システムが開発されている。特
に、ある国の言語を他の国の言語に自動的に翻訳する機
械翻訳システムなどが実用化されている。
【0005】そこで、情報収集の際の言語の壁を取り払
うために、WWW用機械翻訳システムが最近実用化され
た。(電子情報通信学会技術研究報告(オフィスシステ
ム)OFS95−6pp.31−pp.36「快適なイ
ンターネットサーフィングを支援するWWW用機械翻訳
システム」1995年5月) WWW用機械翻訳システムにおいては、ユーザがHip
ertext Transfer Protocol
(http)等で取って来たHypertextMar
kup Language(HTML)等のハイパーテ
キストで書かれた外国語の文書を、日本語のハイパーテ
キスト文書に翻訳し、ユーザに表示する。この際、元の
文書のリンクの情報はそのままにして翻訳を行なう。
【0006】一般に、HTMLのようなハイパーテキス
トの文書では、テキストの中に他のハイパーテキストを
参照するためのタグ情報がリンクとして埋め込まれてい
て、そのリンクを辿ることで関連する文書にアクセスで
きるようになっている。
【0007】このように翻訳を行なうことによって、イ
ンターネットを通じて入手したHTML文書等のハイパ
ーテキスト文書を自国語で読んで情報収集を行なうこと
ができる。また、元のHTML文書等のハイパーテキス
ト文書中に埋め込まれたリンクを翻訳結果のHTML文
書等のハイパーテキスト文書でもそのまま保存しておく
事によって、必要に応じて、原文書からと同じように翻
訳結果の文書からリンクの先の文書にアクセスする事が
できる。
【0008】しかしながら、通常、機械翻訳には、ある
一定の処理時間が必要となる。従って、ユーザは翻訳結
果が得られるまで一定時間待たなければならないという
問題が生じる。
【0009】そこで、従来のWWW用機械翻訳システム
は、ユーザが翻訳処理の実行開始を指示するために翻訳
ボタンを押さなくとも、原文書を表示すると同時に翻訳
を始めるようになっている(事前翻訳機能)。こうする
ことによって、ユーザが翻訳ボタンを押す際には、文書
の何割かの部分が既に翻訳されているので、ユーザに対
して、翻訳ボタンが押されてから翻訳結果ができあがる
までの時間を短縮して翻訳結果を提示することができ
る。
【0010】また、従来のWWW用機械翻訳システムで
は、一度翻訳した結果を蓄積しておくことにより、再度
その文書にアクセスした際には、その文書が変更されて
いる場合のみ翻訳を行えばよいようになっている(蓄積
選択機能)。従って、そのような際には翻訳の過程を省
略することができ、ユーザの待ち時間を短縮することが
できる。
【0011】
【発明が解決しようとする課題】このように従来のWW
W用機械翻訳システムでは、ユーザから見たレスポンス
時間を短縮するための工夫がなされている。しかしなが
ら、ユーザから見たレスポンス時間を短縮するためには
これだけでは不十分である。
【0012】従来のWWW用翻訳システムでは、事前翻
訳機能よって、httpで所望の文書を取って来てから
文書の翻訳を始めているため、ユーザが翻訳ボタンを押
す前に翻訳が始まるという利点があるものの、http
で文書を取って来てから翻訳ボタンを押すまでの時間が
短い場合や、文書が大きい場合には、翻訳がまだ終了し
ていないことが多い。
【0013】また、蓄積選択機能によって、過去の翻訳
結果を蓄積しておくことにより、再度その文書にアクセ
スした際には、その文書が変更されている場合のみ翻訳
を行えば良いという利点はあるものの、文書が変更され
ている場合には、文書全体をもう一度翻訳し直さなけれ
ばならない。
【0014】本発明は前記のような事情を考慮してなさ
れたもので、ハイパーテキストにアクセスする際の、ユ
ーザから見たレスポンス時間をより短縮させることが可
能な翻訳方法を提供することを目的とする。
【0015】すなわち、文書の中のリンクが指す文書に
ついてはユーザが次にアクセスすることが予測されるの
で、文書の中のリンクの指す文書についてはユーザがア
クセス要求を出す前に、あらかじめアクセスして翻訳を
開始しておき、ユーザからみたレスポンス時間をさらに
短縮することを第1の目的とする。
【0016】また、文書の中のリンクが指す文書の中で
も、ユーザが次にアクセスする可能性が高い文書を予測
し、ユーザがアクセス要求を出す前にあらかじめアクセ
スして翻訳を開始する際に、ユーザがアクセスする可能
性の高い文書については優先的に翻訳しておくことによ
って、ユーザからみたレスポンス時間をさらに短縮する
ことを第2の目的とする。
【0017】また、過去のアクセス履歴を参照した結
果、ユーザがアクセスした文書あるいはアクセスが予測
される文書が変更されていた場合でも、変更されていた
文書について必要最小限の翻訳を実行することによって
ユーザの待ち時間を短縮することを第3の目的とする。
【0018】
【課題を解決するための手段】本発明は、第1の目的を
達成するため、本発明は、WWWサーバ等のHTML等
のハイパーテキストにアクセスする手段と協調し、ある
いはハイパーテキストにアクセスする手段を持ち、アク
セスして得られたHTML等のハイパーテキストを翻訳
する手段を持つ翻訳方法であり、ハイパーテキストのリ
ンクの先にあるハイパーテキストに対してユーザからア
クセス要求がある前に予めアクセスし、リンクの先のハ
イパーテキストをバックグラウンドで予め翻訳を開始し
ておくことを特徴とする。
【0019】また第2の目的を達成するため、ハイパー
テキストのリンクの先にあるハイパーテキストに対して
ユーザからアクセス要求がある前に予め翻訳を開始して
おく際に、リンクの先のハイパーテキストの中で次にユ
ーザがアクセスする可能性が高い文書を予測し、アクセ
スする可能性が高い文書については優先して翻訳してお
くことを特徴とする。
【0020】またさらに第3の目的を達成するため、さ
らにアクセスしたハイパーテキストとその翻訳結果を保
存する手段を持ち、ユーザからアクセス要求があったハ
イパーテキストとその翻訳結果が保存されていた場合に
は、実際にアクセスして得られたハイパーテキストと保
存されていた翻訳前のハイパーテキストとの差分のみを
必要最小限の翻訳作業で翻訳することを特徴とする。
【0021】このように、本発明の第1の目的を達成す
るための方法によれば、ハイパーテキスト中のリンクの
先の文書について、その文書の翻訳をユーザがアクセス
要求を出す前に始めることにより、ユーザの待ち時間を
従来のWWW用機械翻訳システム等のハイパーテキスト
アクセス用翻訳システムよりさらに短縮することができ
る。
【0022】また、第2の目的を達成するための方法に
よれば、今後アクセスする可能性の高い文書の翻訳を予
め優先度を上げて翻訳しておくことにより、その文書が
アクセスされた場合に、さらにユーザの待ち時間を短縮
することができる。さらに、第3の目的を達成するため
の方法によれば、ユーザが過去にアクセスした文書が変
更されていた場合でもユーザの待ち時間を短縮すること
ができる。
【0023】
【発明の実施の形態】以下、本発明の実施形態について
図面を参照しながら説明する。図1は本発明を適用する
ハイパーテキストアクセス用翻訳システムの中でも代表
的なWWW用翻訳システムを動作させるための構成例を
示す図であり、例えばネットワークの構成図である。図
1において、WWW用翻訳システム101は、ネットワ
ークで得られた第1言語の文書を第2言語の文書に翻訳
して表示するためのものであり、ソフトウェア等で実現
される。なお、本実施形態では、第1言語を英語、第2
言語を日本語として説明する。
【0024】翻訳結果記憶部102は、WWW用翻訳シ
ステム101が過去に翻訳した結果を格納しておくため
のもので、ディスク装置等によって構成される。ディス
ク装置は、ネットワークファイルシステム(NFS)あ
るいはネットワークドライブ等でWWW用システム10
1とネットワークで接続されていても、WWW用翻訳シ
ステム101が動作している計算機のローカルディスク
であってもよい。
【0025】WWWサーバ103は、WWW用翻訳シス
テム101からUniform Resource L
ocator(URL)要求を受取り、インターネット
に対してhttp要求等を出して、得られたHTML文
書をWWW用翻訳システム101に返す。
【0026】図2はWWW用翻訳システム101の構成
図である。図2に示すように、WWW用翻訳システム1
01は、表示入力部201及び翻訳部202によって構
成されている。
【0027】表示入力部201は、Xウィンドウシステ
ム等のウィンドウシステム上のクライアントあるいはア
プリケーションとして実現され、翻訳部202で得られ
た翻訳結果をCRT等を用いて表示しユーザに提示する
と同時に、ユーザからのURL要求の入力をマウスやキ
ーボード等から受け付け、翻訳部202に送る。
【0028】翻訳部202は、制御部203と翻訳バッ
ファ204から構成される。翻訳部202は、WWWサ
ーバ103から送られてきたHTML等で記述された第
1言語による文書を、HTMLで記述された第2言語の
文書に翻訳して、その結果を表示入力部201に送ると
同時に翻訳結果記憶部102に書き込む。また、表示入
力部201から入力されたURL要求や、翻訳部202
で生成されたURL要求を、必要に応じてWWWサーバ
103に送る。
【0029】図3は表示入力部201がCRT等の画面
上に表示させる内容の一例を示している。図3に示すよ
うに、表示画面中には「Document Titl
e」「Document URL」の他、翻訳部202
における翻訳結果であるハイパーテキストの一部内容
(図3では「ハイパーリンク」に関する文書)が表示さ
れている。表示中のハイパーテキスト中には、他のハイ
パーテキストを指し示すリンクが明示されている(図3
中ではテキスト中のアンダーラインがリンクを表わ
す)。この、アンダーラインが付加された語句を指示す
ることで、リンクされた他のハイパーテキストを表示さ
せて参照することができる。
【0030】図4は翻訳バッファ204に記憶される情
報を説明するための図である。翻訳バッファ204は、
ヘッダ部401と文書部402が含まれる。ヘッダ部4
01は、複数のHTML文書についての情報を書き込め
るようになっており、1つ1つの文書について、そのU
RL、翻訳が必要であるかどうかを示す変数「翻訳必
要」、その文書の翻訳が終了しているかどうかを示す変
数「翻訳終了」、及びその文書が実際に書き込まれる文
書部402へのポインタの4つの情報を書き込めるよう
になっている。なお、変数「翻訳必要」は、その値が1
で翻訳が必要であることを示し、0で翻訳が不要である
ことを示す。また、変数「翻訳終了」は、その値が1で
既に翻訳が終了していることを示し、0で翻訳されてい
ないことを示す。
【0031】文書部402は、複数のHTML文書を原
文と訳文を対にして書き込めるようになっている。また
文書部402は、原文と訳文が文レベルでの対応がわか
る形で書き込むことができるようになっている。一般に
は文書部402は大きな記憶領域を必要とするので、必
要に応じてダイナミックアロケーション等で計算機のメ
モリ上に確保するのがよい。
【0032】図5は翻訳結果記憶部102に記憶される
情報を説明するための図である。翻訳結果記憶部102
は、記憶部ヘッダ部501と記憶部文書部502が含ま
れる。
【0033】記憶部ヘッダ部501は、複数のHTML
文書についての情報を書き込めるようになっており、1
つ1つの文書について、そのURL、及びその文書が実
際に書き込まれる記憶部文書部502へのポインタの情
報を書き込めるようになっている。
【0034】記憶部文書部502は、複数のHTML文
書を原文と訳文を対にして書き込めるようになってい
る。この際、原文と訳文は文レベルでの対応がわかる形
で書き込むことができるようになっている。
【0035】次に、本実施形態の動作について、フロー
チャートを参照しながら説明する。図6は翻訳部202
の制御部203における処理の流れを表すフローチャー
トである。まず、ステップST601では表示入力部2
01からURL要求が送られて来る。ステップST60
2では表示入力部201から送られて来たURLが翻訳
バッファ204のヘッダ部401に存在するかどうかが
検査される。存在しない場合はステップST603に進
む。存在する場合はステップST611に進む。
【0036】ステップST603では表示入力部201
から受け取ったURL要求をWWWサーバ103へ送
る。ステップST604ではWWWサーバ103から、
要求したURLの、HTML等で書かれた文書が得られ
ると共に、翻訳バッファ204のヘッダ部401のUR
L領域にその文書のURLを書き込む。また、ヘッダ部
401の変数「翻訳終了」の値を0にする。さらに文書
部402に必要なメモリ領域を確保し、原文領域にWW
Wサーバ103から得られた文書を1文毎に分割して書
き込む。
【0037】ステップST605ではステップST60
4で文書部402の原文領域に書き込まれた文書の中か
ら全てのリンクの情報が取り出される。この際、原文領
域から同じURLのリンク、すなわち同じハイパーテキ
ストを指し示すリンクが複数個取り出された場合にはそ
れらのリンクはマージされる。リンクが複数個取り出さ
れるということは、今後アクセス可能性が高いと予測さ
れる。ステップST606では、ステップST605で
取り出された全てのリンクの先の文書を予め翻訳してお
くため、バックグラウンド翻訳ルーチン(詳細について
は後述する)が起動される。
【0038】例えば図6のルーチンがUNIX等のマル
チタスクが利用可能なOSの上で動作している場合には
fork等の処理がリンクの数だけの回数実行され、処
理(プロセス)が複製される。そして複製されて新たに
できた処理(プロセス)でバックグラウンド翻訳ルーチ
ンを実行する。また、例えば図6のルーチンがマルチス
レッドが利用可能なシステムで動作している場合には、
新しいスレッドがリンクの数だけ生成され、新たに生成
されたスレッドでバックグラウンド翻訳ルーチンを実行
する。
【0039】この際、ステップST605で今後アクセ
スされる可能性が高いと判断されたリンク先の文書を処
理するバックグラウンド翻訳ルーチンは、処理の優先度
を上げて起動される。例えば図6のルーチンがUNIX
オペレーティングシステム上でスーパユーザの権限で動
作している場合にはfork等で新たにできた優先度を
上げるべき処理(プロセス)に対し、親プロセスからr
eniceコマンドが実行される。
【0040】ステップST607では表示入力部201
に対し、WWWサーバ103から必要な文書が得られ翻
訳を開始することを応答する。ステップST608では
ステップST604で入手した文書がどの言語で書かれ
ているかが調べられ、翻訳すべきかどうかが検査され
る。この検査では簡単な形態素解析を行なって辞書引き
に成功する単語の割合を複数の言語で調べ、その割合が
高かった言語で文書が書かれていると判断する。
【0041】翻訳すべきと判断された場合は、ヘッダ部
401の変数「翻訳必要」の値を1にしてステップST
609に進む。翻訳すべきではないと判断された場合に
はヘッダ部401の変数「翻訳必要」の値を0にしてス
テップST610に進む。
【0042】ステップST609では翻訳実行ルーチン
(詳細については後述する)が実行され、翻訳バッファ
204の文書部402の訳文領域に1文毎に訳文が書き
込まれる。この際、訳文内にもHTMLのリンクの情報
が書き込まれる。ステップST610では翻訳バッファ
204の訳文領域に原文領域の文書がそのままコピーさ
れる。この際、変数「翻訳終了」の値を1にする。
【0043】一方、ステップST611では表示入力部
201に対し、既にWWWサーバ103から必要な文書
が得られていて、既に翻訳が開始されていることを応答
する。ステップST612ではステップST602で翻
訳バッファ204のヘッダ部401中に見つかった、表
示入力部201から要求があったURLの文書について
既に翻訳が終了しているかどうかが、翻訳バッファ20
4のヘッダ部401の変数「翻訳終了」の値をもとに検
査される。変数「翻訳終了」の値が0の場合には、ステ
ップST613に進む。変数「翻訳終了」の値が1の場
合にはステップST614に進む。
【0044】ステップST613では、ステップST6
12で翻訳が終了していないことがわかった文書につい
て、その文書を翻訳している1つの翻訳実行ルーチンの
処理の優先度が上げられる。例えば図6のルーチンがマ
ルチタスクが可能なUNIXオペレーティングシステム
上でスーパーユーザの権限で動作している場合は、該当
する文書を翻訳している翻訳実行ルーチンのプロセスの
プロセス番号を引数として、プログラム中からreni
ceコマンドが実行される。
【0045】ステップST614では表示入力部201
からURL要求があった文書について翻訳バッファ20
4の文書部402の原文領域から全てのリンクの情報が
取り出される。この際、原文領域から同じURLのリン
ク、すなわち同じハイパーテキストを指し示すリンクが
複数個取り出された場合には、それらのリンクはマージ
される。リンクが複数個取り出されるということは、今
後アクセス可能性が高いと予測される。ステップST6
15ではステップST614で取り出された全てのリン
クの先の文書を予め翻訳するため、バックグラウンド翻
訳ルーチンが起動される。バックグラウンド翻訳ルーチ
ンを起動する方法はステップST606で述べたものと
同じである。ステップST615で今後アクセスされる
可能性が高いと予測された文書に対する処理もステップ
ST606でのものと同様である。
【0046】図7はバックグラウンド翻訳ルーチンの処
理の流れを表すフローチャートである。ステップST7
01では取り出されたリンクの1つが示すURLの文書
がWWWサーバ103に要求される。ステップST70
2ではWWWサーバ103から、要求したURLに応じ
た、HTML等で書かれた文書が得られると共に、翻訳
バッファ204のヘッダ部401のURL領域にその文
書のURLを書き込む。また、ヘッダ部401の変数
「翻訳終了」の値を0にする。さらに文書部402に必
要な記憶領域を確保し、原文領域にWWWサーバ103
から得られた文書を1文毎に分割して書き込む。
【0047】ステップST703ではステップST70
2で入手した文書がどの言語で書かれているかが調べら
れ、翻訳すべきかどうかが検査される。この際には図6
のステップST608での手法が用いられる。
【0048】翻訳すべきと判断された場合は、ヘッダ部
401の変数「翻訳必要」の値を1にしてステップST
704に進む。翻訳すべきではないと判断された場合に
はヘッダ部401の変数「翻訳必要」の値を0にしてス
テップST705に進む。
【0049】ステップST704では翻訳実行ルーチン
が実行され、翻訳バッファ204の文書部402の訳文
領域に1文毎に訳文が書き込まれる。この際、訳文にも
HTMLのリンクの情報が書き込まれる。ステップST
705では翻訳バッファ204の訳文領域に原文領域の
文書がそのままコピーされる。この際、変数「翻訳終
了」の値を1にする。
【0050】図8は翻訳実行ルーチンの処理の流れを表
すフローチャートである。ステップST801では翻訳
しようとしている文書のURLが図5の翻訳結果記憶部
102の記憶部ヘッダ部501に存在するかどうかが調
べられる。その文書のURLが翻訳結果記憶部102の
記憶部ヘッダ部501に存在する場合には、既にその文
書は過去に1回以上翻訳されている。この場合にはステ
ップST802に進む。文書のURLが翻訳結果記憶部
102の記憶部ヘッダ部501に存在しない場合にはス
テップST805に進む。
【0051】ステップST802では翻訳しようとして
いる文書、すなわち翻訳バッファ204の文書部402
の原文領域にある文書と、その文書と同じURLを持つ
翻訳結果記憶部102の記憶部文書部502の原文領域
にある文書との間に差分があるかどうかが1文ずつ検査
される。1文でも差分がある場合にはステップST80
3に進む。文書全体が同じであった場合にはステップS
T806に進む。
【0052】ステップST803では例えば特開平2−
118774号に記載された方法によって、翻訳しよう
としている文書、すなわち翻訳バッファ204の文書部
402の原文領域にある文書と、その文書と同じURL
を持つ翻訳結果記憶部102の記憶部文書部502の原
文領域にある文書との差分が文単位で翻訳される。その
際、1文翻訳される毎に、訳文が翻訳バッファ204の
文書部402の訳文領域に書き込まれる。
【0053】差分がなく既に翻訳されている文について
は翻訳結果記憶部102の記憶部文書部502の訳文領
域にある訳文1文が翻訳バッファ204の文書部402
の訳文領域にコピーされる。文書全体の訳が得られると
ステップST804に進む。
【0054】ステップST804では全文の翻訳が終了
したので、その文書についての変数「翻訳終了」の値を
1にすると共に、翻訳結果を翻訳バッファ204からコ
ピーして翻訳結果記憶部102に書き込む。その際に原
文も訳文と同様に翻訳結果記憶部102に書き込み、原
文と訳文は記憶部文書部102に文単位の対応が取れる
形で書き込む。またその文書のURLも同時に記憶部ヘ
ッダ部501に書き込んでおく。これらの翻訳結果記憶
部102への書き込みの際、文書の差分が翻訳された場
合には新たな領域に書き込まれるのではなく、これまで
の領域に上書きされる。
【0055】ステップST805ではステップST80
1で過去の翻訳結果が得られなかったので、翻訳バッフ
ァ204の文書部402の原文領域にある該当する文書
の全文が翻訳される。その際、1文翻訳される毎に、訳
文が翻訳バッファ204の訳文領域に書き込まれる。
【0056】ステップST806では、ステップST8
02で現在翻訳しようとしているURLの文書が起去に
翻訳した時から変化していないことが明らかになったの
で、翻訳結果記憶部102の記憶部文書部502の訳文
領域にあるその文書の訳文が全て翻訳バッファ204の
訳文領域にそのままコピーされる。
【0057】図9はユーザからのURL入力に対する表
示入力部201の処理の流れを表すフローチャートであ
る。ステップST901ではユーザがマウスで表示入力
部201の画面をクリックする、あるいはキーボードで
URLを直接タイプする等の方法でURLを入力する。
【0058】ステップST902ではユーザから入力さ
れたURLについて翻訳部202にURL要求を出す。
ステップST903では翻訳部202から、要求された
URLの文書についてWWWサーバ103から文書を入
手して翻訳を始めた旨、あるいは予め翻訳が始まってい
た旨、応答が帰って来る。
【0059】ステップST904では翻訳部202に要
求したURLの文書について既に全文の翻訳が終了して
いるかが検査される。この際、翻訳バッファ204のヘ
ッダ部401の該当するURLについての変数「翻訳終
了」にアクセスし、この変数が0になっていれば翻訳が
まだ途中であると判断され、ステップST905に進
む。この変数「翻訳終了」が1になっていれば、翻訳が
終了しているあるいは翻訳する必要がない文書だと判断
されてステップST907に進む。
【0060】ステップST905では翻訳バッフッァ2
04の文書部402の訳文領域にアクセスされ、該当す
るURLの文書の訳文を翻訳が出来上がった文まで画面
に表示される。
【0061】ステップST906では翻訳作業が進むの
を待つために一定時間待機する。この際、翻訳部202
が処理速度の速い計算機上にある場合は短い待機時間に
し、翻訳部202が処理速度の遅い計算機上にある場合
は長めの待機時間にするとよい。一定時間待機した後、
ステップST904に戻る。
【0062】一方、ステップST904で全文について
翻訳が終了していれば、ステップST907で翻訳バッ
ファ204の文書部402の訳文領域にアクセスし、該
当するURLの文書の訳文を全文画面に表示する。
【0063】このようにして、表示中のハイパーテキス
トの中のリンクが指すハイパーテキストについては、ユ
ーザによって次にアクセスされることが予測されるの
で、リンクの指すハイパーテキストについてはユーザが
アクセス要求を出す前に、あらかじめアクセスして翻訳
を開始しておくことによって、ユーザからみたレスポン
ス時間をさらに短縮することができる。
【0064】また、ハイパーテキストの中のリンクが指
すハイパーテキストテキストが複数ある場合に、その中
でユーザが次にアクセスする可能性が高いハイパーテキ
ストを予測し、ユーザがアクセス要求を出す前にあらか
じめアクセスして翻訳を開始する際に、ユーザがアクセ
スする可能性の高いハイパーテキストについては優先的
に翻訳しておくことによって、ユーザからみたレスポン
ス時間をさらに短縮することができる。
【0065】また、過去のアクセス履歴を参照した結
果、ユーザがアクセスしたハイパーテキスト、あるいは
アクセスが予測されるハイパーテキストが変更されてい
た場合でも、変更されていた差分の部分についてのみ翻
訳を行なうことで、必要最小限の翻訳ですみ、ユーザの
待ち時間を短縮することができる。
【0066】なお、本発明は前述した実施形態に限定さ
れるものではない。例えば図2でWWW用翻訳システム
を翻訳部202だけで構成し、表示入力部201は別に
して翻訳部202とネットワークで結ぶようにしてもよ
い。そのような構成にすると、家庭等のエンドユーザは
表示入力部201だけを家庭のマシンに持ち、比較的大
きなネットワーク上の計算機に存在する翻訳部202と
電話回線やISDN回線等で結んで、システムを構成す
ることもできる。
【0067】また、例えば図1でWWW用翻訳システム
101と、翻訳結果記憶部102をユーザの近くに置い
て、WWWサーバ103とは物理的に離れた場所に設置
し、電話回線やISDN回線等を結んでも良い。その
際、WWW用翻訳システム101とWWWサーバ103
の間は、Point to Point Protoc
ol(PPP)等のプロトコルで接続することができ
る。
【0068】また、逆に図1の全ての構成要素を1つの
計算機内で実現してもよい。また、アクセスする可能性
の高いハイパーテキストを、そのハイパーテキストのア
クセス頻度から判断してもよい。
【0069】また。本発明は上で具体的に説明したWW
Wアクセス用に限定されたものではなく、ハイパーテキ
ストアクセス用に一般的に利用可能である。また、本発
明は、物理的な計算機の構成(CPUが1つ、あるいは
複数等)に依存するものではないが、特に本発明の処理
方法を並列計算機で実行した場合、あるいはネットワー
クを用いた分散処理で実行した場合等、すなわち複数の
CPUを同時に使用できる場合に、その効果がより大で
ある。
【0070】
【発明の効果】以上詳述したように本発明によれば、ハ
イパーテキスト中のリンクの先の文書についてはユーザ
がアクセス要求を出す前に、あらかじめアクセスして翻
訳を開始しておくことによって、ユーザから見たレスポ
ンス時間を従来のWWW用翻訳システム等のハイパーテ
キストアクセス用翻訳システムよりさらに短縮すること
ができる。その際に、ユーザが次にアクセスする可能性
が高い文書を予測し、アクセスする可能性の高い文書に
ついては翻訳処理の優先度を上げることによって、さら
にレスポンス時間を短縮することができる。また、過去
のアクセス履歴を参照した場合に、ユーザがアクセスし
た文書あるいはアクセスする可能性の高い文書が変更さ
れていた場合でも、必要最小限の翻訳を行なうことによ
って、ユーザの待ち時間を従来のWWW用翻訳システム
等のハイパーテキスト用翻訳システムよりさらに短縮す
ることができる。また、翻訳が全部終了していない場合
でも、翻訳できた部分から順に表示することによって、
ユーザの待ち時間を短縮することができる。
【図面の簡単な説明】
【図1】本発明を適用するWWW用翻訳システムを動作
させるためのネットワークの構成図。
【図2】図1中に示すWWW用翻訳システム101の構
成図。
【図3】図1中の表示入力部201が画面上に表示させ
る内容の一例を示す図。
【図4】図1中の翻訳バッファ204に記憶される情報
を説明するための図。
【図5】図1中の翻訳結果記憶部102に記憶される情
報を説明するための図。
【図6】図1中の翻訳部202の制御部203における
処理の流れを表すフローチャート。
【図7】本実施形態におけるバックグラウンド翻訳ルー
チンの処理の流れを表すフローチャート。
【図8】本実施形態における翻訳実行ルーチンの処理の
流れを表すフローチャート。
【図9】本実施形態におけるユーザからのURL入力に
対する表示入力部201の処理の流れを表すフローチャ
ート。
【符号の説明】
101…WWW用翻訳システム 102…翻訳結果記憶部 103…WWWサーバ 201…表示入力部 202…翻訳部 203…制御部 204…翻訳バッファ 401…ヘッダ部 402…文書部 501…記憶部ヘッダ部 502…記憶部文書部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 ハイパーテキストの翻訳を行なう翻訳方
    法であって、 ハイパーテキスト中のリンクが指し示すハイパーテキス
    トの翻訳をアクセス要求がある前に予め開始しておくこ
    とを特徴とする翻訳方法。
  2. 【請求項2】 ハイパーテキストの翻訳を行なう翻訳方
    法であって、 ハイパーテキスト中のリンクが指し示すハイパーテキス
    トの中で、アクセス要求のある可能性が高いハイパーテ
    キストを予測し、この予測したハイパーテキストの翻訳
    をアクセス要求がある前に予め優先的に開始しておくこ
    とを特徴とする翻訳方法。
  3. 【請求項3】 ハイパーテキストの翻訳を行ない、ハイ
    パーテキストとその翻訳結果を保存する翻訳方法であっ
    て、 アクセス要求があったハイパーテキストとその翻訳結果
    が保存されていた場合には、実際にアクセスして得られ
    たハイパーテキストと保存されていた翻訳前のハイパー
    テキストとの差分のみを翻訳することを特徴とする翻訳
    方法。
JP7234287A 1995-09-12 1995-09-12 ハイパーテキストアクセス用翻訳方法 Pending JPH0981549A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7234287A JPH0981549A (ja) 1995-09-12 1995-09-12 ハイパーテキストアクセス用翻訳方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7234287A JPH0981549A (ja) 1995-09-12 1995-09-12 ハイパーテキストアクセス用翻訳方法

Publications (1)

Publication Number Publication Date
JPH0981549A true JPH0981549A (ja) 1997-03-28

Family

ID=16968626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7234287A Pending JPH0981549A (ja) 1995-09-12 1995-09-12 ハイパーテキストアクセス用翻訳方法

Country Status (1)

Country Link
JP (1) JPH0981549A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10301832A (ja) * 1997-04-25 1998-11-13 Kobe Nippon Denki Software Kk ハイパーメディア文書先読み装置およびその記録媒体
JP2000276431A (ja) * 1999-03-25 2000-10-06 Nec Corp 翻訳機能付きプロキシキャッシュサーバ及びそれを有する翻訳機能付きブラウジング・システム
JP2003521785A (ja) * 2000-02-02 2003-07-15 ワールドリンゴ.コム プロプライエタリー リミテッド 翻訳発注システム
US7216072B2 (en) 2000-02-29 2007-05-08 Fujitsu Limited Relay device, server device, terminal device, and translation server system utilizing these devices
US7493557B2 (en) 2001-09-12 2009-02-17 Seiko Epson Corporation Source file generation apparatus
JP2022530754A (ja) * 2019-04-30 2022-07-01 ホアウェイ・テクノロジーズ・カンパニー・リミテッド コンテンツ翻訳方法および端末

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10301832A (ja) * 1997-04-25 1998-11-13 Kobe Nippon Denki Software Kk ハイパーメディア文書先読み装置およびその記録媒体
JP2000276431A (ja) * 1999-03-25 2000-10-06 Nec Corp 翻訳機能付きプロキシキャッシュサーバ及びそれを有する翻訳機能付きブラウジング・システム
JP2003521785A (ja) * 2000-02-02 2003-07-15 ワールドリンゴ.コム プロプライエタリー リミテッド 翻訳発注システム
US7216072B2 (en) 2000-02-29 2007-05-08 Fujitsu Limited Relay device, server device, terminal device, and translation server system utilizing these devices
US7493557B2 (en) 2001-09-12 2009-02-17 Seiko Epson Corporation Source file generation apparatus
JP2022530754A (ja) * 2019-04-30 2022-07-01 ホアウェイ・テクノロジーズ・カンパニー・リミテッド コンテンツ翻訳方法および端末

Similar Documents

Publication Publication Date Title
US7207005B2 (en) Translation management system
US6347316B1 (en) National language proxy file save and incremental cache translation option for world wide web documents
US7016977B1 (en) Method and system for multilingual web server
US10541973B2 (en) Service of cached translated content in a requested language
US8489980B2 (en) Translation management system
KR100317401B1 (ko) 관련된웹페이지를인쇄하기위한장치및방법
US7958446B2 (en) Systems and methods for language translation in network browsing applications
US6041324A (en) System and method for identifying valid portion of computer resource identifier
KR100265548B1 (ko) 기계번역방법및장치
CN1146818C (zh) Web服务器和处理Web页面请求以及显示HTML页面的方法
JP2008527524A (ja) 埋め込み型翻訳強化検索
JPH11134150A (ja) ウェブ・ページをフォーマットするための装置及び方法
KR20040068105A (ko) 네트워크에서 동적 정보를 전달하기 위한 방법 및 시스템
JP4202857B2 (ja) プログラム、文字入力編集方法、装置及び記録媒体
US6615168B1 (en) Multilingual agent for use in computer systems
JP2000330992A (ja) 多国言語対応wwwサーバシステム及びその処理方法
JPH0981549A (ja) ハイパーテキストアクセス用翻訳方法
JP3912464B2 (ja) 画面表示データ読込装置
JP3647967B2 (ja) 画面遷移システム
KR20000039748A (ko) 다국어 웹 문서 번역 서비스 장치 및 이를 이용한번역 서비스 방법
WO2002054258A1 (en) Method and system for caching and distributing information from dynamic internet websites
KR20000049928A (ko) 다국어 검색엔진의 운영 장치 및 방법
JPH10143529A (ja) オートパイロット装置
US7853580B2 (en) Method, system and computer program for downloading information based on a snapshot approach
KR19990006459A (ko) 월드 와이드 웹상의 타이틀의 리스트를 디스플레이하기 위한 장치, 방법 및 컴퓨터 프로그램 제품