JPH10187728A - Html文書処理装置及びhtml文書処理方法 - Google Patents

Html文書処理装置及びhtml文書処理方法

Info

Publication number
JPH10187728A
JPH10187728A JP8339288A JP33928896A JPH10187728A JP H10187728 A JPH10187728 A JP H10187728A JP 8339288 A JP8339288 A JP 8339288A JP 33928896 A JP33928896 A JP 33928896A JP H10187728 A JPH10187728 A JP H10187728A
Authority
JP
Japan
Prior art keywords
document
input
html document
html
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8339288A
Other languages
English (en)
Inventor
Shigeko Akiyama
薫子 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8339288A priority Critical patent/JPH10187728A/ja
Publication of JPH10187728A publication Critical patent/JPH10187728A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 【課題】 ユーザの待ち時間を短縮し、入力されるHT
ML文書の翻訳結果を逐次表示出力することのできるH
TML文書処理装置及びHTML文書処理方法を提供す
ること。 【解決手段】 HTML文書の入力を行う入力手段1
と、入力手段1から入力されるHTML文書を格納する
入力文書格納手段2と、入力文書格納手段2に格納され
たHTML文書中の翻訳対象文を、解析規則3に基づい
た所定の単位で取り出す文書解析手段4と、文書解析手
段4によって取り出された所定の単位の翻訳対象文を翻
訳する翻訳手段5と、翻訳手段5により生成される所定
の単位の訳文を、入力文書格納手段2に格納されたHT
ML文書に付加する文書生成手段6と、文書生成手段6
により生成されるHTML文書を格納する出力文書格納
手段7と、出力文書格納手段7に格納されるHTML文
書を出力する出力手段8とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、インターネットな
どで用いられるHTML(HyperText Markup Languag
e)という言語で書かれた文書(以下「HTML文書」
と称する)データを解析して生成するHTML文書処理
装置及びHTML文書処理方法に関するものである。
【0002】
【従来の技術】最近では、パーソナルコンピュータ及び
通信装置の普及により、インターネットに代表される通
信ネットワークを通じて多くの情報を得ることができる
ようになった。その中でも、インターネット上を流れる
情報を収得しようと試みている操作者は多く、英語で書
かれた情報を手軽に得るために、HTML文書中の英文
を翻訳し、その訳文を表示するHTML文書処理装置が
知られている。
【0003】
【発明が解決しようとする課題】このような従来のHT
ML文書処理装置では、取得したHTML文書の1ファ
イル分の文書を一括して翻訳し、全ての翻訳を終えてか
ら、訳文をユーザに対して表示出力していたため、翻訳
を行っている間の待ち時間が長く、ユーザにとっては無
駄な時間となっていた。
【0004】本発明は、ユーザの待ち時間を短縮し、入
力されるHTML文書の翻訳結果を逐次表示出力するこ
とのできるHTML文書処理装置及びHTML文書処理
方法を提供することを目的とする。
【0005】
【課題を解決するための手段】この課題を解決するため
に本発明は、HTML文書の入力を行う入力手段と、入
力手段から入力されるHTML文書を格納する入力文書
格納手段と、入力文書格納手段に格納されたHTML文
書中の翻訳対象文を、解析規則に基づいた所定の単位で
取り出す文書解析手段と、文書解析手段によって取り出
された所定の単位の翻訳対象文を翻訳する翻訳手段と、
翻訳手段により生成される所定の単位の訳文を、入力文
書格納手段に格納されたHTML文書に付加する文書生
成手段と、文書生成手段により生成されるHTML文書
を格納する出力文書格納手段と、出力文書格納手段に格
納されるHTML文書を出力する出力手段とを有する構
成とした。
【0006】これにより、ユーザの待ち時間を短縮し、
入力されるHTML文書の翻訳結果を逐次表示出力する
ことのできるHTML文書処理装置が得られる。
【0007】
【発明の実施の形態】本発明の請求項1に記載の発明
は、HTML文書の入力を行う入力手段と、入力手段か
ら入力されるHTML文書を格納する入力文書格納手段
と、入力文書格納手段に格納されたHTML文書中の翻
訳対象文を、解析規則に基づいた所定の単位で取り出す
文書解析手段と、文書解析手段によって取り出された所
定の単位の翻訳対象文を翻訳する翻訳手段と、翻訳手段
により生成される所定の単位の訳文を、入力文書格納手
段に格納されたHTML文書に付加する文書生成手段
と、文書生成手段により生成されるHTML文書を格納
する出力文書格納手段と、出力文書格納手段に格納され
るHTML文書を出力する出力手段とを有する構成とし
たことにより、HTML文書中の翻訳対象文を所定の単
位で取り出し、取り出した翻訳対象文を翻訳し、所定の
単位の翻訳が終了後、逐次、元のHTML文書中に訳文
を埋め込んだ新たなHTML文書を生成し、表示出力す
ることで、操作者に対して、翻訳の待ち時間を短縮させ
ることができる。
【0008】本発明の請求項2に記載の発明は、入力手
段から入力されるデータが、1ファイル分となるまで入
力文書格納手段に蓄積するように制御する制御手段を有
する構成としたことにより、通信データのように、ラン
ダムに流れてくるデータであっても、1ファイル分とし
て纏めて処理することができる。
【0009】本発明の請求項3に記載の発明は、入力手
段から入力されるデータが、適当な量となるまで入力文
書格納手段に蓄積するように制御する制御手段を有する
構成としたことにより、通信データのように、ランダム
に流れてくるデータであっても、適当な量毎に、纏めて
処理をすることができる。
【0010】
【実施例】以下、本発明の一実施例について、図面を参
照しながら説明する。なお、本実施例では、英語のHT
ML文書が入力され、日本語の訳文を付加したHTML
文書が生成される場合を例として説明する。
【0011】図1は本発明の一実施例におけるHTML
文書処理装置の機能ブロック図である。
【0012】図1において、1はHTML文書の入力及
び各種の指示を行う入力手段、2は入力手段1から入力
されるHTML文書を格納する入力文書格納手段、3は
翻訳する英文を解析する規則である解析規則、4は入力
文書格納手段2に格納されたHTML文書を、解析規則
3の解析規則に基づいて解析し、翻訳対象英文を適当な
長さ(一文単位)で取り出す文書解析手段、5は文書解
析手段4で取り出された英文の翻訳を行う翻訳手段、6
は翻訳手段5で翻訳された訳文を、入力文書格納手段2
に格納されている元のHTML文書に付加して、訳文が
挿入された新たなHTML文書を生成する文書生成手
段、7は文書生成手段6で生成されたHTML文書を格
納する出力文書格納手段、8は出力文書格納手段7に格
納されたHTML文書を出力する出力手段、9は上記各
手段の制御を行う制御手段である。
【0013】図2は本発明の一実施例におけるHTML
文書処理装置のハードウェアブロック図である。
【0014】図1及び図2において、キーボード21
は、入力手段1を実現している。RAM(ランダム・ア
クセス・メモリ)22は、入力文書格納手段2、出力文
書格納手段7を実現している。ディスプレイ24は、出
力手段8を実現している。CPU(中央処理演算装置)
25は、制御手段9を実現している。
【0015】ROM(リード・オンリ・メモリ)23
は、CPU25によって実行される、解析規則3の解析
規則、文書解析手段4、翻訳手段5、文書生成手段6の
各処理を行うための制御プログラムを格納している。
【0016】以上のように構成されたHTML文書処理
装置について、以下にその動作を説明する。
【0017】図3は本発明の一実施例におけるHTML
文書処理装置のフローチャートであり、CPU25が制
御プログラムを実行する様子を示したものである。
【0018】図3に示すように、入力手段1を介して英
語のHTML文書が入力される(ステップ1)。この入
力は、入力手段1がフロッピーディスク等の記憶媒体か
らのロード機能を有しているものであっても良い。
【0019】入力手段1からHTML文書が入力される
と、入力文書格納手段2にHTML文書をテキストの状
態で格納する(ステップ2)。
【0020】入力文書格納手段2に格納されたHTML
文書に対して、文書解析手段4は、解析規則3の解析規
則を用いて英文の解析を行い、1翻訳単位(例えば、1
文単位)の翻訳対象文を取り出す(ステップ3)。
【0021】ステップ3で取り出した英語の翻訳対象文
を、翻訳手段5によって日本語の訳文に翻訳する(ステ
ップ4)。
【0022】文書生成手段6は、入力文書格納手段2に
格納されているHTML文書中に、翻訳手段5で翻訳し
た訳文を埋め込んだ新たなHTML文書を生成し、生成
されたHTML文書は、出力文書格納手段7に格納され
る(ステップ5)。
【0023】出力文書格納手段7に格納されたHTML
文書は、出力手段8に出力され(ステップ6)、ステッ
プ3に戻り、ステップ4、ステップ5、ステップ6の処
理を繰り返す。
【0024】なお、ステップ3で取り出された翻訳対象
文に対して、ステップ4、ステップ5、ステップ6の処
理が逐次行われることになる。これにより、1翻訳単位
の翻訳が終了したものから、逐次訳文を表示することが
可能となる。
【0025】また、図3のステップ2において、入力手
段1を介して入力されたHTML文書を、1ファイル分
となるまで入力文書格納手段2に蓄積し、その後に、前
述のステップ3以降の処理を行って、訳文付きのHTM
L文書を表示させることもできる。これによって、通信
データのように、ランダムに流れてくるデータであって
も、1ファイル分として纏めて処理することができる。
【0026】また、図3のステップ2において、入力手
段1を介して入力されたHTML文書を、解析規則3に
格納されている解析規則に従って、適当な単位となるま
で蓄積し、その後に、前述のステップ3以降の処理を行
って、訳文付きのHTML文書を表示させる。これによ
って、通信データのように、ランダムに流れてくるデー
タであっても、適当な量毎に纏めて処理することができ
る。
【0027】なお、前述した、入力されるHTML文書
データを、入力文書格納手段2に蓄積させるパターン
は、入力手段1からの指示により選択可能としても良
い。
【0028】次に、図3に示すフローチャートの処理
を、例文を用いて具体的に説明する。図4は本発明の一
実施例における解析規則を示す図、図5は本発明の一実
施例におけるHTML文書の表示例を示す図、図6は本
発明の一実施例におけるHTML文書のデータを示す図
である。
【0029】図6のように示されるHTML文書データ
を、図4に示す解析規則に従って解析を実行すると、次
に示すタグが検出される。
【0030】<FONT SIZE=-1> <BR> <A HARF="/assist/customer_serice/index.html"> </A> タグが検出されると、図4の解析規則に基づいて、次に
示す文が、1翻訳単位に分割された英文として解析され
る。
【0031】 Corporate Sales: 415/528-2555; Personal Sales: 415/528-3777: If you have any questions,please visit Customer Service. これらのうち、次に示す文が英語の翻訳対象文として判
断される(本実施例では、英文字を含まない文は、翻訳
対象文としない。)。
【0032】 Corporate Sales: Personal Sales: If you have any questions,please visit Customer Service. 図7、図9、図11は本発明の一実施例における訳文挿
入後のHTML文書のデータを示す図であり、図8、図
10、図12は本発明の一実施例における訳文挿入後の
HTML文書の表示例を示す図まず、「Corporate Sale
s:」が取り出されて翻訳され、「法人の販売:」の翻訳
結果が得られる。この訳文を埋め込んだHTML文書デ
ータが図7であり、これを表示したのが図8である。
【0033】次に、「Personal Sales:」が取り出され
て翻訳され、「パーソナルな販売:」の翻訳結果が得ら
れる。この訳文を埋め込んだHTML文書データが図9
であり、これを表示したのが図10である。
【0034】さらに、「If you have any questions,pl
ease visit Customer Service.」が取り出されて翻訳さ
れ、「もし、あなたがあらゆる質問を持っていれば、顧
客サービスをどうぞ訪れて下さい。」との翻訳結果が得
られ、この訳文を埋め込んだHTML文書データが図1
1であり、これを表示したのが図12である。
【0035】このように、翻訳処理と翻訳結果の表示処
理とは、1文目の翻訳結果を操作者に対して表示してい
る間に、2文目の翻訳処理を行い、2文目の翻訳結果を
操作者に対して表示している間に、3文目の翻訳処理を
行うというように、翻訳処理と翻訳結果の表示処理とを
交互に行う。
【0036】なお、本実施例において達成されるHTM
L文書処理装置及びHTML文書処理方法は、フロッピ
ーディスク、CD−ROM(Compact Disk - Read Only
Memory)などの光ディスク、ハードディスク等々の記
憶媒体に格納されたプログラムを、パーソナルコンピュ
ータに装着、または格納し、動作させることにより実現
可能である。
【0037】
【発明の効果】以上のように本発明によれば、HTML
文書の入力を行う入力手段と、入力手段から入力される
HTML文書を格納する入力文書格納手段と、入力文書
格納手段に格納されたHTML文書中の翻訳対象文を、
解析規則に基づいた所定の単位で取り出す文書解析手段
と、文書解析手段によって取り出された所定の単位の翻
訳対象文を翻訳する翻訳手段と、翻訳手段により生成さ
れる所定の単位の訳文を、入力文書格納手段に格納され
たHTML文書に付加する文書生成手段と、文書生成手
段により生成されるHTML文書を格納する出力文書格
納手段と、出力文書格納手段に格納されるHTML文書
を出力する出力手段とを有する構成としたことにより、
HTML文書中の翻訳対象文を所定の単位で取り出し、
取り出した翻訳対象文を翻訳し、所定の単位の翻訳が終
了後、逐次、元のHTML文書中に訳文を埋め込んだ新
たなHTML文書を生成し、表示出力することで、操作
者に対して、翻訳の待ち時間を短縮させることができ、
効率的に、HTML文書に書かれている情報を取得でき
る。
【図面の簡単な説明】
【図1】本発明の一実施例におけるHTML文書処理装
置の機能ブロック図
【図2】本発明の一実施例におけるHTML文書処理装
置のハードウェアブロック図
【図3】本発明の一実施例におけるHTML文書処理装
置のフローチャート
【図4】本発明の一実施例における解析規則を示す図
【図5】本発明の一実施例におけるHTML文書の表示
例を示す図
【図6】本発明の一実施例におけるHTML文書のデー
タを示す図
【図7】本発明の一実施例における訳文挿入後のHTM
L文書のデータを示す図
【図8】本発明の一実施例における訳文挿入後のHTM
L文書の表示例を示す図
【図9】本発明の一実施例における訳文挿入後のHTM
L文書のデータを示す図
【図10】本発明の一実施例における訳文挿入後のHT
ML文書の表示例を示す図
【図11】本発明の一実施例における訳文挿入後のHT
ML文書のデータを示す図
【図12】本発明の一実施例における訳文挿入後のHT
ML文書の表示例を示す図
【符号の説明】
1 入力手段 2 入力文書格納手段 3 解析規則 4 文書解析手段 5 翻訳手段 6 文書生成手段 7 出力文書格納手段 8 出力手段 9 制御手段 21 キーボード 22 RAM(ランダム・アクセス・メモリ) 23 ROM(リード・オンリ・メモリ) 24 ディスプレイ 25 CPU(中央処理演算装置)

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】HTML文書の入力を行う入力手段と、 前記入力手段から入力されるHTML文書を格納する入
    力文書格納手段と、 前記入力文書格納手段に格納されたHTML文書中の翻
    訳対象文を、解析規則に基づいた所定の単位で取り出す
    文書解析手段と、 前記文書解析手段によって取り出された所定の単位の翻
    訳対象文を翻訳する翻訳手段と、 前記翻訳手段により生成される所定の単位の訳文を、前
    記入力文書格納手段に格納されたHTML文書に付加す
    る文書生成手段と、 前記文書生成手段により生成されるHTML文書を格納
    する出力文書格納手段と、 前記出力文書格納手段に格納されるHTML文書を出力
    する出力手段とを有することを特徴とするHTML文書
    処理装置。
  2. 【請求項2】前記入力手段から入力されるデータが、1
    ファイル分となるまで前記入力文書格納手段に蓄積する
    ように制御する制御手段を有することを特徴とする請求
    項1記載のHTML文書処理装置。
  3. 【請求項3】前記入力手段から入力されるデータが、適
    当な量となるまで前記入力文書格納手段に蓄積するよう
    に制御する制御手段を有することを特徴とする請求項1
    記載のHTML文書処理装置。
  4. 【請求項4】データを入力する入力装置と、データを記
    憶する記憶装置と、データを出力する出力装置とを有す
    る装置を制御する方法であって、 入力装置から入力されるHTML文書を記憶装置に格納
    させ、 記憶装置に記憶されたHTML文書を、解析規則を用い
    て解析し、 所定の単位の翻訳対象文を取り出し、 取り出した所定の単位の翻訳対象文を翻訳し、 翻訳結果である訳文を、記憶装置に記憶されているHT
    ML文書に付加し、 訳文が付加されたHTML文書を記憶装置に格納し、 記憶装置に格納された、訳文が付加されたHTML文書
    を出力装置に出力させるように制御することを特徴とす
    るHTML文書処理方法。
  5. 【請求項5】データを入力する入力装置と、データを記
    憶する記憶装置と、データを出力する出力装置とを有す
    る装置を制御するためのプログラムを記憶した記憶媒体
    であって、 入力装置から入力されるHTML文書を記憶装置に格納
    させ、 記憶装置に記憶されたHTML文書を、解析規則を用い
    て解析し、 所定の単位の翻訳対象文を取り出し、 取り出した所定の単位の翻訳対象文を翻訳し、 翻訳結果である訳文を、記憶装置に記憶されているHT
    ML文書に付加し、 訳文が付加されたHTML文書を記憶装置に格納し、 記憶装置に格納された、訳文が付加されたHTML文書
    を出力装置に出力させるように制御することを特徴とす
    るプログラムを記憶した記憶媒体。
JP8339288A 1996-12-19 1996-12-19 Html文書処理装置及びhtml文書処理方法 Pending JPH10187728A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8339288A JPH10187728A (ja) 1996-12-19 1996-12-19 Html文書処理装置及びhtml文書処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8339288A JPH10187728A (ja) 1996-12-19 1996-12-19 Html文書処理装置及びhtml文書処理方法

Publications (1)

Publication Number Publication Date
JPH10187728A true JPH10187728A (ja) 1998-07-21

Family

ID=18326043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8339288A Pending JPH10187728A (ja) 1996-12-19 1996-12-19 Html文書処理装置及びhtml文書処理方法

Country Status (1)

Country Link
JP (1) JPH10187728A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001057722A1 (en) * 2000-02-02 2001-08-09 Worldlingo.Com Pty Ltd Translation ordering system
WO2002003270A1 (fr) * 2000-07-04 2002-01-10 Aai Inc. Dispositif et procede commerciaux, systeme, et support enregistre
AU765001B2 (en) * 2000-02-02 2003-09-04 Transperfect Global, Inc. Translation ordering system
JP4633937B2 (ja) * 1999-02-12 2011-02-16 株式会社アトラス 複数言語変換装置、複数言語変換方法及び複数言語変換のためのコンピュータプログラムを記憶した記憶媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4633937B2 (ja) * 1999-02-12 2011-02-16 株式会社アトラス 複数言語変換装置、複数言語変換方法及び複数言語変換のためのコンピュータプログラムを記憶した記憶媒体
WO2001057722A1 (en) * 2000-02-02 2001-08-09 Worldlingo.Com Pty Ltd Translation ordering system
AU765001B2 (en) * 2000-02-02 2003-09-04 Transperfect Global, Inc. Translation ordering system
WO2002003270A1 (fr) * 2000-07-04 2002-01-10 Aai Inc. Dispositif et procede commerciaux, systeme, et support enregistre

Similar Documents

Publication Publication Date Title
US10275713B2 (en) Automatic data interpretation and answering analytical questions with tables and charts
JP3038079B2 (ja) 自動翻訳装置
JPH10124413A (ja) 埋め込みウェブオブジェクトの優先順位づけダウンローディングの方法と装置
US20010029442A1 (en) Translation system, translation processing method and computer readable recording medium
EP1655674A2 (en) THIRD LANGUAGE TEXT GENERATING ALGORITHM BY MULTI&amp;minus;LINGUAL TEXT INPUTTING AND DEVICE AND PROGRAM THEREFOR
JPH10187728A (ja) Html文書処理装置及びhtml文書処理方法
JP4435144B2 (ja) データ検索システム及びプログラム
JPH09106399A (ja) 機械翻訳装置及び機械翻訳方法
Tull Library systems and Unicode: a review of the current state of development
JP3056810B2 (ja) 文書検索方法および装置
JPH08161350A (ja) 電子ファイリング方法および装置
JP7366473B1 (ja) 文書処理プログラム及び情報処理装置
JPH10134059A (ja) Html文書処理装置及びhtml文書処理方法
JPH08137892A (ja) 文書検索方法及び文書検索装置
JPH113334A (ja) 翻訳装置及び翻訳方法
JP4294386B2 (ja) 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体
JP7083473B2 (ja) 入力支援装置
JPH01185724A (ja) 検索装置
JP4054353B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP2009295122A (ja) 構造化文書処理システム、構造化文書処理方法および構造化文書処理プログラム
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JP4019662B2 (ja) 文書編集装置、文書速読支援装置、文書編集方法、文書速読支援方法、文書編集プログラム、文書速読支援プログラムおよび記録媒体
JP2915225B2 (ja) 文書作成装置
JP2020191079A (ja) 情報処理方法及び情報処理装置
JP2004272785A (ja) 質問応答装置及び質問応答プログラム