JPH1049531A - Html文書作成方法 - Google Patents
Html文書作成方法Info
- Publication number
- JPH1049531A JPH1049531A JP8198923A JP19892396A JPH1049531A JP H1049531 A JPH1049531 A JP H1049531A JP 8198923 A JP8198923 A JP 8198923A JP 19892396 A JP19892396 A JP 19892396A JP H1049531 A JPH1049531 A JP H1049531A
- Authority
- JP
- Japan
- Prior art keywords
- document
- contents
- text
- file
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 WWWブラウザを用いて定型文書の読みたい
章や節を見つけることを容易にすることができるHTM
L文書作成方法を提供する。 【解決手段】 定型文書を入力する工程と、あらかじめ
設定された定型文書における章又は節の書式から、定型
文書中の章又は節が表記された行を判断する工程と、判
断された章又は節が表記された行、及びその行から参照
すべき本文中の宛先からなる目次を生成する工程と、定
型文書に、目次の章又は節が表記された行から参照され
る宛先を付加した本文を生成する工程と、目次と本文と
を結合して出力する工程とを備えるものである。
章や節を見つけることを容易にすることができるHTM
L文書作成方法を提供する。 【解決手段】 定型文書を入力する工程と、あらかじめ
設定された定型文書における章又は節の書式から、定型
文書中の章又は節が表記された行を判断する工程と、判
断された章又は節が表記された行、及びその行から参照
すべき本文中の宛先からなる目次を生成する工程と、定
型文書に、目次の章又は節が表記された行から参照され
る宛先を付加した本文を生成する工程と、目次と本文と
を結合して出力する工程とを備えるものである。
Description
【0001】
【発明の属する技術分野】本発明は、インターネットで
広範囲に使用されているWWW(World Wide Web)ブラ
ウザで、文書等を参照するために用いられるHTML
(HyperText Mark-up Language)言語仕様において、あ
る定型の文書中にある文字および形式を認識して、HT
ML文書を作成するHTML文書作成方法に関するもの
である。
広範囲に使用されているWWW(World Wide Web)ブラ
ウザで、文書等を参照するために用いられるHTML
(HyperText Mark-up Language)言語仕様において、あ
る定型の文書中にある文字および形式を認識して、HT
ML文書を作成するHTML文書作成方法に関するもの
である。
【0002】
【従来の技術】従来、テキストファイルからHTMLフ
ァイルへの変換方法としは、タグとして、文書の先頭に
「<PRE>」を付加したり、改行を「<BR>や<P
>」に変換するものがあった。しかしながら、HTML
言語の仕様には、他の文書や、文書中のある位置へのハ
イパーリンクを張る機能があるが、それは人間によって
判断し、人間によって記述されるようになっていた。ま
た、文書中のある項目(例えば、章や節)へのハイパー
リンクがないので、人間が肉眼で検索したり、ブラウザ
に備え付けられた文字検索機能を用いて、その項目を探
す必要があるものであった。
ァイルへの変換方法としは、タグとして、文書の先頭に
「<PRE>」を付加したり、改行を「<BR>や<P
>」に変換するものがあった。しかしながら、HTML
言語の仕様には、他の文書や、文書中のある位置へのハ
イパーリンクを張る機能があるが、それは人間によって
判断し、人間によって記述されるようになっていた。ま
た、文書中のある項目(例えば、章や節)へのハイパー
リンクがないので、人間が肉眼で検索したり、ブラウザ
に備え付けられた文字検索機能を用いて、その項目を探
す必要があるものであった。
【0003】
【発明が解決しようとする課題】一般的に、ある定型文
書には、ある決まった項目が含まれている場合が多く、
従来、そのような定型文書のある項目を参照したい時に
は、肉眼で探したり、文字検索で一々探さなければなら
ず、面倒であるという問題点があった。
書には、ある決まった項目が含まれている場合が多く、
従来、そのような定型文書のある項目を参照したい時に
は、肉眼で探したり、文字検索で一々探さなければなら
ず、面倒であるという問題点があった。
【0004】
【課題を解決するための手段】本発明に係るHTML文
書作成方法は、定型文書から目次及びその目次から参照
される本文からなるHTML文書を作成するHTML文
書作成方法において、定型文書を入力する工程と、あら
かじめ設定された定型文書における章又は節の書式か
ら、定型文書中の章又は節が表記された行を判断する工
程と、判断された章又は節が表記された行、及びその行
から参照すべき本文中の宛先からなる目次を生成する工
程と、定型文書に、目次の章又は節が表記された行から
参照される宛先を付加した本文を生成する工程と、目次
と本文とを結合して出力する工程とを備えるものであ
る。
書作成方法は、定型文書から目次及びその目次から参照
される本文からなるHTML文書を作成するHTML文
書作成方法において、定型文書を入力する工程と、あら
かじめ設定された定型文書における章又は節の書式か
ら、定型文書中の章又は節が表記された行を判断する工
程と、判断された章又は節が表記された行、及びその行
から参照すべき本文中の宛先からなる目次を生成する工
程と、定型文書に、目次の章又は節が表記された行から
参照される宛先を付加した本文を生成する工程と、目次
と本文とを結合して出力する工程とを備えるものであ
る。
【0005】
実施の形態1.図1は本発明の一実施の形態に係るHT
ML文書の作成方法の概要を示すフローチャートであ
る。ここでは、仕様書や取り扱い説明書等、章や節番号
が、各章および各節の先頭に書かれた定型文書のHTM
L文書作成動作について説明する。また、章と節の1行
は、空白を除いた最初の文字が「数字」又は「第+数
字」で始まり、任意数の「空白」を間にはさんで、「章
名(節名)」という構成の定型文書をデフォルトとして
説明する。例えば、以下に示すような形式である。 「第1章 はじめに 1.1 概要」
ML文書の作成方法の概要を示すフローチャートであ
る。ここでは、仕様書や取り扱い説明書等、章や節番号
が、各章および各節の先頭に書かれた定型文書のHTM
L文書作成動作について説明する。また、章と節の1行
は、空白を除いた最初の文字が「数字」又は「第+数
字」で始まり、任意数の「空白」を間にはさんで、「章
名(節名)」という構成の定型文書をデフォルトとして
説明する。例えば、以下に示すような形式である。 「第1章 はじめに 1.1 概要」
【0006】まず、定型文書ファイルを入力し、1行を
読み出し(S1)、読み出した行が、章または節かどう
かを判定し(S2)、章か節なら抜き出し、目次に追加
して目次を作成し、この目次は、クリックした時、その
章または節にジャンプできるよう記述されている(S
3)。そして、目次からのハイパーリンクが可能なよう
に、本文を作成し(S4)、S1からS4までを、ファ
イルの最後(EOF)まで繰り返して、ファイルが終っ
たら、S3で作成した目次とS4で作成した本文とを結
合する(S5)。
読み出し(S1)、読み出した行が、章または節かどう
かを判定し(S2)、章か節なら抜き出し、目次に追加
して目次を作成し、この目次は、クリックした時、その
章または節にジャンプできるよう記述されている(S
3)。そして、目次からのハイパーリンクが可能なよう
に、本文を作成し(S4)、S1からS4までを、ファ
イルの最後(EOF)まで繰り返して、ファイルが終っ
たら、S3で作成した目次とS4で作成した本文とを結
合する(S5)。
【0007】次に、本発明の具体例について説明する。
図2は、この実施の形態の具体例を説明するための説明
図であり、この例は、仕様書等の定型文書(図2の
(a))に現れる章と節を抜き出し、それらにハイパー
リンクを張った目次と本文を作成しHTML文書(図2
の(b))を作成したものである。
図2は、この実施の形態の具体例を説明するための説明
図であり、この例は、仕様書等の定型文書(図2の
(a))に現れる章と節を抜き出し、それらにハイパー
リンクを張った目次と本文を作成しHTML文書(図2
の(b))を作成したものである。
【0008】次に、このHTML文書の作成動作につい
て説明する。図3はこの実施の形態のHTML文書の作
成動作の詳細を示すフローチャートである。まず、章又
は節の数(変数名:count)を0に初期化し(S1
0)、定型文書ファイルを開きファイルが終了か否かを
判断する(S20)。S20でファイルが終了でないと
判断された場合は、定型文書ファイルから1行読出し
(S30)、読み出した行が、章又は節かどうかを判断
する(S40)。
て説明する。図3はこの実施の形態のHTML文書の作
成動作の詳細を示すフローチャートである。まず、章又
は節の数(変数名:count)を0に初期化し(S1
0)、定型文書ファイルを開きファイルが終了か否かを
判断する(S20)。S20でファイルが終了でないと
判断された場合は、定型文書ファイルから1行読出し
(S30)、読み出した行が、章又は節かどうかを判断
する(S40)。
【0009】S40での判断基準は、その文書毎に決め
ることが可能であるが、デフォルトとして、空白を除い
た行の最初の文字列が数字(0〜9又は0 〜9 )、又は
空白を除いた行の先頭文字が「第」で、その後の文字が
数字(0〜9又は0 〜9 )であり、かつ、読み込んだ行
を連続した1つ以上の空白で区切った時に、1ワード目
と2ワード目共、又は2ワード目と3ワード目共に空白
だけでない場合に章又は節と判断するようになってい
る。
ることが可能であるが、デフォルトとして、空白を除い
た行の最初の文字列が数字(0〜9又は0 〜9 )、又は
空白を除いた行の先頭文字が「第」で、その後の文字が
数字(0〜9又は0 〜9 )であり、かつ、読み込んだ行
を連続した1つ以上の空白で区切った時に、1ワード目
と2ワード目共、又は2ワード目と3ワード目共に空白
だけでない場合に章又は節と判断するようになってい
る。
【0010】これは、章や節でない行で、空白を除いた
最初の文字が「数字」又は「第+数字」の場合の誤認を
避けるためである。例えば以下に示すような文書の場
合、 「3章 詳細説明 1章において説明したように、… 3.1節 実施例」 この3行は、いずれも最初の連続した空白を除いた、最
初の文字は数字であるが、2行目は章や節ではない。
最初の文字が「数字」又は「第+数字」の場合の誤認を
避けるためである。例えば以下に示すような文書の場
合、 「3章 詳細説明 1章において説明したように、… 3.1節 実施例」 この3行は、いずれも最初の連続した空白を除いた、最
初の文字は数字であるが、2行目は章や節ではない。
【0011】そこで、それぞれの行を1つ以上の連続し
た空白で分割すると、以下のように各行は分割される。 「「3章」、「詳細説明」、「」 「」、「1章において説明したように、…」、「」 「」「3.1節」、「実施例」」 このように、章や節の行は、1ワード目と2ワード目
共、又は2ワード目と3ワード目共に空白だけではなく
なり、章や節でない行を章や節として判断してしまうこ
とがなくなる。
た空白で分割すると、以下のように各行は分割される。 「「3章」、「詳細説明」、「」 「」、「1章において説明したように、…」、「」 「」「3.1節」、「実施例」」 このように、章や節の行は、1ワード目と2ワード目
共、又は2ワード目と3ワード目共に空白だけではなく
なり、章や節でない行を章や節として判断してしまうこ
とがなくなる。
【0012】そして、S40で章又は節と判断された場
合は、countをインクリメントし、一時的に作成さ
れた目次ファイルに「<A HREF ="#count">読み込んだ行
</A>」を出力する(S50)。ここで、countは章
又は節の数を示したものであり数字である。そして、一
時的に作成した本文ファイルには、「<A NAME ="count"
> 読み込んだ行」を出力する(S60)。
合は、countをインクリメントし、一時的に作成さ
れた目次ファイルに「<A HREF ="#count">読み込んだ行
</A>」を出力する(S50)。ここで、countは章
又は節の数を示したものであり数字である。そして、一
時的に作成した本文ファイルには、「<A NAME ="count"
> 読み込んだ行」を出力する(S60)。
【0013】また、S40で章や節でないと判断された
場合は、読み込んだ行をそのまま一時的に作成した本文
ファイルに出力し(S70)、S20に戻る。また、S
20でファイルが終了であると判断された場合は、一時
的に作成した目次ファイルと本文ファイルを1つのファ
イルに結合して、HTML文書を作成し、2つの一時フ
ァイルを消去し(S80)、終了する。
場合は、読み込んだ行をそのまま一時的に作成した本文
ファイルに出力し(S70)、S20に戻る。また、S
20でファイルが終了であると判断された場合は、一時
的に作成した目次ファイルと本文ファイルを1つのファ
イルに結合して、HTML文書を作成し、2つの一時フ
ァイルを消去し(S80)、終了する。
【0014】この実施の形態では、仕様書や取り扱い説
明書等の章や節に数字を用いている定型文中において、
本文中に出現する章や節を抽出し、目次を作成し、その
目次から章や節にジャンプできるようにHTML記述に
よるハイパーリンクをはることによって、WWWブラウ
ザを用いて参照する際に、読みたい章や節を見つけるこ
とを容易にすることが可能となる。
明書等の章や節に数字を用いている定型文中において、
本文中に出現する章や節を抽出し、目次を作成し、その
目次から章や節にジャンプできるようにHTML記述に
よるハイパーリンクをはることによって、WWWブラウ
ザを用いて参照する際に、読みたい章や節を見つけるこ
とを容易にすることが可能となる。
【0015】実施の形態2.図4は本発明の他の実施の
形態に係るHTML文書の作成方法の概要を示すフロー
チャートである。ここでは、例えば、公開特許公報のよ
うな、 で囲まれた項目に分けて書かれている定型文書のHTM
L文書作成動作について説明する。
形態に係るHTML文書の作成方法の概要を示すフロー
チャートである。ここでは、例えば、公開特許公報のよ
うな、 で囲まれた項目に分けて書かれている定型文書のHTM
L文書作成動作について説明する。
【0016】まず、定型文書ファイルを入力し、1行を
読み出し(S101)、読み出した行が抽出する項目か
どうかを判定し(S102)、抽出する項目なら抜き出
し、目次に追加して目次を作成し、この目次は、クリッ
クした時、その章または節にジャンプできるよう記述さ
れている(S103)。そして、目次からのハイパーリ
ンクが可能なように、本文を作成し(S104)、S1
01からS104までを、ファイルの最後(EOF)ま
で繰り返して、ファイルが終ったら、S103で作成し
た目次とS104で作成した本文とを結合する(S10
5)。
読み出し(S101)、読み出した行が抽出する項目か
どうかを判定し(S102)、抽出する項目なら抜き出
し、目次に追加して目次を作成し、この目次は、クリッ
クした時、その章または節にジャンプできるよう記述さ
れている(S103)。そして、目次からのハイパーリ
ンクが可能なように、本文を作成し(S104)、S1
01からS104までを、ファイルの最後(EOF)ま
で繰り返して、ファイルが終ったら、S103で作成し
た目次とS104で作成した本文とを結合する(S10
5)。
【0017】また、このとき、ハイパーリンクは、目次
だけにはるのではなく、本文中の各項目に、その前後の
項目にジャンプできるように設定するようにしてもよ
い。
だけにはるのではなく、本文中の各項目に、その前後の
項目にジャンプできるように設定するようにしてもよ
い。
【0018】次に、本発明の具体例について説明する。
図5及び図6は、この実施の形態の具体例を説明するた
めの説明図であり、この例は、特許公開公報(図5)に
現れる項目を抜き出し、それらにハイパーリンクを張っ
た目次と本文を作成しHTML文書(図6)を作成した
ものである。
図5及び図6は、この実施の形態の具体例を説明するた
めの説明図であり、この例は、特許公開公報(図5)に
現れる項目を抜き出し、それらにハイパーリンクを張っ
た目次と本文を作成しHTML文書(図6)を作成した
ものである。
【0019】次に、このHTML文書の作成動作につい
て説明する。図7はこの実施の形態のHTML文書の作
成動作の詳細を示すフローチャートである。なお、抽出
する指定項目は、使用者によって、最初の文字と末尾の
文字を与えられているものとする。この例では、公開特
許公報であるので、 である。
て説明する。図7はこの実施の形態のHTML文書の作
成動作の詳細を示すフローチャートである。なお、抽出
する指定項目は、使用者によって、最初の文字と末尾の
文字を与えられているものとする。この例では、公開特
許公報であるので、 である。
【0020】まず、抽出した項目の数(変数名:cou
nt)を0に初期化する(S110)。この変数cou
ntは、ハイパーリンクを記述する時に使われるもので
ある。そして、一時的に作成する目次用ファイルに、 「<A NAME ="0"> 」 を書き込み(S120)、ファイル終了かどうかを判断
する(S130)。
nt)を0に初期化する(S110)。この変数cou
ntは、ハイパーリンクを記述する時に使われるもので
ある。そして、一時的に作成する目次用ファイルに、 「<A NAME ="0"> 」 を書き込み(S120)、ファイル終了かどうかを判断
する(S130)。
【0021】S130でファイル終了でなければ、変換
元ファイルから一行読出し(S140)、その行に指定
された項目を含むかどうかを判定する(S150)。そ
して、S150で指定項目であると判断された場合、抽
出数countをインクリメントし、指定項目の末尾に
改行を示す<BR>を付加し、 「<A HREF ="#count">抽出した指定項目</A><BR>」 を目次ファイルに追加する(S160)。
元ファイルから一行読出し(S140)、その行に指定
された項目を含むかどうかを判定する(S150)。そ
して、S150で指定項目であると判断された場合、抽
出数countをインクリメントし、指定項目の末尾に
改行を示す<BR>を付加し、 「<A HREF ="#count">抽出した指定項目</A><BR>」 を目次ファイルに追加する(S160)。
【0022】また、本文中において、前後の項目にジャ
ンプできるようにするために、抽出項目数countを
それぞれ±1した、preとnextと変数を使って、
一時的に作成した本文用ファイルに、 「<A NAME ="count"><A HREF ="#pre">前項へ・</A><A
HREF ="#next"> 次項へ</A>抽出した指定項目」 を追加する(170)。
ンプできるようにするために、抽出項目数countを
それぞれ±1した、preとnextと変数を使って、
一時的に作成した本文用ファイルに、 「<A NAME ="count"><A HREF ="#pre">前項へ・</A><A
HREF ="#next"> 次項へ</A>抽出した指定項目」 を追加する(170)。
【0023】また、S150で指定項目でないと判断さ
れた場合、そのまま読み込んだ行を一時的に作った本文
用ファィルに追加する(S180)。そして、S130
からS170までの工程がファイルが終了するまで繰り
返され、S130で、ファイル終了と判断された場合、
本文用ファイルへ、 「<A NAME ="next"><A HREF ="#0">目次へ</A>」 を追加し(S190)、一時的に作成した目次ファイル
の末尾に本文ファイルを結合し、HTML文書を作成
し、2つの一時ファイルを消去し(S200)、終了す
る。
れた場合、そのまま読み込んだ行を一時的に作った本文
用ファィルに追加する(S180)。そして、S130
からS170までの工程がファイルが終了するまで繰り
返され、S130で、ファイル終了と判断された場合、
本文用ファイルへ、 「<A NAME ="next"><A HREF ="#0">目次へ</A>」 を追加し(S190)、一時的に作成した目次ファイル
の末尾に本文ファイルを結合し、HTML文書を作成
し、2つの一時ファイルを消去し(S200)、終了す
る。
【0024】この実施の形態では、公開特許公報のよう
に、文中の任意の項目が、ある決まった文字列によって
囲まれて出現する定型文書において、その項目を囲む前
後の文字列を指定することにより、指定された項目を抽
出し、項目一覧(目次)を作成し、その目次から各項目
にジャンプしたり、本文中の各項目から、その前後の項
目にジャンプできるように、HTML記述によりハイパ
ーリンクをはるようにしたので、WWWブラウザを用い
て参照する際に、読みたい項目を見つけることを容易に
することが可能となる。
に、文中の任意の項目が、ある決まった文字列によって
囲まれて出現する定型文書において、その項目を囲む前
後の文字列を指定することにより、指定された項目を抽
出し、項目一覧(目次)を作成し、その目次から各項目
にジャンプしたり、本文中の各項目から、その前後の項
目にジャンプできるように、HTML記述によりハイパ
ーリンクをはるようにしたので、WWWブラウザを用い
て参照する際に、読みたい項目を見つけることを容易に
することが可能となる。
【0025】実施の形態3.図8は本発明の他の実施の
形態に係るHTML文書の作成方法の概要を示すフロー
チャートである。ここでは、特許庁から電子出版されて
いる公開特許公報のような、SGML(Standard Gener
alized Markup Language)で書かれ、その本文中に図な
どのイメージ情報が挿入されている定型文書の定型文書
のHTML文書作成動作について説明する。
形態に係るHTML文書の作成方法の概要を示すフロー
チャートである。ここでは、特許庁から電子出版されて
いる公開特許公報のような、SGML(Standard Gener
alized Markup Language)で書かれ、その本文中に図な
どのイメージ情報が挿入されている定型文書の定型文書
のHTML文書作成動作について説明する。
【0026】ここで、電子出版されている公開特許公報
は、公報1件につき、SGMLで書かれた1つのテキス
トファイルと、その1つのテキストファイルに対して、
TIFF形式で描かれた複数のイメージデータを1つに
まとめたもので構成されている。また、このSGMLフ
ァイルとイメージファイルは、接尾子を除いて同じ名前
で収録されており、テキストファイルが、*.txt で、イ
メージファイルが、*.img というファイルとなってい
る。
は、公報1件につき、SGMLで書かれた1つのテキス
トファイルと、その1つのテキストファイルに対して、
TIFF形式で描かれた複数のイメージデータを1つに
まとめたもので構成されている。また、このSGMLフ
ァイルとイメージファイルは、接尾子を除いて同じ名前
で収録されており、テキストファイルが、*.txt で、イ
メージファイルが、*.img というファイルとなってい
る。
【0027】また、公開特許公報のSGMLで使われて
いるタグは、HTML化する時には、ほとんど捨てて構
わないものであり、必要なのは、イメージデータへのハ
イパーリンク部分だけである。この、イメージデータが
挿入されることを示すタグは、<RTI> で始まるものと<E
MI> である。また、表示の際に見易くするために、適当
な位置に改行(<BR>や<P> )を挿入する必要があり、こ
こでは、改行を、 の後ろだけに挿入するようにしている。
いるタグは、HTML化する時には、ほとんど捨てて構
わないものであり、必要なのは、イメージデータへのハ
イパーリンク部分だけである。この、イメージデータが
挿入されることを示すタグは、<RTI> で始まるものと<E
MI> である。また、表示の際に見易くするために、適当
な位置に改行(<BR>や<P> )を挿入する必要があり、こ
こでは、改行を、 の後ろだけに挿入するようにしている。
【0028】まず、1件の公報に対して複数のイメージ
を1つのイメージファイルを分割し(S300)、そし
て、SGMLで書かれたテキストファイルを1文字単位
で読み込み(S310)、その後、タグ等を認識し、イ
メージデータへハイパーリンクのはりつけ(S32
0)、不要なSGMLのタグの削除(S330)及びブ
ラウザ表示を美しくするための改行の挿入(S340)
を行なう。
を1つのイメージファイルを分割し(S300)、そし
て、SGMLで書かれたテキストファイルを1文字単位
で読み込み(S310)、その後、タグ等を認識し、イ
メージデータへハイパーリンクのはりつけ(S32
0)、不要なSGMLのタグの削除(S330)及びブ
ラウザ表示を美しくするための改行の挿入(S340)
を行なう。
【0029】ここで、図8のS300でのイメージデー
タの分割について説明する。まず、公開特許公報イメー
ジファイルの構成は、図9に示すように示すようになっ
ており、イメージファイルは、8バイトから成るヘッダ
と、複数のイメージデータそれぞれに対応するディレク
トリ(1ディレクトリ252バイト)と、不定長のイメ
ージデータに大別される。
タの分割について説明する。まず、公開特許公報イメー
ジファイルの構成は、図9に示すように示すようになっ
ており、イメージファイルは、8バイトから成るヘッダ
と、複数のイメージデータそれぞれに対応するディレク
トリ(1ディレクトリ252バイト)と、不定長のイメ
ージデータに大別される。
【0030】そして、S300でのメージファイルの分
割とは、図9におけるヘッダとディレクトリを取り除
き、1〜nまでのイメージデータをそれぞ1つずつのフ
ァイルに落とすものであり、ファイル名は、テキストフ
ァイルとイメージファイルの接尾子を除いて、各イメー
ジデータに対応して、"-(ハイフン)" の後に数字を付
加し、接尾子に"tif" を付加する(例えば、「9600001
0.img」は、「96000010-1.tif、96000010-2.tif、…、96
000010-n.tif 」に分割する)。
割とは、図9におけるヘッダとディレクトリを取り除
き、1〜nまでのイメージデータをそれぞ1つずつのフ
ァイルに落とすものであり、ファイル名は、テキストフ
ァイルとイメージファイルの接尾子を除いて、各イメー
ジデータに対応して、"-(ハイフン)" の後に数字を付
加し、接尾子に"tif" を付加する(例えば、「9600001
0.img」は、「96000010-1.tif、96000010-2.tif、…、96
000010-n.tif 」に分割する)。
【0031】また、分割する際に必要なデータは、各デ
ィレクトリの固定位置に存在し、各ディレクトリの先頭
位置を0バイトとしたときの、各情報の相対位置は図1
0に示すようになっている。そして、図10に示したよ
うな情報から、各ディレクトリの118−121バイト
に記されているイメージデータへのポインタによって、
イメージデータの存在する先頭位置から、166−16
9バイトに記されているサイズ分のデータを、236−
243バイトに記述されているID番号をファイル名に
利用して、ファイルに落とす。
ィレクトリの固定位置に存在し、各ディレクトリの先頭
位置を0バイトとしたときの、各情報の相対位置は図1
0に示すようになっている。そして、図10に示したよ
うな情報から、各ディレクトリの118−121バイト
に記されているイメージデータへのポインタによって、
イメージデータの存在する先頭位置から、166−16
9バイトに記されているサイズ分のデータを、236−
243バイトに記述されているID番号をファイル名に
利用して、ファイルに落とす。
【0032】但し、ここでのID番号は、テキストファ
イルの説明に用いられる図番 とは一致していない。そして、218−221バイトに
記されている数値が0の場合は終了し、0でなければ、
次のディレクトリに対して、同様の処理を行なう。
イルの説明に用いられる図番 とは一致していない。そして、218−221バイトに
記されている数値が0の場合は終了し、0でなければ、
次のディレクトリに対して、同様の処理を行なう。
【0033】次に、図8のS320でのイメージデータ
へハイパーリンクのはりつけについて説明する。上述し
たように、テキストファイルに書かれている図番と、実
際のイメージファイルのID番号は一致しない。そこ
で、図番をクリックした時に、対応する図が表示される
ように設定するため、最初に、各図番が、どのファイル
(ID番号で識別)に対応されているか調べる。
へハイパーリンクのはりつけについて説明する。上述し
たように、テキストファイルに書かれている図番と、実
際のイメージファイルのID番号は一致しない。そこ
で、図番をクリックした時に、対応する図が表示される
ように設定するため、最初に、各図番が、どのファイル
(ID番号で識別)に対応されているか調べる。
【0034】ここで、公開特許公報には、テキストファ
イルの末尾の項に、図11に示すような、各図番とタグ
がセットになっている部分が存在する。そこで、テキス
トファイルを読出し、図11に示すように書かれた部分
から、各図が、どのファイルに対応するかを認識する。
但し、ID番号が1(000001)の図は、公報の第
一ページの書誌的事項のイメージファイル(以下、フロ
ントページという)、ID番号が2(000002)の
図は、要約に添付される図である。
イルの末尾の項に、図11に示すような、各図番とタグ
がセットになっている部分が存在する。そこで、テキス
トファイルを読出し、図11に示すように書かれた部分
から、各図が、どのファイルに対応するかを認識する。
但し、ID番号が1(000001)の図は、公報の第
一ページの書誌的事項のイメージファイル(以下、フロ
ントページという)、ID番号が2(000002)の
図は、要約に添付される図である。
【0035】また、テキストファイル中の「図」+「数
字」で書かれている部分には、図12に示すように、対
応するファイルへのハイパーリンクをつける。さらに、
テキストファイル中に現れる図の挿入を意味するタグ
は、図13に示すように、対応する図番(ID番号00
001はフロントページ、ID番号00002は要約に
添付される図)をクリックすると、その図のファイルへ
ジャンプするように、ハイパーリンクをはる。但し、図
11に示すような組合せの場合は、図13に示すような
変換は行なわない。
字」で書かれている部分には、図12に示すように、対
応するファイルへのハイパーリンクをつける。さらに、
テキストファイル中に現れる図の挿入を意味するタグ
は、図13に示すように、対応する図番(ID番号00
001はフロントページ、ID番号00002は要約に
添付される図)をクリックすると、その図のファイルへ
ジャンプするように、ハイパーリンクをはる。但し、図
11に示すような組合せの場合は、図13に示すような
変換は行なわない。
【0036】そして、以上の動作によって、図番をクリ
ックすることによって、対応したイメージファイルが、
一般に無料配布されているイメージ表示ソフトウェア
(ワークステーションのxv等)によって、参照すること
が可能になる。
ックすることによって、対応したイメージファイルが、
一般に無料配布されているイメージ表示ソフトウェア
(ワークステーションのxv等)によって、参照すること
が可能になる。
【0037】そして、イメージデータに関係するタグ以
外は、すべて削除し、また、 の後には、改行を示すタグ(<BR>)を挿入し、以上で、
電子出版されている公開特許公報のHTML化は終了と
なる。
外は、すべて削除し、また、 の後には、改行を示すタグ(<BR>)を挿入し、以上で、
電子出版されている公開特許公報のHTML化は終了と
なる。
【0038】この実施の形態では、SGMLで書かれた
電子出版されている公開特許公報を、1件の特許公報に
対して複数のイメージデータが1つのTIFF形式にま
とめられているイメージファイルを、世の中に流通した
フリーソフトウェアで参照可能な形式に分割し、また、
本文中の不要なタグは削除し、必要なタグはHTMLの
タグに置き換え、さらに、本文中の図の説明の部分から
図番とイメージファイル名関係を解析して、本文中に出
現する図番をクリックすることにより、イメージファイ
ルを参照することができるようにHTMLのタグづけを
行うことにより、公開特許公報をHTML化することに
よって、従来のように公開特許公報を参照するための専
用ツールを使用しなくても、インターネットで広く利用
されているWWWブラウザで公開特許公報を参照するこ
とが可能となる。
電子出版されている公開特許公報を、1件の特許公報に
対して複数のイメージデータが1つのTIFF形式にま
とめられているイメージファイルを、世の中に流通した
フリーソフトウェアで参照可能な形式に分割し、また、
本文中の不要なタグは削除し、必要なタグはHTMLの
タグに置き換え、さらに、本文中の図の説明の部分から
図番とイメージファイル名関係を解析して、本文中に出
現する図番をクリックすることにより、イメージファイ
ルを参照することができるようにHTMLのタグづけを
行うことにより、公開特許公報をHTML化することに
よって、従来のように公開特許公報を参照するための専
用ツールを使用しなくても、インターネットで広く利用
されているWWWブラウザで公開特許公報を参照するこ
とが可能となる。
【0039】なお、この実施の形態では、HTML文書
の作成時、イメージデータへのハイパーリンク部分以外
のタグは捨てるようにしているが、HTMLのタグに変
換できるものがあれば、変換するようにしてもよい。
の作成時、イメージデータへのハイパーリンク部分以外
のタグは捨てるようにしているが、HTMLのタグに変
換できるものがあれば、変換するようにしてもよい。
【0040】
【発明の効果】以上のように、本発明によれば、定型文
書を入力し、あらかじめ設定された定型文書における章
又は節の書式から、定型文書中の章又は節が表記された
行を判断し、判断された章又は節が表記された行、及び
その行から参照すべき本文中の宛先からなる目次を生成
し、定型文書に、目次の章又は節が表記された行から参
照される宛先を付加した本文を生成し、目次と本文とを
結合して出力するようにしたので、WWWブラウザを用
いて定型文書を参照する際に、読みたい章や節を見つけ
ることを容易にすることができるという効果を有する。
書を入力し、あらかじめ設定された定型文書における章
又は節の書式から、定型文書中の章又は節が表記された
行を判断し、判断された章又は節が表記された行、及び
その行から参照すべき本文中の宛先からなる目次を生成
し、定型文書に、目次の章又は節が表記された行から参
照される宛先を付加した本文を生成し、目次と本文とを
結合して出力するようにしたので、WWWブラウザを用
いて定型文書を参照する際に、読みたい章や節を見つけ
ることを容易にすることができるという効果を有する。
【図1】本発明の一実施の形態に係るHTML文書の作
成方法の概要を示すフローチャートである。
成方法の概要を示すフローチャートである。
【図2】実施の形態1の具体例を説明するための説明図
である。
である。
【図3】実施の形態1のHTML文書の作成動作の詳細
を示すフローチャートである。
を示すフローチャートである。
【図4】本発明の他の実施の形態に係るHTML文書の
作成方法の概要を示すフローチャートである。
作成方法の概要を示すフローチャートである。
【図5】実施の形態2の具体例を説明するための説明図
である。
である。
【図6】実施の形態2の具体例を説明するための説明図
である。
である。
【図7】実施の形態2のHTML文書の作成動作の詳細
を示すフローチャートである。
を示すフローチャートである。
【図8】本発明の他の実施の形態に係るHTML文書の
作成方法の概要を示すフローチャートである。
作成方法の概要を示すフローチャートである。
【図9】公開特許公報のイメージファイルの構成を説明
するための説明図である。
するための説明図である。
【図10】イメージファイル内のディレクトリの各情報
を説明するための説明図である。
を説明するための説明図である。
【図11】公開特許公報のテキストファイル一部を示す
図である。
図である。
【図12】公開特許公報のテキストファイル中のハイパ
ーリンクを説明するための説明図である。
ーリンクを説明するための説明図である。
【図13】公開特許公報のテキストファイル中のハイパ
ーリンクを説明するための説明図である。
ーリンクを説明するための説明図である。
Claims (4)
- 【請求項1】 定型文書から目次及びその目次から参照
される本文からなるHTML文書を作成するHTML文
書作成方法において、 定型文書を入力する工程と、 あらかじめ設定された前記定型文書における章又は節の
書式から、前記定型文書中の章又は節が表記された行を
判断する工程と、 前記判断された章又は節が表記された行、及びその行か
ら参照すべき前記本文中の宛先からなる目次を生成する
工程と、 前記定型文書に、前記目次の章又は節が表記された行か
ら参照される宛先を付加した本文を生成する工程と、 前記目次と本文とを結合して出力する工程とを備えるこ
とを特徴とするHTML文書作成方法。 - 【請求項2】 定型文書から目次及びその目次から参照
される本文からなるHTML文書を作成するHTML文
書作成方法において、 定型文書を入力する工程と、 あらかじめ設定された文字から、前記定型文書中の前記
設定された文字で囲まれたキーワードが表記された行を
判断する工程と、 前記判断されたキーワードが表記された行、及びその行
から参照すべき前記本文中の宛先からなる目次を生成す
る工程と、 前記定型文書に、前記目次のキーワードが表記された行
から参照される宛先を付加した本文を生成する工程と、 前記目次と本文とを結合して出力する工程とを備えるこ
とを特徴とするHTML文書作成方法。 - 【請求項3】 定型文書から目次及びその目次から参照
される本文からなるHTML文書を作成するHTML文
書作成方法において、 定型文書を入力する工程と、 あらかじめ設定された文字から、前記定型文書中の前記
設定された文字で囲まれたキーワードが表記された行を
判断する工程と、 前記判断されたキーワードが表記された行、及びその行
から参照すべき前記本文中の宛先からなる目次を生成す
る工程と、 前記定型文書に、前記目次のキーワードが表記された行
から参照される宛先、及び前後のキーワードへの宛先を
付加した本文を生成する工程と、 前記目次と本文とを結合して出力する工程とを備えるこ
とを特徴とするHTML文書作成方法。 - 【請求項4】 文書ファイルとその文書ファイルに関係
する複数のイメージデータ及び各イメージデータの識別
データからなるイメージファイルから、HTML文書を
作成するHTML文書作成方法において、 前記文書ファイル及びイメージファイルを入力する工程
と、 前記複数のイメージデータからなるイメージファイルを
前記識別データに基づいて、単一のイメージデータから
なる複数のイメージファイルに分割する工程と、 前記文書ファイル中のイメージファイルを指示する語
句、及びその語句に対応する前記分割されたイメージフ
ァイルを判断する工程と、 前記文書ファイル中の、イメージファイルを指示する語
句に対して、参照すべきイメージファイルの宛先を付加
する工程とを備えることを特徴とするHTML文書作成
方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8198923A JPH1049531A (ja) | 1996-07-29 | 1996-07-29 | Html文書作成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8198923A JPH1049531A (ja) | 1996-07-29 | 1996-07-29 | Html文書作成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1049531A true JPH1049531A (ja) | 1998-02-20 |
Family
ID=16399217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8198923A Pending JPH1049531A (ja) | 1996-07-29 | 1996-07-29 | Html文書作成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1049531A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000021007A1 (en) * | 1998-10-05 | 2000-04-13 | Eastman Kodak Company | A system for generating and maintaining field service publications |
US6366753B1 (en) | 1999-11-11 | 2002-04-02 | Heidelberger Druckmaschinen Ag | Charger wire tensioning mounting mechanism and method of using |
JPWO2008013128A1 (ja) * | 2006-07-28 | 2009-12-17 | 株式会社Access | 端末装置、コンテンツ表示方法、およびコンテンツ表示プログラム |
-
1996
- 1996-07-29 JP JP8198923A patent/JPH1049531A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000021007A1 (en) * | 1998-10-05 | 2000-04-13 | Eastman Kodak Company | A system for generating and maintaining field service publications |
US6366753B1 (en) | 1999-11-11 | 2002-04-02 | Heidelberger Druckmaschinen Ag | Charger wire tensioning mounting mechanism and method of using |
JPWO2008013128A1 (ja) * | 2006-07-28 | 2009-12-17 | 株式会社Access | 端末装置、コンテンツ表示方法、およびコンテンツ表示プログラム |
US8429152B2 (en) | 2006-07-28 | 2013-04-23 | Access Co., Ltd. | Terminal device, content displaying method, and content displaying program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3860347B2 (ja) | リンク処理装置 | |
US6073143A (en) | Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request | |
US10042828B2 (en) | Rich text handling for a web application | |
JP5209235B2 (ja) | ドキュメントの注釈をソースドキュメントのコンテキスト内で視覚化すること | |
US8554786B2 (en) | Document information management system | |
CA2242158C (en) | Method and apparatus for searching and displaying structured document | |
US20030018670A1 (en) | Method, system and computer program product for implementing acronym assistance | |
US7428695B2 (en) | System for automatic generation of arbitrarily indexed hyperlinked text | |
JPH07325827A (ja) | ハイパーテキスト自動生成装置 | |
US20080028292A1 (en) | Techniques to facilitate reading of a document | |
JP5381704B2 (ja) | 情報提供システム | |
EP0384986A2 (en) | Method for displaying online information | |
US7814408B1 (en) | Pre-computing and encoding techniques for an electronic document to improve run-time processing | |
JPH06259420A (ja) | 文章編集支援装置 | |
JPH1049531A (ja) | Html文書作成方法 | |
JP2010165218A (ja) | 電子メール表示制御装置、電子メール表示制御方法、及び、プログラム | |
JP3966086B2 (ja) | 文書処理装置および方法 | |
JPH11134341A (ja) | ハイパーメデイア記述言語による記述情報の抜粋表示シ ステム | |
JP2005011301A (ja) | 文書処理装置及び文書処理プログラム | |
JP3077615B2 (ja) | ホームページ分析表示システム | |
US20030212959A1 (en) | System and method for processing Web documents | |
JP2000081999A (ja) | 文書出力システム | |
JPH09231234A (ja) | 文書検索装置 | |
JPH1091639A (ja) | 文書データベースシステム | |
JP2001067366A (ja) | データベース検索結果表示システム、方法及び記録媒体 |