JPH09160917A - タグ付き文書作成装置及びその方法 - Google Patents

タグ付き文書作成装置及びその方法

Info

Publication number
JPH09160917A
JPH09160917A JP7345264A JP34526495A JPH09160917A JP H09160917 A JPH09160917 A JP H09160917A JP 7345264 A JP7345264 A JP 7345264A JP 34526495 A JP34526495 A JP 34526495A JP H09160917 A JPH09160917 A JP H09160917A
Authority
JP
Japan
Prior art keywords
document
character string
input area
tag
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7345264A
Other languages
English (en)
Inventor
Hisaaki Kadoma
央章 角間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dainippon Screen Manufacturing Co Ltd
Original Assignee
Dainippon Screen Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dainippon Screen Manufacturing Co Ltd filed Critical Dainippon Screen Manufacturing Co Ltd
Priority to JP7345264A priority Critical patent/JPH09160917A/ja
Publication of JPH09160917A publication Critical patent/JPH09160917A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 文書作成者がタグの意味や使い方或いは文書
の論理構造などを理解していなくても、容易にタグ付き
文書を作成できるようにする。 【解決手段】 変換テーブル22は定型フォーマットに
おける文字入力エリアの座標と、その座標位置にある文
字列に付加すべきタグとを対応付けて格納している。文
字列抽出部24は変換テーブル22を参照して、定型フ
ォーマットを用いて作成された定型文書28の文字入力
エリア内より、文字列を抽出する。タグ付加部26は変
換テーブル22を参照して、文字列を抽出した文字入力
エリアの座標に対応するタグを、抽出した文字列の前後
に付加し、得られたタグ付きの文字列をタグ付き文書3
0の一部として出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、定型フォーマット
を用いて作成された定型文書からタグ付き文書を作成す
るタグ付き文書作成装置及びその方法に関するものであ
る。
【0002】
【従来の技術】タグ付き文書として代表的なものには、
ISO(国際標準化機構)によるSGML(Standard G
eneralized Markup Language)規格がある。この規格に
よると、タグ付き文書とは図8に示すような文書を言
う。即ち、タグ付き文書では、例えば<title>××××
××</title>のように、文字列(この場合、×××××
×)の前後に、その文字列の内容,特徴,性質,性格な
どを表す情報(この場合、title)を含むタグが付加さ
れている。
【0003】このようなタグ付き文書は、文書の蓄積や
再利用、或いは文書の加工などを行なう場合にとても有
効である。例えば、このようなタグ付き文書を多数蓄積
した場合、タグを目印として、各文書の共通の情報(例
えば、タイトル)を容易に検索抽出することができる。
また、タグ付き文書を印刷する場合でも、特定のタグの
付加された文字列のみを特殊な文字で印刷するなどの指
定を行なうことができる。
【0004】
【発明が解決しようとする課題】しかし、このようなタ
グ付き文書を作成するためには、文書作成者が、タグの
意味や使い方或いは文書の論理構造などを理解した上
で、適切な位置にタグを挿入して文書を作成する必要が
あった。従って、一般の文書作成者がタグ付き文書を作
成することは、大変手間のかかる作業となり、そのた
め、一般の文書の作成者によるタグ付け文書の作成は活
発には行なわれていなかった。
【0005】従って、本発明の目的は、上記した従来技
術の問題点を解決し、文書作成者がタグの意味や使い方
或いは文書の論理構造などを理解していなくても、容易
にタグ付き文書を作成することができるタグ付き文書作
成装置を提供することにある。
【0006】
【課題を解決するための手段およびその作用・効果】上
記した目的の少なくとも一部を達成するために、第1の
発明は、定型フォーマットの文字入力エリアに文字列を
入力することにより作成された定型文書の中から、前記
文字入力エリア内の文字列を抽出し、該文字列にタグを
付加して、タグ付き文書を作成するタグ付き文書作成装
置であって、前記文字入力エリアに関連する情報と、該
文字入力エリア内より抽出した文字列に付加すべきタグ
とを対応付けて格納する変換テーブルと、前記文字入力
エリア内より文字列を抽出する文字列抽出手段と、前記
文字列を抽出した前記文字入力エリアの関連情報に対応
するタグを、前記変換テーブルより読み出して、抽出し
た前記文字列に付加し、得られたタグ付きの文字列によ
って前記タグ付き文書を作成するタグ付加手段と、を備
えることを要旨とする。
【0007】このように、第1の発明では、定型フォー
マットの文字入力エリアに文字列を入力することによっ
て作成された定型文書から、タグ付き文書を作成してい
る。即ち、文字列抽出手段が、作成された定型文書の文
字入力エリア内より文字列を抽出し、タグ付加手段が、
文字列を抽出した文字入力エリアの関連情報に対応する
タグを、変換テーブルより読み出して、抽出した文字列
に付加し、得られたタグ付きの文字列によってタグ付き
文書を作成する。なお、変換テーブルは、定型フォーマ
ットにおける各文字入力エリアの関連情報と、その文字
入力エリア内より抽出した文字列に付加すべきタグとを
対応付けて格納している。
【0008】従って、第1の発明によれば、文書作成者
がタグの意味や使い方或いは文書の論理構造などを理解
していなくても、定型フォーマットを用いて定型文書を
作成しさえすれば、その定型文書から容易にタグ付き文
書を作成することができる。
【0009】第1の発明のタグ付き文書作成装置におい
て、前記文字列抽出手段は、前記変換テーブルより前記
関連情報を読み出して、該関連情報に基づいて前記文字
入力エリア内より文字列を抽出するようにしても良い。
【0010】変換テーブルには文字入力エリアの関連情
報が格納されているので、その関連情報を用いて文字入
力エリアを特定し、その入力エリア内より文字列を抽出
することができる。そして、その抽出した文字列に読み
出した上記関連情報に対応するタグを付加すれば良い。
【0011】第1の発明のタグ付き文書作成装置におい
て、前記関連情報は、前記文字入力エリアの前記定型文
書内での位置を表す位置情報を含むことが好ましい。ま
た、前記文字入力エリアの属性を表す属性情報を含むこ
とが好ましい。これらの情報は、いずれも、これらの情
報がわかれば、関連する文字入力エリアを特定すること
ができる情報だからである。
【0012】第2の発明は、タグ付き文書を作成するた
めのタグ付き文書作成方法であって、定型フォーマット
の文字入力エリアに文字列を入力することにより作成さ
れた定型文書を用意する第1の工程と、前記文字入力エ
リアに関連する情報と、該文字入力エリア内より抽出す
る文字列に付加すべきタグとを対応付けて格納する変換
テーブルを用意する第2の工程と、前記定型文書の中か
ら、前記文字入力エリア内の文字列を抽出する第3の工
程と、前記文字列を抽出した前記文字入力エリアの関連
情報に対応するタグを、前記変換テーブルより読み出し
て、抽出した前記文字列に付加し、得られたタグ付きの
文字列よって前記タグ付き文書を作成する第4の工程
と、を備えることを要旨とする。
【0013】このように、第2の発明では、第1の工程
において、定型フォーマットを用いて作成された定型文
書を用意し、第2の工程において、文字入力エリアの関
連情報とタグとを対応付ける変換テーブルを用意する。
そして、第3の工程では、定型文書の文字入力エリア内
より文字列を抽出し、第4の工程では、文字列を抽出し
た文字入力エリアの関連情報に対応するタグを変換テー
ブルより読み出して、文字列に付加し、タグ付き文書を
作成する。
【0014】従って、第2の発明においても、第1の発
明と同様に、文書作成者がタグの意味や使い方或いは文
書の論理構造などを理解していなくても、容易にタグ付
き文書を作成することができる。
【0015】第2の発明のタグ付き文書作成方法におい
て、前記第1の工程は、前記定型フォーマットを作成す
る工程を含んでも良い。
【0016】
【発明の実施の形態】以下、本発明の実施の形態を実施
例に基づいて説明する。図1は本発明の第1の実施例と
してのタグ付き文書作成装置を示すブロック図である。
図1に示すように、本実施例のタグ付き文書作成装置2
0は、定型フォーマット内の座標とその座標位置にある
文字列に付加すべきタグとを対応付けて格納する変換テ
ーブル22と、変換テーブル22を参照して、定型フォ
ーマットを用いて作成された定型文書より文字列を抽出
する文字列抽出部24と、変換テーブル22を参照し
て、抽出された文字列の前後にタグを付加するタグ付加
部26と、を備えている。
【0017】なお、図1に示す装置によってタグ付き文
書を作成するには、図2に示すように、前もって、定型
フォーマットの作成(ステップS10)や、変換テーブ
ルの作成(ステップS12)や、定型フォーマットを用
いた文書入力(ステップS14)などの各処理を行なう
必要がある。以下、図2に従って、順に説明する。
【0018】まず、文書を入力する際に用いる定型フォ
ーマットを作成する処理を行なう(ステップS10)。
図3は作成された定型フォーマットの一例を示す説明図
である。この例は「技術報告書」の定型フォーマットの
例である。図3に示すように、各記入項目にはそれぞれ
文字入力エリアがそれぞれ設定されている。例えば、エ
リアAは発行日を入力するためのエリアであり、エリア
Bは件名を、エリアCは期間を、エリアDは技術分類
を、エリアEはキーワードを、それぞれ入力するための
エリアである。作成された定型フォーマットはデータと
してハードディスクなどの記憶手段(図示せず)に蓄積
される。なお、定型フォーマットについては、自ら作成
しても良いし、また、市販されている汎用の定型フォー
マットを利用するようにしても良い。
【0019】次に、図1の変換テーブル22の内容を作
成する処理を行なう(ステップS12)。即ち、予め、
定型フォーマットを作成する際に各文字入力エリアA〜
Eの座標を調べておき、各座標に対して、各文字入力エ
リアA〜Eに入力される文字列に関連するタグをそれぞ
れ設定して、変換テーブル22の内容を作成する。
【0020】図4は図3の定型フォーマットにおける各
文字入力エリアA〜Eの座標を示す説明図であり、ま
た、図5は作成された変換テーブルの内容の一例を示す
説明図である。図4に示すように、各文字入力エリアA
〜Eの座標としては、例えば、各エリアの先頭の左下点
の座標を用いる。従って、文字入力エリアAの座標は例
えば(146,25)となり、文字入力エリアBの座標
は(16,41)となる。一方、文字入力エリアAには
文字列として発行日に関する文字列の入力が予定されて
いるので、この文字列に付加すべきタグとして <date><
/date>を設定する。また、文字入力エリアBには件名に
関する文字列の入力が予定されているので、この文字列
に付加すべきタグとしては <title></title>を設定す
る。従って、変換テーブル22の内容として、図5に示
すように、座標(146,25)にはタグとして<date>
</date>が、座標(16,41)にはタグとして<title>
</title>が、それぞれ対応付けられる。こうして作成さ
れた変換テーブル22の内容は、変換テーブル22内に
格納される。
【0021】なお、このような定型フォーマットと変換
テーブルの作成は、将来における文書の蓄積や再利用、
或いは文書の加工などが行い易くなるように、文書の論
理構造を良く理解し、タグの意味や使い方を良く知って
いる者によって、それぞれ行なわれる。
【0022】さて、こうして定型フォーマットと変換テ
ーブルが作成されたら、次に、定型フォーマットを用い
て文書を入力する処理を行なう(ステップS14)。文
書の入力は、各文字入力エリアA〜Eにそれぞれ所望の
文字列を入力することによって行なわれる。図6は図3
の定型フォーマットを用いて文書を入力した状態を示す
説明図である。図6に示すように、各文字入力エリアA
〜Eに文字列が入力されると、それら文字入力エリアA
〜Eは、入力される文字列の長さに応じて、自動的にエ
リアの長さが拡大される。
【0023】こうした文書の入力は、文書の論理構造の
知識がない一般の文書作成者によって行なわれることを
想定している。即ち、文書作成者は定型フォーマットに
おいて準備されている各記入項目へ所望の内容を入力す
るだけで良いため、一般の文書作成者でも容易に文書入
力を行なうことができる。なお、こうして定型フォーマ
ットを用いて作成された定型文書(即ち、入力された文
書)は、ハードディスクなどの記憶手段(図示せず)に
記憶される。
【0024】以上のようにして、定型フォーマットを用
いて作成された定型文書が多数蓄積されたら、次に、図
1に示したタグ付き文書作成装置によって、タグ付き文
書を作成する処理を行なう(ステップS16)。図1に
示すように、タグ付き文書30は、定型フォーマットを
用いて作成された定型文書28の一つ一つに対して、一
つずつ作成される。
【0025】図7は図2のタグ付き文書作成ステップS
16の詳細処理ルーチンを示すフローチャートである。
なお、図7に示す処理ルーチンは、定型フォーマットを
用いて作成された一つの定型文書28について、一つの
タグ付き文書30を作成しようとする度に起動される。
【0026】図7に示すように、まず、この処理ルーチ
ンが起動されると、変換テーブル22より、格納された
座標を読み出す処理を行なう(ステップS20)。即
ち、図1の文字列抽出部24が、変換テーブル22に格
納された複数の座標のうち、先頭に格納されている座標
を一つ読み出す。従って、変換テーブル22の内容が図
5に示した如くであるとすると、座標として(146,
25)がまず読み出されることになる。
【0027】次に、定型フォーマットを用いて作成され
た定型文書28から、読み出した座標位置にある文字列
を抽出する処理を行なう(ステップS22)。即ち、文
字列抽出部24が、読み出した座標位置の文字入力エリ
ア内に入力されている文字列を抽出する。従って、作成
された定型文書28が図6に示した如くであり、読み出
した座標が(146,25)であるとすると、座標(1
46,25)に対応する文字入力エリアはAであるの
で、そのエリアAに入力されている文字列「○年○月○
日」が抽出される。なお、エリアA内には「発行日:」
という文字列も存在するが、この文字列はタグ付き文書
を構成する情報として特に必要はないので、抽出の対象
から除外される。但し、「発行日:」という文字列も含
めて抽出するようにしても、何ら支障はない。
【0028】一般に、市販されているDTP(ディスク
・トップ・パブリッシング)ソフトなどでは、文書内で
の文字列や画像の入力位置をその座標で記憶するように
しており、さらに、座標を指定すると、その座標位置に
ある文字列や画像を読み出すことができるようになって
いるものが多い。従って、文字列抽出部24は、そのよ
うなソフトを利用することにより、ステップS22の処
理を実現することが可能である。なお、自らDTPソフ
トを作成して利用する場合でも、上記したような市販の
DTPソフトと同等の機能があれば十分である。
【0029】次に、変換テーブル22を参照して、抽出
した文字列の前後に、読み出した座標に対応するタグを
付加する処理を行なう(ステップS24)。即ち、タグ
付加部26が、ステップS20で読み出した座標に対応
するタグを変換テーブル22より読み出して、抽出した
文字列の前後にそのタグを付加する。こうして得られた
タグ付きの文字列はタグ付き文書30の一部として出力
される。
【0030】従って、変換テーブル22の内容が図5に
示した如くであり、座標が(146,25)である場
合、タグとしては 「<date></date>」が読み出され、ス
テップ22で抽出された文字列「○年○月○日」の前後
に付加されて、タグ付きの文字列 「<date>○年○月○
日</date>」が得られ、これがタグ付き文書の一部とな
る。
【0031】次に、変換テーブル22に読み出すべき座
標が残っているか否かを判定する処理を行なう(ステッ
プS26)。即ち、文字列抽出部24が、変換テーブル
22を再び参照して、変換テーブル22に格納されてい
る座標のうち、未だ読み出されていない座標が存在する
かどうかを判定する。そして、存在する場合にはステッ
プ20に戻って次の座標を読み出す処理を行ない、以
下、前述と同様の処理を繰り返す。存在しない場合に
は、図7に示す処理ルーチンを終了する。処理ルーチン
を終了すると、定型フォーマットを用いて作成された一
つの定型文書28について、一つのタグ付き文書30が
作成されたことになる。
【0032】図8は図6の定型文書について作成された
タグ付き文書の一例を示す説明図である。図5に示す変
換テーブル22の内容に従って、図6の定型文書内の所
定の文字列にタグが付加されることによって、図8に示
すようなタグ付き文書が作成される。
【0033】このようにして、定型フォーマットを用い
て作成された一つの定型文書28について、一つのタグ
付き文書30が作成されたら、蓄積された次の定型文書
についてタグ付き文書を作成するために、再び、図7の
処理ルーチンを起動する。
【0034】以上述べたように、本実施例によれば、文
書作成者はタグの意味や使い方或いは文書の論理構造な
どを理解していなくても、単に定型フォーマットを用い
て文書を入力するだけで良く、後は、図1に示したタグ
付き文書作成装置によって自動的にタグ付き文書を作成
することができるので、タグ付き文書の作成に手間がか
からない。
【0035】次に、本発明の第2の実施例について説明
する。本実施例の構成は、図1に示した第1の実施例の
構成と同じであり、本実施例における処理手順も図2に
示した第1の実施例の処理手順と同じである。但し、変
換テーブル22の内容が第1の実施例の場合と異なる。
本実施例では、変換テーブル22の内容として文字入力
エリアの座標を用いるのではなく、文字入力エリアの属
性を用いるようにする。
【0036】即ち、本実施例では、予め、定型フォーマ
ットを作成する際に、各文字入力エリアA〜Eに対して
それぞれ属性を設定しておき、各属性に対して、各文字
入力エリアA〜Eに入力される文字列に関連するタグを
それぞれ設定して、変換テーブル22の内容を作成す
る。一般に、市販されているDTPソフトなどでは、文
書内での文字入力エリアに対して文字フォントや文字サ
イズの他、属性を設定できる機能を有するものがあり、
ここでは、そのような機能を有するソフトを用いること
によって上記処理を実現することができる。
【0037】図9は図3の定型フォーマットにおける各
文字入力エリアA〜Eに対して設定された属性の一例を
示す説明図であり、また、図10は作成された変換テー
ブルの内容の一例を示す説明図である。図9に示すよう
に、各文字入力エリアA〜Eに対する属性としては、各
記入項目のタイトルをそのまま用いる。従って、文字入
力エリアAに対する属性は「発行日」となり、文字入力
エリアBに対する属性は「件名」となる。一方、文字入
力エリアAの文字列に付加すべきタグとしては、第1の
実施例と同様に、 <date></date>を設定し、また、文字
入力エリアBの文字列に付加すべきタグとしては <titl
e></title>を設定する。従って、変換テーブル22の内
容としては、図10に示すように、属性「発行日」には
タグとして<date></date>が、属性「件名」にはタグと
して<title></title>が、それぞれ対応付けられる。こ
うして作成された変換テーブル22の内容は、変換テー
ブル22内に格納される。
【0038】なお、ここで、属性とは文字入力エリアを
識別するための指標となるものをいい、従って、文字入
力エリアを識別することができるものであれば、単なる
番号であっても、記号であっても良く、定型フォーマッ
トを作成する者が自由に設定することができる。また、
異なる文字入力エリアにそれぞれ入力される文字列に対
し、同一のタグを付加したいのであれば、それら文字入
力エリアに対して属性を設定する際に、それぞれ同一の
属性を設定するようにすれば良い。例えば、図9の文字
入力エリアAとCに入力される文字列に、それぞれ、 <
date></date>というタグを付加したいのであれば、それ
ぞれのエリアA,Cに「発行日」という属性を設定すれ
ば良い。
【0039】さて、このようにして内容の作成された変
換テーブル22を用いて、タグ付き文書の作成を行なう
場合の処理について、次に説明する。図11は本発明の
第2の実施例におけるタグ付き文書作成ステップS16
の詳細処理ルーチンを示すフローチャートである。な
お、図11に示す処理ルーチンについても、図7の処理
ルーチンと同様に、定型フォーマットを用いて作成され
た一つの定型文書28について、一つのタグ付き文書3
0を作成しようする度に起動される。
【0040】図11に示すように、まず、この処理ルー
チンが起動されると、作成された定型文書28の文字入
力エリアより、文字列を抽出する処理を行なう(ステッ
プS30)。即ち、文字列抽出部24が、作成された定
型文書28における複数の文字入力エリアのうち、最初
の文字入力エリア内に入力されている文字列を抽出す
る。従って、作成された定型文書28が図6に示した如
くである場合、最初の文字入力エリアはAであるので、
そのエリアAに入力されている文字列「○年○月○日」
が抽出される。なお、抽出された文字列から「発行
日:」という文字列が除外されているのは、第1の実施
例と同様の理由による。
【0041】次に、文字列を抽出した文字入力エリアの
属性を調べる処理を行なう(ステップS32)。即ち、
文字列抽出部24が、文字列を抽出した文字入力エリア
に対して設定されている属性が何であるかを調べる。従
って、例えば、各文字入力エリアA〜Eに対して属性が
図9に示す如く設定されている場合、文字列を抽出した
文字入力エリアAについて属性を調べると、その属性は
「発行日」であることがわかる。
【0042】次に、変換テーブル22を参照し、抽出し
た文字列の前後に、調べた結果得られた属性に対応する
タグを付加する処理を行なう(ステップS34)。即
ち、タグ付加部26が、ステップS32で調べた結果と
して得られた属性に対応するタグを変換テーブル22よ
り読み出して、ステップ30で抽出した文字列の前後
に、そのタグを付加する。こうして得られたタグ付きの
文字列はタグ付き文書30の一部として出力される。
【0043】従って、例えば、変換テーブルの内容が図
10に示した如くであり、調べた結果得られた属性が
「発行日」である場合、タグとしては 「<date></date
>」が読み出される。そして、読み出されたタグは、ス
テップ30で抽出された文字列「○年○月○日」の前後
に付加され、その結果、タグ付きの文字列「<date>○年
○月○日</date>」が得られ、これがタグ付き文書の一
部となる。
【0044】次に、作成された定型文書28中に、文字
列を抽出すべき文字入力エリアが残っているか否かを判
定する処理を行なう(ステップS36)。即ち、文字列
抽出部24が、定型文書28内の文字入力エリアのう
ち、未だ文字列の抽出されていない文字入力エリアが存
在するかどうかを判定する。そして、存在する場合には
ステップ30に戻って次の座標を読み出す処理を行な
い、以下、前述と同様の処理を繰り返す。存在しない場
合には、図11に示す処理ルーチンを終了する。
【0045】このようにして、本実施例においても、第
1の実施例と同様にタグ付き文書を作成することができ
る。即ち、図10に示す変換テーブル22の内容に従っ
て、図6の定型文書内の所定の文字列にタグが付された
場合は、前述の図8に示すようなタグ付き文書が作成さ
れる。
【0046】以上述べたように、本実施例によれば、第
1の実施例と同様に、文書作成者がタグの意味や使い方
或いは文書の論理構造などを理解していなくても、容易
にタグ付き文書を作成することができる。また、前述し
たように、文字入力エリアが異なっていても、同一の属
性を設定することは可能であるので、異なる文字入力エ
リアの文字列に同一のタグを付加したいような場合で
も、第1の実施例に比較して簡単に付加することができ
る。
【0047】なお、本実施例においては、図11のフロ
ーチャートに示すように、まず、文字入力エリアより文
字列を抽出し、次に、その文字入力エリアの属性を調べ
るようにしているが、第1の実施例における図7のフロ
ーチャートに類似するように、まず、変換テーブルより
属性を読み出し、その属性に該当する文字入力エリアよ
り文字列を抽出するようにしても良い。一般に、市販さ
れているDTPソフトなどでは、文書について属性を指
定すると、その属性が設定されている文字入力エリアよ
り文字列を読み出すことができるようになっているもの
が多いので、そのようなソフトを利用することにより、
上記のような処理は容易に実現することができる。
【0048】なお、本発明は上記した実施例や実施形態
に限られるものではなく、その要旨を逸脱しない範囲に
おいて種々の態様にて実施することが可能であることは
言うまでもない。
【0049】即ち、上記した実施例では、変換テーブル
22の内容として、文字入力エリアの座標や属性を用い
ていたが、本発明はこれらに限定されるものではなく、
文字入力エリアに関連する情報であればどの様なもので
も良い。例えば、各記入項目の先頭に付された番号や記
号やタイトルなども関連情報として利用することができ
る。
【0050】また、上記した実施例では、タグを抽出し
た文字列の前後に付加していたが、作成するタグ付き文
書の構成によっては、タグを文字列の先頭のみあるいは
後尾のみに付加しても良く、また、文字列の途中の特定
の位置に付加しても良い。
【図面の簡単な説明】
【図1】本発明の第1の実施例としてのタグ付き文書作
成装置を示すブロック図である。
【図2】タグ付き文書を作成するまでの一連の処理手順
を示すフローチャートである。
【図3】作成された定型フォーマットの一例を示す説明
図である。
【図4】図3の定型フォーマットにおける各文字入力エ
リアA〜Eの座標を示す説明図である。
【図5】作成された変換テーブルの内容の一例を示す説
明図である。
【図6】図3の定型フォーマットを用いて文書を入力し
た状態を示す説明図である。
【図7】図2のタグ付き文書作成処理ステップS16の
詳細処理ルーチンを示すフローチャートである。
【図8】図6の定型文書について作成されたタグ付き文
書の一例を示す説明図である。
【図9】図3の定型フォーマットにおける各文字入力エ
リアA〜Eに対して設定された属性の一例を示す説明図
である。
【図10】作成された変換テーブルの内容の一例を示す
説明図である。
【図11】本発明の第2の実施例におけるタグ付き文書
作成処理ステップS16の詳細処理ルーチンを示すフロ
ーチャートである。
【符号の説明】 20…文書作成装置 22…変換テーブル 24…文字列抽出部 26…タグ付加部 28…入力文書 30…タグ付き文書 A〜E…文字入力エリア

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 定型フォーマットの文字入力エリアに文
    字列を入力することにより作成された定型文書の中か
    ら、前記文字入力エリア内の文字列を抽出し、該文字列
    にタグを付加して、タグ付き文書を作成するタグ付き文
    書作成装置であって、 前記文字入力エリアに関連する情報と、該文字入力エリ
    ア内より抽出した文字列に付加すべきタグとを対応付け
    て格納する変換テーブルと、 前記文字入力エリア内より文字列を抽出する文字列抽出
    手段と、 前記文字列を抽出した前記文字入力エリアの関連情報に
    対応するタグを、前記変換テーブルより読み出して、抽
    出した前記文字列に付加し、得られたタグ付きの文字列
    によって前記タグ付き文書を作成するタグ付加手段と、 を備えるタグ付き文書作成装置。
  2. 【請求項2】 請求項1に記載のタグ付き文書作成装置
    において、 前記文字列抽出手段は、前記変換テーブルより前記関連
    情報を読み出して、該関連情報に基づいて前記文字入力
    エリア内より文字列を抽出することを特徴とするタグ付
    き文書作成装置。
  3. 【請求項3】 請求項1または2に記載のタグ付き文書
    作成装置において、 前記関連情報は、前記文字入力エリアの前記定型文書内
    での位置を表す位置情報を含むことを特徴とするタグ付
    き文書作成装置。
  4. 【請求項4】 請求項1または2に記載のタグ付き文書
    作成装置において、 前記関連情報は、前記文字入力エリアの属性を表す属性
    情報を含むことを特徴とするタグ付き文書作成装置。
  5. 【請求項5】 タグ付き文書を作成するためのタグ付き
    文書作成方法であって、 定型フォーマットの文字入力エリアに文字列を入力する
    ことにより作成された定型文書を用意する第1の工程
    と、 前記文字入力エリアに関連する情報と、該文字入力エリ
    ア内より抽出する文字列に付加すべきタグとを対応付け
    て格納する変換テーブルを用意する第2の工程と、 前記定型文書の中から、前記文字入力エリア内の文字列
    を抽出する第3の工程と、 前記文字列を抽出した前記文字入力エリアの関連情報に
    対応するタグを、前記変換テーブルより読み出して、抽
    出した前記文字列に付加し、得られたタグ付きの文字列
    よって前記タグ付き文書を作成する第4の工程と、 を備えるタグ付き文書作成方法。
  6. 【請求項6】 請求項5に記載のタグ付き文書作成方法
    において、 前記第1の工程は、 前記定型フォーマットを作成する工程を含むタグ付き文
    書作成方法。
JP7345264A 1995-12-06 1995-12-06 タグ付き文書作成装置及びその方法 Pending JPH09160917A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7345264A JPH09160917A (ja) 1995-12-06 1995-12-06 タグ付き文書作成装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7345264A JPH09160917A (ja) 1995-12-06 1995-12-06 タグ付き文書作成装置及びその方法

Publications (1)

Publication Number Publication Date
JPH09160917A true JPH09160917A (ja) 1997-06-20

Family

ID=18375428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7345264A Pending JPH09160917A (ja) 1995-12-06 1995-12-06 タグ付き文書作成装置及びその方法

Country Status (1)

Country Link
JP (1) JPH09160917A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004164134A (ja) * 2002-11-11 2004-06-10 Just Syst Corp 電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム
JP2009003496A (ja) * 2007-06-19 2009-01-08 Data Design Kk 帳票データ変換装置
US7546527B2 (en) 2001-03-06 2009-06-09 International Business Machines Corporation Method and apparatus for repurposing formatted content
JP2010015213A (ja) * 2008-07-01 2010-01-21 Profield Co Ltd 情報処理装置、情報処理方法、およびプログラム
JP2015018478A (ja) * 2013-07-12 2015-01-29 大日本印刷株式会社 電子書籍制作装置,方法およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7546527B2 (en) 2001-03-06 2009-06-09 International Business Machines Corporation Method and apparatus for repurposing formatted content
US8055999B2 (en) 2001-03-06 2011-11-08 International Business Machines Corporation Method and apparatus for repurposing formatted content
JP2004164134A (ja) * 2002-11-11 2004-06-10 Just Syst Corp 電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム
JP2009003496A (ja) * 2007-06-19 2009-01-08 Data Design Kk 帳票データ変換装置
JP2010015213A (ja) * 2008-07-01 2010-01-21 Profield Co Ltd 情報処理装置、情報処理方法、およびプログラム
JP2015018478A (ja) * 2013-07-12 2015-01-29 大日本印刷株式会社 電子書籍制作装置,方法およびプログラム

Similar Documents

Publication Publication Date Title
US7707139B2 (en) Method and apparatus for searching and displaying structured document
JP4808705B2 (ja) 文書情報マイニングツール
US7194679B1 (en) Web-based file review system utilizing source and comment files
US20030145017A1 (en) Method and application for removing material from documents for external sources
JPH08241332A (ja) 全文登録語検索装置および方法
JPH077408B2 (ja) 強調特性変更方法及びシステム
JP2000148736A (ja) フォントの取得方法、登録方法、表示方法、印刷方法、異体字フォントを含む電子文書の取り扱い方法およびその記録媒体
JPH08190542A (ja) 文書データベース管理装置及び方法
US7200811B1 (en) Form processing apparatus, form processing method, recording medium and program
US6175843B1 (en) Method and system for displaying a structured document
EP0384986A2 (en) Method for displaying online information
JP4054428B2 (ja) 画像検索装置及びその方法、コンピュータ可読メモリ
JP4666996B2 (ja) 電子ファイリングシステム、電子ファイリング方法
US7073122B1 (en) Method and apparatus for extracting structured data from HTML pages
JPH09160917A (ja) タグ付き文書作成装置及びその方法
US20060112327A1 (en) Structured document processing apparatus and structured document processing method, and program
JP2001101036A (ja) ログ情報の格納及び利用方法
JP2007034378A (ja) 文書処理方法及び装置及びプログラム
US20040164989A1 (en) Method and apparatus for disclosing information, and medium for recording information disclosure program
JP2005092229A5 (ja)
JPH10240763A (ja) 文書情報管理システム
JP3193249B2 (ja) キーワード検索方法
KR100544375B1 (ko) 문서파일로부터 명함정보를 추출하기 위한 장치와 방법,및 상기 방법을 기록한 기록매체
JPS61156366A (ja) ワ−ドプロセツサ
JPH0678119A (ja) 画像ファイリング装置および画像読取処理装置