JP2002007384A - 構造化文書の変換 - Google Patents

構造化文書の変換

Info

Publication number
JP2002007384A
JP2002007384A JP2000184984A JP2000184984A JP2002007384A JP 2002007384 A JP2002007384 A JP 2002007384A JP 2000184984 A JP2000184984 A JP 2000184984A JP 2000184984 A JP2000184984 A JP 2000184984A JP 2002007384 A JP2002007384 A JP 2002007384A
Authority
JP
Japan
Prior art keywords
conversion
node
structured document
tree structure
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000184984A
Other languages
English (en)
Inventor
Yoshihiro Takase
恵宏 高瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dainippon Screen Manufacturing Co Ltd
Original Assignee
Dainippon Screen Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dainippon Screen Manufacturing Co Ltd filed Critical Dainippon Screen Manufacturing Co Ltd
Priority to JP2000184984A priority Critical patent/JP2002007384A/ja
Publication of JP2002007384A publication Critical patent/JP2002007384A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 構造化文書の変換の自由度を高める。 【解決手段】 変換前の構造化文書のツリー構造を表示
するための第1のツリー構造表示領域W1と、変換後の
構造化文書のツリー構造を表示するための第2のツリー
構造表示領域W1とを表示する。そして、第1のツリー
構造表示領域W1に変換元の構造化文書のツリー構造を
表示し、ユーザの操作によって、変換元の構造化文書の
ツリー構造のノードを選択するとともに、変換先の文書
における変換後の位置と名称とを少なくとも指定する。
この指定に応じて、第2のツリー構造表示領域W2に、
変換先ノードの位置と名称とが表示される。これらの指
定に従って、第1の構造化文書から第2の構造化文書へ
の変換規則が生成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、構造化文書を変
換する技術に関する。
【0002】
【従来の技術】コンピュータによって取り扱われる構造
化文書としては、SGMLやHTML,XMLなどの規
約に従ったものが知られている。これらの構造化文書で
は、いわゆるタグ(開始タグと終了タグ)で囲まれた部
分に内容が記述されているという、共通の一般的な構造
を有している。
【0003】SGML文書やXML文書は、文書型定義
(DTD)と、論理構造とで構成されるのが一般的であ
る。論理構造とは、タグと、タグで囲まれた実体部分と
を含む文書の本体の部分である。一方、文書型定義は、
その文書内において独自のタグを使用する際に、使用さ
れるタグの名前やその属性などを定義するために使用さ
れる。この文書型定義を用いることによって、それぞれ
の業務形態に応じた構造化文書を利用できる。
【0004】ところで、構造化文書は、同一の業務形態
で使用されるばかりでなく、他の異なる業務形態の下で
も利用されることがある。このような場合には、元の構
造化文書が、他の業務形態に適した構造化文書に変換さ
れて利用される。
【0005】構造化文書を変換する技術としては、例え
ば特開平11−272667号公報に記載されたものが
知られている。この技術では、変換前の構造化文書のタ
グと、変換後の構造化文書のタグとの対応関係がユーザ
によって指定され、この指定に応じて文書の変換が行わ
れる。
【0006】
【発明が解決しようとする課題】しかし、この従来の技
術では、タグ名を一対一に対応付けることのみが可能で
あり、変換の自由度が必ずしも高くないという問題があ
った。例えば、変換前の構造化文書において同一のタグ
名で登録されている内容を、変換後には異なる複数のタ
グ名に変換するようなことは不可能であった。
【0007】本発明は、上述した従来の課題を解決する
ためになされたものであり、構造化文書の変換の自由度
を高めることのできる技術を提供することを目的とす
る。
【0008】
【課題を解決するための手段およびその作用・効果】上
記目的を達成するために、本発明による方法は、構造化
文書を変換するための規則を作成する方法であって、
(a)変換前の第1の構造化文書のツリー構造を表示す
るための第1のツリー構造表示領域と、変換後の第2の
構造化文書のツリー構造を表示するための第2のツリー
構造表示領域とを表示する工程と、(b)前記第1のツ
リー構造表示領域に、前記第1の構造化文書のツリー構
造を表示する工程と、(c)ユーザの操作によって、前
記第1のツリー構造表示領域に表示された前記第1の構
造化文書のツリー構造のノードを選択するとともに、文
書の変換後において前記選択されたノードが前記第2の
構造化文書に占める位置と名称とを少なくとも指定する
工程と、(d)前記指定に応じて、前記第2のツリー構
造表示領域に、前記選択されたノードの変換後の位置と
名称とを表示する工程と、(e)前記工程(b)ないし
(d)を複数のノードについて繰り返す工程と、(f)
前記第1のツリー構造表示領域に表示されている前記第
1の構造化文書のツリー構造と、前記第2のツリー構造
表示領域に表示されている前記第2の構造化文書のツリ
ー構造との対応関係に従って、前記第1の構造化文書か
ら前記第2の構造化文書への変換規則を生成する工程
と、を備えることを特徴とする。
【0009】上記方法によれば、ツリー構造を見なが
ら、ユーザが変換前のノードと、変換後のノードの位置
と名称とを指定することができるので、構造化文書の変
換規則を作成する際における自由度をかなり高めること
が可能である。また、変換前の各ノードについて、位置
と名称とを指定できるので、例えば、変換前は同じ名称
であったノードに対して、変換後は異なる名称を指定す
ることが可能である。
【0010】なお、前記工程(d)は、前記第1のツリ
ー構造表示領域の中の前記選択されたノードと、前記選
択されたノードが変換された後の前記第2のツリー構造
表示領域のノードとを結ぶ図形を表示する工程を含むよ
うにしてもよい。
【0011】こうすれば、変換前後のノードの対応関係
が視覚的に把握できるので、変換規則をより容易に作成
することが可能である。
【0012】また、前記工程(c)において、前記選択
されたノードが、前記第2の構造化文書の中の複数の位
置に変換されるように指定可能であることが好ましい。
【0013】また、前記工程(c)において、前記選択
されたノードが前記第2の構造化文書の中の複数の位置
に変換されるように指定されるときに、前記複数の位置
における変換後のノードの名称を独立に指定可能である
ことが好ましい。
【0014】さらに、前記工程(c)において、前記選
択されたノードが前記第1の構造化文書のエレメントと
属性のうちのいずれかであるときに、前記第2の構造化
文書において前記選択されたノードがエレメントと属性
のいずれに変換されるかを指定可能であることが好まし
い。
【0015】これらの好ましい態様によれば、変換規則
生成の際の自由度をより高めることができ、変換後の構
造化文書を作成する際の融通性が高まる。
【0016】なお、本発明は、種々の態様で実現するこ
とが可能であり、例えば、構造化文書の変換規則の作成
方法および装置、その変換規則を用いた構造化文書の変
換方法および装置、それらの方法または装置の機能を実
現するためのコンピュータプログラム、そのコンピュー
タプログラムを記録した記録媒体、そのコンピュータプ
ログラムを含み搬送波内に具現化されたデータ信号、等
の態様で実現することができる。
【0017】
【発明の実施の形態】次に、本発明の実施の形態を実施
例に基づいて以下の順序で説明する。 A.装置の構成と文書変換処理の概要: B.変換処理の詳細手順: C.変形例:
【0018】A.装置の構成と文書変換処理の概要:図
1は、本発明の一実施例としての構造化文書変換装置2
0の構成を示すブロック図である。この装置20は、C
PU22と、ROMおよびRAMを含むメインメモリ2
6と、フレームメモリ28と、キーボード30と、マウ
ス32と、表示装置34と、ハードディスク36と、モ
デム38と、これらの各要素を接続するバス24と、を
備えるコンピュータである。なお、図1では各種のイン
ターフェイス回路は省略されている。
【0019】メインメモリ26には、構造化文書の変換
処理を行うための各種の処理部42〜60の機能をそれ
ぞれ実現するためのコンピュータプログラムが格納され
ている。これらの各処理部42〜60の機能を実現する
コンピュータプログラムは、フレキシブルディスクやC
D−ROM等の、コンピュータ読み取り可能な記録媒体
に記録された形態で提供される。
【0020】図2は、各処理部42〜60によって変換
元構造化文書SD1が変換先構造化文書SD2に変換さ
れる際の処理の流れを示す説明図である。図3は、この
変換処理のパラメータをユーザが指定する際に表示装置
34上に表示されるウィンドウを示す説明図である。こ
のウィンドウには、変換前の構造化文書のツリー構造を
表示するための第1のツリー構造表示領域W1と、変換
後の構造化文書のツリー構造を表示するための第2のツ
リー構造表示領域W2とが並べて表示される。
【0021】これらのツリー構造は、構造化文書のエレ
メント(「要素」とも呼ぶ)の階層構造を表している。
ここで、「エレメント」とは、通常は、対応する開始タ
グから終了タグまでの部分(開始タグと終了タグを含
む)を言う。XML文書では、開始タグと終了タグが必
ずペアで作成されるが、HTML文書では終了タグが省
略される場合もある。なお、対応する開始タグと終了タ
グに挟まれた部分(開始タグと終了タグを除く)は、
「エレメントの内容」と呼ばれている。
【0022】図4は、変換元構造化文書SD1の例を示
しており、図5は、変換先構造化文書SD2の例を示し
ている。図4に示すように、構造化文書の第1行目に
は、「<!DOCTYPE」で始まる文書型宣言が配置される。
この文書型宣言は、その構造化文書が使用する文書型定
義(DTD)を宣言している。図4の例では「BOOKLIS
T」という文書型定義が用いられており、一方、図5の
例では「BOOK」という文書型定義が用いられている。こ
の例のように、構造化文書の変換処理は、異なる文書型
定義を使用する文書に変換するために行われる。
【0023】図4の第2行目以降が構造化文書の内容
(「論理構造」とも呼ばれる)である。ここでは、「BO
OKLIST」や「BOOK」などの多数のエレメントが階層構造
を構成している。また、図5に示す変換後の構造化文書
SD2においても、「BOOK」や「BOOKTITLE」などの多
数のエレメントが階層構造を構成している。図3の左側
の第1のツリー構造表示領域W1は、図4に示す変換元
構造化文書SD1のエレメントのツリー構造を表示して
おり、図3の右側の第2のツリー構造表示領域W2は、
図5に示す変換先構造化文書SD2のエレメントのツリ
ー構造を表示していることが理解できる。但し、図3に
おいて、左側に「+」マークが付されているエレメント
は、その下にいくつかのエレメントが折り畳まれてお
り、表示されていないことを意味している。
【0024】なお、図3には、ツリー構造のノード(ツ
リー構造の枝)としてはエレメントのみが示されている
が、エレメント以外の構成要素(例えばエレメント内の
属性名や属性値)をツリー構造のノードとして表示する
ことも可能である。例えば、図5に示す変換先構造化文
書SD2の第5行目のエレメント「TITEM」の開始タグ
には、属性名「rid」とその属性値「t1」とが含まれて
いる。これらの属性名や属性値も、ツリー構造のノード
として表示可能である。
【0025】図3の2つのツリー構造表示領域W1,W
2には、さらに、変換元構造化文書のノードと変換先構
造化文書のノードとを結ぶ矢印A1〜A4bが表示され
ている。例えば、矢印A1は、変換元構造化文書SD1
のノード「BOOK」が、変換先構造化文書SD2のノード
「BOOK」に対応することを示している。また、矢印A2
は、変換元構造化文書SD1のノード「BOOK」の1階層
下にあるノード「TITLE」が、変換先構造化文書SD2
のノード「BOOKTITLE」に対応することを示している。
【0026】図3には、本実施例における変換の特徴が
2つ例示されている。第1の特徴は、変換元構造化文書
SD1の1つのノードを、変換先構造化文書SD2の複
数のノードに変換できる点である。具体的には、矢印A
3a,A3bで示されているように、変換元構造化文書
SD1のノード「CHAPTER」の下にある1つのノード「T
ITLE」が、変換先構造化文書SD2では、ノード「TO
C」の下にあるノード「TITEM」と、ノード「CHAPTER」
の下にあるノード「TITLE」とに変換されている。ノー
ド「TOC」は、文書の目次の部分であり、各章(「CHAPT
ER」)のタイトル部分を集めたものである。
【0027】本実施例の第2の特徴は、変換元文書にお
いて異なる階層にある同一名称の複数のノードを、互い
に異なる名称のノードに変換できる点である。具体的に
は、変換元構造化文書SD1内のノード「TITLE」に
は、ノード「BOOK」の下にある第1種のノード「TITL
E」と、ノード「CHAPTER」の下にある第2種のノード
「TITLE」とがある。ノード「BOOK」の下の第1種のノ
ード「TITLE」は、変換先構造化文書SD2では、ノー
ド「BOOK」の下にあるノード「BOOKTITLE」に変換され
ている。一方、ノード「CHAPTER」の下にある第2種の
ノード「TITLE」は、変換後はノード「TOC」の下にある
ノード「TITEM」(およびノード「CHAPTER」の1階層下
にあるノード「TITLE」)に変換されている。このよう
に、本実施例の文書変換では、変換元文書において異な
る階層にある同一名称の複数のノードを、互いに異なる
名称のノードに変換することできる。
【0028】なお、ノード同士の対応関係を示す矢印A
1〜A4bは、例えば、ユーザが変換元や変換先のノー
ド上にマウスポインタを配置したときに表示されるよう
にしてもよい。このように、変換前後のノードの対応関
係を示す図形を表示するようにすれば、ユーザがノード
同士の対応を容易に把握することが可能である。
【0029】本実施例の文書変換処理はこのような特徴
を有しており、従来の文書変換処理に比べて、文書変換
の自由度が高いことが理解できる。また、変換処理用の
ウィンドウには、変換元と変換先のツリー構造が並べて
表示され、ノード同士の対応関係が図形で示されるの
で、変換前後の構造を把握しつつ、変換パラメータを指
定することが可能である。
【0030】各処理部42〜60は、このような文書変
換を図2に示す手順に従って実行する。変換処理の開始
時には、変換元構造化文書(第1の構造化文書)SD1
が構造化文書入力部42によって変換元構造化文書オブ
ジェクトOSD1に変換され、メインメモリ26内に格
納される。この変換元構造化文書オブジェクトOSD1
の内容や、そのツリー構造は、変換元構造化文書表示部
44によって表示装置34上に表示される。なお、本明
細書において、「文書オブジェクト」や「情報オブジェ
クト」という用語は、メモリに格納された文書や情報の
データを意味している。
【0031】ユーザは、変換始点指定部52や、変換終
点位置指定部54、変換方法指定部56、変換パターン
指定部58等によって提供されるユーザインターフェー
ス画面(ダイアログ)を利用し、キーボード30やマウ
ス32を操作して、種々の変換パラメータを指定する。
各指定部52〜58は、以下のようなパラメータを指定
するために利用される。
【0032】(1)変換始点指定部52:第1のツリー
構造表示領域W1(図3)に表示された変換元構造化文
書SD1のツリー構造のノードの中から、変換元となる
ノード(以下、「変換元ノード」または「変換始点」と
呼ぶ)をマウスポインタ等を用いて指定する。また、画
面上に表示されるポップアップメニュー(後述する)に
おいて以下の内容を指定することにより、一度に複数の
ノードを変換始点として選択することも可能である。 (1−a)選択範囲指定:マウスポインタで選択された
ノードと、そのノードの下位に連結されているすべての
ノード(これらをまとめて「サブツリー」と呼ぶ)を、
下記(1−b)〜(1−e)等の条件を指定する際の選
択対象として指定する。 (1−b)下位階層指定:マウスポインタで選択された
ノードを変換始点として用いる代わりに、その「下位の
1階層のノード」や「下位階層のすべてのノード」など
を変換始点として指定する。 (1−c)パス指定:変換始点として選択されるノード
として、ルートノード(ツリー構造の最上位のノード)
からのパス、あるいは、その一部を指定する。 (1−d)出現順指定:変換始点として選択されるノー
ドとして、同一パスのノードの中の出現順を指定する。
例えば、パス=「booklist.book」(ピリオドは階層の
区切りを示す)、出現順=「2」と指定したときには、
このパス「booklist.book」の2番目に出現するすべて
のノードが変換始点として選択される。 (1−e)選択条件指定:変換始点として選択されるノ
ードの位置を特定する条件を指定する。
【0033】(2)変換終点位置指定部54:変換元ノ
ードを変換した後のノード(以下、「変換先ノード」ま
たは「変換終点」と呼ぶ)の位置と名称とを指定する。
【0034】(3)変換方法指定部56:変換終点を、
変換終点位置の下位階層のノードとして作成するか、変
換終点隣接位置の先行ノードとして作成するか、あるい
は、変換終点位置の後続ノードとして作成するか等を指
定する。
【0035】(4)変換パターン指定部58:変換先ノ
ードの構造を指定する。変換先ノードの構造(以下、
「変換パターン」とも呼ぶ)としては、例えば、以下の
ようなものが考えられる。 (4−a)エレメント生成:エレメント名を指定し、エ
レメントとして変換先ノードを生成する。 (4−b)属性名生成:属性名を指定し、属性名として
変換先ノードを生成する。 (4−c)属性値生成:属性値を指定し、属性値として
変換先ノードを生成する。 (4−d)コピー:変換元ノードをコピーして変換先ノ
ードを生成する。 (4−e)エレメント名を変えてコピー:変換元ノード
がエレメントである場合に、変更後のエレメント名を指
定し、エレメントとして変換先ノードを生成する。 (4−f)属性名を変えてコピー:変換元ノードが属性
名である場合に、変更後の属性名を指定し、属性名とし
て変換先ノードを生成する。 (4−g)属性値を変えてコピー:変換元ノードが属性
値である場合に、変更後の属性値を指定し、属性値とし
て変換先ノードを生成する。 (4−h)条件指定:変換パターンを適用するための条
件として、任意の絶対的位置にあるノード(例えば、
「第n階層のm番目のエレメント」等)を特定する条
件、あるいは、変換元ノードと所定の相対的位置にある
ノードを特定する条件等を指定する。
【0036】なお、上記(4−a),(4−b),(4
−c)の機能は、変換元ノードがエレメントであるか、
あるいは属性(属性名または属性値)であるかに関係無
く指定可能である。従って、本実施例においては、変換
元構造化文書中のエレメントと属性(属性名または属性
値)のいずれでも、エレメントと属性(属性名または属
性値)のうちの任意のものに変換することが可能であ
る。本実施例では、この点においても変換の自由度が高
いことが理解できる。
【0037】各指定部52〜58を用いて指定された変
換パラメータは、それぞれ変換指定情報オブジェクトO
B1〜OBnとしてメインメモリ26内に格納される。
始終点対応取得部50は、変換パラメータの指定の際
に、それ以前に設定されていた始点と終点の対応関係を
調べる機能を有している。この始点と終点の対応関係
は、図3に示されている矢印A1〜A4bに相当する。
【0038】変換元構造化文書オブジェクトOSD1
は、各種の変換指定情報オブジェクトOB1〜OBnの
内容に従って、変換先構造化文書オブジェクトOSD2
に変換される。この変換先構造化文書オブジェクトOS
D2の内容や、そのツリー構造は、変換先構造化文書表
示部46によって表示装置34上に表示される。
【0039】構造化文書出力部48は、変換先構造化文
書オブジェクトOSD2から、変換先構造化文書(第2
の構造化文書)SD2を作成する。こうして変換された
変換先構造化文書SD2は、ハードディスク36などの
記録媒体に格納されて種々の用途に利用される他、モデ
ム38を介してコンピュータネットワーク上の他の装置
に転送されて利用される。
【0040】変換シート出力部60は、各種の変換指定
情報オブジェクトOB1〜OBnから、変換シートデー
タCSを作成する。この変換シートデータCSは、変換
元構造化文書SD1から変換先構造化文書SD2への変
換規則を規定したデータであり、特定の構造化文書変換
アプリケーションに対応したフォーマットを有してい
る。この変換シートデータCSと変換元構造化文書SD
1とを、その構造化文書変換アプリケーションに入力す
れば、変換先構造化文書SD2を直ちに作成することが
できる。
【0041】B.変換処理の詳細手順:図6ないし図2
7は、構造化文書の変換処理の詳細手順を示している。
図6ないし図11は、変換元構造化文書の第1階層の1
番目のノード「BOOK」(図3)を、変換先構造化文書の
ルートノードとして作成する手順を示している。なお、
本明細書において、「第1階層」とはツリー構造のルー
トノードの直下の階層を意味する。
【0042】図6では、まず、ユーザが変換始点を指定
する。具体的には、ユーザがマウスポインタなどを用い
て、第1のツリー構造表示領域W1内の第1階層の1番
目のノード「BOOK」を選択する。なお、図6において
は、選択状態であるノード「BOOK」の名称が、四角枠で
囲まれており、これによって選択状態であることが示さ
れている。このノード「BOOK」がダブルクリックされる
と、始点指定用のポップアップメニューPM1が開かれ
る。そこで、ユーザは、このポップアップメニューPM
1内から、「このノードを選択」メニューを選択する。
この選択により、1番目のノード「BOOK」が選択された
状態が継続する。
【0043】次に、図7に示すように、変換先の終点位
置を指定する。具体的には、第2のツリー構造表示領域
W2内において終点位置指定用のポップアップメニュー
PM2を開き、「ルートノードを作成…」メニューを選
択する。これによって、変換先文書では、エレメント
「BOOK」がルートノードになることが指定される(図3
参照)。
【0044】ユーザがこのメニュー選択を行うと、図8
(A)に示す変換パターン指定ダイアログCPDが開か
れる。ユーザが、変換パターン指定ダイアログCPD内
のポップアップウィンドウPM3において「子エレメン
ト追加…」メニューを選択すると、エレメント指定ダイ
アログEDが開かれる。ユーザがこのエレメント指定ダ
イアログEDにおいて変換後のエレメント名「BOOK」を
指定すると、図8(B)に示すように、変換パターン指
定ダイアログCPD内に、変換後のルートノードとして
エレメント「BOOK」が作成される。
【0045】次に、図9(A)に示すように、変換パタ
ーン指定ダイアログ内のポップアップメニューPM2を
再度開いて「子エレメント追加…」メニューを選択し、
エレメント指定ダイアログEDを用いて、追加する子エ
レメント名「TOC」を入力する。この結果、図9(B)
に示すように、エレメント「BOOK」の子エレメント「TO
C」が作成される。図10では、図9と同様の手順で、
子エレメント「ADVTSEC」が作成されている。この例か
ら理解できるように、変換パターンの指定では、変換元
が存在しない新たなノード(エレメントや属性)も作成
可能である。
【0046】図11は、図6〜図9において指定された
変換パラメータに従って、第2のツリー構造表示領域W
2内に変換先文書のツリー構造を表示した状態を示して
いる。この状態では、変換元の1番目のノード「BOOK」
と変換先のルートノード「BOOK」との対応関係A1が形
成されている。この対応関係A1は、始終点対応取得部
50内に格納される。なお、対応関係A1を示す図形
(矢印など)は、図11に示すように、2つのツリー構
造表示領域W1,W2にわたって表示することが好まし
い。
【0047】図12ないし図15は、変換元文書の1番
目のノード「BOOK」の下にあるノード「TITLE」を、変
換先のノード「BOOKTITLE」として作成する手順を示し
ている。まず、図12に示すように変換元の始点を指定
する。具体的には、第1のツリー構造表示領域W1内の
1番目のノード「BOOK」の下にあるノード「TITLE」を
選択すると、始点指定用のポップアップメニュPM1が
開かれる。そして、ユーザが「このノードを選択」メニ
ューを選択すると、ノード「TITLE」が選択された状態
が継続する。
【0048】次に、図13では、変換先の終点位置を指
定する。具体的には、まず、変換始点(図12のノード
「TITLE」)の変換後のノード(すなわち変換終点)に
隣接すべきノード「TOC」(「終点隣接ノード」と呼
ぶ)を、第2のツリー構造表示領域W2内で選択する。
ユーザが終点隣接ノード「TOC」を選択すると、始終点
対応取得部50(図3)が、そのノード「TOC」の親ノ
ード「BOOK」と、これに対応する変換元のノード「BOO
K」との既存の対応関係を取得する。この対応関係の取
得処理は、始終点対応取得部50内に予め格納されてい
た対応関係データの中から読み出すことによって実現す
ることができ、あるいは、既存の変換指定情報オブジェ
クトOBi (図2)から検索することによっても実現可
能である。ユーザは、さらに、第2のツリー構造表示領
域W2内において終点位置指定用のポップアップメニュ
ーPM2を開き、「先行エレメントを作成…」メニュー
を選択する。ここで「先行エレメント」とは、選択した
ノード「TOC」と同じ階層でノード「TOC」に先行するエ
レメントを意味している。
【0049】ユーザがこのメニュー選択を行うと、図1
4(A)に示す変換パターン指定ダイアログCPDが開
かれる。ユーザが、変換パターン指定ダイアログCPD
内のポップアップウィンドウPM3において「子エレメ
ント追加…」メニューを選択すると、エレメント指定ダ
イアログEDが開かれる。このエレメント指定ダイアロ
グEDにおいて変換後のエレメント名「BOOKTITLE」を
指定すると、図14(B)に示すように、変換パターン
指定ダイアログCPD内に、変換先ノードとしてエレメ
ント「BOOKTITLE」が作成される。この指定により、図
15に示すように、変換元の1番目のノード「BOOK」の
下にあるノード「TITLE」と、変換先ノード「BOOKTITL
E」とが対応関係A2で関連付けられる。
【0050】図16ないし図19は、変換元文書のノー
ド「FOREWORD」の下位ノード「TITLE」から変換先のノ
ードを作成する手順を示している。まず、図16に示す
ように変換元の始点であるノード「TITLE」を指定す
る。すると、始点指定用のポップアップメニュPM1が
開かれるので、ユーザは「このノードを選択」メニュー
を選択する。この選択により、ノード「TITLE」が選択
された状態が継続する。
【0051】次に、図17では、変換先の終点位置を指
定する。具体的には、まず、第2のツリー構造表示領域
W2内において、変換始点(変換元ノード「TITLE」)
に対応する変換終点に隣接すべきノード「FORWARD」
(すなわち、終点隣接ノード)を選択する。なお、図1
6,図17の例では、変換先として、ノード「CONTENT
S」の下に、3つのノード「FOREWORD」,「CHAPTER」,
「CHAPTER」が既に生成されているものと仮定してい
る。ユーザが終点隣接ノード「FORWORD」を選択する
と、始終点対応取得部50(図3)が、そのノード「FO
RWORD」に対応する変換元ノード「FOREWORD」との既存
の対応関係を取得する。
【0052】なお、この例からも理解できるように、始
終点対応取得部50は、終点隣接ノードが選択されたと
きに、そのノードに対応する変換元ノードが存在してい
るか否かを判断し、終点隣接ノードに対応する変換元ノ
ードが存在する場合には、その対応関係を取得する。一
方、図12,図13の例で説明したように、終点隣接ノ
ードに対応する変換元ノードが存在しない場合には、終
点隣接ノードの親ノードと、その親ノードの変換元ノー
ドとの対応関係を取得する。こうすることによって、終
点隣接ノードの位置を、変換元文書内のノードと対応づ
けることが可能である。
【0053】こうして終点隣接ノード「FOREWORD」の対
応関係が取得されると、ユーザは、さらに、第2のツリ
ー構造表示領域W2内において終点位置指定用のポップ
アップメニューPM2を開き、「子エレメントを作成
…」メニューを選択する。
【0054】ユーザがこのメニュー選択を行うと、図1
8(A)に示す変換パターン指定ダイアログCPDが開
かれる。ユーザが、変換パターン指定ダイアログCPD
内のポップアップウィンドウPM3において「子エレメ
ント追加…」メニューを選択すると、エレメント指定ダ
イアログEDが開かれる。このエレメント指定ダイアロ
グEDにおいて変換後のエレメント名「TITLE」を指定
すると、図18(B)に示すように、変換パターン指定
ダイアログCPD内に、変換先ノードとしてエレメント
「TITLE」が作成される。
【0055】次に、ユーザは、図19(A)に示すよう
に、変換パターン指定ダイアログCPD内のポップアッ
プウィンドウPM3において「属性追加…」メニューを
選択し、エレメント指定ダイアログEDにおいて属性名
「ID」と属性値「T1」を指定する。この結果、図19
(B)に示すように、変換パターン指定ダイアログCP
D内に、エレメント「TITLE」の属性(属性名「ID」と
属性値「T1」)が新たに作成される。この例から理解で
きるように、本実施例では、変換先エレメントに属性を
任意に追加することが可能である。
【0056】これらの指定により、図20に示すよう
に、変換元のノード「FOREWORD」の下のノード「TITL
E」と、変換先のノード「TITLE」とが始終点対応関係A
3で関連付けられる。この対応関係A3は、始終点対応
取得部50内に格納される。
【0057】図21は、同様にして、変換先のノード
「CHAPTER」の下にエレメント「TITLE」とその属性(属
性名「ID」と属性値「T2」)が作成された状態を示して
いる。図22は、変換先の他のノード「CHAPTER」の下
にエレメント「TITLE」とその属性(属性名「ID」と属
性値「T3」)が作成された状態を示している。
【0058】図23ないし図27は、変換元文書の複数
のノード「PARA」を変換先にコピーする手順を示してい
る。以下の処理では、図23の変換元文書に存在する2
つのノード「CHAPTER」の下位にある複数のノード「PAR
A」が、一括して変換先文書にコピーされる。
【0059】まず、ユーザは、図23に示すように変換
始点として、1つノード「PARA」を指定する。すると、
始点指定用のポップアップメニュPM1が開かれるの
で、ユーザは「詳細指定…」メニューを選択する。この
選択により、図24に示す始点詳細設定ダイアログSS
Dが開かれる。
【0060】ユーザは、この始点詳細設定ダイアログS
SDの選択範囲指定フィールドSF内に、選択対象とな
るサブツリールートノード「BOOK[1].CONTENTS」を指定
する。ここで、「BOOK[1]」は、変換元にある「BOOK」
という名称のノードの中の1番目のノードを意味してお
り、「BOOK[1].CONTENTS」はその1番目のノード「BOO
K」の下位のノード「CONTENTS」を意味している。ここ
では、ノード「BOOK[1].CONTENTS」をルートノードとす
るサブツリーの中のノードが選択対象となることが指定
されている。
【0061】ユーザは、次に、選択対象となるノードを
パス指定フィールドPFで指定する。パス指定フィール
ドには、始点ノード「PARA」を示すパス指定の候補がい
くつか表示されているので、ユーザは、その中の1つを
選択すればよい。この例では、結局、ノード「BOOK[1].
CONTENTS.CHAPTER.PARA」が選択されていることにな
る。図23に示すように、このパスを有するノード「PA
RA」は、変換元文書内に5つ存在する。図24に示した
始点詳細設定ダイアログSSDには、この他に出現順指
定フィールドOFや、条件指定フィールドCFが設けら
れており、選択対象となるノードの出現順や、その他の
条件を指定することも可能である。但し、図24の例で
は、これらのフィールドOF,CFには指定がなされて
いない。この指定の結果、図25に示すように、5つの
ノード「PARA」のすべてが変換始点として選択される。
【0062】次に、図26では、変換先の終点位置を指
定する。具体的には、第2のツリー構造表示領域W2内
にある2つのノード「CHAPTER」のうちの1番目のノー
ドを、変換始点「PARA」に関する終点隣接ノードとして
選択する。ユーザが1番目の「CHAPTER」ノードを選択
すると、始終点対応取得部50(図3)が、そのノード
「CHAPTER」に対応する変換元ノード「CHAPTER」との既
存の対応関係を取得する。始終点対応取得部50は、さ
らに、図24の選択範囲指定フィールドSFで指定され
た選択範囲「BOOK[1].CONTENTS」内において、この変換
元ノード「CHAPTER」と同じ階層で同じ名称を有するす
べてのノードに関して、変換先ノードとの対応関係が取
得される。
【0063】こうして終点隣接ノードの対応関係が取得
されると、ユーザは、さらに、第2のツリー構造表示領
域W2内において終点位置指定用のポップアップメニュ
ーPM2を開き、「子ノードとしてコピー…」メニュー
を選択する。ユーザがこのメニュー選択を行うと、図2
7に示すように、変換元文書のツリー構造内の5つのノ
ード「PARA」が、終点隣接ノードの子ノードとして複写
される。
【0064】図28は、以上のような種々の指定を利用
して作成された変換元文書と変換先文書のツリー構造の
対応関係の一例を示す説明図である。変換元文書のノー
ドと変換先文書のノードとを結ぶ矢印は、相互の対応関
係を表している。この例からも理解できるように、変換
元文書のノードから作成される変換先文書のノードの位
置や種別(エレメントEL、属性名AS、属性値AVの
区別)は、種々の組み合わせが可能である。
【0065】なお、図28は、ユーザによって指定され
た変換パラメータによって表されるツリー構造の対応関
係を表示したものであり、この時点では文書の変換は行
われていない。図2で説明したように、変換後の構造化
文書は、これらの変換パラメータ(変換指定情報オブジ
ェクトOB1〜OBn)を用いて、構造化文書出力部4
8によって作成される。また、変換シート出力部60
は、変換指定情報オブジェクトOB1〜OBnから、文
書の変換規則を表す変換シートデータCSを作成するこ
とが可能である。
【0066】なお、本明細書において、「変換規則」と
いう用語は、変換の仕方を表す情報を広く意味してお
り、変換指定情報オブジェクトOB1〜OBnも含んで
いる。また、特に断らない限り、「変換規則」はこのよ
うな広い意味を有している。
【0067】以上のように、本実施例の構造化文書の変
換処理によれば、変換元文書のツリー構造内の任意のノ
ードを、変換先文書のツリー構造内の任意のノードに変
換することが可能である。また、変換元文書の1つのノ
ードから、変換先文書の複数のノードを生成することも
可能である。さらに、変換元文書のエレメントと属性
(属性名および属性値)のうちの任意の1つを、変換先
文書のエレメントと属性(属性名および属性値)のうち
の任意の1つに変換することも可能である。本実施例の
構造化文書の変換処理は、これらの特徴を有しているの
で、文書変換に関して高い自由度を有しており、所望の
構造を有する構造化文書に変換することが可能である。
【0068】なお、この発明は上記の実施例や実施形態
に限られるものではなく、その要旨を逸脱しない範囲に
おいて種々の態様において実施することが可能である。
【図面の簡単な説明】
【図1】本発明の一実施例としての構造化文書変換装置
20の構成を示すブロック図。
【図2】変換元構造化文書SD1が変換先構造化文書S
D2に変換される際の処理の流れを示す説明図。
【図3】ユーザが変換パラメータを指定する際に表示さ
れるウィンドウを示す説明図。
【図4】変換元構造化文書SD1の例を示す説明図。
【図5】変換先構造化文書SD2の例を示す説明図。
【図6】変換元構造化文書の1番目のノード「BOOK」か
ら変換先構造化文書のルートノードを作成する手順を示
す説明図。
【図7】変換元構造化文書の1番目のノード「BOOK」か
ら変換先構造化文書のルートノードを作成する手順を示
す説明図。
【図8】変換元構造化文書の1番目のノード「BOOK」か
ら変換先構造化文書のルートノードを作成する手順を示
す説明図。
【図9】変換元構造化文書の1番目のノード「BOOK」か
ら変換先構造化文書のルートノードを作成する手順を示
す説明図。
【図10】変換元構造化文書の1番目のノード「BOOK」
から変換先構造化文書のルートノードを作成する手順を
示す説明図。
【図11】変換元構造化文書の1番目のノード「BOOK」
から変換先構造化文書のルートノードを作成する手順を
示す説明図。
【図12】変換元文書のノード「TITLE」から変換先の
ノード「BOOKTITLE」を作成する手順を示す説明図。
【図13】変換元文書のノード「TITLE」から変換先の
ノード「BOOKTITLE」を作成する手順を示す説明図。
【図14】変換元文書のノード「TITLE」から変換先の
ノード「BOOKTITLE」を作成する手順を示す説明図。
【図15】変換元文書のノード「TITLE」から変換先の
ノード「BOOKTITLE」を作成する手順を示す説明図。
【図16】変換元文書のノード「TITLE」から変換先の
ノード「TITLE」を作成する手順を示す説明図。
【図17】変換元文書のノード「TITLE」から変換先の
ノード「TITLE」を作成する手順を示す説明図。
【図18】変換元文書のノード「TITLE」から変換先の
ノード「TITLE」を作成する手順を示す説明図。
【図19】変換元文書のノード「TITLE」から変換先の
ノード「TITLE」を作成する手順を示す説明図。
【図20】変換元文書のノード「TITLE」から変換先の
ノード「TITLE」を作成する手順を示す説明図。
【図21】変換元文書のノード「TITLE」から変換先の
ノード「TITLE」を作成する手順を示す説明図。
【図22】変換元文書のノード「TITLE」から変換先の
ノード「TITLE」を作成する手順を示す説明図。
【図23】変換元文書の複数のノード「PARA」を変換先
にコピーする手順を示す説明図。
【図24】変換元文書の複数のノード「PARA」を変換先
にコピーする手順を示す説明図。
【図25】変換元文書の複数のノード「PARA」を変換先
にコピーする手順を示す説明図。
【図26】変換元文書の複数のノード「PARA」を変換先
にコピーする手順を示す説明図。
【図27】変換元文書の複数のノード「PARA」を変換先
にコピーする手順を示す説明図。
【図28】種々の指定を利用して作成された変換先文書
と変換元文書のツリー構造の対応関係の一例を示す説明
図。
【符号の説明】
20…構造化文書変換装置 22…CPU 24…バス 26…メインメモリ 28…フレームメモリ 30…キーボード 32…マウス 34…表示装置 36…ハードディスク 38…モデム 42…構造化文書入力部 44…変換元構造化文書表示部 44…変換先構造化文書表示部 48…構造化文書出力部 50…始終点対応取得部 52…変換始点指定部 54…変換終点位置指定部 56…変換方法指定部 58…変換パターン指定部 60…変換シート出力部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 構造化文書を変換するための規則を作成
    する方法であって、(a)変換前の第1の構造化文書の
    ツリー構造を表示するための第1のツリー構造表示領域
    と、変換後の第2の構造化文書のツリー構造を表示する
    ための第2のツリー構造表示領域とを表示する工程と、
    (b)前記第1のツリー構造表示領域に、前記第1の構
    造化文書のツリー構造を表示する工程と、(c)ユーザ
    の操作によって、前記第1のツリー構造表示領域に表示
    された前記第1の構造化文書のツリー構造のノードを選
    択するとともに、文書の変換後において前記選択された
    ノードが前記第2の構造化文書に占める位置と名称とを
    少なくとも指定する工程と、(d)前記指定に応じて、
    前記第2のツリー構造表示領域に、前記選択されたノー
    ドの変換後の位置と名称とを表示する工程と、(e)前
    記工程(b)ないし(d)を複数のノードについて繰り
    返す工程と、(f)前記第1のツリー構造表示領域に表
    示されている前記第1の構造化文書のツリー構造と、前
    記第2のツリー構造表示領域に表示されている前記第2
    の構造化文書のツリー構造との対応関係に従って、前記
    第1の構造化文書から前記第2の構造化文書への変換規
    則を生成する工程と、を備えることを特徴とする構造化
    文書の変換規則作成方法。
  2. 【請求項2】 請求項1記載の方法であって、 前記工程(d)は、前記第1のツリー構造表示領域の中
    の前記選択されたノードと、前記選択されたノードが変
    換された後の前記第2のツリー構造表示領域のノードと
    を結ぶ図形を表示する工程を含む、構造化文書の変換規
    則作成方法。
  3. 【請求項3】 請求項1または2記載の方法であって、 前記工程(c)において、前記選択されたノードが、前
    記第2の構造化文書の中の複数の位置に変換されるよう
    に指定可能である、構造化文書の変換規則作成方法。
  4. 【請求項4】 請求項3記載の方法であって、 前記工程(c)において、前記選択されたノードが前記
    第2の構造化文書の中の複数の位置に変換されるように
    指定されるときに、前記複数の位置における変換後のノ
    ードの名称を独立に指定可能である、構造化文書の変換
    規則作成方法。
  5. 【請求項5】 請求項1ないし4のいずれかに記載の方
    法であって、 前記工程(c)において、前記選択されたノードが前記
    第1の構造化文書のエレメントと属性のうちのいずれか
    であるときに、前記第2の構造化文書において前記選択
    されたノードがエレメントと属性のいずれに変換される
    かを指定可能である、構造化文書の変換規則作成方法。
JP2000184984A 2000-06-20 2000-06-20 構造化文書の変換 Pending JP2002007384A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000184984A JP2002007384A (ja) 2000-06-20 2000-06-20 構造化文書の変換

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000184984A JP2002007384A (ja) 2000-06-20 2000-06-20 構造化文書の変換

Publications (1)

Publication Number Publication Date
JP2002007384A true JP2002007384A (ja) 2002-01-11

Family

ID=18685365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000184984A Pending JP2002007384A (ja) 2000-06-20 2000-06-20 構造化文書の変換

Country Status (1)

Country Link
JP (1) JP2002007384A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309970A (ja) * 2004-04-23 2005-11-04 Junichi Fukuda 区分割当て装置、区分割当て方法、及びプログラム
JP2006277660A (ja) * 2005-03-30 2006-10-12 Fujitsu Ltd 変換規則作成プログラム及び変換規則評価プログラム
JP2008304985A (ja) * 2007-06-05 2008-12-18 Hitachi Systems & Services Ltd 自動分類指定文書形式変換装置
US7506249B2 (en) 2002-12-27 2009-03-17 Ntt Docomo, Inc. Apparatus, method and program for converting structured document
JP2009211599A (ja) * 2008-03-06 2009-09-17 Hitachi Ltd マッピング定義作成システムおよびマッピング定義作成プログラム
JP2013025631A (ja) * 2011-07-22 2013-02-04 Internatl Business Mach Corp <Ibm> 変換規則生成支援装置、方法、およびプログラム
JP2013029910A (ja) * 2011-07-27 2013-02-07 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
CN113765872A (zh) * 2020-10-14 2021-12-07 天翼智慧家庭科技有限公司 一种自适应数据格式转换适配的方法和系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7506249B2 (en) 2002-12-27 2009-03-17 Ntt Docomo, Inc. Apparatus, method and program for converting structured document
JP2005309970A (ja) * 2004-04-23 2005-11-04 Junichi Fukuda 区分割当て装置、区分割当て方法、及びプログラム
JP2006277660A (ja) * 2005-03-30 2006-10-12 Fujitsu Ltd 変換規則作成プログラム及び変換規則評価プログラム
JP2008304985A (ja) * 2007-06-05 2008-12-18 Hitachi Systems & Services Ltd 自動分類指定文書形式変換装置
JP2009211599A (ja) * 2008-03-06 2009-09-17 Hitachi Ltd マッピング定義作成システムおよびマッピング定義作成プログラム
JP2013025631A (ja) * 2011-07-22 2013-02-04 Internatl Business Mach Corp <Ibm> 変換規則生成支援装置、方法、およびプログラム
US9396175B2 (en) 2011-07-22 2016-07-19 International Business Machines Corporation Supporting generation of transformation rule
US9400771B2 (en) 2011-07-22 2016-07-26 International Business Machines Corporation Supporting generation of transformation rule
JP2013029910A (ja) * 2011-07-27 2013-02-07 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
CN113765872A (zh) * 2020-10-14 2021-12-07 天翼智慧家庭科技有限公司 一种自适应数据格式转换适配的方法和系统
CN113765872B (zh) * 2020-10-14 2023-10-24 天翼数字生活科技有限公司 一种自适应数据格式转换适配的方法和系统

Similar Documents

Publication Publication Date Title
US6304258B1 (en) Method and system for adding application defined properties and application defined property sheet pages
US8434014B1 (en) System and method for editing information
JP4166472B2 (ja) コンピュータシステムのユーザに情報を提示するための方法及び装置
US20060136819A1 (en) Method, system, ane computer-readable medium for applying a global formatting scheme to a chart in an electronic document
JP2004005568A (ja) レガシー・アプリケーションの高速gui体裁更新
JPH10149398A (ja) マップ構築システムおよびマップ構築方法
JPH0855019A (ja) 視覚的プログラミング方法
Kurlander et al. A visual language for browsing, undoing, and redoing graphical interface commands
JP2007505387A (ja) データのツリー構造の表示を提供する方法
JP2002007384A (ja) 構造化文書の変換
JP2005250820A (ja) ストレージシステムにおけるxml文書分類方法
JP3444948B2 (ja) 文書編集装置および文書編集方法
US20090313308A1 (en) Method and apparatus for comparing process designs
JP3615280B2 (ja) ネットワーク情報検索システム
JP2001344230A (ja) マルチメディア文書生成装置及び方法、及びこれらをコンピュータに実行させるプログラムを記録した記録媒体
JP2004038334A (ja) 操作位置記憶方法、構造化文書表示方法、構造化文書表示装置、プログラム、および操作位置記憶データ
Skilton et al. Supporting cognitive work analysis with the Work Domain Analysis Workbench (WDAW)
CN106934587A (zh) 一种数据处理方法及装置
JP3298456B2 (ja) ビジュアルシミュレーション支援方法及び装置
JP7439955B2 (ja) 操作支援装置、操作支援方法および操作支援プログラム
JPH04320551A (ja) ハイパーテキスト装置およびハイパーテキスト生成方法
JPH0612250A (ja) 視覚的プログラミング方法
KR100349674B1 (ko) 계층 구조 정보가 표현된 트리상에서 체크 상자를 이용한 서브 계층정보 추출 방법
JPH05197719A (ja) 文書作成装置
JPWO2006137561A1 (ja) グラフ処理装置