WO2004061713A1

WO2004061713A1 - 構造化文書の構造変換装置、構造変換方法、記録媒体

Info

Publication number: WO2004061713A1
Application number: PCT/JP2003/014821
Authority: WO
Inventors: Shigeru Yoshida
Original assignee: Fujitsu Limited
Priority date: 2002-12-27
Filing date: 2003-11-20
Publication date: 2004-07-22
Also published as: US20050132278A1; JPWO2004061713A1; JP4388929B2

Abstract

図１（ｂ）に示すように、先出願では、レコード内の各要素を、応用ソフトのデータ処理の対象項目（キー要素）と、非対象項目（非キー要素）に分けて、キー要素はそのままにし、非キー要素の要素内容をＣＳＶ形式で各新要素に纏めたＸＭＬ文書に変換する。本発明では、図１（ｃ）に示すように、新要素をレコード内の第１階層に複数配置し、各非キー要素は､自由に任意の新要素に要素内容を纏める。また、ヘッダに付加情報を記述することで、自己記述性を維持できるようにする。

Description

明細書構造化文書の構造変換装置、構造変換方法、記録媒体技術分野

本発明は、 XML文書から XML文書への構造変換/逆変換を行なう方法、装置等に関する。背景技術

近年、ィンターネットを通して、個人、企業、自治体など、あらゆる種類のシステムが相互に通信可能に接続されており、これらのシステムが相互に連携して、 W e bサービスが提供されたり、 E D I (E lectronic Data Interchange; 、 E C (Electronic Commerce) 力 S 了われつつある。このために、幅広い情報交換が必要になってきている。

このような状況下 ίこおレヽて、 XM L (extensible Markup Language )は、データを構造化する柔軟な表現能力を有し、コンピュータによる処理に適しているので、上記のシステム間のデータ交換や各システムでのデータ処理を行う際の、共通基盤のフォーマットとして注目されている。

XMLは、 1 9 8 6年に I S Oで標準化された S GM L (Standard Generalized Markup Language)を、インター不ッ卜で活用し易ぐするために、 1 9 9 8年 2月にその基本仕様 XM L 1.0が W 3 C (World Wide Web Consortium)において策定されたものである。

従来より用いられている W e bページ作成言語である H TM L ( HyperT ext Markup Language)は、タグ力 S固定で表示に特ィ匕したちのとなっており、タグ情報を基にコンピュータで情報を処理したいという要件に対応できない問題があった。

これに対して、 X M Lは、利用者が自由にタグを定義でき、文書中の文字列に意味付けができる言語構造を有している。このような X M Lで文書を記述した場合、その文書を、タグ情報に基づいてコンビュータで情報処理できる。

尚、 X M L文書は、その特徴によって、次の 2種類の型に大きく分類される。

■データ型 X M L文書：伝票、予定表など、タグ数が多く、要素内容短いもの

■文書型 X M L文書：雑誌、マニュアル、辞典など、要素内容が長い文章になるもの

ここでは、主に、データ型 X M L文書を対象にするものとする。ここで、以下の説明で使用される用語について、 X M L規格に基づき説明しておく。よく知られていることであるが、一対の" く" と" 〉 " で囲まれた文字列を「タグ」、 " く文字列〉" を「開始タグ」、 " く /文字列〉" を「終了タグ」、開始タグから終了タグまでの文字列全体を「要素」、開始タグと終了タグで挟まれた文字列を「要素内容」、タグ内に記述される要素の名前を「タグ名」（あるいは「要素名」）、要素に対する付加情報を「属性」と呼ぶ。

構造化文書では、その文書中にタグを埋め込む形でデータ構造が記述される。このようにデータ構造をタグとして文書中に埋め込んだ構成を採ることにより、データ項目の追加 ·削除 '変更に対して柔軟性と拡張性が得られるほか、タグ名に、人が読んで意味のある名前を付けることにより、データに視認性を持たせることができる。

ところで、 XML文書に対する処理の高速化やメモリ使用量の削減等を図って、 XML文書に対する処理能力を向上させる為には、一般に、基盤ソフトウェアの実装の高性能化を図ることが主流になっている。しかし、このような手法のほかに、 XM L文書自体に予め加工を施しておくことによつても、 XML文書に対する処理性能を向上させることが可能である。本発明は、後者の手法（XML文書を加工して処理性能の向上を図る手法）に関連するものであり、ここで、後者の手法に係わる従来技術について説明する。

例えば、非特許文献 1 には、 XML導入時に処理速度が遅くなる問題が発生し、データ構造を変更することにより、問題に対処する事例が開示されている。例えば、住友電工システムズの例（同誌の p.64-6 5参照）では、同種のデータを、 C S V (Comma Separated Value) 形式で 1つにまとめて記述し、まとめられたデータを、 XML文書中の 1つのタグ中に埋め込むことが開示されている。つまり、「XMLデータの中に、 C S V形式のデータを埋め込むようなもの」とした。例えば、 XMLデータの定義情報を変更し、 1力月分の XMLデータを日付順にコンマで区切ってまとめている。

具体的には、

<K0USU day=" 01" >8.0</K0USU> く KOUSU day=" 02" >5.5</K0USU>--- く KOUSU day=" 31" 〉12.8</K0USU>

というように、別々のタグに記述されていた毎日の実績に関するデータを、

く KOUSU day=" 01、 02、 ···、 31" data=" 8.0、 5.5、 "ヽ 12.8 " X/K0USU) といった形式で、月単位にまとめるように、元の文書を書き換えている。

このような変更により、 1ヶ月分のデータを参照する際には、データベース .サーバーへの照会は 1回で済むようになり、 XMLの定義情報の送信も 1回送信するだけなので、データ容量も 1 0分の 1に減つたとしている。

また、非特許文献 2には、データ量を減らすことを目的とし、レコード形式の XML文書を、 XM L文書の規格を保ったまま、 X S L変換を用いて、レコード単位にレコード内の全要素を C S V形式で繋いだ XML文書に変換することが開示ざれている。データ処理の負荷を減らすためには、レコード内全要素を 1個の C S V形式に纏めた文書を、専用の A P I によって扱うことを意図している。

具体的には、非特許文献 2の手法による変換前■後の XML文書は、例えば、図 4 6 ( a ) 、 ( b ) に示すようになる。図 4 6 ( a ) は、変換前の元の XML文書であり、図 4 6 ( b ) は、変換後の XML 文書である。

図示の通り、変換後の XML文書は、 2つの部分に分けられる。 1 つは、元の XML文書の各タグ名を記述する部分、もう 1つは、各要素の内容（ _{1 ;} 2， 3， 4等）を C S V形式で繋いで記述した部分である。

ところで、ここで、代表的な構造化文書である XML文書で.は、何らかの応用ソフトが XML文書を扱えるようにするために（検索 ·更新 ' 削除などの操作を施す）、 D OM (Document Object Model)と、 S AX (Simple API for XML)と呼ばれる二つの標準的なインターフェイス（A P I ： Application Programming Interface)規格力 S定められている。 S AXは、メモリ消費が小さく、一般に高速だが、時系列出力で、参照するだけの簡単な処理に向くという特徴を持つ。一方、 D OMは、一般に低速で、メモリ消費が大きいが、文書の要素を階層的なッリ一構造に展開するため、複雑な処理內容でもプログラムが組み易いという特徴を持つ。

一般に、 XML文書に対して検索■更新■削除などの操作を施す場合、操作対象の XM L文書を標準 A P I (D OM) で D OMツリーに展開してから、その操作を施すことになる。しかし、 1^ 文書を0 OMツリーに展開する際には、元のデータ量の 6倍もの膨大な動作メモリ容量が必要となるうえ、使用されない項目（操作対象外の項目）も一緒に展開されてしまうため、展開処理に多大な時間を要している (処理速度、メモリ消費量は、 XML文書の要素数に比例する）。上記非特許文献 1， 2のような、 XML文書を加工して処理性能の向上を図る手法が存在するのは、このような事情があるからである。

しかしながら、上記非特許文献 1， 2には、以下の問題点があったまず、非特許文献 1に記載の手法は、データ依存の個別の方法であり、組織的な汎用の方法ではない。すなわち、非特許文献 1記載の手法は、データ処理に用いる同種のデータを一つにまとめるものであつて、同種のデータを持つ特定のデータに適用する方法であり、改善の効果はデータに依存する。つまり、汎用の方法ではない。

また、非特許文献 2に記載の手法は、 XML文書のタグを外すことによって、データ量は削減できるが、この方法によって既存の応用ソフトのデータ処理の負荷を軽減することはできない。

非特許文献 2では、変換文書を扱える特別な A P I ソフトを作って、データ処理の負荷を軽減することを想定している。これは、既存の D OMソフトと同様の機能のソフトを別途作成しなければならないことを意味する。この為、この作業は多大の工数を要する。よって、既存の D OMと同様に使われる状況にはなり難い。

また、非特許文献 2に記載の手法は、定型（表形式）の XML文書のみを想定している。

このような従来技術に対して、本出願の発明者は、非特許文献 3の手法を提案している。

非特許文献 3に記載の手法は、まず、レコード構成の XML文書に対して D OM応用ソフトでのデータ処理性能を改善するためであつて、応用ソフトにわずかな修正で適用できて（特別なソフトを書かずに変換が実行できる）、変換後に基本的に元の XML文書と同様（トランスペアレント）に扱える形式を目指している。そして、レコード毎に、応用ソフトで処理対象とする要素はそのままにして、処理対象外の複数の要素は、その要素内容を C S V形式で 1つにまとめた XM L文書に変換することを特徴としている。また、非表形式のデータを表現した XML文書に関しては、レコード内に出現する要素が不定であるため、変換 XML文書上に、処理非対象の要素名を保持して、要素内容と対応付ける必要があるために、 C S V形式の要素内容と同じ並び順で、処理非対象要素名を C S V形式で繋いで、変換先 C S V形式の要素の属性として置くことを提案している。

(非特許文献 1 )

「見えてきた万能幻想の真実 XMLの〃常識〃を覆す」、日経コンピュータ誌 2001.3.12号、 ρ 5 2 - ρ 7 1

(非特許文献 2 ) "Building an XML Bloat Buster using ZXML XML Compression Method" by Alain Trotter； [平成 1 4年 2月 1 8 日検索]、インターネク < UI^ L ： http:// w. ASPToday. com/> または、としてく U R L ： http: //www. XML. com/pub/r/904 >

(非特許文献 3 )

「XML文書の事前形式変換によるデータ処理性能改善の検討.」、吉田茂、他；第 1回情報科学技術フォーラム（F I T 2002) D- 29、 2 002.09.27 ここで、本出願人は、非特許文献 3に関連して、既に、特願平 1 3 — 4 0 1 9 3 4号（以下、先出願と呼ぶ）を出願している。

先出願においても、非特許文献 3と同様に、レコード形式の XML 文書においてレコード内要素が、応用ソフトのデータ処理の対象項目 (キー要素）と、非対象項目（非キー要素）に分けられて、変換の際には、キー要素はそのままにし、非キー要素の内容を C S V形式で纏めて新たな一つの要素（C S V要素と呼ぶ）とする XML文書に変換することを提案している。 XML文書が非定型の場合は、新要素に纏めた要素の要素名を C S V形式にしたものを属性に付ける。この変換 (以下では、 C S V圧縮変換と呼ぶ）は、 X S L変換として実行する。

この C S V圧縮変換は、データ処理の対象項目であるキー要素は、 C S V形式にはしないで、そのままとするので、応用ソフトに僅かな修正を施すだけで適用可能となる。また、非キー要素のタグを削除して、その要素内容を一つの新要素に纏めることで、元文書のタグを減らした要素数に応じて、 XML文書処理のメモリ使用量の削減、メモリ展開時間、処理時間を短縮することができる。

例えば、図 4 7には定型 XML文書の場合、図 4 8に非定型 XML 文書の場合の変換前/後の XML文書、及び変換仕様の一例を示す。図 4 7 ( a ) には変換前の定型 XML文書の例、図 4 7 ( b ) にはその変換結果、図 4 7 ( c ) にはこの変換に用いる変換仕様の一例を示す。

この例では、「名前」と「会社」をキー要素とし、それ以外の非キ一要素の要素内容は、変換後の文書では、新要素「情報」に C S V形式で纏めている。

また、図 4 8 ( a ) には変換前の非定型 XM L文書の例、図 4 8 ( b ) にはその変換結果、図 4 8 ( c ) にはこの変換に用いる変換仕様の一例を示す。

この例では、変換後の文書では、各レコード毎（Aさん、 Bさん）に、そのレコードに記述されている非キー要素の要素名を、新要素のタグにおいて属性 tagsによって指定している。これによつて、変換後の XML文書を用いて、応用ソフトウェアが何らかの処理を実行する際にも、要素名と要素内容との対応関係が分かる。

上記のように、非特許文献 3、先出願では、特に応用ソフトウェアが変換後の XML文書を処理することに関して、従来に比べて優れた手法を提案している。また、従来では、非定型の XML文書に対応する手法は、全く考えられていなかった。

しかしながら、先出願に記載の手法には、未だ、以下に記す（ a ) 〜（ c ) の改良の余地が残っている。

( a ) 応用ソフトにおける扱い易さについて

先出願では、非キー要素は、応用ソフトで使わない要素を想定していた。しかし、キー要素/非キー要素を明確に区別できない応用ソフ、トも多く、非キー要素と定義した場合であっても、変換後に、この非キー要素の要素内容を応用ソフトで読出し/書込みしたいことが起こる。 C S V要素の内容が読出せれば、どの Script言語でも、 C S Vを分離/合併する標準関数（ " spl i t" 、 " join" ) が用意されているため、展開は容易に行なえる。

しかし、先出願の手法では、このような状況は想定していなかった為、多くの非キー要素をまとめた場合、非キー要素の中の使う要素以外に、不要な要素も一緒に展開して取り出す必要があり、オーバーへッドが大きくなるという課題が残った。これは、 C S V形式で纏めた非キー要素の数が多ければ多いほど、オーバーヘッドが大きく'なる。これを解決するには、新要素を複数定義し、新要素 1つ当りに割り当てる非キー要素を減らすことが考えられる。この点については、先出願においても、例えば先出願の図 6〜図 8に示すように、 2つの新要素「情報 1」、「情報 2」に、それぞれ、非キー要素を C S V形式で纏めている。

しかしながら、これは、上記問題を想定したものではなく、タグ名「勤務先」の要素内にある要素は、.タグ名「勤務先」の要素内に作成した新要素「情報 1」に纏め、それ以外の非キー要素は、レコード内の第 1階層に作成した新要素「情報 2」に纏めるようにしている。応用ソフトが非キー要素を扱う場合が生じ得ることを想定していないので、「情報 1」は元の X M L文書の階層構造に従って「勤務先」要素の下、すなわちレコード内の第 2階層に作成され、「情報 2」はレコード内の第 1階層に作成される。この為、応用ソフトが非キー要素を扱う場合に、扱い難くなる場合がある。 ' また、この例では、 2つの新要素、すなわち複数の新要素が存在するが、非キー要素の数が非常に多い場合に、その数に応じて、新要素の数を、 3つ、 4つ、 · ■ ■ 1 0以上等とする発想は、先出願にはない ₀

( b ) 変換/逆変換後のレコード内の要素順序

先出願に限らず、従来では、変換の際、レコード内の要素の順序は保存されない。この為、変換前の元の X M L文書と、これを変換後に更に逆変換した X M L文書とを比較すると、内容的には同一だが、要素の並びが変わってしまって、ユーザから見れば文書が変質したように見え、使い難いという問題があった。

( c ) X M L文書としての自己記述性の欠如に対応する手法の改善 X M L文書は、要素名でデータの意味付けがなされ、それ自身だけで自己記述性を備えている。しかし、従来では、非定型の X M L文書内に C S V形式を持ち込むと、この自己記述性が失われてしまい、 C S V形式で繋いだデータの意味を得るには他のファイルの参照が必要になるという問題があった。

これに対して、先出願では、要素名と要素内容を対応付けるため、 C S V形式で纏める非キー要素名を含む Pathを属性で与える非定型文書向けの手法を提案している。つまり、例えば図 4 8 ( b ) や先出願の図 3 ( B ) に示すように、属性 tagsによって、非キー要素の要素名を記述している。この方法によれば、非定型文書にも対応可能である。しかしながら、各レコード毎に、それぞれ、非キー要素の全ての要素名を記述するので、特に、レコード数が多い場合、非キー要素の要素数が多い場合、冗長過ぎるという問題がある。

これを回避するため、先出願では非定型文書で用いている非キー要素名を含む Pathの記述を任意の短縮文字列で表すことも提案している。つまり、先出願の図 3 ( C ) に示すように、各非キー要素に任意の短縮文字列 A， B , C， ■ ■ ' を割り当てておき、属性 tagsによつて短縮文字列を記述している。

しかしながら、この方法では、変換文書を応用ソフトで扱えるようにする為には、各非キー要素名と短縮文字列との対応関係を別フアイルに記録しておき、応用ソフトがこの別ファイルを参照しつつ処理を行なう必要がある。

また、逐一対応関係を指定しなければならないので、非キー要素の数が多くなるに従って、指定が煩雑になり、手間が掛かるようになる更に、先出願では、そもそも、変換後の X M L文書に記述する要素名（または短縮文字列）は、逆変換処理の際に必要なものであった。本発明の課題は、レコード内の要素を、応用ソフトで扱うキー要素と、それ以外の非キー要素に分けて、キー要素はそのままとし、非キ一要素は C S V形式で繋ぐように変換することで、変換後の X M L文書を既存の応用ソフトで利用可能とすると共に、汎用の方法としてデータ処理のメモリ使用量、処理時間を削減することができると共に、更に、応用ソフトで非キー要素を扱う事態が生じた場合でもオーバーへッドが大きくなることなく、あるいは逆変換結果が、並び順までも元の X M L文書の通りに戻すことができ、あるいは非定型文書においてレコード数が多い場合/非キー要素の要素数が多い場合でも、冗長になることなく、変換後でも自己記述性を維持できるようにする構造化文書変換/逆変換方法、その装置、プログラム等を提供することである。発明の開示

本発明による第 1の構造化文書の構造変換装置は、定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義し、変換対象の構造化文書内の各要素について、レコード内で出現する順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である各非キー要素を、前記複数の新要素の何れに割り当てるかを定義した変換仕様定義手段と、該変換仕様定義手段によつて定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書内の各要素を、前記レコード内で出現する順に、前記キー要素はそのまま変換後の構造化文書に記述し、前記各非キー要素に関しては、その要素内容を、該当する前記新要素毎に C S V形式でまとめたものを各新要素の要素内容として変換後の構造化文書に記述する構造変換手段とを有するように構成する。

上記構成において、変換対象の構造化文書内の各要素を、キー要素

/非キー要素に分けて、非キー要素の要素内容は c S V形式、すなわち要素内容を区切り記号を介して繋げてまとめることにより、汎用の方法としてデータ処理のメモリ使用量、処理時間を削減することができると共に、応用ソフトウェアがキー要素を用いて検索等の処理を行なえる点は、先出願と同様である。

上記第 1の構造化文書の構造変換装置では、更に、新要素を複数定義して、各非キー要素を、各新要素の何れかに自由に割り当てている。新要素の数は、非キー要素の数に応じたものとすればよい。これによって、新要素 1つ当りに割り当てられる非キー要素の数を抑制し、もし応用ソフトウェアが非キー要素を扱う事態が生じても、オーバーヘッドが大きくなることを抑止できる。また、変換対象の構造化文書内の階層構造に関係なく自由に変換できるので、応用ソフトウアの処理内容に合わせて、変換後の構造化文書が応用ソフトウェアで扱い易いように定義すればよい。更に、変換仕様定義手段における変換対象の構造化文書内の各要素の定義は、レコード内で各要素が出現する順に定義しているので、逆変換の際に、この変換仕様定義手段を参照 -して、定義されている順番通りに処理を行なえば、要素の並びが変わつてしまうことなく、完全に元通りに復元することができる。

本発明による第 2の構造化文書の構造変換装置は、非定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義し、変換対象の構造化文書内に出現し得る全ての要素について、全て出現する場合の出現順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である非キー要素を、該複数の新要素の何れに割り当てるかを定義した変換仕様定義手段と、該変換仕様定義手段によって定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書内の各要素を、前記レコード内で出現する順に、前記キー要素はそのまま変換後の構造化文書に記述し、前記各非キー要素に関しては、前記変換対象の構造化文書に出現する要素はその要素内容を、前記変換対象の構造化文書に出現しない要素の要素内容は空要素として、該当する前記新要素毎に C S V形式でまとめたものを各新要素の要素内容として変換後の構造化文書に記述する構造変換手段とを有するように構成する。

また、上記第 2の構造化文書の構造変換装置において、例えば、前記変換仕様定義手段で定義される変換仕様に基づいて前記変換後の構造化文書を元の構造化文書に戻すために、該変換仕様定義手段において前記出現順に定義されている各要素について、順次、その要素に該当する新要素を求め、該新要素について前記 C S V形式でまとめた各要素内容の中から、その順番に応じて該要素に対応する要素内容を求めて前記元の構造化文書に記述する際に、該要素内容が前記空要素である要素は記述しない逆変換手段を更に有するように構成してもよい。

上記第 2の構造化文書の構造変換装置によれば、変換対象の構造化文書が、非定型の構造化文書である場合でも、第 1の構造化文書の構造変換装置と同様の効果が得られるようにできる。更に、変換対象の構造化文書が、非定型の構造化文書であるにも係わらず、変換後の構造化文書に非キー要素の要素名を記述しなくても、問題なく、逆変換できる。その為に、上記構成では、変換仕様定義手段における変換対象の構造化文書のレコード内の各要素の定義は、レコード内に出現し得る全ての要素について、レコード内で各要素が出現する順に定義し、この順番通りに変換/逆変換処理すると共に、各レコード毎に、そのレコードでは出現しなかった要素は、変換の際には要素内容を空要素として出力し、逆変換時には空要素である要素は出力しないようにする。

更に、上記第 2の構造化文書の構造変換装置において、前記構造変換手段は、更に、前記新要素毎に、その新要素内に要素内容を記述し得る全ての要素の要素名を C S V形式でまとめたものを、付加情報として変換後の構造化文書に記述するように構成してもよい。

これによつて、応用ソフトウェアで非キー要素を処理対象とする事態が生じた場合でも、付加情報を参照することで、要素内容と要素名との対応関係が分かると共に、上記空要素の要素は、そのレコードには記述されていないことが分かる。先出願では、各レコード毎に、要素名または短縮文字列を記述していたが、本発明では、例えばへッダ等に一度、付加情報を記述しておけばよく、各レコード毎に逐一記述する必要なく、上記対応関係が分かるようにしている。

本発明による第 3の構造化文書の構造変換装置は、非定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義すると共に、該各新要素毎にその新要素が非定型要素であるか否かを指定し、変換対象の構造化文書内の各要素について、該構造化文書内に出現し得る全ての要素について、全て出現する場合の出現順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キー要素以外の要素である非キー要素を、前記複数の新要素の何れに割り当てるかを定義する変換仕様定義手段と、該変換仕様定義手段によって定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書内の各要素を、前記レコ"ド内で出現する順に、前記キー要素はそのまま変換後の構造化文書に記述し、前記各非キー要素に関しては、前記新要素毎に、該新要素が前記非定型要素ではない場合には出現した要素の要素内容を出現順に C S V形式でまとめたものを該新要素の要素内容として変換後の構造化文書に記述し、該新要素が前記非定型要素である場合には、出現した要素の要素内容を出現順に C S V形式でまとめたものを該新要素の要素内容とすると共に該出現順番を C S V形式でまとめたものを該新要素のタグの属性値として変換後の構造化文書に記述する構造変換手段とを有するように構成する。また、.例えば、上記第 3の構造化文書の構造変換装置において、前記構造変換手段は、更に、前記新要素毎に、その新要素内に要素内容を記述し得る全ての要素の要素名を C S V形式でまとめたものを、付加情報として変換後の構造化文書に記述するように構成してもよい。

上記構成の第 3の構造化文書の構造変換装置によれば、上記第 2の構造化文書の構造変換装置とほぼ同様の効果が得られる。手法として異なる点は、その要素がレコード内に出現するか否かを、出現しなかつた場合は空要素とするのではなく、実際に出現した要素の出現順番を記述する点である。出現順番が記述されていない要素は、そのレコード内に出現しなかったことを意味する。

本発明による第 4の構造化文書の構造変換装置は、レコードの種類毎にそのレコードを構成する要素が異なる非定型の構造化文書に対応して、レコードの種類毎にレコード項目リストを定義するものであつて、該各レコード項目リストは、そのレコード種類に出現し得る全ての要素について、データ処理の対象となるキー要素であるか否かを指定すると共に、変換後の構造化文書における新要素を 1以上定義して、前記キー要素以外の要素である非キー要素を、どの新要素に割り当てるかを指定する変換仕様定義手段と、該変換仕様定義手段によつて定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書中の各レコード毎に、そのレコードの種類に応じたレコード項目リストを前記変換仕様定義手段から選択し、該選択したレコード項目リストに基づいて、前記レコード内の各要素をレコード内で出現する順に、前記キー要素はそのまま変換後の構造化文書に記述し、前記各非キー要素に関しては、該当する前記新要素毎に C S V形式でまとめたものを各新要素の要素内容として変換後の構造化文書に記述する構造変換手段とを有するように構成する。

上記構成の第 4の構造化文書の構造変換装置によれば、変換仕様定義手段において、レコードの種類ごとに入れ替わるレコード項目（要素）をそれぞれ分けて定義すると共に、切り替え条件を付けることによって、変換/逆変換時にその条件によって要素並びを切り替えることで、変換後の構造化文書には無駄な記述が含まれないようになると共に、非定型要素の無駄な有無チェックを行わなくて済む為、変換 Z 逆変換処理の高速化を図れる。

なお、上述した本発明の各構成により行なわれる機能と同様の制御をコンピュータに行なわせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体から、そのプログラムをコンピュータに読み出させて実行させることによっても、前述した課題を解決することができる。つまり、本発明は、このようなプログラム自体としても構成することができるし、当該プログラムを記録した記録媒体（特に可搬型記録媒体）として構成することもできる。図面の簡単な説明

本発明は、後述する詳細な説明を、下記の添付図面と共に参照すればより明らかになるであろう。

図 1 ( a ) 〜（ c ) は、 D O M上でのメモリ展開形式を、本発明と従来とを比較して説明する為の図である。

図 2は、本例の構造化文書変換方法をコンピュータ等で実行する処理全体の概略的な流れを示す図である。

図 3は、第 1の実施例で変換対象となる定型 X M L文書の一例を示す図である。

図 4は、第 1の実施例で用いる変換仕様 XML文書の一例を示す図である。

図 5は、第 1の実施例における変換 XML文書の一例を示す図である。

図 6は、定型 XML文書に対する構造変換処理の基本的な処理フローチャート図である。

図 7は、 XML文書に対する構造変換処理の基本的な処理フロ一チヤ一ト図である。

図 8は、変換処理における図 6のステップ S 1 7または図 7のステツプ S 2 8の処理の詳細フローチャート図である。

図 9は、逆変換処理におけるステップ S 1 7の詳細フローチャート図である。

図 1 0は、第 2、第 3の実施例において入力 XM L文書となる非定型 XML文書の一例を示す図である。

図 1 1は、第 2の実施例における変換仕様 XML文書の一例を示す図である。

図 1 2は、図 1 0の非定型 XML文書を、図 1 1に変換仕様 XM L文書を用いて構造変換して成る変換 XML文書の一例を示す図である。

図 1 3は、第 2の実施例の構造変換処理における「レコ一ド内の要素の処理」の詳細フローチャート図である。

図 1 4は、第 2の実施例の逆変換処理における「レコード内の要素の処理」の詳細フローチャート図である。

図 1 5は、第 3の実施例における変換仕様 XML文書の一例を示す図である。

図 1 6は、図 1 0の非定型 XML文書を、図 1 5に変換仕様 XM L文書を用いて構造変換して成る変換 XML文書の一例を示す図である。

図 1 7は、第 3の実施例の構造変換処理における「レコード内の要素の処理」の詳細フローチャート図である。

図 1 8は、第 3の実施例の逆変換処理における「レコード内の要素の処理」の詳細フローチャート図である。

図 1 9 ( a ) 〜（ d ) は、第 1の実施例において、変換/逆変換 X S Lシートを用いる場合の概略的な処理手順を示す図である。

図 2 0は、図 4に示す例の変換仕様 XML文書を読み込んだ場合に生成される変換 X S Lシートの一例を示す図である。

図 2 1は、図 4に示す例の変換仕様 XML文書を読み込んだ場合に生成される逆変換 X S Lシートの一例を示す図である。

図 2 2は、変換仕様 XML文書を作成する手順を説明する為の図である。

図 2 3は、応用ソフトウェアのプログラムの一例を示す図である図 2 4は、応用ソフトウエアのプログラムの一例を示す図である。

図 2 5は、レコードの種類によってレコード項目が異なるタイプの非定型 XML文書の一例を示す図である。

図 2 6は、図 2 5の非定型 XML文書に対して第 2の実施例を適用した場合の変換仕様 XML文書の例を示す図である。

図 2 7は、図 2 5 と図 2 6の例に対応する変換 X M L文書を示す図である。

図 2 8は、第 4の実施例（その 1 ) による変換仕様 X ML文書の例を示す図である。 '

図 2 9は、図 2 8の変換仕様 XM L文書を用いて作成する変換 X S Lシートの一例を示す図（その 1 ) である。

図 3 0は、図 2 8の変換仕様 XM L文書を用いて作成する変換 X S Lシートの一例を示す図（その 2) である。

図 3 1は、第 4の実施例（その 1 ) による変換 X ML文書の例を示す図である。

図 3 2は、図 2 8の変換仕様 XML文書を用いて作成する逆変換

X S Lシートの一例を示す図（その 1 ) である。

図 3 3は、図 2 8の変換仕様 XML文書を用いて作成する逆変換

X S Lシートの一例を示す図（その 2) である。

図 3 4は、第 4の実施例（その 2 ) による変換仕様 XML文書の例を示す図である。

図 3 5は、図 3 4の変換仕様に基づく変換/逆変換処理を示すフローチャート図である。図 3 6は、変換処理における図 3 5のステップ3 3 0 2の詳細フローチャート図（その 1 ) である。

図 3 7は、変換処理における図 3 5のステップ S 3 0 2の詳細フローチャート図（その 2) である。

図 3 8は、逆変換処理における図 3 5のステップ S 3 0 2の詳細フローチャート図（その 1 ) である。

図 3 9は、逆変換処理における図 3 5のステップ S 3 0 2の詳細フローチャート図（その 2 ) である。図 4 0 ( a ) 、（b ) は、図 3 4の変換仕様に基づく変換/逆変換 X S Lシートの作成処理フローチャート図である。

図 4 0 ( c ) 、 ( d ) は、これら変換/逆変換 X S Lシートを用いた変換/逆変換処理フローチャート図である。

図 4 1は、図 4 0 ( a ) によつて作成される変換 X S Lシートの一例を示す図である。

図 4 2は、図 4 0 ( b ) によって作成される逆変換 X S Lシートの一例を示す図である。

図 4 3は、図 3 4の変換仕様 XML文書の作成方法を説明する為の図である。

図 4 4は、構造化文書変換方法を実現するコンピュータのハードウェア構成の一例を示す図である。

図 4 5は、プログラム等を記録した記録媒体、ダウンロードのー例を示す図である。

図 4 6 ( a ) は、従来例における変換前の元の XML文書であり

、図 4 6 ( b ) はその変換後の XML文書である。

図 4 7 ( a ) は、先出願における変換前の定型 XML文書の例、図 4 7 ( b ) はその変換結果、図 4 7 ( c ) はこの変換に用いる変換仕様の一例を示す図である。

図 4 8 ( a ) は、先出願における変換前の非定型 XML文書の例

、図 4 8 ( b ) はその変換結果、図 4 8 ( c ) はこの変換に用いる変換仕様の一例を示す。発明を実施するための最良の形態

以下、図面を参照して、本発明の実施の形態について説明する以下、本発明の実施の形態について詳細に説明する。

まず、図 1 ( a ) 〜（ c ) は、本発明の特徴の 1つを、従来技術、先出願と比較して説明する為の図である。

図 1 ( a ) 〜（ c ) には、 XML文書をメモリ上に D OMツリーとして展開した例を示す。

図 1 ( c ) には、本例による構造化文書変換方法による D OM上でのメモリ展開形式を示す。また、比較のために、図 1 ( a ) には従来の D OM展開形式を示し、図 1 ( b ) には先出願の D OM展開形式を示す。尚、図 1 ( a ) 〜（ c ) には、 1つのレコード（タグ名 "個人 " ) のみ示しているが、実際には、多数のレコードが存在する。

図 1 ( a ) に示すように、従来では、異種のデータを扱う場合には、データ処理に使わない要素も含め全要素をメモリ上に展開する。この為、大量に動作メモリを消費し、処理速度も遅くなる。

これに対して、上記非特許文献 1のように同種のデータを一つにまとめて C S V形式で繋ぐ方法や、上記非特許文献 2のように、定型 X ML文書を想定して、そのレコード内全要素を 1個の C S V形式に纏める方法等も提案されている。

しかしながら、上述してある通り、従来では、変換後の XML文書を用いて、応用ソフトウェアが何らかの処理を行なう場合については、何ら対応していない。また、非定型の XML文書には、何ら対応していない。

一方、図 1 ( b ) に示すように、先出願では、レコード内の各要素を、応用ソフトのデータ処理の対象項目（キー要素）と、非対象項目 (非キー要素）に分けて、キー要素はそのままにし、非キー要素の要素内容を C S V形式で各新要素に纏めた XML文書に変換する。尚、図 1 ( b ) 、 ( c ) に示す例では、タグ名 "名前" 、 "会社" の要素がキー要素であったものとする。

この方法によれば、非キー要素は、全て、タグを外して、その要素内容を C S V形式で纏めて各新要素にまとめているので、メモリ上に展開されるツリーの子要素の数を大幅に減らすことができ、展開時やデータ処理時に非キー要素を一括して扱うことができる。ッリ一の子要素とは、例えば図, 1 ( a ) における "部署" 、 "電話" 、 " emai l " 、 "自宅住所" 、 " F a X " 等のタグ名である。

そして、更に、応用ソフトウエアが、この変換後の X M L文書を用いて何らかの処理を行なう際には、キー要素を用いて、例えば検索処理等を実行することができる。

しかしながら、先出願では、上記の通り、「非キー要素は、応用ソフトで使わない要素である」という前提が崩れる状況を想定していなかったので、応用ソフトウェアが非キー要素を扱い易いようにはなつていない。つまり、既に説明してあるが、図 1 ( b ) に示すように、 C S V要素「情報 1」は元の X M L文書の階層構造に従って「勤務先」要素の下、すなわちレコード内の第 2階層に作成され、 C S V要素「情報 2」はレコード内の第 1階層に作成される。そして、各 C S V 要素に含まれる非キー要素も、元の X M L文書の構造通りとなっている。この為、応用ソフトが非キー要素を扱う場合に、扱い難くなる場合がある。少なくとも、応用ソフトウェアで非キー要素を扱い易い構造とすることは想定していない。

また、任意の非キー要素を処理対象とする際に、 C S V要素を展開する場合、非キー要素の数が多いと、オーバーへッドが大きくなることに、十分に対応してはいなかった。これに対して、図 1 ( c ) に示すように、本例の構造変換/逆変換手法では、複数の C S V要素を定義すると共に、元の XML文書の階層構造に関係なく、複数の C S V要素を全てレコード内の第 1階層に配置する。更に、図には表われていないが、各非キー要素を、どの C S V要素に含めるのかを、元の XML文書に関係なく、自由に定義することができる。伹し、自由にできるにしても、応用ソフトウェアの内容に準じて、応用ソフトウェアが扱い易い形とすることが望ましい。また、これも図には表われていないが、 C S V要素の数は、非キー要素の数に応じて、非キー要素数が多い場合には、 C S V要素の数も多くすることが望ましい。

このように、本発明では、非キー要素を処理対象とする場合でも、応用ソフトウエアが扱い易い形にすることができ、また、非キー要素数が多い場合でも、該当する C S V要素を展開する際のオーバーへッドが大きくなることはない。

尚、これは、本例の構造化文書変換方法の特徴の 1つであり、本例による構造化文書変換方法には、他にも、後述するように、様々な特徴がある。

例えば、変換対象の XML文書が、非定型 XML文書である場合、先出願では図 1 ( b ) に示すように、属性 tagsによって、各 C S V要素に C S V形式で纏めた各要素内容に対応するタグ名を記述していたが、これは各レコード毎に逐一記述するので、特にレコード数が多い場合、問題となる。これに対して、本発明では、図 1 ( c ) に示すように、出現し得る全ての要素のタグ名を、まとめてヘッダに付加情報として記述することで、この問題に対応できるが、詳しくは後に説明する。図 2に、本例の構造化文書変換方法をコンピュータ等で実行する処理全体の概略的な流れ及びその構成を示す図である。

本例の構造化文書変換方法は、後述するように、定型 XML文書の場合と、非定型 XML文書の場合（これは、 2つのタイプについてそれぞれ 2つの手法を提案する）について、第 1〜第 4の実施例として説明しているが、図 2に示す処理全体の概略的な流れ及び構成は、共通である。

図 2において、データ構造変換/逆変換機構 1 0は、構造変換部 1 1、逆変換部 1 2、 X S L変換部 1 3を有する。データ構造変換/逆変換機構 1 0は、入力 XML文書 2 1 と、変換仕様 XML文書 2 2を入力して、変換 XML文書 2 3を出力する (変換）。また、抽出 XM L文書 2 4を入力して、結果 XML文書 2 5を出力する（逆変換）。入力 XML文書 2 1は、変換対象の XML文書である。

変換仕様 XML文書 2 2は、変換/逆変換の為の変換仕様を与える XML文書である。すなわち、多様な種類の XM L文書に対して、各 XM L文書に応じたスタイルシート、すなわち X S L (Extensible Stylesheet Language) シートを!/ヽちヽちィ乍するの、；めて ffiィ到で手間が掛かるものである。そこで、この手間を省く為に、本例では (先出願と同様）、 XML文書のデータ構造を変換するための仕様を記述した XML文書、すなわち変換仕様 XML文書 2 2を作成してお

< o

構造変換部 1 1は、この変換仕様 XML文書 2 2によって与えられる変換仕様に基づいて、入力 XML文書 2 1を、変換 XML文書 2 3 へと変換し、逆変換部 1 2は、抽出 XML文書 2 4を、結果 XML文書 2 5へと逆変換する。また、このように変換仕様に基づいて、直接、変換/逆変換処理を実行する方法でもよいが、特に、大量のデータを変換するときに、レコードごとに変換仕様を読み取って判断する処理が必要となる。

これに対して、 X S L変換部 1 3が、変換仕様 X M L文書 2 2 と、変換 X S Lシート生成 X S Lシート 1 4 (先出願における自動変換スタイルシート）とに基づいて、変換実行手順を指示する変換 X S Lシート 1 5 (データ構造変換用スタイルシート）と、逆変換実行手順を指示する逆変換 X S Lシート 1 6 (逆変換用スタイルシート）を生成する。尚、変換 X S Lシート生成 X S Lシート 1 4は、厳密には、変換 X S Lシート 1 5生成用のものと、逆変換 X S Lシート 1 6生成用のものとがあるが、ここでは特に区別せずに扱うものとする。

そして、構造変換部 1 1または逆変換部 1 2が、これら生成した X S Lシート 1 5または 1 6を用いて、変換処理または逆変換処理を実行するようにしてもよい。一度、 X S Lシート 1 5、 1 6を生成してから変換/逆変換をすることによって、大量のデータを変換するときにレコードごとに変換仕様を読み取って判断する操作が不要になるため、高速で実行することができるようになる。

また、このように変換/逆変換の実行手順をスタィルシートで与えるようにすれば、標準の X S L Tプロセッサで変換/逆変換を実行することができ、ほとんどあらゆる種類の X M L文書システムにおいて、本例による変換/逆変換処理を実行できる。この場合、データ構造変換/逆変換機構 1 0 (構造変換部 1 1、逆変換部 1 2、 X S L変換部 1 3 ) は、実際には、例えば 1つの標準の X S L Tプロセッサ（構造化文書変換プロセッサ）によって実現される。

また、変換 X M L文書 2 3が、応用ソフト 3 0によって、メモリ上で D OMッリ一に展開されて、何らかの処理、例えばタグ検索によつて、変換 XML文書 3 0の一部分のレコードが取り出され、 XML文書に直された結果が、抽出 XML文書 2 4である。そして、抽出 XM L文書 2 4を逆変換して元の状態に戻したものが、結果 XML文書 2 5である。

上述してある通り、図 2に示す処理全体の概略的な流れ、構成自体は共通であるが、本例では 4つの実施例の処理を提案している。以下、変換対象が定型 XML文書の場合を第 1の実施例、非定型 XML文書の場合であって、 1つめの手法を第 2の実施例、 2つめの手法を第 3の実施例として説明する。また、他のタイプの非定型 XML文書に係わる 2つの手法を、第 4の実施例として説明する。

以下、まず、第 1の実施例について説明する。

第 1の実施例で変換対象となる定型 XML文書とは、例えば表形式のデータのように、レコード内の要素数、タグ名が固定である XML 文書であり、その一例を図 3に示す。これが、入力 XML文書 2 1に相当する。また、図 3に示す定型 XML文書に対応する変換仕様 XM L文書 2 2の一例を、図 4に示す。また、図 3に示す定型 XML文書を、図 4に示す変換仕様 XML文書 2 2を用いて、構造変換部 1 1によって変換してなる変換 XML文書 2 3の一例を、図 5に示す。

定型 XM L文書は、図 3に示す例では 2つのレコードのみ示しているが、通常はもつと多くのレコードが存在している。また、図 3に示す例では、各レコード（タグ名 "個人" ）は、レコード内が 2階層から成っており、会社情報と個人情報とに分けているが、この例に限るわけではない。 1階層であってよいし、 3階層以上であってもよい。図 3において、各レコードは、タグ名 "名前" 、 "会社情報" 、 " 個人情報" の要素を 1つずつ有している。更に、タグ名 "会社情報" の要素は、タグ名 "会社" 、 "部署" 、 "電話" 、 "email" の要素を有する階層構造となっている。同様に、タグ名 "個人情報" の要素は、タグ名 "自宅住所" 、 "自宅電話" 、 "携帯電話" の要素を有する階層構造となっている。定型 XML文書であるので、図示の 2つのレコードに限らず、全てのレコードは、同じ構造となっている。また、図 4に示す変換仕様 XML文書 2 2の一例では、まず、タグ名「record」の要素の要素内容として、変換対象とするレコード名を記述する。その次には、タグ名「items」内の要素として、タグ名「m erging_tag」の要素と、タグ名「item」の要素を記述している。

タグ名「merging一 tag」の要素の要素内容には、 C S V要素名（C S V要素のタグ名）を記述する。タグ名「merging_tag」の要素内容、すなわち C S V要素名は、入力 XML文書 2 1の構造に関係なく、自由に、複数定義できる。

本例では、先出願と同様に、変換の際には、キー要素はそのままにし、非キー要素の内容を C S V形式で纏めて新たな要素（これを C S V要素と呼ぶ）として変換 XML文書を作成するが、本例においては、入力 XM L文書 2 1の構造に関係なく、自由に複数の C S V要素を定義できるので、応用ソフト 3 0で扱い易いように定義できる。また、 C S V要素の数には、特に上限を設けないので、非キー要素の数が多い場合には、これに応じて、 C S V要素の数を増やすことで、 1つの C S V要素当りに C S V形式で纏める非キー要素の数を抑制できるので、応用ソフト 3 0が任意の非キー要素を処理対象とする場合でも、該当する C S V要素のみを展開する際に、その非キー要素の数は多くないので、オーバーヘッドが大きくなることはない。図示の例では、 2つの C S V要素のタグ名、すなわち「情報 1」と「情報 2」を定義しているが、これは、この例では、非キー要素の数がそれほど多くない為であり、非キー要素の数が多ければ、 C S V要素の数を増やせばよい。

次に、タグ名「i tem」の要素は、変換対象の X M L文書においてレコードに記述される各要素のタグ名を、要素内容として記述している尚、紛らわしいので、以下、 "タグ名「i tem」の要素" 等という表現は、 " 「i tem」要素" または "要素「item」 " という表現に改める。

また、 " 「i teni」要素" の要素内容である "変換対象の X M L文書においてレコードに記述される各要素のタグ名" を、特に "要素名" と呼ぶものとする。

各「i tem」要素は、図上の上から順に、レコード内で出現する要素の順番通りに、その要素の変換仕様を定義している。

まず、図示の通り、要素名は、レコード内で出現する要素の順番通りのタグ名となっている。例えば最初の「i t em」要素の要素名は、変換対象の X M L文書のレコード内で最初に出現する要素のタグ名である「名前」となっている。これによつて、逆変換時に当該変換仕様に基づいて、変換後の X M L文書の内容を元に戻す際に、各要素を元の文書と同じ順番に並べて出力するようになる。

また、各「： i tem」要素には、そのタグ内に所定の属性「mtag」を付与している。これは、各「i tem」要素が、その要素内容、すなわち上記 "要素名" を、どの C S V要素に格納するのかを、属性「mtag」で指定する。但し、 mtag = "_0RG" と指定されている場合には、その要素名の要素がキー要素であることを意味する。図示の例では、応用ソフト 3 0において変換後の XML文書を用いて検索処理をする際に、要素「名前」と要素「会社名」をキーにして検索する場合を想定して、変換仕様の「item」要素において要素名 "名前" と "会社名" の要素がキー要素である旨を属性「mtag」 "_0RG" によって指定している。また、各要素名の要素のレコード内の階層を「path」属性で指定する。

また、上記キー要素以外の要素である非キー要素に関しては、図示の例では、 C S V要素「情報 1」については、非キー要素 "部署" 、 "電話" 、 "email" (何れも「path」属性は "会社情報" が指定されているが、これに限るわけではない）。 C S V要素「情報 2」については、非キー要素 "自宅住所" 、 "自宅電話" 、 "携帯電話" （これも、何れも「path」属性は "個人情報" が指定されているが、これに限るわけではない。つまり、変換元の文書の階層構造に従って C S V要素を割り当てる必要があるわけではない）。

尚、図 4に示す変換仕様 XML文書 2 2のファイル名は、「specl . ralj であるものとする。

構造変換部 1 1力上記図 3に示す定型 XML文書を、図 4に示す変換仕様 XML文書 2 2を用いて、図 7に示す処理を実行することによって、図 5に示す変換 XML文書 2 3が作成される。尚、図 5には、 A氏に関するレコードの変換結果のみを示すが、特に図示しないだけであり、他のレコード（B氏）等も同様に変換される。

以下、図 5、図 7を参照して、本例による構造変換処理について説明する。

尚、図 7は、第 1〜第 3に共通の XML文書に対する構造変換処理の基本的な処理フローチヤ一ト図である。但し、応用ソフト 3 0での非キー要素の利用を考えない場合には、図 6に示す処理であってもよい。図 6は、 XM L文書に対する構造変換処理の基本的な処理フローチャート図である。図 7に示す処理と、図 6の処理の違いは、図 7ではステップ S 2 3の処理が加わっており、また図 6のステップ S 1 3 の処理の代わりにステップ S 2 4の処理を行なう点のみであり、他の処理は同じである。よって、ここでは図 6の説明は省略する。

図 6、図 7は、直接、変換仕様を読み取って行う変換処理のフローチャート図であり、図 8は、図 6のステップ S 1 7または図 7のステップ S 2 8の処理の詳細フローチャート図である。

尚、図 6〜図 9は、データ構造変換/逆変換機構 1 0によって実行される処理を示すものである。

図 7において、データ構造変換/逆変換機構 1 0は、まず、変換仕様 XML文書 2 2を読み込んで、その記述内容から変換仕様を解析する（ステップ S 2 1 ) 。続いて、変換対象である入力 XM L文書 2 1 を入力する（ステップ S 2 2 ) 。そして、この入力 XML文書 2 1 と、解析した変換仕様とに基づいて、ステップ S 2 3以降の処理を実行する。

まず、変換 X ML文書 2 3 (この時点では、何も記述されていない ) に対して、ヘッダ (<csv-def>) に、付加情報を記述する（ステツプ S 2 3 ) 。つまり、変換仕様 XML文書 2 2に記述されていた変換仕様に基づいて、変換 XM L文書 2 3のヘッダに、各 C S V要素毎に、その C S V要素名をタグ名とし、その要素内容として、その C S V 要素に対応する非キー要素の要素名を C S V形式で繋いだものを、付加情報として付ける。この例では、図 4の変換仕様に従って、図 5に示すとおり、 C S V要素名「情報 1」については、これに対応する非キー要素の要素名 "部署" 、 "電話" 、 "email" 、 C S V要素名「情報 2」については、これに対応する非キー要素の要素名 "自宅住所 " 、 "自宅電話" 、 "携帯電話" 力 C S V形式で繋がれて記述されている。

XML文書は、タグ名で要素内容が意味付けられ、自己記述的な性質を持っている。しかし、 C S V形式を取り込むと、 C S V形式の部分はタグが外れるので、 XM L文書の自己記述性が崩れてしまう力 S、この付加情報を変換文書に埋め込むことによって、自己記述性が欠如することはない。

つまり、応用ソフト 3 0において、変換後の XML文書を用いて何らかの処理を実行する場合においても、この付加情報を参照することによって、各要素内容に対応する要素名を知ることができる。

次に、入力 XML文書 2 1のルート要素をコピーし、その属性として、当該変換 XML文書 2 3が C S V変換文書であることを示す「C S V C (CSV Compacting Conversion) 」を記述すると共に、その変換仕様 XM L文書 2 2のフアイル名を入れる（ステップ S 2 4 ) 。図 3の例では、ルート要素は "名簿" であり、また、変換仕様 XML文書 2 2のファイル名は上記の通り「specl.xml」であるので、図 5に示すようにく名簿 CSVC=" specl.xml" 〉と記述される。尚、ここでは、変換仕様 XML文書 2 2のファイル名を記述したが、逆変換 X S L シート 1 6のフアイル名を記述してもよい。あるいは、フアイル名に限らず、例えば U R Lを指定してもよい。

変換 XML文書 2 3は、変換仕様 XML文書 2 2のパラメータの取り方によって幾通りもできる力 S、変換 XML文書 2 3にその変換仕様 XML文書 2 2のフアイル名か逆変換用 X S Lシート名を書いておくことによって、元の XML文書である入力 XML文書 2 1 との対応付けがなされる。

次に、入力 XM L文書 2 1のレコード要素以外の部分を変換 XM L 文書 2 3にコピーする。また、各レコード要素を切り出す（ステップ S 2 5 ) 。レコード要素とは、レコードを記述する要素であることを意味するタグ名で囲まれた要素であり、図 3の例は、タグ名く個人 > と < /個人 >で囲まれた要素である。尚、図 3の例では、レコード要素のみ示しているが、実際には、レコード要素以外の何らかの記述がある場合が多いので、特に図示しないが、これを変換 XML文書 2 3 にコピーする。

そして、各レコード要素毎に、全てのレコ一ドについて処理を行うまで、つまりステップ S 2 6の判定が Y E S となるまで、ステップ S 2 7〜ステップ S 2 9の処理を繰り返し実行する。図 3の例では、まず最初は A氏に関するレコードについて処理し、次に B氏に関するレコードについて処理し、その後、同様に、全てのレコードについて処理を実行することになる。

ステップ S 2 7〜ステップ S 2 9の処理は、まず、レコード要素の開始タグを変換 X M L文書 2 3にコピーする（ステップ S 2 7 ) 。図 3の例では、開始タグは、く個人 >である。次に、レコード内の要素を処理し（ステップ S 2 8 ) 、最後にレコード要素の終了タグ（図 3 ではく/個人〉）を変換 XM L文書 2 3にコピーする（ステップ S 2 9 ) 。

図 8は、ステップ S 2 8の処理の詳細フローチャート図である。同図において、まず、変換仕様 XML文書 2 2を参照して、キー要素は、全て、そのまま、入力 XM L文書 2 1から変換 XML文書 2 3 にコピーする処理を実行する。すなわち、変換仕様 XML文書 2 2中の「要素の並び」の各要素、すなわち「item」要素を順番に走査して (ステップ S 3 1 ) 、その要素名の要素がキー要素であるか否かを判別する（ステップ S 3 2 ) 。すなわち、「item」要素のタグの属性 m tagで指定される文字列が、 mtag= "—ORG" であった場合には、その要素名の要素は、キー要素であると判定する（ステップ S 3 2 , Y E S) 。

そして、入力 XML文書 2 1の処理対象レコードに記述されて.いる；のキー要素を、そのまま、変換 XML文書 2 3にコピーする（ステップ S 3 3 ) 。図 3〜図 5の例では、例えば、図 4において「要素の並ぴ」の最初の「item」要素における要素名「名前」の要素は、属性 mtag= "—ORG" であるので、キー要素と判定する。そして、図 3において最初のレコードは「 A氏」であるので、このレコードにおけるタグ名「名前」の要素である "<名前〉氏< /名前〉" の部分が、そのまま、変換 X ML文書 2 3にコピーされる。以下、同様にして処理を実行し、「要素の並び」の全ての「item」要素について上記処理を実行したら（ステップ S 3 4， Y E S) 、ステップ S 3 5以降の処理に移る。

ステップ S 3 5〜 S 4 0の処理は、変換仕様 XM L文書 2 2を参照して、各 C S V要素毎に、その C S V要素に該当する「item」要素を検索して求め、該当する「item」要素の要素内容、すなわち非キー要素の要素名を C S V形式で繋いで変換 XM L文書 2 3に出力する処理である。まず、変換仕様 XML文書 2 2を参照して、「 C S V要素の定義の並び」からその要素名（つまり、 C S V要素名）を順番に走查し（ステップ S 3 5 ) 、 C S V要素があるか否かを判定する（ステップ S 3 6 ) 。「 C S V要素の定義の並び」の要素とは、図 4における「merging_tag」要素であり、同図では最初は「情報 1」が存在するので、ステップ S 3 6の判定は Y E Sとなり、続いて、変換仕様 X ML文書 2 2中の「要素の並び」の非キー要素、つまり各「item」要素において、その属性 mtagで " _0RG" ではなく、対応する C S V要素名が指定されている「itein」要素を順番に走査して、上記 C S V要素 (ここでは「情報 1」' ）に該当する非キー要素を検索する（ステップ S 3 7 ) 。

そして、該当する非キー要素を見つける毎に（ステップ S 3 8， Y E S) 、この非キー要素の要素内容を、入力 XML文書 2 1から取得して、これを C S V形式で繋ぐ（ステップ S 3 9 ) 。上記 C S V要素「情報 1」に該当する非キー要素、すなわち mtag= "情報 1 " となつている非キー要素は、図 4の例では、まず最初は要素名「部署」であり、「pa1h= "会社情報" 」となっているので、入力 XM L文書 2 1 から、このパスに従って「部署」要素の要素内容「A部」を取得する。同様にして、要素名「電話」、要素名「email」の要素の要素内容「 1 2 3」、「abc@fj. jp」を、その pathに従って入力 X M L文書 2 1からその取得して、これらを順次 C S V形式で繋'いでいく。そして、該当する非キー要素が見つからなくなったら（ステップ S 3 8 , N O) 、上記 C S V要素名「情報 1」をタグ名とし、その要素内容を、上記非キー要素の要素内容を C S V形式で繋いだものとする新要素 (C S V要素）を、変換 XML文書 2 3に出力する（ステップ S 4 0 ) 。この結果、図 5に示す通り、

く情報 1 >A部， 1 2 3， abc@f j. jpく/情報 1 > 力 S、変換 XM L文書 2 3に記述される。

次に、再びステップ S 3 5の処理に戻り、次の C S V要素名「情報 2」を得て、これについても上記と同様の処理を行なった結果、図 5 に示す通り、

<情報 2〉 A巿 A町， 4 5 6 , 7 8 9く/情報 2〉

力 S、変換 XML文書 2 3に記述される。

そして、「情報 2」の次の C S V要素は存在しないので（ステップ S 3 6， NO) 、当該処理を終了する。以上で、変換 XM L文書 2 3 の作成が完了する。

以上の変換処理によつて、変換 XM L文書 2 3におけるレコード内の同階層（この例では第 1階層）に全ての C S V要素（本例では「情報 1」と「情報 2」 ) を配置して、「情報 1」と「情報 2」に、それぞれ「会社情報」と「個人情報」に属する各要素の要素内容を格納するので、例えば応用ソフト 3 0において、想定外に、非キー要素を使う必要が生じた場合でも、応用ソフト 3 0で扱い易い構造となっている。尚、この例では、「会社情報」と「個人情報」が同階層であったので、分かり難いかもしれないが、たとえ「会社情報」と「個人情報」とが互いに異なる階層にあつたとしても、「情報 1」と「情報 2」はレコード内第 1階層となる。また、上述してあるように、「会社情報」に属する要素の要素内容を全て「情報 1」に含める必要はなく、変換仕様 XML文書 2 2によって自由に定義できる。また、既に述べているように、非キー要素の数が多い場合でも、オーバーへッドが大きくなることを防止できる。

次に、以下、定型 XML文書に対する構造変換処理を行なって得られた変換 XML文書 2 3を、逆変換して、元の構造の XML文書に戻す処理、すなわち逆変換処理について、詳細に説明する。図 2の例では、応用ソフト 3 0が、蓄積されている複数の変換 XML文書 2 3の中から、例えばクライアントから要求されて検索条件に応じてタグ検索等を行なって得た検索結果である抽出 XML文書 2 4を、逆変換部 1 2によって逆変換して、結果 XML文書 2 5を出力するので、これに沿って説明する。

まず、逆変換処理の全体フローチャート図は、特に図示しないが、基本的には図 6に示す変換フローと、一部を除いてほぼ同じである。異なる点は、ステップ S 1 2で入力する XML文書、すなわち変換対象の XML文書が、抽出 XML文書 2 4であるので、図 6のステップ S 1 3， S 1 4における「入力 XML文書」を「抽出 XML文書 2 4 」に置き換えればよい。また、抽出 XML文書 2 4が、図 7に示す変換処理によって得られたものである場合には、ステップ S 1 3のルート要素のコピーの際にその属性は除外してコピーし、また、ステップ S 1 4の処理においてヘッダの付加情報は除外してコピーすることになる。

また、当然、ステップ S 1 7の処理内容は、図 8 とは全く異なる。図 9は、逆変換処理におけるステップ S 1 7の詳細フローチヤ一ト図である。

図示の逆変換処理は、各 C S V要素毎にその要素内容である文字列を、区切り記号（カンマ '、 ' ) によって分離して、それぞれ所定の配列に格納しておき、変換仕様 XML文書 2 2中の「要素の並び」の順にキー要素、非キー要素を配置して出力する処理である。

ここでは、図 5の XML文書を、直接、図 4の変換仕様に従って、元の図 3の XML文書に戻す場合を例にして説明する。よって、この例では、結果 XML文書 2 5は、図 3の内容となる。

図 9において、まず、変数 i に初期値 ' 0 ' を代入する（ステップ S 5 1 ) 。

そして、変換仕様 XML文書 2 2を参照して、「C S V要素の定義の並び」からその要素名（つまり、 C S V要素名）を順番に走査し（ステップ S 5 2 ) 、 C S V要素があるか否かを判定する（ステップ S 5 3 ) 。「 C S V要素の定義の並び」の要素とは、図 4における「m ergin_g_tag」要素であり、同図では最初は「情報 1」が存在するので、ステップ S 5 3の判定は Y E Sとなる。

続いて、まず、 i を + 1インクリメントする（ i = i + l ) 。また、変数 j に初期値 ' 1 ' を代入する。そして、抽出 XML文書 2 4を参照して、上記 C S V要素の要素内容を取得し、これを区切り記号（カンマ ' , ， ) によつて分離して、それぞれ、 j を + 1インクリメントしながら、配列 contArray(i, j)に格納する（ステップ S 5 4 ) 。上記の例では、 i = 1 となり、抽出 XML文書 2 4における要素「情報 1」の要素内容は「A部， 1 2 3， abc@fj. jp」であるので、これらを分離し、配列 contArray(i， j)に格納すると、配列（ 1， 1 ) には " A部，，、配列（ 1， 2 ) には " 1 2 3 " ，配列（ 1， 3 ) には "abc @f j. jp" が格納される。 C S V要素「情報 2」についても、同様に処理を行なった結果、配列（ 2， 1 ) には " A巿 A町" 、配列（ 2， 2 ) には " 4 5 6 " ，配列（ 2， 3 ) には " 7 8 9 " が格納される。全ての C S V要素について上記処理を行なったら（ステップ S 5 3 ， NO) 、変数 nに、このときの i の値を代入する（ステップ S 5 5 ) 。上記の例では、 C S V要素「情報 2」に関する処理によって、 i = 2 となっているので、これを変数 nに代入する。続いて、 i = l〜 nまでの各々について、 k ( i ) = 1を設定する（ステップ S 5 6 ) 。上記の例では、 i = l〜 2となるので、 i =,l、 i = 2の各々について、 k ( i ) = 1を設定する。つまり、 k ( 1 ) = 1、 k ( 2) =

1 となる。

そして、ステップ S 5 7〜 S 6 2の処理を、繰り返し実行する。まず、変換仕様 XML文書 2 2中の「要素の並び」の各要素を順番に走査して（ステップ S 5 7 ) 、 ritemj 要素があると（ステップ S 5 8， Y E S) 、この「item」要素の要素名の要素がキー要素であるか否かを判別する（ステップ S 5 9 ) 。つまり、「item」要素のタグの属性において mtag= "—ORG" であった場合には、その要素名の要素がキー要素であると判定する（ステップ S 5 9， Y E S) 。キー要素である場合には、抽出 XML文書 2 4内の処理対象レコードにおけるこのキー要素を、結果 XML文書 2 5にコピーする（ステップ S 6 0 ) 。図 4の例では「要素の並び」の最初のキー要素の要素名は「名前 J であるので、抽出 XML文書 2 4内の処理対象レコードが A氏に関するレコードであるとすると、この要素名「名前」の要素 "く名前 > A氏く/名前 >" 力、そのまま、結果 X ML文書 2 5にコピーされる一方、非キー要素である場合（ステップ S 5 9 , NO) 、つまり、「item」要素のタグの属性 mtagにおいて、 "—ORG" ではなく、 C S V 要素名が指定されている場合には、この C S V要素名の変換仕様 XM L文書 2 2中の出現順番 i を求め（ステップ S 6 1 ) 、配列 contArr ay(i，k(i))に格納されているデータを、当該非キー要素の要素名と共に、結果 XML文書 2 5に出力する (ステップ S 6 2 ) 。

図 4では、例えば、「item」要素の並びにおいて、最初に出現する非キー要素は、図示の通り、要素名が「部署」の要素であり、そのタグの属性 mtagで指定される C S V要素名は「情報 1」であるので、続いて、「mergin_g_t_ag」要素を参照すると、「情報 1」の出現順番は 1番目であるので、出現順番 i = l となる。また、この段階では、 k ( i = 1 ) は初期設定値 ' 1 ' であるので、配列（ 1， 1 ) に格納されているデータ、すなわち「A部」力 S、要素名「部署」と共に、結果 XML文書 2 5に書き込まれることになる。勿論、その際、 pathを参照する。

また、ステップ S 6 2の処理の最後で、 k ( i ) = k ( i ) + 1 とする。これによつて、次に C S V要素「情報 1」に対応する非キー要素が出現した場合には、今度は、配列（ 1 , 2 ) に格納されているデータが出力されることになる。

以上の処理を、変換仕様 XML文書 2 2中の「要素の並び」の全ての「item」要素について実行したら（ステップ S 5 8， NO) 、当該処理は終了する。このとき、上記の例では、結果 XML文書 2 5の内容は、図 3の内容と同一となっている。

従来では、変換前の元の XML文書と、これを変換後に更に逆変換した XML文書とを比較すると、内容的には同一だが、要素の並びが変わってしまって、ユーザから見れば文書が変質したように見えていたが、本例の処理では、要素の並びの順番が変わってしまうことはなく、完全に元通りにすることができる。

以上、定型 XML文書に対する構造変換/逆変換処理について説明した。

以下、非定型 XML文書に対する構造変換/逆変換処理について説明する。上述してある通り、この処理には、第 2の実施例と第 3の実施例がある。 .

まず、図 1 0に、第 2、第 3の実施例において入力 XML文書 2 1 となる非定型 XML文書の一例を示す。

図 1 0に示す通り、非定型 XML文書は、レコード内の要素数、タグ名が可変となる。

図 1 0の例では、「名前」をキー要素とする場合を考える。また、この例では、「会社」はキー要素として扱ってもよいし、非キー要素として扱ってもよレ、。

また、非キー要素に関しては、図 3では、 A氏、 B氏とも同じ要素名、要素数であったのに対して（勿論、 A氏、 B氏に限らず、他のレコードも同様）、図 1 0では、非定型 XML文書であるので、タグ名、要素数が異なる。すなわち、 A氏に関する非キー要素は、会社情報として要素名 "部署" 、 "住所" 、 ' "電話" 、 "email" 、個人情報として要素名 "住所" 、 "電話" 、 "携帯電話" の要素がある。一方、 B氏に関する非キー要素は、会社情報として要素名 "部署" 、 "住所" 、 "電話" 、 "email" 、 "email" 、個人情報として、要素名 " 住所" 、 "電話" の要素がある。

B氏は、 A氏と比較すると、会社情報として "email" が 2つある一方で、個人情報としての "携帯電話" がない。つまり、 B氏は、 e mailァドレスを 2つ持っており、携帯電話は持っていない為に、このような個人情報が入力されたということである。

尚、この例では、入力 XML文書 2 1において二人ともキー要素の要素内容は記述されているが、記述されない場合があってもよい。以下の説明では、第 2、第 3の実施例とも、上記図 1 0の非定型 X M L文書を入力 X.M L文書 2 1 とする場合について説明する。

まず、第 2の実施例について説明する。

図 1 1は、第 2の実施例における変換仕様 X M L文書 2 2の一例を示す図である。

同図において、まず、元の文書の要素名「会社情報/会社」を、任意の別名（この例では「勤務先」）に置き換えて、変換後の文書に出力する為の変換仕様について説明する。これは、く rep l ac i ng_tag〉で新要素名「勤務先」を定義し、「要素の並び」における要素「会社」の箇所で、属性で rtag=" 勤務先" として指定する。この操作によつて、この例のように 2層の場合に限らず、 3層以上の深い階層であつても、この深い階層にあ,る要素をレコード内 1階層目に上げて、応用ソフトで読出し易くすることができる。また、これは、 C S V形式でまとめる要素が 1個の特殊な場合であり、必ずしも 1個の場合と複数個の場合とを区別する必要はないが、区別することによって、変換/ 逆変換の操作をし易くすることができる。

また、図 1 0の例では、「住所」、「電話」が、それぞれ、 2っ存在する。つまり、「会社情報」、「個人情報」の各々に、「住所」、「電話」が存在する。このような場合、要素名だけを変換 X M L文書 2 3に出力しても、応用ソフト 3 0では区別が付かない。この為、先出願では、 tagsを用いて、「会社情報/住所」、「会社情報/電話 j 、「個人情報/住所」、「個人情報/電話」という形で出力していた力これでは、階層構造が深くなるほど、冗長な記述となってしまう。本例では、これに対して、図 1 1の変換仕様 X M L文書 2 2の例のように、「i t emj 要素のタグの属性として、 name属性を与えている。この name属性によって、別名を指定して、この別名を変換文書のヘッダで付加情報として記述するようにしている。図 1 1の例では、例えば、「会社情報/住所」は「会社住所」、「個人情報/住所」は「自宅住所」という別名を与え、図 1 2に示すヘッダの付加情報には、この別名が記述され、応用ソフト 3 0はこの別名を用いて任意の処理を行なう。「電話」についても同様である。また、 emai lについても、最大 2 個記述されるので、図 1 1に示す通り、別名を与えている。

このように、非キー要素の要素内容を C S V要素に纏めたときに、 —意に指定できる要素名を変换仕様で与え、変換文書にそれを反映させることによって、元文書の要素階層とは別の纏め方、別の要素名で、応用ソフト 3 0が扱うことができるようになる。尚、これは、第 1 の実施例において適用してもよい。

また、本例では、図 1 1に示すように、「item」要素のタグにおいて format属性を与えている。図示の例では「会社情報/ emai l [0]」、「会社情報/ emai l [ l ]」、「個人情報/携帯電話」の「i tem」要素に、 format=" unfi xed" の属性が付いており、これによつて、これらの要素名の要素の要素内容が、入力 X M L文書 2 1において固定的な出現をしないことを指定できる。

"固定的な出現をしない" とは、例えば上記図 1 0には B氏が携帯電話は持っていないので、携帯電話番号を記入しなかった場合のデータを示している。このように、必ずしもその要素名の要素の要素内容が記述されているものではないことを、 format=" unf ixed" で指定する。

一方、「itemj 要素において、タグに format " unf ixed" の属性力 S 付いていない場合、その要素名の要素は、必ず要素内容が記述されている。つまり、一般的に、例えば任意のホームページで任意の情報（ここでは、任意のユーザの個人情報）を入力させる際、必須入力項目を指定 '表示し、この必須入力項目の中の 1つでも入力していない状態で「登録」等を行なおうとすると、エラーとすることが行なわれている。上記 format=" unf i xed" の属性が付いていない要素は、例えばこの必須入力項目に対応するものと考えてよい。 format=" unf i xed " の属性は、キー要素、非キー要素の両方に指定可能である。

但し、固定的な出現をしない場合でも、 format=" unf ixed" の属性は、必ず指定しなけらばならないとは限らない。この場合、後述する図 1 4のステップ S 1 0 0、 S 1 0 4の処理における「非定型要素且つ」の条件が無くなる。但し、この場合、 format=" unf ixed" の属性が指定されていないにも係わらず、その要素が存在しない場合に、ェラーとする処理等が行なえなくなる。

図 1 2は、図 1 0の非定型 X M L文書を、図 1 1に変換仕様 X M L 文書 2 2を用いて構造変換して成る変換 X M L文書 2 3の一例を示す図である。

また、図 1 3は、第 2の実施例における構造変換処理における「レコード内の要素の処理」の詳細フローチャート図である。すなわち、第 2の実施例においても、構造変換処理全体の処理の流れは、第 1の実施例と略同様であるので、全体処理については図 6、図 7で説明してあるので省略する。そして、ステップ S 1 7またはステップ S 2 8 の処理内容は、第 1の実施例とは異なるので、その詳細について、図 1 3に示して説明する。尚、図 1 2には、付加情報を付ける処理を行なった場合の変換結果を示している。

伹し、図 7の処理、すなわち付加情報を付ける処理を行なう場合には、更に、ステップ S 2 3の処理内容が多少異なる。すなわち、第 2 の実施例では、図 1 1に示す通り、変換文書のヘッダの付加情報で与える非キー要素の要素名の別名を、 name属性で与えているので、ステップ S 2 3の処理は、 name属性で指定されている別名を、変換 XML 文書 2 3に付加情報として出力する処理となる。例えば、図 1 1において非キー要素「会社情報/住所」について、 name属性で「会社住所」が指定されているので、図 1 2に示す通り、 C S V要素名「場所」において「会社住所」が記述される。他の非キー要素についても'同様である。また、図 1 2には、図 7のステップ S 2 4の処理によって、ルート要素「名簿」と、その属性に変換文書名が記述されている。尚、ここでは、図 1 1の変換仕様 XM L文書 2 2のファイル名が spec²

. xmlであったものとする。

このように、ルート要素とヘッダが記述された状態で、図 1 3の処理によって、図 1 2の個人タグ内の各種情報が記述される。

図 1 3において、まず、ステップ S 7 1〜 S 7 5の処理、すなわち変換仕様 XML文書 2 2を参照して、キー要素を全て探し出して、その要素名と要素内容を変換 XML文書 2 3にコピーする処理は、基本的には、図 8のステップ S 3 1〜S 3 4の処理と略同様である。伹し、第 2の実施例は、入力文書が非定型 XML文書であり、非キー要素だけでなく、キー要素も固定的な出現をしない場合がある。これに対応して、ステップ S 7 3の処理を行なっている。

ステップ S 7 3の処理では、ステップ S 7 2において見つけた、キ一要素に関する「item」要素のタグに、 format=" unfixed" の属性が付いており、且つ入力 XML文書 2 1においてこのキー要素が記述されていない場合には（ステップ S 7 3， Y E S) 、このキー要素はコピーしないようにする。図 1 0、図 1 1の例には、ステップ S 7 3の判定が Y E Sとなる例は存在しないが、例えば仮に、図 1 1において、キー要素「名前」に関する「item」要素のタグに、 format=" unfixed" の属性が付いており、且つ図 1 0において「名前」要素が記述されていなかった場合には、図 1 2におけるく名前〉 A氏く/名前 >の部分は、記述されていないことになる。

また、図 1 3において、ステップ S 7 6〜S 8 1の処理、すなわち、変換仕様 XM L文書 2 2を参照して、各 C S V要素毎.に、その C S V要素に該当する要素を検索して求め、該当する要素の要素内容を C S V形式で繋いで変換 XML文書 2 3に出力する処理は、基本的には、図 8のステップ S 3 5〜S 4 0の処理と略同様である。但し、第 2 の実施例は、入力文書が非定型 XML文書であり、上記の通り、非キ一要素が、固定的な出現をしない場合がある。これに対して、本例では、もし、ある非キー要素の要素内容が存在しない場合には、ステツプ S 8 0の処理において、空要素を繋ぐようにしている。

例えば、 A氏のレコードを処理対象としたときのステップ S 7 8， S 7 9の処理において、 C S V要素名「連絡」に該当する非キー要素として、変換仕様 XML文書 2 2の「item」要素中に、「会社情報/ emailtl] J に関する「item」要素を見つけたとき（ステップ S 7 9， Y E S) 、この非キー要素「会社情報/ email[l]」は、図 1 0に示す通り、記述されていないので、この場合にはステップ S 8 0の処理において空要素を繋ぐ。これによつて、図 1 2に示す C S V要素名「連絡」の要素内容は、

く連絡〉 123， abc@f j. jp,， 456， 789く/連絡〉

となる。つまり、新要素名「会社 emaillj の要素内容である「abc@f j. jpj と、新要素名「個人電話」の要素内容である「456」の間は、空要素「，，」で繋がれている。

また、図 1 3には示していないが、変換仕様 XML文書 2 2中の「要素の並び」における任意の「item」要素において、そのタグの属性で rtagが指定されている場合には、その要素名を、く replacing_tag〉で定義されている新要素名に置き換えて、変換 XML文書 2 3に出力する処理を実行する。これによつて、図 1 2に示すように、「会社情報/会社」力 S 「勤務先」というレコード内 1階層目の要素に置き換えられている。これは、 C S V形式でまとめる要素が 1個であるという、特殊な場合である。

以上の処理によって、図 1 2に示す変換 XML文書 2 3が作成される。図 1 2に示す通り、この変換文書では、元の XML文書である図 1 0の入力 XM L文書 2 1において「会社情報」、「個人情報」の下にあった非キー要素の要素内容を、それぞれ、バラバラに、 C S V要素「場所」、「連絡」に纏め直している。 "バラバラに" とは、例えば「会社情報」の下にあった非キー要素は全て C S V要素「場所」に纏めるとは限らず、一部は「連絡」に纏めてもよいという意味であるまた、変換 XML文書 2 3には、各 C S V要素に絡めた要素内容の要素名を、ヘッダの付加情報として記述しているが、その際に、元の XML文書では「会社情報」と「個人情報」の下に、それぞれ、同名の要素「住所」と「電話」があったが、これらの名称が重複する要素名に関しては、上記の通り、変換仕様 XML文書 2 2中の name属性に従って、新たな名前「会社住所」、「会社電話」、「自宅住所」、「自宅電話」を与えている。これは、上記の通り、例えば「会社情報/ 住所」等のように XPathで与えても一意の名前になるが、特に階層が深い場合には冗長になる為、別名を与えることによって、応用ソフトで、これらの要素の扱いを容易にできるようになる。また、この例では「会社情報/ email」が最大 2個記述されるものと想定している。この為、繰返し出現する「会社情報/ email」に対して「会社 emaill」「会社 email 2」を新たな名前として与え、各々がー意になるようにしている。

次に、以下、第 2の実施例における逆変換処理について説明する。第 2の実施例の逆変換処理は、処理全体の流れは、第 1の実施例で説明した逆変換の全体処理と、略同様であるので、特に図示/説明はしない。

図 1 4は、この逆変換の全体処理中の "レコード内の要素の処理" の詳細フローチヤ一ト図である。

図 1 4の処理において、ステップ S 9 1〜S 9 5の処理までは、図 9のステップ S 5 1〜ステップ S 5 5の処理と略同様であるので、説明は省略する。伹し、ステップ S 9 4の処理において、要素内容が空要素である場合にも配列を割り当てる。つまり、例えば、図 1 2の A 氏のレコードの C S V要素「連絡」において、要素内容「4 5 6」の前に空要素があるが、この空要素にも配列（ 2， 3 ) を割り当てるので、「 4 5 6」は、配列（ 2， 4 ) に格納される。

ステップ S 9 6以降の処理について、以下に説明する。

まず、 i = l〜nまでの各 i毎に、 k ( i ) に初期値 ' 0 ' を与える（ステップ S 9 6 ) 。

ここで、図 9のステップ S 5 6では初期値 ' 1 ' を与えていた力 S、これを ' 0 ' とした理由について、説明しておく。これは、 k ( i ) の値を + 1インクリメントする処理を、ステップ S 1 0 3の段階で行なっている点と関連する。これらの処理は、内容的には、図 9の処理と殆ど変わらないが、図 9ではステップ S 6 2の処理において、配列の格納内容を出力すると共に、 k ( i ) の値を + 1インクリメントしていたが、本例のように非定型 XML文書を扱う場合には、必ずしも配列の格納内容を出力する処理を行なうとは限らないので（つまり、ステップ S 1 0 4の判定が Y E S となる）、ステップ S 1 0 4の分岐の前の段階で、 k ( i ) の値を + 1インクリメントする（ステップ S 1 0 3 ) 。また、これによつて、配列（ i， k ( i ) ) の格納内容を出力する処理の前に k ( i ) の値が + 1インクリメントされてしまうことに対応して、ステップ S 9 6において k ( i ) の初期値を ' 0 ' にしている。

上記ステップ S 9 6の処理後、まず、変換仕様 XM L文書 2 2中の「要素の並び」の各「item」要素を順番に走査して（ステップ S 9 7 ) 、各「item」要素毎に（ステップ S 9 8， Y E S) 、その「item 」要素で定義している要素名の要素が、キー要素であるか否かを判定する（ステップ S 9 9 ) 。判定方法は、既に説明している。

キー要素である場合には（ステップ S 9 9， YE S) 、続いて、当該「item」要素のタグに、 format=，， unfixed" の属†生カ付レヽてレヽて、且つ変換対象入力文書である抽出 XM L文書 2 4内の処理対象レコ一ド'において、このキー要素名の要素が存在しない場合には（ステップ S 1 0 0 , Y E S；) 、結果 XML文書 2 5に対して何も出力しないで、ステップ S 9 7に戻り、次の要素の処理に移る。一方、当該キー要素に関する「item」要素のタグに、 format unfixed" の属性が付いていない場合、若しくは format=" unfixed" の属性が付いていても抽出 XML文書 2 4に、このキー要素名の要素が存在する場合には（ステップ S 1 0 0， NO) 、このキー要素の要素名を結果 XML文書 2 5にコピーすると共に、抽出 XML文書 2 4内の処理対象レコードに記述されている当該キー要素の要素内容を、結果 XML文書 2 5にコピーする（ステップ S 1 0 1 ) 。

一方、ステップ S 9 9において、非キー要素であると判定された場合（ステップ S 9 9， NO) 、つまり、「item」要素のタグの属性 m tagが、 "_0RG" ではなく、 C S V要素名が記述されている場合には、まず、この C S V要素名の変換仕様 XML文書 2 2中の出現順番 i を求め（ステップ S 1 0 2 ) 、 k ( i ) の値を + 1インクリメントする（ステップ S 1 0 3 ) 。'そして、当該キー要素に関する「item」要素のタグに、 format=，， unfixed" の属个生力寸レヽていて、且つ酉己歹 lj con tArray(i， k(i))に何も格納されていない（空である）場合には（ステップ S 1 0 4 ) 、結果 XML文書 2 5に対して何も出力しないで、ステツプ S 9 7に戻り、次の「item」要素の処理に移る。要素内容は、上記の通り "空" であるので何も出力できないが、当該非キー要素の要素名も出力しない。

—方、ステップ S 1 0 4の判定が N Oの場合には、配列 contArray (i，k(i))に格納されているデータを、当該非キー要素の要素名と共に、結果 XML文書 2 5に出力する（ステップ S 1 0 5 ) 。

以上の処理で、例えば図 1 2に示す変換文書を、図 1 0に示す元の文書に、戻すことができる。これは、順番も、元通りに戻すことができる。変換仕様 XML文書 2 2中の各「item」要素を、元の XML文書の出現順に並べており、且つこの順番通りに処理し、出力しているからである。尚、図 1 4には示していないが、変換仕様 XML文書 2 2において Γ itemj 要素のタグに属性 rtagを有する場合、その要素名の要素は、この属性 rtagで指定される新要素名（図 1 1、図 1 2の例では「勤務先」）の要素内容を、抽出 XML文書 2 4から取得して、この要素内容と、元の要素名とを、結果 XML文書 2 5に出力する。

以上説明した第 2の実施例によれば、非定型 XML文書であっても、第 1の実施例と同様の効果が得られる。更に、上述してあるように、 name属性による効果も得られる。

次に、以下、非定型 XM L文書に対する 2つ目の方法、すなわち第 3の実施例について説明する。

第 3の実施例を説明する際の具体例は、入力 XML文書 2 1は、上記図 1 0に示した例と同じであるとし、変換仕様 XML文書 2 2の具体例を図 1 5に示し、変換 XML文書 2 3の具体例を図 1 6に示す。図 1 5に示す変換仕様 XML文書 2 2の例は、図 1 1に示す第 2の実施例の場合と比較すると、変換 XML文書 2 3のヘッダの付加情報で与える非キー要素の別名を、変換仕様 XML文書 2 2中の非キー要素に関する各「i1:em」要素において、 name属性で与えるようにしている点は、第 2の実施例と同じである。

第 2の実施例と異なる点は、変換仕様 XML文書 2 2中の「mer_gi ng_tag」要素にぉレヽて、そのタグ内に属'性として format=，， unfixed " を付けられている場合には、その C S V要素に含まれる全ての非キ一要素が、固定的な出現をしないことを指定する点である。

これに伴って、ステップ S 2 3の処理を行なった場合には、図 1 6 に示すように、非定型な要素をまとめる C S V要素である「連絡」には、 format=" unfixed" の属性を付けて、 C S V要素「連絡」内の非キー要素が全て非定型であると見なすように指定する。

図 1 7は、第 3の実施例における構造変換処理における「レコード内の要素の処理」の詳細フローチャート図である。すなわち、第 3の実施例においても、第 2の実施例と同様に、構造変換処理全体の処理の流れは、第 1の実施例と略同様であるので、全体処理については図 6、図 7で説明してあるので省略する。そして、ステップ S 1 7またはステップ S 2 8の処理内容は、第 1、第 2の実施例とは異なるので、その詳細について、図 1 7に示して説明する。尚、図 1 6には、付加情報を付ける処理を行なった場合の変換結果を示している。また、図 7の処理、すなわち付加情報を付ける処理を行なう場合、ステップ S 2 3の処理内容は、第 2の実施例と同様である。すなわち、 name 属性で指定されている別名を、変換 X M L文書 2 3のヘッダに付加情報として出力する。

図 1 7において、ステップ S 1 1 1〜ステップ S 1 1 7の処理は、図 1 3のステップ S 7 1〜 S 7 7の処理と同じであるので、その説明は省略する。また、ステップ S 1 1 8の判定が N Oとなった場合の処理であるステップ S 1 1 9〜 S 1 2 2の処理は、図 8のステップ S 3 7〜 S 4 ◦の処理と同じであるので、その説明は省略する。

以下、ステップ S 1 1 8の判定が Y E Sとなった場合の処理について説明する。ステップ S 1 1 8の判定が Y E Sとなる場合、つまり処理対象の C S V要素が非定型 C S V要素である場合とは、「merging _tagj 要素において、上記「連絡」のように、そのタグ内に属性として format=" unfixed" が付されていた場合である。 .

この場合、変換仕様 X M L文書 2 2中の「要素の並び」において、非キー要素を順番に走査して、上記非定型 C S V要素（ここでは「連絡」）に該当する非キー要素を検索する（ステップ S 1 2 4) 。

そして、該当する非キー要素を見つける毎に（ステップ S 1 2 5， Y E S) 、入力 XML文書 2 1中にこの非キー要素が記述されているか否かに判定し（ステップ S 1 2 6) 、もし記述されている場合には (ステップ S 1 2 6， Y E S) 、この非キー要素の出現順番を C S V 形式で繋ぐと共に（ステップ S 1 2 7) 、入力 XML文書 2 1から要素内容を取得して、これを C S V形式で繋ぐ（ステップ S 1 2 8 ) 、という処理を繰り返す。

そして、該当する非キー要素が見つからなくなったら（ステップ S 1 2 5 , NO) 、上記非定型 C S V要素のタグ内の属性 tagsの属性値としてステップ S 1 2 7の処理結果を置くと共に（ステップ S 1 2 9 ) 、この tags属性を有する非定型 C S V要素のタグと共に、ステップ S 1 2 8の処理結果を変換 XML文書 2 3に出力する。

図 1 5、図 1 6に示す非定型 C S V要素「連絡」の例では、例えば A氏に関するレコードを処理対象としたときには、図 1 5のステップ S 1 2 5において、「連絡」に該当する非キー要素として、走査順に、「会社情報/電話」（出現順番 1 ) 、「会社情報 /email [1] 」（出現順番 2 ) 、「会社情報/ email [2] 」（出現順番 3 ) 、「個人情報/ 電話」（出現順番 4) 、「個人情報/携帯電話」（出現順番 5 ) が見つかるが、唯一「会社情報/ email [2] 」（出現順番 3 ) のみは、図 1 0の A氏のレコード内に記述されていないので、図 1 6に示すように、 tags属性を有する非定型 C S V要素のタグとして、

〈連絡 tags=" 1, 2, 4, 5" > く/連絡〉

その要素内容として

123, abc@f j. jp, 456, 789 力 S、変換 XML文書 2 3に記述される。

また、上記の通り、へッダの付加情報として、 C S V要素の要素内容に対応する要素名（ここでは、別名になっており、 "会社電話、会社 e_maill、会社 _email2、自宅電話、携帯電話" ）力出現順番通りに記述されている。

これによつて、新要素である C S V要素に纏めてある要素内容とその要素名との対応を取ることができる。例えば要素内容「 4 5 6」に対応する tags属性値は ' 4，であるので、付加情報における 4番目の要素名「自宅電話」に対応することが分かる。

次に、図 1 8を参照して；第 3の実施例における逆変換処理について説明する。図 1 8は、第 3の実施例の逆変換処理における「レコ一ド内の要素の処理」の詳細フローチャート図である。

図 1 8におけるステップ S 1 4 1〜ステップ S 1 4 9の処理は、ステツプ S 1 4 1〜ステップ S 1 4 4までと、ステップ S 1 4 7、 S 1 4 8の処理は、図 9のステップ S 5 1〜ステップ S 5 6の処理と略同様であるが、ステップ S 1 4 5 , S 1 4 6 , S 1 4 9の処理が追加されている。ステップ S 1 4 1〜ステップ S 1 4 4までと、ステップ S 1 4 7、 S 1 4 8の処理についての説明は、省略または簡略化する。まず、ステップ S 1 4 4までの処理によって、処理対象 C S V要素の要素内容を配列 contArray(i， j)に格納したら、続いて、もしこの C S V要素が非定型要素であるならば（ステップ S 1 4 5 , Y E S) 、その属性 "tags" の値を分離して、それぞれ、配列 ta_gArray(i, j)に格納する（ステップ S 1 4 6 ) 。

図 1 5、図 1 6の例では、まず、最初に見つかる C S V要素は「場所」であるが、これは非定型 C S V要素ではないので、ステップ S 1 4 5の判定は NOとなる。よって、この場合は i = l となるので、処理対象 C S V要素の要素内容を配列 contArray(l， j)に格納したら、そのまま、ステップ S 1 4 2の処理に戻る。

一方、次の C S V要素である「連絡」は、属性として format=" un fixed" が付されているので、非定型要素である（ステップ S 1 4 5 ， Y E S) 。よって、この場合は、 i = 2となるので、処理対象 C S V要素の要素内容を配列 contArray(2， j)に格納し（ステップ S 1 4 4 ) 、更にその属性 "tags" の値を分離して、それぞれ、配列 tagArra y(²，j)に格納する（ステップ S 1 4 6 ) 。

以上の処理によって、例えば A氏のレコードに関しては、配列 con tArrayには、（ 1， 1 ) に A部、（ 1， 2 ) に A市 A町、（ 1， 3 ) に A巿 B町が格納され、（ 2， 1 ) に 1 2 3、（ 2， 2 ) に abcOfj. jp、（ 2， 3 ) に 4 5 6、 ( 2 , 4 ) に 7 8 9が格納される。また、配列 tagArrayには（ 2， 1 ) に 1、（ 2 , 2 ) に 2、（ 2， 3 ) に 4 、（ 2， 4 ) に 5が格納される。

次に、この例では、ステップ S 1 4 7において n = 2となるので、ステップ S 1 4 8、 S 1 4 9において、 k ( i ) 、 m ( i ) の初期値を設定すると、 k ( 1 ) = 1、 k ( 2 ) = 1、 m ( 1 ) = 0、 m ( 2 ) = 0が設定される。

次に、変換仕様 XML文書 2 2中の「要素の並び」を走査して、 j = 1、 2 , 3、 · · ■ の各「item」要素毎に、ステップ S 1 5 2〜S 1 6 0の処理を実行して、全ての「item」要素について処理を行なつたら（ステップ S 1 5 1， NO) 、当該処理は終了する。

まず、処理対象の要素、すなわち「要素の並び」の j番目の「ite mj 要素が定義している要素名の要素が、キー要素であるか否か判定する（ステップ S I 5 2 ) 。判定方法は、既に説明してある。キー要素である場合には（ステップ S 1 5 2， YE S) 、ステップ S 1 5 3 、 S 1 5 4の処理を実行する。ステップ S 1 5 3、 S 1 5 4の処理は、第 2の実施例と同様、すなわち図 1 4のステップ S 1 0 0 , S 1 0 1の処理と略同様であるので、ここでの説明は省略する。

一方、その「item」要素が定義している要素名の要素が、非キー要素である場合（ステップ S 1 5 2 , NO) 、まず、この非キー要素に対応する C S V要素名の変換仕様 XM L文書 2 2中での出現順番 i を求める (ステップ S 1 5 5 ) 。続いて、 m ( i ) を + 1インクリメントする（ステップ S 1 5 6 ) 。そして、上記 C S V要素が非定型要素であるか否かに応じて、ステップ S 1 5 8またはステップ S 1 5 9 の何れかに分岐する（ステップ S 1 5 7 ) 。

図 1 5に示す例では、最初に見つかる非キー要素は「会社情報/部署」であり、これに対応する C S V要素名は「場所」であり、この C S V要素「場所」の出現順番は ' 1 ' であるので、

m ( 1 ) = m ( 1 ) + 1 = 0 + 1 = 1

となり、更に、この C S V要素「場所」は非定型要素ではないので、ステップ S 1 5 8の処理に移行する。すなわち、配列 contArray(i， k (i))に格納されているデータを、当該非キー要素の要素名と共に、結果 XML文書 2 5に出力する（ステップ S 1 5 8 ) 。この例では、 k ( 1 ) は初期値 ' 1 ' のままなので、配列 contArray(l， k(l)) = cont Array(l， 1)に格納されている「部」力 S、当該非キー要素名「部署」と共に、結果 XML文書 2 5に出力される。

そして、 k ( 1 ) の値が + 1インクリメントされて、 ' 2，となる。一方、図 1 5の例において非キー要素「会社情報/電話」が処理対象となったときには、これに対応する C S V要素名は「連絡」であり、この C S V要素「連絡」の出現順番は ' 2 ' であるので、

m ( 2 ) = m ( 2 ) + 1 = 0 + 1 = 1

となり、更に、この C S V要素「場所」は非定型要素なので（ステツプ S 1 5 7 , Y E S) 、ステップ S 1 5 9の処理に移行する。

ステップ S 1 5 9の処理は、配列 tagArrayに格納されている要素の順番を用いて、順番が入ってない要素は出力しないようにする処理である。例えば、上記「会社情報/電話」の例では、 m ( 2) = 1 となつており、酉己歹 IJ tagArray ( 2， 1 ) には ' 1 ' が格納されているので、ステップ S 1 5 9の判定は Y E S となり、配列 contArray ( 2， 1 ) に格納されている「 1 2 3」を、その非キー要素名「会社情報/電話」と共に、結果 XML文書 2 5に出力する。そして、 k ( 2 ) を + 1インクリメントする。図 1 5において次の非キー要素である「会社情報/ email [0] 」も、同様に、ステップ S 1 5 6で m ( 2 ) = 2 となり、配歹 IJ tagArray ( 2 , 2 ) には ' 2 ' が格納されているので、ステツプ S 1 5 9の判定は Y E S となる。

一方、次の非キー要素である「会社情報 /email [1] 」の場合、ステツプ S 1 5 6で m ( 2 ) = 3 となるが、配列 tagArray ( 2 , 3 ) には ' 4 ' が格納されているので、ステップ S 1 5 9の判定は N Oとなる。元々、「会社情報 /email [1] 」の情報は記述されていないので、上記の処理によって、この要素は出力しないようにできる。また、この場合は、ステップ S 1 6 0の処理を行なわないので、 k ( 2 ) は + 1インクリメントされない。よって、「要素の並ぴ」における次の次の要素である「個人情報/電話」に関する処理では、ステップ S 1 5 9で、再び、配列 tagArray ( 2， 3 ) = ' 4 ' との比較が行われる。このときは、 m ( 2 ) = 4 となっているので、ステップ S 1 5 9の判定は Y E S となる。

以上説明した非定型 X M L文書に対する 2通りの手法、すなわち第 2の実施例、第 3の実施例を、先出願の手法と比較した場合、以下の特徴がある。

まず、先出願では、たとえ短縮文字列を使う場合でも、各レコード毎に逐一短縮文字列をタグ内の属性として指定しなければならず、冗長であると共に、短縮文字列と要素名との対応関係ファイル等を参照しなければならない。

これに対して、第 2の実施例では、ヘッダに、付加情報として、出現し得る全ての要素の要素名を記述し、各レコードにおいて、出現しなかった要素は、空要素としているだけで、要素名と要素内容との対応関係を定義できる。

また、第 3の実施例では、上記付加情報を用いるが、各レコードのタグ内に属性を記述しなければならない。しかし、この属性は、出現順番をそのまま記述するので、コンピュータによって自動的に属性値を記述することができる。一方、先出願では、別途、対応関係フアイルを定義しなければならないので、手間が掛かる。

また、先出願では、変換後の X M L文書を応用ソフトで利用しない場合でも、逆変換処理を行なう際に、変換後の X M L文書内に記述された非キー要素のタグ名を切り出して、このタグ名と要素内容とから、非キー要素を復元していた。一方、第 2の実施例、第 3の実施例では、変換後の X M L文書内に非キー要素のタグ名が記述されていなくても、逆変換処理を実行できる。また、第 2の実施例と第 3の実施例とを比較した場合の長短は、以下通りである。

第 2の実施例の手法は、第 1の実施例の手法の延長線上にあると見なすこともできる。第 2の実施例では、選択出現候補要素（出現する可能性がある要素）全てについて C S V形式に併合■分離の操作をするため、選択出現候補要素がいずれも頻繁に出現する場合に有効である。

これに対して第 3の実施例の手法は、属性値を用いて要素名と要素内容を対応させるものであり、方法的には複雑になるものの、選択出現候補要素中にめったに出現しないものが多数ある場合に有効となる。

上述した説明では、変換仕様 X M L文書 2 2に基づいて、直接、構造変換または逆変換処理を実行する場合について説明したが、上述してある通り、変換仕様 X M L文書 2 2に基づいて変換 X S Lシート 1 5、逆変換 X S Lシート 1 6を作成し、これらの X S Lシートを用いて、構造変換または逆変換処理を実行する構成であってもよい。この場合でも、実質的な処理内容は、上述したものと同様であるが、ここでは、図 1 9 ( a ) 〜（ d ) に、第 1の実施例を例にして、変換/逆変換 X S Lシートを用いる場合の概略的な処理手順を示しておくものとする。

尚、ここでは、第 1の実施例に対応する例のみ示すが、第 2、第 3 の実施例についても同様である。

まず、図 1 9 ( a ) では、 X S L変換部 1 3は、変換仕様 X M L文書 2 2を読み込んで、この記述内容から変換仕様を解析して（ステツプ S 1 7 1 ) 、この解析結果と変換 X S Lシート生成 X S Lシート 1 4 とを用いて、 XML文書から XML文書への変換の際にそのデータ構造を変換する為のスタイルシートである変換 X S Lシート 1 5 を作成する（ステップ S 1 7 2 ) 。また、同様に、図 1 9 ( b ) に示すように、 X S L変換部 1 3は、変換仕様 XML文書 2 2を読み込んで、この記述内容から変換仕様を解析して（ステップ S 1 8 1 ) 、この解析結果と、変換 X S Lシート生成 X S Lシート 1 4 とを用いて、変換 XML文書 2 3または抽出 XML文書 2 4から元の XML文書 2 1 の文書形式に戻す為の逆変換処理に用いるスタイルシートである逆変換 X S Lシート 1 6を作成する（ステップ S 1 8 2 ) 。

図 2 0、図 2 1 に、それぞれ、図 4に示す例の変換仕様 XM L文書 2 2を読み込んだ場合に生成される変換 X S Lシート 1 5、逆変換 X S Lシート 1 6の一例を示す。

そして、変換処理を行なう場合には、図 1 9 ( c ) に示すように、処理対象となる入力 XML文書 2 1 とこれに対応する変換 X S Lシート 1 5のフアイル名等を指定することで（ステップ S 1 9 1 ) 、当該変換 X S Lシート 1 5を用いて、実質的に図 6のステップ S 1 3〜 S 1 8の処理（ステップ S 1 7の処理は図 8の処理）に相当する処理が実行されることになる（ステップ S 1 9 2 ) 。

同様に、逆変換処理を行なう場合には、図 1 9 ( d ) に示すように、処理対象となる変換 XML文書 2 3 (抽出XML文書 2 4 ) とこれに対応する逆変換 X S Lシート 1 6のフアイル名等を指定することで（ステップ S 2 0 1 ) 、当該逆変換 X S Lシート 1 6を用いて、実質的に図 6のステップ S 1 3〜 S 1 8の処理（ステップ S 1 7の処理は図 9の処理）に相当する処理が実行されることになる（ステップ S 2 0 2 ) 。次に、以下、図 2 2を参照して、変換仕様 XML文書 2 2を作成する手順について説明する。

図 2 2に示すように、変換仕様 XML文書 2 2の作成手順は、まず、レコードの要素名をく record>要素で指定する（ステップ S 2 1 1 ) 。

次に、く items>の下のく merging_tag〉要素で、新要素名（C S V要素名）を指定する（ステップ S 2 1 2 ) 。その際、第 3の実施例の場合であって、上記非定型 C S V要素を指定する場合には、く mer_ging_t_a g〉タグに format-" unfixed" の属性を付ける。あるいは、第 2、第 3 の実施例において、 1個の非キー要素をまとめる新要素を " rtag" で指定したい場合には、く replacing_tag〉を記述する。

次に、各「item」要素を、レコード内で要素が出現する順に列挙する（ステップ S 2 1 3 ) 。その際、「itemj 要素によって定義する要素が、

· キー要素の場合は、属性 mtag= "_0RG" を指定する。

-非キー要素の場合は、この要素内容を格納すべき C S V要素名を属性 mtagで指定する。

- 1個の非キー要素をまとめる新要素を指定したい場合には、く repl acing— 1:^>で記述した新要素名の何れかを、属性 rtagで指定する。 ■ その要素がレコード内で階層を持つ場合には、その階層を属性 pat hで指定する。

■応用ソフト 3 0中で、非キー要素名を別名で扱いたい場合には、属性 nameで別名を指定する。

•第 2の実施例の場合において、その要素の要素内容が固定的な出現をしないことを指定したい場合には、 format=" unfixed" の属性を付ける。

尚、「レコード内で」という場合には、入力 XML文書 2 1における話であるものとする。

上記のような変換仕様を用いることによって、これに基づいて作成された変換 XM L文書 2 3は、応用ソフト 3 0で扱い易いものとなる図 2 3、図 2 4の、応用ソフト 3 0の ' J Scriptプログラムの一例を示す図である。

尚、図 2 3、図 2 4に示す処理内容は、一般的且つ単純な内容であり、これ自体に特に意味があるわけではないが、以下、図 2 3、図 2 4に示すプログラムの処理内容について概略的に説明しておく。図 2 3、図 2 4のプログラムは、何れも A氏の C S V新要素「連絡」を読出す例であるが、図 2 3は図 1 0に示す変換 XML文書、図 2 4 は図 1 6に示す変換 X ML文書を処理対象としていることから、多少、プログラムの記述が違っている力、その処理の目的はほぼ同じであるので、以下、図 2 4のプログラムについてのみ、概略的に説明する

Step 1 ：ヘッダの付加情報を読取り、 C S V要素に纏められた要素名を分離し、要素名の配列に格納する。

Step 2 ： A氏の非キー要素を纏めた C S V要素「連絡」を読取り、 C.S V要素に纏められた要素の名前を分離し、要素内容の配列に格鈉する。

Step 3 ： C S V要素「連絡」の要素内容を読取り、分離して配列に格納する。

Step 4 ： C S V要素「連絡」の属性として、対応する要素名の順番を読取り、分離して配列に格納する。

Step 5 ： C S V要素「連絡」の要素名順番の配列から読出した順番によって要素名配列を読出し、それを引数とする連想配列の連絡に、対応する C S V要素「連絡」の要素内容を格納する。

尚、図 2 3には、更に、連想配列 assocArray [ "会社電話" ] の要素内容を、 " 1 2 3 " 力、ら " 2 3 4 " に変更する処理が加わっているこれらの例で特徴的なことは、付加情報により変換文書が自己記述的になったため、元文書のレコード項目が増え、 C S V要素に纏める非キー要素が増えたとしても、要素名で要素内容をアクセスしているため、図 2 3、図 2 4のプログラムはそのまま使えることである。このように X M L文書の自己記述性がもたらす柔軟性を引き継ぐようになる。

以上説明したように、本発明は、基本的に、上記先出願の特徴 ·効果に加えて、以下に述べる特徴と備える。

( A ) 応用ソフトが非キー要素を処理対象とする場合の扱い易さについて

上記のように、先出願では、応用ソフトが非キー要素を処理対象とする場合が有り得ることを、想定していない。

本発明では、複数個の C S V要素を同一階層 (例えば、レコード内の第 1階層）に配置し、各非キー要素をこれら複数の C S V要素の何れかに割当てるようにすると共に、その割り当て方は、元の X M L文書の階層構造に関係なく、自由に割り当てることができる。例えば用途に応じて分類した非キー要素を、用途毎に用意された各 C S V要素に格納することができる。これによつて、応用ソフトウエアで、想定外に、非キー要素を用いるデータ処理を行なう必要が生じた場合でも、扱い易いものとなり、更に、非キー要素の数が非常に多くても、 C S V要素数を増やし、 1つの C S V要素に格納する非キー要素数を減らすことにより、必要な C S V要素のみ展開する際に、オーバーへッドを減らすことができる。

( B ) 変換仕様に基づきレコード内要素順序を保存

変換/逆変換後にレコード内の要素の順序を保存するために、変換仕様においてレコード内での要素の順序を定義する。このようにすることで、変換後に順序が不明になっても、逆変換時に順に並べ替えて出力することができ、内容だけでなく、順番も、元通りにすることができる。 ·

( C ) 変換文書の自己記述性

一般的に、 X M L文書は自己記述型であることに特徴がある。先出願では、非定型の X M L文書に関して、各レコード毎、各 C S V要素毎に、逐一、要素名（または短縮文字列）と要素内容との対応関係を、変換後の X M L文書に記述していた。これによつて、逆変換処理の際に、要素名と要素内容とを切り出して、これらを用いて元の非キー要素を復元していた。また、応用ソフトウェアにおいて処理を行なう際に、要素名と要素内容との対応関係が分かる。しかしながら、要素名を記述する場合は冗長となり、冗長とならないように短縮文字列を記述する場合には、別途、要素名と短縮文字列との対応関係を参照する必要があった。

本発明では、変換後の X M L文書において、全てのレコードに共通の定義として、各 C S V要素毎に、その C S V要素に格納し得る全ての要素の要素名、換言すればその C S V要素に係わりレコード内に出現する可能性のある全ての要素の要素名、を出現順に記述した付加情報を与える。

そして、各 C S V要素毎に、その C S V要素に係わる要素の要素内容を順に格納する際に、各レコード毎に、そのレコードにおいてどの要素が記述されていなかったのか示すようにしている。例えば、その要素が記述されていなかった場合には、空要素として、この空要素を他の要素内容と同様に C S V形式で繋ぐようにする。あるいは、例えば、 C S V要素のタグの属性として、 C S V要素内に実際に格納された要素、すなわち実際にそのレコード内に出現した要素の当該 C S V 要素内での出現順番を、 C S V形式で繋いだものを記述する。

上記の通り、付加情報には、出現する可能性のある全ての要素の要素名を、出現順に記述している。よって、この順番に従って、各要素内容と要素名との対応関係が分かる。また、空要素の位置に対応する要素名、または属性に記述されていない出現順番に対応する要素名の要素は、そのレコードに関しては、変換前の X M L文書に記述されていないことが分かる。

このようにすることで、応用ソフトウェアが変換後の X M L文書を用いた処理を実行する際、その付加情報を参照すれば、元文書と同様にデータ処理ができるようになる。また、上記空要素を用いる方法では、更に、 C S V要素のタグの属性を付ける必要がなくなる。また、本例では、逆変換処理の際に、付加情報を参照する必要はない。よつて、応用ソフトウェアでの非キー要素の利用を考えない場合には、付加情報は特に必要ない。

E D I のデータは、 1 レコードで数百〜千項目あり、項目数が多過ぎるので D O M展開に向かない。文書要素を切り出して時系列に流すだけの標準 A P I (S AX : Simple A P I for XML)を用いており、複雑な文書操作が難しくなつている。しかし、数百の要素は一つ一つの応用ソフトでは全部の要素にアクセスすることはない。本発明によれば、応用ソフトの都合に応じて、その処理に用いる非キー要素を含むグループ（新要素）のみを展開できるので、オーバーヘッドが大きくなることを防止し、実用的になる。また、要素の並び順の見た目も保存する完全な可逆変換とすることができる。

また、階層の深い XML文書で、レコード内だけで頻繁に使う要素を、少ない非キー要素数のグループで C S V要素にまとめれば、一階層要素の C S V分解だけで読めるので、読出しが速くなる効果もある。ただし、このやり方は、元の XML応用ソフトのトランスペアレント性を壊すことになるが、 C S Vファイルとして使っていた応用ソフトでの使い方に近くなる。 ·

以上、本発明の実施の形態について説明したが、本発明は、上述した説明の例に限るわけではない。

例えば、上記の例では、非キー要素の要素名、要素内容を、 C S V 形式で繋ぐ際、区切り記号としてコンマを用いて繋いでいる。これは、 C S V (Comma Separated Values)は、本来、コンマを介して、数値や文字列を繋ぐ方法であり、一般的には、区切り記号はコンマに限られる為である。

しかしながら、本発明においては、区切り記号は、コンマに限らないものとする。区切り記号にコンマを用いた場合は、要素内容が金額であって、千の位を表すコンマが数値に付けられる場合は、むしろ、コンマより、 " @" (アットマーク）や" —，，（アンダーバー）を用いることになる。あるいは、めったに出現することがない 2文字の文字列でもいい。文字列中にある区切り記号の文字は、実体参照のような識別できる形に置き換えることになる。例えば、コンマは、 " &CMM ; " と置く。従って、区切り記号は、通常の文字列に、めったに現れない文字/文字列であることが望ましい。

以上述べたように、本発明においては、コンマに限らず、区切り記号/記号列を介して、数値や文字列を繋ぐ方法を、便宜上、 C S V形式と呼ぶことにする。

また、本発明は、非キー要素複数個を幾つかグループごとにまとめて一つずつの要素にし、応用ソフトがデータ処理する間に一括して扱えるようにする方法である。

このため、非キー要素の要素名を C S V形式に繋いで、新要素の要素名に置く力、属性に置くかを選ぶことができる。また、非キー要素の要素内容を C S V形式に繋いで、新たな要素の属性に置く力要素内容に置くかを選ぶことができる。これらは、データ量や、データ処理の際に新たな要素が幾つ増えるかに関係するが、非キー要素複数個をグループごとにひとまとめにして扱うという本発明の本質からは、新要素の属性、要素内容のどこに置く力、どの方法でも採り得る。本発明の変換文書中で、 )変換仕様または逆変換ソフトと、（b) C S V要素にまとめられた要素の情報を指定した。これらの情報は、元の文書にはなかったものなので、変換文書中にリンクを付けて外部ファイルとして与えてもいい。また、元の文書とは別の情報であるので、変換文書に置くときには、特別な名前空間（namespace)を付して識別できるようにしてもよい。

次に、以下、本発明の第 4の実施例について説明する。

上述した通り、第 2、第 3の実施例では、非定型の構造化文書に対応して、 C S V要素に纏めた要素も後で応用ソフトが使えるように、用途ごとに複数の C S V要素を定義して要素内容を格納していた。また、要素名は、ヘッダの付加情報との対応関係を示すだけに留め、各レコードには要素名は入らないので、 XML文書の展開時のノード数を減らすことができ、メモリ使用量の削減、展開時間の短縮は図れる効果があった。また、変換仕様の XML文書に逆変換時の要素の並び順を指定しており，変換 XML文書の要素の並び順を保存して復元できる効果があった。

ところで、非定型 XML文書には、上記図 1 0に示した例のように非定型要素がレコードの一部分にしか現れないタイプ以外にも、例えば図 2 5に示す製品リストの XM L文書の例のように、レコード（部品）の種類によってレコード項目が入れ替わるために、非定型要素がレコードの大部分を占めるタイプ（表形式では表現が困難なタイプ）がある。

図 2 5に示す非定型 XM L文書の例は、製品カタログの例であり、 <部品 >が 1つのレコードを示し、その属性 "種類" によつてそのレコード（部品）の種類を定義している。この例では、 "C P U" 、 " ハードディスク" 、 "メモリ " の 3種類である。そして、部品の種類 = "C P U" に係わるレコード項目（要素）のタグ名は、商品名、型番、 C P U、クロック、キャッシュ容量である。部品の種類 = "ハードディスク" に係わるレコード項目のタグ名は、商品名、型番、ディスク容量、転送速度、回転数である。部品の種類 = "メモリ " に係わるレコード項目のタグ名は、商品名、型番、メモリ容量、ベースク口ック、電源電圧となっている。

このように、図 2 5に示す非定型 XML文書の例では、レコード（部品）の種類によってレコード項目が大きく異なっている。つまり、非定型要素が大部分を占めるようになつている。

図 2 5に示す例のような非定型 XM L文書に対して上記第 2の実施例の手法を適用した場合の変換仕様 XM L文書 2 2を図 2 6に示し、この変換仕様 XML文書 2 2を用いて図 2 5の非定型 XML文書を変換した結果である変換 X ML文書 2 3を図 2 7に示す。

図 2 6に示す変換仕様 XM L文書 2 2.の例では、レコード（部品）の種類 " C P U" 、 "ハードディスク" 、 "メモリ " の全てに共通する要素である「商品名」と「型番」はキー要素とし、これら以外の要素を非キー要素とすると共にその全てに format = " unfixed"の属性を付している。つまり、非キー要素は、全て非定型要素として指定される。また、 C S V要素名（C S V要素のタグ名）を記述する「mer ging_tagj の要素内容は、それぞれ "C P U情報" 、 "HD情報" 、 "メモリ情報" としている。

また、上記各非キー要素に係わる各「item」要素における属性「m tagj では、その非キー要素が関係するレコード（部品）の種類に対応する上記 C S V要素名を指定する。つまり、例えば、非キー要素「ディスク容量」の場合は、属性「m1:_ag」で "HD情報" を指定する。

このように、上記図 2 6の変換仕様 XML文書 2 2では、出現可能な全要素を抱え込むことになる。この為、変換/逆変換時（図 1 3の処理）の処理負荷が大きくなる。つまり、例えば種類 = "ハードディスク " のレコ^ドに対する処理を例にすると、このレコードに関する非キー要素はディスク容量、転送速度、回転数のみであるにも係わらず、他の非キー要素についても処理を実行する為、処理負荷が重くなる。また、その結果、変換 X ML文書 2 3では、図 ² 7に示すように、他の種類、すなわち C P U情報、メモリ情報に係わる非キー要素は、全て空要素として出力される（例えば、 < C P U情報〉，，くノ C P U情報 >) ので、無駄に情報量が増えることになる。つまり、全部が空要素の C S V要素が含まれてしまい、要素数が効果的に削減できない。

一方，逆変換時（図 1 4の処理）には，非キー要素に関しては、出現可能な全要素の中から要素内容のある要素のみ出力し、空の要素内容の要素は出力を止める処理を行う為、出現可能な全要素の要素内容の有無の検査が必要となるので、やはり、処理負荷が増大する。上記の例では、レコードの種類は 3種類であつたが、種類が増えれば増えるほど、処理負荷は増大していく。

このようなタイプの非定型 XM L文書に対して、第 4の実施例では、以下に説明する 2つの手法を提案する。

まず、第 4の実施例（'その 1 ) について説明する。

第 4の実施例（その 1 ) では、主に、変換 XM L文書に無駄な記述、すなわち全部が空要素の C S V要素が含まれないようにする。第 4の実施例（その 2 ) では、これに加えて更に、変換/逆変換時の処理負荷を軽減する。

まず、第 4の実施例（その 1 ) について説明する。

本例では、図 2 8に示す変換仕様 XML文書を用いる。

図 2 8に示す変換仕様 XM L文書を、図 2 6 と比較すると、その違ヽ【ま、「 merging一 tag」要素 ίこお!/、て format:" unfixed" の属个生を付している点である。

X S L変換部 1 3がこの変換仕様 XM L文書を用いて作成する変換 X S Lシート 1 5の一例を図 2 9、図 3 0に示す。また、本例による変換 XM L文書 2 3の一例を図 3 1に示す。

尚、図 2 9、図 3 0は、 1つの変換 X S Lシートを 2つに分けて示しているだけであり、変換 X S Lシートの前半部分を図 2 9に、後半部分を図 3 0に示している。

図 2 8に示す変換仕様 XM L文書を用いて変換処理を行った場合、基本的には第 2の実施例と略同様の処理を行うことになるが、図 1 3 のステップ S 8 1の処理が異なる。すなわち、上記の通り、図 2 8に示す変換仕様 XML文書では、「merging_tag」要素に format=" unf ixed" の属性を付してある。既に説明してあるように、例えばステツプ S 7 3の処理では、キー要素に関する「item」要素のタグに、 for mat=" unfixed" の属性が付いており、且つ入力 XML文書 2 1においてこのキー要素が記述されていない場合には、このキー要素はコピ一して出力する処理は行わないようにする。本例では、これと同様に、ステップ S 8 1 (こおレヽて、「merging_tag」要素（こ f ormat=" unfix ed" の属性を付してあり、且つステップ S 8 0の処理結果（要素内容を C S V形式で繋ぐ）が全て空要素であった場合には、ステップ S 8 1の処理を行わないようにする。つまり、ステップ S 7 8〜S 8 0の処理、すなわち要素内容を C S V形式で繋ぐ処理は行うものの、これを変換 XML文書に出力しないようにする。

変換 X S Lシートでは、図 3 0における i f t e s t文、例えば <xsl： if test= "not ($cnt01=$emp0l) " >

が、この処理に相当する。

これによつて、変換 X ML文書は、図 3 1に示すように、無駄な記述、すなわち全部が空要素の C S V要素が含まれないようになる。

しかしながら、この方法では、上記の通り、変換 XML文書に出力しないものであっても、一旦要素内容を C S V形式で繋いだ後で要素内容が全て空かどうかのチェックする処理を行うので、無駄な処'理が発生する。つまり、上記処理負荷が増大するという問題が十分に解消されていない。

これは逆変換についても同様である。図 3 2、図 3 3に逆変換 X S Lシートの例を示す。尚、図 3 2、図 3 3は、 1 つの変換 X S Lシートを 2つに分けて示しているだけであり、逆変換 X S Lシートの.前半部分を図 3 2に、後半部分を図 3 3に示している。

図 3 2は、レコード部分以外の処理であるので、特に説明しない。図 3 3に示す通り、逆変換時においては、各 C S V要素毎に C S V 形式で纏めた各非キー要素内容を、く variable>によって変数 "var0101 " 〜 "var0303" に代入する。その際、要素内容が存在しない（空要素）ものについては NU L Lが入る。

例えば、図 2 7の文書が逆変換処理対象である場合であって最初のレコード（種類 = "C P U" ) に対する処理を行う場合には、例えば "var0101" には「Pentium 3， 700MHz, 256MB」が代入され、 "varO 102" には「700MHz， 256MB」が代入され、 "var0103" には「256MB J が代入されるが、 "var0201" 〜 "var0303" には NU L Lが入ることになる。

そして、 i f t e s t文によって、各非キー要素毎に、その有無をチェックして出力するか否かを決める。

上記の例では、まず、く GPU>に関しては、

IT test二" substring - before($var010Ί , , )"

によって、 "var0101" に代入されている「Pentium 3， 700MHz, 25 6MB」において最初のカンマ（， ) の前には Pentium 3がある、つまり NU L L (空要素）ではないので、 Pentium 3が出力されることになる。

くクロック〉に関しても、同様に、 "var0102" に代入されている「7 00MHz, 256MB」において最初のカンマ（，）の前にある 700MHzが出力されることになる。

くキャッシュ容量〉に関しては、 "var0103" には「256MB」が代入されているので、これを出力することになる。

一方、くディスク容量〉〜く電源電圧〉については、変数 "var0201" 〜 "var0303" には N U L Lが代入されているので、出力しないことになる。

尚、 if test, substring— before等は、 XSLTにおいて一般的に知られているものであり、後にまとめて簡単に説明してある。

上記のような処理を行う為、該当するレコード種類以外のレコード項目は無駄にチェックを行う必要があり、処理の高速化を図ることはできない。

これに対して、第 4の実施例（その 2 ) では、例えば図 3 4に示す '変換仕様 XM L文書では、レコードの種類ごとに入れ替わるレコード項目（要素）をそれぞれ分けて並べるとともに、切り替わる条件を付けることによって、変換/逆変換時にその条件によって要素並びを切り替えることで、非定型要素の無駄な有無チェックを除くものであるつまり、図 3 4に示す変換仕様 XM L文書 4 0では、レコードの種類ごとに出現する要素を分けて指定するようにしており、レコード種類ごとのレコード項目のリストく items>は "when"属性の条件付で切り替えるようにしている。 "when"属性の属性値は、そのまま変換/逆変換用 X S Lシートに記述される切り替え条件として利用される。このため、この属性値は X S Lシートの条件式に則って記述される。つまり、変換/逆変換用 X S Lシートのプログラム言語の表記法に合わせて、変換仕様 XML文書 4 0における切り替え条件を記述することになる。

逆に、この属性値がそのまま変換/逆変換用 X S Lシートに反映されるので、複数個の要素内容、属性値の AND、 ORを取った複雑な条件指定も可能となる。

図 3 4に示す変換仕様 XM L文書を用いて変換 Z逆変換処理を行うと、全体の処理フローは図 6又は図 7 と同じであるが、そのステツプ S 1 7又はステップ S 2 8の処理の詳細は、図 3 5の処理となり、更に図 3 5のステップ S 3 0 2の詳細フローを図 3 6〜図 3 9に示す。変換処理は、図 3 6又は図 3 7、逆変換処理は図 3 8又は図 3 9 を行う。

図 3 6〜図 3 9の処理は、図 8、図 1 3、図 9、図 1 4の処理とほぼ同じであるが、異なる点は、 "変換仕様中の" 力 S "レコード項目リスト中の" に代わっている点である。つまり、図 3 5のステップ S 3 0 1の処理によって、変換仕様 XML文書 4 0中の各レコード項目リスト 4 1、 4 2、 4 3の中から、処理対象のレコードに該当するレコード項目リストが選択されるので、ステップ S 3 0 2の処理では、変換仕様 XML文書 4 0の全てを用いることなく、選択されたレコード項目リストのみを用いるので、 "変換仕様中の" 力 S "レコード項目リスト中の" に代わることになる。

例えば、処理対象が図 2 5の X M L文書中の部品種類が "ハ一ドデイスク" のレコードである場合には、ステップ S 3 0 1 において変換仕様 XML文書 4 0中のレコード項目リスト 4 2が選択されることになる。よって、選択されたレコード項目リスト 4 2についてのみ図 8、図 1 3、図 9、図 1 4の処理を行うこと、すなわち図 3 6〜図 3 9の処理を行うことにより、処理対象のレコードには関係のない要素についてまで無駄な処理を行う、ということが無くなり、処理効率が向上し、処理負担が軽減される。

尚、図 8、図 9は、第 1の実施例、すなわち定型 XML文書に係わる処理であるが、本例では選択したレコード項目リスト 4 2内には f ormat=" unfixed" となる要素、つまり "固定的な出現をしない" 要素は存在しないので、第 1の実施例の処理を流用しても構わないことになる。但し、これは一例であり、選択したレコード項目リスト 4 2 内に format = " unfixed" となる要素が存在する構成であってもよレヽ。この場合、変換 XM L文書には、第 2の実施例のように空要素を出力してもよいし、第 3の実施例のように属性に出願順番を記述する出力形式であってもよい。

また、当然、 X S L変換部 1 3が、図 3 4に示す変換仕様 XML文書に基づいて、図 4 0 ( a ) のステップ S 3 9 1、 S 3 9 2、図 4 0 ( b ) のステップ S 4 0 1、 S 4 0 2の処理によって、変換 X S Lシート 1 5、逆変換 X S Lシート 1 6を作成し、これらを用いて、変換 /逆変換処理を実行するようにしてもよい。

X S L変換部 1 3による処理は、基本的には X S Lの仕様に合わせて置き換えを行うだけであるので特に説明しないが、例えば変換 X S Lシート 1 5生成処理は、図 3 4、図 4 1に示す例では、図 3 4の変换仕様 XML文書において items要素が出てくる毎に、その when属性の内容（最初のレコードでは "@種類 = ' C P U' " を、そのまま、 <xsl :when test=に当て嵌めればよい。 item要素において属性 mtagで

"_0RG" が指定されているものは、その要素内容を、く xsl:co_Py - of select =に当て嵌めればよい。 item要素において属性 mtagで C S V要素名が指定されているものは、その要素内容を、 concatによって連結すればよレ、。

図 4 2に示す逆変換 X S Lシートについても、同様であり、 varia ble、 copy- of、 value- of等の予め用意されているテンプレートに対して、変換仕様 XM L文書の nierging_ta_g要素、 item要素の属性（ "― 0 RG" や C S V要素名）に応じて、その要素内容（C P U情報、商品名、型番、 C P U、クロック、キャッシュ容量等）を当て嵌めていけばよい。勿論、 variable文、 copy- of文の数は、それぞれ、変換仕様' X ML文書にある非キー要素、キー要素の数に応じたものとする。

そして、変換時には、図 4 0 ( c ) に示すように、処理対象となる入力 XM L文書 2 1 とこれに対応する変換 X S Lシート 1 5のファィル名等を指定することで（ステップ S 4 1 1 ) 、当該変換 X S Lシート 1 5を用いて、実質的に図 7のステップ S 2 3〜 S 2 9の処理（ステップ S 2 8の処理は図 3 5 と更に図 3 6又は図 3 7の処理）に相当する処理が実行されることになる（ステップ S 4 1 2 ) 。

同様に、逆変換処理を行なう場合には、図 4 0 ( d ) に示すように、処理対象となる変換 X M L文書 2 3 (抽出）：^]^文書 2 4 ) とこれに対応する逆変換 X S Lシート 1 6のファイル名等を指定することで（ステップ S 4 2 1 ) 、当該逆変換 X S Lシート 1 6を用いて、実質的に図 6のステップ S 1 3〜 S 1 8の処理（ステップ S 1 7の処理は図 3 5 と更に図 3 8又は図 3 9の処理）に相当する処理が実行されることになる（ステップ S 4 2 2 ) 。図 4 0 ( a ) 、 ( b ) の処理によって作成される変換 X S Lシート 1 5、逆変換 X S Lシート 1 6の一例を図 4 1、図 4 2に示す。尚、図 4 1においてはその前半部分は図 2 9 と同じであるので省略して示している。同様に、図 4 2においてはその前半部分は図 3 2 と同じであるので省略して示している。

図 4 1、図 4 2では、図 3 4の変換仕様 XM L文書中のく items>で示したレコード種類ごとの要素並びが、く choose> -く when><otherwise> の条件によって切り替えられる形式となる。く choose>、く when>、 <ot herwise>については X S L Tスタイルシートのプログラムとしてよく知られているので、ここでは特に詳細には説明しないが、簡単に説明するならば、く choose>は X S L Tにおいて複数の条件を選択して処理する為に用いられるものであり、く choose〉I¾:においてく when>¾i^、須、〈otherwise ま任意の要素である。 X S L Tプロセッサは、 xsl:wh enを順番に評価していき、 xsl:whenの test属性の値が真となる最初の x sl:when要素のテンプレートのみを処理する。もし該当する xshwhen要素が 1つもない場合には、 xsl:otherwise要素のテンプレートを処理するが、これは上記の通り必須要素ではないので、無くても構わなレ、。他の X S L Tプログラム関数についても、同様に、よく知られているので、ここでは特に詳細には説明しないが、簡単に説明するならば、く value - of select>によって指定したタグ名の要素の要素内容を X M L文書から取り出すことができる。また、く variable は変数の定義を行う。変数の値を参照するときは、変数名の頭に " $ " を付ける。く concat>は文字列を繋げて 1つの文字列を作るものとして知られている。く copy - of select>は、く value - of select>力《指定されたノードの値を文字列として出力するのに対して、ノードを子要素も含めてそのままコピーして出力する。く if test>を用いると、単純な if-then (〜に該当すれば〜を実行する）型の条件処理を行う。文字列の中で特定の文字以降を抜き出すためにはく substring- after>を使用する。文字列の中で特定の文字より前を抜き出すためにはく substring- before>を使用する。 "@" は属性、 "@ *" は全ての属性を意味する。

図 4 1、図 4 2において、上記の通り、切り替え条件であるく when >の test属性値の評価式（例えば "@種類 = ' C P U ' " 等）は、変換仕様 XML文書中で指定したく items>の when属性値の評価式を、そのまま使う。これによつて，複数個の要素/要素内容/属性/属性値の AND/O R等の複雑な条件指定が可能になる。

最後に、図 3 4の変換仕様 XM L文書の作成フローを図 4 3に示す図 4 3において、まず、レコードの要素名をく record〉要素で指定する（ステップ S 4 3 1 ) 。次に、全てのレコード項目リストを記述するまで（ステップ S 4 3 2 ) 、ステップ S 4 3 3〜 S 4 3 5の処理を繰り返し実行する。

すなわち、まず、レコード要素リストの条件を指定する（ステップ S 4 3 3 ) 。これは、レコード項目リスト要素く item>を記し、そのレコード項目リストの条件を、く items>の属性 whenに、 X S L表記で記述する。

次に、 C S V要素の指定を行う（ステップ S 4 3 4 ) 。これは、く items>の下のく merging_tag〉要素によって C S V要素名を指定する。その際、 format=" unfixed" の属性を付ける。

最後に、レコード項目の指定を行う（ステップ S 4 3 5 ) 。これは、く merging— tag〉の次にく item〉要素を並べ、レコード内の要素力 ^s出現する順にレコード内要素の要素名を列挙する。属性を対象とする場合は、く item>の要素内容として属性を識別する "@" に続けて属性名を指定する。キー要素の場合は、属性 mtag= "—ORG" を指定する。非キ一要素の場合、属性 ratagで何れかの C S V要素名を指定する。各要素が非定型ならば、属性 format= "unfixed" で指定する。その要素がレコード内で階層を持つ場合は、その階層を属性 pathで指定する。図 4 4は、本実施の形態による構造化文書変換方法を実現するコンピュータのハードウエア構成の一例を示す図である。

同図に示すコンピュータ 1 0 0は、 C P U 1 0 1、メモリ 1 0 2、入力装置 1 0 3、出力装置 1 0 4、外部記憶装置 1 0 5、媒体駆動装置 1 0 6、ネットワーク接続装置 1 0 7等を有し、これらがバス 1 0 8に接続された構成となっている。同図に示す構成は一例であり、これに限るものではない。

C P U 1 0 1は、当該コンピュータ 1 0 0全体を制御する中央処理装置である。

メモリ 1 0 2は、プログラム実行、データ更新等の際に、外部記憶装置 1 0 5 (あるいは可搬型記録媒体 1 0 9 ) に記憶されているプログラムあるいはデータを一時的に格納する R AM等のメモリである。 C P U 1 0 1は、メモリ 1 0 2に読み出したプログラム/データを用いて、上述してある各種処理、機能（図 6〜図 9、図 1 3〜図 1 4、図 1 7〜図 1 9等に示す処理等や、図 2に示す各機能部の機能）を実現する。尚、データとは、上記各種 XML文書、 X S Lシート等である。

入力装置 1 0 3は、例えばキーボード、マウス、タツチパネル等である。出力装置 1 0 4は、例えばディスプレイ、プリンタ等である。

外部記憶装置 1 0 5は、例えば磁気ディスク装置、光ディスク装置

、光磁気ディスク装置等であり、上記本発明の各種機能を実現させる為のプログラム/データ等が格納されている。

媒体駆動装置 1 0 6は、可搬型記録媒体 1 0 9に記憶されているプログラム/データ等を読み出す。可搬型記録媒体 1 0 9は、例えば、

F D (フレキシブルディスク）、 CD_R OM、その他、 DVD、光磁気ディスク等である。

ネットワーク接続.装置 1 0 7は、ネットワークに接続して、外部の情報処理装置とプログラム Zデータ等の送受信を可能にする構成でめる。

図 4 5は、上記プログラム等を記録した記録媒体、ダウンロードの一例を示す図である。

図示のように、上記本発明の機能を実現するプログラム/データが記憶されている可搬型記録媒体 1 0 9から情報処理装置 1 0 0側に読み出して、メモリ 1 0 2に格納し実行するものであってもよいし、また、上記プログラム/データは、ネットワーク接続装置 1 0 7により接続しているネットワーク（インターネット等）を介して、外部のサーバ 1 1 0の記憶部 1 1 1 に記憶されているプログラム/データをダウンロードするものであってもよレヽ。

また、本発明は、装置/方法に限らず、上記プログラム/データを格納した記録媒体（可搬型記録媒体 1 0 9等）自体として構成することもできるし、上記プログラム自体として構成することもできる。産業上の利用の可能性以上、詳細に説明したように、本発明の構造化文書変換/逆変換方法、そのシステム/装置、プログラム等によれば、レコード内の要素を、応用ソフトで扱うキー要素と、それ以外の非キー要素に分けて、キー要素はそのままとし、非キー要素は c S V形式で繋ぐように変換することで、変換後の X M L文書を既存の応用ソフトで利用可能とすると共に、.汎用の方法としてデータ処理のメモリ使用量、処理時間を削減することができると共に、更に、応用ソフトで非キー要素を扱う事態が生じた場合でもオーバーッドが大きくなることなく、あるいは逆変換結果が元の X M L文書の要素の並びの順となり、あるいは非定型文書においてレコード数が多い場合、非キー要素の要素数が多い場合でも、冗長になることなく、変換後でも自己記述性を維持できるようになる。

Claims

請求の範囲

1 . 定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義し、変換対象の構造化文書内の各要素について、レコード内で出現する順に、データ処理の対象となるキ要素であるか否かを指定すると共に、該キ一要素以外の要素である各非キー要素を、前記複数の新要素の何れに割り当てるかを定義した変換仕様定義手段と、

該変換仕様定義手段によつて定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書内の各要素を、前記レコード内で出現する順に、前記キー要素はそのまま変換後の構造化文書に記述し、前記各非キ一要素に関しては、その要素内容を、該当する前記新要素毎に C S V 形式でまとめたものを各新要素の要素内容として変換後の構造化文書に記述する構造変換手段と、

を有することを特徴とする構造化文書の構造変換装置。

2 . 前記変換仕様定義手段で定義される変換仕様に基づいて前記変換後の構造化文書を元の構造化文書に戻すために、該変換仕様定義手段において前記出現順に定義されている各要素について、順次、その要素に該当する新要素を求め、該新要素について前記 C S V形式でまとめた各要素内容の中から、その順番に応じて該要素に対応する要素内容を求めて前記元の構造化文書に記述する逆変換手段、

を更に有することを特徴とする請求項 1記載の構造化文書の構造変換装置。

3 . 前記構造変換手段は、更に、前記新要素毎に、前記 C S V形式でまとめた各要素内容に対応する要素名を、 C S V形式でまとめたものを、付加情報として変換後の構造化文書に記述することを特徴とする請求項 1記載の構造化文書の構造変換装置。

4 . 非定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義し、変換対象の構造化文書内に出現し得る全ての要素について、全て出現する場合の出現順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である非キー要素を、該複数の新要素の何れに割り当てるかを定義した変換仕様定義手段と、 .

該変換仕様定義手段によつて定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書内の各要素を、前記レコード内で出現する順に、前記キー要素はそのまま変換後の構造化文書に記述し、前記各非キ一要素に関しては、前記変換対象の構造化文書に出現する要素はその要素内容を、前記変換対象の構造化文書に出現しない要素の要素内容は空要素として、該当する前記新要素毎に C S V形式でまとめたものを各新要素の要素内容として変換後の構造化文書に記述する構造変換手段と、

を有することを特徴とする構造化文書の構造変換装置。

5 . 前記変換仕様定義手段で定義される変換仕様に基づいて前記変換後の構造化文書を元の構造化文書に戻すために、該変換仕様定義手段において前記出現順に定義されている各要素について、順次、その要素に該当する新要素を求め、該新要素について前記 C S V形式でまとめた各要素内容の中から、その順番に応じて該要素に対応する要素内容を求めて前記元の構造化文書に記述する際に、該要素内容が前記空要素である要素は記述しない逆変換手段、

を更に有することを特徴とする請求項 4記載の構造化文書の構造変換装置。

6 . 変換仕様定義手段は、更に、前記各要素毎に、前記変換対象の構造化文書内で必ず出現するとは限らない要素である非定型要素であるか否かを指定し、

前記キー要素は、該非定型要素であって且つ前記変換対象の構造化文書内に記述されていない場合には、変換後の構造化文書に何も記述しないこと.を特徴とする請求項 4記載の構造化文書の構造変換装置。

7 . 非定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義すると共に、該各新要素毎にその新要素が非定型要素であるか否かを指定し、変換対象の構造化文書内の各要素について、該構造化文書内に出現し得る全ての要素について、全て出現する場合の出現順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である非キー要素を、前記複数の新要素の何れに割り当てるかを定義する変換仕様定義手段と、該変換仕様定義手段によって定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書内の各要素を、前記レコード内で出現する順に、前記キー要素はそのまま変換後の構造化文書に記述し、前記各非キ一要素に関しては、前記新要素毎に、該新要素が前記非定型要素ではない場合には出現した要素の要素内容を出現順に C S V形式でまとめたものを該新要素の要素内容として変換後の構造化文書に記述し、該新要素が前記非定型要素である場合には、出現した要素の要素内容を出現順に C S V形式でまとめたものを該新要素の要素内容とすると共に該出現順番を C S V形式でまとめたものを該新要素のタグの属性値として変換後の構造化文書に記述する構造変換手段と、

を有することを特徴とする構造化文書の構造変換装置。

8 . 前記変換仕様定義手段で定義される変換仕様に基づいて前記変換後の構造化文書から任意の構造化文書に変換するために、該変換仕様定義手段における前記出現順に各要素について、該要素に該当する新要素を求め、該新要素が前記非定型要素である場合には、該新要素の前記属性値として該要素の出現順番が記述されている場合に、該要素に対応する要素内容を前記元の構造化文書に記述する逆変換手段、

を更に有することを特徴とする請求項 7記載の構造化文書の構造変換装置。

9 . 前記構造変換手段は、更に、前記新要素毎に、その新要素内に要素内容を記述し得る全ての要素の要素名を C S V形式でまとめたものを、付加情報として変換後の構造化文書に記述することを特徴とする請求項 4または 8記載の構造化文書の構造変換装置。

1 0 . 前記変換仕様定義手段は、更に、変換対象の構造化文書における任意の階層の任意の要素名に関して、該階層の指定まで含めた要素名に対応付けた別名を与える定義を行い、

前記構造変換手段は、前記付加情報として記述する要素名を該別名とすることを特徴とする請求項 9記載の構造化文書の構造変換装置。

1 1 . 前記変換仕様定義手段によって定義される変換仕様を反映した変換用スタィルシートを生成し、

前記構造変換手段は、該変換用スタイルシートを用いて前記変換を実行することを特徴とする請求項 1〜 1 0の何れかに記載の構造化文書の構造変換装置。

1 2 . 前記変換仕様定義手段によって定義される変換仕様を逆に反映した逆変換用スタイルシートを生成し、

前記逆変換手段は、該逆変換用スタイルシートを用いて前記逆変換を実行することを特徴とする請求項 2， 5， 8の何れかに記載の構造化文書の構造変換装置。

1 3 . 定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義し、該変換対象の構造化文書内の各要素について、レコ一ド内で出現する順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である各非キー要素を、前記複数の新要素の何れに割り当てるかを定義した変換仕様定義文書に基づいて、

変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書内の各要素を、前記レコード内で出現する順に、

前記キー要素はそのまま変換後の構造化文書に記述するステップと、

前記各非キー要素に関しては、その要素内容を、該当する前記新要素毎に C S V形式でまとめたものを各新要素の要素内容として変換後の構造化文書に記述するステップと、

を有することを特徴とする構造化文書の構造変換方法。

1 4 . 非定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義し、変換対象の構造化文書内に出現し得る全ての要素について、全て出現する場合の出現順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である非キー要素を、該複数の新要素の何れに割り当てるかを定義した変換仕様定義文書に基づいて、

変換対象の構造化文書内の各要素を、前記レコード内で出現する順に、

前記キー要素はそのまま変換後の構造化文書に記述するステツプと、

前記各非キー要素に関しては、前記変換対象の構造化文書に出現する要素はその要素内容を、前記変換対象の構造化文書に出現しない要素の要素内容は空要素として、該当する前記新要素毎に C S V形式でまとめたものを各新要素の要素内容として変換後の構造化文書に記述するステップと、

を有することを特徴とする構造化文書の構造変換方法。

1 5 . 非定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義すると共に、該各新要素毎にその新要素が非定型要素であるか否かを指定し、変換対象の構造化文書内の各要素について、該構造化文書内に出現し得る全ての要素について、全て出現する場合の出現順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である非キー要素を、前記複数の新要素の何れに割り当てるかを定義する変換仕様定義文書に基づいて、

該変換対象の構造化文書内の各要素を、前記レコード内で出現する順に、

前記各非キー要素に関しては、前記新要素毎に、該新要素が前記非定型要素ではない場合には、出現した要素の要素内容を出現順に C S V形式でまとめたものを該新要素の要素内容として変換後の構造化文書に記述するステップと、

該新要素が前記非定型要素である場合には、出現した要素の要素内容を出現順に C S V形式でまとめたものを該新要素の要素内容とすると共に該出現順番を C S .V形式でまとめたものを該新要素のタグの属性値として変換後の構造化文書に記述するステップと、

を有することを特徴とする構造化文書の構造変換方法。

1 6 . コンピュータに、

定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義し、該変換対象の構造化文書内の各要素について、レコード内で出現する順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である各非キー要素を、前記複数の新要素の何れに割り当てるかを定義した変換仕様定義文書に基づいて、

変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書内の各要素を、前記レコード内で出現する順前記キー要素はそのまま変換後の構造化文書に記述するステップと、

を実現させるためのプログラム。

1 7 . コンピュータに、非定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義し、変換対象の構造化文書内に出現し得る全ての要素について、全て出現する場合の出現順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である非キー要素を、該複数の新要素の何れに割り当てるかを定義した変換仕様定義文書に基づいて、

を実現させるためのプログラム。

1 8 . コンピュータに、

非定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義すると共に、該各新要素毎にその新要素が非定型要素であるか否かを指定し、変換対象の構造化文書內の各要素について、該構造化文書內に出現し得る全ての要素について、全て出現する場合の出現順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である非キー要素を、前記複数の新要素の何れに割り当てるかを定義する変換仕様定義文書に基づいて、該変換対象の構造化文書内の各要素を、前記レコード内で出現する順に、

前記キー要素はそのまま変換後の構造化文書に記述するステツプと.、

前記各非キー要素に関しては、前記新要素毎に、

該新要素が前記非定型要素ではない場合には、出現した要素の要素内容を出現順に C S V形式でまとめたものを該新要素の要素内容として変換後の構造化文書に記述するステップと、

該新要素が前記非定型要素である場合には、出現した要素の要素内容を出現順に C S V形式でまとめたものを該新要素の要素内容とすると共に該出現順番を C S V形式でまとめたものを該新要素のタグの属性値として変換後の構造化文書に記述するステップと、

を実現させるためのプログラム。

1 9 . コンピュータに、

を実現させるプログラムを記録した前記コンピュータ読取り可能な記録媒体。

2 0 . コンピュータに、

非定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義し、変換対象の構造化文書内に出現し得る全ての要素について、全て出現する場合の出現順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である非キー要素を、該複数の新要素の何れに割り当てるかを定義した変換仕様定義文書に基づいて、

2 1 . コンピュータに、

非定型の構造化文書に対応して、変換後の構造化文書における新要素を複数定義すると共に、該各新要素毎にその新要素が非定型要素であるか否かを指定し、変換対象の構造化文書内の各要素について、該構造化文書内に出現し得る全ての要素について、全て出現する場合の出現順に、データ処理の対象となるキー要素であるか否かを指定すると共に、該キ一要素以外の要素である非キー要素を、前記複数の新要素の何れに割り当てるかを定義する変換仕様定義文書に基づいて、該変換対象の構造化文書内の各要素を、前記レコード内で出現する前記キー要素はそのまま変換後の構造化文書に記述するステップと、

前記各非キー要素に関しては、前記新要素毎に、

2 2 . レコードの種類毎にそのレコードを構成する要素が異なる非定型の構造化文書に対応して、レコードの種類毎にレコード項目リストを定義するものであって、該各レコード項目リストは、そのレコ一ド種類に出現し得る全ての要素について、データ処理の対象となるキー要素であるか否かを指定すると共に、変換後の構造化文書における新要素を 1以上定義して、前記キー要素以外の要素である非キー要素を、どの新要素に割り当てるかを指定する変換仕様定義手段と、該変換仕様定義手段によって定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書中の各レコード毎に、そのレコードの種類に応じたレコード項目リストを前記変換仕様定義手段から選択し、該選択したレコード項目リストに基づいて、前記レコード内の各要素をレコ一ド内で出現する順に、前記キー要素はそのまま変換後の構造化文書に記述し、前記各非キー要素に関しては、該当する前記新要素毎に C S V形式でまとめたものを各新要素の要素内容として変換後の構造化文書に記述する構造変換手段と、

を有することを特徴とする構造化文書の構造変換装置。

2 3 . 前記各レコード項目リストには、そのレコード項目リストを選択させる為の切り替え条件が更に記述され、

前記構造変換手段は、該切り替え条件を用いて、処理対象のレコードの種類に応じたレコード項目リストを選択することを特徴とする請求項 2 2記載の構造変換装置。

2 4 . レコードの種類毎にそのレコードを構成する要素が異なる非定型の構造化文書に対応して、レコードの種類毎にレコード項目リストを定義するものであって、該各レコード項目リストは、そのレコード種類に出現し得る全ての要素について、データ処理の対象となるキー要素であるか否かを指定すると共に、変換後の構造化文書における新要素を 1以上定義して、前記キー要素以外の要素である非キー要素を、どの新要素に割り当てるかを指定する変換仕様定義文書に基づいて、

該変換仕様定義文書によって定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書中の各レコード毎に、そのレコードの種類に応じたレコード項目リストを前記変換仕様定義文書から選択するステップと、

該選択したレコード項目リストに基づいて、前記レコード内の各要素をレコード内で出現する順に、前記キー要素はそのまま変換後の構 '造化文書に記述し、前記各非キー要素に関しては、該当する前記新要素毎に C S V形式でまとめたものを各新要素の要素内容として変換後の構造化文書に記述するステップと、

を有することを特徴とする構造化文書の構造変換方法。

2 5 . コンピュータに、

レコードの種類毎にそのレコードを構成する要素が異なる非定型の構造化文書に対応して、レコードの種類毎にレコード項目リストを定義するものであって、該各レコード項目リストは、そのレコード種類に出現し得る全ての要素について、データ処理の対象となるキー要素であるか否かを指定すると共に、変換後の構造化文書における新要素を 1以上定義して、前記キー要素以外の要素である非キー要素を、どの新要素に割り当てるかを指定する変換仕様定義文書に基づいて、該変換仕様定義文書によって定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書中の各レコード毎に、そのレコードの種類に応じたレコード項目リストを前記変換仕様定義文書から選択するステップと、

該選択したレコード項目リストに基づいて、前記レコード内の各要素をレコード内で出現する順に、前記キー要素はそのまま変換後の構造化文書に記述し、前記各非キー要素に関しては、該当する前記新要素毎に C S V形式でまとめたものを各新要素の要素内容として変換後の構造化文書に記述するステップと、

を実現させるためのプログラム。

2 6 . コンピュータに、

レコードの種類毎にそのレコ'一ドを構成する要素が異なる非定型の構造化文書に対応して、レコードの種類毎にレコード項目リストを定義するものであって、該各レコード項目リストは、そのレコード種類に出現し得る全ての要素について、データ処理の対象となるキー要素であるか否かを指定すると共に、変換後の構造化文書における新要素を 1以上定義して、前記キー要素以外の要素である非キー要素を、どの新要素に割り当てるかを指定する変換仕様定義文書に基づいて、該変換仕様定義文書によって定義される変換仕様に基づいて前記変換対象の構造化文書から変換後の構造化文書を作成するために、該変換対象の構造化文書中の各レコード毎に、そのレコードの種類に応じたレコード項目リストを前記変換仕様定義文書から選択するステップと、