JP2007094971A - 変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 - Google Patents
変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 Download PDFInfo
- Publication number
- JP2007094971A JP2007094971A JP2005286669A JP2005286669A JP2007094971A JP 2007094971 A JP2007094971 A JP 2007094971A JP 2005286669 A JP2005286669 A JP 2005286669A JP 2005286669 A JP2005286669 A JP 2005286669A JP 2007094971 A JP2007094971 A JP 2007094971A
- Authority
- JP
- Japan
- Prior art keywords
- conversion method
- layer
- automatic generation
- elements
- hierarchical structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
【解決手段】対象/記述境界決定部124は、構造化データの階層構造を上位層をなす第1の層と下位層をなす第2の層とに分割するための境界を決定する。変換法生成部125は、上記第1の層を表の行方向及び列方向のうちの一方である第1の方向に対応付け、上記第2の層を上記表の行方向及び列方向のうちの他方である第2の方向に対応付けるための変換法を示す変換法情報を生成する。
【選択図】図2
Description
(1)タグの反復が冗長である
(2)テキストが縦長になる
傾向がある。このため、テキスト形式のXMLデータは、情報項目の構造間の対応関係をユーザが直感的に読み取る(理解する)のには適さない。つまり、テキスト形式のXMLデータは、ユーザにとって決して見やすく且つ理解しやすいものではない。
図1は本発明の一実施形態に係る計算機システムの構成を示すブロック図である。この計算機システムは、計算機10及び当該計算機10と接続される端末(ユーザ端末)20から構成される。本実施形態において端末20は計算機10に直接接続されているものとする。しかし、端末20がネットワークを介して計算機10と接続されていても構わない。
・TAGNAME パスのタグ名を値とする
・TEXT タグの内容テキストを値とする
・CHILD(“名前”) 指定のタグ名を持つ子要素の内容テキストを値とする
・ATTR(“名前”) 指定の名前を持つ属性値を値とする
・“文字列” 指定の文字列を値とする
・null 指定なし(値不要)
のいずれかである。
まず、XMLデータの構造上の一般的な特徴について説明する。ここでは、XMLデータの表形式データへの変換という観点から、構造上の共通性のない情報の集まりを含めたXML一般ではなく、日常の業務ソフトウェアが取り扱うような、定型的項目群からなる情報の集まり、及び、それらを分類する木構造を想定する。このようなXMLデータにおける階層構造は、通常、よりルート要素(ルートノード)に近い(階層的に浅い)要素(ノード)と、ルート要素からより遠い(階層的に深い)要素について、次のように構成されるのが一般的である。
(2)深い層は、浅い層の構成メンバーを表わす
(3)深い層は、浅い層の特徴記述項目の値を記述する。
次に、本実施形態で適用される、XMLを表で表現する仕組みについて、図3及び図4を参照して説明する。図3は、XMLデータの階層構造31の一例を示す。図4は、この階層構造31を保ちながら、XMLデータを表で表現する仕組みを示す。
a:タグ名、b:テキスト、c:特定子要素のテキスト、d:特定属性値、e:定数
のいずれかのデータを用いることができる。
5-1)対象層については、同じ深さの要素のタグ名により、例えば次の優先度
全て異なるとき、 列見出し={e}、 セル値={a}
全て同一のとき、 列見出し={e,a}、セル値={b,c,d,e}
同一セットのとき、列見出し={e,a}、セル値={b,c,d,e}
で値が決定される。ここで{ }内の要素の優先度は、左側の要素ほど高いことを表す。例えば{b,c,d,e}は、b(テキスト)の優先度が最も高く、以下、c(特定子要素のテキスト)、d(特定属性値)、e(定数)の順に優先度が低くなることを表す。
末端のとき、 列見出し={e,a}、セル値={b,c,d,e}
末端でないとき、 列見出し={e,a}、セル値=なし
で値が決定される。
Claims (14)
- 構造化データを表形式データに変換するための変換法を計算機により自動生成する変換法自動生成方法において、
前記構造化データの階層構造を、上位層をなす第1の層と下位層をなす第2の層とに分割するステップと、
前記第1の層を表の行方向及び列方向のうちの一方である第1の方向に対応付け、前記第2の層を前記表の行方向及び列方向のうちの他方である第2の方向に対応付けるための変換法を示す変換法情報を生成する変換法生成ステップと
を具備することを特徴とする変換法自動生成方法。 - 前記分割するステップは、
前記構造化データの階層構造内で同じ深さの要素のうちタグ名が異なる要素の割合が第1のレベル以上となるか、或いは当該同じ深さの要素のうちタグ名が同一の要素の割合が第2のレベル以上となる最大深さを判別する判別ステップと、
前記判別ステップの判別結果に基づいて前記第1の層及び前記第2の層の境界を決定して、前記構造化データの階層構造のルートから前記検出された最大深さまでの層を前記第1の層とし、前記構造化データの階層構造の前記検出された最大深さより深い層を前記第2の層とする境界決定ステップと
を含むことを特徴とする請求項1記載の変換法自動生成方法。 - 前記第1及び第2のレベルを100%としたことを特徴とする請求項2記載の変換法自動生成方法。
- 前記変換法情報は、前記構造化データの階層構造における各パスについて、当該パス、当該パスに対応する見出しをどこから得るかを表す見出し決定法情報及び当該パスに対応するセルの値をどこから得るかを表すセル値決定法情報を含む配列から構成されることを特徴とする請求項2記載の変換法自動生成方法。
- 前記見出し決定法情報及び前記セル値決定法情報は、対応するパスで特定される要素のタグ名、当該要素の内容であるテキスト、当該要素の特定の子要素の内容であるテキスト、当該要素の特定の属性値及び定数のいずれかを指定する請求項4記載の変換法自動生成方法。
- 前記変換法生成ステップは、
前記第1の層内で同じ深さの各要素のタグ名が全て異なる場合、当該各要素に対応付ける見出しを指定する前記見出し決定法情報として前記定数を決定し、当該各要素に対応付けるセルの値を指定する前記セル値決定法情報として当該各要素のタグ名を決定するステップと、
前記第1の層内で同じ深さの各要素のタグ名が全て同じ場合、当該各要素に対応付ける見出しを指定する前記見出し決定法情報として、当該各要素に共通のタグ名及び前記定数のいずれかを予め定められた優先度に従って決定し、当該各要素に対応付けるセルの値を指定する前記セル値決定法情報として、当該各要素のテキスト、当該各要素の特定の子要素のテキスト、当該各要素の特定の属性値及び前記定数のいずれかを予め定められた優先度に従って決定するステップと
を含むことを特徴とする請求項5記載の変換法自動生成方法。 - 前記変換法生成ステップは、
前記第2の層内で子ノードを持たない要素について、当該要素に対応付ける見出しを指定する前記見出し決定法情報として、当該要素のタグ名及び前記定数のいずれかを予め定められた優先度に従って決定し、当該要素に対応付けるセルの値を指定する前記セル値決定法情報として、当該要素のテキスト、当該要素の特定の子要素のテキスト、当該要素の特定の属性値及び前記定数のいずれかを予め定められた優先度に従って決定するステップと、
前記第2の層内で子ノードを持つ要素について、当該要素に対応付ける見出しを指定する前記見出し決定法情報として、当該要素のタグ名及び前記定数のいずれかを予め定められた優先度に従って決定し、当該要素に対応付けるセルの値を指定する前記セル値決定法情報として指定なしを決定するステップと
を含むことを特徴とする請求項5記載の変換法自動生成方法。 - 前記生成された変換法情報を端末に転送して画面表示するステップと、
前記端末に表示された変換法情報をユーザの前記端末の操作に基づいて修正するステップと
を更に具備することを特徴とする請求項1記載の変換法自動生成方法。 - 前記変換法情報の生成に用いられた前記構造化データを当該変換法情報に基づいて表形式データに変換して表形式で出力するステップを更に具備することを特徴とする請求項1記載の変換法自動生成方法。
- 構造化データを表形式データに変換するための変換法を自動生成する変換法自動生成プログラムであって、
計算機に、
前記構造化データの階層構造を、上位層をなす第1の層と下位層をなす第2の層とに分割するステップと、
前記第1の層を表の行方向及び列方向のうちの一方である第1の方向に対応付け、前記第2の層を前記表の行方向及び列方向のうちの他方である第2の方向に対応付けるための変換法を示す変換法情報を生成する変換法生成ステップと
を実行させるための変換法自動生成プログラム。 - 前記分割するステップは、
前記構造化データの階層構造内で同じ深さの要素のうちタグ名が異なる要素の割合が第1のレベル以上となるか、或いは当該同じ深さの要素のうちタグ名が同一の要素の割合が第2のレベル以上となる最大深さを判別する判別ステップと、
前記判別ステップの判別結果に基づいて前記第1の層及び前記第2の層の境界を決定して、前記構造化データの階層構造のルートから前記検出された最大深さまでの層を前記第1の層とし、前記構造化データの階層構造の前記検出された最大深さより深い層を前記第2の層とする境界決定ステップと
を含むことを特徴とする請求項10記載の変換法自動生成プログラム。 - 前記変換法情報は、前記構造化データの階層構造における各パスについて、当該パス、当該パスに対応する見出しをどこから得るかを表す見出し決定法情報及び当該パスに対応するセルの値をどこから得るかを表すセル値決定法情報を含む配列から構成されることを特徴とする請求項11記載の変換法自動生成プログラム。
- 構造化データを表形式データに変換するための変換法を自動生成する変換法自動生成装置において、
前記構造化データの階層構造を上位層をなす第1の層と下位層をなす第2の層とに分割するための境界を決定する境界決定手段と、
前記第1の層を表の行方向及び列方向のうちの一方である第1の方向に対応付け、前記第2の層を前記表の行方向及び列方向のうちの他方である第2の方向に対応付けるための変換法を示す変換法情報を生成する変換法生成手段と
を具備することを特徴とする変換法自動生成装置。 - 前記構造化データの階層構造内で同じ深さの要素のうちタグ名が異なる要素の割合が第1のレベル以上となるかを判別する第1のタグ名判別手段と、
前記構造化データの階層構造内で同じ深さの要素のうちタグ名が同一の要素の割合が第2のレベル以上となるかを判別する第2のタグ名判別手段と
を更に具備し、
前記境界決定手段は、前記同じ深さの要素のうちタグ名が異なる要素の割合が前記第1のレベル以上とならず、且つ当該同じ深さの要素のうちタグ名が同一の要素の割合が前記第2のレベル以上とならない場合に、当該深さを前記境界と決定する
ことを特徴とする請求項13記載の変換法自動生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005286669A JP4189400B2 (ja) | 2005-09-30 | 2005-09-30 | 変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005286669A JP4189400B2 (ja) | 2005-09-30 | 2005-09-30 | 変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007094971A true JP2007094971A (ja) | 2007-04-12 |
JP4189400B2 JP4189400B2 (ja) | 2008-12-03 |
Family
ID=37980582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005286669A Expired - Fee Related JP4189400B2 (ja) | 2005-09-30 | 2005-09-30 | 変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4189400B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013015935A (ja) * | 2011-07-01 | 2013-01-24 | Hitachi Ltd | Xmlファイル構造の復元方法。 |
US11748560B2 (en) | 2020-08-14 | 2023-09-05 | Kyndryl, Inc. | Converting between tabular and structured data formats |
-
2005
- 2005-09-30 JP JP2005286669A patent/JP4189400B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013015935A (ja) * | 2011-07-01 | 2013-01-24 | Hitachi Ltd | Xmlファイル構造の復元方法。 |
US11748560B2 (en) | 2020-08-14 | 2023-09-05 | Kyndryl, Inc. | Converting between tabular and structured data formats |
Also Published As
Publication number | Publication date |
---|---|
JP4189400B2 (ja) | 2008-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4091726B2 (ja) | 構造化文書の表示規則の生成方法、システムおよびプログラムが記録された媒体ならびに構造化文書およびその文書型定義の変更方法、システムおよびプログラムが記録された媒体 | |
JP4997749B2 (ja) | 文書処理方法、プログラム及びシステム | |
US20040133854A1 (en) | Persistent document object model | |
CN111506310A (zh) | 生成多平台样式的方法、装置、设备及存储介质 | |
US20080262833A1 (en) | Document Processing Device and Document Processing Method | |
US20040268304A1 (en) | XML document editor | |
US20020169803A1 (en) | System and user interface for generating structured documents | |
JP2004234354A (ja) | 構造パターン候補を生成する方法、システムおよびプログラム | |
JP2014167797A (ja) | ウェブブラウザ上でxml文書を生成する方法 | |
US20080163077A1 (en) | System and method for visually generating an xquery document | |
US20100107048A1 (en) | Document processor and document processing method | |
US20070258100A1 (en) | Document Processing Device and Document Processing Method | |
JP4303079B2 (ja) | テキストフォーマッティングまたはマークアップ言語フォーマッティングとアウトライン構造との間の変換のためのシステムおよび方法 | |
US20080010588A1 (en) | Document Processing Device and Document Processing Method | |
US20090077462A1 (en) | Document processing device and document processing method | |
US20090083300A1 (en) | Document processing device and document processing method | |
JP2007034571A (ja) | 文書処理プログラム、文書処理方法 | |
US20080005662A1 (en) | Server Device and Name Space Issuing Method | |
US20080250311A1 (en) | Document Processing Device, and Document Processing Method | |
US20080208790A1 (en) | Document Processing Device, and Document Processing Method | |
US20080010587A1 (en) | Document Processing Device and Document Processing Method | |
JP4189400B2 (ja) | 変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 | |
US20080141112A1 (en) | Document Processing Device and Document Processing Method | |
US20090235156A1 (en) | Document processing device and document processing method | |
US20080320412A1 (en) | Document Processing Device and Document Processing Method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070731 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071001 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071218 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080507 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080702 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080912 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110919 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120919 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120919 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130919 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |