JP4189400B2 - 変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 - Google Patents
変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 Download PDFInfo
- Publication number
- JP4189400B2 JP4189400B2 JP2005286669A JP2005286669A JP4189400B2 JP 4189400 B2 JP4189400 B2 JP 4189400B2 JP 2005286669 A JP2005286669 A JP 2005286669A JP 2005286669 A JP2005286669 A JP 2005286669A JP 4189400 B2 JP4189400 B2 JP 4189400B2
- Authority
- JP
- Japan
- Prior art keywords
- conversion method
- layer
- cell
- value
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
(1)タグの反復が冗長である
(2)テキストが縦長になる
傾向がある。このため、テキスト形式のXMLデータは、情報項目の構造間の対応関係をユーザが直感的に読み取る(理解する)のには適さない。つまり、テキスト形式のXMLデータは、ユーザにとって決して見やすく且つ理解しやすいものではない。
図1は本発明の一実施形態に係る計算機システムの構成を示すブロック図である。この計算機システムは、計算機10及び当該計算機10と接続される端末(ユーザ端末)20から構成される。本実施形態において端末20は計算機10に直接接続されているものとする。しかし、端末20がネットワークを介して計算機10と接続されていても構わない。
・TAGNAME パスのタグ名を値とする
・TEXT タグの内容テキストを値とする
・CHILD(“名前”) 指定のタグ名を持つ子要素の内容テキストを値とする
・ATTR(“名前”) 指定の名前を持つ属性値を値とする
・“文字列” 指定の文字列を値とする
・null 指定なし(値不要)
のいずれかである。
まず、XMLデータの構造上の一般的な特徴について説明する。ここでは、XMLデータの表形式データへの変換という観点から、構造上の共通性のない情報の集まりを含めたXML一般ではなく、日常の業務ソフトウェアが取り扱うような、定型的項目群からなる情報の集まり、及び、それらを分類する木構造を想定する。このようなXMLデータにおける階層構造は、通常、よりルート要素(ルートノード)に近い(階層的に浅い)要素(ノード)と、ルート要素からより遠い(階層的に深い)要素について、次のように構成されるのが一般的である。
(2)深い層は、浅い層の構成メンバーを表わす
(3)深い層は、浅い層の特徴記述項目の値を記述する。
次に、本実施形態で適用される、XMLを表で表現する仕組みについて、図3及び図4を参照して説明する。図3は、XMLデータの階層構造31の一例を示す。図4は、この階層構造31を保ちながら、XMLデータを表で表現する仕組みを示す。
a:タグ名、b:テキスト、c:特定子要素のテキスト、d:特定属性値、e:定数
のいずれかのデータを用いることができる。
5-1)対象層については、同じ深さの要素のタグ名により、例えば次の優先度
全て異なるとき、 列見出し={e}、 セル値={a}
全て同一のとき、 列見出し={e,a}、セル値={b,c,d,e}
同一セットのとき、列見出し={e,a}、セル値={b,c,d,e}
で値が決定される。ここで{ }内の要素の優先度は、左側の要素ほど高いことを表す。例えば{b,c,d,e}は、b(テキスト)の優先度が最も高く、以下、c(特定子要素のテキスト)、d(特定属性値)、e(定数)の順に優先度が低くなることを表す。
末端のとき、 列見出し={e,a}、セル値={b,c,d,e}
末端でないとき、 列見出し={e,a}、セル値=なし
で値が決定される。
Claims (4)
- データベースと、カスタマイズ情報記憶手段と、タグ名判別手段と、境界決定手段と、変換法生成手段とを備えた計算機において、前記データベースに格納されている構造化データを表形式データに変換するための変換法を自動生成する変換法自動生成方法であって、
前記タグ名判別手段が、前記構造化データの階層構造内で同じ深さの要素のうちタグ名が異なる要素の割合が第1のレベル以上となるか、或いは当該同じ深さの要素のうちタグ名が同一の要素の割合が第2のレベル以上となる最大深さを判別するステップと、
前記判別された最大深さに基づき、前記境界決定手段が、前記構造化データの階層構造のルートから前記最大深さまでの層を第1の層とし、前記構造化データの階層構造の前記最大深さより深い層を第2の層として決定するステップと、
前記変換法生成手段が、前記決定された第1の層を表の行方向及び列方向のうちの一方である第1の方向に対応付け、前記決定された第2の層を前記表の行方向及び列方向のうちの他方である第2の方向に対応付けるための変換法を示す変換法情報であって、前記構造化データの階層構造における各パスについて、当該パスを含むと共に、当該パスで特定される要素のタグ名、当該要素の内容であるテキスト、当該要素の特定の子要素の内容であるテキスト、当該要素の特定の属性値及び定数のいずれかを、それぞれ見出し及びセルの値として指定する見出し決定法情報及びセル値決定法情報を含む配列から構成される変換法情報を生成するステップとを具備し、
前記変換法情報を生成するステップは、
前記第1の層内で同じ深さの各要素のタグ名が全て異なる場合、前記変換法生成手段が、当該各要素に対応付ける見出しを指定する前記見出し決定法情報として前記定数を決定すると共に、当該各要素に対応付けるセルの値を指定する前記セル値決定法情報として当該各要素のタグ名を決定するステップと、
前記第1の層内で同じ深さの各要素のタグ名が全て同じ場合、前記変換法生成手段が、当該各要素に対応付ける見出しを指定する前記見出し決定法情報として当該タグ名を決定すると共に、前記カスタマイズ情報記憶手段に格納されているカスタマイズ情報であって、当該各要素に対応するセルの値の取得元の候補として当該各要素のテキスト、当該各要素の特定の子要素のテキスト、当該各要素の特定の属性値及び前記定数のいずれを優先させるかを示すカスタマイズ情報に従って、前記各要素に対応して実際に存在する候補のうち最も優先度の高い候補を、当該各要素に対応付けるセルの値を指定する前記セル値決定法情報として決定するステップと、
前記第2の層内で子ノードを持たない要素について、前記変換法生成手段が、当該要素に対応付ける見出しを指定する前記見出し決定法情報として当該要素のタグ名を決定すると共に、前記カスタマイズ情報記憶手段に格納されているカスタマイズ情報に従って、当該要素に対応して実際に存在する候補のうち最も優先度の高い候補を、当該要素に対応付けるセルの値を指定する前記セル値決定法情報として決定するステップと、
前記第2の層内で子ノードを持つ要素について、前記変換法生成手段が、当該要素に対応付ける見出しを指定する前記見出し決定法情報として当該要素のタグ名を決定すると共に、当該要素に対応付けるセルの値を指定する前記セル値決定法情報として指定なしを決定するステップとを含む
ことを特徴とする変換法自動生成方法。 - 前記第1及び第2のレベルを100%としたことを特徴とする請求項1記載の変換法自動生成方法。
- データベースと、カスタマイズ情報記憶手段と、タグ名判別手段と、境界決定手段と、変換法生成手段とを備えた計算機に、
前記タグ名判別手段が、前記構造化データの階層構造内で同じ深さの要素のうちタグ名が異なる要素の割合が第1のレベル以上となるか、或いは当該同じ深さの要素のうちタグ名が同一の要素の割合が第2のレベル以上となる最大深さを判別するステップと、
前記判別された最大深さに基づき、前記境界決定手段が、前記構造化データの階層構造のルートから前記最大深さまでの層を第1の層とし、前記構造化データの階層構造の前記最大深さより深い層を第2の層として決定するステップと、
前記変換法生成手段が、前記決定された第1の層を表の行方向及び列方向のうちの一方である第1の方向に対応付け、前記決定された第2の層を前記表の行方向及び列方向のうちの他方である第2の方向に対応付けるための変換法を示す変換法情報であって、前記構造化データの階層構造における各パスについて、当該パスを含むと共に、当該パスで特定される要素のタグ名、当該要素の内容であるテキスト、当該要素の特定の子要素の内容であるテキスト、当該要素の特定の属性値及び定数のいずれかを、それぞれ見出し及びセルの値として指定する見出し決定法情報及びセル値決定法情報を含む配列から構成される変換法情報を生成するステップと
を実行させるための変換法自動生成プログラムであって、
前記変換法情報を生成するステップは、
前記第1の層内で同じ深さの各要素のタグ名が全て異なる場合、前記変換法生成手段が、当該各要素に対応付ける見出しを指定する前記見出し決定法情報として前記定数を決定すると共に、当該各要素に対応付けるセルの値を指定する前記セル値決定法情報として当該各要素のタグ名を決定するステップと、
前記第1の層内で同じ深さの各要素のタグ名が全て同じ場合、前記変換法生成手段が、当該各要素に対応付ける見出しを指定する前記見出し決定法情報として当該タグ名を決定すると共に、前記カスタマイズ情報記憶手段に格納されているカスタマイズ情報であって、当該各要素に対応するセルの値の取得元の候補として当該各要素のテキスト、当該各要素の特定の子要素のテキスト、当該各要素の特定の属性値及び前記定数のいずれを優先させるかを示すカスタマイズ情報に従って、前記各要素に対応して実際に存在する候補のうち最も優先度の高い候補を、当該各要素に対応付けるセルの値を指定する前記セル値決定法情報として決定するステップと、
前記第2の層内で子ノードを持たない要素について、前記変換法生成手段が、当該要素に対応付ける見出しを指定する前記見出し決定法情報として当該要素のタグ名を決定すると共に、前記カスタマイズ情報記憶手段に格納されているカスタマイズ情報に従って、当該要素に対応して実際に存在する候補のうち最も優先度の高い候補を、当該要素に対応付けるセルの値を指定する前記セル値決定法情報として決定するステップと、
前記第2の層内で子ノードを持つ要素について、前記変換法生成手段が、当該要素に対応付ける見出しを指定する前記見出し決定法情報として当該要素のタグ名を決定すると共に、当該要素に対応付けるセルの値を指定する前記セル値決定法情報として指定なしを決定するステップとを含む
ことを特徴とする変換法自動生成プログラム。 - データベースに格納されている構造化データを表形式データに変換するための変換法を自動生成する変換法自動生成装置において、
前記構造化データの階層構造内で同じ深さの要素のうちタグ名が異なる要素の割合が第1のレベル以上となるか、或いは当該同じ深さの要素のうちタグ名が同一の要素の割合が第2のレベル以上となる最大深さを判別するタグ名判別手段と、
前記判別された最大深さに基づき、前記構造化データの階層構造のルートから前記最大深さまでの層を第1の層とし、前記構造化データの階層構造の前記最大深さより深い層を第2の層として決定する境界決定手段と、
前記決定された第1の層を表の行方向及び列方向のうちの一方である第1の方向に対応付け、前記決定された第2の層を前記表の行方向及び列方向のうちの他方である第2の方向に対応付けるための変換法を示す変換法情報であって、前記構造化データの階層構造における各パスについて、当該パスを含むと共に、当該パスで特定される要素のタグ名、当該要素の内容であるテキスト、当該要素の特定の子要素の内容であるテキスト、当該要素の特定の属性値及び定数のいずれかを、それぞれ見出し及びセルの値として指定する見出し決定法情報及びセル値決定法情報を含む配列から構成される変換法情報を生成する変換法生成手段と、
各要素に対応するセルの値の取得元の候補として当該各要素のテキスト、当該各要素の特定の子要素のテキスト、当該各要素の特定の属性値及び前記定数のいずれを優先させるかを示すカスタマイズ情報を格納するカスタマイズ情報記憶手段とを具備し、
前記変換法生成手段は、
前記第1の層内で同じ深さの各要素のタグ名が全て異なる場合、当該各要素に対応付ける見出しを指定する前記見出し決定法情報として前記定数を決定すると共に、当該各要素に対応付けるセルの値を指定する前記セル値決定法情報として当該各要素のタグ名を決定し、
前記第1の層内で同じ深さの各要素のタグ名が全て同じ場合、当該各要素に対応付ける見出しを指定する前記見出し決定法情報として当該タグ名を決定すると共に、前記カスタマイズ情報に従って、前記各要素に対応して実際に存在する候補のうち最も優先度の高い候補を、当該各要素に対応付けるセルの値を指定する前記セル値決定法情報として決定し、
前記第2の層内で子ノードを持たない要素について、当該要素に対応付ける見出しを指定する前記見出し決定法情報として当該要素のタグ名を決定すると共に、前記カスタマイズ情報に従って、当該要素に対応して実際に存在する候補のうち最も優先度の高い候補を、当該要素に対応付けるセルの値を指定する前記セル値決定法情報として決定し、
前記第2の層内で子ノードを持つ要素について、当該要素に対応付ける見出しを指定する前記見出し決定法情報として当該要素のタグ名を決定すると共に、当該要素に対応付けるセルの値を指定する前記セル値決定法情報として指定なしを決定するように構成されている
ことを特徴とする変換法自動生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005286669A JP4189400B2 (ja) | 2005-09-30 | 2005-09-30 | 変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005286669A JP4189400B2 (ja) | 2005-09-30 | 2005-09-30 | 変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007094971A JP2007094971A (ja) | 2007-04-12 |
JP4189400B2 true JP4189400B2 (ja) | 2008-12-03 |
Family
ID=37980582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005286669A Expired - Fee Related JP4189400B2 (ja) | 2005-09-30 | 2005-09-30 | 変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4189400B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013015935A (ja) * | 2011-07-01 | 2013-01-24 | Hitachi Ltd | Xmlファイル構造の復元方法。 |
US11748560B2 (en) | 2020-08-14 | 2023-09-05 | Kyndryl, Inc. | Converting between tabular and structured data formats |
-
2005
- 2005-09-30 JP JP2005286669A patent/JP4189400B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007094971A (ja) | 2007-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4997749B2 (ja) | 文書処理方法、プログラム及びシステム | |
JP4091726B2 (ja) | 構造化文書の表示規則の生成方法、システムおよびプログラムが記録された媒体ならびに構造化文書およびその文書型定義の変更方法、システムおよびプログラムが記録された媒体 | |
US7107521B2 (en) | XSL dynamic inheritance | |
US8434014B1 (en) | System and method for editing information | |
US8484552B2 (en) | Extensible stylesheet designs using meta-tag information | |
US7409673B2 (en) | XML document editor | |
JP2004234354A (ja) | 構造パターン候補を生成する方法、システムおよびプログラム | |
US20040133854A1 (en) | Persistent document object model | |
US20060143562A1 (en) | Self-describing editors for browser-based WYSIWYG XML/HTML editors | |
JP4775974B2 (ja) | ウェブページを編集するプログラム、装置、及びシステム | |
US20080262833A1 (en) | Document Processing Device and Document Processing Method | |
US20190243842A1 (en) | Information extraction method and system | |
JP2002318798A (ja) | 構造化文書翻訳におけるユーザ制御可能なデータをグループ化する方法およびシステム | |
JP2014167797A (ja) | ウェブブラウザ上でxml文書を生成する方法 | |
US20080163077A1 (en) | System and method for visually generating an xquery document | |
JP4303079B2 (ja) | テキストフォーマッティングまたはマークアップ言語フォーマッティングとアウトライン構造との間の変換のためのシステムおよび方法 | |
CN110489625A (zh) | 一种网页数据采集模板的生成方法和装置 | |
US20010014899A1 (en) | Structural documentation system | |
US20090083300A1 (en) | Document processing device and document processing method | |
JP2007034571A (ja) | 文書処理プログラム、文書処理方法 | |
US20080005662A1 (en) | Server Device and Name Space Issuing Method | |
US20090235156A1 (en) | Document processing device and document processing method | |
JP4566196B2 (ja) | 文書処理方法および装置 | |
US20080250311A1 (en) | Document Processing Device, and Document Processing Method | |
JP4189400B2 (ja) | 変換法自動生成方法、変換法自動生成プログラム及び変換法自動生成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070731 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071001 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071218 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080507 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080702 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080912 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110919 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120919 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120919 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130919 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |