WO2014010029A1

WO2014010029A1 - プログラム、マッピング装置およびマッピング方法

Info

Publication number: WO2014010029A1
Application number: PCT/JP2012/067614
Authority: WO
Inventors: 貴之井ノ上; 傑鷲尾
Original assignee: 富士通株式会社
Priority date: 2012-07-10
Filing date: 2012-07-10
Publication date: 2014-01-16
Also published as: US10437857B2; US20150127689A1; JPWO2014010029A1; JP6079780B2

Abstract

　マッピング装置（１）は、変更前の項目を含む変更前のＸＢＲＬデータ（２１）および変更後の項目を含む変更後のＸＢＲＬデータ（２２）の変更前後の項目をマッピングする。マッピング装置（１）は、変更前のＸＢＲＬデータ（２１）の項目間の親子関係および変更前のＸＢＲＬデータ（２１）の項目間の親子関係の中で最上位の親項目同士の一致率を、各項目の項目名および各項目に関する補助情報を用いて算出する。そして、マッピング装置（１）は、算出した一致率に基づいて、変更前のＸＢＲＬデータ（２１）と変更前のＸＢＲＬデータ（２１）の親項目同士をマッピングする。これにより、マッピング装置（１）は、ＸＢＲＬデータの項目に関する複数の情報が変更されても、変更前後の項目同士をマッピングできる。

Description

プログラム、マッピング装置およびマッピング方法

　本発明は、プログラム、マッピング装置およびマッピング方法に関する。

　ＸＢＲＬ（eXtensible　Business　Reporting　Language）文書による財務諸表を金融庁へ提出することが義務付けられている。ＸＢＲＬ文書とは、例えば財務報告に関して、ＸＭＬ（eXtensible　Markup　Language）をベースにした報告書記述言語であるＸＢＲＬで記述された文書である。

　かかるＸＢＲＬ文書の作成に用いられるＸＢＲＬデータは、例えば法令の改正、会計基準の変更および企業の監督機関の財務報告の方針の変更等により変更される。ＸＢＲＬデータには、スキーマやリンクベースが含まれる。スキーマとは、ＸＢＲＬデータで用いられる項目の一覧であり、項目毎に名前およびデータ型を定義する。リンクベースとは、スキーマに含まれるそれぞれの項目間の関係性を定義する。例えば、リンクベースは、親の項目に複数の子の項目がぶら下がるツリー構造の関係性を定義する。さらに、リンクベースには、子の項目の補助情報としてオーダー情報が定義されており、オーダー情報によって子の項目の表示順序が決定される。このようなＸＢＲＬデータを用いて、変更前後の項目同士が対応付けられる。

　図１５は、ＸＢＲＬデータを用いて変更前後の項目同士が対応付けられる例を示す図である。図１５には、変更前と変更後のＸＢＲＬデータが表されている。変更前のＸＢＲＬデータ内の項目名“CurrentAssets”が変更後のＸＢＲＬデータ内の項目名“CurrentAsset”に変更された場合、変更前後の項目同士をマッピングするマッピング装置は、変更前後の２つの項目の親子関係、兄弟関係あるいは補助情報に注目する。図１５では、マッピング装置は、比較対象の項目の親項目、兄弟項目を比較して、親項目の項目名が同一の“Assets”であり、兄弟項目の項目名も同一の“NonCurrentAssets”であることを判定する。そして、マッピング装置は、比較対象の項目名“CurrentAssets”が比較対象の項目名“CurrentAsset”に変更されたという結果を出し、変更前後の項目同士を対応付ける（例えば、特許文献１参照）。

国際公開第２０１１／０８９６８３号

　しかしながら、ＸＢＲＬデータの項目に関する複数の情報が変更された場合、変更前後の項目同士を最適に対応付けることができないという問題があった。例えば、ＸＢＲＬデータの項目の項目名が変更されるとともに、変更があった項目の補助情報が変更された場合、変更前後の項目同士を最適に対応付けることができない。

　図１６は、変更前後の項目同士を最適に対応付けることができない例を示す図である。図１６には、変更前と変更後のＸＢＲＬデータが表されている。変更前のＸＢＲＬデータの項目名“CurrentAssets”が変更後のＸＢＲＬデータの項目名“CurrentResources”に変更された場合、マッピング装置は、変更前後の２つの項目の親子関係、兄弟関係あるいは補助情報に注目する。図１６では、マッピング装置は、比較対象の項目の親項目、兄弟項目および項目の補助情報としてラベル情報を比較する。すると、マッピング装置は、親項目の項目名は同一であると判定する。ところが、兄弟項目の項目名が“CurrentCosts”と“CurrentPrices”であり、同一でない。さらに、ラベル情報が“流動資産”と“流同資産”で完全に一致していない。そこで、マッピング装置は、比較対象の項目名“CurrentAssets”が比較対象の項目名“CurrentResources”に変更されたという結果を確実に出せない。この結果、マッピング装置は、変更前後の項目同士を最適に対応付けることができない。

　１つの側面では、本発明は、ＸＢＲＬデータの項目に関する複数の情報が変更されても、変更前後の項目同士を対応付けることができることを目的とする。

　一態様のプログラムは、コンピュータに、変更前の項目を含む第１のデータの項目間の階層関係および変更後の項目を含む第２のデータの項目間の階層関係の中で最上位の親項目同士の一致率を、各項目に関する項目情報を用いて算出し、該算出した一致率に基づいて、前記第１のデータと前記第２のデータの親項目同士を対応付ける、処理を実行させる。

　一つの態様によれば、ＸＢＲＬデータの項目に関する複数の情報が変更されても、変更前後の項目同士を対応付けることができる。

図１は、実施例に係るマッピング装置の構成を示す機能ブロック図である。図２は、スキーマのデータ構造の一例を示す図である。図３は、リンクベース（表示リンク）のデータ構造の一例を示す図である。図４は、リンクベース（ラベルリンク）のデータ構造の一例を示す図である。図５は、リンクベース（参照リンク）のデータ構造の一例を示す図である。図６は、変更前後のツリー構造のマッピングの一例を示す図である。図７は、変更前後のツリー構造の一例を示す図である。図８Ａは、変更前後の子項目同士の組合せのパターン例を示す図（１）である。図８Ｂは、変更前後の子項目同士の組合せのパターン例を示す図（２）である。図８Ｃは、変更前後の子項目同士の組合せのパターン例を示す図（３）である。図９Ａは、変更前後の子項目同士の組合せのパターンと一致率の具体例を説明する図（１）である。図９Ｂは、変更前後の子項目同士の組合せのパターンと一致率の具体例を説明する図（２）である。図１０は、出力部による出力の一例を示す図である。図１１は、実施例に係るマッピング処理の主処理の手順を示すフローチャートである。図１２は、変更前後のツリー構造のマッピング処理の手順を示すフローチャートである。図１３は、変更前後のツリー構造内の項目のマッピング処理の手順を示すフローチャートである。図１４は、マッピングプログラムを実行するコンピュータの一例を示す図である。図１５は、ＸＢＲＬデータを用いて変更前後の項目同士が対応付けられる例を示す図である。図１６は、変更前後の項目同士を最適に対応付けることができない例を示す図である。

　以下に、本願の開示するプログラム、マッピング装置およびマッピング方法の実施例を図面に基づいて詳細に説明する。なお、実施例によりこの発明が限定されるものではない。

［実施例に係るマッピング装置の構成］
　図１は、実施例に係るマッピング装置の構成を示す機能ブロック図である。図１に示すように、マッピング装置１は、変更前のＸＢＲＬデータ２１および変更後のＸＢＲＬデータ２２を入力し、変更前後のＸＢＲＬデータ２１、２２に含まれる項目間を対応付ける。

　変更前後のＸＢＲＬデータ２１、２２には、それぞれタクソノミが定義されている。「タクソノミ」とは、ＸＢＲＬで用いられる項目（以下、「項目」という）の体系を定義したものであり、スキーマとリンクベースとからなる。「スキーマ」は、項目の一覧であり、項目毎にその名前およびデータ型を定義する。「リンクベース」は、項目に対するリンク情報を定義し、例えば表示リンク、ラベルリンクや参照リンクがある。「表示リンク」とは、項目間の親子関係や表示順序（オーダー情報）等を定義する。「ラベルリンク」とは、項目のラベル（例えば、項目の名前“Assets”のラベルとして“資産”）を定義する。「参照リンク」とは、項目の定義の根拠となった文献情報（例えば、項目の名前“Assets”の文献情報として“財務諸表等規則、様式第Ａ号”）を定義する。つまり、マッピング装置１は、変更前のＸＢＲＬデータ２１に含まれる項目について、項目名が変更されたり、ラベル名が変更されたり、文献情報名が変更されたり、子項目の順番が変更された場合であっても、変更前後の項目間を対応付ける。

　なお、実施例では、「スキーマ」が、スキーマ４１に対応する。「リンクベース」が、リンクベース４２に対応する。スキーマ４１およびリンクベース４２の各構成例については、後述する。

　また、マッピング装置１は、記憶部２と、制御部３とを有する。

　記憶部２は、例えばフラッシュメモリ（Flash　Memory）やＦＲＡＭ（登録商標）（Ferroelectric　Random　Access　Memory）等の不揮発性の半導体メモリ素子等の記憶装置に対応する。そして、記憶部２は、変更前のＸＢＲＬデータ２１および変更後のＸＢＲＬデータ２２を有する。

　変更前のＸＢＲＬデータ２１および変更後のＸＢＲＬデータ２２は、後述する構造解析部３１によって記憶部２に格納される。変更前のＸＢＲＬデータ２１および変更後のＸＢＲＬデータ２２は、それぞれスキーマ４１およびリンクベース４２を含む。さらに、リンクベース４２は、表示リンク４２１とラベルリンク４２２と参照リンク４２３とを含む。

　ここで、スキーマ４１、およびリンクベース４２に含まれる表示リンク４２１とラベルリンク４２２と参照リンク４２３のデータ構造について、図２～図５を参照して説明する。図２は、スキーマのデータ構造の一例を示す図である。図３は、リンクベース（表示リンク）のデータ構造の一例を示す図である。図４は、リンクベース（ラベルリンク）のデータ構造の一例を示す図である。図５は、リンクベース（参照リンク）のデータ構造の一例を示す図である。

　図２に示すように、スキーマ４１は、ＩＤ（IDentification）４１ａ毎に、項目名４１ｂおよびデータ型４１ｃを対応付けて記憶する。ＩＤ４１ａは、ＸＢＲＬデータで用いられる項目の識別子である。項目名４１ｂは、項目の名前を示す。データ型４１ｃは、項目に対応付けられる値のデータ型を示す。一例として、ＩＤ４１ａが「１」である場合、項目名４１ｂとして「Assets」、データ型４１ｃとして「金額型」と記憶している。

　図３に示すように、表示リンク４２１は、親子関係４２１ａを記憶する。親子関係４２１ａは、項目間の親子関係を、項目の識別子と矢印を用いて定義する。図３の例では、項目の識別子「１」が親であり、項目の識別子「２」が子である場合、親子関係４２１ａは、「１→２」で表される。また、同一の親に対して複数の子がある場合、例えば親子関係４２１ａの子が上にあるほど、子の表示順序（オーダー情報）が先行するものとする。図３の例では、親の項目の識別子「１」に対して複数の子の項目の識別子「２」、「３」がある。この場合、上にある「２」の識別子の子が、オーダー情報を「１」とし、下にある「３」の識別子の子が、オーダー情報を「２」とする。なお、親子関係４２１ａは、親子の関係に限られず、子孫の関係であっても良く、孫から曾孫の関係であっても良い。

　図４に示すように、ラベルリンク４２２は、ＩＤ４２２ａ毎に、ラベル名４２２ｂを対応付けて記憶する。ＩＤ４２２ａは、項目の識別子であり、図２で示されたＩＤ４１ａに対応する。ラベル名４２２ｂは、項目のラベルを示す。一例として、ＩＤ４２２ａが「１」である場合、ラベル名４２２ｂとして「流動資産」と記憶している。

　図５に示すように、参照リンク４２３は、ＩＤ４２３ａ毎に、参照名４２３ｂを対応付けて記憶する。ＩＤ４２３ａは、項目の識別子であり、図２で示されたＩＤ４１ａに対応する。参照名４２３ｂは、項目の定義の根拠となった文献情報を示す。一例として、ＩＤ４２３ａが「１」である場合、参照名４２３ｂとして「財務諸表等規則、様式第Ａ号」と記憶している。

　制御部３は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、これらによって種々の処理を実行する。そして、制御部３は、例えば、ＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路またはＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等の電子回路に対応する。さらに、制御部３は、構造解析部３１と、マッピング部３２と、出力部３３とを有する。さらに、マッピング部３２は、ツリー構造マッピング部３２１および項目マッピング部３２２を有する。

　構造解析部３１は、変更前後のＸＢＲＬデータ２１、２２を用いて、構造解析を行い、変更前後のツリー構造を作成する。例えば、構造解析部３１は、変更前後のＸＢＲＬデータ２１、２２を入力し、入力した変更前後のＸＢＲＬデータ２１、２２を記憶部２に格納する。一例として、構造解析部３１は、ファイルである変更前後のＸＢＲＬデータ２１、２２の記憶装置への入出力によって実現する。また、構造解析部３１は、変更前のスキーマ４１に記述された項目に関して、変更前の表示リンク４２１から表される親子関係および表示順序を用いたツリー構造を作成する。さらに、構造解析部３１は、作成したツリー構造に、ラベルリンク４２２から表されるラベル名、参照リンク４２３から表される参照名を追加する。また、構造解析部３１は、変更後のスキーマ４１に記述された項目に関して、変更後のリンクベース４２を用いたツリー構造を作成する。

　マッピング部３２は、ツリー構造マッピング部３２１および項目マッピング部３２２を有する。

　ツリー構造マッピング部３２１は、構造解析部３１によって作成された変更前後のツリー構造に基づいて、変更前（比較元）の親項目に関するツリーに対して、変更後（比較先）の親項目に関するツリーをマッピングする。ここでは、ツリー構造マッピング部３２１は、比較元のツリーと構造上最も近い比較先のツリーをマッピングする。例えば、ツリー構造マッピング部３２１は、比較元のツリーおよび比較先のツリーの最上位の親項目同士について、項目名および補助情報を比較する。補助情報とは、一例としてラベル名、参照名、親項目にぶら下がる子項目の数が含まれる。

　ここで、変更前後（比較元先）のツリー構造のマッピングについて、図６を参照して説明する。図６は、変更前後のツリー構造のマッピングの一例を示す図である。図６に示すように、比較元のツリー構造に“Assets”を親項目とするツリーがあり、親項目のラベル情報として“資産”、参照情報として“財務諸表等規則、様式第Ａ号”、子項目数として３が記述されている。図６では、ラベル情報、参照情報、子項目数が、補助情報である。そして、ツリー構造マッピング部３２１は、比較元と比較先候補の親項目同士の項目名、ラベル情報、リファレンス情報および子項目数を比較する。ここでは、ツリー構造マッピング部３２１は、比較元と比較先の候補の親項目同士の項目名を比較すると、比較元の項目名から最後の文字“ｓ”を削除した候補１が類似していると判定する。そして、ツリー構造マッピング部３２１は、比較元と比較先の候補のラベル情報、リファレンス情報および子項目数を比較すると、候補１が比較元と一致していると判定する。この結果、ツリー構造マッピング３２１は、比較先の候補１が示す親項目“Asset”のツリーを比較元の親項目“Assets”のツリーにマッピングできる。

　図１に戻って、ツリー構造マッピング部３２１による比較は、具体例として、各親項目の項目名の一致率および各親項目の補助情報の一致率を用いて行われる。

　項目名、ラベル名、参照名のような文字列の一致率は、一例として、以下の式（１）で算出される。

ａ_０は、項目名の一致率とする。ａ_１は、ラベル名の一致率とする。ａ_２は、参照名の一致率とする。最大文字数は、比較元の文字列および比較先の文字列で大きい方の文字数を示す。不一致の文字数は、一例として、レーベンシュタイン距離を用いて算出されるが、文字列の類似度が求められる方法であればこれに限られない。

　子項目の数の一致率ａ_３は、以下の式（２）で算出される。

最大項目数は、比較元の親項目が所有する子項目の数と比較先の親項目が所有する子項目の数で大きい方の数を示す。項目数の差は、比較元の親項目が所有する子項目の数と比較先の親項目が所有する子項目の数の差の絶対値を示す。

　また、ツリー構造マッピング部３２１は、算出した各一致率の平均を算出することで、親項目同士の一致率を算出する。親項目同士の一致率は、以下の式（３）で算出される。

ここでは、式（３）で表されるｎは４を示す。

　また、ツリー構造マッピング部３２１は、親項目同士の一致率が最も高い２つの親項目のツリーを、構造上最も近いツリーであるとしてマッピングする。その後、後述する項目マッピング部３２２は、これらのツリー内の子項目同士をマッピングする。

　項目マッピング部３２２は、親項目同士のツリーがマッピングされた場合、マッピングされた変更前のツリーの親項目と変更後のツリーの親項目にそれぞれぶら下がる子項目同士の一致率を算出する。例えば、項目マッピング部３２２は、変更前と変更後のそれぞれのツリーに含まれる子項目同士のパターンを複数作成する。また、項目マッピング部３２２は、複数作成したパターン毎にパターンに含まれる子項目同士の一致率を算出する。子項目同士の一致率は、各子項目の項目名の一致率および各子項目の補助情報の一致率を用いて算出される。ここでいう補助情報とは、一例としてラベル名、参照名、オーダー情報（表示順序）が含まれる。

　項目名、ラベル名、参照名のような文字列の一致率は、親項目同士の一致率の場合と同様に、式（１）で算出される。また、オーダー情報の一致率は、以下の式（４）で算出される。

最大オーダー番号は、比較元の子項目のオーダー番号と比較先の子項目のオーダー番号で大きい方のオーダー番号を示す。オーダー番号の差は、比較元の子項目のオーダー番号と比較先の子項目のオーダー番号の差の絶対値を示す。

　また、項目マッピング部３２２は、算出した各一致率の平均を算出することで、子項目同士の一致率を算出する。子項目同士の一致率は、以下の式（５）で算出される。

ここでは、式（５）で表されるｎは４を示す。また、ａ_０は、項目名の一致率とする。ａ_１は、ラベル名の一致率とする。ａ_２は、参照名の一致率とする。ａ_３は、オーダーの一致率とする。

　また、項目マッピング部３２２は、パターンに含まれる子項目同士の一致率を算出した場合、パターンに含まれる子項目同士の一致率の平均を算出することで、パターン毎のツリー全体の一致率を算出する。ツリー全体の一致率は、以下の式（６）で算出される。

式（６）で表されるｍはパターンに含まれる子項目同士の数を示す。ｅ_ｋは、パターンに含まれる子項目同士の一致率を示す。なお、全体の一致率Ｅが高いほど、その全体の一致率が算出されたパターンに含まれる子項目同士の一致率も高いと推定される。

　また、項目マッピング３２２は、最も高い一致率が算出されたパターンの子項目同士をマッピングする。これにより、項目マッピング３２２は、項目に関する、項目名や補助情報のうち複数の情報が変更されても、変更前後の項目同士を最適にマッピングすることができる。

　出力部３３は、ツリー構造マッピング部３２１によってマッピングされた親項目同士および項目マッピング３２２によってマッピングされた子項目同士について、一致率が完全一致（１００％）ではない項目同士を出力する。これにより、出力部３３は、項目に関する、項目名や補助情報のうち複数の情報が変更されても、変更前後の項目同士を最適にマッピングした結果を表すことができる。

［変更前後の子項目のマッピング］
　ここで、変更前後（比較元先）のツリー構造に基づく子項目のマッピングについて、図７および図８Ａ～図８Ｃを参照して説明する。図７は、変更前後のツリー構造の一例を示す図である。図８Ａ～図８Ｃは、変更前後の子項目同士の組合せのパターンの一例を示す図である。図７では、比較元の親項目のツリーと、マッピングされた比較先の親項目のツリーとが表されている。比較元および比較先のツリーには、それぞれ３つの子項目が記述されている。そして、例えば、比較元の項目名“DeferrdAssets”が比較先の項目名“DeferrdAsset”に変更され、さらにオーダー情報も２から３へ変更されている。

　このような場合に、項目マッピング部３２２は、比較元と比較先のそれぞれのツリーに含まれる子項目同士の組合せのパターンを複数作成する。例えば、図８Ａに示すように、パターン１として、比較元“CurrentAssets”と比較先“CurrentAsset”との組合せ、比較元“DeferredAssets”と比較先“NonCurrentAsset”との組合せ、比較元“NonCurrentAssets”と比較先“DeferredAsset”との組合せとする。図８Ｂに示すように、パターン２として、比較元“CurrentAssets”と比較先“CurrentAsset”との組合せ、比較元“DeferredAssets”と比較先“DeferredAsset”との組合せ、比較元“NonCurrentAssets”と比較先“NonCurrentAsset”との組合せとする。図８Ｃに示すように、パターン３として、比較元“CurrentAssets”と比較先“DeferredAsset”との組合せ、比較元“DeferredAssets”と比較先“NonCurrentAsset”との組合せ、比較元“NonCurrentAssets”と比較先“CurrentAsset”との組合せとする。

　そして、項目マッピング部３２２は、パターン１～３毎に、パターンに含まれる各子項目同士の一致率を各子項目の項目名と、ラベル名、参照名およびオーダー情報等の補助情報とを用いて算出する。そして、項目マッピング部３２２は、パターンに含まれる全ての子項目同士の一致率の平均を算出することで、パターン１～３毎のツリー全体の一致率を算出する。そして、項目マッピング部３２２は、全体の一致率が最も高いパターンを選択する。ここでは、項目マッピング部３２２は、パターン２を選択できたとする。この結果、子項目名“CurrentAssets”は“CurrentAsset”に変更され、子項目名“DeferredAssets”は“DeferredAsset”に変更され、子項目名“NonCurrentAssets”は“NonCurrentAsset”に変更されたことがわかる。

　このように、項目マッピング３２２は、子項目の項目名や子項目の表示順序が変更されていても、変更前後の子項目同士を最適にマッピングすることができる。すなわち、項目マッピング部３２２は、項目に関する、項目名や補助情報のうち複数の情報が変更されても、変更前後の項目同士を最適にマッピングすることが可能となる。

［変更前後のパターンと一致率の具体例］
　さらに、変更前後の子項目同士の組合せのパターンと一致率について、図９Ａおよび図９Ｂを参照して説明する。図９Ａおよび図９Ｂは、変更前後の子項目同士の組合せのパターンと一致率の具体例を説明する図である。図９Ａでは、比較元の親項目“Assets”のツリーと、マッピングされた比較先の親項目“Asset”のツリーとが表されている。比較元および比較先のツリーには、それぞれ３つの子項目が記述されている。そして、それぞれの子項目には、補助情報としてオーダー情報が記述されている。なお、各項目には、説明の便宜上、項目に対応する項目番号が付けられている。以下、項目名の後の括弧内の内容は、項目番号を示すとする。また、比較元に対して比較先の項目番号には「´」が付けられている。

　図９Ａに示すように、比較元の項目名“CurrentAssets”（２）が比較先の項目名“CurrentAsset”（２´）に変更されている。また、比較元の項目名“NonCurrentAssets”（３）が比較先の項目名“NonCurrentAsset”（３´）に変更されている。また、比較元の項目名“DeferrdAssets”（４）が比較先の項目名“DeferrdAsset”（４´）に変更されている。

　図９Ｂに示すように、項目マッピング部３２２は、比較元と比較先のそれぞれのツリーに含まれる子項目同士の組合せのパターンを複数作成する。図９Ｂでは、パターンｐ１は、比較元“CurrentAssets”（２）と比較先“CurrentAsset”（２´）との組合せ、比較元“NonCurrentAssets”（３）と比較先“NonCurrentAsset”（３´）との組合せ、比較元“DeferrdAssets”（４）と比較先“DeferrdAsset”（４´）との組合せとする。以下、パターンにおける説明を、項目名を省略して項目番号のみで説明する。パターンｐ２は、比較元２と比較先２´との組合せ、比較元３と比較先４´との組合せ、比較元４と比較先３´との組合せとする。パターンｐ３は、比較元２と比較先３´との組合せ、比較元３と比較先２´との組合せ、比較元４と比較先４´との組合せとする。パターンｐ４は、比較元２と比較先３´との組合せ、比較元３と比較先４´との組合せ、比較元４と比較先２´との組合せとする。パターンｐ５は、比較元２と比較先４´との組合せ、比較元３と比較先２´との組合せ、比較元４と比較先３´との組合せとする。パターンｐ６は、比較元２と比較先４´との組合せ、比較元３と比較先３´との組合せ、比較元４と比較先２´との組合せとする。

　項目マッピング部３２２は、複数作成したパターンｐ１～ｐ６毎にパターンに含まれる子項目同士の一致率を算出する。ここでは、子項目同士の一致率は、子項目同士における各子項目の項目名の一致率および各子項目の補助情報としてのオーダー情報の一致率を用いて算出される。具体的には、子項目同士における各子項目の項目名の一致率は、式（１）で算出される。子項目同士における各子項目のオーダー情報の一致率は、式（４）で算出される。そして、子項目同士の一致率は、式（５）で算出される。

　図９Ｂでは、子項目同士の組合せに後続する百分率が、子項目同士の一致率である。ここでは、例えば、比較元２と比較先２´との組合せにおける子項目同士の一致率は、９２．３％である。また、比較元３と比較先３´との組合せにおける子項目同士の一致率は、９３．８０％である。また、比較元４と比較先４´との組合せにおける子項目同士の一致率は、９２．３０％である。

　さらに、項目マッピング部３２２は、パターンに含まれる子項目同士の一致率の平均を算出することで、パターンｐ１～ｐ６毎のツリー全体の一致率を算出する。具体的には、パターン毎のツリー全体の一致率は、式（６）で算出される。ここでは、例えば、パターンｐ１のツリー全体の一致率は、９２．８０％である。パターンｐ２のツリー全体の一致率は、５５．８０％である。パターンｐ３のツリー全体の一致率は、７８．８０％である。パターンｐ４のツリー全体の一致率は、４８．４０％である。パターンｐ５のツリー全体の一致率は、５０．３０％である。パターンｐ６のツリー全体の一致率は、５６．９０％である。

　そして、項目マッピング部３２２は、全体の一致率が最も高いパターンを選択する。ここでは、項目マッピング部３２２は、最高値を有する９２．８０％のパターンｐ１を選択する。この結果、子項目名“CurrentAssets”（２）は“CurrentAsset”（２´）に変更されたことがわかる。子項目名“NonCurrentAssets”（３）は“NonCurrentAsset”（３´）に変更されたことがわかる。子項目名“DeferredAssets”（４）は“DeferredAsset”（４´）に変更されたことがわかる。

［出力の一例］
　さらに、出力部３３による出力の一例を、図１０を参照して説明する。図１０は、出力部による出力の一例を示す図である。図１０の例では、図９Ｂで選択されたパターンｐ１における出力例が表されている。

［マッピング処理の主処理］
　次に、実施例に係るマッピング処理の主処理の手順について、図１１を参照して説明する。図１１は、実施例に係るマッピング処理の主処理の手順を示すフローチャートである。

　まず、制御部３は、マッピング要求があったか否かを判定する（ステップＳ１１）。マッピング要求がなかったと判定した場合（ステップＳ１１；Ｎｏ）、制御部３は、マッピング要求があるまで、判定処理を繰り返す。一方、マッピング要求があったと判定した場合（ステップＳ１１；Ｙｅｓ）、構造解析部３１は、変更前後のＸＢＲＬデータ２１、２２を記憶部２から読み込む（ステップＳ１２）。なお、構造解析部３１は、変更前後のＸＢＲＬデータ２１、２２を記憶部２から読み込む代わりに、外部から入力するとしても良い。

　そして、構造解析部３１は、変更前後のＸＢＲＬデータ２１、２２を用いて、構造解析を行い、変更前後のツリー構造を作成する（ステップＳ１３）。例えば、構造解析部３１は、変更前のスキーマ４１に記述された項目に関して、変更前のリンクベース４２を用いたツリー構造を作成する。また、構造解析部３１は、変更後のスキーマ４１に記述された項目に関して、変更後のリンクベース４２を用いたツリー構造を作成する。

　続いて、ツリー構造マッピング３２１は、変更前後のツリー構造のマッピング処理を行う（ステップＳ１４）。

　その後、項目マッピング部３２２は、マッピング処理が行われた、変更前後のツリー構造内の項目のマッピング処理を行う（ステップＳ１５）。そして、マッピング処理の主処理が終了する。

［変更前後のツリー構造のマッピング処理］
　次に、図１１に示すＳ１４におけるマッピング処理の手順について、図１２を参照して説明する。図１１は、変更前後のツリー構造のマッピング処理の手順を示すフローチャートである。なお、ツリー構造マッピング部３２１は、構造解析部３１によって作成された変更前後のツリー構造を受け取ったとする。

　すると、ツリー構造マッピング部３２１は、変更前（比較元）の親項目と子項目から構成されるツリー構造の情報（対象情報）を１つ抽出する（ステップＳ２１）。そして、ツリー構造マッピング部３２１は、変更後（比較先）の比較対象となるツリー構造の情報を１つ抽出する（ステップＳ２２）。

　続いて、ツリー構造マッピング部３２１は、親項目同士の一致率を親項目の項目名および補助情報から算出する（ステップＳ２３）。補助情報には、ラベル情報、参照情報、親項目にぶら下がる子項目の数が含まれる。例えば、親項目同士の一致率は、式（１）～式（３）を用いて算出される。

　そして、ツリー構造マッピング部３２１は、比較対象となる情報がまだ有るか否かを判定する（ステップＳ２４）。比較対象となる情報がまだ有ると判定した場合（ステップＳ２４；Ｙｅｓ）、ツリー構造マッピング部３２１は、次の比較対象となる情報を抽出すべく、ステップＳ２２に移行する。

　一方、比較対象となる情報が無いと判定した場合（ステップＳ２４；Ｎｏ）、ツリー構造マッピング部３２１は、抽出した対象情報について、比較対象の中で最も（親項目同士の）一致率の高い比較対象を決定する（ステップＳ２５）。

　そして、ツリー構造マッピング部３２１は、抽出した対象情報に対して、決定した比較対象をマッピングし、マッピングした情報を出力する（ステップＳ２６）。言い換えると、ツリー構造マッピング部３２１は、対象情報の親項目に関するツリー構造に対して、対象情報の親項目との一致率が最も高い比較対象の親項目に関するツリー構造をマッピングする。すなわち、ツリー構造マッピング部３２１は、親項目同士の一致率が最も高い親項目同士のツリー構造を、構造上最も近いツリー構造であるとしてマッピングする。

　続いて、ツリー構造マッピング部３２１は、全ての対象情報の抽出およびマッピングが終了したか否かを判定する（ステップＳ２７）。全ての対象情報の抽出およびマッピングが終了していないと判定した場合（ステップＳ２７；Ｎｏ）、ツリー構造マッピング部３２１は、次の対象情報を抽出すべく、ステップＳ２１に移行する。

　一方、全ての対象情報の抽出およびマッピングが終了したと判定した場合（ステップＳ２７；Ｙｅｓ）、ツリー構造マッピング部３２１は、ツリー構造のマッピング処理を終了する。

［変更前後のツリー構造内の項目のマッピング処理］
　次に、図１１に示すＳ１５におけるマッピング処理の手順について、図１３を参照して説明する。図１３は、変更前後のツリー構造内の項目のマッピング処理の手順を示すフローチャートである。なお、項目マッピング部３２２は、ツリー構造マッピング３２１によってマッピングされた１組の変更前後のツリー構造を受け取ったとする。

　すると、項目マッピング部３２２は、ツリー構造マッピング３２１によってマッピングされた１組の変更前後のツリー構造（対象情報）を受け取る（ステップＳ３１）。ツリー構造は、親項目と子項目から構成される。そして、項目マッピング部３２２は、変更前後の対象情報内の子項目を用いて網羅的に組合せたパターンを作成する（ステップＳ３２）。

　続いて、項目マッピング部３２２は、全てのパターンから１つのパターンを抽出する（ステップＳ３３）。そして、項目マッピング部３２２は、抽出したパターンに含まれる子項目同士の一致率を、子項目の項目名および補助情報から算出する（ステップＳ３４）。補助情報には、ラベル情報、参照情報、オーダー情報が含まれる。例えば、子項目同士の一致率は、式（１）、式（４）、式（５）を用いて算出される。

　そして、項目マッピング部３２２は、抽出したパターンに含まれる全ての子項目同士の一致率の平均を算出する（ステップＳ３５）。算出した結果は、抽出したパターンに関するツリー構造全体の一致率を示す。例えば、ツリー構造全体の一致率は、式（６）を用いて算出される。

　そして、項目マッピング部３２２は、他のパターンがまだ有るか否かを判定する（ステップＳ３６）。他のパターンがまだ有ると判定した場合（ステップＳ３６；Ｙｅｓ）、項目マッピング部３２２は、次のパターンを抽出すべく、ステップＳ３３に移行する。

　一方、他のパターンが無いと判定した場合（ステップＳ３６；Ｎｏ）、項目マッピング部３２２は、ツリー構造全体の一致率が最も高いパターンを決定する（ステップＳ３７）。そして、項目マッピング部３２２は、決定したパターンに基づいて、変更前後の対象情報内の子項目同士をマッピングし、マッピングした情報を出力する（ステップＳ３８）。言い換えると、項目マッピング部３２２は、ツリー構造全体の一致率が最も高いパターンに含まれる子項目同士をマッピングする。そして、項目マッピング部３２２は、ツリー構造内の項目のマッピング処理を終了する。

［実施例の効果］
　上記実施例によれば、マッピング装置１は、変更前のＸＢＲＬデータ２１の項目間の親子関係および変更後のＸＢＲＬデータ２２の項目間の親子関係の中で最上位の親項目同士の一致率を、各親項目に関する項目情報（例えば、項目名および補助情報）を用いて算出する。そして、マッピング装置１は、算出した親項目同士の一致率に基づいて、変更前のＸＢＲＬデータ２１と変更後のＸＢＲＬデータ２２の親項目同士をマッピングする。かかる構成によれば、マッピング装置１は、親項目に関する項目情報を用いた親項目同士の一致率に基づいて、親項目同士をマッピングする。この結果、マッピング装置１は、複数の項目情報が変更された親項目と変更前の親項目とのマッピングに、項目情報を用いた親項目同士の一致率を用いることにより、複数の項目情報が変更された親項目と変更前の親項目とを最適にマッピングできる。

　上記実施例によれば、マッピング装置１は、親項目同士の項目名の一致率および親項目同士の親項目に関する補助情報の一致率を算出する。そして、マッピング装置１は、算出した各一致率の平均を算出することで、親項目同士の一致率を算出する。かかる構成によれば、マッピング装置１は、親項目の項目名および親項目に関する補助情報が変更されても、変更前後の親項目のマッピングに親項目同士の一致率を用いるので、複数の情報が変更された親項目と変更前の親項目とを最適にマッピングできる。

　上記実施例によれば、マッピング装置１は、親項目同士の項目名の一致率、親項目同士の親項目に関する補助情報の一致率、さらに、親項目同士の各親項目にぶら下がる子項目の数の一致率を算出する。そして、マッピング装置１は、算出した各一致率の平均を算出することで、親項目同士の一致率を算出する。かかる構成によれば、マッピング装置１は、親項目に関する複数の情報が変更されても、変更前後の親項目のマッピングに親項目にぶら下がる子項目の数を含んだ親項目同士の一致率を用いる。この結果、マッピング装置１は、複数の情報が変更された親項目と変更前の親項目とを最適にマッピングできる。

　上記実施例によれば、マッピング装置１は、親項目同士をマッピングした場合、マッピングした変更前のＸＢＲＬデータ２１の親項目と変更後のＸＢＲＬデータ２２の親項目にそれぞれぶら下がる子項目同士の一致率を、子項目に関する項目情報を用いて算出する。そして、マッピング装置１は、算出した子項目同士の一致率に基づいて、ＸＢＲＬデータ２１とＸＢＲＬデータ２２の子項目同士をマッピングする。かかる構成によれば、マッピング装置１は、子項目に関する項目情報を用いた子項目同士の一致率に基づいて、子項目同士をマッピングする。この結果、マッピング装置１は、複数の項目情報が変更された子項目と変更前の子項目とのマッピングに、項目情報を用いた子項目同士の一致率を用いることにより、複数の項目情報が変更された子項目と変更前の子項目とを最適にマッピングできる。例えば、マッピング装置１は、子項目の項目名と表示順序が変更されても、項目名と表示順序を含んだ子項目同士の一致率を用いることにより、変更された子項目と変更前の子項目とを最適にマッピングできる。

　上記実施例によれば、マッピング装置１は、マッピングした変更前のＸＢＲＬデータ２１の親項目と変更後のＸＢＲＬデータ２２の親項目にそれぞれぶら下がる子項目同士の組合せのパターンを複数作成する。そして、マッピング装置１は、複数作成したパターン毎に子項目同士の一致率を算出する。さらに、マッピング装置１は、パターン毎に算出された子項目同士の一致率に基づいて、変更前のＸＢＲＬデータ２１と変更後のＸＢＲＬデータ２２の子項目同士をマッピングする。かかる構成によれば、マッピング装置１は、子項目同士の組合せのパターン毎に算出された、子項目に関する項目情報を用いた子項目同士の一致率に基づいて子項目同士をマッピングするので、変更された子項目と変更前の子項目とを効率的にマッピングできる。

［プログラム等］
　なお、マッピング装置１は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置に、上記した制御部３と、記憶部２等の各機能を搭載することによって実現することができる。

　また、図示したマッピング装置１の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、マッピング装置１の分散・統合の具体的態様は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、ツリー構造マッピング３２１と項目マッピング部３２２とを１個の部として統合しても良い。一方、項目マッピング部３２２を、比較元と比較先のツリーに含まれる子項目同士の組合せのパターンを作成する作成部と、作成したパターンを用いて子項目同士をマッピングするマッピング部とに分散しても良い。また、変更前のＸＢＲＬデータ２１や変更後のＸＢＲＬデータ２２等の記憶部２をマッピング装置１の外部装置としてネットワーク経由で接続するようにしても良い。

　また、上記実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーション等のコンピュータで実行することによって実現することができる。そこで、以下では、図１に示したマッピング装置１と同様の機能を実現するマッピングプログラムを実行するコンピュータの一例を説明する。図１４は、マッピングプログラムを実行するコンピュータの一例を示す図である。

　図１４に示すように、コンピュータ２００は、各種演算処理を実行するＣＰＵ２０３と、ユーザからのデータの入力を受け付ける入力装置２１５と、表示装置２０９を制御する表示制御部２０７を有する。また、コンピュータ２００は、記憶媒体からプログラム等を読取るドライブ装置２１３と、ネットワークを介して他のコンピュータとの間でデータの授受を行う通信制御部２１７とを有する。また、コンピュータ２００は、各種情報を一時記憶するメモリ２０１と、外部記憶装置２０５を有する。そして、メモリ２０１、ＣＰＵ２０３、外部記憶装置２０５、表示制御部２０７、ドライブ装置２１３、入力装置２１５、通信制御部２１７は、バス２１９で接続されている。

　ドライブ装置２１３は、例えばリムーバブルディスク２１１用の装置である。外部記憶装置２０５は、マッピングプログラム２０５ａおよびマッピング関連情報２０５ｂを記憶する。

　ＣＰＵ２０３は、マッピングプログラム２０５ａを読み出して、メモリ２０１に展開する。マッピングプログラム２０５ａは、マッピングプロセス２０１ａとして機能する。

　例えば、マッピングプロセス２０１ａは、制御部３の各機能部に対応する。マッピング関連情報２０５ｂは、変更前のＸＢＲＬデータ２１および変更後のＸＢＲＬデータ２２に対応する。

　なお、マッピングプログラム２０５ａについては、必ずしも最初から外部記憶装置２０５に記憶させておかなくても良い。例えば、コンピュータ２００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカード等の「可搬用の物理媒体」に当該プログラムを記憶させておく。そして、コンピュータ２００がこれらからマッピングプログラム２０５ａを読み出して実行するようにしても良い。

　１　マッピング装置
　２　記憶部
　３　制御部
　２１　変更前のＸＢＲＬデータ
　２２　変更後のＸＢＲＬデータ
　３１　構造解析部
　３２　マッピング部
　３２１　ツリー構造マッピング部
　３２２　項目マッピング部
　３３　出力部
　４１　スキーマ
　４２　リンクベース
　４２１　表示リンク
　４２２　ラベルリンク
　４２３　参照リンク

Claims

　コンピュータに、
　変更前の項目を含む第１のデータの項目間の階層関係および変更後の項目を含む第２のデータの項目間の階層関係の中で最上位の親項目同士の一致率を、各項目に関する項目情報を用いて算出し、
　該算出した一致率に基づいて、前記第１のデータと前記第２のデータの親項目同士を対応付ける、
　処理を実行させることを特徴とするプログラム。
　前記親項目同士の一致率を算出する処理は、親項目同士の項目名の一致率および親項目同士の親項目に関する項目情報の一致率を算出し、該算出した各一致率の平均を算出することで、親項目同士の一致率を算出する
　処理をコンピュータに実行させることを特徴とする請求項１に記載のプログラム。
　前記親項目同士の一致率を算出する処理は、親項目同士の項目名の一致率、親項目同士の親項目に関する項目情報の一致率、さらに、親項目同士の各親項目にぶら下がる子項目の数の一致率を算出し、該算出した各一致率の平均を算出することで、親項目同士の一致率を算出する
　処理をコンピュータに実行させることを特徴とする請求項２に記載のプログラム。
　前記対応付ける処理によって親項目同士を対応付けた場合、対応付けた前記第１のデータの親項目と前記第２のデータの親項目にそれぞれぶら下がる子項目同士の一致率を、子項目に関する項目情報を用いて算出し、
　前記対応付ける処理は、
　さらに、該算出された子項目同士の一致率に基づいて、前記第１のデータと前記第２のデータの子項目同士を対応付ける
　処理をコンピュータに実行させることを特徴とする請求項３に記載のプログラム。
　前記子項目同士の一致率を算出する処理は、対応付けた前記第１のデータの親項目と前記第２のデータの親項目にそれぞれぶら下がる子項目同士の組合せのパターンを複数作成し、複数作成したパターン毎に子項目同士の一致率を算出し、
　前記対応付ける処理は、
　前記パターン毎に算出された子項目同士の一致率に基づいて、前記第１のデータと前記第２のデータの子項目同士を対応付ける
　処理をコンピュータに実行させることを特徴とする請求項４に記載のプログラム。
　変更前の項目を含む第１のデータの項目間の階層関係および変更後の項目を含む第２のデータの項目間の階層関係の中で最上位の親項目同士の一致率を、各項目に関する項目情報を用いて算出する算出部と、
　前記算出部によって算出された一致率に基づいて、前記第１のデータと前記第２のデータの親項目同士を対応付けるマッピング部と
　を有することを特徴とするマッピング装置。
　コンピュータが、
　変更前の項目を含む第１のデータの項目間の階層関係および変更後の項目を含む第２のデータの項目間の階層関係の中で最上位の親項目同士の一致率を、各項目に関する項目情報を用いて算出し、
　該算出した一致率に基づいて、前記第１のデータと前記第２のデータの親項目同士を対応付ける、
　各処理を実行することを特徴とするマッピング方法。