WO2007132524A1

WO2007132524A1 - 差分抽出プログラム、方法及び装置

Info

Publication number: WO2007132524A1
Application number: PCT/JP2006/309740
Authority: WO
Inventors: Masaya Naitou
Original assignee: Fujitsu Limited
Priority date: 2006-05-16
Filing date: 2006-05-16
Publication date: 2007-11-22

Abstract

　木構造におけるリンクの差分を容易に特定することを目的とする。そのために、複数の要素を木構造のノードとして含む複数の集合のデータを格納している記憶装置から第１の集合のデータを読み出し、第１の集合の木構造におけるリンク毎に、当該リンクの両端の要素の情報と当該リンク関係を表す情報とを含むリンク情報を抽出し、第１の集合についてのリンク情報を含む第１のリンク情報リストを記憶装置に格納する工程と、記憶装置から第２の集合のデータを読み出し、第２の集合の木構造におけるリンク毎に、リンク情報を抽出し、第２の集合についてのリンク情報を含む第２のリンク情報リストを記憶装置に格納する工程と、第１のリンク情報リスト及び第２のリンク情報リストに基づき、第１の集合と第２の集合との間におけるリンクについての差分を抽出する工程とを実行する。

Description

明細書

差分抽出プログラム、方法及び装置

技術分野

[0001] 本発明は、集合間の差分を抽出するための技術に関し、より詳しくは集合に含まれる要素間のリンクについての差分を抽出する技術に関する。

背景技術

[0002] 近年、財務情報の円滑な流通を図るため、 XML (extensible Markup Language)をベースとした XBRL (extensible Business Reporting Language)の仕様に基づいた財務データの利用が進みつつある。 XBRLでは、例えば売上高や営業利益といったデータそのものはインスタンスと呼ばれるファイルに含まれ、例えば文書構造や表示方法等はタクソノミーと呼ばれるファイルに含まれる。さらに、タクソノミーは、要素名の定義を含むスキーマファイルと要素間のリンクの定義を含むリンクベースファイルとに大別される。なお、 XBRLでは、 XLink (XML Linking Language)と呼ばれるリンク言語が採用され、リンクベースファイルにリンクの定義が記述される。 XLinkでは、要素間の表示階層及び表示順序を定義する表示リンク、要素間の計算式を定義する計算リンク、要素間の様々な関係 (例えば、親子関係等)を定義する定義リンク、要素の表示用ラベルを定義するラベルリンク、要素の根拠 (例えば、参照先等)を定義する参照リンク等を定義することができる。

[0003] 例えば、現在、 PDF (Portable Document Format)や HTML (Hyper Text Markup Language)などの形式で収集してヽる企業の財務諸表 (例えば、有価証券報告書等 )を、 XBRLで収集する場合には、公的機関（例えば、金融庁等）がタクソノミーを作成して各企業に公開し、各企業はそのタクソノミーに従ったインスタンスを提出する形式が想定される。

[0004] また、タクソノミーは、会計基準に基づいて作成されるため、会計基準が変更になるとタクソノミーも変更となる。このような場合、タクソノミー開発者はタクソノミーの差分を確認しながらタクソノミーの開発を行うことが想定される。さらに、タクソノミーは各国によって内容が異なるため、タクソノミー開発者が自国のタクソノミーと他国のタクソノミ一との差分を容易に把握できるようにする技術が望まれる。なお、各国のタクソノミーについては、インターネットく URL : http：〃 www.xbrl.org/FRTaxonomies/ >で、その一部を参照することができる。このように、 XBRLの導入検討が進むにつれ、タクソノミ一の保守などの観点力タクソノミーの差分を検出 ·表示する技術が求められている

[0005] 例えば、 GUI (Graphical User Interface)で容易にタクソノミーを生成するための技術やタクソノミーの差分を表示する技術がインターネット < URL : http：〃 interstage.fo jitsu.com/jp/xwand/catalog/index.html>で開示されている。ここでは、例えば、 XLi nkで記述された表示リンクを解析し、タクソノミーの各要素を図 20に示すような階層構造 (より具体的には木構造)で表示する。図 20の画面例では、要素を階層表示する Element列と、子要素の表示順序を示す order列とが含まれる。また、図 20で示したタクソノミー（以下、タクソノミー Aと呼ぶ）が定義されるタクソノミーファイルの一例を図 17、図 18A乃至図 18C、図 19A乃至図 19Dに示す。なお、図 17がスキーマフアイル、図 18A乃至図 18Cが 1つのリンクベースファイル（表示リンクの定義）、図 19A乃至図 19Dが 1つのリンクベースファイル（ラベルリンクの定義）をそれぞれ示している。

[0006] ここで、例えば、タクソノミー Aに「住所」という要素を追加する場合、図 17の追加箇所 1701に図 21に示す elementタグを追加し、図 18Aの追カロ箇所 1801に図 22に示す locタグ、 presentationArcタグを追加し、図 19Dの追加箇所 1901に図 23に示す loc タグ、 labelタグ、 labelArcタグを追加する（以下、「住所」という要素が追加されたタクソノミーをタクソノミー Bと呼ぶ)。すなわち、スキーマファイル（図 17)に要素が追加され、リンクベースファイル（図 18A及び図 19D)に追加された要素に関するリンクが追カロされたことになる。この場合、スキーマファイルを比較することで、タクソノミー Bに「住所」という要素の追加を検出することができ、例えば図 24に示すような画面にてタクソノミー Aとタクソノミー Bとの差分を表示する。図 24の画面例では、タクソノミー Aとタクソノミー Bとの比較結果の列と、タクソノミー Aの要素の列と、タクソノミー Bの要素の列とが含まれる。また、タクソノミー Aの要素に対応するタクソノミー Bの要素は同一行に表示される。さらに、比較結果の列に表示されている「=」マークはタクソノミー Aの要素とタクソノミー Bの要素とが同一であることを表し、「 +」マークはタクソノミー Aの要素とタクソノミー Bの要素とが異なることを表している。従って、図 24の画面例では、「住所」と、う要素がタクソノミー Bにのみ存在し、タクソノミー Aには存在しな、ことが確認できる。

[0007] また、例えば、タクソノミー Aの「財政状況」という要素を「経営成績」の配下に移動する場合、図 18Bの変更箇所 1802の presentationArcタグを図 25に示す presentatio nArcタグに変更する（以下、「財政状況」という要素を「経営成績」の配下に移動した場合のタクソノミーをタクソノミー B'と呼ぶ）。すなわち、リンクベースファイル（図 18B) の「業績財政状況」 t 、う表示リンクが、「経営成績財政状況」 t 、う表示リンクに変更されたことになる。し力しながら、現在は、タクソノミー Aとタクソノミー B'との間のリンクにつ、ての差分を検出'表示できて!/、な、ため、「財政状況」 t 、う要素の表示階層が変更になったことを容易に判断することができない。そもそも、 XBRLを含む XM L文書では、 XML文書の種類によって比較の観点が複数あり、単純にテキスト文書として比較することができな、。

[0008] 一方、階層構造を比較する技術としては、例えば、特開 2002— 366594号公報記載の技術がある。具体的には、複数の榭状図を区別がつく状態で (例えば、各榭状図における各枝が重ならないように一方の榭状図の各枝を上下左右にずらしたり、各榭状図で異なる表示色'線種を使用したりする状態で)重ねて 1つの榭状図として表示するものである。しかし、榭状図間の差分については、人間が目視により探す必要があり、膨大な榭状図に対してはあまり現実的な技術ではない。

特許文献 1：特開 2002— 366594号公報

非特許文献 1： "Financial Reporting Taxonomies "ゝ [online], XBRL INTERNATIONA し、 [平成 18年 4月 24日検索]、インターネットく URL : http：〃 www.xbri-jp.org/ > 非特許文献 2： "Interstage XWand I Interstage XWand Managerカタログ"、 [online]、平成 16年 11月、富士通株式会社、 [平成 18年 4月 24日検索]、インターネットく UR し： http:/ 1 interstage.lUjitsu.com/jp/ xwand/ catalog/ index.html >

発明の開示

発明が解決しょうとする課題

[0009] 上で述べたように、 XBRLに限らず、複数の要素を木構造のノードとして含む集合を比較する場合において、木構造におけるリンクの差分を検出しておらず、リンクの差分を容易に特定することができな、。

[0010] また、従来は、リンクの差分については、あまり用途がないため、リンクの比較を行う必要性は低力つた。しかしながら、今後、利便性の高いリンク機能 (例えば、 XLink等 )の普及により、リンクに着目して比較を行う必要性が高くなる。

[0011] 従って、本発明の目的は、木構造におけるリンクの差分を容易に特定できるようにするための技術を提供することである。

課題を解決するための手段

[0012] 本発明に係る差分抽出方法は、集合間の差分を抽出する方法であって、複数の要素を木構造のノードとして含む複数の集合のデータを格納している記憶装置力比較元となる第 1の集合のデータを読み出し、第 1の集合の木構造におけるリンク毎に、当該リンクの両端の要素の情報と当該リンク関係を表す情報とを含むリンク情報を抽出し、第 1の集合についてのリンク情報を含む第 1のリンク情報リストをリンクリスト格納部に格納する第 1のリンク情報抽出ステップと、記憶装置力比較先となる第 2の集合のデータを読み出し、第 2の集合の木構造におけるリンク毎に、リンク情報を抽出し、第 2の集合にっ、てのリンク情報を含む第 2のリンク情報リストをリンクリスト格納部に格納する第 2のリンク情報抽出ステップと、リンクリスト格納部に格納された第 1のリンク情報リスト及び第 2のリンク情報リストに基づき、第 1の集合と第 2の集合との間におけるリンクについての差分を抽出する差分抽出ステップとを含む。

[0013] このようにすれば、複数の要素を木構造のノードとして含む集合を比較する場合において、木構造におけるリンクの差分を抽出することができ、保守作業の効率を向上することができる。また、 XBRLの場合、タクソノミー開発者は、要素の追加又は削除だけでなぐリンクについての変更箇所も把握することができる。

[0014] また、第 1の集合及び第 2の集合を比較可能な形態で表示すると共に、第 1の集合と第 2の集合との間におけるリンクについての差分を強調表示するステップをさらに含むようにしてもよい。このようにすれば、木構造におけるリンクの差分を容易に特定することができる。また、例えば、 XBRLの場合、タクソノミーにおける要素の定義が 100 0を超えることもあるため、人間の目視では見落としが発生することがあり、本発明によればこれを防止することができる。

[0015] さらに、リンク関係を表す情報が、当該リンクの両端の要素間の親子関係の情報とリンクの属性情報とを含むようにしてもよい。そして、差分抽出ステップが、リンクの両端の要素間の親子関係の情報とリンクの属性情報とのうち少なくとも 1つが異なるリンク情報を、第 1の集合と第 2の集合との間におけるリンクについての差分として抽出するステップを含むようにしてもよい。このようにすれば、例えば、親要素と子要素とのリンク自体はそのままで、リンクの属性のみが変更になる場合に、木構造としては何ら変更はないが、異なるリンクとみなすことができる。

[0016] また、リンクの属性情報が、子要素の表示順序を示す情報又はリンクの両端の要素間の計算方法を示す情報の場合もある。例えば、 XBRLであれば、表示リンクの orde r属性や計算リンクの weight属性の値が異なる場合、差分として抽出することができる

[0017] さらに、要素が、 XBRLで記述された財務情報に含まれる要素の場合もある。また、第 1のリンク情報抽出ステップ及び第 2のリンク情報抽出ステップが、 XLinkで記述されたリンクを集合の木構造におけるリンクとみなし、リンク毎に、リンク情報を抽出するステップを含むようにしてもよい。さらに、 XLinkで記述されたリンク力表示リンクと計算リンクと定義リンクとラベルリンクと参照リンクとのうちいずれか 1つの場合もある。

[0018] また、要素の情報が、財務情報におけるスキーマフアイノレ名と要素名とを含むようにしてもよい。そして、差分抽出ステップが、ファイル対応情報格納部に格納され且つ比較元となる財務情報におけるスキーマファイル名と比較先となる財務情報におけるスキーマファイル名との対応関係を表す情報に基づき、第 1の集合に含まれる要素と第 2の集合に含まれる要素とが同一である力否かを判定するステップを含むようにしてもよい。このようにすれば、例えば、比較元の財務情報におけるスキーマファイル名と比較先の財務情報におけるスキーマファイル名とが異なる場合でも、ファイル名を対応付けることにより、同一のスキーマファイル名とみなすことができる。

[0019] なお、本発明に係る差分抽出方法をコンピュータに実行させるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブル 'ディスク、 CD-ROM, 光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。また、ネットワークを介してディジタル信号にて頒布される場合もある。なお、処理途中のデータについては、コンピュータのメモリ等の記憶装置に一時保管される。図面の簡単な説明

[図 1]図 1は、本発明の実施の形態に係る機能ブロック図である。

[図 2]図 2は、本発明の実施の形態に係る処理フローを示す図である。

[図 3]図 3 (a)及び (b)は、ファイル対応情報格納部に格納されるファイル対応情報の一例を示す図である。

[図 4]図 4は、構造情報格納部に格納される構造情報の一例を示す図である。

[図 5]図 5は、構造情報格納部に格納される構造情報の一例を示す図である。

[図 6]図 6は、木構造の一例を示す図である。

[図 7A]図 7Aは、リンクリスト格納部に格納されるリンク情報の一例を示す図である。

[図 7B]図 7Bは、リンクリスト格納部に格納されるリンク情報の一例を示す図である。

[図 8]図 8は、ファイル名置換処理の処理フローを示す図である。

[図 9]図 9は、比較部によるファイル名置換処理後におけるリンクリスト格納部に格納されるリンク情報の一例を示す図である。

[図 10]図 10は、差分結果の表示例を示す図である。

[図 11]図 11は、差分箇所を強調表示した表示例を示す図である。

[図 12]図 12は、差分結果の表示例を示す図である。

[図 13]図 13は、差分箇所を強調表示した表示例を示す図である。

[図 14]図 14は、木構造の一例を示す図である。

[図 15]図 15は、構造情報格納部に格納される構造情報の一例を示す図である。

[図 16]図 16は、木構造の一例を示す図である。

[図 17]図 17は、タクソノミーのスキーマファイルの一例を示す図である。

[図 18A]図 18Aは、タクソノミーのリンクベースファイルの一例を示す図である。

[図 18B]図 18Bは、タクソノミーのリンクベースファイルの一例を示す図である。

[図 18C]図 18Cは、タクソノミーのリンクベースファイルの一例を示す図である。

[図 19A]図 19Aは、タクソノミーのリンクベースファイルの一例を示す図である。

[図 19B]図 19Bは、タクソノミーのリンクベースファイルの一例を示す図である。 [図 19C]図 19Cは、タクソノミーのリンクベースファイルの一例を示す図である。

[図 19D]図 19Dは、タクソノミーのリンクベースファイルの一例を示す図である。

[図 20]図 20は、タクソノミーを階層構造で表示した画面例を示す図である。

[図 21]図 21は、変更後のタクソノミーの一例を示す図である。

[図 22]図 22は、変更後のタクソノミーの一例を示す図である。

[図 23]図 23は、変更後のタクソノミーの一例を示す図である。

[図 24]図 24は、タクソノミーの差分を表示した画面例を示す図である。

[図 25]図 25は、変更後のタクソノミーの一例を示す図である。

[図 26]図 26は、コンピュータの機能ブロック図である。

発明を実施するための最良の形態

[0021] 図 1に本発明の一実施の形態に係る差分抽出装置の機能ブロック図の一例を示す。なお、本実施の形態では、 XBRLのタクソノミーを、複数の要素を木構造のノードとして含む集合とする例を示すが、このような集合についてはタクソノミーに限られるものではない。本実施の形態に係る差分抽出装置は、タクソノミーファイル及びフアイル対応情報の入力を受け付ける入力部 1と、入力部 1が受け付けたタクソノミーフアイルを格納するタクソノミー格納部 3と、タクソノミー格納部 3に格納されたタクソノミーフアイルを分析するタクソノミー分析部 5と、タクソノミー分析部 5が分析した結果を格納する構造情報格納部 7と、構造情報格納部 7に格納された情報からリンク情報リストを生成するリンクリスト生成部 9と、リンクリスト生成部 9が生成したリンク情報リストを格納するリンクリスト格納部 11と、入力部 1が受け付けたファイル対応情報を格納するファィル対応情報格納部 13と、リンクリスト格納部 11とファイル対応情報格納部 13とに格納された情報に基づきタクソノミーを比較する比較部 15と、比較部 15が比較した結果を格納する差分情報格納部 17と、構造情報格納部 7と差分情報格納部 17とに格納された情報に基づきタクソノミー間の差分を表示する差分表示部 19とを有する。

[0022] 次に、図 1に示した差分抽出装置の処理の詳細を図 2乃至図 16を用いて説明する。図 2に、図 1に示した差分抽出装置の全体の処理フローを示す。まず、入力部 1は、比較元タクソノミー及び比較先タクソノミーの入力を受け付け、タクソノミー格納部 3に格納する (ステップ Sl)。本実施の形態では、タクソノミー Bの「財政状況」という要素を「経営成績」配下に移動した場合のタクソノミーをタクソノミー cとする。そして、比較元タクソノミーをタクソノミー A、比較先タクソノミーをタクソノミー Cとする。次に、受け付けた各々のタクソノミーにスキーマファイルが複数存在する力判定する (ステップ S 3)。もし、スキーマファイルが 1つの場合 (ステップ S3 : Noルート）、各タクソノミーにおけるスキーマファイルの対応付けは必然的に決まるため、ステップ S 7の処理に移行する。なお、図示していないが、入力部 1は、各タクソノミーのスキーマファイル名を抽出し、ファイル対応情報としてファイル対応情報格納部 13に格納する。本実施の形態では、タクソノミー Aのスキーマファイルを samplel.xsd、タクソノミー Cのスキーマファィルを sample2.xsdとする。図 3 (a)に本実施の形態（すなわち、スキーマファイルが 1 つの場合）におけるファイル対応情報の一例を示す。図 3 (a)の例では、スキーマファィル samplel.xsdとスキーマファイル sample2.xsdとが対応付けられている。一方、スキ一マファイルが複数存在する場合 (ステップ S3 : Yesルート）、入力部 1は各ファイルの対応付けが示されたファイル対応情報の入力を受け付け、ファイル対応情報格納部 13に格納する (ステップ S5)。図 3 (b)にスキーマファイルが複数存在する場合のファイル対応情報の一例を示す。図 3 (b)の例では、スキーマファイル samplel-xxx.xs dとスキーマフアイノレ sample2- xxx.xsd、スキーマフアイノレ samplel- yyy.xsdとスキーマフアイノレ sample2— yyy.xsd、 · · ·、スゃーマフアイノレ samplel— zzz.xsdとスゃーマフアイノレ sa mple2-zzz.xsdがそれぞれ対応付けられている。

次に、タクソノミー分析部 5が、各タクソノミーについて、タクソノミーの構造を分析して構造情報を生成し、構造情報格納部 7に格納する (ステップ S7)。なお、タクソノミ一の構造を分析して構造情報を生成する処理については、従来技術 (要素間の関連付けを特定して、例えば図 20の画面例における木構造を表示するためのデータを生成する処理）と同じであるため、詳細は省略する。図 4及び図 5に構造情報格納部 7に格納される構造情報の一例を示す。図 4は、図 18A乃至図 18Cで示したリンクべ一スファイルに記述される表示リンクを分析して生成された構造情報の一例である。図 4の例では、要素毎に要素情報へのポインタと属性情報と子要素へのポインタとを保持する。このように、親要素が子要素へのポインタを持つデータ構造となっており、表示リンクの親子関係を示すことができる。例えば、「財務諸表」は、子要素として「文書情報」及び「業績」を持つ。さらに、「文書情報」及び「業績」は表示リンクの属性情報である order属性の値を保持する。表示リンクにおける order属性は、兄弟関係にある要素 (すなわち、同じ親要素を持つ子要素間）の表示順序を指定するものであり、図 4の例では、「文書情報」（order=1.0)、「業績」（order=2.0)の順に表示されることを示す。また、図 5は、要素情報とラベル情報との関係を示すものである。図 5の例では、要素情報には要素名、要素の型情報、属性情報、ラベル情報へのポインタが含まれ、ラベル情報には日本語の表示名、英語の表示名が含まれる。なお、ラベル情報には、英語以外の外国語の表示名を含む場合もある。図 20で示した画面例は、図 4 及び図 5に示した構造情報を基に作成される。また、図 4及び図 5に示した構造情報力図 6に示すような木構造を表示することも可能である。

次に、リンクリスト生成部 9が、各タクソノミーについて、構造情報からリンク情報を抽出してリンク情報リストを生成し、リンクリスト格納部 11に格納する (ステップ S 9)。リンクリスト生成部 9は、構造情報格納部 7に格納される構造情報を、図 6で示したような木構造とみなし、木構造におけるリンク毎にリンク情報を抽出する。なお、本実施の形態では、リンク情報を (親要素名，子要素名，親子）と示す。例えば、図 6に示した木構造の場合、リンク情報として (財務諸表，文書情報，親子)、（財務諸表，業績，親子)、（文書情報，表題，親子)、（文書情報，年月日，親子)、（文書情報，会社名，親子)、（業績，経営成績，親子)、（業績，財政状況，親子)、（経営成績，売上高，親子)、（経営成績，営業利益，親子)、（経営成績，経常利益，親子)、（財政状況，総資産，親子)、（財政状況，株主資本，親子)が抽出される。なお、ここでは、説明の便宜上、親要素名及び子要素名を図 6で示される各要素名としたが、実際には、図 5 に示した要素情報の要素名（例えば、財務諸表であれば samplel.xsd#statements)が抽出される。このようにして抽出されたリンク情報リストの一例を図 7A及び図 7Bに示す。図 7Aはタクソノミー Aのリンク情報リスト、図 7Bはタクソノミー Cのリンク情報リストを示す。なお、図 5に示した要素情報の要素名（例えば、 samplel.xsd#statements)は、 XPointer (XML Pointer Language)と呼ばれるリンク言語に基づく表記方法である。 XPointerは XLinkと共に使用されるリンク言語で、例えば、 XLinkで定義されるリンクの両端の要素を指定する場合に用いられる。 samplel.xsd#statementsのように、ファイル名と要素の ID属性の値とを「#」で結びつけて記述する。

[0025] 次に、比較部 15が、ファイル対応情報格納部 13に格納されたファイル対応情報に基づきファイル名置換処理を実施する (ステップ S 11)。ファイル名置換処理につ!、ては、図 8を用いて説明する。まず、ファイル対応情報から、比較元タクソノミーの未処理の置換元スキーマファイル名を抽出する (ステップ S 17)。次に、ファイル対応情報を参照し、抽出した置換元スキーマファイル名に対応する、比較先タクソノミーの置換先スキーマファイル名を特定する (ステップ S 19)。そして、比較元タクソノミーのリンク情報リスト内の置換元スキーマファイル名を置換先スキーマファイル名で置換する (ステツプ S21)。本実施の形態では、タクソノミー Aとタクソノミー Cとのファイル対応情報は図 3 (a)に示した内容であり、置換元スキーマファイルとして samplel.xsdが抽出され、 sample2.xsdが置換先スキーマファイル名として特定される。そして、例えば、（sampl e丄 .xsd#statements, samplel.xsd#statements.aocumentInformation, |¾十ノとヽっタクソノミー Aのリンク情報は、 samplel.xsdが sample2.xsdに置換されるため、（sample2.xsd# statements, sample2.xsdffstatements.documentInformation,親子)とヽっリンク ffr報になる。次に、比較元タクソノミーのスキーマファイル名を全て置換した力判定する (ステップ S23)。もし、置換してないスキーマファイル名がある場合 (ステップ S23 : Noルート）、ステップ S 17の処理に戻る。一方、スキーマファイル名を全て置換した場合 (ステップ S23 : Yesルート）、ファイル名置換処理を終了して元の処理に戻る。なお、フアイル名置換処理後のタクソノミー Aのリンク情報リストを図 9に示す。本実施の形態では、比較元タクソノミーのスキーマファイル名を比較先タクソノミーのファイル名で置換しているが、置換元と置換先が逆になつてもよい。

[0026] 一般的に、タクソノミーのファイル名は各国毎に異なる力要素の ID属性の値 (例えば、 statements)は英語による表記となっている。従って、 XPointerによる表記の場合、このようなファイル名置換処理を実施することで、各国毎のファイル名の差異を意識せずに、以下で説明するリンク情報リストの比較を行うことができる。

[0027] 図 2の処理フローの説明に戻って、比較部 15が、比較元タクソノミーのリンク情報リストと比較先タクソノミーのリンク情報リストとを比較して差分を抽出し、差分情報格納部 17に格納する (ステップ S13)。具体的には、同一のリンク情報 (すなわち、親要素名、子要素名、親子関係が全て一致するリンク情報）が比較元タクソノミーのリンク情報リスト及び比較先タクソノミーのリンク情報リストにそれぞれ存在する力否かを判定し、いずれかのリンク情報リストにのみ存在するリンク情報を抽出する。本実施の形態では、図 9に示したファイル名置換処理後のタクソノミー Aのリンク情報リストと図 7Bに示したタクソノミー Cのリンク情報リストとが比較され、図 7Bのリンク情報 701及びリンク情報 702、図 9のリンク情報 901が差分として抽出される。リンク情報 701は、タクソノミ一 Cに「住所」の追カ卩による差分であり、リンク情報 702及びリンク情報 901は、「財政状況」の表示階層の変更による差分である。なお、リンク情報 701、リンク情報 702及びリンク情報 901における下線部は、追加又は変更箇所を示す。

[0028] 次に、差分表示部 19は、構造情報格納部 7と差分情報格納部 17とに格納された情報に基づきタクソノミー間の差分を表示装置等に表示する (ステップ S15)。図 10 に、タクソノミー間の差分を一覧表示した画面例を示す。図 10の画面例では、タクソノミー Aにおける差分としてリンク情報 901、タクソノミー Cにおける差分としてリンク情報 701及びリンク情報 702を表示している。なお、各リンク情報における親要素名及び子要素名は、ラベル情報の日本語の表示名に置き換えて表示している力 XPointe rによる表記で表示するようにしてもよい。図 11に、各タクソノミーを木構造で表示すると共に、差分を強調表示した画面例を示す。図 11の例では、タクソノミー Aにおける「業績一財政状況」のリンク（リンク情報 901に相当）、タクソノミー Cにおける「文書情報 —住所」のリンク（リンク情報 701に相当）及び「経営成績-財政状況」のリンク（リンク情報 702に相当）を点線で表示している。

[0029] このようにすれば、木構造におけるリンクの差分を抽出することができ、リンクの差分を容易に特定することができる。また、図 10及び図 11を同時に表示し、例えば、利用者が図 10の一覧力も特定の要素名を選択した場合に、図 11の木構造上の対応する要素を強調表示するようにしてもよい。このようにすれば、例えば、「住所」を選択した場合、タクソノミー C側のみ強調表示されることになり、要素の追カ卩による差分である力要素の表示階層の変更による差分であるかを容易に特定することができる。

[0030] また、上で説明したステップ S9では、親要素名、子要素名、親子をリンク情報として抽出したが、リンク情報に属性情報を含むようにしてもよい。以下では、表示リンクにおける order属性をリンク情報に含む場合について説明する。なお、属性情報を含むリンク情報を (親要素名，子要素名，親子:属性情報)と示す。例えば、図 6に示した木構造において、兄弟関係にある要素 (例えば、「表題」と「年月日」と「会社名」）の中で一番上に表示されて、る要素（すなわち、「表題」）の order属性の値力 1.0であり、続いて上から順に 2.0、 3.0、 · · ·といったように order属性の値が与えられているものとする。また、図 6に示した「文書情報」の order属性の値 (order=1.0)と「業績」の order 属性の値 (order=2.0)とを入れ替えた場合のタクソノミーをタクソノミー A'とする。

[0031] この場合、ステップ S9の処理を実施すると、タクソノミー Aのリンク情報として (財務諸表，文書情報，親子: order=1.0)、（財務諸表，業績，親子: order=2.0)、（文書情報，表題，親子: order=1.0)、（文書情報，年月日，親子: _Order=2.0)、（文書情報，会社名，親子: order=3.0)、（業績，経営成績，親子: order=1.0)、（業績，財政状況，親子: order=2.0)、（経営成績，売上高，親子: order=1.0)、（経営成績，営業利益，親子: order=2.0)、（経営成績，経常利益，親子: order=3.0)、（財政状況，総資産，親子: order=1.0)、（財政状況，株主資本，親子: order=2.0)が抽出される。さらにタクソノミー A'のリンク情報として (財務諸表，文書情報，親子: order=2.0)、（財務諸表，業績，親子: order=1.0)、（文書情報，表題，親子: _Order=1.0)、（文書情報，年月日，親子: order=2.0)、（文書情報，会社名，親子: order=3.0)、（業績，経営成績，親子: ord er=1.0)、（業績，財政状況，親子: order=2.0)、（経営成績，売上高，親子: order=1.0 ) , (経営成績，営業利益，親子: order=2.0)、（経営成績，経常利益，親子: order=3. 0)、（財政状況，総資産，親子: order=1.0)、（財政状況，株主資本，親子: order=2.0 )が抽出される。

[0032] そして、ステップ S 13の処理を実施すると、タクソノミー Aのリンク情報 (財務諸表，文書情報，親子: order=1.0)及び (財務諸表，業績，親子: order=2.0)、タクソノミー A, のリンク情報 (財務諸表，文書情報，親子: order=2.0)及び (財務諸表，業績，親子 rder=1.0)が差分として抽出される。ここでは、タクソノミー Aの（財務諸表，文書情報，親子： order=1.0)とタクソノミー A'の（財務諸表，文書情報，親子： order=2.0)、タクソノミー Aの (財務諸表，業績，親子: order=2.0)とタクソノミー A，の (財務諸表，業績，親子: order=1.0)は、親要素名、子要素名、親子関係については一致しているため、属性情報のみに差分があるリンク情報として差分情報格納部 17に格納する。タクソノミー Aとタクソノミー A'との差分を表示した画面例を図 12及び図 13に示す。図 12の画面例では、「」の列が設けられており、属性情報のみに差分があるリンク情報を表示してしている。本実施の形態では、 order属性の値は表示していないが、必要に応じて表示するようにしてもよい。また、図 13の画面例では、タクソノミー A及びタクソノミ一 A'において、「財務諸表—文書情報」のリンク、「財務諸表—業績」のリンクを点線で表示している。このようにすれば、親子関係は同一だが、属性情報が異なるようなリンクの差分にっ、ても容易に特定することができる。

[0033] さらに、図 4で説明した構造情報は、リンクベースファイルに記述される表示リンクを分析して生成された構造情報であるが、計算リンクの場合にも適用できる。以下では、図 14に示すような木構造の計算リンクについて説明する。この場合、ステップ S7の処理を実施すると、図 15に示すような構造情報が生成される。図 15の例では、図 4と同じデータ構造を持ち、属性情報として weight属性の値を保持する。 weight属性とは、子要素の値力親要素の値を計算する場合における、子要素の値の重みを指定するための属性である。例えば、 weight属性の値が 1の場合は子要素の値を親要素の値に加算、 weight属性が 2の場合は子要素の値を 2倍した値を親要素の値に加算、 weight属性の値が― 1の場合は子要素の値を— 1倍した値を親要素に加算 (すなわち、親要素の値力も子要素の値を減算)する。従って、図 15の例では、「売上総利益 =売上高売上原価」となり、さらに売上原価は「売上原価 =期首棚卸高 +当期製造原価一期末棚卸高」となる。そして、データ構造が表示リンクの場合と同じであるため、ステップ S9乃至ステップ S 15の処理を実施すればよい。なお、ステップ S9乃至ステップ S15の処理については、上で述べた処理と同様であるため、ここでは説明を省略する。このようにすれば、計算リンクの差分についても容易に特定することができる。

[0034] また、ラベルリンクについても図 16に示すような木構造とみなし、上で述べたような処理をすることで、差分を特定することができる。また、図示していないが、定義リンク、参照リンクについても同様に処理することができる。

[0035] さらに、ステップ S9の処理で抽出する属性情報を指定できるようにしてもよい。若しくは、ステップ S 9の処理では全ての属性情報を抽出するようにし、ステップ S 13の処理で比較する属性情報を指定できるようにしてもよい。このようにすれば、目的に応じた適切な比較を行うことができる。

[0036] 以上述べたように、本実施の形態によれば、複数の要素を木構造のノードとして含む集合を比較する場合に、要素の差分 (例えば、要素の追加又は削除)だけでなぐ要素間のリンクの差分も容易に特定することができる。

[0037] 以上本発明の一実施の形態について説明したが、本発明はこれに限定されるものではない。例えば、 XBRLのタクソノミーに限らず、要素間にリンクが存在し、木構造とみなすことができるような場合について適用可能である。例えば、インターネット上の Webページを木構造のノード、 Webページ間のハイパーリンクをリンクとみなすことにより、 Webサイトのリンク構造を比較することができる。また、フローチャートにおける各記号 (例えば、端子記号、判断記号等）を木構造のノード、記号間を結ぶ線をリンクとみなすことで、フローチャート同士を比較することができる。なお、ノード間のリンクは親子関係に限らず、兄弟関係等のリンクであってもよい。

[0038] また、図 1に示した機能ブロック図は、一例であって、必ずしも実際のプログラムモジュールの構成に合致しない場合もある。さらに、処理結果が変わらない範囲において処理順番の入れ替えが可能なステップも存在する。

[0039] さらに、上で述べた差分抽出装置は、図 26のようなコンピュータ装置であって、メモリ 2501 (記憶装置）と CPU2503 (処理装置）とハードディスク 'ドライブ (HDD) 2505 と表示装置 2509に接続される表示制御部 2507とリムーバブル'ディスク 2511用のドライブ装置 2513と入力装置 2515とネットワークに接続するための通信制御部 251 7とがバス 2519で接続されている。オペレーティング 'システム（OS : Operating Syste m)及び本実施の形態における処理を実施するためのアプリケーション 'プログラムは、 HDD2505に格糸内されており、 CPU2503により実行される際には HDD2505力らメモリ 2501に読み出される。必要に応じて CPU2503は、表示制御部 2507、通信制御部 2517、ドライブ装置 2513を制御して、必要な動作を行わせる。また、処理途中のデータについては、メモリ 2501に格納され、必要があれば HDD2505に格納される。本発明の実施の形態では、上で述べた処理を実施するためのアプリケーション 'プログラムはリムーバブル.ディスク 2511に格納されて頒布され、ドライブ装置 251 3から HDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部 2517を経由して、 HDD2505にインストールされる場合もある。このようなコンビユータ装置は、上で述べた CPU2503、メモリ 2501などのハードウェアと OS及び必要なアプリケーション 'プログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。

Claims

請求の範囲

[1] 集合間の差分を抽出する処理をコンピュータに実行させるためのプログラムであつて、

複数の要素を木構造のノードとして含む複数の集合のデータを格納している記憶装置力比較元となる第 1の集合のデータを読み出し、前記第 1の集合の木構造におけるリンク毎に、当該リンクの両端の要素の情報と当該リンク関係を表す情報とを含むリンク情報を抽出し、前記第 1の集合についての前記リンク情報を含む第 1のリンク情報リストをリンクリスト格納部に格納する第 1のリンク情報抽出ステップと、

前記記憶装置から比較先となる第 2の集合のデータを読み出し、前記第 2の集合の木構造におけるリンク毎に、前記リンク情報を抽出し、前記第 2の集合についての前記リンク情報を含む第 2のリンク情報リストを前記リンクリスト格納部に格納する第 2のリンク情報抽出ステップと、

前記リンクリスト格納部に格納された前記第 1のリンク情報リスト及び前記第 2のリンク情報リストに基づき、前記第 1の集合と前記第 2の集合との間におけるリンクについての差分を抽出する差分抽出ステップと、

をコンピュータに実行させるための差分抽出プログラム。

[2] 前記第 1の集合及び前記第 2の集合を比較可能な形態で表示すると共に、前記第 1の集合と前記第 2の集合との間におけるリンクにつ、ての差分を強調表示するステップをさらに実行させる

請求項 1記載の差分抽出プログラム。

[3] 前記リンク関係を表す情報が、当該リンクの両端の要素間の親子関係の情報とリンクの属性情報とを含み、

前記差分抽出ステップが、

前記リンクの両端の要素間の親子関係の情報と前記リンクの属性情報とのうち少なくとも 1つが異なる前記リンク情報を、前記第 1の集合と前記第 2の集合との間におけるリンクについての差分として抽出するステップを含む

請求項 1記載の差分抽出プログラム。

[4] 前記リンクの属性情報が、子要素の表示順序を示す情報又は前記リンクの両端の要素間の計算方法を示す情報である

ことを特徴とする請求項 3記載の差分抽出プログラム。

[5] 前記要素が、 XBRLで記述された財務情報に含まれる要素である

ことを特徴とする請求項 1記載の差分抽出プログラム。

[6] 前記第 1のリンク情報抽出ステップ及び第 2のリンク情報抽出ステップが、

XLinkで記述されたリンクを前記集合の木構造におけるリンクとみなし、リンク毎に、前記リンク情報を抽出するステップを含む

請求項 5記載の差分抽出プログラム。

[7] 前記 XLinkで記述されたリンク力表示リンクと計算リンクと定義リンクとラベルリンクと参照リンクとのうちいずれか 1つである

ことを特徴とする請求項 6記載の差分抽出プログラム。

[8] 前記要素の情報が、前記財務情報におけるスキーマファイル名と要素名とを含み、前記差分抽出ステップが、

ファイル対応情報格納部に格納され且つ比較元となる前記財務情報におけるスキ一マファイル名と比較先となる前記財務情報におけるスキーマファイル名との対応関係を表す情報に基づき、前記第 1の集合に含まれる要素と前記第 2の集合に含まれる要素とが同一である力否かを判定するステップを含む、

請求項 5記載の差分抽出プログラム。

[9] 複数の要素を木構造のノードとして含む複数の集合のデータを格納して、る記憶装置とリンクリスト格納部とを有するコンピュータに実行される差分抽出方法であって前記記憶装置から比較元となる第 1の集合のデータを読み出し、前記第 1の集合の木構造におけるリンク毎に、当該リンクの両端の要素の情報と当該リンク関係を表す情報とを含むリンク情報を抽出し、前記第 1の集合についての前記リンク情報を含む第 1のリンク情報リストを前記リンクリスト格納部に格納する第 1のリンク情報抽出ステツプと、

を含む差分抽出方法。

集合間の差分を抽出する差分抽出装置であって、

複数の要素を木構造のノードとして含む複数の集合のデータを格納している記憶装置と、

前記記憶装置から比較元となる第 1の集合のデータを読み出し、前記第 1の集合の木構造におけるリンク毎に、当該リンクの両端の要素の情報と当該リンク関係を表す情報とを含むリンク情報を抽出し、前記第 1の集合についての前記リンク情報を含む第 1のリンク情報リストをリンクリスト格納部に格納する第 1のリンク情報抽出手段と、前記記憶装置から比較先となる第 2の集合のデータを読み出し、前記第 2の集合の木構造におけるリンク毎に、前記リンク情報を抽出し、前記第 2の集合についての前記リンク情報を含む第 2のリンク情報リストを前記リンクリスト格納部に格納する第 2のリンク情報抽出手段と、

前記リンクリスト格納部に格納された前記第 1のリンク情報リスト及び前記第 2のリンク情報リストに基づき、前記第 1の集合と前記第 2の集合との間におけるリンクについての差分を抽出する差分抽出手段と、

を有する差分抽出装置。