WO2007132524A1 - 差分抽出プログラム、方法及び装置 - Google Patents

差分抽出プログラム、方法及び装置 Download PDF

Info

Publication number
WO2007132524A1
WO2007132524A1 PCT/JP2006/309740 JP2006309740W WO2007132524A1 WO 2007132524 A1 WO2007132524 A1 WO 2007132524A1 JP 2006309740 W JP2006309740 W JP 2006309740W WO 2007132524 A1 WO2007132524 A1 WO 2007132524A1
Authority
WO
WIPO (PCT)
Prior art keywords
link
information
difference
link information
list
Prior art date
Application number
PCT/JP2006/309740
Other languages
English (en)
French (fr)
Inventor
Masaya Naitou
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to PCT/JP2006/309740 priority Critical patent/WO2007132524A1/ja
Publication of WO2007132524A1 publication Critical patent/WO2007132524A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents

Definitions

  • the present invention relates to a technique for extracting a difference between sets, and more particularly to a technique for extracting a difference regarding links between elements included in a set.
  • XBRL extensible Business Reporting Language
  • XML extensible Markup Language
  • data such as sales and operating profit are included in a file called an instance.
  • the document structure and display method are included in a file called a taxonomy.
  • taxonomies are broadly divided into schema files that contain definition of element names and link base files that contain definitions of links between elements.
  • XBRL employs a link language called XLink (XML Linking Language), and the link definition is described in the link base file.
  • XLink display links that define the display hierarchy and display order between elements, calculation links that define calculation formulas between elements, definition links that define various relationships between elements (for example, parent-child relationships), element links It is possible to define a label link that defines a display label and a reference link that defines the basis of an element (for example, a reference destination).
  • taxonomy is created based on the accounting standard, the taxonomy is also changed when the accounting standard is changed. In such a case, it is assumed that the taxonomy developer develops the taxonomy while checking the taxonomy differences. Furthermore, because taxonomy varies from country to country, taxonomy developers can use their own taxonomy and taxonomy in other countries. A technique that makes it possible to easily grasp the difference from one is desired. Some taxonomy in each country can be found at the Internet URL: http: ⁇ www.xbrl.org/FRTaxonomies/>. In this way, as XBRL introduction studies proceed, the ability to detect and display taxonomy differences is required, including maintenance of taxonomy.
  • the technology for easily generating taxonomies using GUI (Graphical User Interface) and the technology for displaying taxonomic differences is the Internet ⁇ URL: http: httpinterstage.fo jitsu.com/jp/xwand/catalog /index.html>.
  • a display link described in XLink is analyzed, and each element of the taxonomy is displayed in a hierarchical structure (more specifically, a tree structure) as shown in FIG.
  • the screen example in FIG. 20 includes an Element column that displays elements in a hierarchy and an order column that indicates the display order of child elements. Examples of taxonomy files in which the taxonomy shown in FIG.
  • FIGS. 17, 18A to 18C, and 19A to 19D show a schema file
  • FIGS. 18A to 18C show one link base file (display link definition)
  • FIG. 19A to 19D show one link base file (label link definition).
  • the element tag shown in Fig. 21 is added to the additional location 1701 in Fig. 17, and the additional calorie location 1801 in Fig. 18A is shown in Fig. 22
  • Add the loc tag and presentationArc tag shown in Fig. 19D and add the loc tag, label tag, and labelArc tag shown in Fig. 23 to the added part 1901 in Fig. 19D (the taxonomy with the element "address" added to the taxonomy B). Called).
  • elements are added to the schema file (Fig. 17), and links related to the elements added to the link base file (Figs. 18A and 19D) are added.
  • the difference between taxonomy A and taxonomy B is displayed on the screen shown in FIG. To do.
  • the screen example of FIG. 24 includes a comparison result column between taxonomy A and taxonomy B, a column of taxonomy A elements, and a column of taxonomy B elements.
  • the elements of taxonomy B corresponding to the elements of taxonomy A are displayed on the same line.
  • Patent Document 1 JP 2002-366594 A
  • Non-patent document 1 “Financial Reporting Taxonomies” ⁇ [online], XBRL INTERNATIONA [searched 24 April 2006], Internet URL: http: ⁇ www.xbri-jp.org/>
  • Non-patent document 2 "Interstage XWand I Interstage XWand Manager Catalog", [online], November 2004, Fujitsu Limited, [searched April 24, 2006], Internet UR: http: / 1 interstage.lUjitsu.com / jp / xwand / catalog / index.html>
  • a set including a plurality of elements as nodes of a tree structure not limited to XBRL.
  • the link difference in the tree structure is not detected, and the link difference cannot be easily identified.
  • an object of the present invention is to provide a technique for easily specifying a link difference in a tree structure.
  • a difference extraction method is a method for extracting a difference between sets, and is a storage device power comparison that stores data of a plurality of sets including a plurality of elements as nodes of a tree structure. Read the data of the original first set, extract link information including information on the elements at both ends of the link and information indicating the link relation for each link in the tree structure of the first set.
  • the first link information extraction step for storing the first link information list including the link information for the set of the second set in the link list storage unit, the data of the second set as the storage device comparison destination is read, and the second set A second link information extraction step for extracting link information for each link in the tree structure of the set and storing a second link information list including the link information in the second set in the link list storage unit.
  • link A difference extraction step for extracting a difference between the first set and the second set based on the first link information list and the second link information list stored in the list storage unit. .
  • the method may further include a step of displaying the first set and the second set in a form that can be compared, and further highlighting a difference regarding the link between the first set and the second set. Also good. In this way, the link difference in the tree structure can be easily identified.
  • the definition of elements in the taxonomy may exceed 1000, so oversight may occur with human eyes. According to this, this can be prevented.
  • the information indicating the link relationship may include information on a parent-child relationship between elements at both ends of the link and link attribute information.
  • the difference extraction step obtains link information in which at least one of the parent-child relationship information between the elements at both ends of the link and the attribute information of the link is different, for the link between the first set and the second set. You may make it include the step extracted as a difference. In this way, for example, when the link between the parent element and the child element remains unchanged and only the link attribute is changed, the tree structure is not changed at all, but it can be regarded as a different link. it can.
  • the link attribute information may be information indicating a display order of child elements or information indicating a calculation method between elements at both ends of the link. For example, in the case of XBRL, if the value of the orde r attribute of the display link or the weight attribute of the calculation link is different, it can be extracted as a difference.
  • the element may be an element included in financial information described in XBRL.
  • the first link information extraction step and the second link information extraction step may include a step in which links described in XLink are regarded as links in a set tree structure, and link information is extracted for each link. Good. Furthermore, there may be one of the link force display link, calculation link, definition link, label link, and reference link described in XLink.
  • the element information may include a schema name and an element name in the financial information.
  • the difference extraction step is based on the information stored in the file correspondence information storage unit and representing the correspondence between the schema file name in the financial information as the comparison source and the schema file name in the financial information as the comparison destination.
  • a step of determining whether or not the elements included in the set and the elements included in the second set are the same may be included. In this way, for example, even if the schema file name in the financial information of the comparison source and the schema file name in the financial information of the comparison destination are different, it can be regarded as the same schema file name by associating the file names. .
  • a program for causing a computer to execute the differential extraction method according to the present invention can be created, such as a flexible disk, CD-ROM, magneto-optical disk, semiconductor memory, hard disk, etc. Stored in a storage medium or storage device It is. In some cases, digital signals are distributed over a network. Note that the data being processed is temporarily stored in a storage device such as a computer memory.
  • FIG. 1 is a functional block diagram according to an embodiment of the present invention.
  • FIG. 2 is a diagram showing a processing flow according to the embodiment of the present invention.
  • FIG. 3 (a) and (b) are diagrams showing an example of file correspondence information stored in the file correspondence information storage unit.
  • FIG. 4 is a diagram showing an example of structure information stored in a structure information storage unit.
  • FIG. 5 is a diagram showing an example of structure information stored in a structure information storage unit.
  • FIG. 6 is a diagram showing an example of a tree structure.
  • FIG. 7A is a diagram showing an example of link information stored in a link list storage unit.
  • FIG. 7B is a diagram showing an example of link information stored in the link list storage unit.
  • FIG. 8 is a diagram showing a processing flow of file name replacement processing.
  • FIG. 9 is a diagram showing an example of link information stored in the link list storage unit after the file name replacement process by the comparison unit.
  • FIG. 10 is a diagram showing a display example of a difference result.
  • FIG. 11 is a diagram showing a display example in which a difference portion is highlighted.
  • FIG. 12 is a diagram showing a display example of a difference result.
  • FIG. 13 is a diagram showing a display example in which a difference portion is highlighted.
  • FIG. 14 is a diagram showing an example of a tree structure.
  • FIG. 15 is a diagram showing an example of structure information stored in a structure information storage unit.
  • FIG. 16 is a diagram showing an example of a tree structure.
  • FIG. 17 is a diagram showing an example of a taxonomy schema file.
  • FIG. 18A is a diagram showing an example of a taxonomy link base file.
  • FIG. 18B is a diagram showing an example of a taxonomy link base file.
  • FIG. 18C is a diagram showing an example of a taxonomy link base file.
  • FIG. 19A is a diagram showing an example of a taxonomy link base file.
  • FIG. 19B is a diagram showing an example of a taxonomy link base file.
  • FIG. 19C is a diagram showing an example of a taxonomy link base file.
  • FIG. 19D is a diagram showing an example of a taxonomy link base file.
  • FIG. 20 is a diagram showing a screen example in which taxonomies are displayed in a hierarchical structure.
  • FIG. 21 is a diagram showing an example of the taxonomy after the change.
  • FIG. 22 is a diagram showing an example of the taxonomy after the change.
  • FIG. 23 is a diagram showing an example of the taxonomy after the change.
  • FIG. 24 is a diagram showing an example of a screen displaying taxonomy differences.
  • FIG. 25 is a diagram showing an example of the taxonomy after the change.
  • FIG. 26 is a functional block diagram of a computer.
  • FIG. 1 shows an example of a functional block diagram of a difference extraction device according to an embodiment of the present invention.
  • the difference extraction apparatus includes an input unit 1 that receives input of taxonomy files and file correspondence information, a taxonomy storage unit 3 that stores taxonomy files received by the input unit 1, and a taxonomy storage unit 3.
  • the taxonomy analysis unit 5 that analyzes the stored taxonomy file, the structure information storage unit 7 that stores the results analyzed by the taxonomy analysis unit 5, and the link information list that is generated from the information stored in the structure information storage unit 7
  • a link list generation unit 9 a link list storage unit 11 for storing the link information list generated by the link list generation unit 9, a file correspondence information storage unit 13 for storing the file correspondence information received by the input unit 1, Comparison unit that compares taxonomy based on information stored in link list storage unit 11 and file correspondence information storage unit 13 15 and a difference information storage unit 17 that stores the results of comparison by the comparison unit 15, and a difference display that displays differences between taxonomies based on information stored in the structure information storage unit 7 and the difference information storage unit 17 Part 19.
  • the input unit 1 accepts inputs of a comparison source taxonomy and a comparison destination taxonomy and stores them in the taxonomy storage unit 3 (step Sl).
  • taxonomy B's “financial status” element Let taxonomy be the taxonomy when moving to “Business Results”.
  • the comparison taxonomy is taxonomy A, and the comparison taxonomy is taxonomy C.
  • it is determined whether there is a plurality of schema files in each accepted taxonomy (step S3).
  • step S3 No route
  • the mapping of the schema file in each taxonomy is inevitably determined, so the process proceeds to step S7.
  • the input unit 1 extracts the schema file name of each taxonomy and stores it in the file correspondence information storage unit 13 as file correspondence information.
  • the taxonomy A schema file is samplel.xsd
  • the taxonomy C schema file is sample2.xsd.
  • FIG. 3 (a) shows an example of file correspondence information in this embodiment (that is, when there is one schema file). In the example of Fig. 3 (a), the schema file samplel.xsd and the schema file sample2.xsd are associated.
  • Step S3 when there are multiple schema files (step S3: Yes route), the input unit 1 accepts input of file correspondence information indicating the association of each file and stores it in the file correspondence information storage unit 13 ( Step S5).
  • Figure 3 (b) shows an example of file correspondence information when there are multiple schema files.
  • the schema file samplel-xxx.xs d and schema file sampler sample2- xxx.xsd, schema file sampler samplel-yyy.xsd and schema file sampler sample2—yyy.xsd, ... -Mafuinore samplel—Zzz.xsd and Sumafuainole sample2-zzz.xsd are associated with each other.
  • the taxonomy analysis unit 5 analyzes the structure of the taxonomy for each taxonomy, generates structure information, and stores it in the structure information storage unit 7 (step S7).
  • the process of generating structure information by analyzing the structure of a taxonomy the conventional technology (identifying the association between elements and generating data for displaying the tree structure in the screen example of Fig. 20, for example) The details are omitted here. 4 and 5 show an example of the structure information stored in the structure information storage unit 7.
  • FIG. FIG. 4 is an example of the structure information generated by analyzing the display link described in the link base file shown in FIGS. 18A to 18C. In the example shown in Fig.
  • FIG. 4 shows the relationship between element information and label information.
  • the parent element has a data structure having pointers to the child elements, and can indicate the parent-child relationship of the display link.
  • “Financial Statement” has “Sentence” as a child element.
  • Document information "and” results ".
  • “document information” and “performance” hold the value of the order attribute which is the attribute information of the display link.
  • the order attribute in the display link specifies the display order of sibling elements (that is, between child elements that have the same parent element).
  • “document information” (order 1.0)
  • Resultss” (order 2.0).
  • FIG. 5 shows the relationship between element information and label information.
  • FIG. 5 shows the relationship between element information and label information.
  • the element information includes element names, element type information, attribute information, and pointers to label information
  • the label information includes Japanese display names and English display names.
  • the label information may include display names in foreign languages other than English.
  • the screen example shown in FIG. 20 is created based on the structure information shown in FIGS.
  • the structure information shown in FIGS. 4 and 5 can be displayed as shown in FIG.
  • the link list generation unit 9 extracts link information from the structure information for each taxonomy, generates a link information list, and stores it in the link list storage unit 11 (step S9).
  • the link list generation unit 9 regards the structure information stored in the structure information storage unit 7 as a tree structure as shown in FIG. 6, and extracts link information for each link in the tree structure.
  • the link information is indicated as (parent element name, child element name, parent / child).
  • the link information includes (financial statements, document information, parent and child), (financial statements, performance, parent and child), (document information, title, parent and child), (document information, date and time).
  • Fig. 7A shows the link information list for taxonomy A
  • Fig. 7B shows the link information list for taxonomy C.
  • the element name (for example, samplel.xsd # statements) of the element information shown in FIG. 5 is a notation method based on a link language called XPointer (XML Pointer Language).
  • XPointer is a link language used with XLink, and is used, for example, to specify elements at both ends of a link defined by XLink.
  • Like samplel.xsd # statements Describe the file name by linking the element ID attribute value with "#".
  • the comparison unit 15 performs a file name replacement process based on the file correspondence information stored in the file correspondence information storage unit 13 (step S 11).
  • the file name replacement process will be described with reference to FIG.
  • the unprocessed replacement source schema file name of the comparison source taxonomy is extracted from the file correspondence information (step S17).
  • the file correspondence information is referred to, and the replacement destination schema file name of the comparison destination taxonomy corresponding to the extracted replacement source schema file name is specified (step S19).
  • the replacement source schema file name in the comparison source taxonomy link information list is replaced with the replacement destination schema file name (step S21).
  • the file correspondence information between taxonomy A and taxonomy C is the contents shown in Fig.
  • samplel.xsd is extracted as the replacement source schema file
  • sample2.xsd is the replacement destination schema file name.
  • link information of (sampl ed.xsd # statements, samplel.xsd # statements.aocumentInformation,
  • step S23 if all the schema file names are replaced (step S23: Yes route), the file name replacement process is performed.
  • the link information list of taxonomy A after file name replacement processing is shown in Fig. 9.
  • the schema file name of the comparison source taxonomy is compared with the comparison destination taxonomy.
  • the replacement source and replacement destination may be reversed.
  • the comparison unit 15 compares the link information list of the comparison source taxonomy with the link information list of the comparison destination taxonomy, extracts a difference, and stores the difference information storage unit 17. (Step S13). Specifically, the same link information (that is, the parent element Name, child element name, and link information that all parent-child relationships match) are determined in the link information list of the comparison source taxonomy and the link information list of the comparison destination taxonomy, respectively. Extract link information that only exists. In this embodiment, the link information list of taxonomy A after the file name replacement process shown in FIG. 9 is compared with the link information list of taxonomy C shown in FIG. 7B, and the link information 701 and link information of FIG.
  • the link information 701 is a difference due to the addition of “address” to the taxonomy C, and the link information 702 and the link information 901 are differences due to a change in the display hierarchy of “financial status”.
  • the underlined portions in the link information 701, the link information 702, and the link information 901 indicate additions or changes.
  • the difference display unit 19 displays a difference between taxonomies on a display device or the like based on the information stored in the structure information storage unit 7 and the difference information storage unit 17 (step S15).
  • Figure 10 shows an example of a screen that lists the differences between taxonomies.
  • link information 901 is displayed as the difference in taxonomy A
  • link information 701 and link information 702 are displayed as the difference in taxonomy C.
  • the parent element name and child element name in each link information may be displayed in the notation of the force XPointer displayed in place of the label information in Japanese.
  • Figure 11 shows an example of a screen that displays each taxonomy in a tree structure and highlights the differences. In the example of Fig.
  • the link difference in the tree structure can be extracted, and the link difference can be easily identified.
  • 10 and 11 are displayed at the same time. For example, when the user selects a specific element name for the list power in FIG. 10, the corresponding element on the tree structure in FIG. 11 is highlighted. Good. In this way, for example, when “Address” is selected, only the taxonomy C side will be highlighted, and whether the difference is due to a change in the display hierarchy of the force element, which is a difference due to the addition of the element. Can be easily identified.
  • the parent element name, child element name, and parent / child are extracted as link information.
  • the link information may include attribute information.
  • Link information including attribute information is indicated as (parent element name, child element name, parent / child: attribute information).
  • the element ie, “title”, “year / month / day”, and “company name”
  • the value of the order attribute of “title” is 1.0, and then the value of the order attribute is given as 2.0, 3.0,.
  • a column “” is provided, and link information having a difference only in attribute information is displayed.
  • the value of the order attribute is not displayed, but may be displayed as necessary.
  • “taxonomy—document information” link and “financial statement—performance” link are indicated by dotted lines in taxonomy A and taxonomy 1 '. In this way, it is possible to easily identify a link difference that has the same parent-child relationship but different attribute information.
  • the label link is also regarded as a tree structure as shown in FIG. 16, and the difference can be specified by performing the processing as described above. Although not shown, the definition link and the reference link can be processed in the same manner.
  • the attribute information extracted in the process of step S9 may be specified. Young Alternatively, all attribute information may be extracted in the process of step S9, and attribute information to be compared may be specified in the process of step S13. In this way, an appropriate comparison can be made according to the purpose.
  • the CPU 2503 controls the display control unit 2507, the communication control unit 2517, and the drive device 2513 as necessary to perform necessary operations.
  • the data being processed is stored in the memory 2501, and stored in the HDD 2505 if necessary.
  • an application for executing the processing described above is used.
  • the program is stored on the removable disk 2511, distributed, and installed on the HDD 2505 from the drive unit 2513. It may be installed in HDD2505 via network such as the Internet and communication control unit 2517.
  • Such a computer device realizes various functions as described above by organically cooperating the hardware such as CPU2503 and memory 2501 described above with the OS and necessary application programs. To do.

Abstract

 木構造におけるリンクの差分を容易に特定することを目的とする。そのために、複数の要素を木構造のノードとして含む複数の集合のデータを格納している記憶装置から第1の集合のデータを読み出し、第1の集合の木構造におけるリンク毎に、当該リンクの両端の要素の情報と当該リンク関係を表す情報とを含むリンク情報を抽出し、第1の集合についてのリンク情報を含む第1のリンク情報リストを記憶装置に格納する工程と、記憶装置から第2の集合のデータを読み出し、第2の集合の木構造におけるリンク毎に、リンク情報を抽出し、第2の集合についてのリンク情報を含む第2のリンク情報リストを記憶装置に格納する工程と、第1のリンク情報リスト及び第2のリンク情報リストに基づき、第1の集合と第2の集合との間におけるリンクについての差分を抽出する工程とを実行する。

Description

明 細 書
差分抽出プログラム、方法及び装置
技術分野
[0001] 本発明は、集合間の差分を抽出するための技術に関し、より詳しくは集合に含まれ る要素間のリンクについての差分を抽出する技術に関する。
背景技術
[0002] 近年、財務情報の円滑な流通を図るため、 XML (extensible Markup Language)を ベースとした XBRL (extensible Business Reporting Language)の仕様に基づいた財 務データの利用が進みつつある。 XBRLでは、例えば売上高や営業利益といったデ ータそのものはインスタンスと呼ばれるファイルに含まれ、例えば文書構造や表示方 法等はタクソノミーと呼ばれるファイルに含まれる。さらに、タクソノミーは、要素名の定 義を含むスキーマファイルと要素間のリンクの定義を含むリンクベースファイルとに大 別される。なお、 XBRLでは、 XLink (XML Linking Language)と呼ばれるリンク言語 が採用され、リンクベースファイルにリンクの定義が記述される。 XLinkでは、要素間 の表示階層及び表示順序を定義する表示リンク、要素間の計算式を定義する計算リ ンク、要素間の様々な関係 (例えば、親子関係等)を定義する定義リンク、要素の表 示用ラベルを定義するラベルリンク、要素の根拠 (例えば、参照先等)を定義する参 照リンク等を定義することができる。
[0003] 例えば、現在、 PDF (Portable Document Format)や HTML (Hyper Text Markup Language)などの形式で収集して ヽる企業の財務諸表 (例えば、有価証券報告書等 )を、 XBRLで収集する場合には、公的機関(例えば、金融庁等)がタクソノミーを作 成して各企業に公開し、各企業はそのタクソノミーに従ったインスタンスを提出する形 式が想定される。
[0004] また、タクソノミーは、会計基準に基づいて作成されるため、会計基準が変更になる とタクソノミーも変更となる。このような場合、タクソノミー開発者はタクソノミーの差分を 確認しながらタクソノミーの開発を行うことが想定される。さらに、タクソノミーは各国に よって内容が異なるため、タクソノミー開発者が自国のタクソノミーと他国のタクソノミ 一との差分を容易に把握できるようにする技術が望まれる。なお、各国のタクソノミー については、インターネットく URL : http:〃 www.xbrl.org/FRTaxonomies/ >で、その 一部を参照することができる。このように、 XBRLの導入検討が進むにつれ、タクソノミ 一の保守などの観点力 タクソノミーの差分を検出 ·表示する技術が求められている
[0005] 例えば、 GUI (Graphical User Interface)で容易にタクソノミーを生成するための技 術やタクソノミーの差分を表示する技術がインターネット < URL : http:〃 interstage.fo jitsu.com/jp/xwand/catalog/index.html>で開示されている。ここでは、例えば、 XLi nkで記述された表示リンクを解析し、タクソノミーの各要素を図 20に示すような階層 構造 (より具体的には木構造)で表示する。図 20の画面例では、要素を階層表示す る Element列と、子要素の表示順序を示す order列とが含まれる。また、図 20で示した タクソノミー(以下、タクソノミー Aと呼ぶ)が定義されるタクソノミーファイルの一例を図 17、図 18A乃至図 18C、図 19A乃至図 19Dに示す。なお、図 17がスキーマフアイ ル、図 18A乃至図 18Cが 1つのリンクベースファイル(表示リンクの定義)、図 19A乃 至図 19Dが 1つのリンクベースファイル(ラベルリンクの定義)をそれぞれ示している。
[0006] ここで、例えば、タクソノミー Aに「住所」という要素を追加する場合、図 17の追加箇 所 1701に図 21に示す elementタグを追加し、図 18Aの追カロ箇所 1801に図 22に示 す locタグ、 presentationArcタグを追加し、図 19Dの追加箇所 1901に図 23に示す loc タグ、 labelタグ、 labelArcタグを追加する(以下、「住所」という要素が追加されたタクソ ノミーをタクソノミー Bと呼ぶ)。すなわち、スキーマファイル(図 17)に要素が追加され 、リンクベースファイル(図 18A及び図 19D)に追加された要素に関するリンクが追カロ されたことになる。この場合、スキーマファイルを比較することで、タクソノミー Bに「住 所」という要素の追加を検出することができ、例えば図 24に示すような画面にてタクソ ノミー Aとタクソノミー Bとの差分を表示する。図 24の画面例では、タクソノミー Aとタク ソノミー Bとの比較結果の列と、タクソノミー Aの要素の列と、タクソノミー Bの要素の列 とが含まれる。また、タクソノミー Aの要素に対応するタクソノミー Bの要素は同一行に 表示される。さらに、比較結果の列に表示されている「=」マークはタクソノミー Aの要 素とタクソノミー Bの要素とが同一であることを表し、「 +」マークはタクソノミー Aの要 素とタクソノミー Bの要素とが異なることを表している。従って、図 24の画面例では、「 住所」と 、う要素がタクソノミー Bにのみ存在し、タクソノミー Aには存在しな 、ことが確 認できる。
[0007] また、例えば、タクソノミー Aの「財政状況」という要素を「経営成績」の配下に移動 する場合、図 18Bの変更箇所 1802の presentationArcタグを図 25に示す presentatio nArcタグに変更する(以下、「財政状況」という要素を「経営成績」の配下に移動した 場合のタクソノミーをタクソノミー B'と呼ぶ)。すなわち、リンクベースファイル(図 18B) の「業績 財政状況」 t 、う表示リンクが、「経営成績 財政状況」 t 、う表示リンクに 変更されたことになる。し力しながら、現在は、タクソノミー Aとタクソノミー B'との間のリ ンクにつ 、ての差分を検出'表示できて!/、な 、ため、「財政状況」 t 、う要素の表示階 層が変更になったことを容易に判断することができない。そもそも、 XBRLを含む XM L文書では、 XML文書の種類によって比較の観点が複数あり、単純にテキスト文書 として比較することができな 、。
[0008] 一方、階層構造を比較する技術としては、例えば、特開 2002— 366594号公報記 載の技術がある。具体的には、複数の榭状図を区別がつく状態で (例えば、各榭状 図における各枝が重ならないように一方の榭状図の各枝を上下左右にずらしたり、各 榭状図で異なる表示色'線種を使用したりする状態で)重ねて 1つの榭状図として表 示するものである。しかし、榭状図間の差分については、人間が目視により探す必要 があり、膨大な榭状図に対してはあまり現実的な技術ではない。
特許文献 1:特開 2002— 366594号公報
非特許文献 1: "Financial Reporting Taxonomies "ゝ [online], XBRL INTERNATIONA し、 [平成 18年 4月 24日検索]、インターネットく URL : http:〃 www.xbri-jp.org/ > 非特許文献 2: "Interstage XWand I Interstage XWand Managerカタログ"、 [online]、 平成 16年 11月、富士通株式会社、 [平成 18年 4月 24日検索]、インターネットく UR し: http:/ 1 interstage.lUjitsu.com/jp/ xwand/ catalog/ index.html >
発明の開示
発明が解決しょうとする課題
[0009] 上で述べたように、 XBRLに限らず、複数の要素を木構造のノードとして含む集合 を比較する場合において、木構造におけるリンクの差分を検出しておらず、リンクの 差分を容易に特定することができな 、。
[0010] また、従来は、リンクの差分については、あまり用途がないため、リンクの比較を行う 必要性は低力つた。しかしながら、今後、利便性の高いリンク機能 (例えば、 XLink等 )の普及により、リンクに着目して比較を行う必要性が高くなる。
[0011] 従って、本発明の目的は、木構造におけるリンクの差分を容易に特定できるように するための技術を提供することである。
課題を解決するための手段
[0012] 本発明に係る差分抽出方法は、集合間の差分を抽出する方法であって、複数の要 素を木構造のノードとして含む複数の集合のデータを格納している記憶装置力 比 較元となる第 1の集合のデータを読み出し、第 1の集合の木構造におけるリンク毎に 、当該リンクの両端の要素の情報と当該リンク関係を表す情報とを含むリンク情報を 抽出し、第 1の集合についてのリンク情報を含む第 1のリンク情報リストをリンクリスト格 納部に格納する第 1のリンク情報抽出ステップと、記憶装置力 比較先となる第 2の 集合のデータを読み出し、第 2の集合の木構造におけるリンク毎に、リンク情報を抽 出し、第 2の集合にっ 、てのリンク情報を含む第 2のリンク情報リストをリンクリスト格納 部に格納する第 2のリンク情報抽出ステップと、リンクリスト格納部に格納された第 1の リンク情報リスト及び第 2のリンク情報リストに基づき、第 1の集合と第 2の集合との間に おけるリンクについての差分を抽出する差分抽出ステップとを含む。
[0013] このようにすれば、複数の要素を木構造のノードとして含む集合を比較する場合に おいて、木構造におけるリンクの差分を抽出することができ、保守作業の効率を向上 することができる。また、 XBRLの場合、タクソノミー開発者は、要素の追加又は削除 だけでなぐリンクについての変更箇所も把握することができる。
[0014] また、第 1の集合及び第 2の集合を比較可能な形態で表示すると共に、第 1の集合 と第 2の集合との間におけるリンクについての差分を強調表示するステップをさらに含 むようにしてもよい。このようにすれば、木構造におけるリンクの差分を容易に特定す ることができる。また、例えば、 XBRLの場合、タクソノミーにおける要素の定義が 100 0を超えることもあるため、人間の目視では見落としが発生することがあり、本発明に よればこれを防止することができる。
[0015] さらに、リンク関係を表す情報が、当該リンクの両端の要素間の親子関係の情報とリ ンクの属性情報とを含むようにしてもよい。そして、差分抽出ステップが、リンクの両端 の要素間の親子関係の情報とリンクの属性情報とのうち少なくとも 1つが異なるリンク 情報を、第 1の集合と第 2の集合との間におけるリンクについての差分として抽出する ステップを含むようにしてもよい。このようにすれば、例えば、親要素と子要素とのリン ク自体はそのままで、リンクの属性のみが変更になる場合に、木構造としては何ら変 更はないが、異なるリンクとみなすことができる。
[0016] また、リンクの属性情報が、子要素の表示順序を示す情報又はリンクの両端の要素 間の計算方法を示す情報の場合もある。例えば、 XBRLであれば、表示リンクの orde r属性や計算リンクの weight属性の値が異なる場合、差分として抽出することができる
[0017] さらに、要素が、 XBRLで記述された財務情報に含まれる要素の場合もある。また、 第 1のリンク情報抽出ステップ及び第 2のリンク情報抽出ステップが、 XLinkで記述さ れたリンクを集合の木構造におけるリンクとみなし、リンク毎に、リンク情報を抽出する ステップを含むようにしてもよい。さらに、 XLinkで記述されたリンク力 表示リンクと計 算リンクと定義リンクとラベルリンクと参照リンクとのうちいずれか 1つの場合もある。
[0018] また、要素の情報が、財務情報におけるスキーマフアイノレ名と要素名とを含むように してもよい。そして、差分抽出ステップが、ファイル対応情報格納部に格納され且つ 比較元となる財務情報におけるスキーマファイル名と比較先となる財務情報における スキーマファイル名との対応関係を表す情報に基づき、第 1の集合に含まれる要素と 第 2の集合に含まれる要素とが同一である力否かを判定するステップを含むようにし てもよい。このようにすれば、例えば、比較元の財務情報におけるスキーマファイル名 と比較先の財務情報におけるスキーマファイル名とが異なる場合でも、ファイル名を 対応付けることにより、同一のスキーマファイル名とみなすことができる。
[0019] なお、本発明に係る差分抽出方法をコンピュータに実行させるためのプログラムを 作成することができ、当該プログラムは、例えばフレキシブル 'ディスク、 CD-ROM, 光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納さ れる。また、ネットワークを介してディジタル信号にて頒布される場合もある。なお、処 理途中のデータについては、コンピュータのメモリ等の記憶装置に一時保管される。 図面の簡単な説明
[図 1]図 1は、本発明の実施の形態に係る機能ブロック図である。
[図 2]図 2は、本発明の実施の形態に係る処理フローを示す図である。
[図 3]図 3 (a)及び (b)は、ファイル対応情報格納部に格納されるファイル対応情報の 一例を示す図である。
[図 4]図 4は、構造情報格納部に格納される構造情報の一例を示す図である。
[図 5]図 5は、構造情報格納部に格納される構造情報の一例を示す図である。
[図 6]図 6は、木構造の一例を示す図である。
[図 7A]図 7Aは、リンクリスト格納部に格納されるリンク情報の一例を示す図である。
[図 7B]図 7Bは、リンクリスト格納部に格納されるリンク情報の一例を示す図である。
[図 8]図 8は、ファイル名置換処理の処理フローを示す図である。
[図 9]図 9は、比較部によるファイル名置換処理後におけるリンクリスト格納部に格納さ れるリンク情報の一例を示す図である。
[図 10]図 10は、差分結果の表示例を示す図である。
[図 11]図 11は、差分箇所を強調表示した表示例を示す図である。
[図 12]図 12は、差分結果の表示例を示す図である。
[図 13]図 13は、差分箇所を強調表示した表示例を示す図である。
[図 14]図 14は、木構造の一例を示す図である。
[図 15]図 15は、構造情報格納部に格納される構造情報の一例を示す図である。
[図 16]図 16は、木構造の一例を示す図である。
[図 17]図 17は、タクソノミーのスキーマファイルの一例を示す図である。
[図 18A]図 18Aは、タクソノミーのリンクベースファイルの一例を示す図である。
[図 18B]図 18Bは、タクソノミーのリンクベースファイルの一例を示す図である。
[図 18C]図 18Cは、タクソノミーのリンクベースファイルの一例を示す図である。
[図 19A]図 19Aは、タクソノミーのリンクベースファイルの一例を示す図である。
[図 19B]図 19Bは、タクソノミーのリンクベースファイルの一例を示す図である。 [図 19C]図 19Cは、タクソノミーのリンクベースファイルの一例を示す図である。
[図 19D]図 19Dは、タクソノミーのリンクベースファイルの一例を示す図である。
[図 20]図 20は、タクソノミーを階層構造で表示した画面例を示す図である。
[図 21]図 21は、変更後のタクソノミーの一例を示す図である。
[図 22]図 22は、変更後のタクソノミーの一例を示す図である。
[図 23]図 23は、変更後のタクソノミーの一例を示す図である。
[図 24]図 24は、タクソノミーの差分を表示した画面例を示す図である。
[図 25]図 25は、変更後のタクソノミーの一例を示す図である。
[図 26]図 26は、コンピュータの機能ブロック図である。
発明を実施するための最良の形態
[0021] 図 1に本発明の一実施の形態に係る差分抽出装置の機能ブロック図の一例を示す 。なお、本実施の形態では、 XBRLのタクソノミーを、複数の要素を木構造のノードと して含む集合とする例を示すが、このような集合についてはタクソノミーに限られるも のではない。本実施の形態に係る差分抽出装置は、タクソノミーファイル及びフアイ ル対応情報の入力を受け付ける入力部 1と、入力部 1が受け付けたタクソノミーフアイ ルを格納するタクソノミー格納部 3と、タクソノミー格納部 3に格納されたタクソノミーフ アイルを分析するタクソノミー分析部 5と、タクソノミー分析部 5が分析した結果を格納 する構造情報格納部 7と、構造情報格納部 7に格納された情報からリンク情報リストを 生成するリンクリスト生成部 9と、リンクリスト生成部 9が生成したリンク情報リストを格納 するリンクリスト格納部 11と、入力部 1が受け付けたファイル対応情報を格納するファ ィル対応情報格納部 13と、リンクリスト格納部 11とファイル対応情報格納部 13とに格 納された情報に基づきタクソノミーを比較する比較部 15と、比較部 15が比較した結 果を格納する差分情報格納部 17と、構造情報格納部 7と差分情報格納部 17とに格 納された情報に基づきタクソノミー間の差分を表示する差分表示部 19とを有する。
[0022] 次に、図 1に示した差分抽出装置の処理の詳細を図 2乃至図 16を用いて説明する 。図 2に、図 1に示した差分抽出装置の全体の処理フローを示す。まず、入力部 1は、 比較元タクソノミー及び比較先タクソノミーの入力を受け付け、タクソノミー格納部 3に 格納する (ステップ Sl)。本実施の形態では、タクソノミー Bの「財政状況」という要素 を「経営成績」配下に移動した場合のタクソノミーをタクソノミー cとする。そして、比較 元タクソノミーをタクソノミー A、比較先タクソノミーをタクソノミー Cとする。次に、受け 付けた各々のタクソノミーにスキーマファイルが複数存在する力判定する (ステップ S 3)。もし、スキーマファイルが 1つの場合 (ステップ S3 : Noルート)、各タクソノミーにお けるスキーマファイルの対応付けは必然的に決まるため、ステップ S 7の処理に移行 する。なお、図示していないが、入力部 1は、各タクソノミーのスキーマファイル名を抽 出し、ファイル対応情報としてファイル対応情報格納部 13に格納する。本実施の形 態では、タクソノミー Aのスキーマファイルを samplel.xsd、タクソノミー Cのスキーマファ ィルを sample2.xsdとする。図 3 (a)に本実施の形態(すなわち、スキーマファイルが 1 つの場合)におけるファイル対応情報の一例を示す。図 3 (a)の例では、スキーマファ ィル samplel.xsdとスキーマファイル sample2.xsdとが対応付けられている。一方、スキ 一マファイルが複数存在する場合 (ステップ S3 : Yesルート)、入力部 1は各ファイル の対応付けが示されたファイル対応情報の入力を受け付け、ファイル対応情報格納 部 13に格納する (ステップ S5)。図 3 (b)にスキーマファイルが複数存在する場合の ファイル対応情報の一例を示す。図 3 (b)の例では、スキーマファイル samplel-xxx.xs dとスキーマフアイノレ sample2- xxx.xsd、スキーマフアイノレ samplel- yyy.xsdとスキーマフ アイノレ sample2— yyy.xsd、 · · ·、スゃーマフアイノレ samplel— zzz.xsdとスゃーマフアイノレ sa mple2-zzz.xsdがそれぞれ対応付けられている。
次に、タクソノミー分析部 5が、各タクソノミーについて、タクソノミーの構造を分析し て構造情報を生成し、構造情報格納部 7に格納する (ステップ S7)。なお、タクソノミ 一の構造を分析して構造情報を生成する処理については、従来技術 (要素間の関 連付けを特定して、例えば図 20の画面例における木構造を表示するためのデータを 生成する処理)と同じであるため、詳細は省略する。図 4及び図 5に構造情報格納部 7に格納される構造情報の一例を示す。図 4は、図 18A乃至図 18Cで示したリンクべ 一スファイルに記述される表示リンクを分析して生成された構造情報の一例である。 図 4の例では、要素毎に要素情報へのポインタと属性情報と子要素へのポインタとを 保持する。このように、親要素が子要素へのポインタを持つデータ構造となっており、 表示リンクの親子関係を示すことができる。例えば、「財務諸表」は、子要素として「文 書情報」及び「業績」を持つ。さらに、「文書情報」及び「業績」は表示リンクの属性情 報である order属性の値を保持する。表示リンクにおける order属性は、兄弟関係にあ る要素 (すなわち、同じ親要素を持つ子要素間)の表示順序を指定するものであり、 図 4の例では、「文書情報」(order=1.0)、「業績」(order=2.0)の順に表示されることを 示す。また、図 5は、要素情報とラベル情報との関係を示すものである。図 5の例では 、要素情報には要素名、要素の型情報、属性情報、ラベル情報へのポインタが含ま れ、ラベル情報には日本語の表示名、英語の表示名が含まれる。なお、ラベル情報 には、英語以外の外国語の表示名を含む場合もある。図 20で示した画面例は、図 4 及び図 5に示した構造情報を基に作成される。また、図 4及び図 5に示した構造情報 力 図 6に示すような木構造を表示することも可能である。
次に、リンクリスト生成部 9が、各タクソノミーについて、構造情報からリンク情報を抽 出してリンク情報リストを生成し、リンクリスト格納部 11に格納する (ステップ S 9)。リン クリスト生成部 9は、構造情報格納部 7に格納される構造情報を、図 6で示したような 木構造とみなし、木構造におけるリンク毎にリンク情報を抽出する。なお、本実施の形 態では、リンク情報を (親要素名,子要素名,親子)と示す。例えば、図 6に示した木 構造の場合、リンク情報として (財務諸表,文書情報,親子)、(財務諸表,業績,親 子)、(文書情報,表題,親子)、(文書情報,年月日,親子)、(文書情報,会社名, 親子)、(業績,経営成績,親子)、(業績,財政状況,親子)、(経営成績,売上高, 親子)、(経営成績,営業利益,親子)、(経営成績,経常利益,親子)、(財政状況, 総資産,親子)、(財政状況,株主資本,親子)が抽出される。なお、ここでは、説明の 便宜上、親要素名及び子要素名を図 6で示される各要素名としたが、実際には、図 5 に示した要素情報の要素名(例えば、財務諸表であれば samplel.xsd#statements)が 抽出される。このようにして抽出されたリンク情報リストの一例を図 7A及び図 7Bに示 す。図 7Aはタクソノミー Aのリンク情報リスト、図 7Bはタクソノミー Cのリンク情報リスト を示す。なお、図 5に示した要素情報の要素名(例えば、 samplel.xsd#statements)は 、 XPointer (XML Pointer Language)と呼ばれるリンク言語に基づく表記方法である 。 XPointerは XLinkと共に使用されるリンク言語で、例えば、 XLinkで定義されるリ ンクの両端の要素を指定する場合に用いられる。 samplel.xsd#statementsのように、 ファイル名と要素の ID属性の値とを「#」で結びつけて記述する。
[0025] 次に、比較部 15が、ファイル対応情報格納部 13に格納されたファイル対応情報に 基づきファイル名置換処理を実施する (ステップ S 11)。ファイル名置換処理につ!、て は、図 8を用いて説明する。まず、ファイル対応情報から、比較元タクソノミーの未処 理の置換元スキーマファイル名を抽出する (ステップ S 17)。次に、ファイル対応情報 を参照し、抽出した置換元スキーマファイル名に対応する、比較先タクソノミーの置換 先スキーマファイル名を特定する (ステップ S 19)。そして、比較元タクソノミーのリンク 情報リスト内の置換元スキーマファイル名を置換先スキーマファイル名で置換する (ス テツプ S21)。本実施の形態では、タクソノミー Aとタクソノミー Cとのファイル対応情報 は図 3 (a)に示した内容であり、置換元スキーマファイルとして samplel.xsdが抽出され 、 sample2.xsdが置換先スキーマファイル名として特定される。そして、例えば、(sampl e丄 .xsd#statements, samplel.xsd#statements.aocumentInformation, |¾十ノと ヽっタクソ ノミー Aのリンク情報は、 samplel.xsdが sample2.xsdに置換されるため、(sample2.xsd# statements, sample2.xsdffstatements.documentInformation,親子)と ヽっリンク ffr報に なる。次に、比較元タクソノミーのスキーマファイル名を全て置換した力判定する (ステ ップ S23)。もし、置換してないスキーマファイル名がある場合 (ステップ S23 : Noルー ト)、ステップ S 17の処理に戻る。一方、スキーマファイル名を全て置換した場合 (ステ ップ S23 : Yesルート)、ファイル名置換処理を終了して元の処理に戻る。なお、フアイ ル名置換処理後のタクソノミー Aのリンク情報リストを図 9に示す。本実施の形態では 、比較元タクソノミーのスキーマファイル名を比較先タクソノミーのファイル名で置換し ているが、置換元と置換先が逆になつてもよい。
[0026] 一般的に、タクソノミーのファイル名は各国毎に異なる力 要素の ID属性の値 (例え ば、 statements)は英語による表記となっている。従って、 XPointerによる表記の場 合、このようなファイル名置換処理を実施することで、各国毎のファイル名の差異を意 識せずに、以下で説明するリンク情報リストの比較を行うことができる。
[0027] 図 2の処理フローの説明に戻って、比較部 15が、比較元タクソノミーのリンク情報リ ストと比較先タクソノミーのリンク情報リストとを比較して差分を抽出し、差分情報格納 部 17に格納する (ステップ S13)。具体的には、同一のリンク情報 (すなわち、親要素 名、子要素名、親子関係が全て一致するリンク情報)が比較元タクソノミーのリンク情 報リスト及び比較先タクソノミーのリンク情報リストにそれぞれ存在する力否かを判定し 、いずれかのリンク情報リストにのみ存在するリンク情報を抽出する。本実施の形態で は、図 9に示したファイル名置換処理後のタクソノミー Aのリンク情報リストと図 7Bに示 したタクソノミー Cのリンク情報リストとが比較され、図 7Bのリンク情報 701及びリンク情 報 702、図 9のリンク情報 901が差分として抽出される。リンク情報 701は、タクソノミ 一 Cに「住所」の追カ卩による差分であり、リンク情報 702及びリンク情報 901は、「財政 状況」の表示階層の変更による差分である。なお、リンク情報 701、リンク情報 702及 びリンク情報 901における下線部は、追加又は変更箇所を示す。
[0028] 次に、差分表示部 19は、構造情報格納部 7と差分情報格納部 17とに格納された 情報に基づきタクソノミー間の差分を表示装置等に表示する (ステップ S15)。図 10 に、タクソノミー間の差分を一覧表示した画面例を示す。図 10の画面例では、タクソノ ミー Aにおける差分としてリンク情報 901、タクソノミー Cにおける差分としてリンク情報 701及びリンク情報 702を表示している。なお、各リンク情報における親要素名及び 子要素名は、ラベル情報の日本語の表示名に置き換えて表示している力 XPointe rによる表記で表示するようにしてもよい。図 11に、各タクソノミーを木構造で表示する と共に、差分を強調表示した画面例を示す。図 11の例では、タクソノミー Aにおける「 業績一財政状況」のリンク(リンク情報 901に相当)、タクソノミー Cにおける「文書情報 —住所」のリンク(リンク情報 701に相当)及び「経営成績-財政状況」のリンク(リンク 情報 702に相当)を点線で表示している。
[0029] このようにすれば、木構造におけるリンクの差分を抽出することができ、リンクの差分 を容易に特定することができる。また、図 10及び図 11を同時に表示し、例えば、利用 者が図 10の一覧力も特定の要素名を選択した場合に、図 11の木構造上の対応する 要素を強調表示するようにしてもよい。このようにすれば、例えば、「住所」を選択した 場合、タクソノミー C側のみ強調表示されることになり、要素の追カ卩による差分である 力 要素の表示階層の変更による差分であるかを容易に特定することができる。
[0030] また、上で説明したステップ S9では、親要素名、子要素名、親子をリンク情報として 抽出したが、リンク情報に属性情報を含むようにしてもよい。以下では、表示リンクに おける order属性をリンク情報に含む場合について説明する。なお、属性情報を含む リンク情報を (親要素名,子要素名,親子:属性情報)と示す。例えば、図 6に示した 木構造において、兄弟関係にある要素 (例えば、「表題」と「年月日」と「会社名」)の 中で一番上に表示されて 、る要素(すなわち、「表題」)の order属性の値力 1.0であり 、続いて上から順に 2.0、 3.0、 · · ·といったように order属性の値が与えられているもの とする。また、図 6に示した「文書情報」の order属性の値 (order=1.0)と「業績」の order 属性の値 (order=2.0)とを入れ替えた場合のタクソノミーをタクソノミー A'とする。
[0031] この場合、ステップ S9の処理を実施すると、タクソノミー Aのリンク情報として (財務 諸表,文書情報,親子: order=1.0)、(財務諸表,業績,親子: order=2.0)、(文書情 報,表題,親子: order=1.0)、(文書情報,年月日,親子: Order=2.0)、(文書情報,会 社名,親子: order=3.0)、(業績,経営成績,親子: order=1.0)、(業績,財政状況,親 子: order=2.0)、(経営成績,売上高,親子: order=1.0)、(経営成績,営業利益,親 子: order=2.0)、(経営成績,経常利益,親子: order=3.0)、(財政状況,総資産,親 子: order=1.0)、(財政状況,株主資本,親子: order=2.0)が抽出される。さらにタクソ ノミー A'のリンク情報として (財務諸表,文書情報,親子: order=2.0)、(財務諸表,業 績,親子: order=1.0)、(文書情報,表題,親子: Order=1.0)、(文書情報,年月日,親 子: order=2.0)、(文書情報,会社名,親子: order=3.0)、(業績,経営成績,親子: ord er=1.0)、(業績,財政状況,親子: order=2.0)、(経営成績,売上高,親子: order=1.0 ) , (経営成績,営業利益,親子: order=2.0)、(経営成績,経常利益,親子: order=3. 0)、(財政状況,総資産,親子: order=1.0)、(財政状況,株主資本,親子: order=2.0 )が抽出される。
[0032] そして、ステップ S 13の処理を実施すると、タクソノミー Aのリンク情報 (財務諸表,文 書情報,親子: order=1.0)及び (財務諸表,業績,親子: order=2.0)、タクソノミー A, のリンク情報 (財務諸表,文書情報,親子: order=2.0)及び (財務諸表,業績,親子 rder=1.0)が差分として抽出される。ここでは、タクソノミー Aの(財務諸表,文書情報, 親子: order=1.0)とタクソノミー A'の(財務諸表,文書情報,親子: order=2.0)、タクソ ノミー Aの (財務諸表,業績,親子: order=2.0)とタクソノミー A,の (財務諸表,業績, 親子: order=1.0)は、親要素名、子要素名、親子関係については一致しているため、 属性情報のみに差分があるリンク情報として差分情報格納部 17に格納する。タクソノ ミー Aとタクソノミー A'との差分を表示した画面例を図 12及び図 13に示す。図 12の 画面例では、「 」の列が設けられており、属性情報のみに差分があるリンク情報を表 示してしている。本実施の形態では、 order属性の値は表示していないが、必要に応 じて表示するようにしてもよい。また、図 13の画面例では、タクソノミー A及びタクソノミ 一 A'において、「財務諸表—文書情報」のリンク、「財務諸表—業績」のリンクを点線 で表示している。このようにすれば、親子関係は同一だが、属性情報が異なるようなリ ンクの差分にっ 、ても容易に特定することができる。
[0033] さらに、図 4で説明した構造情報は、リンクベースファイルに記述される表示リンクを 分析して生成された構造情報であるが、計算リンクの場合にも適用できる。以下では 、図 14に示すような木構造の計算リンクについて説明する。この場合、ステップ S7の 処理を実施すると、図 15に示すような構造情報が生成される。図 15の例では、図 4と 同じデータ構造を持ち、属性情報として weight属性の値を保持する。 weight属性とは 、子要素の値力 親要素の値を計算する場合における、子要素の値の重みを指定 するための属性である。例えば、 weight属性の値が 1の場合は子要素の値を親要素 の値に加算、 weight属性が 2の場合は子要素の値を 2倍した値を親要素の値に加算 、 weight属性の値が― 1の場合は子要素の値を— 1倍した値を親要素に加算 (すな わち、親要素の値力も子要素の値を減算)する。従って、図 15の例では、「売上総利 益 =売上高 売上原価」となり、さらに売上原価は「売上原価 =期首棚卸高 +当期 製造原価一期末棚卸高」となる。そして、データ構造が表示リンクの場合と同じである ため、ステップ S9乃至ステップ S 15の処理を実施すればよい。なお、ステップ S9乃 至ステップ S15の処理については、上で述べた処理と同様であるため、ここでは説明 を省略する。このようにすれば、計算リンクの差分についても容易に特定することがで きる。
[0034] また、ラベルリンクについても図 16に示すような木構造とみなし、上で述べたような 処理をすることで、差分を特定することができる。また、図示していないが、定義リンク 、参照リンクについても同様に処理することができる。
[0035] さらに、ステップ S9の処理で抽出する属性情報を指定できるようにしてもよい。若し くは、ステップ S 9の処理では全ての属性情報を抽出するようにし、ステップ S 13の処 理で比較する属性情報を指定できるようにしてもよい。このようにすれば、目的に応じ た適切な比較を行うことができる。
[0036] 以上述べたように、本実施の形態によれば、複数の要素を木構造のノードとして含 む集合を比較する場合に、要素の差分 (例えば、要素の追加又は削除)だけでなぐ 要素間のリンクの差分も容易に特定することができる。
[0037] 以上本発明の一実施の形態について説明したが、本発明はこれに限定されるもの ではない。例えば、 XBRLのタクソノミーに限らず、要素間にリンクが存在し、木構造 とみなすことができるような場合について適用可能である。例えば、インターネット上 の Webページを木構造のノード、 Webページ間のハイパーリンクをリンクとみなすこと により、 Webサイトのリンク構造を比較することができる。また、フローチャートにおける 各記号 (例えば、端子記号、判断記号等)を木構造のノード、記号間を結ぶ線をリン クとみなすことで、フローチャート同士を比較することができる。なお、ノード間のリンク は親子関係に限らず、兄弟関係等のリンクであってもよい。
[0038] また、図 1に示した機能ブロック図は、一例であって、必ずしも実際のプログラムモ ジュールの構成に合致しない場合もある。さらに、処理結果が変わらない範囲におい て処理順番の入れ替えが可能なステップも存在する。
[0039] さらに、上で述べた差分抽出装置は、図 26のようなコンピュータ装置であって、メモ リ 2501 (記憶装置)と CPU2503 (処理装置)とハードディスク 'ドライブ (HDD) 2505 と表示装置 2509に接続される表示制御部 2507とリムーバブル'ディスク 2511用の ドライブ装置 2513と入力装置 2515とネットワークに接続するための通信制御部 251 7とがバス 2519で接続されている。オペレーティング 'システム(OS : Operating Syste m)及び本実施の形態における処理を実施するためのアプリケーション 'プログラムは 、 HDD2505に格糸内されており、 CPU2503により実行される際には HDD2505力ら メモリ 2501に読み出される。必要に応じて CPU2503は、表示制御部 2507、通信 制御部 2517、ドライブ装置 2513を制御して、必要な動作を行わせる。また、処理途 中のデータについては、メモリ 2501に格納され、必要があれば HDD2505に格納さ れる。本発明の実施の形態では、上で述べた処理を実施するためのアプリケーション 'プログラムはリムーバブル.ディスク 2511に格納されて頒布され、ドライブ装置 251 3から HDD2505にインストールされる。インターネットなどのネットワーク及び通信制 御部 2517を経由して、 HDD2505にインストールされる場合もある。このようなコンビ ユータ装置は、上で述べた CPU2503、メモリ 2501などのハードウェアと OS及び必 要なアプリケーション 'プログラムとが有機的に協働することにより、上で述べたような 各種機能を実現する。

Claims

請求の範囲
[1] 集合間の差分を抽出する処理をコンピュータに実行させるためのプログラムであつ て、
複数の要素を木構造のノードとして含む複数の集合のデータを格納している記憶 装置力 比較元となる第 1の集合のデータを読み出し、前記第 1の集合の木構造に おけるリンク毎に、当該リンクの両端の要素の情報と当該リンク関係を表す情報とを含 むリンク情報を抽出し、前記第 1の集合についての前記リンク情報を含む第 1のリンク 情報リストをリンクリスト格納部に格納する第 1のリンク情報抽出ステップと、
前記記憶装置から比較先となる第 2の集合のデータを読み出し、前記第 2の集合の 木構造におけるリンク毎に、前記リンク情報を抽出し、前記第 2の集合についての前 記リンク情報を含む第 2のリンク情報リストを前記リンクリスト格納部に格納する第 2のリ ンク情報抽出ステップと、
前記リンクリスト格納部に格納された前記第 1のリンク情報リスト及び前記第 2のリン ク情報リストに基づき、前記第 1の集合と前記第 2の集合との間におけるリンクについ ての差分を抽出する差分抽出ステップと、
をコンピュータに実行させるための差分抽出プログラム。
[2] 前記第 1の集合及び前記第 2の集合を比較可能な形態で表示すると共に、前記第 1の集合と前記第 2の集合との間におけるリンクにつ 、ての差分を強調表示するステ ップをさらに実行させる
請求項 1記載の差分抽出プログラム。
[3] 前記リンク関係を表す情報が、当該リンクの両端の要素間の親子関係の情報とリン クの属性情報とを含み、
前記差分抽出ステップが、
前記リンクの両端の要素間の親子関係の情報と前記リンクの属性情報とのうち少な くとも 1つが異なる前記リンク情報を、前記第 1の集合と前記第 2の集合との間におけ るリンクについての差分として抽出するステップを含む
請求項 1記載の差分抽出プログラム。
[4] 前記リンクの属性情報が、子要素の表示順序を示す情報又は前記リンクの両端の 要素間の計算方法を示す情報である
ことを特徴とする請求項 3記載の差分抽出プログラム。
[5] 前記要素が、 XBRLで記述された財務情報に含まれる要素である
ことを特徴とする請求項 1記載の差分抽出プログラム。
[6] 前記第 1のリンク情報抽出ステップ及び第 2のリンク情報抽出ステップが、
XLinkで記述されたリンクを前記集合の木構造におけるリンクとみなし、リンク毎に、 前記リンク情報を抽出するステップを含む
請求項 5記載の差分抽出プログラム。
[7] 前記 XLinkで記述されたリンク力 表示リンクと計算リンクと定義リンクとラベルリンク と参照リンクとのうちいずれか 1つである
ことを特徴とする請求項 6記載の差分抽出プログラム。
[8] 前記要素の情報が、前記財務情報におけるスキーマファイル名と要素名とを含み、 前記差分抽出ステップが、
ファイル対応情報格納部に格納され且つ比較元となる前記財務情報におけるスキ 一マファイル名と比較先となる前記財務情報におけるスキーマファイル名との対応関 係を表す情報に基づき、前記第 1の集合に含まれる要素と前記第 2の集合に含まれ る要素とが同一である力否かを判定するステップを含む、
請求項 5記載の差分抽出プログラム。
[9] 複数の要素を木構造のノードとして含む複数の集合のデータを格納して 、る記憶 装置とリンクリスト格納部とを有するコンピュータに実行される差分抽出方法であって 前記記憶装置から比較元となる第 1の集合のデータを読み出し、前記第 1の集合の 木構造におけるリンク毎に、当該リンクの両端の要素の情報と当該リンク関係を表す 情報とを含むリンク情報を抽出し、前記第 1の集合についての前記リンク情報を含む 第 1のリンク情報リストを前記リンクリスト格納部に格納する第 1のリンク情報抽出ステツ プと、
前記記憶装置から比較先となる第 2の集合のデータを読み出し、前記第 2の集合の 木構造におけるリンク毎に、前記リンク情報を抽出し、前記第 2の集合についての前 記リンク情報を含む第 2のリンク情報リストを前記リンクリスト格納部に格納する第 2のリ ンク情報抽出ステップと、
前記リンクリスト格納部に格納された前記第 1のリンク情報リスト及び前記第 2のリン ク情報リストに基づき、前記第 1の集合と前記第 2の集合との間におけるリンクについ ての差分を抽出する差分抽出ステップと、
を含む差分抽出方法。
集合間の差分を抽出する差分抽出装置であって、
複数の要素を木構造のノードとして含む複数の集合のデータを格納している記憶 装置と、
前記記憶装置から比較元となる第 1の集合のデータを読み出し、前記第 1の集合の 木構造におけるリンク毎に、当該リンクの両端の要素の情報と当該リンク関係を表す 情報とを含むリンク情報を抽出し、前記第 1の集合についての前記リンク情報を含む 第 1のリンク情報リストをリンクリスト格納部に格納する第 1のリンク情報抽出手段と、 前記記憶装置から比較先となる第 2の集合のデータを読み出し、前記第 2の集合の 木構造におけるリンク毎に、前記リンク情報を抽出し、前記第 2の集合についての前 記リンク情報を含む第 2のリンク情報リストを前記リンクリスト格納部に格納する第 2のリ ンク情報抽出手段と、
前記リンクリスト格納部に格納された前記第 1のリンク情報リスト及び前記第 2のリン ク情報リストに基づき、前記第 1の集合と前記第 2の集合との間におけるリンクについ ての差分を抽出する差分抽出手段と、
を有する差分抽出装置。
PCT/JP2006/309740 2006-05-16 2006-05-16 差分抽出プログラム、方法及び装置 WO2007132524A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/309740 WO2007132524A1 (ja) 2006-05-16 2006-05-16 差分抽出プログラム、方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/309740 WO2007132524A1 (ja) 2006-05-16 2006-05-16 差分抽出プログラム、方法及び装置

Publications (1)

Publication Number Publication Date
WO2007132524A1 true WO2007132524A1 (ja) 2007-11-22

Family

ID=38693627

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/309740 WO2007132524A1 (ja) 2006-05-16 2006-05-16 差分抽出プログラム、方法及び装置

Country Status (1)

Country Link
WO (1) WO2007132524A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011089683A1 (ja) * 2010-01-19 2011-07-28 富士通株式会社 解析方法、解析装置及び解析プログラム
JP2011197898A (ja) * 2010-03-18 2011-10-06 Fujitsu Ltd 影響検出装置、影響検出プログラム、及び影響検出方法
JP2015132885A (ja) * 2014-01-09 2015-07-23 富士ゼロックス株式会社 画像処理装置及びプログラム
CN107463617A (zh) * 2017-07-04 2017-12-12 北京工业大学 基于路径摘要的链接信息提取方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000024211A (ja) * 1998-09-14 2000-01-25 Ace Denken:Kk 遊技機

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000024211A (ja) * 1998-09-14 2000-01-25 Ace Denken:Kk 遊技機

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YAHATA Y. AND WATANABE Y.: "Reconstruction method of an XBRL document corresponding to revision of taxonomy", TECHNICAL REPORT OF IEICE SS2004-31, vol. 104, no. 466, 18 November 2004 (2004-11-18), pages 31 - 36, XP003003065 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011089683A1 (ja) * 2010-01-19 2011-07-28 富士通株式会社 解析方法、解析装置及び解析プログラム
KR101384405B1 (ko) 2010-01-19 2014-04-10 후지쯔 가부시끼가이샤 해석 방법, 해석 장치 및 해석 프로그램
JP5494675B2 (ja) * 2010-01-19 2014-05-21 富士通株式会社 解析方法、解析装置及び解析プログラム
EP2527991A4 (en) * 2010-01-19 2017-01-11 Fujitsu Limited Analysis method, analysis device, and analysis program
JP2011197898A (ja) * 2010-03-18 2011-10-06 Fujitsu Ltd 影響検出装置、影響検出プログラム、及び影響検出方法
JP2015132885A (ja) * 2014-01-09 2015-07-23 富士ゼロックス株式会社 画像処理装置及びプログラム
CN107463617A (zh) * 2017-07-04 2017-12-12 北京工业大学 基于路径摘要的链接信息提取方法

Similar Documents

Publication Publication Date Title
US11263390B2 (en) Systems and methods for informational document review, display and validation
US10719898B2 (en) Systems and methods for analyzing documents
Van Eck et al. Visualizing bibliometric networks
Leydesdorff et al. Mapping the geography of science: Distribution patterns and networks of relations among cities and institutes
JP5073494B2 (ja) 文書処理装置および文書処理方法
JP4956757B2 (ja) 数式記述構造化言語オブジェクト検索システムおよび検索方法
US20130305149A1 (en) Document reader and system for extraction of structural and semantic information from documents
Gaizauskas et al. The METER corpus: a corpus for analysing journalistic text reuse
CN108090104B (zh) 用于获取网页信息的方法和装置
US8601367B1 (en) Systems and methods for generating filing documents in a visual presentation context with XBRL barcode authentication
US20080239413A1 (en) Auditing System and Method for Digital Documents
JP2008515061A (ja) 概念的メタデータおよび文脈的メタデータの検索エンジンを用いたウェブ上におけるデータ要素の検索方法
JP2008165641A (ja) 会計情報収集・分析システム及びその方法並びにプログラム
JP2011022705A (ja) 証跡管理方法、システム、及びプログラム
US9805429B2 (en) System and methods for analyzing documents
Basoglu et al. Inline XBRL versus XBRL for SEC reporting
Portisch et al. Visual analysis of ontology matching results with the melt dashboard
WO2007132524A1 (ja) 差分抽出プログラム、方法及び装置
JP5271920B2 (ja) オンライン検索のために構造化データを用いる方法
JP5766438B2 (ja) 電子メディアにおけるクリックスルー機能に関する方法およびシステム
JP4987434B2 (ja) 電文データの監査用保管・検索システム、電文データの監査用保管・検索方法、および電文データの監査用保管・検索プログラム
Liauw Content Analysis and Its Application with Dynamic Online Content: A Case Study
Wingkvist et al. A Visualization‑based Approach to Present and Assess Technical Documentation Quality
Arshad Privacy fox-A JavaScript-based P3P agent for Mozilla Firefox
Souza et al. A framework for auditing XBRL documents based on the GRI sustainability guidelines

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 06746454

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06746454

Country of ref document: EP

Kind code of ref document: A1