WO2014010029A1 - プログラム、マッピング装置およびマッピング方法 - Google Patents

プログラム、マッピング装置およびマッピング方法 Download PDF

Info

Publication number
WO2014010029A1
WO2014010029A1 PCT/JP2012/067614 JP2012067614W WO2014010029A1 WO 2014010029 A1 WO2014010029 A1 WO 2014010029A1 JP 2012067614 W JP2012067614 W JP 2012067614W WO 2014010029 A1 WO2014010029 A1 WO 2014010029A1
Authority
WO
WIPO (PCT)
Prior art keywords
items
item
parent
change
child
Prior art date
Application number
PCT/JP2012/067614
Other languages
English (en)
French (fr)
Inventor
貴之 井ノ上
傑 鷲尾
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to JP2014524524A priority Critical patent/JP6079780B2/ja
Priority to PCT/JP2012/067614 priority patent/WO2014010029A1/ja
Publication of WO2014010029A1 publication Critical patent/WO2014010029A1/ja
Priority to US14/592,229 priority patent/US10437857B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/282Hierarchical databases, e.g. IMS, LDAP data stores or Lotus Notes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Definitions

  • the present invention relates to a program, a mapping device, and a mapping method.
  • XBRL eXtensible Business Reporting Language
  • An XBRL document is a document described in XBRL, which is a report description language based on XML (eXtensible Markup Language), for example, for financial reporting.
  • XBRL data used to create such an XBRL document is changed by, for example, amendments to laws and regulations, changes in accounting standards, and changes in financial reporting policies of corporate supervisors.
  • XBRL data includes a schema and a link base.
  • a schema is a list of items used in XBRL data, and a name and a data type are defined for each item.
  • the link base defines the relationship between items included in the schema. For example, the link base defines a tree structure relationship in which a plurality of child items hang from a parent item. Further, order information is defined in the link base as auxiliary information of child items, and the display order of the child items is determined by the order information. Using such XBRL data, items before and after the change are associated with each other.
  • FIG. 15 is a diagram illustrating an example in which items before and after change are associated with each other using XBRL data.
  • FIG. 15 shows XBRL data before and after the change.
  • the mapping device that maps the items before and after the change is Focus on parent-child relationships, sibling relationships, or auxiliary information.
  • the mapping device compares the parent item and sibling item of the item to be compared, and the item name of the parent item is the same “Assets”, and the item name of the sibling item is also the same “NonCurrentAssets”. Judge that.
  • the mapping apparatus gives a result that the item name “CurrentAssets” to be compared is changed to the item name “CurrentAsset” to be compared, and associates the items before and after the change (see, for example, Patent Document 1).
  • FIG. 16 is a diagram illustrating an example in which items before and after the change cannot be optimally associated with each other.
  • FIG. 16 shows XBRL data before and after the change.
  • the mapping device pays attention to the parent-child relationship, sibling relationship, or auxiliary information of the two items before and after the change. To do.
  • the mapping device compares label information as parent information, sibling items, and auxiliary information of items of comparison target items. Then, the mapping device determines that the item name of the parent item is the same.
  • the item names of the sibling items are “CurrentCosts” and “CurrentPrices”, which are not the same.
  • the label information does not completely match “current assets” and “current assets”. Therefore, the mapping apparatus cannot reliably produce a result that the comparison target item name “CurrentAssets” is changed to the comparison target item name “CurrentResources”. As a result, the mapping device cannot optimally associate the items before and after the change.
  • an object of the present invention is to be able to associate items before and after the change even if a plurality of pieces of information related to the items of the XBRL data are changed.
  • a program that stores a top-level parent item in a hierarchical relationship between items of first data including an item before change and a hierarchical relationship between items of second data including an item after change.
  • a matching rate between each item is calculated using item information relating to each item, and a process of associating the parent items of the first data and the second data based on the calculated matching rate is executed.
  • items before and after the change can be associated with each other even if a plurality of information related to the items of the XBRL data is changed.
  • FIG. 1 is a functional block diagram illustrating the configuration of the mapping apparatus according to the embodiment.
  • FIG. 2 is a diagram illustrating an example of a schema data structure.
  • FIG. 3 is a diagram illustrating an example of a data structure of a link base (display link).
  • FIG. 4 is a diagram illustrating an example of a data structure of a link base (label link).
  • FIG. 5 is a diagram illustrating an example of a data structure of a link base (reference link).
  • FIG. 6 is a diagram illustrating an example of mapping of the tree structure before and after the change.
  • FIG. 7 is a diagram illustrating an example of the tree structure before and after the change.
  • FIG. 8A is a diagram (1) illustrating a pattern example of a combination of child items before and after the change.
  • FIG. 8A is a diagram (1) illustrating a pattern example of a combination of child items before and after the change.
  • FIG. 8B is a diagram (2) illustrating a pattern example of a combination of child items before and after the change.
  • FIG. 8C is a diagram (3) illustrating a pattern example of a combination of child items before and after the change.
  • FIG. 9A is a diagram (1) for explaining a specific example of the pattern of the combination of child items before and after the change and the matching rate.
  • FIG. 9B is a diagram (2) illustrating a specific example of the pattern of the combination of child items before and after the change and the matching rate.
  • FIG. 10 is a diagram illustrating an example of output from the output unit.
  • FIG. 11 is a flowchart illustrating the procedure of the main process of the mapping process according to the embodiment.
  • FIG. 12 is a flowchart showing the procedure of the tree structure mapping process before and after the change.
  • FIG. 13 is a flowchart showing the procedure for mapping the items in the tree structure before and after the change.
  • FIG. 14 is a diagram illustrating an example of a computer that executes a mapping program.
  • FIG. 15 is a diagram illustrating an example in which items before and after the change are associated with each other using the XBRL data.
  • FIG. 16 is a diagram illustrating an example in which items before and after change cannot be optimally associated with each other.
  • FIG. 1 is a functional block diagram illustrating the configuration of the mapping apparatus according to the embodiment. As illustrated in FIG. 1, the mapping apparatus 1 inputs XBRL data 21 before change and XBRL data 22 after change, and associates items included in the XBRL data 21 and 22 before and after the change.
  • the taxonomy is defined in the XBRL data 21 and 22 before and after the change.
  • “Taxonomy” defines a system of items (hereinafter referred to as “items”) used in XBRL, and includes a schema and a link base.
  • the “schema” is a list of items, and the name and data type are defined for each item.
  • “Link base” defines link information for an item, and includes, for example, a display link, a label link, and a reference link.
  • Display link defines a parent-child relationship between items, a display order (order information), and the like.
  • “Label link” defines an item label (for example, “asset” as the label of the item name “Assets”).
  • “Reference link” defines document information that is the basis for defining an item (for example, “Rules for Financial Statements, Form No. A” as document information of the item name “Assets”). That is, the mapping apparatus 1 changes the item name, the label name, the document information name, or the order of the child items for the items included in the XBRL data 21 before the change. Even so, the items before and after the change are associated.
  • “schema” corresponds to the schema 41.
  • “Link base” corresponds to the link base 42. Each configuration example of the schema 41 and the link base 42 will be described later.
  • mapping device 1 includes a storage unit 2 and a control unit 3.
  • the storage unit 2 corresponds to a storage device such as a nonvolatile semiconductor memory element such as a flash memory or a FRAM (registered trademark) (Ferroelectric Random Access Memory).
  • the storage unit 2 includes XBRL data 21 before change and XBRL data 22 after change.
  • the XBRL data 21 before the change and the XBRL data 22 after the change are stored in the storage unit 2 by the structure analysis unit 31 described later.
  • the XBRL data 21 before the change and the XBRL data 22 after the change include a schema 41 and a link base 42, respectively.
  • the link base 42 includes a display link 421, a label link 422, and a reference link 423.
  • FIG. 2 is a diagram illustrating an example of a schema data structure.
  • FIG. 3 is a diagram illustrating an example of a data structure of a link base (display link).
  • FIG. 4 is a diagram illustrating an example of a data structure of a link base (label link).
  • FIG. 5 is a diagram illustrating an example of a data structure of a link base (reference link).
  • the schema 41 stores an item name 41b and a data type 41c in association with each ID (IDentification) 41a.
  • the ID 41a is an item identifier used in the XBRL data.
  • the item name 41b indicates the name of the item.
  • the data type 41c indicates the data type of the value associated with the item. As an example, when the ID 41a is “1”, “Assets” is stored as the item name 41b and “money type” is stored as the data type 41c.
  • the display link 421 stores a parent-child relationship 421a.
  • the parent-child relationship 421a defines a parent-child relationship between items using an item identifier and an arrow.
  • the parent-child relationship 421a is represented by “1 ⁇ 2”.
  • the child display order order information
  • the child display order is preceded as the child of the parent-child relationship 421a is higher.
  • the parent-child relationship 421a is not limited to the parent-child relationship, and may be a descendant relationship or a grandchild-great-grandchild relationship.
  • the label link 422 stores a label name 422b in association with each ID 422a.
  • the ID 422a is an item identifier and corresponds to the ID 41a shown in FIG.
  • the label name 422b indicates an item label. As an example, when the ID 422a is “1”, “current asset” is stored as the label name 422b.
  • the reference link 423 stores a reference name 423b in association with each ID 423a.
  • ID 423a is an item identifier and corresponds to the ID 41a shown in FIG.
  • the reference name 423b indicates document information that is the basis for defining the item. As an example, when the ID 423a is “1”, “Rules for Financial Statements, Form No. A” is stored as the reference name 423b.
  • the control unit 3 has an internal memory for storing programs and control data that define various processing procedures, and executes various processes using these.
  • the control unit 3 corresponds to, for example, an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or FPGA (Field Programmable Gate Array) or an electronic circuit such as a CPU (Central Processing Unit) or MPU (Micro Processing Unit).
  • the control unit 3 includes a structure analysis unit 31, a mapping unit 32, and an output unit 33.
  • the mapping unit 32 includes a tree structure mapping unit 321 and an item mapping unit 322.
  • the structure analysis unit 31 performs structure analysis using the XBRL data 21 and 22 before and after the change, and creates a tree structure before and after the change. For example, the structure analysis unit 31 inputs the XBRL data 21 and 22 before and after the change, and stores the input XBRL data 21 and 22 before and after the change in the storage unit 2. As an example, the structure analysis unit 31 is realized by inputting / outputting the XBRL data 21 and 22 before and after the change as a file to the storage device. In addition, the structure analysis unit 31 creates a tree structure using the parent-child relationship and the display order expressed from the display link 421 before the change for the items described in the schema 41 before the change.
  • the structure analysis unit 31 adds the label name represented by the label link 422 and the reference name represented by the reference link 423 to the created tree structure. Further, the structure analysis unit 31 creates a tree structure using the link base 42 after the change for the items described in the schema 41 after the change.
  • the mapping unit 32 includes a tree structure mapping unit 321 and an item mapping unit 322.
  • the tree structure mapping unit 321 is a tree related to the parent item before the change (comparison source) and the parent item after the change (comparison destination). To map.
  • the tree structure mapping unit 321 maps the comparison source tree and the comparison destination tree closest in structure.
  • the tree structure mapping unit 321 compares the item name and auxiliary information for the top parent items of the comparison source tree and the comparison target tree.
  • the auxiliary information includes, as an example, a label name, a reference name, and the number of child items hanging from the parent item.
  • FIG. 6 is a diagram illustrating an example of mapping of the tree structure before and after the change.
  • FIG. 6 there is a tree whose parent item is “Assets” in the tree structure of the comparison source, “Asset” as the label information of the parent item, “Rules for Financial Statements, Form No. A” as the reference information, 3 is described as the number of child items.
  • label information, reference information, and number of child items are auxiliary information.
  • the tree structure mapping unit 321 compares the item name, label information, reference information, and the number of child items between the parent items of the comparison source and the comparison destination candidates.
  • the tree structure mapping unit 321 compares the item names of the parent items of the comparison source and the comparison destination candidates, the candidate 1 in which the last character “s” is deleted from the comparison source item name is similar. Is determined. Then, the tree structure mapping unit 321 determines that the candidate 1 matches the comparison source by comparing the label information, the reference information, and the number of child items of the comparison source and the comparison destination candidate. As a result, the tree structure mapping 321 can map the tree of the parent item “Asset” indicated by the comparison target candidate 1 to the tree of the parent item “Assets” of the comparison source.
  • the comparison by the tree structure mapping unit 321 is performed using, as a specific example, the matching rate of the item name of each parent item and the matching rate of the auxiliary information of each parent item.
  • the matching rate of character strings such as item names, label names, and reference names is calculated by the following equation (1).
  • a 0 is the matching rate of item names.
  • a 1 is the match of the label name.
  • a 2 is a matching rate of reference names.
  • the maximum number of characters indicates the larger number of characters in the comparison source character string and the comparison destination character string.
  • the number of mismatched characters is calculated using the Levenshtein distance as an example, but is not limited to this as long as the similarity of character strings is obtained.
  • Matching rate a 3 number of children items is calculated by the following equation (2).
  • the maximum number of items indicates the larger of the number of child items owned by the comparison-source parent item and the number of child items owned by the comparison-destination parent item.
  • the difference in the number of items indicates the absolute value of the difference between the number of child items owned by the parent item of the comparison source and the number of child items owned by the parent item of the comparison destination.
  • the tree structure mapping unit 321 calculates a matching rate between parent items by calculating an average of the calculated matching rates.
  • the coincidence rate between parent items is calculated by the following equation (3).
  • n represented by Formula (3) represents 4.
  • the tree structure mapping unit 321 maps the tree of the two parent items having the highest matching rate between the parent items as being the closest tree in the structure. Thereafter, the item mapping unit 322, which will be described later, maps the child items in these trees.
  • the item mapping unit 322 calculates a matching rate between the parent item of the mapped tree before the change and the child item hanging from the parent item of the tree after the change. For example, the item mapping unit 322 creates a plurality of patterns of child items included in the respective trees before and after the change. In addition, the item mapping unit 322 calculates a matching rate between the child items included in the pattern for each of the plurality of created patterns. The matching rate between the child items is calculated using the matching rate of the item names of each child item and the matching rate of the auxiliary information of each child item.
  • the auxiliary information here includes, as an example, a label name, a reference name, and order information (display order).
  • the matching rate of character strings such as item names, label names, and reference names is calculated by equation (1) as in the matching rate of parent items. Further, the coincidence rate of the order information is calculated by the following formula (4).
  • the maximum order number indicates the larger order number of the order number of the child item of the comparison source and the order number of the child item of the comparison destination.
  • the difference between the order numbers indicates the absolute value of the difference between the order number of the comparison-source child item and the order number of the comparison-destination child item.
  • the item mapping unit 322 calculates the coincidence rate between the child items by calculating the average of the calculated respective coincidence rates.
  • the matching rate between the child items is calculated by the following formula (5).
  • n represented by Formula (5) represents 4.
  • a 0 is an item name matching rate.
  • a 1 is the match of the label name.
  • a 2 is a matching rate of reference names.
  • a 3 is, the concordance rate of the order.
  • the item mapping unit 322 calculates the matching rate between the child items included in the pattern
  • the item mapping unit 322 calculates the average matching rate between the child items included in the pattern, thereby calculating the matching rate of the entire tree for each pattern. calculate.
  • the coincidence rate of the entire tree is calculated by the following equation (6).
  • M represented by Expression (6) indicates the number of child items included in the pattern.
  • e k represents a rate of matching child items with each other included in the pattern. It is estimated that the higher the overall matching rate E is, the higher the matching rate between the child items included in the pattern for which the overall matching rate is calculated.
  • the item mapping 322 maps the child items of the pattern with the highest matching rate calculated. As a result, the item mapping 322 can optimally map items before and after the change even if a plurality of items of item names and auxiliary information related to the item are changed.
  • the output unit 33 outputs items whose matching rates are not completely matched (100%) for the parent items mapped by the tree structure mapping unit 321 and the child items mapped by the item mapping 322. Thereby, the output part 33 can represent the result of optimally mapping the items before and after the change even if a plurality of information among the item name and auxiliary information related to the item is changed.
  • FIG. 7 is a diagram illustrating an example of the tree structure before and after the change.
  • 8A to 8C are diagrams showing an example of a combination pattern of child items before and after the change.
  • a comparison source parent item tree and a mapped comparison destination parent item tree are represented.
  • Three child items are described in each of the comparison source and comparison target trees. For example, the item name “DeferrdAssets” of the comparison source is changed to the item name “DeferrdAsset” of the comparison destination, and the order information is also changed from 2 to 3.
  • the item mapping unit 322 creates a plurality of combinations of child items included in the respective comparison source and comparison target trees. For example, as shown in FIG. 8A, as pattern 1, the combination of the comparison source “CurrentAssets” and the comparison destination “CurrentAsset”, the combination of the comparison source “DeferredAssets” and the comparison destination “NonCurrentAsset”, and the comparison source “NonCurrentAssets” It is a combination with the previous “DeferredAsset”. As shown in FIG.
  • the item mapping unit 322 uses the item name of each child item and auxiliary information such as the label name, reference name, and order information for the matching rate between the child items included in the pattern for each of the patterns 1 to 3. To calculate. Then, the item mapping unit 322 calculates the matching rate of the entire tree for each of the patterns 1 to 3 by calculating the average of the matching rates of all the child items included in the pattern. Then, the item mapping unit 322 selects a pattern having the highest overall matching rate. Here, it is assumed that the item mapping unit 322 can select the pattern 2.
  • the child item name “CurrentAssets” is changed to “CurrentAsset”
  • the child item name “DeferredAssets” is changed to “DeferredAsset”
  • the child item name “NonCurrentAssets” is changed to “NonCurrentAsset”.
  • the item mapping 322 can optimally map the child items before and after the change even if the item names of the child items and the display order of the child items are changed. That is, the item mapping unit 322 can optimally map the items before and after the change even if a plurality of items of item names and auxiliary information regarding the items are changed.
  • FIG. 9A and FIG. 9B are diagrams for explaining a specific example of a combination pattern and matching rate between child items before and after the change.
  • FIG. 9A a tree of the parent item “Assets” of the comparison source and a tree of the parent item “Asset” of the mapped comparison destination are represented.
  • Three child items are described in each of the comparison source and comparison target trees.
  • order information is described as auxiliary information.
  • Each item is given an item number corresponding to the item for convenience of explanation.
  • the contents in parentheses after the item name indicate the item number.
  • “′” is added to the item number of the comparison destination with respect to the comparison source.
  • the item name “CurrentAssets” (2) of the comparison source is changed to the item name “CurrentAsset” (2 ′) of the comparison destination.
  • the item name “NonCurrentAssets” (3) of the comparison source is changed to the item name “NonCurrentAsset” (3 ′) of the comparison destination.
  • the item name “DeferrdAssets” (4) of the comparison source is changed to the item name “DeferrdAsset” (4 ′) of the comparison destination.
  • the item mapping unit 322 creates a plurality of patterns of combinations of child items included in the respective comparison source and comparison target trees.
  • the pattern p1 is a combination of the comparison source “CurrentAssets” (2) and the comparison destination “CurrentAsset” (2 ′), and the comparison source “NonCurrentAssets” (3) and the comparison destination “NonCurrentAsset” (3 ′).
  • the combination is a combination of the comparison source “DeferrdAssets” (4) and the comparison destination “DeferrdAsset” (4 ′).
  • the description of the pattern will be described using only item numbers, omitting item names.
  • the pattern p2 is a combination of the comparison source 2 and the comparison destination 2 ′, a combination of the comparison source 3 and the comparison destination 4 ′, and a combination of the comparison source 4 and the comparison destination 3 ′.
  • the pattern p3 is a combination of the comparison source 2 and the comparison destination 3 ′, a combination of the comparison source 3 and the comparison destination 2 ′, and a combination of the comparison source 4 and the comparison destination 4 ′.
  • the pattern p4 is a combination of the comparison source 2 and the comparison destination 3 ′, a combination of the comparison source 3 and the comparison destination 4 ′, and a combination of the comparison source 4 and the comparison destination 2 ′.
  • the pattern p5 is a combination of the comparison source 2 and the comparison destination 4 ′, a combination of the comparison source 3 and the comparison destination 2 ′, and a combination of the comparison source 4 and the comparison destination 3 ′.
  • the pattern p6 is a combination of the comparison source 2 and the comparison destination 4 ′, a combination of the comparison source 3 and the comparison destination 3 ′, and a combination of the comparison source 4 and the comparison destination 2 ′.
  • the item mapping unit 322 calculates the matching rate between the child items included in the pattern for each of the plurality of created patterns p1 to p6.
  • the matching rate between the child items is calculated using the matching rate of the item names of the child items among the child items and the matching rate of the order information as auxiliary information of each child item.
  • the matching rate of the item names of the child items among the child items is calculated by Expression (1).
  • the coincidence ratio of the order information of each child item among the child items is calculated by the equation (4). Then, the coincidence rate between the child items is calculated by Expression (5).
  • the percentage following the combination of the child items is the matching rate between the child items.
  • the matching rate between the child items in the combination of the comparison source 2 and the comparison destination 2 ′ is 92.3%.
  • the matching rate between the child items in the combination of the comparison source 3 and the comparison destination 3 ′ is 93.80%.
  • the matching rate between the child items in the combination of the comparison source 4 and the comparison destination 4 ′ is 92.30%.
  • the item mapping unit 322 calculates the matching rate of the entire tree for each of the patterns p1 to p6 by calculating the average of matching rates between the child items included in the pattern.
  • the matching rate of the entire tree for each pattern is calculated by Expression (6).
  • the matching rate of the entire tree of the pattern p1 is 92.80%.
  • the matching rate of the entire tree of the pattern p2 is 55.80%.
  • the matching rate of the entire tree of the pattern p3 is 78.80%.
  • the matching rate of the entire tree of the pattern p4 is 48.40%.
  • the matching rate of the entire tree of the pattern p5 is 50.30%.
  • the matching rate of the entire tree of the pattern p6 is 56.90%.
  • the item mapping unit 322 selects a pattern having the highest overall matching rate.
  • the item mapping unit 322 selects the 92.80% pattern p1 having the highest value.
  • the child item name “CurrentAssets” (2) has been changed to “CurrentAsset” (2 ′).
  • the child item name “NonCurrentAssets” (3) has been changed to “NonCurrentAsset” (3 ′).
  • the child item name “DeferredAssets” (4) has been changed to “DeferredAsset” (4 ′).
  • FIG. 10 is a diagram illustrating an example of output from the output unit.
  • an output example in the pattern p1 selected in FIG. 9B is shown.
  • FIG. 11 is a flowchart illustrating the procedure of the main process of the mapping process according to the embodiment.
  • the control unit 3 determines whether or not there is a mapping request (step S11). When it determines with there being no mapping request
  • the structure analysis unit 31 performs a structure analysis using the XBRL data 21 and 22 before and after the change, and creates a tree structure before and after the change (step S13). For example, the structure analysis unit 31 creates a tree structure using the link base 42 before the change for items described in the schema 41 before the change. Further, the structure analysis unit 31 creates a tree structure using the link base 42 after the change for the items described in the schema 41 after the change.
  • the tree structure mapping 321 performs a mapping process of the tree structure before and after the change (step S14).
  • the item mapping unit 322 performs mapping processing of the items in the tree structure before and after the change in which the mapping processing has been performed (step S15). Then, the main process of the mapping process ends.
  • FIG. 11 is a flowchart showing the procedure of the tree structure mapping process before and after the change. It is assumed that the tree structure mapping unit 321 receives the tree structures before and after the change created by the structure analysis unit 31.
  • the tree structure mapping unit 321 extracts one piece of tree structure information (target information) composed of the parent item and the child item before the change (comparison source) (step S21). Then, the tree structure mapping unit 321 extracts one piece of tree structure information to be compared (the comparison target) after the change (step S22).
  • the tree structure mapping unit 321 calculates the matching rate between the parent items from the item name of the parent item and the auxiliary information (step S23).
  • the auxiliary information includes label information, reference information, and the number of child items hanging from the parent item.
  • the coincidence rate between the parent items is calculated using Expressions (1) to (3).
  • the tree structure mapping unit 321 determines whether there is still information to be compared (step S24). When it is determined that there is still information to be compared (step S24; Yes), the tree structure mapping unit 321 proceeds to step S22 in order to extract information to be compared next.
  • step S24 when it is determined that there is no information to be compared (step S24; No), the tree structure mapping unit 321 compares the extracted target information with the highest match rate (of parent items) among the comparison targets. A target is determined (step S25).
  • the tree structure mapping unit 321 maps the determined comparison target to the extracted target information, and outputs the mapped information (step S26).
  • the tree structure mapping unit 321 maps the tree structure related to the comparison target parent item having the highest matching rate with the parent item of the target information to the tree structure related to the parent item of the target information. That is, the tree structure mapping unit 321 maps the tree structure of the parent items having the highest matching rate between the parent items as the tree structure closest to the structure.
  • the tree structure mapping unit 321 determines whether extraction and mapping of all target information has been completed (step S27). If it is determined that extraction and mapping of all target information has not been completed (step S27; No), the tree structure mapping unit 321 proceeds to step S21 to extract the next target information.
  • step S27 when it is determined that the extraction and mapping of all target information has been completed (step S27; Yes), the tree structure mapping unit 321 ends the tree structure mapping process.
  • FIG. 13 is a flowchart showing the procedure for mapping the items in the tree structure before and after the change. It is assumed that the item mapping unit 322 receives a set of tree structures before and after a change mapped by the tree structure mapping 321.
  • the item mapping unit 322 receives a set of tree structures (target information) before and after the change mapped by the tree structure mapping 321 (step S31).
  • the tree structure is composed of parent items and child items.
  • the item mapping unit 322 creates an exhaustively combined pattern using the child items in the target information before and after the change (step S32).
  • the item mapping unit 322 extracts one pattern from all patterns (step S33). Then, the item mapping unit 322 calculates the matching rate between the child items included in the extracted pattern from the item name and auxiliary information of the child item (step S34).
  • the auxiliary information includes label information, reference information, and order information. For example, the coincidence rate between the child items is calculated using Expression (1), Expression (4), and Expression (5).
  • the item mapping unit 322 calculates the average of the match rates of all the child items included in the extracted pattern (step S35).
  • the calculated result indicates the matching rate of the entire tree structure regarding the extracted pattern.
  • the matching rate of the entire tree structure is calculated using Expression (6).
  • step S36 determines whether or not there is another pattern. If it is determined that there is still another pattern (step S36; Yes), the item mapping unit 322 proceeds to step S33 in order to extract the next pattern.
  • step S36 determines a pattern having the highest matching rate of the entire tree structure (step S37). Then, the item mapping unit 322 maps the child items in the target information before and after the change based on the determined pattern, and outputs the mapped information (step S38). In other words, the item mapping unit 322 maps the child items included in the pattern having the highest matching rate of the entire tree structure. Then, the item mapping unit 322 ends the mapping process of items in the tree structure.
  • the mapping device 1 determines the matching rate between the top parent items in the parent-child relationship between the items of the XBRL data 21 before the change and the parent-child relationship between the items of the XBRL data 22 after the change. , Using item information (for example, item name and auxiliary information) regarding each parent item. Then, the mapping apparatus 1 maps the parent items of the XBRL data 21 before the change and the XBRL data 22 after the change based on the calculated matching rate between the parent items. According to such a configuration, the mapping device 1 maps the parent items based on the matching rate between the parent items using the item information regarding the parent item.
  • item information for example, item name and auxiliary information
  • the mapping device 1 uses the matching rate between the parent items using the item information for mapping the parent item in which the plurality of item information has been changed and the parent item before the change. It is possible to optimally map the changed parent item and the parent item before the change.
  • the mapping device 1 calculates the matching rate of the item names between the parent items and the matching rate of the auxiliary information regarding the parent item between the parent items. Then, the mapping device 1 calculates the coincidence rate between the parent items by calculating the average of the calculated coincidence rates. According to this configuration, the mapping device 1 uses the matching rate between the parent items for mapping the parent item before and after the change even if the item name of the parent item and the auxiliary information related to the parent item are changed. It is possible to optimally map the changed parent item and the parent item before the change.
  • the mapping device 1 matches the item name matching rate between parent items, the matching rate of auxiliary information related to the parent item between parent items, and the number of child items hanging on each parent item between parent items. The matching rate of is calculated. Then, the mapping device 1 calculates the coincidence rate between the parent items by calculating the average of the calculated coincidence rates. According to such a configuration, the mapping device 1 uses the matching rate between parent items including the number of child items hanging on the parent item in the mapping of the parent item before and after the change even if a plurality of information about the parent item is changed. . As a result, the mapping apparatus 1 can optimally map the parent item whose information has been changed and the parent item before the change.
  • the mapping device 1 maps the parent items, the matching rate between the child items hanging from the mapped parent item of the XBRL data 21 before the change and the parent item of the XBRL data 22 after the change, respectively. Is calculated using the item information related to the child items. Then, the mapping device 1 maps the child items of the XBRL data 21 and the XBRL data 22 based on the calculated matching rate between the child items. According to such a configuration, the mapping apparatus 1 maps child items based on the matching rate between the child items using the item information regarding the child items.
  • the mapping device 1 uses the matching rate between the child items using the item information for mapping the child item whose item information has been changed and the child item before the change, so that the item information can be obtained. It is possible to optimally map the changed child item and the child item before the change. For example, the mapping device 1 uses the matching rate between the child items including the item name and the display order even if the item name and the display order of the child items are changed, so that the changed child item and the child before the change are used. Items can be optimally mapped.
  • the mapping apparatus 1 creates a plurality of patterns of combinations of child items hanging on the parent item of the mapped XBRL data 21 before the change and the parent item of the changed XBRL data 22 respectively. Then, the mapping device 1 calculates the matching rate between the child items for each of the plurality of created patterns. Furthermore, the mapping apparatus 1 maps the child items of the XBRL data 21 before the change and the XBRL data 22 after the change based on the matching rate between the child items calculated for each pattern. According to such a configuration, the mapping device 1 maps the child items based on the matching rate between the child items using the item information regarding the child items calculated for each combination pattern of the child items. The mapped child item and the child item before change can be efficiently mapped.
  • the mapping device 1 can be realized by mounting the above-described functions such as the control unit 3 and the storage unit 2 on an information processing device such as a known personal computer or workstation.
  • each component of the illustrated mapping apparatus 1 does not necessarily need to be physically configured as illustrated.
  • the specific mode of distribution / integration of the mapping apparatus 1 is not limited to that shown in the figure, and all or a part of the mapping apparatus 1 is functionally or physically distributed in arbitrary units according to various loads or usage conditions. -Can be integrated and configured.
  • the tree structure mapping 321 and the item mapping unit 322 may be integrated as one unit.
  • the item mapping unit 322 is distributed into a creation unit that creates a pattern of combinations of child items included in the comparison source and comparison target trees, and a mapping unit that maps child items using the created pattern. May be.
  • the storage unit 2 such as the XBRL data 21 before the change or the XBRL data 22 after the change may be connected as an external device of the mapping device 1 via the network.
  • FIG. 14 is a diagram illustrating an example of a computer that executes a mapping program.
  • the computer 200 includes a CPU 203 that executes various arithmetic processes, an input device 215 that receives input of data from a user, and a display control unit 207 that controls the display device 209.
  • the computer 200 also includes a drive device 213 that reads a program or the like from a storage medium, and a communication control unit 217 that exchanges data with another computer via a network.
  • the computer 200 also includes a memory 201 that temporarily stores various types of information and an external storage device 205.
  • the memory 201, CPU 203, external storage device 205, display control unit 207, drive device 213, input device 215, and communication control unit 217 are connected via a bus 219.
  • the drive device 213 is a device for the removable disk 211, for example.
  • the external storage device 205 stores a mapping program 205a and mapping related information 205b.
  • the CPU 203 reads the mapping program 205a and develops it in the memory 201.
  • the mapping program 205a functions as a mapping process 201a.
  • mapping process 201 a corresponds to each functional unit of the control unit 3.
  • the mapping related information 205b corresponds to the XBRL data 21 before the change and the XBRL data 22 after the change.
  • mapping program 205a is not necessarily stored in the external storage device 205 from the beginning.
  • the program is stored in a “portable physical medium” such as a flexible disk (FD), a CD-ROM, a DVD disk, a magneto-optical disk, or an IC card inserted into the computer 200. Then, the computer 200 may read out and execute the mapping program 205a from these.
  • a “portable physical medium” such as a flexible disk (FD), a CD-ROM, a DVD disk, a magneto-optical disk, or an IC card inserted into the computer 200.
  • the computer 200 may read out and execute the mapping program 205a from these.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

 マッピング装置(1)は、変更前の項目を含む変更前のXBRLデータ(21)および変更後の項目を含む変更後のXBRLデータ(22)の変更前後の項目をマッピングする。マッピング装置(1)は、変更前のXBRLデータ(21)の項目間の親子関係および変更前のXBRLデータ(21)の項目間の親子関係の中で最上位の親項目同士の一致率を、各項目の項目名および各項目に関する補助情報を用いて算出する。そして、マッピング装置(1)は、算出した一致率に基づいて、変更前のXBRLデータ(21)と変更前のXBRLデータ(21)の親項目同士をマッピングする。これにより、マッピング装置(1)は、XBRLデータの項目に関する複数の情報が変更されても、変更前後の項目同士をマッピングできる。

Description

プログラム、マッピング装置およびマッピング方法
 本発明は、プログラム、マッピング装置およびマッピング方法に関する。
 XBRL(eXtensible Business Reporting Language)文書による財務諸表を金融庁へ提出することが義務付けられている。XBRL文書とは、例えば財務報告に関して、XML(eXtensible Markup Language)をベースにした報告書記述言語であるXBRLで記述された文書である。
 かかるXBRL文書の作成に用いられるXBRLデータは、例えば法令の改正、会計基準の変更および企業の監督機関の財務報告の方針の変更等により変更される。XBRLデータには、スキーマやリンクベースが含まれる。スキーマとは、XBRLデータで用いられる項目の一覧であり、項目毎に名前およびデータ型を定義する。リンクベースとは、スキーマに含まれるそれぞれの項目間の関係性を定義する。例えば、リンクベースは、親の項目に複数の子の項目がぶら下がるツリー構造の関係性を定義する。さらに、リンクベースには、子の項目の補助情報としてオーダー情報が定義されており、オーダー情報によって子の項目の表示順序が決定される。このようなXBRLデータを用いて、変更前後の項目同士が対応付けられる。
 図15は、XBRLデータを用いて変更前後の項目同士が対応付けられる例を示す図である。図15には、変更前と変更後のXBRLデータが表されている。変更前のXBRLデータ内の項目名“CurrentAssets”が変更後のXBRLデータ内の項目名“CurrentAsset”に変更された場合、変更前後の項目同士をマッピングするマッピング装置は、変更前後の2つの項目の親子関係、兄弟関係あるいは補助情報に注目する。図15では、マッピング装置は、比較対象の項目の親項目、兄弟項目を比較して、親項目の項目名が同一の“Assets”であり、兄弟項目の項目名も同一の“NonCurrentAssets”であることを判定する。そして、マッピング装置は、比較対象の項目名“CurrentAssets”が比較対象の項目名“CurrentAsset”に変更されたという結果を出し、変更前後の項目同士を対応付ける(例えば、特許文献1参照)。
国際公開第2011/089683号
 しかしながら、XBRLデータの項目に関する複数の情報が変更された場合、変更前後の項目同士を最適に対応付けることができないという問題があった。例えば、XBRLデータの項目の項目名が変更されるとともに、変更があった項目の補助情報が変更された場合、変更前後の項目同士を最適に対応付けることができない。
 図16は、変更前後の項目同士を最適に対応付けることができない例を示す図である。図16には、変更前と変更後のXBRLデータが表されている。変更前のXBRLデータの項目名“CurrentAssets”が変更後のXBRLデータの項目名“CurrentResources”に変更された場合、マッピング装置は、変更前後の2つの項目の親子関係、兄弟関係あるいは補助情報に注目する。図16では、マッピング装置は、比較対象の項目の親項目、兄弟項目および項目の補助情報としてラベル情報を比較する。すると、マッピング装置は、親項目の項目名は同一であると判定する。ところが、兄弟項目の項目名が“CurrentCosts”と“CurrentPrices”であり、同一でない。さらに、ラベル情報が“流動資産”と“流同資産”で完全に一致していない。そこで、マッピング装置は、比較対象の項目名“CurrentAssets”が比較対象の項目名“CurrentResources”に変更されたという結果を確実に出せない。この結果、マッピング装置は、変更前後の項目同士を最適に対応付けることができない。
 1つの側面では、本発明は、XBRLデータの項目に関する複数の情報が変更されても、変更前後の項目同士を対応付けることができることを目的とする。
 一態様のプログラムは、コンピュータに、変更前の項目を含む第1のデータの項目間の階層関係および変更後の項目を含む第2のデータの項目間の階層関係の中で最上位の親項目同士の一致率を、各項目に関する項目情報を用いて算出し、該算出した一致率に基づいて、前記第1のデータと前記第2のデータの親項目同士を対応付ける、処理を実行させる。
 一つの態様によれば、XBRLデータの項目に関する複数の情報が変更されても、変更前後の項目同士を対応付けることができる。
図1は、実施例に係るマッピング装置の構成を示す機能ブロック図である。 図2は、スキーマのデータ構造の一例を示す図である。 図3は、リンクベース(表示リンク)のデータ構造の一例を示す図である。 図4は、リンクベース(ラベルリンク)のデータ構造の一例を示す図である。 図5は、リンクベース(参照リンク)のデータ構造の一例を示す図である。 図6は、変更前後のツリー構造のマッピングの一例を示す図である。 図7は、変更前後のツリー構造の一例を示す図である。 図8Aは、変更前後の子項目同士の組合せのパターン例を示す図(1)である。 図8Bは、変更前後の子項目同士の組合せのパターン例を示す図(2)である。 図8Cは、変更前後の子項目同士の組合せのパターン例を示す図(3)である。 図9Aは、変更前後の子項目同士の組合せのパターンと一致率の具体例を説明する図(1)である。 図9Bは、変更前後の子項目同士の組合せのパターンと一致率の具体例を説明する図(2)である。 図10は、出力部による出力の一例を示す図である。 図11は、実施例に係るマッピング処理の主処理の手順を示すフローチャートである。 図12は、変更前後のツリー構造のマッピング処理の手順を示すフローチャートである。 図13は、変更前後のツリー構造内の項目のマッピング処理の手順を示すフローチャートである。 図14は、マッピングプログラムを実行するコンピュータの一例を示す図である。 図15は、XBRLデータを用いて変更前後の項目同士が対応付けられる例を示す図である。 図16は、変更前後の項目同士を最適に対応付けることができない例を示す図である。
 以下に、本願の開示するプログラム、マッピング装置およびマッピング方法の実施例を図面に基づいて詳細に説明する。なお、実施例によりこの発明が限定されるものではない。
[実施例に係るマッピング装置の構成]
 図1は、実施例に係るマッピング装置の構成を示す機能ブロック図である。図1に示すように、マッピング装置1は、変更前のXBRLデータ21および変更後のXBRLデータ22を入力し、変更前後のXBRLデータ21、22に含まれる項目間を対応付ける。
 変更前後のXBRLデータ21、22には、それぞれタクソノミが定義されている。「タクソノミ」とは、XBRLで用いられる項目(以下、「項目」という)の体系を定義したものであり、スキーマとリンクベースとからなる。「スキーマ」は、項目の一覧であり、項目毎にその名前およびデータ型を定義する。「リンクベース」は、項目に対するリンク情報を定義し、例えば表示リンク、ラベルリンクや参照リンクがある。「表示リンク」とは、項目間の親子関係や表示順序(オーダー情報)等を定義する。「ラベルリンク」とは、項目のラベル(例えば、項目の名前“Assets”のラベルとして“資産”)を定義する。「参照リンク」とは、項目の定義の根拠となった文献情報(例えば、項目の名前“Assets”の文献情報として“財務諸表等規則、様式第A号”)を定義する。つまり、マッピング装置1は、変更前のXBRLデータ21に含まれる項目について、項目名が変更されたり、ラベル名が変更されたり、文献情報名が変更されたり、子項目の順番が変更された場合であっても、変更前後の項目間を対応付ける。
 なお、実施例では、「スキーマ」が、スキーマ41に対応する。「リンクベース」が、リンクベース42に対応する。スキーマ41およびリンクベース42の各構成例については、後述する。
 また、マッピング装置1は、記憶部2と、制御部3とを有する。
 記憶部2は、例えばフラッシュメモリ(Flash Memory)やFRAM(登録商標)(Ferroelectric Random Access Memory)等の不揮発性の半導体メモリ素子等の記憶装置に対応する。そして、記憶部2は、変更前のXBRLデータ21および変更後のXBRLデータ22を有する。
 変更前のXBRLデータ21および変更後のXBRLデータ22は、後述する構造解析部31によって記憶部2に格納される。変更前のXBRLデータ21および変更後のXBRLデータ22は、それぞれスキーマ41およびリンクベース42を含む。さらに、リンクベース42は、表示リンク421とラベルリンク422と参照リンク423とを含む。
 ここで、スキーマ41、およびリンクベース42に含まれる表示リンク421とラベルリンク422と参照リンク423のデータ構造について、図2~図5を参照して説明する。図2は、スキーマのデータ構造の一例を示す図である。図3は、リンクベース(表示リンク)のデータ構造の一例を示す図である。図4は、リンクベース(ラベルリンク)のデータ構造の一例を示す図である。図5は、リンクベース(参照リンク)のデータ構造の一例を示す図である。
 図2に示すように、スキーマ41は、ID(IDentification)41a毎に、項目名41bおよびデータ型41cを対応付けて記憶する。ID41aは、XBRLデータで用いられる項目の識別子である。項目名41bは、項目の名前を示す。データ型41cは、項目に対応付けられる値のデータ型を示す。一例として、ID41aが「1」である場合、項目名41bとして「Assets」、データ型41cとして「金額型」と記憶している。
 図3に示すように、表示リンク421は、親子関係421aを記憶する。親子関係421aは、項目間の親子関係を、項目の識別子と矢印を用いて定義する。図3の例では、項目の識別子「1」が親であり、項目の識別子「2」が子である場合、親子関係421aは、「1→2」で表される。また、同一の親に対して複数の子がある場合、例えば親子関係421aの子が上にあるほど、子の表示順序(オーダー情報)が先行するものとする。図3の例では、親の項目の識別子「1」に対して複数の子の項目の識別子「2」、「3」がある。この場合、上にある「2」の識別子の子が、オーダー情報を「1」とし、下にある「3」の識別子の子が、オーダー情報を「2」とする。なお、親子関係421aは、親子の関係に限られず、子孫の関係であっても良く、孫から曾孫の関係であっても良い。
 図4に示すように、ラベルリンク422は、ID422a毎に、ラベル名422bを対応付けて記憶する。ID422aは、項目の識別子であり、図2で示されたID41aに対応する。ラベル名422bは、項目のラベルを示す。一例として、ID422aが「1」である場合、ラベル名422bとして「流動資産」と記憶している。
 図5に示すように、参照リンク423は、ID423a毎に、参照名423bを対応付けて記憶する。ID423aは、項目の識別子であり、図2で示されたID41aに対応する。参照名423bは、項目の定義の根拠となった文献情報を示す。一例として、ID423aが「1」である場合、参照名423bとして「財務諸表等規則、様式第A号」と記憶している。
 制御部3は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、これらによって種々の処理を実行する。そして、制御部3は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路またはCPU(Central Processing Unit)やMPU(Micro Processing Unit)等の電子回路に対応する。さらに、制御部3は、構造解析部31と、マッピング部32と、出力部33とを有する。さらに、マッピング部32は、ツリー構造マッピング部321および項目マッピング部322を有する。
 構造解析部31は、変更前後のXBRLデータ21、22を用いて、構造解析を行い、変更前後のツリー構造を作成する。例えば、構造解析部31は、変更前後のXBRLデータ21、22を入力し、入力した変更前後のXBRLデータ21、22を記憶部2に格納する。一例として、構造解析部31は、ファイルである変更前後のXBRLデータ21、22の記憶装置への入出力によって実現する。また、構造解析部31は、変更前のスキーマ41に記述された項目に関して、変更前の表示リンク421から表される親子関係および表示順序を用いたツリー構造を作成する。さらに、構造解析部31は、作成したツリー構造に、ラベルリンク422から表されるラベル名、参照リンク423から表される参照名を追加する。また、構造解析部31は、変更後のスキーマ41に記述された項目に関して、変更後のリンクベース42を用いたツリー構造を作成する。
 マッピング部32は、ツリー構造マッピング部321および項目マッピング部322を有する。
 ツリー構造マッピング部321は、構造解析部31によって作成された変更前後のツリー構造に基づいて、変更前(比較元)の親項目に関するツリーに対して、変更後(比較先)の親項目に関するツリーをマッピングする。ここでは、ツリー構造マッピング部321は、比較元のツリーと構造上最も近い比較先のツリーをマッピングする。例えば、ツリー構造マッピング部321は、比較元のツリーおよび比較先のツリーの最上位の親項目同士について、項目名および補助情報を比較する。補助情報とは、一例としてラベル名、参照名、親項目にぶら下がる子項目の数が含まれる。
 ここで、変更前後(比較元先)のツリー構造のマッピングについて、図6を参照して説明する。図6は、変更前後のツリー構造のマッピングの一例を示す図である。図6に示すように、比較元のツリー構造に“Assets”を親項目とするツリーがあり、親項目のラベル情報として“資産”、参照情報として“財務諸表等規則、様式第A号”、子項目数として3が記述されている。図6では、ラベル情報、参照情報、子項目数が、補助情報である。そして、ツリー構造マッピング部321は、比較元と比較先候補の親項目同士の項目名、ラベル情報、リファレンス情報および子項目数を比較する。ここでは、ツリー構造マッピング部321は、比較元と比較先の候補の親項目同士の項目名を比較すると、比較元の項目名から最後の文字“s”を削除した候補1が類似していると判定する。そして、ツリー構造マッピング部321は、比較元と比較先の候補のラベル情報、リファレンス情報および子項目数を比較すると、候補1が比較元と一致していると判定する。この結果、ツリー構造マッピング321は、比較先の候補1が示す親項目“Asset”のツリーを比較元の親項目“Assets”のツリーにマッピングできる。
 図1に戻って、ツリー構造マッピング部321による比較は、具体例として、各親項目の項目名の一致率および各親項目の補助情報の一致率を用いて行われる。
 項目名、ラベル名、参照名のような文字列の一致率は、一例として、以下の式(1)で算出される。
Figure JPOXMLDOC01-appb-M000001
は、項目名の一致率とする。aは、ラベル名の一致率とする。aは、参照名の一致率とする。最大文字数は、比較元の文字列および比較先の文字列で大きい方の文字数を示す。不一致の文字数は、一例として、レーベンシュタイン距離を用いて算出されるが、文字列の類似度が求められる方法であればこれに限られない。
 子項目の数の一致率aは、以下の式(2)で算出される。
Figure JPOXMLDOC01-appb-M000002
最大項目数は、比較元の親項目が所有する子項目の数と比較先の親項目が所有する子項目の数で大きい方の数を示す。項目数の差は、比較元の親項目が所有する子項目の数と比較先の親項目が所有する子項目の数の差の絶対値を示す。
 また、ツリー構造マッピング部321は、算出した各一致率の平均を算出することで、親項目同士の一致率を算出する。親項目同士の一致率は、以下の式(3)で算出される。
Figure JPOXMLDOC01-appb-M000003
ここでは、式(3)で表されるnは4を示す。
 また、ツリー構造マッピング部321は、親項目同士の一致率が最も高い2つの親項目のツリーを、構造上最も近いツリーであるとしてマッピングする。その後、後述する項目マッピング部322は、これらのツリー内の子項目同士をマッピングする。
 項目マッピング部322は、親項目同士のツリーがマッピングされた場合、マッピングされた変更前のツリーの親項目と変更後のツリーの親項目にそれぞれぶら下がる子項目同士の一致率を算出する。例えば、項目マッピング部322は、変更前と変更後のそれぞれのツリーに含まれる子項目同士のパターンを複数作成する。また、項目マッピング部322は、複数作成したパターン毎にパターンに含まれる子項目同士の一致率を算出する。子項目同士の一致率は、各子項目の項目名の一致率および各子項目の補助情報の一致率を用いて算出される。ここでいう補助情報とは、一例としてラベル名、参照名、オーダー情報(表示順序)が含まれる。
 項目名、ラベル名、参照名のような文字列の一致率は、親項目同士の一致率の場合と同様に、式(1)で算出される。また、オーダー情報の一致率は、以下の式(4)で算出される。
Figure JPOXMLDOC01-appb-M000004
最大オーダー番号は、比較元の子項目のオーダー番号と比較先の子項目のオーダー番号で大きい方のオーダー番号を示す。オーダー番号の差は、比較元の子項目のオーダー番号と比較先の子項目のオーダー番号の差の絶対値を示す。
 また、項目マッピング部322は、算出した各一致率の平均を算出することで、子項目同士の一致率を算出する。子項目同士の一致率は、以下の式(5)で算出される。
Figure JPOXMLDOC01-appb-M000005
ここでは、式(5)で表されるnは4を示す。また、aは、項目名の一致率とする。aは、ラベル名の一致率とする。aは、参照名の一致率とする。aは、オーダーの一致率とする。
 また、項目マッピング部322は、パターンに含まれる子項目同士の一致率を算出した場合、パターンに含まれる子項目同士の一致率の平均を算出することで、パターン毎のツリー全体の一致率を算出する。ツリー全体の一致率は、以下の式(6)で算出される。
Figure JPOXMLDOC01-appb-M000006
式(6)で表されるmはパターンに含まれる子項目同士の数を示す。eは、パターンに含まれる子項目同士の一致率を示す。なお、全体の一致率Eが高いほど、その全体の一致率が算出されたパターンに含まれる子項目同士の一致率も高いと推定される。
 また、項目マッピング322は、最も高い一致率が算出されたパターンの子項目同士をマッピングする。これにより、項目マッピング322は、項目に関する、項目名や補助情報のうち複数の情報が変更されても、変更前後の項目同士を最適にマッピングすることができる。
 出力部33は、ツリー構造マッピング部321によってマッピングされた親項目同士および項目マッピング322によってマッピングされた子項目同士について、一致率が完全一致(100%)ではない項目同士を出力する。これにより、出力部33は、項目に関する、項目名や補助情報のうち複数の情報が変更されても、変更前後の項目同士を最適にマッピングした結果を表すことができる。
[変更前後の子項目のマッピング]
 ここで、変更前後(比較元先)のツリー構造に基づく子項目のマッピングについて、図7および図8A~図8Cを参照して説明する。図7は、変更前後のツリー構造の一例を示す図である。図8A~図8Cは、変更前後の子項目同士の組合せのパターンの一例を示す図である。図7では、比較元の親項目のツリーと、マッピングされた比較先の親項目のツリーとが表されている。比較元および比較先のツリーには、それぞれ3つの子項目が記述されている。そして、例えば、比較元の項目名“DeferrdAssets”が比較先の項目名“DeferrdAsset”に変更され、さらにオーダー情報も2から3へ変更されている。
 このような場合に、項目マッピング部322は、比較元と比較先のそれぞれのツリーに含まれる子項目同士の組合せのパターンを複数作成する。例えば、図8Aに示すように、パターン1として、比較元“CurrentAssets”と比較先“CurrentAsset”との組合せ、比較元“DeferredAssets”と比較先“NonCurrentAsset”との組合せ、比較元“NonCurrentAssets”と比較先“DeferredAsset”との組合せとする。図8Bに示すように、パターン2として、比較元“CurrentAssets”と比較先“CurrentAsset”との組合せ、比較元“DeferredAssets”と比較先“DeferredAsset”との組合せ、比較元“NonCurrentAssets”と比較先“NonCurrentAsset”との組合せとする。図8Cに示すように、パターン3として、比較元“CurrentAssets”と比較先“DeferredAsset”との組合せ、比較元“DeferredAssets”と比較先“NonCurrentAsset”との組合せ、比較元“NonCurrentAssets”と比較先“CurrentAsset”との組合せとする。
 そして、項目マッピング部322は、パターン1~3毎に、パターンに含まれる各子項目同士の一致率を各子項目の項目名と、ラベル名、参照名およびオーダー情報等の補助情報とを用いて算出する。そして、項目マッピング部322は、パターンに含まれる全ての子項目同士の一致率の平均を算出することで、パターン1~3毎のツリー全体の一致率を算出する。そして、項目マッピング部322は、全体の一致率が最も高いパターンを選択する。ここでは、項目マッピング部322は、パターン2を選択できたとする。この結果、子項目名“CurrentAssets”は“CurrentAsset”に変更され、子項目名“DeferredAssets”は“DeferredAsset”に変更され、子項目名“NonCurrentAssets”は“NonCurrentAsset”に変更されたことがわかる。
 このように、項目マッピング322は、子項目の項目名や子項目の表示順序が変更されていても、変更前後の子項目同士を最適にマッピングすることができる。すなわち、項目マッピング部322は、項目に関する、項目名や補助情報のうち複数の情報が変更されても、変更前後の項目同士を最適にマッピングすることが可能となる。
[変更前後のパターンと一致率の具体例]
 さらに、変更前後の子項目同士の組合せのパターンと一致率について、図9Aおよび図9Bを参照して説明する。図9Aおよび図9Bは、変更前後の子項目同士の組合せのパターンと一致率の具体例を説明する図である。図9Aでは、比較元の親項目“Assets”のツリーと、マッピングされた比較先の親項目“Asset”のツリーとが表されている。比較元および比較先のツリーには、それぞれ3つの子項目が記述されている。そして、それぞれの子項目には、補助情報としてオーダー情報が記述されている。なお、各項目には、説明の便宜上、項目に対応する項目番号が付けられている。以下、項目名の後の括弧内の内容は、項目番号を示すとする。また、比較元に対して比較先の項目番号には「´」が付けられている。
 図9Aに示すように、比較元の項目名“CurrentAssets”(2)が比較先の項目名“CurrentAsset”(2´)に変更されている。また、比較元の項目名“NonCurrentAssets”(3)が比較先の項目名“NonCurrentAsset”(3´)に変更されている。また、比較元の項目名“DeferrdAssets”(4)が比較先の項目名“DeferrdAsset”(4´)に変更されている。
 図9Bに示すように、項目マッピング部322は、比較元と比較先のそれぞれのツリーに含まれる子項目同士の組合せのパターンを複数作成する。図9Bでは、パターンp1は、比較元“CurrentAssets”(2)と比較先“CurrentAsset”(2´)との組合せ、比較元“NonCurrentAssets”(3)と比較先“NonCurrentAsset”(3´)との組合せ、比較元“DeferrdAssets”(4)と比較先“DeferrdAsset”(4´)との組合せとする。以下、パターンにおける説明を、項目名を省略して項目番号のみで説明する。パターンp2は、比較元2と比較先2´との組合せ、比較元3と比較先4´との組合せ、比較元4と比較先3´との組合せとする。パターンp3は、比較元2と比較先3´との組合せ、比較元3と比較先2´との組合せ、比較元4と比較先4´との組合せとする。パターンp4は、比較元2と比較先3´との組合せ、比較元3と比較先4´との組合せ、比較元4と比較先2´との組合せとする。パターンp5は、比較元2と比較先4´との組合せ、比較元3と比較先2´との組合せ、比較元4と比較先3´との組合せとする。パターンp6は、比較元2と比較先4´との組合せ、比較元3と比較先3´との組合せ、比較元4と比較先2´との組合せとする。
 項目マッピング部322は、複数作成したパターンp1~p6毎にパターンに含まれる子項目同士の一致率を算出する。ここでは、子項目同士の一致率は、子項目同士における各子項目の項目名の一致率および各子項目の補助情報としてのオーダー情報の一致率を用いて算出される。具体的には、子項目同士における各子項目の項目名の一致率は、式(1)で算出される。子項目同士における各子項目のオーダー情報の一致率は、式(4)で算出される。そして、子項目同士の一致率は、式(5)で算出される。
 図9Bでは、子項目同士の組合せに後続する百分率が、子項目同士の一致率である。ここでは、例えば、比較元2と比較先2´との組合せにおける子項目同士の一致率は、92.3%である。また、比較元3と比較先3´との組合せにおける子項目同士の一致率は、93.80%である。また、比較元4と比較先4´との組合せにおける子項目同士の一致率は、92.30%である。
 さらに、項目マッピング部322は、パターンに含まれる子項目同士の一致率の平均を算出することで、パターンp1~p6毎のツリー全体の一致率を算出する。具体的には、パターン毎のツリー全体の一致率は、式(6)で算出される。ここでは、例えば、パターンp1のツリー全体の一致率は、92.80%である。パターンp2のツリー全体の一致率は、55.80%である。パターンp3のツリー全体の一致率は、78.80%である。パターンp4のツリー全体の一致率は、48.40%である。パターンp5のツリー全体の一致率は、50.30%である。パターンp6のツリー全体の一致率は、56.90%である。
 そして、項目マッピング部322は、全体の一致率が最も高いパターンを選択する。ここでは、項目マッピング部322は、最高値を有する92.80%のパターンp1を選択する。この結果、子項目名“CurrentAssets”(2)は“CurrentAsset”(2´)に変更されたことがわかる。子項目名“NonCurrentAssets”(3)は“NonCurrentAsset”(3´)に変更されたことがわかる。子項目名“DeferredAssets”(4)は“DeferredAsset”(4´)に変更されたことがわかる。
[出力の一例]
 さらに、出力部33による出力の一例を、図10を参照して説明する。図10は、出力部による出力の一例を示す図である。図10の例では、図9Bで選択されたパターンp1における出力例が表されている。
[マッピング処理の主処理]
 次に、実施例に係るマッピング処理の主処理の手順について、図11を参照して説明する。図11は、実施例に係るマッピング処理の主処理の手順を示すフローチャートである。
 まず、制御部3は、マッピング要求があったか否かを判定する(ステップS11)。マッピング要求がなかったと判定した場合(ステップS11;No)、制御部3は、マッピング要求があるまで、判定処理を繰り返す。一方、マッピング要求があったと判定した場合(ステップS11;Yes)、構造解析部31は、変更前後のXBRLデータ21、22を記憶部2から読み込む(ステップS12)。なお、構造解析部31は、変更前後のXBRLデータ21、22を記憶部2から読み込む代わりに、外部から入力するとしても良い。
 そして、構造解析部31は、変更前後のXBRLデータ21、22を用いて、構造解析を行い、変更前後のツリー構造を作成する(ステップS13)。例えば、構造解析部31は、変更前のスキーマ41に記述された項目に関して、変更前のリンクベース42を用いたツリー構造を作成する。また、構造解析部31は、変更後のスキーマ41に記述された項目に関して、変更後のリンクベース42を用いたツリー構造を作成する。
 続いて、ツリー構造マッピング321は、変更前後のツリー構造のマッピング処理を行う(ステップS14)。
 その後、項目マッピング部322は、マッピング処理が行われた、変更前後のツリー構造内の項目のマッピング処理を行う(ステップS15)。そして、マッピング処理の主処理が終了する。
[変更前後のツリー構造のマッピング処理]
 次に、図11に示すS14におけるマッピング処理の手順について、図12を参照して説明する。図11は、変更前後のツリー構造のマッピング処理の手順を示すフローチャートである。なお、ツリー構造マッピング部321は、構造解析部31によって作成された変更前後のツリー構造を受け取ったとする。
 すると、ツリー構造マッピング部321は、変更前(比較元)の親項目と子項目から構成されるツリー構造の情報(対象情報)を1つ抽出する(ステップS21)。そして、ツリー構造マッピング部321は、変更後(比較先)の比較対象となるツリー構造の情報を1つ抽出する(ステップS22)。
 続いて、ツリー構造マッピング部321は、親項目同士の一致率を親項目の項目名および補助情報から算出する(ステップS23)。補助情報には、ラベル情報、参照情報、親項目にぶら下がる子項目の数が含まれる。例えば、親項目同士の一致率は、式(1)~式(3)を用いて算出される。
 そして、ツリー構造マッピング部321は、比較対象となる情報がまだ有るか否かを判定する(ステップS24)。比較対象となる情報がまだ有ると判定した場合(ステップS24;Yes)、ツリー構造マッピング部321は、次の比較対象となる情報を抽出すべく、ステップS22に移行する。
 一方、比較対象となる情報が無いと判定した場合(ステップS24;No)、ツリー構造マッピング部321は、抽出した対象情報について、比較対象の中で最も(親項目同士の)一致率の高い比較対象を決定する(ステップS25)。
 そして、ツリー構造マッピング部321は、抽出した対象情報に対して、決定した比較対象をマッピングし、マッピングした情報を出力する(ステップS26)。言い換えると、ツリー構造マッピング部321は、対象情報の親項目に関するツリー構造に対して、対象情報の親項目との一致率が最も高い比較対象の親項目に関するツリー構造をマッピングする。すなわち、ツリー構造マッピング部321は、親項目同士の一致率が最も高い親項目同士のツリー構造を、構造上最も近いツリー構造であるとしてマッピングする。
 続いて、ツリー構造マッピング部321は、全ての対象情報の抽出およびマッピングが終了したか否かを判定する(ステップS27)。全ての対象情報の抽出およびマッピングが終了していないと判定した場合(ステップS27;No)、ツリー構造マッピング部321は、次の対象情報を抽出すべく、ステップS21に移行する。
 一方、全ての対象情報の抽出およびマッピングが終了したと判定した場合(ステップS27;Yes)、ツリー構造マッピング部321は、ツリー構造のマッピング処理を終了する。
[変更前後のツリー構造内の項目のマッピング処理]
 次に、図11に示すS15におけるマッピング処理の手順について、図13を参照して説明する。図13は、変更前後のツリー構造内の項目のマッピング処理の手順を示すフローチャートである。なお、項目マッピング部322は、ツリー構造マッピング321によってマッピングされた1組の変更前後のツリー構造を受け取ったとする。
 すると、項目マッピング部322は、ツリー構造マッピング321によってマッピングされた1組の変更前後のツリー構造(対象情報)を受け取る(ステップS31)。ツリー構造は、親項目と子項目から構成される。そして、項目マッピング部322は、変更前後の対象情報内の子項目を用いて網羅的に組合せたパターンを作成する(ステップS32)。
 続いて、項目マッピング部322は、全てのパターンから1つのパターンを抽出する(ステップS33)。そして、項目マッピング部322は、抽出したパターンに含まれる子項目同士の一致率を、子項目の項目名および補助情報から算出する(ステップS34)。補助情報には、ラベル情報、参照情報、オーダー情報が含まれる。例えば、子項目同士の一致率は、式(1)、式(4)、式(5)を用いて算出される。
 そして、項目マッピング部322は、抽出したパターンに含まれる全ての子項目同士の一致率の平均を算出する(ステップS35)。算出した結果は、抽出したパターンに関するツリー構造全体の一致率を示す。例えば、ツリー構造全体の一致率は、式(6)を用いて算出される。
 そして、項目マッピング部322は、他のパターンがまだ有るか否かを判定する(ステップS36)。他のパターンがまだ有ると判定した場合(ステップS36;Yes)、項目マッピング部322は、次のパターンを抽出すべく、ステップS33に移行する。
 一方、他のパターンが無いと判定した場合(ステップS36;No)、項目マッピング部322は、ツリー構造全体の一致率が最も高いパターンを決定する(ステップS37)。そして、項目マッピング部322は、決定したパターンに基づいて、変更前後の対象情報内の子項目同士をマッピングし、マッピングした情報を出力する(ステップS38)。言い換えると、項目マッピング部322は、ツリー構造全体の一致率が最も高いパターンに含まれる子項目同士をマッピングする。そして、項目マッピング部322は、ツリー構造内の項目のマッピング処理を終了する。
[実施例の効果]
 上記実施例によれば、マッピング装置1は、変更前のXBRLデータ21の項目間の親子関係および変更後のXBRLデータ22の項目間の親子関係の中で最上位の親項目同士の一致率を、各親項目に関する項目情報(例えば、項目名および補助情報)を用いて算出する。そして、マッピング装置1は、算出した親項目同士の一致率に基づいて、変更前のXBRLデータ21と変更後のXBRLデータ22の親項目同士をマッピングする。かかる構成によれば、マッピング装置1は、親項目に関する項目情報を用いた親項目同士の一致率に基づいて、親項目同士をマッピングする。この結果、マッピング装置1は、複数の項目情報が変更された親項目と変更前の親項目とのマッピングに、項目情報を用いた親項目同士の一致率を用いることにより、複数の項目情報が変更された親項目と変更前の親項目とを最適にマッピングできる。
 上記実施例によれば、マッピング装置1は、親項目同士の項目名の一致率および親項目同士の親項目に関する補助情報の一致率を算出する。そして、マッピング装置1は、算出した各一致率の平均を算出することで、親項目同士の一致率を算出する。かかる構成によれば、マッピング装置1は、親項目の項目名および親項目に関する補助情報が変更されても、変更前後の親項目のマッピングに親項目同士の一致率を用いるので、複数の情報が変更された親項目と変更前の親項目とを最適にマッピングできる。
 上記実施例によれば、マッピング装置1は、親項目同士の項目名の一致率、親項目同士の親項目に関する補助情報の一致率、さらに、親項目同士の各親項目にぶら下がる子項目の数の一致率を算出する。そして、マッピング装置1は、算出した各一致率の平均を算出することで、親項目同士の一致率を算出する。かかる構成によれば、マッピング装置1は、親項目に関する複数の情報が変更されても、変更前後の親項目のマッピングに親項目にぶら下がる子項目の数を含んだ親項目同士の一致率を用いる。この結果、マッピング装置1は、複数の情報が変更された親項目と変更前の親項目とを最適にマッピングできる。
 上記実施例によれば、マッピング装置1は、親項目同士をマッピングした場合、マッピングした変更前のXBRLデータ21の親項目と変更後のXBRLデータ22の親項目にそれぞれぶら下がる子項目同士の一致率を、子項目に関する項目情報を用いて算出する。そして、マッピング装置1は、算出した子項目同士の一致率に基づいて、XBRLデータ21とXBRLデータ22の子項目同士をマッピングする。かかる構成によれば、マッピング装置1は、子項目に関する項目情報を用いた子項目同士の一致率に基づいて、子項目同士をマッピングする。この結果、マッピング装置1は、複数の項目情報が変更された子項目と変更前の子項目とのマッピングに、項目情報を用いた子項目同士の一致率を用いることにより、複数の項目情報が変更された子項目と変更前の子項目とを最適にマッピングできる。例えば、マッピング装置1は、子項目の項目名と表示順序が変更されても、項目名と表示順序を含んだ子項目同士の一致率を用いることにより、変更された子項目と変更前の子項目とを最適にマッピングできる。
 上記実施例によれば、マッピング装置1は、マッピングした変更前のXBRLデータ21の親項目と変更後のXBRLデータ22の親項目にそれぞれぶら下がる子項目同士の組合せのパターンを複数作成する。そして、マッピング装置1は、複数作成したパターン毎に子項目同士の一致率を算出する。さらに、マッピング装置1は、パターン毎に算出された子項目同士の一致率に基づいて、変更前のXBRLデータ21と変更後のXBRLデータ22の子項目同士をマッピングする。かかる構成によれば、マッピング装置1は、子項目同士の組合せのパターン毎に算出された、子項目に関する項目情報を用いた子項目同士の一致率に基づいて子項目同士をマッピングするので、変更された子項目と変更前の子項目とを効率的にマッピングできる。
[プログラム等]
 なお、マッピング装置1は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置に、上記した制御部3と、記憶部2等の各機能を搭載することによって実現することができる。
 また、図示したマッピング装置1の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、マッピング装置1の分散・統合の具体的態様は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、ツリー構造マッピング321と項目マッピング部322とを1個の部として統合しても良い。一方、項目マッピング部322を、比較元と比較先のツリーに含まれる子項目同士の組合せのパターンを作成する作成部と、作成したパターンを用いて子項目同士をマッピングするマッピング部とに分散しても良い。また、変更前のXBRLデータ21や変更後のXBRLデータ22等の記憶部2をマッピング装置1の外部装置としてネットワーク経由で接続するようにしても良い。
 また、上記実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーション等のコンピュータで実行することによって実現することができる。そこで、以下では、図1に示したマッピング装置1と同様の機能を実現するマッピングプログラムを実行するコンピュータの一例を説明する。図14は、マッピングプログラムを実行するコンピュータの一例を示す図である。
 図14に示すように、コンピュータ200は、各種演算処理を実行するCPU203と、ユーザからのデータの入力を受け付ける入力装置215と、表示装置209を制御する表示制御部207を有する。また、コンピュータ200は、記憶媒体からプログラム等を読取るドライブ装置213と、ネットワークを介して他のコンピュータとの間でデータの授受を行う通信制御部217とを有する。また、コンピュータ200は、各種情報を一時記憶するメモリ201と、外部記憶装置205を有する。そして、メモリ201、CPU203、外部記憶装置205、表示制御部207、ドライブ装置213、入力装置215、通信制御部217は、バス219で接続されている。
 ドライブ装置213は、例えばリムーバブルディスク211用の装置である。外部記憶装置205は、マッピングプログラム205aおよびマッピング関連情報205bを記憶する。
 CPU203は、マッピングプログラム205aを読み出して、メモリ201に展開する。マッピングプログラム205aは、マッピングプロセス201aとして機能する。
 例えば、マッピングプロセス201aは、制御部3の各機能部に対応する。マッピング関連情報205bは、変更前のXBRLデータ21および変更後のXBRLデータ22に対応する。
 なお、マッピングプログラム205aについては、必ずしも最初から外部記憶装置205に記憶させておかなくても良い。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD-ROM、DVDディスク、光磁気ディスク、ICカード等の「可搬用の物理媒体」に当該プログラムを記憶させておく。そして、コンピュータ200がこれらからマッピングプログラム205aを読み出して実行するようにしても良い。
 1 マッピング装置
 2 記憶部
 3 制御部
 21 変更前のXBRLデータ
 22 変更後のXBRLデータ
 31 構造解析部
 32 マッピング部
 321 ツリー構造マッピング部
 322 項目マッピング部
 33 出力部
 41 スキーマ
 42 リンクベース
 421 表示リンク
 422 ラベルリンク
 423 参照リンク

Claims (7)

  1.  コンピュータに、
     変更前の項目を含む第1のデータの項目間の階層関係および変更後の項目を含む第2のデータの項目間の階層関係の中で最上位の親項目同士の一致率を、各項目に関する項目情報を用いて算出し、
     該算出した一致率に基づいて、前記第1のデータと前記第2のデータの親項目同士を対応付ける、
     処理を実行させることを特徴とするプログラム。
  2.  前記親項目同士の一致率を算出する処理は、親項目同士の項目名の一致率および親項目同士の親項目に関する項目情報の一致率を算出し、該算出した各一致率の平均を算出することで、親項目同士の一致率を算出する
     処理をコンピュータに実行させることを特徴とする請求項1に記載のプログラム。
  3.  前記親項目同士の一致率を算出する処理は、親項目同士の項目名の一致率、親項目同士の親項目に関する項目情報の一致率、さらに、親項目同士の各親項目にぶら下がる子項目の数の一致率を算出し、該算出した各一致率の平均を算出することで、親項目同士の一致率を算出する
     処理をコンピュータに実行させることを特徴とする請求項2に記載のプログラム。
  4.  前記対応付ける処理によって親項目同士を対応付けた場合、対応付けた前記第1のデータの親項目と前記第2のデータの親項目にそれぞれぶら下がる子項目同士の一致率を、子項目に関する項目情報を用いて算出し、
     前記対応付ける処理は、
     さらに、該算出された子項目同士の一致率に基づいて、前記第1のデータと前記第2のデータの子項目同士を対応付ける
     処理をコンピュータに実行させることを特徴とする請求項3に記載のプログラム。
  5.  前記子項目同士の一致率を算出する処理は、対応付けた前記第1のデータの親項目と前記第2のデータの親項目にそれぞれぶら下がる子項目同士の組合せのパターンを複数作成し、複数作成したパターン毎に子項目同士の一致率を算出し、
     前記対応付ける処理は、
     前記パターン毎に算出された子項目同士の一致率に基づいて、前記第1のデータと前記第2のデータの子項目同士を対応付ける
     処理をコンピュータに実行させることを特徴とする請求項4に記載のプログラム。
  6.  変更前の項目を含む第1のデータの項目間の階層関係および変更後の項目を含む第2のデータの項目間の階層関係の中で最上位の親項目同士の一致率を、各項目に関する項目情報を用いて算出する算出部と、
     前記算出部によって算出された一致率に基づいて、前記第1のデータと前記第2のデータの親項目同士を対応付けるマッピング部と
     を有することを特徴とするマッピング装置。
  7.  コンピュータが、
     変更前の項目を含む第1のデータの項目間の階層関係および変更後の項目を含む第2のデータの項目間の階層関係の中で最上位の親項目同士の一致率を、各項目に関する項目情報を用いて算出し、
     該算出した一致率に基づいて、前記第1のデータと前記第2のデータの親項目同士を対応付ける、
     各処理を実行することを特徴とするマッピング方法。
PCT/JP2012/067614 2012-07-10 2012-07-10 プログラム、マッピング装置およびマッピング方法 WO2014010029A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014524524A JP6079780B2 (ja) 2012-07-10 2012-07-10 プログラム、マッピング装置およびマッピング方法
PCT/JP2012/067614 WO2014010029A1 (ja) 2012-07-10 2012-07-10 プログラム、マッピング装置およびマッピング方法
US14/592,229 US10437857B2 (en) 2012-07-10 2015-01-08 Mapping device, mapping method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/067614 WO2014010029A1 (ja) 2012-07-10 2012-07-10 プログラム、マッピング装置およびマッピング方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US14/592,229 Continuation US10437857B2 (en) 2012-07-10 2015-01-08 Mapping device, mapping method, and recording medium

Publications (1)

Publication Number Publication Date
WO2014010029A1 true WO2014010029A1 (ja) 2014-01-16

Family

ID=49915532

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/067614 WO2014010029A1 (ja) 2012-07-10 2012-07-10 プログラム、マッピング装置およびマッピング方法

Country Status (3)

Country Link
US (1) US10437857B2 (ja)
JP (1) JP6079780B2 (ja)
WO (1) WO2014010029A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015162107A (ja) * 2014-02-27 2015-09-07 株式会社エヌ・ティ・ティ・データ 対応関係抽出装置、対応関係抽出方法、対応関係抽出プログラム
JP2019102034A (ja) * 2017-12-08 2019-06-24 富士通株式会社 判定プログラム、判定装置及び判定方法
US11392539B2 (en) 2018-10-11 2022-07-19 Fujitsu Limited Conversion method, conversion apparatus, and recording medium

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102356B (zh) * 2018-06-13 2023-06-30 中国平安人寿保险股份有限公司 一种保险产品的推荐方法、可读存储介质及终端设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006024179A (ja) * 2004-06-10 2006-01-26 Internatl Business Mach Corp <Ibm> 構造化文書処理装置、構造化文書処理方法、及びプログラム
JP2008097215A (ja) * 2006-10-10 2008-04-24 Just Syst Corp データ処理装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5960173A (en) * 1995-12-22 1999-09-28 Sun Microsystems, Inc. System and method enabling awareness of others working on similar tasks in a computer work environment
US6519557B1 (en) * 2000-06-06 2003-02-11 International Business Machines Corporation Software and method for recognizing similarity of documents written in different languages based on a quantitative measure of similarity
JP2003242167A (ja) 2002-02-19 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> 構造化文書の変換ルール作成方法および装置と変換ルール作成プログラムおよび該プログラムを記録したコンピュータ読取り可能な記録媒体
JP2004348341A (ja) 2003-05-21 2004-12-09 Toshiba Corp 構造化文書処理システム、構造化文書処理方法及びプログラム
ATE532142T1 (de) * 2004-03-16 2011-11-15 Microdasys Inc Inhaltsüberwachung für xml
JP2005284987A (ja) * 2004-03-30 2005-10-13 Fujitsu Ltd 文書構造編集プログラム、文書構造編集方法、文書構造編集装置、文書構造編集プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4859456B2 (ja) 2005-12-27 2012-01-25 株式会社日立製作所 データスキーマのマッピングプログラム及び計算機システム
US20090030754A1 (en) * 2006-04-25 2009-01-29 Mcnamar Richard Timothy Methods, systems and computer software utilizing xbrl to identify, capture, array, manage, transmit and display documents and data in litigation preparation, trial and regulatory filings and regulatory compliance
US8176003B2 (en) * 2007-06-29 2012-05-08 Microsoft Corporation Automatic designation of XBRL taxonomy tags
WO2011089683A1 (ja) 2010-01-19 2011-07-28 富士通株式会社 解析方法、解析装置及び解析プログラム
WO2011133713A2 (en) * 2010-04-20 2011-10-27 Xbrl Cloud, Inc. Xbrl service system and method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006024179A (ja) * 2004-06-10 2006-01-26 Internatl Business Mach Corp <Ibm> 構造化文書処理装置、構造化文書処理方法、及びプログラム
JP2008097215A (ja) * 2006-10-10 2008-04-24 Just Syst Corp データ処理装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAKAMITSU TAHARA ET AL.: "Recovering Traceability Links Between a Specification Document and a Source Code Using Their Structural Similarities", IPSJ SIG NOTES, vol. 2008, no. 29, 17 March 2008 (2008-03-17), pages 139 - 146 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015162107A (ja) * 2014-02-27 2015-09-07 株式会社エヌ・ティ・ティ・データ 対応関係抽出装置、対応関係抽出方法、対応関係抽出プログラム
JP2019102034A (ja) * 2017-12-08 2019-06-24 富士通株式会社 判定プログラム、判定装置及び判定方法
JP7064128B2 (ja) 2017-12-08 2022-05-10 富士通株式会社 判定プログラム、判定装置及び判定方法
US11392539B2 (en) 2018-10-11 2022-07-19 Fujitsu Limited Conversion method, conversion apparatus, and recording medium

Also Published As

Publication number Publication date
US10437857B2 (en) 2019-10-08
US20150127689A1 (en) 2015-05-07
JPWO2014010029A1 (ja) 2016-06-20
JP6079780B2 (ja) 2017-02-15

Similar Documents

Publication Publication Date Title
US10901961B2 (en) Systems and methods for generating schemas that represent multiple data sources
JP6285943B2 (ja) 文字列変換の帰納的合成のための順位付け
US20190073646A1 (en) Consolidated blockchain-based data transfer control method and system
US11263622B2 (en) Computer-implemented system and method for determining the state of a machine executable contract implemented using a blockchain
US8312041B2 (en) Resource description framework network construction device and method using an ontology schema having class dictionary and mining rule
CA3064561A1 (en) Automated dependency analyzer for heterogeneously programmed data processing system
WO2023029508A1 (zh) 基于用户画像的页面生成方法、装置、设备及介质
US10380132B2 (en) Information landscape modeling, analysis and validation
WO2014010029A1 (ja) プログラム、マッピング装置およびマッピング方法
Fill et al. Formalizing meta models with FDMM: the ADOxx case
US20230291561A1 (en) Blockchain tokens
US20070100854A1 (en) Method of providing a validatable data structure
CN111597786A (zh) 一种通过文件导入生成电子证照的实现方法及系统
JP6900956B2 (ja) 検証プログラム、検証装置、検証方法、インデックス生成プログラム、インデックス生成装置およびインデックス生成方法
CN112685439B (zh) 针对风控系统的造数方法、系统、装置及存储介质
WO2017199309A1 (ja) 評価プログラム、評価装置および評価方法
JPWO2020240873A1 (ja) 検証方法、情報処理装置及び検証プログラム
WO2023197397A1 (zh) 一种去中心化的开源软件可信通证化协议
Bukovac et al. Short certificates for chromatic equivalence
Jayathilaka et al. Using syntactic and semantic similarity of Web APIs to estimate porting effort
Gerth et al. Matching
Golling et al. YANG2UML: Bijective Transformation and Simplification of YANG to UML
WO2020124289A1 (zh) 信息比对方法及装置
CN107111839A (zh) 用于多个国家特定数据库中的信用相关数据的通用识别的系统及方法
Samreen et al. Mining Domain Models in Ethereum DApps using Code Cloning

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12880832

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014524524

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12880832

Country of ref document: EP

Kind code of ref document: A1