JPWO2016132550A1 - 抽出プログラム、抽出装置および抽出方法 - Google Patents

抽出プログラム、抽出装置および抽出方法 Download PDF

Info

Publication number
JPWO2016132550A1
JPWO2016132550A1 JP2017500259A JP2017500259A JPWO2016132550A1 JP WO2016132550 A1 JPWO2016132550 A1 JP WO2016132550A1 JP 2017500259 A JP2017500259 A JP 2017500259A JP 2017500259 A JP2017500259 A JP 2017500259A JP WO2016132550 A1 JPWO2016132550 A1 JP WO2016132550A1
Authority
JP
Japan
Prior art keywords
extraction
rule
extraction condition
condition
application order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017500259A
Other languages
English (en)
Other versions
JP6528841B2 (ja
Inventor
奥村 仁
仁 奥村
貴英 村本
貴英 村本
勝 内田
勝 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2016132550A1 publication Critical patent/JPWO2016132550A1/ja
Application granted granted Critical
Publication of JP6528841B2 publication Critical patent/JP6528841B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management

Abstract

抽出装置(1)は、複数のXBRLファイルを含む入力データ(9)より、複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う際に、入力データ(9)より、複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を算出する入力データ解析部(11)と、算出された分布情報を参照し、複数の抽出条件の適用順序を決定する適用順序決定部(14)と、を備えることにより、入力データ(9)から検証ルールが検証対象とするデータ項目を有するXBRLデータを高速に抽出できる。

Description

本発明は、抽出プログラム等に関する。
XBRL(eXtensible Business Reporting Language)文書による財務諸表を金融庁へ提出することが義務付けられている。XBRLとは、各種財務報告用の情報を作成、流通、利用できるように標準化されたXMLベースの言語である。XBRL文書とは、例えば財務会計報告に関して、XBRLで記述された文書である。
XBRL文書の作成に用いられるXBRLデータの品質が必ずしも高いとは限らない。通常、入力されたXBRLデータに対して、XMLやXBRLの構文や形式としての妥当性の検証に加え、各データ項目の財務的な意味や整合性に基づいた検証が行われる。各データ項目の財務的な意味や整合性に基づいた検証は、会計検査的な機能をサポートする位置づけの検証ともいえる。かかる検証を行うために利用される技術としてXBRLフォーミュラがある。XBRLフォーミュラとは、XBRLデータの内容の検証や計算を行うためのルールを定義する記述言語である。すなわち、検証処理は、XBRLフォーミュラで記述された複数の検証ルールに基づいて、入力されるXBRLデータを検証する。
例えば、監督・規制機関等では、一般事業法人からXBRLデータを受け取り、監査を行う。XBRLデータは定期的に入力され、検証処理はXBRLフォーミュラで記述された検証ルールに基づいて、XBRLデータの品質を確認する。この後、確認されたXBRLデータを用いてデータの処理が行われ、一定期間内で監査が完了される必要がある。
国際公開第2011/089683号
ところが、XBRLデータの入力数は、増大する傾向にある。このため、XBRLフォーミュラで記述された検証ルールに基づいた検証処理は時間を要する傾向にある。個々の検証ルールが検証対象とするデータ項目の範囲は、入力される全てのXBRLデータに比べると、ごく一部であることが多い。個々の検証ルールにおいては、検証ルールが検証対象とするデータ項目を有するXBRLデータが高速に抽出されることが望ましい。
1つの側面では、入力データから、検証ルールが検証対象とするデータ項目を有するXBRLデータを高速に抽出することを目的とする。
本願の開示する抽出プログラムは、コンピュータに、複数のXBRLファイルを含む入力データより、前記複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う際に、前記複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を参照し、前記複数の抽出条件の適用順序を決定する、処理を実行させる。
1つの態様によれば、入力データから、検証ルールが検証対象とするデータ項目を有するXBRLデータを高速に抽出することができる。
図1は、実施例1に係る抽出装置の構成を示す機能ブロック図である。 図2は、検証ルールの構造の一例を示す図である。 図3は、アスペクトの種類の一例を示す図である。 図4は、実施例1に係る入力データ解析部による解析結果の一例を示す図である。 図5は、実施例1に係る抽出条件取得部により取得された抽出条件の一例を示す図である。 図6は、実施例1に係る絞込み推定部による処理の具体例を示す図である。 図7は、実施例1に係る適用順序決定部による処理の具体例を示す図である。 図8は、実施例1に係る抽出処理のフローチャートの一例を示す図である。 図9は、実施例1に係る適用順序決定処理のフローチャートの一例を示す図である。 図10は、実施例2に係る抽出装置の構成を示す機能ブロック図である。 図11は、実施例2に係る組合せテーブルのデータ構造の一例を示す図である。 図12は、実施例2に係る抽出条件取得部により取得された抽出条件の一例を示す図である。 図13は、実施例2に係る絞込み推定部による処理の具体例を示す図である。 図14は、実施例2に係る適用順序決定部による処理の具体例を示す図である。 図15Aは、実施例2に係る抽出処理の利用例を示す図(1)である。 図15Bは、実施例2に係る抽出処理の利用例を示す図(2)である。 図15Cは、実施例2に係る抽出処理の利用例を示す図(3)である。 図16は、実施例2に係る抽出処理のフローチャートの一例を示す図である。 図17は、実施例2に係る適用順序決定処理のフローチャートの一例を示す図である。 図18は、抽出プログラムを実行するコンピュータの一例を示す図である。
以下に、本願の開示す抽出プログラム、抽出装置および抽出方法の実施例を図面に基づいて詳細に説明する。なお、実施例によりこの発明が限定されるものではない。
[実施例1に係る抽出装置の構成]
図1は、実施例1に係る抽出装置の構成を示す機能ブロック図である。実施例1に係る抽出装置は、入力データ9に含まれる複数のXBRLデータより、検証ルールに指定される抽出条件を用いて、検証の対象となるデータ項目を有するXBRLデータを抽出する。この抽出されたXBRLデータが検証ルールを用いて検証される。
ここでいう「XBRLデータ」とは、XBRLで記述されたデータである。XBRLとは、各種財務報告用の情報を作成、流通、利用できるように標準化されたXMLベースの言語である。XBRLデータの一例として、財務データが挙げられる。XBRLデータは値と、値を補足する「アスペクト」と呼ばれる各種情報からなる。アスペクトには、値の要素名と各種の付加情報が含まれる。なお、以降、XBRLデータは、データ項目を有する、XBRLで記述されたデータであるとして、データ項目と同義に扱う。また、アスペクト情報については、後述する。
ここでいう「検証ルール」とは、XBRLデータの内容の検証や計算を行うためのルールであり、XBRLフォーミュラを用いて記述される。XBRLフォーミュラとは、XBRLデータの内容の検証や計算を行うためのルールを定義する記述言語であり、検証ルールを定義する。なお、検証ルールの構造については、後述する。
図1に示すように、抽出装置1は、制御部10および記憶部20を有する。
記憶部20は、例えばフラッシュメモリ(Flash Memory)やFRAM(登録商標)(Ferroelectric Random Access Memory)等の不揮発性の半導体メモリ素子等の記憶装置に対応する。記憶部20は、検証ルール21および解析結果22を有する。
検証ルール21は、XBRLデータの内容の検証や計算を行うためのルールである。ここで、検証ルール21の構造を、図2を参照して説明する。図2は、検証ルールの構造の一例を示す図である。
図2に示すように、検証ルールには、一例として、「変数」と、「変数個別の抽出条件」と、「変数共通の抽出条件」と、「検証式」とが定義される。「変数共通の抽出条件」は、検証ルール内の全ての「変数個別の抽出条件」で定義される変数の共通の抽出条件である。ここでは、「変数」は、a1、a2、a3に対応する。「変数個別の抽出条件」は、b1、b2、b3に対応する。「変数共通の抽出条件」は、c0に対応する。「検証式」は、d0に対応する。
「変数共通の抽出条件」c0により、入力データ9の全体から検証ルールで検証されるデータ項目を含む入力データ9が絞り込まれる。さらに、「変数」a1では、「変数個別の抽出条件」b1により、絞り込まれた入力データ9から検証ルールで検証されるデータ項目を含む入力データ9が絞り込まれ、「変数」a1に割り当てられる。「変数」a2では、同様に「変数個別の抽出条件」b2により、絞り込まれた入力データ9から検証ルールで検証されるデータ項目を含む入力データ9が絞り込まれ、「変数」a2に割り当てられる。「変数」a3では、同様に「変数個別の抽出条件」b3により、絞り込まれた入力データ9から検証ルールで検証されるデータ項目を含む入力データ9が絞り込まれ、「変数」a3に割り当てられる。そして、割り当てられたデータ項目で、「検証式」d0に合致するかどうかが検証される。図2の例では、「変数共通の抽出条件」c0における1つ目の条件指定であるアスペクトは、「Dimension:CS」であり、その値は、「x26」である。2つ目の条件指定するアスペクトは、「Dimension:VG」であり、その値は、「x80」である。3つ目の条件指定するアスペクトは、「Dimension:D0」であり、その値は、「x0」である。かかる「Dimension:CS」、「Dimension:VG」、「Dimension:DO」は、それぞれアスペクトである。かかる「Member:X26」、「Member:x80」、「Member:x0」は、それぞれのアスペクトに対する値である。
ここで、アスペクトの種類について、図3を参照して説明する。図3は、アスペクトの種類の一例を示す図である。図3に示すように、各種類のアスペクトが存在する。例えば、アスペクトの種類には、「Location」、「Concept」、・・・、「Dimension」が存在する。「Location」は、親要素の情報を指すアスペクトである。「Concept」は、要素名を指すアスペクトである。「Dimension」は、軸を表す補足情報を指すアスペクトである。「Dimension」では、軸ごとにアスペクトの種類が存在する。Dimensionの軸には、Explicit軸、Typed軸という2種類が存在し、それぞれの軸の種別において任意の数の軸が定義される。
図1に戻って、解析結果22は、入力データ9を解析した結果である。すなわち、解析結果22は、アスペクト種類に対応する値ごとに、入力データ9の件数で値となる頻度を表した分布である。なお、解析結果22は、入力データ解析部11によって予め解析され、解析結果が記憶部20に記憶される。
制御部10は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、これらによって種々の処理を実行する。そして、制御部10は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路の電子回路に対応する。または、制御部10は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等の電子回路に対応する。制御部10は、入力データ解析部11、抽出条件取得部12、絞込み推定部13、適用順序決定部14およびデータ抽出部15を有する。
入力データ解析部11は、入力データ9を解析する。例えば、入力データ解析部11は、入力データ9より、各種類のアスペクトに対応する値ごとに、出現頻度を算出する。入力データ解析部11は、算出する出現頻度を記憶部20の解析結果22に格納する。なお、入力データ解析部11は、全種類のアスペクトを解析対象としても良いが、検証ルールの抽出条件で指定されるアスペクトの種類についてのみ解析対象としても良い。これは、検証ルールの抽出条件に定義されないアスペクトの種類を解析対象としても、使用する機会がないからである。
ここで、入力データ解析部11による解析結果22を、図4を参照して説明する。図4は、実施例1に係る入力データ解析部による解析結果の一例を示す図である。図4に示すように、解析結果22には、アスペクト22aと、値22bと、分布情報22cとが含まれる。アスペクト22aは、アスペクトの種類を示す。値22bは、アスペクトの種類に対応する値を示す。分布情報22cは、入力データ9の件数で値22bとなる頻度を表した分布の情報である。つまり、分布情報22cは、アスペクト22aの値22bを持つ入力データ9の件数、すなわち、値22bの出現頻度を表す。
一例として、アスペクトの種類が「Dimension」である場合の解析結果を示す。アスペクト22aが「Dimension 軸(dim:D1)」、値22bが「m:m10」である場合には、分布情報22cが「290271」である。アスペクト22aが「Dimension 軸(dim:D1)」、値22bが「m:m11」である場合には、分布情報22cが「46」である。アスペクト22aが「Dimension 軸(dim:D2)」、値22bが「m:m20」である場合には、分布情報22cが「29905」である。アスペクト22aが「Dimension 軸(dim:D3)」、値22bが「m:m30」である場合には、分布情報22cが「290384」である。
抽出条件取得部12は、抽出条件解析結果から静的な抽出条件および動的な抽出条件を取得する。抽出条件解析結果とは、検証ルールから抽出条件を解析した結果であり、静的な抽出条件および動的な抽出条件が含まれる。すなわち、検証ルールに記載される抽出条件は、入力データ9に依存しないで定義されるので、入力データ9が入力される以前に予め解析される。ここで、静的な抽出条件とは、XBRLデータそれぞれに記述されるアスペクトの種類および値を直接指定する抽出条件のことをいう。すなわち、静的な抽出条件とは、XBRLデータに依存せず、照合する条件が最初から決定されるものであり、予め抽出対象となるアスペクトの種類およびアスペクトの値を知り得る条件のことをいう。動的な抽出条件とは、XBRLデータそれぞれに記述されるアスペクトの種類および値を動的に指定する抽出条件のことをいう。すなわち、動的な抽出条件とは、抽出しようとするXBRLデータに依存し、XBRLデータごとに照合する条件が決定されるものであり、予め抽出対象となるアスペクトの種類やアスペクトの値を知り得ない条件のことをいう。
例えば、抽出条件取得部12は、抽出条件解析結果から静的な抽出条件を取得する。すなわち、検証ルールに記載された変数共通の抽出条件の中の静的な抽出条件が取得される。また、抽出条件取得部12は、抽出条件解析結果から動的な抽出条件を取得する。すなわち、検証ルールに記載された変数共通の抽出条件の中の動的な抽出条件が取得される。ここで、抽出条件取得部12による取得された抽出条件を、図5を参照して説明する。図5は、実施例1に係る抽出条件取得部による取得された抽出条件の一例を示す図である。
図5に示すように、上段は、静的な抽出条件の一例である。アスペクトの種類が「Dimension」である静的な抽出条件である。ここでは、抽出条件には、アスペクトの種類として「Dimension(dim:D1)」、その値として「mem:m10」が直接設定されている。すなわち、予め抽出対象となるアスペクトの種類およびアスペクトの値が知り得る静的な抽出条件である。
また、下段は、動的な抽出条件の一例である。アスペクトの種類が「Dimension」である動的な抽出条件の一例である。ここでは、抽出条件には、XBRLデータの値が正(>0)である場合には、アスペクトの種類として「Dimension(dim:D1)」、その値として「mem:m10」を適用するように設定されている。XBRLデータの値が0以下(≦0)である場合には、アスペクトの種類として「Dimension(dim:D2)」、その値として「mem:m20」を適用するように設定されている。すなわち、XBRLデータごとに照合する条件が適用されるものであり、予め抽出対象となるアスペクトの種類やアスペクトの値を知り得ない動的な抽出条件である。
図1に戻って、絞込み推定部13は、解析結果22から、抽出条件取得部12によって取得された静的な抽出条件ごとの出現頻度を取得する。すなわち、絞込み推定部13は、静的な抽出条件ごとに、絞り込む(抽出する)ことができるXBRLデータの数(「絞込み推定数」という)を推定する。例えば、絞込み推定部13は、抽出条件取得部12によって取得された静的な抽出条件から、XBRLデータと照合するアスペクトおよび値を取り出す。絞込み推定部13は、解析結果22から、取り出されたアスペクトおよび値に対応する分布情報22cを読み出し、読み出した分布情報22cを絞込み推定数としてアスペクトおよび値に対応付けて設定する。絞込み推定数が小さい程、抽出条件の絞込み効果は大きいものとなる。
適用順序決定部14は、絞込み推定部13によって推定された、複数の静的な抽出条件ごとの絞込み推定数に基づいて、複数の静的な抽出条件の適用順序を決定する。例えば、適用順序決定部14は、絞込み推定部13によって推定された複数の静的な抽出条件の絞込み推定数を参照し、静的な抽出条件の絞込み推定数が小さい程順序が早くなるように静的な抽出条件の適用順序を決定する。すなわち、適用順序決定部14は、絞込み効果が高い順に、抽出条件の適用順序を決定する。つまり、適用順序決定部14は、絞込み効果が最大の抽出条件を最初の適用順序とする。なお、適用順序決定部14は、抽出条件取得部12によって動的な抽出条件が取得された場合には、動的な抽出条件を、例えば、全ての静的な抽出条件の後の適用順序とすれば良い。すなわち、適用順序決定部14は、静的な抽出条件によってある程度XBRLデータを絞り込んだ後に、さらに動的な抽出条件によって絞り込むことができる順序に決定すれば良い。XBRLデータが動的な抽出条件に合致するか否かの判定は、全てのXBRLデータと照合する必要があるため、判定処理の負荷が重くなるからである。したがって、適用順序決定部14は、XBRLデータをある程度絞り込んだ後に、さらに動的な抽出条件によって絞り込むような順序に決定すれば良い。
データ抽出部15は、適用順序決定部14によって決定された適用順序を用いて、入力データ9に対して抽出条件を適用し、XBRLデータを抽出する。これにより、データ抽出部15は、入力データから検証ルールに必要なデータ項目を有するXBRLデータを高速に抽出することができる。
次に、絞込み推定部13による処理を、図6を参照して説明する。図6は、実施例1に係る絞込み推定部による処理の具体例を示す図である。なお、図6では、抽出条件取得部12によって静的な抽出条件が取得されたものとする。
図6に示すように、絞込み推定部13は、静的な抽出条件から、XBRLデータと照合するアスペクトおよび値を取り出す。ここでは、静的な抽出条件が<1>である場合には、アスペクトとして「Dimension軸(dim:D1)」、値として「mem:m10」が取り出される。静的な抽出条件が<2>である場合には、アスペクトとして「Dimension軸(dim:D2)」、値として「mem:m20」が取り出される。静的な抽出条件が<3>である場合には、アスペクトとして「Dimension軸(dim:D3)」、値として「mem:m30」が取り出される。
絞込み推定部13は、解析結果22から、取り出されたアスペクトおよび値に対応する分布情報22cを読み出し、分布情報22cを絞込み推定数としてアスペクトおよび値に対応付けて設定する。ここでは、「Dimension軸(dim:D1)」および「mem:m10」に対応付けて絞込み推定数として「290271」が設定される。「290271」の数のXBRLデータが絞り込まれると推定される。「Dimension軸(dim:D2)」および「mem:m20」に対応付けて絞込み推定数として「29905」が設定される。「29905」の数のXBRLデータが絞り込まれると推定される。「Dimension軸(dim:D3)」および「mem:m30」に対応付けられて絞込み推定数として「290384」が設定される。「290384」の数のXBRLデータが絞り込まれると推定される。これにより、符号e1で示される「29905」が最も小さい絞込み推定数となり、この抽出条件の絞込み効果は大きいものとなる。
次に、適用順序決定部14による処理を、図7を参照して説明する。図7は、実施例1に係る適用順序決定部による処理の具体例を示す図である。なお、図7では、抽出条件取得部12によって静的な抽出条件(静的条件)<1>、<2>、<3>が取得され、動的な抽出条件(動的条件)<1´>、<2´>が取得されたものとする。また、絞込み推定部13によって静的条件の絞込み推定数が設定されたものとする。
図7に示すように、適用順序決定部14は、複数の静的条件の絞込み推定数を参照し、静的条件の絞込み推定数が小さい程早い順序になるように静的条件の適用順序を決定する。ここでは、静的条件<1>の絞込み推定数が「290271」、静的条件<2>の絞込み推定数が「29905」、静的条件<3>の絞込み推定数が「290384」であるので、静的条件の適用順序は、<2>、<1>、<3>に決定される。
適用順序決定部14は、抽出条件取得部12によって動的条件が取得されているので、動的条件を、例えば、全ての静的条件の後の適用順序となるように決定する。ここでは、動的条件の適用順序は、全ての静的条件の後に<1´>、<2´>に決定される。なお、動的条件の適用順序については、並び替えをしても良いし、並び替えをしなくても良い。
これにより、適用順序決定部14による処理を適用した場合の静的な抽出条件に入力される入力データの延べ数は、以下のように最小化することができる。静的条件<2>への入力データの数は「290386」、静的条件<1>への入力データ数は「29905」、静的条件<3>への入力データ数は「29905」(最悪のケース)となり、入力データの延べ数は、「350196」となる。すなわち、各静的条件への入力データ数がそれぞれ「290386」である場合には、入力データの延べ数は、「871158」となる。したがって、適用順序決定部14による処理を適用した場合の入力データの延べ数は、各静的条件への入力データ数がそれぞれ「290386」である場合の入力データの延べ数と比べて、1/2以下とすることができる。
[抽出処理の手順]
次に、実施例1に係る抽出処理の手順について、図8を参照して説明する。図8は、実施例1に係る抽出処理のフローチャートの一例を示す図である。なお、抽出条件解析結果は、入力データ9を受け取る前に、記憶部20に記憶されているものとする。
まず、入力データ解析部11は、入力データ9を受け取ったか否かを判定する(ステップS11)。入力データ9を受け取っていないと判定した場合には(ステップS11;No)、入力データ解析部11は、入力データ9を受け取るまで、判定処理を繰り返す。
一方、入力データ9を受け取ったと判定した場合には(ステップS11;Yes)、入力データ解析部11は、受け取った入力データ9を解析する(ステップS12)。例えば、入力データ解析部11は、入力データ9より、各種類のアスペクトに対応する値ごとに、出現頻度を算出する。入力データ解析部11は、算出した、アスペクトに対応する値ごとの出現頻度を解析結果として記憶部20の解析結果22に格納する(ステップS13)。
続いて、抽出条件取得部12は、抽出条件解析結果から静的な抽出条件および動的な抽出条件を取得する(ステップS14)。
絞込み推定部13は、取得された静的な抽出条件ごとにXBRLデータの絞込み数を推定する(ステップS15)。例えば、絞込み推定部13は、取得された静的な抽出条件から、XBRLデータと照合するアスペクトおよび値を取り出す。絞込み推定部13は、解析結果22から、取り出されたアスペクトおよび値に対応する分布情報22cを読み出す。絞込み推定部13は、読み出した分布情報22cを絞込み推定数としてアスペクトおよび値に対応付けて設定する。
続いて、適用順序決定部14は、取得された静的および動的な抽出条件の適用順序を決定する(ステップS16)。なお、適用順序の決定処理の手順は、後述する。
そして、データ抽出部15は、決定された適用順序に応じて入力データ9に対して抽出条件を適用し、入力データ9からXBRLデータを抽出する(ステップS17)。これにより、データ抽出部15は、入力データ9から検証ルールに必要なデータ項目を有するXBRLデータを高速に抽出することができる。
[適用順序決定処理の手順]
次に、実施例1に係る適用順序決定処理の手順について、図9を参照して説明する。図9は、実施例1に係る適用順序決定処理のフローチャートの一例を示す図である。
適用順序決定部14は、静的な抽出条件の適用順序を、絞込み推定数が小さい程早くなるように決定する(ステップS21)。例えば、適用順序決定部14は、絞込み推定部13によって推定された複数の静的な抽出条件の絞込み推定数を参照し、静的な抽出条件の絞込み推定数が小さい程順序が早くなるように静的な抽出順序を決定する。すなわち、適用順序決定部14は、絞込み効果が高い順に、抽出条件の適用順序を決定する。
そして、適用順序決定部14は、抽出条件取得部12によって動的な抽出条件が取得されたか否かを判定する(ステップS22)。動的な抽出条件が取得されたと判定した場合には(ステップS22;Yes)、適用順序決定部14は、動的な抽出条件の適用順序を、静的な抽出条件の後となるように決定する(ステップS23)。そして、適用順序決定部14は、処理を終了する。
一方、動的な抽出条件が選択されなかったと判定した場合には(ステップS22;No)、適用順序決定部14は、抽出条件の適用順序を決定したので、処理を終了する。
[実施例1の効果]
上記実施例1によれば、抽出装置1は、複数のXBRLデータを含む入力データ9より、複数のXBRLデータそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う。この際、抽出装置1は、複数のXBRLデータそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を参照し、複数の抽出条件の適用順序を決定する。かかる構成によれば、抽出装置1は、入力データ9から検証の対象となる要素を有するXBRLデータを高速に抽出することができる。
また、上記実施例1によれば、抽出装置1は、出現頻度が最も低い値となる抽出条件を最初に適用するように、複数の抽出条件の適用順序を決定する。かかる構成によれば、抽出装置1は、最初に、検証の対象となる要素を有するXBRLデータを最低個数分抽出することができ、この後の抽出処理の負荷を軽減できる。
ところで、実施例1では、抽出装置1は、検証ルールから複数のXBRLデータそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を取得する。そして、抽出装置1は、XBRLデータにおけるアスペクトごとの値の出現頻度を参照し、複数の抽出条件の適用順序を決定する場合を説明した。しかしながら、抽出装置1は、さらに、以下の場合であっても良い。すなわち、抽出装置1は、複数の検証ルールで共通する複数の抽出条件をグループ化する。そして、抽出装置1は、グループ化した抽出グループ、およびXBRLデータにおけるアスペクトごとの値の出現頻度を参照し、検証ルールごとの複数の抽出条件の適用順序を決定する場合であっても良い。さらに、抽出装置1は、グループ化した抽出グループの抽出結果を、複数の検証ルールで再利用する場合であっても良い。
ここで、実施例2において、複数の検証ルールで共通する複数の抽出条件をグループ化するのは、以下の理由による。通常、入力データに対するフォーミュラ検証では、複数の検証ルールが実施される。複数の検証ルールごとに、複数の抽出条件が実行される。複数の検証ルール間では、共通の抽出条件の構造が存在することがある。異なる検証ルールであっても、共通の抽出条件の構造が存在すれば、一方の検証ルールの適用結果を他方の検証ルールで再利用することが可能となる。したがって、実施例2では、複数の検証ルールで共通する複数の抽出条件をグループ化する。ただし、1つの検証ルールの適用結果を再利用することが可能となるのは、共通の抽出条件の構造を最初に適用する場合に限られる。
なお、共通の抽出条件をグループ化して仮想的に1つの抽出条件とみなした場合の絞込み効果の推定数は、共通の抽出条件に含まれる抽出条件のうち絞込みに最も効果の高い抽出条件の絞込み推定数とすれば良い。これについて説明する。すなわち、厳密に推定しようとすると、検証ルール内の個々の抽出条件に対して、複数の特定のアスペクト値を持つデータ項目の出現頻度分布の解析が必要であるが、アスペクト値の組み合わせのバリエーションが多いと、バリエーションに応じたデータ項目ごとの解析処理も負荷(解析時間、メモリ使用量)がかかる。アスペクト値ごとのデータ項目の出現頻度分布であれば、データ項目ごとの解析の負荷は軽く、グループ中の、絞込みに効果の高い抽出条件が1つみつけられれば、検証ルール全体の効果を推定することができる。
このように、共通の抽出条件の構造をグループ化し、仮想的に1つの抽出条件とみなすことで、共通の抽出条件の構造を1度だけ評価し、抽出結果を再利用することが可能となり、抽出処理を効率化することができる。
そこで、実施例2では、抽出装置1は、複数の検証ルールで共通する複数の抽出条件をグループ化する。そして、抽出装置1は、グループ化した抽出グループ、およびXBRLデータにおけるアスペクトごとの値の出現頻度を参照し、検証ルールごとの複数の抽出条件の適用順序を決定する場合について説明する。
[実施例2に係る抽出装置の構成]
図10は、実施例2に係る抽出装置の構成を示す機能ブロック図である。なお、図1に示す抽出装置と同一の構成については同一符号を示すことで、その重複する構成および動作の説明については省略する。実施例1と実施例2とが異なるところは、ルール組合せ部41および組合せテーブル31を追加した点にある。実施例1と実施例2とが異なるところは、抽出条件取得部12A、絞込み推定部13A、適用順序決定部14Aおよびデータ抽出部15Aを変更した点にある。
ルール組合せ部41は、共通する複数の抽出条件を有する複数の検証ルールを組み合わせる。なお、ルール組合せ部41は、入力データ9を入力する前に実施される。例えば、ルール組合せ部41は、複数の検証ルールごとに、それぞれ静的な抽出条件を取り出す。ルール組合せ部41は、取り出した、複数の検証ルールごとの静的な抽出条件に基づいて、共通する複数の抽出条件(抽出グループ)を有する複数の検証ルールを組み合わせる。そして、ルール組合せ部41は、組み合わせた複数の検証ルールを対応付けて組合せテーブル31に格納する。
ここで、組合せテーブル31のデータ構造を、図11を参照して説明する。図11は、実施例2に係る組合せテーブルのデータ構造の一例を示す図である。図11に示すように、組合せテーブル31は、検証ルール名31a、静的抽出条件31bおよび共通構造を持つ検証ルール名31cを対応付けて記憶する。検証ルール名31aは、検証ルールの名称を示す。静的抽出条件31bは、検証ルール名31aが示す検証ルールに含まれる静的な抽出条件を示す。共通構造を持つ検証ルール名31cは、検証ルール名31aが示す検証ルールに含まれる静的抽出条件と共通する静的抽出条件を有する検証ルールの名称を示す。
一例として、検証ルール名31aが「ルール1」である場合には、静的抽出条件31bとして「抽出条件1,抽出条件2」、共通構造を持つ検証ルール名31cとして「ルール3」と記憶している。すなわち、ルール3は、ルール1と共通する静的抽出条件を持つことを意味する。検証ルール名31aが「ルール2」である場合には、静的抽出条件31bとして「抽出条件1,抽出条件3」、共通構造を持つ検証ルール名31cとして「ルール3」と記憶している。すなわち、ルール3は、ルール2と共通する静的抽出条件を持つことを意味する。検証ルール名31aが「ルール3」である場合には、静的抽出条件31bとして「抽出条件1,抽出条件2,抽出条件3」、共通構造を持つ検証ルール名31cとして「なし」と記憶している。すなわち、ルール3と共通する静的抽出条件を持つルールはないことを意味する。
抽出条件取得部12Aは、抽出条件解析結果から静的な抽出条件および動的な抽出条件を取得する。また、抽出条件取得部12Aは、検証ルールごとに、共通する複数の静的な抽出条件をグループ化した抽出グループおよび抽出グループに含まれない静的な抽出条件を選択する。例えば、抽出条件取得部12Aは、検証ルールごとに以下の処理を行う。抽出条件取得部12Aは、組合せテーブル31を参照して、特定した検証ルールが他の検証ルールの静的な抽出条件の構造と共通する構造を持つか否かを判定する。言い換えれば、抽出条件取得部12Aは、特定した検証ルールの静的な抽出条件の構造が他の検証ルールの静的な抽出条件の構造を包含するか否かを判定する。抽出条件取得部12Aは、特定した検証ルールが他の検証ルールの静的な抽出条件の構造と共通する構造を持つと判定した場合には、この他の検証ルールを選択する。この他の検証ルールは、抽出グループに対応する。抽出条件取得部12Aは、特定した検証ルールの静的な抽出条件のうち共通する構造の静的な抽出条件に含まれない静的な抽出条件を選択する。
絞込み推定部13Aは、抽出グループに関するグループ情報、および解析結果22を参照し、検証ルールに含まれる抽出グループおよび抽出グループに含まれない静的な抽出条件の出現頻度を取得する。すなわち、絞込み推定部13Aは、検証ルールごとに、抽出グループの絞込み推定数および抽出グループに含まれない静的な抽出条件の絞込み推定数を推定する。例えば、絞込み推定部13Aは、検証ルールごとに以下の処理を行う。絞込み推定部13Aは、特定の検証ルールについて、抽出条件取得部12Aによって抽出グループに対応する他の検証ルールが選択された場合には、他の検証ルールと共通する静的な抽出条件から、XBRLデータと照合するアスペクトおよび値を取り出す。絞込み推定部13Aは、解析結果22から、取り出されたアスペクトおよび値に対応する分布情報22cを読み出し、読み出した分布情報22cを絞込み推定数として抽出条件に対応付けて設定する。絞込み推定数が小さい程、抽出条件の絞込み効果は大きいものとなる。絞込み推定部13Aは、絞込み推定数が最も小さい数を、抽出グループの絞込み推定数として設定する。そして、絞込み推定部13Aは、解析結果22から、抽出グループに含まれない静的な抽出条件に対応する分布情報22cを読み出し、読み出した分布情報22cを絞込み推定数として設定する。なお、絞込み推定部13Aは、特定した検証ルールに抽出グループが複数存在する場合には、存在する抽出グループごとに絞込み推定処理を行う。
適用順序決定部14Aは、絞込み推定部13Aによって推定された絞込み推定数に基づいて、抽出グループおよび抽出グループに含まれない静的な抽出条件の適用順序を決定する。適用順序決定部14Aは、絞込み推定部13Aによって推定された絞込み推定数に基づいて、抽出グループに含まれる静的な抽出条件の適用順序を決定する。例えば、適用順序決定部14Aは、検証ルールごとに以下の処理を行う。適用順序決定部14Aは、抽出グループの絞込み推定数および抽出グループに含まれない静的な抽出条件の絞込み推定数を参照し、絞込み推定数が小さい程順序が早くなるように、抽出グループおよび抽出グループに含まれない静的な抽出条件の適用順序を決定する。また、適用順序決定部14Aは、抽出グループに含まれる静的な抽出条件の絞込み推定数を参照し、静的な抽出条件の絞込み推定数が小さい程順序が早くなるように静的な抽出条件の適用順序を決定する。なお、適用順序決定部14Aは、抽出グループが複数存在する場合には、それぞれの抽出グループの絞込み推定数に基づき、抽出グループを決定すれば良い。すなわち、適用順序決定部14Aは、絞込み推定数が最も小さい抽出グループを、適用順序決定で用いる抽出グループとして決定すれば良い。
データ抽出部15Aは、検証ルールごとに、適用順序決定部14Aによって決定された適用順序を用いて、入力データに対して抽出条件を適用し、XBRLデータを抽出する。データ抽出部15Aは、ある検証ルールにおけるデータ抽出の際に、検証ルールに含まれる抽出グループのデータ抽出が既に行われた場合には、既に行われたデータ抽出の結果をこの検証ルールのデータ抽出の結果として取得する。ただし、データ抽出の結果が取得できる場合は、ある検証ルールにおいてこの抽出グループが最初に適用される場合に限る。この抽出グループが最初以外で適用されると、先行して適用されたデータ抽出の結果が連動できなくなるからである。
次に、抽出条件取得部12Aによる処理を、図12を参照して説明する。図12は、実施例2に係る抽出条件取得部により取得された抽出条件の一例を示す図である。なお、図12では、抽出条件取得部12Aは、図11で示した組合せテーブル31を参照するものとする。
図12に示すように、抽出条件取得部12Aは、抽出条件解析結果から、静的な抽出条件および動的な抽出条件を取得する。ここでは、ルール1では、静的な抽出条件として、抽出条件1および抽出条件2が取得される。ルール2では、静的な抽出条件として、抽出条件1および抽出条件3が取得される。ルール3では、静的な抽出条件として、抽出条件1、抽出条件2および抽出条件3が取得される。
そして、抽出条件取得部12Aは、組合せテーブル31を参照して、特定した検証ルールが他の検証ルールの静的な抽出条件の構造と共通する構造を持つか否かを判定する。ここでは、ルール1では、他のルールの静的な抽出条件の構造と共通する構造を持たないと判定される。ルール2では、他のルールの静的な抽出条件の構造と共通する構造を持たないと判定される。ルール3では、他のルールの静的な抽出条件の構造と共通する構造を持つと判定される。すなわち、ルール3の静的な抽出条件の構造は、抽出条件1、抽出条件2および抽出条件3であるので、ルール1の静的な抽出条件の構造である抽出条件1および抽出条件2と共通する構造を持つと判定される。また、ルール3の静的な抽出条件の構造は、抽出条件1、抽出条件2および抽出条件3であるので、ルール2の静的な抽出条件の構造である抽出条件1および抽出条件3と共通する構造を持つと判定される。
そして、抽出条件取得部12Aは、特定した検証ルールが他の検証ルールの静的な抽出条件の構造と共通する構造を持つと判定した場合には、以下の処理を行う。抽出条件取得部12Aは、この他の検証ルールを選択するとともに、特定した検証ルールの静的な抽出条件のうち共通する構造の静的な抽出条件に含まれない静的な抽出条件を選択する。ここでは、ルール3について、他の検証ルールとしてルール1、ルール3の静的な抽出条件のうち共通する構造の静的な抽出条件に含まれない静的な抽出条件として抽出条件3が選択される。また、ルール3について、他の検証ルールとしてルール2、ルール3の静的な抽出条件のうち共通する構造の静的な抽出条件に含まれない静的な抽出条件として抽出条件2が選択される。
次に、絞込み推定部13Aによる処理を、図13を参照して説明する。図13は、実施例2に係る絞込み推定部による処理の具体例を示す図である。なお、図13では、検証ルール1,2について、抽出条件取得部12Aによって抽出グループが選択されなかったものとする。検証ルール3について、抽出条件取得部12Aによって抽出グループとして検証ルール1が選択され、抽出グループに含まれない静的な抽出条件として抽出条件3が選択されたものとする。検証ルール3について、抽出条件取得部12Aによって抽出グループとして検証ルール2が選択され、抽出グループに含まれない静的な抽出条件として抽出条件2が選択されたものとする。以降、検証ルールをルールと略記する場合がある。
図13に示すように、ルール1について、絞込み推定部13Aは、抽出グループが選択されないので、静的な抽出条件から、XBRLデータと照合するアスペクトおよび値を取り出す。ここでは、抽出条件1である場合には、アスペクトとして「Dimension軸(dim:D1)」、値として「mem:m10」が取り出される。抽出条件2である場合には、アスペクトとして「Dimension軸(dim:D2)」、値として「mem:m20」が取り出される。
絞込み推定部13Aは、解析結果22から、取り出されたアスペクトおよび値に対応する分布情報22cを読み出し、分布情報22cを絞込み推定数として抽出条件に対応付けて設定する。ここでは、抽出条件1に対応付けられた「190271」の数のXBRLデータが絞り込まれると推定される。抽出条件2に対応付けられた「29905」の数のXBRLデータが絞り込まれると推定される。そして、絞込み推定部13Aは、絞込み推定数が最も小さい数「29905」を、ルール1の絞込み推定数として設定する。
次に、ルール2について、絞込み推定部13Aは、抽出グループが選択されないので、静的な抽出条件から、XBRLデータと照合するアスペクトおよび値を取り出す。ここでは、抽出条件1である場合には、アスペクトとして「Dimension軸(dim:D1)」、値として「mem:m10」が取り出される。抽出条件3である場合には、アスペクトとして「Dimension軸(dim:D3)」、値として「mem:m30」が取り出される。
絞込み推定部13Aは、解析結果22から、取り出されたアスペクトおよび値に対応する分布情報22cを読み出し、分布情報22cを絞込み推定数として抽出条件に対応付けて設定する。ここでは、抽出条件1に対応付けられた「190271」の数のXBRLデータが絞り込まれると推定される。抽出条件3に対応付けられた「290384」の数のXBRLデータが絞り込まれると推定される。そして、絞込み推定部13Aは、絞込み推定数が最も小さい数「190271」を、ルール2の絞込み推定数として設定する。
次に、ルール3について、絞込み推定部13Aは、抽出グループとしてルール1が選択されたので、既に推定されたルール1の絞込み推定数を取得する。ここでは、ルール1の絞込み推定数として、「29905」が取得される。
絞込み推定部13Aは、抽出グループに含まれない抽出条件として抽出条件3が選択されたので、抽出条件3から、XBRLデータと照合するアスペクトおよび値を取り出す。ここでは、アスペクトとして「Dimension軸(dim:D3)」、値として「mem:m30」が取り出される。絞込み推定部13Aは、解析結果22から、取り出されたアスペクトおよび値に対応する分布情報22cを読み出し、分布情報22cを絞込み推定数として抽出条件に対応付けて設定する。ここでは、抽出条件3に対応付けられた「290384」の数のXBRLデータが絞り込まれると推定される。
また、ルール3について、絞込み推定部13Aは、抽出グループとしてルール2が選択されたので、既に推定されたルール2の絞込み推定数を取得する。ここでは、ルール2の絞込み推定数として、「190271」が取得される。
絞込み推定部13Aは、抽出グループに含まれない抽出条件として抽出条件2が選択されたので、抽出条件2から、XBRLデータと照合するアスペクトおよび値を取り出す。ここでは、アスペクトとして「Dimension軸(dim:D2)」、値として「mem:m20」が取り出される。絞込み推定部13Aは、解析結果22から、取り出されたアスペクトおよび値に対応する分布情報22cを読み出し、分布情報22cを絞込み推定数として抽出条件に対応付けて設定する。ここでは、抽出条件2に対応付けられた「29905」の数のXBRLデータが絞り込まれると推定される。これにより、ルール1の絞込み推定数は「29905」、ルール2の絞込み推定数は「190271」であるので、適用順序決定部14Aによって符号f1で示されるルール1が適用順序決定で用いる抽出グループとして決定される。
次に、適用順序決定部14Aによる処理を、図14を参照して説明する。図14は、実施例2に係る適用順序決定部による処理の具体例を示す図である。なお、ルール1〜3それぞれの絞込み推定数は、図13で示したものとする。ルール3では、適用順序決定で用いる抽出グループとしてルール1が決定されるものとする。
図14に示すように、ルール1について、抽出条件取得部12Aによって抽出グループが選択されない。そこで、適用順序決定部14Aは、複数の抽出条件の絞込み推定数を参照し、抽出条件の絞込み推定数が小さい程早い順序になるように抽出条件の適用順序を決定する。ここでは、抽出条件1の絞込み推定数が「190271」、抽出条件2の絞込み推定数が「29905」であるので、抽出条件の適用順序は、抽出条件2、抽出条件1に決定される。
ルール2について、抽出条件取得部12Aによって抽出グループが選択されない。そこで、適用順序決定部14Aは、複数の抽出条件の絞込み推定数を参照し、抽出条件の絞込み推定数が小さい程早い順序になるように抽出条件の適用順序を決定する。ここでは、抽出条件1の絞込み推定数が「190271」、抽出条件3の絞込み推定数が「290384」であるので、抽出条件の適用順序は、抽出条件1、抽出条件3に決定される。
ルール3について、抽出条件取得部12Aによって抽出グループが選択される。そして、適用順序決定部14Aは、適用順序決定で用いる抽出グループとしてルール1を決定する。そこで、適用順序決定部14Aは、抽出グループの絞込み推定数および抽出グループに含まれない静的な抽出条件の絞込み推定数を参照し、絞込み推定数が小さい程順序が早くなるように、抽出グループおよび抽出グループに含まれない静的な抽出条件の適用順序を決定する。ここでは、抽出グループとしてのルール1の絞込み推定数が「29905」、抽出グループに含まれない抽出条件3の絞込み推定数が「290384」であるので、適用順序は、ルール1、抽出条件3に決定される。
また、ルール3について、適用順序決定部14Aは、抽出グループに含まれる抽出条件の絞込み推定数を参照し、静的な抽出条件の絞込み推定数が小さい程順序が早くなるように静的な抽出条件の適用順序を決定する。ここでは、抽出グループとしてのルール1に含まれる抽出条件1の絞込み推定数が「190271」、抽出条件2の絞込み推定数が「29905」であるので、ルールに含まれる抽出条件の適用順序は、抽出条件2、抽出条件1に決定される。
次に、実施例2に係る抽出処理の利用例を、図15A〜図15Cを参照して説明する。図15A〜図15Cは、実施例2に係る抽出処理の利用例を示す図である。図15Aは、組合せテーブル31の一例を示す図である。図15Bは、入力データ1に関する抽出処理であり、図15Cは、更新された入力データである入力データ2に関する抽出処理である。
図15Aに示すように、ルール組合せ部41は、共通する複数の抽出条件(抽出グループ)を有する複数の検証ルールを組み合わせ、組み合わせた複数の検証ルールを対応付けて組合せテーブル31に格納する。組合せテーブル31には、検証ルール名31aが「ルール1」である場合には、静的抽出条件31bとして「抽出条件1,抽出条件2,抽出条件3」、共通構造を持つ検証ルール名31cとして「なし」と記憶している。すなわち、ルール1と共通する静的抽出条件を持つルールはないことを意味する。検証ルール名31aが「ルール2」である場合には、静的抽出条件31bとして「抽出条件1,抽出条件3,抽出条件4」、共通構造を持つ検証ルール名31cとして「なし」と記憶している。すなわち、ルール2と共通する静的抽出条件を持つルールはないことを意味する。検証ルール名31aが「ルール3」である場合には、静的抽出条件31bとして「抽出条件1,抽出条件2」、共通構造を持つ検証ルール名31cとして「ルール1」と記憶している。すなわち、ルール3は、ルール1と共通する静的抽出条件を持つことを意味する。検証ルール名31aが「ルール4」である場合には、静的抽出条件31bとして「抽出条件1,抽出条件3」、共通構造を持つ検証ルール名31cとして「ルール1,ルール2」と記憶している。すなわち、ルール4は、ルール1と共通する静的抽出条件を持つことを意味する。ルール4は、ルール2と共通する静的抽出条件を持つことを意味する。
図15Bに示すように、入力データ1において、入力データ解析部11によって解析された複数の抽出条件の分布情報(推定数)は以下のとおりである。抽出条件1の推定数は「1000」であるものとする。抽出条件2の推定数は「700」であるものとする。抽出条件3の推定数は「900」であるものとする。抽出条件4の推定数は「800」であるものとする。
ルール1について、抽出条件取得部12Aは、組合せテーブル31を参照して、抽出グループとしてルール3、抽出グループに含まれない抽出条件として抽出条件3を選択する。ルール2について、抽出条件取得部12Aは、組合せテーブル31を参照して、抽出グループとしてルール4、抽出グループに含まれない抽出条件として抽出条件4を選択する。ルール3について、抽出条件取得部12Aは、組合せテーブル31を参照して、抽出グループがないので、抽出グループに含まれない抽出条件として抽出条件1,2を選択する。ルール4について、抽出条件取得部12Aは、組合せテーブル31を参照して、抽出グループがないので、抽出グループに含まれない抽出条件として抽出条件1,3を選択する。
次に、ルール1について、絞込み推定部13Aは、抽出グループとしてルール3があるので、解析結果22を参照して、ルール3と共通する抽出条件1,2の絞込み推定数を設定する。絞込み推定部13Aは、絞込み推定数が最も小さい数を、ルール3の絞込み推定数として設定する。ここでは、抽出条件1の絞込み推定数が「1000」、抽出条件2の絞込み推定数が「700」であるので、ルール3の絞込み推定数は、「700」と設定される(g1)。また、絞込み推定部13Aは、解析結果22を参照して、抽出グループに含まれない抽出条件3の絞込み推定数を設定する。ここでは、抽出条件3の絞込み推定数は、「900」と設定される。
なお、ルール1について、抽出グループとしてルール4がある。ルール4の抽出条件を構成する抽出条件1,3の絞込み推定数は、それぞれ「1000」、「900」であるので、ルール4の絞込み推定数は、絞込み推定数が最も小さい数である「900」となる。したがって、ルール1には、抽出グループとしてルール3およびルール4があるが、絞込み推定数が小さいルール3が、適用順序決定で用いる抽出グループとして決定される。
適用順序決定部14Aは、ルール3の絞込み推定数およびルール3に含まれない抽出条件3の絞込み推定数を参照し、絞込み推定数が小さい程順序が早くなるように、適用順序を決定する。ここでは、ルール3の絞込み推定数が「700」、抽出条件3の絞込み推定数が「900」であるので、適用順序は、ルール3、抽出条件3に決定される。また、適用順序決定部14Aは、ルール3に含まれる抽出条件の絞込み推定数を参照し、絞込み推定数が小さい程順序が早くなるように、抽出条件の適用順序を決定する。ここでは、抽出条件1の絞込み推定数が「1000」、抽出条件2の絞込み推定数が「700」であるので、適用順序は、抽出条件2、抽出条件1に決定される。
データ抽出部15Aは、ルール1について、適用順序決定部14Aによって決定された適用順序を用いて、入力データ1に対して抽出条件を適用し、XBRLデータを抽出する。このとき、データ抽出部15Aは、抽出グループとしてのルール3の抽出結果を保存する。
次に、ルール2について、絞込み推定部13Aは、抽出グループとしてルール4があるので、解析結果22を参照して、ルール4と共通する抽出条件1,3の絞込み推定数を設定する。絞込み推定部13Aは、絞込み推定数が最も小さい数を、ルール4の絞込み推定数として設定する。ここでは、抽出条件1の絞込み推定数が「1000」、抽出条件3の絞込み推定数が「900」であるので、ルール4の絞込み推定数は、「900」と設定される(g2)。また、絞込み推定部13Aは、解析結果22を参照して、抽出グループに含まれない抽出条件4の絞込み推定数を設定する。ここでは、抽出条件4の絞込み推定数は、「800」と設定される。
適用順序決定部14Aは、ルール4の絞込み推定数およびルール4に含まれない抽出条件4の絞込み推定数を参照し、絞込み推定数が小さい程順序が早くなるように、適用順序を決定する。ここでは、ルール4の絞込み推定数が「900」、抽出条件4の絞込み推定数が「800」であるので、適用順序は、抽出条件4、ルール4に決定される。また、適用順序決定部14Aは、ルール4に含まれる抽出条件の絞込み推定数を参照し、絞込み推定数が小さい程順序が早くなるように、抽出条件の適用順序を決定する。ここでは、抽出条件1の絞込み推定数が「1000」、抽出条件3の絞込み推定数が「900」であるので、適用順序は、抽出条件3、抽出条件1に決定される。
データ抽出部15Aは、ルール2について、適用順序決定部14Aによって決定された適用順序を用いて、入力データ1に対して抽出条件を適用し、XBRLデータを抽出する。このとき、データ抽出部15Aは、抽出グループとしてのルール4の抽出結果を保存する。
次に、ルール3について、絞込み推定部13Aは、抽出グループがなく、ルール3の抽出条件はルール1で推定済みであるので、ルール3について推定しないで、ルール1の推定結果を利用する。そして、データ抽出部15Aは、ルール3について、適用順序決定部14Aによって決定された適用順序を用いて、入力データ1に対して抽出条件を適用し、XBRLデータを抽出する。なお、データ抽出部15Aは、ルール1が既に処理済みであればルール1に含まれるルール3の抽出条件の適用結果が保存されるので、その保存結果を抽出結果として取得する。すなわち、この場合、ルール3の抽出条件の適用処理は、ルール1におけるルール3の検証処理で一度だけとなる。
次に、ルール4について、絞込み推定部13Aは、抽出グループがなく、ルール4はルール2で推定済みであるので、ルール4について推定しないで、ルール2の推定結果を利用する。そして、データ抽出部15Aは、ルール4について、適用順序決定部14Aによって決定された適用順序を用いて、入力データ1に対して抽出条件を適用し、XBRLデータを抽出する。なお、データ抽出部15Aは、ルール2が既に処理済みでもルール2に含まれるルール4の抽出条件は最初に適用されなかったため適用結果は保存されず、抽出結果の再利用は行われない。
図15Cに示すように、入力データ2において、入力データ解析部11によって解析された複数の抽出条件の分布情報(推定数)は以下のように更新されるとする。抽出条件1の推定数は「1000」であるものとする。抽出条件2の推定数は「900」であるものとする。抽出条件3の推定数は「700」であるものとする。抽出条件4の推定数は「800」であるものとする。すなわち、抽出条件2と抽出条件3の推定数が更新されたものとする。
ルール1について、絞込み推定部13Aは、抽出グループとしてルール3があるので、解析結果22を参照して、ルール3と共通する抽出条件1,2の絞込み推定数を設定する。絞込み推定部13Aは、絞込み推定数が最も小さい数を、ルール3の絞込み推定数として設定する。ここでは、抽出条件1の絞込み推定数が「1000」、抽出条件2の絞込み推定数が「900」であるので、ルール3の絞込み推定数は、「900」と設定される。また、絞込み推定部13Aは、解析結果22を参照して、抽出グループに含まれない抽出条件3の絞込み推定数を設定する。ここでは、抽出条件3の絞込み推定数は、「700」と設定される。
これに対して、ルール1について、抽出グループとしてルール4がある。ルール4と共通する抽出条件1,3の絞込み推定数は、それぞれ「1000」、「700」であるので、ルール4の絞込み推定数は、絞込み推定数が最も小さい数である「700」となる。また、絞込み推定部13Aは、解析結果22を参照して、抽出グループに含まれない抽出条件2の絞込み推定数を設定する。ここでは、抽出条件2の絞込み推定数は、「900」と設定される。したがって、抽出グループとしてルール3およびルール4があるが、絞込み推定数が小さいルール4が、適用順序決定で用いる抽出グループとして決定される。
適用順序決定部14Aは、ルール4の絞込み推定数およびルール4に含まれない抽出条件2の絞込み推定数を参照し、絞込み推定数が小さい程順序が早くなるように、適用順序を決定する。ここでは、ルール4の絞込み推定数が「700」、抽出条件2の絞込み推定数が「900」であるので、適用順序は、ルール4、抽出条件2に決定される。また、適用順序決定部14Aは、ルール4に含まれる抽出条件の絞込み推定数を参照し、絞込み推定数が小さい程順序が早くなるように、抽出条件の適用順序を決定する。ここでは、抽出条件1の絞込み推定数が「1000」、抽出条件3の絞込み推定数が「700」であるので、適用順序は、抽出条件3、抽出条件1に決定される。
データ抽出部15Aは、ルール1について、適用順序決定部14Aによって決定された適用順序を用いて、入力データ2に対して抽出条件を適用し、XBRLデータを抽出する。このとき、データ抽出部15Aは、抽出グループとしてのルール4の抽出結果を保存する。
次に、ルール2について、絞込み推定部13Aは、抽出グループとしてルール4があるが、ルール4はルール1で推定済みであるので、ルール1の推定結果を利用する。ルール4の絞込み推定数は「700」である。また、絞込み推定部13Aは、解析結果22を参照して、抽出グループに含まれない抽出条件4の絞込み推定数を設定する。ここでは、抽出条件4の絞込み推定数は、「800」と設定される。
適用順序決定部14Aは、ルール4の絞込み推定数およびルール4に含まれない抽出条件4の絞込み推定数を参照し、絞込み推定数が小さい程順序が早くなるように、適用順序を決定する。ここでは、ルール4の絞込み推定数が「700」、抽出条件4の絞込み推定数が「800」であるので、適用順序は、ルール4、抽出条件4に決定される。
データ抽出部15Aは、ルール2について、適用順序決定部14Aによって決定された適用順序を用いて、入力データ2に対して抽出条件を適用し、XBRLデータを抽出する。このとき、データ抽出部15Aは、抽出グループとしてのルール4の抽出結果を取得する。そして、データ抽出部15Aは、ルール4の抽出結果を入力して、抽出条件4を適用し、XBRLデータを抽出する。
次に、ルール3について、絞込み推定部13Aは、抽出グループがなく、他のルールで推定済みでないので、解析結果22を参照して、抽出条件1,2の絞込み推定数を設定する。絞込み推定部13Aは、絞込み推定数が最も小さい数を、ルール3の絞込み推定数として設定する。ここでは、抽出条件1の絞込み推定数が「1000」、抽出条件2の絞込み推定数が「900」であるので、ルール3の絞込み推定数は、「900」と設定される。
適用順序決定部14Aは、ルール3に含まれる抽出条件の絞込み推定数を参照し、絞込み推定数が小さい程順序が早くなるように、抽出条件の適用順序を決定する。ここでは、抽出条件1の絞込み推定数が「1000」、抽出条件2の絞込み推定数が「900」であるので、適用順序は、抽出条件2、抽出条件1に決定される。
データ抽出部15Aは、ルール3について、適用順序決定部14Aによって決定された適用順序を用いて、入力データ2に対して抽出条件を適用し、XBRLデータを抽出する。
次に、ルール4について、絞込み推定部13Aは、抽出グループがなく、ルール4はルール1で推定済みであるので、ルール4について推定しないで、ルール1の推定結果を利用する。そして、データ抽出部15Aは、ルール4について、適用順序決定部14Aによって決定された適用順序を用いて、入力データ2に対して抽出条件を適用し、XBRLデータを抽出する。なお、データ抽出部15Aは、ルール1が処理済みであればルール4の抽出条件の適用結果が保存されるので、その保存結果を抽出結果として取得する。すなわち、この場合、ルール4の抽出条件の適用処理は、ルール1におけるルール4の検証処理で一度だけとなる。
これにより、抽出装置1は、複数の検証ルールで共通する抽出条件の構造を抽出グループとして仮想的に1つの抽出条件として扱うので、抽出グループに係る推定結果および抽出結果を再利用することで、全体の抽出処理の適用を効率化することができる。また、抽出装置1は、複数のXBRLデータの更新による分布情報の更新に応じて抽出グループを決定するので、XBRLデータの特徴に応じた抽出条件の適用を最適化することができる。
[抽出処理の手順]
次に、実施例2に係る抽出処理の手順について、図16を参照して説明する。図16は、実施例2に係る抽出処理のフローチャートの一例を示す図である。なお、ルール組合せ部41によって組合せテーブル31が作成されたものとする。また、抽出条件解析結果は、入力データ9を受け取る前に、記憶部20に記憶されているものとする。
まず、入力データ解析部11は、入力データ9を受け取ったか否かを判定する(ステップS31)。入力データ9を受け取っていないと判定した場合には(ステップS31;No)、入力データ解析部11は、入力データ9を受け取るまで、判定処理を繰り返す。
一方、入力データ9を受け取ったと判定した場合には(ステップS31;Yes)、入力データ解析部11は、受け取った入力データ9を解析する(ステップS32)。例えば、入力データ解析部11は、入力データ9より、各種類のアスペクトに対応する値ごとに、出現頻度を算出する。入力データ解析部11は、算出した、アスペクトに対応する値ごとの出現頻度を解析結果22に格納する(ステップS33)。
続いて、抽出条件取得部12Aは、検証ルールごとに、抽出条件解析結果から静的な抽出条件および動的な抽出条件を取得する(ステップS34)。抽出条件取得部12Aは、組合せテーブル31を参照して、検証ルールごとに、検証ルールが他の検証ルールの構造と共通する構造を持つ場合には、この検証ルールを選択するとともに、他の検証ルールに含まれない静的な抽出条件を選択する(ステップS35)。すなわち、抽出条件取得部12Aは、検証ルールごとに、共通する複数の静的な抽出条件をグループ化した抽出グループおよび抽出グループに含まれない静的な抽出条件を選択する。
続いて、絞込み推定部13Aは、検証ルールごとに、選択した静的な抽出条件および選択した他の検証ルールのデータの絞込み数を推定する(ステップS36)。例えば、絞込み推定部13Aは、抽出条件取得部12Aによって他の検証ルールが選択された場合には、他の検証ルールと共通する静的な抽出条件から、XBRLデータと照合するアスペクトおよび値を取り出す。絞込み推定部13Aは、解析結果22から、取り出されたアスペクトおよび値に対応する分布情報22cを読み出し、読み出した分布情報22cを絞込み推定数として抽出条件に対応付けて設定する。絞込み推定部13Aは、絞込み推定数が最も小さい数を、抽出グループの絞込み推定数として設定する。そして、絞込み推定部13Aは、解析結果22から、抽出グループに含まれない静的な抽出条件に対応する分布情報22cを読み出し、読み出した分布情報22cを絞込み推定数として設定する。一方、絞込み推定部13Aは、抽出条件取得部12Aによって他の検証ルールが選択されなかった場合には、静的な抽出条件に対応する分布情報22cを読み出し、読み出した分布情報22cを絞込み推定数として設定する。
そして、適用順序決定部14Aは、検証ルールごとに、抽出条件の適用順序を決定する(ステップS37)。なお、適用順序の決定処理の手順は、後述する。
そして、データ抽出部15Aは、決定された適用順序に応じて入力データ9に対して抽出条件を適用し、入力データ9からXBRLデータを抽出する(ステップS38)。このとき、データ抽出部15Aは、抽出グループを最初に適用した場合には、抽出グループの適用結果(抽出結果)を保存する。また、データ抽出部15Aは、抽出グループが既に他の検証ルールで適用済みであれば、抽出グループの適用結果が保存されているので、保存された適用結果を抽出結果として取得する。つまり、データ抽出部15Aは、グループ化した抽出グループの抽出結果を、複数の検証ルールで再利用する。
[適用順序決定処理の手順]
次に、実施例2に係る適用順序決定処理の手順について、図17を参照して説明する。図17は、実施例2に係る適用順序決定処理のフローチャートの一例を示す図である。
適用順序決定部14Aは、1つの検証ルールを選択する(ステップS41)。
適用順序決定部14Aは、選択した検証ルールが他の検証ルールの構造と共通する構造を持つか否かを判定する(ステップS42)。すなわち、適用順序決定部14Aは、選択した検証ルールが他の検証ルールを包含するか否かを判定する。選択した検証ルールが他の検証ルールの構造と共通する構造を持つと判定した場合には(ステップS42;Yes)、適用順序決定部14Aは、他の検証ルールの共通の静的抽出条件および静的な抽出条件の適用順序を、絞込み推定数が小さい程早くなるように決定する(ステップS43)。そして、適用順序決定部14Aは、ステップS45に移行する。
一方、選択した検証ルールが他の検証ルールの構造と共通する構造を持たないと判定した場合には(ステップS42;No)、適用順序決定部14Aは、静的な抽出条件の適用順序を、絞込み推定数が小さい程早くなるように決定する(ステップS44)。そして、適用順序決定部14Aは、ステップS45に移行する。
ステップS45において、適用順序決定部14Aは、抽出条件取得部12Aによって動的な抽出条件が選択されたか否かを判定する(ステップS45)。動的な抽出条件が選択されたと判定した場合には(ステップS45;Yes)、適用順序決定部14Aは、動的な抽出条件の適用順序を、静的な抽出条件の後となるように決定する(ステップS46)。そして、適用順序決定部14Aは、処理を終了する。
一方、動的な抽出条件が選択されなかったと判定した場合には(ステップS45;No)、適用順序決定部14Aは、抽出条件の適用順序を決定したので、処理を終了する。
[実施例2の効果]
このようにして、上記実施例2では、抽出装置1は、複数の検証ルールで共通する複数の抽出条件をグループ化した抽出グループに関するグループ情報、および、分布情報を参照する。抽出装置1は、検証ルールに含まれる抽出グループごとに算出される絞込み推定数に基づき、抽出グループおよび抽出グループに含まれない複数の抽出条件の適用順序を決定する。かかる構成によれば、抽出装置1は、グループ化した抽出グループの絞込み推定数の算出を一度だけ行えば、再利用することが可能となるので、各検証ルールにおける複数の抽出条件の適用順序の決定を、早期に行うことができる。また、抽出装置1は、グループ化した抽出グループについて、入力データ9からのXBRLデータの抽出処理を一度だけ行えば、再利用することが可能となるので、各検証ルールにおける入力データ9からのXBRLデータの抽出を、早期に行うことができる。
また、上記実施例2では、抽出装置1は、1つの検証ルールに抽出グループが複数存在する場合には、適用順序を決定する際に用いられる抽出グループを、絞込み推定数に基づき決定する。かかる構成によれば、抽出装置1は、絞込み推定数が小さい抽出グループを決定することで、抽出条件の適用順序を効率良く決定できる。
また、上記実施例2では、抽出装置1は、複数のXBRLデータの更新による分布情報の更新に応じて、抽出グループを決定する。かかる構成によれば、抽出装置1は、XBRLデータの特徴に応じた抽出条件の適用を最適化することができる。
また、上記実施例2では、抽出装置1は、適用順序を決定する処理によって決定された適用順序に基づいて、抽出グループの複数の抽出条件および抽出グループに含まれない抽出条件を組み合わせた抽出処理を行う。抽出装置1は、抽出グループの複数の抽出条件を用いて抽出された抽出結果を保存する。かかる構成によれば、抽出装置1は、抽出グループにおける抽出結果を保存することで、同じ抽出グループを持つ検証ルールで、この保存した抽出結果を再利用することができる。この結果、抽出装置1は、各検証ルールにおける抽出処理を、早期に行うことができる。
[プログラム等]
なお、抽出装置1は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置に、上記した制御部10と、記憶部20等の各機能を搭載することによって実現することができる。
また、図示した抽出装置1の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、抽出装置1の分散・統合の具体的態様は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、絞込み推定部13と適用順序決定部14とを1個の部として統合しても良い。一方、抽出条件取得部12を、静的な抽出条件を取得する第1の取得部と、動的な抽出条件を取得する第2の取得部とに分散しても良い。抽出条件取得部12Aを、静的な抽出条件を取得する第1の取得部と、動的な抽出条件を取得する第2の取得部と、抽出グループと抽出グループに含まれない静的な抽出条件を選択する第3の取得部とに分散しても良い。また、検証ルール21や解析結果22等の記憶部20を抽出装置1の外部装置としてネットワーク経由で接続するようにしても良い。
また、上記実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーション等のコンピュータで実行することによって実現することができる。そこで、以下では、図1に示した抽出装置1と同様の機能を実現する抽出プログラムを実行するコンピュータの一例を説明する。図18は、抽出プログラムを実行するコンピュータの一例を示す図である。
図18に示すように、コンピュータ200は、各種演算処理を実行するCPU203と、ユーザからのデータの入力を受け付ける入力装置215と、表示装置209を制御する表示制御部207とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読取るドライブ装置213と、ネットワークを介して他のコンピュータとの間でデータの授受を行う通信制御部217とを有する。また、コンピュータ200は、各種情報を一時記憶するメモリ201と、HDD205を有する。そして、メモリ201、CPU203、HDD205、表示制御部207、ドライブ装置213、入力装置215、通信制御部217は、バス219で接続されている。
ドライブ装置213は、例えばリムーバブルディスク211用の装置である。HDD205は、抽出プログラム205aおよび抽出処理関連情報205bを記憶する。
CPU203は、抽出プログラム205aを読み出して、メモリ201に展開し、プロセスとして実行する。かかるプロセスは、抽出装置1の各機能部に対応する。抽出処理関連情報205bは、検証ルール21および解析結果22等に対応する。そして、例えばリムーバブルディスク211が、抽出プログラム205a等の各情報を記憶する。
なお、抽出プログラム205aについては、必ずしも最初からHDD205に記憶させておかなくても良い。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカード等の「可搬用の物理媒体」に当該プログラムを記憶させておく。そして、コンピュータ200がこれらから抽出プログラム205aを読み出して実行するようにしても良い。
1 抽出装置
9 入力データ
10 制御部
11 入力データ解析部
12,12A 抽出条件取得部
13,13A 絞込み推定部
14,14A 適用順序決定部
15 データ抽出部
20 記憶部
21 検証ルール
22 解析結果
31 組合せテーブル
41 ルール組合せ部

Claims (8)

  1. 複数のXBRLファイルを含む入力データより、前記複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う際に、前記複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を参照し、前記複数の抽出条件の適用順序を決定する、
    処理をコンピュータに実行させる抽出プログラム。
  2. 前記適用順序は、出現頻度が最も低い値となる抽出条件を最初に適用するものであることを特徴とする請求項1に記載の抽出プログラム。
  3. 前記決定する処理は、複数の抽出処理で共通する複数の抽出条件をグループ化した抽出グループに関するグループ情報、および、前記分布情報を参照し、前記抽出処理に含まれる抽出グループごとに算出される分布推定値に基づき、前記抽出グループおよび前記抽出グループに含まれない前記複数の抽出条件の適用順序を決定する
    ことを特徴とする請求項1に記載の抽出プログラム。
  4. 前記抽出グループが複数存在する場合には、前記適用順序を決定する際に用いられる抽出グループを、前記分布推定値に基づき決定する
    ことを特徴とする請求項1に記載の抽出プログラム。
  5. 前記適用順序を決定する処理によって決定された適用順序に基づいて、前記抽出グループの複数の抽出条件および前記抽出グループに含まれない抽出条件を組み合わせた抽出処理を行い、
    前記抽出グループの複数の抽出条件を用いて抽出された抽出結果を保存する
    ことを特徴とする請求項3に記載の抽出プログラム。
  6. 前記複数のXBRLファイルの更新による前記分布情報の更新に応じて、前記抽出グループを決定する
    ことを特徴とする請求項4に記載の抽出プログラム。
  7. 複数のXBRLファイルを含む入力データより、前記複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う際に、前記入力データより、前記複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を算出する算出部と、
    前記算出部によって算出された分布情報を参照し、複数の抽出条件の適用順序を決定する決定部と、
    を有することを特徴とする抽出装置。
  8. コンピュータが、
    複数のXBRLファイルを含む入力データより、前記複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う際に、前記複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を参照し、前記複数の抽出条件の適用順序を決定する、
    処理を実行する抽出方法。
JP2017500259A 2015-02-20 2015-02-20 抽出プログラム、抽出装置および抽出方法 Expired - Fee Related JP6528841B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/054877 WO2016132550A1 (ja) 2015-02-20 2015-02-20 抽出プログラム、抽出装置および抽出方法

Publications (2)

Publication Number Publication Date
JPWO2016132550A1 true JPWO2016132550A1 (ja) 2017-11-24
JP6528841B2 JP6528841B2 (ja) 2019-06-12

Family

ID=56689217

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017500259A Expired - Fee Related JP6528841B2 (ja) 2015-02-20 2015-02-20 抽出プログラム、抽出装置および抽出方法

Country Status (5)

Country Link
US (1) US10497067B2 (ja)
EP (1) EP3261025A4 (ja)
JP (1) JP6528841B2 (ja)
AU (1) AU2015383376A1 (ja)
WO (1) WO2016132550A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11249710B2 (en) * 2016-03-31 2022-02-15 Splunk Inc. Technology add-on control console
CN107704544A (zh) * 2017-09-25 2018-02-16 深圳易嘉恩科技有限公司 利用xbrl概念实现企业主数据建模的方法
EP3866050B1 (en) * 2018-10-11 2023-07-26 Fujitsu Limited Conversion method, conversion apparatus, and conversion program
EP3979177A4 (en) * 2019-05-31 2022-06-15 Fujitsu Limited VERIFICATION PROCESS, INFORMATION PROCESSING SYSTEM AND VERIFICATION PROGRAM
CN113868301B (zh) * 2021-12-02 2022-06-07 昆仑智汇数据科技(北京)有限公司 一种工业设备数据抽取的方法、装置及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6240530A (ja) * 1985-08-17 1987-02-21 Fujitsu Ltd デ−タ抽出処理方式
JPH0352068A (ja) * 1989-07-20 1991-03-06 Nec Corp 論理演算方式
JPH10105560A (ja) * 1996-09-26 1998-04-24 Nec Corp データベース検索方法およびその装置
JP2006163876A (ja) * 2004-12-08 2006-06-22 Hitachi Ltd Xbrlデータ保存方法およびシステム
JP2008299797A (ja) * 2007-06-04 2008-12-11 Toshiba Corp データベースシステム、データベースシステムにおけるデータベース検索方法及びデータベースシステムに用いられるコンピュータプログラム
JP2010146109A (ja) * 2008-12-16 2010-07-01 Internet Disclosure Co Ltd Xbrlデータ検証/作成システム及びxbrlデータ検証/作成プログラム
JP2013003981A (ja) * 2011-06-20 2013-01-07 Fujitsu Ltd 時系列ルール抽出装置、時系列ルール抽出方法及び時系列ルール抽出プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4024727B2 (ja) 2003-07-28 2007-12-19 株式会社日立製作所 眠気検出装置
US8266188B2 (en) * 2005-03-08 2012-09-11 Ca, Inc. Method and system for extracting structural information from a data file
US8875013B2 (en) * 2008-03-25 2014-10-28 International Business Machines Corporation Multi-pass validation of extensible markup language (XML) documents
KR101384405B1 (ko) 2010-01-19 2014-04-10 후지쯔 가부시끼가이샤 해석 방법, 해석 장치 및 해석 프로그램
US8660976B2 (en) * 2010-01-20 2014-02-25 Microsoft Corporation Web content rewriting, including responses
US9430515B2 (en) * 2013-12-06 2016-08-30 General Electric Company Data validation using schema definition

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6240530A (ja) * 1985-08-17 1987-02-21 Fujitsu Ltd デ−タ抽出処理方式
JPH0352068A (ja) * 1989-07-20 1991-03-06 Nec Corp 論理演算方式
JPH10105560A (ja) * 1996-09-26 1998-04-24 Nec Corp データベース検索方法およびその装置
JP2006163876A (ja) * 2004-12-08 2006-06-22 Hitachi Ltd Xbrlデータ保存方法およびシステム
JP2008299797A (ja) * 2007-06-04 2008-12-11 Toshiba Corp データベースシステム、データベースシステムにおけるデータベース検索方法及びデータベースシステムに用いられるコンピュータプログラム
JP2010146109A (ja) * 2008-12-16 2010-07-01 Internet Disclosure Co Ltd Xbrlデータ検証/作成システム及びxbrlデータ検証/作成プログラム
JP2013003981A (ja) * 2011-06-20 2013-01-07 Fujitsu Ltd 時系列ルール抽出装置、時系列ルール抽出方法及び時系列ルール抽出プログラム

Also Published As

Publication number Publication date
US10497067B2 (en) 2019-12-03
JP6528841B2 (ja) 2019-06-12
US20170345102A1 (en) 2017-11-30
WO2016132550A1 (ja) 2016-08-25
AU2015383376A1 (en) 2017-09-07
EP3261025A1 (en) 2017-12-27
EP3261025A4 (en) 2018-08-22

Similar Documents

Publication Publication Date Title
WO2016132550A1 (ja) 抽出プログラム、抽出装置および抽出方法
US8224845B2 (en) Transaction prediction modeling method
JP4839424B2 (ja) プログラムの解析を支援するための方法、並びにそのコンピュータ・プログラム及びコンピュータ・システム
US20190012257A1 (en) Model integration tool
JP2016522475A (ja) 複数ヴァージョンをテストするための方法及びデバイス
Trummer et al. Multi-objective quality-driven service selection—A fully polynomial time approximation scheme
JP7478318B2 (ja) フレキシブル・パイプライン生成のための方法及びシステム
CN106599623B (zh) 一种应用相似度计算方法及装置
US20200050669A1 (en) Dialog apparatus, dialog system, and computer-readable recording medium
JP6973197B2 (ja) データセット検証装置、データセット検証方法、およびデータセット検証プログラム
JP6900956B2 (ja) 検証プログラム、検証装置、検証方法、インデックス生成プログラム、インデックス生成装置およびインデックス生成方法
JP7448039B2 (ja) ルール更新プログラム、ルール更新方法及びルール更新装置
US8775873B2 (en) Data processing apparatus that performs test validation and computer-readable storage medium
JPWO2019138584A1 (ja) 分類木生成方法、分類木生成装置および分類木生成プログラム
JP6422346B2 (ja) プログラム生成装置、及び、プログラム生成方法
JPWO2017199309A1 (ja) 評価プログラム、評価装置および評価方法
US20190244151A1 (en) Just in time compilation (jit) for business process execution
JP2018156207A (ja) コーディング規約生成プログラム、情報処理装置およびコーディング規約生成方法
JP6954347B2 (ja) 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム
JPWO2020240873A1 (ja) 検証方法、情報処理装置及び検証プログラム
JP6710716B2 (ja) 脅威情報評価装置、脅威情報評価方法およびプログラム
JP6563549B1 (ja) データ傾向分析方法、データ傾向分析システム及び絞り込み及び復元装置
Jakobs Automatic Test-Case Generation with CoVeriTest
JP6354501B2 (ja) 比較プログラム、比較方法および情報処理装置
Stricker et al. Solving multi-criteria problems under risk: an approach explained using the example of rescheduling in dynamic environments

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170908

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190429

R150 Certificate of patent or registration of utility model

Ref document number: 6528841

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees