JPWO2016132550A1 - 抽出プログラム、抽出装置および抽出方法 - Google Patents
抽出プログラム、抽出装置および抽出方法 Download PDFInfo
- Publication number
- JPWO2016132550A1 JPWO2016132550A1 JP2017500259A JP2017500259A JPWO2016132550A1 JP WO2016132550 A1 JPWO2016132550 A1 JP WO2016132550A1 JP 2017500259 A JP2017500259 A JP 2017500259A JP 2017500259 A JP2017500259 A JP 2017500259A JP WO2016132550 A1 JPWO2016132550 A1 JP WO2016132550A1
- Authority
- JP
- Japan
- Prior art keywords
- extraction
- rule
- extraction condition
- condition
- application order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 713
- 238000000034 method Methods 0.000 claims description 41
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 abstract description 165
- 238000007405 data analysis Methods 0.000 abstract description 23
- 230000003068 static effect Effects 0.000 description 137
- 238000004458 analytical method Methods 0.000 description 53
- 238000010586 diagram Methods 0.000 description 39
- 238000013075 data extraction Methods 0.000 description 35
- 239000000284 extract Substances 0.000 description 28
- 230000000694 effects Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
Abstract
Description
図1は、実施例1に係る抽出装置の構成を示す機能ブロック図である。実施例1に係る抽出装置は、入力データ9に含まれる複数のXBRLデータより、検証ルールに指定される抽出条件を用いて、検証の対象となるデータ項目を有するXBRLデータを抽出する。この抽出されたXBRLデータが検証ルールを用いて検証される。
次に、実施例1に係る抽出処理の手順について、図8を参照して説明する。図8は、実施例1に係る抽出処理のフローチャートの一例を示す図である。なお、抽出条件解析結果は、入力データ9を受け取る前に、記憶部20に記憶されているものとする。
次に、実施例1に係る適用順序決定処理の手順について、図9を参照して説明する。図9は、実施例1に係る適用順序決定処理のフローチャートの一例を示す図である。
上記実施例1によれば、抽出装置1は、複数のXBRLデータを含む入力データ9より、複数のXBRLデータそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う。この際、抽出装置1は、複数のXBRLデータそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を参照し、複数の抽出条件の適用順序を決定する。かかる構成によれば、抽出装置1は、入力データ9から検証の対象となる要素を有するXBRLデータを高速に抽出することができる。
図10は、実施例2に係る抽出装置の構成を示す機能ブロック図である。なお、図1に示す抽出装置と同一の構成については同一符号を示すことで、その重複する構成および動作の説明については省略する。実施例1と実施例2とが異なるところは、ルール組合せ部41および組合せテーブル31を追加した点にある。実施例1と実施例2とが異なるところは、抽出条件取得部12A、絞込み推定部13A、適用順序決定部14Aおよびデータ抽出部15Aを変更した点にある。
次に、実施例2に係る抽出処理の手順について、図16を参照して説明する。図16は、実施例2に係る抽出処理のフローチャートの一例を示す図である。なお、ルール組合せ部41によって組合せテーブル31が作成されたものとする。また、抽出条件解析結果は、入力データ9を受け取る前に、記憶部20に記憶されているものとする。
次に、実施例2に係る適用順序決定処理の手順について、図17を参照して説明する。図17は、実施例2に係る適用順序決定処理のフローチャートの一例を示す図である。
このようにして、上記実施例2では、抽出装置1は、複数の検証ルールで共通する複数の抽出条件をグループ化した抽出グループに関するグループ情報、および、分布情報を参照する。抽出装置1は、検証ルールに含まれる抽出グループごとに算出される絞込み推定数に基づき、抽出グループおよび抽出グループに含まれない複数の抽出条件の適用順序を決定する。かかる構成によれば、抽出装置1は、グループ化した抽出グループの絞込み推定数の算出を一度だけ行えば、再利用することが可能となるので、各検証ルールにおける複数の抽出条件の適用順序の決定を、早期に行うことができる。また、抽出装置1は、グループ化した抽出グループについて、入力データ9からのXBRLデータの抽出処理を一度だけ行えば、再利用することが可能となるので、各検証ルールにおける入力データ9からのXBRLデータの抽出を、早期に行うことができる。
なお、抽出装置1は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置に、上記した制御部10と、記憶部20等の各機能を搭載することによって実現することができる。
9 入力データ
10 制御部
11 入力データ解析部
12,12A 抽出条件取得部
13,13A 絞込み推定部
14,14A 適用順序決定部
15 データ抽出部
20 記憶部
21 検証ルール
22 解析結果
31 組合せテーブル
41 ルール組合せ部
Claims (8)
- 複数のXBRLファイルを含む入力データより、前記複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う際に、前記複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を参照し、前記複数の抽出条件の適用順序を決定する、
処理をコンピュータに実行させる抽出プログラム。 - 前記適用順序は、出現頻度が最も低い値となる抽出条件を最初に適用するものであることを特徴とする請求項1に記載の抽出プログラム。
- 前記決定する処理は、複数の抽出処理で共通する複数の抽出条件をグループ化した抽出グループに関するグループ情報、および、前記分布情報を参照し、前記抽出処理に含まれる抽出グループごとに算出される分布推定値に基づき、前記抽出グループおよび前記抽出グループに含まれない前記複数の抽出条件の適用順序を決定する
ことを特徴とする請求項1に記載の抽出プログラム。 - 前記抽出グループが複数存在する場合には、前記適用順序を決定する際に用いられる抽出グループを、前記分布推定値に基づき決定する
ことを特徴とする請求項1に記載の抽出プログラム。 - 前記適用順序を決定する処理によって決定された適用順序に基づいて、前記抽出グループの複数の抽出条件および前記抽出グループに含まれない抽出条件を組み合わせた抽出処理を行い、
前記抽出グループの複数の抽出条件を用いて抽出された抽出結果を保存する
ことを特徴とする請求項3に記載の抽出プログラム。 - 前記複数のXBRLファイルの更新による前記分布情報の更新に応じて、前記抽出グループを決定する
ことを特徴とする請求項4に記載の抽出プログラム。 - 複数のXBRLファイルを含む入力データより、前記複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う際に、前記入力データより、前記複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を算出する算出部と、
前記算出部によって算出された分布情報を参照し、複数の抽出条件の適用順序を決定する決定部と、
を有することを特徴とする抽出装置。 - コンピュータが、
複数のXBRLファイルを含む入力データより、前記複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う際に、前記複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を参照し、前記複数の抽出条件の適用順序を決定する、
処理を実行する抽出方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/054877 WO2016132550A1 (ja) | 2015-02-20 | 2015-02-20 | 抽出プログラム、抽出装置および抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016132550A1 true JPWO2016132550A1 (ja) | 2017-11-24 |
JP6528841B2 JP6528841B2 (ja) | 2019-06-12 |
Family
ID=56689217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017500259A Expired - Fee Related JP6528841B2 (ja) | 2015-02-20 | 2015-02-20 | 抽出プログラム、抽出装置および抽出方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10497067B2 (ja) |
EP (1) | EP3261025A4 (ja) |
JP (1) | JP6528841B2 (ja) |
AU (1) | AU2015383376A1 (ja) |
WO (1) | WO2016132550A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11249710B2 (en) * | 2016-03-31 | 2022-02-15 | Splunk Inc. | Technology add-on control console |
CN107704544A (zh) * | 2017-09-25 | 2018-02-16 | 深圳易嘉恩科技有限公司 | 利用xbrl概念实现企业主数据建模的方法 |
EP3866050B1 (en) * | 2018-10-11 | 2023-07-26 | Fujitsu Limited | Conversion method, conversion apparatus, and conversion program |
EP3979177A4 (en) * | 2019-05-31 | 2022-06-15 | Fujitsu Limited | VERIFICATION PROCESS, INFORMATION PROCESSING SYSTEM AND VERIFICATION PROGRAM |
CN113868301B (zh) * | 2021-12-02 | 2022-06-07 | 昆仑智汇数据科技(北京)有限公司 | 一种工业设备数据抽取的方法、装置及设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240530A (ja) * | 1985-08-17 | 1987-02-21 | Fujitsu Ltd | デ−タ抽出処理方式 |
JPH0352068A (ja) * | 1989-07-20 | 1991-03-06 | Nec Corp | 論理演算方式 |
JPH10105560A (ja) * | 1996-09-26 | 1998-04-24 | Nec Corp | データベース検索方法およびその装置 |
JP2006163876A (ja) * | 2004-12-08 | 2006-06-22 | Hitachi Ltd | Xbrlデータ保存方法およびシステム |
JP2008299797A (ja) * | 2007-06-04 | 2008-12-11 | Toshiba Corp | データベースシステム、データベースシステムにおけるデータベース検索方法及びデータベースシステムに用いられるコンピュータプログラム |
JP2010146109A (ja) * | 2008-12-16 | 2010-07-01 | Internet Disclosure Co Ltd | Xbrlデータ検証/作成システム及びxbrlデータ検証/作成プログラム |
JP2013003981A (ja) * | 2011-06-20 | 2013-01-07 | Fujitsu Ltd | 時系列ルール抽出装置、時系列ルール抽出方法及び時系列ルール抽出プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4024727B2 (ja) | 2003-07-28 | 2007-12-19 | 株式会社日立製作所 | 眠気検出装置 |
US8266188B2 (en) * | 2005-03-08 | 2012-09-11 | Ca, Inc. | Method and system for extracting structural information from a data file |
US8875013B2 (en) * | 2008-03-25 | 2014-10-28 | International Business Machines Corporation | Multi-pass validation of extensible markup language (XML) documents |
KR101384405B1 (ko) | 2010-01-19 | 2014-04-10 | 후지쯔 가부시끼가이샤 | 해석 방법, 해석 장치 및 해석 프로그램 |
US8660976B2 (en) * | 2010-01-20 | 2014-02-25 | Microsoft Corporation | Web content rewriting, including responses |
US9430515B2 (en) * | 2013-12-06 | 2016-08-30 | General Electric Company | Data validation using schema definition |
-
2015
- 2015-02-20 JP JP2017500259A patent/JP6528841B2/ja not_active Expired - Fee Related
- 2015-02-20 EP EP15882652.9A patent/EP3261025A4/en not_active Withdrawn
- 2015-02-20 WO PCT/JP2015/054877 patent/WO2016132550A1/ja active Application Filing
- 2015-02-20 AU AU2015383376A patent/AU2015383376A1/en not_active Abandoned
-
2017
- 2017-08-18 US US15/680,771 patent/US10497067B2/en not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240530A (ja) * | 1985-08-17 | 1987-02-21 | Fujitsu Ltd | デ−タ抽出処理方式 |
JPH0352068A (ja) * | 1989-07-20 | 1991-03-06 | Nec Corp | 論理演算方式 |
JPH10105560A (ja) * | 1996-09-26 | 1998-04-24 | Nec Corp | データベース検索方法およびその装置 |
JP2006163876A (ja) * | 2004-12-08 | 2006-06-22 | Hitachi Ltd | Xbrlデータ保存方法およびシステム |
JP2008299797A (ja) * | 2007-06-04 | 2008-12-11 | Toshiba Corp | データベースシステム、データベースシステムにおけるデータベース検索方法及びデータベースシステムに用いられるコンピュータプログラム |
JP2010146109A (ja) * | 2008-12-16 | 2010-07-01 | Internet Disclosure Co Ltd | Xbrlデータ検証/作成システム及びxbrlデータ検証/作成プログラム |
JP2013003981A (ja) * | 2011-06-20 | 2013-01-07 | Fujitsu Ltd | 時系列ルール抽出装置、時系列ルール抽出方法及び時系列ルール抽出プログラム |
Also Published As
Publication number | Publication date |
---|---|
US10497067B2 (en) | 2019-12-03 |
JP6528841B2 (ja) | 2019-06-12 |
US20170345102A1 (en) | 2017-11-30 |
WO2016132550A1 (ja) | 2016-08-25 |
AU2015383376A1 (en) | 2017-09-07 |
EP3261025A1 (en) | 2017-12-27 |
EP3261025A4 (en) | 2018-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2016132550A1 (ja) | 抽出プログラム、抽出装置および抽出方法 | |
US8224845B2 (en) | Transaction prediction modeling method | |
JP4839424B2 (ja) | プログラムの解析を支援するための方法、並びにそのコンピュータ・プログラム及びコンピュータ・システム | |
US20190012257A1 (en) | Model integration tool | |
JP2016522475A (ja) | 複数ヴァージョンをテストするための方法及びデバイス | |
Trummer et al. | Multi-objective quality-driven service selection—A fully polynomial time approximation scheme | |
JP7478318B2 (ja) | フレキシブル・パイプライン生成のための方法及びシステム | |
CN106599623B (zh) | 一种应用相似度计算方法及装置 | |
US20200050669A1 (en) | Dialog apparatus, dialog system, and computer-readable recording medium | |
JP6973197B2 (ja) | データセット検証装置、データセット検証方法、およびデータセット検証プログラム | |
JP6900956B2 (ja) | 検証プログラム、検証装置、検証方法、インデックス生成プログラム、インデックス生成装置およびインデックス生成方法 | |
JP7448039B2 (ja) | ルール更新プログラム、ルール更新方法及びルール更新装置 | |
US8775873B2 (en) | Data processing apparatus that performs test validation and computer-readable storage medium | |
JPWO2019138584A1 (ja) | 分類木生成方法、分類木生成装置および分類木生成プログラム | |
JP6422346B2 (ja) | プログラム生成装置、及び、プログラム生成方法 | |
JPWO2017199309A1 (ja) | 評価プログラム、評価装置および評価方法 | |
US20190244151A1 (en) | Just in time compilation (jit) for business process execution | |
JP2018156207A (ja) | コーディング規約生成プログラム、情報処理装置およびコーディング規約生成方法 | |
JP6954347B2 (ja) | 実験計画最適化装置、実験計画最適化方法および実験計画最適化プログラム | |
JPWO2020240873A1 (ja) | 検証方法、情報処理装置及び検証プログラム | |
JP6710716B2 (ja) | 脅威情報評価装置、脅威情報評価方法およびプログラム | |
JP6563549B1 (ja) | データ傾向分析方法、データ傾向分析システム及び絞り込み及び復元装置 | |
Jakobs | Automatic Test-Case Generation with CoVeriTest | |
JP6354501B2 (ja) | 比較プログラム、比較方法および情報処理装置 | |
Stricker et al. | Solving multi-criteria problems under risk: an approach explained using the example of rescheduling in dynamic environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170908 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190429 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6528841 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |