JP6528841B2 - 抽出プログラム、抽出装置および抽出方法 - Google Patents
抽出プログラム、抽出装置および抽出方法 Download PDFInfo
- Publication number
- JP6528841B2 JP6528841B2 JP2017500259A JP2017500259A JP6528841B2 JP 6528841 B2 JP6528841 B2 JP 6528841B2 JP 2017500259 A JP2017500259 A JP 2017500259A JP 2017500259 A JP2017500259 A JP 2017500259A JP 6528841 B2 JP6528841 B2 JP 6528841B2
- Authority
- JP
- Japan
- Prior art keywords
- extraction
- rule
- extraction condition
- narrowing
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000605 extraction Methods 0.000 title claims description 706
- 238000012795 verification Methods 0.000 claims description 180
- 238000000034 method Methods 0.000 claims description 47
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000003068 static effect Effects 0.000 description 139
- 238000004458 analytical method Methods 0.000 description 54
- 238000010586 diagram Methods 0.000 description 38
- 238000013075 data extraction Methods 0.000 description 35
- 239000000284 extract Substances 0.000 description 26
- 238000007405 data analysis Methods 0.000 description 22
- 230000000694 effects Effects 0.000 description 10
- 238000012550 audit Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Debugging And Monitoring (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Description
図1は、実施例1に係る抽出装置の構成を示す機能ブロック図である。実施例1に係る抽出装置は、入力データ9に含まれる複数のXBRLデータより、検証ルールに指定される抽出条件を用いて、検証の対象となるデータ項目を有するXBRLデータを抽出する。この抽出されたXBRLデータが検証ルールを用いて検証される。
次に、実施例1に係る抽出処理の手順について、図8を参照して説明する。図8は、実施例1に係る抽出処理のフローチャートの一例を示す図である。なお、抽出条件解析結果は、入力データ9を受け取る前に、記憶部20に記憶されているものとする。
次に、実施例1に係る適用順序決定処理の手順について、図9を参照して説明する。図9は、実施例1に係る適用順序決定処理のフローチャートの一例を示す図である。
上記実施例1によれば、抽出装置1は、複数のXBRLデータを含む入力データ9より、複数のXBRLデータそれぞれの要素およびアスペクトを直接指定する複数の抽出条件を組み合わせた抽出処理を行う。この際、抽出装置1は、複数のXBRLデータそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を参照し、複数の抽出条件の適用順序を決定する。かかる構成によれば、抽出装置1は、入力データ9から検証の対象となる要素を有するXBRLデータを高速に抽出することができる。
図10は、実施例2に係る抽出装置の構成を示す機能ブロック図である。なお、図1に示す抽出装置と同一の構成については同一符号を示すことで、その重複する構成および動作の説明については省略する。実施例1と実施例2とが異なるところは、ルール組合せ部41および組合せテーブル31を追加した点にある。実施例1と実施例2とが異なるところは、抽出条件取得部12A、絞込み推定部13A、適用順序決定部14Aおよびデータ抽出部15Aを変更した点にある。
次に、実施例2に係る抽出処理の手順について、図16を参照して説明する。図16は、実施例2に係る抽出処理のフローチャートの一例を示す図である。なお、ルール組合せ部41によって組合せテーブル31が作成されたものとする。また、抽出条件解析結果は、入力データ9を受け取る前に、記憶部20に記憶されているものとする。
次に、実施例2に係る適用順序決定処理の手順について、図17を参照して説明する。図17は、実施例2に係る適用順序決定処理のフローチャートの一例を示す図である。
このようにして、上記実施例2では、抽出装置1は、複数の検証ルールで共通する複数の抽出条件をグループ化した抽出グループに関するグループ情報、および、分布情報を参照する。抽出装置1は、検証ルールに含まれる抽出グループごとに算出される絞込み推定数に基づき、抽出グループおよび抽出グループに含まれない複数の抽出条件の適用順序を決定する。かかる構成によれば、抽出装置1は、グループ化した抽出グループの絞込み推定数の算出を一度だけ行えば、再利用することが可能となるので、各検証ルールにおける複数の抽出条件の適用順序の決定を、早期に行うことができる。また、抽出装置1は、グループ化した抽出グループについて、入力データ9からのXBRLデータの抽出処理を一度だけ行えば、再利用することが可能となるので、各検証ルールにおける入力データ9からのXBRLデータの抽出を、早期に行うことができる。
なお、抽出装置1は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置に、上記した制御部10と、記憶部20等の各機能を搭載することによって実現することができる。
9 入力データ
10 制御部
11 入力データ解析部
12,12A 抽出条件取得部
13,13A 絞込み推定部
14,14A 適用順序決定部
15 データ抽出部
20 記憶部
21 検証ルール
22 解析結果
31 組合せテーブル
41 ルール組合せ部
Claims (6)
- 複数のXBRLファイルに関する入力データより、前記複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件からそれぞれ構成される、複数の検証対象ルールを受け付け、
前記複数の検証対象ルールにそれぞれ含まれる抽出条件に基づいて、共通する複数の抽出条件を有する複数の検証対象ルールを組み合わせ、
前記複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報と、前記複数の検証対象ルールの組み合わせに関する組合せ情報とを参照し、前記複数の検証対象ルールに基づく抽出処理の処理順序を決定する、
処理をコンピュータに実行させる抽出プログラム。 - 前記決定する処理は、前記複数の検証対象ルールのいずれかで共通して含まれる共通抽出条件について算出される分布推定値と、前記複数の検証対象ルール間で共通しない抽出条件の分布推定値に基づき、前記共通抽出条件および前記個別抽出条件の処理順序を決定する
ことを特徴とする請求項1に記載の抽出プログラム。 - 前記処理順序を決定する処理によって決定された処理順序に基づいて、前記共通抽出条件および前記個別抽出条件を組み合わせた抽出処理を行い、
該抽出された抽出結果を保存する
ことを特徴とする請求項2に記載の抽出プログラム。 - 前記複数のXBRLファイルの更新による前記分布情報の更新に応じて、前記共通抽出条件および前記個別抽出条件を決定する
ことを特徴とする請求項2に記載の抽出プログラム。 - 複数のXBRLファイルに関する入力データより、前記複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件からそれぞれ構成される、複数の検証対象ルールを受け付け、
前記複数の検証対象ルールにそれぞれ含まれる抽出条件に基づいて、共通する複数の抽出条件を有する複数の検証対象ルールを組み合わせ、
前記入力データより、前記複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報を算出する算出部と、
前記算出部によって算出された分布情報と、前記複数の検証対象ルールの組み合わせに関する組合せ情報とを参照し、前記複数の検証対象ルールに基づく抽出処理の処理順序を決定する決定部と、
を有することを特徴とする抽出装置。 - コンピュータが、
複数のXBRLファイルに関する入力データより、前記複数のXBRLファイルそれぞれの要素およびアスペクトを直接指定する複数の抽出条件からそれぞれ構成される、複数の検証対象ルールを受け付け、
前記複数の検証対象ルールにそれぞれ含まれる抽出条件に基づいて、共通する複数の抽出条件を有する複数の検証対象ルールを組み合わせ、
前記複数のXBRLファイルそれぞれで規定された複数の要素の、アスペクトごとの値の分布を含む分布情報と、前記複数の検証対象ルールの組み合わせに関する組合せ情報とを参照し、前記複数の検証対象ルールに基づく抽出処理の処理順序を決定する、
処理を実行する抽出方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/054877 WO2016132550A1 (ja) | 2015-02-20 | 2015-02-20 | 抽出プログラム、抽出装置および抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016132550A1 JPWO2016132550A1 (ja) | 2017-11-24 |
JP6528841B2 true JP6528841B2 (ja) | 2019-06-12 |
Family
ID=56689217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017500259A Expired - Fee Related JP6528841B2 (ja) | 2015-02-20 | 2015-02-20 | 抽出プログラム、抽出装置および抽出方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10497067B2 (ja) |
EP (1) | EP3261025A4 (ja) |
JP (1) | JP6528841B2 (ja) |
AU (1) | AU2015383376A1 (ja) |
WO (1) | WO2016132550A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11249710B2 (en) * | 2016-03-31 | 2022-02-15 | Splunk Inc. | Technology add-on control console |
CN107704544A (zh) * | 2017-09-25 | 2018-02-16 | 深圳易嘉恩科技有限公司 | 利用xbrl概念实现企业主数据建模的方法 |
EP3866050B1 (en) | 2018-10-11 | 2023-07-26 | Fujitsu Limited | Conversion method, conversion apparatus, and conversion program |
EP3979177A4 (en) * | 2019-05-31 | 2022-06-15 | Fujitsu Limited | VERIFICATION PROCESS, INFORMATION PROCESSING SYSTEM AND VERIFICATION PROGRAM |
CN113868301B (zh) * | 2021-12-02 | 2022-06-07 | 昆仑智汇数据科技(北京)有限公司 | 一种工业设备数据抽取的方法、装置及设备 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240530A (ja) * | 1985-08-17 | 1987-02-21 | Fujitsu Ltd | デ−タ抽出処理方式 |
JPH0352068A (ja) * | 1989-07-20 | 1991-03-06 | Nec Corp | 論理演算方式 |
JP2842413B2 (ja) * | 1996-09-26 | 1999-01-06 | 日本電気株式会社 | データベース検索方法およびその装置 |
JP4024727B2 (ja) | 2003-07-28 | 2007-12-19 | 株式会社日立製作所 | 眠気検出装置 |
JP4351143B2 (ja) * | 2004-12-08 | 2009-10-28 | 株式会社日立製作所 | Xbrlデータ保存方法およびシステム |
US8266188B2 (en) * | 2005-03-08 | 2012-09-11 | Ca, Inc. | Method and system for extracting structural information from a data file |
JP2008299797A (ja) * | 2007-06-04 | 2008-12-11 | Toshiba Corp | データベースシステム、データベースシステムにおけるデータベース検索方法及びデータベースシステムに用いられるコンピュータプログラム |
US8875013B2 (en) * | 2008-03-25 | 2014-10-28 | International Business Machines Corporation | Multi-pass validation of extensible markup language (XML) documents |
JP2010146109A (ja) * | 2008-12-16 | 2010-07-01 | Internet Disclosure Co Ltd | Xbrlデータ検証/作成システム及びxbrlデータ検証/作成プログラム |
WO2011089683A1 (ja) | 2010-01-19 | 2011-07-28 | 富士通株式会社 | 解析方法、解析装置及び解析プログラム |
US8660976B2 (en) * | 2010-01-20 | 2014-02-25 | Microsoft Corporation | Web content rewriting, including responses |
JP5817241B2 (ja) * | 2011-06-20 | 2015-11-18 | 富士通株式会社 | 時系列ルール抽出装置、時系列ルール抽出方法及び時系列ルール抽出プログラム |
US9430515B2 (en) * | 2013-12-06 | 2016-08-30 | General Electric Company | Data validation using schema definition |
-
2015
- 2015-02-20 JP JP2017500259A patent/JP6528841B2/ja not_active Expired - Fee Related
- 2015-02-20 EP EP15882652.9A patent/EP3261025A4/en not_active Withdrawn
- 2015-02-20 WO PCT/JP2015/054877 patent/WO2016132550A1/ja active Application Filing
- 2015-02-20 AU AU2015383376A patent/AU2015383376A1/en not_active Abandoned
-
2017
- 2017-08-18 US US15/680,771 patent/US10497067B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20170345102A1 (en) | 2017-11-30 |
US10497067B2 (en) | 2019-12-03 |
EP3261025A4 (en) | 2018-08-22 |
EP3261025A1 (en) | 2017-12-27 |
JPWO2016132550A1 (ja) | 2017-11-24 |
WO2016132550A1 (ja) | 2016-08-25 |
AU2015383376A1 (en) | 2017-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6528841B2 (ja) | 抽出プログラム、抽出装置および抽出方法 | |
AU2016304571B2 (en) | Model integration tool | |
US8224845B2 (en) | Transaction prediction modeling method | |
US8219573B2 (en) | Test case generation apparatus, generation method therefor, and program storage medium | |
JP2016522475A (ja) | 複数ヴァージョンをテストするための方法及びデバイス | |
US7299439B1 (en) | Assignment of I/O objects with multiple I/O standards to virtual I/O banks using integer linear programming | |
CN105117621A (zh) | 代码混淆的控制流平展化 | |
US9141514B1 (en) | System, method, and computer program for automatically comparing a plurality of software testing environments | |
KR20180083927A (ko) | 데이터 쿼리 방법 및 장치, 및 데이터베이스 시스템 | |
Gounaris | Towards automated performance optimization of BPMN business processes | |
CN106599623B (zh) | 一种应用相似度计算方法及装置 | |
US20160004583A1 (en) | System for project management from non-function evaluation, method for project management from non-function evaluation, and program for project management from non-function evaluation | |
JP2019159538A (ja) | データセット検証装置、データセット検証方法、およびデータセット検証プログラム | |
US8036921B2 (en) | System and method for optimization process repeatability in an on-demand computing environment | |
JP7448039B2 (ja) | ルール更新プログラム、ルール更新方法及びルール更新装置 | |
US8775873B2 (en) | Data processing apparatus that performs test validation and computer-readable storage medium | |
JPWO2018096686A1 (ja) | 検証プログラム、検証装置、検証方法、インデックス生成プログラム、インデックス生成装置およびインデックス生成方法 | |
JP6422346B2 (ja) | プログラム生成装置、及び、プログラム生成方法 | |
WO2017199309A1 (ja) | 評価プログラム、評価装置および評価方法 | |
Urbanek et al. | Using analytical programming and UCP method for effort estimation | |
WO2020240873A1 (ja) | 検証方法、情報処理装置及び検証プログラム | |
JP2018156207A (ja) | コーディング規約生成プログラム、情報処理装置およびコーディング規約生成方法 | |
JP6354501B2 (ja) | 比較プログラム、比較方法および情報処理装置 | |
JP6710716B2 (ja) | 脅威情報評価装置、脅威情報評価方法およびプログラム | |
Antunes et al. | Shiny app to predict agricultural tire dimensions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170908 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190429 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6528841 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |