JP7015319B2 - データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム - Google Patents
データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム Download PDFInfo
- Publication number
- JP7015319B2 JP7015319B2 JP2019560025A JP2019560025A JP7015319B2 JP 7015319 B2 JP7015319 B2 JP 7015319B2 JP 2019560025 A JP2019560025 A JP 2019560025A JP 2019560025 A JP2019560025 A JP 2019560025A JP 7015319 B2 JP7015319 B2 JP 7015319B2
- Authority
- JP
- Japan
- Prior art keywords
- schema
- analysis
- analysis process
- data type
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
Description
ことを特徴とする。
図1は、本発明によるデータ分析支援装置の第1の実施形態の構成例を示すブロック図である。本実施形態のデータ分析支援装置100は、スキーマ付テーブル入力部10と、スキーマ抽出部20と、テーブル・スキーマ管理データベース30(以下、テーブル・スキーマ管理DB30と記す。)と、分析プロセス受付部40と、スキーマ・分析プロセス管理データベース50(以下、スキーマ・分析プロセス管理DB50と記す。)と、探索部60と、分析プロセス実行部70とを備えている。
次に、本発明によるデータ分析支援装置の第2の実施形態を説明する。第1の実施形態では、スキーマ抽出部20が、カラムの名称およびデータ型が一致するスキーマが登録されていないときに、抽出されたスキーマをテーブル・スキーマ管理DB30に登録する場合について説明した。
20 スキーマ抽出部
21 分析スキーマ抽出部
30 テーブル・スキーマ管理DB
31 テーブル・分析スキーマ管理DB
40 分析プロセス受付部
50 スキーマ・分析プロセス管理DB
51 分析スキーマ・分析プロセス管理DB
60 探索部
61 分析プロセス探索部
62 テーブル探索部
70 分析プロセス実行部
99 スキーマ管理装置
100,200 データ分析支援装置
Claims (11)
- テーブルに適用されるスキーマで定義されているカラム名を用いた、データ分析のための一連の処理である分析プロセスの作成を受け付ける分析プロセス受付部と、
受け付けた分析プロセスと、当該分析プロセスを適用可能なスキーマとを関連付けた情報を記憶するスキーマ・分析プロセス記憶部と、
テーブルの選択をユーザから受け付けると、テーブルと当該テーブルに適用されるスキーマとを関連付けた情報を記憶するテーブル・スキーマ記憶部が記憶する当該情報、および、前記スキーマ・分析プロセス記憶部が記憶する情報に基づいて、受け付けたテーブルに対して適用可能な前記分析プロセスを特定し、特定された分析プロセスの一覧を出力する分析プロセス探索部と、
出力された一覧から前記分析プロセスの選択を受け付け、受け付けたテーブルに対して選択された分析プロセスを実行する分析プロセス実行部とを備えた
ことを特徴とするデータ分析支援装置。 - スキーマに含まれるカラムのデータ型を、分析処理に用いられるデータ型として定義された分析データ型へ変換するデータ型変換部を備え、
前記分析データ型は、少なくとも同値判定が可能なデータ型を表すカテゴリ変数、および、数値変数を含み、
前記データ型変換部は、テーブル・スキーマ記憶部に、分析データ型で定義されるスキーマとテーブルとを関連付けた情報を登録し、
分析プロセス受付部は、スキーマ・分析プロセス記憶部に、分析プロセスと、分析データ型で定義されるスキーマとを関連付けた情報を登録する
請求項1記載のデータ分析支援装置。 - データ型変換部は、データ型またはカラム名に応じた分析データ型への変換ルールに応じて、抽出したスキーマに含まれるデータ型を分析データ型に一括で変換する
請求項2記載のデータ分析支援装置。 - データ型変換部は、スキーマのカラムごとに分析データ型への変換指示を受け付け、抽出したスキーマに含まれるデータ型を受け付けた分析データ型に個別に変換する
請求項2または請求項3記載のデータ分析支援装置。 - 分析データ型は、カテゴリ変数、数値変数、および、順序関係を有する時間軸上の一点を示すデータ型を表す時間変数を含む
請求項2から請求項4のうちのいずれか1項に記載のデータ分析支援装置。 - データ分析方法を実行するためのシステムであって、
実行可能な命令が記憶されたメモリと、
命令を実行するプロセッサとを備え、前記プロセッサはシステムに、
テーブルに適用されるスキーマで定義されているカラム名を用いた、データ分析のための一連の処理である分析プロセスの作成を受け付けさせ、
受け付けた分析プロセスと、当該分析プロセスを適用可能なスキーマとを関連付けた情報を、前記メモリに登録させ、
テーブルと当該テーブルに適用されるスキーマとを関連付けた前記メモリ内の情報、および、ユーザから受け付けたテーブルの選択に基づいて、受け付けたテーブルに対して適用可能な分析プロセスを特定させ、
特定された分析プロセスの一覧を出力させ、
出力された一覧から前記分析プロセスの選択を受け付けさせ、
受け付けたテーブルに対して選択された分析プロセスを実行させる
よう構成されていることを特徴とするシステム。 - 前記プロセッサは、さらに、
スキーマに含まれるカラムのデータ型を、分析処理に用いられるデータ型として定義された分析データ型へ変換し、
前記分析データ型は、少なくとも同値判定が可能なデータ型を表すカテゴリ変数、および、数値変数を含み、
前記メモリに、分析データ型で定義されるスキーマとテーブルとを関連付けた情報を登録し、
前記メモリに、分析プロセスと、分析データ型で定義されるスキーマとを関連付けた情報を登録する
よう構成されている請求項6記載のシステム。 - コンピュータに、
テーブルに適用されるスキーマで定義されているカラム名を用いた、データ分析のための一連の処理である分析プロセスの作成を受け付け、受け付けた分析プロセスと当該分析プロセスを適用可能なスキーマとを関連付けた情報をスキーマ・分析プロセス記憶部に登録する分析プロセス受付処理、
テーブルの選択をユーザから受け付けると、テーブルと当該テーブルに適用されるスキーマとを関連付けた情報を記憶するテーブル・スキーマ記憶部が記憶する当該情報、および、前記スキーマ・分析プロセス記憶部が記憶する情報に基づいて、受け付けたテーブルに対して適用可能な前記分析プロセスを特定し、特定された分析プロセスの一覧を出力する分析プロセス探索処理、および、
出力された一覧から前記分析プロセスの選択を受け付け、受け付けたテーブルに対して選択された分析プロセスを実行する分析プロセス実行処理
を実行させるためのデータ分析支援プログラム。 - コンピュータに、
スキーマに含まれるカラムのデータ型を、分析処理に用いられるデータ型として定義された分析データ型へ変換するデータ型変換処理を実行させ、
前記分析データ型は、少なくとも同値判定が可能なデータ型を表すカテゴリ変数、および、数値変数を含み、
前記データ型変換処理で、テーブル・スキーマ記憶部に、分析データ型で定義されるスキーマとテーブルとを関連付けた情報を登録させ、
分析プロセス受付処理で、スキーマ・分析プロセス記憶部に、分析プロセスと、分析データ型で定義されるスキーマとを関連付けた情報を登録させる
請求項8記載のデータ分析支援プログラム。 - 実行可能な命令を含むメモリ及び命令を実行するよう構成されたプロセッサを含むシステム上で実行される、コンピュータによって実施される方法であって、
テーブルに適用されるスキーマで定義されているカラム名を用いた、データ分析のための一連の処理である分析プロセスを受け付けること、
受け付けた分析プロセスと、当該分析プロセスを適用可能なスキーマとを関連付けた情報を登録すること、
テーブルと当該テーブルに適用されるスキーマとを関連付けた情報、および、ユーザから受け付けたテーブルの選択に基づいて、受け付けたテーブルに対して適用可能な分析プロセスを特定すること、
特定された分析プロセスの一覧を出力すること、
出力された一覧から前記分析プロセスの選択を受け付けること、
受け付けたテーブルに対して選択された分析プロセスを実行すること
を含むことを特徴とする方法。 - 請求項10に記載の、コンピュータによって実施される方法であって、さらに、
スキーマに含まれるカラムのデータ型を、分析処理に用いられるデータ型として定義された分析データ型へ変換すること、
前記分析データ型は、少なくとも同値判定が可能なデータ型を表すカテゴリ変数、および、数値変数を含み、
前記メモリに、分析データ型で定義されるスキーマとテーブルとを関連付けた情報を登録すること、
前記メモリに、分析プロセスと、分析データ型で定義されるスキーマとを関連付けた情報を登録すること
を含む方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762609768P | 2017-12-22 | 2017-12-22 | |
US62/609,768 | 2017-12-22 | ||
PCT/JP2018/028082 WO2019123703A1 (ja) | 2017-12-22 | 2018-07-26 | データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019123703A1 JPWO2019123703A1 (ja) | 2020-12-03 |
JP7015319B2 true JP7015319B2 (ja) | 2022-02-02 |
Family
ID=66992572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019560025A Active JP7015319B2 (ja) | 2017-12-22 | 2018-07-26 | データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210342341A1 (ja) |
JP (1) | JP7015319B2 (ja) |
WO (1) | WO2019123703A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018180970A1 (ja) | 2017-03-30 | 2018-10-04 | 日本電気株式会社 | 情報処理システム、特徴量説明方法および特徴量説明プログラム |
JPWO2019069507A1 (ja) | 2017-10-05 | 2020-11-05 | ドットデータ インコーポレイテッド | 特徴量生成装置、特徴量生成方法および特徴量生成プログラム |
US11803798B2 (en) | 2019-04-18 | 2023-10-31 | Oracle International Corporation | System and method for automatic generation of extract, transform, load (ETL) asserts |
US20210049183A1 (en) * | 2019-04-18 | 2021-02-18 | Oracle International Corporation | System and method for ranking of database tables for use with extract, transform, load processes |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020147599A1 (en) | 2001-04-05 | 2002-10-10 | International Business Machines Corporation | Method and system for simplifying the use of data mining in domain-specific analytic applications by packaging predefined data mining models |
US20050102303A1 (en) | 2003-11-12 | 2005-05-12 | International Business Machines Corporation | Computer-implemented method, system and program product for mapping a user data schema to a mining model schema |
JP2011257812A (ja) | 2010-06-04 | 2011-12-22 | Fujitsu Ltd | スキーマ定義生成装置、スキーマ定義生成方法およびスキーマ定義生成プログラム |
-
2018
- 2018-07-26 JP JP2019560025A patent/JP7015319B2/ja active Active
- 2018-07-26 WO PCT/JP2018/028082 patent/WO2019123703A1/ja active Application Filing
- 2018-07-26 US US16/956,531 patent/US20210342341A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020147599A1 (en) | 2001-04-05 | 2002-10-10 | International Business Machines Corporation | Method and system for simplifying the use of data mining in domain-specific analytic applications by packaging predefined data mining models |
US20050102303A1 (en) | 2003-11-12 | 2005-05-12 | International Business Machines Corporation | Computer-implemented method, system and program product for mapping a user data schema to a mining model schema |
JP2011257812A (ja) | 2010-06-04 | 2011-12-22 | Fujitsu Ltd | スキーマ定義生成装置、スキーマ定義生成方法およびスキーマ定義生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20210342341A1 (en) | 2021-11-04 |
WO2019123703A1 (ja) | 2019-06-27 |
JPWO2019123703A1 (ja) | 2020-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7015319B2 (ja) | データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム | |
US8983895B2 (en) | Representation of multiplicities for Docflow reporting | |
US20190251471A1 (en) | Machine learning device | |
US20200387664A1 (en) | Information processing system, feature description method and feature description program | |
US9892187B2 (en) | Data analysis method, data analysis device, and storage medium storing processing program for same | |
US20160004757A1 (en) | Data management method, data management device and storage medium | |
US20130080584A1 (en) | Predictive field linking for data integration pipelines | |
JP7015320B2 (ja) | データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム | |
US20170091082A1 (en) | Test db data generation apparatus | |
US11010393B2 (en) | Library search apparatus, library search system, and library search method | |
KR102243794B1 (ko) | 데이터 통합 장치 및 데이터 통합 방법 | |
US10545984B2 (en) | Abstract default column type in tables | |
US10417234B2 (en) | Data flow modeling and execution | |
US20160004968A1 (en) | Correlation rule analysis apparatus and correlation rule analysis method | |
JP4992301B2 (ja) | 検索処理方法及び装置 | |
US11250002B2 (en) | Result set output criteria | |
CN111061733A (zh) | 数据处理方法、装置、电子设备和计算机可读存储介质 | |
EP2892018A1 (en) | Automated compilation of graph input for the hipergraph solver | |
JP6646699B2 (ja) | 検索装置及び検索方法 | |
CN109542986B (zh) | 网络数据的要素归一化方法、装置、设备及存储介质 | |
WO2016013157A1 (ja) | テキスト処理システム、テキスト処理方法およびテキスト処理プログラム | |
CN111581363A (zh) | 知识抽取方法、装置、设备及存储介质 | |
JP2020166443A (ja) | データ加工方法レコメンドシステム、データ加工方法レコメンド方法、及びデータ加工方法レコメンドプログラム | |
US10642876B1 (en) | Query processing pipeline for semi-structured and unstructured data | |
CN108920602B (zh) | 用于输出信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210714 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20211014 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220121 |