JP2003216618A - Data analysis device - Google Patents

Data analysis device

Info

Publication number
JP2003216618A
JP2003216618A JP2002012606A JP2002012606A JP2003216618A JP 2003216618 A JP2003216618 A JP 2003216618A JP 2002012606 A JP2002012606 A JP 2002012606A JP 2002012606 A JP2002012606 A JP 2002012606A JP 2003216618 A JP2003216618 A JP 2003216618A
Authority
JP
Japan
Prior art keywords
data
database
data table
search
tables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002012606A
Other languages
Japanese (ja)
Inventor
Kiyoshi Wajima
潔 和嶋
Kazuo Hayashi
一雄 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP2002012606A priority Critical patent/JP2003216618A/en
Publication of JP2003216618A publication Critical patent/JP2003216618A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To achieve efficient data analysis by avoiding troublesome manual operations which must be done to edit a data table again when performing data analysis as to correlation among retrieval data from different databases. <P>SOLUTION: A data analysis device, which connects to a database server connected to a network to analyze the retrieval data from the databases, includes a database access control means for controlling access to the server; a retrieval data display means for displaying the data table obtained from each server; a data table creating means for creating a new data table by evaluating the data values of data items between the displayed data tables according to designated conditions to connect together a plurality of data tables; and a data table file preserving means for preserving the created data table in a file. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は、ネットワークで接
続されたデータベース中の各種データを結び付けた解析
を行うデータ解析ソフトウエアツールに用いて好適なデ
ータ解析装置に関するものである。 【0002】 【従来の技術】一般にデータベースは、ネットワークに
接続されて使用されている。これは、データベースのユ
ーザーがネットワークを介して、容易にデータの更新、
検索を可能とするためである。これにより、データベー
スの所在、個数にかかわらす、必要な時にデータアクセ
スでき、データベースへのアクセス権限さえあれば、ど
こからでもデータベースを使用することが容易に可能と
なる。 【0003】最も現在利用されているリレーショナルデ
ータベースでは、データベース中のデータは、データ間
の関連を持つ単位(以下テーブルと称す)で管理されて
いる。テーブルは、さらに複数のレコードからなる。レ
コードは、複数のデータ項目のデータからなる最小のデ
ータ関連を示す単位である。1つあるいは、複数のデー
タ項目でデータ検索を行った場合、該当データに関連し
た他のデータ項目のデータも同時に検索結果として得る
ことができる。1つのデータベース内では、上記のよう
にデータ項目間の関連は、整理されており、データの重
複や更新が矛盾なく管理されている。そのため、1つの
データベースから得られた検索結果のデータ群を解析す
る際には、Excel(Microsoft社製)、1
−2−3(Lotus社製)、などの表計算ソフトウエ
アを用いてグラフ作成、統計計算などが容易に可能であ
る。なお、その際には、検索結果を一度ファイルに保存
し、個別にこれらソフト起動後、それらファイルを読み
込んで解析を行う、あるいは、各表計算ソフトウエアと
データベースのインターフェースプログラムを作成し、
検索結果を直接メモリ上でこれらソフトに引き渡して解
析を行う、などが必要である。 【0004】単なるデータベースからの検索結果データ
を得る場合は、上述の1つのデータベースからのデータ
を得る場合とほとんど同様である。つまり、検索結果の
データをファイル保存あるいは、表計算ソフトにデータ
を引き渡すこととなる。しかしながら、異なるデータベ
ースのデータテーブル間では、データ項目の関連が統一
的に管理されていないので、それらから個別に得られた
検索データテーブル間でのデータ項目の相関などを解析
する際に、関連があると思われるデータ項目を介してデ
ータテーブルを結合する必要がある。 【0005】この場合、データ項目の関連は、属性が一
致している、あるいは、データ解析者が相関があると認
識している、相関を推定している、などを意味する。そ
のため、関連データ項目で各データ値が一致するとは限
らない。また、データの並びが異なる、データ値に重複
が存在する、などの問題が発生し、容易にデータテーブ
ルの結合ができない。したがって、表計算ソフトウエア
で解析を行う前に、上記のデータ値の重複を確認するこ
とやデータ項目間の関連を定義することなどのデータの
再編集を個別にファイルを表計算ソフトに読み込んだ後
にユーザーの手作業によって行う必要がある。 【0006】 【発明が解決しようとする課題】上記のようなネットワ
ーク下で複数のデータベースを利用してデータ解析を実
行する際に、異なるデータベースの検索データのデータ
項目を関連付けて解析する場合、個々の検索データ保存
ファイルを読み出し、ファイル間の特定データ項目を関
連付けて新たなデータテーブルを作成するためにプログ
ラムを個別に作成する、あるいは、手作業により編集を
行う、などの必要があり、非常に煩雑な作業を必要とす
るという問題がある。したがって、本発明は、異なるデ
ータベース(同一のデータベースでも良い)の複数のデ
ータテーブルを、柔軟性が有り、かつ格別にプログラム
を作成することなく結合できるようにしてデータ解析を
容易にすることを課題とする。 【0007】 【課題を解決するための手段】上記課題を解決するため
の本発明は、ネットワークに接続されたデータベースサ
ーバーへ接続し、データベースからの検索データの解析
を行うデータ解析装置において、サーバーへのアクセス
を制御するデータベースアクセス制御手段と、各サーバ
ーから得られたデータテーブルを表示する検索データ表
示手段と、表示されたデータテーブル間のデータ項目の
データ値を指定された条件で評価することによって複数
のデータテーブルを結合し、新たなデータテーブルを作
成するデータテーブル作成手段と、作成されたデータテ
ーブルをファイル保存するデータテーブルファイル保存
手段とを備えたことを特徴とする。 【0008】上記のように構成した発明によれば、異な
るデータベースの複数のデータテーブルを結合するに当
たり、各データテーブルに予めキー項目を埋め込むこと
をしなくても、データテーブル間のデータ項目を指定
し、かつ指定したデータに結合するための条件を指定す
ることにより、データテーブルを結合することができる
ので、複数のデータベースからの抽出されたデータを容
易に解析可能となる。 【0009】 【発明の実施の形態】以下に、本発明の一実施形態につ
いて図面を参照して説明する。図1は、本発明によるデ
ータ解析装置を実施したデータ解析ツールの主要構成を
示すブロック図である。図2は、本発明によるデータレ
コード結合操作の一例を示すブロック図である。図3
は、本発明による結合条件指定操作の一例を示すブロッ
ク図である。 【0010】図1に示したように、本実施形態のデータ
解析ツールは、データベースアクセス制御部、データテ
ーブル保存領域部、検索データ表示部、データテーブル
作成部、データテーブルファイル保存部、からなる。図
中の各部を繋ぐ線は、データや制御の流れを示してい
る。 【0011】データベースアクセス制御部は、各種デー
タベースへのデータ検索を制御するものである。データ
ベース毎のインターフェース部の組み込みを可能とす
る。インターフェース部は、メモリーを介しての検索デ
ータの引き渡し、あるいは、ファイルを介しての検索デ
ータの引渡しを本ツールへ行う。 【0012】データテーブル保存領域部は、各データベ
ースから得られた検索結果を保存する領域である。検索
データは、アクセス制御部から各データベース毎に本保
存領域部に保存される。本領域は、メモリ上またはディ
スク上に確保される。検索データ表示部、データテーブ
ル作成部、データテーブルファイル保存部からの要求に
応じて各部へのデータの送受を行う。 【0013】検索データ表示部は、各データベースから
の検索データをテーブル形式で表示する。データ項目名
とともに検索結果データをテーブル表示する。これによ
って、各データベースからの検索結果の確認を可能とす
る。不適切な検索データであれば、再度、データベース
アクセス制御部を介して再検索を行う。また、各データ
ベースのデータ項目名を表示することによって、同一定
義のデータ項目名の確認を可能とする。 【0014】データテーブル作成部は、上記検索データ
表示部でのデータベース名とデータ項目名を用いてそれ
ぞれ関連付けたいものを指定することによって、複数の
データベースの検索テーブルを1つに結合したデータテ
ーブルを作成する。データテーブルを作成するには、最
初に、レコードの結合条件を指定する必要がある。結合
条件としては、例えば、選択したデータ項目のデータ値
が互いに等しい場合にレコードを結合する、データ間の
差分が、データ値の10%以内の場合にレコードを結合
する、などがあげられる。このような結合条件を満足す
るレコードを結合し、新たなデータテーブルのレコード
を作成する。これにより作成したデータテーブルは、検
索データ表示部を介して、各データテーブルと同時に内
容を確認することが可能となる。また、必要に応じて上
記のように関連付けされて新規作成されたデータテーブ
ルは、データテーブル保存領域部へ送られ、新たなデー
タテーブルの一つとして同領域に保存される。 【0015】図2の(1)は、検索データ表示部でのデ
ータテーブル表示例を示している。このように検索結果
をデータベース単位にテーブルとして表示している例で
ある。データベースA1の検索結果データテーブルは、
N個のレコードからなっており、データベースB1から
の検索結果データテーブルは、4個のレコードからなっ
ている。この例では、データベースA1のデータ項目xn
とデータベースB1のデータ項目y2が同一定義のデー
タであり、このデータ項目を介して1つのデータテーブ
ルが作成可能である。本実施例では、データ項目xnと
データ項目y2のデータが一致する場合に各データテー
ブルのレコードを結合する例を示している。この結合条
件をデータテーブル作成部に指定することによって、図
2の(3)に示すような新規データテーブルが作成され
る。この結合時に結合可能なレコードが存在しない場合
には、欠値として表示されている。このようにして結合
されたレコードのデータベースを利用することによっ
て、データ項目x1とデータ項目ynの相関を調査するこ
とが容易となる。ここでの相関調査に有効なデータレコ
ードは、3個となる。なお、本実施例では、異なるデー
タベース間のデータ項目間であったが、同一データベー
スの異なったデータテーブル間でも同様である。さら
に、3個以上のデータテーブルにおいても同様である。 【0016】図3に本発明による結合条件指定操作の一
例を示す。データベース検索結果テーブル名、データ項
目名、結合条件を指定するテーブルである。結合条件
は、いくつか設定可能である。結合条件評価のデータ項
目名は、対象テーブル1個に1個のみ指定可能である
が、対象テーブルは、複数指定可能である。条件指定欄
の斜線は、条件の指定がないことを意味する。 【0017】図2(3)の結果は、図3の最初の結合条
件の結果として得られた例である。データベースA1、
B2に対する結合条件は、それぞれのデータ項目名xn
とデータ項目y2のデータが一致するレコードを結合す
る。さらに、結合時には、該当レコードが存在しない場
合には、欠値として処理する。さらに同一レコードが発
生した場合には、重複をテーブルに加えないという処理
を順次行うことを意味している。図3の2番目の結合条
件は、データベースA2、B3、C5のそれぞれの指定さ
れているデータ項目の3つのデータの差分が5以内のレ
コードを結合し、該当レコードがない場合には、そのレ
コードを結合テーブルに加えないということを意味して
いる。 【0018】 【発明の効果】上述したよう日本発明は、データベース
での検索データ、あるいは、異なるデータベース間の検
索データを容易に組み合わせることを可能とし、データ
項目間の解析を効率よく実施することができる。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data analysis apparatus suitable for use in a data analysis software tool for performing an analysis by linking various data in a database connected by a network. It is about. 2. Description of the Related Art Generally, a database is used by being connected to a network. This allows database users to easily update data,
This is to enable search. As a result, regardless of the location and number of the databases, data can be accessed when necessary, and the database can be easily used from anywhere as long as the database has the right to access the database. [0003] In a relational database most currently used, data in the database is managed in units having a relation between the data (hereinafter referred to as a table). The table further includes a plurality of records. A record is a unit indicating the minimum data association consisting of data of a plurality of data items. When a data search is performed on one or a plurality of data items, data of other data items related to the data can be obtained as a search result at the same time. Within one database, the relationships between data items are organized as described above, and data duplication and update are managed without contradiction. Therefore, when analyzing a data group of search results obtained from one database, Excel (manufactured by Microsoft), 1
Graph creation, statistical calculation, and the like can be easily performed using spreadsheet software such as 2-2-3 (manufactured by Lotus). In this case, save the search results in a file once, after starting these software individually, read and analyze those files, or create an interface program for each spreadsheet software and database,
It is necessary to deliver the search results directly to these softwares on the memory for analysis. [0004] Obtaining search result data from a mere database is almost the same as obtaining data from a single database. In other words, the data of the search result is stored in a file or the data is delivered to spreadsheet software. However, the relationship between data items is not managed in a unified manner between data tables of different databases, so when analyzing the correlation of data items between search data tables obtained individually from them, the relationship is not You need to join the data tables through the data items you think are there. [0005] In this case, the association of the data items means that the attributes match, that the data analyst recognizes that there is a correlation, that the correlation is estimated, and so on. Therefore, each data value does not always match in the related data item. In addition, problems such as different data arrangements and duplicated data values occur, making it difficult to combine data tables. Therefore, before performing analysis with the spreadsheet software, the file was read individually into the spreadsheet software for re-editing the data, such as confirming the duplication of the above data values and defining the relationship between data items. It must be done manually later by the user. [0006] When performing data analysis using a plurality of databases under the above-described network, when data items of search data of different databases are analyzed in association with each other, individual analysis is performed. It is necessary to read out the search data storage file and create a program individually to create a new data table by associating specific data items between the files, or manually edit it, etc. There is a problem that complicated work is required. Therefore, an object of the present invention is to facilitate data analysis by connecting a plurality of data tables of different databases (the same database may be used) with flexibility and without specially creating a program. And According to the present invention, there is provided a data analyzing apparatus for connecting to a database server connected to a network and analyzing search data from the database. Database access control means for controlling data access, search data display means for displaying data tables obtained from each server, and by evaluating data values of data items between the displayed data tables under specified conditions. It is characterized by comprising a data table creating means for creating a new data table by combining a plurality of data tables, and a data table file saving means for saving the created data table as a file. According to the invention configured as described above, when combining a plurality of data tables of different databases, the data items between the data tables are designated without embedding the key items in each data table in advance. In addition, by specifying conditions for combining with the specified data, the data tables can be combined, so that data extracted from a plurality of databases can be easily analyzed. An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a main configuration of a data analysis tool implementing a data analysis device according to the present invention. FIG. 2 is a block diagram showing an example of a data record merging operation according to the present invention. FIG.
FIG. 4 is a block diagram showing an example of a connection condition specifying operation according to the present invention. As shown in FIG. 1, the data analysis tool of the present embodiment includes a database access control unit, a data table storage area, a search data display, a data table creation unit, and a data table file storage. The lines connecting the components in the figure indicate the flow of data and control. The database access control section controls data retrieval to various databases. It is possible to incorporate an interface unit for each database. The interface unit delivers the search data via a memory or the search data via a file to the tool. The data table storage area is an area for storing search results obtained from each database. The search data is stored in the main storage area for each database from the access control unit. This area is secured on a memory or a disk. Data is transmitted to and received from each unit in response to requests from the search data display unit, data table creation unit, and data table file storage unit. The search data display section displays search data from each database in a table format. Display search result data in a table with data item names. Thereby, it is possible to confirm the search result from each database. If the search data is inappropriate, the search is performed again via the database access control unit. Also, by displaying the data item name of each database, it is possible to confirm the data item name of the same definition. [0014] The data table creation section specifies a data table to be associated with each other by using the database name and the data item name in the search data display section, thereby creating a data table obtained by combining search tables of a plurality of databases into one. create. To create a data table, you first need to specify the join conditions for the records. Examples of the joining condition include joining records when the data values of the selected data items are equal to each other, joining records when the difference between the data is within 10% of the data value, and the like. Records satisfying such a joining condition are joined to create a new data table record. Thus, the contents of the created data table can be checked simultaneously with each data table via the search data display unit. If necessary, the newly created data table linked as described above is sent to the data table storage area, and is stored in the same area as one of the new data tables. FIG. 2A shows an example of a data table display in the search data display section. In this manner, the search result is displayed as a table in database units. The search result data table of the database A1 is
It consists of N records, and the search result data table from the database B1 consists of four records. In this example, the data item xn of the database A1
And the data item y2 of the database B1 have the same definition, and one data table can be created through this data item. In this embodiment, an example is shown in which records of the data tables are joined when the data of the data item xn and the data of the data item y2 match. By designating this combination condition in the data table creation unit, a new data table as shown in (3) of FIG. 2 is created. If there is no record that can be combined at the time of this combination, it is displayed as a missing value. By utilizing the database of records combined in this way, it becomes easy to investigate the correlation between the data item x1 and the data item yn. Here, three data records are effective for the correlation check. In the present embodiment, data items between different databases are used, but the same applies to different data tables of the same database. The same applies to three or more data tables. FIG. 3 shows an example of the connection condition specifying operation according to the present invention. This table specifies the database search result table name, data item name, and join conditions. Several join conditions can be set. Only one data item name for the join condition evaluation can be specified for each target table, but a plurality of target tables can be specified. A hatched line in the condition specification column indicates that no condition is specified. The result of FIG. 2 (3) is an example obtained as a result of the first combination condition of FIG. Database A1,
The join condition for B2 is the data item name xn
And a record in which the data of the data item y2 matches. Further, at the time of combining, if the corresponding record does not exist, it is processed as a missing value. Further, when the same record occurs, it means that the processing of not adding the duplication to the table is sequentially performed. The second join condition in FIG. 3 is to join records in which the difference between the three data items of the designated data items of the databases A2, B3, and C5 is less than 5, and if there is no corresponding record, the record is Does not add to the join table. As described above, the Japanese invention makes it possible to easily combine search data in a database or search data between different databases, and efficiently analyze data items. it can.

【図面の簡単な説明】 【図1】本発明によるデータ解析ツールの主要構成を示
すブロック図。 【図2】本発明によるデータレコード結合操作の一例を
示すブロック図。 【図3】本発明による結合条件指定操作の一例を示すブ
ロック図。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing a main configuration of a data analysis tool according to the present invention. FIG. 2 is a block diagram showing an example of a data record merging operation according to the present invention. FIG. 3 is a block diagram showing an example of a joining condition designating operation according to the present invention.

Claims (1)

【特許請求の範囲】 【請求項1】 ネットワークに接続されたデータベース
サーバーへ接続し、データベースからの検索データの解
析を行うデータ解析装置において、サーバーへのアクセ
スを制御するデータベースアクセス制御手段と、各サー
バーから得られたデータテーブルを表示する検索データ
表示手段と、表示されたデータテーブル間のデータ項目
のデータ値を指定された条件で評価することによって複
数のデータテーブルを結合し、新たなデータテーブルを
作成するデータテーブル作成手段と、作成されたデータ
テーブルをファイル保存するデータテーブルファイル保
存手段とを備えたことを特徴とするデータ解析装置。
Claims: 1. A data analysis device that connects to a database server connected to a network and analyzes search data from the database, comprising: a database access control unit that controls access to the server; Search data display means for displaying a data table obtained from the server; and combining a plurality of data tables by evaluating data values of data items between the displayed data tables under specified conditions, to form a new data table. And a data table file storing means for storing the generated data table as a file.
JP2002012606A 2002-01-22 2002-01-22 Data analysis device Withdrawn JP2003216618A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002012606A JP2003216618A (en) 2002-01-22 2002-01-22 Data analysis device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002012606A JP2003216618A (en) 2002-01-22 2002-01-22 Data analysis device

Publications (1)

Publication Number Publication Date
JP2003216618A true JP2003216618A (en) 2003-07-31

Family

ID=27649773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002012606A Withdrawn JP2003216618A (en) 2002-01-22 2002-01-22 Data analysis device

Country Status (1)

Country Link
JP (1) JP2003216618A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020188670A1 (en) 2019-03-15 2020-09-24 株式会社日立製作所 Data integration evaluation system and data integration evaluation method
CN112118995A (en) * 2018-05-25 2020-12-22 株式会社东芝 Data creating device for analysis

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112118995A (en) * 2018-05-25 2020-12-22 株式会社东芝 Data creating device for analysis
WO2020188670A1 (en) 2019-03-15 2020-09-24 株式会社日立製作所 Data integration evaluation system and data integration evaluation method

Similar Documents

Publication Publication Date Title
US6928452B2 (en) Tiered and content based database searching
US7069514B2 (en) Modeling system for retrieving and displaying data from multiple sources
US6392669B1 (en) Schedule management system and method for displaying, managing, and changing a schedule and recording medium for storing the same
US7184940B2 (en) Collaboration session recording model
US6408312B1 (en) Method and system for supporting multiple, historical, and future designs in a relational database
US20050171925A1 (en) System and method for exposing a child list
US20100023498A1 (en) Relationship management in a data abstraction model
US20050108219A1 (en) Tiered and content based database searching
US20100011305A1 (en) Dynamic Medical Data Acquisition
US7386793B2 (en) Apparatus, method and program for supporting a review
US8423564B1 (en) Methods and apparatus for managing and updating stored information
US20110219028A1 (en) Automatic generation of virtual database schemas
JP2002207726A (en) Document controller, method of extracting related document, and method of supporting document operation
JP2013530449A (en) How to improve queries for searching databases
US20080114626A1 (en) System and Method for Capturing Process Instance Information
JP2003216618A (en) Data analysis device
EP3373165A1 (en) Method of transferring the structures and data sets between the source and target systems and the system to implement it
JPH1185492A (en) Device for supporting preparation of object oriented data model
US8521699B2 (en) Tracking changes across collection of data tables
EP1634196B1 (en) Data processing method and system for combining database tables
JPH11161656A (en) Data base retrieval and extraction system and recording medium in which control program for data base retrieval and extraction is recorded
US20100011019A1 (en) Database Business Components Code Generator
US20060136447A1 (en) Graphical transformation of data
JPH06149553A (en) Term managing device
JPH0212563A (en) Information managing system

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050405