JP2001256076A - Device and method for generating test data and recording medium - Google Patents

Device and method for generating test data and recording medium

Info

Publication number
JP2001256076A
JP2001256076A JP2000063562A JP2000063562A JP2001256076A JP 2001256076 A JP2001256076 A JP 2001256076A JP 2000063562 A JP2000063562 A JP 2000063562A JP 2000063562 A JP2000063562 A JP 2000063562A JP 2001256076 A JP2001256076 A JP 2001256076A
Authority
JP
Japan
Prior art keywords
data
test data
database
feature
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000063562A
Other languages
Japanese (ja)
Inventor
Masatake Harashima
正豪 原島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000063562A priority Critical patent/JP2001256076A/en
Publication of JP2001256076A publication Critical patent/JP2001256076A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a test data generating device and method and a recording medium for easily and properly generating test data suitable for an actual environment. SOLUTION: When a user sets the parameter of test data generation, a test data preparing device connects to an already existing data base to obtain data storage information in the already existing data base, and then reads records stored in the table of the already existing data base while referring to the data storage information to calculate the characteristics of the column data, and after separating the already existing data base, generates test data by using the characteristics of the already existing data base. At the time of generating the test data, the test data preparing device connects to a data base to be developed, and stores the records of the prepared test data in the data base to be developed. Therefore, it is possible to prepare dummy test data more suitable for the situation by using the data stored in the actually operating already existing data base, and to properly realize the tuning of the data base.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、テストデータ生成
装置、テストデータ生成方法及び記録媒体に関し、詳細
には、実環境に適したテストデータを生成するテストデ
ータ生成装置、テストデータ生成方法及び記録媒体に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a test data generation device, a test data generation method, and a recording medium, and more particularly, to a test data generation device, test data generation method, and recording for generating test data suitable for a real environment. Regarding the medium.

【0002】[0002]

【従来の技術】データベースの開発においては、データ
ベースのチューニングは、重要な役目をになっている。
すなわち、データベースのチューニングは、一般に、デ
ータベース管理システム(DBMS)が管理するテーブ
ル、プロシージャ、ログ・ファイル等のデータベースオ
ブジェクトに割り当てるメモリやキャッシュ等の計算機
(コンピュータ)の資源のサイズ等のデータベースに関
する様々なパラメータを、応答時間、データベースの可
用性及びヒット率等を向上させるように適切に調整する
ことである。
2. Description of the Related Art In database development, database tuning plays an important role.
That is, generally, the tuning of the database is performed by various processes related to the database such as the size of a computer (computer) resource such as a memory and a cache allocated to a database object such as a table, a procedure, and a log file managed by a database management system (DBMS). The parameters are adjusted appropriately to improve response time, database availability and hit rate, etc.

【0003】上記データベースのチューニングを適切に
行うためには、データベースに負荷を与えて、レスポン
スを調べることが必要になり、この負荷を与える方法の
一つとして、大量のダミーのレコードデータをテーブル
に格納して、事前評価することがある。
In order to properly tune the database, it is necessary to apply a load to the database and examine the response. One method of applying the load is to store a large amount of dummy record data in a table. Stored and may be pre-evaluated.

【0004】そして、従来、データベース用テストデー
タ生成ツールとして、茨城日立情報サービス株式会社か
ら市販されている「EASYCAP for ORAC
LE」がある。
[0004] Conventionally, "EASYCAP for ORAC", which is commercially available from Ibaraki Hitachi Information Service Co., Ltd., has been used as a test data generation tool for databases.
LE ”.

【0005】このデータベース用テストデータ生成ツー
ルは、データ値の最小値、最大値及び分布(度数分布、
一様分布、正規分布)等のデータの出現頻度、データ値
の範囲を指定することのできるツールである。そして、
このデータベース用テストデータ生成ツールは、生成さ
れるデータの特性をユーザーが設定するようになってい
る。
[0005] The test data generating tool for a database uses a minimum value, a maximum value, and a distribution (frequency distribution,
This is a tool that can specify the appearance frequency of data such as uniform distribution and normal distribution, and the range of data values. And
In the database test data generation tool, a user sets characteristics of generated data.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、このよ
うな従来のデータベース用テストデータ生成ツールにあ
っては、生成されるデータの特性をユーザーが設定する
ようになっていたため、既存のデータベースを再構築す
るような場合には、必ずしも実環境に即したデータを生
成することができるとは限らず、実環境に適したテスト
データを生成することのできるテストデータ生成方法や
装置が要望されている。
However, in such a conventional test data generation tool for a database, since the characteristics of the generated data are set by the user, the existing database is reconstructed. In such a case, it is not always possible to generate data suitable for the real environment, and there is a demand for a test data generation method and apparatus capable of generating test data suitable for the real environment.

【0007】そこで、請求項1記載の発明は、既存のデ
ータベースの再構築を行う際に必要なテストデータを生
成するに際して、データの格納されている既存のデータ
ベースからデータ格納情報を取得し、当該取得したデー
タ格納情報を参照しつつ既存のデータベースに格納され
たレコードからデータの特徴を算出して、当該算出した
データの特徴を用いて開発対象のデータベースに必要な
テストデータを生成し、当該生成したテストデータを開
発対象のデータベースに格納することにより、実稼働し
ている既存のデータベースに格納されているデータを用
いて、より一層実情に即したダミーのテストデータを生
成し、データベースのチューニングを適切に行うことの
できるテストデータ生成装置を提供することを目的とし
ている。
Therefore, according to the first aspect of the present invention, when generating test data necessary for reconstructing an existing database, data storage information is obtained from the existing database in which data is stored, and The data characteristics are calculated from the records stored in the existing database while referring to the obtained data storage information, and the test data necessary for the development target database is generated using the calculated data characteristics, and the generation is performed. The test data stored in the development target database is used to generate dummy test data that is more realistic based on the data stored in the existing database that is actually in operation, and tuning of the database is performed. It is an object of the present invention to provide a test data generation device that can be appropriately performed.

【0008】請求項2記載の発明は、既存のデータベー
スに格納されたデータの統計的な特徴を算出して、当該
算出した統計的な特徴を用いてテストデータを生成する
ことにより、実情に即した所望の件数のテストデータを
生成し、データベースのチューニングを簡単かつ適切に
行うことのできるテストデータ生成装置を提供すること
を目的としている。
[0010] The invention according to claim 2 calculates the statistical characteristics of the data stored in the existing database, and generates test data using the calculated statistical characteristics, thereby realizing the actual situation immediately. It is an object of the present invention to provide a test data generating apparatus that can generate a desired number of test data and can easily and appropriately tune a database.

【0009】請求項3記載の発明は、既存のデータベー
スに格納されている一部のレコードをサンプリングして
得られたデータを特徴の算出に用いることにより、特徴
を算出するための既存のデータベースからのサンプル数
を調整して、特徴算出に要する処理時間を削減し、実情
に即した所望の件数のテストデータを速やかに生成し
て、データベースのチューニングを速やかにかつ適切に
行うことのできるテストデータ生成装置を提供すること
を目的としている。
According to a third aspect of the present invention, data obtained by sampling a part of records stored in an existing database is used for calculating a feature. Test data that can reduce the processing time required for feature calculation by adjusting the number of samples, generate test data of the desired number according to the actual situation quickly, and perform database tuning quickly and appropriately. It is intended to provide a generator.

【0010】請求項4記載の発明は、レコード内のデー
タが数値データ型であると、既存のデータベースにおけ
る当該データの値の分布に基づいてランダムなデータを
生成し、当該データを特徴の算出に用いることにより、
データが数値データ型である場合にも、実情に即したテ
ストデータを生成し、データベースのチューニングを簡
単かつ適切に行うことのできるテストデータ生成装置を
提供することを目的としている。
According to a fourth aspect of the present invention, if the data in the record is a numerical data type, random data is generated based on the distribution of the values of the data in the existing database, and the data is used for calculating the characteristics. By using
It is an object of the present invention to provide a test data generation device that generates test data in accordance with the actual situation even when the data is a numerical data type, and that can easily and appropriately tune a database.

【0011】請求項5記載の発明は、レコード内のデー
タが非数値データ型であると、既存のデータベースにお
ける当該データのデータ長に基づいてランダムなデータ
を生成し、当該データを特徴の算出に用いることによ
り、データが非数値データ型である場合にも、実情に即
したテストデータを生成し、データベースのチューニン
グを簡単かつ適切に行うことのできるテストデータ生成
装置を提供することを目的としている。
According to a fifth aspect of the present invention, if the data in a record is of a non-numeric data type, random data is generated based on the data length of the data in an existing database, and the data is used for calculating a feature. It is an object of the present invention to provide a test data generation device that generates test data according to the actual situation even when the data is of a non-numeric data type and can easily and appropriately tune a database. .

【0012】請求項6記載の発明は、データ格納情報を
用いてテーブル間の参照関係を考慮して、生成されたテ
ストデータを開発対象のデータベースに格納することに
より、テーブル間に参照による制約があるようなデータ
ベース構造であっても、テストデータを適切に格納し、
データベースのチューニングを簡単かつ適切に行うこと
のできるテストデータ生成装置を提供することを目的と
している。
According to the present invention, the generated test data is stored in the development target database in consideration of the reference relation between the tables using the data storage information, so that the restriction due to the reference between the tables is eliminated. Even with some database structure, test data is stored properly,
It is an object of the present invention to provide a test data generation device that can easily and appropriately tune a database.

【0013】請求項7記載の発明は、生成されたテスト
データを開発対象のデータベースに格納するに際し、当
該生成されたテストデータのレコードをキーに従ってソ
ートして、重複したレコードを削除することにより、生
成されたテストデータを開発対象のデータベースに格納
する際の処理時間を削減し、データベースのチューニン
グを速やかにかつ適切に行うことのできるテストデータ
生成装置を提供することを目的としている。
According to a seventh aspect of the present invention, when storing the generated test data in a database to be developed, the records of the generated test data are sorted according to a key and duplicate records are deleted. It is an object of the present invention to provide a test data generation device capable of reducing the processing time when storing generated test data in a development target database and performing the tuning of the database quickly and appropriately.

【0014】請求項8記載の発明は、テストデータ生成
装置を、通信ネットワークに接続されたデータベース管
理サーバーとクライアントマシン上に構築し、クライア
ントマシン上に、データ格納情報取得手段、特徴算出手
段、テストデータ生成手段及び格納手段を構築して、デ
ータ格納情報取得手段がデータベース管理サーバーを介
して当該データベース管理サーバーの管理する既存のデ
ータベースからデータ格納情報を取得し、格納手段が、
データベース管理サーバーの管理する開発対象のデータ
ベースに当該データベース管理サーバーを介してテスト
データを格納することにより、ネットワーク上に存在す
る複数のデータベースを統合的にチューニングし、利用
性を向上させるテストデータ生成装置を提供することを
目的としている。
According to an eighth aspect of the present invention, a test data generating device is constructed on a database management server and a client machine connected to a communication network, and on the client machine, data storage information obtaining means, feature calculating means, test The data generation means and the storage means are constructed, the data storage information obtaining means obtains the data storage information from the existing database managed by the database management server via the database management server, and the storage means,
A test data generator that stores test data in a development target database managed by a database management server via the database management server, thereby integrally tuning a plurality of databases existing on a network and improving usability. It is intended to provide.

【0015】請求項9記載の発明は、既存のデータベー
スの再構築を行う際に必要なテストデータを生成するに
際して、データの格納されている既存のデータベースか
らデータ格納情報を取得し、当該取得したデータ格納情
報を参照しつつ既存のデータベースに格納されたレコー
ドからデータの特徴を算出して、当該算出したデータの
特徴を用いて開発対象のデータベースに必要なテストデ
ータを生成し、当該生成したテストデータを開発対象の
データベースに格納することにより、実稼働している既
存のデータベースに格納されているデータを用いて、よ
り一層実情に即したダミーのテストデータを生成し、デ
ータベースのチューニングを適切に行うことのできるテ
ストデータ生成方法を提供することを目的としている。
According to the ninth aspect of the present invention, when test data necessary for reconstructing an existing database is generated, data storage information is obtained from the existing database in which data is stored, and the obtained data is obtained. The data characteristics are calculated from the records stored in the existing database while referring to the data storage information, and the test data required for the development target database is generated using the calculated data characteristics, and the generated test is generated. By storing data in the development target database, dummy test data that is more realistic can be generated using data stored in the existing database that is in operation, and database tuning can be performed appropriately. It is intended to provide a test data generation method that can be performed.

【0016】請求項10記載の発明は、既存のデータベ
ースに格納されたデータの統計的な特徴を算出して、当
該算出した統計的な特徴を用いてテストデータを生成す
ることにより、実情に即した所望の件数のテストデータ
を生成し、データベースのチューニングを簡単かつ適切
に行うことのできるテストデータ生成方法を提供するこ
とを目的としている。
The invention according to claim 10 calculates the statistical characteristics of the data stored in the existing database, and generates test data using the calculated statistical characteristics, thereby realizing the actual situation immediately. It is an object of the present invention to provide a test data generation method capable of generating test data of a desired number and performing database tuning easily and appropriately.

【0017】請求項11記載の発明は、既存のデータベ
ースに格納されている一部のレコードをサンプリングし
て得られたデータを特徴の算出に用いることにより、特
徴を算出するための既存のデータベースからのサンプル
数を調整して、特徴算出に要する処理時間を削減し、実
情に即した所望の件数のテストデータを速やかに生成し
て、データベースのチューニングを速やかにかつ適切に
行うことのできるテストデータ生成方法を提供すること
を目的としている。
According to an eleventh aspect of the present invention, data obtained by sampling a part of records stored in an existing database is used for calculating a feature, so that the existing database for calculating the feature can be used. Test data that can reduce the processing time required for feature calculation by adjusting the number of samples, generate test data of the desired number according to the actual situation quickly, and perform database tuning quickly and appropriately. It aims to provide a generation method.

【0018】請求項12記載の発明は、レコード内のデ
ータが数値データ型であると、既存のデータベースにお
ける当該データの値の分布に基づいてランダムなデータ
を生成し、当該データを特徴の算出に用いることによ
り、データが数値データ型である場合にも、実情に即し
たテストデータを生成し、データベースのチューニング
を簡単かつ適切に行うことのできるテストデータ生成方
法を提供することを目的としている。
According to a twelfth aspect of the present invention, when the data in a record is of a numeric data type, random data is generated based on the distribution of the value of the data in an existing database, and the data is used for calculating a feature. It is an object of the present invention to provide a test data generation method that generates test data in accordance with the actual situation even when the data is of a numerical data type, and that can easily and appropriately tune a database.

【0019】請求項13記載の発明は、レコード内のデ
ータが非数値データ型であると、既存のデータベースに
おける当該データのデータ長に基づいてランダムなデー
タを生成し、当該データを特徴の算出に用いることによ
り、データが非数値データ型である場合にも、実情に即
したテストデータを生成し、データベースのチューニン
グを簡単かつ適切に行うことのできるテストデータ生成
方法を提供することを目的としている。
According to a thirteenth aspect of the present invention, when data in a record is of a non-numeric data type, random data is generated based on the data length of the data in an existing database, and the data is used for calculating a feature. It is an object of the present invention to provide a test data generation method that generates test data according to the actual situation even when the data is of a non-numeric data type, and enables easy and appropriate tuning of a database. .

【0020】請求項14記載の発明は、データ格納情報
を用いてテーブル間の参照関係を考慮して、生成された
テストデータを開発対象のデータベースに格納すること
により、テーブル間に参照による制約があるようなデー
タベース構造であっても、テストデータを適切に格納
し、データベースのチューニングを簡単かつ適切に行う
ことのできるテストデータ生成方法を提供することを目
的としている。
According to the present invention, the generated test data is stored in the development target database in consideration of the reference relation between the tables using the data storage information. It is an object of the present invention to provide a test data generation method capable of appropriately storing test data even with a certain database structure and performing simple and appropriate tuning of the database.

【0021】請求項15記載の発明は、生成されたテス
トデータを開発対象のデータベースに格納するに際し、
当該生成されたテストデータのレコードをキーに従って
ソートして、重複したレコードを削除することにより、
生成されたテストデータを開発対象のデータベースに格
納する際の処理時間を削減し、データベースのチューニ
ングを速やかにかつ適切に行うことのできるテストデー
タ生成方法を提供することを目的としている。
According to a fifteenth aspect of the present invention, when storing the generated test data in a database to be developed,
By sorting the records of the generated test data according to the key and deleting duplicate records,
It is an object of the present invention to provide a test data generation method capable of reducing the processing time when storing generated test data in a database to be developed and quickly and appropriately tuning the database.

【0022】請求項16記載の発明は、記録媒体に、既
存のデータベースの再構築を行う際に必要なテストデー
タを生成するテストデータ生成プログラムであって、デ
ータの格納されている既存のデータベースからデータ格
納情報を取得するデータ格納情報取得処理ステップと、
当該取得したデータ格納情報を参照しつつ既存のデータ
ベースに格納されたレコードからデータの特徴を算出す
る特徴算出処理ステップと、特徴算出処理で算出したデ
ータの特徴を用いて開発対象のデータベースに必要なテ
ストデータを生成するテストデータ生成処理ステップ
と、テストデータ生成処理で生成したテストデータを開
発対象のデータベースに格納する格納処理ステップと、
を含むテストデータ生成プログラムを記録することによ
り、当該記録媒体を情報処理装置に読み取らせること
で、テストデータ生成システムを構築し、実稼働してい
る既存のデータベースに格納されているデータを用い
て、より一層実情に即したダミーのテストデータを生成
して、データベースのチューニングを適切に行うことの
できるプログラムを記録した記録媒体を提供することを
目的としている。
According to a sixteenth aspect of the present invention, there is provided a test data generating program for generating test data necessary for reconstructing an existing database on a recording medium, the test data generating program comprising: A data storage information acquisition processing step of acquiring data storage information,
A feature calculation processing step of calculating data features from records stored in an existing database while referring to the obtained data storage information; and a feature calculation process required for a database to be developed using the features of the data calculated in the feature calculation process. A test data generation processing step of generating test data, a storage processing step of storing the test data generated in the test data generation processing in a development target database,
By recording the test data generation program including the above, the information storage device reads the recording medium, thereby constructing a test data generation system, and using data stored in an existing database that is actually operating. It is another object of the present invention to provide a recording medium on which a program capable of generating dummy test data more suitable for the actual situation and appropriately performing database tuning is recorded.

【0023】[0023]

【課題を解決するための手段】請求項1記載の発明のテ
ストデータ生成装置は、既存のデータベースの再構築を
行う際に必要なテストデータを生成するテストデータ生
成装置であって、データの格納されている前記既存のデ
ータベースからデータ格納情報を取得するデータ格納情
報取得手段と、当該データ格納情報を参照しつつ前記既
存のデータベースに格納されたレコードから前記データ
の特徴を算出する特徴算出手段と、前記特徴算出手段の
算出した前記データの特徴を用いて開発対象のデータベ
ースに必要なテストデータを生成するテストデータ生成
手段と、前記テストデータ生成手段の生成した前記テス
トデータを前記開発対象のデータベースに格納する格納
手段と、を備えることにより、上記目的を達成してい
る。
According to a first aspect of the present invention, there is provided a test data generating apparatus for generating test data necessary for reconstructing an existing database, wherein the data is stored. Data storage information obtaining means for obtaining data storage information from the existing database, and feature calculation means for calculating characteristics of the data from records stored in the existing database while referring to the data storage information. Test data generating means for generating test data necessary for a database to be developed using the characteristics of the data calculated by the characteristic calculating means, and the test data generated by the test data generating means to the database to be developed. The above object is achieved by providing a storage means for storing the information in the storage device.

【0024】上記構成によれば、既存のデータベースの
再構築を行う際に必要なテストデータを生成するに際し
て、データの格納されている既存のデータベースからデ
ータ格納情報を取得し、当該取得したデータ格納情報を
参照しつつ既存のデータベースに格納されたレコードか
らデータの特徴を算出して、当該算出したデータの特徴
を用いて開発対象のデータベースに必要なテストデータ
を生成し、当該生成したテストデータを開発対象のデー
タベースに格納するので、実稼働している既存のデータ
ベースに格納されているデータを用いて、より一層実情
に即したダミーのテストデータを生成することができ、
データベースのチューニングを適切に行うことができ
る。
According to the above configuration, when generating test data required for reconstructing an existing database, data storage information is obtained from the existing database in which data is stored, and the obtained data storage is obtained. Calculate the data characteristics from the records stored in the existing database while referring to the information, generate the test data required for the database to be developed using the calculated data characteristics, and compile the generated test data. Since it is stored in the development target database, it is possible to generate dummy test data that is more realistic based on the data stored in the existing database that is in operation,
The database can be tuned appropriately.

【0025】この場合、例えば、請求項2に記載するよ
うに、前記特徴算出手段は、前記既存のデータベースに
格納された前記データの統計的な特徴を算出し、前記テ
ストデータ生成手段は、当該特徴算出手段の算出した統
計的な特徴を用いて前記テストデータを生成するもので
あってもよい。
In this case, for example, as described in claim 2, the feature calculating means calculates a statistical feature of the data stored in the existing database, and the test data generating means determines the statistical feature of the data. The test data may be generated using a statistical feature calculated by a feature calculation unit.

【0026】上記構成によれば、既存のデータベースに
格納されたデータの統計的な特徴を算出して、当該算出
した統計的な特徴を用いてテストデータを生成するの
で、実情に即した所望の件数のテストデータを生成する
ことができ、データベースのチューニングを簡単かつ適
切に行うことができる。
According to the above configuration, the statistical characteristics of the data stored in the existing database are calculated, and the test data is generated using the calculated statistical characteristics. The number of test data can be generated, and the database can be tuned easily and appropriately.

【0027】また、例えば、請求項3に記載するよう
に、前記特徴算出手段は、前記既存のデータベースに格
納されている一部のレコードをサンプリングして得られ
たデータを前記特徴の算出に用いるものであってもよ
い。
Further, for example, as described in claim 3, the feature calculation means uses data obtained by sampling some records stored in the existing database for calculation of the feature. It may be something.

【0028】上記構成によれば、既存のデータベースに
格納されている一部のレコードをサンプリングして得ら
れたデータを特徴の算出に用いているので、特徴を算出
するための既存のデータベースからのサンプル数を調整
して、特徴算出に要する処理時間を削減することがで
き、実情に即した所望の件数のテストデータを速やかに
生成して、データベースのチューニングを速やかにかつ
適切に行うことができる。
According to the above configuration, since data obtained by sampling some of the records stored in the existing database is used for calculating the feature, the data from the existing database for calculating the feature is used. By adjusting the number of samples, it is possible to reduce the processing time required for feature calculation, to quickly generate a desired number of test data according to the actual situation, and to quickly and appropriately tune the database. .

【0029】さらに、例えば、請求項4に記載するよう
に、前記特徴算出手段は、前記レコード内のデータが数
値データ型であると、前記既存のデータベースにおける
当該データの値の分布に基づいてランダムな前記データ
を生成し、当該データを前記特徴の算出に用いるもので
あってもよい。
Further, for example, if the data in the record is a numerical data type, the feature calculating means may randomly determine the data in the record based on the distribution of the value of the data in the existing database. The data may be generated and used for calculating the feature.

【0030】上記構成によれば、レコード内のデータが
数値データ型であると、既存のデータベースにおける当
該データの値の分布に基づいてランダムなデータを生成
し、当該データを特徴の算出に用いているので、データ
が数値データ型である場合にも、実情に即したテストデ
ータを生成することができ、データベースのチューニン
グを簡単かつ適切に行うことができる。
According to the above configuration, if the data in the record is of a numeric data type, random data is generated based on the distribution of the values of the data in the existing database, and the data is used for calculating the characteristics. Therefore, even when the data is of a numerical data type, test data can be generated according to the actual situation, and the database can be tuned easily and appropriately.

【0031】また、例えば、請求項5に記載するよう
に、前記特徴算出手段は、前記レコード内のデータが非
数値データ型であると、前記既存のデータベースにおけ
る当該データのデータ長に基づいてランダムな前記デー
タを生成し、当該データを前記特徴の算出に用いるもの
であってもよい。
For example, if the data in the record is of a non-numeric data type, the feature calculating means may randomly determine the data in the record based on the data length of the data in the existing database. The data may be generated and used for calculating the feature.

【0032】上記構成によれば、レコード内のデータが
非数値データ型であると、既存のデータベースにおける
当該データのデータ長に基づいてランダムなデータを生
成し、当該データを特徴の算出に用いているので、デー
タが非数値データ型である場合にも、実情に即したテス
トデータを生成することができ、データベースのチュー
ニングを簡単かつ適切に行うことができる。
According to the above configuration, if the data in the record is of a non-numeric data type, random data is generated based on the data length of the data in the existing database, and the data is used for calculating the feature. Therefore, even when the data is of a non-numeric data type, test data can be generated according to the actual situation, and database tuning can be performed easily and appropriately.

【0033】さらに、例えば、請求項6に記載するよう
に、前記格納手段は、前記データ格納情報取得手段の取
得した前記データ格納情報を用い、テーブル間の参照関
係を考慮して、前記生成されたテストデータを前記開発
対象のデータベースに格納するものであってもよい。
Further, for example, as set forth in claim 6, the storage means uses the data storage information acquired by the data storage information acquisition means and takes into account the reference relation between the tables to generate the generated data. The test data may be stored in the development target database.

【0034】上記構成によれば、データ格納情報を用い
てテーブル間の参照関係を考慮して、生成されたテスト
データを開発対象のデータベースに格納するので、テー
ブル間に参照による制約があるようなデータベース構造
であっても、テストデータを適切に格納することがで
き、データベースのチューニングを簡単かつ適切に行う
ことができる。
According to the above configuration, the generated test data is stored in the database to be developed in consideration of the reference relation between the tables using the data storage information. Even with a database structure, test data can be appropriately stored, and database tuning can be performed easily and appropriately.

【0035】また、例えば、請求項7に記載するよう
に、前記格納手段は、前記生成されたテストデータを前
記開発対象のデータベースに格納するに際し、当該生成
されたテストデータのレコードをキーに従ってソートし
て、重複したレコードを削除するものであってもよい。
For example, when storing the generated test data in the development target database, the storage unit sorts the generated test data records according to a key. Then, the duplicated record may be deleted.

【0036】上記構成によれば、生成されたテストデー
タを開発対象のデータベースに格納するに際し、当該生
成されたテストデータのレコードをキーに従ってソート
して、重複したレコードを削除するので、生成されたテ
ストデータを開発対象のデータベースに格納する際の処
理時間を削減することができ、データベースのチューニ
ングを速やかにかつ適切に行うことができる。
According to the above configuration, when storing the generated test data in the database to be developed, the records of the generated test data are sorted according to the key, and duplicate records are deleted. Processing time for storing test data in the development target database can be reduced, and database tuning can be performed quickly and appropriately.

【0037】さらに、例えば、請求項8に記載するよう
に、前記テストデータ生成装置は、通信ネットワークに
接続されたデータベース管理サーバーとクライアントマ
シン上に構築され、前記クライアントマシン上に、前記
データ格納情報取得手段、前記特徴算出手段、前記テス
トデータ生成手段及び前記格納手段が構築され、前記デ
ータ格納情報取得手段が前記データベース管理サーバー
を介して当該データベース管理サーバーの管理する前記
既存のデータベースから前記データ格納情報を取得し、
前記格納手段が、前記データベース管理サーバーの管理
する前記開発対象のデータベースに当該データベース管
理サーバーを介して前記テストデータを格納するもので
あってもよい。
Further, for example, as set forth in claim 8, the test data generation device is constructed on a database management server and a client machine connected to a communication network, and stores the data storage information on the client machine. An acquisition unit, the feature calculation unit, the test data generation unit, and the storage unit are constructed, and the data storage information acquisition unit stores the data from the existing database managed by the database management server via the database management server. Get information,
The storage unit may store the test data in the development target database managed by the database management server via the database management server.

【0038】上記構成によれば、テストデータ生成装置
を、通信ネットワークに接続されたデータベース管理サ
ーバーとクライアントマシン上に構築し、クライアント
マシン上に、データ格納情報取得手段、特徴算出手段、
テストデータ生成手段及び格納手段を構築して、データ
格納情報取得手段がデータベース管理サーバーを介して
当該データベース管理サーバーの管理する既存のデータ
ベースからデータ格納情報を取得し、格納手段が、デー
タベース管理サーバーの管理する開発対象のデータベー
スに当該データベース管理サーバーを介してテストデー
タを格納するので、ネットワーク上に存在する複数のデ
ータベースを統合的にチューニングすることができ、利
用性を向上させることができる。
According to the above configuration, the test data generation device is constructed on the database management server and the client machine connected to the communication network, and the data storage information acquisition means, the feature calculation means,
A test data generation unit and a storage unit are constructed, and the data storage information obtaining unit obtains data storage information from an existing database managed by the database management server via the database management server. Since the test data is stored in the database to be managed through the database management server, a plurality of databases existing on the network can be tuned in an integrated manner, and the usability can be improved.

【0039】請求項9記載の発明のテストデータ生成方
法は、既存のデータベースの再構築を行う際に必要なテ
ストデータを生成するテストデータ生成方法であって、
データの格納されている前記既存のデータベースからデ
ータ格納情報を取得するデータ格納情報取得処理と、当
該データ格納情報を参照しつつ前記既存のデータベース
に格納されたレコードから前記データの特徴を算出する
特徴算出処理と、前記特徴算出処理で算出した前記デー
タの特徴を用いて開発対象のデータベースに必要なテス
トデータを生成するテストデータ生成処理と、前記テス
トデータ生成処理で生成した前記テストデータを前記開
発対象のデータベースに格納する格納処理と、を順次行
うことにより、上記目的を達成している。
A test data generating method according to a ninth aspect of the present invention is a test data generating method for generating test data necessary for reconstructing an existing database,
A data storage information acquisition process for acquiring data storage information from the existing database in which data is stored, and a feature of calculating characteristics of the data from records stored in the existing database while referring to the data storage information Calculation processing; test data generation processing for generating test data necessary for a development target database using the characteristics of the data calculated in the characteristic calculation processing; and developing the test data generated in the test data generation processing. The above object is achieved by sequentially performing storage processing for storing in a target database.

【0040】上記構成によれば、既存のデータベースの
再構築を行う際に必要なテストデータを生成するに際し
て、データの格納されている既存のデータベースからデ
ータ格納情報を取得し、当該取得したデータ格納情報を
参照しつつ既存のデータベースに格納されたレコードか
らデータの特徴を算出して、当該算出したデータの特徴
を用いて開発対象のデータベースに必要なテストデータ
を生成し、当該生成したテストデータを開発対象のデー
タベースに格納するので、実稼働している既存のデータ
ベースに格納されているデータを用いて、より一層実情
に即したダミーのテストデータを生成することができ、
データベースのチューニングを適切に行うことができ
る。
According to the above configuration, when generating test data necessary for reconstructing an existing database, data storage information is acquired from the existing database in which data is stored, and the acquired data storage is acquired. Calculate the data characteristics from the records stored in the existing database while referring to the information, generate the test data required for the database to be developed using the calculated data characteristics, and compile the generated test data. Since it is stored in the development target database, it is possible to generate dummy test data that is more realistic based on the data stored in the existing database that is in operation,
The database can be tuned appropriately.

【0041】この場合、例えば、請求項10に記載する
ように、前記テストデータ生成方法は、前記特徴算出処
理で、前記既存のデータベースに格納された前記データ
の統計的な特徴を算出し、前記テストデータ生成処理
で、当該特徴算出処理で算出した統計的な特徴を用いて
前記テストデータを生成してもよい。
In this case, for example, in the test data generation method, the test data generation method calculates a statistical characteristic of the data stored in the existing database in the characteristic calculation process. In the test data generation process, the test data may be generated using the statistical features calculated in the feature calculation process.

【0042】上記構成によれば、既存のデータベースに
格納されたデータの統計的な特徴を算出して、当該算出
した統計的な特徴を用いてテストデータを生成するの
で、実情に即した所望の件数のテストデータを生成する
ことができ、データベースのチューニングを簡単かつ適
切に行うことができる。
According to the above configuration, the statistical characteristics of the data stored in the existing database are calculated, and the test data is generated using the calculated statistical characteristics. The number of test data can be generated, and the database can be tuned easily and appropriately.

【0043】また、例えば、請求項11に記載するよう
に、前記テストデータ生成方法は、前記特徴算出処理
で、前記既存のデータベースに格納されている一部のレ
コードをサンプリングして得られたデータを前記特徴の
算出に用いてもよい。
For example, according to the present invention, in the method for generating test data, in the feature calculation processing, data obtained by sampling some records stored in the existing database may be used. May be used for calculating the feature.

【0044】上記構成によれば、既存のデータベースに
格納されている一部のレコードをサンプリングして得ら
れたデータ特徴の算出に用いているので、特徴を算出す
るための既存のデータベースからのサンプル数を調整し
て、特徴算出に要する処理時間を削減することができ、
実情に即した所望の件数のテストデータを速やかに生成
して、データベースのチューニングを速やかにかつ適切
に行うことができる。
According to the above configuration, some records stored in the existing database are sampled and used to calculate data characteristics. Therefore, a sample from the existing database for calculating the characteristics is used. By adjusting the number, the processing time required for feature calculation can be reduced,
It is possible to quickly generate a desired number of test data according to the actual situation, and quickly and appropriately tune the database.

【0045】さらに、例えば、請求項12に記載するよ
うに、前記テストデータ生成方法は、前記特徴算出処理
で、前記レコード内のデータが数値データ型であると、
前記既存のデータベースにおける当該データの値の分布
に基づいてランダムなデータを生成し、当該データを前
記特徴の算出に用いてもよい。
Further, for example, in the test data generating method according to the present invention, in the feature calculation process, if the data in the record is a numerical data type,
Random data may be generated based on a distribution of values of the data in the existing database, and the data may be used for calculating the feature.

【0046】上記構成によれば、レコード内のデータが
数値データ型であると、既存のデータベースにおける当
該データの値の分布に基づいてランダムなデータを生成
し、当該データを特徴の算出に用いているので、データ
が数値データ型である場合にも、実情に即したテストデ
ータを生成することができ、データベースのチューニン
グを簡単かつ適切に行うことができる。
According to the above configuration, if the data in the record is of a numeric data type, random data is generated based on the distribution of the values of the data in the existing database, and the data is used for calculating the characteristics. Therefore, even when the data is of a numerical data type, test data can be generated according to the actual situation, and the database can be tuned easily and appropriately.

【0047】また、例えば、請求項13に記載するよう
に、前記テストデータ生成方法は、前記特徴算出処理
で、前記レコード内のデータが非数値データ型である
と、前記既存のデータベースにおける当該データのデー
タ長に基づいてランダムなデータを生成し、当該データ
を前記特徴の算出に用いてもよい。
Further, for example, in the test data generating method according to the present invention, if the data in the record is a non-numeric data type in the feature calculation process, May be used to generate random data based on the data length, and use the data for calculating the feature.

【0048】上記構成によれば、レコード内のデータが
非数値データ型であると、既存のデータベースにおける
当該データのデータ長に基づいてランダムなデータを生
成し、当該データを特徴の算出に用いているので、デー
タが非数値データ型である場合にも、実情に即したテス
トデータを生成することができ、データベースのチュー
ニングを簡単かつ適切に行うことができる。
According to the above configuration, if the data in the record is of a non-numeric data type, random data is generated based on the data length of the data in the existing database, and the data is used for calculating the feature. Therefore, even when the data is of a non-numeric data type, test data can be generated according to the actual situation, and database tuning can be performed easily and appropriately.

【0049】さらに、例えば、請求項14に記載するよ
うに、前記テストデータ生成方法は、前記格納処理で、
前記データ格納情報取得処理で取得した前記データ格納
情報を用い、テーブル間の参照関係を考慮して、前記生
成されたテストデータを前記開発対象のデータベースに
格納してもよい。
Further, for example, according to the present invention, the test data generating method includes the steps of:
The generated test data may be stored in the development target database by using the data storage information acquired in the data storage information acquisition process and considering a reference relationship between tables.

【0050】上記構成によれば、データ格納情報を用い
てテーブル間の参照関係を考慮して、生成されたテスト
データを開発対象のデータベースに格納するので、テー
ブル間に参照による制約があるようなデータベース構造
であっても、テストデータを適切に格納することがで
き、データベースのチューニングを簡単かつ適切に行う
ことができる。
According to the above configuration, the generated test data is stored in the development target database in consideration of the reference relation between the tables using the data storage information. Even with a database structure, test data can be appropriately stored, and database tuning can be performed easily and appropriately.

【0051】また、例えば、請求項15に記載するよう
に、前記テストデータ生成方法は、前記格納処理で、前
記生成されたテストデータを前記開発対象のデータベー
スに格納するに際し、当該生成されたテストデータのレ
コードをキーに従ってソートして、重複したレコードを
削除してもよい。
For example, as described in claim 15, in the test data generation method, when the generated test data is stored in the database to be developed in the storage processing, the generated test data is stored in the database. Data records may be sorted according to the key to remove duplicate records.

【0052】上記構成によれば、生成されたテストデー
タを開発対象のデータベースに格納するに際し、当該生
成されたテストデータのレコードをキーに従ってソート
して、重複したレコードを削除するので、生成されたテ
ストデータを開発対象のデータベースに格納する際の処
理時間を削減することができ、データベースのチューニ
ングを速やかにかつ適切に行うことができる。
According to the above configuration, when storing the generated test data in the database to be developed, the records of the generated test data are sorted according to the key, and duplicate records are deleted. Processing time for storing test data in the development target database can be reduced, and database tuning can be performed quickly and appropriately.

【0053】請求項16記載の発明の記録媒体は、既存
のデータベースの再構築を行う際に必要なテストデータ
を生成するテストデータ生成プログラムであって、デー
タの格納されている前記既存のデータベースからデータ
格納情報を取得するデータ格納情報取得処理ステップ
と、当該データ格納情報を参照しつつ前記既存のデータ
ベースに格納されたレコードから前記データの特徴を算
出する特徴算出処理ステップと、前記特徴算出処理で算
出した前記データの特徴を用いて開発対象のデータベー
スに必要なテストデータを生成するテストデータ生成処
理ステップと、前記テストデータ生成処理で生成した前
記テストデータを前記開発対象のデータベースに格納す
る格納処理ステップと、を含むテストデータ生成プログ
ラムを記録することにより、上記目的を達成している。
The recording medium according to the present invention is a test data generating program for generating test data required for reconstructing an existing database, wherein the test data is generated from the existing database in which data is stored. A data storage information acquisition processing step of acquiring data storage information; a feature calculation processing step of calculating a feature of the data from a record stored in the existing database with reference to the data storage information; A test data generation processing step of generating test data necessary for a development target database using the calculated characteristics of the data, and a storage processing of storing the test data generated in the test data generation processing in the development target database Recording a test data generator including steps More, it has achieved the above object.

【0054】上記構成によれば、記録媒体に、既存のデ
ータベースの再構築を行う際に必要なテストデータを生
成するテストデータ生成プログラムであって、データの
格納されている既存のデータベースからデータ格納情報
を取得するデータ格納情報取得処理ステップと、当該デ
ータ格納情報を参照しつつ既存のデータベースに格納さ
れたレコードからデータの特徴を算出する特徴算出処理
ステップと、特徴算出処理で算出したデータの特徴を用
いて開発対象のデータベースに必要なテストデータを生
成するテストデータ生成処理ステップと、テストデータ
生成処理で生成したテストデータを開発対象のデータベ
ースに格納する格納処理ステップと、を含むテストデー
タ生成プログラムを記録しているので、当該記録媒体を
情報処理装置に読み取らせることで、テストデータ生成
システムを構築することができ、実稼働している既存の
データベースに格納されているデータを用いて、より一
層実情に即したダミーのテストデータを生成して、デー
タベースのチューニングを適切に行うことができる。
According to the above configuration, there is provided a test data generating program for generating test data necessary for reconstructing an existing database on a recording medium, and storing data from the existing database in which data is stored. A data storage information acquisition processing step of acquiring information; a characteristic calculation processing step of calculating data characteristics from records stored in an existing database while referring to the data storage information; and a data characteristic calculated by the characteristic calculation processing A test data generation program including: a test data generation processing step of generating test data necessary for a development target database by using the test data generation method; and a storage processing step of storing test data generated in the test data generation processing in the development target database. Is stored in the information processing device. By taking this, a test data generation system can be built, and dummy data that is more relevant to the actual situation is generated using data stored in an existing database that is in operation. Tuning can be performed appropriately.

【0055】[0055]

【発明の実施の形態】以下、本発明の好適な実施の形態
を添付図面に基づいて詳細に説明する。なお、以下に述
べる実施の形態は、本発明の好適な実施の形態であるか
ら、技術的に好ましい種々の限定が付されているが、本
発明の範囲は、以下の説明において特に本発明を限定す
る旨の記載がない限り、これらの態様に限られるもので
はない。
Preferred embodiments of the present invention will be described below in detail with reference to the accompanying drawings. It should be noted that the embodiments described below are preferred embodiments of the present invention, and therefore, various technically preferable limitations are added. However, the scope of the present invention is not limited to the following description. The embodiments are not limited to these embodiments unless otherwise specified.

【0056】図1〜図10は、本発明のテストデータ生
成装置、テストデータ生成方法及び記録媒体の一実施の
形態を示す図であり、図1は、本発明のテストデータ生
成装置、テストデータ生成方法及び記録媒体の一実施の
形態を適用したテストデータ生成装置1のブロック構成
図である。
FIGS. 1 to 10 are diagrams showing an embodiment of a test data generation device, a test data generation method and a recording medium according to the present invention. FIG. FIG. 1 is a block diagram of a test data generation device 1 to which an embodiment of a generation method and a recording medium is applied.

【0057】図1において、テストデータ生成装置1
は、データベース2、データベース管理部3、データ格
納情報取得部4、特徴算出部5、データ生成部6、デー
タ格納部7、データベース管理部8及びデータベース9
等を備えており、データベースのチューニング用のテス
トデータを生成する。
In FIG. 1, a test data generating device 1
Is a database 2, a database management unit 3, a data storage information acquisition unit 4, a feature calculation unit 5, a data generation unit 6, a data storage unit 7, a database management unit 8, and a database 9.
And the like to generate test data for database tuning.

【0058】このテストデータ生成装置1は、コンピュ
ータ(計算機)等にCD(CompactDisc)、MO(光磁
気ディスク)、あるいは、フロッピー(登録商標)ディ
スク等の記録媒体に記録されているテストデータ生成プ
ログラムを読み取らせることにより構築されている。
The test data generating apparatus 1 is a computer (computer) or the like that has a test data generating program recorded on a recording medium such as a CD (Compact Disc), MO (magneto-optical disk), or floppy (registered trademark) disk. It is built by letting you read.

【0059】なお、本実施の形態では、テストデータと
して、リレーショナルデータを取り上げて説明する。
In this embodiment, relational data will be described as test data.

【0060】テストデータ2は、ハードディスクやRA
M(Random Access Memory)等の読み書き可能なメモリ
に格納されており、テストデータを生成するもととなる
既存のデータベースである。
The test data 2 is stored on a hard disk or RA
This is an existing database that is stored in a readable and writable memory such as M (Random Access Memory) and is used to generate test data.

【0061】データベース管理部3は、テストデータ2
の管理を行って、テストデータ2の格納及び読出を行
う。
The database management unit 3 stores the test data 2
And test data 2 is stored and read out.

【0062】データ格納情報取得部(データ格納情報取
得手段)4は、データベース管理部3を介してデータベ
ース2に格納されている格納情報、例えば、テーブル、
カラム、データ型、キー属性及び外部参照制約等の定義
情報等を読み出す。このデータ定義の形式は、SQL
(Structured Query Language)文による定義等であ
る。
The data storage information obtaining unit (data storage information obtaining means) 4 stores storage information stored in the database 2 via the database management unit 3, for example, a table,
Read definition information such as columns, data types, key attributes, and external reference constraints. The format of this data definition is SQL
(Structured Query Language).

【0063】特徴算出部(特徴算出手段)5は、データ
格納情報取得部4の取得した格納情報を参照しつつ、デ
ータベース管理部3を介してデータベース2のテーブル
に格納されているレコードを読み出し、カラムデータの
特徴を算出する。
The feature calculation unit (feature calculation means) 5 reads the record stored in the table of the database 2 via the database management unit 3 while referring to the storage information acquired by the data storage information acquisition unit 4, Calculate the characteristics of the column data.

【0064】データ生成部(テストデータ生成手段)6
は、特徴算出部5の算出したカラムデータの特徴を用い
てテストデータを生成し、生成したテストデータをデー
タ格納部7に出力する。
Data generator (test data generator) 6
Generates test data using the characteristics of the column data calculated by the characteristic calculation unit 5 and outputs the generated test data to the data storage unit 7.

【0065】データベース9は、ハードディスクやRA
M等の読み書き可能なメモリに格納されており、生成さ
れたテストデータに基づいて開発される開発対象のデー
タベースである。
The database 9 includes a hard disk and RA
A development target database stored in a readable / writable memory such as M and developed based on the generated test data.

【0066】データベース管理部8は、データベース9
の管理を行って、データベース9の格納及び読出を行
う。
The database management unit 8 stores the database 9
, And store and read out the database 9.

【0067】データ格納部(格納手段)7は、データ生
成部6の生成したデータをまとめて必要件数のレコード
とし、データベース管理部8を介して上記開発対象のデ
ータベース9に格納する。この開発対象のデータベース
9におけるテーブルの定義等は予め行われている。
The data storage unit (storage means) 7 collects the data generated by the data generation unit 6 into a record of a required number and stores it in the development target database 9 via the database management unit 8. The definition of the table in the database 9 to be developed is performed in advance.

【0068】次に、本実施の形態の作用を説明する。本
実施の形態のテストデータ作成装置1は、既存のデータ
ベース2の特徴を基にテストデータを作成して開発対象
のデータベース9に格納するところにその特徴がある。
Next, the operation of the present embodiment will be described. The test data creation apparatus 1 according to the present embodiment is characterized in that test data is created based on the features of the existing database 2 and stored in the database 9 to be developed.

【0069】すなわち、テストデータ作成装置1は、図
2に示すように、既存のデータベース2に対してテスト
データの生成を行う場合、まず、ユーザーがテストデー
タ生成のパラメータをテストデータ作成装置1を構築し
たコンピュータのキーボード等から入力することによ
り、あるいは、予め作成したパラメータを記憶した記録
媒体を読み取らせること等により、パラメータの設定を
行う(ステップS101)。
That is, as shown in FIG. 2, when generating test data for the existing database 2, the test data generating apparatus 1 first sets the test data generating parameters by the user. The parameters are set by inputting from a built-in computer keyboard or the like, or by reading a recording medium storing the parameters created in advance (step S101).

【0070】テストデータ作成装置1は、パラメータの
設定が行われると、データベース管理部3により既存の
データベース2に接続を行って(ステップS102)、
データ格納情報取得部4がデータベース管理部3を介し
て既存のデータベース2内のデータ格納情報を取得する
データ格納情報取得処理を行う(ステップS103)。
When the parameters are set, the test data creation device 1 connects to the existing database 2 by the database management unit 3 (step S102).
The data storage information acquisition unit 4 performs a data storage information acquisition process of acquiring data storage information in the existing database 2 via the database management unit 3 (step S103).

【0071】次に、テストデータ作成装置1は、データ
格納情報取得部4の取得したデータ格納情報を参照しつ
つ、特徴算出部5が既存データベース2のテーブルに格
納されているレコードを読み出して、カラムデータの特
徴を算出する特徴算出処理を行い(ステップS10
4)、データベース2をデータベース管理部3から切り
離す(ステップS105)。
Next, in the test data creation device 1, the feature calculation unit 5 reads the record stored in the table of the existing database 2 while referring to the data storage information acquired by the data storage information acquisition unit 4, A characteristic calculation process for calculating the characteristics of the column data is performed (step S10).
4), disconnect the database 2 from the database management unit 3 (step S105).

【0072】テストデータ作成装置1は、既存データベ
ース2の特徴の算出を行うと、データ生成部6が当該既
存データベース2の特徴を用いてテストデータの生成を
行うテストデータ生成処理を行い(ステップS10
6)、テストデータを生成すると、データベース管理部
8を開発対象のデータベース9に接続する(ステップS
107)。
After calculating the characteristics of the existing database 2, the test data generation device 1 performs the test data generation process in which the data generation unit 6 generates test data using the characteristics of the existing database 2 (step S10).
6) When the test data is generated, the database management unit 8 is connected to the development target database 9 (step S).
107).

【0073】テストデータ作成装置1は、作成したテス
トデータのレコードをデータ格納部7がデータベース管
理部8を介して開発対象のデータベース9に格納するテ
ストデータ格納処理を行い(ステップS108)、テス
トデータの格納が完了すると、データベース9をデータ
ベース管理部8から開放して、処理を終了する(ステッ
プS109)。
The test data creation device 1 performs a test data storage process in which the data storage unit 7 stores the created record of the test data in the development target database 9 via the database management unit 8 (step S108). Is completed, the database 9 is released from the database management unit 8, and the process is terminated (step S109).

【0074】そして、テストデータ作成装置1は、上記
ステップS104の特徴算出部5での特徴算出処理を、
例えば、図3に示すように、既存のデータベース2に格
納されている一部のレコードをサンプリングして得られ
たデータを特徴算出に用いることにより行っている。
Then, the test data creating apparatus 1 performs the feature calculation process in the feature calculation unit 5 in step S104.
For example, as shown in FIG. 3, this is performed by using data obtained by sampling some records stored in the existing database 2 for feature calculation.

【0075】すなわち、特徴算出部51は、図2のステ
ップS104の特徴算出処理において、図3に示すよう
に、まず、テストデータ生成に必要な既存データベース
2内のテーブル名のリストをセットし(ステップS20
1)、図2のステップS101で設定されたテストパラ
メータとしてのテーブル毎のサンプリング数に基づい
て、レコードをサンプリングする(ステップS20
2)。このレコードのサンプリングは、例えば、テスト
データ作成装置1が各テーブル毎に各レコードに対して
一意に付加するIDのリストからランダムに取り出す。
That is, in the feature calculation process of step S104 in FIG. 2, the feature calculation unit 51 first sets a list of table names in the existing database 2 necessary for test data generation as shown in FIG. Step S20
1), records are sampled based on the sampling number for each table as a test parameter set in step S101 of FIG. 2 (step S20)
2). The sampling of the record is, for example, randomly extracted from a list of IDs uniquely added to each record by the test data creating apparatus 1 for each table.

【0076】レコードのサンプリングを行うと、特徴算
出部5は、図2のステップS101で設定されたテスト
パラメータ及びステップS103で取得したデータ格納
情報に基づいて、カラム毎にデータ型、特徴算出方法の
指定等のパラメータをセットし(ステップS203)、
このセットしたパラメータ(設定値)に基づいて特徴の
算出を行う(ステップS204)。
When the record is sampled, the feature calculation unit 5 determines the data type and the feature calculation method for each column based on the test parameters set in step S101 of FIG. 2 and the data storage information obtained in step S103. Set parameters such as designation (step S203),
The feature is calculated based on the set parameters (set values) (step S204).

【0077】特徴算出部5は、当該カラムに対して特徴
の算出を行うと、全てのカラムについて特徴の算出が終
了したかチェックし(ステップS205)、全てのカラ
ムについて特徴の算出が終了していないときには、ステ
ップS203に戻って、カラム毎のパラメータ(設定
値)のセットから上記同様の処理を行う(ステップS2
03〜S205)。
When the feature calculation unit 5 calculates the feature for the column, it checks whether the calculation of the feature has been completed for all columns (step S205), and the calculation of the feature has been completed for all columns. If not, the process returns to step S203, and the same processing is performed from the set of parameters (set values) for each column (step S2).
03 to S205).

【0078】ステップS205で、全てのカラムについ
て特徴の算出が終了すると、特徴算出部5は、全てのテ
ーブルについて特徴の算出が終了したかチェックし(ス
テップS206)、全てのテーブルについて特徴の算出
が終了していないときには、ステップS202に戻っ
て、レコードのサンプリングから上記同様に処理する
(ステップS202〜S206)。
When the calculation of the characteristics for all the columns is completed in step S205, the characteristic calculation unit 5 checks whether the calculation of the characteristics is completed for all the tables (step S206), and the calculation of the characteristics for all the tables is completed. If the processing has not been completed, the process returns to step S202, and the same processing is performed from the sampling of records (steps S202 to S206).

【0079】ステップS206で、全てのテーブルにつ
いて特徴の算出が完了すると、特徴算出部5は、特徴算
出処理を終了する。
When the calculation of the characteristics for all the tables is completed in step S206, the characteristic calculating section 5 ends the characteristic calculating process.

【0080】そして、特徴算出部5は、上記図3のステ
ップS204の特徴算出処理において、例えば、図4に
示すように、既存のデータベース2に格納されたデータ
の統計的な特性を用いて特徴算出を行う。
Then, in the feature calculation process of step S204 in FIG. 3, the feature calculation unit 5 uses the statistical characteristics of the data stored in the existing database 2 as shown in FIG. Perform the calculation.

【0081】すなわち、特徴算出部5は、図4に示すよ
うに、まず、図3のステップS202及びステップS2
03でサンプリングされたレコードの注目するカラムの
データの集合に対して、度数分布を作成する(ステップ
S301)。
That is, as shown in FIG. 4, the feature calculating unit 5 first executes the steps S202 and S2 in FIG.
A frequency distribution is created for the set of data of the column of interest in the record sampled at 03 (step S301).

【0082】この度数分布の作成は、例えば、カラムの
データ型が整数型の数値データであると、例えば、図3
のステップS202でサンプリングされた500件のレ
コードについてその度数分布を作成する。この度数分布
は、例えば、図5に示すようになる。図5において、横
軸は、データの値であり、縦軸は、レコード件数であ
る。
This frequency distribution is created, for example, when the data type of the column is integer-type numeric data, as shown in FIG.
The frequency distribution is created for the 500 records sampled in step S202. This frequency distribution is, for example, as shown in FIG. In FIG. 5, the horizontal axis is the data value, and the vertical axis is the number of records.

【0083】特徴算出部5は、度数分布を作成すると、
累積度数分布を作成して、既存データベース2の特徴の
算出を行う(ステップS302)。この累積度数分布
は、例えば、図6に示すようになる。図6において、横
軸は、データの値であり、縦軸は、レコード件数であ
る。
When the feature calculation unit 5 creates the frequency distribution,
A cumulative frequency distribution is created, and the characteristics of the existing database 2 are calculated (step S302). This cumulative frequency distribution is, for example, as shown in FIG. In FIG. 6, the horizontal axis is the data value, and the vertical axis is the number of records.

【0084】そして、テストデータ作成装置1は、上記
図2のステップS106のテストデータ生成部6による
テストデータ生成処理を、例えば、図7に示すように、
既存データベース2に格納されたデータの統計的な特性
を用いて行う。
Then, the test data generating apparatus 1 performs the test data generating process by the test data generating section 6 in step S106 in FIG. 2 as shown in FIG.
This is performed using the statistical characteristics of the data stored in the existing database 2.

【0085】すなわち、テストデータ生成部6は、図7
に示すように、テストデータ生成に必要な開発対象のデ
ータベース9内のテーブル名のリストをセットし(ステ
ップS401)、テーブル毎に、図2のステップS10
1でユーザーにより設定されたパラメータであるテスト
用のレコード数を設定する(ステップS402)。
That is, the test data generating unit 6
As shown in (1), a list of table names in the development target database 9 required for test data generation is set (step S401), and for each table, a list of steps S10 in FIG.
The number of test records, which is a parameter set by the user in step 1, is set (step S402).

【0086】次に、テストデータ生成部6は、図2のス
テップS101でユーザーにより設定されたパラメータ
及びステップS103で取得したデータ格納情報から、
カラム毎にデータ型や図3のステップS204で得られ
た特徴算出方法の指定等のパラメータを設定し(ステッ
プS403)、この設定したパラメータに基づいて当該
カラムに対するランダムデータを算出する(ステップS
404)。
Next, the test data generation unit 6 calculates the parameters based on the parameters set by the user in step S101 of FIG. 2 and the data storage information obtained in step S103.
Parameters such as the data type and the specification of the feature calculation method obtained in step S204 of FIG. 3 are set for each column (step S403), and random data for the column is calculated based on the set parameters (step S403).
404).

【0087】テストデータ生成部6は、ランダムデータ
を生成すると、全てのカラムについてランダムデータの
生成を完了したかチェックし(ステップS405)、全
てのカラムについてランダムデータの生成が完了してい
ないときには、ステップS403に戻って、カラム毎の
パラメータの設定から上記同様に処理する(ステップS
403〜S405)。
When generating the random data, the test data generation unit 6 checks whether the generation of the random data has been completed for all the columns (step S405). If the generation of the random data has not been completed for all the columns, Returning to step S403, the same processing is performed from the setting of the parameter for each column (step S403).
403-S405).

【0088】ステップS405で、全てのカラムについ
てランダムデータの生成を完了すると、テストデータ生
成部6は、各カラムについて得られたランダムデータを
連結して1つのレコードを生成し(ステップS40
6)、ステップS402で設定した規定レコード数に達
したかチェックする(ステップS407)。
When the generation of random data for all columns is completed in step S405, the test data generating unit 6 generates one record by connecting the random data obtained for each column (step S40).
6) It is checked whether the specified number of records set in step S402 has been reached (step S407).

【0089】ステップS407で、規定レコード数に達
していないときには、テストデータ生成部6は、ステッ
プS403に戻って、カラム毎のパラメータの設定から
上記同様に処理し(ステップS403〜S407)、ス
テップS407で、規定レコード数に達していると、全
てのテーブルについて処理が完了したかチェックする
(ステップS408)。
If the number of records has not reached the specified number in step S407, the test data generator 6 returns to step S403 and performs the same processing as described above from the setting of parameters for each column (steps S403 to S407). If the specified number of records has been reached, it is checked whether the processing has been completed for all tables (step S408).

【0090】ステップS408で、全てのテーブルにつ
いて処理を完了していないときには、テストデータ生成
部6は、ステップS402に戻って、次のテーブルにつ
いてレコード数を設定することから上記同様に処理し
(ステップS402〜S408)、ステップS408
で、全てのテーブルについて処理を完了すると、テスト
データ生成処理を終了する。
If the processing has not been completed for all the tables in step S408, the test data generation unit 6 returns to step S402 and sets the number of records for the next table, thus performing the same processing as described above (step S408). S402 to S408), step S408
When the processing is completed for all tables, the test data generation processing ends.

【0091】そして、テストデータ生成部6は、この図
7のステップS404におけるランダムデータの生成処
理を、例えば、図8に示すように、既存のデータベース
2に格納されているデータの統計的な特性を用いて行
う。
Then, the test data generation unit 6 performs the random data generation processing in step S404 in FIG. 7 by, for example, as shown in FIG. 8, the statistical characteristics of the data stored in the existing database 2. This is performed using

【0092】すなわち、テストデータ生成部6は、図8
に示すように、まず、「0」から「1」の間の一様乱数
を生成し(ステップS501)、図3のステップS20
2でサンプリングされた500件のレコードについて、
図4のステップS302で作成した累積度数分布(図6
参照)を元に、この特性に基づいたランダムなデータを
生成する(ステップS502)。すなわち、ステップS
502では、実データの度数分布を考慮した乱数を生成
する。
That is, the test data generation unit 6
As shown in (1), first, a uniform random number between "0" and "1" is generated (step S501), and step S20 in FIG.
For 500 records sampled in 2,
The cumulative frequency distribution created in step S302 in FIG.
), Random data is generated based on this characteristic (step S502). That is, step S
At 502, a random number is generated in consideration of the frequency distribution of the actual data.

【0093】この一様分布以外の分布に従った乱数の生
成方法としては、一般に、逆関数法や選択−棄却法等が
知られており、例えば、逆関数法で乱数の生成を行う場
合には、以下のように行う。すなわち、例えば、図6に
示したような累積度数分布が得られた場合、まず、この
累積度数分布を総サンプリング数である500で除算す
る。この除算した値は、図9に示すようになる。次に、
この図9に示したような除算値を、サンプリングしたデ
ータの最小値において「0」、最大値において[1]と
なるように、解析的な関数で近似する。このようにして
近似した結果は、図10に示すようになる。そして、こ
の近似値を、分布関数y=F(x)とみなして、ステッ
プS501で生成した一様乱数をy0とすると、求める
乱数x0は、図10に矢印で示すように、分布関数y=
F(x)の逆関数として、x0=F- 1(y0)により算出
される。
As a method of generating random numbers according to a distribution other than the uniform distribution, generally, an inverse function method, a selection-rejection method, and the like are known. Is performed as follows. That is, for example, when the cumulative frequency distribution as shown in FIG. 6 is obtained, first, the cumulative frequency distribution is divided by 500 which is the total sampling number. This divided value is as shown in FIG. next,
The division value as shown in FIG. 9 is approximated by an analytical function such that the minimum value of the sampled data is “0” and the maximum value is “1”. The result of the approximation in this way is as shown in FIG. Then, assuming that the approximate value is the distribution function y = F (x) and the uniform random number generated in step S501 is y 0 , the random number x 0 to be obtained is represented by the distribution function y =
As an inverse function of F (x), x 0 = F - is calculated by 1 (y 0).

【0094】また、既存のデータベース2のデータ型が
文字型、すなわち、非数値型の場合には、ランダムな数
を文字数とすることにより、すなわち、既存のデータベ
ースのデータのデータ長の分布を元に、ランダムな文字
列を生成することができる。
When the data type of the existing database 2 is a character type, that is, a non-numeric type, a random number is used as the number of characters, that is, based on the distribution of the data length of the data of the existing database. In addition, a random character string can be generated.

【0095】そして、上述のようにして生成したテスト
データを開発対象のデータベース9に格納するテストデ
ータ格納処理は、例えば、図2のステップS103で取
得した既存のデータベース2内のデータ格納情報を用い
てテーブル間の参照関係を考慮した格納を行うととも
に、キー(外部キー)の制約によるテーブル間の参照関
係を考慮した格納を行う。
The test data storage processing for storing the test data generated as described above in the development target database 9 uses, for example, the data storage information in the existing database 2 acquired in step S103 in FIG. In addition to performing storage in consideration of the reference relationship between tables, storage is also performed in consideration of the reference relationship between tables due to restrictions on keys (foreign keys).

【0096】すなわち、いま、リレーショナルデータベ
ース内のテーブルと参照関係を、便宜的にテーブルを頂
点(テーブル→頂点)、参照関係を有向辺(参照の方向
は辺の向きと同一)(参照関係→有向辺)とした有向グ
ラフG=(V,E)とみなす。なお、Vは、頂点の集
合、Eは、辺の集合とする。
That is, the table and the reference relation in the relational database are referred to as vertices (table → vertex) for convenience, and the reference relation is directed side (the direction of reference is the same as the side direction) (reference relation → It is assumed that a directed graph G = (V, E) with a directed edge. Note that V is a set of vertices, and E is a set of edges.

【0097】このようにした場合、外部キー(FK)の
制約による参照関係を考慮したレコードの挿入順は、頂
点xと頂点yを結ぶ辺edge(x,y)∈Eに対して、nu
m (x)<num (y)を満たすような番号num (v)を
割り当てることによって得られる頂点の順序となる。
In this case, the insertion order of records in consideration of the reference relationship due to the restriction of the foreign key (FK) is such that the edge (x, y) ∈E connecting vertex x and vertex y is nu
The order of the vertices is obtained by assigning a number num (v) that satisfies m (x) <num (y).

【0098】そこで、データ格納部7は、データ生成部
6から生成したテストデータを受け取ると、上述のよう
にして求めた順序に従ってテーブル毎にレコードを格納
する。
[0098] Upon receiving the test data generated from the data generation unit 6, the data storage unit 7 stores records for each table in the order obtained as described above.

【0099】また、テストデータ生成装置1は、上述の
ようにして生成したテストデータを開発対象のデータベ
ース9に格納するテストデータ格納処理において、デー
タ格納部7が、当該生成されたテストデータのレコード
をキーに従ってソートし、重複したレコードを削除す
る。
In the test data storage processing for storing the test data generated as described above in the database 9 to be developed, the test data generation device 1 stores the test data in the record of the generated test data. Is sorted according to the key, and duplicate records are deleted.

【0100】このように、本実施の形態によれば、既存
のデータベース2の再構築を行う際に必要なテストデー
タを生成するに際して、データの格納されている既存の
データベース2からデータ格納情報を取得し、当該取得
したデータ格納情報のうちレコード情報からデータの特
徴を算出して、当該算出したデータの特徴を用いて開発
対象のデータベース9に必要なテストデータを生成し、
当該生成したテストデータを開発対象のデータベース9
に格納している。
As described above, according to the present embodiment, when the test data necessary for reconstructing the existing database 2 is generated, the data storage information is extracted from the existing database 2 in which the data is stored. Acquisition, calculating data characteristics from the record information in the obtained data storage information, generating test data necessary for the development target database 9 using the calculated data characteristics,
The generated test data is stored in the database 9 to be developed.
Is stored in

【0101】したがって、実稼働している既存のデータ
ベース2に格納されているデータを用いて、より一層実
情に即したダミーのテストデータを生成することがで
き、データベース2のチューニングを適切に行うことが
できる。
Therefore, it is possible to generate dummy test data more in accordance with the actual situation by using data stored in the existing database 2 that is actually operating, and to appropriately tune the database 2. Can be.

【0102】また、本実施の形態は、既存のデータベー
ス2に格納されたデータの統計的な特徴を算出して、当
該算出した統計的な特徴を用いてテストデータを生成し
ている。
In the present embodiment, the statistical characteristics of the data stored in the existing database 2 are calculated, and the test data is generated using the calculated statistical characteristics.

【0103】したがって、実情に即した所望の件数のテ
ストデータを生成することができ、データベース2のチ
ューニングを簡単かつ適切に行うことができる。
Therefore, it is possible to generate a desired number of test data according to the actual situation, and it is possible to easily and appropriately tune the database 2.

【0104】さらに、本実施の形態は、既存のデータベ
ース2に格納されている一部のレコードをサンプリング
して得られたデータをデータベース2のデータの特徴の
算出を行うのに用いている。
Further, in this embodiment, data obtained by sampling a part of records stored in the existing database 2 is used to calculate the characteristics of the data in the database 2.

【0105】したがって、特徴を算出するための既存の
データベース2からのサンプル数を調整して、特徴算出
に要する処理時間を削減することができ、実情に即した
所望の件数のテストデータを速やかに生成して、データ
ベース2のチューニングを速やかにかつ適切に行うこと
ができる。
Therefore, the processing time required for the feature calculation can be reduced by adjusting the number of samples from the existing database 2 for calculating the feature, and the desired number of test data according to the actual situation can be quickly obtained. By generating it, tuning of the database 2 can be performed promptly and appropriately.

【0106】また、本実施の形態は、既存のデータベー
ス2のレコード内のデータが数値データ型であると、既
存のデータベース2における当該データの値の分布に基
づいてランダムなデータを生成し、当該データを特徴の
算出に用いている。
Further, in the present embodiment, if the data in the record of the existing database 2 is of a numerical data type, random data is generated based on the distribution of the value of the data in the existing database 2, and The data is used to calculate features.

【0107】したがって、既存のデータベース2のデー
タが数値データ型である場合にも、実情に即したテスト
データを生成することができ、データベース2のチュー
ニングを簡単かつ適切に行うことができる。
Therefore, even when the data of the existing database 2 is a numerical data type, it is possible to generate test data according to the actual situation, and the tuning of the database 2 can be performed easily and appropriately.

【0108】さらに、本実施の形態は、既存のデータベ
ース2のレコード内のデータが非数値データ型である
と、既存のデータベース2における当該データのデータ
長に基づいてランダムなデータを生成し、当該データを
特徴の算出に用いている。
Further, in the present embodiment, if the data in the record of the existing database 2 is of a non-numerical data type, random data is generated based on the data length of the data in the existing database 2, and The data is used to calculate features.

【0109】したがって、既存のデータベース2のデー
タが非数値データ型である場合にも、実情に即したテス
トデータを生成することができ、データベース2のチュ
ーニングを簡単かつ適切に行うことができる。
Therefore, even when the data of the existing database 2 is of a non-numerical data type, it is possible to generate test data according to the actual situation, and the tuning of the database 2 can be performed easily and appropriately.

【0110】また、本実施の形態は、データ格納情報を
用いてテーブル間の参照関係を考慮して、生成されたテ
ストデータを開発対象のデータベース9に格納してい
る。
In this embodiment, the generated test data is stored in the development target database 9 in consideration of the reference relation between the tables using the data storage information.

【0111】したがって、テーブル間に参照による制約
があるようなデータベース構造であっても、テストデー
タを適切に格納することができ、データベース2のチュ
ーニングを簡単かつ適切に行うことができる。
Therefore, even in a database structure in which there is a reference restriction between tables, test data can be appropriately stored, and tuning of the database 2 can be performed easily and appropriately.

【0112】さらに、生成されたテストデータを開発対
象のデータベース9に格納するに際し、当該生成された
テストデータのレコードをキーに従ってソートして、重
複したレコードを削除している。
Further, when storing the generated test data in the database 9 to be developed, the records of the generated test data are sorted according to the key, and duplicate records are deleted.

【0113】したがって、生成されたテストデータを開
発対象のデータベース9に格納する際の処理時間を削減
することができ、データベース2のチューニングを速や
かにかつ適切に行うことができる。
Therefore, the processing time for storing the generated test data in the development target database 9 can be reduced, and the tuning of the database 2 can be performed quickly and appropriately.

【0114】また、本実施の形態は、記録媒体に、既存
のデータベースの再構築を行う際に必要なテストデータ
を生成するテストデータ生成プログラムであって、デー
タの格納されている既存のデータベース2からデータ格
納情報を取得するデータ格納情報取得処理ステップと、
当該データ格納情報を参照しつつ既存のデータベース2
に格納されたレコードからデータの特徴を算出する特徴
算出処理ステップと、特徴算出処理で算出したデータの
特徴を用いて開発対象のデータベース9に必要なテスト
データを生成するテストデータ生成処理ステップと、テ
ストデータ生成処理で生成したテストデータを開発対象
のデータベース9に格納する格納処理ステップと、を含
むテストデータ生成プログラムを記録している。
Also, the present embodiment is directed to a test data generation program for generating test data necessary for reconstructing an existing database on a recording medium. A data storage information acquisition processing step of acquiring data storage information from
Existing database 2 referring to the data storage information
A feature calculation processing step of calculating data characteristics from the records stored in the database; a test data generation processing step of generating test data necessary for the development target database 9 using the data characteristics calculated by the characteristic calculation processing; And a storage processing step of storing test data generated in the test data generation processing in the database 9 to be developed.

【0115】したがって、当該記録媒体をコンピュータ
等の情報処理装置に読み取らせることで、テストデータ
生成システムであるテストデータ生成装置1あるいは後
述するテストデータ生成装置20を構築することがで
き、実稼働している既存のデータベース2に格納されて
いるデータを用いて、より一層実情に即したダミーのテ
ストデータを生成して、データベース2のチューニング
を適切に行うことができる。
Therefore, by causing the information processing device such as a computer to read the recording medium, the test data generation device 1 as a test data generation system or the test data generation device 20 to be described later can be constructed, and the actual operation is performed. By using the data stored in the existing database 2, dummy test data more in accordance with the actual situation can be generated, and the database 2 can be tuned appropriately.

【0116】なお、上記実施の形態においては、1つの
装置としてテストデータ生成装置1が構築されている場
合について説明したが、ネットワークに接続されたサー
バーとクライアントマシンによりテストデータ生成装置
を構築することができる。
In the above embodiment, the case where the test data generation device 1 is constructed as one device has been described. However, the test data generation device may be constructed by a server and a client machine connected to a network. Can be.

【0117】例えば、図11に示すように、テストデー
タ生成装置20としては、ネットワーク21に接続され
たサーバー22、23に、既存のデータベース2と開発
対象のデータベース9を有したものとし、同じネットワ
ーク21に接続されたクライアントマシン24に、デー
タ格納情報取得部4、特徴算出部5、データ生成部6及
びデータ格納部7を構築する。
For example, as shown in FIG. 11, as a test data generating device 20, it is assumed that servers 22 and 23 connected to a network 21 have an existing database 2 and a database 9 to be developed. A data storage information acquisition unit 4, a feature calculation unit 5, a data generation unit 6, and a data storage unit 7 are constructed in a client machine 24 connected to 21.

【0118】そして、このようなネットワーク21に接
続されたサーバー22、23とクライアントマシン24
でテストデータ生成装置20を構築するには、クライア
ントマシン24あるいはサーバー22、23に、CD、
MO、あるいは、フロッピーディスク等の記録媒体に記
録されているテストデータ生成プログラムを読み取らせ
ることにより構築する。
The servers 22 and 23 and the client machine 24 connected to the network 21
In order to construct the test data generation device 20 by using a client machine 24 or servers 22 and 23, a CD,
It is constructed by reading a test data generation program recorded on a recording medium such as an MO or a floppy disk.

【0119】このようなテストデータ生成装置20は、
サーバー22のデータベース管理部3がデータベース2
のデータ分布収集して、クライアントマシン24のデー
タ格納情報取得部4に渡すことで、上記同様に処理し、
クライアントマシン24のデータ生成部6の生成したテ
ストデータをデータ格納部7の情報に応じてサーバー2
3のデータベース管理部8が開発対象のデータベース9
に格納する。
Such a test data generation device 20
The database management unit 3 of the server 22
The data distribution is collected and passed to the data storage information acquisition unit 4 of the client machine 24, whereby the same processing as described above is performed.
The test data generated by the data generator 6 of the client machine 24 is stored in the server 2 according to the information in the data storage 7.
The database management unit 8 of 3 is the database 9 to be developed
To be stored.

【0120】このようにすると、ネットワーク21上に
存在する複数のデータベースを統合的にチューニングす
ることができ、利用性を向上させることができる。
Thus, a plurality of databases existing on the network 21 can be tuned in an integrated manner, and the usability can be improved.

【0121】以上、本発明者によってなされた発明を好
適な実施の形態に基づき具体的に説明したが、本発明は
上記のものに限定されるものではなく、その要旨を逸脱
しない範囲で種々変更可能であることはいうまでもな
い。
Although the invention made by the inventor has been specifically described based on the preferred embodiments, the present invention is not limited to the above-described embodiment, and various modifications may be made without departing from the gist of the invention. It goes without saying that it is possible.

【0122】例えば、テストデータ生成装置1及びテス
トデータ生成装置20の対象となる既存のデータベース
2や開発対象のデータベース9は、テストデータ生成装
置1及びテストデータ生成装置2024内に記憶されて
いるものに限るものではなく、所定の記録媒体、例え
ば、CD−ROM、その他の磁気的、光学的記録媒体あ
るいは半導体メモリ等に記憶されていてもよい。
For example, the existing data base 2 and the development target data base 9 to be tested by the test data generation device 1 and the test data generation device 20 are stored in the test data generation device 1 and the test data generation device 2024. However, the information may be stored in a predetermined recording medium, for example, a CD-ROM, another magnetic or optical recording medium, a semiconductor memory, or the like.

【0123】[0123]

【発明の効果】請求項1記載の発明のテストデータ生成
装置によれば、既存のデータベースの再構築を行う際に
必要なテストデータを生成するに際して、データの格納
されている既存のデータベースからデータ格納情報を取
得し、当該取得したデータ格納情報を参照しつつ既存の
データベースに格納されたレコードからデータの特徴を
算出して、当該算出したデータの特徴を用いて開発対象
のデータベースに必要なテストデータを生成し、当該生
成したテストデータを開発対象のデータベースに格納す
るので、実稼働している既存のデータベースに格納され
ているデータを用いて、より一層実情に即したダミーの
テストデータを生成することができ、データベースのチ
ューニングを適切に行うことができる。
According to the test data generating apparatus of the present invention, when generating the test data necessary for reconstructing the existing database, the data is stored in the existing database in which the data is stored. Obtain storage information, calculate data characteristics from records stored in the existing database while referring to the obtained data storage information, and perform tests necessary for the development target database using the calculated data characteristics. Data is generated and the generated test data is stored in the database to be developed, so dummy data that is more realistic is generated using data stored in the existing database that is actually running. And the database can be tuned appropriately.

【0124】請求項2記載の発明のテストデータ生成装
置によれば、既存のデータベースに格納されたデータの
統計的な特徴を算出して、当該算出した統計的な特徴を
用いてテストデータを生成するので、実情に即した所望
の件数のテストデータを生成することができ、データベ
ースのチューニングを簡単かつ適切に行うことができ
る。
According to the test data generating apparatus of the present invention, the statistical characteristics of the data stored in the existing database are calculated, and the test data is generated using the calculated statistical characteristics. Therefore, it is possible to generate a desired number of test data according to the actual situation, and it is possible to easily and appropriately tune the database.

【0125】請求項3記載の発明のテストデータ生成装
置によれば、既存のデータベースに格納されている一部
のレコードをサンプリングして得られたデータを特徴の
算出に用いているので、特徴を算出するための既存のデ
ータベースからのサンプル数を調整して、特徴算出に要
する処理時間を削減することができ、実情に即した所望
の件数のテストデータを速やかに生成して、データベー
スのチューニングを速やかにかつ適切に行うことができ
る。
According to the test data generating apparatus of the third aspect of the present invention, data obtained by sampling some of the records stored in the existing database is used for calculating the characteristics. By adjusting the number of samples from the existing database for calculation, the processing time required for feature calculation can be reduced, and the desired number of test data according to the actual situation can be quickly generated to tune the database. It can be done promptly and properly.

【0126】請求項4記載の発明のテストデータ生成装
置によれば、レコード内のデータが数値データ型である
と、既存のデータベースにおける当該データの値の分布
に基づいてランダムなデータを生成し、当該データを特
徴の算出に用いているので、データが数値データ型であ
る場合にも、実情に即したテストデータを生成すること
ができ、データベースのチューニングを簡単かつ適切に
行うことができる。
According to the test data generating apparatus of the present invention, if the data in the record is of a numerical data type, random data is generated based on the distribution of the value of the data in the existing database. Since the data is used for calculation of the feature, even when the data is of a numerical data type, test data that matches the actual situation can be generated, and tuning of the database can be performed easily and appropriately.

【0127】請求項5記載の発明のテストデータ生成装
置によれば、レコード内のデータが非数値データ型であ
ると、既存のデータベースにおける当該データのデータ
長に基づいてランダムなデータを生成し、当該データを
特徴の算出に用いているので、データが非数値データ型
である場合にも、実情に即したテストデータを生成する
ことができ、データベースのチューニングを簡単かつ適
切に行うことができる。
According to the test data generating apparatus of the present invention, if the data in the record is of a non-numeric data type, random data is generated based on the data length of the data in the existing database. Since the data is used for calculating the feature, even when the data is of a non-numeric data type, test data that matches the actual situation can be generated, and tuning of the database can be performed easily and appropriately.

【0128】請求項6記載の発明のテストデータ生成装
置によれば、データ格納情報を用いてテーブル間の参照
関係を考慮して、生成されたテストデータを開発対象の
データベースに格納するので、テーブル間に参照による
制約があるようなデータベース構造であっても、テスト
データを適切に格納することができ、データベースのチ
ューニングを簡単かつ適切に行うことができる。
According to the test data generation apparatus of the present invention, the generated test data is stored in the development target database in consideration of the reference relation between the tables using the data storage information. Even in the case of a database structure in which there is a reference restriction, test data can be appropriately stored, and database tuning can be performed easily and appropriately.

【0129】請求項7記載の発明のテストデータ生成装
置によれば、生成されたテストデータを開発対象のデー
タベースに格納するに際し、当該生成されたテストデー
タのレコードをキーに従ってソートして、重複したレコ
ードを削除するので、生成されたテストデータを開発対
象のデータベースに格納する際の処理時間を削減するこ
とができ、データベースのチューニングを速やかにかつ
適切に行うことができる。
According to the test data generating apparatus of the present invention, when storing the generated test data in the database to be developed, the records of the generated test data are sorted according to the key and duplicated. Since the record is deleted, the processing time for storing the generated test data in the database to be developed can be reduced, and the database can be tuned quickly and appropriately.

【0130】請求項8記載の発明のテストデータ生成装
置によれば、テストデータ生成装置を、通信ネットワー
クに接続されたデータベース管理サーバーとクライアン
トマシン上に構築し、クライアントマシン上に、データ
格納情報取得手段、特徴算出手段、テストデータ生成手
段及び格納手段を構築して、データ格納情報取得手段が
データベース管理サーバーを介して当該データベース管
理サーバーの管理する既存のデータベースからデータ格
納情報を取得し、格納手段が、データベース管理サーバ
ーの管理する開発対象のデータベースに当該データベー
ス管理サーバーを介してテストデータを格納するので、
ネットワーク上に存在する複数のデータベースを統合的
にチューニングすることができ、利用性を向上させるこ
とができる。
According to the test data generating device of the present invention, the test data generating device is constructed on the database management server and the client machine connected to the communication network, and the data storage information is obtained on the client machine. Means, a feature calculating means, a test data generating means and a storing means, wherein the data storing information obtaining means obtains data storing information from an existing database managed by the database managing server via the database managing server, and stores the data storing information. However, test data is stored in the development target database managed by the database management server via the database management server,
A plurality of databases existing on the network can be tuned in an integrated manner, and the usability can be improved.

【0131】請求項9記載の発明のテストデータ生成方
法によれば、既存のデータベースの再構築を行う際に必
要なテストデータを生成するに際して、データの格納さ
れている既存のデータベースからデータ格納情報を取得
し、当該取得したデータ格納情報を参照しつつ既存のデ
ータベースに格納されたレコードからデータの特徴を算
出して、当該算出したデータの特徴を用いて開発対象の
データベースに必要なテストデータを生成し、当該生成
したテストデータを開発対象のデータベースに格納する
ので、実稼働している既存のデータベースに格納されて
いるデータを用いて、より一層実情に即したダミーのテ
ストデータを生成することができ、データベースのチュ
ーニングを適切に行うことができる。
According to the test data generation method of the present invention, when generating test data necessary for reconstructing an existing database, the data storage information is obtained from the existing database in which the data is stored. And calculate the characteristics of the data from the records stored in the existing database with reference to the obtained data storage information, and use the characteristics of the calculated data to generate test data necessary for the database to be developed. Since the generated test data is generated and stored in the development target database, the dummy test data that is more suitable for the actual situation is generated using the data stored in the existing database in operation. And the database can be tuned appropriately.

【0132】請求項10記載の発明のテストデータ生成
方法によれば、既存のデータベースに格納されたデータ
の統計的な特徴を算出して、当該算出した統計的な特徴
を用いてテストデータを生成するので、実情に即した所
望の件数のテストデータを生成することができ、データ
ベースのチューニングを簡単かつ適切に行うことができ
る。
According to the test data generating method of the present invention, statistical characteristics of data stored in an existing database are calculated, and test data is generated using the calculated statistical characteristics. Therefore, it is possible to generate a desired number of test data according to the actual situation, and it is possible to easily and appropriately tune the database.

【0133】請求項11記載の発明のテストデータ生成
方法によれば、既存のデータベースに格納されている一
部のレコードをサンプリングして得られたデータを特徴
の算出に用いているので、特徴を算出するための既存の
データベースからのサンプル数を調整して、特徴算出に
要する処理時間を削減することができ、実情に即した所
望の件数のテストデータを速やかに生成して、データベ
ースのチューニングを速やかにかつ適切に行うことがで
きる。
According to the test data generation method of the present invention, since data obtained by sampling some of the records stored in the existing database is used for calculating the characteristics, the characteristics can be calculated. By adjusting the number of samples from the existing database for calculation, the processing time required for feature calculation can be reduced, and the desired number of test data according to the actual situation can be quickly generated to tune the database. It can be done promptly and properly.

【0134】請求項12記載の発明のテストデータ生成
方法によれば、レコード内のデータが数値データ型であ
ると、既存のデータベースにおける当該データの値の分
布に基づいてランダムなデータを生成し、当該データを
特徴の算出に用いているので、データが数値データ型で
ある場合にも、実情に即したテストデータを生成するこ
とができ、データベースのチューニングを簡単かつ適切
に行うことができる。
According to the test data generating method of the twelfth aspect, if the data in the record is of a numerical data type, random data is generated based on the distribution of the value of the data in the existing database. Since the data is used for calculating the characteristics, even when the data is of a numerical data type, test data that matches the actual situation can be generated, and tuning of the database can be performed easily and appropriately.

【0135】請求項13記載の発明のテストデータ生成
方法によれば、レコード内のデータが非数値データ型で
あると、既存のデータベースにおける当該データのデー
タ長に基づいてランダムなデータを生成し、当該データ
を特徴の算出に用いているので、データが非数値データ
型である場合にも、実情に即したテストデータを生成す
ることができ、データベースのチューニングを簡単かつ
適切に行うことができる。
According to the test data generation method of the present invention, if the data in the record is of a non-numeric data type, random data is generated based on the data length of the data in the existing database. Since the data is used for calculating the feature, even when the data is of a non-numeric data type, test data that matches the actual situation can be generated, and tuning of the database can be performed easily and appropriately.

【0136】請求項14記載の発明のテストデータ生成
方法によれば、データ格納情報を用いてテーブル間の参
照関係を考慮して、生成されたテストデータを開発対象
のデータベースに格納するので、テーブル間に参照によ
る制約があるようなデータベース構造であっても、テス
トデータを適切に格納することができ、データベースの
チューニングを簡単かつ適切に行うことができる。
According to the test data generation method of the present invention, the generated test data is stored in the development target database in consideration of the reference relation between the tables using the data storage information. Even in the case of a database structure in which there is a reference restriction, test data can be appropriately stored, and database tuning can be performed easily and appropriately.

【0137】請求項15記載の発明のテストデータ生成
方法によれば、生成されたテストデータを開発対象のデ
ータベースに格納するに際し、当該生成されたテストデ
ータのレコードをキーに従ってソートして、重複したレ
コードを削除するので、生成されたテストデータを開発
対象のデータベースに格納する際の処理時間を削減する
ことができ、データベースのチューニングを速やかにか
つ適切に行うことができる。
According to the test data generating method of the present invention, when storing the generated test data in the database to be developed, the generated test data records are sorted according to the key and duplicated. Since the record is deleted, the processing time for storing the generated test data in the database to be developed can be reduced, and the database can be tuned quickly and appropriately.

【0138】請求項16記載の発明の記録媒体によれ
ば、記録媒体に、既存のデータベースの再構築を行う際
に必要なテストデータを生成するテストデータ生成プロ
グラムであって、データの格納されている既存のデータ
ベースからデータ格納情報を取得するデータ格納情報取
得処理ステップと、当該データ格納情報を参照しつつ既
存のデータベースに格納されたレコードからデータの特
徴を算出する特徴算出処理ステップと、特徴算出処理で
算出したデータの特徴を用いて開発対象のデータベース
に必要なテストデータを生成するテストデータ生成処理
ステップと、テストデータ生成処理で生成したテストデ
ータを開発対象のデータベースに格納する格納処理ステ
ップと、を含むテストデータ生成プログラムを記録して
いるので、当該記録媒体を情報処理装置に読み取らせる
ことで、テストデータ生成システムを構築することがで
き、実稼働している既存のデータベースに格納されてい
るデータを用いて、より一層実情に即したダミーのテス
トデータを生成して、データベースのチューニングを適
切に行うことができる。
According to the recording medium of the sixteenth aspect, a test data generating program for generating test data necessary for reconstructing an existing database, wherein the data is stored in the recording medium. A data storage information acquisition processing step of acquiring data storage information from an existing database, a feature calculation processing step of calculating data characteristics from records stored in the existing database while referring to the data storage information, and a feature calculation A test data generation processing step of generating test data necessary for the development target database using the characteristics of the data calculated in the processing, and a storage processing step of storing the test data generated in the test data generation processing in the development target database. Since the test data generation program including By having the body read by the information processing device, a test data generation system can be constructed, and dummy test data that is more relevant to actual conditions using data stored in an existing database that is in operation. Can be generated to properly tune the database.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のテストデータ生成装置、テストデータ
生成方法及び記録媒体の一実施の形態を適用したテスト
データ生成装置のブロック構成図。
FIG. 1 is a block diagram of a test data generation device to which a test data generation device, a test data generation method, and a recording medium according to an embodiment of the present invention are applied.

【図2】図1のテストデータ生成装置によるテストデー
タ生成処理を示すフローチャート。
FIG. 2 is a flowchart showing test data generation processing by the test data generation device of FIG. 1;

【図3】図2の特徴算出処理を既存のデータベースの一
部のレコードをサンプリングして特徴算出する場合の詳
細な処理を示すフローチャート。
FIG. 3 is a flowchart showing a detailed process in the case where the feature calculation process of FIG. 2 performs feature calculation by sampling some records of an existing database.

【図4】図3の特徴算出処理を既存のデータベースのデ
ータの統計的な特性を用いて行う場合の詳細な処理を示
すフローチャート。
FIG. 4 is a flowchart showing detailed processing in the case where the feature calculation processing of FIG. 3 is performed using statistical characteristics of data in an existing database.

【図5】図4の度数分布作成処理でサンプリングされた
500件のレコードについて作成した度数分布を示す
図。
FIG. 5 is a view showing a frequency distribution created for 500 records sampled in the frequency distribution creation processing of FIG. 4;

【図6】図5の度数分布から作成した累積度数分布を示
す図。
FIG. 6 is a diagram showing a cumulative frequency distribution created from the frequency distribution of FIG. 5;

【図7】図2のテストデータ生成処理を既存のテストデ
ータのデータの統計的な特性を用いて行う場合の詳細な
処理を示すフローチャート。
FIG. 7 is a flowchart showing detailed processing in the case where the test data generation processing of FIG. 2 is performed using the statistical characteristics of existing test data.

【図8】図7のランダムデータ生成処理を既存のデータ
ベースのデータの統計的な特性を用いて行う場合の詳細
な処理を示すフローチャート。
8 is a flowchart showing a detailed process in the case where the random data generation process of FIG. 7 is performed using statistical characteristics of data in an existing database.

【図9】図8の一様乱数生成を逆関数法で行う場合に図
6の累積度数分布をサンプリング数で除算した除算値を
示す図。
9 is a diagram showing a division value obtained by dividing the cumulative frequency distribution of FIG. 6 by a sampling number when the uniform random number generation of FIG. 8 is performed by the inverse function method.

【図10】図9の除算値をサンプリングデータに基づい
て解析的な関数で近似した近似値を示す図。
FIG. 10 is a diagram showing an approximate value obtained by approximating the division value of FIG. 9 with an analytical function based on sampling data.

【図11】図1のテストデータ生成装置をネットワーク
上に構築した場合のテストデータ生成装置のブロック構
成図。
FIG. 11 is a block diagram of the test data generation device when the test data generation device of FIG. 1 is constructed on a network.

【符号の説明】[Explanation of symbols]

1 テストデータ生成装置 2 データベース 3 データベース管理部 4 データ格納情報取得部 5 特徴算出部 6 データ生成部 7 データ格納部 8 データベース管理部 9 データベース 20 テストデータ生成装置 21 ネットワーク 22、23 サーバー 24 クライアントマシン REFERENCE SIGNS LIST 1 test data generation device 2 database 3 database management unit 4 data storage information acquisition unit 5 feature calculation unit 6 data generation unit 7 data storage unit 8 database management unit 9 database 20 test data generation device 21 network 22, 23 server 24 client machine

Claims (16)

【特許請求の範囲】[Claims] 【請求項1】既存のデータベースの再構築を行う際に必
要なテストデータを生成するテストデータ生成装置であ
って、データの格納されている前記既存のデータベース
からデータ格納情報を取得するデータ格納情報取得手段
と、当該データ格納情報を参照しつつ前記既存のデータ
ベースに格納されたレコードから前記データの特徴を算
出する特徴算出手段と、前記特徴算出手段の算出した前
記データの特徴を用いて開発対象のデータベースに必要
なテストデータを生成するテストデータ生成手段と、前
記テストデータ生成手段の生成した前記テストデータを
前記開発対象のデータベースに格納する格納手段と、を
備えたことを特徴とするテストデータ生成装置。
1. A test data generating apparatus for generating test data necessary for reconstructing an existing database, comprising: data storage information for acquiring data storage information from the existing database in which data is stored. Acquisition means, feature calculation means for calculating the characteristics of the data from the records stored in the existing database with reference to the data storage information, and a development target using the characteristics of the data calculated by the characteristic calculation means Test data generating means for generating test data necessary for the database of the present invention, and storage means for storing the test data generated by the test data generating means in the database to be developed. Generator.
【請求項2】前記特徴算出手段は、前記既存のデータベ
ースに格納された前記データの統計的な特徴を算出し、
前記テストデータ生成手段は、当該特徴算出手段の算出
した統計的な特徴を用いて前記テストデータを生成する
ことを特徴とする請求項1記載のテストデータ生成装
置。
2. The feature calculation means calculates a statistical feature of the data stored in the existing database,
2. The test data generation device according to claim 1, wherein the test data generation unit generates the test data using a statistical feature calculated by the feature calculation unit.
【請求項3】前記特徴算出手段は、前記既存のデータベ
ースに格納されている一部のレコードをサンプリングし
て得られたデータを前記特徴の算出に用いることを特徴
とする請求項1または請求項2記載のテストデータ生成
装置。
3. The feature calculation unit according to claim 1, wherein data obtained by sampling a part of records stored in the existing database is used for calculation of the feature. 2. The test data generation device according to 2.
【請求項4】前記特徴算出手段は、前記レコード内のデ
ータが数値データ型であると、前記既存のデータベース
における当該データの値の分布に基づいてランダムな前
記データを生成し、当該データを前記特徴の算出に用い
ることを特徴とする請求項1から請求項3のいずれかに
記載のテストデータ生成装置。
4. If the data in the record is of a numerical data type, the feature calculating means generates the random data based on a distribution of values of the data in the existing database, and generates the data. 4. The test data generation device according to claim 1, wherein the test data generation device is used for calculating a feature.
【請求項5】前記特徴算出手段は、前記レコード内のデ
ータが非数値データ型であると、前記既存のデータベー
スにおける当該データのデータ長に基づいてランダムな
前記データを生成し、当該データを前記特徴の算出に用
いることを特徴とする請求項1から請求項3のいずれか
に記載のテストデータ生成装置。
5. If the data in the record is a non-numerical data type, the feature calculation means generates random data based on the data length of the data in the existing database, and generates the data. 4. The test data generation device according to claim 1, wherein the test data generation device is used for calculating a feature.
【請求項6】前記格納手段は、前記データ格納情報取得
手段の取得した前記データ格納情報を用い、テーブル間
の参照関係を考慮して、前記生成されたテストデータを
前記開発対象のデータベースに格納することを特徴とす
る請求項1から請求項5のいずれかに記載のテストデー
タ生成装置。
6. The storage means uses the data storage information acquired by the data storage information acquisition means to store the generated test data in the database to be developed in consideration of a reference relationship between tables. The test data generation device according to any one of claims 1 to 5, wherein
【請求項7】前記格納手段は、前記生成されたテストデ
ータを前記開発対象のデータベースに格納するに際し、
当該生成されたテストデータのレコードをキーに従って
ソートして、重複したレコードを削除することを特徴と
する請求項1から請求項6のいずれかに記載のテストデ
ータ生成装置。
7. The storage means stores the generated test data in the database to be developed.
7. The test data generation apparatus according to claim 1, wherein the generated test data records are sorted according to a key, and duplicate records are deleted.
【請求項8】前記テストデータ生成装置は、通信ネット
ワークに接続されたデータベース管理サーバーとクライ
アントマシン上に構築され、前記クライアントマシン上
に、前記データ格納情報取得手段、前記特徴算出手段、
前記テストデータ生成手段及び前記格納手段が構築さ
れ、前記データ格納情報取得手段が前記データベース管
理サーバーを介して当該データベース管理サーバーの管
理する前記既存のデータベースから前記データ格納情報
を取得し、前記格納手段が、前記データベース管理サー
バーの管理する前記開発対象のデータベースに当該デー
タベース管理サーバーを介して前記テストデータを格納
することを特徴とする請求項1から請求項7のいずれか
に記載のテストデータ生成装置。
8. The test data generating device is constructed on a database management server and a client machine connected to a communication network, and on the client machine, the data storage information acquiring unit, the feature calculating unit,
The test data generation unit and the storage unit are constructed, and the data storage information acquisition unit acquires the data storage information from the existing database managed by the database management server via the database management server, and the storage unit The test data generation device according to any one of claims 1 to 7, wherein the test data is stored in the database to be developed managed by the database management server via the database management server. .
【請求項9】既存のデータベースの再構築を行う際に必
要なテストデータを生成するテストデータ生成方法であ
って、データの格納されている前記既存のデータベース
からデータ格納情報を取得するデータ格納情報取得処理
と、当該データ格納情報を参照しつつ前記既存のデータ
ベースに格納されたレコードから前記データの特徴を算
出する特徴算出処理と、前記特徴算出処理で算出した前
記データの特徴を用いて開発対象のデータベースに必要
なテストデータを生成するテストデータ生成処理と、前
記テストデータ生成処理で生成した前記テストデータを
前記開発対象のデータベースに格納する格納処理と、を
順次行うことを特徴とするテストデータ生成方法。
9. A test data generation method for generating test data necessary for reconstructing an existing database, wherein the data storage information acquires data storage information from the existing database in which data is stored. An acquisition process, a feature calculation process of calculating a feature of the data from a record stored in the existing database while referring to the data storage information, and a development target using the feature of the data calculated in the feature calculation process. Test data generating processing for generating test data necessary for the database of the above, and storing processing for storing the test data generated in the test data generating processing in the development target database are sequentially performed. Generation method.
【請求項10】前記テストデータ生成方法は、前記特徴
算出処理で、前記既存のデータベースに格納された前記
データの統計的な特徴を算出し、前記テストデータ生成
処理で、当該特徴算出処理で算出した統計的な特徴を用
いて前記テストデータを生成することを特徴とする請求
項9記載のテストデータ生成方法。
10. The test data generation method according to claim 1, wherein the feature calculation process calculates a statistical feature of the data stored in the existing database, and the test data generation process calculates the feature in the feature calculation process. The test data generation method according to claim 9, wherein the test data is generated using the obtained statistical characteristics.
【請求項11】前記テストデータ生成方法は、前記特徴
算出処理で、前記既存のデータベースに格納されている
一部のレコードをサンプリングして得られたデータを前
記特徴の算出に用いることを特徴とする請求項9または
請求項10記載のテストデータ生成方法。
11. The test data generating method according to claim 1, wherein in the feature calculation process, data obtained by sampling a part of records stored in the existing database is used for calculating the feature. The test data generation method according to claim 9, wherein the test data is generated.
【請求項12】前記テストデータ生成方法は、前記特徴
算出処理で、前記レコード内のデータが数値データ型で
あると、前記既存のデータベースにおける当該データの
値の分布に基づいてランダムなデータを生成し、当該デ
ータを前記特徴の算出に用いることを特徴とする請求項
9から請求項11のいずれかに記載のテストデータ生成
方法。
12. The test data generation method according to claim 1, wherein, in the feature calculation processing, when data in the record is a numeric data type, random data is generated based on a distribution of values of the data in the existing database. The test data generation method according to claim 9, wherein the data is used for calculating the feature.
【請求項13】前記テストデータ生成方法は、前記特徴
算出処理で、前記レコード内のデータが非数値データ型
であると、前記既存のデータベースにおける当該データ
のデータ長に基づいてランダムなデータを生成し、当該
データを前記特徴の算出に用いることを特徴とする請求
項9から請求項11のいずれかに記載のテストデータ生
成方法。
13. The test data generation method according to claim 1, wherein in the feature calculation processing, if data in the record is a non-numeric data type, random data is generated based on a data length of the data in the existing database. The test data generation method according to claim 9, wherein the data is used for calculating the feature.
【請求項14】前記テストデータ生成方法は、前記格納
処理で、前記データ格納情報取得処理で取得した前記デ
ータ格納情報を用い、テーブル間の参照関係を考慮し
て、前記生成されたテストデータを前記開発対象のデー
タベースに格納することを特徴とする請求項9から請求
項13のいずれかに記載のテストデータ生成方法。
14. The test data generation method according to claim 1, wherein the storage process uses the data storage information acquired in the data storage information acquisition process and considers a reference relationship between tables to generate the test data. 14. The test data generation method according to claim 9, wherein the test data is stored in the development target database.
【請求項15】前記テストデータ生成方法は、前記格納
処理で、前記生成されたテストデータを前記開発対象の
データベースに格納するに際し、当該生成されたテスト
データのレコードをキーに従ってソートして、重複した
レコードを削除することを特徴とする請求項9から請求
項14のいずれかに記載のテストデータ生成方法。
15. The test data generating method according to claim 1, wherein in the storing process, when storing the generated test data in the database to be developed, the generated test data records are sorted according to a key and duplicated. The test data generation method according to any one of claims 9 to 14, wherein the deleted record is deleted.
【請求項16】既存のデータベースの再構築を行う際に
必要なテストデータを生成するテストデータ生成プログ
ラムであって、データの格納されている前記既存のデー
タベースからデータ格納情報を取得するデータ格納情報
取得処理ステップと、当該データ格納情報を参照しつつ
前記既存のデータベースに格納されたレコードから前記
データの特徴を算出する特徴算出処理ステップと、前記
特徴算出処理で算出した前記データの特徴を用いて開発
対象のデータベースに必要なテストデータを生成するテ
ストデータ生成処理ステップと、前記テストデータ生成
処理で生成した前記テストデータを前記開発対象のデー
タベースに格納する格納処理ステップと、を含むテスト
データ生成プログラムを記録することを特徴とする記録
媒体。
16. A test data generation program for generating test data required for reconstructing an existing database, wherein the data storage information acquires data storage information from the existing database in which data is stored. An acquisition processing step, a feature calculation processing step of calculating a feature of the data from a record stored in the existing database while referring to the data storage information, and a feature of the data calculated in the feature calculation process. A test data generation program including: a test data generation processing step of generating test data required for a development target database; and a storage processing step of storing the test data generated in the test data generation processing in the development target database. A recording medium for recording the information.
JP2000063562A 2000-03-08 2000-03-08 Device and method for generating test data and recording medium Pending JP2001256076A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000063562A JP2001256076A (en) 2000-03-08 2000-03-08 Device and method for generating test data and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000063562A JP2001256076A (en) 2000-03-08 2000-03-08 Device and method for generating test data and recording medium

Publications (1)

Publication Number Publication Date
JP2001256076A true JP2001256076A (en) 2001-09-21

Family

ID=18583406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000063562A Pending JP2001256076A (en) 2000-03-08 2000-03-08 Device and method for generating test data and recording medium

Country Status (1)

Country Link
JP (1) JP2001256076A (en)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293830A (en) * 2006-03-30 2007-11-08 Japan Research Institute Ltd Test data generation system, its program, its recording medium and test data generation method
JP2008009984A (en) * 2006-06-27 2008-01-17 Sap Ag System and method for providing mockup data generator
JP2009064430A (en) * 2007-08-16 2009-03-26 Systemexe Inc Device and method for creating test data
JP2009086992A (en) * 2007-09-28 2009-04-23 Ns Solutions Corp Information processor, information processing method, and program
JP2009238140A (en) * 2008-03-28 2009-10-15 Fujitsu Ltd Data generation program, data generation device, and data generation method
KR20120039616A (en) * 2009-06-10 2012-04-25 아브 이니티오 테크놀로지 엘엘시 Generating test data
JP2012168906A (en) * 2011-02-17 2012-09-06 Nec Corp Virtual file system
JP2015052873A (en) * 2013-09-06 2015-03-19 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Method of automatically generating test data comprising character string, method of identifying signature embedded in test data comprising character string, and computer and computer program of these method
US20150113330A1 (en) * 2013-10-17 2015-04-23 Informatica Corporation Domain centric test data generation
US9310722B2 (en) 2011-03-18 2016-04-12 Ricoh Company, Limited Image forming apparatus and image forming method
US9436713B2 (en) 2012-10-25 2016-09-06 Hitachi, Ltd. Database analyzer and database analysis method
JP2017068293A (en) * 2015-09-28 2017-04-06 株式会社日立製作所 Test db data generation method and device
JP2018005702A (en) * 2016-07-06 2018-01-11 日本電気株式会社 Random number generator, random number generation method, and random number generation program
US20180210821A1 (en) * 2017-01-20 2018-07-26 Wipro Limited Method of generating and transforming test data and a system therefor
US10102398B2 (en) 2009-06-01 2018-10-16 Ab Initio Technology Llc Generating obfuscated data
US10185641B2 (en) 2013-12-18 2019-01-22 Ab Initio Technology Llc Data generation
KR102276290B1 (en) * 2020-04-10 2021-07-12 숭실대학교산학협력단 Apparatus for generating large scale test data

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293830A (en) * 2006-03-30 2007-11-08 Japan Research Institute Ltd Test data generation system, its program, its recording medium and test data generation method
JP2008009984A (en) * 2006-06-27 2008-01-17 Sap Ag System and method for providing mockup data generator
JP2009064430A (en) * 2007-08-16 2009-03-26 Systemexe Inc Device and method for creating test data
JP2009086992A (en) * 2007-09-28 2009-04-23 Ns Solutions Corp Information processor, information processing method, and program
JP2009238140A (en) * 2008-03-28 2009-10-15 Fujitsu Ltd Data generation program, data generation device, and data generation method
US10102398B2 (en) 2009-06-01 2018-10-16 Ab Initio Technology Llc Generating obfuscated data
US9411712B2 (en) 2009-06-10 2016-08-09 Ab Initio Technology Llc Generating test data
KR20120039616A (en) * 2009-06-10 2012-04-25 아브 이니티오 테크놀로지 엘엘시 Generating test data
JP2012529716A (en) * 2009-06-10 2012-11-22 アビニシオ テクノロジー エルエルシー How to generate test data
KR101660853B1 (en) * 2009-06-10 2016-09-28 아브 이니티오 테크놀로지 엘엘시 Generating test data
JP2012168906A (en) * 2011-02-17 2012-09-06 Nec Corp Virtual file system
US9563153B2 (en) 2011-03-18 2017-02-07 Ricoh Company, Ltd. Image forming apparatus and image forming method
US9310722B2 (en) 2011-03-18 2016-04-12 Ricoh Company, Limited Image forming apparatus and image forming method
US10088781B2 (en) 2011-03-18 2018-10-02 Ricoh Company, Ltd. Image forming apparatus and image forming method
US9436713B2 (en) 2012-10-25 2016-09-06 Hitachi, Ltd. Database analyzer and database analysis method
JP2015052873A (en) * 2013-09-06 2015-03-19 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Method of automatically generating test data comprising character string, method of identifying signature embedded in test data comprising character string, and computer and computer program of these method
US9613019B2 (en) 2013-09-06 2017-04-04 International Business Machines Corporation Techniques for automatically generating test data
US9235496B2 (en) * 2013-10-17 2016-01-12 Informatica Llc Domain centric test data generation
US20150113330A1 (en) * 2013-10-17 2015-04-23 Informatica Corporation Domain centric test data generation
US10437701B2 (en) 2013-12-18 2019-10-08 Ab Initio Technology Llc Data generation
US10185641B2 (en) 2013-12-18 2019-01-22 Ab Initio Technology Llc Data generation
US10339035B2 (en) 2015-09-28 2019-07-02 Hitachi, Ltd. Test DB data generation apparatus
JP2017068293A (en) * 2015-09-28 2017-04-06 株式会社日立製作所 Test db data generation method and device
JP2018005702A (en) * 2016-07-06 2018-01-11 日本電気株式会社 Random number generator, random number generation method, and random number generation program
US20180210821A1 (en) * 2017-01-20 2018-07-26 Wipro Limited Method of generating and transforming test data and a system therefor
US10467130B2 (en) * 2017-01-20 2019-11-05 Wipro Limited Method of generating and transforming test data and a system therefor
KR102276290B1 (en) * 2020-04-10 2021-07-12 숭실대학교산학협력단 Apparatus for generating large scale test data

Similar Documents

Publication Publication Date Title
JP2001256076A (en) Device and method for generating test data and recording medium
US5345586A (en) Method and system for manipulation of distributed heterogeneous data in a data processing system
US6728720B1 (en) Identifying preferred indexes for databases
US7188116B2 (en) Method and apparatus for deleting data in a database
US7739297B2 (en) Computerized method, system and program product for generating a data mining model
JP3914662B2 (en) Database processing method and apparatus, and medium storing the processing program
US20110055198A1 (en) System and method for optimizing queries
US7478083B2 (en) Method and system for estimating cardinality in a database system
KR20020028208A (en) Real-time database object statistics collection
KR100898465B1 (en) Data storage and inquiry method for time series analysis of weblog and system for executing the method
JPH11212988A (en) Multidimensional data base hierarchy-type classification axis automatic generation system, classification item analyzing method and record medium recorded with its program
CN115881283A (en) Medical main index management system and method based on dynamic model and dynamic rules
CN112579604A (en) Test system number making method, device, equipment and storage medium
CN111400303B (en) Intelligent contract data extraction and synchronization method and system
US8037109B2 (en) Generation of repeatable synthetic data
CN113434596A (en) Method and device for generating test data of distributed database
JPH08190571A (en) Document retrieval method
CN115017133B (en) Heterogeneous database data consistency verification method based on files
KR101648707B1 (en) Middleware based cubrid, and method of processing distribute-parallel query using middleware
KR102276290B1 (en) Apparatus for generating large scale test data
JP3630045B2 (en) T-tree index construction method, T-tree index retrieval method, T-tree index construction device, T-tree index retrieval device, storage medium storing T-tree index construction program, and storage medium storing T-tree index retrieval program
CN112784097B (en) Audio feature generation method and device, computer equipment and storage medium
CN115809268B (en) Adaptive query method and device based on fragment index
CN115934825B (en) Data access method, system, electronic device and storage medium based on elastic search
US20050108229A1 (en) Method and apparatus for retrieving and sorting entries from a directory

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050126

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050415

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080311

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080509

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081202