JP2003006007A - System for automatically managing time-series data - Google Patents

System for automatically managing time-series data

Info

Publication number
JP2003006007A
JP2003006007A JP2001187220A JP2001187220A JP2003006007A JP 2003006007 A JP2003006007 A JP 2003006007A JP 2001187220 A JP2001187220 A JP 2001187220A JP 2001187220 A JP2001187220 A JP 2001187220A JP 2003006007 A JP2003006007 A JP 2003006007A
Authority
JP
Japan
Prior art keywords
data
time
series data
series
automatic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001187220A
Other languages
Japanese (ja)
Inventor
Hidetoshi Jiko
英俊 児高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP2001187220A priority Critical patent/JP2003006007A/en
Publication of JP2003006007A publication Critical patent/JP2003006007A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To automate management of time-series data based on parameter values set by every kind of the time-series data as realizing efficient use of disk resources to store various kinds of data such to be periodically generated such as by unit of time and by unit of month, reduction of access performance degradation in use of data and reduction of maintenance costs. SOLUTION: Data 11 generated this time of data A is inserted into a table to store the data when the table exist after acquiring information retarding the data A from time-series data management information as a processing to store the data 11. Judgment about whether or not the table to store the data 11 exists is performed by comparison between a reference processing date 12 and a name of the table existing on the current disk device. When no table exists, creation of a table (security of an area) to newly store the data generated this time is performed and the data are inserted into it. A creating place of the table in this case is selected so that distribution of the respective tables to constitute the data A becomes even to all the disk devices to the utmost.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は時系列データ自動管
理方式に関し、特に、時系列的に蓄積したデータを管理
する時系列データ自動管理方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a time series data automatic management system, and more particularly to a time series data automatic management system for managing data accumulated in time series.

【0002】[0002]

【従来の技術】従来、この種の時系列データ自動管理方
式は、定期的に発生するデータをデータベースシステム
上に時系列的に長期間に渡り累積を行うために、まず累
積を行いたい期間分のデータを格納するための容量を予
め見積もり、その容量分の領域を1つの表として確保
し、データが発生する度にその表に対して格納を行うと
いう方式により行われていた。
2. Description of the Related Art Conventionally, this type of automatic time-series data management system first accumulates data that occurs periodically in a database system over a long period of time. The capacity for storing the data is estimated in advance, an area for the capacity is secured as one table, and the table is stored each time the data is generated.

【0003】[0003]

【発明が解決しようとする課題】この種の従来の時系列
データ自動管理方式では、次のような問題点があった。
The conventional time-series data automatic management system of this type has the following problems.

【0004】第1の問題点は、最初に確保する表の容量
の算出が困難ということである。その理由は、累積を行
うデータは長期間に渡るものであり、現在のデータ発生
量がこの先も同じである保証はないからである。今後デ
ータ発生量が当初の見積りよりも増加していった場合
は、予定の累積期間に達する前に表のオーバフローが発
生する。また、データ発生量が当初の見積りよりも減少
していった場合は、累積期間に達してもその表の中のデ
ータ占有率は低いものとなり、ディスク装置の無駄な使
用になってしまう。
The first problem is that it is difficult to calculate the capacity of the table to be initially secured. The reason is that the data to be accumulated is for a long period of time, and there is no guarantee that the current data generation amount will be the same in the future. If the amount of data generated increases from the initial estimate in the future, table overflow will occur before the planned cumulative period is reached. Further, if the amount of generated data is smaller than initially estimated, even if the cumulative period is reached, the data occupancy rate in the table becomes low, resulting in wasted use of the disk device.

【0005】第2の問題点は、累積期間を経過した古い
データを削除する手段がレコード単位の削除となり、更
新時間が長くなってしまうことである。その理由は、全
データを1つの表に格納しているため、データを削除す
る手段がレコード単位の削除以外にないためである。デ
ータベースの表のレコードを削除する場合は、必ず更新
前情報(ジャーナル)が発生してしまい大量のレコード
の削除を行う場合は、それなりの処理時間がかかる。ま
たそれだけ分の更新前情報を保存する領域も必要とな
る。
The second problem is that the means for deleting old data whose cumulative period has elapsed is record-based deletion, resulting in a long update time. The reason is that all the data is stored in one table, and there is no means for deleting the data other than the deletion in record units. When deleting records in the database table, pre-update information (journal) always occurs, and when deleting a large number of records, it takes some processing time. In addition, an area for storing that much pre-update information is also required.

【0006】第3の問題点は、定期的に表を再構成する
必要が出てくることである。その理由は第2の問題点の
理由と同じである。表に対して、レコードの削除、挿入
を繰り返し行った場合、表を構成しているデータブロッ
クの断片化や無駄領域が必ず発生し、アクセス性能劣化
やブロック使用率の劣化が起きてしまう。
The third problem is that it becomes necessary to reconstruct the table periodically. The reason is the same as the reason for the second problem. When records are repeatedly deleted and inserted into a table, fragmentation of data blocks constituting the table and wasteful areas are inevitably caused, resulting in deterioration of access performance and deterioration of block usage rate.

【0007】第4の問題点は、各データの格納先が局所
的になり、全件検索処理などを行う場合、特定のディス
ク装置にI/Oがが集中してしまう点である。その理由
は、第2の問題点の理由と同じで、全データを1つの表
に格納しているためであり、ディスク装置が複数台あっ
たとしても、データを均等に配置させることが困難であ
る。
A fourth problem is that the storage destination of each data becomes local and I / O is concentrated in a specific disk device when performing an all-data search process. The reason is the same as the reason for the second problem, because all the data is stored in one table, and it is difficult to evenly arrange the data even if there are a plurality of disk devices. is there.

【0008】これら第1〜第4の問題点を解決する手法
としては、本発明と同様に、月や年といった時系列的な
単位で、1つのデータを複数の表に格納し、1つの仮想
表として定義して利用するという手段は従来から存在し
た。しかし、この場合、新規のデータを格納するための
表の作成や、不要となった表の削除処理は管理者が定期
的に行う必要があり、なんら自動化する為の有効な手法
は存在しないのが現状であった。
As a method for solving these first to fourth problems, as in the present invention, one data is stored in a plurality of tables in a time series unit such as month or year, and one virtual data is stored. The means of defining and using as a table has existed in the past. However, in this case, it is necessary for the administrator to periodically create a table to store new data and delete unnecessary tables, and there is no effective method to automate it. Was the current situation.

【0009】本発明の目的は、以上の問題点を全て解決
し、データの種類別に用意したパラメータ情報により全
ての管理を自動化する方式を提供することにある。
An object of the present invention is to solve all of the above problems and to provide a method of automating all management by using parameter information prepared for each type of data.

【0010】[0010]

【課題を解決するための手段】本発明の第1の実施の形
態は、定期的に発生するデータを時系列的に長期間に渡
り累積を行う記憶装置を有するデータベースシステムに
おいて、時系列データの種類毎にあらかじめパラメータ
登録を行う手段を有し、前記パラメータ値により時系列
的データの管理を行うことを特徴とする時系列データ自
動管理方式を提供する。
According to a first embodiment of the present invention, in a database system having a storage device for accumulating regularly generated data in time series over a long period of time, A time-series data automatic management method is provided, which has means for registering parameters for each type in advance, and manages time-series data according to the parameter values.

【0011】本発明の第2の実施の形態は、時系列デー
タを格納する物理的単位を年や月という時系列的な単位
の表で構成する手段と、時系列データの管理情報上のパ
ラメータ値を変更する手段と、常に最適なサイズで領域
確保が行なわれる手段とを有し、無駄なく効率的な記憶
装置の利用を可能にすることを特徴とする請求項1記載
の時系列データ自動管理方式を提供する。
In the second embodiment of the present invention, a means for constructing a physical unit for storing time-series data by a table of time-series units such as years and months, and a parameter on management information of the time-series data. 2. The time-series data automatic system according to claim 1, further comprising means for changing a value and means for always allocating an area with an optimum size to enable efficient and efficient use of the storage device. Provides a management method.

【0012】本発明の第3の実施の形態は、保有期間経
過後のデータを表単位の物理的な削除で行なう手段を有
し、不用データの削除を可能にすることを特徴とする請
求項2記載の時系列データ自動管理方式を提供する。
A third embodiment of the present invention is characterized in that it has means for physically deleting data after the retention period has passed by a table unit, and enables deletion of unnecessary data. Provide the time series data automatic management method described in 2.

【0013】本発明の第4の実施の形態は、各時系列デ
ータを構成する表が、複数の記憶装置に対して均等に配
置されるよう表の作成先を決定する手段と、データ利用
時のディスク装置に対するI/Oが分散する手段とを有
し、保有データ量が増えてもアクセス性能劣化を最低限
に抑えることを可能にすることを特徴とする請求項2記
載の時系列データ自動管理方式を提供する。
In a fourth embodiment of the present invention, a means for deciding a table creation destination so that the tables making up each time series data are evenly arranged in a plurality of storage devices, and a means for using the data. 3. The time-series data automatic system according to claim 2, further comprising: a means for distributing I / O to the disk device of FIG. 1 to minimize deterioration of access performance even if the amount of retained data increases. Provides a management method.

【0014】本発明の第5の実施の形態は、各時系列デ
ータを複数の記憶装置に対して、時系列的な単位で分割
して格納する手段を有し、ディスク障害時の影響を各デ
ータに関して時系列的に局所に抑えることを可能にする
ことを特徴とする請求項4記載の時系列データ自動管理
方式を提供する。
The fifth embodiment of the present invention has means for dividing each time-series data into a plurality of storage devices and storing the data in a time-series unit, and to reduce the influence of a disk failure. The time-series data automatic management system according to claim 4, wherein the data can be locally suppressed in time series.

【0015】本発明の第6の実施の形態は、管理対象で
ある時系列データの発生データと、処理対象の時系列デ
ータがいつ時点のものであるかを判断するためにマシン
日付などから取得した統一的な日付情報が格納されてい
る処理基準日と、管理対象となる各時系列データに関す
る情報の時系列データ管理情報と、前記発生データ、前
記処理基準日および前記時系列データ管理情報をパラメ
ータ形式であらかじめ登録する手段を有することを特徴
とする請求項1記載の時系列データ自動管理方式を提供
する。
In the sixth embodiment of the present invention, the generation data of the time-series data to be managed and the time-series data to be processed are acquired from the machine date or the like to determine when they are. The processing reference date in which the unified date information is stored, the time series data management information of information regarding each time series data to be managed, the occurrence data, the processing reference date, and the time series data management information. The automatic time-series data management system according to claim 1, further comprising means for pre-registering in a parameter format.

【0016】[0016]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Next, embodiments of the present invention will be described in detail with reference to the drawings.

【0017】図1は本発明の第1の実施例を示す。本発
明の第1の実施例は、日単位や月単位といった定期的に
発生する各種のデータを長期間に渡りディスク装置上に
時系列的に蓄積して管理するデータベースシステムにお
いて、データを格納するためのディスク資源の効率的な
活用とデータ利用時のアクセス性能劣化の低減およびと
メンテナンスコストの低減を実現しながら時系列データ
の種類別に設定したパラメータ値を元にしてこれらの管
理を自動化する手段を含む。
FIG. 1 shows a first embodiment of the present invention. The first embodiment of the present invention stores data in a database system that accumulates and manages various types of data that occur on a daily or monthly basis in a time series on a disk device over a long period of time. A means for automating the management of disk resources based on the parameter values set for each type of time-series data while realizing efficient use of disk resources, reduction of access performance deterioration when using data, and reduction of maintenance costs. including.

【0018】図1を参照すると、Aの今回発生データ1
1は時系列管理対象であるデータAの今回発生データで
ある。処理基準日12は処理対象のデータがいつ時点の
ものであるかを判断するためにマシン日付などから取得
した統一的な日付情報が格納されている。時系列データ
管理情報13は、管理対象となる各時系列データに関す
る情報がパラメータ形式であらかじめ登録されている。
ディスク装置14−1〜14−4は時系列データを格納
するための記憶装置である。A_1996〜A_2000はそれぞ
れ時系列データAをデータ発生年度別に格納しているデ
ータベース表であり、図4の命名規則に従った名前がつ
いている。
Referring to FIG. 1, the data 1 of the current occurrence of A
1 is the data generated this time of the data A that is the time-series management target. The processing reference date 12 stores uniform date information acquired from the machine date or the like in order to determine when the processing target data is. In the time-series data management information 13, information about each time-series data to be managed is registered in advance in a parameter format.
The disk devices 14-1 to 14-4 are storage devices for storing time series data. A_1996 to A_2000 are database tables that store the time-series data A for each data generation year, and are named according to the naming convention of FIG.

【0019】時系列管理対象対象であるデータAに関し
て、Aの今回発生データ11を格納する処理として、ま
ず時系列データ管理情報からAに関する情報を取得した
後、現在のディスク装置の状況照会を行い、このデータ
を格納すべき表が存在すればその表に対してデータ挿入
を行う。格納すべき表が存在するか否かの判断は処理基
準日12と現在ディスク装置上に存在する表の名前との
比較により行う。存在しない場合は、新たに今回発生デ
ータを格納するための表の作成(領域確保)を行い、そ
こに対してデータ挿入を行う。この時の表の作成場所は
ディスク装置の状況照会から判断し、データAを構成す
る各表の分布が全ディスク装置に対して可能な限り均等
になるよう選択する。また、この時に確保する表のサイ
ズは時系列データ管理情報13に登録されている値を用
いる。
As for the process of storing the presently generated data 11 of A for the data A which is the time-series management target, first the information about A is acquired from the time-series data management information, and then the current disk device status inquiry is performed. If there is a table that should store this data, data is inserted into that table. Whether or not there is a table to be stored is determined by comparing the processing reference date 12 with the name of the table currently existing on the disk device. If it does not exist, a table for newly storing the data generated this time is created (area is reserved), and data is inserted into the table. The location of the table at this time is determined from the inquiry about the status of the disk device, and the distribution of each table forming the data A is selected to be as uniform as possible for all the disk devices. The size of the table secured at this time uses the value registered in the time-series data management information 13.

【0020】次に、時系列データ管理情報13からデー
タAに関する累積期間を取得し、累積期間を経過した削
除すべき古いデータが存在するか否かの判断を行い、存
在すれば削除を行う。この削除はレコード単位の削除で
はなく、表単位の物理的な削除により行う。
Next, the cumulative period relating to the data A is acquired from the time-series data management information 13, and it is judged whether or not there is old data to be deleted after the cumulative period has passed. This deletion is not done in record units, but physically in table units.

【0021】最後に、複数の表に分割して格納されてい
るデータAを1つの表として利用できるように、SQLの
集合演算(UNION)を利用した仮想表定義を行う。
Finally, a virtual table definition using SQL set operation (UNION) is performed so that the data A divided and stored in a plurality of tables can be used as one table.

【0022】図2は時系列データAに関する時系列デー
タ管理情報の登録内容である。図3を参照すると、「分
割単位」22は時系列データ名21のデータを複数の表
に分割して格納するにあたり、その単位を年とするか月
とするかの情報を持つ。「分割サイズ」23は1つの表
に割り当てる物理的なサイズであり、該当データの「分
割単位」22当たりに必要となる表のサイズを表す。こ
の値は時系列データ毎に計算または実測により求めて登
録する。「累積期間」24はその時系列データの最低保
有期間を表し、「分割単位」22で設定した単位でいく
つまで累積が必要なのかを表す。
FIG. 2 shows the registration contents of the time series data management information regarding the time series data A. Referring to FIG. 3, the “division unit” 22 has information on whether to divide the data of the time-series data name 21 into a plurality of tables and store the data in units of years. The “division size” 23 is a physical size assigned to one table, and represents the size of the table required for each “division unit” 22 of the corresponding data. This value is calculated or measured for each time series data and registered. The “cumulative period” 24 represents the minimum holding period of the time series data, and represents how many accumulations are necessary in the unit set in the “division unit” 22.

【0023】図3は本発明である管理方式を表すロジッ
ク構成図であり、この管理方式の構成している処理単位
をブロックに分け表している。
FIG. 3 is a logic block diagram showing the management system of the present invention, and the processing units of this management system are divided into blocks.

【0024】図3を参照して、データAの今回発生デー
タを処理する場合における動作に関して詳細に説明す
る。
With reference to FIG. 3, the operation in the case of processing the data A generated this time will be described in detail.

【0025】時系列データAの格納要求31が行われる
と、そのデータを格納するための格納先表の判断処理3
2が行われる。
When the storage request 31 for the time-series data A is made, the determination processing 3 of the storage destination table for storing the data 3
2 is performed.

【0026】格納先表の判断処理32では、時系列デー
タ管理情報13(図1)からデータAの「分割単位」を
取得し、データAの分割単位22は月(図2)であるこ
とが解る。次に処理基準日12(図1)を取得し、その
結果、今回処理しようとしているデータが2001年1月分
のデータであったとする。図4の命名規則に照らし合わ
せると、今回発生データを格納する表の名前は「A_200
1」となり、この表がディスク装置14−1〜14−4
(図1)上に存在するかどうか検索を行う。この結果、
目的の表「A_2001」が存在すればその表に対してデー
タ格納処理34を行うことになるが、この実施例の場合
はその表が存在しないため、格納先表の作成処理33を
行うことになる。
In the storage destination table determination processing 32, the "division unit" of the data A is acquired from the time-series data management information 13 (FIG. 1), and the division unit 22 of the data A is the month (FIG. 2). I understand. Next, it is assumed that the processing reference date 12 (FIG. 1) is acquired, and as a result, the data to be processed this time is the data for January 2001. In light of the naming rules in Fig. 4, the name of the table that stores the data generated this time is "A_200
1 ”, and this table shows the disk devices 14-1 to 14-4.
(Fig. 1) It is searched whether or not it exists. As a result,
If the target table “A_2001” exists, the data storage process 34 is performed on the table. However, in the case of this embodiment, since the table does not exist, the storage destination table creation process 33 is performed. Become.

【0027】格納先表の作成処理33では、まず図5の
フローチャートに従って表の作成先ディスク装置の決定
が行われる。図5のステップS1では時系列データ管理
情報(図1の3)からデータAの分割サイズを取得す
る。図2より、この値は1000MByteである。ステップS
2では、データAを構成している分割表が現時点で各デ
ィスク装置14−1〜14−4(図)上にそれぞれいく
つ存在しているかを求め、これを各ディスク装置に関す
る多重度と定義する図1を参照するとデータAに関する
各ディスク装置の多重度は次のようになる。
In the storage destination table creation processing 33, first, the table creation destination disk device is determined according to the flowchart of FIG. In step S1 of FIG. 5, the division size of the data A is acquired from the time-series data management information (3 in FIG. 1). From FIG. 2, this value is 1000 MByte. Step S
In 2, the number of partition tables forming the data A is present on each disk device 14-1 to 14-4 (Fig.) At present, and this is defined as the multiplicity for each disk device. Referring to FIG. 1, the multiplicity of each disk device for data A is as follows.

【0028】 ディスク装置14−1:多重度2 ディスク装置14−2:多重度2 ディスク装置14−3:多重度1 ディスク装置14−4:多重度1 よって、図5のステップS3では、ディスク装置14−
3と14−4を対象(グループ)として以下のステップ
へ処理が進む。今、ディスク装置14−3の空き容量が
3000MByte、ディスク装置14−4の空き容量が4000Mby
teであったすると、ステップS4でディスクAはディス
ク装置14−4となる。ステップS5では、ディスク装
置4−4の空き容量(4000MByte)は時系列データAの分
割サイズ(1000MByte)以上であると判断され、表の作成
先ディスクはディスク装置14−4と決定され、「A_2
001」という名前でディスク装置14−4上に表の作成
(領域確保)を行う。この時のサイズは先にデータAの
分割サイズとし、1000MByteとなる。
Disk device 14-1: Multiplicity 2 Disk device 14-2: Multiplicity 2 Disk device 14-3: Multiplicity 1 Disk device 14-4: Multiplicity 1 Therefore, in step S3 of FIG. 14-
The process proceeds to the following steps with 3 and 14-4 as targets (groups). Now, the free space of the disk device 14-3
3000MByte, free space of disk unit 14-4 is 4000Mby
If it is te, the disk A becomes the disk device 14-4 in step S4. In step S5, it is determined that the free capacity (4000 MBytes) of the disk device 4-4 is equal to or larger than the division size (1000 MBytes) of the time-series data A, the table creation destination disk is determined to be the disk device 14-4, and "A_2
A table is created (area is reserved) on the disk device 14-4 with the name "001". The size at this time is 1000 MBytes, which is the division size of the data A first.

【0029】データ格納処理34では、格納先表の判断
処理32で求めた「A_2001」という表名に対して、A
の今回発生データ11(図1)の格納を行う。
In the data storage process 34, the table name "A_2001" obtained in the storage destination table determination process 32 is set to A
The presently generated data 11 (FIG. 1) is stored.

【0030】累積期間経過データの判断処理35では、
処理基準日12(図1)と時系列管理情報13(図1)
に登録されている「累積期間」を取得した後、ディスク
装置14−1〜14−4(図1)からデータAを構成し
ている表を全て探し出し、削除が可能な表が存在するか
否かの判断を行う。先ほど、格納先表の作成処理33に
おいて、新たに表を作成しているので、現在データAを
構成する表は「A_1995」〜「A_2001」の7つとなる。
データAの「累積期間」25(図2)は5であるから、
最低限過去5年分のデータを保有しておく必要がある。
今、処理基準日12は2001年1月なので、「A_199
6」までの表が存在していれば最低限過去5年分のデー
タが保有されていることになる。よって、この場合削除
対象は「A_1995」となり、保有期間経過データの削除
処理36おいて、表「A_1995」をデータベースシステ
ム上から論理的に削除すると同時に、物理的にもディス
ク装置上から削除を行う。
In the judgment processing 35 of the accumulated period elapsed data,
Processing reference date 12 (Fig. 1) and time series management information 13 (Fig. 1)
After acquiring the "cumulative period" registered in the table, search for all the tables forming the data A from the disk devices 14-1 to 14-4 (Fig. 1), and check whether there is a table that can be deleted. Make a decision. Since a new table has been newly created in the storage destination table creation process 33, there are seven tables that currently compose the data A, "A_1995" to "A_2001".
Since the “cumulative period” 25 (FIG. 2) of data A is 5,
It is necessary to keep data for at least the past 5 years.
Since the processing reference date 12 is January 2001, "A_199
If the table up to 6 ”exists, it means that at least the data for the past 5 years is held. Therefore, in this case, the deletion target is "A_1995", and the table "A_1995" is logically deleted from the database system and physically deleted from the disk device in the deletion process 36 of the retention period elapsed data. .

【0031】仮想表作成処理37では、図6に示すよう
に、ディスク装置60のデータAを分割して格納してい
る全ての表を、データAという1つの仮想表80として
利用できるようSQLの集合演算(UNION)による仮想表
定義処理70にて仮想表定義を行う。仮想表80は、そ
れを構成する表のメンバー変更がある度に再定義する必
要があり、本方式では時系列データを構成する表は新た
に作成されたり削除されたりするのでこの処理にて毎回
再定義を行う。
In the virtual table creation process 37, as shown in FIG. 6, all the tables in which the data A of the disk device 60 is divided and stored are used as one virtual table 80 of the data A. A virtual table is defined in a virtual table definition process 70 by a set operation (UNION). It is necessary to redefine the virtual table 80 each time there is a change in the members of the tables that make up the virtual table 80. In this method, the tables that make up the time-series data are newly created or deleted. Redefine.

【0032】[0032]

【発明の効果】以上説明したように、本発明は次のよう
な特徴を備えている。 ・時系列データの種類毎にあらかじめパラメータ登録を
行っておくことにより、全ての管理の自動化を可能にす
る。 ・保有期間経過後のデータをレコード単位で削除するの
ではなく、表単位の物理的な削除で行うため、更新前情
報(ジャーナル)が発生せず高速な不用データの削除を
可能にする。 ・この削除方法により、データベースブロック内の物理
的な断片化などが発生しないため、定期的な表の再構成
などのメンテナンス処理が不用となり大幅な運用コスト
削減を可能にする。 ・時系列データを格納する物理的単位を年や月という時
系列的な単位の表で構成しているため、情報量の変化に
より、対象データのデータ発生量の増減が発生したとし
ても、時系列データ管理情報上のパラメータ値を変更す
ることにより、常に最適なサイズで領域確保が行なわ
れ、無駄なく効率的な記憶装置の利用を可能にする。 ・各時系列データを構成する表が、複数の記憶装置に対
して均等に配置されるよう表の作成先を決定しているの
で、データ利用時のディスク装置に対するI/Oが分散
され、保有データ量が増えてもアクセス性能劣化を最低
限に抑えることを可能にする。 ・各時系列データを複数の記憶装置に対して、時系列的
な単位で分割して格納しているため、ディスク障害時の
影響を各データに関して時系列的に局所に抑えることを
可能にする。
As described above, the present invention has the following features. -By registering parameters for each type of time-series data in advance, all management can be automated. -Since data after the retention period has passed is not deleted in record units but physically deleted in table units, pre-update information (journal) does not occur, enabling high-speed deletion of unnecessary data. -By this deletion method, physical fragmentation in the database block does not occur, so maintenance processing such as regular table reconfiguration is not necessary, and a large reduction in operating costs is possible. -Since the physical unit for storing time-series data is configured by a table of time-series units such as year and month, even if the amount of generated data of the target data increases or decreases due to changes in the amount of information, the time By changing the parameter value on the series data management information, the area is always secured with the optimum size, and the storage device can be efficiently used without waste. -Since the table creation destinations are determined so that the tables that make up each time-series data are evenly allocated to multiple storage devices, the I / O to the disk devices during data use is distributed and held. Even if the amount of data increases, it is possible to minimize access performance deterioration. -Since each time-series data is stored in multiple storage devices divided in time-series units, it is possible to suppress the effect of a disk failure locally in time-series for each data. .

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例におけるデータAの今回発生
データを示す図である。
FIG. 1 is a diagram showing currently generated data of data A according to an embodiment of the present invention.

【図2】本発明の一実施例におけるデータAに関する時
系列データ管理情報の内容を示す図である。
FIG. 2 is a diagram showing the contents of time-series data management information regarding data A in one embodiment of the present invention.

【図3】本発明の一実施例である管理方式を示すブロッ
ク構成図である。
FIG. 3 is a block diagram showing a management system according to an embodiment of the present invention.

【図4】本発明の一実施例における命名規則を示す図で
ある。
FIG. 4 is a diagram showing a naming convention in an embodiment of the present invention.

【図5】本発明の一実施例におけるフローチャートを示
す図である。
FIG. 5 is a diagram showing a flowchart in an embodiment of the present invention.

【図6】本発明の一実施例のデータAを分割して格納し
ている全ての表を示す図である。
FIG. 6 is a diagram showing all tables in which data A of one embodiment of the present invention is divided and stored.

【符号の説明】[Explanation of symbols]

11 Aの今回発生データ 12 処理基準日 13 時系列データ管理情報 14−1〜14−4、60 ディスク装置 21 時系列データ名 22、41 分割単位 23 分割サイズ 24 累積期間 31 時系列データAの格納要求 32 格納先表の判断処理 33 格納先表の作成処理 34 データ格納処理 35 累積期間経過データの判断処理 36 保有期間経過データの削除処理 37 仮想表作成処理 42 分割表名 70 仮想表定義処理 80 仮想表 This time's occurrence data of 11 A 12 Processing reference date 13 Time-series data management information 14-1 to 14-4, 60 Disk device 21 Time series data name 22, 41 division unit 23 division size 24 cumulative period 31 Storage request for time series data A 32 Storage Destination Table Judgment Processing 33 Storage table creation processing 34 Data storage processing 35 Judgment processing of accumulated period elapsed data 36 Deletion processing of retention period elapsed data 37 Virtual table creation processing 42 Contingency table name 70 Virtual table definition processing 80 virtual table

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 定期的に発生するデータを時系列的に長
期間に渡り累積を行う記憶装置を有するデータベースシ
ステムにおいて、時系列データの種類毎にあらかじめパ
ラメータの登録を行う手段を有し、前記パラメータ値に
より時系列的データの管理を行うことを特徴とする時系
列データ自動管理方式。
1. A database system having a storage device for accumulating regularly generated data in time series over a long period of time, comprising means for previously registering parameters for each type of time series data, An automatic time-series data management method that manages time-series data according to parameter values.
【請求項2】 時系列データを格納する物理的単位を年
や月という時系列的な単位の表で構成する手段と、時系
列データの管理情報上のパラメータ値を変更する手段
と、常に最適なサイズで領域確保が行なわれる手段とを
有し、無駄なく効率的な記憶装置の利用を可能にするこ
とを特徴とする請求項1記載の時系列データ自動管理方
式。
2. A means for constructing a physical unit for storing time-series data as a table of time-series units such as a year and a month, and a means for changing a parameter value in management information of the time-series data are always optimal. The time-series data automatic management system according to claim 1, further comprising means for allocating an area of a different size, enabling efficient and efficient use of the storage device.
【請求項3】 保有期間経過後のデータを表単位の物理
的な削除で行なう手段を有し、不用データの削除を可能
にすることを特徴とする請求項2記載の時系列データ自
動管理方式。
3. The time-series data automatic management method according to claim 2, further comprising means for physically deleting the data after the retention period has passed by a table unit so that unnecessary data can be deleted. .
【請求項4】 各時系列データを構成する表が、複数の
記憶装置に対して均等に配置されるよう表の作成先を決
定する手段と、データ利用時のディスク装置に対するI
/Oが分散する手段とを有し、保有データ量が増えても
アクセス性能劣化を最低限に抑えることを可能にするこ
とを特徴とする請求項2記載の時系列データ自動管理方
式。
4. A means for deciding a table creation destination so that a table constituting each time series data is evenly arranged for a plurality of storage devices, and an I for a disk device when using the data.
3. The time series data automatic management method according to claim 2, further comprising means for distributing / O, which makes it possible to suppress deterioration of access performance to a minimum even if the amount of retained data increases.
【請求項5】 各時系列データを複数の記憶装置に対し
て、時系列的な単位で分割して格納する手段を有し、デ
ィスク障害時の影響を各データに関して時系列的に局所
に抑えることを可能にすることを特徴とする請求項4記
載の時系列データ自動管理方式。
5. A means for storing each time-series data in a plurality of storage devices by dividing it in time-series units, and suppressing the influence at the time of a disk failure locally on each data in time series. The time-series data automatic management system according to claim 4, which enables the above.
【請求項6】 管理対象である時系列データの発生デー
タと、処理対象の時系列データがいつ時点のものである
かを判断するためにマシン日付などから取得した統一的
な日付情報が格納されている処理基準日と、管理対象と
なる各時系列データに関する情報の時系列データ管理情
報と、前記発生データ、前記処理基準日および前記時系
列データ管理情報をパラメータ形式であらかじめ登録す
る手段とを有することを特徴とする請求項1記載の時系
列データ自動管理方式。
6. The generation data of the time-series data to be managed and the unified date information acquired from the machine date or the like to determine when the time-series data to be processed are stored are stored. Processing reference date, time-series data management information of information relating to each time-series data to be managed, and means for previously registering the generated data, the processing reference date, and the time-series data management information in a parameter format. The automatic time-series data management system according to claim 1, characterized in that it has.
JP2001187220A 2001-06-20 2001-06-20 System for automatically managing time-series data Pending JP2003006007A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001187220A JP2003006007A (en) 2001-06-20 2001-06-20 System for automatically managing time-series data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001187220A JP2003006007A (en) 2001-06-20 2001-06-20 System for automatically managing time-series data

Publications (1)

Publication Number Publication Date
JP2003006007A true JP2003006007A (en) 2003-01-10

Family

ID=19026543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001187220A Pending JP2003006007A (en) 2001-06-20 2001-06-20 System for automatically managing time-series data

Country Status (1)

Country Link
JP (1) JP2003006007A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070257A (en) * 2009-09-24 2011-04-07 Hitachi Solutions Ltd File retrieval system
JP2021518021A (en) * 2018-05-14 2021-07-29 ネッツユニオン クリアリング コーポレーション Data processing methods, equipment and computer readable storage media

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070257A (en) * 2009-09-24 2011-04-07 Hitachi Solutions Ltd File retrieval system
JP2021518021A (en) * 2018-05-14 2021-07-29 ネッツユニオン クリアリング コーポレーション Data processing methods, equipment and computer readable storage media
JP7133647B2 (en) 2018-05-14 2022-09-08 ネッツユニオン クリアリング コーポレーション DATA PROCESSING METHOD, APPARATUS AND COMPUTER-READABLE STORAGE MEDIUM
US11934371B2 (en) 2018-05-14 2024-03-19 Netsunion Clearing Corporation Data processing method and apparatus, and computer-readable storage medium

Similar Documents

Publication Publication Date Title
US10740308B2 (en) Key_Value data storage system
CN104067216B (en) System and method for implementing expansible data storage service
US9052831B1 (en) System and method for performing live partitioning in a data store
US20140258232A1 (en) System and method for performing replica copying using a physical copy mechanism
CN106537345A (en) Precisely tracking memory usage in multi-process computing environment
CN102930062A (en) Rapid horizontal extending method for databases
CN103383653A (en) Method and system for managing and dispatching cloud resource
CN105635331A (en) Service addressing method and apparatus in distributed environment
US20130179476A1 (en) Scalable billing usage data storage
CN102043726B (en) Storage management method of large-scale timing sequence data
CN109947787A (en) A kind of storage of data hierarchy, hierarchical query method and device
CN105376269B (en) Virtual machine storage system and its implementation and device
CN108022445A (en) A kind of method, system and the server of definite parking lot information
US7289990B2 (en) Method and apparatus for reducing index sizes and increasing performance of non-relational databases
CN102982186A (en) Method and system for maintaining range partitioning table based on oracle database system
CN106790705A (en) A kind of Distributed Application local cache realizes system and implementation method
CN108574718A (en) A kind of cloud host creation method and device
CN113177033B (en) Log data storage method and device, electronic equipment and medium
US20040117408A1 (en) Systems, methods and articles of manufacture for determining available space in a database
JP2003006007A (en) System for automatically managing time-series data
CN101030884B (en) Method for scheduling independent resource in telecommunication network resource OSS system
CN110597805B (en) Memory index structure processing method
US20130304707A1 (en) Data Archiving Approach Leveraging Database Layer Functionality
CN105354317A (en) Hotel database updating method and system
CN109376001A (en) A kind of method and apparatus of resource allocation

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050816

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051220