JP2010271781A - System and method for dividing data - Google Patents

System and method for dividing data Download PDF

Info

Publication number
JP2010271781A
JP2010271781A JP2009121148A JP2009121148A JP2010271781A JP 2010271781 A JP2010271781 A JP 2010271781A JP 2009121148 A JP2009121148 A JP 2009121148A JP 2009121148 A JP2009121148 A JP 2009121148A JP 2010271781 A JP2010271781 A JP 2010271781A
Authority
JP
Japan
Prior art keywords
data
combination
block
combined
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009121148A
Other languages
Japanese (ja)
Other versions
JP5410155B2 (en
Inventor
Daisuke Ochi
大介 越智
Ichiro Okajima
一郎 岡島
Hiroshi Kawakami
博 川上
Toshihiro Suzuki
俊博 鈴木
Banki Cho
晩煕 趙
Tomohiro Nagata
智大 永田
Motonari Kobayashi
基成 小林
Yuki Oyabu
勇輝 大薮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2009121148A priority Critical patent/JP5410155B2/en
Publication of JP2010271781A publication Critical patent/JP2010271781A/en
Application granted granted Critical
Publication of JP5410155B2 publication Critical patent/JP5410155B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To improve the efficiency of data processing by logically dividing large amounts of data into capacities suitable for processing on the basis of an appropriate criterion. <P>SOLUTION: Pre-connection data having a plurality of parameters are stored in a pre-connection data temporary storage part 12 as blocks bk for each datum having the value of the same division in the parameters, and the blocks bk whose values of only selection parameters are different are connected by a data connection part 14 as connection candidate blocks, and connection object blocks are extracted from the selected connection candidate blocks by the data connection part 14 so that the total of the capacities of the pre-connection data included in the blocks bk can exceed a prescribed capacity, and the extracted connection candidate blocks are connected, so that a connection file is generated, and written in a connection file storage part 20 by a data writing part 15. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、データ分割システム及びデータ分割方法に関する。   The present invention relates to a data division system and a data division method.

従来、所定のデータ処理を行うシステムにおいて、大量に蓄積されたデータを分割して処理を行う場合には、例えば一定のデータ量ごとに分割して、分割されたデータ群に対して処理を実施していた。また、蓄積されるデータが何らかの属性を有する場合には、その属性ごとにデータを分類する方法が知られている(例えば、特許文献1参照)。   Conventionally, in a system that performs predetermined data processing, when processing is performed by dividing a large amount of accumulated data, for example, the processing is performed on the divided data group by dividing the data into a certain amount of data, for example. Was. Further, when the accumulated data has some attribute, a method of classifying the data for each attribute is known (for example, refer to Patent Document 1).

特表2008−524712号公報Special table 2008-524712

蓄積された大量のデータについて各種処理を実施する場合において、大量のデータを単に一定の容量ごとのデータ群に分割したのでは、分割した複数のデータ群の全てのデータを参照する必要があった。また、蓄積されたデータが属性(パラメータ)を有しており、単に属性ごとに分割してファイルを生成した場合であっても、分割単位が細かすぎると、1つのファイルの容量が小さくなり、ファイル数が膨大になり、後に実施するデータ処理の効率が悪い。   When various processes are performed on a large amount of accumulated data, if a large amount of data is simply divided into data groups each having a fixed capacity, it is necessary to refer to all of the divided data groups. . In addition, even when the accumulated data has attributes (parameters) and a file is generated by simply dividing each attribute, if the division unit is too small, the capacity of one file becomes small, The number of files becomes enormous and the efficiency of data processing to be performed later is poor.

そこで、本発明は、かかる問題点に鑑みてなされたものであり、処理に好適な容量に大量のデータを分割するに際して、論理的に適切な基準で分割することによりデータ処理の効率を向上させることが可能なデータ分割システム及びデータ分割方法を提供することを目的とする。   Therefore, the present invention has been made in view of such a problem, and when dividing a large amount of data into a capacity suitable for processing, the efficiency of data processing is improved by dividing it according to a logically appropriate standard. It is an object of the present invention to provide a data partitioning system and a data partitioning method that can be used.

上記課題を解決するために、本発明のデータ分割システムは、複数のパラメータを有するデータである結合前データの集合を、複数のファイルに分割し、分割したファイルを所定の記憶手段に書き出すデータ分割システムであって、複数のパラメータに同一の範囲区分に属する値を有する結合前データを、結合前データのまとまりである複数のブロックごとに一時蓄積する結合前データ一時蓄積手段と、複数のパラメータから選択された一のパラメータである選択パラメータを選択する選択パラメータ選択手段と、結合前データ一時蓄積手段に蓄積された複数のブロックから、選択パラメータ選択手段により選択された選択パラメータの値のみが異なる結合前データを含む複数のブロックを結合候補ブロックとして、該結合候補ブロックをグループ化した結合候補ブロック群を1または複数形成するブロック選択処理を実行する結合候補ブロック選択手段と、結合候補ブロック選択手段により形成された結合候補ブロック群ごとに、該結合候補ブロック群から、予め定められた所定の分割基準を満たすように、1または複数の結合候補ブロックを結合対象ブロックとして抽出するブロック抽出処理を実行する結合対象ブロック抽出手段と、結合対象ブロック抽出手段により抽出された結合対象ブロックに含まれる結合前データを結合して、結合候補ブロック群ごとに1または複数の結合ファイルを生成する結合ファイル生成処理を実行する結合ファイル生成手段と、結合ファイル生成手段により生成された結合ファイルを所定の記憶手段に記憶させると共に、結合対象ブロックに含まれるすべての結合前データを結合前データ一時蓄積手段から消去する書き出し処理を実行する結合ファイル書き出し手段とを備えることを特徴とする。   In order to solve the above-mentioned problem, the data division system of the present invention divides a set of pre-combination data, which is data having a plurality of parameters, into a plurality of files, and writes the divided files to a predetermined storage means. A pre-combination data temporary storage means for temporarily storing pre-combination data having values belonging to the same range category in a plurality of parameters for each of a plurality of blocks as a group of the pre-combination data; and a plurality of parameters A selection parameter selection means for selecting a selection parameter that is one selected parameter, and a combination in which only the value of the selection parameter selected by the selection parameter selection means is different from a plurality of blocks stored in the pre-combination data temporary storage means A plurality of blocks including the previous data are set as combination candidate blocks, and the combination candidate blocks are grouped. For each combination candidate block group formed by the combination candidate block selection unit that performs block selection processing for forming one or a plurality of combined combination candidate block groups and the combination candidate block selection unit, from the combination candidate block group, A combination target block extraction unit that executes block extraction processing for extracting one or a plurality of combination candidate blocks as a combination target block so as to satisfy a predetermined division criterion, and a combination extracted by the combination target block extraction unit Combined file generation means for executing combined file generation processing for combining the pre-combination data included in the target block and generating one or a plurality of combined files for each combination candidate block group, and the combined file generated by the combined file generation means The file is stored in a predetermined storage means and included in the target block. Characterized in that it comprises a combined file writing means for performing a writing process of deleting all pre-bound data from the combined pre-data temporary storage means to be.

また、上記課題を解決するために、本発明のデータ分割方法は、複数のパラメータを有するデータである結合前データの集合を、複数のファイルに分割し、分割したファイルを所定の記憶手段に書き出すデータ分割方法であって、複数のパラメータから選択された一のパラメータである選択パラメータを選択する選択パラメータ選択ステップと、複数のパラメータに同一の範囲区分に属する値を有する結合前データを、結合前データのまとまりである複数のブロックごとに一時蓄積する結合前データ一時蓄積手段に蓄積された複数のブロックから、選択パラメータ選択ステップにおいて選択された選択パラメータの値のみが異なる結合前データを含む複数のブロックを結合候補ブロックとして、該結合候補ブロックをグループ化した結合候補ブロック群を1または複数形成する結合候補ブロック選択ステップと、結合候補ブロック選択ステップにおいて形成された結合候補ブロック群ごとに、該結合候補ブロック群から、予め定められた所定の分割基準を満たすように、1または複数の結合候補ブロックを結合対象ブロックとして抽出する結合対象ブロック抽出ステップと、結合対象ブロック抽出ステップにおいて抽出された結合対象ブロックに含まれる結合前データを結合して、結合候補ブロック群ごとに1または複数の結合ファイルを生成する結合ファイル生成ステップと、結合ファイル生成ステップにおいて生成された結合ファイルを、所定の記憶手段に記憶させると共に、結合対象ブロックに含まれるすべての結合前データを結合前データ一時蓄積手段から消去する結合ファイル書き出しステップとを有することを特徴とする。   In order to solve the above problem, the data division method of the present invention divides a set of pre-combination data, which is data having a plurality of parameters, into a plurality of files, and writes the divided files to a predetermined storage means. A data division method, a selection parameter selection step for selecting a selection parameter that is one parameter selected from a plurality of parameters, and pre-combination data having values belonging to the same range category for the plurality of parameters. A plurality of blocks including pre-combination data in which only the value of the selection parameter selected in the selection parameter selection step is different from the plurality of blocks stored in the pre-combination data temporary storage means that temporarily stores the data in a plurality of blocks. Candidates that combine the candidate blocks as a candidate block A combination candidate block selection step for forming one or a plurality of lock groups and a combination candidate block group formed in the combination candidate block selection step so as to satisfy a predetermined predetermined division criterion from the combination candidate block group For each candidate block group, by combining the combination target block extraction step for extracting one or a plurality of combination candidate blocks as a combination target block and the pre-combination data included in the combination target block extracted in the combination target block extraction step A combined file generation step for generating one or a plurality of combined files, and a combined file generated in the combined file generation step is stored in a predetermined storage means and all pre-combination data included in the combination target blocks are combined A combination file to be deleted from the previous data temporary storage means. And having a yl writing step.

本発明のデータ分割システム及びデータ分割方法では、選択パラメータの値のみが異なるブロックが結合候補ブロックとして選択されるので、結合されるブロックに含まれる結合前データは、選択パラメータ以外のパラメータ値が同一である。これにより、結合前データの集合から論理的に適切な意味を有する結合ファイルを分割することができる。また、選択された結合候補ブロックから、所定の分割基準を満たすように、結合対象ブロックが抽出されるので、結合前データの集合から、データ処理に好適な容量の結合ファイルを分割することが可能となる。   In the data partitioning system and data partitioning method of the present invention, blocks that differ only in the value of the selection parameter are selected as the combination candidate blocks, so the pre-combination data included in the blocks to be combined have the same parameter values other than the selection parameter It is. As a result, a combined file having a logically appropriate meaning can be divided from the set of data before combining. In addition, since the block to be combined is extracted from the selected combination candidate block so as to satisfy a predetermined division criterion, it is possible to divide a combined file having a capacity suitable for data processing from a set of pre-combination data. It becomes.

また、本発明のデータ分割システムでは、結合対象ブロック抽出手段は、所定の分割基準として、結合候補ブロックに含まれる結合前データの容量の合計が予め定められた所定容量を超えるように、または、予め定められた所定時間が経過したときに、結合候補ブロック群から1または複数の結合候補ブロックを結合対象ブロックとして抽出することを特徴とする。   Further, in the data division system of the present invention, the combination target block extraction means, as a predetermined division criterion, so that the total amount of data before combination included in the combination candidate blocks exceeds a predetermined predetermined capacity, or One or a plurality of combination candidate blocks are extracted as a combination target block from the combination candidate block group when a predetermined time has passed.

この場合には、結合候補ブロック群から結合候補ブロックを結合対象ブロックとして抽出する際の分割基準として、結合候補ブロックに含まれる結合前データの容量、及び一定の時間間隔(所定時間の経過)等の複数の基準で定義できる。これにより、結合前データの容量の合計が予め定められた所定容量を超えるように結合対象ブロックを抽出し、一定時間間隔でデータが分割されるように結合対象ブロックを抽出することができる。従って、データ処理に好適な容量の結合ファイルを分割することが可能となる。   In this case, as a division criterion when extracting a candidate combination block from the candidate combination block group as a combination target block, the capacity of data before combination included in the candidate combination block, a certain time interval (elapse of a predetermined time), etc. Can be defined by multiple criteria. As a result, the block to be combined can be extracted so that the total capacity of the data before combining exceeds a predetermined capacity, and the block to be combined can be extracted so that the data is divided at regular time intervals. Therefore, it is possible to divide a combined file having a capacity suitable for data processing.

また、本発明のデータ分割システムでは、結合前データは、第1〜第n(nは2以上の整数)の複数のパラメータを有し、選択パラメータ選択手段は、選択パラメータとして、複数のパラメータから第1〜第nのパラメータを順次選択し、選択パラメータ選択手段により選択パラメータとして選択された第1〜第nのパラメータごとに、結合候補ブロック選択手段によるブロック選択処理、結合対象ブロック抽出手段によるブロック抽出処理、結合ファイル生成手段による結合ファイル生成処理、及び結合ファイル書き出し手段による書き出し処理が、最大n回順次実行されることを特徴とする。   In the data division system of the present invention, the pre-combination data has a plurality of first to nth parameters (n is an integer equal to or greater than 2), and the selection parameter selection means selects a plurality of parameters as selection parameters. A block selection process by a combination candidate block selection unit and a block by a combination target block extraction unit are selected for each of the first to nth parameters which are sequentially selected as the selection parameters by the selection parameter selection unit. The extraction process, the combined file generating process by the combined file generating means, and the writing process by the combined file writing means are sequentially executed up to n times.

また、本発明のデータ分割方法では、結合前データは、第1〜第n(nは2以上の整数)の複数のパラメータを有し、選択パラメータ選択ステップ、結合候補ブロック選択ステップ、結合対象ブロック抽出ステップ、結合ファイル生成ステップ、及び結合ファイル書き出しステップを、第1〜第nのパラメータごとに最大n回順次実行することを特徴とする。   In the data division method of the present invention, the pre-combination data has a plurality of first to n-th parameters (n is an integer of 2 or more), a selection parameter selection step, a combination candidate block selection step, a combination target block The extracting step, the combined file generating step, and the combined file writing step are sequentially executed at most n times for each of the first to nth parameters.

これらの構成では、結合前データが第1〜第nの複数のパラメータを有する場合において、各パラメータごとに順次、ブロックを結合して結合前データの集合から結合ファイルを分割、生成する処理が行われるので、結合前データの集合から、論理的に適切な意味を有すると共に、データ処理に好適な容量の結合ファイルを分割することができる。   In these configurations, when the pre-combination data has a plurality of first to n-th parameters, a process of sequentially combining the blocks for each parameter to divide and generate a combined file from the set of pre-combination data is performed. Therefore, a combined file having a logically appropriate meaning and suitable for data processing can be divided from the set of data before combining.

また、本発明のデータ分割システムでは、結合ファイル生成手段は、結合候補ブロックから結合対象ブロックとして抽出されなかったブロックである残結合候補ブロックに含まれる結合前データを結合して残結合ファイルを生成し、結合ファイル書き出し手段は、結合ファイル生成手段により生成された残結合ファイルを所定の記憶手段に記憶させると共に、残結合対象ブロックに含まれるすべての結合前データを結合前データ一時蓄積手段から消去することを特徴とする。   In the data division system of the present invention, the combined file generation unit generates the remaining combined file by combining the pre-combined data included in the remaining combined candidate blocks that are not extracted from the combined candidate blocks as the blocks to be combined. The combined file writing unit stores the remaining combined file generated by the combined file generating unit in a predetermined storage unit and erases all the pre-combination data included in the remaining combined target blocks from the pre-combination data temporary storage unit. It is characterized by doing.

この場合には、ブロックに含まれる結合前データの容量の合計が所定容量に達していないなど、一定の分割基準を満たしていなくとも、結合ファイルとして分割、書き出しが行われた結合前データと論理的な意味づけを有する結合前データを残結合ファイルとして書き出すことができる。これにより、結合ファイルに含まれる結合前データ間における論理的意味づけと同一の論理的意味づけを有する結合前データを、結合前データ一時蓄積手段に残さないようにすることができる。   In this case, even if the total capacity of the pre-combination data contained in the block does not reach the predetermined capacity, even if the data does not meet certain division criteria, it is logically combined with the pre-combination data and logical data that were divided and written out as a combined file. Pre-combination data having specific meaning can be written out as a remaining combined file. Thereby, it is possible to prevent the pre-combination data having the same logical meaning as the logical meaning between the pre-combination data included in the connection file from being left in the pre-combination data temporary storage unit.

また、本発明のデータ分割システムでは、結合前データ一時蓄積手段において、一のブロックに含まれる結合前データが所定の分割基準を満たした場合には、結合ファイル生成手段は、一のブロックに含まれる結合前データを結合して結合ファイルを生成することを特徴とする。   In the data division system of the present invention, in the pre-combination data temporary storage unit, when the pre-combination data included in one block satisfies a predetermined division criterion, the combined file generation unit is included in one block. A combined file is generated by combining the pre-combined data.

一のブロックに含まれる複数の結合前データは、同一範囲区分のパラメータ値を有するので、互いに論理的な意味づけを有する。この構成では、これらの論理的な意味づけを有する複数の結合前データが結合ファイルとして書き出されるので、結合前データの集合から、論理的に適切な意味を有すると共に、データ処理に好適な容量の結合ファイルを分割することができる。   A plurality of pre-combination data included in one block have parameter values in the same range section, and thus have logical meanings. In this configuration, since a plurality of pre-combination data having these logical meanings is written out as a joint file, the logical pre-combination data set has a logically appropriate meaning and has a capacity suitable for data processing. Combined files can be split.

本発明のデータ分割システム及びデータ分割方法によれば、選択パラメータの値のみが異なるブロックが結合候補ブロックとして選択されるので、結合されるブロックに含まれる結合前データは、選択パラメータ以外のパラメータ値が同一範囲区分である。これにより、結合前データの集合から論理的に適切な意味を有する結合ファイルを分割することができる。また、選択された結合候補ブロックから、ブロックに含まれる結合前データの容量の合計が所定容量を超えるなどの所定の分割基準を満たすように、結合対象ブロックが抽出されるので、結合前データの集合から、データ処理に好適な容量の結合ファイルを分割することが可能となる。また、選択パラメータは単一ではなく、再帰的に複数のパラメータにて再帰的に結合候補ブロックの選択および結合対象ブロックの抽出が行われる。従って、分割されたデータを用いたデータ処理の効率を向上させることが可能となる。   According to the data division system and the data division method of the present invention, blocks that differ only in the value of the selection parameter are selected as the combination candidate blocks. Therefore, the pre-combination data included in the blocks to be combined is a parameter value other than the selection parameter. Are the same range classification. As a result, a combined file having a logically appropriate meaning can be divided from the set of data before combining. Further, since the block to be combined is extracted from the selected combination candidate block so as to satisfy a predetermined division criterion such that the total capacity of the pre-combination data included in the block exceeds a predetermined capacity, A combined file having a capacity suitable for data processing can be divided from the set. In addition, the selection parameter is not single, but the recursive selection of the candidate block and the extraction of the block to be combined are performed using a plurality of parameters. Therefore, the efficiency of data processing using the divided data can be improved.

実施形態に係るデータ分割システム及びデータ生成ノードを含む全体構成図である。1 is an overall configuration diagram including a data division system and a data generation node according to an embodiment. データ分割装置の機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of a data division | segmentation apparatus. データ分割装置のハードブロック図である。It is a hardware block diagram of a data division device. 結合前データ一時蓄積部の構成の一例を示す図である。It is a figure which shows an example of a structure of the pre-combination data temporary storage part. データ分割システムにおいて実施されるデータ分割方法の処理内容を示すフローチャートである。It is a flowchart which shows the processing content of the data division method implemented in a data division system. データ分割システムにおいて実施されるデータ分割方法の処理内容を示すフローチャートである。It is a flowchart which shows the processing content of the data division method implemented in a data division system. データ分割システムにおいて実施されるデータ分割方法の処理内容を示すフローチャートである。It is a flowchart which shows the processing content of the data division method implemented in a data division system. データ分割システムにおいて実施されるデータ分割方法の処理内容を示すフローチャートである。It is a flowchart which shows the processing content of the data division method implemented in a data division system. データ分割システムにおいて実施されるデータ分割方法の処理内容を示すフローチャートである。It is a flowchart which shows the processing content of the data division method implemented in a data division system. データ分割方法の処理の過程における結合前データ一時蓄積部の一部の状態を例示した図である。It is the figure which illustrated the state of a part of pre-combination data temporary storage part in the process of the data division | segmentation method. データ分割方法の処理の過程における結合前データ一時蓄積部の一部の状態を例示した図である。It is the figure which illustrated the state of a part of pre-combination data temporary storage part in the process of the data division | segmentation method.

本発明の実施形態に係るデータ分割システムについて図面を参照して説明する。なお、可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。   A data division system according to an embodiment of the present invention will be described with reference to the drawings. If possible, the same parts are denoted by the same reference numerals, and redundant description is omitted.

図1は、本発明の実施形態に係るデータ分割装置1を含むシステムの全体構成図である。図1に示すように、データ分割装置1を含むシステムは、データ生成ノードN1〜N3及び外部ファイルシステム2を含む。   FIG. 1 is an overall configuration diagram of a system including a data dividing device 1 according to an embodiment of the present invention. As shown in FIG. 1, the system including the data dividing device 1 includes data generation nodes N1 to N3 and an external file system 2.

データ分割装置1は、データ生成ノードN1〜N3から送信されるデータをデータの集合として一時蓄積し、蓄積したデータを複数のファイルに分割して所定の記憶手段を有する外部ファイルシステム2に書き出す装置であり、例えばサーバ装置により構成される。以降の説明では、データ生成ノードN1〜N3から送信されるデータを結合前データと称する。結合前データは複数のパラメータを有している。   The data dividing device 1 is a device that temporarily accumulates data transmitted from the data generation nodes N1 to N3 as a set of data, divides the accumulated data into a plurality of files, and writes the data to an external file system 2 having a predetermined storage means. For example, it is configured by a server device. In the following description, data transmitted from the data generation nodes N1 to N3 is referred to as pre-combination data. The pre-combination data has a plurality of parameters.

データ生成ノードN1〜N3はそれぞれ、結合前データを生成してデータ分割装置1に送信する装置であり、例えばサーバ装置により構成される。本実施形態では、データ生成ノードN1〜N3は、移動端末の位置情報を収集する装置であり、結合前データは、移動端末の位置情報のデータである。位置情報は、例えば、地域、データ種別、時刻、情報源等のパラメータを有することができる。また、何れかのデータ生成ノードN1〜N3からデータ分割装置1に位置情報が送信される際には、データ生成ノードN1〜N3の識別子がパラメータとして付される。このように、本実施形態における結合前データは、上記のパラメータを有する位置情報である。なお、本実施形態では、3つのデータ生成ノードN1〜N3を図示しているが、データ生成ノードの数はこれに限られない。   Each of the data generation nodes N1 to N3 is a device that generates pre-combination data and transmits it to the data dividing device 1, and is configured by a server device, for example. In the present embodiment, the data generation nodes N1 to N3 are devices that collect location information of mobile terminals, and the pre-combination data is data of location information of mobile terminals. The location information can have parameters such as region, data type, time, and information source, for example. Further, when the position information is transmitted from any of the data generation nodes N1 to N3 to the data dividing device 1, the identifiers of the data generation nodes N1 to N3 are attached as parameters. Thus, the pre-combination data in this embodiment is position information having the above parameters. In the present embodiment, three data generation nodes N1 to N3 are illustrated, but the number of data generation nodes is not limited to this.

外部ファイルシステム2は、結合ファイル記憶部20(所定の記憶手段)を備えており、データ分割装置1から送出される結合ファイルを、当該結合ファイルに含まれる結合前データの論理的な意味づけに依存した識別子を付して、結合ファイル記憶部20に記憶させる。   The external file system 2 includes a combined file storage unit 20 (predetermined storage means), and uses the combined file sent from the data dividing device 1 as a logical meaning of the pre-combined data included in the combined file. The dependent identifier is attached and stored in the combined file storage unit 20.

続いて、図2を参照して、データ分割装置1の機能を説明する。図2は、データ分割装置1の機能的構成を示すブロック図である。   Next, the function of the data dividing device 1 will be described with reference to FIG. FIG. 2 is a block diagram showing a functional configuration of the data dividing device 1.

データ分割装置1は、機能的には、データ取得部11、結合前データ一時蓄積部12(結合前データ一時蓄積手段)、タイマ13、データ結合部14(選択パラメータ選択手段、結合候補ブロック選択手段、結合対象ブロック抽出手段、結合ファイル生成手段)及びデータ書き出し部15(結合ファイル書き出し手段)を備える。   Functionally, the data dividing apparatus 1 includes a data acquisition unit 11, a pre-combination data temporary storage unit 12 (pre-combination data temporary storage unit), a timer 13, a data combination unit 14 (selection parameter selection unit, combination candidate block selection unit). , A target block extracting unit, a combined file generating unit), and a data writing unit 15 (a combined file writing unit).

また、図3は、データ分割装置1のハードウエア構成図である。データ分割装置1は、物理的には、図3に示すように、CPU101、主記憶装置であるRAM102及びROM103、ネットワークカード等のデータ送受信デバイスである通信モジュール104、ハードディスク、フラッシュメモリ等の補助記憶装置105、入力デバイスであるキーボード及びマウス等の入力装置106、ディスプレイ等の出力装置107などを含むコンピュータシステムとして構成されている。図2に示した各機能は、図3に示すCPU101、RAM102等のハードウエア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU101の制御のもとで通信モジュール104、入力装置106、出力装置107を動作させるとともに、RAM102や補助記憶装置105におけるデータの読み出し及び書き込みを行うことで実現される。   FIG. 3 is a hardware configuration diagram of the data dividing device 1. As shown in FIG. 3, the data dividing apparatus 1 physically includes a CPU 101, a RAM 102 and a ROM 103 which are main storage devices, a communication module 104 which is a data transmission / reception device such as a network card, an auxiliary storage such as a hard disk and a flash memory. The computer system includes a device 105, an input device 106 such as a keyboard and mouse as input devices, an output device 107 such as a display, and the like. Each function shown in FIG. 2 has a communication module 104, an input device 106, and an output device 107 under the control of the CPU 101 by loading predetermined computer software on the hardware such as the CPU 101 and the RAM 102 shown in FIG. This is realized by reading and writing data in the RAM 102 and the auxiliary storage device 105.

再び、図2を参照し、データ分割装置1の各機能部について詳細に説明する。   Again, with reference to FIG. 2, each function part of the data division | segmentation apparatus 1 is demonstrated in detail.

データ取得部11は、データ生成ノードN1〜N3から送出された移動端末の位置情報を結合前データとして取得し、取得した結合前データを結合前データ一時蓄積部12に記憶させる部分である。   The data acquisition unit 11 is a part that acquires the location information of the mobile terminals sent from the data generation nodes N1 to N3 as pre-combination data, and stores the acquired pre-combination data in the pre-combination data temporary storage unit 12.

結合前データ一時蓄積部12は、結合前データを記憶する記憶手段である。図4は、結合前データ一時蓄積部12の構成の一例を示す図である。本実施形態において、結合前データは、パラメータA,B,Cを有しており、パラメータAの値は区分a1〜a10のいずれかの範囲区分に属し、パラメータBの値は区分b1〜b10のいずれかの範囲区分に属し、パラメータCの値は区分c1〜c10のいずれかの範囲区分に属するものとする。a1〜a10において、a(n)の範囲区分は任意に設定可能だが、一例としてはa(n)−s≦x<a(n+1)−s(は0≦s≦a(n+1)−a(n)を満たす任意の数)となるxの範囲とする。例えば、a1は0〜1(1を含む)、a2は1〜2(2を含む)、・・・a10は9〜10(10を含む)の範囲区分を持つとし、ある結合前データがパラメータAにおいてa=1.1となる値aを保持する場合、それはa2の範囲区分に属するものとする。図4に示すように、結合前データ一時蓄積部12、パラメータA〜Cに同一の区分を有する複数の結合前データを管理するためのブロックbkを有する。図4に示す例では、結合前データ一時蓄積部12は、1000個(10×10×10)のブロックbkを有する。以下の説明において、例えばパラメータAの区分がa1であり、パラメータBの区分がb1であり、パラメータCの区分がc1であるブロックbkを、「ブロックbk(a1,b1,c1)」と表記する。なお、ブロックbkは、結合前データのまとまりとしての概念であり、1つのブロックbkは1つのファイルであっても良いし、ファイル内のレコードのまとまりであっても良い。   The pre-combination data temporary storage unit 12 is a storage unit that stores pre-combination data. FIG. 4 is a diagram illustrating an example of the configuration of the pre-combination data temporary storage unit 12. In this embodiment, the pre-combination data has parameters A, B, and C, the value of parameter A belongs to one of the range categories of categories a1 to a10, and the value of parameter B is the value of categories b1 to b10. It belongs to any one of the range categories, and the value of the parameter C belongs to any one of the range categories of the categories c1 to c10. In a1 to a10, the range division of a (n) can be arbitrarily set. As an example, a (n) −s ≦ x <a (n + 1) −s (is 0 ≦ s ≦ a (n + 1) −a ( Any number satisfying n) is set to a range of x. For example, a1 has a range of 0 to 1 (including 1), a2 has 1 to 2 (including 2),... A10 has a range of 9 to 10 (including 10), and some pre-combination data is a parameter If A holds a value a such that a = 1.1, it belongs to the range section of a2. As shown in FIG. 4, the pre-combination data temporary storage unit 12 includes a block bk for managing a plurality of pre-combination data having the same division in parameters A to C. In the example illustrated in FIG. 4, the pre-combination data temporary storage unit 12 includes 1000 (10 × 10 × 10) blocks bk. In the following description, for example, a block bk in which the parameter A classification is a1, the parameter B classification is b1, and the parameter C classification is c1 is expressed as “block bk (a1, b1, c1)”. . The block bk is a concept as a group of pre-combination data, and one block bk may be one file or a group of records in the file.

なお、本実施形態では、結合前データは3個のパラメータA,B,Cを有することとしたが、パラメータの数は3個に限られず、第1〜第n(nは2以上の整数)の複数のパラメータを有することとしてもよい。   In the present embodiment, the pre-combination data has three parameters A, B, and C. However, the number of parameters is not limited to three, and the first to nth (n is an integer of 2 or more). It is good also as having a plurality of parameters.

データ取得部11は、データ生成ノードN1〜N3から結合前データを取得すると、パラメータA〜Cの値を参照して、図4に示す結合前データ一時蓄積部12においてパラメータの値が対応するブロックbkに結合前データを記憶させる。例えば、ブロックbk(a1,b1,c1)には、パラメータAの区分がa1、パラメータBの区分がb1、パラメータCの区分がc1である結合前データが含まれる。本実施形態では、例えばパラメータAはデータ生成時刻、パラメータBは地域、パラメータCはデータ種別として対応付けることができる。   When the data acquisition unit 11 acquires pre-combination data from the data generation nodes N1 to N3, the block corresponding to the parameter value in the pre-combination data temporary storage unit 12 shown in FIG. Data before combination is stored in bk. For example, the block bk (a1, b1, c1) includes pre-combination data in which the parameter A segment is a1, the parameter B segment is b1, and the parameter C segment is c1. In the present embodiment, for example, the parameter A can be associated with the data generation time, the parameter B with the region, and the parameter C with the data type.

タイマ13は、処理を一定時間ごとに実施するための契機をデータ結合部14に出力する部分である。タイマ13は、例えば1時間ごとに処理を開始する契機の通知をデータ結合部14に出力することができる。   The timer 13 is a part that outputs to the data combining unit 14 a trigger for performing the processing at regular intervals. For example, the timer 13 can output to the data combining unit 14 a notification of an opportunity to start processing every hour.

データ結合部14は、複数のパラメータから選択された一のパラメータである選択パラメータを選択し、結合前データ一時蓄積部12に蓄積された複数のブロックbkから、選択パラメータの値のみが異なる結合前データを含む複数のブロックbkを結合候補ブロックとして抽出し、抽出した結合候補ブロックをグループ化して結合候補ブロック群を1または複数形成する部分である。例えば、パラメータAを選択パラメータとして選択した場合には、ブロックbk(a1,b1,c1)、ブロックbk(a2,b1,c1)、・・・及びブロックbk(a10,b1,c1)の10個のブロックbkが結合候補ブロックとして抽出され、これらのブロックbkにより結合候補ブロック群が形成される。他のブロックbkについても同様に結合候補ブロック群が形成され、図4に示す例では最大で100個の結合候補ブロック群が形成される。   The data combining unit 14 selects a selection parameter that is one parameter selected from a plurality of parameters, and from the plurality of blocks bk stored in the pre-combination data temporary storage unit 12, only the value of the selection parameter differs. A plurality of blocks bk including data are extracted as connection candidate blocks, and the extracted connection candidate blocks are grouped to form one or a plurality of connection candidate block groups. For example, when the parameter A is selected as a selection parameter, ten blocks bk (a1, b1, c1), block bk (a2, b1, c1),..., And block bk (a10, b1, c1) are selected. Block bk is extracted as a combination candidate block, and a combination candidate block group is formed by these blocks bk. Similarly, another candidate block group is formed for other blocks bk. In the example shown in FIG. 4, a maximum of 100 candidate candidate blocks are formed.

また、データ結合部14は、結合候補ブロック群ごとに、当該結合候補ブロック群から、結合候補ブロックに含まれる結合前データが所定容量や所定時間間隔などの一定の分割基準を満たすように、1または複数の結合候補ブロックを結合対象ブロックとして抽出する部分である。ここでは、データ容量およびデータの時間間隔をその分割基準とし、結合前データの容量の合計が予め定められた所定容量を超えるように結合対象ブロックを抽出する。また、一定時間間隔(所定時間の経過)でデータが分割されるように結合対象ブロックを抽出する。例えば、ブロックbk(a1,b1,c1)、ブロックbk(a2,b1,c1)、・・・及びブロックbk(a10,b1,c1)の10個の結合候補ブロックにより構成される結合候補ブロック群において、ブロックbk(a1,b1,c1)、ブロックbk(a2,b1,c1)、・・・及びブロックbk(a6,b1,c1)の6個の結合候補ブロックに含まれる結合前データの容量の合計が所定容量を超える場合には、これらの6個のブロックbkが結合対象ブロックとして抽出される。   In addition, the data combining unit 14 is configured so that for each combination candidate block group, the combination candidate block group includes pre-combination data included in the combination candidate block so as to satisfy a certain division criterion such as a predetermined capacity or a predetermined time interval. Or it is a part which extracts a some joint candidate block as a candidate block. Here, using the data capacity and the data time interval as the division criterion, the block to be combined is extracted so that the total capacity of the data before combining exceeds a predetermined capacity. Further, the blocks to be combined are extracted so that the data is divided at regular time intervals (elapse of a predetermined time). For example, a combined candidate block group including 10 combined candidate blocks of a block bk (a1, b1, c1), a block bk (a2, b1, c1),..., And a block bk (a10, b1, c1). , And the capacity of data before combination included in the six combination candidate blocks of block bk (a1, b1, c1), block bk (a2, b1, c1),..., And block bk (a6, b1, c1) If the sum of the two exceeds the predetermined capacity, these six blocks bk are extracted as the blocks to be combined.

さらに、データ結合部14は、結合対象ブロックに含まれる結合前データを結合して、結合候補ブロック群ごとに1または複数の結合ファイルを生成する部分である。例えば、ブロックbk(a1,b1,c1)、ブロックbk(a2,b1,c1)、・・・及びブロックbk(a6,b1,c1)の6個のブロックbkが結合対象ブロックとして抽出された場合には、これらの6個のブロックbkに含まれる結合前データを結合して、結合ファイルが生成される。ここで生成される結合ファイルは、上記6個のブロックbkから生成されたので、以降の説明において、結合ファイル(a1〜a6,b1,c1)と表記する。   Furthermore, the data combining unit 14 is a part that combines the pre-combination data included in the combination target blocks to generate one or a plurality of combined files for each combination candidate block group. For example, when six blocks bk of block bk (a1, b1, c1), block bk (a2, b1, c1),..., And block bk (a6, b1, c1) are extracted as blocks to be combined Are combined with the pre-combination data included in these six blocks bk to generate a combined file. Since the combined file generated here is generated from the six blocks bk, it will be expressed as a combined file (a1 to a6, b1, c1) in the following description.

また、データ結合部14は、結合候補ブロックから結合対象ブロックとして抽出されなかったブロックbkである残結合候補ブロックに含まれる結合前データを結合して残結合ファイルを生成する部分でもある。上記のように、ブロックbk(a1,b1,c1)、ブロックbk(a2,b1,c1)、・・・及びブロックbk(a6,b1,c1)の6個のブロックbkが結合対象ブロックとして抽出された場合には、ブロックbk(a7,b1,c1)、ブロックbk(a8,b1,c1)、・・・及びブロックbk(a10,b1,c1)の4個のブロックbkが残結合候補ブロックであり、これらの4個のブロックbkに含まれる結合前データを結合して残結合ファイル(a7〜a10,b1,c1)が生成される。   Further, the data combining unit 14 is also a part that generates the remaining combined file by combining the pre-combined data included in the remaining combined candidate block that is the block bk that has not been extracted from the combined candidate blocks as the combining target block. As described above, 6 blocks bk of block bk (a1, b1, c1), block bk (a2, b1, c1),..., And block bk (a6, b1, c1) are extracted as blocks to be combined. If the block bk (a7, b1, c1), the block bk (a8, b1, c1),..., And the block bk (a10, b1, c1) are four remaining combination candidate blocks The remaining combined files (a7 to a10, b1, c1) are generated by combining the data before combining included in these four blocks bk.

なお、残結合候補ブロックから残結合ファイルが生成されるのは、残結合候補ブロックに含まれる結合前データの容量の合計が所定容量以下の場合である。例えば、ブロックbk(a7,b1,c1)及びブロックbk(a8,b1,c1)に含まれる結合前データの容量の合計が所定容量を超える場合には、ブロックbk(a7,b1,c1)及びブロックbk(a8,b1,c1)に含まれる結合前データを結合して、結合ファイル(a7〜a8,b1,c1)が生成され、残結合ファイル(a9〜a10,b1,c1)が生成される。   The remaining combined file is generated from the remaining combined candidate blocks when the total capacity of the pre-combined data included in the remaining combined candidate blocks is equal to or less than a predetermined capacity. For example, when the sum of the capacities of pre-combination data included in the block bk (a7, b1, c1) and the block bk (a8, b1, c1) exceeds a predetermined capacity, the block bk (a7, b1, c1) and By combining the pre-join data included in the block bk (a8, b1, c1), a join file (a7 to a8, b1, c1) is generated, and a remaining join file (a9 to a10, b1, c1) is generated. The

一方、ブロックbk(a1,b1,c1)、ブロックbk(a2,b1,c1)、・・・及びブロックbk(a10,b1,c1)の10個の結合候補ブロックに含まれる結合前データの容量の合計が所定容量を超えない場合には、データ結合部14は、結合ファイルを生成せずに、これら10個のブロックbkを1つにまとめた結合保留ブロックbka(a0,b1,c1)を生成する。ここで、「a0」は、a1〜a10のどの区分とも異なり、結合保留ブロックbka(a0,b1,c1)に含まれる結合前データのパラメータAの値が、a1〜a10のいずれかの区分に属することを示す。   On the other hand, the capacity of pre-combination data included in 10 join candidate blocks of block bk (a1, b1, c1), block bk (a2, b1, c1),..., And block bk (a10, b1, c1) If the sum of the data does not exceed the predetermined capacity, the data combining unit 14 generates the combined pending block bka (a0, b1, c1) in which these ten blocks bk are combined into one without generating a combined file. Generate. Here, “a0” is different from any of the divisions a1 to a10, and the value of the parameter A of the pre-combination data included in the combination pending block bka (a0, b1, c1) is set to any of the divisions a1 to a10. Indicates belonging.

さらに、データ結合部14は、結合前データ一時蓄積部12において、一のブロックbkに含まれる結合前データの容量の合計が所定容量を超えた場合には、当該ブロックbkに含まれる結合前データを結合して結合ファイルを生成する部分でもある。例えば、ブロックbk(a5,b5,c5)に含まれる結合前データの容量の合計が所定容量を超えた場合には、ブロックbk(a5,b5,c5)に含まれる結合前データを結合して、結合ファイル(a5,b5,c5)が生成される。   Further, in the pre-combination data temporary storage unit 12, the data combining unit 14 determines that the pre-combination data included in the block bk when the total capacity of the pre-combination data included in one block bk exceeds a predetermined capacity. It is also a part that generates a combined file by combining. For example, when the sum of the capacities of the data before combining included in the block bk (a5, b5, c5) exceeds a predetermined capacity, the data before combining included in the block bk (a5, b5, c5) is combined. , A combined file (a5, b5, c5) is generated.

データ結合部14により生成される結合ファイル及び残結合ファイルには、当該結合ファイル及び当該残結合ファイルに含まれる結合前データのパラメータ区分により識別されるような識別子が付されるものとすることができる。   The combined file and the remaining combined file generated by the data combining unit 14 are given identifiers that are identified by the parameter classification of the combined file and the pre-combined data included in the remaining combined file. it can.

データ書き出し部15は、データ結合部14により生成された結合ファイル及び残結合ファイルを、外部ファイルシステム2の結合ファイル記憶部20に書き出す部分である。また、データ書き出し部15は、結合ファイル及び残結合ファイルに含まれて書き出される対象となった結合前データを、結合前データ一時蓄積部12から消去する部分である。   The data writing unit 15 is a part that writes the combined file and the remaining combined file generated by the data combining unit 14 to the combined file storage unit 20 of the external file system 2. The data writing unit 15 is a part for erasing the pre-combination data temporarily included in the combined file and the remaining combined file from the pre-combination data temporary storage unit 12.

データ結合部14及びデータ書き出し部15が実行する処理として、上記説明は、データ結合部14が選択パラメータとしてパラメータAを選択した場合を例として挙げているが、パラメータB及びパラメータCを選択パラメータとして選択した場合の処理も順次行われる。なお、ここではパラメータに優先度があり、A,B,Cの順に結合を優先するものとする。パラメータAの処理で生成した結合保留ブロックbkaは、パラメータBの処理で使用される。   As the processing executed by the data combining unit 14 and the data writing unit 15, the above description has exemplified the case where the data combining unit 14 selects the parameter A as the selection parameter. However, the parameter B and the parameter C are selected as the selection parameters. Processing in the case of selection is also performed sequentially. Here, the parameters have priority, and the combination is given priority in the order of A, B, and C. The combined pending block bka generated by the parameter A process is used for the parameter B process.

なお、本実施形態では、上記の各機能部11〜15が、データ分割装置1に備えられていることとしているが、ネットワークを介して相互に通信可能な複数のサーバに分散して構成され、本発明のデータ分割システムが複数のサーバにより構成されることとしても良い。   In the present embodiment, each of the functional units 11 to 15 is provided in the data dividing device 1, but is configured to be distributed among a plurality of servers that can communicate with each other via a network. The data division system of the present invention may be configured by a plurality of servers.

続いて、本実施形態のデータ分割方法におけるデータ分割装置1の動作について説明する。図5は、データ分割装置1において実施される処理内容を示すフローチャートである。データ統合の契機は、所定容量や所定時間間隔などの一定の分割基準に従う。一定の分割基準として、例えば、結合前データ量に応じて結合処理を行う場合や、タイマ13による一定時間経過後に結合処理を行う場合や、その複合などが考えられる。本実施形態では、その複合として、結合前データ量およびタイマ13による時間をデータ統合の契機とする。図5に示す処理は、タイマ13による時間の計測とは無関係に(タイマ13による時間契機発動前に)、一のブロックbkに含まれる結合前データが所定容量を超えた場合に、当該ブロックbkに含まれる結合前データを結合して、結合ファイルとして書き出すものである。   Next, the operation of the data dividing device 1 in the data dividing method of this embodiment will be described. FIG. 5 is a flowchart showing the processing contents executed in the data dividing apparatus 1. The trigger for data integration follows a certain division criterion such as a predetermined capacity or a predetermined time interval. As a constant division criterion, for example, a case where the combining process is performed according to the data amount before combining, a case where the combining process is performed after a lapse of a predetermined time by the timer 13, a combination thereof, or the like can be considered. In the present embodiment, as the composite, the data amount before combination and the time by the timer 13 are triggered by data integration. The processing shown in FIG. 5 is performed when the pre-combination data included in one block bk exceeds a predetermined capacity regardless of the time measurement by the timer 13 (before the time trigger is activated by the timer 13). The data before combining included in the data is combined and written out as a combined file.

まず、ステップS1において、データ取得部11は、データ生成ノードN1〜N3からの結合前データの取得を試み、結合前データを取得したか否かを判断する。結合前データを取得した場合には、処理手順はステップS2に進められる。   First, in step S1, the data acquisition unit 11 tries to acquire pre-combination data from the data generation nodes N1 to N3, and determines whether or not pre-combination data has been acquired. If pre-combination data has been acquired, the processing procedure proceeds to step S2.

続くステップS2において、データ取得部11は、取得した結合前データを結合前データ一時蓄積部12に記憶させる。この時、データ取得部11は、結合前データのパラメータA〜Cの値が該当する区分を参照して、結合前データ一時蓄積部12におけるパラメータA〜Cの区分に対応するブロックbkに結合前データを分類する。   In subsequent step S2, the data acquisition unit 11 stores the acquired pre-combination data in the pre-combination data temporary storage unit 12. At this time, the data acquisition unit 11 refers to the section to which the values of the parameters A to C of the pre-combination data correspond, and before combining the block bk corresponding to the classification of the parameters A to C in the pre-combination data temporary storage unit 12. Classify the data.

続いて、ステップS3において、データ結合部14は、ステップS2において結合前データが分類されたブロックbkにおける結合前データの容量を計算する。   Subsequently, in step S3, the data combining unit 14 calculates the capacity of the data before combining in the block bk in which the data before combining is classified in step S2.

次に、ステップS4において、データ結合部14は、分割基準として、ステップS3において計算した結合前データの容量が所定容量以下であるか否かを判定する。結合前データの容量が所定容量以下である場合には、処理手順は終了し、結合前データの容量が所定容量以下でない場合には、処理手順はステップS5に進められる。   Next, in step S4, the data combining unit 14 determines whether the capacity of the data before combining calculated in step S3 is equal to or less than a predetermined capacity as a division criterion. If the capacity of the pre-combination data is less than or equal to the predetermined capacity, the processing procedure ends. If the capacity of the data before connection is not less than the predetermined capacity, the processing procedure proceeds to step S5.

続いて、ステップS5において、データ結合部14は、当該ブロックbkに含まれる結合前データを結合して結合ファイルを生成する。   Subsequently, in step S5, the data combining unit 14 combines the data before combining included in the block bk to generate a combined file.

さらに、ステップS6において、データ書き出し部15は、ステップS5において生成された結合ファイルを、当該ブロックbkのパラメータA〜Cの区分による識別子と共に、外部ファイルシステム2の結合ファイル記憶部20に書き出す。例えば、パラメータA〜Cの区分の識別子はファイル名やファイル内のメタヘッダなどに付与されることが考えられる。   Further, in step S6, the data writing unit 15 writes the combined file generated in step S5 to the combined file storage unit 20 of the external file system 2 together with the identifiers according to the parameters A to C of the block bk. For example, it is conceivable that the identifiers of the parameters A to C are given to a file name, a meta header in the file, or the like.

そして、ステップS7において、データ結合部14は、結合前データの書き出しが行われた当該ブロックbkのデータを消去(クリア)し、当該ブロックbkごとに設けられている時間フラグ(図示せず)をセットする。この時間フラグがセットされていることは、タイマ13から処理開始の契機が発せられる前に、当該ブロックbkに含まれる結合前データの書き出しが行われたことを意味する。   In step S7, the data combining unit 14 erases (clears) the data of the block bk where the pre-combination data has been written, and sets a time flag (not shown) provided for each block bk. set. The fact that the time flag is set means that the pre-combination data included in the block bk is written before the timer 13 triggers the start of processing.

以上説明したステップS1〜S7の処理より、タイマ13に設定された時間内に結合前データの容量の合計が所定容量を超えた一のブロックbkに含まれる結合前データは、結合前データの集合から、論理的な意味づけがあるものとして結合ファイルとして分割される。そして、この結合ファイルは、データ処理に好適な容量となる。   As a result of the processing in steps S1 to S7 described above, the pre-combination data included in one block bk in which the total capacity of the pre-combination data exceeds a predetermined capacity within the time set in the timer 13 Therefore, it is divided as a combined file with logical meaning. The combined file has a capacity suitable for data processing.

次に、図6〜9を用いてデータ分割装置1において実施される処理を説明する。図6〜9に示す処理は、タイマ13により一定時間ごとに処理の契機がデータ結合部14に出力され、データ結合部14が一定時間ごとに結合前データを結合して、結合ファイルとして書き出す処理を実行するものである。   Next, the process implemented in the data division | segmentation apparatus 1 is demonstrated using FIGS. The processing shown in FIGS. 6 to 9 is a process in which the timer 13 outputs a processing trigger to the data combining unit 14 at regular time intervals, and the data combining unit 14 combines the pre-combined data at regular time intervals and writes it as a combined file. Is to execute.

まずステップS10において、データ結合部14は、タイマ13から処理の契機の通知を取得したか否かを判断する。処理の契機の通知を取得したと判断した場合には処理手順はステップS11に進められる。   First, in step S <b> 10, the data combining unit 14 determines whether or not a notification of processing opportunity has been acquired from the timer 13. If it is determined that a notification of processing opportunity has been acquired, the processing procedure proceeds to step S11.

次に、ステップS11において、データ結合部14は、結合前データ一時蓄積部12を参照して、結合前データが入っているブロックbkのうち一のブロックbkを選択する。   Next, in step S11, the data combining unit 14 refers to the pre-combination data temporary storage unit 12 and selects one block bk among the blocks bk containing pre-combination data.

次に、ステップS12において、データ結合部14は、ステップS11において選択したブロックbkの時間フラグがセットされているか否かを判定する。時間フラグがセットされていない場合には、処理手順はステップS16に進められ、時間フラグがセットされていた場合には、処理手順はステップS13に進められる。   Next, in step S12, the data combining unit 14 determines whether or not the time flag of the block bk selected in step S11 is set. If the time flag is not set, the process procedure proceeds to step S16. If the time flag is set, the process procedure proceeds to step S13.

続くステップS13において、データ結合部14は、当該ブロックbkに含まれている結合前データをそのまま結合ファイルとして生成する。そして、ステップS14において、データ書き出し部15は、ステップS13において生成された結合ファイルを、当該ブロックbkのパラメータA〜Cによる識別子と共に、外部ファイルシステム2の結合ファイル記憶部20に書き出す。さらに、ステップS15において、データ書き出し部15は、結合前データ一時蓄積部12における当該ブロックbkのデータを消去し、データ結合部14は、結合前データ一時蓄積部12における当該ブロックbkの時間フラグをクリアする。   In subsequent step S13, the data combining unit 14 generates the pre-combination data included in the block bk as a combined file as it is. In step S14, the data writing unit 15 writes the combined file generated in step S13 to the combined file storage unit 20 of the external file system 2 together with the identifiers of the parameters b to b of the block bk. In step S15, the data writing unit 15 erases the data of the block bk in the pre-combination data temporary storage unit 12, and the data combination unit 14 sets the time flag of the block bk in the pre-combination data temporary storage unit 12. clear.

そして、ステップS16において、データ結合部14は、結合前データ一時蓄積部12を参照して、結合前データが入っている全てのブロックbkを選択したか否かを判断する。全てのブロックbkを選択していないと判断した場合には、処理手順はステップS11に戻り、全てのブロックbkを選択したと判断した場合には、処理手順は、図7のステップS21に進められる。   In step S16, the data combining unit 14 refers to the pre-combination data temporary storage unit 12 and determines whether or not all the blocks bk containing the pre-combination data have been selected. If it is determined that all blocks bk have not been selected, the processing procedure returns to step S11. If it is determined that all blocks bk have been selected, the processing procedure proceeds to step S21 in FIG. .

以上説明したステップS11〜S16の処理は、図5に示した処理において結合前データの書き出しが実施されたブロックbkに、当該書き出しが実施された後、且つタイマ13からの処理の契機の通知が発せられるまでの間に結合前データが蓄積された場合に、蓄積された結合前データを結合ファイルとして書き出すものである。これにより、結合前データの容量の合計が所定容量を超えたことにより書き出しが実施されたブロックbkにおいて、当該書き出しの後に当該ブロックbkに蓄積された結合前データは、所定の容量に達しなくとも、論理的な意味づけがあるものとして結合前データの集合から結合ファイルとして分割されることとなる。これにより、同一区分のパラメータA,B,Cを持つデータだけを、一定の分割基準(時間間隔およびデータ量)に則り、分割・出力することができ、出力されたファイルには別のパラメータを持つデータが存在しないことを保証できる。ここにて分割できない未結合データは、異なる区分のパラメータAを持つデータとあわせた上で分割基準に則り分割されることとなる。   In the processing of steps S11 to S16 described above, after the writing is performed to the block bk in which the pre-combination data was written in the processing shown in FIG. When pre-combination data is accumulated before it is issued, the accumulated pre-combination data is written out as a combined file. As a result, in the block bk in which writing has been performed due to the total capacity of the data before combination exceeding the predetermined capacity, the data before combining stored in the block bk after the writing does not reach the predetermined capacity. Therefore, it is divided as a combined file from a set of pre-combined data as having logical meaning. As a result, only data having parameters A, B, and C in the same category can be divided and output according to a certain division criterion (time interval and data amount), and another parameter can be assigned to the output file. It can be assured that no data exists. The uncombined data that cannot be divided here is divided according to the division criterion after being combined with the data having the parameter A of different divisions.

次に図7を参照して、データ分割装置1において実施される処理を説明する。図7に示すステップS21〜S32の処理は、データ結合部14がデータ分割の処理を実施するに際して着目すべきパラメータ(選択パラメータ)として、パラメータAを選択して行われるものである。   Next, with reference to FIG. 7, the process performed in the data division | segmentation apparatus 1 is demonstrated. The processing in steps S21 to S32 shown in FIG. 7 is performed by selecting the parameter A as a parameter (selection parameter) to be noted when the data combining unit 14 performs the data division processing.

まず、ステップS21において、データ結合部14は、パラメータBおよびCが同一区分で、パラメータAが異なるブロック群bkに注目するために、パラメータBおよびCを選択する。例えば最初はパラメータBをb1,パラメータCをc1とする。後の説明において、ここで選択されたパラメータB,Cを固定パラメータと称する。このステップS21は、全ての固定パラメータを選択するまで繰り返し実行される。ここでは、パラメータBについてb1〜b10の10分類、パラメータCについてc1〜c10の10分類があるため、100回実行される。   First, in step S21, the data combining unit 14 selects the parameters B and C in order to pay attention to the block group bk in which the parameters B and C are in the same section and the parameter A is different. For example, initially, parameter B is b1, and parameter C is c1. In the following description, the parameters B and C selected here are referred to as fixed parameters. This step S21 is repeatedly executed until all the fixed parameters are selected. Here, since there are 10 classifications b1 to b10 for parameter B and 10 classifications c1 to c10 for parameter C, this is executed 100 times.

次に、ステップS22において、データ結合部14は、結合ブロックの領域をクリアすると共に、結合Aフラグをクリアする。結合ブロックは、1又は複数のブロックbkに含まれる結合前データを結合したものを一時的に格納するためのブロックであり、結合前データ一時蓄積部12に設けられる。また、結合Aフラグは、結合ブロックに含まれる結合前データを結合ファイルとして書き出したことを示すフラグである。   Next, in step S22, the data combining unit 14 clears the combined block area and clears the combined A flag. The combined block is a block for temporarily storing a combination of pre-combination data included in one or a plurality of blocks bk, and is provided in the pre-combination data temporary storage unit 12. The combined A flag is a flag indicating that the pre-combined data included in the combined block is written out as a combined file.

続いて、ステップS23において、データ結合部14は、パラメータBとCが固定パラメータと同一区分のブロックbkを1つ選択する。ここで、ステップS23〜S28の処理の繰り返しにおいて選択される全てのブロックbkは、パラメータBとCが同一区分であって、パラメータAが異なる区分のブロックであり、本発明における結合候補ブロックを構成する。例えば固定パラメータがB=b1,C=c1である場合には、ステップS23において、例えばブロックbk(a1,b1,c1)が選択される。   Subsequently, in step S23, the data combining unit 14 selects one block bk in which the parameters B and C are the same as the fixed parameter. Here, all the blocks bk selected in the repetition of the processing of steps S23 to S28 are blocks in which the parameters B and C are in the same segment and the parameter A is different, and constitute a candidate block for combining in the present invention. To do. For example, if the fixed parameters are B = b1, C = c1, for example, the block bk (a1, b1, c1) is selected in step S23.

次に、ステップS24において、データ結合部14は、ステップS23において選択された結合候補ブロックに含まれる結合前データを結合ブロックに移動する。そして、ステップS25において、データ結合部14は、結合ブロックに含まれる結合前データの容量の合計が所定容量以下か否かを判断する。結合ブロックに含まれる結合前データの容量の合計が所定容量以下である場合には、処理手順はステップS28に進められ、結合ブロックに含まれる結合前データの容量の合計が所定容量以下でない場合には、処理手順はステップS26に進められる。   Next, in step S24, the data combination unit 14 moves the pre-combination data included in the combination candidate block selected in step S23 to the combination block. In step S25, the data combining unit 14 determines whether the total capacity of the pre-combination data included in the combined block is equal to or less than a predetermined capacity. If the total capacity of the pre-combination data included in the combined block is equal to or less than the predetermined capacity, the processing procedure proceeds to step S28, and the total capacity of the pre-combination data included in the combined block is not less than the predetermined capacity. The processing procedure proceeds to step S26.

続くステップS26において、データ結合部14は、結合ブロックに含まれる結合前データを結合して結合ファイルを生成する。結合ブロックに対して、一のブロックbkごとに結合前データを移動させて、結合ブロックに含まれる結合前データの容量の合計が所定容量を超えたときに、結合ブロックに含まれる結合前データを結合して結合ファイルを生成するので、結合ファイルの容量はデータ処理に好適なものとなる。また、結合ファイルに含まれる結合前データは、パラメータB,Cの区分が同一であり、パラメータAの区分のみが異なるものであるので、結合ファイルは、論理的な意味づけがなされたものとなる。   In subsequent step S26, the data combining unit 14 combines the pre-combination data included in the combined block to generate a combined file. When the pre-combination data is moved for each block bk with respect to the combined block and the total capacity of the pre-combination data included in the combined block exceeds a predetermined capacity, the pre-combination data included in the combined block is Since the combined file is generated by combining, the capacity of the combined file is suitable for data processing. In addition, since the pre-combination data included in the combined file has the same parameter B and C classification, but only the parameter A classification is different, the combined file is logically meaningful. .

次に、ステップS27において、データ書き出し部15は、ステップS26において生成された結合ファイルを、パラメータの区分による識別子をファイル名やファイル内のメタデータなどに付しながら、外部ファイルシステム2の結合ファイル記憶部20に書き出す。ここで結合ファイルに付される識別子は、例えば、結合ファイルに含まれるブロックbkが、ブロックbk(a1,b1,c1)、ブロックbk(a2,b1,c1)、・・・及びブロックbk(a6,b1,c1)の6個のブロックbkである場合には、「結合ファイル(a1〜a6,b1,c1)」とすることができる。ステップS23〜S28の処理において選択され、結合ファイルに含まれることとなったブロックbkは、本発明における結合対象ブロックを構成する。   Next, in step S27, the data writer 15 attaches the combined file generated in step S26 to the combined file of the external file system 2 while attaching an identifier based on the parameter classification to the file name, metadata in the file, or the like. Write to the storage unit 20. Here, the identifier given to the combined file is, for example, that the block bk included in the combined file is a block bk (a1, b1, c1), a block bk (a2, b1, c1),... And a block bk (a6). , B1, c1) can be “joined files (a1 to a6, b1, c1)”. The block bk selected in the processing of steps S23 to S28 and included in the combined file constitutes a combination target block in the present invention.

また、ステップS27において、データ書き出し部15は、結合ブロックのデータを消去する。結合候補ブロックのデータが結合ブロックに移動された後に結合ブロックのデータが消去されるので、ステップS27における結合ブロックのデータの消去の処理は、結合対象ブロックに含まれるすべての結合前データを結合前データ一時蓄積手段から消去する処理に相当する。さらに、ステップS27において、データ結合部14は、結合Aフラグをセットする。   In step S27, the data writing unit 15 erases the combined block data. Since the data of the combined block is erased after the data of the combined candidate block is moved to the combined block, the process of deleting the data of the combined block in step S27 is performed before combining all the pre-combined data included in the combination target block. This corresponds to the process of deleting from the temporary data storage means. Further, in step S27, the data combination unit 14 sets a combination A flag.

続くステップS28において、データ結合部14は、パラメータB,Cが同一区分の、全ての結合候補ブロックを選択したか否かを判断する。全ての結合候補ブロックを選択したと判断した場合には、処理手順はステップS29に進められ、全ての結合候補ブロックを選択していないと判断した場合には、処理手順はステップS23に戻る。   In subsequent step S28, the data combination unit 14 determines whether or not all combination candidate blocks having the same parameters B and C are selected. If it is determined that all the combination candidate blocks have been selected, the processing procedure proceeds to step S29. If it is determined that all the combination candidate blocks have not been selected, the processing procedure returns to step S23.

全ての結合候補ブロックを選択したと判断されると、ステップS29において、データ結合部14は、その時点において、結合ブロックに結合前データが残り、且つ結合Aフラグがセットされているか否かを判断する。結合ブロックに結合前データがあり、且つ結合Aフラグがセットされていると判断した場合には、処理手順はステップS30に進められ、結合ブロックに結合前データがあり、且つ結合Aフラグがセットされていると判断しなかった場合には、処理手順はステップS31に進められる。   If it is determined that all the combination candidate blocks have been selected, in step S29, the data combination unit 14 determines whether or not the pre-combination data remains in the combination block and the combination A flag is set at that time. To do. If it is determined that there is pre-join data in the join block and the join A flag is set, the process proceeds to step S30, where there is pre-join data in the join block and the join A flag is set. If it is not determined that it is, the processing procedure proceeds to step S31.

結合ブロックに結合前データがあり、且つ結合Aフラグがセットされている場合とは、本実施形態の例では、例えば、ブロックbk(a1,b1,c1)、ブロックbk(a2,b1,c1)、・・・及びブロックbk(a6,b1,c1)の6個のブロックbkから結合ファイル(a1〜a6,b1,c1)が生成されて書き出しが行われ、ブロックbk(a7,b1,c1)、ブロックbk(a8,b1,c1)、・・・及びブロックbk(a10,b1,c1)に含まれていた結合前データの容量の合計が所定容量を超えずに、書き出し処理が行われないまま結合ブロックに結合前データが残っている状態である。このように、結合ファイルとして書き出しが行われなかったブロックbkは、本発明における残結合候補ブロックを構成する。そして、このような場合には、ステップS30において、データ結合部14は、結合ブロックに含まれる結合前データを結合して残結合ファイルを生成し、データ書き出し部15は、残結合ファイルを、パラメータA〜Cの区分による識別子と共に、外部ファイルシステム2の結合ファイル記憶部20に書き出す。これにより、同一区分のパラメータB,Cを持つデータのみを、一定の分割基準(時間間隔およびデータ量)に則り、分割・出力することができ、出力されたファイルには異なる区分のパラメータBおよびCを持つデータが存在しないことを保証できる。   In the example of the present embodiment, for example, the block bk (a1, b1, c1) and the block bk (a2, b1, c1) are the cases where pre-join data exists in the join block and the join A flag is set. ,... And the combined file (a1 to a6, b1, c1) are generated from the six blocks bk of the block bk (a6, b1, c1) and written, and the block bk (a7, b1, c1) is written. , Block bk (a8, b1, c1),..., And block bk (a10, b1, c1), the sum of the capacities of the pre-combination data does not exceed a predetermined capacity, and the writing process is not performed. In this state, the pre-combination data remains in the combined block. Thus, the block bk that has not been written out as a combined file constitutes a remaining combined candidate block in the present invention. In such a case, in step S30, the data combining unit 14 combines the data before combining included in the combined block to generate a remaining combined file, and the data writing unit 15 converts the remaining combined file into the parameter Along with the identifiers according to the categories A to C, the data is written in the combined file storage unit 20 of the external file system 2. As a result, only data having parameters B and C in the same segment can be segmented and output according to a certain segmentation criterion (time interval and data amount). It can be assured that no data with C exists.

一方、ステップS29からステップS31に処理が進められる場合とは、パラメータAの区分のみが異なるブロックbkから構成される全ての結合候補ブロックに含まれる結合前データの容量の合計が、所定容量を超えなかった場合である。この場合には、結合ブロックは、全ての結合候補ブロックの結合前データを含んでいるので、ステップS31において、データ結合部14は、結合ブロックの結合前データを結合して、パラメータB,Cの区分により識別される結合保留ブロックbkaに書き出す。例えば、ブロックbk(a1,b2,c1)、ブロックbk(a2,b2,c1)、・・・及びブロックbk(a10,b2,c1)の10個のブロックbkに含まれていた結合前データを結合保留ブロックに書き出した場合には、この結合保留ブロックの識別子を「(a0,b2,c1)」とすることができる。即ち、結合保留ブロックbka(a0,b2,c1)に含まれる結合前データは、パラメータAの値がa1〜a10のいずれかの区分に属することとなる。従って、この結合保留ブロックbkaは、パラメータAによる分割がなされていないことを保証し、パラメータB及びパラメータCの区分により論理的な意味づけがなされることとなる。   On the other hand, in the case where the process proceeds from step S29 to step S31, the sum of the capacities of the pre-combination data included in all the combination candidate blocks composed of the blocks bk that are different only in the parameter A section exceeds the predetermined capacity. This is the case. In this case, since the combined block includes the pre-combination data of all the combination candidate blocks, in step S31, the data combining unit 14 combines the pre-combination data of the combined blocks and sets the parameters B and C. Write to the combined pending block bka identified by the partition. For example, pre-combination data included in 10 blocks bk of block bk (a1, b2, c1), block bk (a2, b2, c1),... And block bk (a10, b2, c1) When writing to the combined pending block, the identifier of the combined reserved block can be set to “(a0, b2, c1)”. That is, the pre-join data included in the join pending block bka (a0, b2, c1) belongs to one of the categories of the parameters A1 to a10. Therefore, this combined pending block bka ensures that no division by parameter A is performed, and logical meaning is given by the division of parameter B and parameter C.

次に、ステップS32において、データ結合部14は、全ての固定パラメータを選択したか否かを判断する。全ての固定パラメータを選択したと判断した場合には、処理手順は図8に示すステップS41に進められ、全ての固定パラメータを選択していないと判断した場合には、処理手順はステップS21に戻り、次の固定パラメータとして、例えばB=b2,C=c1を選択する。   Next, in step S32, the data combining unit 14 determines whether all fixed parameters have been selected. If it is determined that all the fixed parameters have been selected, the processing procedure proceeds to step S41 shown in FIG. 8, and if it is determined that all the fixed parameters have not been selected, the processing procedure returns to step S21. For example, B = b2 and C = c1 are selected as the next fixed parameters.

上記のとおり、ステップS21〜ステップS32に示す処理は、データ結合部が選択パラメータとしてパラメータAを選択した場合の処理であるので、処理手順がステップS41に進められる時には、図4に示す結合前データ一時蓄積部12に含まれるすべてのブロックbkは、パラメータAの区分のみが異なるブロックbk同士で結合されて結合ファイルまたは残結合ファイルとして結合ファイル記憶部20に書き出されたか、結合保留ブロックbkaとして結合前データ一時蓄積部12に残っているか、のいずれかである。図10は、処理手順がステップS41に進められる時における結合前データ一時蓄積部12の一部の状態を例示したものである。図10には、結合前データ一時蓄積部12に残された結合保留ブロックbkaが示されている。また、符号bkvは、ブロックbkの書き出しが行われ、該当するブロックbk及び結合前データが存在しないことを示している。   As described above, the processing shown in steps S21 to S32 is processing when the data combining unit selects parameter A as the selection parameter. Therefore, when the processing procedure proceeds to step S41, the pre-combination data shown in FIG. All the blocks bk included in the temporary storage unit 12 are combined with blocks bk that are different only in the section of parameter A and written to the combined file storage unit 20 as a combined file or a remaining combined file, or as a combined pending block bka It remains either in the pre-combination data temporary storage unit 12. FIG. 10 illustrates a partial state of the pre-combination data temporary storage unit 12 when the processing procedure proceeds to step S41. FIG. 10 shows the combination holding block bka left in the pre-combination data temporary storage unit 12. The symbol bkv indicates that the block bk is written and the corresponding block bk and pre-combination data do not exist.

次に図8を参照して、データ分割装置1において実施される処理を説明する。図8に示すステップS41〜S52の処理は、データ結合部14がデータ分割の処理を実施するに際して着目すべきパラメータ(選択パラメータ)として、パラメータBを選択して行われるものである。   Next, with reference to FIG. 8, the process performed in the data division | segmentation apparatus 1 is demonstrated. The processing in steps S41 to S52 shown in FIG. 8 is performed by selecting the parameter B as a parameter (selection parameter) to be noted when the data combining unit 14 performs the data division processing.

まず、ステップS41において、データ結合部14は、パラメータCが同一区分で、パラメータBが異なるブロック群bkaに注目するために、固定パラメータとして、あるパラメータCを選択する。例えば最初はパラメータCをc1とする。なお、ここで注目するブロック群bkaは、上記のように、ステップS21〜S32において生成された結合保留ブロックbkaのうちのいずれかのものである(図10参照)。このステップS41は、全ての固定パラメータを選択するまで繰り返し実行される。ここでは、パラメータCについてc1〜c10の10分類があるため、10回実行される。   First, in step S41, the data combining unit 14 selects a certain parameter C as a fixed parameter in order to pay attention to the block group bka in which the parameter C is the same segment and the parameter B is different. For example, the parameter C is initially set to c1. Note that the block group bka to be noted here is one of the combined reserved blocks bka generated in steps S21 to S32 as described above (see FIG. 10). This step S41 is repeatedly executed until all the fixed parameters are selected. Here, since there are 10 classifications c1-c10 for parameter C, it is executed 10 times.

次に、ステップS42において、データ結合部14は、結合ブロックの領域をクリアすると共に、結合Bフラグをクリアする。結合Bフラグは、結合ブロックに含まれる結合前データを結合ファイルとして書き出したことを示すフラグである。   Next, in step S42, the data combining unit 14 clears the combined block area and clears the combined B flag. The combined B flag is a flag indicating that the pre-combined data included in the combined block is written out as a combined file.

続いて、ステップS43において、データ結合部14は、パラメータCが固定パラメータと同一区分のブロックbkaを1つ選択する。ここで選択されるブロックは、図10に示す結合保留ブロックbkaのうちのいずれかのブロックである。また、ステップS43〜S48の処理の繰り返しにおいて選択される全てのブロックbkaは、パラメータCが同一区分であって、パラメータBが異なる区分のブロックであり、本発明における結合候補ブロックを構成する。例えば固定パラメータがC=c1である場合には、ステップS43において、例えばブロックbka(a0,b2,c1)が選択される。   Subsequently, in step S43, the data combining unit 14 selects one block bka in which the parameter C is the same as the fixed parameter. The block selected here is one of the combined pending blocks bka shown in FIG. Further, all the blocks bka selected in the repetition of the processes of steps S43 to S48 are blocks in which the parameter C is in the same section and the parameter B is different, and constitutes a combination candidate block in the present invention. For example, if the fixed parameter is C = c1, for example, the block bka (a0, b2, c1) is selected in step S43.

次に、ステップS44において、データ結合部14は、ステップS43において選択された結合候補ブロックに含まれる結合前データを結合ブロックに移動する。そして、ステップS45において、データ結合部14は、結合ブロックに含まれる結合前データの容量の合計が所定容量以下か否かを判断する。結合ブロックに含まれる結合前データの容量の合計が所定容量以下である場合には、処理手順はステップS48に進められ、結合ブロックに含まれる結合前データの容量の合計が所定容量以下でない場合には、処理手順はステップS46に進められる。   Next, in step S44, the data combination unit 14 moves the pre-combination data included in the combination candidate block selected in step S43 to the combination block. In step S45, the data combining unit 14 determines whether the total capacity of the pre-combination data included in the combined block is equal to or less than a predetermined capacity. If the total capacity of the pre-combination data included in the combined block is equal to or less than the predetermined capacity, the processing procedure proceeds to step S48, and the total capacity of the pre-combination data included in the combined block is not less than the predetermined capacity. The process proceeds to step S46.

続くステップS46において、データ結合部14は、結合ブロックに含まれる結合前データを結合して結合ファイルを生成する。結合ブロックに対して、一のブロックごとに結合前データを移動させて、結合ブロックに含まれる結合前データの容量の合計が所定容量を超えたときに、結合ブロックに含まれる結合前データを結合して結合ファイルを生成するので、結合ファイルの容量はデータ処理に好適なものとなる。また、結合ファイルに含まれる結合前データは、パラメータAに関して統合され、パラメータCの区分が同一であり、パラメータBの区分が異なるものであるので、結合ファイルは、論理的な意味づけがなされたものとなる。   In subsequent step S46, the data combining unit 14 combines the pre-combination data included in the combined block to generate a combined file. Move the pre-combination data for each block to the combined block, and combine the pre-combination data included in the combined block when the total capacity of the pre-combination data included in the combined block exceeds the specified capacity. Thus, the combined file is generated, so that the capacity of the combined file is suitable for data processing. Further, since the pre-combination data included in the combined file is integrated with respect to the parameter A, the parameter C classification is the same, and the parameter B classification is different, the combined file has a logical meaning. It will be a thing.

次に、ステップS47において、データ書き出し部15は、ステップS46において生成された結合ファイルを、パラメータの区分による識別子をファイル名やファイル内のメタデータなどに付しながら、外部ファイルシステム2の結合ファイル記憶部20に書き出す。ここで結合ファイルに付される識別子は、例えば、結合ファイルに含まれるブロックbkaが、ブロックbka(a0,b2,c1)、ブロックbka(a0,b5,c1)及びブロックbka(a0,b6,c1)の3個のブロックである場合には、「結合ファイル(a0,b2〜b6,c1)」とすることができる。ステップS43〜S48の処理において選択され、結合ファイルに含まれることとなったブロックbkaは、本発明における結合対象ブロックを構成する。   Next, in step S47, the data writing unit 15 attaches the combined file generated in step S46 to the combined file of the external file system 2 while attaching an identifier based on the parameter classification to the file name, metadata in the file, or the like. Write to the storage unit 20. Here, the identifier given to the combined file is, for example, that the block bka included in the combined file is a block bka (a0, b2, c1), a block bka (a0, b5, c1) and a block bka (a0, b6, c1). ) 3 blocks, it can be “joined file (a0, b2 to b6, c1)”. The block bka selected in the processing of steps S43 to S48 and included in the combined file constitutes a block to be combined in the present invention.

また、ステップS47において、データ書き出し部15は、結合ブロックのデータを消去する。結合候補ブロックのデータが結合ブロックに移動された後に結合ブロックのデータが消去されるので、ステップS47における結合ブロックのデータの消去の処理は、結合対象ブロックに含まれるすべての結合前データを結合前データ一時蓄積手段から消去する処理に相当する。さらに、ステップS47において、データ結合部14は、結合Bフラグをセットする。   In step S47, the data writing unit 15 erases the data of the combined block. Since the data of the combined block is deleted after the data of the combination candidate block is moved to the combined block, the process of deleting the data of the combined block in step S47 is performed before combining all the data before combining included in the combination target block. This corresponds to the process of deleting from the temporary data storage means. Further, in step S47, the data combining unit 14 sets the combined B flag.

続くステップS48において、データ結合部14は、パラメータCが同一区分の、全ての結合候補ブロックを選択したか否かを判断する。全ての結合候補ブロックを選択したと判断した場合には、処理手順はステップS49に進められ、全ての結合候補ブロックを選択していないと判断した場合には、処理手順はステップS43に戻る。   In subsequent step S48, the data combination unit 14 determines whether or not all combination candidate blocks having the same parameter C as the classification are selected. If it is determined that all combination candidate blocks have been selected, the process proceeds to step S49. If it is determined that all combination candidate blocks have not been selected, the process returns to step S43.

全ての結合候補ブロックを選択したと判断されると、ステップS49において、データ結合部14は、その時点において、結合ブロックに結合前データが残り、且つ結合Bフラグがセットされているか否かを判断する。結合ブロックに結合前データがあり、且つ結合Bフラグがセットされていると判断した場合には、処理手順はステップS50に進められ、結合ブロックに結合前データがあり、且つ結合Bフラグがセットされていると判断しなかった場合には、処理手順はステップS51に進められる。   If it is determined that all the combination candidate blocks have been selected, in step S49, the data combination unit 14 determines whether or not the pre-combination data remains in the combination block and the combination B flag is set at that time. To do. If it is determined that there is pre-combination data in the combined block and the combined B flag is set, the processing procedure proceeds to step S50, where there is pre-combined data in the combined block and the combined B flag is set. If it is not determined that it is, the processing procedure proceeds to step S51.

結合ブロックに結合前データがあり、且つ結合Bフラグがセットされている場合とは、本実施形態の例では、例えば、ブロックbka(a0,b2,c1)、ブロックbka(a0,b5,c1)及びブロックbka(a0,b6,c1)の3個のブロックから、結合ファイル(a0,b2〜b6,c1)が生成されて書き出しが行われ、ブロックbka(a0,b9,c1)、ブロックbka(a0,b10,c1)に含まれていた結合前データの容量の合計が所定容量を超えずに、書き出し処理が行われないまま結合ブロックに結合前データが残っている状態である。このように、結合ファイルとして書き出しが行われなかったブロックbkaは、本発明における残結合候補ブロックを構成する。そして、このような場合には、ステップS50において、データ結合部14は、結合ブロックに含まれる結合前データを結合して残結合ファイルを生成し、データ書き出し部15は、残結合ファイルを、パラメータB〜Cの区分による識別子と共に、外部ファイルシステム2の結合ファイル記憶部20に書き出す。これにより、同一区分のパラメータCを持つ結合前データのみを、一定の分割基準(時間間隔およびデータ量)に則り、分割・出力することができ、出力されたファイルは異なる区分のパラメータCを持つデータが存在しないことを保証できる。   In the example of this embodiment, for example, the block bka (a0, b2, c1) and the block bka (a0, b5, c1) are the cases where the combined block has pre-joined data and the combined B flag is set. And the combined file (a0, b2 to b6, c1) is generated from the three blocks of the block bka (a0, b6, c1) and written, and the block bka (a0, b9, c1) and the block bka ( The total capacity of the data before combining included in a0, b10, c1) does not exceed the predetermined capacity, and the data before combining remains in the combined block without performing the writing process. Thus, the block bka that has not been written out as a combined file constitutes the remaining combined candidate block in the present invention. In such a case, in step S50, the data combining unit 14 combines the data before combining included in the combined block to generate a remaining combined file, and the data writing unit 15 converts the remaining combined file into the parameter Along with the identifiers of B to C, the data is written to the combined file storage unit 20 of the external file system 2. As a result, only the pre-combination data having the parameter C of the same division can be divided and output according to a certain division criterion (time interval and data amount), and the output file has the parameter C of a different division. It can be guaranteed that no data exists.

一方、ステップS49からステップS51に処理が進められる場合とは、パラメータBの区分のみが異なるブロックbkaから構成される全ての結合候補ブロックに含まれる結合前データの容量の合計が、所定容量を超えなかった場合である。この場合には、結合ブロックは、全ての結合候補ブロックの結合前データを含んでいるので、ステップS51において、データ結合部14は、結合ブロックの結合前データを結合して、パラメータCの区分により識別される結合保留ブロックbkbに書き出す。例えば、結合前データの無いブロックbkvを除く、ブロックbka(a0,b1,c2)、ブロックbka(a0,b4,c2)、ブロックbka(a0,b8,c2)、及びブロックbka(a0,b9,c2)の4個のブロック(結合保留ブロックbka)に含まれていた結合前データを結合保留ブロックbkbに書き出した場合には、この結合保留ブロックbkbの識別子を「(a0,b0,c2)」とすることができる。即ち、結合保留ブロックbkb(a0,b0,c2)に含まれる結合前データは、パラメータAの値がa1〜a10のいずれか区分に属し、パラメータBの値がb1〜b10のいずれか区分に属することとなる。従って、この結合保留ブロックbkbは、パラメータAおよびBによる分割がなされていないことを保証し、パラメータCの区分により論理的な意味づけがなされることとなる。   On the other hand, in the case where the process proceeds from step S49 to step S51, the sum of the capacities of the pre-combination data included in all the combination candidate blocks composed of the blocks bka that are different only in the parameter B section exceeds the predetermined capacity. This is the case. In this case, since the combined block includes the pre-combination data of all the combination candidate blocks, in step S51, the data combining unit 14 combines the pre-combination data of the combined block, and classifies the parameter C. Write to the identified combined pending block bkb. For example, a block bka (a0, b1, c2), a block bka (a0, b4, c2), a block bka (a0, b8, c2) and a block bka (a0, b9, When the pre-join data included in the four blocks c2) (join pending block bka) is written to the join pending block bkb, the identifier of this join pending block bkb is “(a0, b0, c2)”. It can be. That is, in the pre-join data included in the join pending block bkb (a0, b0, c2), the value of the parameter A belongs to any one of the sections a1 to a10, and the value of the parameter B belongs to any of the sections of the b1 to b10. It will be. Therefore, this combined pending block bkb ensures that no division by parameters A and B is performed, and logical meaning is given by the division of parameter C.

次に、ステップS52において、データ結合部14は、全ての固定パラメータを選択したか否かを判断する。全ての固定パラメータを選択したと判断した場合には、処理手順は図9に示すステップS61に進められ、全ての選固定パラメータを選択していないと判断した場合には、処理手順はステップS41に戻り、次の固定パラメータとして、例えばC=c2を選択する。   Next, in step S52, the data combining unit 14 determines whether all the fixed parameters have been selected. If it is determined that all the fixed parameters have been selected, the processing procedure proceeds to step S61 shown in FIG. 9. If it is determined that all the fixed parameters have not been selected, the processing procedure proceeds to step S41. Returning, for example, C = c2 is selected as the next fixed parameter.

上記のとおり、ステップS41〜ステップS52に示す処理は、データ結合部が選択パラメータとしてパラメータBを選択した場合の処理であるので、処理手順がステップS61に進められる時には、図10に示す結合前データ一時蓄積部12に含まれるすべてのブロック(結合保留ブロックbka)は、パラメータAおよびBの区分が異なるブロック同士で結合されて結合ファイルまたは残結合ファイルとして結合ファイル記憶部20に書き出されたか、結合保留ブロックとして結合前データ一時蓄積部12に残っているか、のいずれかである。図11には、結合前データ一時蓄積部12に残された結合保留ブロックbkbが示されている。また、符号bkwは、ブロックの書き出しが行われ、該当するブロック及び結合前データが存在しないことを示している。   As described above, the processing shown in steps S41 to S52 is processing when the data combining unit selects parameter B as the selection parameter. Therefore, when the processing procedure proceeds to step S61, the pre-combination data shown in FIG. All the blocks (joining pending block bka) included in the temporary storage unit 12 are joined in blocks having different parameter A and B classifications and written to the joined file storage unit 20 as a joined file or a remaining joined file, Either it remains in the pre-combination data temporary storage unit 12 as a combined pending block. FIG. 11 shows the combined pending block bkb remaining in the pre-combination data temporary storage unit 12. The symbol bkw indicates that the block has been written and the corresponding block and pre-combination data do not exist.

次に図9を参照して、データ分割装置1において実施される処理を説明する。図9に示すステップS61〜S71の処理は、データ結合部14がデータ分割の処理を実施するに際して着目すべきパラメータ(選択パラメータ)として、パラメータCを選択して行われるものである。   Next, with reference to FIG. 9, the process performed in the data division | segmentation apparatus 1 is demonstrated. The processes in steps S61 to S71 shown in FIG. 9 are performed by selecting the parameter C as a parameter (selection parameter) to be noted when the data combining unit 14 performs the data division process.

まず、ステップS61において、データ結合部14は、パラメータCが異なるブロック群bkbに注目するために、固定パラメータを解除する。つまり、最後のパラメータCにおいては、ステップS41を固定パラメータの数だけ繰り返し処理するのではなく、1回のみの処理が行われる。なお、ここで注目するブロック群bkbは、上記のように、ステップS41〜S52において生成された結合保留ブロックbkbのうちのいずれかのものである(図11参照)。   First, in step S61, the data combining unit 14 releases the fixed parameter in order to focus on the block group bkb having a different parameter C. That is, for the last parameter C, step S41 is not repeated for the number of fixed parameters, but only once. Note that the block group bkb of interest here is one of the combined pending blocks bkb generated in steps S41 to S52 as described above (see FIG. 11).

次に、ステップS62において、データ結合部14は、結合ブロックの領域をクリアすると共に、結合Cフラグをクリアする。結合Cフラグは、結合ブロックに含まれる結合前データを結合ファイルとして書き出したことを示すフラグである。   Next, in step S62, the data combining unit 14 clears the combined block area and clears the combined C flag. The combined C flag is a flag indicating that the pre-combination data included in the combined block is written as a combined file.

続いて、ステップS63において、データ結合部14は、ブロックbkbを1つ選択する。ここで選択されるブロックは、図11に示す結合保留ブロックbkbのうちのいずれかのブロックである。また、ステップS63〜S68の処理の繰り返しにおいて選択される全てのブロックbkbは、パラメータCが異なる区分のブロックであり、本発明における結合候補ブロックを構成する。例えばステップS63において、ブロックbkb(a0,b0,c2)が選択される。   Subsequently, in step S63, the data combining unit 14 selects one block bkb. The block selected here is one of the combined pending blocks bkb shown in FIG. In addition, all the blocks bkb selected in the repetition of the processing of steps S63 to S68 are blocks with different parameters C, and constitute a candidate block for combining in the present invention. For example, in step S63, the block bkb (a0, b0, c2) is selected.

次に、ステップS64において、データ結合部14は、ステップS63において選択された結合候補ブロックに含まれる結合前データを結合ブロックに移動する。そして、ステップS65において、データ結合部14は、結合ブロックに含まれる結合前データの容量の合計が所定容量以下か否かを判断する。結合ブロックに含まれる結合前データの容量の合計が所定容量以下である場合には、処理手順はステップS68に進められ、結合ブロックに含まれる結合前データの容量の合計が所定容量以下でない場合には、処理手順はステップS66に進められる。   Next, in step S64, the data combination unit 14 moves the pre-combination data included in the combination candidate block selected in step S63 to the combination block. In step S65, the data combining unit 14 determines whether the total capacity of the pre-combination data included in the combined block is equal to or less than a predetermined capacity. If the total capacity of the pre-combination data included in the combined block is less than or equal to the predetermined capacity, the processing procedure proceeds to step S68, and the total capacity of the pre-combination data included in the combined block is not less than the predetermined capacity. The process proceeds to step S66.

続くステップS66において、データ結合部14は、結合ブロックに含まれる結合前データを結合して結合ファイルを生成する。結合ブロックに対して、一のブロックごとに結合前データを移動させて、結合ブロックに含まれる結合前データの容量の合計が所定容量を超えたときに、結合ブロックに含まれる結合前データを結合して結合ファイルを生成するので、結合ファイルの容量はデータ処理に好適なものとなる。また、結合ファイルに含まれる結合前データは、パラメータA,Bに関して統合され、パラメータCの区分が異なるものであるので、結合ファイルは、論理的な意味づけがなされたものとなる。   In subsequent step S66, the data combining unit 14 combines the pre-combination data included in the combined block to generate a combined file. Move the pre-combination data for each block to the combined block, and combine the pre-combination data included in the combined block when the total capacity of the pre-combination data included in the combined block exceeds the specified capacity. Thus, the combined file is generated, so that the capacity of the combined file is suitable for data processing. Further, since the pre-combination data included in the combined file is integrated with respect to the parameters A and B, and the classification of the parameter C is different, the combined file is logically meaningful.

次に、ステップS67において、データ書き出し部15は、ステップS66において生成された結合ファイルを、パラメータの区分による識別子をファイル名やファイル内のメタデータなどに付しながら、外部ファイルシステム2の結合ファイル記憶部20に書き出す。ここで結合ファイルに付される識別子は、例えば、結合ファイルに含まれるブロックbkbが、ブロックbkb(a0,b0,c2)、ブロックbkb(a0,b0,c4)及びブロックbkb(a0,b0,c8)の3個のブロックである場合には、「結合ファイル(a0,b0,c4〜c8)」とすることができる。ステップS63〜S68の処理において選択され、結合ファイルに含まれることとなったブロックbkbは、本発明における結合対象ブロックを構成する。   Next, in step S67, the data writing unit 15 attaches the combined file generated in step S66 to the file name, the metadata in the file, etc. while attaching the identifier based on the parameter classification to the file name or the metadata in the file. Write to the storage unit 20. Here, the identifier given to the combined file is, for example, that the block bkb included in the combined file is a block bkb (a0, b0, c2), a block bkb (a0, b0, c4) and a block bkb (a0, b0, c8). ), It is possible to use “joined file (a0, b0, c4 to c8)”. The block bkb selected in the processing of steps S63 to S68 and included in the combined file constitutes a combination target block in the present invention.

また、ステップS67において、データ書き出し部15は、結合ブロックのデータを消去する。結合候補ブロックのデータが結合ブロックに移動された後に結合ブロックのデータが消去されるので、ステップS67における結合ブロックのデータの消去の処理は、結合対象ブロックに含まれるすべての結合前データを結合前データ一時蓄積手段から消去する処理に相当する。さらに、ステップS67において、データ結合部14は、結合Cフラグをセットする。   In step S67, the data writing unit 15 erases the combined block data. Since the data of the combined block is erased after the data of the combined candidate block is moved to the combined block, the process of deleting the data of the combined block in step S67 is performed before combining all the data before combining included in the block to be combined. This corresponds to the process of deleting from the temporary data storage means. Further, in step S67, the data combining unit 14 sets a combined C flag.

続くステップS68において、データ結合部14は、全ての結合候補ブロックを選択したか否かを判断する。全ての結合候補ブロックを選択したと判断した場合には、処理手順はステップS69に進められ、全ての結合候補ブロックを選択していないと判断した場合には、処理手順はステップS63に戻る。   In subsequent step S68, the data combination unit 14 determines whether all the combination candidate blocks have been selected. If it is determined that all combination candidate blocks have been selected, the processing procedure proceeds to step S69. If it is determined that all combination candidate blocks have not been selected, the processing procedure returns to step S63.

全ての結合候補ブロックを選択したと判断されると、ステップS69において、データ結合部14は、その時点において、結合ブロックに結合前データが残り、且つ結合Cフラグがセットされているか否かを判断する。結合ブロックに結合前データがあり、且つ結合Cフラグがセットされていると判断した場合には、処理手順はステップS70に進められ、結合ブロックに結合前データがあり、且つ結合Cフラグがセットされていると判断しなかった場合には、処理手順はステップS71に進められる。   If it is determined that all the combination candidate blocks have been selected, in step S69, the data combination unit 14 determines whether or not the pre-combination data remains in the combination block and the combination C flag is set at that time. To do. If it is determined that there is pre-join data in the join block and the join C flag is set, the process proceeds to step S70, where there is pre-join data in the join block and the join C flag is set. If it is not determined that it is, the processing procedure proceeds to step S71.

結合ブロックに結合前データがあり、且つ結合Cフラグがセットされている場合とは、本実施形態の例では、例えば、ブロックbkb(a0,b0,c2)、ブロックbkb(a0,b0,c4)及びブロックbkb(a0,b0,c8)の3個のブロックから、結合ファイル(a0,b0,c4〜c8)が生成されて書き出しが行われ、ブロックbkb(a0,b0,c10)に含まれていた結合前データの容量の合計が所定容量を超えずに、書き出し処理が行われないまま結合ブロックに結合前データが残っている状態である。このように、結合ファイルとして書き出しが行われなかったブロックは、本発明における残結合候補ブロックを構成する。そして、このような場合には、ステップS70において、データ結合部14は、結合ブロックに含まれる結合前データを結合して残結合ファイルを生成し、データ書き出し部15は、残結合ファイルを、パラメータCの区分による識別子と共に、外部ファイルシステム2の結合ファイル記憶部20に書き出す。これにより、全ての結合前データを、一定の分割基準(時間間隔およびデータ量)に則り、分割・出力することができる。   In the example of this embodiment, for example, the block bkb (a0, b0, c2) and the block bkb (a0, b0, c4) are the cases where there is pre-join data in the join block and the join C flag is set. And the combined file (a0, b0, c4 to c8) is generated from the three blocks of the block bkb (a0, b0, c8) and written out, and is included in the block bkb (a0, b0, c10). In this state, the total data volume before combining does not exceed a predetermined capacity, and the data before combining remains in the combined block without performing the writing process. In this way, blocks that have not been written out as a combined file constitute a remaining combined candidate block in the present invention. In such a case, in step S70, the data combining unit 14 combines the pre-combination data included in the combined block to generate a remaining combined file, and the data writing unit 15 uses the remaining combined file as a parameter. Along with the identifier by the division of C, it is written in the combined file storage unit 20 of the external file system 2. As a result, all the pre-combination data can be divided and output according to a certain division criterion (time interval and data amount).

一方、ステップS69からステップS71に処理が進められる場合とは、パラメータCの区分のみが異なるブロックbkbから構成される全ての結合候補ブロックに含まれる結合前データの容量の合計が、所定容量を超えなかった場合である。この場合には、結合ブロックは、全ての結合候補ブロックの結合前データを含んでいるので、ステップS71において、データ結合部14は、結合ブロックの結合前データを結合して、パラメータCの区分により識別される結合ファイルとして、外部ファイルシステム2の結合ファイル記憶部20に書き出す。例えば、結合前データの無いブロックbkwを除く、ブロックbkb(a0,b0,c2)、ブロックbkb(a0,b0,c4)、ブロックbkb(a0,b0,c8)、及びブロックbkb(a0,b0,c10)の4個のブロック(結合保留ブロックbkb)に含まれていた結合前データの容量の合計が所定容量を超えなかった場合に、ステップS71に示す処理が行われる。これにより、結合前データ一時蓄積部12に記憶されていた全ての結合前データの書き出しが完了する。こうして、データ分割装置1において実施されるデータ分割処理が終了する。   On the other hand, in the case where the process proceeds from step S69 to step S71, the sum of the capacities of the pre-combination data included in all the combination candidate blocks composed of the blocks bkb differing only in the parameter C category exceeds the predetermined capacity. This is the case. In this case, since the combined block includes the pre-combination data of all the combination candidate blocks, in step S71, the data combining unit 14 combines the pre-combination data of the combined blocks and sets the parameter C according to the classification. As a combined file to be identified, it is written to the combined file storage unit 20 of the external file system 2. For example, a block bkb (a0, b0, c2), a block bkb (a0, b0, c4), a block bkb (a0, b0, c8) and a block bkb (a0, b0, When the sum of the capacities of the pre-combination data included in the four blocks c10) (joining pending block bkb) does not exceed the predetermined capacity, the process shown in step S71 is performed. This completes the writing of all the pre-combination data stored in the pre-combination data temporary storage unit 12. In this way, the data dividing process performed in the data dividing device 1 is completed.

なお、本実施形態では便宜的にbk、bka、bkbを区別しているが、ブロック配列内部の引数が混同しないため、単一のブロック配列bkに集約することも可能である。また、bkv、bkwについても、そのブロック内のデータ量を確認することで容易にbkaやbkbと区別がつくため、同一のブロック配列に集約することも可能である。   In this embodiment, bk, bka, and bkb are distinguished for convenience. However, since arguments inside the block array are not confused, they can be aggregated into a single block array bk. Also, bkv and bkw can be easily distinguished from bka and bkb by confirming the data amount in the block, and therefore can be integrated into the same block arrangement.

なお、本実施形態では、結合前データは3個のパラメータA,B,Cを有することとし、パラメータAを選択パラメータとして選択した場合の処理をステップS21〜S32(図7)、パラメータBを選択パラメータとして選択した場合の処理をステップS41〜S52(図8)、パラメータCを選択パラメータとして選択した場合の処理をステップS61〜S71(図9)に示した。これに対し、結合前データが、第1〜第n(nは2以上の整数)の複数のパラメータを有する場合には、データ結合部14は、n個のパラメータを順次、選択パラメータとしてn回選択し、選択した選択パラメータごとにステップS21〜S32、ステップS41〜S52、またはステップS61〜S71に示す処理をn回順次実行する。この場合には、パラメータごとに順次、ブロックを結合して結合前データの集合から結合ファイルを分割、生成する処理が行われるので、結合前データの集合から、論理的に適切な意味を有すると共に、データ処理に好適な容量の結合ファイルを分割、生成することができる。   In the present embodiment, the pre-combination data has three parameters A, B, and C, and the process when parameter A is selected as a selection parameter is performed in steps S21 to S32 (FIG. 7), and parameter B is selected. The process when the parameter is selected is shown in steps S41 to S52 (FIG. 8), and the process when the parameter C is selected as the selection parameter is shown in steps S61 to S71 (FIG. 9). On the other hand, when the pre-combination data has a plurality of first to nth parameters (n is an integer of 2 or more), the data combining unit 14 sequentially sets n parameters n times as selection parameters. The processing shown in steps S21 to S32, steps S41 to S52, or steps S61 to S71 is sequentially executed n times for each selected selection parameter. In this case, since the process of dividing and generating the combined file from the set of pre-combination data by sequentially combining the blocks for each parameter is performed, the logically appropriate meaning is obtained from the pre-combination data set. A combined file having a capacity suitable for data processing can be divided and generated.

なお、結合前データが3個のパラメータA,B,Cを有しつつ、結合・分割処理はA,Bについてのみ行い、Cについては行わないといったこともできる。この場合、パラメータAについてはステップS21〜S32を行い、パラメータBについてはステップS41〜S52を行うが、S51において結合保留ブロックを生成せず、S71の処理と同様にファイルに書き出す。これにより、パラメータCのく分については統合されることなく、同一ファイル内には単一のパラメータCの区分のデータが存在することを保証することができる。   Note that it is possible that the pre-combination data has three parameters A, B, and C, and the combination / division processing is performed only for A and B and not for C. In this case, steps S21 to S32 are performed for the parameter A, and steps S41 to S52 are performed for the parameter B, but the combined pending block is not generated in S51 and is written to the file in the same manner as the processing of S71. As a result, it is possible to ensure that data of a single parameter C category exists in the same file without being integrated with respect to the parameters C.

続いて、以上説明したデータ分割システム及びデータ分割方法の作用効果について説明する。本実施形態のデータ分割システム及びデータ分割方法では、選択パラメータの値が異なるブロックbkが結合候補ブロックとしてデータ結合部14により選択されるので、結合されるブロックbkに含まれる結合前データは、既に処理された選択パラメータについてはファイルに分割されて書き出されるか結合保留ブロックとして統合され、未処理の選択パラメータについては、選択パラメータ以外の未選択パラメータ値が同一区分である。これにより、結合前データの集合から論理的に適切な意味を有する結合ファイルを分割することができる。また、選択された結合候補ブロックから、ブロックbkに含まれる結合前データの容量の合計が所定容量を超えるように、データ結合部14により、結合対象ブロックが抽出され、抽出された結合対象ブロックを結合して結合ファイルが生成され、データ書き出し部15により、結合ファイル記憶部20に書き出されるので、結合前データの集合から、データ処理に好適な容量の結合ファイルを分割することが可能となる。   Next, operational effects of the data division system and the data division method described above will be described. In the data division system and data division method of the present embodiment, since the block bk having a different selection parameter value is selected by the data combining unit 14 as a combination candidate block, the pre-combination data included in the block bk to be combined is already The processed selection parameters are divided into files and written out or integrated as a combined pending block. For the unprocessed selection parameters, the unselected parameter values other than the selection parameters are in the same category. As a result, a combined file having a logically appropriate meaning can be divided from the set of data before combining. Further, from the selected combination candidate blocks, the data combination unit 14 extracts the combination target blocks so that the total capacity of the pre-combination data included in the block bk exceeds a predetermined capacity, and the extracted combination target blocks are Since a combined file is generated by combining and written to the combined file storage unit 20 by the data writing unit 15, it is possible to divide a combined file having a capacity suitable for data processing from the set of data before combining.

本実施形態のデータ分割システムでは、ブロックbkに含まれる結合前データの容量の合計が所定容量に達していなくとも、データ結合部14により、結合ファイルとして分割、書き出しが行われた結合前データと論理的な意味づけを有する結合前データが残結合候補ブロックとして抽出され、抽出された残結合候補ブロックから残結合ファイルが生成され、データ書き出し部15により、生成された残結合ファイルを結合ファイル記憶部20に書き出すことができる。これにより、結合ファイルに含まれる結合前データ間における論理的意味づけと同一の論理的意味づけを有する結合前データを、結合前データ一時蓄積手段に残さないようにすることができる。これにより、同一区分の未選択パラメータを持つデータのみを、一定の分割基準(時間間隔およびデータ量)に則り、分割・出力することができ、出力されたファイルには異なる区分の未選択パラメータを持つデータが存在しないことを保証できる。   In the data division system according to the present embodiment, even if the total capacity of the pre-combination data included in the block bk does not reach a predetermined capacity, the pre-combination data that has been divided and written out as a combined file by the data combining unit 14 Pre-combination data having logical meaning is extracted as a residual combination candidate block, a residual combined file is generated from the extracted residual combined candidate block, and the generated residual combined file is stored in the combined file by the data writing unit 15 Part 20 can be written out. Thereby, it is possible to prevent the pre-combination data having the same logical meaning as the logical meaning between the pre-combination data included in the connection file from being left in the pre-combination data temporary storage unit. As a result, only data with unselected parameters in the same category can be divided and output according to certain division criteria (time interval and data volume), and unselected parameters in different categories can be output to the output file. It can be assured that no data exists.

また、本実施形態のデータ分割システムでは、結合前データ一時蓄積部12において、一のブロックbkに含まれる結合前データの容量の合計が所定容量を超えた場合には、データ結合部14は、一のブロックbkに含まれる結合前データを結合して結合ファイルを生成する。一のブロックbkに含まれる複数の結合前データは、同一区分のパラメータ値を有するので、互いに論理的な意味づけを有する。従って、データ書き出し部15により、これらの論理的な意味づけを有する複数の結合前データが結合ファイルとして書き出されることとなるので、結合前データの集合から、論理的に適切な意味を有すると共に、データ処理に好適な容量の結合ファイルを分割することができる。   In the data division system of this embodiment, in the pre-combination data temporary storage unit 12, when the total capacity of the pre-combination data included in one block bk exceeds a predetermined capacity, the data combination unit 14 The pre-combination data included in one block bk is combined to generate a combined file. Since the plurality of pre-combination data included in one block bk have parameter values in the same category, they have logical meanings. Accordingly, since the data writing unit 15 writes a plurality of pre-join data having these logical meanings as a join file, it has a logically appropriate meaning from the set of pre-join data, A combined file having a capacity suitable for data processing can be divided.

1…データ分割装置、11…データ取得部、12…結合前データ一時蓄積部、13…タイマ、14…データ結合部、15…データ書き出し部、2…外部ファイルシステム、20…結合ファイル記憶部、N1,N2,N3…データ生成ノード、bk…ブロック、bka,bkb…結合保留ブロック。   DESCRIPTION OF SYMBOLS 1 ... Data division | segmentation apparatus, 11 ... Data acquisition part, 12 ... Pre-combination data temporary storage part, 13 ... Timer, 14 ... Data combination part, 15 ... Data writing part, 2 ... External file system, 20 ... Combined file storage part, N1, N2, N3... Data generation node, bk... Block, bka, bkb.

Claims (7)

複数のパラメータを有するデータである結合前データの集合を、複数のファイルに分割し、分割した前記ファイルを所定の記憶手段に書き出すデータ分割システムであって、
前記複数のパラメータに同一の範囲区分に属する値を有する前記結合前データを、前記結合前データのまとまりである複数のブロックごとに一時蓄積する結合前データ一時蓄積手段と、
前記複数のパラメータから選択された一のパラメータである選択パラメータを選択する選択パラメータ選択手段と、
前記結合前データ一時蓄積手段に蓄積された複数の前記ブロックから、前記選択パラメータ選択手段により選択された選択パラメータの値のみが異なる前記結合前データを含む複数の前記ブロックを結合候補ブロックとして、該結合候補ブロックをグループ化した結合候補ブロック群を1または複数形成するブロック選択処理を実行する結合候補ブロック選択手段と、
前記結合候補ブロック選択手段により形成された前記結合候補ブロック群ごとに、該結合候補ブロック群から、予め定められた所定の分割基準を満たすように、1または複数の前記結合候補ブロックを結合対象ブロックとして抽出するブロック抽出処理を実行する結合対象ブロック抽出手段と、
前記結合対象ブロック抽出手段により抽出された前記結合対象ブロックに含まれる前記結合前データを結合して、前記結合候補ブロック群ごとに1または複数の結合ファイルを生成する結合ファイル生成処理を実行する結合ファイル生成手段と、
前記結合ファイル生成手段により生成された前記結合ファイルを前記所定の記憶手段に記憶させると共に、前記結合対象ブロックに含まれるすべての前記結合前データを前記結合前データ一時蓄積手段から消去する書き出し処理を実行する結合ファイル書き出し手段と
を備えることを特徴とするデータ分割システム。
A data division system that divides a set of pre-combination data, which is data having a plurality of parameters, into a plurality of files, and writes the divided files to a predetermined storage unit,
Pre-combination data temporary storage means for temporarily storing the pre-combination data having values belonging to the same range category for the plurality of parameters for each of a plurality of blocks as a group of the pre-combination data;
Selection parameter selection means for selecting a selection parameter that is one parameter selected from the plurality of parameters;
Among the plurality of blocks stored in the pre-combination data temporary storage unit, a plurality of blocks including the pre-combination data that differ only in the value of the selection parameter selected by the selection parameter selection unit is used as a combination candidate block. A combination candidate block selection unit that executes block selection processing for forming one or a plurality of combination candidate blocks obtained by grouping combination candidate blocks;
For each of the combination candidate block groups formed by the combination candidate block selection means, one or a plurality of the combination candidate blocks are combined from the combination candidate block group so as to satisfy a predetermined predetermined division criterion. A block extraction means for combining to execute block extraction processing to be extracted as
A combination for generating a combined file generation process for generating one or a plurality of combined files for each combination candidate block group by combining the pre-combination data included in the combination target blocks extracted by the combination target block extraction unit File generation means;
A write process for storing the combined file generated by the combined file generating unit in the predetermined storage unit and erasing all the pre-combination data included in the combination target block from the pre-combination data temporary storage unit; A data dividing system comprising: a combined file writing means for executing.
前記結合対象ブロック抽出手段は、
前記所定の分割基準として、前記結合候補ブロックに含まれる前記結合前データの容量の合計が予め定められた所定容量を超えるように、または、予め定められた所定時間が経過したときに、前記結合候補ブロック群から1または複数の前記結合候補ブロックを結合対象ブロックとして抽出すること
を特徴とする請求項1に記載のデータ分割システム。
The combination target block extraction means includes:
As the predetermined division criterion, the combination is performed when the total capacity of the pre-combination data included in the combination candidate block exceeds a predetermined predetermined capacity or when a predetermined time has elapsed. The data division system according to claim 1, wherein one or a plurality of the combination candidate blocks are extracted as a combination target block from the candidate block group.
前記結合前データは、第1〜第n(nは2以上の整数)の複数のパラメータを有し、
前記選択パラメータ選択手段は、前記選択パラメータとして、前記複数のパラメータから第1〜第nのパラメータを順次選択し、
前記選択パラメータ選択手段により前記選択パラメータとして選択された前記第1〜第nのパラメータごとに、前記結合候補ブロック選択手段による前記ブロック選択処理、前記結合対象ブロック抽出手段による前記ブロック抽出処理、前記結合ファイル生成手段による前記結合ファイル生成処理、及び前記結合ファイル書き出し手段による前記書き出し処理が、最大n回順次実行される
ことを特徴とする請求項1または2に記載のデータ分割システム。
The pre-combination data has a plurality of first to nth parameters (n is an integer of 2 or more),
The selection parameter selection means sequentially selects first to n-th parameters from the plurality of parameters as the selection parameters,
For each of the first to nth parameters selected as the selection parameter by the selection parameter selection unit, the block selection process by the combination candidate block selection unit, the block extraction process by the combination target block extraction unit, and the combination 3. The data division system according to claim 1, wherein the combined file generating process by the file generating unit and the writing process by the combined file writing unit are sequentially executed a maximum of n times.
前記結合ファイル生成手段は、前記結合候補ブロックから前記結合対象ブロックとして抽出されなかった前記ブロックである残結合候補ブロックに含まれる前記結合前データを結合して残結合ファイルを生成し、
前記結合ファイル書き出し手段は、前記結合ファイル生成手段により生成された前記残結合ファイルを前記所定の記憶手段に書き出すと共に、前記残結合対象ブロックに含まれるすべての前記結合前データを前記結合前データ一時蓄積手段から消去する
ことを特徴とする請求項1〜3のいずれか1項に記載のデータ分割システム。
The combined file generating unit generates a residual combined file by combining the pre-combined data included in the remaining combined candidate block that is the block that has not been extracted as the combining target block from the combined candidate block,
The combined file writing unit writes the remaining combined file generated by the combined file generating unit to the predetermined storage unit, and all the pre-combined data included in the remaining combined target block is temporarily stored in the pre-combined data The data division system according to any one of claims 1 to 3, wherein the data is deleted from the storage means.
前記結合前データ一時蓄積手段において、一の前記ブロックに含まれる前記結合前データが前記所定の分割基準を満たした場合には、前記結合ファイル生成手段は、前記一のブロックに含まれる前記結合前データを結合して前記結合ファイルを生成する
ことを特徴とする請求項1〜4のいずれか1項に記載のデータ分割システム。
In the pre-combination data temporary storage unit, when the pre-combination data included in one block satisfies the predetermined division criterion, the combined file generation unit includes the pre-combination data included in the one block. The data division system according to claim 1, wherein the combined file is generated by combining data.
複数のパラメータを有するデータである結合前データの集合を、複数のファイルに分割し、分割した前記ファイルを所定の記憶手段に書き出すデータ分割方法であって、
前記複数のパラメータから選択された一のパラメータである選択パラメータを選択する選択パラメータ選択ステップと、
前記複数のパラメータに同一の範囲区分に属する値を有する前記結合前データを、前記結合前データのまとまりである複数のブロックごとに一時蓄積する結合前データ一時蓄積手段に蓄積された複数の前記ブロックから、前記選択パラメータ選択ステップにおいて選択された選択パラメータの値のみが異なる前記結合前データを含む複数の前記ブロックを結合候補ブロックとして、該結合候補ブロックをグループ化した結合候補ブロック群を1または複数形成する結合候補ブロック選択ステップと、
前記結合候補ブロック選択ステップにおいて形成された前記結合候補ブロック群ごとに、該結合候補ブロック群から、予め定められた所定の分割基準を満たすように、1または複数の前記結合候補ブロックを結合対象ブロックとして抽出する結合対象ブロック抽出ステップと、
前記結合対象ブロック抽出ステップにおいて抽出された前記結合対象ブロックに含まれる前記結合前データを結合して、前記結合候補ブロック群ごとに1または複数の結合ファイルを生成する結合ファイル生成ステップと、
前記結合ファイル生成ステップにおいて生成された前記結合ファイルを、前記所定の記憶手段に記憶させると共に、前記結合対象ブロックに含まれるすべての前記結合前データを前記結合前データ一時蓄積手段から消去する結合ファイル書き出しステップと
を有することを特徴とするデータ分割方法。
A data division method for dividing a set of pre-combination data, which is data having a plurality of parameters, into a plurality of files and writing the divided files to a predetermined storage means,
A selection parameter selection step of selecting a selection parameter that is one parameter selected from the plurality of parameters;
The plurality of blocks stored in the pre-combination data temporary storage means for temporarily storing the pre-combination data having values belonging to the same range category in the plurality of parameters for each of a plurality of blocks as a group of the pre-combination data. From the plurality of blocks including the pre-combination data that differ only in the value of the selection parameter selected in the selection parameter selection step as a combination candidate block, one or a plurality of combination candidate block groups obtained by grouping the combination candidate blocks A candidate combination block selection step to be formed;
For each combination candidate block group formed in the combination candidate block selection step, one or a plurality of combination candidate blocks are combined from the combination candidate block group so as to satisfy a predetermined predetermined division criterion. A block to be combined extraction step to extract as
A combined file generation step of combining the pre-combination data included in the combination target blocks extracted in the combination target block extraction step to generate one or a plurality of combined files for each combination candidate block group;
The combined file generated in the combined file generation step is stored in the predetermined storage unit, and all the pre-combination data included in the combination target block is deleted from the pre-combination data temporary storage unit A data dividing method comprising: a writing step.
前記結合前データは、第1〜第n(nは2以上の整数)の複数のパラメータを有し、
前記選択パラメータ選択ステップ、前記結合候補ブロック選択ステップ、前記結合対象ブロック抽出ステップ、前記結合ファイル生成ステップ、及び前記結合ファイル書き出しステップを、前記第1〜第nのパラメータごとに最大n回順次実行することを特徴とする請求項6に記載のデータ分割方法。
The pre-combination data has a plurality of first to nth parameters (n is an integer of 2 or more),
The selection parameter selection step, the combination candidate block selection step, the combination target block extraction step, the combination file generation step, and the combination file writing step are sequentially executed up to n times for each of the first to nth parameters. The data division method according to claim 6.
JP2009121148A 2009-05-19 2009-05-19 Data division system and data division method Expired - Fee Related JP5410155B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009121148A JP5410155B2 (en) 2009-05-19 2009-05-19 Data division system and data division method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009121148A JP5410155B2 (en) 2009-05-19 2009-05-19 Data division system and data division method

Publications (2)

Publication Number Publication Date
JP2010271781A true JP2010271781A (en) 2010-12-02
JP5410155B2 JP5410155B2 (en) 2014-02-05

Family

ID=43419779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009121148A Expired - Fee Related JP5410155B2 (en) 2009-05-19 2009-05-19 Data division system and data division method

Country Status (1)

Country Link
JP (1) JP5410155B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022890A (en) * 2022-06-02 2022-09-06 西安电子科技大学 Method for generating resource cell coverage structure facing capacity coverage

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1166102A (en) * 1997-08-22 1999-03-09 Nec Corp System for retrieval efficiency improvement by data division
JP2001022621A (en) * 1999-07-08 2001-01-26 Hitachi Ltd Multidimensional database management system
JP2002244893A (en) * 2002-01-04 2002-08-30 Fujitsu Ltd Data control unit
JP2004348338A (en) * 2003-05-21 2004-12-09 Ntt Data Corp Data division processor, data division processing method, and data division processing program
JP2005099910A (en) * 2003-09-22 2005-04-14 Dainippon Printing Co Ltd Supply method and supply system for digital contents
JP2007011548A (en) * 2005-06-29 2007-01-18 Fujitsu Ltd Data set dividing program, data set dividing device, and data set dividing method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1166102A (en) * 1997-08-22 1999-03-09 Nec Corp System for retrieval efficiency improvement by data division
JP2001022621A (en) * 1999-07-08 2001-01-26 Hitachi Ltd Multidimensional database management system
JP2002244893A (en) * 2002-01-04 2002-08-30 Fujitsu Ltd Data control unit
JP2004348338A (en) * 2003-05-21 2004-12-09 Ntt Data Corp Data division processor, data division processing method, and data division processing program
JP2005099910A (en) * 2003-09-22 2005-04-14 Dainippon Printing Co Ltd Supply method and supply system for digital contents
JP2007011548A (en) * 2005-06-29 2007-01-18 Fujitsu Ltd Data set dividing program, data set dividing device, and data set dividing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022890A (en) * 2022-06-02 2022-09-06 西安电子科技大学 Method for generating resource cell coverage structure facing capacity coverage
CN115022890B (en) * 2022-06-02 2023-06-30 西安电子科技大学 Method for generating resource cell coverage structure facing capacity coverage

Also Published As

Publication number Publication date
JP5410155B2 (en) 2014-02-05

Similar Documents

Publication Publication Date Title
KR102191225B1 (en) A cache management system and a method of managing data thereof
JP6793838B2 (en) Blockchain-based data processing methods and equipment
CN108549569B (en) Method and equipment for searching information in application program
CN109951547B (en) Transaction request parallel processing method, device, equipment and medium
CN103765381B (en) Parallel work-flow to B+ tree
CN102938784A (en) Method and system used for data storage and used in distributed storage system
CN106453536A (en) Network request processing method and system and server
CN111339078A (en) Data real-time storage method, data query method, device, equipment and medium
CN112286939A (en) Method, device and equipment for generating Hash of global state in block chain type account book
KR102061466B1 (en) Conservative garbage collecting and tagged integers for memory management
CN103246549B (en) A kind of method and system of data conversion storage
WO2021057482A1 (en) Method and device for generating bloom filter in blockchain
US20160321105A1 (en) Parallel computer system, method of controlling parallel computer system, and recording medium
CN108763572A (en) A kind of method and apparatus for realizing Apache Solr read and write abruptions
WO2023160083A1 (en) Method for executing transactions, blockchain, master node, and slave node
CN109033365B (en) Data processing method and related equipment
CN107451204B (en) Data query method, device and equipment
US20150293971A1 (en) Distributed queries over geometric objects
JP5410155B2 (en) Data division system and data division method
CN109324867A (en) A kind of virtual machine temporary storage method, restoration methods and device
CN104932982B (en) A kind of Compilation Method and relevant apparatus of message memory access
JP2018156458A (en) Creation device, creation method, and creation program
JP2008225686A (en) Data arrangement management device and method in distributed data processing platform, and system and program
CN1828596A (en) File system represented inside a database
CN105447183A (en) MPP framework database cluster sequence system and sequence management method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131106

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees