JP5010958B2 - Data management method, program and apparatus - Google Patents

Data management method, program and apparatus Download PDF

Info

Publication number
JP5010958B2
JP5010958B2 JP2007091712A JP2007091712A JP5010958B2 JP 5010958 B2 JP5010958 B2 JP 5010958B2 JP 2007091712 A JP2007091712 A JP 2007091712A JP 2007091712 A JP2007091712 A JP 2007091712A JP 5010958 B2 JP5010958 B2 JP 5010958B2
Authority
JP
Japan
Prior art keywords
items
item
data
array
records
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007091712A
Other languages
Japanese (ja)
Other versions
JP2008250727A (en
Inventor
鐘龍 崔
昌樹 白桃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Broad Solution and Consulting Inc
Original Assignee
Fujitsu Broad Solution and Consulting Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Broad Solution and Consulting Inc filed Critical Fujitsu Broad Solution and Consulting Inc
Priority to JP2007091712A priority Critical patent/JP5010958B2/en
Publication of JP2008250727A publication Critical patent/JP2008250727A/en
Application granted granted Critical
Publication of JP5010958B2 publication Critical patent/JP5010958B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、コンピュータを用いた大規模なデータベースにおけるデータ管理方法、プログラム及び装置に関し、特に、表形式のデータを読み込んで保存する際の手法に関する。   The present invention relates to a data management method, program, and apparatus for a large-scale database using a computer, and more particularly to a technique for reading and storing tabular data.

大規模なデータベースには、多数のデータを表形式で管理し、複数の表を関連付けて運用するリレーショナルデータベース(RDB)が従来から用いられている。RDBはトランザクション処理に向いているため、各種の基幹システムに用いられているが、全件のソートや更新、検索といった処理には時間がかかる。   Conventionally, a large-scale database uses a relational database (RDB) that manages a large number of data in a table format and associates and operates a plurality of tables. Since RDB is suitable for transaction processing, it is used in various backbone systems, but it takes time to sort, update, and search all cases.

このようなRDBの弱点を克服するため、特許文献1には、成分分解法によるFAST(Filter Array Structure)構造が開示されている。FAST構造では、表形式のレコードの配列であるデータを順序、位置、値の成分に分解(コンパイル)して管理することにより、全件を対象とした処理の高速化を可能としている。   In order to overcome such weaknesses of RDB, Patent Document 1 discloses a FAST (Filter Array Structure) structure based on a component decomposition method. In the FAST structure, data that is an array of records in a tabular format is managed by being decomposed (compiled) into order, position, and value components, thereby enabling high-speed processing for all cases.

特許第3581831号公報Japanese Patent No. 3581831

しかしながら、上記のFAST構造を採用したデータ管理方法では、表形式の元データに含まれる全ての項目についてFAST構造へのコンパイルが必要となるため、データの登録コストが高くなる。また、データの追加や更新、集計の際にもコンパイルが必要となるため、これらの処理に時間がかかるという問題がある。   However, in the data management method adopting the FAST structure described above, since all items included in the tabular original data need to be compiled into the FAST structure, the data registration cost increases. In addition, since compilation is also required when adding, updating, and tabulating data, there is a problem that these processes take time.

本発明は、上述した従来技術の問題点に鑑みてなされたものであり、高速検索が可能なFAST構造を利用しつつ、データの登録、追加、更新等の際の処理時間を短縮することができるデータ管理方法、プログラム及び装置を提供することを目的(課題)とする。   The present invention has been made in view of the above-described problems of the prior art, and can reduce the processing time for data registration, addition, update, etc., while using a FAST structure capable of high-speed search. It is an object (problem) to provide a data management method, program, and apparatus that can be used.

本発明にかかるデータ管理方法は、コンピュータが、複数の項目についてそれぞれ項目値を持つレコードを複数含む表形式の元データの入力を受け付ける入力受付手順、入力された元データについて、データ処理のキーとして使用する項目については、ユニークな項目値をソートした配列である項目値テーブルと、レコードの配列順に当該レコードの項目値が格納されている前記項目値テーブル内の位置を記録した配列であるインデックス値テーブルとに分解して保存するコンパイル手順、入力された元データについて、データ処理のキーとして使用しない項目については、1レコードに複数の項目を含む表形式のデータとして保存する表形式保存手順を実行することを特徴とする。   In the data management method according to the present invention, the computer receives an input reception procedure for receiving input of original data in a table format including a plurality of records each having an item value for a plurality of items, and the input original data is used as a key for data processing. For items to be used, an item value table that is an array in which unique item values are sorted, and an index value that is an array that records the positions in the item value table in which the item values of the records are stored in the order in which the records are arranged Compile procedure for disassembling and saving to table, for input source data, for items not used as data processing key, execute tabular format save procedure to save as tabular data including multiple items in one record It is characterized by doing.

コンピュータが、さらに、表形式保存手段により保存されたデータについて、表形式で保存された全項目を1つの項目と見立て、ユニークな項目値をソートした配列である項目値テーブルと、レコードの配列順に当該レコードの項目値が格納されている項目値テーブル内の位置を記録した配列であるインデックス値テーブルとに分解して保存する第2のコンパイル手順を実行するようにしてもよい。   The computer further regards the data saved by the tabular saving means, assuming that all items saved in the tabular format are regarded as one item, an item value table that is an array in which unique item values are sorted, and the order in which the records are arranged You may make it perform the 2nd compilation procedure which decomposes | disassembles into the index value table which is the arrangement | sequence which recorded the position in the item value table in which the item value of the said record is stored.

なお、本発明のデータ管理プログラムは、上記の方法の各手順に相当する手段としてコンピュータを機能させることを特徴とし、本発明のデータ管理装置は、そのように機能するコンピュータと等価である。   The data management program of the present invention is characterized by causing a computer to function as a means corresponding to each procedure of the above method, and the data management apparatus of the present invention is equivalent to a computer that functions as such.

本発明によれば、入力された表形式の元データのうち、キーとして利用する項目についてのみFAST構造へのコンパイルを実行し、他の項目については表形式のまま保存するようにしたため、検索等に利用する項目についてはFAST構造に変換して高速検索を可能としつつ、キーとして利用しない項目についてはコンパイルをしないで表形式で保存することにより、全項目をコンパイルする従来の方法と比較してデータ登録の際、あるいは、レコードの追加、更新の際の処理時間を短縮することができる。   According to the present invention, the FAST structure is compiled only for the items used as keys in the input table format original data, and the other items are stored in the table format. Compared to the conventional method of compiling all items by compiling all the items by saving them in tabular form without compiling them, converting items used in the FAST structure to enable high-speed search Processing time for data registration or record addition / update can be shortened.

以下、本発明にかかるデータ管理方法の実施形態を説明する。最初に、図1に基づいて本実施形態のデータ管理方法が適用されるシステムの概要を説明する。このシステム1は、単独のコンピュータ10と、周辺機器とから構成されている。コンピュータ10は、CPU11、並びにこのCPU11に接続されたハードディスク(HD)20、メモリ(RAM)12及びインターフェイス13を備えている。   Embodiments of a data management method according to the present invention will be described below. First, an outline of a system to which the data management method of the present embodiment is applied will be described based on FIG. The system 1 includes a single computer 10 and peripheral devices. The computer 10 includes a CPU 11, a hard disk (HD) 20, a memory (RAM) 12, and an interface 13 connected to the CPU 11.

なお、コンピュータ10のCPU11には、周辺機器としてディスプレイ30、キーボード31がインターフェイス13を介して接続されている。   Note that a display 30 and a keyboard 31 are connected to the CPU 11 of the computer 10 via the interface 13 as peripheral devices.

HD20には、図示せぬオペレーティングシステムの他、データ管理プログラム21がインストールされると共に、データベース(DB)22が構築されている。CPU11は、起動するとHD20からオペレーティングシステムをRAM13上に読み出して実行し、このオペレーティングシステム上でデータ管理プログラム21を実行する。   In addition to an operating system (not shown), a data management program 21 is installed in the HD 20 and a database (DB) 22 is constructed. When the CPU 11 is activated, it reads the operating system from the HD 20 onto the RAM 13 and executes it, and executes the data management program 21 on this operating system.

データ管理プログラム21には、複数の項目についてそれぞれ項目値を持つレコードを複数含む表形式の元データの入力を受け付ける入力受付機能21aと、入力された元データについて、データ処理のキーとして使用する項目については、ユニークな項目値をソートした配列である項目値テーブルと、レコードの配列順に当該レコードの項目値が格納されている項目値テーブル内の位置を記録した配列であるインデックス値テーブルとに分解して保存するコンパイル機能21bと、入力された元データについて、データ処理のキーとして使用しない項目については、1レコードに複数の項目を含む表形式のデータとして保存する表形式保存機能21cとが含まれている。   The data management program 21 includes an input reception function 21a that accepts input of tabular source data including a plurality of records each having item values for a plurality of items, and items used as data processing keys for the input source data. Is broken down into an item value table that is an array in which unique item values are sorted, and an index value table that is an array that records the positions in the item value table in which the item values of the records are stored in the order in which the records are arranged And a table format saving function 21c that saves the input original data as items of a table format including a plurality of items in one record for items that are not used as data processing keys. It is.

DB22は、キーとなる項目についてコンパイルして保存されたFAST構造データ22aと、キーとならない項目についてコンパイルせずに保存された表形式データ22bとが格納されている。   The DB 22 stores FAST structure data 22a that is compiled and saved for items that are keys, and tabular data 22b that is saved without being compiled for items that are not keys.

なお、図1には、作業管理システムが単独のコンピュータにより構成される例を示したが、このコンピュータをサーバとしてネットワークを介して複数の端末を接続し、各端末から入力、閲覧ができるようにしてもよい。   FIG. 1 shows an example in which the work management system is configured by a single computer, but a plurality of terminals are connected via a network using this computer as a server so that input and browsing can be performed from each terminal. May be.

次に、上記のシステム1において実行されるデータ管理処理の内容を、図2に示すフローチャートに基づいて説明する。図2のフローチャートは、入力されたテキストデータを所定の形式で保存した後、入力されたコマンドに従ってデータを処理する手順を示している。処理が開始すると、CPU11は、ステップS001においてテキストデータの入力を受け付ける。テキストデータは、CSV形式、あいるはタブ区切りのテキスト等の表形式のデータであり、外部のリレーショナルデータベースから出力され、あるいは、ユーザにより入力される。   Next, the contents of the data management process executed in the system 1 will be described based on the flowchart shown in FIG. The flowchart of FIG. 2 shows a procedure for processing the data according to the input command after storing the input text data in a predetermined format. When the process starts, the CPU 11 accepts input of text data in step S001. Text data is CSV format or tabular data such as tab-delimited text and is output from an external relational database or input by a user.

入力時には、例えば図3に示すような選択画面がディスプレイ30上に表示される。ユーザは、この画面上でテキストファイルを選択し、キーとする項目名をチェックボックスを使ってチェックする。例えば、この例では、master.txtというテキストファイルが入力ファイルとして選択されている。このファイルの内容は、図4に示されている。項目としてID,名称、性別が含まれている。図3の選択画面では、その中の項目「性別」がキーとして利用する項目として指定されている。   At the time of input, a selection screen as shown in FIG. 3 is displayed on the display 30, for example. The user selects a text file on this screen and checks the item name as a key using a check box. For example, in this example, a text file called master.txt is selected as the input file. The contents of this file are shown in FIG. Items include ID, name, and gender. In the selection screen of FIG. 3, the item “sex” is designated as an item to be used as a key.

ステップS001でテキストデータが入力されると、CPU11は、ステップS002において、テキストデータの構造から各項目を識別し、項目毎にキーとして利用される項目か否かを判断する。キーとして利用する項目については、ステップS003でFAST構造へコンパイルされ、キーとして利用しない項目については、ステップS004で表形式の中継データ項目の配列に追加される。ステップS005で他の項目があると判断される間は、ステップS002〜S004の処理を繰り返し、全ての項目の処理が終了すると、ステップS006に処理が進められる。   When text data is input in step S001, the CPU 11 identifies each item from the structure of the text data in step S002, and determines whether the item is used as a key for each item. Items used as keys are compiled into a FAST structure in step S003, and items not used as keys are added to the table-format relay data item array in step S004. While it is determined in step S005 that there are other items, the processes in steps S002 to S004 are repeated. When the processes for all the items are completed, the process proceeds to step S006.

処理されたテキストデータは、図5に示すような形式で保存される。すなわち、キーとして利用する項目「性別」については、FAST構造にコンパイルされ、図5(A)に示すように、ユニークな項目値をソートした配列である項目値テーブルValueListと、レコードの配列順OrderSetと、当該レコードの項目値が格納されている項目値テーブル内の位置を記録した配列であるインデックス値テーブルValueNoとに分解して保存される。   The processed text data is stored in a format as shown in FIG. That is, the item “gender” used as a key is compiled into a FAST structure, and as shown in FIG. 5A, an item value table ValueList which is an array in which unique item values are sorted, and the order of records in the order set And an index value table ValueNo that is an array in which the position in the item value table in which the item value of the record is stored is recorded and saved.

一方、キーとして利用されない項目「ID」、「名称」は、コンパイルされず、図5(B)に示すような1つのレコードに複数の項目値を含む表形式の中継データ項目として保存される。ただし、レコードの位置を示すインデックス値テーブルValueListは生成される。   On the other hand, items “ID” and “name” that are not used as keys are not compiled, but are stored as relay data items in a table format including a plurality of item values in one record as shown in FIG. However, an index value table ValueList indicating the position of the record is generated.

次に、ステップS006でコマンドが入力されると、CPU11はステップS007〜S009でコマンドの種類に応じて項目をチェックする。すなわち、コマンドがコンパイルされた項目を対象とするものである場合には、対象となる項目が全てコンパイル済みか否かを判断し、1つでもコンパイル済みでない項目があると異常終了する。全ての対象項目がコンパイル済みである場合、あるいは、コマンドの対象がコンパイルされた項目を対象としない場合に、ステップS010でコマンドを実行する。コマンドが複数ある場合には、ステップS011からステップS007に戻って全てのコマンドについて上記のS007〜S010の処理を繰り返し実行する。   Next, when a command is input in step S006, the CPU 11 checks items according to the type of command in steps S007 to S009. That is, if the command is for a compiled item, it is determined whether all the items to be compiled have been compiled. If there is even one item that has not been compiled, the command terminates abnormally. If all the target items have been compiled, or if the target of the command does not target the compiled item, the command is executed in step S010. When there are a plurality of commands, the process returns from step S011 to step S007, and the processes of S007 to S010 are repeatedly executed for all commands.

全てのコマンドの実行が終了すると、CPU11はステップS012で処理結果としてテキストデータを出力する。ここでは、コンパイル済みの項目については、テキスト形式の文字列に変換し、表形式の中継データ項目と結合して1行ずつ出力する。全ての行の出力が終了すると、処理を終了する。   When the execution of all the commands is completed, the CPU 11 outputs text data as a processing result in step S012. Here, the compiled items are converted into text format character strings, combined with the tabular relay data items, and output line by line. When all the lines have been output, the process ends.

例えば、コマンドとして先に登録された図5に示すデータを性別順にソートして出力するよう入力した場合、出力のオプションを選択するために図6に示すような選択画面がディスプレイ30に表示される。ここでは、出力ファイル名をmaster_new.txtと指定し、タブ区切りのデータとして、キーでない項目も出力するよう選択している。   For example, when the data shown in FIG. 5 previously registered as a command is input to be sorted and output in the order of gender, a selection screen as shown in FIG. 6 is displayed on the display 30 in order to select an output option. . Here, the output file name is specified as master_new.txt, and items that are not keys are output as tab-delimited data.

性別によるソートを指定しているため、ステップS007ではコンパイル対象のコマンドであると判断され、ステップS008でこの項目がコンパイル済みであることが確認され、他の処理対象はないためステップS009をNoで抜けてステップS010で性別によるソートが実行される。ソートの結果は図7に示すとおりである。すなわち、項目「性別」については、図7(A)に示すように、インデックス値テーブルValueNoの値が昇順となるように、レコードの配列順OrderSetが並べ替えられる。ここではOderSetの「2」と「3」とが入れ替えられている。キーとして利用されない項目は、操作されず、図7(B)に示した状態で保存されている。   Since sorting by gender is specified, it is determined in step S007 that it is a command to be compiled. In step S008, it is confirmed that this item has been compiled. Since there is no other processing target, step S009 is set to No. In step S010, sorting by gender is executed. The result of sorting is as shown in FIG. That is, for the item “gender”, as shown in FIG. 7A, the array order OrderSet is rearranged so that the values in the index value table ValueNo are in ascending order. Here, “2” and “3” of OderSet are interchanged. Items that are not used as keys are not operated and are stored in the state shown in FIG.

他のコマンドがなくステップS011をNoで抜けると、ステップS012でソートされた結果が1行ずつ出力される。このとき、図7(A)に示されるコンパイルされた項目「性別」は、コンパイル前の文字列に変換されて図7(B)に示される中継データ項目と結合されて出力される。図8は、出力フィルの内容を示す。この図に示されるように、ID、名称、性別の各項目を含むレコードが性別順にソートされて出力される。   If there is no other command and step S011 is skipped with No, the results sorted in step S012 are output line by line. At this time, the compiled item “gender” shown in FIG. 7A is converted into a pre-compiled character string, combined with the relay data item shown in FIG. 7B, and output. FIG. 8 shows the contents of the output fill. As shown in this figure, records including ID, name, and gender items are sorted and output in the order of gender.

なお、上記の実施形態では、キー項目とならない項目については、FAST構造にコンパイルせずに、入力されたテキストデータと同様の表形式で保存している。ただし、これをさらにFAST構造にコンパイルすることも可能である。すなわち、表形式で保存されたデータについて、表形式で保存された全項目を1つの項目と見立て、ユニークな項目値をソートした配列である項目値テーブルと、レコードの配列順に当該レコードの項目値が格納されている項目値テーブル内の位置を記録した配列であるインデックス値テーブルとに分解して保存してもよい。   In the above embodiment, items that are not key items are stored in the same table format as the input text data without being compiled into the FAST structure. However, it can be further compiled into a FAST structure. That is, for data saved in tabular format, all items saved in tabular format are regarded as one item, an item value table that is an array in which unique item values are sorted, and the item value of the record in the order in which the records are arranged May be decomposed into an index value table that is an array in which positions in the item value table in which are stored are recorded.

図9は、中継項目についてもコンパイルする場合の入力時の選択画面の例である。図3で示した選択画面に加え、「中継項目もコンパイルする」のチェックボックスが加えられている。ここで、図10に示すようなテキストデータが入力された場合を例に説明する。図4に示したデータと比較すると、ID「0001」の名称「山田太郎」のレコード(行)が4行になっている。   FIG. 9 is an example of a selection screen at the time of input when compiling relay items. In addition to the selection screen shown in FIG. 3, a check box “Compile relay items” is also added. Here, a case where text data as shown in FIG. 10 is input will be described as an example. Compared with the data shown in FIG. 4, the record (row) of the name “Taro Yamada” with ID “0001” has four rows.

このテキストデータを入力し、上記の実施形態と同様性別をキー項目としてコンパイルすると、図11(A)に示すようなテーブルとなる。中継項目にはIDと名称とが含まれるが、これをさらにFAST構造にコンパイルする。   When this text data is input and compiled using gender as a key item as in the above embodiment, a table as shown in FIG. 11A is obtained. The relay item includes an ID and a name, which are further compiled into a FAST structure.

すなわち、中継項目に含まれる全項目を1つの項目と見立て、ユニークな項目値をソートする。この例では、IDと名称との2つの項目を1つの項目と見立て、これらの値が共に一致するレコードは、同一と判断して項目値テーブルでは1つのレコードとする。すなわち、図11(B)に示されるように、「0001 山田 太郎」という項目値を持つ4つのレコードは、1つのレコードにまとめられる。   That is, all items included in the relay items are regarded as one item, and unique item values are sorted. In this example, two items of ID and name are regarded as one item, and records whose values match each other are determined to be the same and are regarded as one record in the item value table. That is, as shown in FIG. 11B, four records having the item value “0001 Taro Yamada” are combined into one record.

この変形例のように中継項目も圧縮(FAST構造へのコンパイル)した場合には、中継項目をコンパイルしない実施形態の方法よりコンパイルのための時間はかかるが、複数の項目について一回のみコンパイルすればよいため、全ての項目について1つずつコンパイルする場合と比較すれば時間を短縮でき、しかも、コンパイル後はデータ量が圧縮されるため、ハードディスクやメモリの消費量を削減することができる。   When relay items are also compressed (compiled to FAST structure) as in this modification, it takes more time to compile than the method of the embodiment in which relay items are not compiled, but a plurality of items are compiled only once. Therefore, the time can be shortened as compared with the case where all items are compiled one by one, and the amount of data is compressed after the compilation, so that the consumption of the hard disk and the memory can be reduced.

本発明の実施形態に係るデータ管理装置を含むコンピュータシステムを示すブロック図である。1 is a block diagram showing a computer system including a data management apparatus according to an embodiment of the present invention. 図1のデータ管理装置による処理の内容を示すフローチャートである。It is a flowchart which shows the content of the process by the data management apparatus of FIG. 図1のデータ管理装置のファイル入力時の選択画面を示す説明図である。It is explanatory drawing which shows the selection screen at the time of the file input of the data management apparatus of FIG. 図1のデータ管理装置に入力されるテキストファイルの内容を示す説明図である。It is explanatory drawing which shows the content of the text file input into the data management apparatus of FIG. 図1のデータ管理装置により保存されたデータの構造を示す説明図である。It is explanatory drawing which shows the structure of the data preserve | saved by the data management apparatus of FIG. 図1のデータ管理装置のファイル出力時の選択画面を示す説明図である。It is explanatory drawing which shows the selection screen at the time of the file output of the data management apparatus of FIG. 図1のデータ管理装置により操作されたデータの構造を示す説明図である。It is explanatory drawing which shows the structure of the data operated by the data management apparatus of FIG. 図1のデータ管理装置から出力されるテキストファイルの内容を示す説明図である。It is explanatory drawing which shows the content of the text file output from the data management apparatus of FIG. 本発明の実施形態の変形例におけるデータ管理装置のファイル入力時の選択画面を示す説明図である。It is explanatory drawing which shows the selection screen at the time of the file input of the data management apparatus in the modification of embodiment of this invention. 本発明の実施形態の変形例におけるデータ管理装置に入力されるテキストファイルの内容を示す説明図である。It is explanatory drawing which shows the content of the text file input into the data management apparatus in the modification of embodiment of this invention. 本発明の実施形態の変形例におけるデータ管理装置により保存されたデータの構造を示す説明図である。It is explanatory drawing which shows the structure of the data preserve | saved by the data management apparatus in the modification of embodiment of this invention.

符号の説明Explanation of symbols

1 システム
10 コンピュータ
11 CPU
12 RAM
13 インターフェイス
20 HD
21 データ管理プログラム
21a 入力受付機能
21b コンパイル機能
21c 表形式保存機能
22 DB
22a FAST構造データ
22b 表形式データ
30 ディスプレイ
31 キーボード
1 System 10 Computer 11 CPU
12 RAM
13 Interface 20 HD
21 Data management program 21a Input reception function 21b Compile function 21c Tabular format storage function 22 DB
22a FAST structure data 22b tabular data 30 display 31 keyboard

Claims (3)

コンピュータが、
複数の項目についてそれぞれ項目値を持つレコードを複数含む表形式の元データの入力を受け付ける入力受付手順、
入力された元データについて、データ処理のキーとして使用する項目については、ユニークな項目値をソートした配列である項目値テーブルと、レコードの配列順に当該レコードの項目値が格納されている前記項目値テーブル内の位置を記録した配列であるインデックス値テーブルとに分解して保存するコンパイル手順、
入力された元データについて、データ処理のキーとして使用しない項目については、1レコードに複数の項目を含む表形式のデータとして保存する表形式保存手順、及び
前記表形式保存手順において保存されたデータについて、表形式で保存された全項目を1つの項目と見立て、ユニークな項目値をソートした配列である項目値テーブルと、レコードの配列順に当該レコードの項目値が格納されている前記項目値テーブル内の位置を記録した配列であるインデックス値テーブルとに分解して保存する第2のコンパイル手順
を実行することを特徴とするデータ管理方法。
Computer
An input acceptance procedure for accepting input of original data in a tabular format including multiple records each having an item value for multiple items,
For items used as data processing keys for the input original data, an item value table that is an array in which unique item values are sorted, and the item value in which the item values of the record are stored in the order in which the records are arranged Compile procedure to decompose and save the index value table which is an array that records the position in the table,
For items that are not used as data processing keys for the input original data, a table format storage procedure for storing data as a table format including a plurality of items in one record, and
Regarding the data saved in the table format saving procedure, all items saved in the table format are regarded as one item, an item value table that is an array in which unique item values are sorted, and the items of the record in the order in which the records are arranged. A data management method comprising: executing a second compile procedure that decomposes and stores an index value table that is an array that records positions in the item value table in which values are stored .
コンピュータを、
複数の項目についてそれぞれ項目値を持つレコードを複数含む表形式の元データの入力を受け付ける入力受付手段、
入力された元データについて、データ処理のキーとして使用する項目については、ユニークな項目値をソートした配列である項目値テーブルと、レコードの配列順に当該レコードの項目値が格納されている前記項目値テーブル内の位置を記録した配列であるインデックス値テーブルとに分解して保存するコンパイル手段、
入力された元データについて、データ処理のキーとして使用しない項目については、1レコードに複数の項目を含む表形式のデータとして保存する表形式保存手段、及び
前記表形式保存手段により保存されたデータについて、表形式で保存された全項目を1つの項目と見立て、ユニークな項目値をソートした配列である項目値テーブルと、レコードの配列順に当該レコードの項目値が格納されている前記項目値テーブル内の位置を記録した配列であるインデックス値テーブルとに分解して保存する第2のコンパイル手段
として機能させることを特徴とするデータ管理プログラム。
Computer
Input accepting means for accepting input of original data in a table format including a plurality of records each having an item value for a plurality of items;
For items used as data processing keys for the input original data, an item value table that is an array in which unique item values are sorted, and the item value in which the item values of the record are stored in the order in which the records are arranged A compiling means for disassembling and saving an index value table that is an array in which positions in the table are recorded;
With respect to items that are not used as data processing keys for the input original data, table format storage means for storing the data as tabular data including a plurality of items in one record, and
For the data saved by the tabular format saving means, all items saved in the tabular format are regarded as one item, an item value table that is an array in which unique item values are sorted, and the items of the record in the order in which the records are arranged A data management program that functions as a second compiling unit that decomposes and stores an index value table that is an array in which positions in the item value table in which values are stored are recorded .
複数の項目についてそれぞれ項目値を持つレコードを複数含む表形式の元データの入力を受け付ける入力受付手段と、
入力された元データについて、データ処理のキーとして使用する項目については、ユニークな項目値をソートした配列である項目値テーブルと、レコードの配列順に当該レコードの項目値が格納されている前記項目値テーブル内の位置を記録した配列であるインデックス値テーブルとに分解して保存するコンパイル手段と、
入力された元データについて、データ処理のキーとして使用しない項目については、1レコードに複数の項目を含む表形式のデータとして保存する表形式保存手段と、
前記表形式保存手段により保存されたデータについて、表形式で保存された全項目を1つの項目と見立て、ユニークな項目値をソートした配列である項目値テーブルと、レコードの配列順に当該レコードの項目値が格納されている前記項目値テーブル内の位置を記録した配列であるインデックス値テーブルとに分解して保存する第2のコンパイル手段と
を備えることを特徴とするデータ管理装置。
An input receiving means for receiving input of original data in a tabular format including a plurality of records each having an item value for a plurality of items;
For items used as data processing keys for the input original data, an item value table that is an array in which unique item values are sorted, and the item value in which the item values of the record are stored in the order in which the records are arranged A compiling means for disassembling and storing an index value table that is an array in which positions in the table are recorded;
With respect to items that are not used as data processing keys for the input original data, a table format storage unit that stores data as a table format including a plurality of items in one record;
For the data saved by the tabular format saving means, all items saved in the tabular format are regarded as one item, an item value table that is an array in which unique item values are sorted, and the items of the record in the order in which the records are arranged A data management apparatus comprising: a second compiling unit that decomposes and stores an index value table that is an array in which positions in the item value table in which values are stored are recorded .
JP2007091712A 2007-03-30 2007-03-30 Data management method, program and apparatus Expired - Fee Related JP5010958B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007091712A JP5010958B2 (en) 2007-03-30 2007-03-30 Data management method, program and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007091712A JP5010958B2 (en) 2007-03-30 2007-03-30 Data management method, program and apparatus

Publications (2)

Publication Number Publication Date
JP2008250727A JP2008250727A (en) 2008-10-16
JP5010958B2 true JP5010958B2 (en) 2012-08-29

Family

ID=39975583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007091712A Expired - Fee Related JP5010958B2 (en) 2007-03-30 2007-03-30 Data management method, program and apparatus

Country Status (1)

Country Link
JP (1) JP5010958B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5499825B2 (en) * 2010-03-29 2014-05-21 日本電気株式会社 Database management method, database system, program, and database data structure
JP6295754B2 (en) * 2014-03-19 2018-03-20 日本電気株式会社 Data processing device
JP6828334B2 (en) * 2016-09-13 2021-02-10 日本電気株式会社 Database management device, database management system, database management method, and database management program
JP6863006B2 (en) * 2017-03-30 2021-04-21 富士通株式会社 File generator, file generator and file generator

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63298626A (en) * 1987-05-29 1988-12-06 Matsushita Electric Ind Co Ltd Managing method for data base
JP4563558B2 (en) * 2000-07-31 2010-10-13 株式会社ターボデータラボラトリー Data compiling method and storage medium storing compiling method

Also Published As

Publication number Publication date
JP2008250727A (en) 2008-10-16

Similar Documents

Publication Publication Date Title
CN108491326B (en) Test behavior a recombination process apparatus and storage medium
WO2009146558A1 (en) System and method for building a data warehouse
CN107330014B (en) Data table creating method and device
CN107590254B (en) Big data support platform with merging processing method
JP5010958B2 (en) Data management method, program and apparatus
US8473504B2 (en) Stabilized binary differencing
US10324933B2 (en) Technique for processing query in database management system
CN110716739A (en) Code change information statistical method, system and readable storage medium
CN113344218A (en) Deployment method and device of machine learning model, electronic equipment and storage medium
KR101104739B1 (en) Semantic tagging server for supporting reuse of software artifacts, and methods thereof
US8775873B2 (en) Data processing apparatus that performs test validation and computer-readable storage medium
CN110838338A (en) System, method, storage medium, and electronic device for creating biological analysis item
US11327994B2 (en) Arranging converted operation history information
US8209359B2 (en) Generating BPEL control flows
US11645125B2 (en) Method and apparatus for executing workflow including functions written in heterogeneous programing language
JP6802109B2 (en) Software specification analyzer and software specification analysis method
JP2008250546A (en) Data search method, program and apparatus
WO2006090505A1 (en) Vehicle quality analysis system and method for managing a plurality of data
US20190050384A1 (en) Techniques for dynamically defining a data record format
US8983903B2 (en) Data processing system
US11853969B2 (en) Managing artifact information, especially comparing and merging artifact information, method and system
JP5619930B2 (en) Dialog script operation command execution device, dialog script operation command execution method, and program
JP5359446B2 (en) Information processing system, access path determination method, and access path determination program
WO2021229785A1 (en) Manufacturing system design verification device
WO2006090504A1 (en) Vehicle quality analysis system and program file management method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100129

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100129

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120508

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120604

R150 Certificate of patent or registration of utility model

Ref document number: 5010958

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees