JP7513086B2

JP7513086B2 - 統合装置、データテーブル統合方法、プログラム

Info

Publication number: JP7513086B2
Application number: JP2022522413A
Authority: JP
Inventors: 晴道横山
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2020-05-13
Filing date: 2020-05-13
Publication date: 2024-07-09
Anticipated expiration: 2040-05-13
Also published as: US12086124B2; JPWO2021229724A1; US20230195711A1; WO2021229724A1

Description

本発明は、統合装置、データテーブル統合方法、プログラムに関する。

少なくとも大小比較のできるデータ要素を一つの行の情報として含む２つのデータテーブルを統合して新たなデータテーブルを生成する技術が存在する。

関連する技術が特許文献１に開示されている。特許文献１には、アウタジョイン（外結合）処理を行って、新たな出力テーブルを生成する技術が開示されている。

特開平０３－２８８９６７号公報

上述した統合データテーブルの生成において、処理量を軽減できる技術が求められていた。

そこでこの発明は、上述課題を解決する統合装置、データテーブル統合方法、プログラムを提供することを目的としている。

本発明の第１の態様によれば、統合装置は、少なくとも大小比較のできるデータ要素を一つの行の情報として含む２つのデータテーブルのうちの第一データテーブルのデータ要素それぞれがユニークであるかを判定するユニーク判定手段と、前記第一データテーブルのデータ要素それぞれがユニークである場合には、前記２つのデータテーブルのうちの第二データテーブルの各行のデータ要素と前記第一データテーブルの各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行って、前記昇順ソートに適合するように前記第二データテーブルの行を前記昇順ソート後の前記第一データテーブルの最下行に加えることのできる下限位置を特定する位置特定手段と、前記第二データテーブルの行のデータ要素と、当該行のデータ要素を用いて特定した前記昇順ソート後の前記第一データテーブルにおける前記下限位置の前記昇順ソートにおける次の行のデータ要素とが一致する場合に、それらデータ要素を示す統合対象行を、前記第二データテーブルと前記第一データテーブルとにおいて特定し、少なくともそれら前記第二データテーブルと前記第一データテーブルとの前記統合対象行を統合した統合データテーブルを生成する統合手段と、を備える。

本発明の第２の態様によれば、データテーブル統合方法は、少なくとも大小比較のできるデータ要素を一つの行の情報として含む２つのデータテーブルのうちの第一データテーブルのデータ要素それぞれがユニークであるかを判定し、前記第一データテーブルのデータ要素の配列において当該データ要素それぞれがユニークである場合には、前記２つのデータテーブルのうちの第二データテーブルの各行のデータ要素と前記第一データテーブルの各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行って、前記第二データテーブルの各行のデータ要素についての前記昇順ソート後の前記第一データテーブルの各行のデータ要素の配列における下限位置を特定し、前記第二データテーブルの行のデータ要素と、当該行のデータ要素を用いて特定した前記下限位置であって前記昇順ソート後の前記第一データテーブルの配列における前記下限位置を持つ行のデータ要素とが一致する統合対象行を、前記第二データテーブルと前記第一データテーブルとにおいて特定し、少なくともそれら前記第二データテーブルと前記第一データテーブルとの前記統合対象行を統合した統合データテーブルを生成する。

本発明の第３の態様によれば、プログラムは、統合装置のコンピュータを、少なくとも大小比較のできるデータ要素を一つの行の情報として含む２つのデータテーブルのうちの第一データテーブルのデータ要素それぞれがユニークであるかを判定するユニーク判定手段、前記第一データテーブルのデータ要素の配列において当該データ要素それぞれがユニークである場合には、前記２つのデータテーブルのうちの第二データテーブルの各行のデータ要素と前記第一データテーブルの各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行って、前記第二データテーブルの各行のデータ要素についての前記昇順ソート後の前記第一データテーブルの各行のデータ要素の配列における下限位置を特定する位置特定手段、前記第二データテーブルの行のデータ要素と、当該行のデータ要素を用いて特定した前記下限位置であって前記昇順ソート後の前記第一データテーブルの配列における前記下限位置を持つ行のデータ要素とが一致する統合対象行を、前記第二データテーブルと前記第一データテーブルとにおいて特定し、少なくともそれら前記第二データテーブルと前記第一データテーブルとの前記統合対象行を統合した統合データテーブルを生成する統合手段、として機能させる。

本発明によれば、統合データテーブルの生成において、処理量を軽減することができる。

本実施形態による統合装置を備えた情報処理システムの構成を示す図である。本実施形態による統合装置のハードウェア構成を示す図である。本実施形態による統合装置の機能ブロック図である。本実施形態による統合データテーブルの生成例を示す図である。本実施形態による統合対象の２つのデータテーブルの例を示す第一の図である。本実施形態による統合装置の処理フローを示す図である。本実施形態による統合装置の処理概要を示す第一の図である。本実施形態による統合対象の２つのデータテーブルの例を示す第二の図である。本実施形態による統合装置の処理概要を示す第二の図である。本実施形態による統合装置の最小構成を示す図である。本実施形態による最小構成による統合装置の処理フローを示す図である。

以下、本発明の一実施形態による統合装置を図面を参照して説明する。
図１は同実施形態による統合装置を備えた情報処理システムの構成を示す図である。
図１が示すように、情報処理システム１００は、統合装置１と端末２とを通信ネットワークにより接続して構成されてよい。統合装置１は、あらかじめ自装置などで記憶する少なくとも２つのデータテーブルを、１つのデータテーブルへと統合した統合データテーブルを生成する。端末２は統合装置１を操作するユーザが利用する。統合装置１と端末２とはそれぞれコンピュータである。

図２は統合装置のハードウェア構成を示す図である。
図２で示すように、統合装置１は、ＣＰＵ（Central Processing Unit）１０１、ＲＯＭ（Read Only Memory）１０２、ＲＡＭ（Random Access Memory）１０３、データベース１０４、通信モジュール１０５等の各ハードウェアを備えたコンピュータである。なお、端末２も、同様のハードウェアを備えたコンピュータである。

図３は統合装置の機能ブロック図である。
統合装置１は、統合データテーブル生成プログラムを実行する。これにより統合装置１は、制御部１１、ソート部１２、ユニーク判定部１３、位置特定部１４、統合部１５の各機能を発揮する。

制御部１１は、統合装置１の各機能部を制御する。
ソート部１２は、少なくとも大小比較のできるデータ要素を一つの行の情報として含むデータテーブルの各行を、当該行に含まれるデータ要素に基づいてソートする。

ユニーク判定部１３は、少なくとも大小比較のできるデータ要素を一つの行の情報として含む２つのデータテーブルのうちの第一データテーブルのデータ要素それぞれがユニークであるかを判定する。

位置特定部１４は、第一データテーブルのデータ要素それぞれがユニークである場合には、２つのデータテーブルのうちの第二データテーブルの各行のデータ要素と第一データテーブルの各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行う。位置特定部１４は、その大小比較を行って、昇順ソートに適合するように第二データテーブルの行を昇順ソート後の第一データテーブルの最下行に加えることのできる下限位置を特定する。

統合部１５は、第二データテーブルの行のデータ要素と、当該行のデータ要素を用いて特定した昇順ソート後の第一データテーブルにおける下限位置の昇順ソートにおける次の行のデータ要素とが一致する場合に、それらデータ要素を示す統合対象行を、第二データテーブルと第一データテーブルとにおいて特定する。統合部１５は、少なくともそれら第二データテーブルと第一データテーブルとの統合対象行を統合した統合データテーブルを生成する。

図４は統合データテーブルの生成例を示す図である。
図４で示す統合データテーブルの生成例では、購入履歴テーブル４１と、購入者テーブル４２の２つのデータテーブルを統合した統合データテーブル４３を生成する例を示している。購入履歴テーブル４１と、購入者テーブル４２の２つのデータテーブルは、それぞれ大小比較のできるデータ要素として購入者ＩＤを、各行のデータ要素として含んでいる。なお、購入履歴テーブル４１は２つのデータテーブルのうちの第一データテーブル、購入者テーブル４２を２つのデータテーブルのうちの第二データテーブルと見做すことができる。購入者テーブル４２を２つのデータテーブルのうちの第一データテーブル、購入履歴テーブル４１を２つのデータテーブルのうちの第二データテーブルと見做してもよい。

購入履歴テーブル４１は、購入者ＩＤ、その購入者ＩＤが示す購入者の購入した商品の名称（商品名）、商品の価格、購入日を示す日付、を紐づけたデータテーブルである。購入者テーブル４２は、購入者ＩＤ、その購入者ＩＤの購入者の名前、年齢、を紐づけたデータテーブルである。購入者ＩＤに基づいて、それら二つのデータテーブルを統合することにより、購入者ＩＤ、商品名、価格、日付、名前、年齢を紐づけた、統合データテーブル４３を生成することができる。ここで、統合データテーブル４３には、購入者テーブル４２に含まれる購入者ＩＤ；２、名前；ハナコ、年齢；４５を含む行が統合されていない。これは、購入履歴テーブル４１において、購入者ＩＤ；２、名前；ハナコ、年齢；４５で示される人物の購入履歴がない為である。以下、このような統合データテーブルの生成について順を追って説明する。なお統合データテーブルには、購入者ＩＤ；２、名前；ハナコ、年齢；４５で示される人物の情報を統合してもよい。この場合、当該人物の情報としての商品名、価格、日付の欄に情報が含まれない（ＮＵＬＬ）状態となる場合がある。

図５は統合対象の２つのデータテーブルの例を示す第一の図である。
本実施形態による統合対象の２つのデータテーブルである、右テーブル５１（第一データテーブル）と左テーブル５２（第二データテーブル）とを図５に示す。右テーブル５１と左テーブル５２のそれぞれは、行ＩＤとキーとを紐づけた行を複数行有している。本実施形態において、右テーブル５１と、左テーブル５２の２つのデータテーブルは、それぞれ大小比較のできるデータ要素となるキーを、各行のデータ要素として含んでいる。

図６は統合装置の処理フローを示す図である。
図７は統合装置の処理概要を示す第一の図である。
ユーザは端末２を操作して統合装置１にアクセスする。そしてユーザは端末２を操作して、統合装置１に統合対象となる２つのデータテーブルの指定と、それらデータテーブルにおいて大小比較のできるデータ要素の指定と、統合開始の指示を与える。これにより、統合装置１は２つのデータテーブルの統合処理を開始する（ステップＳ１０１）。２つのデータテーブルは、図５で示した右テーブル５１（第一データテーブル）と、左テーブル５２（第二データテーブル）であるとする。なお２つのデータテーブルにおいて大小比較のできるデータ要素の種類は同じであるとする。図６においてはキーが大小比較のできるデータ要素である。２つのデータテーブルにおけるキーの情報は、同じ種類の情報である。

統合装置１の制御部１０は統合開始の指示を受け付けると、ソート部１２に対して、大小比較のできるデータ要素の昇順ソートを指示する。ソート部１２は、右テーブルと左テーブルのそれぞれの各行を、キーを用いて昇順にソートする（ステップＳ１０２）。これによりソート部１２は、図７（１）で示すように、右テーブル５１の各行のキーが、上から順に「１」、「２」、「３」、「６」となるよう右テーブル５１の各行を昇順に並び替える。またソート部１２は、図７（１）で示すように、左テーブル５２の各行のキーが、上から順に「１」、「３」、「３」、「５」となるよう左テーブル５２を並び替える。

ソートが完了すると制御部１０は、ユニーク判定部１３に処理を指示する。ユニーク判定部１３は、右テーブル５１の各行の大小比較のできるデータ要素としてのキーがそれぞれユニークかを判定する（ステップＳ１０３）。ユニーク判定部１３は、判定結果を制御部１０へ出力する。制御部１０は、右テーブル５１の各行の大小比較のできるデータ要素としてのキーがそれぞれユニークである場合、そのまま右テーブル５１を第一データテーブル、左テーブル５２を第二データテーブルと定義して、処理負荷軽減手法による以下のデータテーブルの統合処理を開始する。

ユニーク判定部１３は、右テーブル５１の各行の大小比較のできるデータ要素としてのキーがそれぞれユニークでない場合、次に左テーブル５２の各行の大小比較のできるデータ要素としてのキーがそれぞれユニークかを判定する（ステップＳ１０４）。ユニーク判定部１３は、判定結果を制御部１０へ出力する。制御部１０は、右テーブル５１の各行の大小比較のできるデータ要素としてのキーがそれぞれユニークである場合、右テーブル５１と左テーブル５２の第一データテーブルと第二データテーブルの定義を逆に入れ替えて、左テーブル５２を第一データテーブル、右テーブル５１を第二データテーブルと定義し、処理負荷軽減手法による以下のデータテーブルの統合処理を開始する。今、左テーブル５２の各行の大小比較のできるデータ要素としてのキーがそれぞれユニークでない。つまり、左テーブル５２においてキー「３」を有する行が２行ある。従って、右テーブル５１を第一データテーブル、左テーブル５２を第二データテーブルと定義して、処理負荷軽減手法による以下のデータテーブルの統合処理を開始する場合の説明を続ける。

なお、ユニーク判定部１３は、右テーブル５１の各行の大小比較のできるデータ要素としてのキーがそれぞれユニークでなく、左テーブル５２の各行の大小比較のできるデータ要素としてのキーもそれぞれユニークでない場合、その判定結果を制御部１０へ出力する。制御部１０は、いずれのデータテーブルも各行の大小比較のできるデータ要素としてのキーがそれぞれユニークでない場合、処理負荷を軽減することができないデータテーブルの統合処理へ切り替えると判定する（ステップＳ１０５）。

なお上述の処理においては、ソート部１２が、右テーブル５１と左テーブル５２の両方のデータテーブルにおいて、各行の大小比較のできるデータ要素としてのキーを昇順にソートしているが、少なくとも、大小比較のできるデータ要素としてのキーがそれぞれユニークとなるデータテーブルを、ソートすればよい。

制御部１０は、処理負荷軽減手法によるデータテーブルの統合処理を開始した場合、その処理負荷軽減手法によるデータテーブルの統合処理を位置特定部１４へ出力する。位置特定部１４は、ｎ＝１と設定し、左テーブル５２のｎ＝１行目を特定する。左テーブル５２の１（ｎ＝１）行目は行ＩＤ＝Ｌ３の行である。位置特定部１４は、Ｌ３行のキー「１」を取得する。位置特定部１４は、左テーブル５２のＬ３の行のデータ要素であるキー「１」と、右テーブル５１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル５２のＬ３行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置を特定する。ここで、図７の（１）で示すように、右テーブル５１において各行の間をそれぞれ境界位置Ｂ０～Ｂ４と呼ぶこととする。左テーブル５２のＬ３の行のデータ要素であるキー「１」と、右テーブル５１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル５２のＬ３行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置は、境界位置Ｂ０となる。つまりこの場合、下限位置はＢ０である。

同様に位置特定部１４は、ｎ＝ｎ＋１によりｎ＝２と設定し、左テーブル５２のｎ＝２行目を特定する。左テーブル５２の２（ｎ＝２）行目は行ＩＤ＝Ｌ０の行である。位置特定部１４は、Ｌ０行のキー「３」を取得する。位置特定部１４は、左テーブル５２のＬ０の行のデータ要素であるキー「３」と、右テーブル５１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル５２のＬ０行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置を特定する。左テーブル５２のＬ０の行のデータ要素であるキー「３」と、右テーブル５１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル５２のＬ０行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置は、境界位置Ｂ２となる。つまりこの場合、下限位置はＢ２である。

同様に位置特定部１４は、ｎ＝ｎ＋１によりｎ＝３と設定し、左テーブル５２のｎ＝３行目を特定する。左テーブル５２の３（ｎ＝３）行目は行ＩＤ＝Ｌ２の行である。位置特定部１４は、Ｌ２行のキー「３」を取得する。位置特定部１４は、左テーブル５２のＬ２の行のデータ要素であるキー「３」と、右テーブル５１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル５２のＬ２行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置を特定する。左テーブル５２のＬ２の行のデータ要素であるキー「３」と、右テーブル５１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル５２のＬ２行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置は、境界位置Ｂ２となる。つまりこの場合、下限位置はＢ２である。

同様に位置特定部１４は、ｎ＝ｎ＋１によりｎ＝４と設定し、左テーブル５２のｎ＝４行目を特定する。左テーブル５２の４（ｎ＝４）行目は行ＩＤ＝Ｌ１の行である。位置特定部１４は、Ｌ１行のキー「５」を取得する。位置特定部１４は、左テーブル５２のＬ１の行のデータ要素であるキー「５」と、右テーブル５１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル５２のＬ１行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置を特定する。左テーブル５２のＬ１の行のデータ要素であるキー「５」と、右テーブル５１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル５２のＬ１行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置は、境界位置Ｂ３となる。つまりこの場合、下限位置はＢ３である。

これにより位置特定部１４は、左テーブル５２のＬ３行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置をＢ０と特定する。また位置特定部１４は、左テーブル５２のＬ０行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置をＢ２と特定する。また位置特定部１４は、左テーブル５２のＬ２行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置をＢ２と特定する。また位置特定部１４は、左テーブル５２のＬ１行を昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置をＢ３と特定する。つまり、位置特定部１４は、左テーブル５２の全ての行についての、昇順ソート後の右テーブル５１の最下行に加えることのできる下限位置を特定する（ステップＳ１０６）。そして位置特定部１４は、左テーブル５２の行ＩＤと、その行ＩＤについて特定した下限位置とを紐づけた位置特定テーブル５３を生成する。そして、位置特定部１４は、制御部１０へ処理終了を出力する。

当該位置特定部１４の処理は、第一データテーブル（右テーブル５１）のデータ要素それぞれがユニークである場合に、２つのデータテーブルのうちの第二データテーブル（左テーブル５２）の各行のデータ要素と第一データテーブル（右テーブル５１）の各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行って、昇順ソートに適合するように第二データテーブル（左テーブル５２）の行を昇順ソート後の第一データテーブル（右テーブル５１）の最下行に加えることのできる下限位置を特定する処理の一態様である。なお上述の大小比較は、二分探索を用いて行う。または大小比較は他の探索手法を用いてもよい。例えば大小比較を、単純探索により行ってもよい。データ要素であるキーの昇順ソート後に大小比較を行うため、二分探索をすることで処理量、処理負荷を軽減することができる。

制御部１０は次に、統合部１５に２つのデータテーブルの統合を指示する。すると統合部１５は、左テーブル５２と、右テーブル５１と、位置特定テーブル５３とを参照し、ｎ＝１と設定し、左テーブルのｎ＝１行目の行（行ＩＤ＝Ｌ３）のデータ要素であるキー「１」と、当該行Ｌ３のデータ要素であるキー「１」を用いて特定した昇順ソート後の右テーブル５１における下限位置Ｂ０の昇順ソートにおける次の行Ｒ１のデータ要素であるキー「１」とが一致するかを判定する。この場合キーはそれぞれ「１」であるため一致する。従って、統合部１５は、それら行Ｌ３と行Ｒ１を統合対象行と特定し、それら行Ｌ３と行Ｒ１とを統合した、行ＩＤ「Ｌ３」、行ＩＤ「Ｒ１」、キー「１」を行に含む統合データテーブルを生成する。

統合部１５は次に、ｎ＝ｎ＋１＝２と設定し、左テーブルのｎ＝２行目の行（行ＩＤ＝Ｌ０）のデータ要素であるキー「３」と、当該行Ｌ０のデータ要素であるキー「３」を用いて特定した昇順ソート後の右テーブル５１における下限位置Ｂ２の昇順ソートにおける次の行Ｒ２のデータ要素であるキー「３」とが一致するかを判定する。この場合キーはそれぞれ「３」であるため一致する。従って、統合部１５は、それら行Ｌ０と行Ｒ２を統合対象行と特定し、それら行Ｌ０と行Ｒ２とを統合した、行ＩＤ「Ｌ０」、行ＩＤ「Ｒ２」、キー「３」を含む行を統合データテーブルにマージする。

統合部１５は次に、ｎ＝ｎ＋１＝３と設定し、左テーブルのｎ＝３行目の行（行ＩＤ＝Ｌ２）のデータ要素であるキー「３」と、当該行Ｌ２のデータ要素であるキー「３」を用いて特定した昇順ソート後の右テーブル５１における下限位置Ｂ２の昇順ソートにおける次の行Ｒ２のデータ要素であるキー「３」とが一致するかを判定する。この場合キーはそれぞれ「３」であるため一致する。従って、統合部１５は、それら行Ｌ２と行Ｒ２を統合対象行と特定し、それら行Ｌ２と行Ｒ２とを統合した、行ＩＤ「Ｌ２」、行ＩＤ「Ｒ２」、キー「３」を含む行を統合データテーブルにマージする。

統合部１５は次に、ｎ＝ｎ＋１＝４と設定し、左テーブルのｎ＝４行目の行（行ＩＤ＝Ｌ１）のデータ要素であるキー「５」と、当該行Ｌ１のデータ要素であるキー「５」を用いて特定した昇順ソート後の右テーブル５１における下限位置Ｂ３の昇順ソートにおける次の行Ｒ３のデータ要素であるキー「６」とが一致するかを判定する。この場合キーはそれぞれ「５」と「６」であるため一致しない。従って、統合部１５は、それら行Ｌ１と行Ｒ３を統合対象行と特定しない。なお、ある統合処理においては、行Ｌ１の情報のみを統合データテーブルにマージしてもよい。

そして統合部１５は、左テーブル５２の全ての行について同様の統合対象行とするかの特定を行って、統合対象行と特定した左テーブル５２の行と、右テーブル５１の行とを統合して統合データテーブルにマージする。これにより統合データテーブルを生成する（ステップＳ１０７）。

一方、制御部１０は、ステップＳ１０５において処理負荷を軽減することができないデータテーブルの統合処理へ切り替えると判定した場合、そのデータテーブルの統合処理を位置特定部１４へ出力する。

図８は統合対象の２つのデータテーブルの例を示す第二の図である。
右テーブル６１（第一データテーブル）と左テーブル６２（第二データテーブル）とを図６に示す。右テーブル６１と左テーブル６２のそれぞれは、行ＩＤとキーとを紐づけた行を複数行有している。図８で示すように右テーブル６１と左テーブル６２の何れのデータテーブルも、データテーブル内の各行の大小比較のできるデータ要素としてのキーがそれぞれユニークでない。例えば右テーブル６１ではキー「１」となる行が２つ存在し、各行の大小比較のできるデータ要素としてのキーがそれぞれユニークでない。また左テーブル６２ではキー「３」となる行が２つ存在し、各行の大小比較のできるデータ要素としてのキーがそれぞれユニークでない。このように、いずれのデータテーブルも各行の大小比較のできるデータ要素としてのキーがそれぞれユニークでない場合、以下のデータテーブルの統合処理が行われる。

図９は統合装置の処理概要を示す第二の図である。
すでにステップＳ１０２により昇順ソートが行われているとすると、図９（２）の右テーブル６１で示すように、右テーブル６１の各行のキーが、上から順に「１」、「１」「２」、「３」となるよう各行が昇順に並び替えられている。また図９（２）の左テーブル６２で示すように、左テーブル６２の各行のキーが、上から順に「１」、「３」、「３」、「５」となるよう各行が昇順に並び変えられている。

そして制御部１０からの指示により、位置特定部１４は、処理負荷軽減手法によるデータテーブルの統合処理における下限位置の特定と同様の処理を行う。つまり、位置特定部１４は、ｎ＝１と設定し、左テーブル６２のｎ＝１行目を特定する。左テーブル６２の１（ｎ＝１）行目は行ＩＤ＝Ｌ３の行である。位置特定部１４は、Ｌ３行のキー「１」を取得する。位置特定部１４は、左テーブル６２のＬ３の行のデータ要素であるキー「１」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル６２のＬ３行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置を特定する。ここで、図９の（１）で示すように、右テーブル６１において各行の間をそれぞれ位置Ｂ０～Ｂ４と呼ぶこととする。左テーブル６２のＬ３の行のデータ要素であるキー「１」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル６２のＬ３行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置は、境界位置Ｂ０となる。つまりこの場合、下限位置はＢ０である。

同様に位置特定部１４は、ｎ＝ｎ＋１によりｎ＝２と設定し、左テーブル６２のｎ＝２行目を特定する。左テーブル６２の２（ｎ＝２）行目は行ＩＤ＝Ｌ０の行である。位置特定部１４は、Ｌ０行のキー「３」を取得する。位置特定部１４は、左テーブル６２のＬ０の行のデータ要素であるキー「３」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル６２のＬ０行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置を特定する。左テーブル６２のＬ０の行のデータ要素であるキー「３」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル６２のＬ０行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置は、境界位置Ｂ３となる。つまりこの場合、下限位置はＢ３である。

同様に位置特定部１４は、ｎ＝ｎ＋１によりｎ＝３と設定し、左テーブル６２のｎ＝３行目を特定する。左テーブル６２の３（ｎ＝３）行目は行ＩＤ＝Ｌ２の行である。位置特定部１４は、Ｌ２行のキー「３」を取得する。位置特定部１４は、左テーブル６２のＬ２の行のデータ要素であるキー「３」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル６２のＬ２行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置を特定する。左テーブル６２のＬ２の行のデータ要素であるキー「３」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル６２のＬ２行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置は、境界位置Ｂ３となる。つまりこの場合、下限位置はＢ３である。

同様に位置特定部１４は、ｎ＝ｎ＋１によりｎ＝４と設定し、左テーブル６２のｎ＝４行目を特定する。左テーブル６２の４（ｎ＝４）行目は行ＩＤ＝Ｌ１の行である。位置特定部１４は、Ｌ１行のキー「５」を取得する。位置特定部１４は、左テーブル６２のＬ１の行のデータ要素であるキー「５」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル６２のＬ１行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置を特定する。左テーブル６２のＬ１の行のデータ要素であるキー「５」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル６２のＬ１行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置は、境界位置Ｂ４となる。つまりこの場合、下限位置はＢ４である。

これにより位置特定部１４は、左テーブル６２のＬ３行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置をＢ０と特定する。また位置特定部１４は、左テーブル６２のＬ０行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置をＢ３と特定する。また位置特定部１４は、左テーブル６２のＬ２行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置をＢ３と特定する。また位置特定部１４は、左テーブル６２のＬ１行を昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置をＢ４と特定する。つまり、位置特定部１４は、左テーブル６２の全ての行についての、昇順ソート後の右テーブル６１の最下行に加えることのできる下限位置を特定する（ステップＳ２０１）。

当該位置特定部１４のステップＳ２０１の処理は、第一データテーブル（右テーブル６１）のデータ要素それぞれがユニークでない場合に、２つのデータテーブルのうちの第二データテーブル（左テーブル６２）の各行のデータ要素と第一データテーブル（右テーブル６１）の各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行って、昇順ソートに適合するように第二データテーブル（左テーブル６２）の行を昇順ソート後の第一データテーブル（右テーブル６１）の最下行に加えることのできる下限位置を特定する処理の一態様である。上述の大小比較は、二分探索を用いて行う。または大小比較は他の探索手法を用いてもよい。例えば大小比較を単純探索により行ってもよい。データ要素であるキーの昇順ソート後に大小比較を行うため、二分探索をすることで処理量、処理負荷を軽減することができる。

次に位置特定部１４は、処理負荷軽減手法によるデータテーブルの統合処理において行わなかった上限位置の特定を行う。つまり、位置特定部１４は、ｎ＝１と設定し、左テーブル５２のｎ＝１行目を特定する。左テーブル５２の１（ｎ＝１）行目は行ＩＤ＝Ｌ３の行である。位置特定部１４は、Ｌ３行のキー「１」を取得する。位置特定部１４は、左テーブル５２のＬ３の行のデータ要素であるキー「１」と、右テーブル５１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル５２のＬ３行を昇順ソート後の右テーブル５１の最上行に加えることのできる上限位置を特定する。左テーブル６２のＬ３の行のデータ要素であるキー「１」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル６２のＬ３行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置は、境界位置Ｂ２となる。つまりこの場合、上限位置はＢ２である。

同様に位置特定部１４は、ｎ＝ｎ＋１によりｎ＝２と設定し、左テーブル６２のｎ＝２行目を特定する。左テーブル６２の２（ｎ＝２）行目は行ＩＤ＝Ｌ０の行である。位置特定部１４は、Ｌ０行のキー「３」を取得する。位置特定部１４は、左テーブル６２のＬ０の行のデータ要素であるキー「３」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル６２のＬ０行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置を特定する。左テーブル６２のＬ０の行のデータ要素であるキー「３」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル６２のＬ０行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置は、境界位置Ｂ４となる。つまりこの場合、上限位置はＢ４である。

同様に位置特定部１４は、ｎ＝ｎ＋１によりｎ＝３と設定し、左テーブル６２のｎ＝３行目を特定する。左テーブル６２の３（ｎ＝３）行目は行ＩＤ＝Ｌ２の行である。位置特定部１４は、Ｌ２行のキー「３」を取得する。位置特定部１４は、左テーブル６２のＬ２の行のデータ要素であるキー「３」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル６２のＬ２行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置を特定する。左テーブル６２のＬ２の行のデータ要素であるキー「３」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル６２のＬ２行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置は、境界位置Ｂ４となる。つまりこの場合、上限位置はＢ４である。

同様に位置特定部１４は、ｎ＝ｎ＋１によりｎ＝４と設定し、左テーブル６２のｎ＝４行目を特定する。左テーブル６２の４（ｎ＝４）行目は行ＩＤ＝Ｌ１の行である。位置特定部１４は、Ｌ１行のキー「５」を取得する。位置特定部１４は、左テーブル６２のＬ１の行のデータ要素であるキー「５」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のキーとの大小比較を行って、昇順ソートに適合するように左テーブル６２のＬ１行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置を特定する。左テーブル６２のＬ１の行のデータ要素であるキー「５」と、右テーブル６１の各行のデータ要素であるキーを用いた昇順ソート後の各行のデータ要素との大小比較を行うと、昇順ソートに適合するように左テーブル６２のＬ１行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置は、境界位置Ｂ４となる。つまりこの場合、上限位置はＢ４である。

これにより位置特定部１４は、左テーブル６２のＬ３行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置をＢ２と特定する。また位置特定部１４は、左テーブル６２のＬ０行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置をＢ４と特定する。また位置特定部１４は、左テーブル６２のＬ２行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置をＢ４と特定する。また位置特定部１４は、左テーブル６２のＬ１行を昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置をＢ４と特定する。つまり、位置特定部１４は、左テーブル６２の全ての行についての、昇順ソート後の右テーブル６１の最上行に加えることのできる上限位置を特定する（ステップＳ２０２）。そして位置特定部１４は、左テーブル６２の行ＩＤと、その行ＩＤについて特定した下限位置と、上限位置とを紐づけた位置特定テーブル６３を生成する。そして、位置特定部１４は、制御部１０へ処理終了を出力する。

当該位置特定部１４の処理は、第一データテーブル（右テーブル６１）のデータ要素それぞれがユニークでない場合に、２つのデータテーブルのうちの第二データテーブル（左テーブル６２）の各行のデータ要素と第一データテーブル（右テーブル６１）の各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行って、昇順ソートに適合するように第二データテーブル（左テーブル６２）の行を昇順ソート後の第一データテーブル（右テーブル６１）の最上行に加えることのできる上限位置を特定する処理の一態様である。なお上述の上限位置の特定における大小比較も、二分探索を用いて行う。または上限位置の特定における大小比較は他の探索手法を用いてもよい。例えば上限位置の特定における大小比較を単純探索を用いて行ってもよい。データ要素であるキーの昇順ソート後に大小比較を行うため、二分探索をすることで処理量、処理負荷を軽減することができる。

制御部１０は次に、統合部１５に２つのデータテーブルの統合を指示する。すると統合部１５は、左テーブル６２と、右テーブル６１と、位置特定テーブル６３とを参照し、ｎ＝１と設定し、左テーブル６２のｎ＝１行目の行（行ＩＤ＝Ｌ３）のデータ要素であるキー「１」と、当該行Ｌ３のデータ要素であるキー「１」を用いて特定した昇順ソート後の右テーブル６１における下限位置Ｂ０の昇順ソートにおける次の行Ｒ１のデータ要素であるキー「１」とが一致するかを判定する。この場合キーはそれぞれ「１」であるため一致する。従って、統合部１５は、それら行Ｌ３と行Ｒ１を統合対象行と特定し、それら行Ｌ３と行Ｒ１とを統合した、行ＩＤ「Ｌ３」、行ＩＤ「Ｒ１」、キー「１」を行に含む統合データテーブルを生成する。

統合部１５は左テーブル６２のｎ＝１行目の行（行ＩＤ＝Ｌ３）について特定した右テーブル６１の上限位置Ｂ２の次の行Ｒ０のデータ要素との一致判定を行っていない為、当該ｎ＝１行目を用いた一致判定を続ける。統合部１５は、左テーブルのｎ＝１行目の行（行ＩＤ＝Ｌ３）のデータ要素であるキー「１」と、当該行Ｌ３のデータ要素であるキー「１」を用いて特定した昇順ソート後の右テーブル５１における下限位置Ｂ０の次に上の境界位置Ｂ１の昇順ソートにおける次の行Ｒ３のデータ要素であるキー「１」とが一致するかを判定する。この場合キーはそれぞれ「１」であるため一致する。従って、統合部１５は、それら行Ｌ３と行Ｒ３を統合対象行と特定し、それら行Ｌ３と行Ｒ３とを統合した、行ＩＤ「Ｌ３」、行ＩＤ「Ｒ３」、キー「１」を含む行を統合データテーブルにマージする。

統合部１５は左テーブル６２のｎ＝１行目の行（行ＩＤ＝Ｌ３）について特定した右テーブル６１の上限位置Ｂ２の次の行のデータ要素との一致判定を行っていない為、当該ｎ＝１行目を用いた一致判定を続ける。統合部１５は、左テーブルのｎ＝１行目の行（行ＩＤ＝Ｌ３）のデータ要素であるキー「１」と、当該行Ｌ３のデータ要素であるキー「１」を用いて特定した昇順ソート後の右テーブル５１における境界位置Ｂ１の次に上の境界位置Ｂ２の昇順ソートにおける次の行Ｒ０のデータ要素であるキー「２」とが一致するかを判定する。この場合キーはそれぞれ「１」、「２」であるため一致しない。従って、統合部１５は、それら行Ｌ３と行Ｒ０を統合対象行と特定しない。そして、統合部１５は、境界位置Ｂ２は左テーブル６２のｎ＝１行目の行（行ＩＤ＝Ｌ３）について特定した上限位置であり、これにより、左テーブル６２のｎ＝１行目の行（行ＩＤ＝Ｌ３）について特定した右テーブル６１の上限位置Ｂ２の次の行のデータ要素との一致判定を行ったため、ｎ＝１行目の処理を終了する。

次に統合部１５は、左テーブル６２と、右テーブル６１と、位置特定テーブル６３とを参照し、ｎ＝ｎ+１＝２と設定し、左テーブル６２のｎ＝２行目の行（行ＩＤ＝Ｌ０）のデータ要素であるキー「３」と、当該行Ｌ０のデータ要素であるキー「３」を用いて特定した昇順ソート後の右テーブル６１における下限位置Ｂ３の昇順ソートにおける次の行Ｒ２のデータ要素であるキー「３」とが一致するかを判定する。この場合キーはそれぞれ「３」であるため一致する。従って、統合部１５は、それら行Ｌ０と行Ｒ２を統合対象行と特定し、それら行Ｌ０と行Ｒ２とを統合した、行ＩＤ「Ｌ０」、行ＩＤ「Ｒ２」、キー「３」を含む行を統合データテーブルにマージする。

統合部１５は左テーブル６２のｎ＝２行目の行（行ＩＤ＝Ｌ０）について特定した右テーブル６１の上限位置Ｂ４の次の行のデータ要素との一致判定を行っていない為、当該ｎ＝２行目を用いた一致判定を続ける。統合部１５は、左テーブル６２のｎ＝２行目の行（行ＩＤ＝Ｌ０）のデータ要素であるキー「３」と、当該行Ｌ０のデータ要素であるキー「３」を用いて特定した昇順ソート後の右テーブル６１における下限位置Ｂ３の次に上の境界位置Ｂ４の昇順ソートにおける次の行のデータ要素であるキーとが一致するかを判定する。この場合、統合部１５は、境界位置Ｂ４の昇順ソートにおける次の行がなく、境界位置Ｂ４は左テーブル６２のｎ＝２行目の行（行ＩＤ＝Ｌ０）について特定した上限位置であるため、処理を終了する。

次に統合部１５は、左テーブル６２と、右テーブル６１と、位置特定テーブル６３とを参照し、ｎ＝ｎ+１＝３と設定し、左テーブル６２のｎ＝３行目の行（行ＩＤ＝Ｌ２）のデータ要素であるキー「３」と、当該行Ｌ２のデータ要素であるキー「３」を用いて特定した昇順ソート後の右テーブル６１における下限位置Ｂ３の昇順ソートにおける次の行Ｒ２のデータ要素であるキー「３」とが一致するかを判定する。この場合キーはそれぞれ「３」であるため一致する。従って、統合部１５は、それら行Ｌ２と行Ｒ２を統合対象行と特定し、それら行Ｌ２と行Ｒ２とを統合した、行ＩＤ「Ｌ２」、行ＩＤ「Ｒ２」、キー「３」を含む行を統合データテーブルにマージする。

統合部１５は左テーブル６２のｎ＝３行目の行（行ＩＤ＝Ｌ２）について特定した右テーブル６１の上限位置Ｂ４の次の行のデータ要素との一致判定を行っていない為、当該ｎ＝３行目を用いた一致判定を続ける。統合部１５は、左テーブル６２のｎ＝３行目の行（行ＩＤ＝Ｌ２）のデータ要素であるキー「３」と、当該行Ｌ２のデータ要素であるキー「３」を用いて特定した昇順ソート後の右テーブル６１における下限位置Ｂ３の次に上の境界位置Ｂ４の昇順ソートにおける次の行のデータ要素であるキーとが一致するかを判定する。この場合、統合部１５は、境界位置Ｂ４の昇順ソートにおける次の行がなく、境界位置Ｂ４は左テーブル６２のｎ＝３行目の行（行ＩＤ＝Ｌ２）について特定した上限位置であるため、処理を終了する。

次に統合部１５は、左テーブル６２と、右テーブル６１と、位置特定テーブル６３とを参照し、ｎ＝ｎ+１＝４と設定し、左テーブル６２のｎ＝４行目の行（行ＩＤ＝Ｌ１）のデータ要素であるキー「５」と、当該行Ｌ１のデータ要素であるキー「５」を用いて特定した昇順ソート後の右テーブル６１における下限位置Ｂ４の昇順ソートにおける次の行Ｒ２のデータ要素であるキーとが一致するかを判定する。この場合、統合部１５は、境界位置Ｂ４の昇順ソートにおける次の行がなく、境界位置Ｂ４は左テーブル６２のｎ＝４行目の行（行ＩＤ＝Ｌ２）について特定した上限位置でもあるため、処理を終了する。

そして統合部１５は、左テーブル６２の全ての行について同様の統合対象行とするかの特定を行って、統合対象行と特定した左テーブル６２の行と、右テーブル６１の行とを統合して統合データテーブルにマージする。これにより統合データテーブルを生成する（ステップＳ２０３）。

上述の処理によれば、２つのデータテーブルのうちの第一データテーブルのデータ要素それぞれがユニークである場合には、下限位置を特定するだけでよく、第一データテーブルのデータ要素それぞれがユニークでない場合には、下限位置と上限位置とをそれぞれ特定している。従って、２つのデータテーブルのうちの第一データテーブルのデータ要素それぞれがユニークである場合には、下限位置を特定するのみで、統合データテーブルを生成するにあたり、処理負荷、処理量を軽減することができる。

図１０は統合装置の最小構成を示す図である。
図１１は最小構成による統合装置の処理フローを示す図である。
図１０で示すように統合装置１は、ユニーク判定手段１００１、位置特定手段１００２、統合手段１００３を少なくとも備える。
ユニーク判定手段１００１は、少なくとも大小比較のできるデータ要素を一つの行の情報として含む２つのデータテーブルのうちの第一データテーブルのデータ要素それぞれがユニークであるかを判定する（ステップＳ３０１）。
位置特定手段１００２は、第一データテーブルのデータ要素それぞれがユニークである場合には、第二データテーブルの各行のデータ要素と第一データテーブルの各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行って、昇順ソートに適合するように第二データテーブルの行を昇順ソート後の第一データテーブルの最下行に加えることのできる下限位置を特定する（ステップＳ３０２）。
統合手段１００３は、第二データテーブルの行のデータ要素と、当該行のデータ要素を用いて特定した昇順ソート後の第一データテーブルにおける下限位置の昇順ソートにおける次の行のデータ要素とが一致する場合に、それらデータ要素を示す統合対象行を特定し、少なくともそれら第二データテーブルと第一データテーブルとの統合対象行を統合した統合データテーブルを生成する（ステップＳ３０３）。

ここで、上述の統合装置１は内部に、コンピュータシステムを有している。そして、上述した各処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。

また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル（差分プログラム）であっても良い。

１・・・統合装置
２・・・端末
１１・・・制御部
１２・・・ソート部
１３・・・ユニーク判定部
１４・・・位置特定部
１５・・・統合部
１００・・・情報処理システム

Claims

少なくとも大小比較のできるデータ要素を一つの行の情報として含む２つのデータテーブルのうちの第一データテーブルのデータ要素それぞれがユニークであるかを判定し、前記２つのデータテーブルのうちの一方のデータテーブルを前記第一データテーブルとして定義して前記第一データテーブルのデータ要素それぞれがユニークであるかを判定した結果、当該第一データテーブルのデータ要素それぞれがユニークでない場合、前記２つのデータテーブルのうちの他方のデータテーブルを前記第一データテーブルとして新たに定義して前記第一データテーブルのデータ要素それぞれがユニークであるかを判定するユニーク判定手段と、
前記第一データテーブルのデータ要素それぞれがユニークである場合には、前記２つのデータテーブルのうちの第二データテーブルの各行のデータ要素と前記第一データテーブルの各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行って、前記昇順ソートに適合するように前記第二データテーブルの行を前記昇順ソート後の前記第一データテーブルの最下行に加えることのできる下限位置を特定する位置特定手段と、
前記第二データテーブルの行のデータ要素と、当該行のデータ要素を用いて特定した前記昇順ソート後の前記第一データテーブルにおける前記下限位置の前記昇順ソートにおける次の行のデータ要素とが一致する場合に、それらデータ要素を示す統合対象行を、前記第二データテーブルと前記第一データテーブルとにおいて特定し、少なくともそれら前記第二データテーブルと前記第一データテーブルとの前記統合対象行を統合した統合データテーブルを生成する統合手段と、
を備える統合装置。
前記統合手段は、前記第二データテーブルの行のデータ要素と、当該行のデータ要素を用いて特定した前記昇順ソート後の前記第一データテーブルにおける前記下限位置の前記昇順ソートにおける次の行のデータ要素とが一致しない場合には、当該第二データテーブルの行を、前記第一データテーブルにおける前記下限位置の前記昇順ソートにおける次の行と統合せずに、前記統合データテーブルにマージする
請求項１に記載の統合装置。
前記統合手段は、前記第二データテーブルの行のデータ要素と、当該行のデータ要素を用いて特定した前記昇順ソート後の前記第一データテーブルにおける前記下限位置の前記昇順ソートにおける次の行のデータ要素とが一致しない場合には、当該第一データテーブルにおける前記下限位置の前記昇順ソートにおける次の行を、前記第二データテーブルの行と統合せずに、前記統合データテーブルにマージする
請求項１または請求項２に記載の統合装置。
二分探索を用いて前記大小比較を行う請求項１から請求項３の何れか一項に記載の統合装置。
少なくとも大小比較のできるデータ要素を一つの行の情報として含む２つのデータテーブルのうちの第一データテーブルのデータ要素それぞれがユニークであるかを判定し、
前記２つのデータテーブルのうちの一方のデータテーブルを前記第一データテーブルとして定義して前記第一データテーブルのデータ要素それぞれがユニークであるかを判定した結果、当該第一データテーブルのデータ要素それぞれがユニークでない場合、前記２つのデータテーブルのうちの他方のデータテーブルを前記第一データテーブルとして新たに定義して前記第一データテーブルのデータ要素それぞれがユニークであるかを判定し、
前記第一データテーブルのデータ要素の配列において当該データ要素それぞれがユニークである場合には、前記２つのデータテーブルのうちの第二データテーブルの各行のデータ要素と前記第一データテーブルの各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行って、前記第二データテーブルの各行のデータ要素についての前記昇順ソート後の前記第一データテーブルの各行のデータ要素の配列における下限位置を特定し、
前記第二データテーブルの行のデータ要素と、当該行のデータ要素を用いて特定した前記下限位置であって前記昇順ソート後の前記第一データテーブルの配列における前記下限位置を持つ行のデータ要素とが一致する統合対象行を、前記第二データテーブルと前記第一データテーブルとにおいて特定し、少なくともそれら前記第二データテーブルと前記第一データテーブルとの前記統合対象行を統合した統合データテーブルを生成する
データテーブル統合方法。
統合装置のコンピュータを、
少なくとも大小比較のできるデータ要素を一つの行の情報として含む２つのデータテーブルのうちの第一データテーブルのデータ要素それぞれがユニークであるかを判定し、前記２つのデータテーブルのうちの一方のデータテーブルを前記第一データテーブルとして定義して前記第一データテーブルのデータ要素それぞれがユニークであるかを判定した結果、当該第一データテーブルのデータ要素それぞれがユニークでない場合、前記２つのデータテーブルのうちの他方のデータテーブルを前記第一データテーブルとして新たに定義して前記第一データテーブルのデータ要素それぞれがユニークであるかを判定するユニーク判定手段、
前記第一データテーブルのデータ要素の配列において当該データ要素それぞれがユニークである場合には、前記２つのデータテーブルのうちの第二データテーブルの各行のデータ要素と前記第一データテーブルの各行のデータ要素を用いた昇順ソート後の各行のデータ要素との大小比較を行って、前記第二データテーブルの各行のデータ要素についての前記昇順ソート後の前記第一データテーブルの各行のデータ要素の配列における下限位置を特定する位置特定手段、
前記第二データテーブルの行のデータ要素と、当該行のデータ要素を用いて特定した前記下限位置であって前記昇順ソート後の前記第一データテーブルの配列における前記下限位置を持つ行のデータ要素とが一致する統合対象行を、前記第二データテーブルと前記第一データテーブルとにおいて特定し、少なくともそれら前記第二データテーブルと前記第一データテーブルとの前記統合対象行を統合した統合データテーブルを生成する統合手段、
として機能させるプログラム。