JP5204303B2 - データ結合システム及びデータ結合方法 - Google Patents

データ結合システム及びデータ結合方法 Download PDF

Info

Publication number
JP5204303B2
JP5204303B2 JP2011514382A JP2011514382A JP5204303B2 JP 5204303 B2 JP5204303 B2 JP 5204303B2 JP 2011514382 A JP2011514382 A JP 2011514382A JP 2011514382 A JP2011514382 A JP 2011514382A JP 5204303 B2 JP5204303 B2 JP 5204303B2
Authority
JP
Japan
Prior art keywords
data
combination
value
destination data
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011514382A
Other languages
English (en)
Other versions
JPWO2010134440A1 (ja
Inventor
大介 越智
一郎 岡島
博 川上
俊博 鈴木
晩煕 趙
智大 永田
基成 小林
勇輝 大薮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2011514382A priority Critical patent/JP5204303B2/ja
Publication of JPWO2010134440A1 publication Critical patent/JPWO2010134440A1/ja
Application granted granted Critical
Publication of JP5204303B2 publication Critical patent/JP5204303B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Description

本発明は、データ結合システム及びデータ結合方法に関する。
一般に、複数のデータ同士を結合する処理において、各データに含まれる所定の項目に着目して、その項目の値が一致する場合に、それらのデータを結合する処理が行われる。例えば、第1のテーブルに含まれるコンテンツデータと、第2のテーブルに含まれるレコードデータとを、それぞれのデータに含まれる属性値及び項目値が一致する場合に結合するデータ処理装置が知られている(例えば、特許文献1参照)。
特開2005−49943号公報
あるデータ群に含まれるデータ(以下、「結合元データ」とする)に対して、他のデータ群から所定の項目の値が一致するデータ(以下、「結合先データ」とする)を抽出して、結合元データと抽出した結合先データとを結合させるデータ結合処理においては、結合先データ群の中に所定の項目の値が一致する結合先データが複数存在する場合がある。また、結合先データ群そのものが複数存在する場合がある。このような場合には、所定の項目の値の一致のみを結合の基準とすると、結合元データに結合させる結合先データを決定することができない。また、結合先データの決定のために、値に関して範囲の概念を伴うことが可能な上記所定の項目とは異なる他の項目をさらに考慮する場合がある。一般に、データ結合処理においては、結合の成功率を向上させる必要があるが、結合の成功率向上のために上記他の項目の値が結合元データと結合先データとの間で大きく異なるようなデータを結合させると、結合された結合元データと結合先データとの結合精度が低くなり、好ましくない。
そこで、本発明は、かかる問題点に鑑みてなされたものであり、データ結合処理において、結合されるデータの結合精度を向上させながら、データ結合の成功率を向上させることが可能なデータ結合システム及びデータ結合方法を提供することを目的とする。
上記課題を解決するために、本発明のデータ結合システムは、識別項目及びキー項目を含む結合元データと、識別項目及びキー項目を含む結合先データを複数有する結合先データ群から選択した一の結合先データである選択結合先データとを結合するデータ結合システムであって、結合元データを記憶する結合元データ記憶手段と、結合先データ群を記憶する結合先データ記憶手段と、結合元データ記憶手段に記憶されている一の結合元データに含まれる識別項目の値が、結合先データ記憶手段に記憶されている結合先データに含まれる識別項目の値と一致または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当し、且つ当該結合元データに含まれるキー項目の値が、当該結合先データに含まれるキー項目の値に基づいて設定された第1の所定の範囲に該当する場合に、当該結合先データを選択結合先データとして選択するデータ判定手段と、データ判定手段により選択された選択結合先データを結合元データに結合し、合成データを生成するデータ結合手段と、合成データを記憶する合成データ記憶手段と、データ結合手段により生成された合成データを、合成データ記憶手段に記憶させるデータ書き出し手段とを備え、所定の識別範囲は、結合先データに含まれる識別項目の値を含む有限の範囲であり、第1の所定の範囲は、結合先データに含まれるキー項目の値を含む有限の範囲であることを特徴とする。
また、上記課題を解決するために、本発明のデータ結合方法は、識別項目及びキー項目を含む結合元データと、識別項目及びキー項目を含む結合先データを複数有する結合先データ群から選択した一の結合先データである選択結合先データとを結合するデータ結合方法であって、一の結合元データに含まれる識別項目の値が、結合先データに含まれる識別項目の値と一致または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当し、且つ当該結合元データに含まれるキー項目の値が、当該結合先データに含まれるキー項目の値に基づいて設定された第1の所定の範囲に該当する場合に、当該結合先データを選択結合先データとして選択するデータ判定ステップと、データ判定ステップにおいて選択された選択結合先データを結合元データに結合し、合成データを生成するデータ結合ステップと、データ結合手段により生成された合成データを、合成データを記憶させるための合成データ記憶手段に記憶させるデータ書き出しステップとを有し、所定の識別範囲は、結合先データに含まれる識別項目の値を含む有限の範囲であり、第1の所定の範囲は、結合先データのキー項目の値を含む有限の範囲であることを特徴とする。
本発明のデータ結合システム及びデータ結合方法では、結合元データに結合先データを結合させるに際して、識別項目が一致または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当していることに加えて、結合先データのキー項目の値に基づいて設定された第1の所定の範囲に結合元データのキー項目の値が該当する場合に当該結合先データを選択結合先データとして結合元データに結合させるので、データ結合の精度を向上させることができる。なお、識別項目が範囲の概念を持たない値が記憶される項目である場合は、識別項目は、例えばユーザの識別子を値として記憶する項目である。また、識別項目が範囲の概念を持つ値が記憶される項目である場合は、識別項目は、例えばIPアドレスの識別子によるネットワークプレフィックスを値として記憶する項目である。また、キー項目は、連続的または離散的な値をとることが可能な項目であり、その値に関して、範囲の概念を伴うことが可能である。
また、本発明のデータ結合システムでは、データ判定手段は、結合先データ記憶手段に記憶されている複数の結合先データから、結合先データに含まれる識別項目の値が、結合元データに含まれる識別項目の値と一致、または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に結合元データに含まれる識別項目の値が該当する結合先データを抽出結合先データとして抽出し、結合元データに含まれるキー項目の値が、抽出結合先データに含まれるキー項目の値に基づいて設定された第1の所定の範囲に該当する場合に、当該抽出結合先データを選択結合先データとして選択することを特徴とする。
この場合には、結合元データに結合される結合先データの候補を識別項目の値により抽出結合先データとして抽出した後に、結合元データに含まれるキー項目の値が抽出結合先データのキー項目の値に基づいて設定された第1の所定の範囲に該当する場合に、当該抽出結合先データを結合元データに結合させるので、データ結合の精度をより向上させることが可能となると共に、キー項目の値に基づく選択結合先データの選択の処理負担を軽減することができる。
また、本発明のデータ結合システムでは、結合元データ及び結合先データは、複数のキー項目を含み、データ判定手段は、結合元データに含まれる複数のキー項目のそれぞれの値が、抽出結合先データに含まれる複数のキー項目の値に基づいて設定されたそれぞれの第1の所定の範囲に該当する場合に、当該抽出結合先データを選択結合先データとして選択することを特徴とする。
この構成では、結合元及び結合先データが複数のキー項目を有するデータであった場合であっても、結合元データのそれぞれのキー項目が結合先データにおけるそれぞれのキー項目に関して設定された第1の所定の範囲に該当する場合に、当該結合先データを結合元データに結合させる選択結合データとして選択するので、結合される選択結合先データと結合元データとの結合精度を向上させながら、データ結合の成功率を向上させることが可能となる。
また、本発明のデータ結合システムでは、データ判定手段は、結合元データに含まれるキー項目の値が、抽出結合先データに含まれるキー項目の値に基づいて設定された第1の所定の範囲に該当しなかった場合には、第1の所定の範囲に隣接して設定された第2の所定の範囲に結合元データに含まれるキー項目の値が該当する場合に、当該抽出結合先データを選択結合先データとして選択することを特徴とする。
この構成では、結合元データのキー項目の値が、いずれの抽出結合先データのキー項目の値に関する第1の所定の範囲に該当しなかった場合であっても、いずれかの抽出結合先データのキー項目に関して第1の所定の範囲に隣接して設定された第2の所定の範囲に該当すれば、当該抽出結合先データが結合元データに結合させる選択結合先データとして選択されるので、データ結合の成功率を向上させることが可能となる。即ち、これらの構成では、結合元データのキー項目の値が、結合先データのキー項目の値に関する第1の所定の範囲に該当する場合、またはキー項目の値が第1の所定の範囲に該当するような抽出結合先データが存在しない場合であって第2の所定の範囲に該当する場合に、当該結合先データが結合元データに結合させる選択結合先データとして選択されるので、結合対象となる結合先データを選択できずに当該結合元データに冠する結合処理が失敗となることを防止することができる。
また、本発明のデータ結合システムでは、結合元データ及び結合先データは、複数のキー項目を含み、データ判定手段は、抽出結合先データに含まれる複数のキー項目の値に基づいて設定されたそれぞれの第1の所定の範囲、または該第1の所定の範囲に隣接して設定されたそれぞれの第2の所定の範囲に、結合元データに含まれる複数のキー項目のそれぞれの値が該当する場合に、当該抽出結合先データを選択結合先データとして選択することを特徴とする。
この構成では、結合元及び結合先データが複数のキー項目を有するデータであった場合であっても、結合元データのそれぞれのキー項目が結合先データにおけるそれぞれのキー項目に関して設定された第1の所定の範囲、または第1の所定の範囲に隣接して設定された第2の所定の範囲に該当する場合に、当該結合先データを結合元データに結合させる選択結合データとして選択するので、結合される選択結合先データと結合元データとの結合精度を保ちながら、データ結合の成功率を向上させることが可能となる。
また、本発明のデータ結合システムでは、データ判定手段は、結合先データ記憶手段に記憶されている複数の結合先データから、結合元データに含まれるキー項目の値が第1の所定の範囲に該当する結合先データを抽出結合先データとして抽出し、抽出結合先データに含まれる識別項目の値が、結合元データに含まれる識別項目の値と一致、または当該抽出結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に結合元データに含まれる識別項目の値が該当する場合に、当該抽出結合先データを選択結合先データとして選択することを特徴とする。
この場合には、結合元データに結合される結合先データの候補をキー項目の値により抽出結合先データとして抽出した後に、抽出結合先データのうち、識別項目の値が一致するもの、または当該抽出結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に結合元データに含まれる識別項目の値が該当するものを結合元データに結合させるので、データ結合の精度をより向上させることが可能となる。
また、本発明のデータ結合システムでは、データ判定手段は、抽出結合先データに含まれる識別項目の値が、結合元データに含まれる識別項目の値と一致せず、且つ当該抽出結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に結合元データに含まれる識別項目の値が該当しなかった場合には、第1の所定の範囲に隣接する第2の所定の範囲を設定するような値を当該キー項目として有する他の結合先データを結合先データ記憶手段から抽出結合先データとして再抽出し、再抽出された抽出結合先データから識別項目の値が結合元データに含まれる識別項目の値と一致または当該抽出結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当する当該抽出結合先データを選択結合先データとして選択することを特徴とする。
この構成では、結合元データの識別項目の値が、キー項目において第1の所定の範囲に基づいて抽出したいずれの抽出結合先データの識別項目の値と一致または当該抽出結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当しなかった場合であっても、第1の所定の範囲に隣接する第2の所定の範囲に基づいてキー項目において再度抽出した抽出結合先データの中に結合元データと識別項目の値が一致または当該抽出結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当する抽出結合先データが存在すれば、当該抽出結合先データが結合元データに結合させる選択結合先データとして選択されるので、データ結合の成功率をさらに向上させることが可能となる。即ち、この構成では、結合元データの識別項目の値が一致または当該抽出結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当する結合先データが、キー項目において第1の所定の範囲に基づいて抽出した抽出結合先データの中に存在する場合、または、第1の所定の範囲に基づいて抽出した抽出結合先データの中に存在せず、第2の所定の範囲に基づいて抽出した抽出結合先データの中に存在する場合に、当該抽出結合先データが結合元データに結合させる選択結合先データとして選択されるので、結合対象となる結合先データを選択できずに当該結合元データに関する結合処理が失敗となることを防止することができる。
また、本発明のデータ結合システムでは、キー項目は、日時に関する項目であり、第1の所定の範囲は、キー項目の値の日時を含む所定の期間であることを特徴とする。この構成によれば、日時に対応付けられた結合元データに、所定の期間に対応付けられた結合先データを結合させることが可能となる。
本発明のデータ結合システム及びデータ結合方法によれば、結合元データに結合先データを結合させるに際して、識別項目が一致または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当していることに加えて、結合先データのキー項目の値に基づいて設定された第1の所定の範囲に結合元データのキー項目の値が該当する場合に当該結合先データを選択結合先データとして結合元データに結合させるので、データ結合の成功率を向上させることが可能となる。また、第1の所定の範囲は、結合先データのキー項目の値に基づいて設定された範囲なので、結合精度を向上させることができる。従って、データ結合の処理において、結合されるデータの結合精度を向上させながら、データ結合の成功率を向上させることが可能となる。
データ結合システムの実施形態に係るサーバの機能ブロック図である。 サーバのハードブロック図である。 テーブル記憶部に記憶されるテーブルA並びにテーブルB1及びテーブルB2の構成の一例を示す図である。 テーブル記憶部に記憶されるテーブルCの構成の一例を示す図である。 サーバにおいて実施されるデータ結合方法の処理内容を示すフローチャートである。 サーバにおいて実施される他の実施形態に係るデータ結合方法の処理内容を示すフローチャートである。
1…サーバ、10…ユーザ要求取得部、11…テーブル判定部、12…データ読み取り部、13…データ結合部、14…データ書き出し部、15…ユーザ結果出力部、16…テーブル記憶部。
本発明の実施形態に係るデータ結合システムについて図面を参照して説明する。なお、可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
(第1実施形態)
図1は、データ結合システムの一実施形態に係るサーバ1の機能的構成を示すブロック図である。サーバ1は、複数のキー項目を含む結合元データと、複数のキー項目を含む結合先データを複数有する結合先データ群から選択した選択結合先データとを結合する装置であって、機能的には、ユーザ要求取得部10、テーブル判定部11(データ判定手段)、データ読み取り部12、データ結合部13(データ結合手段)、データ書き出し部14(データ書き出し手段)、ユーザ結果出力部15及びテーブル記憶部16(結合元データ記憶手段、結合先データ記憶手段、合成データ記憶手段)を備える。
また、図2は、サーバ1のハードウエア構成図である。サーバ1は、物理的には、図2に示すように、CPU101、主記憶装置であるRAM102及びROM103、ハードディスク、フラッシュメモリ等の補助記憶装置105、入力デバイスであるキーボード及びマウス等の入力装置106、ディスプレイ等の出力装置107、ネットワークカード等のデータ送受信デバイスである通信モジュール104などを含むコンピュータシステムとして構成されている。図1に示した各機能は、図2に示すCPU101、RAM102等のハードウエア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU101の制御のもとで通信モジュール104、入力装置106、出力装置107を動作させるとともに、RAM102や補助記憶装置105におけるデータの読み出し及び書き込みを行うことで実現される。
なお、本実施形態では、上記の各機能部10〜16が、サーバ1に備えられていることとしているが、ネットワークを介して相互に通信可能な複数のサーバに分散して構成され、本発明のデータ結合システムが複数のサーバにより構成されることとしても良い。
まず、各機能部10〜15の説明に先立って、テーブル記憶部16に記憶されているテーブルについて説明する。テーブル記憶部16は、図1に示す例では、テーブルA、テーブルB1、テーブルB2及びテーブルCを記憶している。また、テーブルB1及びテーブルB2はテーブルB群を構成する。なお、テーブル記憶部16に記憶されたテーブルAは、本発明における結合元データ記憶手段を構成し、テーブルAに含まれるレコードaは、本発明における結合元データを構成する。また、テーブル記憶部16に記憶されたテーブルB1,B2は、本発明における結合先データ記憶手段を構成し、テーブルB群に記憶された複数のレコードbは、本発明における結合先データ群を構成し、テーブルB1及びテーブルB2に含まれるレコードbは、本発明における結合先データを構成する。テーブル記憶部16に記憶されたテーブルCは、本発明における合成データをレコードとして記憶する合成データ記憶手段を構成する。
テーブルAの構成の一例を図3(a)に示す。テーブルAは、移動端末を収容する基地局及び交換機により取得された移動端末の位置情報を記憶するテーブルであり、項目として、「ユーザID」、「日時」及び「位置」を有している。項目「ユーザID」は、移動端末のユーザの識別子であり、項目「日時」は、そのレコードが取得された日付であり、項目「位置」は、移動端末の所在位置に関する情報である。そして、テーブルAは、図3(a)に示す例では、レコードa1,a2,a3を記憶している。
テーブルB1の構成の一例を図3(b)に示す。テーブルB1は、移動端末の通信サービスの提供者において、「7月」末の時点における移動端末の契約者の属性情報を記憶するテーブルである。テーブルB1は、項目として、「ユーザID」、「性別」及び「生年月日」を有している。項目「ユーザID」は、移動端末のユーザの識別子であり、項目「性別」は、ユーザの性別であり、項目「生年月日」は、ユーザの生年月日である。また、テーブルB1は、属性情報取得時に関する項目「日時」を有しており、全レコードb11,b12における項目「日時」の値が「7月」であると捉えることができる。
テーブルB2の構成の一例を図3(c)に示す。テーブルB2は、移動端末の通信サービスの提供者において、「8月」末の時点における移動端末の契約者の属性情報を記憶するテーブルである。テーブルB2は、テーブルB1と同じ項目を有している。また、テーブルB2は、属性情報取得時に関する項目「日時」を有しており、全レコードb21,b22における項目「日時」の値が「8月」であると捉えることができる。
テーブルCの構成の一例を図4に示す。テーブルCは、テーブルAのレコードaに、テーブルB1,B2に記憶されたいずれかのレコードbを結合させて生成されたレコードcを記憶するテーブルである。テーブルCは、項目として、「ユーザID」、「日時」、「位置」、「性別」及び「生年月日」及び「結合したテーブル」を有する。項目「結合したテーブル」は、結合されたレコードbの取得元のテーブルを示しており、「b7(テーブルB1)」、「b8(テーブルB2)」といった値を有している。
以下、図1を用いて、サーバ1の各機能部について詳細に説明する。
ユーザ要求取得部10は、ユーザからのデータ結合の処理要求を取得する部分である。処理要求にはデータ結合に関する種々の指定事項が含まれており、例えば、「テーブルAとテーブルB群とを結合しテーブルCに出力する」、「テーブルAのレコードに対して、テーブルB群から、ユーザIDの項目が一致し、かつ日時に関する項目に基づいて所定のアルゴリズムにより抽出されるレコードを選択して結合する」、「所定のアルゴリズムの種類」及び「結合に成功したレコードのみテーブルCに出力する」といった情報が含まれる。
テーブル判定部11は、テーブルAに記憶されているレコードaに結合させるレコードbをテーブルB群から選択する部分である。テーブル判定部11が実施する処理の詳細は後述する。また、テーブル判定部11は、テーブルAから取得したレコードa及びテーブルB群から選択されたレコードbをデータ結合部13に送出する。
データ読み取り部12は、テーブル記憶部16に記憶されているテーブルA、テーブルB1及びテーブルB2を参照して、レコードを取得する部分である。データ読み取り部12は、取得したレコードをテーブル判定部に送出する。
データ結合部13は、テーブル判定部11よりレコードa及びレコードbを取得し、レコードaにレコードbを結合し、レコードcを生成する部分である。データ結合部13は、レコードcをデータ書き出し部14に送出する。
データ書き出し部14は、データ結合部13よりレコードcを取得し、取得したレコードcをテーブルCに書き出す部分である。また、データ書き出し部14は、すべてのレコードの書き出しが終了した場合には、その旨の通知をユーザ結果出力部15に送出する。
ユーザ結果出力部15は、データ書き出し部14よりレコードの書き出しが終了した旨の通知を取得し、その旨を表示する部分である。
続いて、図5を用いて、本実施形態のデータ結合方法におけるサーバ1の動作について説明する。図5は、サーバ1において行われるデータ結合の処理内容を示すフローチャートである。
まず、ユーザ要求取得部10は、ユーザからのデータ結合の処理要求を取得する(S1)。この処理要求には、例えば「テーブルAのレコードaに対して、テーブルB群から、「ユーザID」の項目が一致し、かつ「日時」に関する項目に基づいて所定のアルゴリズムにより抽出されるレコードbを選択して結合する」といった情報が含まれるものとする。なお、本実施形態では、項目「ユーザID」は、本発明における識別項目を構成し、項目「日時」は、本発明におけるキー項目を構成する。
なお、識別項目は、範囲の概念を持たない値が記憶される項目である場合と、範囲の概念を持つ値が記憶される項目である場合とがある。前者の一例としては、識別項目が、ユーザの識別子であるユーザIDを値として記憶する項目である場合が挙げられる。また、後者の一例としては、識別項目が、IPアドレスの識別子によるネットワークプレフィックスを値として記憶する項目である場合が挙げられる。本実施形態では、識別項目が範囲の概念を持たない値が記憶される項目であるとして、以下の説明をしている。また、キー項目は、連続的または離散的な値をとることが可能な項目であり、その値に関して、範囲の概念を伴うことが可能である。
次に、データ読み取り部12は、テーブル記憶部16からテーブルAを取得する(S2)。そして、テーブル判定部11は、取得したテーブルAからレコードaを取得する(S3)。ここでは、まずレコードa1が取得されたものとする。
続いて、テーブル判定部11は、レコードaの項目「日時」の値をキーとして、所定アルゴリズムを用いてテーブルB群からいずれかのテーブルBを選択する(S4)。ここで、所定アルゴリズムについて説明する。本実施形態では、以下のような2種類のアルゴリズムが存在する。
第1のアルゴリズム:取得された「日時」がn月1日〜31日の位置情報(レコードa)に対して、n月末属性情報(bn)(レコードb)を結合させる。
第2のアルゴリズム:取得された「日時」がn月16日〜(n+1)月15日の位置情報(レコードa)に対して、n月末属性情報(bn)(レコードb)を結合させる。
即ち、第1のアルゴリズムでは、レコードbに含まれる項目「日時」の値(n月)に基づいてn月1日〜31日の範囲が設定され、この範囲にレコードaの「日時」の値が含まれる場合に、当該レコードaと当該レコードbとが結合される。また、第2のアルゴリズムでは、レコードbに含まれる項目「日時」の値(n月)に基づいてn月16日〜(n+1)月15日の範囲が設定され、この範囲にレコードaの「日時」の値が含まれる場合に、当該レコードaと当該レコードbとが結合される。なお、第1のアルゴリズムにおける日時に関する期間「n月1日〜31日」、及び第2のアルゴリズムにおける日時に関する期間「n月16日〜(n+1)月15日」は、本発明における第1の所定の範囲を構成する。
ここでは第1のアルゴリズムが用いられるとすると、ステップS3において、レコードa1が選択されており、レコードa1の項目「日時」の値は「2008/8/17」であるので、8月末属性情報(b8)のテーブルB2が選択される(S4)。
続いて、テーブル判定部11は、レコードaの項目「ユーザID」の値「111」に基づき、テーブルB2から項目「ユーザID」の値が「111」であるレコードbの取得を試みる(S5)。そして、テーブル判定部11は、レコードbを取得したか否かを判定する(S6)。レコードbを取得できた場合には、処理手順はステップS10に進められ、レコードbを取得できなかった場合には、処理手順はステップS7に進められる。ここでは、レコードB2には、「ユーザID」の値が「111」であるレコードbが存在しないので(図3(c)参照)、処理手順はステップS7に進められる。
なお、本実施形態では、本発明の識別項目を構成する「ユーザID」は、範囲の概念を持たない項目であるので、テーブル判定部11は、レコードaの項目「ユーザID」の値とレコードbの「ユーザID」の値とが一致する場合に、当該レコードbを取得する。これに対して、本発明の識別項目として、「ユーザID」とは異なる、例えば「IPアドレス」に例示されるような範囲の概念を持つ項目を用いた場合には、レコードa及びレコードbの「IPアドレス」の一部(例えば上位部分)が一致する場合に、テーブル判定部11は、当該レコードbを取得することとすることができる。即ち、レコードbの「IPアドレス」の上位部分が一致するIPアドレス群により、IPアドレスの値の範囲が設定され、レコードaのIPアドレスが、その範囲に該当する場合に、テーブル判定部11は、当該レコードbを取得する。このように、本発明の識別項目として、範囲の概念を持つ項目を用いた場合には、レコードbの当該項目の値に基づいて、所定の範囲を設定することができる。ここで設定される所定の範囲は、本発明における「所定の識別範囲」を構成する。引き続き、本実施形態では、テーブル判定部11は、範囲の概念を持たない項目である「ユーザID」を用いて、レコードbを取得するための判定処理を行うこととするが、上記したように、範囲の概念を持つ項目を用いて判定処理を行うこととしてもよい。
ステップS7において、テーブル判定部11は、レコードaの項目「日時」の値に応じて、(n−1)月末属性情報(b(n−1))のテーブルBまたは(n+1)月末属性情報(b(n+1))のテーブルBを、データ読み取り部12を介して選択する(S7)。ここで、(n−1)月末属性情報(b(n−1))に基づいて設定される期間「(n−1)月1日〜31日」、または(n+1)月末属性情報(b(n+1))に基づいて設定される期間「(n+1)月1日〜31日」が、本発明における第2の所定の範囲として設定される。
具体的には、第1のアルゴリズムを用いた場合には、テーブル判定部11は、(n−1)月末属性情報(b(n−1))を選択する。これは、ユーザID「111」のユーザがn月末の時点では移動端末を解約済みであったため、n月末属性情報(bn)には、ユーザID「111」のレコードbが存在しない場合の事象である。なお、(n−1)月末属性情報(b(n−1))に対応付けられる期間「(n−1)月1日〜31日」は、本発明における第1の所定の範囲「n月1日〜31日」に隣接して設定された第2の所定の範囲を構成する。
一方、第2のアルゴリズムを用いた場合において、レコードaの項目「日時」の値が「n月16日〜n月31日」の場合には、テーブル判定部11は、(n−1)月末属性情報(b(n−1))を選択し、レコードaの項目「日時」の値が「(n+1)月1日〜(n+1)月15日」の場合には、テーブル判定部11は、(n+1)月末属性情報(b(n+1))を選択する。なお、(n−1)月末属性情報(b(n−1))に対応付けられる期間「(n−1)月16日〜n月15日」、及び(n+1)月末属性情報(b(n+1))に対応付けられる期間「(n+1)月16日〜(n+2)月15日」は、本発明における第1の所定の範囲「n月16日〜(n+1)月15日」に隣接して設定された第2の所定の範囲を構成する。
レコードaの項目「日時」の値が「n月16日〜n月31日」の場合において、「ユーザID」の値が「111」であるレコードbが存在しない場合は、ユーザID「111」のユーザがn月末の時点では移動端末を解約済みであった場合である。また、レコードaの項目「日時」の値が「(n+1)月1日〜(n+1)月15日」の場合において、「ユーザID」の値が「111」であるレコードbが存在しない場合は、ユーザID「111」のユーザがn月末より後、且つ(n+1)月15日より前の時点で移動端末の加入手続きを行った場合である。
ここでは、第1のアルゴリズムが用いられているので、テーブル判定部11は、7月末属性情報(b7)のテーブルB1を、データ読み取り部12を介して選択する(S7)。
次に、テーブル判定部11は、ステップS7において選択したテーブルBから、項目「ユーザID」の値が「111」であるレコードbの取得を試みる(S8)。そして、テーブル判定部11は、レコードbを取得したか否かを判定する(S9)。レコードbを取得できた場合には、処理手順はステップS10に進められ、レコードbを取得できなかった場合には、処理手順はステップS11に進められる。ここでは、レコードB1には、「ユーザID」の値が「111」であるレコードb11が存在するので、(図3(b)参照)、処理手順はステップS10に進められる。
ステップS10において、テーブル判定部11は、レコードaとステップS5またはステップS8において取得したレコードbとをデータ結合部13に送出する。そして、データ結合部13は、テーブル判定部より取得したレコードaとレコードbとを結合して、レコードcを生成する。一方、処理手順がステップS11に進められた場合には、データ結合部13は、レコードaのみを取得し、結合処理を実施しない(S11)。本実施形態では、処理手順はステップS10に進められ、データ結合部13は、レコードa1及びレコードb11を取得し、これらのレコードを結合する。
続いて、データ結合部13は、生成したレコードcをデータ書き出し部14に送出し、データ書き出し部14は、送出されたレコードcを取得し、テーブルCにレコードcを書き出す(S12)。本実施形態では、データ書き出し部14は、テーブルCにレコードc1を書き出す(図4参照)。なお、テーブルCには、結合処理が行われたレコードのみが書き出されることとしても良いし、結合処理が行われなかったレコードについては、未結合のレコードが書き出されることとしても良い。
続くステップS13では、テーブルAの全レコードaを取得済か否かを判定し、取得済と判定された場合には処理手順は終了し、取得済と判定されなかった場合には、処理手順はステップS3に戻る(S13)。
例えば、ステップS3においてレコードa2を取得し(図3(a)参照)、ステップS4において第1のアルゴリズムが用いられた場合における処理内容を簡単に説明する。レコードa2の項目「日時」の値は「2008/8/12」であるので、ステップS4において「8月末属性情報(b8)」のテーブルB2が選択される。レコードa2の項目「ユーザID」の値は「222」であり、テーブルB2には、項目「ユーザID」が「222」であるレコードb21は存在するので、ステップS10において、レコードa2とレコードb21とが結合されて、レコードc2がテーブルCに書き出される(図4参照)。
例えば、ステップS3においてレコードa3を取得し(図3(a)参照)、ステップS4において第2のアルゴリズムが用いられた場合における処理内容を簡単に説明する。レコードa3の項目「日時」の値は「2008/8/10」であるので、ステップS4において「7月末属性情報(b7)」のテーブルB1が第1の所定の範囲として選択される。レコードa3の項目「ユーザID」の値は「333」であり、テーブルB1には、項目「ユーザID」が「333」であるレコードbは存在しないので、ステップS7において、「8月末属性情報(b8)」のテーブルB2を第2の所定の範囲として選択する。そして、テーブルB2には、項目「ユーザID」が「333」であるレコードb22が存在するので、ステップS10において、レコードa3とレコードb22とが結合されて、レコードc3がテーブルCに書き出される(図4参照)。
(第2実施形態)
次に、図6を用いて、第2の実施形態におけるサーバ1の動作について説明する。図6は、サーバ1において行われるデータ結合方法の処理内容を示すフローチャートである。
ステップS21〜S23における処理内容は、図5におけるステップS1〜S3の処理と同様である。
続いて、テーブル判定部11は、データ読み取り部12を介して、テーブルB群に属する全てのテーブル(ここではテーブルB1,B2)から、取得したレコードaのユーザIDの値と同じ値を有するレコードb群の取得を試みる(S24)。例えば、ステップS23においてレコードa1が取得された場合には、「ユーザID」の値が「111」であるレコードb11が取得される。
続いて、テーブル判定部11は、ステップS24においてレコードb群が取得されたか否かを判定する(S25)。レコードb群を取得できた場合には、処理手順はステップS27に進められ、レコードb群をひとつも取得できなかった場合には、処理手順はステップS26に進められる。処理手順がステップS26に進められた場合には、取得したレコードaについての結合処理は実施されない。例えば、ステップS24においてレコードb11が取得された場合には、処理手順はステップS27に進められる。
次に、テーブル判定部11は、レコードaの「日時」の値をキーとして、所定アルゴリズムを用いて、第1の所定の範囲に合致するレコードbをレコードb群から選択する(S27)。例えば、ステップS24においてレコードb11が取得され、第1のアルゴリズムが用いられる場合には、レコードaに含まれる項目「日時」の値「2008/8/17」は、レコードb11の項目「日時」の値「7月」に基づいて設定される第1の所定の範囲「7月1日〜31日」に合致しないので、レコードb11は選択されない。なお、この実施形態においても、項目「日時」は、本発明におけるキー項目を構成し、項目「ユーザID」は、本発明における「識別項目」を構成する。
続くステップS28において、テーブル判定部11は、ステップS27においてレコードbが選択されたか否かを判定する。レコードbが選択された場合には、処理手順はステップS31に進められ、レコードbが選択されなかった場合には、処理手順はステップS29に進められる。例えば、ステップS27においてレコードb11が選択されなかった場合には、処理手順はステップS29に進められる。
ステップS29において、テーブル判定部11は、抽出対象とする範囲として、レコードaの項目「日時」の値に応じて、所定のアルゴリズムにより設定された第1の所定の範囲から隣接する第2の所定の範囲を設定する。
具体的には、第1のアルゴリズムを用いた場合には、第1の所定の範囲が「n月1日〜31日」である場合、第2の所定の範囲を「(n+1)月1日〜31日」に設定する。このように設定されるのは、ユーザID「111」のユーザがn月末の時点では移動端末を解約済みであったため、n月末属性情報(bn)には、ユーザID「111」のレコードbが存在しない場合である。
一方、第2のアルゴリズムを用いた場合において、第1の所定の範囲が「n月16日〜(n+1)月15日」であり、レコードaの項目「日時」の値が「(n+1)月16日〜(n+1)月31日」の場合には第2の所定の範囲を「(n+1)月16日〜(n+2)月15日」に設定する。このように設定されるのは、ユーザID「111」のユーザが、n月末の時点では移動端末を契約しており、(n+1)月末の時点までに解約した場合である。また、レコードaの項目「日時」の値が「n月1日〜n月15日」の場合には、第2の所定の範囲を「(n−1)月16日〜n月15日」に設定する。このように設定されるのは、ユーザID「111」のユーザが、(n−1)月末の時点では移動端末を未契約でおり、n月末の時点までに契約した場合である。
ここでは、テーブル判定部11は、第1の所定の範囲「7月1日〜31日」に基づき、第2の所定の範囲を「8月1日〜31日」に設定する。
続いて、テーブル判定部11は、第2の所定の範囲に基づいて、所定のアルゴリズムに合致するレコードbを、ステップS24で取得したレコードb群から選択する(S30)。本実施形態では、テーブル判定部11は、第2の所定の範囲「8月1日〜31日」にレコードaの項目「日時」の値「2008/8/17」が該当するので、結合対象のレコードとしてレコードb11を選択する。
次に、ステップS31において、テーブル判定部11は、レコードaとステップ27またはステップS30において選択したレコードbとをデータ結合部13に送出する。そして、データ結合部13は、テーブル判定部より取得したレコードaとレコードbとを結合して、レコードcを生成する(S31)。一方、処理手順がステップS26に進められた場合には、データ結合部13は、レコードaのみを取得し、結合処理を実施しない(S26)。例えば、ステップS30においてレコードb11が選択された場合には、データ結合部13は、レコードa1及びレコードb11を取得し、これらのレコードを結合する。
続いて、データ結合部13は、生成したレコードcをデータ書き出し部14に送出し、データ書き出し部14は、送出されたレコードcを取得し、テーブルCにレコードcを書き出す(S32)。ここでは、データ書き出し部14は、テーブルCにレコードc1を書き出す(図4参照)。
ステップS33において実施される処理内容は、図5におけるステップS13と同様である。なお、ステップS23〜S33において実施される処理は、図6に示すように繰り返して実施されることとしても良いし、テーブルAに記憶されている全てのレコードaに対して並列に行われることとしても良い。並列に行われることとした場合には、それぞれの処理をネットワークを介して通信可能な複数のサーバ装置に割り振って実施させることが可能である。
(第3実施形態)
また、図6を用いて説明した例では、項目「日時」の値をキー項目として用いてレコードbの選択を行っているが、レコードa及びレコードbに含まれるその他の複数の項目をキー項目として用いて、ステップS27〜S30の処理を項目毎に実施することによりレコードbの選択を行うこととしてもよい。
具体的には、レコードa及びレコードbが、複数(n個)の項目を有する場合には、ステップS27〜S30の処理を各項目についてn回繰り返して実施する。レコードaに含まれる複数の項目のそれぞれの値が、ステップS24で取得されたレコードb群に含まれる複数の項目の値に基づいて設定されたそれぞれの第1の所定の範囲に該当する場合に、当該レコードbがレコードaと結合させるレコードとして選択される。それぞれの項目に関して、レコードaに含まれる項目のそれぞれの値が、レコードbに含まれる複数の項目の値に基づいて設定されたそれぞれの第1の所定の範囲に該当しない場合であっても、第1の所定の範囲に隣接して設定されたそれぞれの第2の所定の範囲に該当する場合には、当該レコードbがレコードaと結合させるレコードとして選択される。換言すれば、レコードbに含まれる複数の項目の値に基づいて設定されたそれぞれの第1の所定の範囲、または該第1の所定の範囲に隣接して設定されたそれぞれの第2の所定の範囲に、レコードaに含まれる複数の項目のそれぞれの値が該当する場合に、当該レコードbがレコードaと結合させるレコードとして選択される。なお、この場合には、項目「日時」及び上記の複数の項目は、本発明における複数のキー項目を構成する。
この場合には、レコードa及びレコードbが複数の項目を有する場合であっても、レコードaのそれぞれの項目がレコードbにおけるそれぞれの項目に関して設定された所定の範囲に該当する場合に、当該レコードbをレコードaに結合させるレコードとして選択するので、結合されるレコードaとレコードbとの結合精度を保ちながら、データ結合の成功率を向上させることが可能となる。
続いて、以上説明したデータ結合システム及びデータ結合方法の作用効果について説明する。本実施形態のデータ結合システム及びデータ結合方法では、レコードaにレコードbを結合させるに際して、ユーザIDが一致していることに加えて、レコードbの項目「日時」の値に基づいて設定された第1の所定の範囲にレコードaの項目「日時」の値が該当するとテーブル判定部11が判定した場合に、データ結合部13によりレコードbがレコードaに結合されるので、データ結合の成功率を向上させることが可能となる。また、テーブル判定部11により、レコードbに含まれる項目「日時」の値に基づいて第1の所定の範囲が設定されるので、結合精度を向上させることができる。
また、レコードaの「日時」の項目の値が、レコードbの「日時」の項目の値に関する第1の所定の範囲に該当しなかった場合であっても、第1の所定の範囲に隣接する第2の所定の範囲に該当すれば、レコードbがレコードaに結合させるレコードとしてテーブル判定部11により選択されるので、データ結合の成功率を向上させることが可能となる。
さらに、レコードa及びレコードbが複数の項目を有するデータであった場合であっても、レコードaのそれぞれの項目がレコードbにおけるそれぞれの項目に関して設定された第1または第2の所定の範囲に該当する場合に、テーブル判定部11は、レコードbをレコードaに結合させるデータとして選択するので、結合されるレコードbとレコードaとの結合精度を向上させながら、データ結合の成功率を向上させることが可能となる。
本発明は、データ結合の処理において、結合されるデータの結合精度を向上させながら、データ結合の成功率を向上させることが可能にする。

Claims (9)

  1. 識別項目及びキー項目を含む結合元データと、識別項目及びキー項目を含む結合先データを複数有する結合先データ群から選択した一の前記結合先データである選択結合先データとを結合するデータ結合システムであって、
    前記結合元データを記憶する結合元データ記憶手段と、
    前記結合先データ群を記憶する結合先データ記憶手段と、
    前記結合元データ記憶手段に記憶されている一の結合元データに含まれる識別項目の値が、前記結合先データ記憶手段に記憶されている結合先データに含まれる識別項目の値と一致または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当し、且つ当該結合元データに含まれるキー項目の値が、当該結合先データに含まれるキー項目の値に基づいて設定された第1の所定の範囲に該当する場合に、当該結合先データを前記選択結合先データとして選択するデータ判定手段と、
    前記データ判定手段により選択された前記選択結合先データを前記結合元データに結合し、合成データを生成するデータ結合手段と、
    前記合成データを記憶する合成データ記憶手段と、
    前記データ結合手段により生成された前記合成データを、前記合成データ記憶手段に記憶させるデータ書き出し手段とを備え、
    前記所定の識別範囲は、前記結合先データに含まれる識別項目の値を含む有限の範囲であり、
    前記第1の所定の範囲は、前記結合先データに含まれるキー項目の値を含む有限の範囲であり、
    前記データ判定手段は、
    前記第1の所定の範囲に基づき前記選択結合先データを選択できなかった場合には、前記一の結合元データに含まれる識別項目の値が、前記結合先データ記憶手段に記憶されている結合先データに含まれる識別項目の値と一致または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当し、且つ当該結合元データに含まれるキー項目の値が、前記第1の所定の範囲に隣接して設定された第2の所定の範囲に該当する場合に、当該結合先データを前記選択結合先データとして選択する
    ことを特徴とするデータ結合システム。
  2. 前記データ判定手段は、
    前記結合先データ記憶手段に記憶されている複数の前記結合先データから、前記結合先データに含まれる識別項目の値が、前記結合元データに含まれる識別項目の値と一致、または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に前記結合元データに含まれる識別項目の値が該当する結合先データを抽出結合先データとして抽出し、
    前記結合元データに含まれるキー項目の値が、前記抽出結合先データに含まれるキー項目の値に基づいて設定された前記第1の所定の範囲に該当する場合に、当該抽出結合先データを前記選択結合先データとして選択し、
    前記結合元データに含まれるキー項目の値が、前記抽出結合先データに含まれるキー項目の値に基づいて設定された前記第1の所定の範囲に該当しなかった場合には、前記第1の所定の範囲に隣接して設定された第2の所定の範囲に前記結合元データに含まれるキー項目の値が該当する場合に、当該抽出結合先データを前記選択結合先データとして選択する
    ことを特徴とする請求項1に記載のデータ結合システム。
  3. 前記結合元データ及び結合先データは、複数のキー項目を含み、
    前記データ判定手段は、
    前記抽出結合先データに含まれる複数のキー項目の値に基づいて設定されたそれぞれの前記第1の所定の範囲、または該第1の所定の範囲に隣接して設定されたそれぞれの第2の所定の範囲に、前記結合元データに含まれる複数のキー項目のそれぞれの値が該当する場合に、当該抽出結合先データを前記選択結合先データとして選択する
    ことを特徴とする請求項2に記載のデータ結合システム。
  4. 前記結合先データ群は、複数のテーブルを含み、
    各々の前記テーブルは、同一のキー項目の値を有する複数の結合先データを有する
    ことを特徴とする請求項1〜3のいずれか1項に記載のデータ結合システム。
  5. 前記データ判定手段は、
    前記結合先データ記憶手段に記憶されている複数の前記結合先データから、前記結合元データに含まれるキー項目の値が前記第1の所定の範囲に該当する結合先データを抽出結合先データとして抽出し、
    前記抽出結合先データに含まれる識別項目の値が、前記結合元データに含まれる識別項目の値と一致、または当該抽出結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に前記結合元データに含まれる識別項目の値が該当する場合に、当該抽出結合先データを前記選択結合先データとして選択し、
    前記抽出結合先データに含まれる識別項目の値が、前記結合元データに含まれる識別項目の値と一致せず、且つ当該抽出結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に前記結合元データに含まれる識別項目の値が該当しなかった場合には、前記第1の所定の範囲に隣接する第2の所定の範囲を設定するような値を当該キー項目として有する他の結合先データを前記結合先データ記憶手段から前記抽出結合先データとして再抽出し、再抽出された抽出結合先データから識別項目の値が前記結合元データに含まれる識別項目の値と一致または当該抽出結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当する当該抽出結合先データを選択結合先データとして選択する
    ことを特徴とする請求項1に記載のデータ結合システム。
  6. 前記結合先データ群は、キー項目毎の複数のテーブルを含み、各々の前記テーブルは、同一のキー項目の値を有する複数の結合先データを有し、
    前記データ判定手段は、
    前記結合元データに含まれるキー項目の値が、前記結合先データ群に含まれる前記テーブルのキー項目の値に基づき設定された前記第1の所定の範囲に該当する場合に、当該テーブルを第1のテーブルとして抽出し、
    抽出された当該第1のテーブルが有する前記結合先データの識別項目の値が、前記結合元データに含まれる識別項目の値と一致、または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に前記結合元データに含まれる識別項目の値が該当する場合に、当該結合先データを前記選択結合先データとして選択し、
    前記第1のテーブルから選択結合先データを選択できなかった場合には、前記第1の所定の範囲に隣接する第2の所定の範囲を設定するような値を当該キー項目として有するテーブルを前記結合先データ群から第2のテーブルとして抽出し、
    抽出された当該第2のテーブルが有する前記結合先データの識別項目の値が、前記結合元データに含まれる識別項目の値と一致、または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に前記結合元データに含まれる識別項目の値が該当する場合に、当該結合先データを前記選択結合先データとして選択する
    ことを特徴とする請求項5に記載のデータ結合システム。
  7. 前記キー項目は、日時に関する項目であり、前記第1及び第2の所定の範囲は、前記キー項目の値の日時を含む所定の期間であることを特徴とする請求項1〜6のいずれか1項に記載のデータ結合システム。
  8. 識別項目及びキー項目を含む結合元データと、識別項目及びキー項目を含む結合先データを複数有する結合先データ群から選択した一の前記結合先データである選択結合先データとを結合するデータ結合方法であって、
    一の結合元データに含まれる識別項目の値が、前記結合先データに含まれる識別項目の値と一致または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当し、且つ当該結合元データに含まれるキー項目の値が、当該結合先データに含まれるキー項目の値に基づいて設定された第1の所定の範囲に該当する場合に、当該結合先データを前記選択結合先データとして選択するデータ判定ステップと、
    前記データ判定ステップにおいて選択された前記選択結合先データを前記結合元データに結合し、合成データを生成するデータ結合ステップと、
    前記データ結合ステップにおいて生成された前記合成データを、前記合成データを記憶させるための合成データ記憶手段に記憶させるデータ書き出しステップとを有し、
    前記所定の識別範囲は、前記結合先データに含まれる識別項目の値を含む有限の範囲であり、
    前記第1の所定の範囲は、前記結合先データのキー項目の値を含む有限の範囲であり、
    前記データ判定ステップにおいて、
    前記第1の所定の範囲に基づき前記選択結合先データを選択できなかった場合には、前記一の結合元データに含まれる識別項目の値が、前記結合先データに含まれる識別項目の値と一致または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に該当し、且つ当該結合元データに含まれるキー項目の値が、前記第1の所定の範囲に隣接して設定された第2の所定の範囲に該当する場合に、当該結合先データを前記選択結合先データとして選択する
    ことを特徴とするデータ結合方法。
  9. 前記結合先データ群は、キー項目毎の複数のテーブルを含み、各々の前記テーブルは、同一のキー項目の値を有する複数の結合先データを有し、
    前記データ判定ステップにおいて、
    前記結合元データに含まれるキー項目の値が、前記結合先データ群に含まれる前記テーブルのキー項目の値に基づき設定された前記第1の所定の範囲に該当する場合に、当該テーブルを第1のテーブルとして抽出し、
    抽出された当該第1のテーブルが有する前記結合先データの識別項目の値が、前記結合元データに含まれる識別項目の値と一致、または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に前記結合元データに含まれる識別項目の値が該当する場合に、当該結合先データを前記選択結合先データとして選択し、
    前記第1のテーブルから選択結合先データを選択できなかった場合には、前記第1の所定の範囲に隣接する第2の所定の範囲を設定するような値を当該キー項目として有するテーブルを前記結合先データ群から第2のテーブルとして抽出し、
    抽出された当該第2のテーブルが有する前記結合先データの識別項目の値が、前記結合元データに含まれる識別項目の値と一致、または当該結合先データに含まれる識別項目の値に基づいて設定された所定の識別範囲に前記結合元データに含まれる識別項目の値が該当する場合に、当該結合先データを前記選択結合先データとして選択する
    ことを特徴とする請求項8に記載のデータ結合方法。
JP2011514382A 2009-05-19 2010-05-10 データ結合システム及びデータ結合方法 Expired - Fee Related JP5204303B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011514382A JP5204303B2 (ja) 2009-05-19 2010-05-10 データ結合システム及びデータ結合方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009121126 2009-05-19
JP2009121126 2009-05-19
JP2011514382A JP5204303B2 (ja) 2009-05-19 2010-05-10 データ結合システム及びデータ結合方法
PCT/JP2010/057893 WO2010134440A1 (ja) 2009-05-19 2010-05-10 データ結合システム及びデータ結合方法

Publications (2)

Publication Number Publication Date
JPWO2010134440A1 JPWO2010134440A1 (ja) 2012-11-08
JP5204303B2 true JP5204303B2 (ja) 2013-06-05

Family

ID=43126122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011514382A Expired - Fee Related JP5204303B2 (ja) 2009-05-19 2010-05-10 データ結合システム及びデータ結合方法

Country Status (6)

Country Link
US (1) US8386452B2 (ja)
EP (1) EP2434414A4 (ja)
JP (1) JP5204303B2 (ja)
KR (1) KR101374642B1 (ja)
CN (1) CN102422285B (ja)
WO (1) WO2010134440A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5765244B2 (ja) * 2012-01-11 2015-08-19 富士通株式会社 テーブル処理装置、テーブル処理方法、及びプログラム
KR101784265B1 (ko) * 2016-06-09 2017-10-12 주식회사 그리즐리 빅데이터의 비식별화 처리 방법
US10855767B1 (en) * 2018-03-05 2020-12-01 Amazon Technologies, Inc. Distribution of batch data to sharded readers

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11250079A (ja) * 1998-02-27 1999-09-17 Nippon Telegr & Teleph Corp <Ntt> データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体
JP2008310634A (ja) * 2007-06-15 2008-12-25 Mitsubishi Electric Corp データベース検索装置及びデータベース検索プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6901403B1 (en) * 2000-03-02 2005-05-31 Quovadx, Inc. XML presentation of general-purpose data sources
US6850947B1 (en) * 2000-08-10 2005-02-01 Informatica Corporation Method and apparatus with data partitioning and parallel processing for transporting data for data warehousing applications
US6931390B1 (en) * 2001-02-27 2005-08-16 Oracle International Corporation Method and mechanism for database partitioning
JP2002288012A (ja) * 2001-03-23 2002-10-04 Casio Comput Co Ltd ファイル結合装置、及びプログラム
US6789096B2 (en) * 2001-06-25 2004-09-07 Informatica Corporation Real time sessions in an analytic application
US20040098405A1 (en) * 2002-11-16 2004-05-20 Michael Zrubek System and Method for Automated Link Analysis
JP3660667B2 (ja) 2003-07-29 2005-06-15 株式会社東芝 データ処理装置、データ処理方法およびプログラム
JP2008197976A (ja) * 2007-02-14 2008-08-28 Fujitsu Ltd 連結情報生成プログラム及び連結情報生成方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11250079A (ja) * 1998-02-27 1999-09-17 Nippon Telegr & Teleph Corp <Ntt> データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体
JP2008310634A (ja) * 2007-06-15 2008-12-25 Mitsubishi Electric Corp データベース検索装置及びデータベース検索プログラム

Also Published As

Publication number Publication date
JPWO2010134440A1 (ja) 2012-11-08
CN102422285A (zh) 2012-04-18
KR20120022778A (ko) 2012-03-12
US8386452B2 (en) 2013-02-26
EP2434414A1 (en) 2012-03-28
KR101374642B1 (ko) 2014-03-14
US20120066207A1 (en) 2012-03-15
CN102422285B (zh) 2013-09-18
WO2010134440A1 (ja) 2010-11-25
EP2434414A4 (en) 2015-09-16

Similar Documents

Publication Publication Date Title
US11218372B2 (en) Methods, apparatuses, and computer program products for facilitating synchronization of setting configurations
CN109522330B (zh) 基于区块链的云平台数据处理方法、装置、设备及介质
JP2017207979A (ja) 改ざん検知システム、及び改ざん検知方法
US20120096030A1 (en) Method and apparatus for providing search results by using previous query
JP2022110000A (ja) コンテンツ共有サービス提供方法、その装置及びそのコンピュータプログラム
US9706006B2 (en) System and method of context aware adaption of content for a mobile device
JP5204303B2 (ja) データ結合システム及びデータ結合方法
CN107391100B (zh) 一种支持多语言账单的配置文件生成方法及装置
JP5084665B2 (ja) コンポーネント連携シナリオ統合開発環境提供システム、シナリオ作成支援方法、及び、プログラム
CN111797334A (zh) 一种网址访问方法、装置、电子设备及存储介质
JP2005115473A (ja) 関連情報提供装置
CN113778950B (zh) 授信文件的获取方法、索引服务器、查询服务器和介质
JP6178119B2 (ja) データ移行システム、及びデータ移行方法
CN105827580B (zh) 页面访问方法、装置及系统
JP6114236B2 (ja) 端末装置、電子マガジン作成システム、電子マガジン作成方法およびコンピュータプログラム
JP5324276B2 (ja) 情報取得システム、接続先情報取得サーバ及びプログラム
JP2009118236A (ja) 電話発信システム、投稿閲覧装置及び電話発信方法
JP2007108992A (ja) トランザクション分散方法、トランザクション分散プログラムおよびトランザクション分散装置
CN114648398A (zh) 凭证生成方法、装置、计算机设备和存储介质
CN116886604A (zh) 信息路由方法、装置和计算机设备
JP6259406B2 (ja) データ管理装置及びデータ管理方法
JP2022121747A (ja) データ変換装置およびデータ変換方法
JP6062891B2 (ja) 端末装置、電子マガジン作成装置、電子マガジン作成システム、電子マガジン作成方法およびコンピュータプログラム
CN116089695A (zh) 一种关键词推荐方法、装置、计算机设备及存储介质
JP2020170439A (ja) データ処理システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130214

R150 Certificate of patent or registration of utility model

Ref document number: 5204303

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160222

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees