JP6112440B2 - データ区分方法および装置 - Google Patents
データ区分方法および装置 Download PDFInfo
- Publication number
- JP6112440B2 JP6112440B2 JP2016517131A JP2016517131A JP6112440B2 JP 6112440 B2 JP6112440 B2 JP 6112440B2 JP 2016517131 A JP2016517131 A JP 2016517131A JP 2016517131 A JP2016517131 A JP 2016517131A JP 6112440 B2 JP6112440 B2 JP 6112440B2
- Authority
- JP
- Japan
- Prior art keywords
- tuple
- information
- partitioning
- load
- tuples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 230
- 238000000638 solvent extraction Methods 0.000 title claims description 198
- 238000005192 partition Methods 0.000 claims description 168
- 238000012545 processing Methods 0.000 claims description 86
- 230000011218 segmentation Effects 0.000 claims description 79
- 238000010586 diagram Methods 0.000 claims description 62
- 238000004458 analytical method Methods 0.000 claims description 47
- 230000008569 process Effects 0.000 claims description 31
- 238000003709 image segmentation Methods 0.000 claims description 27
- 241001522296 Erithacus rubecula Species 0.000 claims description 5
- 238000013508 migration Methods 0.000 claims 2
- 230000005012 migration Effects 0.000 claims 2
- 238000007726 management method Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/278—Data partitioning, e.g. horizontal or vertical partitioning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
ユーザによって入力される混合負荷とデータベースの構造情報とを受信するステップであって、混合負荷は、少なくとも1つのトランザクション負荷および/または少なくとも1つの分析負荷を含み、データベースの構造情報は、混合負荷に関連する少なくとも1つのタプルを含む、ステップと、
混合負荷とデータベースの構造情報とに従ってタプル関係情報を決定するステップであって、タプル関係情報は、データベースの構造情報においていずれかの2つのタプル間のトランザクション相関を含む、ステップと、
混合負荷が並列に実行可能であるかどうかに関する特徴とタプル関係情報とに従ってタプルスプリットコスト情報を決定するステップであって、タプルスプリットコスト情報は、データベースの構造情報においてトランザクション相関を有するいずれかの2つのタプル間のスプリットコストを含み、スプリットコストは、トランザクション相関を有する2つのタプルが異なるパーティションに記憶されるとき、トランザクション相関を有する2つのタプルにアクセスすることにおける混合負荷の効率への影響の程度を示すために使用される、ステップと、
タプルスプリットコスト情報に従って複数の区分方式を取得して、これらの区分方式から、最小総コスト値をもつ区分方式を最適区分方式として決定するステップであって、各区分方式の総コスト値は、区分方式が使用されるときの、データベースの構造情報においてトランザクション相関を有するタプル間のスプリットコストの和である、ステップと、
データベースに記憶されたデータ上で区分処理を最適区分方式に従って実施するステップと
を含む。
混合負荷中に含まれる各負荷に従って順に、データベースの構造情報において、各負荷に関連するすべてのタプルを別々に決定するステップと、
各負荷に関連するすべてのタプルのうちのいずれかの2つのタプル間のトランザクション相関に従って、負荷に関連するタプル間の関係サブ情報を決定するステップと、
タプル関係情報を取得するために、混合負荷中の各負荷に関連するタプル間の関係サブ情報を収集するステップと
を含む。
特徴が、タプル関係情報においてトランザクション相関を有する2つのタプルに関連する混合負荷が並列に実行可能でないというものである場合、2つのタプル間のスプリットコストがプリセット正値であると決定するステップと、
特徴が、タプル関係情報においてトランザクション相関を有する2つのタプルに関連する混合負荷が並列に実行可能であるというものである場合、2つのタプル間のスプリットコストがプリセット負値であると決定するステップと
を含む。
複数の区分方式を決定するためにイメージセグメント化アルゴリズムを使用することによって関係図上で複数のタイプのセグメント化処理を実施するステップであって、各タイプのセグメント化処理は1つの区分方式に対応する、ステップと、
各タイプのセグメント化処理が関係図上で実施されるとき、このタイプのセグメント化処理に対応する区分方式の総コスト値を取得するために、各セグメント化された接続ラインによって接続される2つのタプル間のスプリットコストを累積するステップと、
最小総コスト値に対応する区分方式を最適区分方式として決定するステップと
を含む。
最小総コスト値に対応する区分方式を第1の区分方式として決定するステップと、
最適区分方式と第1の区分方式とに従ってタプル移動コスト情報を生成し、タプル移動コスト情報に従って、調整された区分方式を決定する、ステップと
をさらに含む。
第1の区分方式に従って最適区分方式が調整されるとき、各最適パーティションにおいて移動されるべきタプルを決定するステップであって、最適パーティションは、最適区分方式に従って決定される記憶領域である、ステップと、
移動されるべきタプルと最適パーティションとの間の調整関係に従って、移動されるべきタプルと最適パーティションとの間の移動コストを決定するステップと、
調整されたタプルスプリットコスト情報に従って、移動されるべきタプルと最適パーティションとの間のスプリットコストを決定するステップと、
移動コストとスプリットコストとに従ってタプル移動コスト情報を生成するステップと、
複数のプリセット移動区分方式を取得するためにタプル移動コスト情報に従って最適区分方式を調整するステップと、
イメージセグメント化アルゴリズムを使用することによってプリセット移動区分方式の各々に対応する調整された総コスト値を取得するステップと、
複数のプリセット移動区分方式から、最小の調整された総コスト値をもつプリセット移動区分方式を調整された区分方式として決定するステップと
を含む。
オンライン分析処理モードの各々に対応する候補区分方式を取得するために少なくとも2つのオンライン分析処理モードを使用することによってデータ区分を実施するステップと、
各候補区分方式と最適区分方式との間の差分値を決定するステップと、
最小差分値をもつ候補区分方式を現在の区分方式として決定し、現在の区分方式に従ってデータ上で区分を実施するステップと
をさらに含む。
ハッシュ関数処理、置換関数処理、ラウンドロビンアルゴリズム処理、およびレプリカ管理処理
のうちの少なくとも2つを含む。
ユーザによって入力される混合負荷とデータベースの構造情報とを受信するように構成される、受信モジュールであって、混合負荷は、少なくとも1つのトランザクション負荷および/または少なくとも1つの分析負荷を含むことと、データベースの構造情報は、混合負荷に関連する少なくとも1つのタプルを含む、受信モジュールと、
混合負荷とデータベースの構造情報とに従ってタプル関係情報を決定するように構成される、関係決定モジュール、関係決定モジュールであって、タプル関係情報は、データベースの構造情報においていずれかの2つのタプル間のトランザクション相関を含む、関係決定モジュールと、
混合負荷が並列に実行可能であるかどうかに関する特徴とタプル関係情報とに従ってタプルスプリットコスト情報を決定するように構成される、コスト決定モジュールであって、タプルスプリットコスト情報は、データベースの構造情報においてトランザクション相関を有するいずれかの2つのタプル間のスプリットコストを含み、スプリットコストは、トランザクション相関を有する2つのタプルが異なるパーティションに記憶されるとき、トランザクション相関を有する2つのタプルにアクセスすることにおける混合負荷の効率への影響の程度を示すために使用される、コスト決定モジュールと、
タプルスプリットコスト情報に従って複数の区分方式を取得し、これらの区分方式から、最小総コスト値をもつ区分方式を最適区分方式として決定するように構成される、最適選択モジュールであって、各区分方式の総コスト値は、区分方式が使用されるときの、データベースの構造情報においてトランザクション相関を有するタプル間のスプリットコストの和である、最適選択モジュールと、
データベースに記憶されたデータ上で区分処理を最適区分方式に従って実施するように構成される、区分モジュールと
を含む。
混合負荷中に含まれる各負荷に従って順に、データベースの構造情報において、各負荷に関連するすべてのタプルを別々に決定し、
各負荷に関連するすべてのタプルのうちのいずれかの2つのタプル間のトランザクション相関に従って、負荷に関連するタプル間の関係サブ情報を決定し、
タプル関係情報を取得するために、混合負荷中の各負荷に関連するタプル間の関係サブ情報を収集する
ように特に構成される。
特徴が、タプル関係情報においてトランザクション相関を有する2つのタプルに関連する混合負荷が並列に実行可能であるというものである場合、2つのタプル間のスプリットコストがプリセット負値であると決定する
ように特に構成される。
各タイプのセグメント化処理が関係図上で実施されるとき、このタイプのセグメント化処理に対応する区分方式の総コスト値を取得するために、各セグメント化された接続ラインによって接続される2つのタプル間のスプリットコストを累積し、
最小総コスト値に対応する区分方式を最適区分方式として決定する
ように特に構成される。
最小総コスト値に対応する区分方式を第1の区分方式として決定し、
最適区分方式と第1の区分方式とに従ってタプル移動コスト情報を生成し、タプル移動コスト情報に従って、調整された区分方式を決定する
ように構成される。
移動されるべきタプルと最適パーティションとの間の調整関係に従って、移動されるべきタプルと最適パーティションとの間の移動コストを決定し、
タプルスプリットコスト情報に従って、移動されるべきタプルと最適パーティションとの間のスプリットコストを決定し、
移動コストとスプリットコストとに従ってタプル移動コスト情報を生成し、
複数のプリセット移動区分方式を取得するためにタプル移動コスト情報に従って最適区分方式を調整し、
イメージセグメント化アルゴリズムを使用することによってプリセット移動区分方式の各々に対応する調整された総コスト値を取得し、
複数のプリセット移動区分方式から、最小の調整された総コスト値をもつプリセット移動区分方式を調整された区分方式として決定する
ように特に構成される。
区分モジュールが最適区分方式に従ってデータベース中のデータ上で区分処理を実施することに失敗したとき、オンライン分析処理モードの各々に対応する候補区分方式を取得するために少なくとも2つのオンライン分析処理モードを使用することによってデータ区分を実施し、
各候補区分方式と最適区分方式との間の差分値を決定し、
最小差分値をもつ候補区分方式を現在の区分方式として決定し、現在の区分方式に従ってデータ上で区分を実施する
ように構成される、差分選択モジュール
をさらに含む。
ユーザによって入力される混合負荷とデータベースの構造情報とを受信するように構成される、受信モジュール501であって、混合負荷は、少なくとも1つのトランザクション負荷および/または少なくとも1つの分析負荷を含み、データベースの構造情報は、混合負荷に関連する少なくとも1つのタプルを含む、受信モジュール501と、
混合負荷とデータベースの構造情報とに従ってタプル関係情報を決定するように構成される、関係決定モジュール502であって、タプル関係情報は、データベースの構造情報においていずれかの2つのタプル間のトランザクション相関を含む、関係決定モジュール502と、
混合負荷が並列に実行可能であるかどうかに関する特徴とタプル関係情報とに従ってタプルスプリットコスト情報を決定するように構成される、コスト決定モジュール502であって、タプルスプリットコスト情報は、データベースの構造情報においてトランザクション相関を有するいずれかの2つのタプル間のスプリットコストを含み、スプリットコストは、トランザクション相関を有する2つのタプルが異なるパーティションに記憶されるとき、トランザクション相関を有する2つのタプルにアクセスすることにおける混合負荷の効率への影響の程度を示すために使用される、コスト決定モジュール502と、
タプルスプリットコスト情報に従って複数の区分方式を取得し、これらの区分方式から、最小総コスト値をもつ区分方式を最適区分方式として決定するように構成される、最適選択モジュール504であって、各区分方式の総コスト値は、区分方式が使用されるときの、データベースの構造情報においてトランザクション相関を有するタプル間のスプリットコストの和である、最適選択モジュール504と、
データベースに記憶されたデータ上で区分処理を最適区分方式に従って実施するように構成される、区分モジュール505と
を含む。
各負荷に関連するすべてのタプルのうちのいずれかの2つのタプル間のトランザクション相関に従って、負荷に関連するタプル間の関係サブ情報を決定し、
タプル関係情報を取得するために、混合負荷中の各負荷に関連するタプル間の関係サブ情報を収集する
ように特に構成される。
特徴が、タプル関係情報においてトランザクション相関を有する2つのタプルに関連する混合負荷が並列に実行可能であるというものである場合、2つのタプル間のスプリットコストがプリセット負値であると決定する
ように特に構成される。
各タイプのセグメント化処理が関係図上で実施されるとき、このタイプのセグメント化処理に対応する区分方式の総コスト値を取得するために、各セグメント化された接続ラインによって接続される2つのタプル間のスプリットコストを累積し、
最小総コスト値に対応する区分方式を最適区分方式として決定する
ように構成される。
最小総コスト値に対応する区分方式を第1の区分方式として決定し、
最適区分方式と第1の区分方式とに従ってタプル移動コスト情報を生成し、タプル移動コスト情報に従って、調整された区分方式を決定する
ように構成される。
タプルスプリットコスト情報に従って、移動されるべきタプルと最適パーティションとの間のスプリットコストを決定し、
移動コストとスプリットコストとに従ってタプル移動コスト情報を生成し、
複数のプリセット移動区分方式を取得するためにタプル移動コスト情報に従って最適区分方式を調整し、
イメージセグメント化アルゴリズムを使用することによってプリセット移動区分方式の各々に対応する調整された総コスト値を取得し、
複数のプリセット移動区分方式から、最小の調整された総コスト値をもつプリセット移動区分方式を調整された区分方式として決定する
ようにさらに構成される。
各候補区分方式と最適区分方式との間の差分値を決定し、
最小差分値をもつ候補区分方式を現在の区分方式として決定し、現在の区分方式に従ってデータ上で区分を実施する
ように構成される。
各候補区分方式と最適区分方式との間の差分値を決定し、
最小差分値をもつ候補区分方式を現在の区分方式として決定し、現在の区分方式に従ってデータ上で区分を実施し、上記のオンライン分析処理モードは従来技術であり、例えば、ハッシュ関数処理、置換関数処理、ラウンドロビンアルゴリズム処理、およびレプリカ管理処理である
ようにさらに構成される。
502 関係決定モジュール
503 コスト決定モジュール
504 最適選択モジュール
505 区分モジュール
506 調整選択モジュール
507 差分選択モジュール
601 プロセッサ
602 受信機
603 メモリ
604 バス
Claims (15)
- データ区分方法であって、
受信機が、ユーザによって入力される混合負荷とデータベースの構造情報とを受信するステップであって、前記混合負荷は、少なくとも1つのトランザクション負荷および/または少なくとも1つの分析負荷を含み、前記データベースの前記構造情報は、前記混合負荷に関連する少なくとも1つのタプルを含む、ステップと、
プロセッサが、前記混合負荷と前記データベースの前記構造情報とに従ってタプル関係情報を決定するステップであって、前記タプル関係情報は、前記データベースの前記構造情報においていずれかの2つのタプル間のトランザクション相関を含む、ステップと、
前記プロセッサが、前記タプル関係情報と前記混合負荷が並列に実行可能であるかどうかに関する特徴とに従ってタプルスプリットコスト情報を決定するステップであって、前記タプルスプリットコスト情報は、前記データベースの前記構造情報においてトランザクション相関を有するいずれかの2つのタプル間のスプリットコストを含み、前記スプリットコストは、前記トランザクション相関を有する前記2つのタプルが異なるパーティションに記憶されるとき、前記トランザクション相関を有する前記2つのタプルにアクセスすることにおける前記混合負荷の効率への影響の程度を示すために使用される、ステップと、
前記プロセッサが、前記タプルスプリットコスト情報に従って複数の区分方式を取得して、前記区分方式から、最小総コスト値をもつ区分方式が最適区分方式であると決定するステップであって、各区分方式の総コスト値は、前記区分方式が使用されるときの、前記データベースの前記構造情報においてトランザクション相関を有するタプル間のスプリットコストの和である、ステップと、
前記プロセッサが、前記データベースに記憶されたデータ上で区分処理を前記最適区分方式に従って実施するステップと
を含む、データ区分方法。 - 前記混合負荷と前記データベースの前記構造情報とに従って前記タプル関係情報を決定するステップは、
前記プロセッサが、前記混合負荷中に含まれる各負荷に従って、前記データベースの前記構造情報において、前記各負荷に関連するタプルを別々に決定するステップと、
前記プロセッサが、前記各負荷に関連するすべてのタプルのうちのいずれかの2つのタプル間のトランザクション相関に従って、前記各負荷に関連するタプル間の関係サブ情報を決定するステップと、
前記タプル関係情報を取得するために、前記混合負荷中の各負荷に関連するタプル間の関係サブ情報を収集するステップと
を含む、請求項1に記載のデータ区分方法。 - 前記タプル関係情報と前記混合負荷が並列に実行可能であるかどうかに関する特徴とに従ってタプルスプリットコスト情報を決定する前記ステップは、
前記特徴が、前記タプル関係情報においてトランザクション相関を有する2つのタプルに関連する前記混合負荷が並列に実行可能でないというものであるとき、前記2つのタプル間のスプリットコストがプリセット正値であると決定するステップと、
前記特徴が、前記タプル関係情報においてトランザクション相関を有する2つのタプルに関連する前記混合負荷が並列に実行可能であるというものであるとき、前記2つのタプル間のスプリットコストがプリセット負値であると決定するステップと
を含む、請求項1または2に記載のデータ区分方法。 - 前記タプルスプリットコスト情報は関係図によって表され、前記関係図においてトランザクション相関を有するいずれかの2つのタプルは接続ラインによって接続され、前記タプルスプリットコスト情報に従って複数の区分方式を取得して、前記区分方式から、最小総コスト値をもつ区分方式が最適区分方式であると決定する前記ステップは、
複数の区分方式を決定するためにイメージセグメント化アルゴリズムを使用することによって前記関係図上で複数のタイプのセグメント化処理を実施するステップであって、各タイプのセグメント化処理は1つの区分方式に対応する、ステップと、
各タイプのセグメント化処理が前記関係図上で実施されるとき、各タイプのセグメント化処理に対応する区分方式の総コスト値を取得するために、各セグメント化された接続ラインによって接続される2つのタプル間のスプリットコストを累積するステップと、
最小総コスト値に対応する区分方式が最適区分方式であると決定するステップと
を含む、請求項1〜3のいずれか一項に記載のデータ区分方法。 - 前記最適区分方式に従って前記データベース中の前記データ上で区分処理が実施された後に、前記方法は、前記タプルスプリットコスト情報が、調整されたタプルスプリットコスト情報に更新されるとき、前記プロセッサが、複数の区分方式を決定するために前記イメージセグメント化アルゴリズムを使用することによって前記調整されたタプルスプリットコスト情報上で複数のタイプのセグメント化処理を実施し、各タイプのセグメント化処理は1つの区分方式に対応し、各区分方式の総コスト値を決定し、前記調整されたタプルスプリットコスト情報は関係図によって表され、前記関係図においてトランザクション相関を有するいずれかの2つのタプルは接続ラインによって接続される、ステップと、
前記プロセッサが、最小総コスト値に対応する区分方式が第1の区分方式であると決定するステップと、
前記プロセッサが、前記最適区分方式と前記第1の区分方式とに従ってタプル移動コスト情報を生成し、前記タプル移動コスト情報に従って、調整された区分方式を決定する、ステップと
を含む、請求項1〜4のいずれか一項に記載のデータ区分方法。 - 前記最適区分方式と前記第1の区分方式とに従ってタプル移動コスト情報を生成し、前記タプル移動コスト情報に従って、調整された区分方式を決定する、ステップは、
前記第1の区分方式に従って前記最適区分方式が調整されるとき、各最適パーティションにおいて移動されるべきタプルを決定するステップであって、前記最適パーティションは、前記最適区分方式に従って決定される記憶領域である、ステップと、
移動されるべき前記タプルと前記最適パーティションとの間の調整関係に従って、移動されるべき前記タプルと前記最適パーティションとの間の移動コストを決定するステップと、
前記調整されたタプルスプリットコスト情報に従って、移動されるべき前記タプルと前記最適パーティションとの間のスプリットコストを決定するステップと、
前記移動コストと前記スプリットコストとに従ってタプル移動コスト情報を生成するステップと、
複数の移動区分方式を取得するために前記タプル移動コスト情報に従って前記最適区分方式を調整するステップと、
前記イメージセグメント化アルゴリズムを使用することによって前記移動区分方式の各々に対応する調整された総コスト値を取得するステップと、
前記複数の移動区分方式から、最小の調整された総コスト値をもつ移動区分方式が前記調整された区分方式であると決定するステップと
を含む、請求項5に記載のデータ区分方法。 - 前記最適区分方式に従う前記データベース中の前記データ上での区分処理が失敗したとき、前記方法は、
前記プロセッサが、オンライン分析処理モードの各々に対応する候補区分方式を取得するために少なくとも2つの前記オンライン分析処理モードを使用することによってデータ区分を実施するステップと、
前記プロセッサが、各候補区分方式と前記最適区分方式との間の差分値を決定するステップと、
前記プロセッサが、最小差分値をもつ候補区分方式が現在の区分方式であると決定し、前記現在の区分方式に従って前記データ上で区分処理を実施するステップと
をさらに含む、請求項1から6のいずれか一項に記載のデータ区分方法。 - 前記少なくとも2つのオンライン分析処理モードは、以下のオンライン分析処理モード、
ハッシュ関数処理、置換関数処理、ラウンドロビンアルゴリズム処理、およびレプリカ管理処理
のうちの少なくとも2つを含む、請求項7に記載のデータ区分方法。 - データ区分装置であって、
ユーザによって入力される混合負荷とデータベースの構造情報とを受信する、受信モジュールであって、前記混合負荷は、少なくとも1つのトランザクション負荷および/または少なくとも1つの分析負荷を含むことと、前記データベースの前記構造情報は、前記混合負荷に関連する少なくとも1つのタプルを含む、受信モジュールと、
前記混合負荷と前記データベースの前記構造情報とに従ってタプル関係情報を決定する、関係決定モジュールであって、前記タプル関係情報は、前記データベースの前記構造情報においていずれかの2つのタプル間のトランザクション相関を含む、関係決定モジュールと、
前記タプル関係情報と前記混合負荷が並列に実行可能であるかどうかに関する特徴とに従ってタプルスプリットコスト情報を決定する、コスト決定モジュールであって、前記タプルスプリットコスト情報は、前記データベースの前記構造情報においてトランザクション相関を有するいずれかの2つのタプル間のスプリットコストを含み、前記スプリットコストは、前記トランザクション相関を有する前記2つのタプルが異なるパーティションに記憶されるとき、前記トランザクション相関を有する前記2つのタプルにアクセスすることにおける前記混合負荷の効率への影響の程度を示すために使用される、コスト決定モジュールと、
前記タプルスプリットコスト情報に従って複数の区分方式を取得し、前記区分方式から、最小総コスト値をもつ区分方式が最適区分方式であると決定する、最適選択モジュールであって、各区分方式の総コスト値は、前記区分方式が使用されるときの、前記データベースの前記構造情報においてトランザクション相関を有するタプル間のスプリットコストの和である、最適選択モジュールと、
前記データベースに記憶されたデータ上で区分処理を前記最適区分方式に従って実施する、区分モジュールと
を備える、データ区分装置。 - 前記関係決定モジュールは、
前記混合負荷中に含まれる各負荷に従って、前記データベースの前記構造情報において、前記各負荷に関連するタプルを別々に決定し、
前記各負荷に関連するすべてのタプルのうちのいずれかの2つのタプル間のトランザクション相関に従って、前記各負荷に関連するタプル間の関係サブ情報を決定し、
前記タプル関係情報を取得するために、前記混合負荷中の各負荷に関連するタプル間の関係サブ情報を収集する
ように特に構成される、請求項9に記載のデータ区分装置。 - 前記コスト決定モジュールは、前記特徴が、前記タプル関係情報においてトランザクション相関を有する2つのタプルに関連する前記混合負荷が並列に実行可能でないというものであるとき、前記2つのタプル間のスプリットコストがプリセット正値であると決定し、
前記特徴が、前記タプル関係情報においてトランザクション相関を有する2つのタプルに関連する前記混合負荷が並列に実行可能であるというものであるとき、前記2つのタプル間のスプリットコストがプリセット負値であると決定する
ように特に構成される、請求項9または10に記載のデータ区分装置。 - 前記タプルスプリットコスト情報は関係図によって表され、前記関係図においてトランザクション相関を有するいずれかの2つのタプルは接続ラインによって接続され、前記最適選択モジュールは、複数の区分方式を決定するためにイメージセグメント化アルゴリズムを使用することによって前記関係図上で複数のタイプのセグメント化処理を実施し、各タイプのセグメント化処理は1つの区分方式に対応し、
各タイプのセグメント化処理が前記関係図上で実施されるとき、各タイプのセグメント化処理に対応する区分方式の総コスト値を取得するために、各セグメント化された接続ラインによって接続される2つのタプル間のスプリットコストを累積し、
最小総コスト値に対応する区分方式が最適区分方式であると決定する
ように特に構成される、請求項9〜11のいずれか一項に記載のデータ区分装置。 - 前記装置は、前記区分モジュールが前記最適区分方式に従って前記データベース中の前記データ上で区分処理を実施した後に、前記タプルスプリットコスト情報が、調整されたタプルスプリットコスト情報に更新されるとき、複数の区分方式を決定するために前記イメージセグメント化アルゴリズムを使用することによって調整されたタプルスプリットコスト情報上で複数のタイプのセグメント化処理を実施し、各タイプのセグメント化処理は1つの区分方式に対応し、各区分方式の総コスト値を決定し、前記調整されたタプルスプリットコスト情報は関係図によって表され、前記関係図においてトランザクション相関を有するいずれかの2つのタプルは接続ラインによって接続され、
最小総コスト値に対応する区分方式が第1の区分方式であると決定し、
前記最適区分方式と前記第1の区分方式とに従ってタプル移動コスト情報を生成し、前記タプル移動コスト情報に従って、調整された区分方式を決定する
調整選択モジュールをさらに備える、請求項9〜12のいずれか一項に記載のデータ区分装置。 - 前記調整選択モジュールは、前記第1の区分方式に従って前記最適区分方式が調整されるとき、各最適パーティションにおいて移動されるべきタプルを決定し、前記最適パーティションは、前記最適区分方式に従って決定される記憶領域であり、
移動されるべき前記タプルと前記最適パーティションとの間の調整関係に従って、移動されるべき前記タプルと前記最適パーティションとの間の移動コストを決定し、
前記調整されたタプルスプリットコスト情報に従って、移動されるべき前記タプルと前記最適パーティションとの間のスプリットコストを決定し、
前記移動コストと前記スプリットコストとに従ってタプル移動コスト情報を生成し、
複数の移動区分方式を取得するために前記タプル移動コスト情報に従って前記最適区分方式を調整し、
前記イメージセグメント化アルゴリズムを使用することによって前記移動区分方式の各々に対応する調整された総コスト値を取得し、
前記複数の移動区分方式から、最小の調整された総コスト値をもつ移動区分方式を前記調整された区分方式として決定する
ように特に構成される、請求項13に記載のデータ区分装置。 - 前記装置は、
前記区分モジュールが前記最適区分方式に従って前記データベース中の前記データ上で区分処理を実施することに失敗したとき、オンライン分析処理モードの各々に対応する候補区分方式を取得するために少なくとも2つの前記オンライン分析処理モードを使用してデータ区分を実施し、
各候補区分方式と前記最適区分方式との間の差分値を決定し、
最小差分値をもつ候補区分方式を現在の区分方式として決定し、前記現在の区分方式に従って前記データ上で区分処理を実施する、差分選択モジュール
をさらに備える、請求項9から14のいずれか一項に記載のデータ区分装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310226045.6A CN103336792B (zh) | 2013-06-07 | 2013-06-07 | 数据分区方法和装置 |
CN201310226045.6 | 2013-06-07 | ||
PCT/CN2014/071039 WO2014194679A1 (zh) | 2013-06-07 | 2014-01-22 | 数据分区方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016520938A JP2016520938A (ja) | 2016-07-14 |
JP6112440B2 true JP6112440B2 (ja) | 2017-04-12 |
Family
ID=49244957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016517131A Active JP6112440B2 (ja) | 2013-06-07 | 2014-01-22 | データ区分方法および装置 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP2998883B1 (ja) |
JP (1) | JP6112440B2 (ja) |
KR (1) | KR101653776B1 (ja) |
CN (1) | CN103336792B (ja) |
TW (1) | TWI503679B (ja) |
WO (1) | WO2014194679A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103336792B (zh) * | 2013-06-07 | 2016-11-23 | 华为技术有限公司 | 数据分区方法和装置 |
CN103661495B (zh) * | 2014-01-07 | 2015-12-30 | 北京全路通信信号研究设计院集团有限公司 | 线路数据的处理方法及装置 |
US9875263B2 (en) * | 2014-10-21 | 2018-01-23 | Microsoft Technology Licensing, Llc | Composite partition functions |
WO2017209788A1 (en) * | 2016-06-03 | 2017-12-07 | Google Llc | Weighted auto-sharding |
KR101951999B1 (ko) | 2016-08-31 | 2019-05-10 | 재단법인대구경북과학기술원 | 낮은 데이터 중복으로 빠른 쿼리 처리를 지원하는 관계형 데이터베이스 저장 시스템, 저장 방법 및 관계형 데이터베이스 저장 방법에 기초한 쿼리를 처리하는 방법 |
WO2018043843A1 (ko) * | 2016-08-31 | 2018-03-08 | 재단법인대구경북과학기술원 | 낮은 데이터 중복으로 빠른 쿼리 처리를 지원하는 관계형 데이터베이스 저장 시스템, 저장 방법 및 관계형 데이터베이스 저장 방법에 기초한 쿼리를 처리하는 방법 |
CN106777230B (zh) * | 2016-12-26 | 2020-01-07 | 东软集团股份有限公司 | 一种分区系统、分区方法及装置 |
CN107515899B (zh) * | 2017-07-24 | 2020-05-22 | 北京中电普华信息技术有限公司 | 数据库联合分片方法、装置以及存储介质 |
CN108287868B (zh) * | 2017-12-19 | 2019-02-26 | 北京国电通网络技术有限公司 | 一种数据库查询、数据块划分方法和装置 |
CN111198872B (zh) * | 2020-01-06 | 2021-06-11 | 中科驭数(北京)科技有限公司 | 数据库处理事务的方法及装置 |
US11016969B1 (en) | 2020-11-25 | 2021-05-25 | Coupang Corp. | Systems and methods for managing a highly available distributed hybrid transactional and analytical database |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3183736B2 (ja) * | 1992-12-28 | 2001-07-09 | 富士通株式会社 | データベース論理データ構造の動的変更方式 |
CA2150745C (en) * | 1995-06-01 | 2001-05-01 | Chaitanya K. Baru | Method and apparatus for implementing partial declustering in a parallel database system |
CA2159269C (en) * | 1995-09-27 | 2000-11-21 | Chaitanya K. Baru | Method and apparatus for achieving uniform data distribution in a parallel database system |
US7010521B2 (en) * | 2002-05-13 | 2006-03-07 | Netezza Corporation | Optimized database appliance |
US7043621B2 (en) * | 2003-05-16 | 2006-05-09 | Hewlett-Packard Development Company, L.P. | Sharding method and apparatus using directed graphs |
ATE376167T1 (de) * | 2003-08-05 | 2007-11-15 | Harman Becker Automotive Sys | Verfahren zum verarbeiten von digitalen kartendaten |
US7814080B1 (en) * | 2003-10-27 | 2010-10-12 | Teradata Us, Inc. | Grouping database queries and/or transactions |
US7574424B2 (en) * | 2004-10-13 | 2009-08-11 | Sybase, Inc. | Database system with methodology for parallel schedule generation in a query optimizer |
TW200636511A (en) * | 2005-02-15 | 2006-10-16 | Infomato | Crosslink data structure, crosslink database, and system and method of organizing and retrieving information |
US8005836B2 (en) * | 2006-01-13 | 2011-08-23 | Teradata Us, Inc. | Method and system for performing logical partial declustering |
KR100678123B1 (ko) * | 2006-02-10 | 2007-02-02 | 삼성전자주식회사 | 관계형 데이터베이스에서의 xml 데이터 저장 방법 |
US7792822B2 (en) * | 2007-03-02 | 2010-09-07 | Microsoft Corporation | Systems and methods for modeling partitioned tables as logical indexes |
CN101145158A (zh) * | 2007-06-06 | 2008-03-19 | 中兴通讯股份有限公司 | 一种数据库表分区的方法 |
US8150850B2 (en) * | 2008-01-07 | 2012-04-03 | Akiban Technologies, Inc. | Multiple dimensioned database architecture |
CN101876983B (zh) * | 2009-04-30 | 2012-11-28 | 国际商业机器公司 | 数据库分区方法与系统 |
US8849749B2 (en) * | 2010-05-14 | 2014-09-30 | Oracle International Corporation | Load balancing in parallel database systems using multi-reordering |
US9740762B2 (en) * | 2011-04-01 | 2017-08-22 | Mongodb, Inc. | System and method for optimizing data migration in a partitioned database |
CN102799628B (zh) * | 2012-06-21 | 2015-10-07 | 新浪网技术(中国)有限公司 | 在key-value数据库中进行数据分区的方法和装置 |
CN103336792B (zh) * | 2013-06-07 | 2016-11-23 | 华为技术有限公司 | 数据分区方法和装置 |
-
2013
- 2013-06-07 CN CN201310226045.6A patent/CN103336792B/zh active Active
-
2014
- 2014-01-22 JP JP2016517131A patent/JP6112440B2/ja active Active
- 2014-01-22 KR KR1020147016634A patent/KR101653776B1/ko active IP Right Grant
- 2014-01-22 EP EP14807689.6A patent/EP2998883B1/en active Active
- 2014-01-22 WO PCT/CN2014/071039 patent/WO2014194679A1/zh active Application Filing
- 2014-06-06 TW TW103119684A patent/TWI503679B/zh active
Also Published As
Publication number | Publication date |
---|---|
EP2998883A1 (en) | 2016-03-23 |
CN103336792B (zh) | 2016-11-23 |
KR20150010694A (ko) | 2015-01-28 |
TWI503679B (zh) | 2015-10-11 |
CN103336792A (zh) | 2013-10-02 |
EP2998883B1 (en) | 2018-09-12 |
WO2014194679A1 (zh) | 2014-12-11 |
EP2998883A4 (en) | 2016-06-29 |
JP2016520938A (ja) | 2016-07-14 |
KR101653776B1 (ko) | 2016-09-02 |
TW201510754A (zh) | 2015-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6112440B2 (ja) | データ区分方法および装置 | |
US8082234B2 (en) | Closed-loop system management method and process capable of managing workloads in a multi-system database environment | |
CN108628986A (zh) | 数据查询方法、装置、计算机设备和存储介质 | |
US20160147837A1 (en) | Multisource semantic partitioning | |
EP2990962A1 (en) | Database management method and system | |
Liu et al. | Consensus model based on probability K-means clustering algorithm for large scale group decision making | |
US11182370B2 (en) | Reorganizing a data table to improve analytical database performance | |
CN111966495B (zh) | 数据处理方法和装置 | |
US9323796B2 (en) | Data partitioning method and apparatus | |
US9483377B2 (en) | Apparatus and method for enabling a user to monitor skew of resource usage across different components of a large database system | |
JP2008158748A (ja) | 変数選択装置、方法およびプログラム | |
CN104809210B (zh) | 一种基于分布式计算框架下海量数据加权top‑k查询方法 | |
US9898518B2 (en) | Computer system, data allocation management method, and program | |
US10558633B1 (en) | Hash-value-based single-pass data store statistics collection | |
CN109101621A (zh) | 一种数据的批量处理方法及系统 | |
Sun et al. | Mapreduce based location selection algorithm for utility maximization with capacity constraints | |
JPH11232278A (ja) | 情報源推薦装置 | |
Seo et al. | DARK: Deep automatic Redis knobs tuning system depending on the persistence method | |
CN115061663A (zh) | 基于客户需求的微服务划分方法、装置、电子设备及介质 | |
Le et al. | Dynamic estimation and Grid partitioning approach for Multi-Objective Optimization Problems in medical cloud federations | |
US11620271B2 (en) | Relationship analysis using vector representations of database tables | |
CN117971888B (zh) | 数据引擎的确定方法、装置、设备、存储介质及程序产品 | |
Kobashi et al. | Cerise: an RDF store with adaptive data reallocation | |
CN116881230A (zh) | 一种基于云平台的关系数据库自动优化方法 | |
Siviero et al. | Towards a Memory-Adaptive Hybrid Hash Join Design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170302 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6112440 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |