JP6553649B2 - クラスタリング記憶方法および装置 - Google Patents
クラスタリング記憶方法および装置 Download PDFInfo
- Publication number
- JP6553649B2 JP6553649B2 JP2016569821A JP2016569821A JP6553649B2 JP 6553649 B2 JP6553649 B2 JP 6553649B2 JP 2016569821 A JP2016569821 A JP 2016569821A JP 2016569821 A JP2016569821 A JP 2016569821A JP 6553649 B2 JP6553649 B2 JP 6553649B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- sort
- column
- storage medium
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/06—Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
- G06F7/08—Sorting, i.e. grouping record carriers in numerical or other ordered sequence according to the classification of at least some of the information they carry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/217—Database tuning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0893—Caches characterised by their organisation or structure
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/221—Column-oriented storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
- G06F16/24557—Efficient disk access during query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1008—Correctness of operation, e.g. memory ordering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/16—General purpose computing application
- G06F2212/163—Server or database system
Description
記憶されるべき第1のデータをデータベースシステム内のローカルメモリに1行ずつキャッシュするステップと、
第1のソート列を決定するステップであって、ここで、第1のソート列は、ローカルメモリ内にキャッシュされているデータをソートするために使用される、ステップと、
ローカルメモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、第2のデータを第1のソート列に従ってソートするステップであって、ここで、第2のデータは、第1のデータ内の、ローカルメモリ内にキャッシュされているデータである、ステップと、
ソートされた第2のデータをデータベースシステム内の記憶媒体にクラスタリング方式で記憶するステップと
を含む。
ローカルメモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、第2のデータを第1のソート列に従ってソートするステップは、具体的には、
第2のデータの行数が第1の事前に設定された閾値以上である場合、第1のソート列に従って、第2のデータをソートするステップを含む。
ローカルメモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、第2のデータを第1のソート列に従ってソートするステップは、具体的には、
ローカルメモリの、第2のデータによって占有されるサイズが、第2の事前に設定された閾値以上である場合、第1のソート列に従って、第2のデータをソートするステップを含む。
第1のソート列の数値または第1のソート列の数値のハッシュ値に従って、第2のデータをソートするステップを含む。
ソートされた第2のデータを記憶媒体内のアイドル状態の物理ブロックにクラスタリング方式で記憶するステップであって、ここで、アイドル状態の物理ブロックは、第3のデータによって占有される物理ブロックを除く物理ブロックであり、且つ、第3のデータは、第1のデータ内の、第2のデータよりも先に記憶媒体にクラスタリング方式で記憶されているデータである、ステップを含む。
クエリ列を決定するステップと、
クエリ列が第1のソート列内の1番目のソート列である場合、第1のソート列内の1番目のソート列に従って、第1のデータに対してクエリ操作を実行するステップと
をさらに含む。
記憶媒体に記憶された第1のデータをローカルメモリに読み出すステップをさらに含み、ここで、
第1のソート列内の1番目のソート列に従って、第1のデータに対してクエリ操作を実行するステップは、具体的には、
ローカルメモリ内で、二分探索方式で、第1のソート列内の1番目のソート列に従って、第1のデータの1つ以上のデータページの各データページに対してクエリ操作を実行するステップを含む。
第2のソート列を決定するステップと、
第2のソート列が第1のソート列内の1番目のソート列である場合、第1のソート列内の1番目のソート列に従って、第1のデータに対してソート操作を実行するステップと
をさらに含む。
記憶媒体に記憶された第1のデータをローカルメモリに読み出すステップをさらに含み、ここで、
第1のソート列内の1番目のソート列に従って、第1のデータに対してソート操作を実行するステップは、具体的には、
ローカルメモリ内で、第1のソート列内の1番目のソート列に従って、第1のデータに対してマージソートを実行するステップを含む。
集約列を決定するステップと、
集約列が第1のソート列内の1番目のソート列である場合、第1のソート列内の1番目のソート列に従って、第1のデータに対して集約操作を実行するステップであって、ここで、集約操作は、最大値または最小値について第1のデータを探索する操作である、ステップと
をさらに含む。
記憶媒体に記憶された第1のデータをローカルメモリに読み出すステップをさらに含み、ここで、
第1のソート列内の1番目のソート列に従って、第1のデータに対して集約操作を実行するステップは、具体的には、
ローカルメモリ内で、第1のソート列内の1番目のソート列に従って、第1のデータの1つ以上のデータページの各データページにおける最大値または最小値を決定するステップと、
第1のデータにおける最大値または最小値を決定するために、各データページにおける最大値または最小値を連続的に比較するステップとを含む。
記憶媒体内に表を作成するステップであって、ここで、表は、第1のデータをロードするために使用される、ステップをさらに含み、ここで、
ソートされた第2のデータをデータベースシステム内の記憶媒体にクラスタリング方式で記憶するステップは、具体的には、
ソートされた第2のデータを記憶媒体にクラスタリング方式で記憶するために、ソートされた第2のデータを表に1行ずつ挿入するステップを含む。
記憶されるべき第1のデータをデータベースシステム内のローカルメモリに1行ずつキャッシュするように構成されるキャッシングユニットと、
第1のソート列を決定するように構成される決定ユニットであって、ここで、第1のソート列は、ローカルメモリ内にキャッシュされているデータをソートするために使用される、決定ユニットと、
キャッシングユニットによってローカルメモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、第2のデータを決定ユニットによって決定された第1のソート列に従ってソートするように構成される操作ユニットであって、ここで、第2のデータは、第1のデータ内の、ローカルメモリ内にキャッシュされているデータである、操作ユニットと、
操作ユニットによってソートされた第2のデータをデータベースシステム内の記憶媒体にクラスタリング方式で記憶するように構成される記憶ユニットと
を含む。
操作ユニットは、具体的には、第2のデータの行数が第1の事前に設定された閾値以上である場合、第1のソート列に従って、第2のデータをソートするように構成される。
操作ユニットは、具体的には、ローカルメモリの、第2のデータによって占有されるサイズが、第2の事前に設定された閾値以上である場合、第1のソート列に従って、第2のデータをソートするように構成される。
操作ユニットは、決定ユニットによって決定されたクエリ列が第1のソート列内の1番目のソート列である場合、第1のソート列内の1番目のソート列に従って、第1のデータに対してクエリ操作を実行するようにさらに構成される。
操作ユニットは、具体的には、ローカルメモリ内で、二分探索方式で、第1のソート列内の1番目のソート列に従って、キャッシングユニットによってキャッシュされた第1のデータの1つ以上のデータページの各データページに対してクエリ操作を実行するように構成される。
操作ユニットは、決定ユニットによって決定された第2のソート列が第1のソート列内の1番目のソート列である場合、第1のソート列内の1番目のソート列に従って、第1のデータに対してソート操作を実行するようにさらに構成される。
操作ユニットは、具体的には、ローカルメモリ内で、第1のソート列内の1番目のソート列に従って、キャッシングユニットによってキャッシュされた第1のデータに対してマージソートを実行するように構成される。
操作ユニットは、決定ユニットによって決定された集約列が第1のソート列内の1番目のソート列である場合、第1のソート列内の1番目のソート列に従って、第1のデータに対して集約操作を実行するようにさらに構成され、ここで、集約操作は、最大値または最小値について第1のデータを探索する操作である。
操作ユニットは、具体的には、ローカルメモリ内で、第1のソート列内の1番目のソート列に従って、キャッシングユニットによってキャッシュされた第1のデータの1つ以上のデータページの各データページにおける最大値または最小値を決定し、第1のデータにおける最大値または最小値を決定するために、各データページにおける最大値または最小値を連続的に比較するように構成される。
作成ユニットは、キャッシングユニットが記憶されるべき第1のデータをデータベースシステム内のローカルメモリに1行ずつキャッシュする前に、記憶媒体内に表を作成するように構成され、ここで、表は、第1のデータをロードするために使用され、且つ、
操作ユニットは、具体的には、ソートされた第2のデータを記憶媒体にクラスタリング方式で記憶するために、ソートされた第2のデータを作成ユニットによって作成された表に1行ずつ挿入するように構成される。
底層記憶媒体と、
底層記憶媒体に結合され、且つ、底層記憶媒体のキャッシュとして役割を果たすように構成されるメモリと、
メモリに結合されたプロセッサとを含み、ここで、底層記憶媒体における1つ以上のデータブロックはキャッシュ内のターゲットデータブロックにマッピングされ、プロセッサはメモリ内の命令を実行し、
記憶されるべき第1のデータをメモリに1行ずつキャッシュし、第1のソート列を決定し、メモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、第2のデータを第1のソート列に従ってソートし、ソートされた第2のデータを底層記憶媒体にクラスタリング方式で記憶するように構成され、ここで、第1のソート列は、メモリ内にキャッシュされているデータをソートするために使用され、第2のデータは、第1のデータ内の、メモリ内にキャッシュされているデータである。
プロセッサは、具体的には、第2のデータの行数が第1の事前に設定された閾値以上である場合、第1のソート列に従って、第2のデータをソートするように構成される。
プロセッサは、具体的には、メモリの、第2のデータによって占有されるサイズが、第2の事前に設定された閾値以上である場合、第1のソート列に従って、第2のデータをソートするように構成される。
Create table t(c1 int,c2 int, partial cluster key(c1,c2+1)
という文を使用してよく、ここで、表t記憶構造は、第1のソート列、すなわち、部分クラスタキーを含む。
記憶されるべき第1のデータをデータベースシステム内のローカルメモリに1行ずつキャッシュするように構成されるキャッシングユニット10と、
第1のソート列を決定するように構成される決定ユニット11であって、ここで、第1のソート列は、ローカルメモリ内にキャッシュされているデータをソートするために使用される、決定ユニット11と、
ローカルメモリ内にキャッシングユニット10によってキャッシュされている第2のデータが事前に設定された条件を満たす場合、第2のデータを決定ユニット11によって決定された第1のソート列に従ってソートするように構成される操作ユニット12であって、ここで、第2のデータは、第1のデータ内の、ローカルメモリ内にキャッシュされているデータである、操作ユニット12と、
操作ユニット12によってソートされた第2のデータをデータベースシステム内の記憶媒体にクラスタリング方式で記憶するように構成される記憶ユニット13と
を含んでよい。
操作ユニット12は、具体的には、ローカルメモリ内にキャッシングユニット10によってキャッシュされている第2のデータの行数が第1の事前に設定された閾値以上である場合、第1のソート列に従って、第2のデータをソートするように構成される。
操作ユニット12は、具体的には、ローカルメモリの、ローカルメモリ内にキャッシングユニット10によってキャッシュされている第2のデータによって占有されるサイズが、第2の事前に設定された閾値以上である場合、第1のソート列に従って、第2のデータをソートするように構成される。
操作ユニット12は、具体的には、ローカルメモリ内で、二分探索方式で、第1のソート列内の1番目のソート列に従って、キャッシングユニット10によってキャッシュされた第1のデータの1つ以上のデータページの各データページに対してクエリ操作を実行するように構成される。
操作ユニット12は、具体的には、ローカルメモリ内で、第1のソート列内の1番目のソート列に従って、キャッシングユニット10によってキャッシュされた第1のデータに対してマージソートを実行するように構成される。
操作ユニット12は、具体的には、ローカルメモリ内で、第1のソート列内の1番目のソート列に従って、キャッシングユニット10によってキャッシュされた第1のデータの1つ以上のデータページの各データページにおける最大値または最小値を決定し、第1のデータにおける最大値または最小値を決定するために、各データページにおける最大値または最小値を連続的に比較するように構成される。
作成ユニット14は、キャッシングユニット10が記憶されるべき第1のデータをデータベースシステム内のローカルメモリに1行ずつキャッシュする前に、記憶媒体内に表を作成するように構成され、ここで、表は、第1のデータをロードするために使用され、且つ、
操作ユニット12は、具体的には、ソートされた第2のデータを記憶媒体にクラスタリング方式で記憶するために、ソートされた第2のデータを作成ユニット14によって作成された表に1行ずつ挿入するように構成される。
底層記憶媒体21は、記憶されるべき第1のデータを記憶するように構成され、
メモリ22は底層記憶媒体21に結合されるとともに底層記憶媒体21のキャッシュとして役割を果たすために使用され、且つ、底層記憶媒体21における1つ以上のデータブロックはキャッシュ内のターゲットデータブロックにマッピングされることは理解されるべきであり、
プロセッサ20はメモリ22に結合され、且つ、プロセッサ20は、
記憶されるべき第1のデータをメモリ22に1行ずつキャッシュし、第1のソート列を決定し、メモリ22内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、第2のデータを第1のソート列に従ってソートし、ソートされた第2のデータを底層記憶媒体21にクラスタリング方式で記憶するためにメモリ22内の命令を実行し、ここで、第1のソート列は、メモリ22内にキャッシュされているデータをソートするために使用され、第2のデータは、第1のデータ内の、メモリ22内にキャッシュされているデータである。
プロセッサ20は、具体的には、メモリ22内にキャッシュされている第2のデータの行数が第1の事前に設定された閾値以上である場合、第1のソート列に従って、第2のデータをソートするように構成される。
プロセッサ20は、具体的には、メモリ22の、メモリ22内にキャッシュされている第2のデータによって占有されるサイズが、第2の事前に設定された閾値以上である場合、第1のソート列に従って、第2のデータをソートするように構成される。
プロセッサ20は、具体的には、メモリ22内で、二分探索方式で、第1のソート列内の1番目のソート列に従って、第1のデータの1つ以上のデータページの各データページに対してクエリ操作を実行し、クエリ結果を出力するように構成される。
プロセッサ20は、具体的には、メモリ22内で、第1のソート列内の1番目のソート列に従って、第1のデータに対してマージソートを実行し、ソートされた第1のデータを出力するように構成される。
プロセッサ20は、具体的には、メモリ22内で、第1のソート列内の1番目のソート列に従って、第1のデータの1つ以上のデータページの各データページにおける最大値または最小値を決定し、第1のデータにおける最大値または最小値を決定するために、各データページにおける最大値または最小値を連続的に比較し、最大値または最小値を出力するように構成される。
プロセッサ20は、具体的には、ソートされた第2のデータを底層記憶媒体21にクラスタリング方式で記憶するために、ソートされた第2のデータを表に1行ずつ挿入するように構成される。
10 キャッシングユニット
11 決定ユニット
12 操作ユニット
13 記憶ユニット
14 作成ユニット
20 プロセッサ
21 底層記憶媒体
22 メモリ
Claims (42)
- コンピュータノードによって実行されるクラスタリング記憶方法であって、前記方法はデータベースシステムにおいて適用され、且つ、
記憶されるべき第1のデータを前記データベースシステム内のローカルメモリに一部ずつキャッシュするステップと、
第1のソート列を決定するステップであって、前記第1のソート列は、前記ローカルメモリ内にキャッシュされているデータをソートするために使用される、ステップと、
前記ローカルメモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、前記ローカルメモリ内にキャッシュされている前記第2のデータを前記第1のソート列に従ってソートするステップであって、前記第2のデータは、前記第1のデータの一部である、ステップと、
ソートされた前記第2のデータを前記データベースシステム内の記憶媒体にクラスタリング方式で記憶するステップと、
前記記憶されるべき第1のデータが前記データベースシステム内の前記記憶媒体に全て記憶されるまで、前述のステップを繰り返し実行するステップであって、前記第1のデータは一部ずつソートされ、一部ずつソートされた前記第1のデータは前記データベースシステム内の前記記憶媒体に連続的に記憶され、それによって前記記憶媒体に記憶された前記第1のデータは部分的にシーケンシャルである、ステップと
を含む、クラスタリング記憶方法。 - 前記事前に設定された条件は、前記ローカルメモリ内にキャッシュされている前記第2のデータのデータ量と前記ローカルメモリ内の記憶用に許可されているデータ量との間の関係を表すために使用される、請求項1に記載のクラスタリング記憶方法。
- 前記事前に設定された条件は、前記第2のデータの行数が第1の事前に設定された閾値以上であることであり、且つ、
前記ローカルメモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、前記第2のデータを前記第1のソート列に従ってソートする前記ステップは、具体的には、
前記第2のデータの前記行数が前記第1の事前に設定された閾値以上である場合、前記第1のソート列に従って、前記第2のデータをソートするステップを含む、請求項1または2に記載のクラスタリング記憶方法。 - 前記事前に設定された条件は、前記ローカルメモリの、前記第2のデータによって占有されるサイズが、第2の事前に設定された閾値以上であることであり、且つ、
前記ローカルメモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、前記第2のデータを前記第1のソート列に従ってソートする前記ステップは、具体的には、
前記ローカルメモリの、前記第2のデータによって占有される前記サイズが、前記第2の事前に設定された閾値以上である場合、前記第1のソート列に従って、前記第2のデータをソートするステップを含む、請求項1または2に記載のクラスタリング記憶方法。 - 前記第1のソート列に従って、前記第2のデータをソートする前記ステップは、具体的には、
前記第1のソート列の数値または前記第1のソート列の数値のハッシュ値に従って、前記第2のデータをソートするステップを含む、請求項1乃至4のいずれか1項に記載のクラスタリング記憶方法。 - ソートされた前記第2のデータを前記データベースシステム内の記憶媒体にクラスタリング方式で記憶する前記ステップは、具体的には、
ソートされた前記第2のデータを前記記憶媒体内のアイドル状態の物理ブロックにクラスタリング方式で記憶するステップであって、前記アイドル状態の物理ブロックは、第3のデータによって占有される物理ブロックを除く物理ブロックであり、且つ、前記第3のデータは、前記第1のデータ内の、前記第2のデータよりも先に前記記憶媒体にクラスタリング方式で記憶されているデータである、ステップを含む、請求項1乃至5のいずれか1項に記載のクラスタリング記憶方法。 - 前記第1のソート列は、物理的な列および表現のうちの少なくとも1つを含む、請求項1乃至6のいずれか1項に記載のクラスタリング記憶方法。
- 前記第1のデータが前記記憶媒体に全て記憶された後、前記方法は、
クエリ列を決定するステップと、
前記クエリ列が前記第1のソート列内の1番目のソート列である場合、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してクエリ操作を実行するステップと
をさらに含む、請求項1乃至7のいずれか1項に記載のクラスタリング記憶方法。 - クエリ列を決定する前記ステップの後で、且つ、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してクエリ操作を実行する前記ステップの前に、前記方法は、
前記記憶媒体に記憶された前記第1のデータを前記ローカルメモリに読み出すステップをさらに含み、
前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してクエリ操作を実行する前記ステップは、具体的には、
前記ローカルメモリ内で、二分探索方式で、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータの1つ以上のデータページの各データページに対してクエリ操作を実行するステップを含む、請求項8に記載のクラスタリング記憶方法。 - 前記第1のデータが前記記憶媒体に全て記憶された後、前記方法は、
第2のソート列を決定するステップと、
前記第2のソート列が前記第1のソート列内の1番目のソート列である場合、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してソート操作を実行するステップと
をさらに含む、請求項1乃至7のいずれか1項に記載のクラスタリング記憶方法。 - 第2のソート列を決定する前記ステップの後で、且つ、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してソート操作を実行する前記ステップの前に、前記方法は、
前記記憶媒体に記憶された前記第1のデータを前記ローカルメモリに読み出すステップをさらに含み、
前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してソート操作を実行する前記ステップは、具体的には、
前記ローカルメモリ内で、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してマージソートを実行するステップを含む、請求項10に記載のクラスタリング記憶方法。 - 前記第1のデータが前記記憶媒体に全て記憶された後、前記方法は、
集約列を決定するステップと、
前記集約列が前記第1のソート列内の1番目のソート列である場合、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して集約操作を実行するステップであって、前記集約操作は、最大値または最小値について前記第1のデータを探索する操作である、ステップと
をさらに含む、請求項1乃至7のいずれか1項に記載のクラスタリング記憶方法。 - 集約列を決定する前記ステップの後で、且つ、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して集約操作を実行する前記ステップの前に、前記方法は、
前記記憶媒体に記憶された前記第1のデータを前記ローカルメモリに読み出すステップをさらに含み、
前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して集約操作を実行する前記ステップは、具体的には、
前記ローカルメモリ内で、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータの1つ以上のデータページの各データページにおける最大値または最小値を決定するステップと、
前記第1のデータにおける最大値または最小値を決定するために、各データページにおける前記最大値または前記最小値を連続的に比較するステップとを含む、請求項12に記載のクラスタリング記憶方法。 - 記憶されるべき第1のデータを前記データベースシステム内のローカルメモリに1行ずつキャッシュする前記ステップの前に、前記方法は、
前記記憶媒体内に表を作成するステップであって、前記表は、前記第1のデータをロードするために使用される、ステップをさらに含み、
ソートされた前記第2のデータを前記データベースシステム内の記憶媒体にクラスタリング方式で記憶する前記ステップは、具体的には、
ソートされた前記第2のデータを前記記憶媒体にクラスタリング方式で記憶するために、ソートされた前記第2のデータを前記表に1行ずつ挿入するステップを含む、請求項1に記載のクラスタリング記憶方法。 - クラスタリング記憶装置であって、前記装置はデータベースシステムにおいて適用され、且つ、
記憶されるべき第1のデータを前記データベースシステム内のローカルメモリに一部ずつキャッシュするように構成されるキャッシングユニットと、
第1のソート列を決定するように構成される決定ユニットであって、前記第1のソート列は、前記ローカルメモリ内にキャッシュされているデータをソートするために使用される、決定ユニットと、
前記キャッシングユニットによって前記ローカルメモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、前記第2のデータを前記決定ユニットによって決定された前記第1のソート列に従ってソートするように構成される操作ユニットであって、前記第2のデータは、前記第1のデータの一部である、操作ユニットと、
前記操作ユニットによってソートされた前記第2のデータを前記データベースシステム内の記憶媒体にクラスタリング方式で記憶するように構成される記憶ユニットであって、前記第1のデータは一部ずつソートされ、一部ずつソートされた前記第1のデータは前記データベースシステム内の前記記憶媒体に連続的に記憶され、それによって前記記憶媒体に記憶された前記第1のデータは部分的にシーケンシャルである、記憶ユニットと
を含む、クラスタリング記憶装置。 - 前記事前に設定された条件は、前記ローカルメモリ内にキャッシュされている前記第2のデータのデータ量と前記ローカルメモリ内の記憶用に許可されているデータ量との間の関係を表すために使用される、請求項15に記載のクラスタリング記憶装置。
- 前記事前に設定された条件は、前記第2のデータの行数が第1の事前に設定された閾値以上であることであり、且つ、
前記操作ユニットは、具体的には、前記第2のデータの前記行数が前記第1の事前に設定された閾値以上である場合、前記第1のソート列に従って、前記第2のデータをソートするように構成される、請求項15または16に記載のクラスタリング記憶装置。 - 前記事前に設定された条件は、前記ローカルメモリの、前記第2のデータによって占有されるサイズが、第2の事前に設定された閾値以上であることであり、且つ、
前記操作ユニットは、具体的には、前記ローカルメモリの、前記第2のデータによって占有される前記サイズが、前記第2の事前に設定された閾値以上である場合、前記第1のソート列に従って、前記第2のデータをソートするように構成される、請求項15または16に記載のクラスタリング記憶装置。 - 前記操作ユニットは、具体的には、前記決定ユニットによって決定された、前記第1のソート列の数値または前記第1のソート列の数値のハッシュ値に従って、前記第2のデータをソートするように構成される、請求項15乃至18のいずれか1項に記載のクラスタリング記憶装置。
- 前記記憶ユニットは、具体的には、前記操作ユニットによってソートされた前記第2のデータを前記記憶媒体内のアイドル状態の物理ブロックにクラスタリング方式で記憶するように構成され、前記アイドル状態の物理ブロックは、第3のデータによって占有される物理ブロックを除く物理ブロックであり、且つ、前記第3のデータは、前記第1のデータ内の、前記第2のデータよりも先に前記記憶媒体にクラスタリング方式で記憶されているデータである、請求項15乃至19のいずれか1項に記載のクラスタリング記憶装置。
- 前記決定ユニットによって決定された前記第1のソート列は、物理的な列および表現のうちの少なくとも1つを含む、請求項15乃至20のいずれか1項に記載のクラスタリング記憶装置。
- 前記決定ユニットは、前記記憶ユニットが前記第1のデータ全てを前記記憶媒体に記憶した後、クエリ列を決定するようにさらに構成され、且つ、
前記操作ユニットは、前記決定ユニットによって決定された前記クエリ列が前記第1のソート列内の1番目のソート列である場合、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してクエリ操作を実行するようにさらに構成される、請求項15乃至21のいずれか1項に記載のクラスタリング記憶装置。 - 前記キャッシングユニットは、前記決定ユニットが前記クエリ列を決定した後で、且つ、前記操作ユニットが前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して前記クエリ操作を実行する前に、前記記憶媒体に記憶された前記第1のデータを前記ローカルメモリに読み出すようにさらに構成され、且つ、
前記操作ユニットは、具体的には、前記ローカルメモリ内で、二分探索方式で、前記第1のソート列内の前記1番目のソート列に従って、前記キャッシングユニットによってキャッシュされた前記第1のデータの1つ以上のデータページの各データページに対してクエリ操作を実行するように構成される、請求項22に記載のクラスタリング記憶装置。 - 前記決定ユニットは、前記記憶ユニットが前記第1のデータ全てを前記記憶媒体に記憶した後、第2のソート列を決定するようにさらに構成され、且つ、
前記操作ユニットは、前記決定ユニットによって決定された前記第2のソート列が前記第1のソート列内の1番目のソート列である場合、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してソート操作を実行するようにさらに構成される、請求項15乃至21のいずれか1項に記載のクラスタリング記憶装置。 - 前記キャッシングユニットは、前記決定ユニットが前記第2のソート列を決定した後で、且つ、前記操作ユニットが前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して前記ソート操作を実行する前に、前記記憶媒体に記憶された前記第1のデータを前記ローカルメモリに読み出すようにさらに構成され、且つ、
前記操作ユニットは、具体的には、前記ローカルメモリ内で、前記第1のソート列内の前記1番目のソート列に従って、前記キャッシングユニットによってキャッシュされた前記第1のデータに対してマージソートを実行するように構成される、請求項24に記載のクラスタリング記憶装置。 - 前記決定ユニットは、前記記憶ユニットが前記第1のデータ全てを前記記憶媒体に記憶した後、集約列を決定するようにさらに構成され、且つ、
前記操作ユニットは、前記決定ユニットによって決定された前記集約列が前記第1のソート列内の1番目のソート列である場合、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して集約操作を実行するようにさらに構成され、前記集約操作は、最大値または最小値について前記第1のデータを探索する操作である、請求項15乃至21のいずれか1項に記載のクラスタリング記憶装置。 - 前記キャッシングユニットは、前記決定ユニットが前記集約列を決定した後で、且つ、前記操作ユニットが前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して前記集約操作を実行する前に、前記記憶媒体に記憶された前記第1のデータを前記ローカルメモリに読み出すようにさらに構成され、且つ、
前記操作ユニットは、具体的には、前記ローカルメモリ内で、前記第1のソート列内の前記1番目のソート列に従って、前記キャッシングユニットによってキャッシュされた前記第1のデータの1つ以上のデータページの各データページにおける最大値または最小値を決定し、前記第1のデータにおける最大値または最小値を決定するために、各データページにおける前記最大値または前記最小値を連続的に比較するように構成される、請求項26に記載のクラスタリング記憶装置。 - 前記クラスタリング記憶装置は、作成ユニットをさらに含み、
前記作成ユニットは、前記キャッシングユニットが前記記憶されるべき第1のデータを前記データベースシステム内の前記ローカルメモリに1行ずつキャッシュする前に、前記記憶媒体内に表を作成するように構成され、前記表は、前記第1のデータをロードするために使用され、且つ、
前記操作ユニットは、具体的には、ソートされた前記第2のデータを前記記憶媒体にクラスタリング方式で記憶するために、ソートされた前記第2のデータを前記作成ユニットによって作成された前記表に1行ずつ挿入するように構成される、請求項15に記載のクラスタリング記憶装置。 - 底層記憶媒体と、
前記底層記憶媒体に結合され、且つ、前記底層記憶媒体のキャッシュとして役割を果たすように構成されるメモリと、
前記メモリに結合されたプロセッサとを含むデータベースシステムであって、
記憶されるべき第1のデータを前記メモリに一部ずつキャッシュし、第1のソート列を決定し、前記メモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、ローカルメモリ内にキャッシュされている前記第2のデータを前記第1のソート列に従ってソートし、ソートされた前記第2のデータを前記底層記憶媒体にクラスタリング方式で記憶し、前記記憶されるべき第1のデータが前記データベースシステム内の前記記憶媒体に全て記憶されるまで、前述のステップを繰り返し実行するために、前記プロセッサは前記メモリ内の命令を実行し、前記第1のソート列は、前記メモリ内にキャッシュされているデータをソートするために使用され、前記第2のデータは、前記第1のデータの一部であり、前記第1のデータは一部ずつソートされ、一部ずつソートされた前記第1のデータは前記データベースシステム内の前記記憶媒体に連続的に記憶され、それによって前記記憶媒体に記憶された前記第1のデータは部分的にシーケンシャルである、データベースシステム。 - 前記事前に設定された条件は、前記メモリ内にキャッシュされている前記第2のデータのデータ量と前記メモリ内の記憶用に許可されているデータ量との間の関係を表すために使用される、請求項29に記載のデータベースシステム。
- 前記事前に設定された条件は、前記第2のデータの行数が第1の事前に設定された閾値以上であることであり、且つ、
前記メモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、前記第2のデータを前記第1のソート列に従ってソートする態様では、前記プロセッサは、具体的には、前記第2のデータの前記行数が前記第1の事前に設定された閾値以上である場合、前記第1のソート列に従って、前記第2のデータをソートするように構成される、請求項29または30に記載のデータベースシステム。 - 前記事前に設定された条件は、前記メモリの、前記第2のデータによって占有されるサイズが、第2の事前に設定された閾値以上であることであり、且つ、
前記メモリ内にキャッシュされている第2のデータが事前に設定された条件を満たす場合、前記第2のデータを前記第1のソート列に従ってソートする態様では、前記プロセッサは、具体的には、前記メモリの、前記第2のデータによって占有される前記サイズが、前記第2の事前に設定された閾値以上である場合、前記第1のソート列に従って、前記第2のデータをソートするように構成される、請求項29または30に記載のデータベースシステム。 - 前記第1のソート列に従って、前記第2のデータをソートする態様では、前記プロセッサは、具体的には、前記第1のソート列の数値または前記第1のソート列の数値のハッシュ値に従って、前記第2のデータをソートするように構成される、請求項29乃至32のいずれか1項に記載のデータベースシステム。
- ソートされた前記第2のデータを前記底層記憶媒体にクラスタリング方式で記憶する態様では、前記プロセッサは、具体的には、前記第2のデータを前記底層記憶媒体内のアイドル状態の物理ブロックにクラスタリング方式で記憶するように構成され、前記アイドル状態の物理ブロックは、第3のデータによって占有される物理ブロックを除く物理ブロックであり、且つ、前記第3のデータは、前記第1のデータ内の、前記第2のデータよりも先に前記底層記憶媒体にクラスタリング方式で記憶されているデータである、請求項29乃至33のいずれか1項に記載のデータベースシステム。
- 前記プロセッサによって決定された前記第1のソート列は、物理的な列および表現のうちの少なくとも1つを含む、請求項29乃至34のいずれか1項に記載のデータベースシステム。
- 前記プロセッサは、前記第1のデータが前記底層記憶媒体に全て記憶された後、クエリ列を決定し、前記クエリ列が前記第1のソート列内の1番目のソート列である場合、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してクエリ操作を実行するようにさらに構成される、請求項29乃至35のいずれか1項に記載のデータベースシステム。
- 前記プロセッサは、前記クエリ列を決定した後で、且つ、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して前記クエリ操作を実行する前に、前記底層記憶媒体に記憶された前記第1のデータを前記メモリに読み出し、前記メモリ内で、二分探索方式で、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータの1つ以上のデータページの各データページに対してクエリ操作を実行するようにさらに構成される、請求項36に記載のデータベースシステム。
- 前記プロセッサは、前記第1のデータが前記底層記憶媒体に全て記憶された後、第2のソート列を決定し、前記第2のソート列が前記第1のソート列内の1番目のソート列である場合、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してソート操作を実行するようにさらに構成される、請求項29乃至35のいずれか1項に記載のデータベースシステム。
- 前記プロセッサは、前記第2のソート列を決定した後で、且つ、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して前記ソート操作を実行する前に、前記底層記憶媒体に記憶された前記第1のデータを前記メモリに読み出し、前記メモリ内で、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対してマージソートを実行するようにさらに構成される、請求項38に記載のデータベースシステム。
- 前記プロセッサは、前記第1のデータが前記底層記憶媒体に全て記憶された後、集約列を決定し、前記集約列が前記第1のソート列内の1番目のソート列である場合、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して集約操作を実行するようにさらに構成され、前記集約操作は、最大値または最小値について前記第1のデータを探索する操作である、請求項29乃至35のいずれか1項に記載のデータベースシステム。
- 前記プロセッサは、前記集約列を決定した後で、且つ、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータに対して前記集約操作を実行する前に、前記底層記憶媒体に記憶された前記第1のデータを前記メモリに読み出し、前記メモリ内で、前記第1のソート列内の前記1番目のソート列に従って、前記第1のデータの1つ以上のデータページの各データページにおける最大値または最小値を決定し、前記第1のデータにおける最大値または最小値を決定するために、各データページにおける前記最大値または前記最小値を連続的に比較するようにさらに構成される、請求項40に記載のデータベースシステム。
- 前記プロセッサは、前記記憶されるべき第1のデータが前記メモリに1行ずつキャッシュされる前に、前記底層記憶媒体内に表を作成し、ソートされた前記第2のデータを前記底層記憶媒体にクラスタリング方式で記憶するために、ソートされた前記第2のデータを前記表に1行ずつ挿入するようにさらに構成され、前記表は、前記第1のデータをロードするために使用される、請求項29に記載のデータベースシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410228979.8 | 2014-05-27 | ||
CN201410228979.8A CN104021161B (zh) | 2014-05-27 | 2014-05-27 | 一种聚簇存储方法及装置 |
PCT/CN2014/092058 WO2015180432A1 (zh) | 2014-05-27 | 2014-11-24 | 一种聚簇存储方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017526027A JP2017526027A (ja) | 2017-09-07 |
JP6553649B2 true JP6553649B2 (ja) | 2019-07-31 |
Family
ID=51437915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016569821A Active JP6553649B2 (ja) | 2014-05-27 | 2014-11-24 | クラスタリング記憶方法および装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US10817258B2 (ja) |
EP (1) | EP3133505A4 (ja) |
JP (1) | JP6553649B2 (ja) |
KR (1) | KR101972645B1 (ja) |
CN (2) | CN104021161B (ja) |
RU (1) | RU2663358C2 (ja) |
WO (1) | WO2015180432A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021161B (zh) * | 2014-05-27 | 2018-06-15 | 华为技术有限公司 | 一种聚簇存储方法及装置 |
US20160306810A1 (en) * | 2015-04-15 | 2016-10-20 | Futurewei Technologies, Inc. | Big data statistics at data-block level |
CN108304408B (zh) * | 2017-01-12 | 2021-04-02 | 中国移动通信集团公司 | 一种缓存数据刷新方法及装置 |
CN107239381B (zh) * | 2017-06-07 | 2021-09-07 | 北京奇虎科技有限公司 | 崩溃信息的处理方法、装置及系统 |
CN108009195B (zh) * | 2017-10-23 | 2022-06-28 | 环亚数据技术有限公司 | 一种基于大数据的降维转换方法、电子设备、存储介质 |
KR101969652B1 (ko) * | 2017-11-17 | 2019-04-16 | 경북대학교 산학협력단 | 데이터 전달 장치, 방법과 그를 이용한 사물 인터넷 시스템, 데이터 전달 방법을 실행하기 위한 프로그램이 기록된 기록매체 및 하드웨어와 결합하여 데이터 전달 방법을 실행하기 위하여 매체에 저장된 프로그램 |
CN109918369B (zh) * | 2017-12-13 | 2024-01-23 | 金篆信科有限责任公司 | 数据存储方法及装置 |
CN110858122B (zh) * | 2018-08-23 | 2023-10-20 | 杭州海康威视系统技术有限公司 | 存储数据的方法和装置 |
CN109189763A (zh) * | 2018-09-17 | 2019-01-11 | 北京锐安科技有限公司 | 一种数据存储方法、装置、服务器及存储介质 |
CN109634955B (zh) * | 2018-11-15 | 2021-07-27 | 金蝶软件(中国)有限公司 | 数据存储方法、数据检索方法和装置 |
CN111339210B (zh) * | 2018-12-18 | 2023-04-28 | 杭州海康威视数字技术股份有限公司 | 数据聚类方法及装置 |
CN109783052B (zh) * | 2018-12-27 | 2021-11-12 | 深圳市轱辘车联数据技术有限公司 | 数据排序方法、装置、服务器及计算机可读存储介质 |
CN109949378B (zh) * | 2019-03-26 | 2021-06-08 | 中国科学院软件研究所 | 图像灰度值排序方法、装置、电子设备及计算机可读介质 |
CN112148691B (zh) * | 2019-06-27 | 2024-03-26 | 金世超 | 数据存储方法和数据存储引擎 |
CN111221917B (zh) * | 2019-10-12 | 2023-05-26 | 中国平安财产保险股份有限公司 | 智能分区存储方法、装置及计算机可读存储介质 |
CN111581929B (zh) * | 2020-04-22 | 2022-09-27 | 腾讯科技(深圳)有限公司 | 基于表格的文本生成方法及相关装置 |
CN111708954B (zh) * | 2020-05-22 | 2023-10-27 | 微梦创科网络科技(中国)有限公司 | 一种排行榜的排名方法及系统 |
CN113900622B (zh) * | 2021-09-22 | 2022-04-08 | 中国科学院国家空间科学中心 | 一种基于fpga的数据信息快速排序方法、系统、设备及存储介质 |
CN115576947A (zh) * | 2022-10-19 | 2023-01-06 | 北京力控元通科技有限公司 | 一种数据管理方法、装置、组合库、电子设备及存储介质 |
CN116150212B (zh) * | 2023-04-24 | 2023-07-07 | 苏州映赛智能科技有限公司 | 数据处理方法及设备 |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0581343A (ja) * | 1991-09-21 | 1993-04-02 | Toshiba Corp | データ処理装置 |
JPH0581342A (ja) * | 1991-09-21 | 1993-04-02 | Toshiba Corp | データ処理装置 |
US5742806A (en) * | 1994-01-31 | 1998-04-21 | Sun Microsystems, Inc. | Apparatus and method for decomposing database queries for database management system including multiprocessor digital data processing system |
US6026406A (en) * | 1997-06-04 | 2000-02-15 | Oracle Corporation | Batch processing of updates to indexes |
JP3864703B2 (ja) * | 2001-01-11 | 2007-01-10 | 豊田合成株式会社 | エアバッグとそのラッピング方法 |
US6907422B1 (en) * | 2001-12-18 | 2005-06-14 | Siebel Systems, Inc. | Method and system for access and display of data from large data sets |
US20030158842A1 (en) * | 2002-02-21 | 2003-08-21 | Eliezer Levy | Adaptive acceleration of retrieval queries |
US7370068B1 (en) * | 2002-09-04 | 2008-05-06 | Teradata Us, Inc. | Sorting of records with duplicate removal in a database system |
US6910106B2 (en) * | 2002-10-04 | 2005-06-21 | Microsoft Corporation | Methods and mechanisms for proactive memory management |
JP2005135221A (ja) * | 2003-10-31 | 2005-05-26 | Turbo Data Laboratory:Kk | 表形式データの結合方法、結合装置およびプログラム |
US8478755B2 (en) | 2006-04-20 | 2013-07-02 | Microsoft Corporation | Sorting large data sets |
US20080059492A1 (en) | 2006-08-31 | 2008-03-06 | Tarin Stephen A | Systems, methods, and storage structures for cached databases |
US8108355B2 (en) * | 2006-10-27 | 2012-01-31 | Hewlett-Packard Development Company, L.P. | Providing a partially sorted index |
US20080133493A1 (en) * | 2006-12-04 | 2008-06-05 | Michael Bender | Method for maintaining database clustering when replacing tables with inserts |
US7779058B2 (en) * | 2007-02-22 | 2010-08-17 | Ronald Raymond Shea | Method and apparatus for managing a digital inventory of multimedia files stored across a dynamic distributed network |
US8478775B2 (en) * | 2008-10-05 | 2013-07-02 | Microsoft Corporation | Efficient large-scale filtering and/or sorting for querying of column based data encoded structures |
US20100088309A1 (en) * | 2008-10-05 | 2010-04-08 | Microsoft Corporation | Efficient large-scale joining for querying of column based data encoded structures |
US10152504B2 (en) * | 2009-03-11 | 2018-12-11 | Actian Netherlands B.V. | Column-store database architecture utilizing positional delta tree update system and methods |
EP2443574A4 (en) * | 2009-06-19 | 2014-05-07 | Blekko Inc | EVOLVING CLUSTER DATABASE |
KR101102080B1 (ko) * | 2010-03-11 | 2012-01-04 | 이너비트 주식회사 | 컬럼 내의 부분 인덱싱을 이용한 임베디드 디비엠에스의 인덱스 생성 방법과 이를 이용한 데이터 검색 방법 및 데이터 소팅방법 |
WO2012034128A1 (en) * | 2010-09-10 | 2012-03-15 | Ab Initio Technology Llc | Managing data selection based on attributes |
CN102591864B (zh) * | 2011-01-06 | 2015-03-25 | 上海银晨智能识别科技有限公司 | 比对系统中的数据更新方法及装置 |
US8229917B1 (en) * | 2011-02-24 | 2012-07-24 | International Business Machines Corporation | Database query optimization using clustering data mining |
US20120310917A1 (en) * | 2011-05-31 | 2012-12-06 | International Business Machines Corporation | Accelerated Join Process in Relational Database Management System |
US8543538B2 (en) * | 2011-06-01 | 2013-09-24 | Clustrix, Inc. | Systems and methods for redistributing data in a relational database |
US20120323923A1 (en) * | 2011-06-14 | 2012-12-20 | Bank Of America Corporation | Sorting Data in Limited Memory |
CN102314505B (zh) | 2011-09-07 | 2016-04-13 | 北京人大金仓信息技术股份有限公司 | 基于偏序关系的缓冲区版本产生方法 |
CN102521304A (zh) * | 2011-11-30 | 2012-06-27 | 北京人大金仓信息技术股份有限公司 | 基于哈希的聚簇表存储方法 |
KR101867286B1 (ko) | 2012-02-27 | 2018-06-15 | 삼성전자주식회사 | 작업 부하를 고려한 하드웨어 가속화 기반의 대규모 데이터의 분산 처리 장치 및 방법 |
KR101482014B1 (ko) * | 2012-05-11 | 2015-01-14 | 네이버 주식회사 | 할당 테이블을 이용한 파일 캐시 시스템 및 방법 그리고 파일 캐시 어플리케이션을 배포하는 배포 시스템 및 배포 방법 |
US9430550B2 (en) * | 2012-09-28 | 2016-08-30 | Oracle International Corporation | Clustering a table in a relational database management system |
CN103810209B (zh) * | 2012-11-14 | 2019-05-10 | 腾讯科技(深圳)有限公司 | 一种保存数据的方法及系统 |
US9213716B2 (en) * | 2013-03-12 | 2015-12-15 | Sap Se | Hierarchical indicies |
KR101720602B1 (ko) * | 2013-08-29 | 2017-03-29 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 데이터를 저장하기 위한 방법 및 장치 |
US10133800B2 (en) * | 2013-09-11 | 2018-11-20 | Microsoft Technology Licensing, Llc | Processing datasets with a DBMS engine |
CN103577559A (zh) * | 2013-10-23 | 2014-02-12 | 华为技术有限公司 | 数据排序方法和装置 |
CN103631940B (zh) * | 2013-12-09 | 2017-02-08 | 中国联合网络通信集团有限公司 | 一种应用于hbase数据库的数据写入方法及系统 |
CN104021161B (zh) * | 2014-05-27 | 2018-06-15 | 华为技术有限公司 | 一种聚簇存储方法及装置 |
-
2014
- 2014-05-27 CN CN201410228979.8A patent/CN104021161B/zh active Active
- 2014-05-27 CN CN201810496652.7A patent/CN108897761B/zh active Active
- 2014-11-24 RU RU2016150418A patent/RU2663358C2/ru active
- 2014-11-24 JP JP2016569821A patent/JP6553649B2/ja active Active
- 2014-11-24 KR KR1020167033902A patent/KR101972645B1/ko active IP Right Grant
- 2014-11-24 WO PCT/CN2014/092058 patent/WO2015180432A1/zh active Application Filing
- 2014-11-24 EP EP14893251.0A patent/EP3133505A4/en not_active Ceased
-
2016
- 2016-11-23 US US15/360,030 patent/US10817258B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN104021161A (zh) | 2014-09-03 |
JP2017526027A (ja) | 2017-09-07 |
CN104021161B (zh) | 2018-06-15 |
CN108897761B (zh) | 2023-01-13 |
RU2016150418A3 (ja) | 2018-07-02 |
KR20160148703A (ko) | 2016-12-26 |
US10817258B2 (en) | 2020-10-27 |
CN108897761A (zh) | 2018-11-27 |
EP3133505A4 (en) | 2017-03-22 |
KR101972645B1 (ko) | 2019-08-23 |
US20170075657A1 (en) | 2017-03-16 |
WO2015180432A1 (zh) | 2015-12-03 |
EP3133505A1 (en) | 2017-02-22 |
RU2663358C2 (ru) | 2018-08-03 |
RU2016150418A (ru) | 2018-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6553649B2 (ja) | クラスタリング記憶方法および装置 | |
US10761758B2 (en) | Data aware deduplication object storage (DADOS) | |
KR101938953B1 (ko) | 빅 데이터 질의 엔진을 위한 플래시 최적화된 열 데이터 배치 및 데이터 액세스 처리 알고리즘 | |
US10552378B2 (en) | Dividing a dataset into sub-datasets having a subset of values of an attribute of the dataset | |
US20220156292A1 (en) | Systems and methods for generating and using aggregated search indices and non-aggregated value storage | |
US7689574B2 (en) | Index and method for extending and querying index | |
WO2020057272A1 (zh) | 一种索引数据存储及检索方法、装置及存储介质 | |
CN108089816B (zh) | 一种基于负载均衡的查询式重复数据删除方法及装置 | |
De Vries et al. | Robust record linkage blocking using suffix arrays and bloom filters | |
US20120254173A1 (en) | Grouping data | |
CN105989015B (zh) | 一种数据库扩容方法和装置以及访问数据库的方法和装置 | |
JP6807395B2 (ja) | プロセッサ・グリッド内の分散データ重複排除 | |
CN113535670B (zh) | 一种虚拟化资源镜像存储系统及其实现方法 | |
CN111159130A (zh) | 一种小文件合并方法及电子设备 | |
CN112148217A (zh) | 全闪存储系统的重删元数据的缓存方法、装置及介质 | |
US11880368B2 (en) | Compressing data sets for storage in a database system | |
CN107273443B (zh) | 一种基于大数据模型元数据的混合索引方法 | |
WO2024022180A1 (zh) | 网盘文档索引方法、装置、网盘及存储介质 | |
JP2015162042A (ja) | インデックス管理装置 | |
CN114281989A (zh) | 基于文本相似度的数据去重方法、装置及存储介质和服务器 | |
CN108920687B (zh) | 一种基于Lucene索引段的合并优化方法 | |
US20130290378A1 (en) | Adaptive probabilistic indexing with skip lists | |
WO2023141987A1 (zh) | 文件读取方法和装置 | |
US20230229657A1 (en) | Zero Copy Optimization for SELECT * Queries | |
CN117807174A (zh) | 索引处理方法、装置、计算机设备、介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190704 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6553649 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |