JP6207619B2 - ソース追跡によるデータのプロファイリング - Google Patents
ソース追跡によるデータのプロファイリング Download PDFInfo
- Publication number
- JP6207619B2 JP6207619B2 JP2015537694A JP2015537694A JP6207619B2 JP 6207619 B2 JP6207619 B2 JP 6207619B2 JP 2015537694 A JP2015537694 A JP 2015537694A JP 2015537694 A JP2015537694 A JP 2015537694A JP 6207619 B2 JP6207619 B2 JP 6207619B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- entries
- sets
- records
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24542—Plan optimisation
- G06F16/24544—Join order optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2365—Ensuring data consistency and integrity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本出願は、参照により本明細書に組み込まれている、2012年10月22日に出願された米国特許出願第61/716,766号の優先権を主張するものである。
Claims (20)
- データ記憶システムに記憶されたデータをプロファイリングするための方法であって、
レコードの複数の集合の各々についての定量的情報を記憶するために、前記データ記憶システムに接続されたインターフェース上で、前記データ記憶システムに記憶された前記レコードの複数の集合にアクセスするステップであって、各特定の集合についての前記定量的情報が、前記特定の集合における前記レコードの少なくとも1つの選択されたフィールドについて、値カウントエントリの対応するリストを含み、各値カウントエントリが、前記選択されたフィールドに現れる値、及び前記選択されたフィールドに前記値が現れるレコードの数のカウントを含む、アクセスするステップと、
プロファイリング要約情報を生成するために、前記集合のうちの2又は3以上の集合の前記定量的情報を処理するステップと
を含み、
前記処理するステップが、
値カウントエントリの組み合わせリストを生成するために、前記2又は3以上の集合のうちの少なくとも第1の集合及び第2の集合の各々からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリをマージするステップと、
別個のフィールド値エントリのリストを生成するために、値カウントエントリの前記組み合わせリストの値カウントエントリを集約するステップであって、前記別個のフィールド値エントリの少なくともいくつかが、前記値カウントエントリのうちの少なくとも1つからの別個の値を識別し、且つ、前記2又は3以上の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、集約するステップと
を含む、方法。 - 対応するリストの値カウントエントリをマージするステップが、前記値カウントエントリの値に基づいて、前記値カウントエントリをソートするステップを含む、請求項1に記載の方法。
- 値カウントエントリをソートするステップが、前記値カウントエントリの値に基づいて、主ソート順序によりソートするステップと、2又は3以上の集合の識別子に基づいて、副ソート順序によりソートするステップとを含む、請求項2に記載の方法。
- 集合のうちの2又は3以上の集合の定量的情報を処理するステップが、前記集合のうちの3又は4以上の集合の前記定量的情報を処理するステップを含む、請求項1に記載の方法。
- 3又は4以上の集合のうちの少なくとも2つの集合の第1のサブセットについて、別個のフィールド値エントリのリストからプロファイリング要約情報を生成するステップをさらに含む方法であって、前記プロファイリング要約情報が、前記第1のサブセットにおけるレコードのそれぞれの集合のフィールド間の結合演算の結果の複数のパターンを含む、請求項4に記載の方法。
- 3又は4以上の集合のうちの少なくとも2つの集合の、第1のサブセットとは異なる第2のサブセットについて、別個のフィールド値エントリのリストからプロファイリング要約情報を生成するステップをさらに含む方法であって、前記プロファイリング要約情報が、前記第2のサブセットにおけるレコードのそれぞれの集合のフィールド間の結合演算の結果の複数のパターンを含む、請求項5に記載の方法。
- 特定の集合に対応する値カウントエントリのリストにおける各値カウントエントリが、選択されたフィールドに値が現れるレコードの前記特定の集合内でのそれぞれの位置を識別する位置情報をさらに含む、請求項1に記載の方法。
- 処理するステップが、別個のフィールド値エントリのリストを更新するために、2又は3以上の集合のうちの第3の集合からの少なくとも1つのフィールドについて、対応するリストの値カウントエントリを読み込むステップであって、その結果、前記別個のフィールド値エントリの少なくともいくつかが、第1の集合、第2の集合、及び前記第3の集合についての対応するリストの値カウントエントリからの別個の値を識別し、且つ、前記第1の集合、前記第2の集合、及び前記第3の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、読み込むステップを含む、請求項1に記載の方法。
- データ記憶システムに記憶されたデータをプロファイリングするための、コンピュータ可読記憶媒体に記憶されたコンピュータプログラムであって、
コンピューティングシステムに、
レコードの複数の集合の各々についての定量的情報を記憶するために、前記データ記憶システムに接続されたインターフェース上で、前記データ記憶システムに記憶された前記レコードの複数の集合にアクセスさせるための命令であって、各特定の集合についての前記定量的情報が、前記特定の集合における前記レコードの少なくとも1つの選択されたフィールドについて、値カウントエントリの対応するリストを含み、各値カウントエントリが、前記選択されたフィールドに現れる値、及び前記選択されたフィールドに前記値が現れるレコードの数のカウントを含む、アクセスさせるための命令と、
プロファイリング要約情報を生成するために、前記集合のうちの2又は3以上の集合の前記定量的情報を処理させるための命令と
を含み、
前記処理することが、
値カウントエントリの組み合わせリストを生成するために、前記2又は3以上の集合のうちの少なくとも第1の集合及び第2の集合の各々からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリをマージすることと、
別個のフィールド値エントリのリストを生成するために、値カウントエントリの前記組み合わせリストの値カウントエントリを集約することであって、前記別個のフィールド値エントリの少なくともいくつかが、前記値カウントエントリのうちの少なくとも1つからの別個の値を識別し、且つ、前記2又は3以上の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、集約することと
を含む、コンピュータプログラム。 - データ記憶システムに記憶されたデータをプロファイリングするためのコンピューティングシステムであって、
レコードの複数の集合の各々についての定量的情報を記憶するために、前記データ記憶システムに記憶された前記レコードの複数の集合にアクセスするように構成された、前記データ記憶システムに接続されたインターフェースであって、各特定の集合についての前記定量的情報が、前記特定の集合における前記レコードの少なくとも1つの選択されたフィールドについて、値カウントエントリの対応するリストを含み、各値カウントエントリが、前記選択されたフィールドに現れる値、及び前記選択されたフィールドに前記値が現れるレコードの数のカウントを含む、インターフェースと、
プロファイリング要約情報を生成するために、前記集合のうちの2又は3以上の集合の前記定量的情報を処理するように構成された少なくとも1つのプロセッサと
を含み、
前記処理することが、
値カウントエントリの組み合わせリストを生成するために、前記2又は3以上の集合のうちの少なくとも第1の集合及び第2の集合の各々からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリをマージすることと、
別個のフィールド値エントリのリストを生成するために、値カウントエントリの前記組み合わせリストの値カウントエントリを集約することであって、前記別個のフィールド値エントリの少なくともいくつかが、前記値カウントエントリのうちの少なくとも1つからの別個の値を識別し、且つ、前記2又は3以上の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、集約することと
を含む、コンピューティングシステム。 - データ記憶システムに記憶されたデータをプロファイリングするためのコンピューティングシステムであって、
レコードの複数の集合の各々についての定量的情報を記憶するために、前記データ記憶システムに記憶された前記レコードの複数の集合にアクセスするための手段であって、各特定の集合についての前記定量的情報が、前記特定の集合における前記レコードの少なくとも1つの選択されたフィールドについて、値カウントエントリの対応するリストを含み、各値カウントエントリが、前記選択されたフィールドに現れる値、及び前記選択されたフィールドに前記値が現れるレコードの数のカウントを含む、アクセスするための手段と、
プロファイリング要約情報を生成するために、前記集合のうちの2又は3以上の集合の前記定量的情報を処理するための手段と
を含み、
前記処理することが、
値カウントエントリの組み合わせリストを生成するために、前記2又は3以上の集合のうちの少なくとも第1の集合及び第2の集合の各々からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリをマージすることと、
別個のフィールド値エントリのリストを生成するために、値カウントエントリの前記組み合わせリストの値カウントエントリを集約することであって、前記別個のフィールド値エントリの少なくともいくつかが、前記値カウントエントリのうちの少なくとも1つからの別個の値を識別し、且つ、前記2又は3以上の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、集約することと
を含む、コンピューティングシステム。 - データ記憶システムに記憶されたデータをプロファイリングするための方法であって、
レコードの複数の集合の各々についての定量的情報を記憶するために、前記データ記憶システムに接続されたインターフェース上で、前記データ記憶システムに記憶された前記レコードの複数の集合にアクセスするステップであって、各特定の集合についての前記定量的情報が、前記特定の集合における前記レコードの少なくとも1つの選択されたフィールドについて、値カウントエントリの対応するリストを含み、各値カウントエントリが、前記選択されたフィールドに現れる値、及び前記選択されたフィールドに前記値が現れるレコードの数のカウントを含む、アクセスするステップと、
プロファイリング要約情報を生成するために、前記集合のうちの2又は3以上の集合の前記定量的情報を処理するステップと
を含み、
前記処理するステップが、
別個のフィールド値エントリのリストを含む出力データを記憶するために、前記2又は3以上の集合のうちの第1の集合からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリを読み込むステップと、
記憶された出力データに少なくとも部分的に基づいて、更新された出力データを記憶するために、前記2又は3以上の集合のうちの第2の集合からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリを読み込むステップであって、その結果、前記別個のフィールド値エントリのうちの少なくともいくつかが、前記第1の集合及び前記第2の集合についての対応するリストの値カウントエントリからの別個の値を識別し、且つ、前記第1の集合及び前記第2の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、読み込むステップと
を含む、方法。 - 集合のうちの2又は3以上の集合の定量的情報を処理するステップが、前記集合のうちの3又は4以上の集合の前記定量的情報を処理するステップを含む、請求項12に記載の方法。
- 3又は4以上の集合のうちの少なくとも2つの集合の第1のサブセットについて、別個のフィールド値エントリのリストからプロファイリング要約情報を生成するステップをさらに含む方法であって、前記プロファイリング要約情報が、前記第1のサブセットにおけるレコードのそれぞれの集合のフィールド間の結合演算の結果の複数のパターンを含む、請求項13に記載の方法。
- 3又は4以上の集合のうちの少なくとも2つの集合の、第1のサブセットとは異なる第2のサブセットについて、別個のフィールド値エントリのリストからプロファイリング要約情報を生成するステップをさらに含む方法であって、前記プロファイリング要約情報が、前記第2のサブセットにおけるレコードのそれぞれの集合のフィールド間の結合演算の結果の複数のパターンを含む、請求項14に記載の方法。
- 特定の集合に対応する値カウントエントリのリストにおける各値カウントエントリが、選択されたフィールドに値が現れるレコードの前記特定の集合内でのそれぞれの位置を識別する位置情報をさらに含む、請求項12に記載の方法。
- 処理するステップが、別個のフィールド値エントリのリストを更新するために、2又は3以上の集合のうちの第3の集合からの少なくとも1つのフィールドについて、対応するリストの値カウントエントリを読み込むステップであって、その結果、前記別個のフィールド値エントリの少なくともいくつかが、第1の集合、第2の集合、及び前記第3の集合についての対応するリストの値カウントエントリからの別個の値を識別し、且つ、前記第1の集合、前記第2の集合、及び前記第3の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、読み込むステップを含む、請求項12に記載の方法。
- データ記憶システムに記憶されたデータをプロファイリングするための、コンピュータ可読記憶媒体に記憶されたコンピュータプログラムであって、
コンピューティングシステムに、
レコードの複数の集合の各々についての定量的情報を記憶するために、前記データ記憶システムに接続されたインターフェース上で、前記データ記憶システムに記憶された前記レコードの複数の集合にアクセスさせるための命令であって、各特定の集合についての前記定量的情報が、前記特定の集合における前記レコードの少なくとも1つの選択されたフィールドについて、値カウントエントリの対応するリストを含み、各値カウントエントリが、前記選択されたフィールドに現れる値、及び前記選択されたフィールドに前記値が現れるレコードの数のカウントを含む、アクセスさせるための命令と、
プロファイリング要約情報を生成するために、前記集合のうちの2又は3以上の集合の前記定量的情報を処理させるための命令と
を含み、
前記処理することが、
別個のフィールド値エントリのリストを含む出力データを記憶するために、前記2又は3以上の集合のうちの第1の集合からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリを読み込むことと、
記憶された出力データに少なくとも部分的に基づいて、更新された出力データを記憶するために、前記2又は3以上の集合のうちの第2の集合からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリを読み込むことであって、その結果、前記別個のフィールド値エントリのうちの少なくともいくつかが、前記第1の集合及び前記第2の集合についての対応するリストの値カウントエントリからの別個の値を識別し、且つ、前記第1の集合及び前記第2の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、読み込むことと
を含む、コンピュータプログラム。 - データ記憶システムに記憶されたデータをプロファイリングするためのコンピューティングシステムであって、
レコードの複数の集合の各々についての定量的情報を記憶するために、前記データ記憶システムに記憶された前記レコードの複数の集合にアクセスするように構成された、前記データ記憶システムに接続されたインターフェースであって、各特定の集合についての前記定量的情報が、前記特定の集合における前記レコードの少なくとも1つの選択されたフィールドについて、値カウントエントリの対応するリストを含み、各値カウントエントリが、前記選択されたフィールドに現れる値、及び前記選択されたフィールドに前記値が現れるレコードの数のカウントを含む、インターフェースと、
プロファイリング要約情報を生成するために、前記集合のうちの2又は3以上の集合の前記定量的情報を処理するように構成された少なくとも1つのプロセッサと
を含み、
前記処理することが、
別個のフィールド値エントリのリストを含む出力データを記憶するために、前記2又は3以上の集合のうちの第1の集合からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリを読み込むことと、
記憶された出力データに少なくとも部分的に基づいて、更新された出力データを記憶するために、前記2又は3以上の集合のうちの第2の集合からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリを読み込むことであって、その結果、前記別個のフィールド値エントリのうちの少なくともいくつかが、前記第1の集合及び前記第2の集合についての対応するリストの値カウントエントリからの別個の値を識別し、且つ、前記第1の集合及び前記第2の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、読み込むことと
を含む、コンピューティングシステム。 - データ記憶システムに記憶されたデータをプロファイリングするためのコンピューティングシステムであって、
レコードの複数の集合の各々についての定量的情報を記憶するために、前記データ記憶システムに記憶された前記レコードの複数の集合にアクセスするための手段であって、各特定の集合についての前記定量的情報が、前記特定の集合における前記レコードの少なくとも1つの選択されたフィールドについて、値カウントエントリの対応するリストを含み、各値カウントエントリが、前記選択されたフィールドに現れる値、及び前記選択されたフィールドに前記値が現れるレコードの数のカウントを含む、アクセスするための手段と、
プロファイリング要約情報を生成するために、前記集合のうちの2又は3以上の集合の前記定量的情報を処理するための手段と
を含み、
前記処理することが、
別個のフィールド値エントリのリストを含む出力データを記憶するために、前記2又は3以上の集合のうちの第1の集合からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリを読み込むことと、
記憶された出力データに少なくとも部分的に基づいて、更新された出力データを記憶するために、前記2又は3以上の集合のうちの第2の集合からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリを読み込むことであって、その結果、前記別個のフィールド値エントリのうちの少なくともいくつかが、前記第1の集合及び前記第2の集合についての対応するリストの値カウントエントリからの別個の値を識別し、且つ、前記第1の集合及び前記第2の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、読み込むことと
を含む、コンピューティングシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261716766P | 2012-10-22 | 2012-10-22 | |
US61/716,766 | 2012-10-22 | ||
PCT/US2013/053351 WO2014065917A1 (en) | 2012-10-22 | 2013-08-02 | Profiling data with source tracking |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016502166A JP2016502166A (ja) | 2016-01-21 |
JP6207619B2 true JP6207619B2 (ja) | 2017-10-04 |
Family
ID=48985856
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015537694A Active JP6207619B2 (ja) | 2012-10-22 | 2013-08-02 | ソース追跡によるデータのプロファイリング |
JP2015537698A Active JP6357162B2 (ja) | 2012-10-22 | 2013-08-02 | 位置情報を用いたデータのプロファイリング |
JP2015538128A Active JP6377622B2 (ja) | 2012-10-22 | 2013-10-22 | 位置情報を用いたデータのプロファイリング |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015537698A Active JP6357162B2 (ja) | 2012-10-22 | 2013-08-02 | 位置情報を用いたデータのプロファイリング |
JP2015538128A Active JP6377622B2 (ja) | 2012-10-22 | 2013-10-22 | 位置情報を用いたデータのプロファイリング |
Country Status (9)
Country | Link |
---|---|
US (5) | US9569434B2 (ja) |
EP (5) | EP3657348B1 (ja) |
JP (3) | JP6207619B2 (ja) |
KR (3) | KR102129643B1 (ja) |
CN (4) | CN104756107B (ja) |
AU (4) | AU2013335231B2 (ja) |
CA (3) | CA2887670C (ja) |
HK (3) | HK1211109A1 (ja) |
WO (3) | WO2014065917A1 (ja) |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2013335231B2 (en) | 2012-10-22 | 2018-08-09 | Ab Initio Technology Llc | Profiling data with location information |
US9953054B2 (en) * | 2013-04-22 | 2018-04-24 | Salesforce.Com, Inc. | Systems and methods for implementing and maintaining sampled tables in a database system |
US9292553B2 (en) * | 2013-08-20 | 2016-03-22 | Pivotal Software, Inc. | Queries for thin database indexing |
US9292554B2 (en) * | 2013-08-20 | 2016-03-22 | Pivotal Software, Inc. | Thin database indexing |
US10515231B2 (en) * | 2013-11-08 | 2019-12-24 | Symcor Inc. | Method of obfuscating relationships between data in database tables |
US20150199645A1 (en) * | 2014-01-15 | 2015-07-16 | Bank Of America Corporation | Customer Profile View of Consolidated Customer Attributes |
US9984173B2 (en) * | 2014-02-24 | 2018-05-29 | International Business Machines Corporation | Automated value analysis in legacy data |
CA2939915C (en) | 2014-03-07 | 2021-02-16 | Ab Initio Technology Llc | Managing data profiling operations related to data type |
US10769122B2 (en) * | 2014-03-13 | 2020-09-08 | Ab Initio Technology Llc | Specifying and applying logical validation rules to data |
GB2524073A (en) * | 2014-03-14 | 2015-09-16 | Ibm | Communication method and system for accessing media data |
US9628107B2 (en) | 2014-04-07 | 2017-04-18 | International Business Machines Corporation | Compression of floating-point data by identifying a previous loss of precision |
US10089409B2 (en) | 2014-04-29 | 2018-10-02 | Microsoft Technology Licensing, Llc | Event-triggered data quality verification |
US10877955B2 (en) * | 2014-04-29 | 2020-12-29 | Microsoft Technology Licensing, Llc | Using lineage to infer data quality issues |
US9959299B2 (en) | 2014-12-02 | 2018-05-01 | International Business Machines Corporation | Compression-aware partial sort of streaming columnar data |
US10909078B2 (en) | 2015-02-25 | 2021-02-02 | International Business Machines Corporation | Query predicate evaluation and computation for hierarchically compressed data |
US11392568B2 (en) | 2015-06-23 | 2022-07-19 | Microsoft Technology Licensing, Llc | Reducing matching documents for a search query |
US10467215B2 (en) * | 2015-06-23 | 2019-11-05 | Microsoft Technology Licensing, Llc | Matching documents using a bit vector search index |
US11281639B2 (en) | 2015-06-23 | 2022-03-22 | Microsoft Technology Licensing, Llc | Match fix-up to remove matching documents |
US10229143B2 (en) | 2015-06-23 | 2019-03-12 | Microsoft Technology Licensing, Llc | Storage and retrieval of data from a bit vector search index |
US10242071B2 (en) | 2015-06-23 | 2019-03-26 | Microsoft Technology Licensing, Llc | Preliminary ranker for scoring matching documents |
US10733164B2 (en) | 2015-06-23 | 2020-08-04 | Microsoft Technology Licensing, Llc | Updating a bit vector search index |
US10565198B2 (en) | 2015-06-23 | 2020-02-18 | Microsoft Technology Licensing, Llc | Bit vector search index using shards |
US20170242876A1 (en) * | 2016-02-22 | 2017-08-24 | Ca, Inc. | Maintaining Database Referential Integrity Using Different Primary and Foreign Key Values |
US11475026B2 (en) * | 2016-02-26 | 2022-10-18 | Douglas Schiller | Value discrepancy visualization apparatus and method thereof |
CN106227837B (zh) * | 2016-07-27 | 2019-08-02 | 浪潮金融信息技术有限公司 | 一种数据分析方法和装置 |
JP2018036977A (ja) * | 2016-09-02 | 2018-03-08 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
US10474649B2 (en) * | 2016-09-27 | 2019-11-12 | Halo Tech Corp. | Providing action corrections using a dual model system |
US10817465B2 (en) * | 2016-12-09 | 2020-10-27 | Salesforce.Com, Inc. | Match index creation |
US10636293B2 (en) * | 2017-06-07 | 2020-04-28 | International Business Machines Corporation | Uncertainty modeling in traffic demand prediction |
US10528549B2 (en) | 2017-09-25 | 2020-01-07 | Mastercard International Incorporated | Systems and methods for use in loading data based on a hierarchical framework |
US10795915B1 (en) * | 2017-12-29 | 2020-10-06 | Iqvia Inc. | System and method for merging slowly changing data |
US11514644B2 (en) | 2018-01-19 | 2022-11-29 | Enphase Energy, Inc. | Automated roof surface measurement from combined aerial LiDAR data and imagery |
US11068540B2 (en) | 2018-01-25 | 2021-07-20 | Ab Initio Technology Llc | Techniques for integrating validation results in data profiling and related systems and methods |
CN111971665B (zh) * | 2018-01-25 | 2024-04-19 | 起元技术有限责任公司 | 将验证结果整合到数据归档中的技术以及相关系统和方法 |
US10430100B2 (en) | 2018-02-28 | 2019-10-01 | International Business Machines Corporation | Transactional operations in multi-master distributed data management systems |
US10891307B2 (en) * | 2018-05-31 | 2021-01-12 | Microsoft Technology Licensing, Llc | Distributed data synchronization in a distributed computing system |
US11042522B2 (en) | 2018-06-11 | 2021-06-22 | International Business Machines Corporation | Resolving versions in an append-only large-scale data store in distributed data management systems |
US11188539B2 (en) | 2018-07-27 | 2021-11-30 | International Business Machines Corporation | Matching non-sequential log metadata with out-of-order record data |
JP6573187B1 (ja) * | 2019-01-08 | 2019-09-11 | 株式会社ビジネスインテリジェンス | データ処理プログラム、データ出力装置、データ統合方法、出力プログラム、データ出力方法及びデータ処理システム |
US11360990B2 (en) | 2019-06-21 | 2022-06-14 | Salesforce.Com, Inc. | Method and a system for fuzzy matching of entities in a database system based on machine learning |
US11194844B1 (en) * | 2020-09-01 | 2021-12-07 | Skyline Al Ltd. | System and method for detecting second degree relationships between entities by uniquely resolving entities |
US11909750B1 (en) * | 2020-10-15 | 2024-02-20 | Splunk Inc. | Data reduction and evaluation via link analysis |
Family Cites Families (145)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5179643A (en) | 1988-12-23 | 1993-01-12 | Hitachi, Ltd. | Method of multi-dimensional analysis and display for a large volume of record information items and a system therefor |
JPH032938A (ja) | 1989-05-31 | 1991-01-09 | Hitachi Ltd | データベース処理方法 |
US5604899A (en) | 1990-05-21 | 1997-02-18 | Financial Systems Technology Pty. Ltd. | Data relationships processor with unlimited expansion capability |
FR2698465B1 (fr) | 1992-11-20 | 1995-01-13 | Bull Sa | Méthode d'extraction de profils de statistiques, utilisation des statistiques créées par la méthode. |
US5847972A (en) * | 1993-09-24 | 1998-12-08 | Eick; Stephen Gregory | Method and apparatus for graphically analzying a log-file |
US5742806A (en) | 1994-01-31 | 1998-04-21 | Sun Microsystems, Inc. | Apparatus and method for decomposing database queries for database management system including multiprocessor digital data processing system |
JP3519126B2 (ja) | 1994-07-14 | 2004-04-12 | 株式会社リコー | 自動レイアウトシステム |
US5842200A (en) | 1995-03-31 | 1998-11-24 | International Business Machines Corporation | System and method for parallel mining of association rules in databases |
US6601048B1 (en) | 1997-09-12 | 2003-07-29 | Mci Communications Corporation | System and method for detecting and managing fraud |
CN1052316C (zh) * | 1995-09-15 | 2000-05-10 | 殷步九 | 计算机管理设计系统 |
US5966072A (en) | 1996-07-02 | 1999-10-12 | Ab Initio Software Corporation | Executing computations expressed as graphs |
US5778373A (en) | 1996-07-15 | 1998-07-07 | At&T Corp | Integration of an information server database schema by generating a translation map from exemplary files |
US6138123A (en) | 1996-07-25 | 2000-10-24 | Rathbun; Kyle R. | Method for creating and using parallel data structures |
JPH1055367A (ja) | 1996-08-09 | 1998-02-24 | Hitachi Ltd | データ利用システム |
US5845285A (en) | 1997-01-07 | 1998-12-01 | Klein; Laurence C. | Computer system and method of data analysis |
US5987453A (en) | 1997-04-07 | 1999-11-16 | Informix Software, Inc. | Method and apparatus for performing a join query in a database system |
US7031843B1 (en) * | 1997-09-23 | 2006-04-18 | Gene Logic Inc. | Computer methods and systems for displaying information relating to gene expression data |
US6134560A (en) | 1997-12-16 | 2000-10-17 | Kliebhan; Daniel F. | Method and apparatus for merging telephone switching office databases |
JP3474106B2 (ja) * | 1998-06-17 | 2003-12-08 | アルプス電気株式会社 | 液晶表示装置 |
CA2340008C (en) | 1998-08-11 | 2008-09-23 | Shinji Furusho | Method and apparatus for retrieving, accumulating, and sorting table-formatted data |
US7039919B1 (en) * | 1998-10-02 | 2006-05-02 | Microsoft Corporation | Tools and techniques for instrumenting interfaces of units of a software program |
US6826556B1 (en) | 1998-10-02 | 2004-11-30 | Ncr Corporation | Techniques for deploying analytic models in a parallel |
US6546416B1 (en) | 1998-12-09 | 2003-04-08 | Infoseek Corporation | Method and system for selectively blocking delivery of bulk electronic mail |
US6959300B1 (en) | 1998-12-10 | 2005-10-25 | At&T Corp. | Data compression method and apparatus |
US6343294B1 (en) | 1998-12-15 | 2002-01-29 | International Business Machines Corporation | Data file editor for multiple data subsets |
US6741995B1 (en) | 1999-03-23 | 2004-05-25 | Metaedge Corporation | Method for dynamically creating a profile |
US6430539B1 (en) | 1999-05-06 | 2002-08-06 | Hnc Software | Predictive modeling of consumer financial behavior |
GB2349961A (en) * | 1999-05-08 | 2000-11-15 | Int Computers Ltd | Analysing data files to produce summaries therefrom |
US6163774A (en) | 1999-05-24 | 2000-12-19 | Platinum Technology Ip, Inc. | Method and apparatus for simplified and flexible selection of aggregate and cross product levels for a data warehouse |
US6801938B1 (en) | 1999-06-18 | 2004-10-05 | Torrent Systems, Inc. | Segmentation and processing of continuous data streams using transactional semantics |
CN100375088C (zh) | 1999-06-18 | 2008-03-12 | 国际商业机器公司 | 利用事务语义法分段和处理连续数据流 |
JP3318834B2 (ja) | 1999-07-30 | 2002-08-26 | 三菱電機株式会社 | データファイルシステム及びデータ検索方法 |
JP3363120B2 (ja) | 1999-08-30 | 2003-01-08 | ファンクルシステム株式会社 | コンテンツ収集・貼付方法及び装置並びにコンテンツ収集・貼付のためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2001331362A (ja) | 2000-03-17 | 2001-11-30 | Sony Corp | ファイル変換方法、データ変換装置及びファイル表示システム |
JP3567861B2 (ja) | 2000-07-07 | 2004-09-22 | 日本電信電話株式会社 | 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 |
JP4366845B2 (ja) | 2000-07-24 | 2009-11-18 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラム提供媒体 |
US6788302B1 (en) | 2000-08-03 | 2004-09-07 | International Business Machines Corporation | Partitioning and load balancing graphical shape data for parallel applications |
US20020073138A1 (en) | 2000-12-08 | 2002-06-13 | Gilbert Eric S. | De-identification and linkage of data records |
US6952693B2 (en) | 2001-02-23 | 2005-10-04 | Ran Wolff | Distributed mining of association rules |
US20020161778A1 (en) | 2001-02-24 | 2002-10-31 | Core Integration Partners, Inc. | Method and system of data warehousing and building business intelligence using a data storage model |
US20020120602A1 (en) | 2001-02-28 | 2002-08-29 | Ross Overbeek | System, method and computer program product for simultaneous analysis of multiple genomes |
US20030063779A1 (en) * | 2001-03-29 | 2003-04-03 | Jennifer Wrigley | System for visual preference determination and predictive product selection |
CA2349265A1 (en) * | 2001-05-30 | 2002-11-30 | Andrew Emili | Protein expression profile database |
US20030033138A1 (en) | 2001-07-26 | 2003-02-13 | Srinivas Bangalore | Method for partitioning a data set into frequency vectors for clustering |
US7130852B2 (en) | 2001-07-27 | 2006-10-31 | Silicon Valley Bank | Internal security system for a relational database system |
US7013290B2 (en) | 2001-08-03 | 2006-03-14 | John Allen Ananian | Personalized interactive digital catalog profiling |
US6801903B2 (en) | 2001-10-12 | 2004-10-05 | Ncr Corporation | Collecting statistics in a database system |
US7359847B2 (en) * | 2001-11-30 | 2008-04-15 | International Business Machines Corporation | Tracking converage results in a batch simulation farm network |
US20030140027A1 (en) | 2001-12-12 | 2003-07-24 | Jeffrey Huttel | Universal Programming Interface to Knowledge Management (UPIKM) database system with integrated XML interface |
US7813937B1 (en) | 2002-02-15 | 2010-10-12 | Fair Isaac Corporation | Consistency modeling of healthcare claims to detect fraud and abuse |
US7031969B2 (en) | 2002-02-20 | 2006-04-18 | Lawrence Technologies, Llc | System and method for identifying relationships between database records |
US7386318B2 (en) | 2002-03-19 | 2008-06-10 | Pitney Bowes Mapinfo Corporation | Location based service provider |
US7032212B2 (en) | 2002-05-06 | 2006-04-18 | Microsoft Corporation | Method and system for generating test matrices for software programs |
US20040083199A1 (en) | 2002-08-07 | 2004-04-29 | Govindugari Diwakar R. | Method and architecture for data transformation, normalization, profiling, cleansing and validation |
US6657568B1 (en) | 2002-08-27 | 2003-12-02 | Fmr Corp. | Data packing for real-time streaming |
US7047230B2 (en) | 2002-09-09 | 2006-05-16 | Lucent Technologies Inc. | Distinct sampling system and a method of distinct sampling for optimizing distinct value query estimates |
US7043476B2 (en) * | 2002-10-11 | 2006-05-09 | International Business Machines Corporation | Method and apparatus for data mining to discover associations and covariances associated with data |
AU2003284118A1 (en) | 2002-10-14 | 2004-05-04 | Battelle Memorial Institute | Information reservoir |
US7395243B1 (en) | 2002-11-01 | 2008-07-01 | Checkfree Corporation | Technique for presenting matched billers to a consumer |
US7698163B2 (en) | 2002-11-22 | 2010-04-13 | Accenture Global Services Gmbh | Multi-dimensional segmentation for use in a customer interaction |
US7403942B1 (en) | 2003-02-04 | 2008-07-22 | Seisint, Inc. | Method and system for processing data records |
US7433861B2 (en) | 2003-03-13 | 2008-10-07 | International Business Machines Corporation | Byte-code representations of actual data to reduce network traffic in database transactions |
US7117222B2 (en) | 2003-03-13 | 2006-10-03 | International Business Machines Corporation | Pre-formatted column-level caching to improve client performance |
US7130760B2 (en) | 2003-03-31 | 2006-10-31 | National Instruments Corporation | Reporting invalid parameter values for a parameter-based system |
US20040249810A1 (en) | 2003-06-03 | 2004-12-09 | Microsoft Corporation | Small group sampling of data for use in query processing |
GB0314591D0 (en) | 2003-06-21 | 2003-07-30 | Ibm | Profiling data in a data store |
US20050240354A1 (en) * | 2003-08-27 | 2005-10-27 | Ascential Software Corporation | Service oriented architecture for an extract function in a data integration platform |
US20060069717A1 (en) * | 2003-08-27 | 2006-03-30 | Ascential Software Corporation | Security service for a services oriented architecture in a data integration platform |
US7426520B2 (en) | 2003-09-10 | 2008-09-16 | Exeros, Inc. | Method and apparatus for semantic discovery and mapping between data sources |
CN101271472B (zh) * | 2003-09-15 | 2011-04-13 | 起元科技有限公司 | 数据处理方法和数据处理系统 |
EP1676217B1 (en) * | 2003-09-15 | 2011-07-06 | Ab Initio Technology LLC | Data profiling |
US7587394B2 (en) | 2003-09-23 | 2009-09-08 | International Business Machines Corporation | Methods and apparatus for query rewrite with auxiliary attributes in query processing operations |
US7149736B2 (en) | 2003-09-26 | 2006-12-12 | Microsoft Corporation | Maintaining time-sorted aggregation records representing aggregations of values from multiple database records using multiple partitions |
AU2003279999A1 (en) | 2003-10-21 | 2005-06-08 | Nielsen Media Research, Inc. | Methods and apparatus for fusing databases |
US7620630B2 (en) * | 2003-11-12 | 2009-11-17 | Oliver Lloyd Pty Ltd | Directory system |
US8078481B2 (en) * | 2003-12-05 | 2011-12-13 | John Steinbarth | Benefits administration system and methods of use and doing business |
US7689542B2 (en) | 2004-01-13 | 2010-03-30 | Oracle International Corporation | Dynamic return type generation in a database system |
US20050177578A1 (en) | 2004-02-10 | 2005-08-11 | Chen Yao-Ching S. | Efficient type annontation of XML schema-validated XML documents without schema validation |
US7376656B2 (en) | 2004-02-10 | 2008-05-20 | Microsoft Corporation | System and method for providing user defined aggregates in a database system |
KR100619064B1 (ko) | 2004-07-30 | 2006-08-31 | 삼성전자주식회사 | 메타 데이터를 포함하는 저장 매체, 그 재생 장치 및 방법 |
US8447743B2 (en) | 2004-08-17 | 2013-05-21 | International Business Machines Corporation | Techniques for processing database queries including user-defined functions |
CN1314634C (zh) | 2004-09-17 | 2007-05-09 | 南京理工大学 | 单质炸药降静电处理方法 |
US7392169B2 (en) * | 2004-10-21 | 2008-06-24 | International Business Machines Corporation | Method, system and program product for defining and recording minimum and maximum event counts of a simulation utilizing a high level language |
US7899833B2 (en) | 2004-11-02 | 2011-03-01 | Ab Initio Technology Llc | Managing related data objects |
US20060129893A1 (en) * | 2004-11-30 | 2006-06-15 | Smith Alan R | Apparatus, system, and method for criteria driven summarization of trace entry data |
US8145642B2 (en) | 2004-11-30 | 2012-03-27 | Oracle International Corporation | Method and apparatus to support bitmap filtering in a parallel system |
US7694088B1 (en) * | 2005-03-31 | 2010-04-06 | Symantec Operating Corporation | System and method for efficient creation of aggregate backup images |
US20060230019A1 (en) * | 2005-04-08 | 2006-10-12 | International Business Machines Corporation | System and method to optimize database access by synchronizing state based on data access patterns |
US8572018B2 (en) * | 2005-06-20 | 2013-10-29 | New York University | Method, system and software arrangement for reconstructing formal descriptive models of processes from functional/modal data using suitable ontology |
US7584205B2 (en) | 2005-06-27 | 2009-09-01 | Ab Initio Technology Llc | Aggregating data with complex operations |
US7877350B2 (en) | 2005-06-27 | 2011-01-25 | Ab Initio Technology Llc | Managing metadata for graph-based computations |
US20070021995A1 (en) | 2005-07-20 | 2007-01-25 | Candemir Toklu | Discovering patterns of executions in business processes |
US7774346B2 (en) | 2005-08-26 | 2010-08-10 | Oracle International Corporation | Indexes that are based on bitmap values and that use summary bitmap values |
US20070073721A1 (en) | 2005-09-23 | 2007-03-29 | Business Objects, S.A. | Apparatus and method for serviced data profiling operations |
US7565349B2 (en) * | 2005-11-10 | 2009-07-21 | International Business Machines Corporation | Method for computing frequency distribution for many fields in one pass in parallel |
US20070214179A1 (en) | 2006-03-10 | 2007-09-13 | Khanh Hoang | Searching, filtering, creating, displaying, and managing entity relationships across multiple data hierarchies through a user interface |
US8271452B2 (en) * | 2006-06-12 | 2012-09-18 | Rainstor Limited | Method, system, and database archive for enhancing database archiving |
NO325864B1 (no) | 2006-11-07 | 2008-08-04 | Fast Search & Transfer Asa | Fremgangsmåte ved beregning av sammendragsinformasjon og en søkemotor for å støtte og implementere fremgangsmåten |
US20080114789A1 (en) | 2006-11-15 | 2008-05-15 | Wysham John A | Data item retrieval method and apparatus |
JP2008146242A (ja) * | 2006-12-07 | 2008-06-26 | Ricoh Co Ltd | 発注支援システム、機器監視装置、機器監視方法及びプログラム |
US7894075B2 (en) * | 2006-12-11 | 2011-02-22 | Zygo Corporation | Multiple-degree of freedom interferometer with compensation for gas effects |
US8412713B2 (en) * | 2007-03-06 | 2013-04-02 | Mcafee, Inc. | Set function calculation in a database |
US9224179B2 (en) * | 2007-05-14 | 2015-12-29 | The University Of Utah Research Foundation | Method and system for report generation including extensible data |
US7958142B2 (en) | 2007-09-20 | 2011-06-07 | Microsoft Corporation | User profile aggregation |
JP5241738B2 (ja) * | 2008-01-28 | 2013-07-17 | 株式会社ターボデータラボラトリー | 表からツリー構造データを構築する方法及び装置 |
US20090226916A1 (en) * | 2008-02-01 | 2009-09-10 | Life Technologies Corporation | Automated Analysis of DNA Samples |
US7912867B2 (en) | 2008-02-25 | 2011-03-22 | United Parcel Services Of America, Inc. | Systems and methods of profiling data for integration |
US7904464B2 (en) * | 2008-08-27 | 2011-03-08 | International Business Machines Corporation | Virtual list view support in a distributed directory |
US8463739B2 (en) * | 2008-08-28 | 2013-06-11 | Red Hat, Inc. | Systems and methods for generating multi-population statistical measures using middleware |
JP5287071B2 (ja) * | 2008-09-17 | 2013-09-11 | 株式会社リコー | データベース管理システムおよびプログラム |
US20100114976A1 (en) * | 2008-10-21 | 2010-05-06 | Castellanos Maria G | Method For Database Design |
CN101393521B (zh) * | 2008-11-13 | 2012-04-25 | 上海交通大学 | Windows应用程序内部固化数据的提取系统 |
US8150832B2 (en) * | 2009-03-06 | 2012-04-03 | Oracle International Corporation | Methods and systems for automatically determining a default hierarchy from data |
US9251212B2 (en) * | 2009-03-27 | 2016-02-02 | Business Objects Software Ltd. | Profiling in a massive parallel processing environment |
US20110029478A1 (en) | 2009-05-20 | 2011-02-03 | Broeker Stephen A | Stream Star Schema and Nested Binary Tree for Data Stream Analysis |
US8977705B2 (en) * | 2009-07-27 | 2015-03-10 | Verisign, Inc. | Method and system for data logging and analysis |
KR101688555B1 (ko) | 2009-09-16 | 2016-12-21 | 아브 이니티오 테크놀로지 엘엘시 | 데이터세트 요소의 매핑 |
US8560575B2 (en) * | 2009-11-12 | 2013-10-15 | Salesforce.Com, Inc. | Methods and apparatus for selecting updates to associated records to publish on an information feed in an on-demand database service environment |
AU2010319344B2 (en) | 2009-11-13 | 2014-10-09 | Ab Initio Technology Llc | Managing record format information |
US8595284B2 (en) | 2009-12-14 | 2013-11-26 | Samsung Electronics Co., Ltd | Web application script migration |
US8396873B2 (en) | 2010-03-10 | 2013-03-12 | Emc Corporation | Index searching using a bloom filter |
US8326824B2 (en) * | 2010-05-28 | 2012-12-04 | International Business Machines Corporation | Methods to estimate existing cache contents for better query optimization |
KR101781416B1 (ko) * | 2010-06-22 | 2017-09-25 | 아브 이니티오 테크놀로지 엘엘시 | 관련 데이터세트의 처리 |
JP2012009996A (ja) * | 2010-06-23 | 2012-01-12 | National Institute Of Information & Communication Technology | 情報処理システム、中継装置、および情報処理方法 |
JP5398663B2 (ja) * | 2010-08-06 | 2014-01-29 | 三菱電機株式会社 | データ処理装置及びデータ処理方法及びプログラム |
US20140147013A1 (en) * | 2010-10-11 | 2014-05-29 | The Regents Of The University Of Colorado, A Body Corporate | Direct echo particle image velocimetry flow vector mapping on ultrasound dicom images |
US8296274B2 (en) | 2011-01-27 | 2012-10-23 | Leppard Andrew | Considering multiple lookups in bloom filter decision making |
AU2012211167B2 (en) | 2011-01-28 | 2014-08-21 | Ab Initio Technology Llc | Generating data pattern information |
JP5556695B2 (ja) * | 2011-02-16 | 2014-07-23 | 株式会社島津製作所 | 質量分析データ処理方法及び該方法を用いた質量分析装置 |
US9275367B2 (en) * | 2011-05-05 | 2016-03-01 | Aegis Analytical Corporation | System for designating, displaying and selecting types of process parameters and product outcome parameters |
EP2608122A1 (en) * | 2011-12-22 | 2013-06-26 | Philip Morris Products S.A. | Systems and methods for quantifying the impact of biological perturbations |
US8610605B2 (en) * | 2011-06-17 | 2013-12-17 | Sap Ag | Method and system for data compression |
DE102012210794A1 (de) * | 2011-07-01 | 2013-02-07 | International Business Machines Corporation | System und Verfahren zur Datenqualitätsüberwachung |
US8856085B2 (en) | 2011-07-19 | 2014-10-07 | International Business Machines Corporation | Automatic consistent sampling for data analysis |
US8666919B2 (en) | 2011-07-29 | 2014-03-04 | Accenture Global Services Limited | Data quality management for profiling, linking, cleansing and migrating data |
WO2013063017A1 (en) * | 2011-10-24 | 2013-05-02 | The Brigham And Women's Hospital, Inc. | Diagnosis and treatment of mesothelioma |
CN103176973B (zh) | 2011-12-20 | 2016-04-20 | 国际商业机器公司 | 用于生成数据库的测试工作负载的系统和方法 |
US8762396B2 (en) | 2011-12-22 | 2014-06-24 | Sap Ag | Dynamic, hierarchical bloom filters for network data routing |
US9336246B2 (en) | 2012-02-28 | 2016-05-10 | International Business Machines Corporation | Generating composite key relationships between database objects based on sampling |
US9483268B2 (en) * | 2012-03-16 | 2016-11-01 | International Business Machines Corporation | Hardware based run-time instrumentation facility for managed run-times |
US10061807B2 (en) * | 2012-05-18 | 2018-08-28 | Splunk Inc. | Collection query driven generation of inverted index for raw machine data |
CN104704499B (zh) * | 2012-06-21 | 2018-12-11 | 菲利普莫里斯生产公司 | 与基于网络的生物标记签名相关的系统和方法 |
AU2013335231B2 (en) * | 2012-10-22 | 2018-08-09 | Ab Initio Technology Llc | Profiling data with location information |
WO2014065918A1 (en) * | 2012-10-22 | 2014-05-01 | Ab Initio Technology Llc | Characterizing data sources in a data storage system |
US9348773B2 (en) * | 2013-05-28 | 2016-05-24 | Dell Products, L.P. | Systems and methods for adaptive interrupt coalescing in a converged network |
-
2013
- 2013-08-02 AU AU2013335231A patent/AU2013335231B2/en active Active
- 2013-08-02 CN CN201380055340.8A patent/CN104756107B/zh active Active
- 2013-08-02 EP EP19216483.8A patent/EP3657348B1/en active Active
- 2013-08-02 CA CA2887670A patent/CA2887670C/en active Active
- 2013-08-02 JP JP2015537694A patent/JP6207619B2/ja active Active
- 2013-08-02 US US13/957,641 patent/US9569434B2/en active Active
- 2013-08-02 EP EP13752720.6A patent/EP2909746B1/en active Active
- 2013-08-02 WO PCT/US2013/053351 patent/WO2014065917A1/en active Application Filing
- 2013-08-02 WO PCT/US2013/053412 patent/WO2014065919A1/en active Application Filing
- 2013-08-02 JP JP2015537698A patent/JP6357162B2/ja active Active
- 2013-08-02 US US13/958,057 patent/US9323748B2/en active Active
- 2013-08-02 CN CN201380055099.9A patent/CN104737167B/zh active Active
- 2013-08-02 KR KR1020157012267A patent/KR102129643B1/ko active IP Right Grant
- 2013-08-02 CN CN201811474571.3A patent/CN110096494B/zh active Active
- 2013-08-02 KR KR1020157013538A patent/KR102074026B1/ko active IP Right Grant
- 2013-08-02 EP EP13748437.4A patent/EP2909745B1/en active Active
- 2013-08-02 AU AU2013335229A patent/AU2013335229B2/en active Active
- 2013-08-02 CA CA2888250A patent/CA2888250C/en active Active
- 2013-10-22 JP JP2015538128A patent/JP6377622B2/ja active Active
- 2013-10-22 EP EP20187755.2A patent/EP3764242A1/en active Pending
- 2013-10-22 US US14/059,590 patent/US9323749B2/en active Active
- 2013-10-22 EP EP13786806.3A patent/EP2909752B1/en active Active
- 2013-10-22 AU AU2013334870A patent/AU2013334870B2/en active Active
- 2013-10-22 WO PCT/US2013/066061 patent/WO2014066314A1/en active Application Filing
- 2013-10-22 CA CA2887931A patent/CA2887931C/en active Active
- 2013-10-22 CN CN201380055344.6A patent/CN104769586B/zh active Active
- 2013-10-22 KR KR1020157013542A patent/KR102134494B1/ko active IP Right Grant
-
2015
- 2015-09-21 US US14/859,502 patent/US9990362B2/en active Active
- 2015-12-03 HK HK15111884.9A patent/HK1211109A1/xx unknown
- 2015-12-03 HK HK15111898.3A patent/HK1211116A1/xx unknown
- 2015-12-03 HK HK15111895.6A patent/HK1211113A1/xx unknown
-
2017
- 2017-02-13 US US15/431,008 patent/US10719511B2/en active Active
-
2018
- 2018-10-24 AU AU2018253523A patent/AU2018253523B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6207619B2 (ja) | ソース追跡によるデータのプロファイリング | |
US10521427B2 (en) | Managing data queries | |
JP5372850B2 (ja) | データプロファイリング | |
US7958114B2 (en) | Detecting estimation errors in dictinct page counts | |
US20170060944A1 (en) | Optimized inequality join method | |
US20120117054A1 (en) | Query Analysis in a Database | |
CN111611458A (zh) | 大数据治理中基于元数据和数据分析技术实现系统数据架构梳理的方法 | |
Abuzaid et al. | Diff: a relational interface for large-scale data explanation | |
Damasio et al. | Guided automated learning for query workload re-optimization | |
Ordonez et al. | Managing big data analytics workflows with a database system | |
Hasan et al. | Data transformation from sql to nosql mongodb based on r programming language | |
Mihaylov et al. | Scalable learning to troubleshoot query performance problems | |
Brkić et al. | A time-constrained algorithm for integration testing in a data warehouse environment | |
Rozsnyai et al. | Automated correlation discovery for semi-structured business processes | |
Ordonez-Ante et al. | Dynamic data transformation for low latency querying in big data systems | |
Graefe et al. | 10381 Summary and Abstracts Collection–Robust Query Processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170721 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170905 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6207619 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |