JP6526684B2 - データベースキーの識別 - Google Patents
データベースキーの識別 Download PDFInfo
- Publication number
- JP6526684B2 JP6526684B2 JP2016543564A JP2016543564A JP6526684B2 JP 6526684 B2 JP6526684 B2 JP 6526684B2 JP 2016543564 A JP2016543564 A JP 2016543564A JP 2016543564 A JP2016543564 A JP 2016543564A JP 6526684 B2 JP6526684 B2 JP 6526684B2
- Authority
- JP
- Japan
- Prior art keywords
- filter
- data set
- field
- value
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 64
- 238000004590 computer program Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 19
- 238000012545 processing Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000013461 design Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2237—Vectors, bitmaps or matrices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2255—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24558—Binary matching operations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Claims (19)
- 第1のデータセット中の第1のフィールドの識別を受け取る工程であって、前記第1のデータセットは複数のレコードを含んでいる、工程と、
値の集合を識別する工程であって、前記集合は、レコードごとに、それぞれのレコードにある、前記フィールドに関連付けられた値を含む、工程と、
前記値の集合に基づいてフィルタマスクを生成する工程であって、前記フィルタマスクを適用することにより、所与の値が前記値の集合にないことを判定することができる工程と、
第2のデータセットを受け取る工程であって、前記第2のデータセットは第2のフィールドを含んでおり、前記第2のデータセットは複数のレコードを含んでいる、工程と、
前記第2のフィールドと関連付けられた値であって前記フィルタマスクを通過する値を持つ、前記第2のデータセット中のレコードの数を判定する工程と、
前記数をプロファイルに記憶する工程と、
を含む、コンピュータが実行する方法。 - 前記値の集合と、前記第2のフィールドに関連付けられた値を持つ前記第2のデータセット中の前記レコードとのSorensen−Dice係数を求める工程をさらに含む請求項1に記載の方法。
- フィルタマスクを生成する工程が、前記値の集合にある値ごとに、対応する値にフィルタキーを生成する工程を含む請求項1に記載の方法。
- 前記対応する値にフィルタキーを生成する工程が、
前記対応する値のハッシュ値を生成する工程と、
前記ハッシュ値を、所定数の整数に分割する工程と、
前記整数に基づいてビットベクトルにビットを設定することにより、フィルタキーを作成する工程と、
を含む請求項3に記載の方法。 - 前記フィルタマスクを生成する工程が、前記生成されたフィルタキーそれぞれに2進演算を行う工程をさらに含む請求項3に記載の方法。
- 前記第2のフィールドと関連付けられた値であって前記フィルタマスクを通過する値を持つ、前記第2のデータセット中のレコードの数を判定する工程が、
前記第2のフィールドに関連付けられた値に第2のフィルタキーを計算する工程と、
前記第2のフィルタキーを前記フィルタマスクと比較する工程と、
を含む請求項5に記載の方法。 - 1つまたは複数のコンピュータによって実行されると、前記1つまたは複数のコンピュータに、
第1のデータセット中の第1のフィールドの識別を受け取る工程であって、前記第1のデータセットは複数のレコードを含んでいる、工程と、
値の集合を識別する工程であって、前記集合は、レコードごとに、それぞれのレコードにある、前記フィールドに関連付けられた値を含む、工程と、
前記値の集合に基づいてフィルタマスクを生成する工程であって、前記フィルタマスクを適用することにより、所与の値が前記値の集合にないことを判定することができる工程と、
第2のデータセットを受け取る工程であって、前記第2のデータセットは第2のフィールドを含んでおり、前記第2のデータセットは複数のレコードを含んでいる、工程と、
前記第2のフィールドと関連付けられた値であって前記フィルタマスクを通過する値を持つ、前記第2のデータセット中のレコードの数を判定する工程と、
前記数をプロファイルに記憶する工程と、
を含む動作を行わせるコンピュータプログラム命令が符号化された非一時的なコンピュータ記憶媒体。 - 前記値の集合と、前記第2のフィールドに関連付けられた値を持つ前記第2のデータセット中の前記レコードとのSorensen−Dice係数を求める工程をさらに含む請求項7に記載の媒体。
- フィルタマスクを生成する工程が、前記値の集合にある値ごとに、対応する値にフィルタキーを生成する工程を含む請求項7に記載の媒体。
- 前記対応する値にフィルタキーを生成する工程が、
前記対応する値のハッシュ値を生成する工程と、
前記ハッシュ値を、所定数の整数に分割する工程と、
前記整数に基づいてビットベクトルにビットを設定することにより、フィルタキーを作成する工程と、
を含む請求項9に記載の媒体。 - 前記フィルタマスクを生成する工程が、前記生成されたフィルタキーそれぞれに2進演算を行う工程をさらに含む請求項9に記載の媒体。
- 前記第2のフィールドと関連付けられた値であって前記フィルタマスクを通過する値を持つ、前記第2のデータセット中のレコードの数を判定する工程が、
前記第2のフィールドに関連付けられた値に第2のフィルタキーを計算する工程と、
前記第2のフィルタキーを前記フィルタマスクと比較する工程と、
を含む請求項11に記載の媒体。 - 1つまたは複数のコンピュータと、1つまたは複数の記憶装置とを備えるシステムであって、前記1つまたは複数の記憶装置は、前記1つまたは複数のコンピュータによって実行されると、前記1つまたは複数のコンピュータに、
第1のデータセット中の第1のフィールドの識別を受け取る工程であって、前記第1のデータセットは複数のレコードを含んでいる、工程と、
値の集合を識別する工程であって、前記集合は、レコードごとに、それぞれのレコードにある、前記フィールドに関連付けられた値を含む、工程と、
前記値の集合に基づいてフィルタマスクを生成する工程であって、前記フィルタマスクを適用することにより、所与の値が前記値の集合にないことを判定することができる工程と、
第2のデータセットを受け取る工程であって、前記第2のデータセットは第2のフィールドを含んでおり、前記第2のデータセットは複数のレコードを含んでいる、工程と、
前記第2のフィールドと関連付けられた値であって前記フィルタマスクを通過する値を持つ、前記第2のデータセット中のレコードの数を判定する工程と、
前記数をプロファイルに記憶する工程と、
を含む動作を行わせるように動作可能な命令を記憶しているシステム。 - 前記値の集合と、前記第2のフィールドに関連付けられた値を持つ前記第2のデータセット中の前記レコードとのSorensen−Dice係数を求める工程をさらに含む請求項13に記載のシステム。
- フィルタマスクを生成する工程が、前記値の集合にある値ごとに、対応する値にフィルタキーを生成する工程を含む請求項13に記載のシステム。
- 前記対応する値にフィルタキーを生成する工程が、
前記対応する値のハッシュ値を生成する工程と、
前記ハッシュ値を、所定数の整数に分割する工程と、
前記整数に基づいてビットベクトルにビットを設定することにより、フィルタキーを作成する工程と、
を含む請求項15に記載のシステム。 - 前記フィルタマスクを生成する工程が、前記生成されたフィルタキーそれぞれに2進演算を行う工程をさらに含む請求項15に記載のシステム。
- 前記第2のフィールドと関連付けられた値であって前記フィルタマスクを通過する値を持つ、前記第2のデータセット中のレコードの数を判定する工程が、
前記第2のフィールドに関連付けられた値に第2のフィルタキーを計算する工程と、
前記第2のフィルタキーを前記フィルタマスクと比較する工程と、
を含む請求項17に記載のシステム。 - 第1のデータセット中の第1のフィールドの識別を受け取る手段であって、前記第1のデータセットは複数のレコードを含んでいる、手段と、
値の集合を識別する手段であって、前記集合は、レコードごとに、それぞれのレコードにある、前記フィールドに関連付けられた値を含む、手段と、
前記値の集合に基づいてフィルタマスクを生成する手段であって、前記フィルタマスクを適用することにより、所与の値が前記値の集合にないことを判定することができる手段と、
第2のデータセットを受け取る手段であって、前記第2のデータセットは第2のフィールドを含んでおり、前記第2のデータセットは複数のレコードを含んでいる、手段と、
前記第2のフィールドと関連付けられた値であって前記フィルタマスクを通過する値を持つ、前記第2のデータセット中のレコードの数を判定する手段と、
前記数をプロファイルに記憶する手段と、
を備えるシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/156,544 | 2014-01-16 | ||
US14/156,544 US11487732B2 (en) | 2014-01-16 | 2014-01-16 | Database key identification |
PCT/US2015/011518 WO2015109047A1 (en) | 2014-01-16 | 2015-01-15 | Database key identification |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017507392A JP2017507392A (ja) | 2017-03-16 |
JP6526684B2 true JP6526684B2 (ja) | 2019-06-05 |
Family
ID=52432993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016543564A Active JP6526684B2 (ja) | 2014-01-16 | 2015-01-15 | データベースキーの識別 |
Country Status (9)
Country | Link |
---|---|
US (1) | US11487732B2 (ja) |
EP (1) | EP3095047B1 (ja) |
JP (1) | JP6526684B2 (ja) |
KR (1) | KR102240137B1 (ja) |
CN (1) | CN105917336B (ja) |
AU (1) | AU2015206487B2 (ja) |
CA (1) | CA2934034C (ja) |
SG (1) | SG11201604859RA (ja) |
WO (1) | WO2015109047A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9892026B2 (en) | 2013-02-01 | 2018-02-13 | Ab Initio Technology Llc | Data records selection |
US11227104B2 (en) * | 2014-05-11 | 2022-01-18 | Informatica Llc | Composite data creation with refinement suggestions |
US20160027123A1 (en) * | 2014-07-22 | 2016-01-28 | Gastke Inc. | Automatic tagging of trial balance |
US10891294B1 (en) | 2014-07-22 | 2021-01-12 | Auditfile, Inc. | Automatically migrating computer content |
US11232085B2 (en) * | 2016-01-07 | 2022-01-25 | Amazon Technologies, Inc. | Outlier detection for streaming data |
GB2566677A (en) * | 2017-09-12 | 2019-03-27 | Infosum Ltd | Grouping datasets |
CN107766570B (zh) * | 2017-11-10 | 2020-04-07 | 广东电网有限责任公司电力科学研究院 | 一种档案同源核查方法 |
US11068540B2 (en) | 2018-01-25 | 2021-07-20 | Ab Initio Technology Llc | Techniques for integrating validation results in data profiling and related systems and methods |
US10846307B1 (en) * | 2020-04-03 | 2020-11-24 | Csg Systems, Inc. | System and method for managing interactions with a data lake |
KR102416517B1 (ko) * | 2020-11-13 | 2022-07-01 | 디비에프아이에스 주식회사 | Rpa를 이용하는 데이터베이스 중앙 관리 장치 및 그 방법 |
CN112800085B (zh) * | 2021-04-13 | 2021-09-14 | 成都四方伟业软件股份有限公司 | 一种基于布隆过滤器识别表间主外键字段的方法及装置 |
Family Cites Families (106)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5179643A (en) | 1988-12-23 | 1993-01-12 | Hitachi, Ltd. | Method of multi-dimensional analysis and display for a large volume of record information items and a system therefor |
JPH032938A (ja) | 1989-05-31 | 1991-01-09 | Hitachi Ltd | データベース処理方法 |
FR2698465B1 (fr) | 1992-11-20 | 1995-01-13 | Bull Sa | Méthode d'extraction de profils de statistiques, utilisation des statistiques créées par la méthode. |
JP3079881B2 (ja) | 1993-08-10 | 2000-08-21 | 三菱自動車工業株式会社 | 道路交通状況推定方法および車両運転特性制御方法 |
JP3002938B2 (ja) | 1993-10-28 | 2000-01-24 | オークマ株式会社 | 自動工具交換装置及び工具交換方法 |
US5742806A (en) | 1994-01-31 | 1998-04-21 | Sun Microsystems, Inc. | Apparatus and method for decomposing database queries for database management system including multiprocessor digital data processing system |
JP3519126B2 (ja) | 1994-07-14 | 2004-04-12 | 株式会社リコー | 自動レイアウトシステム |
US5842200A (en) | 1995-03-31 | 1998-11-24 | International Business Machines Corporation | System and method for parallel mining of association rules in databases |
US6601048B1 (en) | 1997-09-12 | 2003-07-29 | Mci Communications Corporation | System and method for detecting and managing fraud |
US5966072A (en) | 1996-07-02 | 1999-10-12 | Ab Initio Software Corporation | Executing computations expressed as graphs |
US5778373A (en) | 1996-07-15 | 1998-07-07 | At&T Corp | Integration of an information server database schema by generating a translation map from exemplary files |
US6138123A (en) | 1996-07-25 | 2000-10-24 | Rathbun; Kyle R. | Method for creating and using parallel data structures |
JPH1055367A (ja) | 1996-08-09 | 1998-02-24 | Hitachi Ltd | データ利用システム |
US5845285A (en) | 1997-01-07 | 1998-12-01 | Klein; Laurence C. | Computer system and method of data analysis |
US5987453A (en) | 1997-04-07 | 1999-11-16 | Informix Software, Inc. | Method and apparatus for performing a join query in a database system |
US6134560A (en) | 1997-12-16 | 2000-10-17 | Kliebhan; Daniel F. | Method and apparatus for merging telephone switching office databases |
US6826556B1 (en) | 1998-10-02 | 2004-11-30 | Ncr Corporation | Techniques for deploying analytic models in a parallel |
US6959300B1 (en) | 1998-12-10 | 2005-10-25 | At&T Corp. | Data compression method and apparatus |
US6343294B1 (en) | 1998-12-15 | 2002-01-29 | International Business Machines Corporation | Data file editor for multiple data subsets |
US6741995B1 (en) | 1999-03-23 | 2004-05-25 | Metaedge Corporation | Method for dynamically creating a profile |
US6163774A (en) | 1999-05-24 | 2000-12-19 | Platinum Technology Ip, Inc. | Method and apparatus for simplified and flexible selection of aggregate and cross product levels for a data warehouse |
AU5624700A (en) | 1999-06-18 | 2001-01-09 | Torrent Systems, Inc. | Segmentation and processing of continuous data streams using transactional semantics |
US6801938B1 (en) | 1999-06-18 | 2004-10-05 | Torrent Systems, Inc. | Segmentation and processing of continuous data streams using transactional semantics |
JP3318834B2 (ja) | 1999-07-30 | 2002-08-26 | 三菱電機株式会社 | データファイルシステム及びデータ検索方法 |
JP3567861B2 (ja) | 2000-07-07 | 2004-09-22 | 日本電信電話株式会社 | 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 |
JP4366845B2 (ja) | 2000-07-24 | 2009-11-18 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラム提供媒体 |
US6788302B1 (en) | 2000-08-03 | 2004-09-07 | International Business Machines Corporation | Partitioning and load balancing graphical shape data for parallel applications |
US7039627B1 (en) | 2000-12-22 | 2006-05-02 | Nortel Networks Limited | Method and apparatus for performing a radix search by selecting one of a valid table and a transition table |
US6952693B2 (en) | 2001-02-23 | 2005-10-04 | Ran Wolff | Distributed mining of association rules |
US20020161778A1 (en) | 2001-02-24 | 2002-10-31 | Core Integration Partners, Inc. | Method and system of data warehousing and building business intelligence using a data storage model |
US20020120602A1 (en) | 2001-02-28 | 2002-08-29 | Ross Overbeek | System, method and computer program product for simultaneous analysis of multiple genomes |
CA2349265A1 (en) | 2001-05-30 | 2002-11-30 | Andrew Emili | Protein expression profile database |
US20030033138A1 (en) | 2001-07-26 | 2003-02-13 | Srinivas Bangalore | Method for partitioning a data set into frequency vectors for clustering |
US7130852B2 (en) | 2001-07-27 | 2006-10-31 | Silicon Valley Bank | Internal security system for a relational database system |
AU2002355530A1 (en) | 2001-08-03 | 2003-02-24 | John Allen Ananian | Personalized interactive digital catalog profiling |
US6801903B2 (en) | 2001-10-12 | 2004-10-05 | Ncr Corporation | Collecting statistics in a database system |
US20030140027A1 (en) | 2001-12-12 | 2003-07-24 | Jeffrey Huttel | Universal Programming Interface to Knowledge Management (UPIKM) database system with integrated XML interface |
US7813937B1 (en) | 2002-02-15 | 2010-10-12 | Fair Isaac Corporation | Consistency modeling of healthcare claims to detect fraud and abuse |
US7031969B2 (en) | 2002-02-20 | 2006-04-18 | Lawrence Technologies, Llc | System and method for identifying relationships between database records |
AU2003223314B2 (en) | 2002-03-19 | 2007-04-05 | Mapinfo Corporation | Location based service provider |
US20040083199A1 (en) | 2002-08-07 | 2004-04-29 | Govindugari Diwakar R. | Method and architecture for data transformation, normalization, profiling, cleansing and validation |
US6657568B1 (en) | 2002-08-27 | 2003-12-02 | Fmr Corp. | Data packing for real-time streaming |
US7047230B2 (en) | 2002-09-09 | 2006-05-16 | Lucent Technologies Inc. | Distinct sampling system and a method of distinct sampling for optimizing distinct value query estimates |
US7043476B2 (en) | 2002-10-11 | 2006-05-09 | International Business Machines Corporation | Method and apparatus for data mining to discover associations and covariances associated with data |
AU2003284118A1 (en) | 2002-10-14 | 2004-05-04 | Battelle Memorial Institute | Information reservoir |
US7698163B2 (en) | 2002-11-22 | 2010-04-13 | Accenture Global Services Gmbh | Multi-dimensional segmentation for use in a customer interaction |
US7403942B1 (en) | 2003-02-04 | 2008-07-22 | Seisint, Inc. | Method and system for processing data records |
US7433861B2 (en) | 2003-03-13 | 2008-10-07 | International Business Machines Corporation | Byte-code representations of actual data to reduce network traffic in database transactions |
US7117222B2 (en) | 2003-03-13 | 2006-10-03 | International Business Machines Corporation | Pre-formatted column-level caching to improve client performance |
US7840664B2 (en) | 2003-05-21 | 2010-11-23 | Ixia | Automated characterization of network traffic |
US20040249810A1 (en) | 2003-06-03 | 2004-12-09 | Microsoft Corporation | Small group sampling of data for use in query processing |
GB0314591D0 (en) | 2003-06-21 | 2003-07-30 | Ibm | Profiling data in a data store |
US20050240354A1 (en) | 2003-08-27 | 2005-10-27 | Ascential Software Corporation | Service oriented architecture for an extract function in a data integration platform |
US20060069717A1 (en) | 2003-08-27 | 2006-03-30 | Ascential Software Corporation | Security service for a services oriented architecture in a data integration platform |
US7426520B2 (en) * | 2003-09-10 | 2008-09-16 | Exeros, Inc. | Method and apparatus for semantic discovery and mapping between data sources |
CN1853181A (zh) | 2003-09-15 | 2006-10-25 | Ab开元软件公司 | 数据归档 |
WO2005029369A2 (en) | 2003-09-15 | 2005-03-31 | Ab Initio Software Corporation | Data profiling |
US7587394B2 (en) | 2003-09-23 | 2009-09-08 | International Business Machines Corporation | Methods and apparatus for query rewrite with auxiliary attributes in query processing operations |
US7149736B2 (en) | 2003-09-26 | 2006-12-12 | Microsoft Corporation | Maintaining time-sorted aggregation records representing aggregations of values from multiple database records using multiple partitions |
US7698345B2 (en) | 2003-10-21 | 2010-04-13 | The Nielsen Company (Us), Llc | Methods and apparatus for fusing databases |
US7689542B2 (en) | 2004-01-13 | 2010-03-30 | Oracle International Corporation | Dynamic return type generation in a database system |
US7376656B2 (en) | 2004-02-10 | 2008-05-20 | Microsoft Corporation | System and method for providing user defined aggregates in a database system |
US20050177578A1 (en) | 2004-02-10 | 2005-08-11 | Chen Yao-Ching S. | Efficient type annontation of XML schema-validated XML documents without schema validation |
US8447743B2 (en) | 2004-08-17 | 2013-05-21 | International Business Machines Corporation | Techniques for processing database queries including user-defined functions |
US20060074881A1 (en) | 2004-10-02 | 2006-04-06 | Adventnet, Inc. | Structure independent searching in disparate databases |
US8145642B2 (en) * | 2004-11-30 | 2012-03-27 | Oracle International Corporation | Method and apparatus to support bitmap filtering in a parallel system |
US8572018B2 (en) | 2005-06-20 | 2013-10-29 | New York University | Method, system and software arrangement for reconstructing formal descriptive models of processes from functional/modal data using suitable ontology |
US7716630B2 (en) | 2005-06-27 | 2010-05-11 | Ab Initio Technology Llc | Managing parameters for graph-based computations |
US7584205B2 (en) | 2005-06-27 | 2009-09-01 | Ab Initio Technology Llc | Aggregating data with complex operations |
US7774346B2 (en) | 2005-08-26 | 2010-08-10 | Oracle International Corporation | Indexes that are based on bitmap values and that use summary bitmap values |
JP3962417B2 (ja) | 2005-08-31 | 2007-08-22 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベースに対するアクセスを制御するシステム、およびその方法 |
US20070073721A1 (en) | 2005-09-23 | 2007-03-29 | Business Objects, S.A. | Apparatus and method for serviced data profiling operations |
US8271452B2 (en) | 2006-06-12 | 2012-09-18 | Rainstor Limited | Method, system, and database archive for enhancing database archiving |
US8260910B2 (en) | 2006-09-19 | 2012-09-04 | Oracle America, Inc. | Method and apparatus for monitoring a data stream to detect a pattern of data elements using bloom filters |
NO325864B1 (no) | 2006-11-07 | 2008-08-04 | Fast Search & Transfer Asa | Fremgangsmåte ved beregning av sammendragsinformasjon og en søkemotor for å støtte og implementere fremgangsmåten |
CN101191069B (zh) | 2006-11-21 | 2011-04-27 | 中国石油化工股份有限公司 | 石脑油催化裂解制乙烯和丙烯的方法 |
US8412713B2 (en) | 2007-03-06 | 2013-04-02 | Mcafee, Inc. | Set function calculation in a database |
US8069129B2 (en) | 2007-04-10 | 2011-11-29 | Ab Initio Technology Llc | Editing and compiling business rules |
US7958142B2 (en) | 2007-09-20 | 2011-06-07 | Microsoft Corporation | User profile aggregation |
US20090226916A1 (en) | 2008-02-01 | 2009-09-10 | Life Technologies Corporation | Automated Analysis of DNA Samples |
US7912867B2 (en) | 2008-02-25 | 2011-03-22 | United Parcel Services Of America, Inc. | Systems and methods of profiling data for integration |
US8463739B2 (en) | 2008-08-28 | 2013-06-11 | Red Hat, Inc. | Systems and methods for generating multi-population statistical measures using middleware |
CN104731981B (zh) | 2008-09-19 | 2018-03-20 | 甲骨文国际公司 | 存储器端存储请求管理 |
US20100114976A1 (en) | 2008-10-21 | 2010-05-06 | Castellanos Maria G | Method For Database Design |
US9251212B2 (en) | 2009-03-27 | 2016-02-02 | Business Objects Software Ltd. | Profiling in a massive parallel processing environment |
US20110029478A1 (en) | 2009-05-20 | 2011-02-03 | Broeker Stephen A | Stream Star Schema and Nested Binary Tree for Data Stream Analysis |
KR101631978B1 (ko) | 2009-09-16 | 2016-06-20 | 아브 이니티오 테크놀로지 엘엘시 | 데이터세트 요소의 매핑 |
CN101661510A (zh) | 2009-09-29 | 2010-03-03 | 金蝶软件(中国)有限公司 | 一种数据匹配方法及装置 |
US8560575B2 (en) | 2009-11-12 | 2013-10-15 | Salesforce.Com, Inc. | Methods and apparatus for selecting updates to associated records to publish on an information feed in an on-demand database service environment |
US10445309B2 (en) | 2009-11-13 | 2019-10-15 | Ab Initio Technology Llc | Managing record format information |
US8396873B2 (en) | 2010-03-10 | 2013-03-12 | Emc Corporation | Index searching using a bloom filter |
EP2585949B1 (en) | 2010-06-22 | 2015-03-25 | Ab Initio Technology LLC | Processing related datasets |
US10558705B2 (en) | 2010-10-20 | 2020-02-11 | Microsoft Technology Licensing, Llc | Low RAM space, high-throughput persistent key-value store using secondary memory |
US8296274B2 (en) | 2011-01-27 | 2012-10-23 | Leppard Andrew | Considering multiple lookups in bloom filter decision making |
EP2668725B1 (en) | 2011-01-28 | 2021-12-22 | Ab Initio Technology LLC | Generating data pattern information |
EP2704682A4 (en) | 2011-05-05 | 2014-10-22 | Aegis Analytical Corp | SYSTEM FOR DESIGNATING, DISPLAYING AND SELECTING TYPES OF PROCESS PARAMETERS AND PRODUCT RESET PARAMETERS |
US8610605B2 (en) | 2011-06-17 | 2013-12-17 | Sap Ag | Method and system for data compression |
US8856085B2 (en) | 2011-07-19 | 2014-10-07 | International Business Machines Corporation | Automatic consistent sampling for data analysis |
US8666919B2 (en) | 2011-07-29 | 2014-03-04 | Accenture Global Services Limited | Data quality management for profiling, linking, cleansing and migrating data |
US8880880B2 (en) * | 2011-07-29 | 2014-11-04 | Qualcomm Incorporated | Facilitating access control in peer-to-peer overlay networks |
CN103176973B (zh) | 2011-12-20 | 2016-04-20 | 国际商业机器公司 | 用于生成数据库的测试工作负载的系统和方法 |
US8762396B2 (en) | 2011-12-22 | 2014-06-24 | Sap Ag | Dynamic, hierarchical bloom filters for network data routing |
US9336246B2 (en) | 2012-02-28 | 2016-05-10 | International Business Machines Corporation | Generating composite key relationships between database objects based on sampling |
CN102681946B (zh) | 2012-05-11 | 2015-03-11 | 龙芯中科技术有限公司 | 内存访问方法和装置 |
US11449952B2 (en) | 2012-10-01 | 2022-09-20 | Oracle International Corporation | Efficiently modeling database scenarios for later use on live data |
US9892026B2 (en) | 2013-02-01 | 2018-02-13 | Ab Initio Technology Llc | Data records selection |
-
2014
- 2014-01-16 US US14/156,544 patent/US11487732B2/en active Active
-
2015
- 2015-01-15 WO PCT/US2015/011518 patent/WO2015109047A1/en active Application Filing
- 2015-01-15 AU AU2015206487A patent/AU2015206487B2/en active Active
- 2015-01-15 CN CN201580004845.0A patent/CN105917336B/zh active Active
- 2015-01-15 SG SG11201604859RA patent/SG11201604859RA/en unknown
- 2015-01-15 KR KR1020167018899A patent/KR102240137B1/ko active IP Right Grant
- 2015-01-15 CA CA2934034A patent/CA2934034C/en active Active
- 2015-01-15 JP JP2016543564A patent/JP6526684B2/ja active Active
- 2015-01-15 EP EP15701659.3A patent/EP3095047B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
CA2934034C (en) | 2021-09-21 |
SG11201604859RA (en) | 2016-08-30 |
EP3095047B1 (en) | 2021-06-23 |
WO2015109047A1 (en) | 2015-07-23 |
KR102240137B1 (ko) | 2021-04-13 |
US20150199352A1 (en) | 2015-07-16 |
AU2015206487A1 (en) | 2016-06-30 |
JP2017507392A (ja) | 2017-03-16 |
CN105917336B (zh) | 2021-06-29 |
KR20160107188A (ko) | 2016-09-13 |
CA2934034A1 (en) | 2015-07-23 |
AU2015206487B2 (en) | 2020-07-02 |
CN105917336A (zh) | 2016-08-31 |
EP3095047A1 (en) | 2016-11-23 |
US11487732B2 (en) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6526684B2 (ja) | データベースキーの識別 | |
US9411712B2 (en) | Generating test data | |
JP5372850B2 (ja) | データプロファイリング | |
JP6427592B2 (ja) | データ型に関連するデータプロファイリング操作の管理 | |
JP6636009B2 (ja) | 系統情報の管理 | |
JP6533746B2 (ja) | データレコード選択 | |
US10713589B1 (en) | Consistent sort-based record-level shuffling of machine learning data | |
KR101781416B1 (ko) | 관련 데이터세트의 처리 | |
US8719271B2 (en) | Accelerating data profiling process | |
EP3070620A1 (en) | Lightweight table comparison | |
US10877995B2 (en) | Building a distributed dwarf cube using mapreduce technique | |
JP2014507713A (ja) | データの集合体に対する変更の管理 | |
AU2014265246B2 (en) | Managing memory and storage space for a data operation | |
US7680833B1 (en) | System and method for database structure comparison | |
Brown et al. | Secure Record Linkage of Large Health Data Sets: Evaluation of a Hybrid Cloud Model | |
Pham et al. | ELODU: Entity Resolution in Big Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170411 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180410 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190318 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190408 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190508 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6526684 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |