JP6066927B2 - データパターン情報の生成 - Google Patents
データパターン情報の生成 Download PDFInfo
- Publication number
- JP6066927B2 JP6066927B2 JP2013551372A JP2013551372A JP6066927B2 JP 6066927 B2 JP6066927 B2 JP 6066927B2 JP 2013551372 A JP2013551372 A JP 2013551372A JP 2013551372 A JP2013551372 A JP 2013551372A JP 6066927 B2 JP6066927 B2 JP 6066927B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- records
- field
- fields
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 47
- 238000012545 processing Methods 0.000 claims description 33
- 238000003860 storage Methods 0.000 claims description 23
- 238000013500 data storage Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 15
- 238000010200 validation analysis Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000000875 corresponding effect Effects 0.000 description 32
- 238000004458 analytical method Methods 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 238000009472 formulation Methods 0.000 description 14
- 239000000203 mixture Substances 0.000 description 14
- 238000007781 pre-processing Methods 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000009662 stress testing Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2365—Ensuring data consistency and integrity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
Description
本出願は、2011年1月28日に出願された米国特許出願第61/437,361号明細書の優先権を主張するものである。
Claims (28)
- 複数のレコードを含む少なくとも1つのデータセットをデータストレージシステムに記憶するステップと、
前記レコードにおけるデータパターンを表すコードを生成するために、前記データストレージシステムに接続されたデータ処理システムにおいて、前記複数のレコードを処理するステップであって、前記データパターンが、前記レコードのそれぞれに含まれる1又は2以上のフィールドにおける、データのポピュレーション又はデータの有効性のうちの少なくとも1つを表す、処理するステップと
を含む方法であって、
前記処理するステップが、前記複数のレコードにおける多様なレコードのそれぞれについて、1又は2以上の要素を符号化するコードを前記レコードに関連付けるステップであって、それぞれの要素が、要素値のセットの1つとして、対応するフィールド若しくはフィールドの組み合わせの状態又はプロパティを表し、少なくとも第1のコードの少なくとも1つの要素について、前記セット内の要素値の数が、前記データセットにおける前記複数のレコードのすべてにわたって前記対応するフィールド若しくはフィールドの組み合わせにおいて発生するデータ値の総数よりも少ない、前記ステップと、
前記多様なレコードと関連付けられた前記コードに基づいて対応するフィールド又はフィールドの組み合わせの状態又はプロパティを集約するパターン情報をユーザインターフェース内のグラフィカル表示を通してユーザに表示するステップを含む
方法。 - 第1のコードの少なくとも1つの要素について、セット内の少なくとも2つの要素値が、ポピュレートされている、又はポピュレートされていないときのフィールドの状態をそれぞれ表す、請求項1に記載の方法。
- ポピュレートされていない状態が、ヌル状態、非存在状態、又は空状態のうちの1つを含む、請求項2に記載の方法。
- ヌル状態が、所定の値を有するフィールドの状態を含む、請求項3に記載の方法。
- 所定の値が、1又は2以上の空白文字を含む、請求項4に記載の方法。
- 非存在状態が、レコードにおいて欠けているフィールドを含む、請求項3〜5のいずれかに記載の方法。
- 空状態が、対応するデータ値を有さないフィールドを含む、請求項3〜6のいずれかに記載の方法。
- 第1のコードの少なくとも1つの要素について、セット内の少なくとも2つの要素値が、フィールドに関連付けられたバリデーションルールに従って、有効である又は有効でない前記フィールドにおいて発生するデータ値を表す、請求項1〜7のいずれかに記載の方法。
- バリデーションルールが、データ値のデータタイプに少なくとも部分的に基づいて、有効値を定義する、請求項8に記載の方法。
- バリデーションルールが、列挙された値のリストを参照することによって、少なくとも部分的に有効値を定義する、請求項8に記載の方法。
- 第1のコードの少なくとも1つの要素について、セット内の1又は2以上の要素値が、第1のフィールドにおいて発生するデータ値がターゲットデータ値と一致する度合いを表す、請求項1〜10のいずれかに記載の方法。
- ターゲットデータ値が、第2のフィールドにおいて発生するデータ値である、請求項11に記載の方法。
- セット内の少なくとも3つの要素値が、第1のフィールドにおいて発生するデータ値が、不一致、完全一致、又はファジーマッチとしてそれぞれターゲットデータ値に一致する度合いを表す、請求項1〜12のいずれかに記載の方法。
- 第1のコードの少なくとも1つの要素について、セット内の少なくとも1つの要素値が、第1のレコードのフィールド若しくはフィールドの組み合わせにおいて発生する1又は2以上の値から、及び前記第1のレコードとは異なる少なくとも第2のレコードを含む1又は2以上のレコードのセットのフィールド若しくはフィールドの組み合わせにおいて発生する1又は2以上の値から、計算されるデータ値を符号化する、請求項1〜13のいずれかに記載の方法。
- 第1のレコードが、第1のデータセット内にあり、第2のレコードが、前記第1のデータセットとは異なる第2のデータセット内にある、請求項14に記載の方法。
- 少なくとも第2のコードの少なくとも1つの要素について、セット内の少なくとも1つの要素値が、フィールドにおいて発生する所定のデータ値を表す、請求項1〜15のいずれかに記載の方法。
- 第2のコードの要素についての要素値のセット内の要素値の数が、データセットにおける複数のレコードのすべてにわたって対応するフィールド又はフィールドの組み合わせにおいて発生するデータ値の総数に等しい、請求項16に記載の方法。
- コンピュータプログラムを記憶するコンピュータ可読ストレージ媒体であって、前記コンピュータプログラムが、コンピュータシステムに、
複数のレコードを含む少なくとも1つのデータセットをデータストレージシステムに記憶させ、
前記レコードにおけるデータパターンを表すコードを生成するために、前記データストレージシステムに接続された、前記コンピュータシステムの少なくとも1つのプロセッサにおいて、前記複数のレコードを処理させるための命令を含み、前記データパターンが、前記レコードのそれぞれに含まれる1又は2以上のフィールドにおける、データのポピュレーション又はデータの有効性のうちの少なくとも1つを表し、
前記処理させることが、前記複数のレコードにおける多様なレコードのそれぞれについて、1又は2以上の要素を符号化するコードを前記レコードに関連付けることであって、それぞれの要素が、要素値のセットの1つとして、対応するフィールド若しくはフィールドの組み合わせの状態又はプロパティを表し、少なくとも第1のコードの少なくとも1つの要素について、前記セット内の要素値の数が、前記データセットにおける前記複数のレコードのすべてにわたって前記対応するフィールド若しくはフィールドの組み合わせにおいて発生するデータ値の総数よりも少ないことと、
前記多様なレコードと関連付けられた前記コードに基づいて対応するフィールド又はフィールドの組み合わせの状態又はプロパティを集約するパターン情報をユーザインターフェース内のグラフィカル表示を通してユーザに表示することを含む、
コンピュータ可読ストレージ媒体。 - 複数のレコードを含む少なくとも1つのデータセットを記憶するように構成されたデータストレージシステムと、
前記レコードにおけるデータパターンを表すコードを生成するために、前記複数のレコードを処理するように構成された、前記データストレージシステムに接続されたデータ処理システムであって、前記データパターンが、前記レコードのそれぞれに含まれる1又は2以上のフィールドにおける、データのポピュレーション又はデータの有効性のうちの少なくとも1つを表す、システムと
を含むシステムであって、
前記処理することが、前記複数のレコードにおける多様なレコードのそれぞれについて、1又は2以上の要素を符号化するコードを前記レコードに関連付けることであって、それぞれの要素が、要素値のセットの1つとして、対応するフィールド若しくはフィールドの組み合わせの状態又はプロパティを表し、少なくとも第1のコードの少なくとも1つの要素について、前記セット内の要素値の数が、前記データセットにおける前記複数のレコードのすべてにわたって前記対応するフィールド若しくはフィールドの組み合わせにおいて発生するデータ値の総数よりも少ないことと、
前記多様なレコードと関連付けられた前記コードに基づいて対応するフィールド又はフィールドの組み合わせの状態又はプロパティを集約するパターン情報をユーザインターフェース内のグラフィカル表示を通してユーザに表示することを含む
システム。 - 複数のレコードを含む少なくとも1つのデータセットを記憶するための手段と、
前記レコードにおけるデータパターンを表すコードを生成するために、前記複数のレコードを処理するための手段であって、前記データパターンが、前記レコードのそれぞれに含まれる1又は2以上のフィールドにおける、データのポピュレーション又はデータの有効性のうちの少なくとも1つを表す、手段と
を含むシステムであって、
前記処理することが、前記複数のレコードにおける多様なレコードのそれぞれについて、1又は2以上の要素を符号化するコードを前記レコードに関連付けることであって、それぞれの要素が、要素値のセットの1つとして、対応するフィールド若しくはフィールドの組み合わせの状態又はプロパティを表し、少なくとも第1のコードの少なくとも1つの要素について、前記セット内の要素値の数が、前記データセットにおける前記複数のレコードのすべてにわたって前記対応するフィールド若しくはフィールドの組み合わせにおいて発生するデータ値の総数よりも少ないことと、
前記多様なレコードと関連付けられた前記コードに基づいて対応するフィールド又はフィールドの組み合わせの状態又はプロパティを集約するパターン情報をユーザインターフェース内のグラフィカル表示を通してユーザに表示することを含む
システム。 - 第1のコードの少なくとも1つの要素について、セット内の少なくとも2つの要素値が、ポピュレートされている又はポピュレートされていないときのフィールドの状態をそれぞれ表し、ポピュレートされていない状態が、空状態及び非存在状態の両方を含む、請求項1に記載の方法。
- パターン情報を表示するステップが、
多様なレコードに関連付けられたコードに少なくとも部分的に基づいて前記多様なレコードを特徴づける1又は2以上のデータパターンを決定するステップ、及び
決定された前記1又は2以上のデータパターンからの少なくとも1つの対応する決定されたデータパターンに基づいて、前記多様なレコードの1又は2以上のサブセットを処理するステップ
を含む、請求項1に記載の方法。 - 第1のコードの少なくとも1つの要素について、セット内の1又は2以上の要素値が、第1のフィールドにおいて発生するデータ値がターゲットデータ値と一致する度合いを表す、請求項18に記載のコンピュータ可読ストレージ媒体。
- ターゲットデータ値が、第2のフィールドにおいて発生するデータ値である、請求項23に記載のコンピュータ可読ストレージ媒体。
- 第1のコードの少なくとも1つの要素について、セット内の少なくとも1つの要素値が、第1のレコードのフィールド若しくはフィールドの組み合わせにおいて発生する1又は2以上の値から、及び前記第1のレコードとは異なる少なくとも第2のレコードを含む1又は2以上のレコードのセットのフィールド若しくはフィールドの組み合わせにおいて発生する1又は2以上の値から、計算されるデータ値を符号化する、請求項18に記載のコンピュータ可読ストレージ媒体。
- 第1のレコードが、第1のデータセット内にあり、第2のレコードが、前記第1のデータセットとは異なる第2のデータセット内にある、請求項25に記載のコンピュータ可読ストレージ媒体。
- 第1のコードの少なくとも1つの要素について、セット内の少なくとも2つの要素値が、ポピュレートされている又はポピュレートされていないときのフィールドの状態をそれぞれ表し、ポピュレートされていない状態が、空状態及び非存在状態の両方を含む、請求項18に記載のコンピュータ可読ストレージ媒体。
- パターン情報を表示することが、
多様なレコードに関連付けられたコードに少なくとも部分的に基づいて前記多様なレコードを特徴づける1又は2以上のデータパターンを決定すること、及び
決定された前記1又は2以上のデータパターンからの少なくとも1つの対応する決定されたデータパターンに基づいて、前記多様なレコードの1又は2以上のサブセットを処理すること
を含む、請求項18に記載のコンピュータ可読ストレージ媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161437361P | 2011-01-28 | 2011-01-28 | |
US61/437,361 | 2011-01-28 | ||
PCT/US2012/022905 WO2012103438A1 (en) | 2011-01-28 | 2012-01-27 | Generating data pattern information |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014511587A JP2014511587A (ja) | 2014-05-15 |
JP6066927B2 true JP6066927B2 (ja) | 2017-01-25 |
Family
ID=45607383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013551372A Active JP6066927B2 (ja) | 2011-01-28 | 2012-01-27 | データパターン情報の生成 |
Country Status (8)
Country | Link |
---|---|
US (2) | US9449057B2 (ja) |
EP (1) | EP2668725B1 (ja) |
JP (1) | JP6066927B2 (ja) |
KR (1) | KR101889120B1 (ja) |
CN (1) | CN103348598B (ja) |
AU (1) | AU2012211167B2 (ja) |
CA (1) | CA2823658C (ja) |
WO (1) | WO2012103438A1 (ja) |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100922141B1 (ko) * | 2003-09-15 | 2009-10-19 | 아브 이니티오 소프트웨어 엘엘시 | 데이터 프로파일링 방법 및 시스템 |
US9430773B2 (en) | 2006-07-18 | 2016-08-30 | American Express Travel Related Services Company, Inc. | Loyalty incentive program using transaction cards |
US9558505B2 (en) | 2006-07-18 | 2017-01-31 | American Express Travel Related Services Company, Inc. | System and method for prepaid rewards |
US9542690B2 (en) | 2006-07-18 | 2017-01-10 | American Express Travel Related Services Company, Inc. | System and method for providing international coupon-less discounts |
US10102398B2 (en) | 2009-06-01 | 2018-10-16 | Ab Initio Technology Llc | Generating obfuscated data |
KR20150040384A (ko) | 2009-06-10 | 2015-04-14 | 아브 이니티오 테크놀로지 엘엘시 | 테스트 데이터의 생성 |
US9449057B2 (en) | 2011-01-28 | 2016-09-20 | Ab Initio Technology Llc | Generating data pattern information |
US8595200B2 (en) * | 2012-01-03 | 2013-11-26 | Wizsoft Ltd. | Finding suspicious association rules in data records |
US9195988B2 (en) | 2012-03-13 | 2015-11-24 | American Express Travel Related Services Company, Inc. | Systems and methods for an analysis cycle to determine interest merchants |
US10181126B2 (en) * | 2012-03-13 | 2019-01-15 | American Express Travel Related Services Company, Inc. | Systems and methods for tailoring marketing |
US9116947B2 (en) * | 2012-03-15 | 2015-08-25 | Hewlett-Packard Development Company, L.P. | Data-record pattern searching |
US10664883B2 (en) | 2012-09-16 | 2020-05-26 | American Express Travel Related Services Company, Inc. | System and method for monitoring activities in a digital channel |
US8868444B2 (en) | 2012-09-16 | 2014-10-21 | American Express Travel Related Services Company, Inc. | System and method for rewarding in channel accomplishments |
CA2887661C (en) * | 2012-10-22 | 2022-08-02 | Ab Initio Technology Llc | Characterizing data sources in a data storage system |
CA2887670C (en) | 2012-10-22 | 2021-05-25 | Ab Initio Technology Llc | Profiling data with location information |
US10504132B2 (en) | 2012-11-27 | 2019-12-10 | American Express Travel Related Services Company, Inc. | Dynamic rewards program |
US9892026B2 (en) * | 2013-02-01 | 2018-02-13 | Ab Initio Technology Llc | Data records selection |
US9003382B2 (en) * | 2013-02-18 | 2015-04-07 | Red Hat, Inc. | Efficient just-in-time compilation |
KR102220246B1 (ko) * | 2013-12-18 | 2021-02-24 | 아브 이니티오 테크놀로지 엘엘시 | 데이터 생성 |
US11487732B2 (en) | 2014-01-16 | 2022-11-01 | Ab Initio Technology Llc | Database key identification |
CA2939915C (en) | 2014-03-07 | 2021-02-16 | Ab Initio Technology Llc | Managing data profiling operations related to data type |
US10769122B2 (en) * | 2014-03-13 | 2020-09-08 | Ab Initio Technology Llc | Specifying and applying logical validation rules to data |
US10395237B2 (en) | 2014-05-22 | 2019-08-27 | American Express Travel Related Services Company, Inc. | Systems and methods for dynamic proximity based E-commerce transactions |
GB201409214D0 (en) * | 2014-05-23 | 2014-07-09 | Ibm | A method and system for processing a data set |
US9606903B2 (en) * | 2014-06-06 | 2017-03-28 | Paypal, Inc. | Unit test automation for business rules and applications |
US9355114B1 (en) | 2014-06-25 | 2016-05-31 | Groupon, Inc. | Graph-based compression of data records |
US9922290B2 (en) | 2014-08-12 | 2018-03-20 | Microsoft Technology Licensing, Llc | Entity resolution incorporating data from various data sources which uses tokens and normalizes records |
KR102356771B1 (ko) * | 2014-09-08 | 2022-01-27 | 아브 이니티오 테크놀로지 엘엘시 | 데이터 구동 테스트 프레임워크 |
US10176234B2 (en) | 2014-11-05 | 2019-01-08 | Ab Initio Technology Llc | Impact analysis |
CN104820720A (zh) * | 2015-05-26 | 2015-08-05 | 北京京东尚科信息技术有限公司 | 一种数据质量检测方法和装置 |
US10140327B2 (en) * | 2015-08-24 | 2018-11-27 | Palantir Technologies Inc. | Feature clustering of users, user correlation database access, and user interface generation system |
US11386061B2 (en) | 2015-10-16 | 2022-07-12 | Microsoft Technology Licensing, Llc | Telemetry request system |
US11288245B2 (en) | 2015-10-16 | 2022-03-29 | Microsoft Technology Licensing, Llc | Telemetry definition system |
US10929272B2 (en) * | 2015-10-16 | 2021-02-23 | Microsoft Technology Licensing, Llc | Telemetry system extension |
US10430284B2 (en) * | 2016-06-08 | 2019-10-01 | International Business Machines Corporation | Creating a full backup image from incremental backups |
CN106202240A (zh) * | 2016-06-29 | 2016-12-07 | 华能国际电力股份有限公司 | 物资编码数据处理方法及装置 |
US11256710B2 (en) | 2016-10-20 | 2022-02-22 | Microsoft Technology Licensing, Llc | String transformation sub-program suggestion |
US11620304B2 (en) | 2016-10-20 | 2023-04-04 | Microsoft Technology Licensing, Llc | Example management for string transformation |
US10846298B2 (en) | 2016-10-28 | 2020-11-24 | Microsoft Technology Licensing, Llc | Record profiling for dataset sampling |
CA2989617A1 (en) * | 2016-12-19 | 2018-06-19 | Capital One Services, Llc | Systems and methods for providing data quality management |
US10229750B2 (en) * | 2017-01-18 | 2019-03-12 | Bank Of America Corporation | Memory management architecture for use with a diagnostic tool |
CN107403371B (zh) * | 2017-04-13 | 2020-06-09 | 阿里巴巴集团控股有限公司 | 一种数据生成方法和装置 |
US20190163734A1 (en) * | 2017-11-27 | 2019-05-30 | Microsoft Technology Licensing, Llc | Dynamic pattern recognition in spreadsheets |
US11068540B2 (en) | 2018-01-25 | 2021-07-20 | Ab Initio Technology Llc | Techniques for integrating validation results in data profiling and related systems and methods |
US10891307B2 (en) * | 2018-05-31 | 2021-01-12 | Microsoft Technology Licensing, Llc | Distributed data synchronization in a distributed computing system |
CN108959411B (zh) * | 2018-06-07 | 2020-12-08 | 新华三大数据技术有限公司 | Etl任务的处理方法、装置和设备 |
WO2020005090A1 (en) * | 2018-06-25 | 2020-01-02 | Siemens Aktiengesellschaft | System and method for streaming measurement data |
US11526630B2 (en) | 2019-02-21 | 2022-12-13 | The Toronto-Dominion Bank | Managing cryptographically secure exchanges of data using permissioned distributed ledgers |
US10782942B1 (en) * | 2019-09-13 | 2020-09-22 | Capital One Services, Llc | Rapid onboarding of data from diverse data sources into standardized objects with parser and unit test generation |
CN111008523A (zh) * | 2019-11-21 | 2020-04-14 | 中科鼎富(北京)科技发展有限公司 | 一种信息提取方法、装置及服务器 |
CN111177179B (zh) * | 2019-12-06 | 2023-11-10 | 北京懿医云科技有限公司 | 一种信息记录方法及装置 |
CN111259107B (zh) | 2020-01-10 | 2023-08-18 | 北京百度网讯科技有限公司 | 行列式文本的存储方法、装置以及电子设备 |
US11657033B2 (en) * | 2020-10-16 | 2023-05-23 | Capital One Services, Llc | Systems and methods for maintaining data quality in a data store receiving both low and high quality data |
US11593382B2 (en) | 2021-03-22 | 2023-02-28 | International Business Machines Corporation | Efficient storage of columns with inappropriate data types in relational databases |
US11449487B1 (en) | 2021-03-22 | 2022-09-20 | International Business Machines Corporation | Efficient indexing of columns with inappropriate data types in relational databases |
US20220318418A1 (en) * | 2021-03-31 | 2022-10-06 | Collibra Nv | Systems and methods for an on-demand, secure, and predictive value-added data marketplace |
CN114356985B (zh) * | 2021-12-24 | 2024-04-02 | 深圳市傲天科技股份有限公司 | 信息估计方法、装置、设备及存储介质 |
CN114677955B (zh) * | 2022-03-17 | 2023-09-26 | Tcl华星光电技术有限公司 | 显示面板及其控制方法 |
Family Cites Families (87)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5179643A (en) | 1988-12-23 | 1993-01-12 | Hitachi, Ltd. | Method of multi-dimensional analysis and display for a large volume of record information items and a system therefor |
JPH032938A (ja) | 1989-05-31 | 1991-01-09 | Hitachi Ltd | データベース処理方法 |
FR2698465B1 (fr) | 1992-11-20 | 1995-01-13 | Bull Sa | Méthode d'extraction de profils de statistiques, utilisation des statistiques créées par la méthode. |
JP3079881B2 (ja) | 1993-08-10 | 2000-08-21 | 三菱自動車工業株式会社 | 道路交通状況推定方法および車両運転特性制御方法 |
US5742806A (en) | 1994-01-31 | 1998-04-21 | Sun Microsystems, Inc. | Apparatus and method for decomposing database queries for database management system including multiprocessor digital data processing system |
JP3519126B2 (ja) | 1994-07-14 | 2004-04-12 | 株式会社リコー | 自動レイアウトシステム |
US5842200A (en) | 1995-03-31 | 1998-11-24 | International Business Machines Corporation | System and method for parallel mining of association rules in databases |
US6601048B1 (en) | 1997-09-12 | 2003-07-29 | Mci Communications Corporation | System and method for detecting and managing fraud |
US5966072A (en) | 1996-07-02 | 1999-10-12 | Ab Initio Software Corporation | Executing computations expressed as graphs |
US5778373A (en) | 1996-07-15 | 1998-07-07 | At&T Corp | Integration of an information server database schema by generating a translation map from exemplary files |
US6138123A (en) | 1996-07-25 | 2000-10-24 | Rathbun; Kyle R. | Method for creating and using parallel data structures |
JPH1055367A (ja) | 1996-08-09 | 1998-02-24 | Hitachi Ltd | データ利用システム |
US5845285A (en) | 1997-01-07 | 1998-12-01 | Klein; Laurence C. | Computer system and method of data analysis |
US5987453A (en) | 1997-04-07 | 1999-11-16 | Informix Software, Inc. | Method and apparatus for performing a join query in a database system |
US6134560A (en) | 1997-12-16 | 2000-10-17 | Kliebhan; Daniel F. | Method and apparatus for merging telephone switching office databases |
US6826556B1 (en) | 1998-10-02 | 2004-11-30 | Ncr Corporation | Techniques for deploying analytic models in a parallel |
US6959300B1 (en) | 1998-12-10 | 2005-10-25 | At&T Corp. | Data compression method and apparatus |
US6343294B1 (en) | 1998-12-15 | 2002-01-29 | International Business Machines Corporation | Data file editor for multiple data subsets |
US6741995B1 (en) | 1999-03-23 | 2004-05-25 | Metaedge Corporation | Method for dynamically creating a profile |
US6163774A (en) | 1999-05-24 | 2000-12-19 | Platinum Technology Ip, Inc. | Method and apparatus for simplified and flexible selection of aggregate and cross product levels for a data warehouse |
WO2000079415A2 (en) | 1999-06-18 | 2000-12-28 | Torrent Systems, Inc. | Segmentation and processing of continuous data streams using transactional semantics |
US6801938B1 (en) | 1999-06-18 | 2004-10-05 | Torrent Systems, Inc. | Segmentation and processing of continuous data streams using transactional semantics |
JP3318834B2 (ja) | 1999-07-30 | 2002-08-26 | 三菱電機株式会社 | データファイルシステム及びデータ検索方法 |
JP3567861B2 (ja) | 2000-07-07 | 2004-09-22 | 日本電信電話株式会社 | 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 |
JP4366845B2 (ja) | 2000-07-24 | 2009-11-18 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラム提供媒体 |
US6788302B1 (en) | 2000-08-03 | 2004-09-07 | International Business Machines Corporation | Partitioning and load balancing graphical shape data for parallel applications |
US6952693B2 (en) | 2001-02-23 | 2005-10-04 | Ran Wolff | Distributed mining of association rules |
US20020161778A1 (en) | 2001-02-24 | 2002-10-31 | Core Integration Partners, Inc. | Method and system of data warehousing and building business intelligence using a data storage model |
US20020120602A1 (en) | 2001-02-28 | 2002-08-29 | Ross Overbeek | System, method and computer program product for simultaneous analysis of multiple genomes |
CA2349265A1 (en) | 2001-05-30 | 2002-11-30 | Andrew Emili | Protein expression profile database |
US20030033138A1 (en) | 2001-07-26 | 2003-02-13 | Srinivas Bangalore | Method for partitioning a data set into frequency vectors for clustering |
US7130852B2 (en) | 2001-07-27 | 2006-10-31 | Silicon Valley Bank | Internal security system for a relational database system |
US7013290B2 (en) | 2001-08-03 | 2006-03-14 | John Allen Ananian | Personalized interactive digital catalog profiling |
US6801903B2 (en) | 2001-10-12 | 2004-10-05 | Ncr Corporation | Collecting statistics in a database system |
US20030140027A1 (en) | 2001-12-12 | 2003-07-24 | Jeffrey Huttel | Universal Programming Interface to Knowledge Management (UPIKM) database system with integrated XML interface |
US7813937B1 (en) | 2002-02-15 | 2010-10-12 | Fair Isaac Corporation | Consistency modeling of healthcare claims to detect fraud and abuse |
US7031969B2 (en) | 2002-02-20 | 2006-04-18 | Lawrence Technologies, Llc | System and method for identifying relationships between database records |
AU2003223314B2 (en) | 2002-03-19 | 2007-04-05 | Mapinfo Corporation | Location based service provider |
US20040083199A1 (en) | 2002-08-07 | 2004-04-29 | Govindugari Diwakar R. | Method and architecture for data transformation, normalization, profiling, cleansing and validation |
US6657568B1 (en) * | 2002-08-27 | 2003-12-02 | Fmr Corp. | Data packing for real-time streaming |
US7047230B2 (en) | 2002-09-09 | 2006-05-16 | Lucent Technologies Inc. | Distinct sampling system and a method of distinct sampling for optimizing distinct value query estimates |
US7043476B2 (en) | 2002-10-11 | 2006-05-09 | International Business Machines Corporation | Method and apparatus for data mining to discover associations and covariances associated with data |
WO2004036461A2 (en) | 2002-10-14 | 2004-04-29 | Battelle Memorial Institute | Information reservoir |
US7698163B2 (en) | 2002-11-22 | 2010-04-13 | Accenture Global Services Gmbh | Multi-dimensional segmentation for use in a customer interaction |
US7403942B1 (en) | 2003-02-04 | 2008-07-22 | Seisint, Inc. | Method and system for processing data records |
US7117222B2 (en) | 2003-03-13 | 2006-10-03 | International Business Machines Corporation | Pre-formatted column-level caching to improve client performance |
US7433861B2 (en) | 2003-03-13 | 2008-10-07 | International Business Machines Corporation | Byte-code representations of actual data to reduce network traffic in database transactions |
US20040249810A1 (en) | 2003-06-03 | 2004-12-09 | Microsoft Corporation | Small group sampling of data for use in query processing |
GB0314591D0 (en) | 2003-06-21 | 2003-07-30 | Ibm | Profiling data in a data store |
US20060069717A1 (en) | 2003-08-27 | 2006-03-30 | Ascential Software Corporation | Security service for a services oriented architecture in a data integration platform |
US20050240354A1 (en) | 2003-08-27 | 2005-10-27 | Ascential Software Corporation | Service oriented architecture for an extract function in a data integration platform |
US7426520B2 (en) | 2003-09-10 | 2008-09-16 | Exeros, Inc. | Method and apparatus for semantic discovery and mapping between data sources |
KR100922141B1 (ko) * | 2003-09-15 | 2009-10-19 | 아브 이니티오 소프트웨어 엘엘시 | 데이터 프로파일링 방법 및 시스템 |
US7296008B2 (en) * | 2004-08-24 | 2007-11-13 | Symantec Operating Corporation | Generation and use of a time map for accessing a prior image of a storage device |
US7587394B2 (en) | 2003-09-23 | 2009-09-08 | International Business Machines Corporation | Methods and apparatus for query rewrite with auxiliary attributes in query processing operations |
US7149736B2 (en) | 2003-09-26 | 2006-12-12 | Microsoft Corporation | Maintaining time-sorted aggregation records representing aggregations of values from multiple database records using multiple partitions |
AU2003279999A1 (en) | 2003-10-21 | 2005-06-08 | Nielsen Media Research, Inc. | Methods and apparatus for fusing databases |
US7376656B2 (en) | 2004-02-10 | 2008-05-20 | Microsoft Corporation | System and method for providing user defined aggregates in a database system |
US20050177578A1 (en) | 2004-02-10 | 2005-08-11 | Chen Yao-Ching S. | Efficient type annontation of XML schema-validated XML documents without schema validation |
US8447743B2 (en) | 2004-08-17 | 2013-05-21 | International Business Machines Corporation | Techniques for processing database queries including user-defined functions |
US8145642B2 (en) | 2004-11-30 | 2012-03-27 | Oracle International Corporation | Method and apparatus to support bitmap filtering in a parallel system |
US8572018B2 (en) | 2005-06-20 | 2013-10-29 | New York University | Method, system and software arrangement for reconstructing formal descriptive models of processes from functional/modal data using suitable ontology |
US7716630B2 (en) | 2005-06-27 | 2010-05-11 | Ab Initio Technology Llc | Managing parameters for graph-based computations |
US7774346B2 (en) | 2005-08-26 | 2010-08-10 | Oracle International Corporation | Indexes that are based on bitmap values and that use summary bitmap values |
US20070073721A1 (en) * | 2005-09-23 | 2007-03-29 | Business Objects, S.A. | Apparatus and method for serviced data profiling operations |
US8271452B2 (en) | 2006-06-12 | 2012-09-18 | Rainstor Limited | Method, system, and database archive for enhancing database archiving |
US8412713B2 (en) | 2007-03-06 | 2013-04-02 | Mcafee, Inc. | Set function calculation in a database |
US8775441B2 (en) | 2008-01-16 | 2014-07-08 | Ab Initio Technology Llc | Managing an archive for approximate string matching |
US20090226916A1 (en) | 2008-02-01 | 2009-09-10 | Life Technologies Corporation | Automated Analysis of DNA Samples |
US7912867B2 (en) | 2008-02-25 | 2011-03-22 | United Parcel Services Of America, Inc. | Systems and methods of profiling data for integration |
CN101290625A (zh) * | 2008-06-11 | 2008-10-22 | 华东师范大学 | 一种xml文档的存储和检索方法 |
US8463739B2 (en) | 2008-08-28 | 2013-06-11 | Red Hat, Inc. | Systems and methods for generating multi-population statistical measures using middleware |
US20100114976A1 (en) | 2008-10-21 | 2010-05-06 | Castellanos Maria G | Method For Database Design |
JP5535230B2 (ja) | 2008-10-23 | 2014-07-02 | アビニシオ テクノロジー エルエルシー | ファジーなデータ操作 |
US9251212B2 (en) | 2009-03-27 | 2016-02-02 | Business Objects Software Ltd. | Profiling in a massive parallel processing environment |
WO2011035039A1 (en) * | 2009-09-16 | 2011-03-24 | Ab Initio Technology Llc | Mapping dataset elements |
US8560575B2 (en) | 2009-11-12 | 2013-10-15 | Salesforce.Com, Inc. | Methods and apparatus for selecting updates to associated records to publish on an information feed in an on-demand database service environment |
EP2499565B1 (en) * | 2009-11-13 | 2019-01-09 | Ab Initio Technology LLC | Managing record format information |
US8396873B2 (en) | 2010-03-10 | 2013-03-12 | Emc Corporation | Index searching using a bloom filter |
CA2801079C (en) | 2010-06-22 | 2016-05-03 | Ab Initio Technology Llc | Processing related datasets |
US8296274B2 (en) | 2011-01-27 | 2012-10-23 | Leppard Andrew | Considering multiple lookups in bloom filter decision making |
US9449057B2 (en) | 2011-01-28 | 2016-09-20 | Ab Initio Technology Llc | Generating data pattern information |
US9275367B2 (en) | 2011-05-05 | 2016-03-01 | Aegis Analytical Corporation | System for designating, displaying and selecting types of process parameters and product outcome parameters |
US8615519B2 (en) | 2011-06-17 | 2013-12-24 | Sap Ag | Method and system for inverted indexing of a dataset |
US8856085B2 (en) | 2011-07-19 | 2014-10-07 | International Business Machines Corporation | Automatic consistent sampling for data analysis |
CN103176973B (zh) | 2011-12-20 | 2016-04-20 | 国际商业机器公司 | 用于生成数据库的测试工作负载的系统和方法 |
US8762396B2 (en) | 2011-12-22 | 2014-06-24 | Sap Ag | Dynamic, hierarchical bloom filters for network data routing |
-
2012
- 2012-01-27 US US13/360,230 patent/US9449057B2/en active Active
- 2012-01-27 CA CA2823658A patent/CA2823658C/en active Active
- 2012-01-27 AU AU2012211167A patent/AU2012211167B2/en active Active
- 2012-01-27 KR KR1020137022748A patent/KR101889120B1/ko active IP Right Grant
- 2012-01-27 JP JP2013551372A patent/JP6066927B2/ja active Active
- 2012-01-27 EP EP12704181.2A patent/EP2668725B1/en active Active
- 2012-01-27 WO PCT/US2012/022905 patent/WO2012103438A1/en active Application Filing
- 2012-01-27 CN CN201280006850.1A patent/CN103348598B/zh active Active
-
2015
- 2015-11-30 US US14/954,434 patent/US9652513B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN103348598A (zh) | 2013-10-09 |
US20160078100A1 (en) | 2016-03-17 |
KR20140014155A (ko) | 2014-02-05 |
EP2668725A1 (en) | 2013-12-04 |
US9652513B2 (en) | 2017-05-16 |
US9449057B2 (en) | 2016-09-20 |
CA2823658C (en) | 2018-03-13 |
AU2012211167B2 (en) | 2014-08-21 |
US20120197887A1 (en) | 2012-08-02 |
EP2668725B1 (en) | 2021-12-22 |
CN103348598B (zh) | 2017-07-14 |
WO2012103438A1 (en) | 2012-08-02 |
CA2823658A1 (en) | 2012-08-02 |
KR101889120B1 (ko) | 2018-08-16 |
AU2012211167A1 (en) | 2013-05-02 |
JP2014511587A (ja) | 2014-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6066927B2 (ja) | データパターン情報の生成 | |
CN110020660B (zh) | 使用人工智能(ai)技术的非结构化过程的完整性评估 | |
US20190266075A1 (en) | Data records selection | |
KR102432104B1 (ko) | 데이터 요소 간의 관계를 결정하기 위한 시스템 및 방법 | |
US8768976B2 (en) | Operational-related data computation engine | |
AU2011205296B2 (en) | Matching metadata sources using rules for characterizing matches | |
US8041760B2 (en) | Service oriented architecture for a loading function in a data integration platform | |
US8060553B2 (en) | Service oriented architecture for a transformation function in a data integration platform | |
US7814142B2 (en) | User interface service for a services oriented architecture in a data integration platform | |
US7814470B2 (en) | Multiple service bindings for a real time data integration service | |
US8250116B2 (en) | KStore data simulator directives and values processor process and files | |
US20050262193A1 (en) | Logging service for a services oriented architecture in a data integration platform | |
US20060069717A1 (en) | Security service for a services oriented architecture in a data integration platform | |
US20050240592A1 (en) | Real time data integration for supply chain management | |
US20050240354A1 (en) | Service oriented architecture for an extract function in a data integration platform | |
US20050228808A1 (en) | Real time data integration services for health care information data integration | |
US20050222931A1 (en) | Real time data integration services for financial information data integration | |
US11947567B2 (en) | System and method for computing and managing datasets using hierarchical analytics | |
US9348850B1 (en) | Method for large-scale data schema analysis and quality assurance | |
CN115952186A (zh) | 一种问题数据及其链路追溯方法及装置 | |
US9330115B2 (en) | Automatically reviewing information mappings across different information models | |
Oelsner et al. | IQM4HD concepts | |
Srivastava et al. | An Overview on Data Cleaning on Real World Data | |
Campesato | Data Wrangling Using Pandas, SQL, and Java | |
CN115545934A (zh) | 数据处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151027 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20160126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160219 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20161017 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20161107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6066927 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |