JP2022542920A - データ・マッチングのための能動学習 - Google Patents
データ・マッチングのための能動学習 Download PDFInfo
- Publication number
- JP2022542920A JP2022542920A JP2022505348A JP2022505348A JP2022542920A JP 2022542920 A JP2022542920 A JP 2022542920A JP 2022505348 A JP2022505348 A JP 2022505348A JP 2022505348 A JP2022505348 A JP 2022505348A JP 2022542920 A JP2022542920 A JP 2022542920A
- Authority
- JP
- Japan
- Prior art keywords
- data points
- subset
- unlabeled
- unlabeled data
- current set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 114
- 238000010801 machine learning Methods 0.000 claims abstract description 72
- 238000012549 training Methods 0.000 claims abstract description 43
- 230000004044 response Effects 0.000 claims abstract description 16
- 238000005070 sampling Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 238000003860 storage Methods 0.000 description 25
- 230000008569 process Effects 0.000 description 18
- 238000012545 processing Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 14
- 230000010354 integration Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000001131 transforming effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012552 review Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012558 master data management Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Abstract
Description
(a)ラベル付きデータポイントの現在のセットを用いて機械学習モデルを訓練するステップであって、データレコードは、複数のデータレコードであり、データポイントのラベルは、データポイントの分類を示し、訓練により、同一のエンティティまたは異なるエンティティを表すとしてデータポイントを分類するように構成された訓練済み機械学習モデルがもたらされる、訓練するステップと、
(b)訓練済み機械学習モデルを使用したラベル無しデータポイントの現在のセットの分類の分類結果を使用して、ラベル無しデータポイントの現在のセットから、ラベル無しデータポイントのサブセットを選択するステップであって、ラベル無しデータポイントの選択されたサブセットなしのラベル無しデータポイントの現在のセットが、ラベル無しデータポイントの現在のセットとなる、選択するステップと、
(c)ラベル無しデータポイントのサブセットを分類器に提供し、提供することに応答して、ラベル無しデータポイントのサブセットのラベルを受信するステップと、
(d)ラベル付きデータポイントの現在のセットを加えてラベル付きデータポイントのサブセットを、ラベル付きデータポイントの現在のセットとして用いて、ステップ(a)から(d)までを繰り返すステップと、
(e)訓練済み機械学習モデルを用いて、データセットのデータポイントを分類するステップと
を含む。
(a)ラベル付きデータポイントの現在のセットを用いて機械学習モデルを訓練するステップであって、データポイントは、複数のデータレコードであり、訓練により、同一のエンティティまたは異なるエンティティを表すとしてデータポイントを分類するように構成された訓練済み機械学習モデルがもたらされる、訓練するステップと、
(b)訓練済み機械学習モデルを使用したラベル無しデータポイントの現在のセットの分類の分類結果を使用して、ラベル無しデータポイントの現在のセットから、ラベル無しデータポイントのサブセットを選択するステップであって、ラベル無しデータポイントの選択されたサブセットなしのラベル無しデータポイントの現在のセットが、ラベル無しデータポイントの現在のセットとなる、選択するステップと、
(c)ラベル無しデータポイントのサブセットを分類器に提供し、提供することに応答して、ラベル無しデータポイントのサブセットのラベルを受信するステップと、
(d)ラベル付きデータポイントの現在のセットに加えて、ラベル付きデータポイントのサブセットを、ラベル付きデータポイントの現在のセットとして用いて、ステップ(a)から(d)までを繰り返すステップと、
(e)訓練済み機械学習モデルを用いて、データセットのデータポイントを分類するステップと
のために構成される。
(a)ラベル付きデータポイントの現在のセットを用いて機械学習モデルを訓練するステップであって、データポイントは、複数のデータレコードであり、訓練により、同一のエンティティまたは異なるエンティティを表すとしてデータポイントを分類するように構成された訓練済み機械学習モデルがもたらされる、訓練するステップと、
(b)訓練済み機械学習モデルを使用したラベル無しデータポイントの現在のセットの分類の分類結果を使用して、ラベル無しデータポイントの現在のセットから、ラベル無しデータポイントのサブセットを選択するステップであって、ラベル無しデータポイントの選択されたサブセットなしのラベル無しデータポイントの現在のセットが、ラベル無しデータポイントの現在のセットとなる、選択するステップと、
(c)ラベル無しデータポイントのサブセットを分類器に提供し、提供することに応答して、ラベル無しデータポイントのサブセットのラベルを受信するステップと、
(d)ラベル付きデータポイントの現在のセットに加えて、ラベル付きデータポイントのサブセットを、ラベル付きデータポイントの現在のセットとして用いてステップ(a)から(d)までを繰り返すステップと
のために構成される。
例えば、データを変形するプロセスは、データを、これらのデータ形式を定義する共通表現データに適合する必要のあるデータへ自動的に変換するプロセスを含んでもよい。このデータを変形するプロセスは、不整合な値を識別すること、修正すること、スペリング形式および省略を標準化すること、データの形式および内容を検証することを含み得る。
(a)ラベル付きデータポイントの現在のセットを用いて機械学習モデルを訓練するステップであって、上記データポイントの各々は、複数のデータレコードであり、上記データポイントのラベルは、上記データポイントの分類を示し、上記訓練により、同一のエンティティまたは異なるエンティティを表すとしてデータポイントを分類するように構成された訓練済み機械学習モデルがもたらされる、訓練するステップと、
(b)上記訓練済み機械学習モデルを使用したラベル無しデータポイントの現在のセットの分類の分類結果を使用して、上記ラベル無しデータポイントの現在のセットから、ラベル無しデータポイントのサブセットを選択するステップであって、上記ラベル無しデータポイントの選択されたサブセットなしの上記ラベル無しデータポイントの現在のセットが、上記ラベル無しデータポイントの現在のセットとなる、選択するステップと、
(c)上記ラベル無しデータポイントのサブセットを分類器に提供し、提供することに応答して、上記ラベル無しデータポイントのサブセットのラベルを受信するステップと、
(d)上記ラベル付きデータポイントの現在のセットに加えて上記ラベル付きデータポイントのサブセットを、上記ラベル付きデータポイントの現在のセットとして用いて、ステップ(a)から(d)までを繰り返すステップと、
(e)上記訓練済み機械学習モデルを用いて、上記データセットのデータポイントを分類するステップと
を含む、方法。
上記訓練済み機械学習モデルによる上記データセットの上記データポイントの分類に基づいて、上記データセットの各データポイントの個別のデータレコードを併合するかまたは維持するステップ
のうちの1つをさらに含む、条項1に記載の方法。
をさらに含む、条項1に記載の方法。
Claims (20)
- データセットのデータレコードをマッチングする方法であって、前記データレコードは、属性のセットの値を有し、前記方法は、
(a)ラベル付きデータポイントの現在のセットを用いて機械学習モデルを訓練するステップであって、前記データポイントの各々は、複数のデータレコードであり、前記データポイントのラベルは、前記データポイントの分類を示し、前記訓練により、同一のエンティティまたは異なるエンティティを表すとしてデータポイントを分類するように構成された訓練済み機械学習モデルがもたらされる、訓練するステップと、
(b)前記訓練済み機械学習モデルを使用したラベル無しデータポイントの現在のセットの分類の分類結果を使用して、前記ラベル無しデータポイントの現在のセットから、ラベル無しデータポイントのサブセットを選択するステップであって、前記ラベル無しデータポイントの選択されたサブセットなしの前記ラベル無しデータポイントの現在のセットが、前記ラベル無しデータポイントの現在のセットとなる、選択するステップと、
(c)前記ラベル無しデータポイントのサブセットを分類器に提供し、提供することに応答して、前記ラベル無しデータポイントのサブセットのラベルを受信するステップと、
(d)前記ラベル付きデータポイントの現在のセットに加えてラベル付きデータポイントの前記サブセットを、前記ラベル付きデータポイントの現在のセットとして用いて、ステップ(a)から(d)までを繰り返すステップと、
(e)前記訓練済み機械学習モデルを用いて、前記データセットのデータポイントを分類するステップと
を含む、方法。 - 前記訓練済み機械学習モデルによる前記データセットの前記データポイントの分類を用いて前記データセットの前記データレコードの重複排除を行うステップ、および、
前記訓練済み機械学習モデルによる前記データセットの前記データポイントの分類に基づいて、前記データセットの各データポイントの個別のデータレコードを併合するかまたは維持するステップ
のうちの1つをさらに含む、請求項1に記載の方法。 - 前記訓練済み機械学習モデルによる前記データセットの前記データポイントの分類を用いて前記データセットの重複排除されたデータレコードを保存するステップをさらに含む、請求項1または2に記載の方法。
- ステップ(e)で使用される前記訓練済み機械学習モデルは、ステップ(a)~(d)の所定回数の反復の結果として生じる前記訓練済み機械学習モデルである、請求項1~3のいずれか1項に記載の方法。
- 前記繰り返すステップは、予め定義された反復回数行われるか、または、前記ラベル無しデータポイントのセットが、所定の最小数よりも少ない数のデータポイントを含むまで行われる、請求項1~4のいずれか1項に記載の方法。
- ステップ(d)は、前記ラベル無しデータポイントのセットが、前記所定の最小数よりも少ない数のデータポイントを含むと判定したことに応答して、ステップ(a)から(d)まで繰り返すステップを、前記ラベル無しデータポイントのセットが前記所定の最小数よりも多い数または同数のデータポイントを含むまで待つステップ
をさらに含む、請求項1~4のいずれか1項に記載の方法。 - さらなるラベル無しデータポイントを受信するステップであって、前記ラベル無しデータポイントが、受信された前記さらなるラベル無しデータポイントを加えて前記ラベル無しデータポイントとなる、受信するステップ
をさらに含む、請求項1~6のいずれか1項に記載の方法。 - 前記ラベル無しデータポイントのサブセットを選択するステップは、前記分類結果を用いて、前記ラベル無しデータポイントの現在のセットから、ラベル無しデータポイントの中間サブセットを選択するステップと、前記属性のセットのうちの第1の属性のサブセットを用いて前記ラベル無しデータポイントの中間サブセットの前記データポイントをクラスタリングし、複数のクラスタもたらすステップと、前記複数のクラスタの各クラスタについて、前記クラスタの重心点に最も近いデータポイントを特定するステップとをさらに含み、前記ラベル無しデータポイントのサブセットは、特定された前記最も近いデータポイントを含む、請求項1~7のいずれか1項に記載の方法。
- 前記ラベル無しデータポイントのサブセットを選択するステップは、前記分類結果を用いて、前記ラベル無しデータポイントの現在のセットから、ラベル無しデータポイントの第1の中間サブセットを選択するステップと、前記データポイントを説明するメタデータ・パラメータを用いて、前記ラベル無しデータポイントの第1の中間サブセットから、ラベル無しデータポイントの第2の中間サブセットを選択するステップと、前記属性のセットのうちの第1の属性のサブセットを用いて前記ラベル無しデータポイントの第2の中間サブセットのデータポイントをクラスタリングし、複数のクラスタもたらすステップと、前記複数のクラスタの各クラスタについて、前記クラスタの重心点に最も近いデータポイントを特定するステップとをさらに含み、前記ラベル無しデータポイントのサブセットは、特定された前記データポイントを含む、請求項1~7のいずれか1項に記載の方法。
- 前記ラベル無しデータポイントのサブセットを選択するステップは、前記分類結果を用いて、前記ラベル無しデータポイントの現在のセットから、ラベル無しデータポイントの中間サブセットを選択するステップと、前記データポイントを説明するメタデータ・パラメータを用いて、前記ラベル無しデータポイントの中間サブセットから、前記ラベル無しデータポイントのサブセットを選択するステップと、
さらに含む、請求項1~8のいずれか1項に記載の方法。 - 前記メタデータ・パラメータは、前記データポイントの最新変更時刻および前記データポイントのユーザ優先値の少なくとも1つを含む、請求項9または10に記載の方法。
- 前記属性のセットのうちの第2の属性のサブセットを用いて、受信したデータポイントをクラスタリングし、複数のクラスタをもたらすステップと、前記複数のクラスタの各クラスタについて、前記クラスタの重心点に最も近いデータポイントを特定するステップとをさらに含み、前記ラベル無しデータポイントのセットは、特定されたデータポイントを含む、請求項1~11のいずれか1項に記載の方法。
- 前記第2の属性のサブセットは、前記第1の属性のサブセットと同一または異なる、請求項12に記載の方法。
- 前記第1の属性のサブセットは、前記第2の属性のサブセットの属性の一部である、請求項12に記載の方法。
- 前記ラベル無しデータポイントのサブセットのラベルを受信するステップは、前記第1の属性のサブセットの標示を受信するステップをさらに含む、請求項8~14のいずれか1項に記載の方法。
- 前記選択は、ランダム・サンプリング、マージン・サンプリング(margin sampling)、エントロピー・サンプリング、不一致サンプリング(disagreement sampling)のうちの1つを用いて実行される、請求項1~14のいずれか1項に記載の方法。
- 前記選択するステップは、前記データポイントをランク付けするステップと最初のランク付けされたデータポイントを選択するステップとを含む、請求項1~15のいずれか1項に記載の方法。
- プロセッサによる実行のためのマシン実行可能命令を含み、前記マシン実行可能命令の実行が、プロセッサに請求項1~17のいずれか1項に記載の方法を実行させる、コンピュータ・プログラム製品。
- データセットのデータレコードをマッチングするためのコンピュータ・システムであって、前記データレコードは、属性のセットの値を有し、前記コンピュータ・システムは、
(a)ラベル付きデータポイントの現在のセットを用いて機械学習モデルを訓練するステップであって、前記データポイントは、複数のデータレコードであり、前記訓練により、同一のエンティティまたは異なるエンティティを表すとしてデータポイントを分類するように構成された訓練済み機械学習モデルがもたらされる、訓練するステップと、
(b)訓練済み機械学習モデルを使用したラベル無しデータポイントの現在のセットの分類の分類結果を使用して、ラベル無しデータポイントの現在のセットから、ラベル無しデータポイントのサブセットを選択するステップであって、前記ラベル無しデータポイントの選択されたサブセットなしの前記ラベル無しデータポイントの現在のセットが、前記ラベル無しデータポイントの現在のセットとなる、選択するステップと、
(c)前記ラベル無しデータポイントのサブセットを分類器に提供し、提供することに応答して、前記ラベル無しデータポイントのサブセットのラベルを受信するステップと、
(d)前記ラベル付きデータポイントの現在のセットに加えて、ラベル付きデータポイントの前記サブセットを、前記ラベル付きデータポイントの現在のセットとして用いて、ステップ(a)から(d)までを繰り返すステップと、
(e)前記訓練済み機械学習モデルを用いて、前記データセットのデータポイントを分類するステップと
のために構成される、コンピュータ・システム。 - 重複排除システムのための能動学習機であって、
(a)ラベル付きデータポイントの現在のセットを用いて機械学習モデルを訓練するステップであって、前記データポイントは、複数のデータレコードであり、前記訓練により、同一のエンティティまたは異なるエンティティを表すとしてデータポイントを分類するように構成された訓練済み機械学習モデルがもたらされる、訓練するステップと、
(b)訓練済み機械学習モデルを使用したラベル無しデータポイントの現在のセットの分類の分類結果を使用して、ラベル無しデータポイントの現在のセットから、ラベル無しデータポイントのサブセットを選択するステップであって、前記ラベル無しデータポイントの選択されたサブセットなしの前記ラベル無しデータポイントの現在のセットが、前記ラベル無しデータポイントの現在のセットとなる、選択するステップと、
(c)前記ラベル無しデータポイントのサブセットを分類器に提供し、提供することに応答して、前記ラベル無しデータポイントのサブセットのラベルを受信するステップと、
(d)前記ラベル付きデータポイントの現在のセットに加えて、ラベル付きデータポイントの前記サブセットを、前記ラベル付きデータポイントの現在のセットとして用いてステップ(a)から(d)までを繰り返すステップと
のために構成される、能動学習機。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19189991 | 2019-08-05 | ||
EP19189991.3 | 2019-08-05 | ||
PCT/IB2020/057001 WO2021024080A1 (en) | 2019-08-05 | 2020-07-24 | Active learning for data matching |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022542920A true JP2022542920A (ja) | 2022-10-07 |
Family
ID=67544111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022505348A Pending JP2022542920A (ja) | 2019-08-05 | 2020-07-24 | データ・マッチングのための能動学習 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11409772B2 (ja) |
JP (1) | JP2022542920A (ja) |
CN (1) | CN114175007A (ja) |
DE (1) | DE112020002892T5 (ja) |
GB (2) | GB2600369A (ja) |
WO (1) | WO2021024080A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7280921B2 (ja) * | 2021-06-15 | 2023-05-24 | 株式会社日立製作所 | 計算機システム、推論方法、及びプログラム |
CN116561120B (zh) * | 2023-04-21 | 2023-12-26 | 清华大学 | 一种用于时序数据库的数据文件快速合并方法及系统 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008011728A1 (en) | 2006-07-28 | 2008-01-31 | Pattern Intelligence Inc. | System and method for detecting and analyzing pattern relationships |
AU2008304265B2 (en) | 2007-09-28 | 2013-03-14 | International Business Machines Corporation | Method and system for analysis of a system for matching data records |
US8452755B1 (en) | 2009-05-12 | 2013-05-28 | Microstrategy Incorporated | Database query analysis technology |
CN102831222B (zh) | 2012-08-24 | 2014-12-31 | 华中科技大学 | 一种基于重复数据删除的差量压缩方法 |
US9626373B2 (en) | 2012-10-01 | 2017-04-18 | Western Digital Technologies, Inc. | Optimizing data block size for deduplication |
US9489373B2 (en) * | 2013-07-12 | 2016-11-08 | Microsoft Technology Licensing, Llc | Interactive segment extraction in computer-human interactive learning |
US10572817B2 (en) | 2014-03-19 | 2020-02-25 | Peopleconnect, Inc. | Graph-based organization entity resolution |
US9542412B2 (en) | 2014-03-28 | 2017-01-10 | Tamr, Inc. | Method and system for large scale data curation |
US9311301B1 (en) | 2014-06-27 | 2016-04-12 | Digital Reasoning Systems, Inc. | Systems and methods for large scale global entity resolution |
GB2541034A (en) | 2015-07-31 | 2017-02-08 | British Telecomm | Network operation |
US10002372B2 (en) | 2015-09-15 | 2018-06-19 | Sap Se | Duplicate check based on generated hash value |
US20170123676A1 (en) | 2015-11-04 | 2017-05-04 | HGST Netherlands B.V. | Reference Block Aggregating into a Reference Set for Deduplication in Memory Management |
US10467201B1 (en) | 2015-12-23 | 2019-11-05 | Massachusetts Mutual Life Insurance Company | Systems and methods for integration and analysis of data records |
CN105740404A (zh) | 2016-01-28 | 2016-07-06 | 上海晶赞科技发展有限公司 | 标签关联方法及装置 |
US10832186B2 (en) | 2016-03-21 | 2020-11-10 | International Business Machines Corporation | Task handling in a master data management system |
CN105868773A (zh) | 2016-03-23 | 2016-08-17 | 华南理工大学 | 一种基于层次随机森林的多标签分类方法 |
US10558627B2 (en) | 2016-04-21 | 2020-02-11 | Leantaas, Inc. | Method and system for cleansing and de-duplicating data |
US10621492B2 (en) | 2016-10-21 | 2020-04-14 | International Business Machines Corporation | Multiple record linkage algorithm selector |
CN106777284A (zh) | 2016-12-29 | 2017-05-31 | 南京邮电大学 | 一种基于标签信息的图游走表示方法 |
US10685293B1 (en) * | 2017-01-20 | 2020-06-16 | Cybraics, Inc. | Methods and systems for analyzing cybersecurity threats |
EP3625677A4 (en) * | 2017-05-14 | 2021-04-21 | Digital Reasoning Systems, Inc. | SYSTEMS AND METHODS FOR QUICKLY CREATING, MANAGING AND SHARING LEARNING MODELS |
US10719301B1 (en) * | 2018-10-26 | 2020-07-21 | Amazon Technologies, Inc. | Development environment for machine learning media models |
US10977518B1 (en) * | 2019-03-15 | 2021-04-13 | Amazon Technologies, Inc. | Machine learning based adaptive instructions for annotation |
-
2020
- 2020-04-27 US US16/859,107 patent/US11409772B2/en active Active
- 2020-07-24 CN CN202080053513.2A patent/CN114175007A/zh active Pending
- 2020-07-24 WO PCT/IB2020/057001 patent/WO2021024080A1/en active Application Filing
- 2020-07-24 JP JP2022505348A patent/JP2022542920A/ja active Pending
- 2020-07-24 GB GB2202201.6A patent/GB2600369A/en not_active Withdrawn
- 2020-07-24 GB GBGB2202201.6D patent/GB202202201D0/en active Pending
- 2020-07-24 DE DE112020002892.5T patent/DE112020002892T5/de active Pending
Also Published As
Publication number | Publication date |
---|---|
CN114175007A (zh) | 2022-03-11 |
US20210042330A1 (en) | 2021-02-11 |
GB202202201D0 (en) | 2022-04-06 |
GB2600369A (en) | 2022-04-27 |
WO2021024080A1 (en) | 2021-02-11 |
US11409772B2 (en) | 2022-08-09 |
DE112020002892T5 (de) | 2022-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11500818B2 (en) | Method and system for large scale data curation | |
US20210374610A1 (en) | Efficient duplicate detection for machine learning data sets | |
US20200050968A1 (en) | Interactive interfaces for machine learning model evaluations | |
CA2953817C (en) | Feature processing tradeoff management | |
US20210089563A1 (en) | Systems and methods for performing a computer-implemented prior art search | |
CN106663037B (zh) | 用于管理特征处理的系统和方法 | |
US11182433B1 (en) | Neural network-based semantic information retrieval | |
US20180113928A1 (en) | Multiple record linkage algorithm selector | |
US20200183954A1 (en) | Efficiently finding potential duplicate values in data | |
JP2022542920A (ja) | データ・マッチングのための能動学習 | |
US11556514B2 (en) | Semantic data type classification in rectangular datasets | |
Kumbhar et al. | Web mining: A Synergic approach resorting to classifications and clustering | |
US20230205740A1 (en) | Meta-learning systems and/or methods for error detection in structured data | |
WO2021237082A1 (en) | Neural network-based semantic information retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220209 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220518 |
|
RD16 | Notification of change of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7436 Effective date: 20220331 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240206 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240502 |