JP6568935B2 - 知識ソースを用いた類似性分析およびデータ強化の技術 - Google Patents
知識ソースを用いた類似性分析およびデータ強化の技術 Download PDFInfo
- Publication number
- JP6568935B2 JP6568935B2 JP2017516310A JP2017516310A JP6568935B2 JP 6568935 B2 JP6568935 B2 JP 6568935B2 JP 2017516310 A JP2017516310 A JP 2017516310A JP 2017516310 A JP2017516310 A JP 2017516310A JP 6568935 B2 JP6568935 B2 JP 6568935B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- data set
- reference data
- input data
- data sets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Description
本願は、2015年9月24日に出願され「TECHNIQUES FOR SIMILARITY ANALYSIS AND DATA ENRICHMENT USING KNOWLEDGE SOURCES」と題され以下の出願に基づく利益および優先権を主張する米国非仮特許出願第14/864,485号に基づく利益および優先権を主張する。
2)2015年5月18日に出願され「CATEGORY LABELING」と題された米国仮出願第62/163,296号
3)2015年8月11日に出願され「SIMILARITY METRIC ANALYSIS AND KNOWLEDGE SCORING SYSTEM」と題された米国仮出願第62/203,806号
本願は以下の出願に関連する。
2)2014年9月26日に出願され「DYNAMIC VISUAL PROFILING AND VISUALIZATION OF HIGH VOLUME DATASETS AND REAL-TIME SMART SAMPLING AND STATISTICAL PROFILING OF EXTREMELY LARGE DATASETS」と題された米国仮出願第62/056,474号
3)2014年9月26日に出願され「AUTOMATED ENTITY CORRELATION AND CLASSIFICATION ACROSS HETEROGENEOUS DATASETS」と題された米国仮出願第62/056,475号
4)2014年9月26日に出願され「DECLARATIVE EXTERNAL DATA SOURCE IMPORTATION, EXPORTATION, AND METADATA REFLECTION UTILIZING HTTP AND HDFS PROTOCOLS」と題された米国仮出願第62/056,476号
上記特許出願の内容全体を、すべての目的のために本明細書に引用により援用する。
本開示は概してデータの準備および分析に関する。より具体的には、知識ソースを用いて類似性メトリック分析およびデータ強化を実行する技術が開示される。
簡単な概要
本開示は、概してデータの準備および分析に関する。より具体的には、知識ソースを用いて類似性メトリック分析およびデータ強化(data enrichment)を実行する技術が開示される。
以下の記載において、説明のために、具体的な詳細事項を述べることによって本発明の実施形態が十分に理解されるようにする。しかしながら、これらの具体的な詳細事項がなくてもさまざまな実施形態を実施し得ることが明らかであろう。図面および説明は限定を意図したものではない。
上に示されるように、Jaccard係数は、2つのデータセットAおよびBの類似性を、これらのデータセットAおよびBの共通集合の大きさの、これらのデータセットの合併集合の大きさに対する比率を求めることによって判断できる。1314に示されるように、増補データセット1306と「タイヤメーカー」というカテゴリとの共通集合は2(MichelinおよびBridgestone)であり、合併集合のサイズは4なので、類似性メトリックは0.5である。増補データセット1306と、タイヤ産業の人々というカテゴリとの共通集合は1(Firestone)であり、合併集合のサイズは4なので、類似性メトリックは0.25である。よって、「ベストマッチ」は、「タイヤメーカー」であり、データ強化サービスは、「タイヤメーカー」の列にラベル付けすることによって、入力データセットを強化できる。
Claims (17)
- 方法であって、
入力データセットを1つ以上の入力データソースから受けるステップと、
データ強化サービスのコンピューティングシステムによって、前記入力データセットを、参照ソースから取得した1つ以上の参照データセットと比較するステップと、
前記コンピューティングシステムによって、前記1つ以上の参照データセット各々について類似性メトリックを計算するステップとを含み、前記類似性メトリックは、前記入力データセットとの比較における前記1つ以上の参照データセット各々の類似性の程度を示し、
前記コンピューティングシステムによって、前記類似性メトリックに基づいて前記入力データセットと前記1つ以上の参照データセットとの間の一致を識別するステップと、
前記コンピューティングシステムによって、前記1つ以上の参照データセット各々について計算した前記類似性メトリックを示しかつ前記入力データセットと前記1つ以上の参照データセットとの間の前記識別した一致を示すグラフィカルインターフェイスを生成するステップと、
前記グラフィカルインターフェイスを用いて、前記1つ以上の参照データセット各々について計算した前記類似性メトリックを示しかつ前記入力データセットと前記1つ以上の参照データセットとの間の前記識別した一致を示すグラフィカルなビジュアライゼーションをレンダリングするステップとを含み、
前記1つ以上の参照データセットは、ドメインに対応付けられた用語を含み、前記類似性メトリックは、前記1つ以上の参照データセット各々について計算されたマッチングスコアであり、前記マッチングスコアは、前記参照データセットに関するメトリックを示す第1の値と前記入力データセットと前記参照データセットとの比較に基づくメトリックを示す第2の値とを含む1つ以上の値を用いて計算され、
前記1つ以上の値は、前記入力データセットと前記参照データセットとの間で一致する用語の度数値と、前記参照データセットの母集団値と、前記入力データセットと前記参照データセットとの間で一致する異なる用語の数を示す固有マッチング値と、前記参照データセット内の用語の数を示すドメイン値と、前記参照データセットのキュレーションの程度を示すキュレーションレベルとを含む、方法。 - 前記グラフィカルなビジュアライゼーションは、レンダリングされることによって前記マッチングスコアの計算に用いられる1つ以上の値を示す、請求項1に記載の方法。
- 方法であって、
入力データセットを1つ以上の入力データソースから受けるステップと、
データ強化サービスのコンピューティングシステムによって、前記入力データセットを、参照ソースから取得した1つ以上の参照データセットと比較するステップと、
前記コンピューティングシステムによって、前記1つ以上の参照データセット各々について類似性メトリックを計算するステップとを含み、前記類似性メトリックは、前記入力データセットとの比較における前記1つ以上の参照データセット各々の類似性の程度を示し、
前記コンピューティングシステムによって、前記類似性メトリックに基づいて前記入力データセットと前記1つ以上の参照データセットとの間の一致を識別するステップと、
前記コンピューティングシステムによって、前記1つ以上の参照データセット各々について計算した前記類似性メトリックを示しかつ前記入力データセットと前記1つ以上の参照データセットとの間の前記識別した一致を示すグラフィカルインターフェイスを生成するステップと、
前記グラフィカルインターフェイスを用いて、前記1つ以上の参照データセット各々について計算した前記類似性メトリックを示しかつ前記入力データセットと前記1つ以上の参照データセットとの間の前記識別した一致を示すグラフィカルなビジュアライゼーションをレンダリングするステップとを含み、
前記方法は、
前記コンピューティングシステムによって、アグリゲーションサービスから取得した増補データに基づいて増補リストを生成するステップと、
前記増補リストに基づいて前記入力データセットを増補するステップとをさらに含み、
前記1つ以上の参照データセットと比較される前記入力データセットは、前記増補リストに基づいて増補され、
前記方法はさらに、
前記コンピューティングシステムによって、前記1つ以上の参照データセットに基づいてインデックス付トライグラム表を生成するステップを含み、
増補後の前記入力データセットにおけるワードごとに、
前記ワードのトライグラムを作成するステップと、
前記トライグラム各々を前記インデックス付トライグラム表と比較するステップと、
前記トライグラムのうちの第1のトライグラムと一致する、トライグラムに対応付けられた前記インデックス付トライグラム表におけるワードを識別するステップと、
前記ワードをトライグラム増補データセットに格納するステップとを含み、
前記トライグラム増補データセットを前記1つ以上の参照データセットと比較するステップと、
前記比較に基づいて前記トライグラム増補データセットと前記1つ以上の参照データセットとの間の一致を判断するステップとを含み、
前記入力データセットと前記1つ以上の参照データセットとの間の一致を識別するステップは、前記比較に基づく前記トライグラム増補データセットと前記1つ以上の参照データセットとの間の一致を用いて実行される、方法。 - 方法であって、
入力データセットを1つ以上の入力データソースから受けるステップと、
データ強化サービスのコンピューティングシステムによって、前記入力データセットを、参照ソースから取得した1つ以上の参照データセットと比較するステップと、
前記コンピューティングシステムによって、前記1つ以上の参照データセット各々について類似性メトリックを計算するステップとを含み、前記類似性メトリックは、前記入力データセットとの比較における前記1つ以上の参照データセット各々の類似性の程度を示し、
前記コンピューティングシステムによって、前記類似性メトリックに基づいて前記入力データセットと前記1つ以上の参照データセットとの間の一致を識別するステップと、
前記コンピューティングシステムによって、前記1つ以上の参照データセット各々について計算した前記類似性メトリックを示しかつ前記入力データセットと前記1つ以上の参照データセットとの間の前記識別した一致を示すグラフィカルインターフェイスを生成するステップと、
前記グラフィカルインターフェイスを用いて、前記1つ以上の参照データセット各々について計算した前記類似性メトリックを示しかつ前記入力データセットと前記1つ以上の参照データセットとの間の前記識別した一致を示すグラフィカルなビジュアライゼーションをレンダリングするステップとを含み、
前記類似性メトリックは、前記入力データセットとの比較における前記1つ以上の参照データセットの共通部分のカーディナリティに基づく値として計算され、
前記値は前記カーディナリティによって正規化され、
前記値は、前記1つ以上の参照データセットのサイズに基づく第1のファクタだけ減じられ、前記値は、前記1つ以上の参照データセットのタイプに基づく第2のファクタだけ減じられる、方法。 - 前記1つ以上の参照データセットの少なくとも一部を表わすデータ構造を生成するステップをさらに含み、前記データ構造における各ノードは、前記1つ以上の参照データセットから抽出された1つ以上のストリングの中の異なる文字を表わし、
前記入力データセットは、前記データ構造をトラバースすることによって前記1つ以上の参照データセットと比較される、請求項1から4のいずれか一項に記載の方法。 - 前記類似性メトリックは、前記1つ以上の参照データセットのうちの各参照データセットについて、前記入力データセットと前記参照データセットとの間のコサイン類似度を求めることによって計算される、請求項1から5のいずれか一項に記載の方法。
- 前記一致を識別するステップは、前記1つ以上の参照データセットのうち、前記1つ以上の参照データセット各々について計算した前記類似性メトリックに基づく類似性の程度が最大である参照データを求めるステップを含む、請求項1から6のいずれか一項に記載の方法。
- 前記入力データセットは1つ以上のデータ列にフォーマットされる、請求項1から7のいずれか一項に記載の方法。
- データ強化システムであって、
複数の入力データソースと、
クラウドコンピューティングインフラストラクチャシステムとを備え、前記クラウドコンピューティングインフラストラクチャシステムは、
少なくとも1つの通信ネットワークを通して前記複数の入力データソースに通信可能に結合されかつ複数のデータターゲットに通信可能に結合された1つ以上のプロセッサと、
前記1つ以上のプロセッサに結合されたメモリとを含み、前記メモリは、データ強化サービスを提供することを指示する命令を格納し、前記命令は、前記1つ以上のプロセッサによって実行されたときに、前記1つ以上のプロセッサに、請求項1から8のいずれか1項に記載の方法を実行させる、データ強化システム。 - 命令を含むプログラムであって、前記命令は、1つ以上のプロセッサによって実行されたときに、前記1つ以上のプロセッサに、請求項1から8のいずれか1項に記載の方法を実行させる、プログラム。
- 方法であって、
入力データセットを1つ以上の入力データソースから受けるステップと、
データ強化サービスのコンピューティングシステムによって、前記入力データセットを、参照ソースから取得した1つ以上の参照データセットと比較するステップと、
前記コンピューティングシステムによって、前記1つ以上の参照データセット各々について類似性メトリックを計算するステップとを含み、前記類似性メトリックは、前記入力データセットとの比較における前記1つ以上の参照データセット各々の類似性の程度を示し、
前記コンピューティングシステムによって、前記類似性メトリックに基づいて前記入力データセットと前記1つ以上の参照データセットとの間の一致を識別するステップと、
前記入力データセットをマッチング情報とともに格納するステップとを含み、前記マッチング情報は、前記1つ以上の参照データセット各々について計算した類似性メトリックを示しかつ前記入力データセットと前記1つ以上の参照データセットとの間の前記識別した一致を示し、
前記1つ以上の参照データセットは、ドメインに対応付けられた用語を含み、前記類似性メトリックは、前記1つ以上の参照データセット各々について計算されたマッチングスコアであり、前記マッチングスコアは、前記参照データセットに関するメトリックを示す第1の値と前記入力データセットと前記参照データセットとの比較に基づくメトリックを示す第2の値とを含む1つ以上の値を用いて計算され、
前記1つ以上の値は、前記入力データセットと前記参照データセットとの間で一致する用語の度数値と、前記参照データセットの母集団値と、前記入力データセットと前記参照データセットとの間で一致する異なる用語の数を示す固有マッチング値と、前記参照データセット内の用語の数を示すドメイン値と、前記参照データセットのキュレーションの程度を示すキュレーションレベルとを含む、方法。 - 方法であって、
入力データセットを1つ以上の入力データソースから受けるステップと、
データ強化サービスのコンピューティングシステムによって、前記入力データセットを、参照ソースから取得した1つ以上の参照データセットと比較するステップと、
前記コンピューティングシステムによって、前記1つ以上の参照データセット各々について類似性メトリックを計算するステップとを含み、前記類似性メトリックは、前記入力データセットとの比較における前記1つ以上の参照データセット各々の類似性の程度を示し、
前記コンピューティングシステムによって、前記類似性メトリックに基づいて前記入力データセットと前記1つ以上の参照データセットとの間の一致を識別するステップと、
前記入力データセットをマッチング情報とともに格納するステップとを含み、前記マッチング情報は、前記1つ以上の参照データセット各々について計算した類似性メトリックを示しかつ前記入力データセットと前記1つ以上の参照データセットとの間の前記識別した一致を示し、
前記方法は、
前記コンピューティングシステムによって、アグリゲーションサービスから取得した増補データに基づいて増補リストを生成するステップと、
前記増補リストに基づいて前記入力データセットを増補するステップとをさらに含み、
前記1つ以上の参照データセットと比較される前記入力データセットは、前記増補リストに基づいて増補され、
前記方法はさらに、
前記コンピューティングシステムによって、前記1つ以上の参照データセットに基づいてインデックス付トライグラム表を生成するステップを含み、
増補後の前記入力データセットにおけるワードごとに、
前記ワードのトライグラムを作成するステップと、
前記トライグラム各々を前記インデックス付トライグラム表と比較するステップと、
前記トライグラムのうちの第1のトライグラムと一致する、トライグラムに対応付けられた前記インデックス付トライグラム表におけるワードを識別するステップと、
前記ワードをトライグラム増補データセットに格納するステップとを含み、
前記トライグラム増補データセットを前記1つ以上の参照データセットと比較するステップと、
前記比較に基づいて前記トライグラム増補データセットと前記1つ以上の参照データセットとの間の一致を判断するステップとを含み、
前記入力データセットと前記1つ以上の参照データセットとの間の一致を識別するステップは、前記比較に基づく前記トライグラム増補データセットと前記1つ以上の参照データセットとの間の一致を用いて実行される、方法。 - 方法であって、
入力データセットを1つ以上の入力データソースから受けるステップと、
データ強化サービスのコンピューティングシステムによって、前記入力データセットを、参照ソースから取得した1つ以上の参照データセットと比較するステップと、
前記コンピューティングシステムによって、前記1つ以上の参照データセット各々について類似性メトリックを計算するステップとを含み、前記類似性メトリックは、前記入力データセットとの比較における前記1つ以上の参照データセット各々の類似性の程度を示し、
前記コンピューティングシステムによって、前記類似性メトリックに基づいて前記入力データセットと前記1つ以上の参照データセットとの間の一致を識別するステップと、
前記入力データセットをマッチング情報とともに格納するステップとを含み、前記マッチング情報は、前記1つ以上の参照データセット各々について計算した類似性メトリックを示しかつ前記入力データセットと前記1つ以上の参照データセットとの間の前記識別した一致を示し、
前記類似性メトリックは、前記入力データセットとの比較における前記1つ以上の参照データセットの共通部分のカーディナリティに基づく値として計算され、
前記値は前記カーディナリティによって正規化され、
前記値は、前記1つ以上の参照データセットのサイズに基づく第1のファクタだけ減じられ、前記値は、前記1つ以上の参照データセットのタイプに基づく第2のファクタだけ減じられる、方法。 - 前記入力データセットと前記1つ以上の参照データセットとの間の一致の識別に基づいて、前記入力データセットのカテゴリラベルを識別するステップと、
前記カテゴリラベルに対応付けて前記入力データセットを格納するステップとをさらに含む、請求項11から13のいずれか一項に記載の方法。 - 前記類似性メトリックは、Jaccard係数、Tversky係数、またはDice-Sorensen係数のうちの1つ以上を用いて計算される、請求項11から14のいずれか一項に記載の方法。
- 前記入力データセットは、グラフマッチングまたは意味類似性マッチングのうちの1つ以上を用いて、前記1つ以上の参照データセットと比較される、請求項11から15のいずれか一項に記載の方法。
- データ強化システムであって、
複数の入力データソースと、
クラウドコンピューティングインフラストラクチャシステムとを備え、前記クラウドコンピューティングインフラストラクチャシステムは、
少なくとも1つの通信ネットワークを通して前記複数の入力データソースに通信可能に結合されかつ複数のデータターゲットに通信可能に結合された1つ以上のプロセッサと、
前記1つ以上のプロセッサに結合されたメモリとを含み、前記メモリは、データ強化サービスを提供することを指示する命令を格納し、前記命令は、前記1つ以上のプロセッサによって実行されたときに、前記1つ以上のプロセッサに、請求項11から16のいずれか1項に記載の方法を実行させる、データ強化システム。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462056468P | 2014-09-26 | 2014-09-26 | |
US62/056,468 | 2014-09-26 | ||
US201562163296P | 2015-05-18 | 2015-05-18 | |
US62/163,296 | 2015-05-18 | ||
US201562203806P | 2015-08-11 | 2015-08-11 | |
US62/203,806 | 2015-08-11 | ||
US14/864,485 US10210246B2 (en) | 2014-09-26 | 2015-09-24 | Techniques for similarity analysis and data enrichment using knowledge sources |
US14/864,485 | 2015-09-24 | ||
PCT/US2015/052190 WO2016049437A1 (en) | 2014-09-26 | 2015-09-25 | Techniques for similarity analysis and data enrichment using knowledge sources |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017536601A JP2017536601A (ja) | 2017-12-07 |
JP2017536601A5 JP2017536601A5 (ja) | 2018-07-19 |
JP6568935B2 true JP6568935B2 (ja) | 2019-08-28 |
Family
ID=54325688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017516310A Active JP6568935B2 (ja) | 2014-09-26 | 2015-09-25 | 知識ソースを用いた類似性分析およびデータ強化の技術 |
Country Status (5)
Country | Link |
---|---|
US (2) | US10210246B2 (ja) |
EP (1) | EP3198482A1 (ja) |
JP (1) | JP6568935B2 (ja) |
CN (1) | CN106687952B (ja) |
WO (1) | WO2016049437A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10915233B2 (en) | 2014-09-26 | 2021-02-09 | Oracle International Corporation | Automated entity correlation and classification across heterogeneous datasets |
US10936599B2 (en) | 2017-09-29 | 2021-03-02 | Oracle International Corporation | Adaptive recommendations |
US11379506B2 (en) | 2014-09-26 | 2022-07-05 | Oracle International Corporation | Techniques for similarity analysis and data enrichment using knowledge sources |
Families Citing this family (193)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021099839A1 (en) | 2019-11-18 | 2021-05-27 | Roy Mann | Collaborative networking systems, methods, and devices |
WO2021161104A1 (en) | 2020-02-12 | 2021-08-19 | Monday.Com | Enhanced display features in collaborative network systems, methods, and devices |
US11410129B2 (en) | 2010-05-01 | 2022-08-09 | Monday.com Ltd. | Digital processing systems and methods for two-way syncing with third party applications in collaborative work systems |
US10073858B2 (en) | 2013-05-16 | 2018-09-11 | Oracle International Corporation | Systems and methods for tuning a storage system |
US11182433B1 (en) | 2014-07-25 | 2021-11-23 | Searchable AI Corp | Neural network-based semantic information retrieval |
US10891272B2 (en) | 2014-09-26 | 2021-01-12 | Oracle International Corporation | Declarative language and visualization system for recommended data transformations and repairs |
US10031915B2 (en) * | 2015-06-15 | 2018-07-24 | International Business Machines Corporation | Identifying and displaying related content |
US10445343B2 (en) * | 2015-07-16 | 2019-10-15 | Interactive Data Pricing And Reference Data Llc | Systems and methods for data exchange and conversion |
US10776357B2 (en) * | 2015-08-26 | 2020-09-15 | Infosys Limited | System and method of data join and metadata configuration |
US20170083013A1 (en) * | 2015-09-23 | 2017-03-23 | International Business Machines Corporation | Conversion of a procedural process model to a hybrid process model |
US10318564B2 (en) | 2015-09-28 | 2019-06-11 | Microsoft Technology Licensing, Llc | Domain-specific unstructured text retrieval |
US10354188B2 (en) | 2016-08-02 | 2019-07-16 | Microsoft Technology Licensing, Llc | Extracting facts from unstructured information |
US20170091270A1 (en) | 2015-09-30 | 2017-03-30 | Linkedln Corporation | Organizational url enrichment |
US11089045B2 (en) | 2015-10-28 | 2021-08-10 | Qomplx, Inc. | User and entity behavioral analysis with network topology enhancements |
US11831682B2 (en) | 2015-10-28 | 2023-11-28 | Qomplx Llc | Highly scalable distributed connection interface for data capture from multiple network service and cloud-based sources |
US10681074B2 (en) | 2015-10-28 | 2020-06-09 | Qomplx, Inc. | System and method for comprehensive data loss prevention and compliance management |
US20170124464A1 (en) * | 2015-10-28 | 2017-05-04 | Fractal Industries, Inc. | Rapid predictive analysis of very large data sets using the distributed computational graph |
US11055630B2 (en) | 2015-10-28 | 2021-07-06 | Qomplx, Inc. | Multitemporal data analysis |
US11637866B2 (en) | 2015-10-28 | 2023-04-25 | Qomplx, Inc. | System and method for the secure evaluation of cyber detection products |
US11074652B2 (en) | 2015-10-28 | 2021-07-27 | Qomplx, Inc. | System and method for model-based prediction using a distributed computational graph workflow |
US11570214B2 (en) | 2015-10-28 | 2023-01-31 | Qomplx, Inc. | Crowdsourced innovation laboratory and process implementation system |
US11757849B2 (en) | 2015-10-28 | 2023-09-12 | Qomplx, Inc. | Detecting and mitigating forged authentication object attacks in multi-cloud environments |
US11546380B2 (en) | 2015-10-28 | 2023-01-03 | Qomplx, Inc. | System and method for creation and implementation of data processing workflows using a distributed computational graph |
US11468368B2 (en) | 2015-10-28 | 2022-10-11 | Qomplx, Inc. | Parametric modeling and simulation of complex systems using large datasets and heterogeneous data structures |
US11477245B2 (en) | 2015-10-28 | 2022-10-18 | Qomplx, Inc. | Advanced detection of identity-based attacks to assure identity fidelity in information technology environments |
US11539663B2 (en) | 2015-10-28 | 2022-12-27 | Qomplx, Inc. | System and method for midserver facilitation of long-haul transport of telemetry for cloud-based services |
US20170371726A1 (en) * | 2015-10-28 | 2017-12-28 | Fractal Industries, Inc. | Rapid predictive analysis of very large data sets using an actor-driven distributed computational graph |
US11055451B2 (en) | 2015-10-28 | 2021-07-06 | Qomplx, Inc. | System and methods for multi-language abstract model creation for digital environment simulations |
US11055601B2 (en) | 2015-10-28 | 2021-07-06 | Qomplx, Inc. | System and methods for creation of learning agents in simulated environments |
US11507858B2 (en) | 2015-10-28 | 2022-11-22 | Qomplx, Inc. | Rapid predictive analysis of very large data sets using the distributed computational graph using configurable arrangement of processing components |
US11323484B2 (en) | 2015-10-28 | 2022-05-03 | Qomplx, Inc. | Privilege assurance of enterprise computer network environments |
US11757920B2 (en) | 2015-10-28 | 2023-09-12 | Qomplx, Inc. | User and entity behavioral analysis with network topology enhancements |
WO2017078774A1 (en) * | 2015-11-03 | 2017-05-11 | Hewlett Packard Enterprise Development Lp | Relevance optimized representative content associated with a data storage system |
US10169601B2 (en) | 2015-11-18 | 2019-01-01 | American Express Travel Related Services Company, Inc. | System and method for reading and writing to big data storage formats |
US10445324B2 (en) | 2015-11-18 | 2019-10-15 | American Express Travel Related Services Company, Inc. | Systems and methods for tracking sensitive data in a big data environment |
US10055471B2 (en) | 2015-11-18 | 2018-08-21 | American Express Travel Related Services Company, Inc. | Integrated big data interface for multiple storage types |
US10037329B2 (en) | 2015-11-18 | 2018-07-31 | American Express Travel Related Services Company, Inc. | System and method for automatically capturing and recording lineage data for big data records |
US10055426B2 (en) | 2015-11-18 | 2018-08-21 | American Express Travel Related Services Company, Inc. | System and method transforming source data into output data in big data environments |
US10360394B2 (en) | 2015-11-18 | 2019-07-23 | American Express Travel Related Services Company, Inc. | System and method for creating, tracking, and maintaining big data use cases |
US10055444B2 (en) | 2015-12-16 | 2018-08-21 | American Express Travel Related Services Company, Inc. | Systems and methods for access control over changing big data structures |
CN108701194B (zh) | 2016-01-19 | 2022-06-24 | 雷韦兹公司 | 掩蔽限制访问控制系统 |
US10521456B2 (en) * | 2016-03-16 | 2019-12-31 | Veda Data Solutions, Inc. | Linking incongruous personal data records, and applications thereof |
JP6400037B2 (ja) * | 2016-03-17 | 2018-10-03 | ヤフー株式会社 | 判定装置、および判定方法 |
US10838946B1 (en) * | 2016-03-18 | 2020-11-17 | EMC IP Holding Company LLC | Data quality computation for use in data set valuation |
US10320815B2 (en) * | 2016-05-23 | 2019-06-11 | GreatHorn, Inc. | Computer-implemented methods and systems for identifying visually similar text character strings |
CN105975460A (zh) * | 2016-05-30 | 2016-09-28 | 上海智臻智能网络科技股份有限公司 | 问句信息处理方法及装置 |
US11243938B2 (en) * | 2016-05-31 | 2022-02-08 | Micro Focus Llc | Identifying data constraints in applications and databases |
US11947554B2 (en) | 2016-06-19 | 2024-04-02 | Data.World, Inc. | Loading collaborative datasets into data stores for queries via distributed computer networks |
US10853376B2 (en) | 2016-06-19 | 2020-12-01 | Data.World, Inc. | Collaborative dataset consolidation via distributed computer networks |
US11755602B2 (en) | 2016-06-19 | 2023-09-12 | Data.World, Inc. | Correlating parallelized data from disparate data sources to aggregate graph data portions to predictively identify entity data |
US10324925B2 (en) | 2016-06-19 | 2019-06-18 | Data.World, Inc. | Query generation for collaborative datasets |
US10452975B2 (en) | 2016-06-19 | 2019-10-22 | Data.World, Inc. | Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization |
US11941140B2 (en) | 2016-06-19 | 2024-03-26 | Data.World, Inc. | Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization |
US11675808B2 (en) | 2016-06-19 | 2023-06-13 | Data.World, Inc. | Dataset analysis and dataset attribute inferencing to form collaborative datasets |
US10579721B2 (en) | 2016-07-15 | 2020-03-03 | Intuit Inc. | Lean parsing: a natural language processing system and method for parsing domain-specific languages |
US11222266B2 (en) | 2016-07-15 | 2022-01-11 | Intuit Inc. | System and method for automatic learning of functions |
US11049190B2 (en) | 2016-07-15 | 2021-06-29 | Intuit Inc. | System and method for automatically generating calculations for fields in compliance forms |
WO2018039257A1 (en) | 2016-08-22 | 2018-03-01 | Oracle International Corporation | System and method for ontology induction through statistical profiling and reference schema matching |
CN108027820A (zh) * | 2016-09-02 | 2018-05-11 | 百度时代网络技术(北京)有限公司 | 用于产生短语黑名单以响应于搜索查询来防止某些内容出现在搜索结果中的方法和系统 |
US10565222B2 (en) | 2016-09-15 | 2020-02-18 | Oracle International Corporation | Techniques for facilitating the joining of datasets |
US10445062B2 (en) | 2016-09-15 | 2019-10-15 | Oracle International Corporation | Techniques for dataset similarity discovery |
US10650000B2 (en) | 2016-09-15 | 2020-05-12 | Oracle International Corporation | Techniques for relationship discovery between datasets |
US10409789B2 (en) | 2016-09-16 | 2019-09-10 | Oracle International Corporation | Method and system for adaptively imputing sparse and missing data for predictive models |
US10176092B2 (en) * | 2016-09-21 | 2019-01-08 | Ngd Systems, Inc. | System and method for executing data processing tasks using resilient distributed datasets (RDDs) in a storage device |
US10127268B2 (en) * | 2016-10-07 | 2018-11-13 | Microsoft Technology Licensing, Llc | Repairing data through domain knowledge |
US10776170B2 (en) | 2016-10-21 | 2020-09-15 | Fujitsu Limited | Software service execution apparatus, system, and method |
ES2765415T3 (es) | 2016-10-21 | 2020-06-09 | Fujitsu Ltd | Aparato, método y programa de procesamiento de datos basado en microservicios |
JP7100422B2 (ja) | 2016-10-21 | 2022-07-13 | 富士通株式会社 | データプロパティ認識のための装置、プログラム、及び方法 |
JP6805765B2 (ja) | 2016-10-21 | 2020-12-23 | 富士通株式会社 | ソフトウェアサービスの実行のためのシステム、方法、及びプログラム |
US10482279B2 (en) | 2016-11-08 | 2019-11-19 | Microsoft Technology Licensing, Llc | Pattern-less private data detection on data sets |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
US10754894B2 (en) * | 2016-12-22 | 2020-08-25 | Micro Focus Llc | Ordering regular expressions |
FR3061577A1 (fr) * | 2016-12-30 | 2018-07-06 | Atos Integration | Dispositif de traitement de flux de donnees a grande echelle |
US10977323B2 (en) * | 2017-01-18 | 2021-04-13 | International Business Machines Corporation | Determining domain expertise and providing tailored internet search results |
US11295326B2 (en) | 2017-01-31 | 2022-04-05 | American Express Travel Related Services Company, Inc. | Insights on a data platform |
US10831773B2 (en) | 2017-03-01 | 2020-11-10 | Next Pathway Inc. | Method and system for parallelization of ingestion of large data sets |
CN108572953B (zh) * | 2017-03-07 | 2023-06-20 | 上海颐为网络科技有限公司 | 一种词条结构的合并方法 |
CN108572954B (zh) * | 2017-03-07 | 2023-04-28 | 上海颐为网络科技有限公司 | 一种近似词条结构推荐方法和系统 |
US11068453B2 (en) * | 2017-03-09 | 2021-07-20 | data.world, Inc | Determining a degree of similarity of a subset of tabular data arrangements to subsets of graph data arrangements at ingestion into a data-driven collaborative dataset platform |
US10331947B2 (en) * | 2017-04-26 | 2019-06-25 | International Business Machines Corporation | Automatic detection on string and column delimiters in tabular data files |
US10810472B2 (en) | 2017-05-26 | 2020-10-20 | Oracle International Corporation | Techniques for sentiment analysis of data using a convolutional neural network and a co-occurrence network |
CN108959329B (zh) * | 2017-05-27 | 2023-05-16 | 腾讯科技(北京)有限公司 | 一种文本分类方法、装置、介质及设备 |
CN107273153B (zh) * | 2017-05-31 | 2021-04-06 | 苏州工业园区服务外包职业学院 | 特殊字符业务触发模块及方法 |
CN108228687A (zh) * | 2017-06-20 | 2018-06-29 | 上海吉贝克信息技术有限公司 | 大数据知识挖掘及精准跟踪方法与系统 |
US10394874B2 (en) * | 2017-07-28 | 2019-08-27 | Microsoft Technology Licensing, Llc | Syntactic profiling of alphanumeric strings |
US11087210B2 (en) | 2017-08-18 | 2021-08-10 | MyFitnessPal, Inc. | Context and domain sensitive spelling correction in a database |
US10885056B2 (en) | 2017-09-29 | 2021-01-05 | Oracle International Corporation | Data standardization techniques |
US10997228B2 (en) * | 2017-10-26 | 2021-05-04 | International Business Machines Corporation | Comparing tables with semantic vectors |
AU2018366208A1 (en) * | 2017-11-08 | 2020-05-07 | Qomplx, Inc. | Modeling multi-peril catastrophe using a distributed simulation engine |
CN107894979B (zh) * | 2017-11-21 | 2021-09-17 | 北京百度网讯科技有限公司 | 用于语义挖掘的复合词处理方法、装置及其设备 |
CN110741389A (zh) | 2017-11-21 | 2020-01-31 | 谷歌有限责任公司 | 改进的实体数据的打通 |
US11301495B2 (en) * | 2017-11-21 | 2022-04-12 | Cherre, Inc. | Entity resolution computing system and methods |
US10942954B2 (en) | 2017-12-22 | 2021-03-09 | International Business Machines Corporation | Dataset adaptation for high-performance in specific natural language processing tasks |
US10915586B2 (en) | 2017-12-29 | 2021-02-09 | Kensho Technologies, Llc | Search engine for identifying analogies |
US11212316B2 (en) * | 2018-01-04 | 2021-12-28 | Fortinet, Inc. | Control maturity assessment in security operations environments |
US10956677B2 (en) | 2018-02-05 | 2021-03-23 | International Business Machines Corporation | Statistical preparation of data using semantic clustering |
US11120086B2 (en) | 2018-02-13 | 2021-09-14 | Oracle International Corporation | Toponym disambiguation |
EP3762840B1 (en) * | 2018-03-06 | 2022-05-04 | Google LLC | Systems and methods for autofill field classification |
US10740825B1 (en) * | 2018-04-10 | 2020-08-11 | Facebook, Inc. | User clustering in a latent space for identifying user interest in a content item |
US10803197B1 (en) * | 2018-04-13 | 2020-10-13 | Amazon Technologies, Inc. | Masking sensitive information in records of filtered accesses to unstructured data |
US11853713B2 (en) * | 2018-04-17 | 2023-12-26 | International Business Machines Corporation | Graph similarity analytics |
CN108734548B (zh) * | 2018-04-27 | 2021-12-17 | 达而观信息科技(上海)有限公司 | 物品推荐方法和装置 |
CN108734549B (zh) * | 2018-04-27 | 2021-12-21 | 达而观信息科技(上海)有限公司 | 物品推荐方法和装置 |
CN108960958B (zh) * | 2018-04-27 | 2022-03-22 | 达而观信息科技(上海)有限公司 | 物品推荐方法和装置 |
US11314598B2 (en) * | 2018-04-27 | 2022-04-26 | EMC IP Holding Company LLC | Method for approximating similarity between objects |
US11567980B2 (en) * | 2018-05-07 | 2023-01-31 | Google Llc | Determining responsive content for a compound query based on a set of generated sub-queries |
US10887415B1 (en) * | 2018-05-09 | 2021-01-05 | Architecture Technology Corporation | Common agnostic data exchange systems and methods |
US11893543B2 (en) * | 2018-05-15 | 2024-02-06 | International Business Machines Corporation | Optimized automatic consensus determination for events |
US11947529B2 (en) | 2018-05-22 | 2024-04-02 | Data.World, Inc. | Generating and analyzing a data model to identify relevant data catalog data derived from graph-based data arrangements to perform an action |
CN110597801B (zh) * | 2018-05-23 | 2021-09-17 | 杭州海康威视数字技术股份有限公司 | 一种数据库系统及其建立方法和装置 |
CN108920540B (zh) * | 2018-06-12 | 2021-12-03 | 武汉大学 | 一种基于Spark的并行栅格数据处理方法 |
US11321368B2 (en) | 2018-06-13 | 2022-05-03 | Oracle International Corporation | Regular expression generation using longest common subsequence algorithm on combinations of regular expression codes |
JP6489340B1 (ja) * | 2018-06-28 | 2019-03-27 | 嘉久 塩川 | 比較対象企業選定システム |
US11436359B2 (en) | 2018-07-04 | 2022-09-06 | Monday.com Ltd. | System and method for managing permissions of users for a single data type column-oriented data structure |
US11698890B2 (en) | 2018-07-04 | 2023-07-11 | Monday.com Ltd. | System and method for generating a column-oriented data structure repository for columns of single data types |
US11474978B2 (en) * | 2018-07-06 | 2022-10-18 | Capital One Services, Llc | Systems and methods for a data search engine based on data profiles |
US10635939B2 (en) | 2018-07-06 | 2020-04-28 | Capital One Services, Llc | System, method, and computer-accessible medium for evaluating multi-dimensional synthetic data using integrated variants analysis |
US10943196B2 (en) * | 2018-07-09 | 2021-03-09 | Accenture Global Solutions Limited | Data reconciliation |
CN109271581A (zh) * | 2018-08-02 | 2019-01-25 | 北京天元创新科技有限公司 | 一种基于Dashboard的大数据快速呈现方法 |
US11062330B2 (en) * | 2018-08-06 | 2021-07-13 | International Business Machines Corporation | Cognitively identifying a propensity for obtaining prospective entities |
US10915820B2 (en) * | 2018-08-09 | 2021-02-09 | Accenture Global Solutions Limited | Generating data associated with underrepresented data based on a received data input |
WO2020051413A1 (en) | 2018-09-07 | 2020-03-12 | Walmart Apollo, Llc | Method and apparatus to more quickly classify additional text entries |
US11361031B2 (en) * | 2018-10-08 | 2022-06-14 | International Business Machines Corporation | Dynamic linguistic assessment and measurement |
CN109299168B (zh) * | 2018-10-09 | 2022-08-09 | 中标云(湖北)网络科技有限公司 | 一种互联网大数据可视化分析系统 |
US10552739B1 (en) | 2018-10-15 | 2020-02-04 | Sas Institute Inc. | Intelligent data curation |
US11797902B2 (en) | 2018-11-16 | 2023-10-24 | Accenture Global Solutions Limited | Processing data utilizing a corpus |
WO2020104539A1 (en) * | 2018-11-21 | 2020-05-28 | Nec Corporation | Method and system of targeting epitopes for neoantigen-based immunotherapy |
US20220078198A1 (en) * | 2018-12-21 | 2022-03-10 | Element Ai Inc. | Method and system for generating investigation cases in the context of cybersecurity |
US11790262B2 (en) | 2019-01-22 | 2023-10-17 | Accenture Global Solutions Limited | Data transformations for robotic process automation |
US10970272B2 (en) * | 2019-01-31 | 2021-04-06 | Sap Se | Data cloud—platform for data enrichment |
US11106689B2 (en) * | 2019-05-02 | 2021-08-31 | Tate Consultancy Services Limited | System and method for self-service data analytics |
US11531780B2 (en) * | 2019-05-15 | 2022-12-20 | International Business Machines Corporation | Deep learning-based identity fraud detection |
US11315038B2 (en) * | 2019-05-16 | 2022-04-26 | International Business Machines Corporation | Method to measure similarity of datasets for given AI task |
WO2020235021A1 (ja) * | 2019-05-21 | 2020-11-26 | 日本電信電話株式会社 | 分析装置、分析システム、分析方法及びプログラム |
US11163956B1 (en) * | 2019-05-23 | 2021-11-02 | Intuit Inc. | System and method for recognizing domain specific named entities using domain specific word embeddings |
US11269905B2 (en) * | 2019-06-20 | 2022-03-08 | International Business Machines Corporation | Interaction between visualizations and other data controls in an information system by matching attributes in different datasets |
JP2022538705A (ja) | 2019-06-24 | 2022-09-06 | オラクル・インターナショナル・コーポレイション | コンテキストを用いた陰性例のための正規表現生成 |
JP2022538704A (ja) | 2019-06-24 | 2022-09-06 | オラクル・インターナショナル・コーポレイション | スパン強調表示整列を用いた正規表現生成 |
US11487945B2 (en) * | 2019-07-02 | 2022-11-01 | Servicenow, Inc. | Predictive similarity scoring subsystem in a natural language understanding (NLU) framework |
US11694029B2 (en) * | 2019-08-19 | 2023-07-04 | Oracle International Corporation | Neologism classification techniques with trigrams and longest common subsequences |
US11303545B2 (en) * | 2019-09-06 | 2022-04-12 | Ebay Inc. | Rate-limiting based on cardinality computation |
ES2813777B2 (es) | 2019-09-23 | 2023-10-27 | Quibim S L | Metodo y sistema para la segmentacion automatica de hiperintensidades de sustancia blanca en imagenes de resonancia magnetica cerebral |
WO2021086875A1 (en) * | 2019-10-31 | 2021-05-06 | Pronto Technology, Inc. | Data enrichment and matching |
US11108645B2 (en) | 2019-11-04 | 2021-08-31 | Hewlett Packard Enterprise Development Lp | Device interface matching using an artificial neural network |
US11366858B2 (en) * | 2019-11-10 | 2022-06-21 | Tableau Software, Inc. | Data preparation using semantic roles |
US11604797B2 (en) * | 2019-11-14 | 2023-03-14 | Microstrategy Incorporated | Inferring joins for data sets |
US11030556B1 (en) | 2019-11-18 | 2021-06-08 | Monday.Com | Digital processing systems and methods for dynamic object display of tabular information in collaborative work systems |
JP2021114017A (ja) * | 2020-01-16 | 2021-08-05 | 富士通株式会社 | 生成方法,情報処理装置及び生成プログラム |
US11783128B2 (en) | 2020-02-19 | 2023-10-10 | Intuit Inc. | Financial document text conversion to computer readable operations |
US11645523B2 (en) * | 2020-02-20 | 2023-05-09 | Adobe Inc. | Generating explanatory paths for predicted column annotations |
US11269848B2 (en) | 2020-03-10 | 2022-03-08 | International Business Machines Corporation | Preventing unnecessary upload |
GB2593926A (en) * | 2020-04-09 | 2021-10-13 | Noetica Ltd | Methods and systems for generating logical queries |
US11442969B2 (en) * | 2020-04-24 | 2022-09-13 | Capital One Services, Llc | Computer-based systems configured for efficient entity resolution for database merging and reconciliation |
TWI759731B (zh) * | 2020-04-27 | 2022-04-01 | 淡江大學 | 機器學習方法 |
US11829953B1 (en) | 2020-05-01 | 2023-11-28 | Monday.com Ltd. | Digital processing systems and methods for managing sprints using linked electronic boards |
IL297858A (en) | 2020-05-01 | 2023-01-01 | Monday Com Ltd | Digital processing systems and methods for improved networking and collaborative work management systems, methods and devices |
US11277361B2 (en) | 2020-05-03 | 2022-03-15 | Monday.com Ltd. | Digital processing systems and methods for variable hang-time for social layer messages in collaborative work systems |
US11301639B2 (en) * | 2020-06-26 | 2022-04-12 | Huawei Technologies Co., Ltd. | Methods and systems for generating a reference data structure for anonymization of text data |
US20220043934A1 (en) * | 2020-08-07 | 2022-02-10 | SECURITI, Inc. | System and method for entity resolution of a data element |
US11526514B2 (en) * | 2020-08-18 | 2022-12-13 | Mastercard Technologies Canada ULC | Request orchestration |
US20230289280A1 (en) * | 2020-08-28 | 2023-09-14 | Nokia Solutions And Networks Oy | Methods, apparatuses, and computer readable media for software development, testing and maintenance |
US11822528B2 (en) * | 2020-09-25 | 2023-11-21 | International Business Machines Corporation | Database self-diagnosis and self-healing |
US11102081B1 (en) * | 2020-09-28 | 2021-08-24 | Accenture Global Solutions Limited | Quantitative network testing framework for 5G and subsequent generation networks |
US20220164873A1 (en) * | 2020-11-24 | 2022-05-26 | Collibra Nv | Systems and methods for data enrichment |
US20220207085A1 (en) * | 2020-12-29 | 2022-06-30 | Imperva, Inc. | Data classification technology |
US20220221966A1 (en) | 2021-01-14 | 2022-07-14 | Monday.com Ltd. | Digital processing systems and methods for dual mode editing in collaborative documents enabling private changes in collaborative work systems |
US20220237179A1 (en) * | 2021-01-28 | 2022-07-28 | Wood Mackenzie, Inc. | Systems and Methods for Improved Machine Learning Using Data Completeness and Collaborative Learning Techniques |
US20220284459A1 (en) * | 2021-03-03 | 2022-09-08 | Capital One Services, Llc | Predictions based on analysis of big data |
US11677736B2 (en) | 2021-03-25 | 2023-06-13 | International Business Machines Corporation | Transient identification generation |
CN113055393B (zh) * | 2021-03-26 | 2022-08-26 | 支付宝(杭州)信息技术有限公司 | 一种安全服务化方法、装置以及设备 |
US20220318418A1 (en) * | 2021-03-31 | 2022-10-06 | Collibra Nv | Systems and methods for an on-demand, secure, and predictive value-added data marketplace |
CN113065657A (zh) * | 2021-04-09 | 2021-07-02 | 顶象科技有限公司 | 一种基于银行对公数据的知识图谱构建方法和装置 |
US11899698B2 (en) * | 2021-05-28 | 2024-02-13 | Microsoft Technology Licensing, Llc | Wordbreak algorithm with offset mapping |
EP4356580A1 (en) * | 2021-06-15 | 2024-04-24 | Telefonaktiebolaget LM Ericsson (publ) | Method and apparatus for infrastructure capability aggregation and exposure |
US11301473B1 (en) * | 2021-06-18 | 2022-04-12 | Sas Institute Inc. | Dataset overlap query system |
US11514007B1 (en) | 2021-06-24 | 2022-11-29 | Sap Se | Dynamic data processing for a semantic data storage architecture |
CN113760997B (zh) * | 2021-09-10 | 2023-04-28 | 成都知道创宇信息技术有限公司 | 数据置信度计算方法及装置、计算机设备和可读存储介质 |
CN113779358A (zh) * | 2021-09-14 | 2021-12-10 | 支付宝(杭州)信息技术有限公司 | 一种事件检测方法和系统 |
US11854110B2 (en) | 2021-11-12 | 2023-12-26 | Rockwell Collins, Inc. | System and method for determining geographic information of airport terminal chart and converting graphical image file to hardware directives for display unit |
US11954770B2 (en) | 2021-11-12 | 2024-04-09 | Rockwell Collins, Inc. | System and method for recreating graphical image using character recognition to reduce storage space |
US20230153064A1 (en) * | 2021-11-12 | 2023-05-18 | Rockwell Collins, Inc. | Method for automatically matching chart names |
US11842429B2 (en) | 2021-11-12 | 2023-12-12 | Rockwell Collins, Inc. | System and method for machine code subroutine creation and execution with indeterminate addresses |
US11915389B2 (en) | 2021-11-12 | 2024-02-27 | Rockwell Collins, Inc. | System and method for recreating image with repeating patterns of graphical image file to reduce storage space |
US11887222B2 (en) | 2021-11-12 | 2024-01-30 | Rockwell Collins, Inc. | Conversion of filled areas to run length encoded vectors |
US11748923B2 (en) | 2021-11-12 | 2023-09-05 | Rockwell Collins, Inc. | System and method for providing more readable font characters in size adjusting avionics charts |
US11947600B2 (en) | 2021-11-30 | 2024-04-02 | Data.World, Inc. | Content addressable caching and federation in linked data projects in a data-driven collaborative dataset platform using disparate database architectures |
US11886385B2 (en) | 2022-06-02 | 2024-01-30 | International Business Machines Corporation | Scalable identification of duplicate datasets in heterogeneous datasets |
US20240028620A1 (en) * | 2022-07-20 | 2024-01-25 | Dell Products L.P. | System and method for entity resolution using a sorting algorithm and a scoring algorithm with a dynamic thresholding |
IL303138A (en) * | 2022-09-08 | 2023-07-01 | 6Sense Insights Inc | Methods and systems for identifying companies using context associated with user input |
US11880803B1 (en) * | 2022-12-19 | 2024-01-23 | Tbk Bank, Ssb | System and method for data mapping and transformation |
US11741071B1 (en) | 2022-12-28 | 2023-08-29 | Monday.com Ltd. | Digital processing systems and methods for navigating and viewing displayed content |
US11886683B1 (en) | 2022-12-30 | 2024-01-30 | Monday.com Ltd | Digital processing systems and methods for presenting board graphics |
US11893381B1 (en) | 2023-02-21 | 2024-02-06 | Monday.com Ltd | Digital processing systems and methods for reducing file bundle sizes |
Family Cites Families (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59231683A (ja) | 1983-06-01 | 1984-12-26 | インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン | データ圧縮方法 |
JPS63225300A (ja) * | 1987-03-16 | 1988-09-20 | 株式会社東芝 | パタ−ン認識装置 |
JPH07200300A (ja) | 1993-11-29 | 1995-08-04 | Toshiba Corp | パターン認識型推論方法及び装置 |
US6807558B1 (en) | 1995-06-12 | 2004-10-19 | Pointcast, Inc. | Utilization of information “push” technology |
US5740549A (en) | 1995-06-12 | 1998-04-14 | Pointcast, Inc. | Information and advertising distribution system and method |
US6216131B1 (en) * | 1998-02-06 | 2001-04-10 | Starfish Software, Inc. | Methods for mapping data fields from one data set to another in a data processing environment |
US6047283A (en) * | 1998-02-26 | 2000-04-04 | Sap Aktiengesellschaft | Fast string searching and indexing using a search tree having a plurality of linked nodes |
JP2000222196A (ja) | 1999-01-29 | 2000-08-11 | Toshiba Tec Corp | プログラム自動生成方法及びこの方法を使用したデータ処理方法並びにプログラム自動生成装置及びデータ処理装置並びにプログラム自動生成プログラムを記録した記録媒体 |
JP3708007B2 (ja) | 1999-11-22 | 2005-10-19 | 株式会社東芝 | 情報交換装置 |
US6556983B1 (en) | 2000-01-12 | 2003-04-29 | Microsoft Corporation | Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space |
EP1202206A3 (en) | 2000-10-24 | 2004-01-21 | International Business Machines Corporation | Method and system in an electronic spreadsheet for persistently self-replicating multiple ranges of cells through a copy-paste operation |
US8402068B2 (en) | 2000-12-07 | 2013-03-19 | Half.Com, Inc. | System and method for collecting, associating, normalizing and presenting product and vendor information on a distributed network |
US7571177B2 (en) | 2001-02-08 | 2009-08-04 | 2028, Inc. | Methods and systems for automated semantic knowledge leveraging graph theoretic analysis and the inherent structure of communication |
US6754651B2 (en) * | 2001-04-17 | 2004-06-22 | International Business Machines Corporation | Mining of generalized disjunctive association rules |
WO2002095533A2 (en) * | 2001-05-18 | 2002-11-28 | Biowulf Technologies, Llc | Model selection for cluster data analysis |
US7043492B1 (en) * | 2001-07-05 | 2006-05-09 | Requisite Technology, Inc. | Automated classification of items using classification mappings |
JP2003058523A (ja) | 2001-08-21 | 2003-02-28 | Nippon Telegr & Teleph Corp <Ntt> | 構造化文書の変換ルール作成方法および装置と変換ルール作成プログラムおよび該プログラムを記録した記録媒体 |
US7158961B1 (en) * | 2001-12-31 | 2007-01-02 | Google, Inc. | Methods and apparatus for estimating similarity |
US8155951B2 (en) | 2003-06-12 | 2012-04-10 | Patrick William Jamieson | Process for constructing a semantic knowledge base using a document corpus |
US8239380B2 (en) * | 2003-06-20 | 2012-08-07 | Microsoft Corporation | Systems and methods to tune a general-purpose search engine for a search entry point |
US7805341B2 (en) | 2004-04-13 | 2010-09-28 | Microsoft Corporation | Extraction, transformation and loading designer module of a computerized financial system |
US7558799B2 (en) | 2004-06-01 | 2009-07-07 | Microsoft Corporation | Method, system, and apparatus for discovering and connecting to data sources |
US7895220B2 (en) | 2005-08-30 | 2011-02-22 | Schlumberger Technology Corporation | Middleware method and apparatus and program storage device adapted for linking data sources to software applications |
US20070112827A1 (en) | 2005-11-10 | 2007-05-17 | International Business Machines Corporation | Abstract rule sets |
US7533096B2 (en) * | 2006-07-12 | 2009-05-12 | International Business Machines Corporation | Computer-based method for finding similar objects using a taxonomy |
EP2181402A1 (fr) | 2007-02-23 | 2010-05-05 | Enrico Maim | Procedes d'extraction, de combinaison, de synthese et de visualisation de donnees multidimensionnelles provenant de differentes sources |
EP1990740A1 (en) | 2007-05-08 | 2008-11-12 | Sap Ag | Schema matching for data migration |
US8090747B2 (en) * | 2007-05-21 | 2012-01-03 | New York University | Method, system, computer-accessible medium and software arrangement for organization and analysis of multiple sets of data |
US7970766B1 (en) | 2007-07-23 | 2011-06-28 | Google Inc. | Entity type assignment |
US8175941B2 (en) | 2007-11-19 | 2012-05-08 | Codestreet, Llc | Method and system for developing and applying market data scenarios |
CN102483777A (zh) | 2008-10-10 | 2012-05-30 | S·E·特纳 | 到达远程用户的内容数据流的受控传递 |
US8156435B2 (en) | 2008-11-25 | 2012-04-10 | At&T Intellectual Property I, L.P. | Systems and methods to select media content |
US8161028B2 (en) * | 2008-12-05 | 2012-04-17 | International Business Machines Corporation | System and method for adaptive categorization for use with dynamic taxonomies |
US8156159B2 (en) | 2009-02-11 | 2012-04-10 | Verizon Patent And Licensing, Inc. | Data masking and unmasking of sensitive data |
US8166104B2 (en) | 2009-03-19 | 2012-04-24 | Microsoft Corporation | Client-centered usage classification |
US9213687B2 (en) | 2009-03-23 | 2015-12-15 | Lawrence Au | Compassion, variety and cohesion for methods of text analytics, writing, search, user interfaces |
US20100274821A1 (en) * | 2009-04-22 | 2010-10-28 | Microsoft Corporation | Schema Matching Using Clicklogs |
US10102398B2 (en) | 2009-06-01 | 2018-10-16 | Ab Initio Technology Llc | Generating obfuscated data |
US8234285B1 (en) * | 2009-07-10 | 2012-07-31 | Google Inc. | Context-dependent similarity measurements |
US8204904B2 (en) | 2009-09-30 | 2012-06-19 | Yahoo! Inc. | Network graph evolution rule generation |
CN102096672A (zh) * | 2009-12-09 | 2011-06-15 | 西安邮电学院 | 一种基于模糊粗糙模型的分类规则提取方法 |
AU2011205296B2 (en) * | 2010-01-13 | 2016-07-28 | Ab Initio Technology Llc | Matching metadata sources using rules for characterizing matches |
US8559731B2 (en) * | 2010-01-18 | 2013-10-15 | International Business Machines Corporation | Personalized tag ranking |
US8825649B2 (en) | 2010-07-21 | 2014-09-02 | Microsoft Corporation | Smart defaults for data visualizations |
US9076152B2 (en) | 2010-10-20 | 2015-07-07 | Microsoft Technology Licensing, Llc | Semantic analysis of information |
US9734228B2 (en) | 2010-10-26 | 2017-08-15 | Accenture Global Services Limited | Digital analytics system |
US8745061B2 (en) * | 2010-11-09 | 2014-06-03 | Tibco Software Inc. | Suffix array candidate selection and index data structure |
US8484245B2 (en) * | 2011-02-08 | 2013-07-09 | Xerox Corporation | Large scale unsupervised hierarchical document categorization using ontological guidance |
CN102104510B (zh) | 2011-03-01 | 2014-01-29 | 北京中创信测科技股份有限公司 | 一种数据视图处理方法和系统 |
US8874616B1 (en) | 2011-07-11 | 2014-10-28 | 21Ct, Inc. | Method and apparatus for fusion of multi-modal interaction data |
US9489397B1 (en) | 2011-07-27 | 2016-11-08 | Aon Benfield Global, Inc. | Impact data manager for dynamic data delivery |
US8577938B2 (en) | 2011-08-23 | 2013-11-05 | Accenture Global Services Limited | Data mapping acceleration |
JP5743822B2 (ja) | 2011-09-21 | 2015-07-01 | 日本電気株式会社 | 情報漏洩防止装置及び制限情報生成装置 |
US8799207B1 (en) | 2011-10-08 | 2014-08-05 | Bay Dynamics | Unified data source management |
US8538934B2 (en) | 2011-10-28 | 2013-09-17 | Microsoft Corporation | Contextual gravitation of datasets and data services |
WO2013146884A1 (ja) | 2012-03-27 | 2013-10-03 | 日本電気株式会社 | データクレンジングシステム、方法およびプログラム |
WO2014028860A2 (en) * | 2012-08-17 | 2014-02-20 | Opera Solutions, Llc | System and method for matching data using probabilistic modeling techniques |
US9070090B2 (en) | 2012-08-28 | 2015-06-30 | Oracle International Corporation | Scalable string matching as a component for unsupervised learning in semantic meta-model development |
US9495641B2 (en) | 2012-08-31 | 2016-11-15 | Nutomian, Inc. | Systems and method for data set submission, searching, and retrieval |
JP2014063295A (ja) | 2012-09-20 | 2014-04-10 | Cybernet Systems Co Ltd | 文脈解析装置、情報分類装置及び情報分類システム |
US20140222181A1 (en) | 2012-10-12 | 2014-08-07 | Invensys Systems, Inc. | Automatically updating graphical symbols in a control loop strategy diagram |
CN102982138B (zh) | 2012-11-19 | 2017-02-15 | 北京思特奇信息技术股份有限公司 | 一种客户身份动态展现方法及装置 |
US9223870B2 (en) | 2012-11-30 | 2015-12-29 | Microsoft Technology Licensing, Llc | Decoration of search results by third-party content providers |
US20130232452A1 (en) | 2013-02-01 | 2013-09-05 | Concurix Corporation | Force Directed Graph with Time Series Data |
US10332010B2 (en) | 2013-02-19 | 2019-06-25 | Business Objects Software Ltd. | System and method for automatically suggesting rules for data stored in a table |
US20140282912A1 (en) | 2013-03-14 | 2014-09-18 | Public Insight Corporation | Methods and Systems for Analyzing Public Data |
US8909656B2 (en) | 2013-03-15 | 2014-12-09 | Palantir Technologies Inc. | Filter chains with associated multipath views for exploring large data sets |
US9189539B2 (en) * | 2013-03-15 | 2015-11-17 | International Business Machines Corporation | Electronic content curating mechanisms |
US9710534B2 (en) * | 2013-05-07 | 2017-07-18 | International Business Machines Corporation | Methods and systems for discovery of linkage points between data sources |
US10165571B2 (en) | 2013-09-11 | 2018-12-25 | Freebit Co., Ltd. | Application state change notification program and method therefor |
US9367809B2 (en) | 2013-10-11 | 2016-06-14 | Accenture Global Services Limited | Contextual graph matching based anomaly detection |
CN103593199B (zh) | 2013-11-29 | 2016-08-24 | 迈普通信技术股份有限公司 | 数据转换的方法和系统 |
US10210246B2 (en) | 2014-09-26 | 2019-02-19 | Oracle International Corporation | Techniques for similarity analysis and data enrichment using knowledge sources |
US10296192B2 (en) | 2014-09-26 | 2019-05-21 | Oracle International Corporation | Dynamic visual profiling and visualization of high volume datasets and real-time smart sampling and statistical profiling of extremely large datasets |
US10891272B2 (en) | 2014-09-26 | 2021-01-12 | Oracle International Corporation | Declarative language and visualization system for recommended data transformations and repairs |
US9928284B2 (en) * | 2014-12-31 | 2018-03-27 | Zephyr Health, Inc. | File recognition system and method |
JP6356726B2 (ja) | 2016-05-19 | 2018-07-11 | ファナック株式会社 | ラダープログラム解析装置 |
-
2015
- 2015-09-24 US US14/864,485 patent/US10210246B2/en active Active
- 2015-09-25 EP EP15781210.8A patent/EP3198482A1/en not_active Ceased
- 2015-09-25 CN CN201580047579.XA patent/CN106687952B/zh active Active
- 2015-09-25 JP JP2017516310A patent/JP6568935B2/ja active Active
- 2015-09-25 WO PCT/US2015/052190 patent/WO2016049437A1/en active Application Filing
-
2018
- 2018-12-31 US US16/237,405 patent/US11379506B2/en active Active
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10915233B2 (en) | 2014-09-26 | 2021-02-09 | Oracle International Corporation | Automated entity correlation and classification across heterogeneous datasets |
US10976907B2 (en) | 2014-09-26 | 2021-04-13 | Oracle International Corporation | Declarative external data source importation, exportation, and metadata reflection utilizing http and HDFS protocols |
US11379506B2 (en) | 2014-09-26 | 2022-07-05 | Oracle International Corporation | Techniques for similarity analysis and data enrichment using knowledge sources |
US11693549B2 (en) | 2014-09-26 | 2023-07-04 | Oracle International Corporation | Declarative external data source importation, exportation, and metadata reflection utilizing HTTP and HDFS protocols |
US10936599B2 (en) | 2017-09-29 | 2021-03-02 | Oracle International Corporation | Adaptive recommendations |
US11500880B2 (en) | 2017-09-29 | 2022-11-15 | Oracle International Corporation | Adaptive recommendations |
Also Published As
Publication number | Publication date |
---|---|
US20190138538A1 (en) | 2019-05-09 |
JP2017536601A (ja) | 2017-12-07 |
WO2016049437A9 (en) | 2017-03-02 |
US10210246B2 (en) | 2019-02-19 |
CN106687952B (zh) | 2022-02-11 |
EP3198482A1 (en) | 2017-08-02 |
US11379506B2 (en) | 2022-07-05 |
CN106687952A (zh) | 2017-05-17 |
WO2016049437A1 (en) | 2016-03-31 |
US20160092557A1 (en) | 2016-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6568935B2 (ja) | 知識ソースを用いた類似性分析およびデータ強化の技術 | |
JP7148654B2 (ja) | 推薦されるデータ変換および修復のための宣言型言語およびビジュアライゼーションシステム | |
US11500880B2 (en) | Adaptive recommendations | |
US11693549B2 (en) | Declarative external data source importation, exportation, and metadata reflection utilizing HTTP and HDFS protocols | |
US11163527B2 (en) | Techniques for dataset similarity discovery | |
US11417131B2 (en) | Techniques for sentiment analysis of data using a convolutional neural network and a co-occurrence network | |
US11200248B2 (en) | Techniques for facilitating the joining of datasets | |
US11704321B2 (en) | Techniques for relationship discovery between datasets | |
US11120086B2 (en) | Toponym disambiguation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180608 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180608 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190320 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190805 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6568935 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |