JP7213890B2 - 高速化された大規模な類似度計算 - Google Patents
高速化された大規模な類似度計算 Download PDFInfo
- Publication number
- JP7213890B2 JP7213890B2 JP2020560917A JP2020560917A JP7213890B2 JP 7213890 B2 JP7213890 B2 JP 7213890B2 JP 2020560917 A JP2020560917 A JP 2020560917A JP 2020560917 A JP2020560917 A JP 2020560917A JP 7213890 B2 JP7213890 B2 JP 7213890B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- entities
- processing unit
- correlation
- data arrays
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 156
- 238000003491 array Methods 0.000 claims description 103
- 238000000034 method Methods 0.000 claims description 93
- 230000015654 memory Effects 0.000 claims description 82
- 238000004422 calculation algorithm Methods 0.000 claims description 78
- 230000008569 process Effects 0.000 claims description 44
- 238000004891 communication Methods 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000009471 action Effects 0.000 claims description 3
- 238000004148 unit process Methods 0.000 claims 1
- 238000004590 computer program Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- 238000013500 data storage Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 6
- 230000037406 food intake Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000011524 similarity measure Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000036316 preload Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
i) tf.sketch_gpu_load_table (query_tensor)
ii) tf.sketch_gpu_load_table (GPU_table_uri)
iii) tf.sketch_gpu_method (simlarity_method_enum)
→ J(X,Y) = |X∩Y| / |X∪Y| (formula_similarity_score)
iv) tf.sketch_gpu_results (top_k_return)
102 コンピューティングサーバ
104 エンティティ相関システム
106 データストレージデバイス
108 データ取り込み構成要素
110 データホスティングサービス
112 データフローモジュール
114 プロセッサモジュール
116 第1のプロセッサ、CPU
118 第2のプロセッサ、GPU
120 クエリデータ
200 プロセス
300 アーキテクチャ
302 GPU/CPU転送ブロック
304 スレッドブロック
306 データ配列
308 データ配列
310 データ配列
312 データ配列、クエリテンソル
400 処理アーキテクチャ
402 プロセス
404 プロセス
500 コンピューティングデバイス
502 プロセッサ
504 メモリ
506 ストレージデバイス
508 高速インターフェース、高速コントローラ
510 高速拡張ポート
512 低速インターフェース、低速コントローラ
514 低速バス、低速拡張ポート
516 ディスプレイ
520 サーバ
522 ラップトップコンピュータ
524 ラックサーバシステム
550 コンピューティングデバイス
552 プロセッサ
554 ディスプレイ
556 ディスプレイインターフェース
558 制御インターフェース
560 音声コーデック
562 外部インターフェース
564 メモリ
566 通信インターフェース
568 トランシーバ
570 GPS受信機モジュール
572 拡張インターフェース
574 拡張メモリ
580 セルラ電話
582 スマートフォン
Claims (21)
- エンティティ相関システムの第1の処理ユニットによって、ストレージデバイスに記憶されたデータを取得するステップであって、前記データが、複数のエンティティについての情報を含む、ステップと、
前記第1の処理ユニットにおいて、前記ストレージデバイスから取得された前記データを使用して複数のデータ配列を生成するステップであって、前記複数のデータ配列の各データ配列が、
i)複数のエンティティのそれぞれに関するパラメータ値を含み、
ii)第2の処理ユニットのそれぞれの計算セルにおける処理のために構成される、ステップと、
前記エンティティ相関システムにおいて、前記複数のデータ配列のうちの少なくとも2つのデータ配列を前記第2の処理ユニットに提供するステップであって、前記第2の処理ユニットが、前記第2の処理ユニットのそれぞれの計算セルにおいて前記少なくとも2つのデータ配列を同時に処理するために相関アルゴリズムを実行するように構成される、ステップと、
前記第2の処理ユニットにおいて、前記相関アルゴリズムおよび前記複数のエンティティに関する前記パラメータ値を使用して、前記それぞれの計算セルにおいて実行される計算に基づいて、前記少なくとも2つのデータ配列の相関スコアを計算するステップと、
前記エンティティ相関システムにおいて、前記計算された相関スコアに基づいて、前記少なくとも2つのデータ配列のエンティティの間の関係を決定するステップであって、前記関係が、どのエンティティが前記少なくとも2つのデータ配列の間で共有されるか、および/または、どのエンティティが前記少なくとも2つのデータ配列の間で異なるかを示す、ステップと
を含む、コンピュータによって実施される方法。 - 前記相関スコアを計算するステップが、
特定の相関アルゴリズムを類似度アルゴリズムまたは条件付き確率アルゴリズムとして選択するステップと、
前記特定の相関アルゴリズムを使用して、前記少なくとも2つのデータ配列のエンティティの間の積集合および前記少なくとも2つのデータ配列のエンティティの間の和集合を計算するステップと、
前記積集合および前記和集合に基づいて前記相関スコアを計算するステップと
を含む、請求項1に記載の方法。 - 前記第1の処理ユニットが、前記複数のデータ配列を生成するために前記ストレージデバイスから取得されたデータを予めソートする中央演算処理装置(CPU)であり、
前記第2の処理ユニットが、前記少なくとも2つのデータ配列のエンティティに関する前記パラメータ値を使用して並列計算を実行するグラフィックス処理ユニット(GPU)であり、
前記特定の相関アルゴリズムが、Jaccard類似度アルゴリズム、コサイン類似度アルゴリズム、または条件付き確率アルゴリズムである、請求項2に記載の方法。 - 生成するステップが、
前記複数のエンティティについての情報を含む前記データをスケッチアルゴリズムに基づいてソートするステップと、
ソートするステップに応じて、前記データのスケッチ表現を生成するステップであって、各スケッチ表現が、前記複数のデータ配列の各々に対応する、生成するステップと
を含む、請求項1に記載の方法。 - 各データ配列が、前記ストレージデバイスに記憶された前記データのスケッチ表現であり、
前記複数のデータ配列の少なくとも1つのサブセットが、各々が所定の数のエンティティを有するそれぞれのデータ配列を含む、請求項1に記載の方法。 - 各スケッチ表現が、前記第2の処理ユニットに含まれる計算セルの量に応じてサイズを決められる、請求項5に記載の方法。
- 提供するステップが、
前記第2の処理ユニットのメモリキャッシュに各データ配列を記憶するステップであって、前記メモリキャッシュが、前記第2の処理ユニットのコンパクトなメモリを表し、各データ配列が、前記コンパクトなメモリのデータ容量に応じてサイズを決められる、記憶するステップ
を含む、請求項1に記載の方法。 - 前記データ配列のうちの少なくとも1つが、前記第2の処理ユニットに含まれる複数の計算セルの各々によるアクセスのために構成される、請求項1に記載の方法。
- エンティティの間の関係を決定するステップが、
前記計算された相関スコアが閾値スコアを超えるかどうかを判定するステップと、
前記計算された相関スコアが前記閾値スコアを超えるとの判定に応じて、前記閾値スコアを超える前記相関スコアを使用してランク付けされるエンティティのリストを生成するステップと
を含む、請求項1に記載の方法。 - 1つまたは複数の処理デバイスと、
1つまたは複数の非一時的機械可読ストレージデバイスであって、
エンティティ相関システムの第1の処理ユニットによって、ストレージデバイスに記憶されたデータを取得することであって、前記データが、複数のエンティティについての情報を含む、取得すること、
前記第1の処理ユニットにおいて、前記ストレージデバイスから取得された前記データを使用して複数のデータ配列を生成することであって、前記複数のデータ配列の各データ配列が、
i)複数のエンティティのそれぞれに関するパラメータ値を含み、
ii)第2の処理ユニットのそれぞれの計算セルにおける処理のために構成される、生成すること、
前記エンティティ相関システムにおいて、少なくとも2つのデータ配列を前記第2の処理ユニットに提供することであって、前記第2の処理ユニットが、前記第2の処理ユニットのそれぞれの計算セルにおいて前記少なくとも2つのデータ配列を同時に処理するために相関アルゴリズムを実行するように構成される、提供すること、
前記第2の処理ユニットにおいて、前記相関アルゴリズムおよび前記複数のエンティティに関する前記パラメータ値を使用して前記それぞれの計算セルにおいて実行される計算に基づいて、前記少なくとも2つのデータ配列の相関スコアを計算すること、ならびに
前記エンティティ相関システムにおいて、前記計算された相関スコアに基づいて、前記少なくとも2つのデータ配列のエンティティの間の関係を決定することであって、前記関係が、どのエンティティが前記少なくとも2つのデータ配列の間で共有されるか、および/または、どのエンティティが前記少なくとも2つのデータ配列の間で異なるかを示す、決定すること
を含む動作の実行を引き起こすために、前記1つまたは複数の処理デバイスによって実行可能な命令を記憶する、1つまたは複数の非一時的機械可読ストレージデバイスと
を備える、電子システム。 - 前記相関スコアを計算することが、
特定の相関アルゴリズムを類似度アルゴリズムまたは条件付き確率アルゴリズムとして選択することと、
前記特定の相関アルゴリズムを使用して、前記少なくとも2つのデータ配列のエンティティの間の積集合および前記少なくとも2つのデータ配列のエンティティの間の和集合を計算することと、
前記積集合および前記和集合に基づいて、前記相関スコアを計算することと
を含む、請求項10に記載の電子システム。 - 前記第1の処理ユニットが、前記複数のデータ配列を生成するために前記ストレージデバイスから取得されたデータを予めソートする中央演算処理装置(CPU)であり、
前記第2の処理ユニットが、前記少なくとも2つのデータ配列のエンティティに関する前記パラメータ値を使用して並列計算を実行するグラフィックス処理ユニット(GPU)であり、
前記特定の相関アルゴリズムが、Jaccard類似度アルゴリズム、コサイン類似度アルゴリズム、または条件付き確率アルゴリズムである、請求項11に記載の電子システム。 - 生成することが、
前記複数のエンティティについての情報を含む前記データをスケッチアルゴリズムに基づいてソートすることと、
ソートすることに応じて、前記データのスケッチ表現を生成することであって、各スケッチ表現が、前記複数のデータ配列の各々に対応する、生成することと
を含む、請求項10に記載の電子システム。 - 各データ配列が、前記ストレージデバイスに記憶された前記データのスケッチ表現であり、
前記複数のデータ配列の少なくとも1つのサブセットが、各々が所定の数のエンティティを有するそれぞれのデータ配列を含む、請求項10に記載の電子システム。 - 各スケッチ表現が、前記第2の処理ユニットに含まれる計算セルの量に応じてサイズを決められる、請求項14に記載の電子システム。
- 提供することが、
前記第2の処理ユニットのメモリキャッシュに各データ配列を記憶することであって、前記メモリキャッシュが、前記第2の処理ユニットのコンパクトなメモリを表し、各データ配列が、前記コンパクトなメモリのデータ容量に応じてサイズを決められる、記憶すること
を含む、請求項10に記載の電子システム。 - 前記データ配列のうちの少なくとも1つが、前記第2の処理ユニットに含まれる複数の計算セルの各々によるアクセスのために構成される、請求項10に記載の電子システム。
- エンティティの間の関係を決定することが、
前記計算された相関スコアが閾値スコアを超えるかどうかを判定することと、
前記計算された相関スコアが前記閾値スコアを超えるとの判定に応じて、前記閾値スコアを超える前記相関スコアを使用してランク付けされるエンティティのリストを生成することと
を含む、請求項10に記載の電子システム。 - エンティティ相関システムにおいて、エンティティのセットの中の関係に関連するデータのためのクエリを受信するステップと、
受信した前記クエリに応答して前記エンティティの中にて決定された前記関係を示すデータを提供するステップと
をさらに含み、
前記複数のデータ配列を生成するステップは、前記クエリに関連するエンティティタイプをさらに使用して複数のデータ配列を生成する
請求項1から9のいずれか一項に記載の方法。 - 前記1つまたは複数の非一時的機械可読ストレージデバイスは、
エンティティ相関システムによって、エンティティのセットの中の関係に関連するデータのためのクエリを受信すること、
受信した前記クエリに応答して前記エンティティの中にて決定された前記関係を示すデータを提供すること
を含む動作の実行をさらに引き起こすために、前記1つまたは複数の処理デバイスによって実行可能な命令を記憶し、
前記複数のデータ配列を生成することは、前記クエリに関連するエンティティタイプをさらに使用して複数のデータ配列を生成する
請求項10から18のいずれか一項に記載の電子システム。 - 命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、第2の処理ユニットと通信する第1の処理ユニットを含む処理システムによって実行されるときに、前記処理システムに、請求項1から9および請求項19のいずれか一項に記載の方法を実行させる、コンピュータ可読記憶媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2018/030486 WO2019212537A1 (en) | 2018-05-01 | 2018-05-01 | Accelerated large-scale similarity calculation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021522605A JP2021522605A (ja) | 2021-08-30 |
JP7213890B2 true JP7213890B2 (ja) | 2023-01-27 |
Family
ID=62486629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020560917A Active JP7213890B2 (ja) | 2018-05-01 | 2018-05-01 | 高速化された大規模な類似度計算 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11379535B2 (ja) |
EP (1) | EP3631646A1 (ja) |
JP (1) | JP7213890B2 (ja) |
KR (1) | KR102495793B1 (ja) |
CN (2) | CN110959157B (ja) |
WO (1) | WO2019212537A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102495793B1 (ko) | 2018-05-01 | 2023-02-06 | 구글 엘엘씨 | 가속화된 대규모 유사성 계산 |
CN111984916B (zh) * | 2020-10-09 | 2021-01-12 | 北京应用物理与计算数学研究所 | 一种数理方程解算构件及并行软件研发方法与系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4976578B1 (ja) | 2011-09-16 | 2012-07-18 | 楽天株式会社 | 画像検索装置およびプログラム |
US20120321175A1 (en) | 2011-06-17 | 2012-12-20 | Microsoft Corporation | Location-aided recognition |
JP2017079080A (ja) | 2016-12-21 | 2017-04-27 | 株式会社Jvcケンウッド | 情報処理装置、情報処理方法、情報処理プログラム |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5415591Y2 (ja) | 1972-10-19 | 1979-06-22 | ||
US4905162A (en) * | 1987-03-30 | 1990-02-27 | Digital Equipment Corporation | Evaluation system for determining analogy and symmetric comparison among objects in model-based computation systems |
US5560006A (en) * | 1991-05-15 | 1996-09-24 | Automated Technology Associates, Inc. | Entity-relation database |
US5339257A (en) * | 1991-05-15 | 1994-08-16 | Automated Technology Associates Inc. | Real-time statistical process monitoring system |
JP3611601B2 (ja) * | 1994-09-01 | 2005-01-19 | 富士通株式会社 | リスト処理システムとその方法 |
US5943663A (en) * | 1994-11-28 | 1999-08-24 | Mouradian; Gary C. | Data processing method and system utilizing parallel processing |
JPH08272824A (ja) * | 1995-03-31 | 1996-10-18 | Hitachi Software Eng Co Ltd | 遺伝子配列データ自動検索方法 |
US6128608A (en) | 1998-05-01 | 2000-10-03 | Barnhill Technologies, Llc | Enhancing knowledge discovery using multiple support vector machines |
US6774917B1 (en) | 1999-03-11 | 2004-08-10 | Fuji Xerox Co., Ltd. | Methods and apparatuses for interactive similarity searching, retrieval, and browsing of video |
US6694325B2 (en) * | 2000-10-16 | 2004-02-17 | Frank Jas | Database method implementing attribute refinement model |
IES20010724A2 (en) * | 2001-07-30 | 2003-02-05 | Univ Dublin | Data processing system and method |
KR100483321B1 (ko) | 2001-10-17 | 2005-04-15 | 한국과학기술원 | 하이퍼사각형 기반의 다차원 데이터 세그먼테이션을이용한 유사성 검색 장치와 그 방법 |
JP3903783B2 (ja) | 2001-12-14 | 2007-04-11 | 日本電気株式会社 | 顔メタデータ生成方法および装置、並びに顔類似度算出方法および装置 |
US20040002818A1 (en) * | 2001-12-21 | 2004-01-01 | Affymetrix, Inc. | Method, system and computer software for providing microarray probe data |
US7069268B1 (en) * | 2003-01-13 | 2006-06-27 | Cisco Technology, Inc. | System and method for identifying data using parallel hashing |
US6947933B2 (en) | 2003-01-23 | 2005-09-20 | Verdasys, Inc. | Identifying similarities within large collections of unstructured data |
US20090270717A1 (en) * | 2008-04-25 | 2009-10-29 | Welch Allyn, Inc. | Apparatus and method for diagnosis of optically identifiable ophthalmic conditions |
US7483034B2 (en) | 2004-02-25 | 2009-01-27 | Siemens Medical Solutions Usa, Inc. | System and method for GPU-based 3D nonrigid registration |
US7706633B2 (en) | 2004-04-21 | 2010-04-27 | Siemens Corporation | GPU-based image manipulation method for registration applications |
US20050246333A1 (en) * | 2004-04-30 | 2005-11-03 | Jiang-Liang Hou | Method and apparatus for classifying documents |
US7899796B1 (en) * | 2004-11-23 | 2011-03-01 | Andrew Borthwick | Batch automated blocking and record matching |
US7716217B2 (en) * | 2006-01-13 | 2010-05-11 | Bluespace Software Corporation | Determining relevance of electronic content |
US8140530B2 (en) | 2006-08-03 | 2012-03-20 | Nec Corporation | Similarity calculation device and information search device |
WO2008092147A2 (en) * | 2007-01-26 | 2008-07-31 | Information Resources, Inc. | Analytic platform |
US8099401B1 (en) * | 2007-07-18 | 2012-01-17 | Emc Corporation | Efficiently indexing and searching similar data |
US7987177B2 (en) | 2008-01-30 | 2011-07-26 | International Business Machines Corporation | Method for estimating the number of distinct values in a partitioned dataset |
US8166047B1 (en) * | 2008-08-06 | 2012-04-24 | At&T Intellectual Property I, L.P. | Systems, devices, and/or methods for managing data |
US9171077B2 (en) | 2009-02-27 | 2015-10-27 | International Business Machines Corporation | Scaling dynamic authority-based search using materialized subgraphs |
US9413527B2 (en) | 2009-04-30 | 2016-08-09 | HGST Netherlands B.V. | Optimizing signature computation and sampling for fast adaptive similarity detection based on algorithm-specific performance |
WO2011014471A1 (en) * | 2009-07-27 | 2011-02-03 | Sensis Corporation | System and method for correlating past activities, determining hidden relationships and predicting future activities |
WO2011102432A1 (ja) * | 2010-02-18 | 2011-08-25 | Inoue Katsumi | 情報絞り込み検出機能を備えたメモリ、このメモリを用いた情報検出方法、このメモリを含む装置、情報の検出方法、メモリの使用方法、およびメモリアドレス比較回路 |
US8620930B2 (en) * | 2010-03-11 | 2013-12-31 | Yahoo! Inc. | Method and system for determining similarity score |
FI20105252A0 (fi) * | 2010-03-12 | 2010-03-12 | Medisapiens Oy | Menetelmä, järjestely ja tietokoneohjelmatuote biologisen tai lääketieteellisen näytteen analysoimiseen |
US20180181705A1 (en) * | 2010-03-12 | 2018-06-28 | Medisapiens Oy | Method, an arrangement and a computer program product for analysing a biological or medical sample |
US10474647B2 (en) * | 2010-06-22 | 2019-11-12 | Primal Fusion Inc. | Methods and devices for customizing knowledge representation systems |
US8407215B2 (en) * | 2010-12-10 | 2013-03-26 | Sap Ag | Text analysis to identify relevant entities |
CN102855259B (zh) * | 2011-06-30 | 2015-05-13 | Sap欧洲公司 | 大规模数据聚类分析的并行化 |
US8873813B2 (en) * | 2012-09-17 | 2014-10-28 | Z Advanced Computing, Inc. | Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities |
US9916538B2 (en) * | 2012-09-15 | 2018-03-13 | Z Advanced Computing, Inc. | Method and system for feature detection |
US9317875B2 (en) * | 2012-10-08 | 2016-04-19 | Linkedin Corporation | Methods and systems for identifying similar schools |
US8862662B2 (en) * | 2012-10-29 | 2014-10-14 | The Boeing Company | Determination of latent interactions in social networks |
US9141823B2 (en) * | 2013-03-15 | 2015-09-22 | Veridicom, Sa De Cv | Abstraction layer for default encryption with orthogonal encryption logic session object; and automated authentication, with a method for online litigation |
US20150363553A1 (en) * | 2013-06-18 | 2015-12-17 | Naryan L. Rustgi | Medical registry |
US9396253B2 (en) * | 2013-09-27 | 2016-07-19 | International Business Machines Corporation | Activity based analytics |
US10042894B2 (en) * | 2013-10-31 | 2018-08-07 | Microsoft Technology Licensing, Llc | Temporal-based professional similarity |
US20160239499A1 (en) * | 2015-02-12 | 2016-08-18 | Red Hat, Inc. | Object Creation Based on Copying Objects Corresponding to Similar Entities |
US11001900B2 (en) * | 2015-06-30 | 2021-05-11 | Psomagen, Inc. | Method and system for characterization for female reproductive system-related conditions associated with microorganisms |
US20170161591A1 (en) * | 2015-12-04 | 2017-06-08 | Pilot Ai Labs, Inc. | System and method for deep-learning based object tracking |
US10402750B2 (en) * | 2015-12-30 | 2019-09-03 | Facebook, Inc. | Identifying entities using a deep-learning model |
US10268749B1 (en) * | 2016-01-07 | 2019-04-23 | Amazon Technologies, Inc. | Clustering sparse high dimensional data using sketches |
US20170270245A1 (en) * | 2016-01-11 | 2017-09-21 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods for performing secondary and/or tertiary processing |
US10585893B2 (en) * | 2016-03-30 | 2020-03-10 | International Business Machines Corporation | Data processing |
US10353911B2 (en) * | 2016-06-19 | 2019-07-16 | Data.World, Inc. | Computerized tools to discover, form, and analyze dataset interrelations among a system of networked collaborative datasets |
US10922761B2 (en) * | 2016-08-02 | 2021-02-16 | Mastercard International Incorporated | Payment card network data validation system |
US10635739B1 (en) * | 2016-08-25 | 2020-04-28 | Cyber Atomics, Inc. | Multidimensional connectivity graph-based tensor processing |
CN107818069B (zh) * | 2016-09-12 | 2021-10-01 | 阿里巴巴集团控股有限公司 | 数据处理方法及系统 |
US10565498B1 (en) * | 2017-02-28 | 2020-02-18 | Amazon Technologies, Inc. | Deep neural network-based relationship analysis with multi-feature token model |
US11068453B2 (en) * | 2017-03-09 | 2021-07-20 | data.world, Inc | Determining a degree of similarity of a subset of tabular data arrangements to subsets of graph data arrangements at ingestion into a data-driven collaborative dataset platform |
US11238109B2 (en) * | 2017-03-09 | 2022-02-01 | Data.World, Inc. | Computerized tools configured to determine subsets of graph data arrangements for linking relevant data to enrich datasets associated with a data-driven collaborative dataset platform |
US11138516B2 (en) * | 2017-06-30 | 2021-10-05 | Visa International Service Association | GPU enhanced graph model build and scoring engine |
KR102495793B1 (ko) | 2018-05-01 | 2023-02-06 | 구글 엘엘씨 | 가속화된 대규모 유사성 계산 |
-
2018
- 2018-05-01 KR KR1020207033966A patent/KR102495793B1/ko active IP Right Grant
- 2018-05-01 US US16/344,450 patent/US11379535B2/en active Active
- 2018-05-01 JP JP2020560917A patent/JP7213890B2/ja active Active
- 2018-05-01 CN CN201880048473.5A patent/CN110959157B/zh active Active
- 2018-05-01 WO PCT/US2018/030486 patent/WO2019212537A1/en unknown
- 2018-05-01 EP EP18728476.5A patent/EP3631646A1/en active Pending
- 2018-05-01 CN CN202410227462.0A patent/CN118133039A/zh active Pending
-
2022
- 2022-06-13 US US17/839,116 patent/US11782991B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120321175A1 (en) | 2011-06-17 | 2012-12-20 | Microsoft Corporation | Location-aided recognition |
JP2014523015A (ja) | 2011-06-17 | 2014-09-08 | マイクロソフト コーポレーション | ロケーションを利用した認識 |
JP4976578B1 (ja) | 2011-09-16 | 2012-07-18 | 楽天株式会社 | 画像検索装置およびプログラム |
JP2017079080A (ja) | 2016-12-21 | 2017-04-27 | 株式会社Jvcケンウッド | 情報処理装置、情報処理方法、情報処理プログラム |
Non-Patent Citations (2)
Title |
---|
津田 宏治 外,離散構造処理系-知能情報処理を支えるアルゴリズムの技法 大規模データの類似度検索技術,人工知能学会誌,日本,(社)人工知能学会 ,2012年05月01日,第27巻 第3号,pp. 239--245 |
菅野 健太 外,メニーコアプロセッサを用いた大規模な集合間類似結合の高速化,第10回データ工学と情報マネジメントに関するフォーラム (第16回日本データベース学会年次大会) [Online] ,日本,電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2018年03月06日,pp. 1--5 |
Also Published As
Publication number | Publication date |
---|---|
WO2019212537A1 (en) | 2019-11-07 |
CN110959157B (zh) | 2024-03-12 |
US11379535B2 (en) | 2022-07-05 |
CN110959157A (zh) | 2020-04-03 |
US20220309101A1 (en) | 2022-09-29 |
EP3631646A1 (en) | 2020-04-08 |
JP2021522605A (ja) | 2021-08-30 |
US11782991B2 (en) | 2023-10-10 |
KR20210002647A (ko) | 2021-01-08 |
KR102495793B1 (ko) | 2023-02-06 |
US20210026889A1 (en) | 2021-01-28 |
CN118133039A (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9454580B2 (en) | Recommendation system with metric transformation | |
US10504120B2 (en) | Determining a temporary transaction limit | |
US9218630B2 (en) | Identifying influential users of a social networking service | |
US20170140038A1 (en) | Method and system for hybrid information query | |
US11782991B2 (en) | Accelerated large-scale similarity calculation | |
US20140006369A1 (en) | Processing structured and unstructured data | |
US20150234883A1 (en) | Method and system for retrieving real-time information | |
CN103177066A (zh) | 分析和表示人际关系 | |
CN104615723B (zh) | 查询词权重值的确定方法和装置 | |
CN111435376A (zh) | 信息处理方法及系统、计算机系统和计算机可读存储介质 | |
Fageeri et al. | An efficient log file analysis algorithm using binary-based data structure | |
CN118093962A (zh) | 数据检索方法、装置、系统、电子设备及可读存储介质 | |
Zhao et al. | Monochromatic and bichromatic ranked reverse boolean spatial keyword nearest neighbors search | |
Szczuka et al. | Using domain knowledge in initial stages of KDD: optimization of compound object processing | |
CN115422429A (zh) | 关联词的确定方法、装置、计算机设备和存储介质 | |
WO2016144360A1 (en) | Progressive interactive approach for big data analytics | |
US20180276294A1 (en) | Information processing apparatus, information processing system, and information processing method | |
Hussan et al. | An optimized user behavior prediction model using genetic algorithm on mobile web structure | |
Kakkar et al. | Interactive analysis of big geospatial data with high‐performance computing: A case study of partisan segregation in the United States | |
CN116910229A (zh) | 针对指标的智能查询方法和装置 | |
CN114756654A (zh) | 动态地名地址匹配方法、装置、计算机设备和存储介质 | |
CN116910604A (zh) | 用户分类方法、装置、计算机设备、存储介质和程序产品 | |
CN118229251A (zh) | 邮件检索展示方法、装置、计算机设备和存储介质 | |
CN117874057A (zh) | 数据的查询方法及装置、电子设备 | |
CN117112724A (zh) | 搜索推送方法、装置、设备、存储介质和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210115 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7213890 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |