WO2022049680A1 - 結合テーブル特定システム、結合テーブル探索装置、方法およびプログラム - Google Patents
結合テーブル特定システム、結合テーブル探索装置、方法およびプログラム Download PDFInfo
- Publication number
- WO2022049680A1 WO2022049680A1 PCT/JP2020/033308 JP2020033308W WO2022049680A1 WO 2022049680 A1 WO2022049680 A1 WO 2022049680A1 JP 2020033308 W JP2020033308 W JP 2020033308W WO 2022049680 A1 WO2022049680 A1 WO 2022049680A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- join
- index
- search
- column
- records
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 100
- 230000008878 coupling Effects 0.000 title abstract description 11
- 238000010168 coupling process Methods 0.000 title abstract description 11
- 238000005859 coupling reaction Methods 0.000 title abstract description 11
- 238000000605 extraction Methods 0.000 claims description 35
- 230000008569 process Effects 0.000 claims description 35
- 238000010276 construction Methods 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 25
- 239000000284 extract Substances 0.000 claims description 18
- 230000006870 function Effects 0.000 description 107
- 239000013598 vector Substances 0.000 description 47
- 238000010586 diagram Methods 0.000 description 21
- 230000002596 correlated effect Effects 0.000 description 19
- 238000004364 calculation method Methods 0.000 description 14
- 238000011156 evaluation Methods 0.000 description 9
- 230000001174 ascending effect Effects 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 238000009826 distribution Methods 0.000 description 5
- 235000013361 beverage Nutrition 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/221—Column-oriented storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24542—Plan optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
Definitions
- the Jaccard similarity is 0.5
- the editing distance is 0.37
- the similarity after Word2vec conversion is 0.8 for "ramune” and "ramune 250 ml” illustrated in FIG. 2.
- the maximum similarity is calculated to be 0.8, which is larger than the threshold value Tr , so that it is determined that the two records can be combined.
- the join column candidate extraction unit 112 extracts a column including a record that can be a join key with another table from each outer table included in the outer table group as a join column candidate.
- the join column candidate extraction unit 112 estimates, for example, the types of all the columns in the outer table group, and determines whether or not the column of the estimated type can be joined with the columns of other tables.
- the column type here may be a type such as a "character string type" or a "numeric type" indicating a character attribute, or may indicate a concept represented by a column. ..
- N 10
- M 1
- the number of results when the join index A is used for the record of a certain target column is 2, and the number of results when the join index B is used is 5.
- FIG. 9 is an explanatory diagram showing an example of a process for determining whether or not to exclude the feature vector. It is assumed that the data in the "sales" column of the base table BT3 illustrated in FIG. 9 and the data in the "attribute 1" column and the “attribute 2" column of the external table FT3 are standardized data, respectively. That is, each surrounded by the broken line illustrated in FIG. 9 corresponds to the feature vector.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
まず、本発明の第一の実施形態を説明する。第一の実施形態では、対象とするカラムに結合可能なテーブルを特定するためのコストを低減させることを目標とする。図1は、本発明による結合テーブル特定システムの一実施形態の構成例を示すブロック図である。本実施形態の結合テーブル特定システム100は、結合元のテーブル(すなわち、ベーステーブル)に結合可能な外部テーブル(以下、結合テーブルと記す。)を特定するシステムである。より具体的には、結合テーブルは、ベーステーブルに含まれるいずれかのカラムと結合可能なカラムを含むテーブルである。
次に、本発明の第二の実施形態を説明する。第二の実施形態では、対象カラムのデータに相関のあるデータから成るカラムを含むテーブルを高速に特定することを目標とする。図7は、本発明による相関テーブル特定システムの一実施形態の構成例を示すブロック図である。本実施形態の相関テーブル特定システム200は、対象カラムと相関のあるカラムを含む外部テーブル(以下、相関テーブルと記す。)を特定するシステムである。
-サイズ2の相関索引:A[1,2]、 B[0,3]
-サイズ4の相関索引:A[1,2,3,4]、 B[0,3,4,5]
-サイズ6の相関索引:A[1,2,3,4,5,7]、B[0,3,4,5,7,9]
-サイズ2の相関索引:P1[0,1]、P2[3,4]、P3[1,2]、P4[0,1]
-サイズ4の相関索引:P1[0,1,2,3]、P2[3,4,5,6]、P3[1,2,3,3]
-サイズ6の相関索引:P1[0,1,2,3,4,5]
次に、本発明の第三の実施形態を説明する。第三の実施形態では、対象とするカラムを含むテーブルに対し、相関のあるデータを効率的に統合することを目標とする。図13は、本発明によるテーブル統合システムの一実施形態の構成例を示すブロック図である。本実施形態のテーブル統合システム300は、ベーステーブルに含まれる対象カラムと相関のあるカラムを統合するシステムである。
次に、本発明の第四の実施形態を説明する。第四の実施形態では、第一の実施形態から第三の実施形態までのシステムを組み合わせて、対象とするカラムを含むテーブルに対し、相関のあるデータを効率的に統合する方法を説明する。
前記結合索引を前記類似度関数ごとに記憶する結合索引記憶部と、
前記結合索引を利用して対象カラムに結合可能なテーブルを前記外部テーブルの中から探索する結合テーブル探索装置とを備え、
前記結合索引構築装置は、
前記類似度関数ごとに前記結合索引を生成し、生成された前記結合索引を前記結合索引記憶部に記憶させる結合索引生成手段を含み、
前記結合テーブル探索装置は、
前記結合索引記憶部から前記結合索引の入力を受け付ける入力手段と、
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成する検索プラン生成手段と、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定するレコード検索手段とを含み、
前記レコード検索手段は、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行う
ことを特徴とする結合テーブル特定システム。
結合索引生成手段は、抽出された前記結合カラム候補の結合索引を類似度関数ごとに生成し、生成された結合索引を結合索引記憶部に記憶させる
付記1記載の結合テーブル特定システム。
付記2記載の結合テーブル特定システム。
付記3記載の結合テーブル特定システム。
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成する検索プラン生成手段と、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定するレコード検索手段とを備え、
前記レコード検索手段は、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行う
ことを特徴とする結合テーブル探索装置。
生成された前記結合索引を結合索引記憶部に記憶させ、
前記結合索引記憶部から前記結合索引の入力を受け付け、
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、
算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成し、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定し、
前記レコードの検索において、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行う
ことを特徴とする結合テーブル特定方法。
抽出された前記結合カラム候補の結合索引を類似度関数ごとに生成し、生成された結合索引を結合索引記憶部に記憶させる
付記6記載の結合テーブル特定方法。
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、
算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成し、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定し、
前記レコードの検索において、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行う
ことを特徴とする結合テーブル探索方法。
レコード間の類似度を算出する関数である類似度関数により算出される当該類似度が予め定めた閾値より大きい外部テーブルのレコードを検索可能な索引である結合索引を当該類似度関数ごとに記憶する記憶装置から、当該結合索引の入力を受け付ける入力処理、
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成する検索プラン生成処理、および、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定するレコード検索処理を実行させ、
前記レコード検索処理で、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行わせる
ための結合テーブル探索プログラムを記憶するプログラム記憶媒体。
レコード間の類似度を算出する関数である類似度関数により算出される当該類似度が予め定めた閾値より大きい外部テーブルのレコードを検索可能な索引である結合索引を当該類似度関数ごとに記憶する記憶装置から、当該結合索引の入力を受け付ける入力処理、
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成する検索プラン生成処理、および、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定するレコード検索処理を実行させ、
前記レコード検索処理で、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行わせる
ための結合テーブル探索プログラム。
20 テーブル記憶装置
21 結合テーブル記憶部
22 相関テーブル記憶部
100 結合テーブル特定システム
110 結合索引構築装置
112 結合カラム候補抽出部
114 結合索引生成部
120 結合索引記憶部
130 結合テーブル探索装置
132 入力部
134 検索プラン生成部
136 レコード検索部
138 結合テーブル出力部
140 結合テーブル記憶部
200 相関テーブル特定システム
210 相関索引構築装置
212 非結合カラム候補抽出部
214 相関索引生成部
220 相関索引記憶部
230 相関テーブル探索装置
232 入力部
234 索引特定部
236 候補カラム検索部
238 相関テーブル出力部
240 相関テーブル記憶部
300 テーブル統合システム
310 統合テーブル生成装置
312 入力部
314 テーブル結合部
316 特徴量加工部
318 特徴量選択部
320 統合テーブル出力部
330 統合テーブル記憶部
400 外部データ活用システム
Claims (9)
- レコード間の類似度を算出する関数である類似度関数により算出される当該類似度が予め定めた閾値より大きい外部テーブルのレコードを検索可能な索引である結合索引を構築する結合索引構築装置と、
前記結合索引を前記類似度関数ごとに記憶する結合索引記憶部と、
前記結合索引を利用して対象カラムに結合可能なテーブルを前記外部テーブルの中から探索する結合テーブル探索装置とを備え、
前記結合索引構築装置は、
前記類似度関数ごとに前記結合索引を生成し、生成された前記結合索引を前記結合索引記憶部に記憶させる結合索引生成手段を含み、
前記結合テーブル探索装置は、
前記結合索引記憶部から前記結合索引の入力を受け付ける入力手段と、
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成する検索プラン生成手段と、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定するレコード検索手段とを含み、
前記レコード検索手段は、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行う
ことを特徴とする結合テーブル特定システム。 - 結合索引構築装置は、外部テーブル群に含まれる各外部テーブルのうち、他のテーブルとの結合キーになり得るレコードを含むカラムである結合カラム候補を、当該各外部テーブルから抽出する結合カラム候補抽出手段を含み、
結合索引生成手段は、抽出された前記結合カラム候補の結合索引を類似度関数ごとに生成し、生成された結合索引を結合索引記憶部に記憶させる
請求項1記載の結合テーブル特定システム。 - 結合カラム候補抽出手段は、各外部テーブルに含まれる各カラムの型を推定し、推定された型のカラムが他のテーブルのカラムと結合可能な否かを判定して結合カラム候補を抽出する
請求項2記載の結合テーブル特定システム。 - 結合カラム候補抽出手段は、推定されたカラムの型が、予め定めた意味を示す場合または所定の文字の属性である場合に、当該カラムを結合カラム候補として抽出する
請求項3記載の結合テーブル特定システム。 - レコード間の類似度を算出する関数である類似度関数により算出される当該類似度が予め定めた閾値より大きい外部テーブルのレコードを検索可能な索引である結合索引を当該類似度関数ごとに記憶する記憶装置から、当該結合索引の入力を受け付ける入力手段と、
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成する検索プラン生成手段と、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定するレコード検索手段とを備え、
前記レコード検索手段は、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行う
ことを特徴とする結合テーブル探索装置。 - レコード間の類似度を算出する関数である類似度関数により算出される当該類似度が予め定めた閾値より大きい外部テーブルのレコードを検索可能な索引である結合索引を、当該類似度関数ごとに生成し、
生成された前記結合索引を結合索引記憶部に記憶させ、
前記結合索引記憶部から前記結合索引の入力を受け付け、
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、
算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成し、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定し、
前記レコードの検索において、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行う
ことを特徴とする結合テーブル特定方法。 - 外部テーブル群に含まれる各外部テーブルのうち、他のテーブルとの結合キーになり得るレコードを含むカラムである結合カラム候補を、当該各外部テーブルから抽出し、
抽出された前記結合カラム候補の結合索引を類似度関数ごとに生成し、生成された結合索引を結合索引記憶部に記憶させる
請求項6記載の結合テーブル特定方法。 - レコード間の類似度を算出する関数である類似度関数により算出される当該類似度が予め定めた閾値より大きい外部テーブルのレコードを検索可能な索引である結合索引を当該類似度関数ごとに記憶する記憶装置から、当該結合索引の入力を受け付け、
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、
算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成し、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定し、
前記レコードの検索において、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行う
ことを特徴とする結合テーブル探索方法。 - コンピュータに、
レコード間の類似度を算出する関数である類似度関数により算出される当該類似度が予め定めた閾値より大きい外部テーブルのレコードを検索可能な索引である結合索引を当該類似度関数ごとに記憶する記憶装置から、当該結合索引の入力を受け付ける入力処理、
前記類似度関数ごとの結合索引を用いて対象カラムのレコードを検索した場合に推定される結合可能なレコードペアの数である結果数を当該結合索引ごとに算出し、算出された前記結果数の多い順に前記結合索引の利用順を規定した検索プランを生成する検索プラン生成処理、および、
前記検索プランで規定された順に結合索引を用いて、前記対象カラムのレコードの検索を行い、予め定めた閾値以上のレコードが検索された前記外部テーブルを結合テーブルと特定するレコード検索処理を実行させ、
前記レコード検索処理で、すでに用いた結合索引により検索された前記外部テーブルのレコードを検索対象から除外して、後続の結合索引を用いた検索を行わせる
ための結合テーブル探索プログラムを記憶するプログラム記憶媒体。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022546785A JP7424501B2 (ja) | 2020-09-02 | 2020-09-02 | 結合テーブル特定システム、結合テーブル探索装置、方法およびプログラム |
US18/024,163 US20230394016A1 (en) | 2020-09-02 | 2020-09-02 | Coupling table specification system, coupling table search device, method, and program |
PCT/JP2020/033308 WO2022049680A1 (ja) | 2020-09-02 | 2020-09-02 | 結合テーブル特定システム、結合テーブル探索装置、方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/033308 WO2022049680A1 (ja) | 2020-09-02 | 2020-09-02 | 結合テーブル特定システム、結合テーブル探索装置、方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022049680A1 true WO2022049680A1 (ja) | 2022-03-10 |
Family
ID=80491870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2020/033308 WO2022049680A1 (ja) | 2020-09-02 | 2020-09-02 | 結合テーブル特定システム、結合テーブル探索装置、方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230394016A1 (ja) |
JP (1) | JP7424501B2 (ja) |
WO (1) | WO2022049680A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001155028A (ja) * | 1999-11-29 | 2001-06-08 | Hitachi Ltd | リレーショナルデータベースにおける集約演算処理方法、その装置及び集約演算処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2010176327A (ja) * | 2009-01-28 | 2010-08-12 | Sony Corp | 学習装置、学習方法、情報処理装置、データ選択方法、データ蓄積方法、データ変換方法、及びプログラム |
JP2017188137A (ja) * | 2016-03-31 | 2017-10-12 | スマートインサイト株式会社 | 異種データソース混在環境におけるフィールド間の関係性の自動的発見のための方法、プログラム、および、システム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7343367B2 (en) * | 2005-05-12 | 2008-03-11 | International Business Machines Corporation | Optimizing a database query that returns a predetermined number of rows using a generated optimized access plan |
US9342553B1 (en) * | 2012-05-13 | 2016-05-17 | Google Inc. | Identifying distinct combinations of values for entities based on information in an index |
WO2014174599A1 (ja) * | 2013-04-24 | 2014-10-30 | 株式会社日立製作所 | 計算機、記録媒体及びデータ検索方法 |
US10120851B2 (en) * | 2016-06-30 | 2018-11-06 | Microsoft Technology Licensing, Llc | Automatic semantic data enrichment in a spreadsheet |
CN111259004B (zh) * | 2020-01-08 | 2023-04-14 | 腾讯科技(深圳)有限公司 | 一种存储引擎中数据索引的方法以及相关装置 |
-
2020
- 2020-09-02 US US18/024,163 patent/US20230394016A1/en active Pending
- 2020-09-02 WO PCT/JP2020/033308 patent/WO2022049680A1/ja active Application Filing
- 2020-09-02 JP JP2022546785A patent/JP7424501B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001155028A (ja) * | 1999-11-29 | 2001-06-08 | Hitachi Ltd | リレーショナルデータベースにおける集約演算処理方法、その装置及び集約演算処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2010176327A (ja) * | 2009-01-28 | 2010-08-12 | Sony Corp | 学習装置、学習方法、情報処理装置、データ選択方法、データ蓄積方法、データ変換方法、及びプログラム |
JP2017188137A (ja) * | 2016-03-31 | 2017-10-12 | スマートインサイト株式会社 | 異種データソース混在環境におけるフィールド間の関係性の自動的発見のための方法、プログラム、および、システム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2022049680A1 (ja) | 2022-03-10 |
US20230394016A1 (en) | 2023-12-07 |
JP7424501B2 (ja) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106649455B (zh) | 一种大数据开发的标准化系统归类、命令集系统 | |
JP4011906B2 (ja) | プロファイル情報の情報検索方法、プログラム、記録媒体及び装置 | |
AU2014201516A1 (en) | Resolving similar entities from a transaction database | |
CN104769586A (zh) | 采用位置信息剖析数据 | |
RU2010125681A (ru) | Способы и системы для реализации приближенного сравнения строк в базе данных | |
JP2009031931A (ja) | 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体 | |
JP2007219929A (ja) | 感性評価システム及び方法 | |
Zhu et al. | Book recommendation service by improved association rule mining algorithm | |
Subramanian et al. | Ensemble variable selection for Naive Bayes to improve customer behaviour analysis | |
Satish et al. | Big data processing with harnessing hadoop-MapReduce for optimizing analytical workloads | |
KR102438923B1 (ko) | 시계열 분포 특징을 고려한 딥러닝 기반 비트코인 블록 데이터 예측 시스템 | |
Qinl et al. | Synthesizing privacy preserving entity resolution datasets | |
KR102358357B1 (ko) | 시장규모추정장치 및 그 동작 방법 | |
CN112784049A (zh) | 一种面向文本数据的在线社交平台多元知识获取方法 | |
WO2022049680A1 (ja) | 結合テーブル特定システム、結合テーブル探索装置、方法およびプログラム | |
WO2022049682A1 (ja) | テーブル統合システム、方法およびプログラム | |
WO2022049681A1 (ja) | 相関索引構築装置、相関テーブル探索装置、方法およびプログラム | |
Fageeri et al. | A semi-apriori algorithm for discovering the frequent itemsets | |
CN116610810A (zh) | 基于调控云知识图谱血缘关系的智能搜索方法及系统 | |
JP6145562B2 (ja) | 情報構造化システム及び情報構造化方法 | |
EP3477505B1 (en) | Fingerprint clustering for content-based audio recogntion | |
CN116186298A (zh) | 信息检索方法和装置 | |
US20180095968A1 (en) | Database search apparatus and method of searching databases | |
CA3231515A1 (en) | Records matching techniques for facilitating database search and fragmented record detection | |
CN113505117A (zh) | 基于数据指标的数据质量评估方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20952420 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2022546785 Country of ref document: JP Kind code of ref document: A |
|
WWE | Wipo information: entry into national phase |
Ref document number: 18024163 Country of ref document: US |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20952420 Country of ref document: EP Kind code of ref document: A1 |