JP2019527441A - 分散コンピューティングフレームワーク及び分散コンピューティング方法(distributed computing framework and distributed computing method) - Google Patents
分散コンピューティングフレームワーク及び分散コンピューティング方法(distributed computing framework and distributed computing method) Download PDFInfo
- Publication number
- JP2019527441A JP2019527441A JP2019505244A JP2019505244A JP2019527441A JP 2019527441 A JP2019527441 A JP 2019527441A JP 2019505244 A JP2019505244 A JP 2019505244A JP 2019505244 A JP2019505244 A JP 2019505244A JP 2019527441 A JP2019527441 A JP 2019527441A
- Authority
- JP
- Japan
- Prior art keywords
- field
- key
- operator
- data set
- distributed computing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24537—Query rewriting; Transformation of operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/465—Distributed object oriented systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5066—Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
Abstract
Description
analytics = p.parallelize([(‘alibaba.com, baidu.com, tencent.com’, 1), (‘baidu.com, tencent.com’, 2), (‘alibaba.com, tencent.com’, 3), (‘alibaba.com, baidu.com’, 2), (‘alibaba.com, jd.com’, 1)])\
.apply(schema.from_tuple, [‘websites’, ‘clicknum’])
.apply(schema.select, lambda cols: {
‘website’: cols[‘websites’].flat_map(lambda line: line.split(‘, ’)),
‘clicknum’: cols[‘clicknum’]
})
.apply(schema.group_by, [‘website’])\
.apply_values(schema.agg, lambda cols: {
‘max_click_num’: cols[‘clicknum’].max(),
‘sum_click_num’: cols[‘clicknum’].flat_map(lambda x: x[‘x’]),
‘avg_click_num’: cols[‘clicknum’].sum() / cols[‘clicknum’].count()
})
本実施例において、一行毎のコードは、1つの表現式に相当し、ユーザは、表現式の形式によって分散コンピューティングタスクのコードを作成することができる。分散コンピューティングフレームワークは、1つのapply糖衣構文(Syntactic sugar)を提供することができ、apply糖衣構文の意味は、次の通りである。
2番目の要素には、キー値ペアwebsites−baidu.com、tencent.com、及びキー値ペアclicknum−2を含む。
3番目の要素には、キー値ペアwebsites−alibaba.com、tencent.com、及びキー値ペアclicknum−3を含む。
4番目の要素には、キー値ペアwebsites−alibaba.com、baidu.com、及びキー値ペアclicknum−2を含む。
5番目の要素には、キー値ペアwebsites−alibaba.com、jd.com、及びキー値ペアclicknum−1を含む。
2番目の要素は、キー値ペアwebsite−baidu.com、キー値ペアwebsite−tencent.com、キー値ペアclicknum−2である。
3番目の要素は、キー値ペアwebsite−alibaba.com、キー値ペアwebsite−tencent.com、キー値ペアclicknum−3である。
4番目の要素は、キー値ペアwebsite−alibaba.com、キー値ペアwebsite−baidu.com、キー値ペアclicknum−2である。
5番目の要素は、キー値ペアwebsite−alibaba.com、キー値ペアwebsite−jd.com、キー値ペアclicknum−1である。
2番目の要素は、キー値ペアwebsite−baidu.com及びキー値ペアclicknum−1である。
3番目の要素は、キー値ペアwebsite−tencent.com及びキー値ペアclicknum−1である。
4番目の要素は、キー値ペアwebsite−baidu.com及びキー値ペアclicknum−2である。
5番目の要素は、キー値ペアwebsite−tencent.com、及びキー値ペアclicknum−2である。
6番目の要素は、キー値ペアwebsite−alibaba.com及びキー値ペアclicknum−3である。
7番目の要素は、キー値ペアwebsite−tencent.com及びキー値ペアclicknum−3である。
8番目の要素は、キー値ペアwebsite−alibaba.com、及びキー値ペアclicknum−2である。
9番目の要素は、キー値ペアwebsite−baidu.com及びキー値ペアclicknum−2である。
10番目の要素は、キー値ペアwebsite−alibaba.com及びキー値ペアclicknum−1である。
11番目の要素は、キー値ペアwebsite−jd.com及びキー値ペアclicknum−1である。
本実施例において、フィールドは、演算子により作用される分散データセットにおけるデータの属性を示す。分散コンピューティングタスクは、表現式で表現することができる。分散コンピューティングタスクに必要なデータがウェブサイトのクリックレートデータである場合を例として、ウェブサイトのクリックレートデータは、ウェブサイトデータとクリックレートデータとの両方を含む。演算子は、ウェブサイトデータ及びクリックレートデータに作用することができる。分散コンピューティングタスクの表現式は、演算子キーワード及びフィールドキーワードを含むことができる。解析ユニットは、分散コンピューティングタスクの表現式中の演算子キーワード及びフィールドキーワードを解析して、演算子、及び演算子に対応するフィールドであるウェブサイトフィールド、クリックレートフィールドを決定することができる。
本実施例において、演算子の入力パラメータは、フィールドとフィールド型分散データセットとを含み、フィールド型分散データセットは、少なくとも1つの要素を含み、要素は複数のキー値ペアを含み、キー値ペアのキーはフィールドであり、キー値ペアの値は分散データセット中にフィールドに対応するデータである。
2番目の要素には、キー値ペアwebsites−baidu.com、tencent.com、及びキー値ペアclicknum−2を含む。
3番目の要素には、キー値ペアwebsites−alibaba.com、tencent.com、及びキー値ペアclicknum−3を含む。
4番目の要素には、キー値ペアwebsites−alibaba.com、baidu.com、及びキー値ペアclicknum−2を含む。
5番目の要素には、キー値ペアwebsites−alibaba.com、jd.com、及びキー値ペアclicknum−1を含む。
本実施例において、ステップ202を介して演算子の入力パラメータを作成した後、演算子により入力パラメータSchemaPCollection及びフィールドに基づいて分散コンピューティングすることができる。
本実施例において、1つのapply糖衣構文を提供することができ、apply糖衣構文の意味は、次の通りである。
.apply(f、* args)は、f(pcollection、* args)に等価する。
2番目の要素は、キー値ペアwebsite−baidu.com、キー値ペアwebsite−tencent.com、キー値ペアclicknum−2である。
3番目の要素は、キー値ペアwebsite−alibaba.com、キー値ペアwebsite−tencent.com、キー値ペアclicknum−3である。
4番目の要素は、キー値ペアwebsite−alibaba.com、キー値ペアwebsite−baidu.com、キー値ペアclicknum−2である。
5番目の要素は、キー値ペアwebsite−alibaba.com、キー値ペアwebsite−jd.com、キー値ペアclicknum−1である。
2番目の要素は、キー値ペアwebsite−baidu.com及びキー値ペアclicknum−1である。
3番目の要素は、キー値ペアwebsite−tencent.com及びキー値ペアclicknum−1である。
4番目の要素は、キー値ペアwebsite−baidu.com及びキー値ペアclicknum−2である。
5番目の要素は、キー値ペアwebsite−tencent.com、及びキー値ペアclicknum−2である。
6番目の要素は、キー値ペアwebsite−alibaba.com及びキー値ペアclicknum−3である。
7番目の要素は、キー値ペアwebsite−tencent.com及びキー値ペアclicknum−3である。
8番目の要素は、キー値ペアwebsite−alibaba.com、及びキー値ペアclicknum−2である。
9番目の要素は、キー値ペアwebsite−baidu.com及びキー値ペアclicknum−2である。
10番目の要素は、キー値ペアwebsite−alibaba.com及びキー値ペアclicknum−1である。
11番目の要素は、キー値ペアwebsite−jd.com及びキー値ペアclicknum−1である。
2番目の要素は、キー値ペアwebsite−baidu.com及びキー値ペアclicknum−1である。
3番目の要素は、キー値ペアwebsite−tencent.com及びキー値ペアclicknum−1である。
4番目の要素は、キー値ペアwebsite−baidu.com及びキー値ペアclicknum−2である。
5番目の要素は、キー値ペアwebsite−tencent.com、及びキー値ペアclicknum−2である。
6番目の要素は、キー値ペアwebsite−alibaba.com及びキー値ペアclicknum−3である。
7番目の要素は、キー値ペアwebsite−tencent.com及びキー値ペアclicknum−3である。
8番目の要素は、キー値ペアwebsite−alibaba.com、及びキー値ペアclicknum−2である。
9番目の要素は、キー値ペアwebsite−baidu.com及びキー値ペアclicknum−2である。
10番目の要素は、キー値ペアwebsite−alibaba.com及びキー値ペアclicknum−1である。
11番目の要素は、キー値ペアwebsite−jd.com及びキー値ペアclicknum−1である。
{ ‘sum_click_num’:6、‘website’: ‘tencent.com’、 ‘avg_click_num’:2、‘max_click_num’:3}、
{ ‘sum_click_num’:5、‘website’: ‘baidu.com’、 ‘avg_click_num’:1、‘ max_click_num ’:2}、
{ ‘sum_click_num’:1、‘ website ’:‘ jd.com ’、‘ avg_click_num’:1、 ‘max_click_num’:1}]。
Claims (14)
- 分散コンピューティングフレームワークであって、
分散コンピューティングタスクの表現式を解析して、演算子と、前記演算子に対応するフィールドとを決定するための解析ユニットであって、前記フィールドは、演算子により作用される分散データセットにおけるデータの属性を示すためのものである、解析ユニットと、
演算子を提供するための演算子ユニットであって、前記演算子の入力パラメータは、フィールドとフィールド型分散データセットとを含み、前記フィールド型分散データセットは、少なくとも1つの要素を含み、前記要素は、複数のキー値ペアを含み、前記キー値ペアのキーはフィールドであり、前記キー値ペアの値は分散データセット中に前記フィールドに対応するデータである、演算子ユニットと、を含むことを特徴とする分散コンピューティングフレームワーク。 - 請求項1に記載の分散コンピューティングフレームワークであって、
前記演算子ユニットは、
フィールドに基づいて、分散コンピューティングタスクに必要なデータに対応する分散データセットを、フィールド型分散データセットに変換するためのフィールド型分散データセット生成演算子であって、前記フィールド型分散データセットにおける要素は複数のキー値ペアを含み、各キー値ペアのキーは1つのフィールドであり、各キー値ペアの値は分散データセット中に前記フィールドに対応するデータである、フィールド型分散データセット生成演算子を含むことを特徴とする分散コンピューティングフレームワーク。 - 請求項2に記載の分散コンピューティングフレームワークであって、
前記演算子ユニットは、
フィールド型分散データセット中の各要素のうち、異なるキーを持つキー値ペアを組み合わせて、各要素にキーの異なるキー値ペアを含んでいるフィールド型分散データセットを取得するための連結演算子を含むことを特徴とする分散コンピューティングフレームワーク。 - 請求項3に記載の分散コンピューティングフレームワークであって、
前記演算子ユニットは、
フィールド型分散データセットにおける要素中のグループ化フィールドの示すキーに対応する値に基づいて、フィールド型分散データセットにおける要素をグループ化して、複数のグループ化されたフィールド型分散データセットを取得するためのグループ化演算子であって、
各グループ化フィールドの示すキーに対応する値は、1つのグループ化されたフィールド型分散データセットに対応し、グループ化されたフィールド型分散データセットは、グループ化フィールドの示すキーに対応する値を含む少なくとも1つの要素を含む、グループ化演算子を含むことを特徴とする分散コンピューティングフレームワーク。 - 請求項4に記載の分散コンピューティングフレームワークであって、
前記演算子ユニットは、
トラバーサルフィールドに基づいて、フィールド型分散データセットにおける全ての要素の中にトラバーサルフィールドの示すキーに対応する値に対して操作するためのトラバーサル演算子を含むことを特徴とする分散コンピューティングフレームワーク。 - 請求項5に記載の分散コンピューティングフレームワークであって、
前記演算子ユニットは、
フィールド型分散データセットにおける全ての要素の中にトラバーサルフィールドの示すキーに対応する値に対して操作して得られた結果を集約するための集約演算子を含むことを特徴とする分散コンピューティングフレームワーク。 - 分散コンピューティング方法であって、
分散コンピューティングタスクの表現式を解析して、演算子と、前記演算子に対応するフィールドとを決定するステップであって、前記フィールドは、演算子により作用される分散データセットにおけるデータの属性を示すためのものである、ステップと、
前記演算子の入力パラメータを生成するステップであって、前記演算子の入力パラメータは、フィールドとフィールド型分散データセットとを含み、前記フィールド型分散データセットは、少なくとも1つの要素を含み、前記要素は、複数のキー値ペアを含み、キー値ペアのキーはフィールドであり、キー値ペアの値は分散データセット中に前記フィールドに対応するデータである、ステップと、
前記演算子により前記入力パラメータに基づいて分散コンピューティングするステップとを含むことを特徴とする分散コンピューティング方法。 - 請求項7に記載の分散コンピューティング方法であって、
フィールドに基づいて、分散コンピューティングタスクに必要なデータに対応する分散データセットを、フィールド型分散データセットに変換するステップであって、前記フィールド型分散データセットにおける要素は複数のキー値ペアを含み、各キー値ペアのキーは1つのフィールドであり、各キー値ペアの値は分散データセット中に前記フィールドに対応するデータである、ステップをさらに含むことを特徴とする分散コンピューティング方法。 - 請求項8に記載の分散コンピューティング方法であって、
フィールド型分散データセット中の各要素のうち、異なるキーを持つキー値ペアを組み合わせて、各要素にキーの異なるキー値ペアを含んでいるフィールド型分散データセットを取得するステップをさらに含むことを特徴とする分散コンピューティング方法。 - 請求項9に記載の分散コンピューティング方法であって、
フィールド型分散データセットにおける要素中のグループ化フィールドの示すキーに対応する値に基づいて、フィールド型分散データセットにおける要素をグループ化して、複数のグループ化されたフィールド型分散データセットを取得するステップであって、各グループ化フィールドの示すキーに対応する値は、1つのグループ化されたフィールド型分散データセットに対応し、グループ化されたフィールド型分散データセットは、グループ化フィールドの示すキーに対応する値を含む少なくとも1つの要素を含む、ステップをさらに含むことを特徴とする分散コンピューティング方法。 - 請求項10に記載の分散コンピューティング方法であって、
トラバーサルフィールドに基づいて、フィールド型分散データセットにおける全ての要素の中にトラバーサルフィールドの示すキーに対応する値に対して操作するステップをさらに含むことを特徴とする分散コンピューティング方法。 - 請求項11に記載の分散コンピューティング方法であって、
フィールド型分散データセットにおける全ての要素の中にトラバーサルフィールドの示すキーに対応する値に対して操作して得られた結果を集約するステップをさらに含むことを特徴とする分散コンピューティング方法。 - プロセッサと、メモリを備える機器であって、
前記プロセッサによって実行可能なコンピュータ可読命令が前記メモリに記憶され、前記コンピュータ可読命令が実行される場合、前記プロセッサは分散コンピューティング方法を実行し、前記方法は、
分散コンピューティングタスクの表現式を解析して、演算子と、前記演算子に対応するフィールドとを決定するステップであって、前記フィールドは、演算子により作用される分散データセットにおけるデータの属性を示すためのものである、ステップと、
前記演算子の入力パラメータを生成するステップであって、前記演算子の入力パラメータは、フィールドとフィールド型分散データセットとを含み、前記フィールド型分散データセットは、少なくとも1つの要素を含み、前記要素は、複数のキー値ペアを含み、キー値ペアのキーはフィールドであり、キー値ペアの値は分散データセット中に前記フィールドに対応するデータである、ステップと、
前記演算子により前記入力パラメータに基づいて分散コンピューティングするステップとを含む、機器。 - プロセッサによって実行可能なコンピュータ可読命令が記憶されている不揮発性コンピュータ記憶媒体であって、
前記コンピュータ可読命令が前記プロセッサによって実行される場合、前記プロセッサは分散コンピューティング方法を実行し、前記方法は、
分散コンピューティングタスクの表現式を解析して、演算子と、前記演算子に対応するフィールドとを決定するステップであって、前記フィールドは、演算子により作用される分散データセットにおけるデータの属性を示すためのものである、ステップと、
前記演算子の入力パラメータを生成するステップであって、前記演算子の入力パラメータは、フィールドとフィールド型分散データセットとを含み、前記フィールド型分散データセットは、少なくとも1つの要素を含み、前記要素は、複数のキー値ペアを含み、キー値ペアのキーはフィールドであり、キー値ペアの値は分散データセット中に前記フィールドに対応するデータである、ステップと、
前記演算子により前記入力パラメータに基づいて分散コンピューティングするステップとを含む、不揮発性コンピュータ記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610836654.7A CN106406985B (zh) | 2016-09-21 | 2016-09-21 | 分布式计算框架和分布式计算方法 |
CN201610836654.7 | 2016-09-21 | ||
PCT/CN2016/102122 WO2018053889A1 (zh) | 2016-09-21 | 2016-10-14 | 分布式计算框架和分布式计算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019527441A true JP2019527441A (ja) | 2019-09-26 |
JP6781820B2 JP6781820B2 (ja) | 2020-11-04 |
Family
ID=57997066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019505244A Active JP6781820B2 (ja) | 2016-09-21 | 2016-10-14 | 分散コンピューティングフレームワーク及び分散コンピューティング方法(distributed computing framework and distributed computing method) |
Country Status (6)
Country | Link |
---|---|
US (1) | US11132363B2 (ja) |
EP (1) | EP3480693A4 (ja) |
JP (1) | JP6781820B2 (ja) |
KR (1) | KR102172138B1 (ja) |
CN (1) | CN106406985B (ja) |
WO (1) | WO2018053889A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106445645B (zh) | 2016-09-06 | 2019-11-26 | 北京百度网讯科技有限公司 | 用于执行分布式计算任务的方法和装置 |
CN109726822B (zh) * | 2018-12-14 | 2020-10-09 | 中科寒武纪科技股份有限公司 | 运算方法、装置及相关产品 |
CN112783924A (zh) * | 2019-11-07 | 2021-05-11 | 北京沃东天骏信息技术有限公司 | 一种脏数据识别方法、装置和系统 |
CN115906983B (zh) * | 2022-11-23 | 2024-01-02 | 北京百度网讯科技有限公司 | 分布式模型训练方法、装置、设备、存储介质及程序产品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799622A (zh) * | 2012-06-19 | 2012-11-28 | 北京大学 | 基于MapReduce扩展框架的分布式SQL查询方法 |
US20140172898A1 (en) * | 2012-12-13 | 2014-06-19 | Microsoft Corporation | Distributed sql query processing using key-value storage system |
JP2014194769A (ja) * | 2013-03-13 | 2014-10-09 | Cloudera Inc | Apachehadoop用の低レイテンシクエリエンジン |
JP2015072688A (ja) * | 2013-10-01 | 2015-04-16 | クラウデラ インコーポレイテッド | Hadoopにおける強化されたSQLライクなクエリのためのバックグラウンドフォーマット最適化 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7418715B2 (en) * | 2005-04-08 | 2008-08-26 | Microsoft Corporation | System and method for producing and communicating requested data among networked application programs |
CN102915229B (zh) * | 2011-08-02 | 2016-05-04 | 深圳市世纪光速信息技术有限公司 | 一种分布式计算方法及系统 |
EP2786276A1 (en) * | 2011-11-30 | 2014-10-08 | DeCarta Inc. | Systems and methods for performing geo-search and retrieval of electronic point-of-interest records using a big index |
CN103502940B (zh) * | 2011-12-21 | 2017-12-12 | 华为技术有限公司 | 一种分布式系统中处理事务的方法、相关设备及系统 |
US9910894B2 (en) * | 2012-07-16 | 2018-03-06 | Microsoft Technology Licensing, Llc | Data scope origination within aggregation operations |
CN103593721B (zh) * | 2012-08-13 | 2016-10-05 | 中国商用飞机有限责任公司 | 基于复杂事件处理的业务流程监控方法 |
US9229979B2 (en) | 2012-12-11 | 2016-01-05 | Microsoft Technology Licensing, Llc | Optimizing parallel queries using interesting distributions |
CN103902592B (zh) * | 2012-12-27 | 2018-02-27 | 深圳市腾讯计算机系统有限公司 | 基于MapReduce实现分析函数的方法及系统 |
CN103399887A (zh) * | 2013-07-19 | 2013-11-20 | 蓝盾信息安全技术股份有限公司 | 一种海量日志的查询与统计分析系统 |
CN103399927B (zh) * | 2013-08-05 | 2016-11-02 | 百度在线网络技术(北京)有限公司 | 分布式计算方法和装置 |
CN103425779A (zh) * | 2013-08-19 | 2013-12-04 | 曙光信息产业股份有限公司 | 数据的处理方法和装置 |
CN104239532A (zh) * | 2014-09-19 | 2014-12-24 | 浪潮(北京)电子信息产业有限公司 | Hive中自制用户提取信息工具的方法和装置 |
CN105786808B (zh) * | 2014-12-15 | 2019-06-18 | 阿里巴巴集团控股有限公司 | 一种用于分布式执行关系型计算指令的方法与设备 |
US20160371355A1 (en) * | 2015-06-19 | 2016-12-22 | Nuodb, Inc. | Techniques for resource description framework modeling within distributed database systems |
US10108547B2 (en) * | 2016-01-06 | 2018-10-23 | Netapp, Inc. | High performance and memory efficient metadata caching |
-
2016
- 2016-09-21 CN CN201610836654.7A patent/CN106406985B/zh active Active
- 2016-10-14 WO PCT/CN2016/102122 patent/WO2018053889A1/zh unknown
- 2016-10-14 JP JP2019505244A patent/JP6781820B2/ja active Active
- 2016-10-14 KR KR1020197002252A patent/KR102172138B1/ko active IP Right Grant
- 2016-10-14 EP EP16916628.7A patent/EP3480693A4/en not_active Ceased
-
2019
- 2019-03-13 US US16/352,576 patent/US11132363B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799622A (zh) * | 2012-06-19 | 2012-11-28 | 北京大学 | 基于MapReduce扩展框架的分布式SQL查询方法 |
US20140172898A1 (en) * | 2012-12-13 | 2014-06-19 | Microsoft Corporation | Distributed sql query processing using key-value storage system |
JP2014194769A (ja) * | 2013-03-13 | 2014-10-09 | Cloudera Inc | Apachehadoop用の低レイテンシクエリエンジン |
JP2015072688A (ja) * | 2013-10-01 | 2015-04-16 | クラウデラ インコーポレイテッド | Hadoopにおける強化されたSQLライクなクエリのためのバックグラウンドフォーマット最適化 |
Also Published As
Publication number | Publication date |
---|---|
WO2018053889A1 (zh) | 2018-03-29 |
JP6781820B2 (ja) | 2020-11-04 |
KR102172138B1 (ko) | 2020-10-30 |
EP3480693A4 (en) | 2019-07-10 |
US11132363B2 (en) | 2021-09-28 |
CN106406985A (zh) | 2017-02-15 |
EP3480693A1 (en) | 2019-05-08 |
CN106406985B (zh) | 2019-10-11 |
US20190213188A1 (en) | 2019-07-11 |
KR20190020801A (ko) | 2019-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8898145B2 (en) | Query optimization techniques for business intelligence systems | |
US7711704B2 (en) | System and method of providing date, arithmetic and other relational functions for OLAP sources | |
JP2021527878A (ja) | 正規表現コード上で最長共通サブシーケンスアルゴリズムを用いた正規表現生成 | |
US20150227839A1 (en) | Systems and methods for semantic inference and reasoning | |
US20110218978A1 (en) | Operating on time sequences of data | |
US11132363B2 (en) | Distributed computing framework and distributed computing method | |
US20150331918A1 (en) | Business Intelligence Document | |
US8417690B2 (en) | Automatically avoiding unconstrained cartesian product joins | |
US20060294069A1 (en) | Sorting and filtering in an interactive report | |
CN112765282B (zh) | 一种数据联机分析处理方法、装置、设备及存储介质 | |
US11379499B2 (en) | Method and apparatus for executing distributed computing task | |
US9910894B2 (en) | Data scope origination within aggregation operations | |
CN111198898A (zh) | 大数据查询方法及大数据查询装置 | |
WO2023097521A1 (zh) | 数据模型生成的方法和装置 | |
US20140379691A1 (en) | Database query processing with reduce function configuration | |
US10990612B2 (en) | Metric-centric transformations of multidimensional database data | |
WO2023185377A1 (zh) | 一种多粒度数据模式挖掘方法及相关设备 | |
CN114090627B (zh) | 一种数据查询方法及装置 | |
CN114237712B (zh) | 指令执行方法、装置、电子设备及计算机存储介质 | |
Liu et al. | PolySem: Efficient Polyglot Analytics on Semantic Data | |
CN116028519A (zh) | 一种数据筛选方法、装置、电子设备及可读存储介质 | |
CN114996276A (zh) | Olap预计算模型建模方法、数据查询方法、装置及存储介质 | |
KR20200048301A (ko) | 테이블 처리 방법 및 장치 | |
Trakhtenbrot | Equivalent transformations for invariant parallel functions | |
CA2545108A1 (en) | System and method of providing date, arithmetic and other relational functions for olap sources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190131 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190131 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201001 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201016 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6781820 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |