JP2013140510A - データ処理方法、分散処理システムおよびプログラム - Google Patents
データ処理方法、分散処理システムおよびプログラム Download PDFInfo
- Publication number
- JP2013140510A JP2013140510A JP2012000598A JP2012000598A JP2013140510A JP 2013140510 A JP2013140510 A JP 2013140510A JP 2012000598 A JP2012000598 A JP 2012000598A JP 2012000598 A JP2012000598 A JP 2012000598A JP 2013140510 A JP2013140510 A JP 2013140510A
- Authority
- JP
- Japan
- Prior art keywords
- input data
- result
- processing
- data
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24539—Query rewriting; Transformation using cached or materialised query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】記憶装置1は、過去に処理した入力データの集合D2,D3に対応する第2の処理の結果R2,R3を記憶する。検索手段2aは、入力データの集合D1が指定されると、記憶装置1から入力データの集合D1と重複する入力データの集合D2に対応する第2の処理の結果R2を検索する。データ処理手段3aは、入力データの集合D2に含まれ入力データの集合D1に含まれない差分の入力データD2aに対応する第1の処理の結果R2aを取得し、当該第1の処理の結果R2aを用いて、検索した第2の処理の結果R2から差分の入力データD2aの影響を除去することで、入力データの集合D1に対応する第2の処理の結果R1を生成する。
【選択図】図1
Description
一側面では、本発明は、過去の処理結果の再利用可能性を高めたデータ処理方法、分散処理システムおよびプログラムを提供することを目的とする。
[第1の実施の形態]
図1は、第1の実施の形態の分散処理システムを示す図である。第1の実施の形態の分散処理システムは、入力データに対して複数のノードを用いて行われた第1の処理の結果に対して第2の処理を行うシステムである。第1の実施の形態の分散処理システムは、記憶装置1、情報処理装置2,3およびノード4,4aを含む。記憶装置1、情報処理装置2,3およびノード4,4aは、ネットワークで接続されている。ノード4,4aは、データ処理を行うノードである。
情報処理装置2は、検索手段2aを有する。検索手段2aは、第1の入力データの集合D1が指定されると、記憶装置1から第1の入力データの集合D1と重複する第2の入力データD2の集合に対応する第2の処理の結果R2を検索する。
なお、検索手段2aとデータ処理手段3aとを同一の情報処理装置上に設けてもよい。また、データ処理手段3aの処理をノード4,4aが実行してもよい。
図2は、第2の実施の形態の分散処理システムを示す図である。第2の実施の形態の分散処理システムは、入力されたログデータに含まれる文字列(文字を含む)をカウントする処理(以下、ワードカウントと呼ぶことがある)を複数のノードに分散処理させる。第2の実施の形態の分散処理システムでは、分散処理にMapReduceを用いるものとする。MapReduceを利用するためのフレームワークとして、例えば、Hadoopが知られている。
結果情報管理サーバ600は、結果情報を管理するサーバコンピュータである。結果情報は、結果登録サーバ400によって登録されたReduce処理の結果である。
入力情報管理サーバ500は、入力情報記憶部510を有する。入力情報記憶部510は、入力情報を記憶する。
データ処理サーバ700は、データ処理部710を有する。データ処理部710は、実行制御部110によりMap処理が割り当てられると、入力データの一部を取得してMap処理を実行する。また、データ処理部710は、実行制御部110によりReduce処理が割り当てられるとMap処理の結果に対してReduce処理を実行し、Reduce処理の結果を実行制御サーバ100に応答する。
ステップS1は、Map処理である。Map処理では、各データ処理部が、自身が担当する入力データの一部に対して、キー(key)とバリュー(value)とのペア(以下、キー・バリュー・ペアと呼ぶことがある)を生成する。具体的には、キーは商品を示す文字列の情報である。バリューは、当該入力データの一部に含まれる当該文字列の数である。
このようにして、過去の結果を利用しない場合は、入力データの全範囲に対してMapReduceを実行する。
図8は、第2の実施の形態のReduce結果テーブルの例を示す図である。Reduce結果テーブル611は、結果情報記憶部610に記憶される。Reduce結果テーブル611は、入力データ識別子およびReduce結果の項目を含む。
図9は、第2の実施の形態の分散処理の例を示すシーケンス図である。以下、図9に示す処理をステップ番号に沿って説明する。
(ステップST5)実行制御サーバ100は、MapReduceを用いたワードカウントの処理の組立依頼を処理組立サーバ300に送信する。組立依頼は、分析結果の情報を含む。処理組立サーバ300は、組立依頼を受信する。
(ステップST7)処理組立サーバ300は、実行制御サーバ100に組立結果を応答する。実行制御サーバ100は、組立結果を受信する。
このように、第2の実施の形態の分散処理システムでは、MapReduceを実行する前に、処理組立サーバ300が処理の組立を行う。処理の組立は、分析サーバ200の分析結果に応じた方法で行われる。次に、ステップST3の分析処理の手順を説明する。
(ステップS11)分析部210は、入力情報記憶部510を参照して、処理対象の期間として指定された期間のログデータ(今回の入力データ)を取得する。分析部210は、今回の入力データの入力データ識別子を取得する。分析部210は、指定された期間の最も早い日付と最も遅い日付とをハイフン“−”で結合し、更にその最後にハイフン“−”と“Reduce”の文字列を結合することで、当該入力データ識別子を得る。
(ステップS21)処理組立部310は、前回だけに出現する入力データP1を入力としたMap処理を作成する。
(ステップS24)処理組立部310は、ステップS22の逆Reduce処理の結果およびステップS23のMap処理の結果を入力としたReduce処理を作成する。
(ステップS31)データ処理部710,710a,・・・は、前回だけに出現する入力データP1に対するMap処理を実行し、前回だけに出現する入力データP1に対応するMap結果P1aを生成する。データ処理部710,710a,・・・には、各自がMap処理の対象とする入力データの範囲が実行制御部110により与えられる。本例では、入力データを日付単位で区切って1つのMap処理の処理単位とする。ここでは、前回だけに出現する入力データP1は、1日のログデータ511aである。したがって、この場合、当該ステップS31のMap処理を割り当てられるのは例えば1つのデータ処理部である。ただし、当該1日のログデータ511aを時間単位などに更に分割して複数のデータ処理部にMap処理を割り当ててもよい。そうすれば、当該Map処理を高速に行える。Map結果P1aは、1日のログデータ511aに対する1日のMap結果512aとなる。
ここで、ステップS32では、Map結果P1aのみを処理対象とする。例えば、Map結果P1a,P3aの区別は、Map結果を何れのデータ処理サーバから取得したかにより行える。前回だけに出現する入力データP1に対するMap処理を割り当てたデータ処理サーバから取得したMap結果はMap結果P1aである。今回だけに出現する入力データP3に対するMap処理を割り当てたデータ処理サーバから取得したMap結果はMap結果P3aである。あるいは、データ処理サーバ側で、逆Reduce処理対象となるMap結果P1aのキー・バリュー・ペアのバリューに、所定のフラグを付加してもよい。
(2)「前回の処理結果」を検索でき、重複する入力データP2および今回だけに出現する入力データP3のみが得られる場合(前回だけに出現する入力データP1は得られない)。例えば、前回の入力データが5月1日〜5月5日のログデータであるのに対して、今回の入力データが5月1日〜5月6日のログデータである場合である。
分析結果が(2)の場合は、今回だけに出現する入力データP3に関してMap処理を実行し(ステップS31aに相当)、当該Map結果にshuffle&sort処理を実行して前回の処理結果に加えればよい(ステップS33に相当)。すなわち、ステップS31,S32を実行せず、前回のReduce結果530およびMap結果P3aをステップS33の入力とする。
図14は、第2の実施の形態のワードカウントのコード例を示す図である。図14(A)は、Reduce処理のコード例を示している。図14(B)は、逆Reduce処理のコード例を示している。なお、各コード例は、プログラム言語としてJava(登録商標)を想定している。
以上で説明したように、第2の実施の形態の分散処理システムでは、今回の入力データD10に対するワードカウントを行う際に、今回の入力データD10と重複する前回の入力データD20に対応する前回の処理結果を検索する。そして、前回の入力データだけに出現する入力データP1に対するMap処理を実行し、当該Map処理の結果にshuffle&sort処理を実行する。そして、当該shuffle&sort処理の結果を用いて前回の処理結果から、前回の入力データだけに出現する入力データP1の影響を除去する。これにより、今回の入力データD10と前回の入力データD20とにずれがあっても、前回の処理結果を利用することができる。このため、過去の処理結果の利用可能性を向上できる。
以下、第3の実施の形態を説明する。前述の第2の実施の形態との相違点を主に説明し、共通する点の説明を省略する。
図18は、第3の実施の形態の第1のMapの入出力例である。データD11は、ステップS1a(第1のMap処理)の入力データである。データD11は、評価値テーブル513から管理者が指定した期間の情報をCSV形式で抽出したものである。データD11には、ユーザ名、商品ID、評価日付および評価値の順で情報が記述されている。
図20は、第3の実施の形態の第1のReduceの入出力例である。データD13は、ステップS2aの出力データであり、ステップS3a(第1のReduce処理)の入力データである。
図21は、第3の実施の形態の第2のMapの入出力例である。データD21は、ステップS3aの出力データ(データD14と同一)であり、ステップS4(第2のMap処理)の入力データである。データD22は、ステップS4の出力データである。
図23は、第3の実施の形態の第2のReduceの入出力例である。データD23は、ステップS5の出力データであり、ステップS6(第2のReduce処理)の入力データである。データD24は、ステップS6の出力データであり、データD23に基づいて生成されるデータである。
データD25は、ユーザ間の類似度を用いて(2)式により算出された各ユーザの各商品に対する予測評価値の一覧であり、お勧め商品を抽出するためのリコメンド情報である。例えば、ユーザ“Taro”に対するお勧め商品を3つ抽出したい場合には、データD25からRate(Taro,Item)のうち、大きい方から3つ選択して、該当する商品を特定すればよい。
(ステップS41)データ処理部710,710a,・・・は、前回だけに出現する入力データP1に対するMap処理を実行し、Map結果P1aを生成する。本例では、入力データを日付単位で区切って1つのMap処理の処理単位とする。ここでは、前回だけに出現する入力データP1は、1日の評価値データである。したがって、この場合、当該ステップS41のMap処理を割り当てられるのは例えば1つのデータ処理部である。ただし、当該1日の評価値データを更に分割して複数のデータ処理部にMap処理を割り当ててもよい。そうすれば、当該Map処理を高速に行える。
(ステップS41a)データ処理部710,710a,・・・は、今回だけに出現する入力データP3に対するMap処理を実行し、Map結果P3aを生成する。ここでは、今回だけに出現する入力データP3は、6日の評価値データである。したがって、この場合、ステップS41のMap処理と同様に、何れか1つのデータ処理部でMap処理を実行してもよいし、6日の評価値データを更に分割して複数のデータ処理部でMap処理を実行してもよい。なお、ステップS41,S41aは並列に実行可能である。例えば、ステップS41で用いたデータ処理サーバ以外のデータ処理サーバを用いて当該ステップS41aを実行することで、ステップS41,S41aを並列実行する。
なお、ステップS41,S41aを並列に実行するものとしたが、ステップS41aをステップS42と並列に実行してもよい。また、ステップS41,S41aを直列に実行してもよい。直列に実行する場合、ステップS41,S41aの実行順序は任意に決定できる。すなわち、ステップS41を先に実行してもよいし、ステップS41aを先に実行してもよい。
図29は、第3の実施の形態のReduceのコード例を示す図である。第3の実施の形態のReduceのコードには、CollaborativeFiltering_phase1_Reduceクラスに、reduceメソッドが定義されている。当該reduceメソッドは、逆Reduce結果616にMap結果P3aに含まれるキー・バリュー・ペアのバリューに設定されたユーザ名および日付を設定する操作である。例えば、図27のステップS43の例でいえば、逆Reduce結果616のキー・バリュー・ペア<Item1,(Jiro−3/2−4,・・・)>に対して、Map結果P3aのキー・バリュー・ペア<Item1,Taro−3/6−5>に含まれる“Taro−3/6−5”を追加する。なお、逆Reduce結果616のキー・バリュー・ペアに、同じユーザ名で日付の古いものがある場合は、削除する。
なお、以上の説明では、第1フェーズにおいて逆Reduceを行う例を示したが、第2フェーズに含まれる集計処理でも逆Reduceを利用してもよい。
以下、第4の実施の形態を説明する。前述の第2,第3の実施の形態との相違点を主に説明し、共通する点の説明を省略する。
(ステップS51)実行制御部110は、クライアント30から処理依頼を受信する。
なお、ステップS52の判定では、所定割合の入力データを用いてMapReduceを試行して、処理時間を計測して、逆Reduceの適用による高速化の可否を求めてもよい。具体的には、前回だけに出現する入力データP1、重複する入力データP2および今回だけに出現する入力データP3から同じ割合ずつレコードを抽出する。そして、逆Reduceを用いる場合と、逆Reduceを用いない場合とで、MapReduceの処理時間(計算量に相当)を比較する。
T1=Max(前回分Map処理時間+前回分逆Reduce処理時間,今回分Map処理時間)+今回分Reduce処理時間
ここで、Max演算子は、括弧内の要素のうち、最大のものを選択することを表す。前回分Map処理時間は、前回だけに出現する入力データP1に対するMap処理の所要時間である。前回分逆Reduce処理時間は、前回分Map処理の結果に対する逆Reduce処理の所要時間である。今回分Map処理時間は、今回だけに出現する入力データP3に対するMap処理の所要時間である。今回分Reduce処理時間は、今回分Map処理の結果に対するReduce処理の所要時間である。なお、逆ReduceやReduceの処理時間が非常に小さいと考えて、これらの処理時間を無視してもよい。その場合、逆Reduceを用いる場合の全体の処理時間T1aをT1a=(前回分Map処理時間,今回分Map処理時間)と表すこともできる。
T2=Max(重複分Map処理時間,今回分Map処理時間)+Max(重複分Reduce処理時間,今回分Reduce処理時間)
ここで、重複分Map処理時間は重複する入力データP2に対するMap処理の所要時間である。重複分Reduce処理時間は、重複分Map処理の結果に対するReduce処理の所要時間である。
なお、データ処理サーバ700,700a,・・・の機能はコンピュータに所定のプログラムを実行させることで実現できる。当該プログラムは、コンピュータ読み取り可能な可搬型の記録媒体に記録しておくことができる。当該記録媒体には、記録媒体13と同様に種々の媒体を用いることができる。当該プログラムを流通させるには、例えば、そのプログラムが記録された記録媒体を配布する。または、そのプログラムをサーバコンピュータに格納しておき、ネットワーク経由でデータ処理サーバ700,700a,・・・に転送する。データ処理サーバ700,700a,・・・は、例えば、記録媒体に記録されたプログラムまたはネットワークから取得したプログラムを、自装置の不揮発性の記憶媒体に格納する。そして、当該不揮発性の記憶媒体からプログラムを読み取り実行する。ただし、データ処理サーバ700,700a,・・・は、取得したプログラムを、不揮発性の記憶媒体に格納せずに逐次、RAMに展開して実行することも可能である。
2,3 情報処理装置
2a 検索手段
3a データ処理手段
4,4a ノード
D1 第1の入力データの集合
D2 第2の入力データの集合
Claims (7)
- 複数のノードを用いて入力データに対して第1の処理を行い、第1の処理の結果に対して第2の処理を行うシステムで実行されるデータ処理方法であって、
第1の入力データの集合が指定されると、過去に処理した入力データの集合に対応する第2の処理の結果を記憶する記憶装置から、前記第1の入力データの集合と重複する第2の入力データの集合に対応する第2の処理の結果を検索し、
前記第2の入力データの集合に含まれ前記第1の入力データの集合に含まれない差分の入力データに対応する第1の処理の結果を取得し、
前記差分の入力データに対応する第1の処理の結果を用いて、前記第2の入力データの集合に対応する第2の処理の結果から前記差分の入力データの影響を除去することで、前記第1の入力データの集合に対応する第2の処理の結果を生成する、
データ処理方法。 - 複数のノードを用いて入力データに対して第1の処理を行い、第1の処理の結果に対して第2の処理を行うシステムで実行されるデータ処理方法であって、
第1の入力データの集合が指定されると、過去に処理した入力データの集合に対応する第2の処理の結果を記憶する記憶装置から、前記第1の入力データの集合と重複する第2の入力データの集合に対応する第2の処理の結果を検索し、
前記第1の入力データの集合に含まれ前記第2の入力データの集合に含まれない差分の入力データに対応する第1の処理の結果を取得し、
前記第2の入力データの集合に対応する第2の処理の結果に、前記差分の入力データに対応する第1の処理の結果を合成することで、前記第1の入力データの集合に対応する第2の処理の結果を生成する、
データ処理方法。 - 第1の入力データの集合と重複する過去に処理した入力データの集合が複数あるとき、複数の入力データの集合に対応する複数の第2の処理の結果の中から、前記第1の入力データの集合との重複範囲が大きい入力データの集合に対応する第2の処理の結果を選択する、請求項1または2記載のデータ処理方法。
- 前記差分の入力データに対応する第1の処理の結果を前記第2の入力データの集合に対応する第2の処理の結果に適用することで前記第1の入力データの集合に対応する第2の処理の結果を生成する第1の生成方法の計算量と、前記第1の入力データの集合の全体に対して前記第1の処理および前記第2の処理を行う第2の生成方法の計算量と、を予測し、
前記第1の生成方法の計算量が前記第2の生成方法の計算量よりも小さいときに、前記第1の生成方法に従って前記第1の入力データの集合に対応する第2の処理の結果を生成する、
請求項1乃至3の何れか一項に記載のデータ処理方法。 - 前記差分の入力データの影響を除去する処理は、前記第2の入力データの集合に対応する第2の処理の結果の値から前記差分の入力データに対応する第1の処理の結果の値を減算する処理、または、前記第2の入力データの集合に対応する第2の処理の結果に含まれる複数のデータ要素から前記差分の入力データに対応する第1の処理の結果に含まれるデータ要素を削除する処理、である請求項1乃至4の何れか一項に記載のデータ処理方法。
- 複数のノードを用いて入力データに対して第1の処理を行い、第1の処理の結果に対して第2の処理を行う分散処理システムであって、
過去に処理した入力データの集合に対応する第2の処理の結果を記憶する記憶装置と、
第1の入力データの集合が指定されると、前記記憶装置から前記第1の入力データの集合と重複する第2の入力データの集合に対応する第2の処理の結果を検索する検索手段と、
前記第2の入力データの集合に含まれ前記第1の入力データの集合に含まれない差分の入力データに対応する第1の処理の結果を取得し、前記差分の入力データに対応する第1の処理の結果を用いて、前記第2の入力データの集合に対応する第2の処理の結果から前記差分の入力データの影響を除去することで、前記第1の入力データの集合に対応する第2の処理の結果を生成するデータ処理手段と、
を有する分散処理システム。 - 入力データに対して複数のノードを用いて行われた第1の処理の結果に対して第2の処理を行うためのプログラムであって、コンピュータに、
第1の入力データの集合が指定されると、過去に処理した入力データの集合に対応する第2の処理の結果を記憶する記憶装置から、前記第1の入力データの集合と重複する第2の入力データの集合に対応する第2の処理の結果を取得し、
前記第2の入力データの集合に含まれ前記第1の入力データの集合に含まれない差分の入力データに対応する第1の処理の結果を取得し、
前記差分の入力データに対応する第1の処理の結果を用いて、前記第2の入力データの集合に対応する第2の処理の結果から前記差分の入力データの影響を除去することで、前記第1の入力データの集合に対応する第2の処理の結果を生成する、
処理を実行させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012000598A JP5919825B2 (ja) | 2012-01-05 | 2012-01-05 | データ処理方法、分散処理システムおよびプログラム |
US13/717,997 US9135351B2 (en) | 2012-01-05 | 2012-12-18 | Data processing method and distributed processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012000598A JP5919825B2 (ja) | 2012-01-05 | 2012-01-05 | データ処理方法、分散処理システムおよびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013140510A true JP2013140510A (ja) | 2013-07-18 |
JP5919825B2 JP5919825B2 (ja) | 2016-05-18 |
Family
ID=48744688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012000598A Active JP5919825B2 (ja) | 2012-01-05 | 2012-01-05 | データ処理方法、分散処理システムおよびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9135351B2 (ja) |
JP (1) | JP5919825B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015207148A (ja) * | 2014-04-21 | 2015-11-19 | 富士通株式会社 | 処理連携方法,処理連携プログラム及び処理連携システム |
JP2018515844A (ja) * | 2015-05-04 | 2018-06-14 | アリババ グループ ホウルディング リミテッド | データ処理方法及びシステム |
JP2023514947A (ja) * | 2020-12-13 | 2023-04-12 | グーグル エルエルシー | コンテンツ選択および配信のためのプライバシー保存技法 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11048765B1 (en) | 2008-06-25 | 2021-06-29 | Richard Paiz | Search engine optimizer |
US9607045B2 (en) | 2012-07-12 | 2017-03-28 | Microsoft Technology Licensing, Llc | Progressive query computation using streaming architectures |
CN104508636B (zh) * | 2012-07-31 | 2017-10-31 | 英派尔科技开发有限公司 | 数据管理设备、系统和方法 |
US11809506B1 (en) | 2013-02-26 | 2023-11-07 | Richard Paiz | Multivariant analyzing replicating intelligent ambience evolving system |
US11741090B1 (en) | 2013-02-26 | 2023-08-29 | Richard Paiz | Site rank codex search patterns |
US9514214B2 (en) * | 2013-06-12 | 2016-12-06 | Microsoft Technology Licensing, Llc | Deterministic progressive big data analytics |
US9547553B1 (en) | 2014-03-10 | 2017-01-17 | Parallel Machines Ltd. | Data resiliency in a shared memory pool |
CN104951468A (zh) * | 2014-03-28 | 2015-09-30 | 阿里巴巴集团控股有限公司 | 数据搜索处理方法和系统 |
US9781027B1 (en) | 2014-04-06 | 2017-10-03 | Parallel Machines Ltd. | Systems and methods to communicate with external destinations via a memory network |
US9690713B1 (en) | 2014-04-22 | 2017-06-27 | Parallel Machines Ltd. | Systems and methods for effectively interacting with a flash memory |
US9594688B1 (en) | 2014-12-09 | 2017-03-14 | Parallel Machines Ltd. | Systems and methods for executing actions using cached data |
US9594696B1 (en) | 2014-12-09 | 2017-03-14 | Parallel Machines Ltd. | Systems and methods for automatic generation of parallel data processing code |
US9690705B1 (en) | 2014-12-09 | 2017-06-27 | Parallel Machines Ltd. | Systems and methods for processing data sets according to an instructed order |
US9753873B1 (en) | 2014-12-09 | 2017-09-05 | Parallel Machines Ltd. | Systems and methods for key-value transactions |
US9781225B1 (en) | 2014-12-09 | 2017-10-03 | Parallel Machines Ltd. | Systems and methods for cache streams |
US9639473B1 (en) | 2014-12-09 | 2017-05-02 | Parallel Machines Ltd. | Utilizing a cache mechanism by copying a data set from a cache-disabled memory location to a cache-enabled memory location |
WO2016159883A1 (en) * | 2015-03-30 | 2016-10-06 | National University Of Singapore | Extracting information from a data set in a distributed computing environment |
US10740328B2 (en) | 2016-06-24 | 2020-08-11 | Microsoft Technology Licensing, Llc | Aggregate-query database system and processing |
US10769134B2 (en) | 2016-10-28 | 2020-09-08 | Microsoft Technology Licensing, Llc | Resumable and online schema transformations |
US10552435B2 (en) | 2017-03-08 | 2020-02-04 | Microsoft Technology Licensing, Llc | Fast approximate results and slow precise results |
US11200238B2 (en) * | 2019-01-28 | 2021-12-14 | Roblox Corporation | Computing cross products using map reduce |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08287076A (ja) * | 1995-04-11 | 1996-11-01 | Fuji Xerox Co Ltd | データベース管理装置 |
US20050240570A1 (en) * | 2004-04-22 | 2005-10-27 | Oracle International Corporation | Partial query caching |
JP2010092222A (ja) * | 2008-10-07 | 2010-04-22 | Internatl Business Mach Corp <Ibm> | 更新頻度に基づくキャッシュ機構 |
US20110072006A1 (en) * | 2009-09-18 | 2011-03-24 | Microsoft Corporation | Management of data and computation in data centers |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002259443A (ja) | 2001-02-28 | 2002-09-13 | Ricoh Co Ltd | 文書管理システム、文書検索方法および文書検索プログラム |
US8135698B2 (en) * | 2004-06-25 | 2012-03-13 | International Business Machines Corporation | Techniques for representing relationships between queries |
US20120053446A1 (en) * | 2007-11-21 | 2012-03-01 | Parascript Llc | Voting in image processing |
JP2010009222A (ja) | 2008-06-25 | 2010-01-14 | Nikon Corp | 情報処理装置 |
JP5268508B2 (ja) * | 2008-09-08 | 2013-08-21 | キヤノン株式会社 | 情報処理装置及び検索方法 |
JP6002159B2 (ja) * | 2011-02-24 | 2016-10-05 | レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド | 電子文書の検索方法及び電子文書検索のグラフィカル表示方法 |
-
2012
- 2012-01-05 JP JP2012000598A patent/JP5919825B2/ja active Active
- 2012-12-18 US US13/717,997 patent/US9135351B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08287076A (ja) * | 1995-04-11 | 1996-11-01 | Fuji Xerox Co Ltd | データベース管理装置 |
US20050240570A1 (en) * | 2004-04-22 | 2005-10-27 | Oracle International Corporation | Partial query caching |
JP2010092222A (ja) * | 2008-10-07 | 2010-04-22 | Internatl Business Mach Corp <Ibm> | 更新頻度に基づくキャッシュ機構 |
US20110072006A1 (en) * | 2009-09-18 | 2011-03-24 | Microsoft Corporation | Management of data and computation in data centers |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015207148A (ja) * | 2014-04-21 | 2015-11-19 | 富士通株式会社 | 処理連携方法,処理連携プログラム及び処理連携システム |
JP2018515844A (ja) * | 2015-05-04 | 2018-06-14 | アリババ グループ ホウルディング リミテッド | データ処理方法及びシステム |
US10872070B2 (en) | 2015-05-04 | 2020-12-22 | Advanced New Technologies Co., Ltd. | Distributed data processing |
JP2023514947A (ja) * | 2020-12-13 | 2023-04-12 | グーグル エルエルシー | コンテンツ選択および配信のためのプライバシー保存技法 |
JP7457813B2 (ja) | 2020-12-13 | 2024-03-28 | グーグル エルエルシー | コンテンツ選択および配信のためのプライバシー保存技法 |
US12052227B2 (en) | 2020-12-13 | 2024-07-30 | Google Llc | Privacy-preserving techniques for content selection and distribution |
Also Published As
Publication number | Publication date |
---|---|
US9135351B2 (en) | 2015-09-15 |
US20130179466A1 (en) | 2013-07-11 |
JP5919825B2 (ja) | 2016-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5919825B2 (ja) | データ処理方法、分散処理システムおよびプログラム | |
US11748394B1 (en) | Using indexers from multiple systems | |
US20210342369A1 (en) | Method and system for implementing efficient classification and exploration of data | |
US10444956B2 (en) | Row drill down of an event statistics time chart | |
US10929173B2 (en) | Design-time information based on run-time artifacts in a distributed computing cluster | |
US10127258B2 (en) | Event time selection output techniques | |
US9965531B2 (en) | Data storage extract, transform and load operations for entity and time-based record generation | |
US9645843B2 (en) | Image instance mapping | |
US11182364B2 (en) | Data analysis support apparatus and data analysis support method | |
US11163722B2 (en) | Methods and apparatus for analyzing a live stream of log entries to detect patterns | |
US9910821B2 (en) | Data processing method, distributed processing system, and program | |
JP5467062B2 (ja) | 情報推薦装置及び方法及びプログラム | |
US11687219B2 (en) | Statistics chart row mode drill down | |
CN111046237A (zh) | 用户行为数据处理方法、装置、电子设备及可读介质 | |
CN117971606B (zh) | 基于ElasticSearch的日志管理系统及方法 | |
US9727666B2 (en) | Data store query | |
Nelson et al. | Entity resolution for longitudinal studies in education using OYSTER | |
US11308115B2 (en) | Method and system for persisting data | |
WO2016027364A1 (ja) | 話題クラスタ選択装置、及び検索方法 | |
JP6634938B2 (ja) | 分析支援方法、分析支援プログラムおよび分析支援装置 | |
US20160110387A1 (en) | Product lifecycle management system | |
US12130789B1 (en) | Data lineage tracking service | |
JP2014013476A (ja) | ファイルの検索方法、ファイル検索装置及びプログラム | |
WO2016151865A1 (ja) | ソフトウェア選択システム及びその方法 | |
JPWO2018061070A1 (ja) | 計算機システム及び分析ソースデータ管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140904 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150731 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5919825 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |