JP6032680B2 - 受信したデータごとに集計処理を行うシステム、方法およびプログラム - Google Patents
受信したデータごとに集計処理を行うシステム、方法およびプログラム Download PDFInfo
- Publication number
- JP6032680B2 JP6032680B2 JP2013227726A JP2013227726A JP6032680B2 JP 6032680 B2 JP6032680 B2 JP 6032680B2 JP 2013227726 A JP2013227726 A JP 2013227726A JP 2013227726 A JP2013227726 A JP 2013227726A JP 6032680 B2 JP6032680 B2 JP 6032680B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- tuple
- processing
- output
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本実施の形態に係る集計処理システム1の概略構成の一例を示す図である。集計処理システム1は、多数のデータが外部から次々と到着する場合に、データを蓄積してからまとめて処理を行うのではなく、データが到着するごとに集計処理を行うシステムである。本実施の形態において、集計処理とは、到着したデータに対して、すでに保持しているデータと組み合わせて演算を行い、その結果を保存してデータベースを更新する処理をいう。
次に、図1に示す集計処理システム1の構成要素について説明する。本実施の形態に係る集計処理システム1は、集計処理システム1の集計処理の対象となるデータをタプルの形式に変換しデータ処理部3に送信するデータ送信部2と、送信されたタプルに対して集計処理を実行するデータ処理部3とを備える。また、データ送信部2は複数のタプル送信部201を備え、データ処理部3は複数のRDA(Realtime Data Aggregation)サーバプロセス301およびRDB(Relational Database)サーバプロセス302を備えている。RDAサーバプロセスとは、本実施の形態に係る集計処理(リアルタイムデータ集計:RDA)を実現するサーバプロセスである。RDBサーバプロセスとは、行と列とからなるテーブルの形式でデータを管理するサーバプロセスである。また、サーバプロセスとは、一定の目的のもとにサーバ装置で実行される処理手段である。
次に、データ処理部3が実行する集計処理の基本となる基本モデルについて説明する。図2は、本実施の形態に係る基本モデルの一例を説明するための図である。基本モデルでは、タプルに対する集計処理を実行するオブジェクト(以下、オペレータと称する)が一つ存在する。
次に、図2に示した基本モデルを複数組み合わせた構成において行われる処理について説明する。図3は、本実施の形態に係る基本モデルを組み合わせた構成の一例を説明するための図である。図3に示す構成では3つのオペレータ(オペレータA、オペレータB、オペレータC)が存在し、各オペレータによる集計処理は一つのトランザクションとして実行されるものとする。また、図示の例では、オペレータAの入力テーブルは定義されておらず、オペレータCの処理では出力タプルは生成されないものとする。
次に、本実施の形態に係る集計処理を実行するデータ処理部3の機能構成について説明する。図4は、本実施の形態に係るデータ処理部3の機能構成例を示したブロック図である。
次に、定義情報管理部13に格納されているタプル定義情報について説明する。図5(a)(b)は、本実施の形態に係るタプル定義情報の一例を示す図である。図5(a)に示すタプル定義情報は、タプル名「PACKET_INFO」のタプル定義情報であり、図5(b)に示すタプル定義情報は、タプル名「PACKET_INFO_2」のタプル定義情報である。
次に、定義情報管理部13に格納されているテーブル定義情報について説明する。図6は、本実施の形態に係るテーブル定義情報の一例を示す図である。図6に示すテーブル定義情報は、テーブル名「PACKET_INFO」のテーブル定義情報である。
次に、定義情報管理部13に格納されているオペレータ定義情報について説明する。図7(a)(b)は、本実施の形態に係るオペレータ定義情報の一例を示す図である。図7(a)に示すオペレータ定義情報は、オペレータ名「te_copy」の定義情報であり、図7(b)に示すオペレータ定義情報は、オペレータ名「ee_avg」の定義情報である。
次に、集計処理の手順について説明する。図8は、本実施の形態に係るデータ処理部3による集計処理手順の一例を示したフローチャートである。
次に、図8に示した集計処理手順で行われる集計処理の具体例について説明する。図9は、本実施の形態に係るデータ処理部3による集計処理の具体例を示した図である。図9に示す集計処理は、データ送信部2が、例えば、携帯電話のパケット数のデータで「ユーザID」「パケット数」「時刻」の値を持つデータを受信して、タプルの形式に変換し、変換後のタプルをデータ処理部3に送信した場合に実行される集計処理の例である。データ処理部3に送信されるタプルは、図5(a)に示すタプル「PACKET_INFO」とし、4つのオペレータによる処理がトランザクションとして実行されることとする。また、タプル「PACKET_INFO」のキー値はユーザを識別するための番号である「ユーザID」であるとする。以下に示すステップは、図8の各ステップに対応するものとする。
次に、定義情報(タプル定義情報、テーブル定義情報、オペレータ定義情報)に関する記述の具体例について説明する。定義情報の記述方式としては様々な方式が存在するが、ここでは一例として、XML(Extensible Markup Language)形式で記述した場合の例について説明する。図10は、本実施の形態に係る定義情報に関する記述の一例を示した図である。
次に、集計処理の手順の他の例について説明する。図11は、本実施の形態に係るデータ処理部3による集計処理手順の他の一例を示したフローチャートである。図8に示す集計処理の手順では、データ送信部2から入力されるタプルに対して実行されるオペレータの処理を一つのトランザクションとする場合について説明した。一方、図11に示す集計処理の手順では、一つのオペレータの処理ごとにトランザクションを完了させるように予め指定されているものとする。
次に、集計処理を最適化して性能を向上させるための最適化処理について説明する。図12(図12−1、図12−2)は、本実施の形態に係る最適化処理の第1の例を説明するための図である。図12−1は、最適化前の集計処理結果の一例を示した図であり、図12−2は、最適化後の集計処理結果の一例を示した図である。
次に、最適化処理の他の例について説明する。図14は、本実施の形態に係る最適化処理の第2の例を説明するための図である。本例において実行される処理は、並列化処理である。並列化処理とは、一つの外部から到着するタプルに対する複数のオペレータ処理において、別々のスレッドで同時並行して処理を行うというものである。スレッドとは、演算手段であるCPU(Central Processing Unit)による処理の単位のことをいう。
図16は、本実施の形態に係るデータ処理部3を構成するのに好適なハードウェア構成例を示す図である。ここでは、コンピュータに適用する場合について説明する。図16に示すコンピュータは、演算手段であるCPU10aと、主記憶手段であるメモリ10cを備える。また、外部デバイスとして、磁気ディスク装置(HDD:Hard Disk Drive)10g、ネットワーク・インターフェイス10f、ディスプレイ装置を含む表示機構10d、音声機構10h、キーボードやマウス等の入力デバイス10i等を備える。
Claims (10)
- 分類のために用いられる値であるキーを有するデータを外部から受信し、受信したデータごとに集計処理を行うシステムであって、
前記集計処理の対象として前記キーを有する第1の入力データを受け付ける受付部と、
データベースを保持する保持部と、
前記受付部により受け付けられた前記第1の入力データに対して前記集計処理を行い、前記キーを有する第1の出力データおよび当該キーを有し前記保持部に保持された前記データベースに格納される第2の出力データの少なくとも一つを出力する処理部とを備え、
前記処理部は、前記キーを有するデータに対して前記集計処理を行い当該キーを有する第1の出力データおよび当該キーを有し前記保持部に保持された前記データベースに格納される第2の出力データの少なくとも一つを出力する他の処理部について、当該他の処理部による当該集計処理が正常に完了しなかった場合には当該処理部の処理結果を取り消し、
前記受付部は、前記処理部に対する前記第1の入力データとして、外部から受信した前記データ又は前記他の処理部から出力された第1の出力データを受け付けること
を特徴とするシステム。 - 前記処理部は、前記第1の入力データに加えて、前記データベースから読み出した第3データを受け付け、当該第1の入力データおよび当該第3データに基づいて当該第1の入力データに対する処理を行うことを特徴とする請求項1に記載のシステム。
- 分類のために用いられる値であるキーを有するデータを外部から受信し、受信したデータごとに集計処理を行うシステムであって、
前記集計処理の対象として前記キーを有する第1の入力データを受け付ける受付部と、
データベースを保持する保持部と、
前記受付部により受け付けられた前記第1の入力データに対して所定の処理を行い、処理結果に基づいて、当該キーを有する第1の出力データおよび当該キーを有し前記保持部に保持された前記データベースに格納される第2の出力データの少なくとも一つを出力する複数の処理部とを備え、
前記受付部は、外部から受信した前記データを前記複数の処理部のうちの先頭の処理部に対する第1の入力データとして受け付けて、当該先頭の処理部より後の各処理部に対しては、処理部の前段にある他の処理部から出力された第1の出力データを当該処理部に対する第1の入力データとして受け付けること
を特徴とするシステム。 - 前記複数の処理部は、前記第1の入力データに加えて、前記データベースから読み出したデータを第2の入力データとして受け付け、当該第1の入力データおよび当該第2の入力データに基づいて前記所定の処理を行うことを特徴とする請求項3に記載のシステム。
- 前記複数の処理部において、出力される第1の出力データがない場合、または出力される第1の出力データを第1の入力データとする他の処理部がない場合、前記キーを有するデータについての集計処理が終了することを特徴とする請求項3または4に記載のシステム。
- 分類のために用いられる値であるキーを有するデータを外部から受信し、受信したデータごとに集計処理を行うシステムであって、
前記集計処理の対象として前記キーを有する第1の入力データを受け付ける受付部と、
データベースを保持する保持部と、
前記受付部により受け付けられた前記第1の入力データに応じた前記集計処理を行う手段である1または複数のオペレータを呼び出して、呼び出した1または複数の当該オペレータにより当該第1の入力データに対する所定の処理を行い、各オペレータの処理において、前記キーを有する第1の出力データおよび当該キーを有し前記保持部に保持された前記データベースに格納される第2の出力データの少なくとも一つを出力する処理部と、
前記処理部により出力された前記第1の出力データを記憶する記憶部とを備え、
前記受付部は、第1の入力データの受け付けに際し、前記記憶部に記憶された前記第1の出力データがある場合、当該第1の出力データを第1の入力データとして受け付け、当該記憶部に記憶された当該第1の出力データがない場合、外部から受信した前記データを第1の入力データとして受け付けること
を特徴とするシステム。 - 前記処理部による前記所定の処理が終了した後、前記記憶部に記憶される前記第1の出力データがない場合、前記第2の出力データが格納された前記データベースの内容が確定されることを特徴とする請求項6に記載のシステム。
- 前記処理部によるオペレータの処理が終了するごとに、前記データベースの内容が確定されることを特徴とする請求項6に記載のシステム。
- 分類のために用いられる値であるキーを有するデータを外部から受信し、受信したデータごとに集計処理を行う方法であって、
受付部が、前記集計処理の対象として前記キーを有する第1の入力データを受け付けるステップと、
処理部が、前記受付部により受け付けられた前記第1の入力データに対して前記集計処理を行い、前記キーを有する第1の出力データおよび当該キーを有しデータベースに格納される第2の出力データの少なくとも一つを出力するステップとを含み、
前記処理部は、前記キーを有するデータに対して前記集計処理を行い当該キーを有する第1の出力データおよび当該キーを有し前記データベースに格納される第2の出力データの少なくとも一つを出力する他の処理部について、当該他の処理部による当該集計処理が正常に完了しなかった場合には当該処理部の処理結果を取り消し、
前記受付部は、前記処理部に対する前記第1の入力データとして、外部から受信した前記データ又は前記他の処理部から出力された第1の出力データを受け付けること
を特徴とする方法。 - 分類のために用いられる値であるキーを有するデータを外部からコンピュータに受信させ、受信させたデータごとに集計処理を行うプログラムであって、
前記コンピュータを、
前記集計処理の対象として前記キーを有する第1の入力データを受け付ける受付手段、
前記受付手段により受け付けられた前記第1の入力データに対して前記集計処理を行い、前記キーを有する第1の出力データおよび当該キーを有しデータベースに格納される第2の出力データの少なくとも一つを出力する処理手段として機能させ、
前記処理手段は、前記キーを有するデータに対して前記集計処理を行い当該キーを有する第1の出力データおよび当該キーを有し前記データベースに格納される第2の出力データの少なくとも一つを出力する他の処理手段について、当該他の処理手段による当該集計処理が正常に完了しなかった場合には当該処理手段の処理結果を取り消し、
前記受付手段は、前記処理手段に対する前記第1の入力データとして、外部から受信した前記データ又は前記他の処理手段から出力された第1の出力データを受け付けること
を特徴とするプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013227726A JP6032680B2 (ja) | 2013-10-31 | 2013-10-31 | 受信したデータごとに集計処理を行うシステム、方法およびプログラム |
US14/472,324 US10474698B2 (en) | 2013-10-31 | 2014-08-28 | System, method, and program for performing aggregation process for each piece of received data |
CN201410599106.8A CN104598299B (zh) | 2013-10-31 | 2014-10-30 | 用于对每条接收数据执行聚合处理的系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013227726A JP6032680B2 (ja) | 2013-10-31 | 2013-10-31 | 受信したデータごとに集計処理を行うシステム、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015088072A JP2015088072A (ja) | 2015-05-07 |
JP6032680B2 true JP6032680B2 (ja) | 2016-11-30 |
Family
ID=52996652
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013227726A Expired - Fee Related JP6032680B2 (ja) | 2013-10-31 | 2013-10-31 | 受信したデータごとに集計処理を行うシステム、方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10474698B2 (ja) |
JP (1) | JP6032680B2 (ja) |
CN (1) | CN104598299B (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9632847B2 (en) * | 2014-11-11 | 2017-04-25 | Fair Isaac Corporation | System and method for linearizing messages from data sources for optimized high-performance processing in a stream processing system |
US10579753B2 (en) * | 2016-05-24 | 2020-03-03 | Ab Initio Technology Llc | Executable logic for processing keyed data in networks |
WO2018069973A1 (ja) * | 2016-10-11 | 2018-04-19 | 富士通株式会社 | 集計プログラム、集計装置、及び集計方法 |
US10949427B2 (en) * | 2017-01-31 | 2021-03-16 | Microsoft Technology Licensing, Llc | Stream data processing on multiple application timelines |
US20220035675A1 (en) * | 2020-08-02 | 2022-02-03 | Avatar Cognition Barcelona S.L. | Pattern recognition system utilizing self-replicating nodes |
US20220058179A1 (en) * | 2020-08-24 | 2022-02-24 | International Business Machines Corporation | Executing database transactions |
CN112732722A (zh) * | 2021-01-19 | 2021-04-30 | 深圳市欢太科技有限公司 | 数据处理方法、数据处理装置、存储介质与电子设备 |
US11861322B2 (en) * | 2021-05-13 | 2024-01-02 | West Technology Group, Llc | Automated management of revised IVR prompt translations |
US11875132B2 (en) | 2021-05-13 | 2024-01-16 | Intrado Corporation | Validation of revised IVR prompt translation |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5546557A (en) | 1993-06-14 | 1996-08-13 | International Business Machines Corporation | System for storing and managing plural logical volumes in each of several physical volumes including automatically creating logical volumes in peripheral data storage subsystem |
JP2000057092A (ja) | 1998-08-13 | 2000-02-25 | Nec Corp | オンラインリアルタイムシステム、トランザクション処理装置及び方法、並びに記録媒体 |
JP4688270B2 (ja) | 1999-10-13 | 2011-05-25 | 株式会社ビジュアルジャパン | ネットワーク型データ伝送システム、並びに同システムにおけるサーバ及び端末装置 |
JP2003162772A (ja) | 2001-11-27 | 2003-06-06 | Nec Corp | データ共有システム、その処理方法及びそのプログラム |
JP2004280371A (ja) | 2003-03-14 | 2004-10-07 | Mitsubishi Electric Information Systems Corp | サーバ装置及びプログラム |
JP2005011109A (ja) | 2003-06-19 | 2005-01-13 | Hitachi Ltd | ジョブ管理方法、情報処理装置、プログラム、および記録媒体 |
JP4723301B2 (ja) | 2005-07-21 | 2011-07-13 | 株式会社日立製作所 | ストリームデータ処理システムおよびストリームデータ処理方法 |
US20070226188A1 (en) * | 2006-03-27 | 2007-09-27 | Theodore Johnson | Method and apparatus for data stream sampling |
JP2008276547A (ja) | 2007-04-27 | 2008-11-13 | Toshiba Corp | プログラム処理方法及び情報処理装置 |
US8335782B2 (en) | 2007-10-29 | 2012-12-18 | Hitachi, Ltd. | Ranking query processing method for stream data and stream data processing system having ranking query processing mechanism |
JP5377897B2 (ja) * | 2007-10-29 | 2013-12-25 | 株式会社日立製作所 | ストリームデータのランキングクエリ処理方法およびランキングクエリ処理機構を有するストリームデータ処理システム |
US8510341B2 (en) * | 2008-11-21 | 2013-08-13 | Sap Ag | System, method and structures for a reusable custom-defined nestable compound data type for construction of database objects |
US8458451B2 (en) * | 2009-01-20 | 2013-06-04 | New York University | Database outsourcing with access privacy |
JP4462504B1 (ja) | 2009-09-23 | 2010-05-12 | 修平 西山 | 一貫性保持の起点となるトランザクション・プロセスが所有する更新アクセス・カウンタによるマルチ・トランザクション制御システム |
JP5058209B2 (ja) | 2009-05-22 | 2012-10-24 | 株式会社日立製作所 | ストリームデータ処理において逆再生を行うデータ処理システム |
JP2011237944A (ja) | 2010-05-07 | 2011-11-24 | Nec Corp | 分散型データベース運用システム、運用方法、及び運用プログラム |
US8423516B2 (en) | 2010-09-15 | 2013-04-16 | International Business Machines Corporation | Speculative execution in a real-time data environment |
JP2012118928A (ja) | 2010-12-03 | 2012-06-21 | Nec Corp | イベント処理装置、イベント処理方法およびイベント処理プログラム |
-
2013
- 2013-10-31 JP JP2013227726A patent/JP6032680B2/ja not_active Expired - Fee Related
-
2014
- 2014-08-28 US US14/472,324 patent/US10474698B2/en not_active Expired - Fee Related
- 2014-10-30 CN CN201410599106.8A patent/CN104598299B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN104598299B (zh) | 2018-10-12 |
US20150120739A1 (en) | 2015-04-30 |
CN104598299A (zh) | 2015-05-06 |
JP2015088072A (ja) | 2015-05-07 |
US10474698B2 (en) | 2019-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6032680B2 (ja) | 受信したデータごとに集計処理を行うシステム、方法およびプログラム | |
US11829360B2 (en) | Database workload capture and replay | |
US10554771B2 (en) | Parallelized replay of captured database workload | |
US20200192900A1 (en) | Order-independent multi-record hash generation and data filtering | |
US9589041B2 (en) | Client and server integration for replicating data | |
US8725707B2 (en) | Data continuous SQL process | |
Varia | Cloud architectures | |
US20180113771A1 (en) | Transaction consistency query support for replicated data from recovery log to external data stores | |
US9747356B2 (en) | Eager replication of uncommitted transactions | |
US7680793B2 (en) | Commit-time ordered message queue supporting arbitrary read and dequeue patterns from multiple subscribers | |
US11232071B2 (en) | Regressable differential data structures | |
US20150278310A1 (en) | Database device | |
US10685034B2 (en) | Systems, methods, and apparatuses for implementing concurrent dataflow execution with write conflict protection within a cloud based computing environment | |
CN111966692A (zh) | 针对数据仓库的数据处理方法、介质、装置和计算设备 | |
JP6262505B2 (ja) | 分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラム | |
US9092472B1 (en) | Data merge based on logical segregation | |
JP5546909B2 (ja) | データ処理システム及び方法及びプログラム | |
US9063773B2 (en) | Automatic parallelism tuning for apply processes | |
JPWO2018061219A1 (ja) | ジョブスケジューリングシステム、ジョブスケジューリング方法、およびジョブスケジューリング装置 | |
JP6680897B2 (ja) | 計算機システム及び分析ソースデータ管理方法 | |
US20220360458A1 (en) | Control method, information processing apparatus, and non-transitory computer-readable storage medium for storing control program | |
US20180060407A1 (en) | Data-dependency-driven flow execution | |
US10776753B1 (en) | Consistent updating of data storage units using tenant specific update policies | |
CN117633095A (zh) | 一种可视化数据平台和系统 | |
Xu et al. | AQUAS: A Quality-Aware Scheduler |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151127 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20160115 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160524 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160624 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160927 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20160927 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161018 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6032680 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |