JP6457747B2 - Framework providing apparatus for processing large-capacity sequentially collected data and data processing method thereof - Google Patents

Framework providing apparatus for processing large-capacity sequentially collected data and data processing method thereof Download PDF

Info

Publication number
JP6457747B2
JP6457747B2 JP2014117008A JP2014117008A JP6457747B2 JP 6457747 B2 JP6457747 B2 JP 6457747B2 JP 2014117008 A JP2014117008 A JP 2014117008A JP 2014117008 A JP2014117008 A JP 2014117008A JP 6457747 B2 JP6457747 B2 JP 6457747B2
Authority
JP
Japan
Prior art keywords
data
user
processing
rule
distributed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014117008A
Other languages
Japanese (ja)
Other versions
JP2015106406A (en
Inventor
パク、ジュ、サン
イ、ホ、ソン
ファン、ジェ、ガク
バン、ヒョ、チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2015106406A publication Critical patent/JP2015106406A/en
Application granted granted Critical
Publication of JP6457747B2 publication Critical patent/JP6457747B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、大容量のデータを処理するためのシステムに関するものであって、より詳しくは、処理しようとする様々な種類のデータをユーザの定義に基づいて収集、格納、処理、管理する機能を構成できる柔軟性と、データを効率的に処理できる管理機能を提供するためのフレームワーク提供装置及びそのデータ処理方法に関する。   The present invention relates to a system for processing a large amount of data. More specifically, the present invention relates to a function for collecting, storing, processing, and managing various types of data to be processed based on a user definition. The present invention relates to a framework providing apparatus and a data processing method therefor for providing a configuration flexibility and a management function capable of efficiently processing data.

最近、スマートフォンの拡散と共にモノのインターネット技術の発展に伴うセンサを適用した情報技術の底辺拡大で、情報システムにおける収集、処理、格納、管理、使用されるデジタルデータが急増している。一例として、製薬と医薬品流通産業の場合、医薬品の不法流通と偽造医薬品の流通を防止するためにバーコードを利用した医薬品管理を超えて、RFID技術を用いた個別医薬品に対する識別及び管理を推進しながら、医薬品の製造と流通過程で様々な業務処理に因って発生するデータの量が爆発的に増加するものと予想される。   Recently, with the spread of smartphones, digital data used in collection, processing, storage, management, and use in information systems has been rapidly increasing due to the expansion of information technology based on the development of the Internet of Things technology. As an example, in the pharmaceutical and pharmaceutical distribution industries, we promote identification and management of individual drugs using RFID technology, beyond drug management using barcodes to prevent illegal distribution of counterfeit drugs and counterfeit drugs. However, the amount of data generated due to various business processes during the manufacturing and distribution process of pharmaceuticals is expected to increase explosively.

また、モノのインターネット技術が拡散すると、大量のセンサデータが発生し、これを活用した様々なサービスが登場するものと予想されるところ、センサデータの多様性と新規センサ装置の増加、ユーザのニーズの変化などに因り、サービスが頻繁に変更される環境では、一つの一括した処理方式の適用が困難であるという問題がある。   In addition, when the Internet of Things technology spreads, a large amount of sensor data will be generated, and various services that use this data are expected to appear. The diversity of sensor data, the increase in new sensor devices, and user needs In an environment where services are frequently changed due to changes in the network, there is a problem that it is difficult to apply one batch processing method.

上記のような背景から、大量のデータを効率的に収集、格納、処理するための様々な技術が登場しているが、ユーザのニーズの変化とデータの多様性の面でユーザ定義に応じたデータの収集、格納、処理機能を柔軟に構成することができ、データ規模の面で複数のデータソースから発生する大量のデータを効率的に管理するための方法が必要である。特に、特定産業分野または業務分野に従属されて長期間持続され、大量に発生して累積される環境では、多数の利害関係者が、該当データへの様々なニーズを反映しなければならない場合、これを効果的に支援するためのフレームワークが、特に重要な要素として必要となる。   Various technologies for efficiently collecting, storing, and processing large amounts of data have emerged from the background described above. However, in response to changes in user needs and the diversity of data, it has been adapted to user definitions. Data collection, storage, and processing functions can be flexibly configured, and a method for efficiently managing a large amount of data generated from a plurality of data sources in terms of data scale is required. In particular, in an environment that is subordinated to a specific industry or business area, is sustained for a long time, is generated and accumulated in large numbers, and many stakeholders have to reflect different needs for the data, A framework to effectively support this is required as a particularly important factor.

本発明は、上述した従来技術の問題点を解決するために、様々な種類のデータに対して、ユーザ定義による収集、格納、処理、管理、検索などの機能を構成することによって、可変的なユーザのニーズと任意のデータ変更に対し柔軟に対応できるフレームワーク提供装置及びそのデータ処理方法を提供することを目的とする。   In order to solve the above-mentioned problems of the prior art, the present invention can be made variable by configuring functions such as user-defined collection, storage, processing, management, and search for various types of data. It is an object of the present invention to provide a framework providing apparatus and a data processing method thereof that can flexibly cope with user needs and arbitrary data changes.

本発明の他の目的は、様々な種類のデータとそのデータの増加速度を予測できない環境において、大容量のデータを、分散されたストアに特定の領域に偏らないよう格納して管理することができ、エラーが発生しても、サービス要求を満たすことのできるフレームワーク提供装置及びそのデータ処理方法を提供することである。   Another object of the present invention is to store and manage a large amount of data in a distributed store so as not to be biased to a specific area in an environment in which various types of data and an increase rate of the data cannot be predicted. It is possible to provide a framework providing apparatus and a data processing method thereof that can satisfy a service request even if an error occurs.

本発明の目的は、上記した目的に制限されておらず、言及されていないまた他の目的は、以下の記載から当業者に明確に理解することができるだろう。   The object of the present invention is not limited to the above-mentioned object, and other objects not mentioned can be clearly understood by those skilled in the art from the following description.

上述した本発明の目的を達成するための本発明の一面によるデータ処理方法は、大容量の順次収集データを処理するためのフレームワーク提供装置でのデータ処理方法において、外部のデータ提供装置から収集されたソースデータに対してユーザ定義基盤の前処理を行なうステップと、前記ソースデータをユーザが定義した格納ルールに基づいて分散型データストアに格納するステップと、ユーザが定義したデータ処理ルールに基づいて前記ソースデータまたは前記ソースデータの格納情報を処理して加工データを生成するステップと、前記加工データを前記分散型データストアに分配して格納するためのデータ分配ルールを登録するステップと、及び前記データ分配ルールに基づいて前記加工データを前記分散型データストアに分配して格納するステップと、を有する。   A data processing method according to one aspect of the present invention for achieving the above-described object of the present invention is a data processing method in a framework providing apparatus for processing a large amount of sequentially collected data. Pre-processing user-defined infrastructure for the generated source data, storing the source data in a distributed data store based on a user-defined storage rule, and based on a user-defined data processing rule Processing the source data or the storage information of the source data to generate processed data, registering a data distribution rule for distributing and storing the processed data in the distributed data store, and Based on the data distribution rule, the processed data is distributed to the distributed data store for storage. With the method comprising the steps of, a.

また、本発明の一面によるデータ処理方法は、前記分散型データストアに格納された前記ソースデータまたは前記加工データにユーザ検索がある場合、前記ユーザが定義した格納ルールまたは前記データ分配ルールを参照して、前記ソースデータまたは前記加工データをユーザ端末に転送するステップをさらに有する。   The data processing method according to one aspect of the present invention refers to a storage rule defined by the user or the data distribution rule when there is a user search in the source data or the processed data stored in the distributed data store. And transferring the source data or the processed data to a user terminal.

一実施形態として、前記ユーザ定義基盤の前処理を行なうステップは、ユーザインターフェースを介して登録される外部システム連動機能とデータの前処理機能に基づいてデータ収集プロセスを生成するステップを有する。   In one embodiment, the step of pre-processing the user-defined base includes generating a data collection process based on an external system linkage function registered via a user interface and a data pre-processing function.

一実施形態として、前記分散型データストアに格納するステップは、ユーザインターフェースを介して登録されるユーザが定義したソースデータ格納ルールに基づいてソースデータ格納プロセスを生成するステップを有する。   In one embodiment, storing in the distributed data store includes generating a source data storage process based on user-defined source data storage rules registered via a user interface.

一実施形態として、前記加工データを生成するステップは、ユーザインターフェースを介して登録されたユーザ定義基盤データ処理機能と、前記加工データ格納ルールに基づいて少なくとも一つ以上のソースデータ処理プロセスを生成するステップを有する。   In one embodiment, the processing data generating step generates at least one source data processing process based on a user-defined infrastructure data processing function registered through a user interface and the processing data storage rule. Has steps.

一実施形態として、前記データ分配ルールを登録するステップは、前記分散型データストアがキー・バリュー(key−value)分散型データストアである場合、前記加工データを均等に格納できるキー値生成ルールを登録するステップを有する。   In one embodiment, the step of registering the data distribution rule includes a key value generation rule capable of storing the processed data evenly when the distributed data store is a key-value distributed data store. A step of registering.

本発明の他の実施形態に係るデータ処理方法は、ユーザインターフェースを介して登録される外部システムの連動機能とデータの前処理機能に基づいてデータ収集プロセスを生成するステップと、ユーザインターフェースを介して登録されるユーザが定義したソースデータ格納ルールに基づいてソースデータ格納プロセスを生成するステップと、ユーザインターフェースを介して登録されたユーザ定義基盤のデータ処理機能と、前記加工データ格納ルールに基づいて少なくとも一つ以上のソースデータ処理プロセスを生成するステップと、前記加工データ処理を前記分散型データストアに分配して格納するためのデータ分配ルールを登録し、前記データ分配ルールに基づいて加工データ分配プロセスを生成するステップと、及び前記それぞれのプロセス間の関係設定によってユーザ定義基盤データを処理するための統合プロセスを生成するステップを有する。   A data processing method according to another embodiment of the present invention includes a step of generating a data collection process based on an external system linkage function and a data pre-processing function registered via a user interface, and via a user interface. Generating a source data storage process based on registered user-defined source data storage rules, a user-defined infrastructure data processing function registered via a user interface, and at least based on the processed data storage rules Creating one or more source data processing processes; registering data distribution rules for distributing and storing the processed data processes in the distributed data store; and processing data distribution processes based on the data distribution rules Generating and each of the above Comprising generating an integrated process for processing a user-defined base data by the relationship set between the processes.

一方、本発明の目的を達成するための本発明の他面によるフレームワーク提供装置は、大容量の順次収集データを処理するためのフレームワークを提供するプログラムコード(code)が格納された不揮発性メモリと、前記プログラムコードを行なう少なくとも一つのプロセッサを有する。   Meanwhile, a framework providing apparatus according to another aspect of the present invention for achieving the object of the present invention is a non-volatile storage in which program code (code) for providing a framework for processing large-capacity sequentially collected data is stored. A memory and at least one processor for executing the program code;

ここで、前記フレームワークは、外部のデータ提供装置から収集されたソースデータに対し、ユーザ定義基盤の前処理を行なうデータ収集モジュールと、前記ソースデータをユーザが定義した格納ルールに基づいて、分散型データストアに格納するデータ格納モジュールと、ユーザが定義したデータ処理ルールに基づいて前記ソースデータまたは前記ソースデータの格納情報を処理して加工データを生成するデータ処理モジュールと、前記加工データを前記分散型データストアに分散して格納するためのデータ分配ルールを登録するデータ管理政策モジュールを提供することを特徴とする。   Here, the framework distributes the source data collected from an external data providing apparatus based on a data collection module that performs user-defined infrastructure preprocessing and a storage rule that defines the source data by the user. A data storage module for storing data in a type data store, a data processing module for processing the source data or storage information of the source data based on a data processing rule defined by a user to generate processed data, and the processed data A data management policy module for registering data distribution rules to be distributed and stored in a distributed data store is provided.

一実施形態として、前記データ収集モジュールは、外部システム連動機能とデータ解析を含むユーザ定義基盤の前処理機能を登録できるユーザインターフェースを提供する。   In one embodiment, the data collection module provides a user interface capable of registering a user-defined infrastructure preprocessing function including an external system linkage function and data analysis.

一実施形態として、前記データ格納モジュールは、ユーザ定義によるソースデータ格納ルールを登録できるユーザインターフェースを提供する。   In one embodiment, the data storage module provides a user interface capable of registering user-defined source data storage rules.

一実施形態として、前記データ格納モジュールは、前記ソースデータから必要なデータの抽出作業または前記ソースデータへの加工作業が必要な場合、前記データ処理モジュールを登録し、前記データ処理モジュールで、ユーザが定義したデータ処理ルール基づいて前記ソースデータを前記データ処理モジュールに転送したり、前記ソースデータの格納情報を通知する。   In one embodiment, the data storage module registers the data processing module when necessary data extraction work or processing to the source data is necessary from the source data. Based on the defined data processing rule, the source data is transferred to the data processing module, or the storage information of the source data is notified.

一実施形態として、前記データ処理モジュールは、前記ユーザが定義したデータ処理ルールと前記加工データ格納ルールを登録できるユーザインターフェースを提供する。   In one embodiment, the data processing module provides a user interface capable of registering a data processing rule defined by the user and the processing data storage rule.

一実施形態として、前記データ処理モジュールは、ユーザが定義したデータ処理ルールに基づいて前記ソースデータまたは前記ソースデータの格納情報を即時に行なう方式または周期的に行なう方式で処理する。   In one embodiment, the data processing module processes the source data or the stored information of the source data based on a data processing rule defined by a user in an immediate manner or periodically.

一実施形態として、前記データ管理政策モジュールは、前記データ分配ルールを登録及び検索するためのユーザインターフェースを提供し、前記分散型データストアがキー・バリュー分散型データストアである場合、前記データ分配ルールは、前記加工データを均等に格納できるキー値生成ルールであることを特徴とする。   In one embodiment, the data management policy module provides a user interface for registering and retrieving the data distribution rule, and the data distribution rule when the distributed data store is a key-value distributed data store. Is a key value generation rule capable of storing the processed data evenly.

本発明によると、複数の利害関係者が関与する業務順次に応じて大量に発生して収集される様々な種類のデータに対して、収集、格納、処理、検索、管理機能をユーザの定義に基づいて構成することができ、必要に応じて装置を追加して格納と処理能力を増強させることのできるフレームワークを提供することで、任意で変化したり増加するユーザのニーズとデータに対して、柔軟かつ効率的に対応し、コストを最小限に抑えることができる。特に、時間の経過につれて、データが急増するものと予想される環境では、高い拡張性と可用性を持つフレームワークを提供することによって、大量のデータを効率的に管理し、多数の利害関係者を満たすサービスを提供することができる。   According to the present invention, the collection, storage, processing, search, and management functions can be defined by the user for various types of data that are generated and collected in large quantities according to the business sequence involving multiple stakeholders. By providing a framework that can be configured on the basis of additional storage and processing capacity as needed to meet arbitrarily changing and increasing user needs and data Respond flexibly and efficiently, and minimize costs. Especially in environments where data is expected to grow exponentially over time, it provides a highly scalable and highly available framework to efficiently manage large volumes of data and Can provide a satisfying service.

本発明の実施形態に係る大容量の順次収集データを処理するためのフレームワーク提供装置のフレームワークの構成を示す図である。It is a figure which shows the structure of the framework of the framework provision apparatus for processing the large-capacity sequential collection data based on embodiment of this invention. 本発明の実施形態に係る大容量の順次収集データを処理するためのフレームワーク提供装置を活用したシステムの一例を示す図である。It is a figure which shows an example of the system using the framework provision apparatus for processing the large-capacity sequential collection data based on embodiment of this invention. 本発明の実施形態に係る大容量の順次収集データを処理するためのフレームワーク提供装置を活用したシステムの他の例を示す図である。It is a figure which shows the other example of the system using the framework provision apparatus for processing the large-capacity sequential collection data based on embodiment of this invention. 本発明の実施形態に基づいて分散型ストアのデータ格納スペースを拡張する一例を示す図である。It is a figure which shows an example which expands the data storage space of a distributed store based on embodiment of this invention. 本発明の実施形態に基づいてキー・バリュー分散型ストアでのユーザ定義基盤データの格納方式を説明するための図である。It is a figure for demonstrating the storage system of the user-defined basic | foundation data in a key value distributed type store based on embodiment of this invention. 本発明の実施形態に基づいてキー・バリュー分散型ストアでのユーザ定義基盤データの格納方式を説明するための図である。It is a figure for demonstrating the storage system of the user-defined basic | foundation data in a key value distributed type store based on embodiment of this invention. キー・バリュー分散型ストアにデータが分散されて格納された状況を比較して説明するための図である。It is a figure for comparing and explaining the situation where data was distributed and stored in a key / value distributed store. キー・バリュー分散型ストアにデータが分散されて格納された状況を比較して説明するための図である。It is a figure for comparing and explaining the situation where data was distributed and stored in a key / value distributed store. 本発明の実施形態に係るフレームワーク提供装置でのデータ処理方法を示す図である。It is a figure which shows the data processing method with the framework provision apparatus which concerns on embodiment of this invention.

発明の実施のための最良の形態BEST MODE FOR CARRYING OUT THE INVENTION

本発明の利点及び特徴、そしてそれらを達成する方法は添付される図面と共に詳細に後述されている実施形態を参照すれば明確になるだろう。しかし、本発明は、以下に開示される実施形態に限定されるのではなく、多様な形態で実装されるものであり、単に本実施形態は、本発明の開示が完全になるようにし、本発明の属する技術分野における通常の知識を持つ者に発明の範疇を完全に知らせるために提供されるもので、本発明は、請求項の範疇によって定義されるだけである。なお、本明細書において使用される用語は、実施形態を説明するためのものであって本発明を制限するものではない。本明細書で、単数形は文句で特に言及しない限り、複数形も含む。   Advantages and features of the present invention and methods for achieving them will be apparent with reference to the embodiments described in detail below in conjunction with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but can be implemented in various forms. The embodiments merely provide a complete disclosure of the present invention. The present invention is only defined by the scope of the claims, and is provided to fully inform those skilled in the art of the technical field to which the invention pertains. Note that the terms used in this specification are for describing the embodiments and do not limit the present invention. In this specification, the singular includes the plural unless specifically stated otherwise.

以下、本発明の好ましい実施形態を添付された図面を参照して詳細に説明する。まず、各図面の構成要素に参照符号を付加するにおいて、同一の構成要素に対しては、たとえ他の図面上に表示されても、同一の符号を持つことに留意されたい。また、本発明を説明するに当たり、関連した公知の構成または機能に対する具体的な説明が本発明の要旨を曖昧にすると判断される場合には、その詳細な説明は省略する。   Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. First, in adding reference numerals to the components of each drawing, it should be noted that the same components have the same symbols even if they are displayed on other drawings. Further, in describing the present invention, when it is determined that a specific description of a related known configuration or function obscures the gist of the present invention, a detailed description thereof is omitted.

本発明に係るフレームワーク提供装置は、大容量の順次収集データを処理するためのフレームワークを提供するプログラムコードが格納された不揮発性メモリと、前記プログラムコードを実行する少なくとも一つのプロセッサを含む。ここで、フレームワークを提供する装置は、外部のデータ提供装置、分散型データストア、ユーザ端末間でのデータの収集、処理及び/または加工、検索などの役割を行なうサーバ装置であり得る。   A framework providing apparatus according to the present invention includes a non-volatile memory storing program code for providing a framework for processing large-capacity sequentially collected data, and at least one processor for executing the program code. Here, the device that provides the framework may be an external data providing device, a distributed data store, or a server device that plays a role of data collection, processing and / or processing, search, etc. between user terminals.

本発明に係るフレームワーク提供装置において、前記プログラムコードの実行は、一つの「タスク」または「プロセス」単位で処理することができ、前記プログラムコードの実行結果、大容量の順次収集データを処理するためのフレームワークが生成される。図1には本発明の実施形態に係る大容量の順次収集データを処理するためのフレームワーク提供装置から提供されるフレームワークの構成が示されている。   In the framework providing apparatus according to the present invention, the execution of the program code can be processed in units of one “task” or “process”, and the execution result of the program code and a large amount of sequentially collected data are processed. A framework is generated. FIG. 1 shows a configuration of a framework provided from a framework providing apparatus for processing large-capacity sequentially collected data according to an embodiment of the present invention.

図1を参照すると、本発明の実施形態に係る大容量の業務順次収集データ処理フレームワークは、データ収集モジュール101、データ格納モジュール102、データ処理モジュール104、データ管理政策モジュール105、モジュール構成管理者106、データサービス提供者107を有する。   Referring to FIG. 1, a large-capacity business sequential collection data processing framework according to an embodiment of the present invention includes a data collection module 101, a data storage module 102, a data processing module 104, a data management policy module 105, and a module configuration manager. 106, and a data service provider 107.

データ収集モジュール101は、様々な種類のデータを提供する外部データ提供システムと連動してデータを収集し、収集されたデータ(以下、ソースデータ)に対して、ユーザ定義基盤の前処理を行なう。前処理過程を経たソースデータはデータ格納モジュール102に転送される。   The data collection module 101 collects data in conjunction with an external data providing system that provides various types of data, and performs pre-processing on a user-defined basis for the collected data (hereinafter, source data). The source data that has undergone the preprocessing process is transferred to the data storage module 102.

データ収集モジュール101は、外部データ提供システム連動機能とデータ解析などの使用者定義基盤の前処理機能を登録できるユーザインターフェースを提供する。   The data collection module 101 provides a user interface capable of registering a user-defined base preprocessing function such as an external data providing system interlocking function and data analysis.

これにより、外部のデータ提供システムとの連動方式が変更されても、ユーザはデータ格納モジュール102を変更することなくデータ収集モジュール101の外部データ提供システム連動機能のみを変更することによって、外部変更に対応することができる。   As a result, even if the linkage method with the external data providing system is changed, the user can change to the external change by changing only the external data providing system linkage function of the data collection module 101 without changing the data storage module 102. Can respond.

データ収集モジュール101は、Pull方式とPush方式で動作するが、Pull方式は、外部データ提供システムにデータ要求を周期的に行なってデータを収集する方式であり、Push方式は、データ受信待機状態で外部データ提供システムからデータを転送すると、これを収集する方式を言う。   The data collection module 101 operates in the Pull method and the Push method, but the Pull method is a method of collecting data by periodically making a data request to the external data providing system, and the Push method is in a data reception standby state. A method of collecting data transferred from an external data providing system.

データ格納モジュール102は、データ収集モジュール101から転送されたデータのソースを分散型ストア103に格納する機能と、ユーザ定義に基づいたソースデータ格納ルールを登録できるインターフェースを提供する。ユーザは、データ格納モジュール102を利用して、分散型ストア103にソースデータを格納し、維持、管理することによって、今後新たなサービスの提供や既存のサービスの変更が必要な状況においてもスムーズに対応することができ、データ処理結果のエラー検証にも活用することができる。また、ユーザは、データ格納モジュール102に転送されたソースデータから必要なデータの抽出作業、またはソースデータの加工作業が必要な場合、データ格納モジュール102にデータ処理モジュール104を登録することができる。データ格納モジュール102は、自身に登録されたデータ処理モジュール104が存在する場合、そのデータ処理モジュール104のデータ処理方式に応じて、該当ソースデータを即時転送したり、分散型ストア103に格納されたソースデータの格納情報(データ提供者、データ発生時刻、データ格納経路など)を通知する。   The data storage module 102 provides a function for storing the source of data transferred from the data collection module 101 in the distributed store 103 and an interface for registering source data storage rules based on user definitions. Users can use the data storage module 102 to store, maintain, and manage source data in the distributed store 103 so that they can smoothly provide new services or change existing services in the future. It can be used for error verification of data processing results. Further, the user can register the data processing module 104 in the data storage module 102 when necessary data extraction work or source data processing work is required from the source data transferred to the data storage module 102. When the data processing module 104 registered in the data storage module 102 exists, the data storage module 102 transfers the corresponding source data immediately or stores it in the distributed store 103 according to the data processing method of the data processing module 104. Notify the source data storage information (data provider, data generation time, data storage path, etc.).

一方、分散型ストア103は、データ格納モジュール102から格納要求を受けたソースデータとデータ処理モジュール104によって発生された加工データを格納し管理する機能を提供する。分散型ストア103は、データを格納できる複数の情報機器を直接またはネットワークに接続して構成し、必要に応じて装置を単に追加するだけで、データ格納スペースと処理能力を向上させることができる。   On the other hand, the distributed store 103 provides a function of storing and managing source data received from the data storage module 102 and processed data generated by the data processing module 104. The distributed store 103 is configured by connecting a plurality of information devices capable of storing data directly or connected to a network, and by simply adding a device as necessary, the data storage space and the processing capability can be improved.

図4は、本発明で述べたフレームワークを構成する分散型ストア401のデータ格納スペースが不足した状況で、格納スペースを拡張するステップに関するものである。図4aは、複数の分散ノード(402−1、402−2・・・、402−n)で構成された分散型ストア401を構築した環境を示している。図4bは、データ量が急増する状況において、新しい分散ノード(402−n+1)を分散型ストア401に追加することによって、データ格納スペースを拡張した実施形態を示す。   FIG. 4 relates to the step of expanding the storage space in a situation where the data storage space of the distributed store 401 constituting the framework described in the present invention is insufficient. FIG. 4a shows an environment in which a distributed store 401 composed of a plurality of distributed nodes (402-1, 402-2,..., 402-n) is constructed. FIG. 4b shows an embodiment in which the data storage space is expanded by adding a new distributed node (402-n + 1) to the distributed store 401 in a situation where the amount of data increases rapidly.

図1に示されたデータ処理モジュール104は、データ格納モジュール102から転送または通知されたデータを、ユーザが定義したデータ処理ルールに基づいて処理し、その処理結果として生成された加工データを分散型ストア103に格納する機能を提供する。   The data processing module 104 shown in FIG. 1 processes the data transferred or notified from the data storage module 102 based on the data processing rules defined by the user, and the processed data generated as a result of the processing is distributed. A function of storing in the store 103 is provided.

データ処理モジュール104は、ユーザ定義基盤データ処理機能と加工データ格納ルールを登録できるユーザインターフェースを提供する。データ処理モジュール104に登録されたユーザ定義基盤データ処理ルールは、ユーザの設定に応じて、周期的に行う方式と即時に行う方式で動作することができる。   The data processing module 104 provides a user interface capable of registering user-defined infrastructure data processing functions and processing data storage rules. The user-defined infrastructure data processing rules registered in the data processing module 104 can operate in a periodic manner or an immediate manner according to user settings.

ここで、周期的に行う方式は、一定の時間間隔でユーザ定義基盤データ処理機能を行い、即時に行う方式は、データを転送または通知されてから即時にユーザ定義基盤データ処理機能を行なう。   Here, the method performed periodically performs the user-defined infrastructure data processing function at regular time intervals, and the method performed immediately performs the user-defined infrastructure data processing function immediately after the data is transferred or notified.

データ処理モジュール104は、ユーザ定義基盤データ処理機能を行なった結果、生成された加工データを分散型ストア103に格納するに当たり、分散型ストア103の特定領域にデータが集中して格納されることを防止するために、データ管理政策モジュール105から提供する加工データ分配ルール情報を利用して加工データを格納する。以下、データ管理政策モジュール105について詳細に説明する。   As a result of performing the user-defined infrastructure data processing function, the data processing module 104 determines that data is concentrated and stored in a specific area of the distributed store 103 when storing the generated processed data in the distributed store 103. In order to prevent this, the processing data distribution rule information provided from the data management policy module 105 is used to store the processing data. Hereinafter, the data management policy module 105 will be described in detail.

データ管理政策モジュール105は、データ処理モジュール104から発生された加工データが分散型ストア103の特定の領域に偏って格納されることによって、分散型ストア103の性能が低下することを防止するために、加工データを分散型ストア103の全領域に均等に格納するためのデータ分配ルールを登録し検索できるユーザインターフェースを提供する。分散型ストア103の実施形態のうちKey−Value分散型ストアの場合、データのkey値によってデータの配分が行われるので、ユーザは、データを均等に格納できるkey値生成ルールをデータ管理政策モジュール105に登録することによって、分散型ストア103の性能低下を防止することができる。   The data management policy module 105 prevents the performance of the distributed store 103 from being deteriorated by storing the processed data generated from the data processing module 104 in a specific area in the distributed store 103. A user interface capable of registering and searching for data distribution rules for storing processed data evenly in all areas of the distributed store 103 is provided. In the case of the key-value distributed store among the embodiments of the distributed store 103, the data is distributed according to the key value of the data. By registering with, the performance degradation of the distributed store 103 can be prevented.

以下、図5を参照して、Key−Value分散型ストアでkey値生成ルールに基づいてデータを格納する方式の一例を見てみる。図5は、本発明の実施形態によってキー・バリュー分散型ストアでユーザ定義基盤データの格納方式を説明するための図である。   Hereinafter, an example of a method for storing data based on the key value generation rule in the key-value distributed type store will be described with reference to FIG. FIG. 5 is a diagram for explaining a storage method of user-defined infrastructure data in a key / value distributed store according to an embodiment of the present invention.

図5aのテーブル501は、流通イベントのkey値を、発生時刻、流通イベントIDの順で構成した一例であって、最近発生した流通イベントがテーブルの端部分に格納される。図5bのテーブル502は流通イベントのkey値を流通イベントID、発生時刻の順で構成した一例であって、流通イベントが流通イベントID単位で群集されて格納される。   The table 501 in FIG. 5A is an example in which the distribution event key value is configured in the order of occurrence time and distribution event ID, and the recently generated distribution event is stored in the end portion of the table. A table 502 in FIG. 5B is an example in which the key value of the distribution event is configured in the order of the distribution event ID and the generation time, and the distribution event is collected and stored in units of distribution event ID.

図6は、図5aのテーブル501と図5bのテーブル502の一例によって、流通イベントデータがKey−Value分散型ストア601内に分配されて格納された状況を比較したもので、Key−Value分散型ストア601は複数の分散ノード602で構成され、大量の流通イベントデータは複数の分散ノード602のデータ格納領域603に分配されて格納される。   FIG. 6 is a comparison of the situation where distribution event data is distributed and stored in the key-value distributed store 601 using the example of the table 501 in FIG. 5a and the table 502 in FIG. 5b, and the key-value distributed type. The store 601 includes a plurality of distributed nodes 602, and a large amount of distribution event data is distributed and stored in the data storage areas 603 of the plurality of distributed nodes 602.

図6aの場合、最近発生した流通イベントデータが特定のデータ領域603に偏って格納されることによって、特定の分散ノード602に流通イベント格納作業への負荷が集中されてKey−Value分散型ストア601の全体的な性能が低下する反面、図6bの場合には、最近発生した流通イベントデータが、複数の分散ノード602に分配されて格納されることによって流通イベント格納作業への負荷を分散させることができる。   In the case of FIG. 6 a, distribution event data that has recently occurred is stored in a specific data area 603, so that the load on the distribution event storage work is concentrated on a specific distributed node 602, and the key-value distributed store 601. On the other hand, in the case of FIG. 6B, the distribution event data that has recently occurred is distributed to and stored in a plurality of distributed nodes 602, thereby distributing the load on the distribution event storage work. Can do.

一方、図1に示されたモジュール構成管理者106は、データ収集モジュール101、データストアモジュール102、データ処理モジュール104、データ管理政策モジュール105間の関係設定によって、ユーザ定義基盤データ処理ステップを設定、生成、検索、管理できる機能を提供する。   On the other hand, the module configuration manager 106 shown in FIG. 1 sets user-defined infrastructure data processing steps by setting the relationship among the data collection module 101, the data store module 102, the data processing module 104, and the data management policy module 105. Provide functions that can be created, searched, and managed.

データサービス提供者107は、モジュール構成管理者106によって生成されたユーザ定義基盤データの処理ステップを行なった結果であって、分散型ストア103に格納されたデータを利用したデータサービスを提供する。   The data service provider 107 provides a data service using the data stored in the distributed store 103 as a result of processing the user-defined infrastructure data generated by the module configuration manager 106.

例えば、データサービス提供者107は、データサービスを提供するに当たり、必要なデータの効率的検索のためにデータ管理政策モジュール105に登録されたデータ分配ルール情報を活用してデータサービスを提供する。   For example, when providing a data service, the data service provider 107 uses the data distribution rule information registered in the data management policy module 105 to provide the data service for efficient retrieval of necessary data.

以下、図2を参照して本発明の実施形態に係る大容量の順次収集データを処理するためのフレームワーク提供装置を活用したシステムの一例を見てみる。   Hereinafter, an example of a system using a framework providing apparatus for processing large-capacity sequentially collected data according to an embodiment of the present invention will be described with reference to FIG.

図2は、本発明で説明したフレームワーク提供装置を活用したシステムの一例を示す概念図であり、センサネットワーク251から発生されるセンサデータを活用したセンサ情報検索サービスと、物流/流通ネットワーク252から発生される流通イベントデータを活用した流通情報検索サービスに関するものである。   FIG. 2 is a conceptual diagram showing an example of a system using the framework providing apparatus described in the present invention. From a sensor information search service using sensor data generated from the sensor network 251 and a distribution / distribution network 252. The present invention relates to a distribution information search service that utilizes generated distribution event data.

まず、図1に示されたフレームワークを利用してセンサ情報検索サービスを提供しようとするユーザは、センサデータ処理プロセス210とセンサ情報検索サービス220を生成することができる。   First, a user who intends to provide a sensor information search service using the framework shown in FIG. 1 can generate a sensor data processing process 210 and a sensor information search service 220.

ユーザは、フレームワークを利用してセンサデータ収集モジュール211、センサデータ格納モジュール212、センサデータ加工モジュール213、時系列パターン抽出モジュール214、センサデータ管理政策モジュール215、時系列パターン管理政策モジュール216を生成し、図1のモジュール構成管理106を利用して生成されたモジュール間の関係を設定して、センサデータ処理プロセス210を構成することができる。   The user uses the framework to generate a sensor data collection module 211, a sensor data storage module 212, a sensor data processing module 213, a time series pattern extraction module 214, a sensor data management policy module 215, and a time series pattern management policy module 216. Then, the relationship between the modules generated using the module configuration management 106 of FIG. 1 can be set to configure the sensor data processing process 210.

一方、図2における「モジュール」は、図1のフレームワークを介してユーザが生成した中間プログラムまたは中間プロセスとして一つに一括して特定の機能を行なう他のプログラムとしても再利用できる形となっていることを意味する。このような複数の「モジュール」集合への関係設定によって、センサデータ処理プロセスまたは流通イベント処理プロセスのような最終プロセスが生成される。   On the other hand, the “module” in FIG. 2 can be reused as an intermediate program generated by the user through the framework of FIG. 1 or another program that performs a specific function as an intermediate process. Means that The final process such as the sensor data processing process or the distribution event processing process is generated by setting the relationship to the plurality of “module” sets.

さらに図2に戻って、ユーザは、図1のデータ収集モジュール101から提供される外部データ提供システム連動機能とデータ前処理機能を登録できるユーザインターフェースを利用して、センサネットワーク連動機能とセンサデータ前処理機能を登録することによって、センサデータ収集モジュール211を生成することができる。   Further, referring back to FIG. 2, the user uses the user interface that can register the external data providing system interlocking function and the data preprocessing function provided from the data collection module 101 of FIG. By registering the processing function, the sensor data collection module 211 can be generated.

また、ユーザは、図1のデータ格納モジュール102から提供されるソースデータ格納ルール登録ユーザインターフェースを利用して、センサデータ格納ルールを登録することによって、センサデータ格納モジュール212を生成することができる。   Further, the user can generate the sensor data storage module 212 by registering the sensor data storage rule using the source data storage rule registration user interface provided from the data storage module 102 of FIG.

また、ユーザは、図1のデータ処理モジュール104から提供されるユーザ定義基盤データ処理機能と加工データ格納ルールを登録できるユーザインターフェースを利用して、センサデータ加工機能とセンサデータ格納ルールを登録することによって、センサデータ加工モジュール213を生成し、時系列パターン抽出機能と、時系列パターン格納ルールを登録することによって、時系列パターン抽出モジュール214を生成することができる。   In addition, the user registers the sensor data processing function and the sensor data storage rule using the user interface that can register the user-defined infrastructure data processing function and the processing data storage rule provided from the data processing module 104 of FIG. Thus, the time series pattern extraction module 214 can be generated by generating the sensor data processing module 213 and registering the time series pattern extraction function and the time series pattern storage rule.

また、ユーザは、センサデータ加工機能の場合、センサネットワークから収集されたセンサデータに対し即時処理が必要なため、センサデータ加工モジュール213を即時に行う方式に設定し、時系列パターン抽出機能の場合、一定時間収集されセンサデータに対する処理が要求される作業であるため、時系列パターン抽出モジュール214を周期的に行う方式に設定することができる。   Further, in the case of the sensor data processing function, the user needs to immediately process the sensor data collected from the sensor network, so the sensor data processing module 213 is set to a method of performing immediately, and in the case of the time series pattern extraction function Since this is an operation that requires processing for sensor data collected for a certain period of time, the time-series pattern extraction module 214 can be set to perform periodically.

また、ユーザは、図1のデータ管理政策モジュール105から提供されるデータ分配ルール登録ユーザインターフェースを利用して、センサデータ分配ルールを登録することによって、センサデータ管理政策モジュール215を生成し、時系列パターンデータ分配ルールを登録することによって、時系列パターン管理政策モジュール216を生成することができる。   Also, the user registers the sensor data distribution rule using the data distribution rule registration user interface provided from the data management policy module 105 of FIG. By registering the pattern data distribution rule, the time series pattern management policy module 216 can be generated.

また、ユーザは、図1のデータサービス提供者107から提供されるデータ管理政策モジュール105と分散型ストア103アクセス機能を利用して、センサデータ統計検索サービス221と、時系列パターン検索サービス222を生成することができる。   Further, the user generates a sensor data statistical search service 221 and a time series pattern search service 222 by using the data management policy module 105 and the distributed store 103 access function provided by the data service provider 107 of FIG. can do.

センサデータ統計検索サービス221は、センサデータ統計検索要求に対してセンサデータ管理政策モジュール215に登録されたセンサデータ分配ルール情報を利用して、該当検索条件を満たすセンサデータの格納領域を判別し、その領域内のセンサデータに対する統計処理によってセンサ統計検索要求を効率的に処理することができる。   The sensor data statistical search service 221 uses the sensor data distribution rule information registered in the sensor data management policy module 215 in response to the sensor data statistical search request to determine the storage area of the sensor data that satisfies the search condition, Sensor statistical search requests can be efficiently processed by statistical processing on sensor data in the area.

時系列パターン検索サービス222は、時系列パターン検索要求に対して、時系列パターン管理政策モジュール216に登録された時系列パターンデータ分配ルール情報を利用して、該当検索条件を満たす時系列パターン格納領域を判別し、時系列パターン検索要求を効率的に処理することができる。   The time series pattern search service 222 uses a time series pattern data distribution rule information registered in the time series pattern management policy module 216 in response to a time series pattern search request, and a time series pattern storage area that satisfies the corresponding search conditions. And a time series pattern search request can be processed efficiently.

また、ユーザは、今後、新しい種類のセンサデータの収集が必要な場合、センサデータ収集モジュール211のセンサデータ前処理機能と、センサデータ格納モジュール212のセンサデータ格納ルールの変更によって、センサデータ処理プロセス210を変更及び拡張することができ、センサデータを活用した新しい情報検索サービスが必要な場合は、該当サービスのためのデータ処理モジュール、データ管理政策、データサービス提供者をフレームワーク内に追加することによって、センサ情報検索サービス220を拡張することができる。   Further, when the user needs to collect new types of sensor data in the future, the sensor data processing process is performed by changing the sensor data preprocessing function of the sensor data collection module 211 and the sensor data storage rule of the sensor data storage module 212. If a new information retrieval service that utilizes sensor data can be modified and expanded, add a data processing module, data management policy, and data service provider for the service to the framework. Thus, the sensor information search service 220 can be extended.

一方で、図1に示されたフレームワークを利用して流通情報検索サービスを提供しようとするユーザは、流通イベント処理プロセス230と流通情報検索サービス240を生成することができる。   On the other hand, a user who intends to provide a distribution information search service using the framework shown in FIG. 1 can generate a distribution event processing process 230 and a distribution information search service 240.

ユーザは、流通イベント収集モジュール231、流通イベント格納モジュール232、流通イベント加工モジュール233、流通履歴抽出モジュール234、流通イベント管理政策モジュール235、流通履歴管理政策モジュール236を生成し、図1のモジュール構成管理者106を利用して生成されたモジュールの関係を設定して流通イベント処理プロセスを構成する。   The user generates a distribution event collection module 231, a distribution event storage module 232, a distribution event processing module 233, a distribution history extraction module 234, a distribution event management policy module 235, and a distribution history management policy module 236, and manages the module configuration of FIG. The distribution event processing process is configured by setting the relationship of the modules generated using the person 106.

ユーザは、図1のデータ収集モジュール101 から提供される外部システム連動機能とデータ前処理機能登録インターフェースを利用して、物流/流通ネットワークから流通イベントを収集するためのHTTPサーバ機能とXML形式の流通イベントメッセージに対する前処理機能を登録することによって、流通イベント収集モジュール231を生成することができる。   The user uses the external system linkage function and the data pre-processing function registration interface provided from the data collection module 101 of FIG. 1, and the HTTP server function for collecting distribution events from the distribution / distribution network and the distribution in the XML format. By registering the preprocessing function for the event message, the distribution event collection module 231 can be generated.

また、ユーザは、図1のデータ格納モジュール102から提供されるソースデータ格納ルール登録インターフェースを利用して、流通イベント格納ルールを登録することによって、流通イベント格納モジュール232を生成することができる。   Further, the user can generate the distribution event storage module 232 by registering the distribution event storage rule using the source data storage rule registration interface provided from the data storage module 102 of FIG.

また、ユーザは、図1のデータ処理モジュール104から提供されるユーザ定義基盤データ処理機能と加工データ格納ルール登録インターフェースを利用して、流通イベント加工機能と流通イベント格納ルールを登録することによって、流通イベント加工モジュール233、流通履歴抽出機能と流通履歴格納ルールを登録することにより、流通履歴抽出モジュール234を生成することができる。また、ユーザは、流通イベント処理機能と流通履歴抽出機能が、リアルタイムでの処理が要求されるため、流通イベント加工モジュール233と流通履歴抽出モジュール234のデータ処理方式を即時に行う方式に設定する。   Further, the user registers the distribution event processing function and the distribution event storage rule by using the user-defined infrastructure data processing function and the processing data storage rule registration interface provided from the data processing module 104 of FIG. By registering the event processing module 233, the distribution history extraction function and the distribution history storage rule, the distribution history extraction module 234 can be generated. In addition, since the distribution event processing function and the distribution history extraction function are required to be processed in real time, the user sets the data processing method of the distribution event processing module 233 and the distribution history extraction module 234 to a method for performing immediately.

また、ユーザは、図1のデータ管理政策モジュール105から提供されるデータ分配ルール登録インターフェースを利用して、流通イベント分配ルールを登録することによって流通イベント管理政策モジュール235、流通履歴分配ルールを登録することにより流通履歴管理政策モジュール236を生成することができる。   The user registers the distribution event management rule module 235 and the distribution history distribution rule by registering the distribution event distribution rule using the data distribution rule registration interface provided from the data management policy module 105 of FIG. Thus, the distribution history management policy module 236 can be generated.

また、ユーザは、図1のデータサービス提供者107から提供されるデータ管理政策モジュール105と分散型ストア103アクセス機能を利用して流通イベント検索サービス241と流通履歴検索サービス242を生成することができる。流通イベント検索サービス241は流通イベント検索要求に対して流通イベント管理政策モジュール235に登録された流通イベント分配ルール情報を利用して、該当条件を満たす流通イベントの格納領域を判別し、該当領域での流通イベント検索によって流通イベント検索要求を効率的に処理することができる。流通履歴検索サービス242は、特定商品への流通履歴検索要求に対し流通履歴管理政策モジュール236に登録された流通履歴分配ルール情報を利用して、該当商品の履歴データが格納された領域を判別し、流通履歴検索要求に対して迅速に応答することができる。   Further, the user can generate the distribution event search service 241 and the distribution history search service 242 using the data management policy module 105 and the distributed store 103 access function provided by the data service provider 107 of FIG. . In response to the distribution event search request, the distribution event search service 241 uses the distribution event distribution rule information registered in the distribution event management policy module 235 to determine the storage area of the distribution event that satisfies the corresponding condition. Distribution event search requests can be efficiently processed by distribution event search. The distribution history search service 242 uses the distribution history distribution rule information registered in the distribution history management policy module 236 in response to a distribution history search request for a specific product, and determines an area in which the history data of the corresponding product is stored. , It is possible to quickly respond to the distribution history search request.

また、ユーザは、今後、各物流倉庫に保管中の商品への在庫情報検索サービスが必要な場合は、該当サービスのためのデータ処理モジュール、データ管理政策モジュール、データサービス提供者を生成し、既存の流通イベント格納モジュール232から流通イベントが転送されることによって在庫情報検索サービスを提供する。   In addition, when the user needs an inventory information search service for products stored in each distribution warehouse in the future, the user creates a data processing module, a data management policy module, and a data service provider for the corresponding service. The distribution event is transferred from the distribution event storage module 232 to provide an inventory information search service.

一方、本発明に係るフレームワーク提供装置は、フレームワークを利用して様々な分野でデータを効率的に処理できる方法を提供することができる。   On the other hand, the framework providing apparatus according to the present invention can provide a method capable of efficiently processing data in various fields using the framework.

図3には本発明で説明したフレームワークを利用して物流/流通ネットワーク302で商品の流通過程で発生する流通イベントデータを収集、処理、検索機能を提供する物流/流通データ共有システム301の様々な実施形態が示される。   FIG. 3 illustrates various distribution / distribution data sharing systems 301 that provide functions for collecting, processing, and searching distribution event data generated in the distribution process of goods in the distribution / distribution network 302 using the framework described in the present invention. Embodiments are shown.

物流/流通データ共有システム301は、商品の製造から販売までの流通の全過程で発生する流通イベントを多数の物流/流通の参加者が共有できる環境を提供することによって、様々な種類のアプリケーションシステムを構築することができる。図3の医薬品流通履歴追跡システム303は、物流/流通データ共有システム301から医薬品に対する流通イベントが提供され、医薬品の流通状況をリアルタイムでモニタリングすることにより、違法医薬品が流通される事故を未然に防止することができる。図3の在庫管理システム304は、物流/流通データ共有システム301から各物流/流通拠点で商品の入出庫数量が提供され、各商品の在庫状況を把握することによって、在庫切れまたは過剰問題が発生する前に在庫管理計画を策定することができる。図3の有効期限管理システム305は、物流/流通データ共有システム301から食品に対する流通イベントが提供され、有効期限が切れた食品が流通されて消費者の健康を害する問題を防ぐことができる。図3の違法取引追跡システム306は、物流/流通データ共有システム301から商品の取引データが提供され、商品に対する不正取引状況を追跡することができる。   The distribution / distribution data sharing system 301 provides various environments of application systems by providing an environment in which a large number of distribution / distribution participants can share distribution events that occur in the entire distribution process from manufacture to sale of products. Can be built. The drug distribution history tracking system 303 in FIG. 3 prevents an accident in which illegal drugs are distributed by monitoring distribution of drugs in real time by providing distribution events for drugs from the distribution / distribution data sharing system 301. can do. The inventory management system 304 in FIG. 3 is provided with the quantity of goods in and out of each physical distribution / distribution base from the physical distribution / distribution data sharing system 301, and an out-of-stock or excess problem occurs by grasping the stock status of each commodity. An inventory management plan can be developed before The expiration date management system 305 of FIG. 3 is provided with a distribution event for food from the distribution / distribution data sharing system 301, and can prevent the problem of harming consumers' health due to distribution of expired food. The illegal transaction tracking system 306 of FIG. 3 is provided with the transaction data of the product from the logistics / distribution data sharing system 301, and can track the status of illegal transactions for the product.

以下、図7を参照して本発明の実施形態に係るフレームワーク提供装置で行なわれるデータ処理方法について詳細に説明する。データの処理は、ユーザ定義によって生成された中間プロセスによりそれぞれ行われ、フレームワークは中間プロセスを生成できるようにするユーザインターフェースをユーザに提供する。   Hereinafter, a data processing method performed by the framework providing apparatus according to the embodiment of the present invention will be described in detail with reference to FIG. Data processing is performed by intermediate processes created by user definitions, respectively, and the framework provides the user with a user interface that allows the intermediate processes to be created.

具体的に説明すると、本発明の実施形態に係るフレームワーク提供装置は、ユーザインターフェースを介して登録される外部システム連動機能とデータ前処理機能に基づいて、データ収集プロセスを生成し、ユーザインターフェースを介して登録されたユーザが定義したソースデータ格納ルールに基づいて、ソースデータ格納プロセスを生成する。   More specifically, the framework providing apparatus according to the embodiment of the present invention generates a data collection process based on the external system linkage function and the data preprocessing function registered via the user interface, A source data storage process is generated based on the source data storage rules defined by the user registered through the user interface.

また、フレームワーク提供装置は、ユーザインタフェースを介して登録されたユーザ定義基盤データ処理機能と前記加工データ格納ルールに基づいて、少なくとも一つ以上のソースデータ処理プロセスを生成し、前記加工データを、前記分散型データストアに分配して格納するためのデータ分配ルールを登録し、前記データ分配ルールに基づいて加工データ分配プロセスを生成する。   In addition, the framework providing device generates at least one source data processing process based on the user-defined infrastructure data processing function registered through the user interface and the processing data storage rule, A data distribution rule to be distributed and stored in the distributed data store is registered, and a processed data distribution process is generated based on the data distribution rule.

最後に、フレームワーク提供装置は、前記それぞれのプロセス間の関係設定によって、ユーザ定義基盤データを処理するための統合プロセスを生成してデータを処理する。   Finally, the framework providing apparatus generates an integrated process for processing the user-defined infrastructure data according to the relationship setting between the processes and processes the data.

図7を参照すると、まず、データ収集モジュール101は、様々な種類のデータを提供する外部データ提供システムと連動してデータを収集し、収集されたデータ(以下、ソースデータ)に対して、ユーザ定義基盤の前処理を行なう。前処理過程を経たソースデータは、データ格納モジュール102に転送される(S10)。   Referring to FIG. 7, first, the data collection module 101 collects data in conjunction with an external data providing system that provides various types of data, and the collected data (hereinafter referred to as source data) is a user. Predefine the definition base. The source data that has undergone the preprocessing process is transferred to the data storage module 102 (S10).

そして、データ格納モジュール102は、データ収集モジュール101から転送されたデータのソースを分散型ストア103に格納する(S20)。この時、データ格納モジュール102は、ユーザ定義によるソースデータ格納ルールに基づいて、ソースデータを格納し、維持、管理することによって、今後新たなサービスの提供や既存のサービスの変更が必要な状況においてもスムーズに対応することができ、データ処理結果のエラー検証にも活用することができる。   Then, the data storage module 102 stores the data source transferred from the data collection module 101 in the distributed store 103 (S20). At this time, the data storage module 102 stores, maintains, and manages source data based on user-defined source data storage rules, so that it is necessary to provide a new service or change an existing service in the future. Can also be used for error verification of data processing results.

以下、データ処理モジュール104は、データ格納モジュール102から転送または通知されたデータを、ユーザが定義したデータ処理ルールに基づいて処理し、その処理結果として生成された加工データを分散型ストア103に格納する機能を提供する(S30)。   Hereinafter, the data processing module 104 processes the data transferred or notified from the data storage module 102 based on the data processing rules defined by the user, and stores the processed data generated as a result of the processing in the distributed store 103. The function to perform is provided (S30).

一方、データ管理政策モジュール105は、データ処理モジュール104から発生された加工データが分散型ストア103の特定領域に偏って格納されることによって、分散型ストア103の性能が低下する問題を防止するために、加工データを分散型ストア103の全領域に均等に格納するためのデータ分配ルールを登録して検索できるユーザインタフェースを提供する(S40)。ユーザインターフェースを介して加工データを分散格納するためのデータ分配ルールが登録されると、データ処理モジュール104は、前記データ分配ルールに基づいて加工データを分散型ストア103に分配して格納する(S50)。   On the other hand, the data management policy module 105 prevents the problem that the performance of the distributed store 103 deteriorates due to the processing data generated from the data processing module 104 being stored in a specific area of the distributed store 103. In addition, a user interface capable of registering and searching for data distribution rules for storing processed data evenly in all areas of the distributed store 103 is provided (S40). When the data distribution rule for distributing and storing the processed data is registered through the user interface, the data processing module 104 distributes and stores the processed data in the distributed store 103 based on the data distribution rule (S50). ).

以降、データサービス提供者107から前記分散型ストア103に格納されたソースデータまたは加工データに対する検索要求がある場合、データサービス提供者107は、データサービスを提供するに当たり必要なデータの効率的な検索のためにデータ管理政策モジュール105に登録されたデータ分配ルール情報を活用してデータサービスをユーザに提供する(S60)。   Thereafter, when there is a search request for the source data or the processed data stored in the distributed store 103 from the data service provider 107, the data service provider 107 performs an efficient search for data necessary for providing the data service. Therefore, the data distribution rule information registered in the data management policy module 105 is utilized to provide a data service to the user (S60).

一方、前述した本発明に係るフレームワーク提供装置でのデータ処理方法は、コンピュータで読み取り可能な記録媒体にコンピュータが読み取り可能なコードとして実装されるのが可能になる。コンピュータが読み取り可能な記録媒体としては、コンピュータシステムによって解読できるデータが格納された全ての種類の記録媒体を含む。例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、磁気テープ、磁気ディスク、フラッシュメモリ、光データ記憶装置などがある。また、コンピュータで読み取り可能な記録媒体は、コンピュータネットワークに接続されたコンピュータシステムに分散され、分散方式で読み取り可能なコードとして格納され、行なわれる。   On the other hand, the above-described data processing method in the framework providing apparatus according to the present invention can be implemented as a computer-readable code on a computer-readable recording medium. Computer-readable recording media include all types of recording media that store data that can be decoded by a computer system. For example, there are ROM (Read Only Memory), RAM (Random Access Memory), magnetic tape, magnetic disk, flash memory, optical data storage device, and the like. A computer-readable recording medium is distributed in a computer system connected to a computer network, and stored and executed as a code that can be read in a distributed manner.

本発明の属する技術分野において通常の知識を持つ者は、本発明がその技術的思想や必須的な特徴を変更せずに他の具体的な形で実施できるということが分かる。従って、上述した実施形態は全ての面で例示的なものであって限定的なものではないものと理解しなければならない。本発明の保護範囲は、上記の詳細な説明よりは、後述する特許請求の範囲によって示され、特許請求の範囲及びその均等概念から導き出される全ての変更または変形された形態が本発明の範囲に含まれるものと解釈しなければならない。   Those having ordinary knowledge in the technical field to which the present invention pertains will understand that the present invention can be implemented in other specific forms without changing the technical idea and essential features thereof. Therefore, it should be understood that the above-described embodiment is illustrative in all aspects and not restrictive. The protection scope of the present invention is indicated by the following claims rather than the above detailed description, and all modifications or variations derived from the claims and their equivalents are within the scope of the present invention. It must be interpreted as included.

Claims (13)

大容量の順次収集データを処理するためのフレームワーク提供装置でのデータ処理方法において、
外部のデータ提供装置から収集されたソースデータに対してユーザ定義基盤の前処理を行なうステップと、
前記ソースデータをユーザが定義した格納ルールに基づいて分散型データストアに格納するステップと、
ユーザが定義したデータ処理ルールに基づいて前記ソースデータまたは前記ソースデータの格納情報を処理して加工データを生成するステップと、
前記加工データを前記分散型データストアに分配して格納するためのデータ分配ルールを登録するステップと、及び
前記データ分配ルールに基づいて前記加工データを前記分散型データストアに分配して格納するステップと、
を有するデータ処理方法。
In a data processing method in a framework providing apparatus for processing a large amount of sequentially collected data,
Pre-processing user-defined infrastructure for source data collected from an external data provider;
Storing the source data in a distributed data store based on user-defined storage rules;
Processing the source data or stored information of the source data based on a user-defined data processing rule to generate processed data;
Registering a data distribution rule for distributing and storing the processed data in the distributed data store; and distributing and storing the processed data in the distributed data store based on the data distribution rule When,
A data processing method.
前記分散型データストアに格納された前記ソースデータまたは前記加工データにユーザ検索がある場合、前記ユーザが定義した格納ルールまたは前記データ分配ルールを参照して前記ソースデータまたは前記加工データをユーザ端末に転送するステップをさらに有する請求項1に記載のデータ処理方法。   When there is a user search in the source data or the processed data stored in the distributed data store, the source data or the processed data is referred to the user terminal by referring to the storage rule or the data distribution rule defined by the user. The data processing method according to claim 1, further comprising a transferring step. 前記ユーザ定義基盤の前処理を行なうステップは、
ユーザインターフェースを介して登録される外部システム連動機能とデータ前処理機能に基づいてデータ収集プロセスを生成するステップを有する請求項1に記載のデータ処理方法。
The step of pre-processing the user-defined infrastructure includes:
The data processing method according to claim 1, further comprising a step of generating a data collection process based on an external system linkage function and a data preprocessing function registered via a user interface.
前記分散型データストアに格納するステップは、
ユーザインターフェースを介して登録されるユーザが定義したソースデータ格納ルールに基づいてソースデータ格納プロセスを生成するステップを有する請求項1に記載のデータ処理方法。
Storing in the distributed data store comprises:
The data processing method according to claim 1, further comprising the step of generating a source data storage process based on user-defined source data storage rules registered via a user interface.
前記加工データを生成するステップは、
ユーザインターフェースを介して登録されたユーザ定義基盤データ処理機能と前記ユーザが定義したデータ処理ルールに基づいて少なくとも一つ以上のソースデータ処理プロセスを生成するステップを有する請求項1に記載のデータ処理方法。
The step of generating the machining data includes:
The data processing method according to claim 1, further comprising: generating at least one source data processing process based on a user-defined infrastructure data processing function registered through a user interface and a data processing rule defined by the user. .
前記データ分配ルールを登録するステップは、
前記分散型データストアがキー・バリュー(key−value)分散型データストアである場合、前記加工データを均等に格納できるキー値生成ルールを登録するステップを有する請求項1に記載のデータ処理方法。
The step of registering the data distribution rule includes:
The data processing method according to claim 1, further comprising a step of registering a key value generation rule capable of storing the processed data evenly when the distributed data store is a key-value distributed data store.
大容量の順次収集データを処理するためのフレームワークを提供するプログラムコード(code)が格納された不揮発性メモリと、前記プログラムコードを行なう少なくとも一つのプロセッサを有する装置において、
前記フレームワークは、
外部のデータ提供装置から収集されたソースデータに対して、ユーザ定義基盤の前処理を行なうデータ収集モジュールと、
前記ソースデータをユーザが定義した格納ルールに基づいて分散型データストアに格納するデータ格納モジュールと、
ユーザが定義したデータ処理ルールに基づいて前記ソースデータまたは前記ソースデータの格納情報を処理して加工データを生成するデータ処理モジュールと、
前記加工データを前記分散型データストアに分配して格納するためのデータ分配ルールを登録するデータ管理政策モジュールを提供するフレームワーク提供装置。
In an apparatus having a non-volatile memory storing a program code (code) for providing a framework for processing a large amount of sequentially collected data, and at least one processor for executing the program code,
The framework is
A data collection module that performs user-defined infrastructure preprocessing on source data collected from an external data providing device;
A data storage module for storing the source data in a distributed data store based on storage rules defined by a user;
A data processing module that processes the source data or stored information of the source data based on a user-defined data processing rule to generate processed data;
A framework providing apparatus for providing a data management policy module for registering a data distribution rule for distributing and storing the processed data in the distributed data store.
前記データ収集モジュールは、
外部システム連動機能とデータ解析を有するユーザ定義基盤前処理機能を登録できるユーザインターフェースを提供する請求項7に記載のフレームワーク提供装置。
The data collection module includes:
8. The framework providing apparatus according to claim 7 , which provides a user interface capable of registering a user-defined infrastructure preprocessing function having an external system linkage function and data analysis.
前記データ格納モジュールは、
ユーザ定義によるソースデータ格納ルールを登録できるユーザインターフェースを提供する請求項7に記載のフレームワーク提供装置。
The data storage module includes:
8. The framework providing apparatus according to claim 7 , which provides a user interface capable of registering user-defined source data storage rules.
前記データ格納モジュールは、
前記ソースデータから必要なデータ抽出作業または前記ソースデータへの加工作業が必要な場合、前記データ処理モジュールを登録し、前記データ処理モジュールでユーザが定義したデータ処理ルールに基づいて前記ソースデータを前記データ処理モジュールに転送したり、前記ソースデータの格納情報を通知する請求項7または9に記載のフレームワーク提供装置。
The data storage module includes:
When necessary data extraction work from the source data or processing work to the source data is necessary, the data processing module is registered, and the source data is converted into the source data based on a data processing rule defined by the user in the data processing module. The framework providing apparatus according to claim 7 or 9 , wherein the framework providing apparatus notifies the storage information of the source data by transferring to a data processing module.
前記データ処理モジュールは、
前記ユーザが定義したデータ処理ルールと前記データ分配ルールを登録できるユーザインターフェースを提供する請求項7に記載のフレームワーク提供装置。
The data processing module includes:
The framework providing apparatus according to claim 7 , wherein a user interface capable of registering the data processing rule defined by the user and the data distribution rule is provided.
前記データ処理モジュールは、
ユーザが定義したデータ処理ルールに基づいて前記ソースデータまたは前記ソースデータの格納情報を即時に行う方式または周期的に行う方式で処理する請求項7または11に記載のフレームワーク提供装置。
The data processing module includes:
12. The framework providing apparatus according to claim 7 or 11 , wherein processing is performed by a method in which the source data or storage information of the source data is immediately or periodically performed based on a data processing rule defined by a user.
前記データ管理政策モジュールは、
前記データ分配ルールを登録及び検索できるユーザインターフェースを提供し、前記分散型データストアがキー・バリュー分散型データストアである場合、前記データ分配ルールは前記加工データを均等に格納できるキー値生成ルールである請求項7に記載のフレームワーク提供装置。
The data management policy module includes:
A user interface that can register and search the data distribution rule is provided, and when the distributed data store is a key-value distributed data store, the data distribution rule is a key value generation rule that can store the processed data equally. The framework providing device according to claim 7 .
JP2014117008A 2013-11-28 2014-06-05 Framework providing apparatus for processing large-capacity sequentially collected data and data processing method thereof Expired - Fee Related JP6457747B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020130146106A KR102075386B1 (en) 2013-11-28 2013-11-28 Apparatus for providing franework of processing large-scale data from business sequence and data processing method thereof
KR10-2013-0146106 2013-11-28

Publications (2)

Publication Number Publication Date
JP2015106406A JP2015106406A (en) 2015-06-08
JP6457747B2 true JP6457747B2 (en) 2019-01-23

Family

ID=53436434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014117008A Expired - Fee Related JP6457747B2 (en) 2013-11-28 2014-06-05 Framework providing apparatus for processing large-capacity sequentially collected data and data processing method thereof

Country Status (2)

Country Link
JP (1) JP6457747B2 (en)
KR (1) KR102075386B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106708815B (en) * 2015-07-15 2021-09-17 中兴通讯股份有限公司 Data processing method, device and system
KR102164473B1 (en) * 2015-08-26 2020-10-12 주식회사 케이티 Data sharing apparatus and method for IoT system

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3181058B2 (en) 1995-12-01 2001-07-03 松下電器産業株式会社 Information processing apparatus and method in data transfer network
US7912820B2 (en) * 2003-06-06 2011-03-22 Microsoft Corporation Automatic task generator method and system
KR100527257B1 (en) 2005-08-17 2005-11-09 (주) 픽소니어 Record media written with data structure for real-time processing of huge-sized data and real-time image processing method using that data structure
JP4948276B2 (en) * 2007-06-15 2012-06-06 三菱電機株式会社 Database search apparatus and database search program
JP5589205B2 (en) 2011-02-23 2014-09-17 株式会社日立製作所 Computer system and data management method
JP2012215992A (en) 2011-03-31 2012-11-08 Hammock:Kk Information sharing and utilizing system
KR20150010980A (en) 2011-06-14 2015-01-29 가부시끼가이샤 도시바 Information integrated control system and information processing program, social infra management system, management method, local device, server device, and program
KR101426673B1 (en) * 2012-02-14 2014-08-05 주식회사 케이티 Method of Distributed Indexing and Searching for Effective Analysis of Time Series Data in Search System

Also Published As

Publication number Publication date
KR102075386B1 (en) 2020-02-11
JP2015106406A (en) 2015-06-08
KR20150061864A (en) 2015-06-05

Similar Documents

Publication Publication Date Title
CN102609813B (en) based on the master data management architecture of cloud
US8756686B2 (en) Communication protocol for a containment-aware discovery service
Benyoucef et al. Supply chain network design with unreliable suppliers: a Lagrangian relaxation-based approach
EP1696364A2 (en) Dynamic component management
US20150012566A1 (en) Systems and methods for capturing and managing information pertaining to asset spares inventories
CN102754075A (en) Effectively managing configuration drift
US9672242B2 (en) System for automatically detecting abnormalities statistical data on usage, method therefor, and apparatus applied to same
US20130006989A1 (en) Search Method for a Containment-Aware Discovery Service
Lei et al. A unified approach for location-allocation analysis: integrating GIS, distributed computing and spatial optimization
Solanki et al. EPCIS event-based traceability in pharmaceutical supply chains via automated generation of linked pedigrees
CN106920158A (en) Order real-time monitoring system based on Storm and Kafka technologies
Schulz A genetic algorithm to solve the hybrid flow shop scheduling problem with subcontracting options and energy cost consideration
CN115114359A (en) User data processing method and device
US8832123B2 (en) Filter method for a containment-aware discovery service
JP6457747B2 (en) Framework providing apparatus for processing large-capacity sequentially collected data and data processing method thereof
Cupek et al. Performance evaluation of redundant OPC UA architecture for process control
Hribernik et al. The application of the epcglobal framework architecture to autonomous control in logistics
Dutta et al. Big data analytics for real time systems
CN103246551A (en) Device and method for management of background timed task
CN114266516A (en) Device management method, device, system and storage medium based on graph database
Ioannidis et al. Revenue management in single-stage CONWIP production systems
CN113377877A (en) Multi-engine big data platform
US20060168112A1 (en) Generic integration within an auto-id system
US20240273462A1 (en) Smart asset management framework
BE1024532B1 (en) System and device for processing large amounts of data

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20161117

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180705

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181221

R150 Certificate of patent or registration of utility model

Ref document number: 6457747

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees