JP6716727B2 - ストリーミングデータ分散処理方法及び装置 - Google Patents

ストリーミングデータ分散処理方法及び装置 Download PDF

Info

Publication number
JP6716727B2
JP6716727B2 JP2018566484A JP2018566484A JP6716727B2 JP 6716727 B2 JP6716727 B2 JP 6716727B2 JP 2018566484 A JP2018566484 A JP 2018566484A JP 2018566484 A JP2018566484 A JP 2018566484A JP 6716727 B2 JP6716727 B2 JP 6716727B2
Authority
JP
Japan
Prior art keywords
real
time
time value
processed
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018566484A
Other languages
English (en)
Other versions
JP2019523952A (ja
Inventor
チョンリン フォン
チョンリン フォン
リャン ルオ
リャン ルオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2019523952A publication Critical patent/JP2019523952A/ja
Application granted granted Critical
Publication of JP6716727B2 publication Critical patent/JP6716727B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24532Query optimisation of parallel queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system

Description

本出願は、2016年6月20日付けで出願されると共に「STREAMING DATA DISTRIBUTED PROCESSING METHOD AND DEVICE」という名称を有する中国特許出願第 201610447125.8 号の優先権を主張するものであり、この特許文献のすべての内容は、引用により、そのすべてが本明細書に包含される。
本発明は、データ処理の技術分野に関し、且つ、更に詳しくは、ストリーミングデータ分散処理方法及び装置に関する。
様々なネットワークアプリケーションが人々の日々の生活において益々深く根を下ろすようになるのに伴って、多くのアプリケーションシステムが、テラバイト規模のサービスデータを毎日生成することになる。このデータの海のリアルタイム分析は、アプリケーションシステムにとって大きな価値を有する情報を提供することができる。例えば、トラフィック監視システムによって収集されるビデオデータストリームのリアルタイム分析は、トラフィックフローの制御を支援することが可能であり、且つ、ソーシャルネットワーキングサイト上におけるユーザのアクセス動作のリアルタイム分析は、ホットトピックを即座に見出すと共にこれらを更に多くのユーザに対してプッシュすることができる。
膨大な量のリアルタイムサービスデータは、通常、異なる場所において、異なるソフトウェア及びハードウェアプラットフォーム上において、且つ/又は、異なるタイプのデーベース内において、保存されている。リアルタイムデータ収集システムは、リアルタイムデータ処理を実行するべく、データベース内において、ストリームの形態において、リアルタイムで変化するサービスデータを継続的に収集している。リアルタイムデータ収集システムは、シングルスレッドを使用することにより、実現することも可能であり、或いは、複数のスレッドがリアルタイムデータ収集を同時に実行する状態において分散形態を利用することにより、実現することもできる。
アプリケーションシステムのサービスデータは、任意の時点において更新され得ることから、特に、サービスデータの単一の断片が、恐らくは、非常に短い期間内において複数回にわたって更新され得ることから、シングルスレッドを使用して実装されたリアルタイムデータ収集システムは、ストリーミングデータ内において、最初に更新されたサービスデータリアルタイム値が、後から更新されたサービスデータリアルタイム値よりも前に到来する、ことを保証することができる。但し、大部分の状況において、シングルスレッドの低い性能は、大量のデータのリアルタイムデータ処理の需要を充足することができない。分散型のリアルタイムデータ収集システムにおいては、その生成された分散型のストリーミングデータ内におけるサービスデータリアルタイム値のシーケンスが、更新が発生したシーケンスと異なっている可能性がある。
現時点の技術においては、サービスデータリアルタイム値のデータ処理は、ストリーミングデータ内のサービスデータのシーケンスに従って実行されている。この結果、分散型のストリーミングデータ内におけるサービスデータリアルタイム値のシーケンスが、更新が発生したシーケンスと異なっている際には、相対的に早期に更新されたリアルタイム値が、後から更新されたリアルタイム値を置換することにより、データ処理結果の誤りをもたらすことになる。
以上の内容に鑑み、本出願は、ストリーミングデータ分散処理方法を提供しており、方法は、
ストリーミングデータのデータレコードのサービスデータ識別子情報、データレコードの処理対象のリアルタイム値、及びデータレコードの処理対象のリアルタイム値の時間シーケンス特性を取得するステップであって、識別子情報は、サービスデータの一つの断片又は一つの組を一意に表している、ステップと、
保存されているサービスデータ識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係に基づいてサービスデータの処理済みのリアルタイム値の時間シーケンス特性を取得するステップと、
サービスデータの処理対象のリアルタイム値の時間シーケンス特性とサービスデータの処理済みのリアルタイム値の時間シーケンス特性とを比較し、且つ、処理対象のリアルタイム値の時間シーケンスが、処理済みのリアルタイム値の時間シーケンスよりも後である際に、処理対象のリアルタイム値をサービス演算の実行において利用し、且つ、処理済みのリアルタイム値の保存されている時間シーケンス特性を処理対象のリアルタイム値の時間シーケンス特性に更新するステップと、
を具備する。
又、本出願は、ストリーミングデータ分散処理装置をも提供しており、装置は、
ストリーミングデータのデータレコードのサービスデータ識別子情報、データレコードの処理対象のリアルタイム値、及びデータレコードの処理対象のリアルタイム値の時間シーケンス特性を取得するように構成された処理対象の情報取得ユニットであって、識別子情報は、サービスデータの一つの断片又は一つの組を一意に表している、処理対象の情報取得ユニットと、
保存されているサービスデータ識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係に基づいてサービスデータの処理済みのリアルタイム値の時間シーケンス特性を取得するように構成された処理済みの情報取得ユニットと、
サービスデータの処理対象のリアルタイムデータ値の時間シーケンス特性とサービスデータの処理済みのリアルタイム値の時間シーケンス特性とを比較し、且つ、処理対象のリアルタイム値の時間シーケンスが、処理済みのリアルタイム値の時間シーケンスよりも後である際に、処理対象のリアルタイム値をサービス演算の実行において利用し、且つ、処理済みのリアルタイム値の保存されている時間シーケンス特性を処理対象のリアルタイム値の時間シーケンス特性に更新するように構成されたデータ処理ユニットと、
を具備する。
上述の技術的解決策によって示されているように、本出願の実施形態においては、データレコードの処理済みのリアルタイム値の時間シーケンス特性が、データ処理において保存され、且つ、ストリーミングデータ内の同一のデータレコードからの処理対象のリアルタイム値の時間シーケンス特性と比較され、且つ、処理済みのリアルタイム値よりも後の時間シーケンスを有する処理対象のリアルタイム値のみがサービス演算を経験している。従って、データ更新シーケンスに応じたデータ処理が実現されることにより、後から更新されたリアルタイム値を処理することによって生じる処理結果の誤りが防止され、且つ、データ処理精度が改善される。
図1は、本出願の一実施形態の適用シナリオ用のネットワーク構造図である。 図2は、本出願の一実施形態のストリーミングデータ分散処理方法のフロー図である。 図3は、本出願の一実施形態を含む装置のハードウェア構造図である。 図4は、本出願の一実施形態のストリーミングデータ分散処理装置の論理構造図である。
本出願の実施形態は、新しいストリーミングデータ分散処理方法を提示している。ストリーミングデータは、データレコードの処理対象のリアルタイム値の時間シーケンス特性を含み、且つ、データ処理を既に経験しているデータレコードの処理済みのリアルタイム値の時間シーケンス特性が保存されている。処理対象の及び処理済みのリアルタイム値の時間シーケンス特性を比較することにより、処理対象の及び処理済みのリアルタイム値の相対的な時間シーケンスが見出され、且つ、処理対象のリアルタイム値の時間シーケンスが後である際に、処理対象のリアルタイム値の時間シーケンスがデータ処理を経験している。この結果、相対的に早期の時間シーケンスを有するリアルタイム値の後からの処理によって生じるデータ処理結果の誤りが防止されることにより、既存の技術における問題を克服することができる。
本出願の一実施形態の適用シナリオのネットワーク構造が図1に示されており、動作実行プロセスにおいて異なるサービスシステムによって生成及びリフレッシュされたサービスデータは、(例えば、MySQL、Oracle、HBase などの)いくつかの異なるタイプのサービスデータベース内において保存することができる。既定の条件を充足しているサービスデータが、サービスデータベース内において追加又はリフレッシュされた際に、データ収集プラットフォームは、新たに追加又は更新されたサービスデータに基づいて、データレコードを生成し、恒常的に生成されるデータレコードをストリーミングデータとして組み合わせ、且つ、ストリーミングデータをリアルタイム演算プラットフォームに提供している。データ収集プラットフォームは、読取りのためにリアルタイム演算プラットフォームに対して提供するべく、生成されたデータレコードをメッセージとしてメッセージキューに書き込む、(例えば、kafka や TimeTunel などの)メッセージ指向のミドルウェアを利用することにより、実現することができる。リアルタイム演算プラットフォームは、(例えば、Jstorm や storm などの)分散演算を利用することも可能であり、且つ、中央集中型の演算を利用することもできる。図1は、分散型の演算が利用された際のフレームワークであり得る。一つ又は複数の(例えば、storm プラットフォームの出力などの)データ分配器が、ストリーミングデータのデータレコードを少なくとも二つの(例えば、storm プラットフォームのエンジン(bolt)などの)データプロセッサに分配し、且つ、データプロセッサは、サービスデータ内のリアルタイムの変化が処理結果において反映されるようにしている。
従って、図1において、データ収集プラットフォームがマルチスレッド型の並列取得を利用しており、且つ/又は、リアルタイム演算プラットフォームが分散型の演算を利用している場合に、サービスデータの断片が連続的に更新された際には、相対的に早期に更新されたサービスデータリアルタイム値を搬送するデータレコードが、後から更新されたサービスデータリアルタイム値を搬送するデータレコードよりも後にリアルタイム演算プラットフォームのデータプロセッサに到達する場合がある。本出願の実施形態は、リアルタイム演算プラットフォーム上において稼働する(分散型の演算が利用される際には、それぞれのデータプロセッサ上において稼働する)ことができると共に、且つ、上述の状況において、後から更新されたサービスデータの処理結果が相対的に早期に更新されたサービスデータの処理結果によって隠蔽されるという誤りを防止することができる。
本出願の実施形態は、例えば、携帯電話機、タブレットコンピュータ、PC(Personal Computer)、ラップトップ、サーバ、及び仮想機械などの、演算及び保存能力を有する任意の物理的又は論理的装置に適用することができる。或いは、この代わりに、本出願の実施形態においては、装置は、様々な機能を実現するべく、互いに調整している、異なる職務を共有する、二つ以上の物理的又は論理的装置であってもよい。
本出願のいくつかの実施形態においては、ストリーミングデータ分散処理方法のフローは、図2に示されているとおりである。
ステップ210:ストリーミングデータのデータレコードのサービスデータ識別子、データレコードの処理対象のリアルタイム値、及びデータレコードの処理対象のリアルタイム値の時間シーケンス特性を取得する。
本出願のいくつかの実施形態においては、データレコードは、ストリーミングデータの最小構成単位である。それぞれのデータレコードは、サービスデータベース内の、(例えば、口座の残高などの)サービスデータの一つの断片の変化(追加又は更新)、或いは、(例えば、振替の回数や他の口座に振り替えられた合計金額などの)サービスデータの組(二つ以上の断片)の同時の変化、に基づいて生成されている。データレコードは、サービスデータ又はサービスデータの組の識別子情報と、サービスデータ又はサービスデータの組のリアルタイム値と、を具備しており、通常、データレコードは、リアルタイム値がサービスデータベース内において生成された時刻をも具備する。
ここで、識別子情報は、例えば、本出願の実施形態が稼働している範囲内において、サービスデータ又はサービスデータの組を一意に表しており、識別子情報とサービスデータ又はサービスデータの組との間には、1対1の対応性が存在している。例えば、本出願の一実施形態は、リアルタイム演算プラットフォームのそれぞれのデータプロセッサ上において稼働しており、従って、データプロセッサによって処理されるそれぞれのデータレコードごとに、識別子情報とサービスデータの断片又はサービスデータの組との間には、1対1の対応性が存在している。実際の一適用シナリオにおいては、サービスデータの識別子情報を判定するべく、サービスデータベース内のフィールド及びテーブル識別子並びに/或いはサービスシステム内のサービスデータ識別子を参照することができる。例えば、サービスデータが配置されているテーブルのプライマリキー、テーブル名、及びデータベース名の組合せをサービスデータの識別子情報として使用することができる。又、サービスデータが属しているサービスの主サービスプライマリキー識別子、第二サービスプライマリキー識別子、及びアプリケーションシグネチャをサービスデータの識別子情報として使用することもできる。
サービスデータのリアルタイム値は、最も最近の変化の後のサービスデータ又はサービスデータの組の値である。リアルタイム値生成時刻は、サービスデータがサービスデータベース内において変化した時刻である。
リアルタイム値の時間シーケンス特性は、サービスデータ又はサービスデータの組が変化した時刻と関連する情報を具備する。サービスデータ又はサービスデータの組がN回の変化を経験した際には、N個のデータレコードが生成されることになる。これらのN個のデータレコードのうちにおいて、サービスデータ識別子情報は、同一であり、サービスデータリアルタイム値は、異なっており、且つ、大部分の状況において、リアルタイム値の時間シーケンス特性も、異なっている。リアルタイム値の時間シーケンス特性を比較することにより、通常、このサービスデータ又はサービスデータの組のいずれの一つ又は複数のリアルタイム値が、相対的に早期に発生したのか、並びに、後から発生したのか、を知ることができる。
リアルタイム値の時間シーケンス特性として使用される変数は、サービスデータが変化している速度及びストリーミングデータ処理用の精度要件などの、実際の適用シナリオにおける要因に基づいて選択することができる。例えば、データレコードにおけるリアルタイム値生成時刻をリアルタイム値の時間シーケンス特性として使用することができる。同一の識別子情報を有するサービスデータの場合には、リアルタイム値の時間シーケンスは、リアルタイム値生成時刻に基づいて判定することができる。但し、リアルタイム値生成時刻は、通常、その保存の精度が(例えば、ミリ秒に)限られていることから、一つに極めて近接した状態において(例えば、数十マイクロ秒内において)発生した、サービスデータの同一の断片又は同一の組に対する2回の変化は、同一のリアルタイム値生成時刻を有する場合がある。
又、リアルタイム値生成時刻の精度の向上に加えて、データ収集プラットフォームとして機能しているメッセージ指向のミドルウェアを有する適用シナリオにおいては、リアルタイム値生成時刻と、リアルタイム値を含むメッセージのメッセージ識別子と、をリアルタイム値の時間シーケンス特性として使用することもできる。このタイプの適用シナリオにおいて、メッセージ指向のミドルウェアは、一つ又は複数のデータレコードをメッセージ内においてパッケージ化し、メッセージ生成の時間シーケンスに従って、メッセージ識別子が、それぞれのメッセージごとに指定され、且つ、メッセージ識別子を有するメッセージが、メッセージフロー(即ち、ストリーミングデータ)を構成している。サービスデータの同一の断片又は同一の組に対する2回の連続的な変化について生成されたデータレコードは、同一のメッセージ内において出現することにはならないことから、メッセージ生成時間シーケンスを反映したメッセージ識別子は、サービスデータのリアルタイム値の時間情報をも反映している。同一のサービスデータ識別子情報を有する二つのデータレコードの場合に、サービスデータのリアルタイム値生成時刻が異なっている場合には、リアルタイム値の時間シーケンスは、リアルタイム値生成時刻に基づいて判定される。サービスデータのリアルタイム値生成時刻が同一である場合には、リアルタイム値の時間シーケンスは、データレコードを含むメッセージのメッセージ識別子に基づいて判定することができる。
従って、データレコードは、ストリーミングデータから抽出され、且つ、データレコードから、サービスデータ識別子情報と、サービスデータの処理対象のリアルタイム値と、を取得することが可能であり(データレコード内のサービスデータのリアルタイム値は、データ処理を経験してはいないことから、データレコード内のサービスデータのリアルタイム値は、処理対象のリアルタイム値と呼称することができる)、且つ、処理対象のリアルタイム値の時間シーケンス特性は、データレコードから、或いは、データレコード及びデータレコードを搬送しているメッセージから、取得することができる。
ステップ220:保存されているサービスデータ識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係に基づいてサービスデータの処理済みのリアルタイム値の時間シーケンス特性を取得する。
ステップ230:サービスデータの処理対象のリアルタイム値の時間シーケンス特性とサービスデータの処理済みのリアルタイム値の時間シーケンス特性とを比較し、且つ、処理対象のリアルタイム値の時間シーケンスが処理済みのリアルタイム値の時間シーケンスよりも後である際に、処理対象のリアルタイム値をサービス演算の実行において利用し、且つ、処理済みのリアルタイム値の保存されている時間シーケンス特性を処理対象のリアルタイム値の時間シーケンス特性に更新する。
本出願のいくつかの実施形態においては、サービスデータ識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係のテーブルが維持されており、この場合に、処理済みのリアルタイム値の時間シーケンス特性は、最も最近にデータ処理を経験したサービスデータリアルタイム値の時間シーケンス特性である。このリアルタイム値を含むデータレコードは、ストリーミングデータ内においてオリジナルのデータレコードの前に配置されている。
新しいデータレコードからサービスデータ識別子情報を取得した後に、識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係のテーブルがチェックされる。この識別子情報が存在している場合には、この識別子情報を有するサービスデータの処理済みのリアルタイム値の時間シーケンス特性を取得することができる。このサービスデータの処理対象の及び処理済みのリアルタイム値の時間シーケンス特性が比較される。処理対象のリアルタイム値の時間シーケンスが、処理済みのリアルタイム値よりも後である場合には、処理対象のリアルタイム値がサービス演算において利用され(即ち、処理対象のリアルタイム値がデータ処理を経験する)、且つ、識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係のテーブル内において、データレコード内の識別子情報に対応する処理済みのリアルタイム値の時間シーケンス特性が、データレコードの処理対象のリアルタイム値の時間シーケンス特性値として更新される。さもなければ、データ処理結果の誤りをもたらす、相対的に早期に更新されたリアルタイム値が、後から更新されたリアルタイム値を置換することを回避するように、データレコード内の処理対象のリアルタイム値は、処理を経験しない、即ち、データレコード内の処理対象のリアルタイム値は、サービス演算において使用されない。
リアルタイム値生成時刻がリアルタイム値の時間シーケンス特性として機能している状況において、処理対象のリアルタイム値生成時刻が、処理済みのリアルタイム値生成時刻よりも大きい場合には、処理対象のリアルタイム値の時間シーケンスは、処理済みのリアルタイム値の時間シーケンスよりも後である。リアルタイム値生成時刻及びリアルタイム値を含むメッセージのメッセージ識別子がリアルタイム値の時間シーケンス特性として使用されている状況において、処理対象のリアルタイム値生成時刻が、処理済みのリアルタイム値生成時刻よりも後である際には、且つ、処理対象のリアルタイム値を含むメッセージのメッセージ識別子によって反映された時間シーケンスが、処理済みのリアルタイム値を含むメッセージのメッセージ識別子によって反映された時間シーケンスよりも後である状態において、処理対象の及び処理済みのリアルタイム値の生成時刻が同一である際には、処理対象のリアルタイム値の時間シーケンスは、処理済みのリアルタイム値の時間シーケンスよりも後である。
識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係のテーブルが、データレコード内のサービスデータ識別子情報に対応する処理済みのリアルタイム値の時間シーケンス特性を有していない場合には、それは、これが、このサービスデータ又はこのサービスデータの組のリアルタイム値を受け取る最初であり得ることを意味している。従って、データレコード内のサービスデータの処理対象のリアルタイム値が、サービス演算において使用され、サービスデータの処理対象のリアルタイム値の時間シーケンス特性が、処理済みのリアルタイム値の時間シーケンス特性として機能し、且つ、サービスデータの識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係が、対応性関係テーブル内において保存される。
サービス演算を実施するべく処理対象のリアルタイム値を利用する特定のアルゴリズムは、現時点の技術のデータ処理モードを参照することによって実現される、実際の適用シナリオの需要に基づいたものであってよい。更なる詳細の付与については、省略することとする。
識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係のテーブル内の大きなバイト数の又は多数のテーブル項目を有する識別子情報を伴う適用シナリオにおいては、対応性関係のルックアップが、相当量の時間を必要とする場合がある。データ処理のリアルタイム品質に対するルックアップ回数の影響を低減するべく、識別子情報が識別子特性及び少なくとも一つの識別子フィールドを具備するようにすることが可能であり、この場合には、すべての識別子フィールドの組合せが、サービスデータの一つの断片又は一つの組を一意に表しており、識別子特性の入力は、すべての識別子フィールドの組合せの既定の一部分であり、且つ、(例えば、ダイジェストアルゴリズムなどの)アルゴリズムを使用することによって生成される。対応性関係テーブルをルックアップする際に、識別子情報内の識別子特性をテーブル項目のルックアップを実行するためのインデックスとして使用することにより、ルックアップ速度を加速させることができる。
リアルタイム演算プラットフォームが分散型の演算を利用している適用シナリオにおいては、本出願の実施形態の方法は、並列状態において、且つ、独立的に、データ処理の責任を担う二つ以上の(例えば、図1に示されているネットワーク構造内のデータプロセッサなどの)ソフトウェア機能モジュール上において稼働する。ストリーミングデータがこれらのソフトウェア機能モジュールに到達する前に、通常、データ分配器が、異なるデータレコードをこれらのソフトウェア機能モジュールに対して分配することになる。データ分配器は、同一のサービスデータ識別子情報を有するデータレコードが同一のソフトウェア機能モジュールに分配され得るように、データレコード内のサービスデータ識別子情報のすべて又は既定の部分に従って、データレコードをソフトウェア機能モジュールに分配することができる。この結果、リアルタイム演算プラットフォームの全体ではなく、単一のソフトウェア機能モジュール上において、識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係のテーブルを実装することにより、対応性関係テーブルの容量を低減することが可能であり、且つ、ルックアップ速度を加速させることができる。
従って、本出願の実施形態においては、ストリーミングデータは、データレコードの処理対象のリアルタイム値の時間シーケンス特性を搬送している。データ処理において、データレコードの処理済みのリアルタイム値の時間シーケンス特性が保存され、且つ、処理対象の及び処理済みのリアルタイム値の時間シーケンス特性を比較することにより、処理済みのリアルタイム値よりも後の時間シーケンスを有する処理対象のリアルタイム値のみがサービス演算を経験しており、これにより、後から更新されたリアルタイム値を処理することによって生じる処理結果の誤りが回避され、且つ、データ処理精度が向上している。
本出願の一適用例においては、メッセージ指向のミドルウェアが、変化したサービスデータをサービスデータベースから収集し、且つ、データレコードを生成している。データレコードは、サービスデータ識別子情報、サービスデータリアルタイム値(処理対象のリアルタイム値)、及びリアルタイム値生成時刻を具備する。ここで、サービスデータ識別子情報は、識別子特性と、少なくとも二つの識別子フィールドと、を具備し、且つ、識別子フィールドは、一つ又は複数のサービスプライマリキー識別子及びサービスシグネチャである。これらのサービスプライマリキー識別子及びサービスシグネチャの組合せとデータレコードを生成するべく使用されたサービスデータとの間には、(データレコードを処理するソフトウェア機能モジュールの範囲内において)1対1の対応性が存在している。サービスプライマリキー識別子は、主サービスプライマリキー識別子を具備する。又、複数のサービスプライマリキー識別子が存在している場合には、サービスプライマリキー識別子は、第二サービスプライマリキー識別子及びその他のサービスプライマリキー識別子を具備することができる。識別子特性は、主サービスプライマリキーのダイジェスト値の最初のいくつかのビットであり、この場合に、ダイジェスト値は、ダイジェストアルゴリズムを利用した後に、主サービスプライマリキーから取得された値である。例えば、主サービスプライマリキーのMD5(Message Digest Algorithm 5)値の最初の5ビットを識別子特性として使用することができる。識別子特性は、サービスデータの識別子情報として機能するように、すべての識別子フィールドと結合される(結合演算子として、「#」などの固定されたシンボルを隣接する識別子フィールドの間において使用することができる)。例示用の結果が、表1に示されている。
Figure 0006716727
メッセージ指向のミドルウェアが、データレコードをメッセージ内においてパッケージ化し、昇順においてソートされた次のメッセージ連番が、(同様に、メッセージ内においてパッケージ化された)メッセージ識別子として使用され、且つ、生成されたメッセージが、メッセージキュー内において配置される。
リアルタイム演算プラットフォームのデータ分配器が、メッセージキューからメッセージを抽出し、データレコードを解析し、且つ、データレコード内のサービスデータ識別子情報の識別子特性に従って、データレコード及びデータレコードを含むメッセージのメッセージ識別子をデータプロセッサのうちの一つに送信する。識別子特性は、主サービスプライマリキーのダイジェスト値の最初のいくつかのビットであることから、同一の主サービスプライマリキーを有するサービスデータを有するデータレコードが、同一のデータプロセッサに対して分配されることになる。換言すれば、同一のサービスデータが、同一のデータプロセッサ上においてデータ処理を経験することになる。
それぞれのデータプロセッサは、サービスデータ識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係のテーブル DATA_CHECK を維持している。DATA_CHECK テーブルのフィールドは、表2に示されているとおりである。
Figure 0006716727
データ分配器によって分配される、データレコード及びデータレコードが配置されたメッセージのメッセージ識別子を受け取った後に、データプロセッサは、サービスデータ識別子情報をデータレコードから抽出し、データレコードのサービスデータリアルタイム値及びリアルタイム値生成時刻を処理対象のリアルタイム値及び処理対象のリアルタイム値生成時刻として使用すると共に、分配されたメッセージ識別子を処理対象のリアルタイム値が配置されているメッセージのメッセージ識別子として使用する。
識別子情報内の識別子特性をインデックスとして使用することにより、データプロセッサは、この識別子情報のテーブル項目として DATA_CHECK テーブル内の ROWKEY をルックアップし、識別子情報に対応する処理済みのリアルタイム値の時間シーケンス特性の LAST_VERSION を取得し、且つ、処理済みのリアルタイム値生成時刻及び処理済みのリアルタイム値が配置されているメッセージのメッセージ識別子を解析する。
データプロセッサが、処理対象の及び処理済みのリアルタイム値生成時刻を比較する。処理対象のリアルタイム値生成時刻が処理済みのリアルタイム値生成時刻よりも後である場合には、或いは、処理対象の及び処理済みのリアルタイム値生成時刻が同一であり、且つ、処理対象のリアルタイム値が配置されているメッセージのメッセージ識別子が、処理済みのリアルタイム値が配置されているメッセージのメッセージ識別子よりも大きい場合には、処理対象のリアルタイム値がデータ処理を経験し、且つ、DATA_CHECK テーブル内のこの識別子情報を有するテーブル項目の LAST_VERSION が、処理対象のリアルタイム値生成時刻及び処理対象のリアルタイム値を保持するメッセージのメッセージ識別子に変更される。さもなければ、データレコードの処理対象のリアルタイム値は、放棄され、且つ、データ処理を経験しない。
又、上述のプロセスの実装に対応することにより、本出願の実施形態は、ストリーミングデータ分散処理用の装置をも提供している。この装置は、ソフトウェアを通じて、ハードウェアを通じて、或いは、ソフトウェア及びハードウェアの組合せを通じて、実装することができる。ソフトウェア実装を一例として使用すれば、論理装置として、装置は、CPU(Central Processing Unit)が配置されている装置のCPUに、対応するコンピュータプログラム命令をメモリに読み取らせることにより、稼働する。又、ハードウェアについては、図3に示されているCPU、メモリ、及び不揮発性メモリに加えて、ストリーミングデータ分散処理用の装置が配置されている装置は、通常、無線信号の送信及び受信を実行するべく使用されるチップなどのその他のハードウェア及び/又はネットワーク通信のために使用されるカードなどのその他のハードウェアをも具備する。
図4は、本出願の実施形態によって提供されるストリーミングデータ分散処理装置を示しており、装置は、処理対象の情報取得ユニット、処理済みの情報取得ユニット、及びデータ処理ユニットを具備し、この場合に、処理対象の情報取得ユニットは、ストリーミングデータのデータレコードのサービスデータ識別子情報、データレコードの処理対象のリアルタイム値、及びデータレコードの処理対象のリアルタイム値の時間シーケンス特性を取得するように構成されており、識別子情報は、サービスデータの一つの断片又は一つの組を一意に表しており、処理済みの情報取得ユニットは、保存されているデータ識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係に基づいてサービスデータの処理済みのリアルタイム値の時間シーケンス特性を取得するように構成されており、データ処理ユニットは、サービスデータの処理対象のリアルタイム値の時間シーケンス特性とサービスデータの処理済みのリアルタイム値の時間シーケンス特性とを比較し、且つ、処理対象のリアルタイム値の時間シーケンスが、処理済みのリアルタイム値の時間シーケンスよりも後である際に、処理対象のリアルタイム値をサービス演算の実行において利用し、且つ、処理済みのリアルタイム値の保存されている時間シーケンス特性を処理対象のリアルタイム値の時間シーケンス特性に更新するように構成されている。
任意選択により、リアルタイム値の時間シーケンス特性は、リアルタイム値生成時刻を具備する。
任意選択により、ストリーミングデータは、データレコードのサービスデータ識別子情報を搬送するメッセージのメッセージフロー、データレコードの処理対象のリアルタイム値、及びデータレコードの処理対象のリアルタイム値の時間シーケンス特性を具備し、リアルタイム値の時間シーケンス特性は、リアルタイム値生成時刻及びリアルタイム値を含むメッセージのメッセージ識別子を具備し、メッセージ識別子は、メッセージ生成の時間シーケンスを判定する能力を有し、処理対象のリアルタイム値の時間シーケンスが、処理済みのリアルタイム値の時間シーケンスよりも後であることは、処理対象のリアルタイム値の生成時刻が、処理済みのリアルタイム値の生成時刻よりも後であること、或いは、処理対象の及び処理済みのリアルタイム値の生成時刻が同一であり、且つ、処理対象のリアルタイム値を含むメッセージのメッセージ識別子によって反映された時間シーケンスが、処理済みのリアルタイム値を含むメッセージのメッセージ識別子によって反映された時間シーケンスよりも後であること、を具備する。
又、任意選択により、装置は、サービスデータの処理済みのリアルタイム値の時間シーケンスが保存される前に、サービスデータの処理対象のリアルタイム値をサービス演算において利用し、処理済みのリアルタイム値の時間シーケンス特性としてサービスデータの処理対象の値の時間シーケンス特性を使用し、且つ、サービスデータ識別子情報と処理済みのリアルタイム値の時間シーケンス特性との間の対応性関係を保存するように構成された処理済みの情報追加ユニットをも具備する。
任意選択により、ストリーミングデータ分散処理方法は、並列状態において、且つ、独立的に、少なくとも二つのソフトウェア機能モジュール上において稼働し、且つ、ソフトウェア機能モジュールによって処理されるデータレコードは、サービスデータ識別子情報又はデータレコードのサービスデータ識別子情報の一部分に基づいて判定される。
一例においては、識別子情報は、識別子特性及び少なくとも一つの識別子フィールドを具備し、すべての識別子フィールドの組合せは、サービスデータの一つの断片又は一つの組を一意に表しており、且つ、識別子特性は、すべての識別子フィールドの組合せの既定の一部分に基づいて生成されている。
先行する例においては、識別子フィールドは、主サービスプライマリキー識別子及びアプリケーションシグネチャを具備していてもよく、識別子特性は、主サービスプライマリキー識別子のダイジェスト値の最初のいくつかのビットである。
以上の内容は、本出願の好適な実施形態であるに過ぎず、且つ、本出願を限定するものではない。本出願の精神及び原理内において実施されるすべての変更、等価な置換、及び改善は、本出願の保護の範囲に含まれている。
通常の一構成においては、演算装置は、一つ又は複数のプロセッサ(CPU)、入出力インタフェース、ネットワークインタフェース、及び内部メモリを具備する。
内部メモリは、コンピュータ可読媒体上の不揮発性メモリ、ランダムアクセスメモリ(RAM:Random Access Memory)、及び/又は、読み出し専用メモリ(ROM:Read-Only Memory)又はフラッシュRAMなどの、不揮発性RAM、の形態を具備することができる。内部メモリは、コンピュータ可読媒体の一例である。
コンピュータ可読媒体は、任意の方法又は技術を通じて情報ストレージを実現し得る、永久的な、非永久的な、可動型の、且つ固定型の、媒体を含む。情報は、コンピュータ可読命令、データ構造、プログラムモジュール、又はその他のデータであってもよい。コンピュータストレージ媒体の例は、限定を伴うことなしに、相変化RAM(PRAM:Phase-change RAM)、スタティックRAM(SRAM:Static RAM)、ダイナミックRAM(DRAM:Dynamic RAM)、その他のタイプのランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、電気的に消去可能なプログラム可能な読み出し専用メモリ(EEPROM:Electrically Erasable Programmable Read-Only Memory)、フラッシュメモリ又はその他の内部メモリ技術、コンパクトディスク読み出し専用メモリ(CD−ROM:Compact Disk Read-Only Memory)、デジタルバーサタイルディスク(DVD:Digital Verstile Disc)又はその他の光メモリ、カセット、磁気テープ及びディスクメモリ又はその他の磁気メモリ装置、或いは、演算装置によってアクセスされ得る情報を保存するべく使用され得る任意のその他の非送信媒体を含む。本明細書における定義によれば、コンピュータ可読媒体は、変調されたデータ信号及び搬送波などの、一時的なコンピュータ可読媒体(一時的な媒体)を排除し得る。
又、「具備する、備える(comprise)」及び「包含する、含む(include)」という用語、或いは、これらの任意の変形は、非排他的包含となるように意図されていることに留意されたい。従って、一連の要素を具備するプロセス、方法、製品、又は装置は、これらの要素を具備し得るのみならず、明示的に列挙されてはいないその他の要素、或いは、そのプロセス、方法、製品、又は装置に固有の要素をも具備し得る。その他の制限が存在していない際に、「一つの〜を具備する(comprising one...)」というフレーズによって定義される要素は、その要素を具備するプロセス、方法、製品、又は装置内におけるその他の類似の要素の存在を排除するものではない。
当業者は、本出願の実施形態は、方法、システム、又はコンピュータプログラムプロダクトとして提供され得ることを理解するであろう。従って、本出願は、純粋にハードウェア実施形態の形態、純粋にソフトウェア実施形態の形態、或いは、ソフトウェアとハードウェアとを組み合わせた実施形態の形態を利用することができる。又、本出願は、コンピュータ実行可能プログラムコードを具備する(限定を伴うことなしに、磁気ディスクメモリ、CD−ROM、及び光メモリを含む)一つ又は複数のコンピュータストレージ媒体を通じて実現されたコンピュータプログラムプロダクトの形態を利用することもできる。

Claims (12)

  1. ストリーミングデータ分散処理方法であって、
    ストリーミングデータのデータレコードのサービスデータ識別子情報と、前記データレコードの処理対象のリアルタイム値と、前記データレコードの前記処理対象のリアルタイム値の時間シーケンス特性と、を取得するステップであって、前記サービスデータ識別子情報は、サービスデータの一つの断片又は一つの組を一意に表している、ステップと、
    前記サービスデータの処理済みのリアルタイム値の時間シーケンス特性を取得するステップであって、前記取得されているサービスデータ識別子情報と前記処理済みのリアルタイム値の前記時間シーケンス特性との間の対応性関係に基づいて時間シーケンス特性を取得するステップと、
    前記サービスデータの前記処理対象のリアルタイム値の前記時間シーケンス特性と前記サービスデータの前記処理済みのリアルタイム値の前記時間シーケンス特性とを比較し、前記処理対象のリアルタイム値の時間シーケンスが、前記処理済みのリアルタイム値の時間シーケンスよりも後である際に、前記処理対象のリアルタイム値をサービス演算の実行において利用し、且つ、前記処理済みのリアルタイム値の前記取得されている時間シーケンス特性を前記処理対象のリアルタイム値の前記時間シーケンス特性に更新するステップと、
    前記サービスデータの前記処理済みのリアルタイム値の前記時間シーケンス特性が保存される前に、前記サービスデータの前記処理対象のリアルタイム値を前記サービス演算において利用し、前記サービスデータの前記処理対象の値の前記時間シーケンス特性を前記処理済みのリアルタイム値の前記時間シーケンス特性として使用し、且つ、前記サービスデータ識別子情報と前記処理済みのリアルタイム値の前記時間シーケンス特性との間の前記対応性関係を保存するステップと、
    を具備する方法。
  2. リアルタイム値の時間シーケンス特性は、リアルタイム値生成時刻を具備する、請求項1に記載の方法。
  3. 前記ストリーミングデータは、前記データレコードの前記サービスデータ識別子情報を搬送するメッセージのメッセージフローと、前記データレコードの前記処理対象のリアルタイム値と、前記データレコードの前記処理対象のリアルタイム値の前記時間シーケンス特性と、を具備し、
    前記リアルタイム値の前記時間シーケンス特性は、リアルタイム値生成時刻と前記リアルタイム値を含むメッセージのメッセージ識別子とを具備し、前記メッセージ識別子は、メッセージ生成の時間シーケンスを反映する能力を有し、
    前記処理対象のリアルタイム値の前記時間シーケンスが、前記処理済みのリアルタイム値の前記時間シーケンスよりも後であることは、前記処理対象のリアルタイム値の生成時刻が、前記処理済みのリアルタイム値の生成時刻よりも後であること、或いは、前記処理対象の及び処理済みのリアルタイム値の前記生成時刻が同一であり、且つ、前記処理対象のリアルタイム値を含むメッセージのメッセージ識別子によって反映された時間シーケンスが、前記処理済みのリアルタイム値を含むメッセージのメッセージ識別子によって反映された時間シーケンスよりも後であること、を具備する、
    請求項1に記載の方法。
  4. 前記ストリーミングデータ分散処理方法は、並列状態において、且つ、独立的に、少なくとも二つのソフトウェア機能モジュール上において稼働し、且つ、前記ソフトウェア機能モジュールによって処理される前記データレコードは、前記サービスデータ識別子情報又は前記データレコードの前記サービスデータ識別子情報の一部分に基づいて判定される、請求項1に記載の方法。
  5. 前記サービスデータ識別子情報は、識別子特性と少なくとも一つの識別子フィールドとを具備し、すべての識別子フィールドの組合せが、前記サービスデータの一つの断片又は一つの組を一意に表しており、且つ、前記識別子特性は、前記すべての識別子フィールドの組合せの既定の一部分に基づいて生成される、請求項1又は請求項に記載の方法。
  6. 前記識別子フィールドは、主サービスプライマリキー識別子とアプリケーションシグネチャとを具備し、前記識別子特性は、前記主サービスプライマリキー識別子のダイジェスト値の最初のいくつかのビットである、請求項に記載の方法。
  7. ストリーミングデータ分散処理装置であって、
    ストリーミングデータのデータレコードのサービスデータ識別子情報と、前記データレコードの処理対象のリアルタイム値と、前記データレコードの前記処理対象のリアルタイム値の時間シーケンス特性と、を取得するように構成された処理対象の情報取得ユニットであって、前記サービスデータ識別子情報は、サービスデータの一つの断片又は一つの組を一意に表している、処理対象の情報取得ユニットと、
    前記サービスデータの処理済みのリアルタイム値の時間シーケンス特性を取得するように構成された処理済みの情報取得ユニットであって、前記取得されているサービスデータ識別子情報と前記処理済みのリアルタイム値の前記時間シーケンス特性との間の対応性関係に基づいて時間シーケンス特性を取得するように構成された処理済みの情報取得ユニットと、
    前記サービスデータの前記処理対象のリアルタイム値の前記時間シーケンス特性と前記サービスデータの前記処理済みのリアルタイム値の前記時間シーケンス特性とを比較し、前記処理対象のリアルタイム値の時間シーケンスが、前記処理済みのリアルタイム値の時間シーケンスよりも後である際に、前記処理対象のリアルタイム値をサービス演算の実行において利用し、且つ、前記処理済みのリアルタイム値の前記取得されている時間シーケンス特性を前記処理対象のリアルタイム値の前記時間シーケンス特性に更新する、ように構成されたデータ処理ユニットと、
    前記サービスデータの前記処理済みのリアルタイム値の前記時間シーケンス特性が保存される前に、前記サービスデータの前記処理対象のリアルタイム値を前記サービス演算において利用し、前記サービスデータの前記処理対象の値の前記時間シーケンス特性を前記処理済みのリアルタイム値の前記時間シーケンス特性として使用し、且つ、前記サービスデータ識別子情報と前記処理済みのリアルタイム値の前記時間シーケンス特性との間の前記対応性関係を保存する、ように構成された処理済みの情報追加ユニットと、
    を具備する装置。
  8. 前記リアルタイム値の時間シーケンス特性は、リアルタイム値生成時刻を具備する、請求項に記載の装置。
  9. 前記ストリーミングデータは、前記データレコードの前記サービスデータ識別子情報を搬送するメッセージのメッセージフローと、前記データレコードの前記処理対象のリアルタイム値と、前記データレコードの前記処理対象のリアルタイム値の前記時間シーケンス特性と、を具備し、
    前記リアルタイム値の前記時間シーケンス特性は、リアルタイム値生成時刻と前記リアルタイム値を含むメッセージのメッセージ識別子とを具備し、前記メッセージ識別子は、メッセージ生成の時間シーケンスを反映する能力を有し、
    前記処理対象のリアルタイム値の前記時間シーケンスが、前記処理済みのリアルタイム値の前記時間シーケンスよりも後であることは、前記処理対象のリアルタイム値の生成時刻が、前記処理済みのリアルタイム値の生成時刻よりも後であること、或いは、前記処理対象の及び処理済みのリアルタイム値の前記生成時刻が同一であり、且つ、前記処理対象のリアルタイム値を含むメッセージのメッセージ識別子によって反映された時間シーケンスが、前記処理済みのリアルタイム値を含むメッセージのメッセージ識別子によって反映された時間シーケンスよりも後であること、を具備する、
    請求項に記載の装置。
  10. 前記ストリーミングデータ分散処理装置は、並列状態において、且つ、独立的に、少なくとも二つのソフトウェア機能モジュール上において稼働し、且つ、前記ソフトウェア機能モジュールによって処理される前記データレコードは、前記サービスデータ識別情報又は前記データレコードの前記サービスデータ識別情報の一部分に基づいて判定される、請求項に記載の装置。
  11. 前記サービスデータ識別子情報は、識別子特性と少なくとも一つの識別子フィールドとを具備し、すべての識別子フィールドの組合せが、前記サービスデータの一つの断片又は一つの組を一意に表しており、且つ、前記識別子特性は、すべての識別子フィールドの前記組合せの既定の一部分に基づいて生成される、請求項又は請求項10に記載の装置。
  12. 前記識別子フィールドは、主サービスプライマリキー識別子とアプリケーションシグネチャとを具備し、前記識別子特性は、前記主サービスプライマリキー識別子のダイジェスト値の最初のいくつかのビットである、請求項11に記載の装置。
JP2018566484A 2016-06-20 2017-06-07 ストリーミングデータ分散処理方法及び装置 Active JP6716727B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610447125.8A CN106874320A (zh) 2016-06-20 2016-06-20 分布式流式数据处理的方法和装置
CN201610447125.8 2016-06-20
PCT/CN2017/087380 WO2017219858A1 (zh) 2016-06-20 2017-06-07 分布式流式数据处理的方法和装置

Publications (2)

Publication Number Publication Date
JP2019523952A JP2019523952A (ja) 2019-08-29
JP6716727B2 true JP6716727B2 (ja) 2020-07-01

Family

ID=59239567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018566484A Active JP6716727B2 (ja) 2016-06-20 2017-06-07 ストリーミングデータ分散処理方法及び装置

Country Status (16)

Country Link
US (1) US11036562B2 (ja)
EP (1) EP3474162A4 (ja)
JP (1) JP6716727B2 (ja)
KR (1) KR102099544B1 (ja)
CN (1) CN106874320A (ja)
AU (1) AU2017282818C1 (ja)
BR (1) BR112018076658A8 (ja)
CA (1) CA3025215C (ja)
MX (1) MX2018016067A (ja)
MY (1) MY188882A (ja)
PH (1) PH12018502494A1 (ja)
RU (1) RU2705429C1 (ja)
SG (1) SG11201810630PA (ja)
TW (1) TWI662426B (ja)
WO (1) WO2017219858A1 (ja)
ZA (1) ZA201808139B (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110019214A (zh) * 2017-12-04 2019-07-16 北京京东尚科信息技术有限公司 对数据拆分结果进行校验的方法和装置
CN109002472B (zh) * 2018-06-13 2023-07-14 平安科技(深圳)有限公司 一种数据库差异的识别方法及装置
CN109361629B (zh) * 2018-10-26 2020-11-03 江苏大学 一种基于Kafka大消息可靠传输方法
CN110033263A (zh) * 2019-01-14 2019-07-19 阿里巴巴集团控股有限公司 基于区块链的用户特征值获取、应用方法和装置
RU2722538C1 (ru) * 2019-12-13 2020-06-01 Общество С Ограниченной Ответственностью "Убик" Компьютерно-реализуемый способ обработки информации об объектах, с использованием методов совместных вычислений и методов анализа данных
CN111611252B (zh) * 2020-04-01 2023-07-18 石化盈科信息技术有限责任公司 数据同步过程中安全数据的监控、装置、设备和存储介质
WO2021230771A2 (en) * 2020-05-12 2021-11-18 Ubic Technologies Llc Method of piece data synchronization describing a single entity and stored in different databases
CN111639138B (zh) * 2020-06-03 2023-04-25 中国联合网络通信集团有限公司 数据处理方法、装置、设备及存储介质
CN112150248B (zh) * 2020-09-30 2021-08-03 欧冶云商股份有限公司 一种基于批流融合的挂货量统计方法、系统、装置
CN112200505B (zh) * 2020-12-04 2022-02-08 望海康信(北京)科技股份公司 跨业务系统的流程监控装置、方法及相应设备和存储介质
CN112988429B (zh) * 2021-05-08 2021-08-06 成都新希望金融信息有限公司 数据处理方法、装置、电子设备和计算机可读存储介质
CN113160918A (zh) * 2021-05-21 2021-07-23 山东健康医疗大数据有限公司 一种变化数据捕获的统一处理方法及工具
CN115098247A (zh) * 2022-06-06 2022-09-23 支付宝(杭州)信息技术有限公司 资源分配方法和装置

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5185871A (en) 1989-12-26 1993-02-09 International Business Machines Corporation Coordination of out-of-sequence fetching between multiple processors using re-execution of instructions
US8639625B1 (en) * 1995-02-13 2014-01-28 Intertrust Technologies Corporation Systems and methods for secure transaction management and electronic rights protection
US6055619A (en) 1997-02-07 2000-04-25 Cirrus Logic, Inc. Circuits, system, and methods for processing multiple data streams
US6748440B1 (en) 1999-05-12 2004-06-08 Microsoft Corporation Flow of streaming data through multiple processing modules
US7007096B1 (en) 1999-05-12 2006-02-28 Microsoft Corporation Efficient splitting and mixing of streaming-data frames for processing through multiple processing modules
US6880126B1 (en) 1999-08-03 2005-04-12 International Business Machines Corporation Controlling presentation of a GUI, using view controllers created by an application mediator, by identifying a destination to access a target to retrieve data
US7181017B1 (en) * 2001-03-23 2007-02-20 David Felsher System and method for secure three-party communications
US6633825B2 (en) * 2001-06-29 2003-10-14 Siemens Power Transmission & Distribution, Inc. Automatic calibration of time keeping for utility meters
US6910078B1 (en) 2001-11-15 2005-06-21 Cisco Technology, Inc. Methods and apparatus for controlling the transmission of stream data
JP4154893B2 (ja) 2002-01-23 2008-09-24 株式会社日立製作所 ネットワークストレージ仮想化方法
US7657861B2 (en) 2002-08-07 2010-02-02 Pact Xpp Technologies Ag Method and device for processing data
WO2004027648A1 (en) 2002-09-18 2004-04-01 Netezza Corporation Intelligent storage device controller
US7051245B2 (en) * 2002-11-30 2006-05-23 International Business Machines Corporation System and method for handling out-of-order data supplied by a real-time feed
EP1463309A1 (fr) 2003-03-26 2004-09-29 THOMSON Licensing S.A. Traitement d'un format de flux de données pour la réception audiovisuelle mobile
US20080273698A1 (en) 2005-04-26 2008-11-06 Koninklijke Philips Electronics, N.V. Device for and a Method of Processing a Data Stream Having a Sequence of Packets and Timing Information Related to the Packets
US20070226226A1 (en) * 2006-03-23 2007-09-27 Elta Systems Ltd. Method and system for distributing processing of computerized tasks
KR100898465B1 (ko) * 2007-04-26 2009-05-21 엔에이치엔(주) 웹로그의 시계열 분석을 위한 데이터 저장 및 조회 방법그리고 상기 방법을 수행하는 시스템
JP5198929B2 (ja) 2008-04-25 2013-05-15 株式会社日立製作所 ストリームデータ処理方法及び計算機システム
JP5154366B2 (ja) 2008-10-28 2013-02-27 株式会社日立製作所 ストリームデータ処理プログラム及び計算機システム
JP5465413B2 (ja) 2008-10-29 2014-04-09 株式会社日立製作所 ストリームデータ処理方法、及びそのシステム
US9538142B2 (en) * 2009-02-04 2017-01-03 Google Inc. Server-side support for seamless rewind and playback of video streaming
US8402344B2 (en) 2009-10-05 2013-03-19 Cleversafe, Inc. Method and apparatus for controlling dispersed storage of streaming data
RU2494453C2 (ru) * 2011-11-24 2013-09-27 Закрытое акционерное общество "Лаборатория Касперского" Способ распределенного выполнения задач компьютерной безопасности
CN103458000B (zh) * 2013-08-07 2016-06-08 广东电网公司佛山供电局 终端数据同步系统与方法
CN104091276B (zh) * 2013-12-10 2015-08-26 深圳市腾讯计算机系统有限公司 在线分析点击流数据的方法和相关装置及系统
WO2015103615A1 (en) * 2014-01-06 2015-07-09 Yyesit, Llc Method and apparatus of surveillance system
CN104794114B (zh) * 2014-01-16 2018-04-03 阿里巴巴集团控股有限公司 一种数据处理方法及装置
US9389899B2 (en) * 2014-01-27 2016-07-12 Red Hat Israel, Ltd. Fair unidirectional multi-queue virtual machine migration
CN104866234B (zh) * 2014-02-21 2019-01-22 腾讯科技(北京)有限公司 数据迁移方法、装置及系统
KR101588375B1 (ko) * 2014-04-25 2016-01-25 네이버 주식회사 데이터베이스 관리 방법 및 데이터베이스 관리 시스템
WO2015183517A1 (en) * 2014-05-29 2015-12-03 Causam Energy, Inc. System, method, and data packets for messaging for electric power grid elements over a secure internet protocol network
US20160026673A1 (en) 2014-07-25 2016-01-28 Linkedin Corporation Ensuring consistency of derived data in a distributed storage system
CN104320382B (zh) * 2014-09-30 2018-04-20 华为技术有限公司 分布式的实时流处理装置、方法和单元
US9754002B2 (en) * 2014-10-07 2017-09-05 Excalibur Ip, Llc Method and system for providing a synchronization service
GB201421674D0 (en) * 2014-12-05 2015-01-21 Business Partners Ltd Real time document indexing
RU2584471C1 (ru) * 2014-12-30 2016-05-20 Некоммерческое Партнерство "Центр Прикладных Исследований Компьютерных Сетей" УСТРОЙСТВО ДЛЯ ПРИЕМА И ПЕРЕДАЧИ ДАННЫХ С ВОЗМОЖНОСТЬЮ ОСУЩЕСТВЛЕНИЯ ВЗАИМОДЕЙСТВИЯ С OpenFlow КОНТРОЛЛЕРОМ
US10706468B2 (en) * 2015-08-03 2020-07-07 Trading Technologies International, Inc. Contextual searching

Also Published As

Publication number Publication date
CN106874320A (zh) 2017-06-20
CA3025215A1 (en) 2017-12-28
BR112018076658A8 (pt) 2023-01-31
PH12018502494A1 (en) 2019-07-15
TWI662426B (zh) 2019-06-11
US20190114213A1 (en) 2019-04-18
TW201800967A (zh) 2018-01-01
ZA201808139B (en) 2020-08-26
SG11201810630PA (en) 2019-01-30
RU2705429C1 (ru) 2019-11-07
KR20190020105A (ko) 2019-02-27
JP2019523952A (ja) 2019-08-29
BR112018076658A2 (pt) 2019-04-02
AU2017282818C1 (en) 2020-02-20
WO2017219858A1 (zh) 2017-12-28
EP3474162A1 (en) 2019-04-24
MX2018016067A (es) 2019-03-28
CA3025215C (en) 2020-06-02
KR102099544B1 (ko) 2020-05-18
AU2017282818B2 (en) 2019-08-22
US11036562B2 (en) 2021-06-15
AU2017282818A1 (en) 2019-01-24
MY188882A (en) 2022-01-12
EP3474162A4 (en) 2020-01-15

Similar Documents

Publication Publication Date Title
JP6716727B2 (ja) ストリーミングデータ分散処理方法及び装置
US10560465B2 (en) Real time anomaly detection for data streams
CN110019240B (zh) 一种业务数据交互方法、装置及系统
US9104676B2 (en) Hash algorithm-based data storage method and system
CN110489059B (zh) 数据集群存储的方法、装置及计算机设备
US20130191523A1 (en) Real-time analytics for large data sets
Jeong et al. Anomaly teletraffic intrusion detection systems on hadoop-based platforms: A survey of some problems and solutions
CN104298541A (zh) 云存储系统的数据分布算法及其装置
CN109191287A (zh) 一种区块链智能合约的分片方法、装置及电子设备
CN111355816A (zh) 服务器选取方法、装置、设备及分布式服务系统
CN108399175B (zh) 一种数据存储、查询方法及其装置
CN110727727A (zh) 一种数据库的统计方法及装置
CN108289034A (zh) 一种故障发现方法和装置
CN106789147B (zh) 一种流量分析方法及装置
JP2014531072A (ja) 多数のデバイスへのイベントの配信
CN113468226A (zh) 一种业务处理方法、装置、电子设备和存储介质
CN110851758B (zh) 一种网页访客数量统计方法及装置
CN105718485B (zh) 一种将数据录入数据库的方法及装置
CN110427390B (zh) 数据查询方法及装置、存储介质、电子装置
CN109032804B (zh) 数据处理方法和装置、服务器
CN113051323A (zh) 一种水环境大数据交换方法
CN116010677B (zh) 空间索引方法、装置及其电子设备
CN107395745A (zh) 一种分布式存储系统数据分散存储实现方法
CN117057799A (zh) 资产数据处理方法、装置、设备及存储介质
KR20210147491A (ko) 체인 데이터베이스를 구비한 블록체인 네트워크 기반의 데이터 저장 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191223

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200108

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200512

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200610

R150 Certificate of patent or registration of utility model

Ref document number: 6716727

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250