JP7046073B2 - リアルタイムデータ処理方法及び装置 - Google Patents

リアルタイムデータ処理方法及び装置 Download PDF

Info

Publication number
JP7046073B2
JP7046073B2 JP2019535921A JP2019535921A JP7046073B2 JP 7046073 B2 JP7046073 B2 JP 7046073B2 JP 2019535921 A JP2019535921 A JP 2019535921A JP 2019535921 A JP2019535921 A JP 2019535921A JP 7046073 B2 JP7046073 B2 JP 7046073B2
Authority
JP
Japan
Prior art keywords
real
time data
time
degree
integrity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019535921A
Other languages
English (en)
Other versions
JP2020507147A (ja
Inventor
リー グオジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2020507147A publication Critical patent/JP2020507147A/ja
Application granted granted Critical
Publication of JP7046073B2 publication Critical patent/JP7046073B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2358Change logging, detection, and notification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Fuzzy Systems (AREA)
  • Debugging And Monitoring (AREA)

Description

本出願は、2016年12月30日に出願された「Real-Time Data Processing Method and Apparatus」と題する中国特許出願第201611270978.5号への優先権を主張するものであり、その全体が参照により本明細書によって組み込まれる。
本出願は、データ処理の分野に関し、より具体的には、リアルタイムデータ処理方法及び装置に関する。
既存のリアルタイムデータ計算の分野では、ストリームデータは連続的であり、その始めは分からない。したがって、リアルタイムで集められたデータはリアルタイムで変化する。リアルタイムで集められたデータが常に変化するため、これらのデータの部分を使用するサービス関係者は、これらのデータの部分の処理進捗が分からない。したがって、これらのデータの部分に基づいて、いくつかの決定的行動を行うことが不可能である。例えば、収集の事前に設定された数分以内の売上高は常に変化し、意思決定者は係るデータに基づいて、販売戦略に対して修正を行うかどうかを判定することができない。別の例では、アラーム監視システムのリアルタイムデータが常に変化する場合、本システムは、当該データに基づいて、正確なアラーム動作を行うことができない。言い換えれば、パラメータは、既存技術のリアルタイムデータの処理進捗を評価するために使用されることができない。
現在、一般的に使用されているリアルタイムデータは、以下のような2つの方法で処理されている。
図1に示されるように、エラー数が1分ログにおいて100よりも多い場合、ワーニングが与えられる。例えば、1分間に4回の個別の機会において100カウントが現れる、すなわち、各回に25回現れる。
第1のスキームに関して、図2に示されるように、25カウントに達する毎に計算を行い、第2の機会に計算を再度行う。リアルタイムデータは、係る蓄積方式によって処理される。処理を完了した後のタイミング毎に、データをデータベース内に保存する。具体的には、25カウントのすべてが、すぐに、リアルタイム計算エンジン、次にメモリを通り、最後にデータベースに到達する、すなわち、データソースからデータベースまで動く。現在、第1のスキームは、データの完全性を保証することができるため、産業界で最も使用されているものである。しかしながら、データベース内のデータは常に変化し、ひいては、正確な決定を行うことができない欠点がある。
第2のスキームに関して、図3に示されるように、予想されるタイムアウト周期(例えば、2分間のタイムアウト)は、事前に規定され得る。25カウントの4つの機会が4つの時間周期から生じると仮定する。最初の3つの機会が2分以内に達成し、4つ目の機会はこれらの3つの機会の2分後に達成する。この種類のスキームは、最初の3つの機会の75カウントだけを記録し、データベースへの記憶は、1回だけ行われる。具体的には、図3のメモリは2分間待機し、データベースへの記憶は、係る2分後だけに行われる。データベースに関して、その利点は、データが存在する限り、それは、もう変化しないことである。係るデータに基づいて直接的に決定を行うことができる。例えば、取引金額が減らされる場合、広告スペースのブランドはすぐに変わる、これは、最速時間で取引金額を埋め合わせ得る。しかしながら、このスキームの不利点は、タイムアウト周期を経過したデータ(図の点線によって示されるような第4の時間の25カウント)が失われ、ひいては、エラーが存在することである。
今までに、既存技術におけるリアルタイムデータ処理の進捗を知る際の失敗によって生じる問題に関して、効果的な解決策が提案されていない。
本出願の実施形態は、少なくとも、リアルタイムデータ処理の進捗を知る際の失敗によって生じる問題を解決するために、リアルタイムデータ処理方法及びその装置を提供する。
本出願の実施形態の態様に従って、リアルタイムデータ処理方法を提供する。本方法は、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集めることと、全てのノード上で同じ既定条件を満足するリアルタイムデータの集約を行い、同じ既定条件に対応するリアルタイムデータの総量を取得することであって、当該既定条件はリアルタイムデータが集められた時間を表すために使用される、当該取得することと、当該同じ既定条件を満足するリアルタイムデータの完全性の程度を計算することであって、当該完全性の程度は、同じ既定条件を満足する処理済リアルタイムデータと、全てのノード上に集約されたリアルタイムデータとの比率を示すために使用される、当該計算することと、を含む。
本出願の実施形態の別の態様に従って、また、リアルタイムデータ処理装置を提供する。本処理装置は、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集めるように構成されている収集モジュールと、全てのノード上で同じ既定条件を満足するリアルタイムデータを集約し、同じ既定条件に対応するリアルタイムデータの総量を取得するように構成されている集約モジュールであって、当該既定条件はリアルタイムデータが集められた時間を表すために使用される、当該集約モジュールと、当該同じ既定条件を満足するリアルタイムデータの完全性の程度を計算するように構成されている計算モジュールであって、当該完全性の程度は、同じ既定条件を満足する処理済リアルタイムデータと、全てのノード上に集約されたリアルタイムデータとの比率を示すために使用される、当該計算モジュールと、を含む。
本出願の実施形態では、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集め、全てのノード上で同じ既定条件を満足するリアルタイムデータを集約し、同じ既定条件に対応するリアルタイムデータの総量を取得する。同じ既定条件を満足するリアルタイムデータの完全性の程度を計算し、それによって、リアルタイムデータの完全性の程度の計算を実現する。
パラメータ(すなわち、完全性の程度)は、リアルタイムデータ処理に導入されることを留意することは容易である。この完全性の程度によって、リアルタイムデータ処理の進捗を知ることができる。完全性の程度は、処理される集約済リアルタイムデータの進捗に対する既定条件を満足する処理済リアルタイムデータによって占められる割合を示すために使用される。完全性の程度が導入された後、リアルタイムデータを集めることができ、集められたリアルタイムデータを集約することができる。次に、既定条件を満足するリアルタイムデータは、集約されたリアルタイムデータから取得され、それによって、既定条件を満足するリアルタイムデータの完全性の程度を計算することができ、したがって、リアルタイムデータ処理に関する評価特質を追加する効果を上げる。
したがって、本出願の実施形態は、既存技術におけるリアルタイムデータ処理の進捗を知ることを失敗するような技術的問題を解決する。
本明細書に説明される図面は、本出願のさらなる理解を可能にすることを目的として、本出願の一部であることが意図される。例示的実施形態及びその説明は、本出願を説明するために使用され、本出願への不適切な限定として解釈するものではない。
既存技術による、リアルタイムデータ処理方法の概略図である。 既存技術による、第1のリアルタイムデータ処理方法の概略図である。 既存技術による、第2のリアルタイムデータ処理方法の概略図である。 本出願の実施形態による、リアルタイムデータ処理方法のコンピューティングデバイスのハードウェア構造を示すブロック図である。 本出願の実施形態による、リアルタイムデータ処理方法のフローチャートである。 本出願の実施形態による、選択式リアルタイムデータ処理方法の概略図である。 本出願の実施形態による、選択式リアルタイムデータ処理方法のフローチャートである。 本出願の実施形態による、リアルタイムデータ装置の概略図である。 本出願の実施形態による、コンピュータ端末の構造ブロック図である。
本出願の実施形態における技術的解決策は、本出願の実施形態における添付図面を参照して、下記に明確かつ完全に説明される。明らかに、説明される実施形態は、単に、本出願の実施形態の一部及び全てではないものを表す。いかなる発明的な努力もすることのない本出願の実施形態に基づく当業者によって得られる他の全ての実施形態は、本出願の保護範囲内にあるものとする。
本出願の明細書及び特許請求の範囲、ならびに図面における用語「第1の」、「第2の」等が、同様の対象物を区別するために使用され、特定の順番または順序を説明するために必ず使用されるものではないことを留意されたい。そのように使用されるデータは、適切なときにいつでも交換され得、それにより、本明細書に説明される本出願の実施形態は、本明細書に例示または説明されるもの以外の順番で実施されることができることを理解されたい。加えて、用語「含む(including)」及び「含有する(containing)」は、非排他的な包括を網羅することを意図する。例えば、一連のステップまたはユニットを含む工程、方法、システム、製品、またはデバイスは、必ずしも、明示的に列挙されるこれらのステップまたはユニットだけに制限されるわけではなく、係る工程、方法、製品、またはデバイスに明示的に列挙されない、または内在しない他のステップまたはユニットを含み得る。
第1の実施形態
本出願の実施形態に従って、リアルタイムデータ処理方法の実施形態を提供する。添付図面のフローチャートに例示されるステップは、コンピュータ実行可能命令のセット等のコンピュータシステムで実行され得ることを留意されたい。さらに、論理上の順序がフローチャートで示されるが、いくつかの場合、複数のステップは、そのフローチャートに示される、または説明されるものと異なる順序で行われ得る。
本出願の実施形態によって提供される方法に関する実施形態は、サーバ上で処理され得る。良好な使用体験を提供するために、処理結果クエリサービスは、また、提供される。例えば、サーバの動作結果は、ウェブページを通してまたはクライアントによって閲覧され得る。サーバは、コンピュータとして理解することができる。明らかに、クラウドコンピューティングは、技術開発に伴って一緒に広く使用されるようになってきている。本出願の実施形態に提供される方法は、また、クラウドコンピューティングで促進または使用され得る。端末の計算能力は、また、技術開発に伴って改良されている。端末が対応するデータを取得するとき、その端末上で計算を行うことができる。例えば、端末は、限定ではないが、携帯電話、タブレットコンピュータ、及び他のポータブルデバイスを含み得る。しかしながら、サーバ上で以下の実施形態を展開することは、現在好ましい選択肢である。
現在の技術的条件の下、サーバ、端末、及びクラウドコンピューティングが依存するハードウェアアーキテクチャは類似しており、コンピューティングデバイスの種類として見なすことができる。本出願の実施形態は、係るクラウドコンピューティング内で実装されることができる。技術開発に伴って、コンピューティングデバイスのハードウェアアーキテクチャは変化しており、または、コンピューティングデバイスの新しいアーキテクチャが現れてきている。また、本出願の以下の実施形態を実装することができる。図4のコンピューティングデバイスのアーキテクチャは、下記の説明の例のように使用される。
図4は、本出願の実施形態による、リアルタイムデータ処理方法のコンピューティングデバイスのハードウェア構造を示すブロック図である。図4に示すように、コンピュータ端末40は、1つ以上のプロセッサ402(図に示されるような402a、402b、...、402n)(プロセッサ402は、限定ではないが、マイクロプロセッサ(MCU)またはプログラム可能論理回路デバイス(FPGA)等の処理デバイスを含み得る)と、データを記憶するために使用されるメモリ404と、通信機能のために使用される伝送デバイスとを含み得る。加えて、また、ディスプレイ、入力/出力インターフェース(I/Oインターフェース)、ユニバーサルシリアルバス(USB)ポート(I/Oインターフェースの部分(複数可)の1つとして含まれ得る)、ネットワークインターフェース、電力供給装置、及び/またはカメラも含み得る。当業者は、図4に示される構造は単に例示であり、上記の電子デバイスの構造を限定するものではないことを理解することができる。例えば、コンピュータ端末40は、また、図4に示されるものよりも多いもしくは少ないコンポーネントを含み得る、または図4に示されるものと異なる構成を有し得る。
プロセッサ402及び/または他のデータ処理回路の1つ以上は、概して、本明細書では「データ処理回路」と称され得ることを留意されたい。データ処理回路は、ソフトウェア、ハードウェア、ファームウェア、または任意の他のそれらの組み合わせとして、全体的にまたは部分的に、具体化され得る。さらに、データ処理回路は、単一及び別個の処理モジュールであり得る、または、コンピュータ端末40の他のコンポーネントのいずれかに、全体的にまたは部分的に組み込まれ得る。本出願の実施形態に含有されるように、データ処理回路は、処理制御(例えば、インターフェースに接続される可変抵抗端子パスの選択)の機能を果たす。
メモリ404は、本出願の実施形態では、リアルタイムデータ処理方法に対応するプログラム命令/モジュール等の、アプリケーションソフトウェアのソフトウェアプログラム及びモジュールを記憶するように構成され得る。プロセッサ402(複数可)は、メモリ404内に記憶されたソフトウェアプログラム(複数可)及びモジュール(複数可)を起動することによって、様々な機能アプリケーション及びデータ処理を実行する。メモリ404は、高速ランダムアクセスメモリを含み得、また、1つ以上の磁気記憶デバイス、フラッシュメモリ、または他の不揮発性ソリッドストレージデバイス等の不揮発性メモリを含み得る。いくつかの例では、メモリ404は、さらに、プロセッサ402(複数可)に対して遠隔に位置する記憶デバイスを含み得る。リモート記憶デバイスは、ネットワークを介して、携帯端末40に接続されることができる。係るネットワークの例は、限定ではないが、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせを含む。
伝送デバイスは、ネットワークを介して、データを受信または伝送するために使用される。ネットワークの特定の例は、コンピュータ端末40の通信プロバイダによって提供される無線ネットワークを含み得る。ある例では、伝送デバイスは、ベースステーションを経由して、インターネットとの通信を行うために、他のネットワークデバイスに接続することができるネットワークインターフェースコントローラ(NIC)を含む。ある例では、伝送デバイスは、無線で、インターネットと通信するために使用される無線周波数(RF)モジュールであり得る。
ネットワークの例は、限定ではないが、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせを含む。
ディスプレイは、例えば、ユーザがコンピュータ端末40(または、モバイルデバイス)のユーザインターフェースと対話することを可能にするタッチスクリーン液晶ディスプレイ(LCD)であり得る。
いくつかの選択的実施形態では、上記の図4に示されるコンピュータデバイス40は、ハードウェアコンポーネント(回路を含む)、ソフトウェアコンポーネント(コンピュータ可読媒体に記憶されたコンピュータコードを含む)、またはハードウェア及びソフトウェアコンポーネントの両方の組み合わせを含み得ることを留意されたい。図4は、単に、特定の実施形態の例であり、上記に説明されたコンピュータデバイス(または、モバイルデバイス)内に存在し得る複数の種類のコンポーネントを示すことが意図されることを留意されたい。
上記の動作環境では、本出願の実施形態は、リアルタイムデータ処理方法を提供する。図5は、本出願の実施形態による、リアルタイムデータ処理方法のフローチャートである。図5に示されるように、本方法は、以下のステップを含み得る。
ステップS502:分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集める。
具体的には、リアルタイムデータはリアルタイム統計データであり得、データは、常に、時間と共に変化している。
ステップS504:全てのノード上で同じ既定条件を満足するリアルタイムデータを集約し、当該同じ既定条件に対応するリアルタイムデータの総量を取得し、当該既定条件は、リアルタイムデータが集められた時間を表すために使用される。
具体的には、既定条件は、制限時間であり得る。上記に説明された既定条件のリアルタイムデータは、既定時間内に集められたリアルタイムデータであり得る。既定時間は、リアルタイムデータの収集に対応する異なる時間である。
ステップS506:同じ既定条件を満足するリアルタイムデータの完全性の程度を計算し、当該完全性の程度は、当該同じ既定条件を満足する処理済リアルタイムデータと、全てのノード上に集約されたリアルタイムデータとの比率を示すために使用される。
具体的には、係るパーセンテージによって、リアルタイムデータの処理の進捗を知ることができる。リアルタイムデータの処理の進捗は、パーセンテージが採用されるとき、より直感的になり得、サービス関係者は、リアルタイムデータの完全性の程度に従って、より的確な決定を行うことができる。
選択的解決策では、上記の完全性の程度は、量パラメータを使用して計算され得る。言い換えれば、完全性の程度は、既定条件を満足する処理済リアルタイムデータの量と、処理される集約済リアルタイムデータの総量との比率に基づいて計算される。
本明細書では、リアルタイムデータの処理は、様々な種類の動作を含み得ることを留意されたい。例えば、比較的に単純な処理は、リアルタイムデータを集めることである。例えば、リアルタイムデータの処理は、リアルタイムデータが集められた後に完了されると考えられ得る。明らかに、いくつかのより複雑な処理方法が存在し得る。例えば、リアルタイムデータを集めた後、リアルタイムデータのいくつかの処置(複数可)(例えば、フォーマット調整、データ抽出、またはデータ集約)が必要である。そのとき、処置(複数可)が完了した後に、処理は完了すると考えられ得る。
また、本明細書では、以下の実施形態の説明において、リアルタイムデータが「集められた」後に、リアルタイムデータの処理は完了すると考えられることを留意されたい。これは、リアルタイムデータの完全性のレベルが、リアルタイムデータが集められた後のある度合いまで査定されることができるためである。
上記の実施形態をトランザクションログ製品に適用することは、下記に例として使用される。上記の実施形態に従って、以下の機能を実装することができる。現在時間(分単位)におけるリアルタイムデータの統計結果は、(1000,95%)であると仮定される、すなわち、カウントされるリアルタイムの部分の量は1000であり、これらのデータの部分の完全性の程度は、現在時間において95%である。リアルタイムデータが常に変化しているため、現在時間の後の2分以内のデータが常にカウントされ、これらの2分間のリアルタイムデータの部分の量は200である。当該時間(すなわち、現在時間の後の2分に対応する時間)に計算されたデータの完全性の程度は100%と仮定される、すなわち、当該時間に対応するリアルタイムデータの統計結果は、(1200,100%)である。上記の解決策によって、トランザクションログ製品を使用するサービス関係者は、データが破棄されていないことを確実にしながら、データの正確性を把握することができる。
この例では、当該量は、処理の完了についての進捗に基づいて使用される、すなわち、データの完全性の程度は、1200個のデータが集められたとき100%であると考えられる。
本出願の第1の実施形態に開示される解決策から分かり得るように、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集め、同じ既定条件下にあるリアルタイムデータの対応する量を取得するために、全てのノード上で同じ既定条件を満足するリアルタイムデータを集約する。同じ既定条件を満足するリアルタイムデータの完全性の程度を計算し、それによって、リアルタイムデータの完全性の程度の計算を実現する。
パラメータ(すなわち、完全性の程度)は、リアルタイムデータ処理に導入されることを留意することは容易である。この完全性の程度によって、リアルタイムデータ処理の進捗を知ることができる。完全性の程度は、処理される集約済リアルタイムデータの進捗に関する既定条件を満足する処理済リアルタイムデータによって占められる割合を示すために使用される。完全性の程度が導入された後、リアルタイムデータを集めることができ、集められたリアルタイムデータを集約することができる。次に、既定条件を満足するリアルタイムデータは、集約されたリアルタイムデータから取得され、それによって、既定条件を満足するリアルタイムデータの完全性の程度を計算することができ、したがって、リアルタイムデータ処理に関する評価特質を追加する効果を上げる。
したがって、本出願によって提供される第1の実施形態の解決策により、既存技術におけるリアルタイムデータ処理の進捗を知ることを失敗することによって生じる問題を解決する。
以下の実施形態では、リアルタイムデータ処理の完全性の程度は、以下の特質、既定時間周期にわたって集められたリアルタイムデータの量から評価されることができる。これは、時間周期にわたって、どれくらいの量のリアルタイムデータを集めることができるかを評価することにやや似ている。明らかに、完全性の程度は、また、他の観点から評価されることができ、評価特質がどの観点から選択されることに関わらず、進捗を表示することができる限り、または、処理のパーセンテージに関して進捗を表示する限り、本出願の実施形態の保護の範囲内に含まれる。
本出願の上記の実施形態に従って、完全性の程度は、同じ既定条件を満足する処理済リアルタイムデータの総量と、全てのノード上に集約されたリアルタイムデータの総量との比率を示すために使用される。
選択的解決策では、上記の完全性の程度は、量パラメータに従って計算され得る。
本出願の上記の実施形態に従って、完全性の程度は、既定時間周期内で同じ既定条件を満足するリアルタイムデータの総量と、全てのノード上に集約されるリアルタイムデータの総量との比率を示すために使用され、同じ既定条件を満足するリアルタイムデータは既定時間で集められたリアルタイムデータであり、既定時間周期は、ある既定時間周期及び当該既定時間の前の時間周期である。
具体的には、既定時間は、リアルタイムデータの完全性の程度を計算する必要がある特定の時間であり得る。
選択的解決策では、リアルタイムデータの完全性の程度は、特定の時間において取得されるリアルタイムデータであり得、具体的には、特定の時間において及び特定の時間の前に処理されるリアルタイムデータの割合または進捗であり得る。
本出願の上記の実施形態に従って、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータがS502において集められた後、本方法は、さらに、以下のステップを含み得る。
ステップS508:リアルタイムデータの集められた部分のぞれぞれのタイムスタンプを取得し、タイムスタンプは、リアルタイムデータの各々の部分を処理するための時間を示すために使用される。
選択的解決策では、既定条件に制限時間がある場合(例えば、リアルタイムデータの5分を集約する)、2分で集められたリアルタイムデータのデータ完全性の程度を知る必要がある。リアルタイムデータを集めた後、タイムスタンプは、リアルタイムデータの集められた部分のそれぞれに与えられることができ、タイムスタンプは、リアルタイムデータの各々の部分を集めるときの時間を示すために使用される。
本出願の上記の実施形態に従って、ステップS506において、同じ既定条件を満足するリアルタイムデータの完全性の程度を計算することは、以下のステップを含み得る。
ステップS506:処理されたリアルタイムデータの全ての部分の総量と、現在のタイムスタンプにおけるノード上に集約されたリアルタイムデータの全ての部分の総量との比率を、完全性の程度として設定する。
選択的解決策では、リアルタイムデータが1つ以上のノードによって受信された後、リアルタイムデータの集められた部分のそれぞれのタイムスタンプを取得し得る。各タイムスタンプのリアルタイムデータの個数を判定する。処理されたリアルタイムデータの個数と、集約されたリアルタイムデータの部分の総数との比率を、完全性の程度として見なす。
前述の実施形態によって、リアルタイムデータの集められた部分のそれぞれのタイムスタンプを取得し、タイムスタンプに従って既定時間内に集められたいくつかのリアルタイムデータの部分を直感的に取得することができ、それにより、データの完全性の程度を速く計算することができる。
本出願の前述の実施形態に従って、ステップS504において、全てのノード上で同じ既定条件を満足するリアルタイムデータを集約し、同じ既定条件に対応するリアルタイムデータの総量を取得することは、以下のステップを含む。
ステップS502:リアルタイムデータを各分散ノード上で取得する。
ステップS504:各分散ノード上で同じタイムスタンプを有するリアルタイムデータの取得された部分を集約し、各タイムスタンプに対応するリアルタイムデータの部分の各々の総数を取得する。
選択的解決策では、サーバ内のリアルタイムデータの各部分は、対応する処理時間を有し、リアルタイムデータの各々の部分は、異なるノードの間で分散される。既定時間周期内でリアルタイムデータを集約するとき、各分散ノード上のリアルタイムデータは所定の時間周期内で取得され、各分散ノード上のリアルタイムデータは集約される、すなわち、各分散ノード上の同じ対応する処理時間がかかるリアルタイムデータの部分を組み合わせる。組み合わせの動作後に、統合されたデータ構造(例えば、時間:ファイル数)は各分散ノード上で生成され、次に、分散ノード上のデータ構造は、単一ノードに伝送される。組み合わせ動作は、最後に、単一ノード上で行われる、すなわち、各分散ノード上で同じ対応する処理時間がかかるリアルタイムデータの部分を組み合わせ、リアルタイムデータの集約結果は、単一ノード上で形成される。当該結果は、複数の処理時間のリアルタイムデータ、各処理時間に対応するリアルタイムデータの各々の量を含む。
別の選択的解決策では、リアルタイムデータの各部分は、異なるノード間で分散され、各分散ノード上のリアルタイムデータの部分は集約される、すなわち、既定時間周期内のリアルタイムデータの部分の総数を取得し、所定時間周期でリアルタイムデータを集めるためにかかる時間を取得する。後で、既定時間内の集約済リアルタイムデータの部分の総量と、集約済リアルタイムデータを集めるためにかかる時間とを取得するために、各分散ノード上の集約結果を単一ノード上で組み合わせる。
上記の実施形態によって、分散環境に起因して、各分散ノード上のリアルタイムデータは最初に集約され、次に、組み合わせ動作は単一ノード上で行われる。次に、既定時間周期内のリアルタイムデータの集約結果を取得する。この解決策を使用して、データを破棄することなく、既定時間周期内にリアルタイムデータを速く及び正確に集約する目的を達成することができる。
本出願の上記の実施形態は、サーバによって生成されたログファイルの完全性の程度のリアルタイム統計の例を使用して、下記に詳細に説明される。図6に示されるように、選択式リアルタイムデータ処理方法の概略図を提供する。リアルタイム算出エンジンは、第1の時間において、20個のリアルタイムデータをファイルaから取得し、計算された完全性の程度は25%である。第2の時間において、25個のリアルタイムデータをファイルbから取得し、計算された完全性の程度は35%である。第3の時間において、35個のリアルタイムデータをファイルcから取得し、計算された完全性の程度は75%である。第4の時間において、20個のリアルタイムデータをファイルdから取得し、計算された完全性の程度は100%である。リアルタイムデータの完全性の程度が100%または95%に達すると、リアルタイムデータ及びリアルタイムデータの完全性の程度は、メモリからデータベースに記憶される。
図7に示されるように、本実施形態は、以下のステップを含み得る。
ステップS702:データソースを集め、タイムスタンプで各データソースをラベル付けする。
このステップでは、データソースを集め、すなわち、分散環境における各ログファイルを集める。各ログファイルは、フェッチされるとき、対応する処理時間を有する。例えば、aログ、bログ、cログは、各々、3つのログファイルを表し、リアルタイムシステムに達したときに、対応する処理時間(すなわち、上記に説明されたようなタイムスタンプ)を有する。これらの処理時間は、ログファイルの処理の各々の時間を示すために使用される。表1に示されるように、aログに対応する処理時間は20160113 13:42:50であり、bログに対応する処理時間は20160113 13:42:52であり、cログに対応する処理時間は20160113 13:42:52である。
Figure 0007046073000001
ステップS704:タイムスタンプに従って、識別可能データ構造を取得する。
上記のデータ構造は、時間:ファイル数である。表2に示されるように、表1のデータ構造は、タイムスタンプに従って識別可能データ構造に更新されることができる。
Figure 0007046073000002
ステップS706:集約するために、分散ノード上の識別可能データ構造を単一ノードに伝送する。
分散環境に起因して、分散環境における各分散ノードは、上記に説明されたような識別可能データ構造(すなわち、時間:ファイル数)を作り、組み合わせ動作が単一ノード上で行われる。
例えば、ノードA上で生成された識別可能データ構造のコンテンツは、表2に示される。
表2に示されるように、20160113 13:42:50の時点では、aログファイルは処理され、その処理はまだ完了していない。Aノード上の2つのファイル(bログ及びcログ)及び他のファイルは、完全に処理されていると考えられ得る。20160113 13:42:52の時点では、2つのファイル(bログ及びcログ)が処理中であり、まだ完全に処理されていない。ノードA上の他のファイルは、完全に処理されていると考えられ得、aログファイルはまだ処理されていない。さらに、20160113 13:42:49及び前回の時点(複数可)では、ノードA上の3つのファイル(aログ、bログ、cログ)及び他のファイルは、完全に処理されていると考えられ得る。
ノードB上で生成された識別可能データ構造のコンテンツは、表3に示される。
Figure 0007046073000003
表3に示されるように、20160113 13:42:51の時点では、kログ、mログ、及びnログの3つのファイルが処理中であり、まだ完全に処理されていない。ノードB上の5つのファイル(dログ、eログ、fログ、gログ、及びhログ)及び他のファイルは、完全に処理されていると考えられ得る。20160113 13:42:52の時点では、5つのファイル(dログ、eログ、fログ、gログ、及びhログ)が処理中であり、まだ完全に処理されていない。ノードB上の他のファイルは、完全に処理されていると考えられ得、3つのファイル(kログ、mログ、及びnログ)はまだ処理されていない。さらに、20160113 13:42:50及び前回の時点(複数可)では、ノードB上の8つのファイル(dログ、eログ、fログ、gログ、hログ、kログ、mログ、及びnログ)及び他のファイルは、また、完全に処理されていると考えられ得る。
ノードA及びノードBのデータ構造を組み合わせ、組み合わせ後にノード上に生成されたデータ構造のコンテンツは、表4に示される。
Figure 0007046073000004
ステップS708:データが提出されたときの集約されたデータ構造に基づいて、リアルタイムデータの完全性の程度を計算し、リアルタイムデータ及び完全性の程度を一緒にデータベース内に記憶する。
随意に、各時間的瞬間に対応する完全性の程度は、複数のタイムスタンプに対応する完全性の程度である。完全性の程度が計算された後、2つの指標、各タイムスタンプ、及びタイムスタンプ毎に計算された完全性の各々の程度(タイムスタンプ、完全性の程度)は、データベース内に一緒に記憶され、それにより、データベース内のデータの各部分は、データ処理の完全性のレベルを有する。データ処理の完全性のレベルに基づいて、関連付けられたリアルタイムデータの処理進捗を知ることができ、より的確な決定は、さらに、リアルタイムデータのために行われる。
データソース内のリアルタイムデータの個数を説明しないが、前述の実施形態はログファイル(すなわち、上記に説明されたようなデータソース)だけを集めることができ、完全性の程度は集められたログファイルに基づいて計算されることを留意されたい。したがって、2つの指標(リアルタイムデータ及び完全性の程度)をデータベース内に一緒にどのように記憶するかの例は、本出願の実施形態に説明されない。
組み合わせ後のノード上のデータ構造に従って、上記の表1~表4に示されるような実施形態のリアルタイムデータの完全性の程度を以下のように計算する。
1:20160113 13:42:53の時間的瞬間に、11のログファイルは、20160113 13:42:49のタイムスタンプを有する。20160113 13:42:49のタイムスタンプを伴うこれらの11のファイルは、完全に処理されていると考えられる。この理由は、これらのログファイルを処理するための最短時間は、49秒よりも大きい20160113 13:42:50であるからである。したがって、49秒の完全性の程度は100%である。
2:20160113 13:42:53の時間的瞬間に、11のファイルは、20160113 13:42:50のタイムスタンプを有する。20160113 13:42:50のタイムスタンプを伴う11のファイルのうち、50秒は52秒及び51秒よりも小さいため、ノードAのaログファイルは処理中であり、まだ完全に処理されておらず、ノードAのbログファイル及びcログファイル、ならびにノードBのdログファイル、eログファイル、fログファイル、gログファイル、及びhログファイルは完全に処理され、ノードBの3つのファイル(kログ、mログ、及びnログ)は、また、完全に処理されている。したがって、20160113 13:42:50のタイムスタンプを伴う11のログファイルのうち完全に処理されているログファイル数は、7+3=10である。したがって、完全性の程度は10/11=91%である。
3:20160113 13:42:53の時間的瞬間に、20160113 13:42:51であるタイムスタンプに関して、11ファイルある。51秒は52秒と50秒との間であるため、20160113 13:42:51のタイムスタンプを伴う11のファイルに関して、ノードAのaログファイルはまだ処理されておらず、ノードBの3つのファイル(kログ、mログ、及びnログ)は処理中であり、完全に処理されておらず、ノードAのbログ及びcログ、ならびにノードBの5つのファイル(dログ、eログ、fログ、gログ、及びhログ)は完全に処理されている。したがって、20160113 13:42:51のタイムスタンプを伴う11のログファイルのうち完全に処理されているログファイル数は7であり、51秒の全てのリアルタイムデータの完全性の程度は、7/11=63.6%として取得されることができる。
4:20160113 13:42:53の時間的瞬間に、11のファイルは、20160113 13:42:52のタイムスタンプを有する。52秒は51秒と50秒よりも長いため、20160113 13:42:52のタイムスタンプを伴う11のファイルのうち、ノードAの2つのファイル(bログ及びCログ)、ならびにノードBの5つのファイル(dログ、eログ、fログ、gログ、及びhログ)は処理中であり、まだ処理を終えていない。ノードAのaログファイル及びノードBの3つのファイル(kログ、mログ、及びnログ)はまだ処理されていない。したがって、20160113 13:42:52のタイムスタンプを伴う11のログファイルは完全に処理されていないと考えられ、52秒の全てのリアルタイムデータの完全性の程度は0%として取得される。
5:20160113 13:42:53の時間的瞬間に、11のファイルは、20160113 13:42:53のタイムスタンプを有する。20160113 13:42:52に一致する全てのログファイルが処理されるため、すなわち、53秒におけるログファイルは、まだ集められておらず、53秒のデータの統計結果は0%である。
上記の方法のステップに従って、20160113 13:42:54の時間的瞬間において、いくつかのノードによって集められたリアルタイムデータに関するリアルタイムデータの完全性の程度を計算する。
20160113 13:42:49のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は11であり、49秒の全てのリアルタイムデータの完全性の程度を11/11=100%として取得することができる。
20160113 13:42:50のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は11であり、50秒の全てのリアルタイムデータの完全性の程度を11/11=100%として取得することができる。
20160113 13:42:51のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は8であり、51秒の全てのリアルタイムデータの完全性の程度を8/11=72.3%として取得することができる。
20160113 13:42:52のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は5であり、52秒の全てのリアルタイムデータの完全性の程度を5/11=45.5%として取得することができる。
20160113 13:42:53のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は2であり、53秒の全てのリアルタイムデータの完全性の程度を2/11=18.2%として取得することができる。
20160113 13:42:54のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は0であり、54秒の全てのリアルタイムデータの完全性の程度を0として取得することができる。
上記の方法のステップに従って、20160113 13:42:55の時間的瞬間において、いくつかのノードによって集められたリアルタイムデータに関するリアルタイムデータの完全性の程度を計算する。
20160113 13:42:49のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は11であり、49秒の全てのリアルタイムデータの完全性の程度を11/11=100%として取得することができる。
20160113 13:42:50のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は11であり、50秒の全てのリアルタイムデータの完全性の程度を11/11=100%として取得することができる。
20160113 13:42:51のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は9であり、51秒の全てのリアルタイムデータの完全性の程度を9/11=81.8%として取得することができる。
20160113 13:42:52のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は6であり、52秒の全てのリアルタイムデータの完全性の程度を6/11=54.5%として取得することができる。
20160113 13:42:53のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は4であり、53秒の全てのリアルタイムデータの完全性の程度を4/11=36.4%として取得することができる。
20160113 13:42:54のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は2であり、54秒の全てのリアルタイムデータの完全性の程度を2/11=18.2%として取得することができる。
20160113 13:42:55のタイムスタンプを伴う11のログファイルに関して、完全に処理されているログファイル数は0であり、55秒の全てのリアルタイムデータの完全性の程度を0として取得することができる。
本出願の実施形態は、非常に重要な属性をリアルタイムデータに追加する、すなわち、完全性の程度の概念が提案される。データの各部はパーセンテージ(0%~100%)の概念を有し、当該パーセンテージは、当該データの部分の完全性のレベルを表すために使用される。データの完全性の程度がなければ、リアルタイムデータの結果には、進捗の概念がない。この場合、多くの速く意思決定を行う分野では、リアルタイムデータに基づいて決定を行うかどうかは知られていない。データに完全性の程度が追加される場合、特に、リアルタイムデータに完全性の程度が追加される場合、リアルタイムデータに基づいて、より正確な決定を行うことができる。
リアルタイムデータの完全性の程度を加えることは、各タイムスタンプのリアルタイムデータを(タイムスタンプ、完全性の程度)になるようにする、すなわち、リアルタイムデータの単一の指標を、リアルタイムデータ及び各タイムスタンプの完全性の程度を含む2つの指標に変換する。さらに、これらの2つの指標をデータベース内に一緒に記憶する。完全性の程度の関数を以下の計算に適用することができる。アラーム監視システムのリアルタイム計算、大画面のデータのリアルタイム計算、トランザクションログのデータ統計、及び単一値集約にリアルタイム計算が挙げられる。アラーム監視システムのリアルタイム計算は、アラームを報告するかどうかを判定するために、データの各部の完全性の程度の計算に基づいて、データの各部の処理の完全性のレベルを知ることができ、それによって、アラームの各インスタンスの正確性を確実にする。大画面のデータにおけるリアルタイム計算に関して、サービス者及び意思決定者が、係るデータ報告に関する最も的確な、最速の、及び正しい決定を行うことを可能にするために、処理進捗のパーセンテージを現在のデータに追加することができる。例えば、現時点における現在の広告によってもたらされている収入が100万である場合、及び現時点に関連付けられる完全性の程度を100%として判定できる場合、広告をすぐに変えることができる。11.11イベント等の時間的制約があるプロモーションでは、広告によって、より多くの収入をもたらし得るようになる。
データの完全性の程度を多くの分野で適用することができる。例えば、リアルタイム計算に起因して、毎分の売上高等の現在の統計データは常に変化している。サービス関係者は、データ処理の進捗について分からない。データが常に入ってくるため、本出願の実施形態は、係る問題のために、完全性の程度をリアルタイムデータに追加する。既定条件を満足するリアルタイムデータの完全性の程度の計算に基づいて、リアルタイムデータは、パーセンテージの概念を有し得る。パーセンテージを使用して、リアルタイムデータの処理の進捗を知ることができる。例えば、事前に設定された数分内の売上高は常に変化している。意思決定者は、既定条件を満たすリアルタイムデータの完全性の程度の計算に基づいて、販売戦略を変更するかどうかを判定することができる。別の例では、アラーム監視システムのリアルタイムデータに関して、計算された完全性の程度(すなわち、完全性の程度によって表されるデータ処理の完全性のレベル)に従って、アラームを出すかどうかを判定することができる。上記の解決策によって、リアルタイムデータの処理の進捗が既存技術で知られていない問題を解決し、それにより、サービス関係者は、リアルタイムデータの完全性の程度に従って、いくつかのより正確な決定を行うことができる。
前述の方法に関する実施形態は全て、単純な説明のために、一連のアクションの組み合わせとして表されることを留意されたい。当業者は、本出願に従って、あるステップが他の順序でまたは同時に行われ得るため、本出願は説明されるアクションの順序によって限定されないことを理解しているはずである。さらに、当業者は、また、本明細書に説明される実施形態は全て好ましい実施形態であり、含まれるアクション及びモジュールは必ずしも本出願によって要求されるものではないことを理解しているはずである。
上記の実施形態の説明によって、当業者は、上記の実施形態に従った方法がソフトウェアに必要な汎用ハードウェアプラットフォームを加えて実施され得、明らかに、またハードウェアによっても実施され得ることを明確に理解することができる。しかしながら、多くの場合、前者のものが良好な実施形態である。係る理解に基づいて、本出願の技術的解決策の本質または既存技術に貢献する部分は、ソフトウェア製品の形態で具体化され得る。コンピュータソフトウェア製品は、ストレージ媒体(ROM/RAM、ディスク、光学ディスク)の中に記憶され、端末デバイス(携帯電話、コンピュータ、サーバ、またはネットワークデバイス等であり得る)に、本出願の様々な実施形態に説明される方法を行わせるいくつかの命令を含む。
第2の実施形態
本出願の実施形態に従って、第1の実施形態のリアルタイムデータ処理方法を実施するためのリアルタイムデータ処理装置の実施形態をさらに提供する。図8に示されるように、装置800は、収集モジュール802、集約モジュール804、及び計算モジュール806を含み得る。
収集モジュール802は、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集めるように構成されている。集約モジュール804は、全てのノード上で同じ既定条件を満足するリアルタイムデータを集約し、同じ既定条件に対応するリアルタイムデータの総量を取得するように構成されており、当該既定条件は、リアルタイムデータが集められた時間を表すために使用される。計算モジュール806は、同じ既定条件を満足するリアルタイムデータの完全性の程度を計算するように構成されており、完全性の程度は、同じ既定条件を満足する処理済リアルタイムデータと、全てのノード上に集約されたリアルタイムデータとの比率を示すために使用される。
具体的には、上記に説明されたリアルタイムデータはリアルタイムで計算されたデータであり得、データは、常に、時間と共に変化している。上記の既定条件は、制限時間であり得る。上記に説明された既定条件のリアルタイムデータは、既定時間(複数可)内に集められたリアルタイムデータであり得る。既定時間(複数可)は、リアルタイムデータの収集に対応する異なる時間(複数可)である。上記の進捗はパーセンテージ(すなわち、処理されたリアルタイムデータと、集約後に処理されるデータとの比率)であり得る。パーセンテージを使用して、リアルタイムデータ処理の進捗を知ることができる。パーセンテージが使用されるとき、リアルタイムデータの処理の進捗は、より直感的になり得、サービス関係者が、リアルタイムデータの完全性の程度に基づいて、より的確な決定を行うことがより容易になる。
本明細書では、リアルタイムデータの処理は、様々な種類の動作を含み得ることを留意されたい。例えば、比較的に単純な処理は、リアルタイムデータを集めることである。例えば、リアルタイムデータの処理は、リアルタイムデータが集められた後に完了されると考えられ得る。明らかに、いくつかのより複雑な処理方法が存在し得る。例えば、リアルタイムデータを集めた後、リアルタイムデータのいくつかの処置(複数可)(例えば、フォーマット調整、データ抽出、またはデータ集約)が必要である。そのとき、処置(複数可)が完了した後に、処理は完了すると考えられ得る。
また、収集モジュール802、集約モジュール804、及び計算モジュール806は、第1の実施形態のステップS502~S506に対応し、これらの3つのモジュール及び対応するステップによって実施される例及び適用シナリオは同じであるが、上記に説明されたような第1の実施形態に開示された内容に限定されないことを留意されたい。上記のモジュールが、第1の実施形態に提供されたコンピュータ端末40で起動する装置の一部として動作することができることを留意されたい。
上記から分かり得るように、本出願の第2の実施形態に開示される解決策では、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集め、同じ既定条件を満足するリアルタイムデータの対応する量を取得するために、全てのノード上で同じ既定条件を満足するリアルタイムデータを集約する。同じ既定条件を満足するリアルタイムデータの完全性の程度を計算し、それによって、リアルタイムデータの完全性の程度の計算を実施する。
パラメータ(すなわち、完全性の程度)は、リアルタイムデータ処理に導入されることを留意することは容易である。この完全性の程度によって、リアルタイムデータ処理の進捗を知ることができる。完全性の程度は、処理される集約済リアルタイムデータの進捗に対する既定条件を満足する処理済リアルタイムデータによって占められる割合を示すために使用される。完全性の程度が導入された後、リアルタイムデータを集めることができ、集められたリアルタイムデータを集約することができる。次に、既定条件を満足するリアルタイムデータは、集約されたリアルタイムデータから取得され、それによって、既定条件を満足するリアルタイムデータの完全性の程度を計算することができ、したがって、リアルタイムデータ処理に関する評価特質を追加する効果を上げる。
したがって、本出願によって提供される前述の第2の実施形態の解決策により、既存技術がリアルタイムデータ処理の進捗を知ることを失敗するような技術的問題を解決する。
進捗はパーセンテージ(すなわち、処理されたリアルタイムデータと、集約後に処理されるデータとの比率)であり得る。パーセンテージを使用して、リアルタイムデータ処理の進捗を知ることができる。パーセンテージが使用されるとき、リアルタイムデータの処理の進捗は、より直感的になり得、サービス関係者が、リアルタイムデータの完全性の程度に基づいて、より的確な決定を行うことがより容易になる。
リアルタイムデータの処理は、様々な種類の動作を含み得る。例えば、比較的に単純な処理は、リアルタイムデータを集めることである。例えば、リアルタイムデータの処理は、リアルタイムデータが集められた後に完了されると考えられ得る。明らかに、いくつかのより複雑な処理方法が存在し得る。例えば、リアルタイムデータを集めた後、リアルタイムデータのいくつかの処置(複数可)(例えば、フォーマット調整、データ抽出、またはデータ集約)が必要である。そのとき、処置(複数可)が完了した後に、処理は完了すると考えられ得る。
以下の実施形態の説明では、リアルタイムデータの処理は、リアルタイムデータが「集められた」後に完了されると考えられる。これは、リアルタイムデータの完全性のレベルが、リアルタイムデータが集められた後にある程度まで査定されることができるためである。
以下の実施形態では、リアルタイムデータ処理の完全性の程度は、以下の特質、既定時間周期にわたって集められたリアルタイムデータの量から評価されることができる。これは、時間周期にわたって、どれくらいの量のリアルタイムデータを集めることができるかを評価することにやや似ている。明らかに、完全性の程度は、また、他の観点から評価されることができ、評価特質がどの観点から選択されることに関わらず、進捗を表示することができる限り、または、処理のパーセンテージに関して進捗を表示する限り、本出願の実施形態の保護の範囲内に含まれる。
本出願の上記の実施形態に従って、完全性の程度は、同じ既定条件を満足する処理済リアルタイムデータの総量と、全てのノード上に集約されたリアルタイムデータの総量との比率を示すために使用される。
選択的解決策では、完全性の程度は、量パラメータに従って計算することができる。
本出願の上記の実施形態に従って、完全性の程度は、既定時間周期内で同じ既定条件を満足するリアルタイムデータの総量と、全てのノード上に集約されるリアルタイムデータの総量との比率を示すために使用され、同じ既定条件を満足するリアルタイムデータは既定時間で集められたリアルタイムデータであり、既定時間周期は、ある既定時間周期及び当該既定時間の前の時間周期である。
具体的には、既定時間は、リアルタイムデータの完全性の程度を計算する必要がある特定の時間であり得る。
選択的解決策では、リアルタイムデータの完全性の程度は、特定の時間において取得されるリアルタイムデータであり得、具体的には、特定の時間において及び特定の時間の前に処理されるリアルタイムデータの割合または進捗であり得る。
本出願の上記の実施形態に従って、既定条件が既定時間内に集められたリアルタイムデータを含むとき、リアルタイムデータ処理装置800は、さらに、図8に示されるような獲得モジュール808を含む。
獲得モジュール808は、リアルタイムデータを集めた後にリアルタイムデータの集められた部分のぞれぞれのタイムスタンプを取得するように構成されており、タイムスタンプは、リアルタイムデータの各々の部分を処理するための時間を示すために使用される。
獲得モジュール808は、第1の実施形態では、ステップS508に対応し、モジュール及び対応するステップによって実施される例及び適用シナリオは同じであり、第1の実施形態に開示された内容に限定されないことを留意されたい。上記のモジュールが、第1の実施形態に提供されたコンピュータ端末40の装置の一部として動作することができることを留意されたい。
前述の実施形態によって、集められたリアルタイムデータの各部分はタイムスタンプであり、既定時間に集められたリアルタイムデータの個数は、各々のタイムスタンプに従って直感的に取得することができ、それにより、データの完全性の程度を速く計算することができる。
本出願の上記の実施形態に従って、図8に示されるように、計算モジュール806は、さらに、現在のタイムスタンプにおける全ての処理済リアルタイムデータの総量と、全てのノード上に集約されたリアルタイムデータの総量との比率を、完全性の程度として使用するように構成されている。
計算モジュール806は、第1の実施形態では、ステップS506に対応し、モジュール及び対応するステップによって実施される例及び適用シナリオは同じであり、第1の実施形態に開示された内容に限定されないことを留意されたい。上記のモジュールが、第1の実施形態に提供されたコンピュータ端末40の装置の一部として動作することができることを留意されたい。
本出願の上記の実施形態に従って、図8に示されるように、集約モジュール806は、獲得ユニット810及び集約ユニット812を含む。
獲得ユニット810は、リアルタイムデータを各分散ノード上で取得するように構成されている。集約ユニット812は、各分散ノード上で取得される同じタイムスタンプを有するリアルタイムデータの部分を集約し、各タイムスタンプに対応するリアルタイムデータの各々の総量を取得するように構成されている。
獲得ユニット810及び収集ユニット812は、第1の実施形態のステップS502~S504に対応し、これらの2つのモジュール及び対応するステップによって実施される例及び適用シナリオは同じであり、第1の実施形態に開示された内容に限定されないことを留意されたい。上記のモジュールが、第1の実施形態に提供されたコンピュータ端末40の装置の一部として動作することができることを留意されたい。
上記の実施形態によって、分散環境に起因して、各分散ノード上のリアルタイムデータは最初に集約され、次に、組み合わせ動作は単一ノード上で行われる。次に、既定時間周期内のリアルタイムデータの集約結果を取得する。この解決策を使用して、データを破棄することなく、既定時間周期内にリアルタイムデータを速く及び正確に集約する目的を達成することができる。
本出願の実施形態は、非常に重要な属性をリアルタイムデータに追加する、すなわち、完全性の程度の概念が提案される。データの各部はパーセンテージ(0%~100%)の概念を有し、当該パーセンテージは、当該データの部分の完全性のレベルを表すために使用される。データの完全性の程度がなければ、リアルタイムデータの結果には、進捗の概念がない。この場合、多くの速く意思決定を行う分野では、リアルタイムデータに基づいて決定を行うかどうかは知られていない。データに完全性の程度が追加される場合、特に、リアルタイムデータに完全性の程度が追加される場合、リアルタイムデータに基づいて、より正確な決定を行うことができる。
データの完全性の程度を多くの分野で適用することができる。例えば、リアルタイム計算に起因して、毎分の売上高等の現在の統計データは常に変化している。サービス関係者は、データ処理の進捗について分からない。データが常に入ってくるため、本出願の実施形態は、係る問題のために、完全性の程度の概念を提案する、すなわち、リアルタイムデータに追加する。既定条件を満足するリアルタイムデータの完全性の程度の計算に基づいて、リアルタイムデータは、パーセンテージの概念を有し得る。パーセンテージを使用して、リアルタイムデータの処理の進捗を知ることができる。例えば、事前に設定された数分内の売上高は常に変化している。意思決定者は、既定条件を満たすリアルタイムデータの完全性の程度の計算に基づいて、販売戦略を変更するかどうかを判定することができる。別の例では、アラーム監視システムのリアルタイムデータに関して、計算された完全性の程度(すなわち、完全性の程度によって表されるデータ処理の完全性のレベル)に従って、アラームを出すかどうかを判定することができる。上記の解決策によって、リアルタイムデータの処理の進捗が既存技術で知られていない問題を解決し、それにより、サービス関係者は、リアルタイムデータの完全性の程度に従って、いくつかのより正確な決定を行うことができる。
第3の実施形態
本出願の実施形態は、コンピュータ端末を提供し得る。コンピュータ端末は、コンピュータ端末グループの任意のコンピュータ端末デバイスであり得る。随意に、本実施形態では、コンピュータ端末は、また、係る携帯端末等の端末デバイスと交換され得る。
随意に、本実施形態では、コンピュータ端末は、コンピュータネットワークの複数のネットワークデバイスの少なくとも1つのネットワークデバイス内に位置し得る。
本実施形態では、コンピュータ端末は、リアルタイムデータ処理方法で、以下のステップのプログラムコードを実行し得る。当該ステップとして、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集めるステップと、全てのノード上で同じ既定条件を満足するリアルタイムデータの集約を行い、同じ既定条件に対応するリアルタイムデータの総量を取得するステップであって、当該既定条件はリアルタイムデータが集められた時間を表すために使用される、当該取得するステップと、当該同じ既定条件を満足するリアルタイムデータの完全性の程度を計算するステップであって、当該完全性の程度は、同じ既定条件を満足する処理済リアルタイムデータと、全てのノード上に集約されたリアルタイムデータとの比率を示すために使用される、当該計算するステップと、が挙げられる。
図9は、本出願の実施形態による、コンピュータ端末の構造ブロック図である。図9に示すように、コンピュータ端末900は、1つ以上のプロセッサ902(図に示されるのは1つだけである)及びメモリ904を含み得る。端末はコンピューティング端末として理解することができ、コンピューティング端末は、動作を行い及び動作の結果を返すことができる、ある程度の計算能力を保有する。動作時、コンピュータ端末は、サービスプロバイダとして理解することができる。複数の端末は、コンピューティングサービスを連帯して行うことができる。端末は、コンピュータ、携帯電話、タブレット等であり得る。明らかに、端末がコンピュータであるとき、複数のコンピュータは、サービスを連帯して提供することができ、また、サーバグループとして理解することができる。別の観点から、これらのデバイスは、また、クラウドコンピューティングサービスを提供することができる。
メモリは、本出願の実施形態では、リアルタイムデータ処理方法及び装置に対応するプログラム命令/モジュール等のソフトウェアプログラム及びモジュールを記憶するように構成され得る。プロセッサ(複数可)は、メモリ内に記憶されたソフトウェアプログラム(複数可)及びモジュールを起動することによって、様々な機能アプリケーション及びデータ処理を実行する、すなわち、上記の方法を実施する。メモリは、高速ランダムアクセスメモリを含み得、また、1つ以上の磁気記憶デバイス、フラッシュメモリ、または他の不揮発性ソリッドストレージデバイス等の不揮発性メモリを含み得る。いくつかの例では、メモリは、さらに、プロセッサ(複数可)に対して遠隔に位置する記憶デバイスを含み得る。これらの記憶デバイスは、ネットワークを通して、コンピュータ端末900に接続されることができる。係るネットワークの例は、限定ではないが、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせを含む。
当該プロセッサ(複数可)は、伝送デバイスによって、メモリ内に記憶された情報及びアプリケーションを呼び出し、以下のステップを行い得る。当該ステップとして、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集めるステップと、全てのノード上で同じ既定条件を満足するリアルタイムデータの集約を行い、同じ既定条件に対応するリアルタイムデータの総量を取得するステップであって、当該既定条件はリアルタイムデータが集められた時間を表すために使用される、当該取得するステップと、当該同じ既定条件を満足するリアルタイムデータの完全性の程度を計算するステップであって、当該完全性の程度は、同じ既定条件を満足する処理済リアルタイムデータと、全てのノード上に集約されたリアルタイムデータとの比率を示すために使用される、当該計算するステップと、が挙げられる。
随意に、当該プロセッサ(複数可)は、さらに、以下のステップのプログラムコードを実行し得る。当該ステップとして、完全性の程度は、同じ既定条件を満足する処理済リアルタイムデータの総量と、全てのノード上に集約されたリアルタイムデータの総量との比率を示すために使用されるステップが挙げられる。
随意に、当該プロセッサ(複数可)は、さらに、以下のステップのプログラムコードを実行し得る。当該ステップとして、完全性は、既定時間周期で同じ既定条件を満足するリアルタイムデータの総量によって占められる全てのノード上に集約されたリアルタイムデータの総量の割合を示すために使用され、同じ既定条件を満足するリアルタイムデータは既定時間で集められたリアルタイムデータであり、既定時間周期は、既定時間及び当該既定時間の前の時間周期であるステップが挙げられる。
随意に、当該プロセッサ(複数可)は、さらに、以下のステップのプログラムコードを実行し得る。当該ステップとして、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集めた後、リアルタイムデータの集められた部分のぞれぞれのタイムスタンプを取得するステップであって、当該タイムスタンプは、リアルタイムデータの各々の部分が処理されたときの時間を示すために使用される、当該取得するステップが挙げられる。
随意に、当該プロセッサ(複数可)は、さらに、以下のステップのプログラムコードを実行し得る。当該ステップとして、現在のタイムスタンプにおける全ての処理済リアルタイムデータの総量と、全てのノード上に集約されたリアルタイムデータの総量との比率を、完全性の程度として使用するステップが挙げられる。
随意に、当該プロセッサ(複数可)は、さらに、以下のステップのプログラムコードを実行し得る。当該ステップとして、各分散ノード上でリアルタイムデータを取得するステップと、各分散ノード上で取得される同じタイムスタンプを有するリアルタイムデータの部分を集約し、各タイムスタンプに対応するリアルタイムデータの各々の総量を取得するステップとが挙げられる。
本出願の実施形態では、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集め、全てのノード上で同じ既定条件を満足するリアルタイムデータを集約する。同じ既定条件に対応するリアルタイムデータの総量を取得し、同じ既定条件を満足するリアルタイムデータの完全性の程度を計算し、それによって、リアルタイムデータの完全性の程度の計算を実現する。
パラメータ(すなわち、完全性の程度)は、リアルタイムデータ処理に導入されることを留意することは容易である。この完全性の程度によって、リアルタイムデータ処理の進捗を知ることができる。完全性の程度は、処理される集約済リアルタイムデータの進捗に対する既定条件を満足する処理済リアルタイムデータによって占められる割合を示すために使用される。完全性の程度が導入された後、リアルタイムデータを集めることができ、集められたリアルタイムデータを集約することができる。次に、既定条件を満足するリアルタイムデータは、集約されたリアルタイムデータから取得され、それによって、既定条件を満足するリアルタイムデータの完全性の程度を計算することができ、したがって、リアルタイムデータ処理に関する評価特質を追加する効果を上げる。
したがって、本出願の実施形態は、既存技術がリアルタイムデータ処理の進捗を知ることができないような技術的問題を解決する。
当業者は、図9に示される構造は例示だけであることを理解することができ、コンピュータ端末は、また、スマートフォン(Android携帯電話、iOS携帯電話等)、タブレットコンピュータ、ハンドヘルドコンピュータ、及び携帯インターネットデバイス(MID)、PAD等の端末デバイスであり得る。図9は、上記の電子デバイスの構造に任意の制限を課していない。例えば、コンピュータ端末900は、また、図9に示されるものよりも多いもしくは少ないコンポーネント(ネットワークインターフェース、表示デバイス等)を含み得る、または図9に示されるものと異なる構成を有し得る。図9のコンピュータは、また、外部サービスを提供するサーバとして使用されることができる。
当業者は、前述の実施形態の各方法の全てまたは一部が、端末デバイスの関連ハードウェアに指示するプログラムによって完了され得ることを理解し得る。当該プログラムは、コンピュータ可読記憶媒体内に記憶され得、当該ストレージ媒体は、フラッシュディスク、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク、または光ディスク等を含み得る。
第4の実施形態
本出願の実施形態は、また、ストレージ媒体を提供する。随意に、本実施形態では、ストレージ媒体は、上記に説明されたような第1の実施形態で提供されるリアルタイムデータ処理方法によって実行されるプログラムコードを記憶するように構成され得る。
随意に、本実施形態では、ストレージ媒体は、コンピュータネットワーク内のコンピュータ端末グループの任意のコンピュータ端末内に、または携帯端末グループの任意の携帯端末内に位置し得る。
随意に、本実施形態では、ストレージ媒体は、以下のステップを行うためのプログラムコードを記憶するように構成されている。当該ステップとして、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集めるステップと、全てのノード上で同じ既定条件を満足するリアルタイムデータの集約を行い、同じ既定条件に対応するリアルタイムデータの総量を取得するステップであって、当該既定条件はリアルタイムデータが集められた時間を表すために使用される、当該取得するステップと、当該同じ既定条件を満足するリアルタイムデータの完全性の程度を計算するステップであって、当該完全性の程度は、同じ既定条件を満足する処理済リアルタイムデータと、全てのノード上に集約されたリアルタイムデータとの比率を示すために使用される、当該計算するステップと、が挙げられる。
随意に、ストレージ媒体は、さらに、以下のステップを行うためのプログラムコードを記憶するように構成されている。当該ステップとして、完全性の程度は、同じ既定条件を満足する処理済リアルタイムデータの総量と、全てのノード上に集約されたリアルタイムデータの総量との比率を示すために使用されるステップが挙げられる。
随意に、ストレージ媒体は、さらに、以下のステップを行うためのプログラムコードを記憶するように構成されている。当該ステップとして、完全性は、既定時間周期で同じ既定条件を満足するリアルタイムデータの総量によって占められる全てのノード上に集約されたリアルタイムデータの総量の割合を示すために使用され、同じ既定条件を満足するリアルタイムデータは既定時間で集められたリアルタイムデータであり、既定時間周期は、既定時間及び当該既定時間の前の時間周期であるステップが挙げられる。
随意に、ストレージ媒体は、さらに、以下のステップを行うためのプログラムコードを記憶するように構成されている。当該ステップとして、分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを集めた後、リアルタイムデータの集められた部分のぞれぞれのタイムスタンプを取得するステップであって、当該タイムスタンプは、リアルタイムデータの各々の部分が処理されたときの時間を示すために使用される、当該取得するステップが挙げられる。
随意に、ストレージ媒体は、さらに、以下のステップを行うためのプログラムコードを記憶するように配列されている。当該ステップとして、現在のタイムスタンプにおける全ての処理済リアルタイムデータの総量と、全てのノード上に集約されたリアルタイムデータの総量との比率を、完全性の程度として使用するステップが挙げられる。
随意に、ストレージ媒体は、さらに、以下のステップを行うためのプログラムコードを記憶するように構成されている。当該ステップとして、各分散ノード上でリアルタイムデータを取得するステップと、各分散ノード上で取得される同じタイムスタンプを有するリアルタイムデータの部分を集約し、各タイムスタンプに対応するリアルタイムデータの各々の総量を取得するステップとが挙げられる。
本出願の実施形態の連続番号は、単に説明のために使用され、本実施形態の利点及び不利点を表していない。
本出願の前述の実施形態では、様々な実施形態の説明は異なる重点を有し、詳細に説明されない、ある実施形態の一部は、他の実施形態の関連する説明に参照されることができる。
本出願によって提供される実施形態では、開示された技術的内容を他の方式において実装し得ることを理解されたい。上記に説明された装置の実施形態は、例示だけのものである。例えば、ユニットの分割は、論理機能の分割であり得る。実用的な実装では、分割の他の方式は存在し得る。例えば、複数のユニットまたはコンポーネントは、別のシステムに組み合わされ得る、もしくは別のシステムに統合され得る、または、いくつかの機能は、無視される可能性がある、もしくは実行されない可能性がある。加えて、示される、または説明される相互結合もしくは直接結合、または通信接続は、いくつかのインターフェース(複数可)、ユニット(複数可)、またはモジュール(複数可)を経由する間接結合または通信接続であり得、電気的形式または他の形式であり得る。
別個のコンポーネントとして説明されるユニットは、物理的に分離され得る、または物理的に分離されない場合があり、ユニットとして表示されるコンポーネントは、物理ユニットであり得る、または物理ユニットではない場合がある、すなわち、当該コンポーネントは、単一の場所に位置し得る、または複数のユニット間で分散され得る。ユニットの一部または全ては、実施形態(複数可)の解決(複数可)の目的を達成するために実際の必要性に従って選択され得る。
加えて、本出願の各実施形態の様々な機能ユニットは単一の処理ユニットに統合され得る、または、各ユニットは個々のエンティティとして物理的に存在し得る、または、2つ以上のユニットは単一のユニットに統合され得る。上記の統合されたユニットは、ハードウェアの形態で、またはソフトウェア機能ユニットの形態で実装されることができる。
統合されたユニットは、ソフトウェア機能ユニットの形態で実装される場合及び独立型製品として販売または使用される場合、コンピュータ可読記憶媒体内に記憶され得る。係る理解に基づいて、本出願の技術的解決策の本質、または既存技術になされた貢献、または技術的解決策の全てもしくは一部は、ソフトウェア製品の形態で具体化され得る。コンピュータソフトウェア製品は、ストレージ媒体内に記憶され、コンピューティングデバイス(携帯電話、コンピュータ、サーバ、またはネットワークデバイス等であり得る)に、本出願の様々な実施形態に説明される方法のステップの全てまたは一部を行わせるいくつかの命令を含む。記憶媒体は、Uディスク、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、リムーバブルハードディスク、磁気ディスク、または光ディスク等の、プログラムコードを記憶することが可能である様々な種類の媒体を含む。
上記の説明は、本出願だけの好ましい実施形態に対応する。当業者は、また、本出願の原理から逸脱することなく、いくつかの改善及び洗練を行うことができることを留意されたい。これらの改善及び洗練は、本出願の保護の範囲内にあるものであると考慮されたい。

Claims (10)

  1. リアルタイムデータ処理装置によって実行されるリアルタイムデータ処理方法であって、
    分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを前記ノードから集めることと、
    前記集められたリアルタイムデータから同じ既定条件を満足するリアルタイムデータを前記リアルタイムデータ処理装置に集約し、前記同じ既定条件に対応するリアルタイムデータの総量を取得することであって、前記既定条件は前記リアルタイムデータが集められた時間を表すために使用される、前記取得することと、
    前記同じ既定条件を満足する前記リアルタイムデータの完全性の程度を計算することであって、前記完全性の程度は、前記同じ既定条件を満足する処理済リアルタイムデータと、前記集められたリアルタイムデータから集約された前記リアルタイムデータとの比率を示すために使用され、前記処理済リアルタイムデータは、前記リアルタイムデータ処理装置に集められた後に、1つまたは複数の所定の処置を実行されたリアルタイムデータである、前記計算することと、
    を含む、方法。
  2. 前記完全性の程度は、前記同じ既定条件を満足する前記処理済リアルタイムデータの総量と、前記集められたリアルタイムデータから集約された前記リアルタイムデータの総量との比率を示すために使用される、請求項1に記載の方法。
  3. 記方法は、さらに、前記分散システムにおいて前記1つ以上のノードによって受信された前記リアルタイムデータを前記ノードから集めた後にリアルタイムデータの集められた部分の各々のタイムスタンプを取得することを含み、
    前記タイムスタンプは、前記リアルタイムデータの各々の部分が処理されたときの時間を示すために使用される、請求項に記載の方法。
  4. 前記同じ既定条件を満足する前記リアルタイムデータの前記完全性の程度を計算することは、最新のタイムスタンプにおける全ての処理済リアルタイムデータの総量と、前記集められたリアルタイムデータから集約された前記リアルタイムデータの前記総量との比率を、前記完全性の程度として使用することを含む、請求項に記載の方法。
  5. 前記集められたリアルタイムデータから前記同じ既定条件を満足する前記リアルタイムデータを前記リアルタイムデータ処理装置に集約し、前記同じ既定条件に対応する前記リアルタイムデータの総量を取得することは、
    リアルタイムデータを各分散ノード上で取得することと、
    各分散ノード上で取得される同じタイムスタンプを有するリアルタイムデータの部分を集約し、各タイムスタンプに対応するリアルタイムデータの各々の総量を取得することと、
    を含む、請求項1~のいずれか1項に記載の方法。
  6. リアルタイムデータ処理装置であって、
    分散システムにおいて1つ以上のノードによって受信されたリアルタイムデータを前記ノードから集めるように構成されている収集モジュールと、
    前記集められたリアルタイムデータから同じ既定条件を満足するリアルタイムデータを前記リアルタイムデータ処理装置に集約し、前記同じ既定条件に対応するリアルタイムデータの総量を取得するように構成されている集約モジュールであって、前記既定条件は前記リアルタイムデータが集められた時間を表すために使用される、前記集約モジュールと、
    前記同じ既定条件を満足する前記リアルタイムデータの完全性の程度を計算するように構成されている計算モジュールであって、前記完全性の程度は、前記同じ既定条件を満足する処理済リアルタイムデータと、前記集められたリアルタイムデータから集約された前記リアルタイムデータとの比率を示すために使用され、前記処理済リアルタイムデータは、前記リアルタイムデータ処理装置に集められた後に、1つまたは複数の所定の処置を実行されたリアルタイムデータである、前記計算モジュールと、
    を含む、装置。
  7. 前記完全性の程度は、前記同じ既定条件を満足する前記処理済リアルタイムデータの総量と、前記集められたリアルタイムデータから集約された前記リアルタイムデータの総量との比率を示すために使用される、請求項に記載の装置。
  8. 前記リアルタイムデータを前記ノードから集めた後にリアルタイムデータの集められた部分の各々のタイムスタンプを取得するように構成されている獲得モジュールをさらに含み、
    前記タイムスタンプは、前記リアルタイムデータの各々の部分を処理するための時間を示すために使用される、請求項に記載の装置。
  9. 前記計算モジュールは、さらに、最新のタイムスタンプにおける全ての処理済リアルタイムデータの総量と、前記集められたリアルタイムデータから集約された前記リアルタイムデータの前記総量との比率を、前記完全性の程度として使用するように構成されている、請求項に記載の装置。
  10. 前記集約モジュールは、
    リアルタイムデータを各分散ノード上で取得するように構成されている獲得ユニットと、
    各分散ノード上で取得される同じタイムスタンプを有するリアルタイムデータの部分を集約し、各タイムスタンプに対応するリアルタイムデータの各々の総量を取得するように構成されている、集約ユニットと、
    を含む、請求項のいずれか1項に記載の装置。
JP2019535921A 2016-12-30 2017-12-19 リアルタイムデータ処理方法及び装置 Active JP7046073B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201611270978.5 2016-12-30
CN201611270978.5A CN108268357B (zh) 2016-12-30 2016-12-30 实时数据处理方法和装置
PCT/CN2017/117082 WO2018121335A1 (zh) 2016-12-30 2017-12-19 实时数据处理方法和装置

Publications (2)

Publication Number Publication Date
JP2020507147A JP2020507147A (ja) 2020-03-05
JP7046073B2 true JP7046073B2 (ja) 2022-04-01

Family

ID=62706875

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019535921A Active JP7046073B2 (ja) 2016-12-30 2017-12-19 リアルタイムデータ処理方法及び装置

Country Status (5)

Country Link
US (1) US11635985B2 (ja)
JP (1) JP7046073B2 (ja)
CN (1) CN108268357B (ja)
TW (1) TW201824018A (ja)
WO (1) WO2018121335A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109240848A (zh) * 2018-07-27 2019-01-18 阿里巴巴集团控股有限公司 一种数据对象标识生成方法及装置
CN112307260A (zh) * 2020-10-30 2021-02-02 北京字节跳动网络技术有限公司 视频鉴别方法、装置、电子设备及计算机可读存储介质
CN112364063B (zh) * 2021-01-12 2021-06-04 北京智慧星光信息技术有限公司 流计算系统及其数据处理方法、电子设备及介质
CN113468234B (zh) * 2021-05-31 2023-12-22 济南浪潮数据技术有限公司 一种监控数据处理方法、装置、系统及存储介质
CN116980890B (zh) * 2023-09-20 2023-12-22 北京集度科技有限公司 信息安全通信装置、方法、车辆、计算机程序产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004021744A (ja) 2002-06-18 2004-01-22 Hitachi Ltd 業務工程の状況把握システム、業務工程の状況把握システムの記録媒体、及び業務工程の状況把握表示装置
JP2014179000A (ja) 2013-03-15 2014-09-25 Ricoh Co Ltd 情報管理システム及びプログラム

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6035297A (en) 1996-12-06 2000-03-07 International Business Machines Machine Data management system for concurrent engineering
US6215898B1 (en) 1997-04-15 2001-04-10 Interval Research Corporation Data processing system and method
US6542905B1 (en) 1999-03-10 2003-04-01 Ltcq, Inc. Automated data integrity auditing system
US6526044B1 (en) 1999-06-29 2003-02-25 Wandel & Goltermann Technologies, Inc. Real-time analysis through capture buffer with real-time historical data correlation
US20020091991A1 (en) * 2000-05-11 2002-07-11 Castro Juan Carlos Unified real-time microprocessor computer
US7076543B1 (en) * 2002-02-13 2006-07-11 Cisco Technology, Inc. Method and apparatus for collecting, aggregating and monitoring network management information
US8606594B2 (en) 2002-10-29 2013-12-10 Practice Velocity, LLC Method and system for automated medical records processing
CN101170454B (zh) * 2006-10-27 2010-05-12 亿阳信通股份有限公司 一种监控数据采集汇总状态的方法和系统
US20090138415A1 (en) 2007-11-02 2009-05-28 James Justin Lancaster Automated research systems and methods for researching systems
WO2008121824A1 (en) 2007-03-29 2008-10-09 Initiate Systems, Inc. Method and system for data exchange among data sources
CN101729296B (zh) * 2009-12-29 2012-12-19 中兴通讯股份有限公司 一种以太网流量统计分析的方法和系统
US20120284118A1 (en) * 2011-05-04 2012-11-08 Microsoft Corporation Using collective data for targeting of advertisements
US9922096B2 (en) 2011-07-08 2018-03-20 Yahoo Holdings, Inc. Automated presentation of information using infographics
CN103262042B (zh) * 2011-12-19 2016-03-30 华为技术有限公司 一种分布式存储数据恢复方法、装置及系统
CN102882745B (zh) * 2012-09-29 2015-12-09 摩卡软件(天津)有限公司 一种用于监控业务服务器的方法和装置
CN103825930B (zh) * 2013-11-12 2017-03-29 浙江省水文局 一种分布式环境下的实时数据同步方法
CN107084710B (zh) 2014-05-05 2020-06-12 赫克斯冈技术中心 相机模块和测量子系统
US9846632B2 (en) * 2014-10-08 2017-12-19 Signalfx, Inc. Real-time reporting based on instrumentation of software
CN104331270B (zh) * 2014-10-24 2017-07-21 华为技术有限公司 一种流数据处理的方法、装置及系统
CN104468569B (zh) * 2014-12-04 2017-12-22 北京国双科技有限公司 分布式数据的完整性检测方法和装置
CN105812202B (zh) * 2014-12-31 2019-02-22 阿里巴巴集团控股有限公司 日志实时监控预警方法及其装置
CN104899948B (zh) * 2015-06-05 2017-05-31 北京京东尚科信息技术有限公司 一种封闭空间拥堵监测方法和系统
US11442804B2 (en) * 2019-12-27 2022-09-13 Paypal, Inc. Anomaly detection in data object text using natural language processing (NLP)

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004021744A (ja) 2002-06-18 2004-01-22 Hitachi Ltd 業務工程の状況把握システム、業務工程の状況把握システムの記録媒体、及び業務工程の状況把握表示装置
JP2014179000A (ja) 2013-03-15 2014-09-25 Ricoh Co Ltd 情報管理システム及びプログラム

Also Published As

Publication number Publication date
CN108268357A (zh) 2018-07-10
TW201824018A (zh) 2018-07-01
WO2018121335A1 (zh) 2018-07-05
JP2020507147A (ja) 2020-03-05
US20190324794A1 (en) 2019-10-24
CN108268357B (zh) 2021-10-26
US11635985B2 (en) 2023-04-25

Similar Documents

Publication Publication Date Title
JP7046073B2 (ja) リアルタイムデータ処理方法及び装置
CN104993946B (zh) 灰度发布的评估方法、装置和系统
CN110812835B (zh) 云游戏的检测方法和装置、存储介质及电子装置
US10459780B2 (en) Automatic application repair by network device agent
CN109039819B (zh) 时延统计方法、装置、系统及存储介质
CN104731690B (zh) 适应性度量收集、存储、和警告阈值
CN108696399B (zh) 业务服务的测试方法和装置
CN105072139B (zh) 推荐方法和装置
US9479414B1 (en) System and method for analyzing computing performance
US20190050317A1 (en) Systems and methods for determining event processing delays
CA3061682C (en) Method and system to identify irregularities in the distribution of electronic files within provider networks
CN111898765A (zh) 特征分箱方法、装置、设备及可读存储介质
CN107809363A (zh) 一种网络信息传播控制方法和装置
CN113391741B (zh) 操作校验方法和装置、存储介质及电子设备
US20160226733A1 (en) Method and score management node for supporting service evaluation
CN109828883B (zh) 任务数据处理方法和装置、存储介质及电子装置
CN104937613A (zh) 量化数据质量的探试
CN110276650A (zh) 广告到达率确定方法、广告发布方法及装置
CN106682054B (zh) 一种终端应用推荐方法、装置和系统
US20180121329A1 (en) Uninstrumented code discovery
CN115185794A (zh) 服务调用链的分析方法、装置及电子设备
CN110888811B (zh) 代码覆盖率信息处理方法、装置、电子设备及介质
CN116974795A (zh) 一种业务路径生成、业务数据校验方法、装置及电子设备
CN113792058A (zh) 指标数据处理方法、装置、电子设备及存储介质
CN110647543A (zh) 数据聚合方法、装置以及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220322

R150 Certificate of patent or registration of utility model

Ref document number: 7046073

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150