JP2022074864A

JP2022074864A - 情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラム

Info

Publication number: JP2022074864A
Application number: JP2020185269A
Authority: JP
Inventors: 健一長末; Kenichi Nagasue; 健人一角; Kento Ikkaku
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-11-05
Filing date: 2020-11-05
Publication date: 2022-05-18
Also published as: US20220138009A1; EP3995956A1

Abstract

【課題】データ処理を引き継ぐ処理ノードに転送されるデータの過不足を低減する。
【解決手段】それぞれ、バッファと、該バッファに保持されたデータを処理する処理部とを含む複数の処理ノードを管理する情報処理装置は、データ処理中の処理ノードのリソース負荷が所定量に到達する到達予測時刻における前記バッファ内の処理済みデータと未処理データとの境界を予測する予測部と、前記予測部の予測に基づいて、未処理データを処理順が遅い側から前記境界に向けて、データ処理を引き継ぐ他の処理ノードに転送する転送制御部とを有する。
【選択図】図２

Description

本発明は、情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラムに関する。

データ処理システム上に複数のアプリケーションの実行環境を構築する手法として、仮想マシン技術またはコンテナ技術が知られている。また、仮想マシンを停止させることなく他の物理マシンに移動するライブマイグレーション技術が知られている。

例えば、仮想マシンの障害に伴うライブマイグレーション中に、送信コンテナから送信する試験パケット数と受信コンテナで受信する試験パケット数との差を求め、仮想マシンのサービスの中断時間を評価する手法が提案されている（例えば、特許文献１参照）。また、データを転送元から転送先に転送する場合に、転送元と転送先の先頭アドレスの大小関係に応じて、開始アドレスまたは終了アドレスから転送を開始することで、データの上書きを抑止する手法が提案されている（例えば、特許文献２参照）。

特開２０１７－１６７８２２号公報特開２００７－１６４５５２号公報

例えば、端末の近くに処理ノードを分散して配置するエッジコンピューティング手法において、各処理ノードのリソースは、クラウド等に比べて小規模であるため、データ処理の実行中にリソース不足に陥る場合がある。リソース不足が予測される場合、データ処理の実行中に、リソースに空きがある他の処理ノードに処理対象のデータを転送し、処理ノードを切り替えることで、リソース不足により処理性能が低下することが抑制される。

しかしながら、リソースの変動傾向の予測が外れると、処理ノードの切り替え時刻までに転送されるデータの一部が移行元の処理ノードで処理済みとなる無駄が発生する。あるいは、切り替え時刻までに移行先の処理ノードで処理するデータの転送が完了しないデータ不足が発生する。

１つの側面では、本発明は、データ処理を引き継ぐ処理ノードに転送されるデータの過不足を低減することを目的とする。

一つの観点によれば、情報処理装置は、それぞれ、バッファと、該バッファに保持されたデータを処理する処理部とを含む複数の処理ノードを管理する情報処理装置において、データ処理中の処理ノードのリソース負荷が所定量に到達する到達予測時刻における前記バッファ内の処理済みデータと未処理データとの境界を予測する予測部と、前記予測部の予測に基づいて、未処理データを処理順が遅い側から前記境界に向けて、データ処理を引き継ぐ他の処理ノードに転送する転送制御部とを有する。

１つの側面では、本発明は、データ処理を引き継ぐ処理ノードに転送されるデータの過不足を低減することができる。

一実施形態におけるデータ処理システムの一例を示すブロック図である。図１のデータ処理システムの動作の一例を示す説明図である。別の実施形態におけるデータ処理システムの一例を示すブロック図である。図３のデータ処理システムの動作の一例を示す説明図である。図３のデータ処理システムの動作の別の例を示す説明図である。図３のデータ処理システムの動作のさらなる別の例を示す説明図である。図３の代表ノードの動作の一例を示すフロー図である。図７のステップＳ１００の処理の一例を示すフロー図である。図８のステップＳ２００の処理の一例を示すフロー図である。図３の代表ノードとエッジノードとの間でのデータ転送に使用されるＡＰＩの一例を示す説明図である。

以下、図面を用いて実施形態が説明される。

図１は一実施形態におけるデータ処理システムの一例を示す。図１に示すデータ処理システム１０は、データＤＴを処理する複数の処理ノード２０（２０ａ、２０ｂ）と、ネットワークＮＷを介して処理ノード２０に接続される管理ノード３０とを有する。例えば、データ処理システム１０は、エッジコンピューティングを実現するために構築される。各処理ノード２０は、エッジノードとして機能し、管理ノード３０は、情報処理装置の一例であり、どの処理ノード２０でデータ処理を実行させるかを管理する代表ノードとして機能する。

各処理ノード２０（２０ａ、２０ｂ）は、バッファ２２（２２ａ、２２ｂ）および処理部２４（２４ａ、２４ｂ）を有する。バッファ２２ａは、データ処理システム１０の外部から入力されるデータＤＴを保持する。各処理部２４は、処理ノード２０内のバッファ２２に保持されたデータＤＴの処理を、例えば、バッファ２２に格納されたデータＤＴから順に実行する。

管理ノード３０は、予測部３２および転送制御部３４を有する。予測部３２および転送制御部３４は、管理ノード３０に搭載されるＣＰＵ等のプロセッサが制御プログラムを実行することで実現される。予測部３２は、データ処理を実行中の処理ノード２０のリソース負荷が所定量に到達する時刻を予測する。以下では、処理ノード２０のリソース負荷が所定量に到達すると予測される時刻は、到達予測時刻と称する。

また、予測部３２は、データ処理を実行中の処理ノード２０のバッファ２２において、データ処理が終わった処理済みデータと、データ処理が終わっていない未処理データとの到達予測時刻での境界を予測する。ここで、バッファ２２には、データが処理する順に格納される。"境界"は、到達予測時刻でのバッファ２２内における処理済みデータのうち、最も遅く処理されるデータの格納位置である。換言すれば、"境界"は、到達予測時刻でのバッファ２２内における未処理データのうち、最も早く処理されるデータの格納位置である。

転送制御部３４は、予測部３２の予測に基づいて、到達予測時刻にバッファ２２に保持されている未処理データを、データ処理の処理順が遅い側から境界まで、データ処理を引き継ぐ他の処理ノード２０に転送する。以下では、データ処理を引き継ぐ他の処理ノード２０は、引き継ぎノード２０とも称する。例えば、転送制御部３４は、データ処理を実行中の処理ノード２０のバッファ２２に保持されている未処理データの転送開始位置を、予測部３２による予測時から到達予測時刻までに引継ぎノード２０に転送可能なデータ量に基づいて決定する。

なお、データ処理を引き継ぐ引き継ぎノード２０のリソース負荷は、データ処理を実行中の処理ノード２０のリソース負荷より小さいことが好ましい。このため、管理ノード３０は、データ処理中の処理ノード２０のリソース負荷より小さいリソース負荷の処理ノード２０を、引き継ぎノード２０として選択する。これにより、引き継ぎノード２０によるデータ処理効率を、引き継ぎ前にデータ処理を実行する処理ノード２０によるデータ処理効率より高くすることができ、データ処理を破綻させることなく継続することができる。リソース負荷は、例えば、処理部２４に搭載される図示しないＣＰＵ（Central Processing Unit）等のプロセッサの使用率、メモリの使用率、およびネットワークＮＷの使用帯域に応じて決められる。

図２は、図１のデータ処理システム１０の動作の一例を示す。例えば、図２に示す動作は、管理ノード３０に搭載されるＣＰＵ等のプロセッサが実行する制御プログラムにより実現される。すなわち、図２は、データ処理システム１０の制御方法の一例およびデータ処理システム１０の制御プログラムの一例を示す。図２では、処理ノード２０ａが、データ処理を実行中のデータの転送元の処理ノードであるとし、処理ノード２０ｂが、処理ノード２０ａからデータ処理を引き継ぐデータの転送先の処理ノード（引継ぎノード）であるとする。

管理ノード３０は、時刻Ｔ０において、処理ノード２０ａのデータ処理に使用するリソース量が初期の割り当て量を超えるため、リソース量（プロセッサの使用率およびメモリの使用率の少なくともいずれか）の割り当てを増加する。リソース量の割り当てを増加するか否かは、予測部３２により予測されてもよい。

次に、予測部３２は、時刻Ｔ１において、処理ノード２０ａのリソース使用量が増加傾向にあり、時刻Ｔ２で、予め設定された閾値に到達することを予測する。この場合、予測部３２は、バッファ２２ａ内のデータのうち、時刻Ｔ２において処理ノード２０ａにより処理済みになるデータと未処理のデータとの境界を予測する。

転送制御部３４は、予測部３２による予測に基づいて、予測部３２が閾値の到達を予測した時刻Ｔ１から到達予測時刻Ｔ２までの間に、処理ノード２０ａから処理ノード２０ｂに転送可能なデータ量を、ネットワークＮＷの帯域等に基づいて算出する。転送制御部３４は、予測部３２が予測した境界から算出した転送可能なデータ量だけ離れた位置をデータの転送開始位置に決定する。

図２において"処理するデータ"に示す矩形は、バッファ２２ａが保持するデータ量を示し、バッファ２２ａに格納されるデータは、図２の下から順に積み上げられ、下から順に処理されるとする。すなわち、矩形で示されるバッファ２２ａ内のデータは、下側ほど処理順が早く、上側ほど処理順が遅いことを示す。

そして、転送制御部３４は、下向きの太い矢印で示すように、転送開始位置から境界に向け（すなわち、処理順が遅い側から）、ネットワークＮＷを介して処理ノード２０ｂにデータを順次転送する。図２の例では、予測部３２の予測が的中し、処理ノード２０ａでの処理済みデータは、時刻Ｔ２において境界まで達する。管理ノード３０は、時刻Ｔ２において、処理ノード２０ａにデータの処理を停止させ、データ処理を実行するノードを処理ノード２０ａから処理ノード２０ｂに切り替える。

データ転送を処理順が遅い側から実行することで、例えば、処理ノード２０ａによるデータの処理効率が上がった場合に、処理ノード２０ａで処理済みとなるデータが処理ノード２０ｂに転送されることを抑止することができる。例えば、到達予測時刻Ｔ２より前に境界までの処理が完了した場合、処理ノード２０ａは、境界より処理順が遅い（図２の境界より上側）データの処理を、到達予測時刻Ｔ２に到達するまで実行する。この場合、処理ノード２０ｂへのデータの転送を途中で停止することで、処理済みのデータの無駄な転送を抑止することができ、ネットワークＮＷの帯域を節約することができる。到達予測時刻Ｔ２より前に境界までの処理が完了する例については、図６で説明する。

また、時刻Ｔ１から時刻Ｔ２までに転送可能なデータ量に基づいて、転送開始位置を決定することで、処理順が遅いデータから順に転送する場合にも、処理ノード２０ｂは、処理ノード２０ａの処理に引き続いて未処理データの処理を実行することができる。これにより、時刻Ｔ２において、処理ノード２０ｂは、未処理データの転送完了を待つことなく、処理を開始することができ、データ処理システム１０の処理性能の低下を抑止することができる。

時刻Ｔ２において、処理ノード２０ｂのバッファ２２ｂには、転送開始位置から境界までのデータが転送済みである。このため、処理ノード２０ｂは、時刻Ｔ２において処理ノード２０ａによるデータ処理を引き継いだ直後からデータ処理を継続して実行することができる。例えば、処理ノード２０ｂのリソース使用量の上限である閾値は、処理ノード２０ａの閾値より大きいため、処理ノード２０ｂは、余裕を持ってデータ処理を実行することができる。従って、データ処理を破綻させることなく継続して実行することができる。

転送制御部３４は、時刻Ｔ２において、上向きの太い矢印で示すように、転送開始位置のデータより処理順が遅いデータ（格納順が新しいデータ）を、処理順が早い順（格納順が古い順）に処理ノード２０ｂのバッファ２２ｂに転送する処理を開始する。時刻Ｔ２以降にバッファ２２ａからバッファ２２ｂに転送されるデータは、時刻Ｔ１において、転送開始位置より処理順が遅いデータと、時刻Ｔ１から時刻Ｔ２までの間に、バッファ２２ａに新たに格納されたデータとを含む。

時刻Ｔ２以降、処理順が早い側からデータを転送することで、処理部２４ｂが処理するデータの転送が遅れて転送の待ち時間が発生する可能性を低くすることができ、データ処理が遅れる可能性を低くすることができる。

以上、図１および図２に示す実施形態では、転送制御部３４は、データ処理を引き継ぐ処理ノード２０ｂへのデータ転送を処理順が遅い側から実行する。これにより、処理ノード２０ａの処理効率が上がった場合に処理ノード２０ａで処理済みとなるデータが処理ノード２０ｂに転送されることを抑止することができる。この結果、処理ノード２０ｂへのデータの無駄な転送を抑止することができ、ネットワークＮＷの帯域を節約することができる。

転送制御部３４は、時刻Ｔ１から時刻Ｔ２までに転送可能なデータ量に基づいて、転送開始位置を決定する。このため、処理順が遅いデータから順に転送する場合にも、処理ノード２０ｂは、時刻Ｔ２において処理ノード２０ａで処理されていない未処理データを、処理ノード２０ａの処理に引き続いて処理を実行することができる。換言すれば、処理順が遅いデータから順に転送する場合にも、時刻Ｔ２において、処理ノード２０ｂは、未処理データの転送完了を待つことなく、処理を開始することができ、データ処理システム１０の処理性能の低下を抑止することができる。

時刻Ｔ２以降、処理順が早い側からデータを転送することで、処理部２４ｂが処理するデータの転送が遅れて転送の待ち時間が発生する可能性を低くすることができ、データ処理が遅れる可能性を低くすることができる。データ処理を実行中の処理ノード２０ａのリソース負荷よりリソース負荷が小さい処理ノード２０ｂにデータ処理を引き継がせることで、データ処理を破綻させることなく継続することができる。

このように、この実施形態では、無駄なデータ転送を抑止することでネットワークＮＷの帯域を増やすことなく、かつ、実行中の処理を止めることなく、処理の移行元の処理ノード２０から処理の移行先の処理ノード２０にデータを転送することができる。

図３は、別の実施形態におけるデータ処理システムの一例を示す。図１および図２に示す要素と同様な要素については、詳細な説明は省略する。図３に示すデータ処理システム１００は、データＤＴ（ＤＴａ、ＤＴｂ、ＤＴｃ）を処理する複数のエッジノード２００（２００ａ、２００ｂ、２００ｃ、２００ｄ）と、ネットワークＮＷを介してエッジノード２００に接続される代表ノード３００を有する。

例えば、代表ノード３００は、クラウドサーバであり、複数のエッジノード２００を制御してエッジコンピューティングを実現する。エッジノード２００は、データを処理する処理ノードの一例であり、代表ノード３００は、エッジノード２００を管理するノードであり、別の実施形態における情報処理装置の一例である。なお、特に限定されないが、エッジノード２００間でのデータの移動は、オーケストレータの一種であるＫｕｂｅｒｎｅｔｅｓを利用して実行されてもよい。この場合、エッジノード２００は、例えば、代表ノード３００に管理される物理サーバが実行するＯＳ（Operating System）上で動作するコンテナでもよい。

各エッジノード２００は、データ受信部２１０、データ保持部２２０、データ処理部２３０およびリソース監視部２４０を有する。データ保持部２２０は、バッファの一例であり、データ処理部２３０は、処理ノードの一例である。データ受信部２１０は、データ生成部４００（４００ａ、４００ｂまたは４００ｃ）から出力されるデータＤＴ（ＤＴａ、ＤＴｂまたはＤＴｃ）を受信し、受信したデータＤＴをデータ保持部２２０に格納する。例えば、データ生成部４００は、カメラ、センサまたはマイクロフォン等のリアルタイムでデータＤＴを逐次生成する装置に含まれる。データ生成部４００がビデオカメラの場合、データ量が相対的に大きい動画データと、データ量が相対的に小さい静止画データとが、切り替えながら出力されてもよい。また、データ生成部４００は、物品等の製造過程を監視するために、製造工場のラインに複数台が設けられてもよい。

データ保持部２２０は、例えば、ＨＤＤ（Hard Disk Drive）またはＳＳＤ（Solid State Drive）等のストレージであり、データ受信部２１０が受信したデータＤＴが格納される。なお、データ生成部４００は、生成したデータＤＴを圧縮して各エッジノード２００に送信してもよい。

データ処理部２３０は、データ保持部２２０に保持されたデータＤＴを古い順（データ生成部４００によるデータＤＴの生成順）に処理し、処理結果（処理後のデータ）を図示しないデータ管理装置に出力する。処理後のデータは、代表ノード３００に転送されてもよい。また、処理後のデータは、データ保持部２２０に一時的に保持されてもよく、各エッジノード２００が有する図示しないバッファメモリに一時的に保持されてもよい。

さらに、データ処理部２３０は、データＤＴを圧縮する処理を実行し、圧縮したデータＤＴを図示しないデータ管理装置に出力してもよい。図３では、エッジノード２００は、２つのデータ保持部２２０を有するが、データ処理部２３０の数および性能は、データ生成部４００から出力されるデータ量およびデータ処理の負荷量に応じて決定される。

リソース監視部２４０は、エッジノード２００内のリソース使用量（リソース負荷）等のリソース状態を監視する。例えば、リソース監視部２４０は、データ処理部２３０のリソース使用量を監視し、代表ノード３００からの問い合わせに応じてリソース使用量を代表ノードに通知する。

例えば、エッジノード２００ｄの処理性能は、エッジノード２００ａ、２００ｂ、２００ｃの処理性能に比べて高い。そして、エッジノード２００ｄは、リソース使用量が閾値を超えると予測されたエッジノード２００ａ、２００ｂまたは２００ｃが実行する処理を代行する代行ノードとして機能されてもよい。なお、エッジノード２００ｄは、代行ノードの機能に加えて、図示しない他のデータ生成部が生成するデータを処理する機能を有してもよい。

なお、各エッジノード２００は、リソース使用量に余裕がある場合、リソース使用量が閾値を超えた他のエッジノード２００の処理を代行する代行ノードとして機能されてもよい。例えば、ビデオ映像をデータＤＴとして出力するデータ生成部４００に接続されたエッジノード２００は、映像に含まれる処理対象（人や自動車）の数が増加した場合に、データ処理の負荷が増加する。そして、処理対象の数が増加に伴ってリソース使用量が閾値を超えることが予想される場合、リソース使用量に余裕がある他のエッジノード２００（例えば、２００ｄ）に処理が切り替えられる。なお、リソース使用量が閾値を超えるか否かの予測は、以下で説明する代表ノード３００により実行される。

代表ノード３００は、処理位置制御部３１０、処理位置管理部３２０、データ管理部３３０、データ制御部３４０およびノード監視部３５０を有する。処理位置制御部３１０、処理位置管理部３２０、データ管理部３３０、データ制御部３４０およびノード監視部３５０は、代表ノード３００に搭載されるＣＰＵ等のプロセッサが制御プログラムを実行することで実現される。

処理位置制御部３１０は、データ生成部４００が生成したデータＤＴの処理を、どのエッジノード２００に実行させるかを制御する。このために、処理位置制御部３１０は、各エッジノード２００のリソース使用量（リソース負荷）の変化を予測し、リソース使用量が閾値を超えると予測した場合、データを処理するエッジノード２００の切り替え制御を実行する。処理位置制御部３１０は、エッジノード２００の制御の状態を処理位置管理部３２０に通知する。処理位置制御部３１０の動作については、図８で説明する。

処理位置管理部３２０は、処理位置制御部３１０によるエッジノード２００の切り替え制御に基づいて、データ生成部４００が生成したデータＤＴの処理を、どのエッジノード２００が処理しているかを管理する。

データ管理部３３０は、各エッジノード２００が保持するデータＤＴのサイズ、データＤＴの生成時刻、データＤＴの種類、データＤＴを生成したデータ生成部４００の識別情報等を、エッジノード２００毎に管理する。データ管理部３３０は、管理している情報をデータ制御部３４０に通知する。

データ制御部３４０は、処理位置制御部３１０がエッジノード２００の切り替えを決定した場合、処理を実行中のエッジノード２００から処理を引き継ぐエッジノード２００へのデータの移動を制御する。データ制御部３４０は、移動したデータの情報をデータ管理部３３０に通知する。例えば、データ制御部３４０は、処理を引き継ぐエッジノード２００に無駄なデータが転送されることを抑止する制御を実行する。また、データ制御部３４０は、処理を引き継ぐエッジノード２００が、処理の引継ぎ後、直ちにデータ処理を開始できるように、データの転送順の制御を実行する。データ制御部３４０の動作については、図９で説明する。

ノード監視部３５０は、各エッジノード２００のリソース監視部２４０が取得したデータ処理部２３０の負荷量等に基づいて、各エッジノード２００のリソース使用量を監視し、監視したリソース使用量を処理位置制御部３１０に通知する。

図４は、図３のデータ処理システム１００の動作の一例を示す。図２と同様の動作については、詳細な説明は省略する。図４の始まりにおいて、データ生成部４００が生成したデータの処理は、エッジノード２００ａにより実行されているとする。

図４において、網掛けの矩形で示すデータは、未処理であることを示す。細い斜線の矩形で示すデータは、データの転送元であるエッジノード２００ａで処理済みであることを示す。白抜きの矩形で示すデータは、データの転送先であるエッジノード２００ｄに転送済みであることを示す。太い斜線の矩形で示すデータは、エッジノード２００ｄで処理済みであることを示す。なお、各種パターンで示す矩形は、図４の右上の"転送先のエッジノードに入力"で示すデータを除いて、エッジノード２００ａのデータ保持部２２０に保持されるデータを示し、下側ほど格納順が古い（処理順が早い）。

時刻Ｔ１０において、代表ノード３００の処理位置制御部３１０は、ノード監視部３５０からの情報に基づいて、データを処理中のエッジノード２００ａの負荷が増加すること、およびリソース使用量が時刻Ｔ２０で不足することを予測する（図４（ａ））。時刻Ｔ１０での予測は、最初の予測の一例であり、前回の予測の一例である。なお、データを処理するためのリソースの割り当ては上限まで行われているとする。また、処理位置制御部３１０は、時刻Ｔ２０での処理済みデータと未処理データとの境界を予測する。時刻Ｔ２０は、エッジノード２００ａの使用リソース量が閾値に到達すると予測される到達予測時刻である。

そして、処理位置制御部３１０は、エッジノード２００ａの代わりにデータ処理を実行可能な他のエッジノード２００を検索する。例えば、処理位置制御部３１０は、エッジノード２００ａからデータ処理を引き継いで実行可能なリソース量がエッジノード２００ｄに割り当てられていると判断し、エッジノード２００ｄでの処理の引き継ぎを決定し、データ制御部３４０に通知する。

データ制御部３４０は、時刻Ｔ１０において、時刻Ｔ１０から時刻Ｔ２０までにエッジノード２００ａからエッジノード２００ｂに転送可能なデータ量を、ネットワークＮＷの帯域等に基づいて算出する。そして、データ制御部３４０は、算出した転送可能なデータ量と、時刻Ｔ２０での処理済みデータと未処理データとの境界とに基づいて、エッジノード２００ａからエッジノード２００ｂに転送するデータの転送開始位置を決定する（図４（ｂ））。

ここで、転送開始位置は、転送可能なデータのうち処理順が最も遅いデータの位置に設定される。そして、データ制御部３４０は、時刻Ｔ１０において、エッジノード２００ａからエッジノード２００ｂへのデータの転送を転送開始位置から開始する。時刻Ｔ１０に示す太い矢印は、時刻Ｔ２０までにエッジノード２００ｂに転送されるデータの転送順（転送方向）と、転送可能なデータ量とを示す（図４（ｃ））。処理位置制御部３１０による境界の予測に基づいて、エッジノード２００ａからエッジノード２００ｂにデータを転送するデータ制御部３４０は、転送制御部の一例である。

時間の経過とともに、エッジノード２００ａ（転送元）の処理済みデータが増加し、エッジノード２００ｂへの転送済みデータが増加する（図４（ｄ））。また、データ生成部４００が生成したデータは、時刻Ｔ２０までエッジノード２００ａのデータ保持部２２０に格納されるため、未処理データが順次増加する（図４（ｅ））。

次に、時刻Ｔ１２において、データ制御部３４０は、時刻Ｔ２０での処理済みデータと未処理データとの境界を再予測する。時刻Ｔ２０での処理済みデータと未処理データとの境界の再予測は、時刻Ｔ２０が到来するまで所定の頻度（例えば、１秒間）で繰り返し実行される。これにより、時刻Ｔ２０での境界の予測値を、エッジノード２００ａでのデータの処理速度の変化に追従して調整することができ、無駄なデータ転送および時刻Ｔ２０での未転送のデータの発生等のデータの過不足を低減することができる。

なお、この実施形態では、境界の再予測は、データ制御部３４０が実行するが、処理位置制御部３１０によって実行され、予測結果がデータ制御部３４０に通知されてもよい。境界を予測する処理位置制御部３１０および境界を再予測するデータ制御部３４０は、予測部の一例である。

図４に示す例では、データ制御部３４０が再予測した境界は、時刻Ｔ１０において処理位置制御部３１０が予測した境界と一致する（図４（ｆ））。このため、データ制御部３４０は、エッジノード２００ａからエッジノード２００ａへのデータの転送を継続する。

時刻Ｔ２０が到来し、エッジノード２００ａによるデータ処理が、予測した境界まで完了し、エッジノード２００ｂへのデータの転送が、予測した境界まで完了する。すなわち、転送開始位置から境界までのデータの転送が完了する（図４（ｇ））。そして、時刻Ｔ２０において、処理位置制御部３１０は、エッジノード２００ｂに、エッジノード２００ａから転送されたデータの処理を開始させる。すなわち、データを処理するエッジノード２００の切り替えが行われる（図４（ｈ））。これにより、時刻Ｔ２０以降、太い斜線の矩形で示すように、エッジノード２００ｂでのデータ処理が進行する（図４（ｉ））。

データ制御部３４０は、時刻Ｔ２０において、エッジノード２００ａのデータ保持部２２０に保持されている残りのデータのエッジノード２００ｂへの転送を開始する。この際、データ制御部３４０は、太い矢印で示すように、処理順が早いデータから順に転送する（図４（ｊ））。これにより、例えば、エッジノード２００ｂでのデータの処理速度が、データの転送速度より速い場合にも、処理するデータのエッジノード２００ｂへの転送が間に合わず、エッジノード２００ｂでの処理が停止する不具合を抑止することができる。

時刻Ｔ２０において、エッジノード２００ａに接続されていたデータ生成部４００は、エッジノード２００ｂに接続される。このため、時刻Ｔ２０以降、データ生成部４００が生成したデータＤＴは、エッジノード２００ｂに入力され、エッジノード２００ｂのデータ保持部２２０に格納される。

なお、リソース使用量に基づいて処理済みデータと未処理データとの境界を予測するタイミング（時刻Ｔ１０）は、データを処理しているエッジノード２００毎に所定の周期で現れる。例えば、所定の周期は、時刻Ｔ１０から時刻Ｔ２０までの時間間隔に等しくてもよい。このため、処理位置制御部３１０は、データが転送されたエッジノード２００ｂでの処理が時刻Ｔ２０に開始されてから上記所定の周期が経過後、エッジノード２００ｂでの処理済みデータと未処理データとの境界を予測する。そして、代表ノード３００は、図４で説明した動作と同様の動作をエッジノード２００ｂに対して実行する。

図５は、図３のデータ処理システム１００の動作の別の例を示す。図４と同様の動作については、詳細な説明は省略する。処理位置制御部３１０が時刻Ｔ１０で予測する時刻Ｔ２０、時刻Ｔ２０での処理済みデータと未処理データとの境界、時刻Ｔ１０での転送開始位置、および時刻Ｔ１０でのデータの転送方向は、図４と同じである。図５では、処理位置制御部３１０が時刻Ｔ１０に予測したよりも、エッジノード２００ａでの処理の進行が遅く、時刻Ｔ２０での未処理データが増加する（図５（ａ））。換言すれば、処理済みデータが時刻Ｔ１０での当初の予測より減少する。

時刻Ｔ１２において、データ制御部３４０は、時刻Ｔ２０での処理済みデータと未処理データとの境界を再予測する。図５に示す例では、エッジノード２００ａでの処理の進行が遅いため、データ制御部３４０が予測した境界は、時刻Ｔ１０において処理位置制御部３１０が予測した境界よりも図５の下側になる（図５（ｂ））。

時刻Ｔ１０で予測された境界と時刻Ｔ１２で再予測された境界との間に位置するデータは、時刻Ｔ１０の予測では、エッジノード２００ａが時刻Ｔ２０までに処理するデータである。しかしながら、エッジノード２００ａでの処理の進行が遅いため、時刻Ｔ１２での再予測では、２つの境界間のデータは、エッジノード２００ｂにより時刻Ｔ２０以降で処理されるデータとなる。

エッジノード２００ａで処理されないデータの無駄な転送を抑止するため、データ制御部３４０は、転送開始位置から開始したデータの転送を中断する（図５（ｃ））。中断により転送されないデータは、時刻Ｔ１０に太い破線で示す。そして、時刻Ｔ１２において、データ制御部３４０は、太い下向きの矢印で示すように、時刻Ｔ２０までに転送可能なデータを処理順が遅い側から再予測した境界までのエッジノード２００ａへのデータの転送を開始する（図５（ｄ））。

境界の再予測によりエッジノード２００ａでの処理速度が低下したと判定された場合、実行中のデータ転送を中断し、再予測された境界に向けて処理順が遅いデータからデータを転送する。これにより、時刻Ｔ２０において、処理を引き継いだエッジノード２００ｂが処理するデータが転送されておらず、処理の開始が遅れることを抑止することができる。すなわち、データ処理システム１００の処理性能が低下することを抑止することができる。

また、再予測された境界に向けて処理順が遅いデータからデータを転送することで、時刻Ｔ２０までにエッジノード２００ａで処理されるデータが、エッジノード２００ｂに転送される無駄を抑止することができる。例えば、時刻Ｔ２０以前での次の再予測（不図示）での境界が、エッジノード２００ａでの処理速度が向上することで、時刻Ｔ１２で再予測した境界よりも上側になる場合、時刻Ｔ１２から開始したエッジノード２００ｂへのデータの転送を中断することができる。これにより、時刻Ｔ２０までにエッジノード２００ａで処理されるデータが、エッジノード２００ｂに転送される無駄を抑止することができる。

これに対して、時刻Ｔ１２で予測した境界から時刻Ｔ１０で再予測した境界まで、処理順が早い側からデータを転送する場合、無駄なデータが転送される場合がある。例えば、時刻Ｔ２０以前での次の再予測（不図示）での境界が、時刻Ｔ１２で再予測した境界よりも図５の上側になる場合、時刻Ｔ１２までにエッジノード２００ａでの処理が完了するデータがエッジノード２００ｂに転送されてしまう。

図５の動作に戻り、データ制御部３４０は、時刻Ｔ２０において、太い矢印で示すように、時刻Ｔ１２で転送を中断したデータを含むデータのエッジノード２００ａからエッジノード２００ｂへの転送を再開する（図５（ｅ））。これにより、転送を中断したデータがエッジノード２００ｂに転送されない不具合を抑止することできる。

この際、データ制御部３４０は、処理順が早い側からデータを転送する。すなわち、データの転送方向は、時刻Ｔ１０において転送開始位置から転送を開始したデータの転送方向と逆向きになる。エッジノード２００の切り替え後、処理順が早い側からデータを転送することで、処理するデータが転送されておらず、処理が開始できない不具合が発生する可能性を低くすることができる。例えば、エッジノード２００ｂでのデータの処理速度がデータの転送速度より速く、処理するデータのエッジノード２００ｂへの転送が間に合わない場合、エッジノード２００ｂでの処理が待たされるため、処理効率が低下するおそれがある。この結果、リアルタイムでの処理が必要な場合にも、リアルタイム性が維持されないおそれがある。

処理位置制御部３１０は、時刻Ｔ２０において図４と同様に、エッジノード２００ｂに、エッジノード２００ａから転送されたデータの処理を開始させる。すなわち、データを処理するエッジノード２００の切り替えが行われる（図５（ｆ））。エッジノード２００ａに接続されていたデータ生成部４００は、エッジノード２００ｂに接続される。このため、時刻Ｔ２０以降、データ生成部４００が生成したデータＤＴは、エッジノード２００ｂに入力され、エッジノード２００ｂのデータ保持部２２０に格納される。

時刻Ｔ３０において、転送開始位置から時刻Ｔ１０で予測した境界までのデータのエッジノード２００ｂへの転送が完了する（図５（ｇ））。この後、データ制御部３４０は、時刻Ｔ３に太い上向きの矢印で示すように、エッジノード２００ａのデータ保持部２２０が保持している、転送開始位置に対して処理順が遅いデータのエッジノード２００ｂへの転送を開始する（図５（ｈ））。データの転送は、処理順が早いデータから転送される。このため、エッジノード２００ｂに転送されていないデータ領域まで処理が進行し、処理が停止する不具合が発生する可能性を、処理順が遅い側からデータを転送する場合比べて低くすることができる。

図６は、図３のデータ処理システム１００の動作のさらなる別の例を示す。図４および図５と同様の動作については、詳細な説明は省略する。処理位置制御部３１０が時刻Ｔ１０で予測する時刻Ｔ２０、時刻Ｔ２０での処理済みデータと未処理データとの境界、時刻Ｔ１０での転送開始位置、および時刻Ｔ１０でのデータの転送方向は、図４と同じである。図６では、処理位置制御部３１０が時刻Ｔ１０に予測したよりも、エッジノード２００ａでの処理の進行が早く、時刻Ｔ２０での処理済みデータが多くなる（図６（ａ））。

時刻Ｔ１２において、データ制御部３４０は、時刻Ｔ２０での処理済みデータと未処理データとの境界を再予測する。図６に示す例では、エッジノード２００ａでの処理の進行が早いため、データ制御部３４０が予測した境界は、時刻Ｔ１０において処理位置制御部３１０が予測した境界よりも図６の上側になる（図６（ｂ））。

例えば、時刻Ｔ１２での再予測では、時刻Ｔ１０で予測された境界と時刻Ｔ１２で再予測された境界との間のデータを含むデータは、時刻Ｔ２０で処理済みとなる。エッジノード２００ｂで処理されないデータの無駄な転送を抑止するため、データ制御部３４０は、転送開始位置から時刻Ｔ１２で再予測された境界までのデータの転送を停止する（図６（ｃ））。これにより、ネットワークＮＷの帯域が無駄なデータの転送に使用されることを抑止することができる。

時刻Ｔ１２以降、データ制御部３４０は、転送開始位置から処理順が遅い側に向けて、エッジノード２００ａからエッジノード２００ｂにデータを転送する（図６（ｄ））。これにより、図４および図５と同様に、エッジノード２００ｂでのデータの処理速度が、データの転送速度より速い場合にも、処理するデータのエッジノード２００ｂへの転送が間に合わず、エッジノード２００ｂでの処理が停止する不具合を抑止することができる。

そして、図４および図５と同様に、時刻Ｔ２０において、エッジノード２００ａに接続されていたデータ生成部４００は、エッジノード２００ｂに接続される。このため、時刻Ｔ２０以降、データ生成部４００が生成したデータは、エッジノード２００ｂに入力され、エッジノード２００ｂのデータ保持部２２０に格納される。

時刻Ｔ２０において、処理位置制御部３１０は、エッジノード２００ｂに、エッジノード２００ａから転送されたデータの処理を開始させる。すなわち、データを処理するエッジノード２００の切り替えが行われる（図６（ｅ））。

図７は、図３の代表ノード３００の動作の一例を示す。例えば、図７から図９に示す動作は、代表ノード３００に搭載されるＣＰＵ等のプロセッサが実行する制御プログラムにより実現される。すなわち、図７から図９は、データ処理システム１００の制御方法の一例およびデータ処理システム１００の制御プログラムの一例を示す。

代表ノード３００は、各データ処理を実行するエッジノード２００の数に対応してそれぞれステップ１００を実行する。例えば、データ処理は、図４から図６と同様にエッジノード２００単位で実行される。ここで、エッジノード２００は、例えば、物理サーバが実行するＯＳ（Operating System）上で動作するコンテナに対応する。

ステップＳ１００において、代表ノード３００は、データ処理を実行するエッジノード２００のリソース使用量を監視し、データ処理の実行を他のエッジノード２００に切り替えるか否か判定する。そして、代表ノード３００は、切り替えを決定した場合、切り替え処理を実行する。ステップＳ１００での処理の例は、図８および図９に示す。

エッジノード２００の切り替えの判定と切り替え処理とを実行した代表ノード３００は、ステップＳ１５０において、監視周期（例えば、１０秒）に到達するまでスリープし、監視周期に到達した場合、ステップＳ１００をエッジノード２００毎に実行する。

図８は、図７のステップＳ１００の処理の一例を示す。図８に示す処理は、代表ノード３００の処理位置制御部３１０により実行される。なお、図７で説明したように、ステップＳ１００は、データ処理の実行単位であるエッジノード２００毎に実行されるため、以下では、着目する１つのエッジノード２００の切り替え判定および切り替え処理について説明する。

まず、ステップＳ１０２において、処理位置制御部３１０は、ノード監視部３５０からエッジノード２００のリソースの使用状況を取得する。次に、ステップＳ１０４において、処理位置制御部３１０は、ノード監視部３５０から取得した情報に基づいて、リソース使用量が増加傾向にあるか否かを判定する。ここで、リソース使用量は、ＣＰＵの使用率およびメモリの使用率を含む。

リソース使用量が増加傾向にある場合、処理位置制御部３１０は、エッジノード２００の切り替えの要否を判定するため、ステップＳ１０６を実行する。リソース使用量が増加傾向にない場合、エッジノード２００を切り替えなくてよいため、処理位置制御部３１０は、図８に示す処理を終了する。

ステップＳ１０６において、処理位置制御部３１０は、次のタイムスロット（例えば、１分後）でのエッジノード２００のリソース使用量をリソース毎に予測する。次に、ステップＳ１０８において、処理位置制御部３１０は、予測したリソース使用量が、エッジノード２００に現在割り当てているリソース量を超えるか否かを、リソース毎に判定する。処理位置制御部３１０は、リソースのいずれかにおいて、リソース使用量の予測値が、現在割り当てているリソース量を超える場合、ステップＳ１１０を実行する。また、処理位置制御部３１０は、すべてのリソースにおいて、ソース使用量の予測値が、現在割り当てているリソース量以下の場合、図８に示す処理を終了する。

ステップＳ１１０において、処理位置制御部３１０は、エッジノード２００において、リソース量の不足が予測されるリソースに空きがあるか否か判定する。処理位置制御部３１０は、リソースに空きがある場合、ステップＳ１１２を実行し、リソースに空きがない場合、ステップＳ１１４を実行する。

例えば、処理位置制御部３１０は、リソース使用量の予測値が、現在割り当てているリソース量を超えるリソースの各々において、空いているリソース量を割り当てることで、予測したリソース量の超過が解消される場合、ステップＳ１１２を実行する。また、処理位置制御部３１０は、リソース使用量の予測値が、現在割り当てているリソース量を超えるリソースの少なくともいずれかにおいて、空いているリソース量を割り当てても、予測したリソース量の超過が解消されない場合、ステップＳ１１４を実行する。

ステップＳ１１２において、処理位置制御部３１０は、リソース使用量の予測値が、現在割り当てているリソース量を超えるリソースの各々について、割り当てるリソース量を増加し、図８に示す処理を終了する。割り当てるリソース量の変更は、処理位置制御部３１０からの指示に基づいて、各エッジノード２００のリソース量を管理するリソース量管理部（不図示）により実行されてもよい。

ステップＳ１１４において、処理位置制御部３１０は、データ処理を実行するエッジノード２００を、リソース量に余裕がある他のエッジノード２００に切り替える時刻（例えば、図４から図６の時刻Ｔ２０）を予測する。すなわち、処理位置制御部３１０は、データ処理を実行中のエッジノード２００のリソース使用量が不足する時刻を予測する。

次に、ステップＳ１１６において、処理位置制御部３１０は、データ処理を実行中のエッジノード２００に代えてデータ処理を代行するエッジノード２００を決定する。処理位置制御部３１０は、代行を決定したエッジノード２００の情報を処理位置管理部３２０に通知する。例えば、データ処理を代行するエッジノード２００のリソース負荷は、データ処理を実行中のエッジノード２００のリソース負荷より小さいことが好ましい。

次に、ステップＳ２００において、処理位置制御部３１０は、データ処理を実行中のエッジノード２００からデータ処理を代行するエッジノード２００にデータを移動（転送）する移動処理を、データ制御部３４０に実行させる。ステップＳ２００の例は、図９で説明する。

ステップＳ２００の実行後、ステップＳ１２０において、処理位置制御部３１０は、データの転送先のエッジノード２００にデータ処理を開始させる。また、処理位置制御部３１０は、データの転送元のエッジノード２００でのデータ処理を停止させる。なお、データの転送先のエッジノード２００でのデータ処理が開始された後にも、データの転送元のエッジノード２００に保持された未処理のデータがなくなるまで、データの転送は継続される。

次に、ステップＳ１２２において、処理位置制御部３１０は、データ生成部４００が生成する新規のデータの転送先を、データの転送元のエッジノード２００からデータの転送先のエッジノード２００に切り替え、図８に示す処理を終了する。

図９は、図８のステップＳ２００の処理の一例を示す。図９に示す処理は、代表ノード３００のデータ制御部３４０により実行される。なお、データ制御部３４０は、データ転送の状況をデータ管理部３３０に通知してもよい。

まず、ステップＳ２０２において、データ制御部３４０は、図８のステップＳ１１４で処理位置制御部３１０が予測した切り替え時刻までに転送可能なデータ量をネットワークＮＷの帯域等に基づいて算出する。すなわち、データ制御部３４０は、切り替え時刻までに、図４から図６で処理位置制御部３１０が予測した境界から転送可能なデータ量を算出する。そして、データ制御部３４０は、算出した転送可能なデータ量に基づいて、図４から図６で説明した転送開始位置を決定し、転送開始位置からデータの転送を開始する。

ステップＳ２０２の後に実行されるステップＳ２０４、Ｓ２０６、Ｓ２０８、Ｓ２１０、Ｓ２１２は、データの転送（移動）が完了するまで繰り返し実行される。ステップＳ２０４において、データ制御部３４０は、例えば、データ転送に使用するデータポインタ等に基づいて、データ転送の進行状況を取得する。

次に、ステップＳ２０６において、データ制御部３４０は、処理位置制御部３１０が予測したエッジノード２００の切り替え時刻での処理済みデータと未処理データとの境界まで、データを転送したか否かを判定する。データ制御部３４０は、境界までデータを転送した場合、ステップＳ２１４を実行し、境界までデータを転送していない場合、ステップＳ２０８を実行する。

ステップＳ２０８において、データ制御部３４０は、次のタイムスロットに到達したか否かを判定する。例えば、図４から図６に示す例では、次のタイムスロットは、時刻Ｔ１２である。データ制御部３４０は、次のタイムスロットに到達した場合、再予測を実行するためにステップＳ２１０を実行し、次のタイムスロットに到達していない場合、ステップＳ２０４を実行する。

ステップＳ２１０において、データ制御部３４０は、処理位置制御部３１０が予測したエッジノード２００の切り替え時刻に境界までのデータ処理が完了するか否かを判定する。データ制御部３４０は、切り替え時刻に境界までのデータ処理が完了する場合、データの転送を継続し、切り替え時刻に境界までのデータ処理が完了しない場合、ステップＳ２１２を実行する。ここで、図４および図６に示す動作が、切り替え時刻に境界までのデータ処理が完了する場合に対応し、図５に示す動作が、切り替え時刻に境界までのデータ処理が完了しない場合に対応する。

ステップＳ２１２において、データ制御部３４０は、転送開始位置からのデータの転送を中断し、新たな転送開始位置を決定し、データの転送を開始する。例えば、データ制御部３４０は、図５（ｄ）に示すように、処理位置制御部３１０が予測した境界から新たに再予測した境界に向けて、データを転送する。データ制御部３４０は、ステップＳ２１２の後、ステップＳ２０４を実行する。

ステップＳ２１４において、データ制御部３４０は、処理位置制御部３１０が予測したエッジノード２００の切り替え時刻までデータを転送した後、未転送のデータが転送元のエッジノード２００にあるか否かを判定する。データ制御部３４０は、未転送のデータが転送元のエッジノード２００にある場合、ステップＳ２１６を実行し、未転送のデータが転送元のエッジノード２００にない場合、図９に示す処理を終了する。

ステップＳ２１６において、データ制御部３４０は、転送元のエッジノード２００から転送先のエッジノード２００に、未転送のデータの転送を開始し、図９に示す処理を終了する。なお、図４から図６で説明したように、未転送のデータの転送は、データを処理するエッジノード２００が切り替えられた後も、転送が完了するまで継続される。

図１０は、図３の代表ノード３００と各エッジノード２００との間でのデータ転送に使用されるＡＰＩ（Application Programming Interface）の一例を示す。例えば、ＡＰＩとして、データ転送指示、移動予測情報およびデータ移動完了通知がある。

データ転送指示は、代表ノード３００からデータの移動元のエッジノード２００に対して発行される。データ転送指示は、処理位置制御部３１０がエッジノード２００の切り替え時刻を予測した初回に一度だけ発行され、それ以降、データ制御部３４０が再予測に基づいて転送を制御する。例えば、データは、データ生成部４００からエッジノード２００のデータ保持部２２０にアドレスが小さい順に格納される。データ保持部２２０に格納されたデータを処理順が遅い側から転送する場合、転送開始位置のアドレス＞転送完了位置のアドレスとなる。

移動予測情報は、代表ノード３００からデータの移動元のエッジノード２００に、転送するデータを指示するために、エッジノード２００の切り替えの予測時刻の変化に基づいて発行される。移動予測情報は、データ転送中に定期的に実行される。

データ移動完了通知は、データの移動元のエッジノード２００およびデータの移動先のエッジノード２００から代表ノード３００に、データ転送の完了を通知するときに発行される。

以上、図３から図１０に示す実施形態においても、図１および図２に示す実施形態と同様の効果を得ることができる。例えば、データ処理を実行中のエッジノード２００のリソース使用量が所定の時刻Ｔ２０において不足すると予測された場合、データ処理を引き継ぐエッジノード２００へのデータ転送を処理順が遅い側から実行する。これにより、データ処理を引き継ぐエッジノード２００に無駄なデータが転送されることを抑止することができ、ネットワークＮＷの帯域を節約することができる。

境界を予測した時刻Ｔ１０からエッジノード２００を切り替える時刻Ｔ２０までに転送可能なデータ量に基づいて、転送開始位置を決定する。これにより、切り替え時刻Ｔ２０において、データ処理を停止させることなく引き継ぐことができ、データ処理システム１００の処理性能の低下を抑止することができる。したがって、無駄なデータ転送を抑止することでネットワークＮＷの帯域を増やすことなく、かつ、実行中の処理を止めることなく、処理の移行元のエッジノード２００から処理の移行先のエッジノード２００にデータを転送することができる。

さらに、図３から図１０に示す実施形態では、境界の再予測により未処理データが増加すると判定された場合、転送開始位置から実行しているデータの転送を中断し、再予測した境界に向けて時刻Ｔ２０までに転送可能なデータを処理が遅い順に転送する。これにより、エッジノード２００ａでの処理速度がその後上がった場合、時刻Ｔ１２から開始したデータの転送を中断することができ、処理済みのデータがエッジノード２００ｂに転送される無駄を抑止することができる。

境界の再予測によりエッジノード２００ａでの処理速度が低下したと判定された場合、実行中のデータ転送を中断し、再予測された境界に向けてデータを転送することで、エッジノード２００ｂによる処理の開始が遅れることを抑止することができる。これにより、データ処理システム１００の処理性能が低下することを抑止することができる。また、再予測された境界に向けて処理順が遅いデータからデータを転送することで、時刻Ｔ２０までにエッジノード２００ａで処理されるデータが、エッジノード２００ｂに転送される無駄を抑止することができる。

時刻Ｔ２０において、転送を中断したデータを含むデータのエッジノード２００ｂへの転送を再開することで、転送を中断したデータがエッジノード２００ｂに転送されない不具合を抑止することできる。この際、処理順が早い側からデータを転送することで、処理するデータが転送されておらず、処理が開始できない不具合が発生する可能性を低くすることができる。

境界の再予測によりエッジノード２００ａでの処理速度が向上したと判定された場合、転送開始位置から再予測された境界までのデータの転送を停止することでネットワークＮＷの帯域が無駄なデータの転送に使用されることを抑止することができる。

境界の再予測を所定の頻度で繰り返し実行することで、境界の予測値を、エッジノード２００ａでのデータの処理速度の変化に追従して調整することができ、無駄なデータ転送および時刻Ｔ２０での未転送のデータの発生等のデータの過不足を低減することができる。

以上の詳細な説明により、実施形態の特徴点および利点は明らかになるであろう。これは、特許請求の範囲がその精神および権利範囲を逸脱しない範囲で前述のような実施形態の特徴点および利点にまで及ぶことを意図するものである。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良および変更に容易に想到できるはずである。したがって、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物および均等物に拠ることも可能である。

１０データ処理システム
２０（２０ａ、２０ｂ）処理ノード
２２（２２ａ、２２ｂ）バッファ
２４（２４ａ、２４ｂ）処理部
３０管理ノード
３２予測部
３４転送制御部
１００データ処理システム
２００（２００ａ、２００ｂ、２００ｃ、２００ｄ）エッジノード
２１０データ受信部
２２０データ保持部
２３０データ処理部
２４０リソース監視部
３００代表ノード
３１０処理位置制御部
３２０処理位置管理部
３３０データ管理部
３４０データ制御部
３５０ノード監視部
４００（４００ａ、４００ｂ、４００ｃ）データ生成部
ＤＴ（ＤＴａ、ＤＴｂ、ＤＴｃ）データ
ＮＷネットワーク

Claims

それぞれ、バッファと、該バッファに保持されたデータを処理する処理部とを含む複数の処理ノードを管理する情報処理装置において、
データ処理中の処理ノードのリソース負荷が所定量に到達する到達予測時刻における前記バッファ内の処理済みデータと未処理データとの境界を予測する予測部と、
前記予測部の予測に基づいて、未処理データを処理順が遅い側から前記境界に向けて、データ処理を引き継ぐ他の処理ノードに転送する転送制御部と
を有する情報処理装置。
前記転送制御部は、前記バッファの、前記境界から前記到達予測時刻までに転送可能なデータ量だけ処理順が遅い側から前記未処理データを前記他の処理ノードに転送する、
請求項１に記載の情報処理装置。
前記予測部は、前記データ処理中の処理ノードから前記他の処理ノードにデータを転送中に前記境界を再予測し、
前記転送制御部は、前記到達予測時刻における未処理データが前回の予測より増加すると前記予測部が再予測した場合、処理順が遅い側から前記境界に向けての未処理データの転送を中断し、前記バッファの、再予測された境界から、前記到達予測時刻までに転送可能なデータ量だけ処理順が遅い側から前記未処理データを前記他の処理ノードに転送する
請求項１または請求項２に記載の情報処理装置。
前記転送制御部は、前記到達予測時刻までに転送可能な未処理データの前記他の処理ノードへの転送が完了後、転送を中断した未処理データを処理順が早い側から前記他の処理ノードに転送する
請求項３に記載の情報処理装置。
前記転送制御部は、前記到達予測時刻における未処理データが前回の予測より減少すると前記予測部が再予測した場合、処理順が遅い側から再予測された境界まで未処理データを転送した後、最初の予測で決定したデータの転送開始位置より処理順が遅いデータの転送を開始する
請求項２ないし請求項４のいずれか１項に記載の情報処理装置。
前記予測部は、前記データ処理中の処理ノードから前記他の処理ノードにデータを転送中に、所定の頻度で前記境界を再予測する
請求項２ないし請求項５のいずれか１項に記載の情報処理装置。
前記転送制御部は、前記予測部の予測に基づいて転送する未処理データの転送開始位置を、前記予測部による予測時から前記到達予測時刻までに前記他の処理ノードに転送可能なデータ量に基づいて決定する
請求項１ないし請求項６の何れか1項に記載の情報処理装置。
前記管理ノードは、データ処理中の処理ノードのリソース負荷よりリソース負荷が小さい処理ノードを、データ処理を引き継ぐ前記他の処理ノードとして選択する
請求項１ないし請求項７の何れか1項に記載の情報処理装置。
それぞれ、バッファと、該バッファに保持されたデータを処理する処理部とを含む複数の処理ノードを管理する情報処理装置の制御方法であって、
データ処理中の処理ノードのリソース負荷が所定量に到達する到達予測時刻における前記バッファ内の処理済みデータと未処理データとの境界を予測し、
予測に基づいて、未処理データを処理順が遅い側から前記境界に向けて、データ処理を引き継ぐ他の処理ノードに転送する
情報処理装置の制御方法。
それぞれ、バッファと、該バッファに保持されたデータを処理する処理部とを含む複数の処理ノードを管理する情報処理装置の制御プログラムであって、
前記管理ノードに、
データ処理中の処理ノードのリソース負荷が所定量に到達する到達予測時刻における前記バッファ内の処理済みデータと未処理データとの境界を予測し、
予測に基づいて、未処理データを処理順が遅い側から前記境界に向けて、データ処理を引き継ぐ他の処理ノードに転送する
処理を実行させる制御プログラム。