JP7035606B2 - エッジコンピューティングシステム、エッジサーバ、システム制御方法、及びプログラム - Google Patents
エッジコンピューティングシステム、エッジサーバ、システム制御方法、及びプログラム Download PDFInfo
- Publication number
- JP7035606B2 JP7035606B2 JP2018028585A JP2018028585A JP7035606B2 JP 7035606 B2 JP7035606 B2 JP 7035606B2 JP 2018028585 A JP2018028585 A JP 2018028585A JP 2018028585 A JP2018028585 A JP 2018028585A JP 7035606 B2 JP7035606 B2 JP 7035606B2
- Authority
- JP
- Japan
- Prior art keywords
- model
- edge
- edge server
- division
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1025—Dynamic adaptation of the criteria on which the server selection is based
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
- H04L47/2425—Traffic characterised by specific attributes, e.g. priority or QoS for supporting services specification, e.g. SLA
- H04L47/2433—Allocation of priorities to traffic types
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
- H04L47/2466—Traffic characterised by specific attributes, e.g. priority or QoS using signalling traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1008—Server selection for load balancing based on parameters of servers, e.g. available memory or workload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
Description
実施形態の詳細な説明に先立って、実施形態の概要を説明する。
図1は、実施形態の概要にかかるエッジコンピューティングシステム1の構成の一例を示すブロック図である。エッジコンピューティングシステム1は、バックエンドサーバ2と、バックエンドサーバ2と通信可能な複数のエッジサーバ3を含む。エッジサーバ3のそれぞれは、データを送信する1以上のデバイス(図1において図示せず)と通信接続している。
分割モデル割り振り部22は、分割モデルのそれぞれを、1以上のエッジサーバ3に割り振る。すなわち、分割モデル割り振り部22は、分割モデルによる演算をどのエッジサーバ3が担当するかを決定する。なお、同一の分割モデルが、複数のエッジサーバ3に割り振られた場合、いずれか1つのエッジサーバ3がこの分割モデルによる演算を実行すればよい。
分割情報送信部24は、分割モデル割り振り部22による割り振りに基づいて、分割モデルと、当該分割モデルの次の処理ステップを含む分割モデルの割り振り先を示す情報である転送先情報と、優先度情報とをエッジサーバ3に送信する。転送先情報は、一連の処理ステップの処理を行うために、分割モデルによる演算結果をどのエッジサーバ3に転送すべきかを示す情報とも言える。すなわち、転送先情報は、どのエッジサーバ3が後続の処理ステップを演算する可能性があるかを示す情報である。
管理部32は、エッジサーバ3と通信接続されているデバイス数を管理する。なお、管理部32は、デバイス数に限らず、エッジサーバ3のリソース状態などをさらに管理してもよい。
演算結果転送部34は、転送先情報及び優先度情報に従って特定される他のエッジサーバ3に、演算処理部33の演算結果を転送する。これにより、後続の処理ステップが他のエッジサーバ3において実行される。なお、上述の通り、同一の分割モデルが複数のエッジサーバ3に割り振られる場合がある。この場合、優先度情報によりいずれかのエッジサーバ3により当該分割モデルによる演算が実行される。このため、演算結果転送部34は、転送先情報及び優先度情報に従って、転送先を特定する。
次に、実施の形態の詳細について説明する。図2は、実施の形態にかかるエッジコンピューティングシステム100の構成の一例を示すブロック図である。図2に示すように、エッジコンピューティングシステム100は、バックエンドサーバ200と、複数のエッジサーバ300と、複数のデバイス400とを含む。バックエンドサーバ200は、図1のバックエンドサーバ2に対応しており、エッジサーバ300は、図1のエッジサーバ3に対応している。
このプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、Compact Disc Read Only Memory(CD-ROM)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、Programmable ROM(PROM)、Erasable PROM(EPROM)、フラッシュROM、Random Access Memory(RAM))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
メモリ51又は記憶装置は、データ保管部206又はデータ保管部302として利用されてもよい。
なお、デバイス400も図3に示した構成と同様のハードウェア構成を備えており、コンピュータとしての機能を有する。
元データからの解析対象の情報の抽出、及び学習済みモデルの入力から出力を得るための中間処理は、それぞれ独立した分割モデルとして表現できる。元データから情報を抽出する分割モデルをM(1)、N-1回の中間処理を行う場合の各中間処理の分割モデルをM(2)~M(N)とすると、元データに対し、M(1)~M(N)の分割モデルの演算を実行することで、最終的な出力を得られることになる。本実施の形態では、このように、モデルをM(1)~M(N)の分割モデルへと分割する。そして、各分割モデルをエッジサーバ300に割り振り、モデル全体の処理を複数のエッジサーバ300による処理の引き継ぎにより実現する。なお、学習済みモデルはバックエンドサーバ200によって予め作成されてもよい。すなわち、モデルの学習処理が、バックエンドサーバ200により行われてもよい。
このように、分割モデル割り振り部203は、元データを送信するデバイス400と通信接続しているエッジサーバ300に、当該元データの入力を必要とする分割モデルを割り振る。
これにより、元データをエッジサーバ300間で転送することによる通信負荷を避けることができる。
すなわち、例えば、分割モデル割り振り部203は、接続数が所定の閾値を超えるエッジサーバ300に対して割り振る分割モデルの数を所定数以下とする。このように、分割モデル割り振り部203は、エッジサーバ300毎のデバイス数に応じた数の分割モデルをエッジサーバ300に割り振る。
これにより、接続デバイス数が多いために元データからの解析対象データの抽出処理の負荷が大きいエッジサーバ300に、処理が集中することを避けることができる。
このように、分割モデル割り振り部203は、第1の分割モデルと第2の分割モデルを別のエッジサーバ300に割り振る。ここで、第2の分割モデルは、第1の分割モデルの次の処理ステップを含む分割モデルである。
このようにすることで、エッジサーバ300が記憶する情報を不正に取得された場合に、モデルについての情報の漏洩による被害を、連続した分割モデルが同一エッジサーバ300に記憶されている場合に比べ、低減することができる。
例えば、分割モデル割り振り部203は、M(n)を割り振られたエッジサーバ300(エッジサーバAと呼ぶこととする)に対しM(n+1)を割り振る際のリスク値を1に設定する。また、M(n-1)とM(n)を割り振られたエッジサーバ300(エッジサーバBと呼ぶこととする)に対しM(n+1)を割り振るリスク値を2に設定する。この場合、分割モデル割り振り部203は、エッジサーバAとエッジサーバBの接続デバイス数の差が所定の閾値以下である場合、リスク値が低いエッジサーバAにM(n+1)を割り振る。これに対し、エッジサーバAの接続デバイス数がエッジサーバBの接続デバイス数よりも所定値以上大きい場合、エッジサーバAにおける元データからの抽出処理の負荷が大きいことが想定される。このため、分割モデル割り振り部203は、エッジサーバBにM(n+1)を割り振る。また、あるエッジサーバ300のリスク値が所定の閾値より高い場合、そのエッジサーバ300の接続デバイス数によらず、そのエッジサーバ300には連続した分割モデルを割り振らないようにする。
図12は、エッジサーバ300の機能構成の一例を示すブロック図である。各エッジサーバ300は、図12に示すように、バックエンド通信部301と、データ保管部302と、エッジ通信部303と、演算処理部304と、デバイス通信部305と、転送先リスト管理部306と、リソース管理部307と、制御部308とを有する。
また、バックエンド通信部301は、例えば、エッジサーバ300に接続されているデバイス400に関する情報(デバイス情報とも称す)を送信する。なお、デバイス情報には、例えば、エッジサーバ300と当該エッジサーバ300に接続しているデバイス400との対応情報、当該エッジサーバ300に接続している各デバイス400から送信されるデータ種別を示す情報、などが含まれる。
次に、ステップ202(S202)において、演算処理部304がデータ保管部302に保存されている分割モデルを使用して演算処理を行う。なお、このとき、演算処理部304は、ステップ201で特定された分割モデルを復号鍵で復号し、復号された分割モデルにより演算を実施する。
次に、ステップ203(S203)において、演算処理部304は、演算処理結果を、次の処理ステップを実行するエッジサーバ300に渡すデータである転送データに含める。
次に、ステップ212(S212)において、制御部308は、受信した転送データから演算処理結果を入力データとして取り出す。
次に、ステップ213(S213)において、制御部308は、受信した転送データに含まれる分割モデル種別を読み取り、使用する分割モデルを決定する。
ステップ302(S302)において、この通知を他のエッジサーバ300のエッジ通信部303が受信する。
バックエンドサーバと、複数のエッジサーバとを含み、
前記バックエンドサーバは、
入力データに対して複数の処理ステップを含む演算を行うプログラムであるモデルを分割モデルへと分割するモデル分割部と、
前記分割モデルのそれぞれを、1以上の前記エッジサーバに割り振る分割モデル割り振り部と、
同一の前記分割モデルが割り振られた複数の前記エッジサーバのうちいずれの前記エッジサーバが優先的に前記分割モデルを実行するかを示す優先度情報を作成する優先度作成部と、
前記分割モデル割り振り部による割り振りに基づいて、前記分割モデルと、当該分割モデルの次の処理ステップを含む前記分割モデルの割り振り先を示す情報である転送先情報と、前記優先度情報とを前記エッジサーバに送信する分割情報送信部と
を有し、
前記エッジサーバのそれぞれは、
前記入力データを送信する1以上のデバイスと通信接続しており、
前記バックエンドサーバから前記分割モデル、前記転送先情報、及び前記優先度情報を取得する分割情報取得部と、
通信接続されているデバイス数を管理する管理部と、
前記分割モデルを用いた演算を実行する演算処理部と、
前記転送先情報及び前記優先度情報に従って特定される他の前記エッジサーバに、前記演算処理部の演算結果を転送する演算結果転送部と
を有し、
前記管理部は、前記デバイス数と所定の閾値とを比較し、比較結果に応じて前記優先度情報の更新を他の前記エッジサーバに要求する
エッジコンピューティングシステム。
(付記2)
前記管理部は、さらに、自サーバのリソースを管理し、前記リソースの利用状況に応じて前記優先度情報の更新を他の前記エッジサーバに要求する
付記1に記載のエッジコンピューティングシステム。
(付記3)
前記演算結果転送部は、転送先から応答がない場合、当該転送先の前記エッジサーバの優先度を前記優先度情報において下げるよう他の前記エッジサーバに要求する
付記1又は2に記載のエッジコンピューティングシステム。
(付記4)
前記分割モデル割り振り部は、前記エッジサーバ毎の前記デバイス数に応じた数の前記分割モデルを前記エッジサーバに割り振る
付記1乃至3のいずれか1項に記載のエッジコンピューティングシステム。
(付記5)
前記分割モデル割り振り部は、前記入力データを送信するデバイスと通信接続している前記エッジサーバに、前記入力データの入力を必要とする前記分割モデルを割り振る
付記1乃至4のいずれか1項に記載のエッジコンピューティングシステム。
(付記6)
前記分割モデル割り振り部は、第1の分割モデルと第2の分割モデルを別の前記エッジサーバに割り振り、
前記第2の分割モデルは、前記第1の分割モデルの次の処理ステップを含む前記分割モデルである
付記1乃至5のいずれか1項に記載のエッジコンピューティングシステム。
(付記7)
前記分割モデル割り振り部は、前記エッジサーバと通信接続している前記デバイスが送信する前記入力データの種別に応じて、当該エッジサーバに割り振る前記分割モデルの数を調整する
付記1乃至6のいずれか1項に記載のエッジコンピューティングシステム。
(付記8)
前記優先度作成部は、前記エッジサーバ毎の前記デバイス数に応じて、優先度を決定する
付記1乃至7のいずれか1項に記載のエッジコンピューティングシステム。
(付記9)
複数の処理ステップを含む演算を行うプログラムであるモデルに入力するための入力データを送信する1以上のデバイスと通信接続しており、
前記モデルを分割した分割モデルと、当該分割モデルの次の処理ステップを含む前記分割モデルを取得する他のエッジサーバを示す情報である転送先情報と、同一の前記分割モデルを取得する複数の前記エッジサーバのうちいずれの前記エッジサーバが優先的に当該分割モデルを実行するかを示す優先度情報とを、バックエンドサーバから取得する分割情報取得部と、
通信接続されているデバイス数を管理する管理部と、
前記分割モデルを用いた演算を実行する演算処理部と、
前記演算処理部の演算結果を、前記転送先情報及び前記優先度情報に従って特定される他の前記エッジサーバに転送する演算結果転送部と
を有し、
前記管理部は、前記デバイス数と所定の閾値とを比較し、比較結果に応じて前記優先度情報の更新を他の前記エッジサーバに要求する
エッジサーバ。
(付記10)
前記管理部は、さらに、自サーバのリソースを管理し、前記リソースの利用状況に応じて前記優先度情報の更新を他の前記エッジサーバに要求する
付記9に記載のエッジサーバ。
(付記11)
入力データに対して複数の処理ステップを含む演算を行うプログラムであるモデルを分割モデルへと分割するモデル分割部と、
前記分割モデルのそれぞれを、1以上のエッジサーバに割り振る分割モデル割り振り部と、
同一の前記分割モデルが割り振られた複数の前記エッジサーバのうちいずれの前記エッジサーバが優先的に前記分割モデルを実行するかを示す優先度情報を作成する優先度作成部と、
前記分割モデル割り振り部による割り振りに基づいて、前記分割モデルと、当該分割モデルの次の処理ステップを含む前記分割モデルの割り振り先を示す情報である転送先情報と、前記優先度情報とを前記エッジサーバに送信する分割情報送信部と
を有し、
前記エッジサーバは、前記入力データを送信する1以上のデバイスと通信接続しており、
前記分割モデル割り振り部は、前記エッジサーバ毎の通信接続されているデバイス数に応じた数の前記分割モデルを前記エッジサーバに割り振る
バックエンドサーバ。
(付記12)
前記優先度作成部は、前記エッジサーバ毎の前記デバイス数に応じて、優先度を決定する
付記11に記載のバックエンドサーバ。
(付記13)
複数の処理ステップを含む演算を行うプログラムであるモデルに入力するための入力データを送信するデバイスとの接続数を管理し、
前記モデルを分割した分割モデルと、当該分割モデルの次の処理ステップを含む前記分割モデルを取得する他のエッジサーバを示す情報である転送先情報と、同一の前記分割モデルを取得する複数の前記エッジサーバのうちいずれの前記エッジサーバが優先的に当該分割モデルを実行するかを示す優先度情報とを、バックエンドサーバから取得し、
前記分割モデルを用いた演算を実行し、
演算結果を、前記転送先情報及び前記優先度情報に従って特定される他の前記エッジサーバに転送し、
前記接続数と所定の閾値とを比較し、比較結果に応じて前記優先度情報の更新を他の前記エッジサーバに要求する
システム制御方法。
(付記14)
複数の処理ステップを含む演算を行うプログラムであるモデルに入力するための入力データを送信するデバイスとの接続数を管理する管理ステップと、
前記モデルを分割した分割モデルと、当該分割モデルの次の処理ステップを含む前記分割モデルを取得する他のエッジサーバを示す情報である転送先情報と、同一の前記分割モデルを取得する複数の前記エッジサーバのうちいずれの前記エッジサーバが優先的に当該分割モデルを実行するかを示す優先度情報とを、バックエンドサーバから取得する取得ステップと、
前記分割モデルを用いた演算を実行する演算ステップと、
演算結果を、前記転送先情報及び前記優先度情報に従って特定される他の前記エッジサーバに転送する転送ステップと、
前記接続数と所定の閾値とを比較し、比較結果に応じて前記優先度情報の更新を他の前記エッジサーバに要求する要求ステップと
をコンピュータに実行させるプログラム。
2、200 バックエンドサーバ
3、300 エッジサーバ
21、201 モデル分割部
22、203 分割モデル割り振り部
23 優先度作成部
24 分割情報送信部
31 分割情報取得部
32 管理部
33、304 演算処理部
34 演算結果転送部
50 ネットワークインタフェース
51 メモリ
52 プロセッサ
202 分割モデル暗号化部
204 転送先リスト作成部
205、303 エッジ通信部
206、302 データ保管部
301 バックエンド通信部
305 デバイス通信部
306 転送先リスト管理部
307 リソース管理部
308 制御部
400 デバイス
500 ネットワーク
Claims (9)
- バックエンドサーバと、複数のエッジサーバとを含み、
前記バックエンドサーバは、
入力データに対して複数の処理ステップを含む演算を行うプログラムであるモデルを分割モデルへと分割するモデル分割部と、
前記分割モデルのそれぞれを、1以上の前記エッジサーバに割り振る分割モデル割り振り部と、
同一の前記分割モデルが割り振られた複数の前記エッジサーバのうちいずれの前記エッジサーバが優先的に前記分割モデルを実行するかを示す優先度情報を、第1の時点における、エッジサーバ毎の通信接続しているデバイス数に基づいて、作成する優先度作成部と、
前記分割モデル割り振り部による割り振りに基づいて、前記分割モデルと、当該分割モデルの次の処理ステップを含む前記分割モデルの割り振り先を示す情報である転送先情報と、前記優先度情報とを前記エッジサーバに送信する分割情報送信部と
を有し、
前記エッジサーバのそれぞれは、
前記入力データを送信する1以上のデバイスと通信接続しており、
前記バックエンドサーバから前記分割モデル、前記転送先情報、及び前記優先度情報を取得する分割情報取得部と、
通信接続されているデバイス数を管理する第1の管理部と、
前記分割モデルを用いた演算を実行する演算処理部と、
前記転送先情報及び前記優先度情報に従って特定される他の前記エッジサーバに、前記演算処理部の演算結果を転送する演算結果転送部と、
他の前記エッジサーバからの要求に応じて前記優先度情報の更新を行う第2の管理部と
を有し、
前記第1の管理部は、前記第1の時点よりも後の第2の時点において自サーバと通信接続している前記デバイス数が所定の閾値を超えている場合には、前記優先度情報の更新を転送元の他の前記エッジサーバに要求し、
転送元の前記エッジサーバの前記演算結果転送部は、前記優先度情報の更新が行われた場合には、前記転送先情報及び更新後の前記優先度情報に従って特定される他の前記エッジサーバに、前記演算処理部の演算結果を転送する
エッジコンピューティングシステム。 - 前記第1の管理部は、さらに、自サーバのリソースを管理し、前記第2の時点における前記リソースの使用率が所定の閾値を超えている場合には、前記優先度情報の更新を転送元の他の前記エッジサーバに要求する
請求項1に記載のエッジコンピューティングシステム。 - 前記演算結果転送部は、転送先から応答がない場合、当該転送先の前記エッジサーバの優先度を前記優先度情報において下げるよう転送元の他の前記エッジサーバに要求する
請求項1又は2に記載のエッジコンピューティングシステム。 - 前記分割モデル割り振り部は、前記エッジサーバ毎の前記デバイス数に応じた数の前記分割モデルを前記エッジサーバに割り振る
請求項1乃至3のいずれか1項に記載のエッジコンピューティングシステム。 - 前記分割モデル割り振り部は、前記入力データを送信するデバイスと通信接続している前記エッジサーバに、前記入力データの入力を必要とする前記分割モデルを割り振る
請求項1乃至4のいずれか1項に記載のエッジコンピューティングシステム。 - 前記分割モデル割り振り部は、第1の分割モデルと第2の分割モデルを別の前記エッジサーバに割り振り、
前記第2の分割モデルは、前記第1の分割モデルの次の処理ステップを含む前記分割モデルである
請求項1乃至5のいずれか1項に記載のエッジコンピューティングシステム。 - 複数の処理ステップを含む演算を行うプログラムであるモデルに入力するための入力データを送信する1以上のデバイスと通信接続しており、
前記モデルを分割した分割モデルと、当該分割モデルの次の処理ステップを含む前記分割モデルを取得する他のエッジサーバを示す情報である転送先情報と、同一の前記分割モデルを取得する複数の前記エッジサーバのうちいずれの前記エッジサーバが優先的に当該分割モデルを実行するかを示す優先度情報とを、バックエンドサーバから取得する分割情報取得部と、
通信接続されているデバイス数を管理する第1の管理部と、
前記分割モデルを用いた演算を実行する演算処理部と、
前記演算処理部の演算結果を、前記転送先情報及び前記優先度情報に従って特定される他の前記エッジサーバに転送する演算結果転送部と、
他の前記エッジサーバからの要求に応じて前記優先度情報の更新を行う第2の管理部と
を有し、
前記分割情報取得部が取得する前記優先度情報は、第1の時点における、エッジサーバ毎の通信接続しているデバイス数に基づいて作成されており、
前記第1の管理部は、前記第1の時点よりも後の第2の時点において自サーバと通信接続している前記デバイス数が所定の閾値を超えている場合には、前記優先度情報の更新を転送元の他の前記エッジサーバに要求し、
転送元の前記エッジサーバの前記演算結果転送部は、前記優先度情報の更新が行われた場合には、前記転送先情報及び更新後の前記優先度情報に従って特定される他の前記エッジサーバに、前記演算処理部の演算結果を転送する
エッジサーバ。 - バックエンドサーバと複数のエッジサーバとを含むエッジコンピューティングシステムに含まれるいずれか一つの前記エッジサーバによるシステム制御方法であって、
複数の処理ステップを含む演算を行うプログラムであるモデルに入力するための入力データを送信するデバイスとの接続数を管理し、
前記モデルを分割した分割モデルと、当該分割モデルの次の処理ステップを含む前記分割モデルを取得する他の前記エッジサーバを示す情報である転送先情報と、同一の前記分割モデルを取得する複数の前記エッジサーバのうちいずれの前記エッジサーバが優先的に当該分割モデルを実行するかを示す優先度情報とを、前記バックエンドサーバから取得し、前記バックエンドサーバから取得される前記優先度情報は、第1の時点における、エッジサーバ毎の通信接続しているデバイス数に基づいて作成されており、
前記分割モデルを用いた演算を実行し、
演算結果を、前記転送先情報及び前記優先度情報に従って特定される他の前記エッジサーバに転送し、
前記第1の時点よりも後の第2の時点における前記接続数が所定の閾値を超えている場合には、前記優先度情報の更新を転送元の他の前記エッジサーバに要求し、
転送元の前記エッジサーバは、他の前記エッジサーバからの要求に応じて前記優先度情報の更新を行い、前記優先度情報の更新が行われた場合には、前記転送先情報及び更新後の前記優先度情報に従って特定される他の前記エッジサーバに、前記演算結果を転送する
システム制御方法。 - バックエンドサーバと複数のエッジサーバとを含むエッジコンピューティングシステムに含まれるいずれか一つの前記エッジサーバのコンピュータに、
複数の処理ステップを含む演算を行うプログラムであるモデルに入力するための入力データを送信するデバイスとの接続数を管理する管理ステップと、
前記モデルを分割した分割モデルと、当該分割モデルの次の処理ステップを含む前記分割モデルを取得する他の前記エッジサーバを示す情報である転送先情報と、同一の前記分割モデルを取得する複数の前記エッジサーバのうちいずれの前記エッジサーバが優先的に当該分割モデルを実行するかを示す優先度情報とを、前記バックエンドサーバから取得する取得ステップと、
前記分割モデルを用いた演算を実行する演算ステップと、
演算結果を、前記転送先情報及び前記優先度情報に従って特定される他の前記エッジサーバに転送する転送ステップと、
第1の時点よりも後の第2の時点における前記接続数が所定の閾値を超えている場合には、前記優先度情報の更新を転送元の他の前記エッジサーバに要求する要求ステップと、
他の前記エッジサーバからの要求に応じて前記優先度情報の更新を行う更新ステップと、
を実行させ、
前記取得ステップで取得する前記優先度情報は、前記第1の時点における、エッジサーバ毎の通信接続しているデバイス数に基づいて作成されており、
転送元の前記エッジサーバの前記転送ステップでは、前記優先度情報の更新が行われた場合には、前記転送先情報及び更新後の前記優先度情報に従って特定される他の前記エッジサーバに、前記演算結果を転送する
プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018028585A JP7035606B2 (ja) | 2018-02-21 | 2018-02-21 | エッジコンピューティングシステム、エッジサーバ、システム制御方法、及びプログラム |
US16/281,754 US20190260827A1 (en) | 2018-02-21 | 2019-02-21 | Edge computing system, edge server, and system control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018028585A JP7035606B2 (ja) | 2018-02-21 | 2018-02-21 | エッジコンピューティングシステム、エッジサーバ、システム制御方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019144864A JP2019144864A (ja) | 2019-08-29 |
JP7035606B2 true JP7035606B2 (ja) | 2022-03-15 |
Family
ID=67617062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018028585A Active JP7035606B2 (ja) | 2018-02-21 | 2018-02-21 | エッジコンピューティングシステム、エッジサーバ、システム制御方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20190260827A1 (ja) |
JP (1) | JP7035606B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3570160A1 (en) * | 2018-05-18 | 2019-11-20 | Siemens Aktiengesellschaft | Method and platform for deployment of an industrial application on an edge computing device of a machine tool |
TWI729606B (zh) * | 2019-12-05 | 2021-06-01 | 財團法人資訊工業策進會 | 用於一邊緣運算網路的負載平衡裝置及方法 |
CN111866175A (zh) * | 2020-08-04 | 2020-10-30 | 华北电力大学 | 边缘计算设备的组网,及其和后端服务器的通信方法 |
CN111966502A (zh) | 2020-09-21 | 2020-11-20 | 北京百度网讯科技有限公司 | 用于调整实例数的方法、装置、电子设备及可读存储介质 |
CN112383742B (zh) * | 2020-09-27 | 2022-11-22 | 国网山西省电力公司忻州供电公司 | 一种基于云计算的用于架空送电工程中的音视频调度方法 |
KR102434201B1 (ko) * | 2020-11-30 | 2022-08-19 | 주식회사 두두원 | IoT 센서 환경에서 에지 게이트웨이의 이종 무선 기기간 간섭 완화를 위한 연결성 조절 장치 및 그 방법 |
WO2022138232A1 (ja) * | 2020-12-23 | 2022-06-30 | ソニーグループ株式会社 | 通信装置、通信方法、および通信システム |
CN115185669A (zh) * | 2021-04-06 | 2022-10-14 | 中国移动通信有限公司研究院 | 一种边缘配置服务器信息处理方法、装置和通信设备 |
CN113992691B (zh) * | 2021-12-24 | 2022-04-22 | 苏州浪潮智能科技有限公司 | 一种边缘计算资源的分配方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003186765A (ja) | 2001-12-20 | 2003-07-04 | Fuji Xerox Co Ltd | ネットワーク接続デバイス、ネットワーク接続デバイス管理システム、ネットワーク接続デバイス管理方法 |
US20040244006A1 (en) | 2003-05-29 | 2004-12-02 | International Business Machines Corporation | System and method for balancing a computing load among computing resources in a distributed computing problem |
JP2017126238A (ja) | 2016-01-15 | 2017-07-20 | 日本電気株式会社 | システム管理装置、情報処理システム、システム管理方法及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05108595A (ja) * | 1991-10-17 | 1993-04-30 | Hitachi Ltd | ニユーラルネツトワークの分散学習装置 |
US7467180B2 (en) * | 2003-05-29 | 2008-12-16 | International Business Machines Corporation | Automatically segmenting and populating a distributed computing problem |
US9866637B2 (en) * | 2016-01-11 | 2018-01-09 | Equinix, Inc. | Distributed edge processing of internet of things device data in co-location facilities |
-
2018
- 2018-02-21 JP JP2018028585A patent/JP7035606B2/ja active Active
-
2019
- 2019-02-21 US US16/281,754 patent/US20190260827A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003186765A (ja) | 2001-12-20 | 2003-07-04 | Fuji Xerox Co Ltd | ネットワーク接続デバイス、ネットワーク接続デバイス管理システム、ネットワーク接続デバイス管理方法 |
US20040244006A1 (en) | 2003-05-29 | 2004-12-02 | International Business Machines Corporation | System and method for balancing a computing load among computing resources in a distributed computing problem |
JP2017126238A (ja) | 2016-01-15 | 2017-07-20 | 日本電気株式会社 | システム管理装置、情報処理システム、システム管理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20190260827A1 (en) | 2019-08-22 |
JP2019144864A (ja) | 2019-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7035606B2 (ja) | エッジコンピューティングシステム、エッジサーバ、システム制御方法、及びプログラム | |
CN110032447B (zh) | 用于分配资源的方法和装置 | |
KR102199278B1 (ko) | 가속 자원 처리 방법 및 장치, 및 네트워크 기능 가상화 시스템 | |
US9965322B2 (en) | Scheduling tasks in a distributed processing system with both reconfigurable and configurable processors | |
CN106528289B (zh) | 资源的操作处理方法及装置 | |
JP2014508970A (ja) | クラウドストレージシステムのデータ暗号化処理装置及び方法 | |
WO2019237594A1 (zh) | 会话保持方法、装置、计算机设备及存储介质 | |
JP6301413B2 (ja) | データ伝送制御方法及び装置 | |
CN114924751A (zh) | 一种业务访问请求流量分配的方法和装置 | |
CN107220375B (zh) | 数据读写方法和服务器 | |
JP5540269B2 (ja) | データ負荷分散配置システムおよびデータ負荷分散配置方法 | |
FI3596602T3 (fi) | Häiritsemätön tuki kolmannen osapuolen liikenneseurannalle | |
CN107409082B (zh) | 终端站装置以及带宽分配方法 | |
CN111372277B (zh) | 数据分发方法、装置及存储介质 | |
EP2942711B1 (en) | Dynamic generation of proxy connections | |
US10735521B1 (en) | IoT network controller / server | |
JP6972783B2 (ja) | 分散システム、バックエンドサービス、エッジサーバ、及びその方法 | |
KR20170005274A (ko) | 사용자 정의 클라우드 서비스 제공을 위한 자원 서비스 중개 제공장치 및 그 방법 | |
JP6330840B2 (ja) | ストレージ管理システムおよびストレージ管理方法 | |
US11469996B2 (en) | Systems for session-based routing | |
US9860171B2 (en) | Large scale message routing in a distributed network | |
US9942314B2 (en) | System and method for optimizing web service availability with a node group agreement protocol | |
CN110390516B (zh) | 用于数据处理的方法、装置和计算机存储介质 | |
CN111866175A (zh) | 边缘计算设备的组网,及其和后端服务器的通信方法 | |
US20140164608A1 (en) | Content transmission system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220214 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7035606 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |