WO2023199846A1

WO2023199846A1 - システム

Info

Publication number: WO2023199846A1
Application number: PCT/JP2023/014300
Authority: WO
Inventors: 和人須田; 裕子石若; 稔大和田; 智博吉田
Original assignee: ソフトバンク株式会社
Priority date: 2022-04-14
Filing date: 2023-04-06
Publication date: 2023-10-19
Also published as: JP7392027B2; JP2023157091A

Abstract

ネットワークに配置された、第１階層の第１階層エージェント及び前記第１階層よりも下位の第２階層の複数の第２階層エージェントを備え、前記複数の第２階層エージェントのそれぞれは、収集した情報を用いて、他の第２階層エージェントと協調して学習を実行し、学習結果を用いて生成した情報を前記第１階層エージェントに送信し、前記第１階層エージェントは、前記複数の第２階層エージェントから受信した情報を用いて学習を実行する、システムを提供する。

Description

システム

　本発明は、システムに関する。

　特許文献１には、マルチエージェントの強化学習について記載されている。
　［先行技術文献］
　［特許文献］
　［特許文献１］特開２００４－２２７２０８号公報

一般的開示

　本発明の第１の態様によれば、システムが提供される。前記システムは、ネットワークに配置された、第１階層の第１階層エージェント及び前記第１階層よりも下位の第２階層の複数の第２階層エージェントを備えてよい。前記複数の第２階層エージェントのそれぞれは、収集した情報を用いて、他の第２階層エージェントと協調して学習を実行し、学習結果を用いて生成した情報を前記第１階層エージェントに送信してよい。前記第１階層エージェントは、前記複数の第２階層エージェントから受信した情報を用いて学習を実行してよい。前記システムは、前記第２階層よりも下位の第３階層の複数の第３階層エージェントを更に備えてよい。前記複数の第３階層エージェントのそれぞれは、収集した情報を用いて、他の第３階層エージェントと協調して学習を実行し、学習結果を用いて生成した情報を前記複数の第２階層エージェントの少なくともいずれかに送信してよい。前記複数の第３階層エージェントのそれぞれは、情報を収集する第３情報収集部と、前記第３情報収集部によって収集された情報を用いて、他の複数の第３階層エージェントと協調して学習を実行する第３学習実行部と、前記第３学習実行部による学習結果を用いて生成した情報を前記複数の第２階層エージェントの少なくともいずれかに送信する第３情報送信部とを有してよい。前記複数の第２階層エージェントのそれぞれは、複数の前記第３階層エージェントから情報を収集する第２情報収集部と、前記第２情報収集部によって収集された情報を用いて、他の複数の第２階層エージェントと協調して学習を実行する第２学習実行部と、前記第２学習実行部による学習結果を用いて生成した情報を前記第１階層エージェントに送信する第２情報送信部とを有してよい。前記第１階層エージェントは、複数の前記第２階層エージェントから情報を収集する第１情報収集部と、前記第１情報収集部によって収集された情報を用いて学習を実行する第１学習実行部とを有してよい。前記第１階層エージェントは、階層型ネットワークの第１ＮＷ階層に配置されてよく、前記複数の第２階層エージェントは、前記階層型ネットワークの前記第１ＮＷ階層よりも下位の第２ＮＷ階層に配置されてよく、前記複数の第３階層エージェントは、前記階層型ネットワークの前記第２ＮＷ階層よりも下位の第３ＮＷ階層に配置されてよい。前記階層型ネットワークは、クラウドネットワークであってよく、前記第１ＮＷ階層は、クラウドコンピューティングにより構成されてよく、前記第２ＮＷ階層は、複数のフォグコンピューティングにより構成されてよく、前記第３ＮＷ階層は、複数のエッジコンピューティングにより構成されてよい。前記階層型ネットワークは、クラウドネットワークであってよく、前記第１ＮＷ階層は、クラウドコンピューティングにより構成されてよく、前記第２ＮＷ階層は、複数のフォグコンピューティングにより構成されてよく、前記第３ＮＷ階層は、複数のエッジコンピューティングにより構成されてよく、前記第３情報収集部は、複数のＩｏＴ（Ｉｎｔｅｒｎｅｔ　ｏｆ　Ｔｈｉｎｇ）デバイスから移動体通信によって情報を収集してよく、前記第３情報送信部は、前記第３学習実行部による学習結果を用いて、前記第３情報収集部が収集した情報から選択した情報、又は、前記学習結果を用いて生成した情報を前記複数の第２階層エージェントの少なくともいずれかに送信してよく、前記第２情報収集部は、前記第３情報送信部によって送信された情報を収集してよく、前記第２情報送信部は、前記第２学習実行部による学習結果を用いて、前記第２情報収集部が収集した情報から選択した情報、又は、前記学習結果を用いて生成した情報を前記第１階層エージェントに送信してよい。

　前記システムにおいて、前記複数の第３階層エージェントのそれぞれは、前記第３学習実行部による学習結果を用いて、前記第３情報収集部が収集した情報に対して処理を実行する第３処理実行部を有してよい。前記第３処理実行部は、前記第３情報収集部が収集した複数の情報を用いて、前記複数の第２階層エージェントの少なくともいずれかに送信する情報を生成してよい。前記第３処理実行部は、前記第３学習実行部による学習結果を用いて、前記第３情報収集部が収集した複数の情報から選択した情報を含む送信情報を生成してよい。前記第３処理実行部は、前記第３学習実行部による学習結果を用いて、前記第３情報収集部が収集した複数の情報をまとめたサマリ情報を生成してよい。前記第３情報送信部は、前記第３処理実行部によって生成された情報を前記複数の第２階層エージェントの少なくともいずれかに送信してよい。前記システムにおいて、前記複数の第２階層エージェントのそれぞれは、前記第２学習実行部による学習結果を用いて、前記第２情報収集部が収集した情報に対して処理を実行する第２処理実行部を有してよい。前記第２処理実行部は、前記第２情報収集部が収集した複数の情報を用いて、前記第１階層エージェントに送信する情報を生成してよい。前記第２処理実行部は、前記第２学習実行部による学習結果を用いて、前記第２情報収集部が収集した複数の情報から選択した情報を含む送信情報を生成してよい。前記第２処理実行部は、前記第２学習実行部による学習結果を用いて、前記第２情報収集部が収集した複数の情報をまとめたサマリ情報を生成してよい。前記第２情報送信部は、前記第２処理実行部によって生成された情報を前記第１階層エージェントに送信してよい。前記システムにおいて、前記第１階層エージェントは、前記第１学習実行部による学習結果を用いて、前記第１情報収集部が収集した情報に対して処理を実行する第１処理実行部を有してよい。前記第１処理実行部は、前記第１学習実行部による学習結果を用いて、前記システムが適用されたネットワークの全体を安定させることを目的とした処理を実行してよい。前記第１処理実行部は、前記第１情報収集部が収集した情報を解析した結果に基づいて、前記複数の第２階層エージェントの少なくともいずれか、又は前記複数の第３階層エージェントの少なくともいずれかに対する指示情報を生成してもよい。前記第１処理実行部は、前記複数の第３階層エージェントの少なくともいずれかに対して、ＩｏＴデバイスから収集した情報のうちの前記複数の第２階層エージェントの少なくともいずれかに送信する情報を指示する指示情報を生成してよい。前記第１処理実行部は、前記複数の第２階層エージェントの少なくともいずれかに対して、前記複数の第２階層エージェントの少なくともいずれかから収集した情報の処理内容を指示する指示情報を生成してよい。前記第１処理実行部は、前記第１情報収集部が収集した情報を解析した結果に基づいて、前記複数の第３階層エージェントの少なくともいずれかに送信する学習用情報を生成してもよい。前記第１処理実行部は、前記第１情報収集部が収集した情報を解析した結果に基づいて、前記複数の第２階層エージェントの少なくともいずれかに送信する学習用情報を生成してもよい。前記第１処理実行部は、前記第１情報収集部が収集した情報の傾向の変化に合わせて設定した報酬を含む学習用情報を生成してよい。

　前記システムが、複数のＩｏＴデバイスによって送信される情報の解析を一つの目的としている場合、前記複数の第３階層エージェントは、よりリアルタイム性を求められる解析を実行し、前記第１階層エージェントは、ある程度長い期間の傾向を解析し、前記複数の第２階層エージェントは、その間に相当する解析を実行してよい。前記システムが、ある地域における事故の発生状況を管理することを目的とした場合に、前記複数の第３階層エージェントが、当該地域に配置された複数のＩｏＴデバイスから画像データ及び物体検知データを収集し、地理的に近接するサブエリアを担当する複数の第３階層エージェントが、情報を共有しながら、事故の発生を検出するための学習を実行し、第３階層エージェントは、学習結果を用いて、事故の発生を検出し、複数の第２階層エージェントが、サブエリアのグループに対して割り当てられ、グループのサブエリアのＩｏＴデバイスから情報を収集する第３階層エージェントから情報を収集し、複数の第２階層エージェントは、互いに協調することによって、事故の発生を予測するための学習を実行し、第２階層エージェントは、学習結果を用いて事故の発生を予測し、第１階層エージェントは、複数の第２階層エージェントによる予測結果によって、全体的な情報の制御を行うための学習を実行してよい。第１階層エージェントは、事故の発生が予測されるサブエリアについて、収集する情報量を増やしたり、情報の種類を増やしたりし、それ以外のサブエリアについて、収集する情報量を減らしたり、情報の種類を減らしたりする制御を行ってよい。

　例えば、前記システムが、クラウドネットワークにおける、ＩｏＴデバイスによって取得された情報を通知するメッセージのルーティングを円滑に実施することを一つの目的としている場合、前記第３階層エージェントは、メッセージのルーティングを実施してよい。前記第３階層エージェントは、他の前記第３階層エージェントと協調して、パブリッシャーからのメッセージについて、Ｔｏｐｉｃ、Ｔｏ（Ｃｏｐｙを含む）、及び分割を制御するような学習を実行してよい。前記第３階層エージェントは、学習結果を用いて、他の前記第３階層エージェントと協調して、パブリッシャーからのメッセージが、適切なサブスクライバーに到達するようにＴｏｐｉｃの生成、Ｔｏの決定、メッセージの複製、メッセージの分割などを制御してよい。前記第２階層エージェントは、例えば、前記第３階層エージェントから収集する情報によって、前記第３階層エージェントによるルーティングを監視し、ルーティングに発生した問題を解消する処理を実行できるような学習を実行してよい。前記第２階層エージェントは、宛先不明の同じＴｏのメッセージが存在する場合に、メッセージをバッファリングし、バッファリングの量が閾値を超えた場合に、バッファリングしているメッセージの一部をネットワークに放ち、その結果、再度戻ってきた場合には、届くようになるまでか、一定時間、バッファリングをし、メッセージが届き始めたら、バッファリングしているメッセージのうち、同じＴｏのメッセージについて送信を開始してよい。前記第１階層エージェントは、前記第２階層エージェントから収集する情報によって、ネットワークにおける問題点を検出するための学習を実行してよい。前記第１階層エージェントは、学習結果を用いて、ネットワークの問題点を検出した場合に、検出結果をネットワークのオペレータに通知したり、ネットワークの構成を変更する指示を出力したりしてよい。

　例えば、前記システムが、自動運転に関する制御を実施することを一つの目的としている場合、複数の第３階層エージェントのそれぞれは、複数に区切られた地域毎に、その地域内に位置する車両に搭載されたＩｏＴデバイス、信号機等に搭載されたＩｏＴデバイス、及び道路等に設置されたＩｏＴデバイスから、情報を収集してよい。前記第３階層エージェントは、車両の位置情報、車両のカメラや、街頭のカメラによって撮像された画像、道路のセンサによって検知された車両検知情報や人検知情報、車両のセンサ等によって検知された車両間距離、地域における天候情報、車両のナビゲーション情報、及び車両の走行速度の少なくともいずれかを収集してよい。前記第３階層エージェントは、あるエリアを担当することになり、ある車両が当該エリアに入ったときから、当該車両に搭載されているＩｏＴデバイスからの情報を収集し、当該車両が当該エリアを出るときに、当該車両が入るエリアを担当する前記第３階層エージェントに、情報の収集を引き継いでよい。前記第３階層下位エージェントは、他の前記第３階層エージェントと情報を共有して、車間距離が閾値より短くなっていることや、車両が人等と衝突するような危険の検知を実行してよい。前記第３階層エージェントは、危険を検知した場合に、対象となる車両に対して、危険検知情報を送信してよい。前記第２階層エージェントは、前記第３階層エージェントに、何の情報を通信するかを指示してよい。前記第２階層エージェントは、過去に前記第３階層エージェントから収集した情報（曜日、時間等）に基づいて、重要情報（人が多い、車が多い等）を分析（学習）し、収集の優先度が高い情報を判定可能にしてよい。前記第２階層エージェントは、期間毎に、優先度の高い情報を収集できるように、前記第３階層エージェントに指示を出してよい。前記第２階層エージェントは、他の前記第２階層エージェントと協調して学習することによって、優先度の高い情報を高い精度で特定可能になってよい。前記第２階層エージェントは、学習の結果、平日の朝は、車検知結果の優先度を高くして情報が収集できるように指示し、休日の昼は、人検知結果の優先度を高くして情報が収集できるように指示するようになってよい。前記第１階層エージェントは、より広い範囲の解析を実行してよい。前記第１階層エージェントは、担当エリア（市、県、国単位の交通情報（交通量、時刻、曜日、イベント、天候）から、数ステップ先の（設定した時刻の）予測を実行し、前記第２階層エージェントに情報を提供してよい。

　なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

自律分散システムの適用対象であるネットワーク１００の一例を概略的に示す。ネットワーク１００の一例であるクラウドネットワーク３００の一例を概略的に示す。自律分散システム２００の一例を概略的に示す。下位エージェント２３０の機能構成の一例を概略的に示す。中間エージェント２２０の機能構成の一例を概略的に示す。上位エージェント２１０の機能構成の一例を概略的に示す。自律分散システム２００の他の一例を概略的に示す。上位エージェント２１０、中間エージェント２２０、又は下位エージェント２３０を実装するコンピュータ１２００のハードウェア構成の一例を概略的に示す。

　マルチエージェントシステムの一つである自律分散システムが知られている。自律分散システムでは、複数のエージェントのそれぞれが、独自に自律的に学習し、協調行動を獲得することを目的としている。各エージェントが全く同じ状態（構造やパラメータ）をｈｏｍｏｇｅｎｉｏｕｓといい、ｈｏｍｏｇｅｎｉｏｕｓから、それぞれ異なる状態（Ｈｅｔｅｒｏｇｅｎｉｏｕｓ）になることを機能分化という。自律分散システムの適用例として、Ｔａｒｇｅｔと複数のＨｕｎｔｅｒが存在し、複数のＨｕｎｔｅｒがＴａｒｇｅｔの捕まえ方を学習する、すなわち、複数のＨｕｎｔｅｒエージェントが、自身の役割をそれぞれ学習し、協調してＴａｒｇｅｔを捕まえる追跡問題のような例がある。自律分散システムでは、同じ性能のエージェント群（ｈｏｍｏ）が、学習をすることで機能分化し、それぞれが役割を持つようになる（ｈｅｔｅｒｏ）。例えば、追跡問題では、まっすぐに追いかけるエージェントと、回り込むエージェントに分かれてくる。このような技術を用いることによって、例えば、同じアルゴリズムで、自律的に、環境に適応した学習を行ったり、マルチエージェントで、自律的に分散して学習したりすることができる。本実施形態では、自律分散システムを、ネットワークに適用する。

　以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

　図１は、自律分散システムの適用対象である通信ネットワーク１００の一例を概略的に示す。通信ネットワーク１００は、階層型のネットワークである。通信ネットワーク１００は、上位コンピューティング１１０と、複数の中間コンピューティング１２０と、複数の下位コンピューティング１３０とによって構成される。

　上位コンピューティング１１０によって、第１ＮＷ（ＮｅｔＷｏｒｋ）階層が構成され、複数の中間コンピューティング１２０によって、第１ＮＷ階層よりも下位の第２ＮＷ階層が構成され、複数の下位コンピューティング１３０によって、第２ＮＷ階層よりも下位の第３ＮＷ階層が構成される。

　自律分散システムの適用対象である通信ネットワーク１００は、階層構造を備えていればどのような通信ネットワークであってもよい。例えば、通信ネットワーク１００は、クラウドネットワークである。

　図２は、通信ネットワーク１００の一例であるクラウドネットワーク３００の一例を概略的に示す。クラウドネットワーク３００は、クラウドコンピューティング３１０と、複数のフォグコンピューティング３２０と、複数のエッジコンピューティング３３０とによって構成される。

　クラウドコンピューティング３１０は、上位コンピューティング１１０の一例であってよい。フォグコンピューティング３２０は、中間コンピューティング１２０の一例であってよい。エッジコンピューティング３３０は、下位コンピューティング１３０の一例であってよい。

　クラウドネットワーク３００において、第１ＮＷ階層は、クラウドコンピューティング３１０によって構成され、第２ＮＷ階層は、複数のフォグコンピューティング３２０によって構成され、第３ＮＷ階層は、複数のエッジコンピューティング３３０によって構成される。

　複数のエッジコンピューティング３３０のそれぞれは、移動通信システムを介して、１又は複数のＩｏＴデバイス４００と通信する。複数のＩｏＴデバイス４００のそれぞれは、無線基地局及びＷｉ－Ｆｉ（登録商標）アクセスポイント等を介して、複数のエッジコンピューティング３３０の少なくともいずれかに対して情報を送信してよい。

　ＩｏＴデバイス４００は、何らかの情報を取得して送信可能であれば、どのようなデバイスであってもよい。ＩｏＴデバイス４００は、例えば、各種センサを備える。ＩｏＴデバイス４００が送信する情報の例として、画像データ（静止画像、動画像）、音データ、赤外線データ、位置データ、物体検知データ、距離データ、天候データ、温度データ、及び湿度データ等が挙げられるが、ほんの一例であり、どのような情報であってもよい。

　当該移動通信システムは、例えば、５Ｇ（５ｔｈ　Ｇｅｎｅｒａｔｉｏｎ）通信システムである。当該移動通信システムは、ＬＴＥ（Ｌｏｎｇ　Ｔｅｒｍ　Ｅｖｏｌｕｔｉｏｎ）通信システムであってもよい。当該移動通信システムは、３Ｇ（３ｒｄ　Ｇｅｎｅｒａｔｉｏｎ）通信システムであってもよい。当該移動通信システムは、６Ｇ（６ｔｈ　Ｇｅｎｅｒａｔｉｏｎ）通信システム以降の移動通信システムであってもよい。

　図３は、自律分散システム２００の一例を概略的に示す。自律分散システム２００は、階層構造を有する複数のエージェントによって構成される。図３に示す例において、自律分散システム２００は、上位エージェント２１０、複数の中間エージェント２２０、及び複数の下位エージェント２３０を備える。

　自律分散システム２００は、通信ネットワーク１００に適用される。例えば、上位エージェント２１０が、上位コンピューティング１１０に配置され、複数の中間エージェント２２０のそれぞれが、複数の中間コンピューティング１２０のそれぞれに配置され、複数の下位エージェント２３０のそれぞれが、複数の下位コンピューティング１３０のそれぞれに配置される。１つの中間コンピューティング１２０に対して複数の中間エージェント２２０が配置されてもよい。１つの下位コンピューティング１３０に複数の下位エージェント２３０が配置されてもよい。

　図２では、自律分散システム２００が３階層によって構成される場合を例示しているが、これに限らない。自律分散システム２００は、２階層であってもよく、４階層以上であってもよい。自律分散システム２００が２階層である場合、自律分散システム２００は、上位エージェント２１０と、複数の下位エージェント２３０とを備えてよい。この例において、上位エージェント２１０は、第１階層の第１階層エージェントの例であってよく、下位エージェント２３０は、第２階層の複数の第２階層エージェントの一例であってよい。この場合、例えば、上位エージェント２１０が上位コンピューティング１１０に配置され、複数の下位エージェント２３０のそれぞれが、複数の下位コンピューティング１３０のそれぞれに配置される。また、例えば、上位エージェント２１０が、複数の中間コンピューティング１２０のいずれかに配置され、複数の下位エージェント２３０が、複数の下位コンピューティング１３０のそれぞれに配置される。なお、この場合、通信ネットワーク１００は、複数の中間コンピューティング１２０を備えずに、２階層により構成されてもよい。

　自律分散システム２００は、例えば、クラウドネットワーク３００に適用される。例えば、上位エージェント２１０が、クラウドコンピューティング３１０に配置され、複数の中間エージェント２２０のそれぞれが、複数のフォグコンピューティング３２０のそれぞれに配置され、複数の下位エージェント２３０のそれぞれが、複数のエッジコンピューティング３３０のそれぞれに配置される。１つのフォグコンピューティング３２０に対して複数の中間エージェント２２０が配置されてもよい。１つのエッジコンピューティング３３０に複数の下位エージェント２３０が配置されてもよい。

　自律分散システム２００が２階層である場合、例えば、上位エージェント２１０がクラウドコンピューティング３１０に配置され、複数の下位エージェント２３０のそれぞれが、複数のエッジコンピューティング３３０のそれぞれに配置される。また、例えば、上位エージェント２１０が、複数のフォグコンピューティング３２０のいずれかに配置され、複数の下位エージェント２３０が、複数のエッジコンピューティング３３０のそれぞれに配置される。なお、この場合、クラウドネットワーク３００は、複数のフォグコンピューティング３２０を備えずに、２階層により構成されてもよい。

　下位エージェント２３０は、情報を収集する。下位エージェント２３０は、例えば、ＩｏＴデバイス４００によって送信された情報を収集する。下位エージェント２３０は、ＩｏＴデバイス４００から移動体通信によって情報を収集してよい。下位エージェント２３０は、ＩｏＴデバイス４００以外の任意のデバイスによって送信された情報を収集してもよい。下位エージェント２３０は、ＩｏＴデバイス４００以外の任意のデバイスから移動体通信によって情報を収集してよい。

　下位エージェント２３０は、収集した情報を用いて、他の下位エージェント２３０と協調して学習を実行する。下位エージェント２３０は、予め登録された報酬に従って、学習を実行してよい。下位エージェント２３０は、予め登録された知識に従って、学習を実行してよい。下位エージェント２３０は、学習結果を用いて各種処理を実行してよい。例えば、下位エージェント２３０は、学習結果を用いて、収集した複数の情報のうち、中間エージェント２２０に送信する情報を選択して、中間エージェント２２０に送信する。例えば、下位エージェント２３０は、学習結果を用いて、収集した複数の情報をまとめたサマリ情報を生成して、中間エージェント２２０に送信する。

　例えば、複数のＩｏＴデバイス４００によって送信される多量の情報のうち、有用な情報のみを上位階層に送信することを目的とした場合に、下位エージェント２３０がＩｏＴデバイス４００から収集して中間エージェント２２０又は上位エージェント２１０に送信する情報の有用度が、報酬として登録される。複数の下位エージェント２３０のそれぞれは、他の下位エージェント２３０と協調しながら、それぞれ自律的に報酬を最大化するように学習を進める。複数の下位エージェント２３０は、異なる１又は複数のＩｏＴデバイス４００から情報を収集しており、それぞれ異なる基準で、収集情報から上位階層に送信する情報を選択したり、収集情報から上位階層に送信するサマリ情報を生成したりするようになり、全体的に有用度の高い情報のみが上位階層に伝わるようにシステムが構築され得る。

　下位エージェント２３０は、比較的リアルタイム性の高い処理を実行してよい。例えば、下位エージェント２３０は、１分及び３分等の予め定められた時間毎に、１又は複数のＩｏＴデバイス４００から収集する情報に対して、学習結果を用いて、選択処理を行ったり、サマリ情報の生成処理を行ったりして、情報を上位階層に送信する。これにより、上位階層に送信する情報をリアルタイムに調整することが可能となる。例えば、昼間は画像が、夜は赤外線データが多い情報を扱うエッジコンピューティング３３０に配置された複数の下位エージェント２３０の場合、多くの下位エージェント２３０が、昼は画像を担当し、夜は赤外線データを担当するようになる。このように、下位エージェント２３０は動的に環境に適応することが可能であるため、例えば、収集対象のＩｏＴデバイス４００を変更したり、収集対象のＩｏＴデバイス４００が収集する情報の種類が変わったりした場合であっても、適応可能である。このように、下位エージェント２３０は、処理をリアルタイムに実行してよいが、時間遅れで統計情報を送信したり、サマリ情報を送信したりしてもよい。下位エージェント２３０は、意図的にディレイを入れることが可能であってもよい。

　中間エージェント２２０は、情報を収集する。中間エージェント２２０は、下位エージェント２３０から情報を収集してよい。中間エージェント２２０は、例えば、下位エージェント２３０がＩｏＴデバイス４００から収集した情報を、下位エージェント２３０から収集する。中間エージェント２２０は、例えば、下位エージェント２３０がＩｏＴデバイス４００から収集した複数の情報のうち、下位エージェント２３０によって選択された情報を下位エージェント２３０から収集する。中間エージェント２２０は、例えば、下位エージェント２３０がＩｏＴデバイス４００から収集した複数の情報をまとめたサマリ情報を、下位エージェント２３０から収集する。

　中間エージェント２２０は、収集した情報を用いて、他の中間エージェント２２０と協調して学習を実行する。中間エージェント２２０は、学習結果を用いて各種処理を実行してよい。例えば、中間エージェント２２０は、学習結果を用いて、収集した複数の情報のうち、中間エージェント２２０に送信する情報を選択して、上位エージェント２１０に送信する。例えば、中間エージェント２２０は、学習結果を用いて、収集した複数の情報をまとめたサマリ情報を生成して、上位エージェント２１０に送信する。

　中間エージェント２２０は、下位エージェント２３０と比較してリアルタイム性の低い処理を実行してよい。例えば、中間エージェント２２０は、１時間及び１日等の予め定められた期間毎に、１又は複数の下位エージェント２３０から収集する情報を用いた処理を実行する。中間エージェント２２０は、例えば、予め定められた期間の情報を用いた学習を実行する。中間エージェント２２０は、他の中間エージェント２２０と協調して、複数の下位エージェント２３０から上位階層に送信される情報の量を調整したり、複数の中間エージェント２２０から上位エージェント２１０に対して送信する情報の量を調整したりしてもよい。中間エージェント２２０は、自律分散システム２００におけるロバスト性を担保するような学習や処理を実行してもよい。中間エージェント２２０は、自律分散システム２００におけるＳｐｉｎａｌ　Ｃｏｒｄの役割を担ってもよい。中間エージェント２２０は、下位エージェント２３０から情報を受信した場合に、上位エージェント２１０に対して当該情報や当該情報に基づいて生成した情報を送信するか、下位エージェント２３０に対して応答したり指示を送信したりするかを判定してもよい。

　上位エージェント２１０は、情報を収集する。上位エージェント２１０は、中間エージェント２２０から情報を収集してよい。上位エージェント２１０は、例えば、中間エージェント２２０から下位エージェント２３０から収集した情報を、下位エージェント２３０から収集する。上位エージェント２１０は、例えば、中間エージェント２２０が下位エージェント２３０から収集した複数の情報のうち、中間エージェント２２０によって選択された情報を中間エージェント２２０から収集する。上位エージェント２１０は、例えば、中間エージェント２２０が下位エージェント２３０から収集した複数の情報をまとめたサマリ情報を、中間エージェント２２０から収集する。上位エージェント２１０は、下位エージェント２３０から情報を収集してもよい。

　上位エージェント２１０は、収集した情報を用いた処理を実行する。上位エージェント２１０は、例えば、収集した情報を用いた学習を実行する。上位エージェント２１０は、例えば、学習結果を用いて各種処理を実行する。

　上位エージェント２１０は、中間エージェント２２０と比較してリアルタイム性の低い処理を実行してよい。例えば、上位エージェント２１０は、１週間、１カ月、及び１年等の予め定められた期間毎に、収集した情報を用いた処理を実行する。上位エージェント２１０は、例えば、予め定められた期間の情報を用いた学習を実行する。

　上位エージェント２１０は、自律分散システム２００の全体を安定させることを目的とした処理を実行してもよい。例えば、上位エージェント２１０は、収集した情報に基づいて、通信ネットワーク１００やクラウドネットワーク３００の全体の通信負荷の要因分析等を実行してよい。上位エージェント２１０は、収集した情報の内容や、情報の収集状況によって、ネットワークにおける通信負荷が高まっている位置を特定して、通信負荷を低減するように、例えば、ＩｏＴデバイス４００、下位エージェント２３０、中間エージェント２２０によって送信される情報の量を調整したり、伝搬経路を調整したりしてよい。

　いわゆるクラウドネットワークにおいて取り扱われる情報の量は非常に増加している。今後、５Ｇ移動通信システムの普及がより進み、ＩｏＴデバイスの数が増加することによって、情報量はさらに増加することが想定される。このような情報量の増加に対して、ネットワークの通信機能の向上や、ネットワーク機器の性能の向上が、常套手段としての対応策となるが、それのみでは対応しきれない可能性がある。それに対して、本実施形態に係る自律分散システム２００をネットワークに適用することによって、処理を階層化することができる。自律分散システム２００によれば、例えば、下位エージェント２３０によってリアルタイム性の高い処理を実行しつつ、有用な情報に絞って上位階層に伝達し、中間エージェント２２０によって、厳選された情報を用いた、もう少し広いスパンの情報処理を行いつつ、情報をさらに絞り、上位エージェント２１０において、更に厳選された情報を用いた、更に広いスパンの情報処理を行ったり、ネットワーク全体の安定化が図られたりするので、大量の情報を適切に取り扱える環境の構築に貢献することができる。

　図４は、下位エージェント２３０の機能構成の一例を概略的に示す。下位エージェント２３０は、記憶部２３１、登録部２３２、情報収集部２３３、学習実行部２３４、処理実行部２３５、及び情報送信部２３６を備える。

　登録部２３２は、各種登録を実行する。登録部２３２は、例えば、下位エージェント２３０が学習に用いる学習用情報を登録する。登録部２３２は、登録した学習用情報を記憶部２３１に記憶する。学習用情報は、報酬を含んでよい。学習用情報は、知識を含んでよい。登録部２３２は、例えば、自律分散システム２００のオペレータ等による入力を受け付けることによって、学習用情報を登録する。登録部２３２は、例えば、上位エージェント２１０から受信した学習用情報を登録する。登録部２３２は、例えば、中間エージェント２２０から受信した学習用情報を登録する。登録部２３２は、第３登録部の一例であってよい。

　情報収集部２３３は、情報を収集する。情報収集部２３３は、任意のデバイスによって送信された情報を収集してよい。情報収集部２３３は、例えば、ＩｏＴデバイス４００によって送信された情報を収集する。情報収集部２３３は、ＩｏＴデバイス４００から移動体通信によって情報を収集してよい。情報収集部２３３は、収集した情報を記憶部２３１に記憶する。情報収集部２３３は、第３情報収集部の一例であってよい。

　学習実行部２３４は、情報収集部２３３が収集した情報を用いて、学習を実行する。学習実行部２３４は、情報収集部２３３が収集した情報を用いて、他の下位エージェント２３０と協調して学習を実行してよい。

　学習実行部２３４は、学習結果を記憶部２３１に記憶する。学習結果は、学習実行部２３４が学習によって生成したモデルを含んでよい。学習結果は、学習実行部２３４が学習によって生成したニューラルネットワークを含んでよい。学習実行部２３４は、第３学習実行部の一例であってよい。

　学習実行部２３４は、任意の学習方法を用いてよい。例えば、学習実行部２３４は、まず、シミュレーションによる事前学習（Ｐｒｅ－ｔｒａｉｎｉｎｇ）を実行し、情報収集部２３３が収集する情報によって、モデル及びニューラルネットワーク等を更新する。事前学習には、過去に情報収集部２３３が収集した実データを用いてよい。事前学習には、シンセティックデータを用いてもよい。学習にトライアンドエラーが許されない環境である場合、強化学習ではなく、ルールベースで学習を行い、そのパラメータのみを学習する方法が有効である。学習方法は、ＡＮＮ（Ａｒｔｉｆｉｃｉａｌ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）、ＤＮＮ（Ｄｅｅｐ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）、ヒューリスティクス等であってもよい。

　処理実行部２３５は、各種処理を実行する。処理実行部２３５は、学習実行部２３４による学習結果を用いて、情報収集部２３３が収集した情報に対して処理を実行してよい。処理実行部２３５は、情報収集部２３３が収集した複数の情報を用いて、中間エージェント２２０に送信する情報を生成してよい。

　例えば、処理実行部２３５は、学習実行部２３４による学習結果を用いて、情報収集部２３３が収集した複数の情報から選択した情報を含む送信情報を生成する。例えば、処理実行部２３５は、学習実行部２３４による学習結果を用いて、情報収集部２３３が収集した複数の情報をまとめたサマリ情報を生成する。処理実行部２３５は、第３処理実行部の一例であってよい。

　情報送信部２３６は、情報を送信する。例えば、情報送信部２３６は、情報収集部２３３によって収集された情報を中間エージェント２２０に送信する。例えば、情報送信部２３６は、処理実行部２３５によって生成された情報を中間エージェント２２０に送信する。情報送信部２３６は、第３情報送信部の一例であってよい。

　図５は、中間エージェント２２０の機能構成の一例を概略的に示す。中間エージェント２２０は、記憶部２２１、登録部２２２、情報収集部２２３、学習実行部２２４、処理実行部２２５、及び情報送信部２２６を備える。

　登録部２２２は、各種登録を実行する。登録部２２２は、例えば、中間エージェント２２０が学習に用いる学習用情報を登録する。登録部２２２は、登録した学習用情報を記憶部２２１に記憶する。学習用情報は、報酬を含んでよい。学習用情報は、知識を含んでよい。登録部２２２は、例えば、自律分散システム２００のオペレータ等による入力を受け付けることによって、学習用情報を登録する。登録部２２２は、例えば、上位エージェント２１０から受信した学習用情報を登録する。登録部２２２は、第２登録部の一例であってよい。

　情報収集部２２３は、情報を収集する。情報収集部２２３は、下位エージェント２３０から情報を収集してよい。情報収集部２２３は、例えば、下位エージェント２３０の情報送信部２３６が送信した情報を収集する。情報収集部２２３は、収集した情報を記憶部２２１に記憶する。情報収集部２２３は、第２情報収集部の一例であってよい。

　学習実行部２２４は、情報収集部２２３が収集した情報を用いて、学習を実行する。学習実行部２２４は、情報収集部２２３が収集した情報を用いて、他の中間エージェント２２０と協調して学習を実行してよい。

　学習実行部２２４は、学習結果を記憶部２２１に記憶する。学習結果は、学習実行部２２４が学習によって生成したモデルを含んでよい。学習結果は、学習実行部２２４が学習によって生成したニューラルネットワークを含んでよい。学習実行部２２４は、第２学習実行部の一例であってよい。

　学習実行部２２４は、任意の学習方法を用いてよい。例えば、学習実行部２２４は、まず、シミュレーションによる事前学習を実行し、情報収集部２２３が収集する情報によって、モデル及びニューラルネットワーク等を更新する。事前学習には、過去に情報収集部２２３が収集した実データを用いてよい。事前学習には、シンセティックデータを用いてもよい。学習にトライアンドエラーが許されない環境である場合、強化学習ではなく、ルールベースで学習を行い、そのパラメータのみを学習する方法が有効である。学習方法は、ＡＮＮ、ＤＮＮ、ヒューリスティクス等であってもよい。

　処理実行部２２５は、各種処理を実行する。処理実行部２２５は、学習実行部２２４による学習結果を用いて、情報収集部２２３が収集した情報に対して処理を実行してよい。処理実行部２２５は、情報収集部２２３が収集した複数の情報を用いて、上位エージェント２１０に送信する情報を生成してよい。

　例えば、処理実行部２２５は、学習実行部２２４による学習結果を用いて、情報収集部２２３が収集した複数の情報から選択した情報を含む送信情報を生成する。例えば、処理実行部２２５は、学習実行部２２４による学習結果を用いて、情報収集部２２３が収集した複数の情報をまとめたサマリ情報を生成する。処理実行部２２５は、第２処理実行部の一例であってよい。

　情報送信部２２６は、情報を送信する。例えば、情報送信部２２６は、情報収集部２２３によって収集された情報を上位エージェント２１０に送信する。例えば、情報送信部２２６は、処理実行部２２５によって生成された情報を上位エージェント２１０に送信する。情報送信部２２６は、第２情報送信部の一例であってよい。

　図６は、上位エージェント２１０の機能構成の一例を概略的に示す。上位エージェント２１０は、記憶部２１１、登録部２１２、情報収集部２１３、学習実行部２１４、処理実行部２１５、及び情報送信部２１６を備える。

　登録部２１２は、各種登録を実行する。登録部２１２は、例えば、上位エージェント２１０が学習に用いる学習用情報を登録する。登録部２１２は、登録した学習用情報を記憶部２１１に記憶する。学習用情報は、報酬を含んでよい。学習用情報は、知識を含んでよい。登録部２１２は、例えば、自律分散システム２００のオペレータ等による入力を受け付けることによって、学習用情報を登録する。登録部２１２は、第１登録部の一例であってよい。

　情報収集部２１３は、情報を収集する。情報収集部２１３は、中間エージェント２２０から情報を収集してよい。情報収集部２１３は、例えば、中間エージェント２２０の情報送信部２２６が送信した情報を収集する。情報収集部２１３は、収集した情報を記憶部２１１に記憶する。情報収集部２１３は、第１情報収集部の一例であってよい。

　学習実行部２１４は、情報収集部２１３が収集した情報を用いて、学習を実行する。学習実行部２１４は、第１学習実行部の一例であってよい。学習実行部２１４は、情報収集部２１３が収集した情報を用いて、複数の中間エージェント２２０と協調して学習を実行してもよい。学習実行部２１４は、情報収集部２１３が収集した情報を用いて、複数の下位エージェント２３０と協調して学習を実行してもよい。学習実行部２１４は、情報収集部２１３が収集した情報を用いて、複数の中間エージェント２２０及び複数の下位エージェント２３０と協調して学習を実行してもよい。

　学習実行部２１４は、学習結果を記憶部２１１に記憶する。学習結果は、学習実行部２１４が学習によって生成したモデルを含んでよい。学習結果は、学習実行部２１４が学習によって生成したニューラルネットワークを含んでよい。学習実行部２１４は、第１学習実行部の一例であってよい。

　学習実行部２１４は、任意の学習方法を用いてよい。例えば、学習実行部２１４は、まず、シミュレーションによる事前学習を実行し、情報収集部２１３が収集する情報によって、モデル及びニューラルネットワーク等を更新する。事前学習には、過去に情報収集部２１３が収集した実データを用いてよい。事前学習には、シンセティックデータを用いてもよい。学習にトライアンドエラーが許されない環境である場合、強化学習ではなく、ルールベースで学習を行い、そのパラメータのみを学習する方法が有効である。学習方法は、ＡＮＮ、ＤＮＮ、ヒューリスティクス等であってもよい。

　処理実行部２１５は、各種処理を実行する。処理実行部２１５は、第１処理実行部の一例であってよい。処理実行部２１５は、学習実行部２１４による学習結果を用いて、情報収集部２１３が収集した情報に対して処理を実行してよい。処理実行部２１５は、学習実行部２１４による学習結果を用いて、自律分散システム２００が適用されたネットワークの全体を安定させることを目的とした処理を実行してよい。

　処理実行部２１５は、情報収集部２１３が収集した情報を解析した結果に基づいて、中間エージェント２２０又は下位エージェント２３０に対する指示情報を生成してもよい。処理実行部２１５は、例えば、下位エージェント２３０に対して、ＩｏＴデバイス４００から収集した情報のうちの中間エージェント２２０に送信する情報を指示する指示情報を生成する。処理実行部２１５は、例えば、中間エージェント２２０に対して、中間エージェント２２０から収集した情報の処理内容を指示する指示情報を生成する。

　処理実行部２１５は、情報収集部２１３が収集した情報を解析した結果に基づいて、下位エージェント２３０に送信する学習用情報を生成してもよい。処理実行部２１５は、情報収集部２１３が収集した情報を解析した結果に基づいて、中間エージェント２２０に送信する学習用情報を生成してもよい。例えば処理実行部２１５は、情報収集部２１３が収集した情報の傾向の変化に合わせて設定した報酬を含む学習用情報を生成する。

　情報送信部２１６は、情報を送信する。例えば、情報送信部２１６は、処理実行部２１５によって生成された指示情報を下位エージェント２３０に送信する。例えば、情報送信部２１６は、処理実行部２１５によって生成された指示情報を中間エージェント２２０に送信する。

　例えば、情報送信部２１６は、処理実行部２１５によって生成された学習用情報を下位エージェント２３０に送信する。例えば、情報送信部２１６は、処理実行部２１５によって生成された学習用情報を中間エージェント２２０に送信する。

　例えば、自律分散システム２００が、複数のＩｏＴデバイス４００によって送信される情報の解析を一つの目的としている場合、下位エージェント２３０は、よりリアルタイム性を求められる解析を実行し、上位エージェント２１０は、ある程度長い期間の傾向を解析し、中間エージェント２２０は、その間に相当する解析を実行する。

　具体例として、ある地域における事故の発生状況を管理することを目的とした場合に、複数の下位エージェント２３０が、当該地域に配置された複数のＩｏＴデバイス４００から画像データや物体検知データ等を収集する。例えば、当該地域が複数のサブエリアに分けられ、複数の下位エージェント２３０のそれぞれが、複数のサブエリアのそれぞれに配置されているＩｏＴデバイス４００から情報を収集する。そして、地理的に近接するサブエリアを担当する複数の下位エージェント２３０が、情報を共有しながら、事故の発生を検出するための学習を実行する。下位エージェント２３０は、学習結果を用いて、事故の発生を検出してよい。また、複数の中間エージェント２２０が、サブエリアのグループに対して割り当てられ、グループのサブエリアのＩｏＴデバイス４００から情報を収集する下位エージェント２３０から情報を収集する。例えば、複数の中間エージェント２２０は、互いに協調することによって、事故の発生を予測するための学習を実行する。中間エージェント２２０は、学習結果を用いて事故の発生を予測してよい。上位エージェント２１０は、例えば、複数の中間エージェント２２０による予測結果によって、全体的な情報の制御を行うための学習を実行する。具体例として、上位エージェント２１０は、事故の発生が予測されるサブエリアについて、収集する情報量を増やしたり、情報の種類を増やしたりし、それ以外のサブエリアについて、収集する情報量を減らしたり、情報の種類を減らしたりする制御を行う。

　例えば、自律分散システム２００が、クラウドネットワーク３００における、ＩｏＴデバイス４００によって取得された情報を通知するメッセージのルーティングを円滑に実施することを一つの目的としている場合、下位エージェント２３０は、メッセージのルーティングを実施する。下位エージェント２３０は、他の下位エージェント２３０と協調して、パブリッシャーからのメッセージについて、Ｔｏｐｉｃ、Ｔｏ（Ｃｏｐｙを含む）、及び分割を制御するような学習を実行する。下位エージェント２３０は、学習結果を用いて、他の下位エージェント２３０と協調して、パブリッシャーからのメッセージが、適切なサブスクライバーに到達するようにＴｏｐｉｃの生成、Ｔｏの決定、メッセージの複製、メッセージの分割などを制御する。

　中間エージェント２２０は、例えば、下位エージェント２３０から収集する情報によって、下位エージェント２３０によるルーティングを監視し、ルーティングに発生した問題を解消する処理を実行できるような学習を実行する。例えば、中間エージェント２２０は、宛先不明の同じＴｏのメッセージが存在する場合に、メッセージをバッファリングし、バッファリングの量が閾値を超えた場合に、バッファリングしているメッセージの一部をネットワークに放つ。その結果、再度戻ってきた場合には、届くようになるまでか、一定時間、バッファリングをする。そして、メッセージが届き始めたら、バッファリングしているメッセージのうち、同じＴｏのメッセージについて送信を開始する。

　上位エージェント２１０は、例えば、中間エージェント２２０から収集する情報によって、ネットワークにおける問題点を検出するための学習を実行する。そして、上位エージェント２１０は、学習結果を用いて、ネットワークの問題点を検出した場合に、検出結果をネットワークのオペレータ等に通知したり、ネットワークの構成を変更する指示を出力したりする。

　例えば、自律分散システム２００が、自動運転に関する制御を実施することを一つの目的としている場合、複数の下位エージェント２３０のそれぞれは、複数に区切られた地域毎に、その地域内に位置する車両に搭載されたＩｏＴデバイス４００、信号機等に搭載されたＩｏＴデバイス４００、及び道路等に設置されたＩｏＴデバイス４００等から、情報を収集する。具体例として、下位エージェント２３０は、車両の位置情報、車両のカメラや、街頭のカメラによって撮像された画像、道路のセンサによって検知された車両検知情報や人検知情報、車両のセンサ等によって検知された車両間距離、地域における天候情報、車両のナビゲーション情報、及び車両の走行速度等を収集する。この場合、下位エージェント２３０は、あるエリアを担当することになり、ある車両が当該エリアに入ったときから、当該車両に搭載されているＩｏＴデバイス４００からの情報を収集し、当該車両が当該エリアを出るときに、当該車両が入るエリアを担当する下位エージェント２３０に、情報の収集を引き継ぐ。

　下位エージェント２３０は、他の下位エージェント２３０と情報を共有して、車間距離が閾値より短くなっていることや、車両が人等と衝突するような危険の検知を実行する。下位エージェント２３０は、危険を検知した場合に、対象となる車両に対して、危険検知情報を送信する。車両は、当該危険検知情報を受信したことに応じて、運転者に警告したり、走行を停止したりする。

　中間エージェント２２０は、例えば、下位エージェント２３０に、何の情報を通信するかを指示する。中間エージェント２２０は、例えば、過去に下位エージェント２３０から収集した情報（曜日、時間等）に基づいて、重要情報（人が多い、車が多い等）を分析（学習）し、収集の優先度が高い情報を判定可能にする。そして、中間エージェント２２０は、期間毎に、優先度の高い情報を収集できるように、下位エージェント２３０に指示を出す。中間エージェント２２０は、他の中間エージェント２２０と協調して学習することによって、優先度の高い情報を高い精度で特定可能になる。具体例として、中間エージェント２２０は、学習の結果、平日の朝は、車検知結果の優先度を高くして情報が収集できるように指示し、休日の昼は、人検知結果の優先度を高くして情報が収集できるように指示するようになる。

　上位エージェント２１０は、例えば、より広い範囲の解析を実行する。上位エージェント２１０は、例えば、担当エリア（市、県、国単位の交通情報（交通量、時刻、曜日、イベント、天候）から、数ステップ先の（設定した時刻の）予測を実行し、中間エージェント２２０に情報を提供する。

　図７は、自律分散システム２００の他の一例を概略的に示す。自律分散システム２００は、スイッチエージェント２５０を更に備えてよい。スイッチエージェント２５０は、通信ネットワーク１００を流れる情報量を制御してよい。例えば、上位エージェント２１０、中間エージェント２２０及び下位エージェント２３０によって、メッセージのルーティングが制御される場合において、スイッチエージェント２５０は、通信トラフィックの制御を実行する。

　図８は、上位エージェント２１０、中間エージェント２２０、又は下位エージェント２３０を実装するコンピュータ１２００のハードウェア構成の一例を概略的に示す。コンピュータ１２００にインストールされたプログラムは、コンピュータ１２００を、本実施形態に係る装置の１又は複数の「部」として機能させ、又はコンピュータ１２００に、本実施形態に係る装置に関連付けられるオペレーション又は当該１又は複数の「部」を実行させることができ、及び／又はコンピュータ１２００に、本実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ１２００に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、ＣＰＵ１２１２によって実行されてよい。

　本実施形態によるコンピュータ１２００は、ＣＰＵ１２１２、ＲＡＭ１２１４、及びグラフィックコントローラ１２１６を含み、それらはホストコントローラ１２１０によって相互に接続されている。コンピュータ１２００はまた、通信インタフェース１２２２、記憶装置１２２４、ＤＶＤドライブ１２２６、及びＩＣカードドライブのような入出力ユニットを含み、それらは入出力コントローラ１２２０を介してホストコントローラ１２１０に接続されている。ＤＶＤドライブ１２２６は、ＤＶＤ－ＲＯＭドライブ及びＤＶＤ－ＲＡＭドライブ等であってよい。記憶装置１２２４は、ハードディスクドライブ及びソリッドステートドライブ等であってよい。コンピュータ１２００はまた、ＲＯＭ１２３０及びキーボードのようなレガシの入出力ユニットを含み、それらは入出力チップ１２４０を介して入出力コントローラ１２２０に接続されている。

　ＣＰＵ１２１２は、ＲＯＭ１２３０及びＲＡＭ１２１４内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ１２１６は、ＲＡＭ１２１４内に提供されるフレームバッファ等又はそれ自体の中に、ＣＰＵ１２１２によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス１２１８上に表示されるようにする。

　通信インタフェース１２２２は、ネットワークを介して他の電子デバイスと通信する。記憶装置１２２４は、コンピュータ１２００内のＣＰＵ１２１２によって使用されるプログラム及びデータを格納する。ＤＶＤドライブ１２２６は、プログラム又はデータをＤＶＤ－ＲＯＭ１２２７等から読み取り、記憶装置１２２４に提供する。ＩＣカードドライブは、プログラム及びデータをＩＣカードから読み取り、及び／又はプログラム及びデータをＩＣカードに書き込む。

　ＲＯＭ１２３０はその中に、アクティブ化時にコンピュータ１２００によって実行されるブートプログラム等、及び／又はコンピュータ１２００のハードウェアに依存するプログラムを格納する。入出力チップ１２４０はまた、様々な入出力ユニットをＵＳＢポート、パラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ１２２０に接続してよい。

　プログラムは、ＤＶＤ－ＲＯＭ１２２７又はＩＣカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもある記憶装置１２２４、ＲＡＭ１２１４、又はＲＯＭ１２３０にインストールされ、ＣＰＵ１２１２によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ１２００に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ１２００の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。

　例えば、通信がコンピュータ１２００及び外部デバイス間で実行される場合、ＣＰＵ１２１２は、ＲＡＭ１２１４にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース１２２２に対し、通信処理を命令してよい。通信インタフェース１２２２は、ＣＰＵ１２１２の制御の下、ＲＡＭ１２１４、記憶装置１２２４、ＤＶＤ－ＲＯＭ１２２７、又はＩＣカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。

　また、ＣＰＵ１２１２は、記憶装置１２２４、ＤＶＤドライブ１２２６（ＤＶＤ－ＲＯＭ１２２７）、ＩＣカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がＲＡＭ１２１４に読み取られるようにし、ＲＡＭ１２１４上のデータに対し様々なタイプの処理を実行してよい。ＣＰＵ１２１２は次に、処理されたデータを外部記録媒体にライトバックしてよい。

　様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。ＣＰＵ１２１２は、ＲＡＭ１２１４から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索／置換等を含む、様々なタイプの処理を実行してよく、結果をＲＡＭ１２１４に対しライトバックする。また、ＣＰＵ１２１２は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第２の属性の属性値に関連付けられた第１の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、ＣＰＵ１２１２は、当該複数のエントリの中から、第１の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第２の属性の属性値を読み取り、それにより予め定められた条件を満たす第１の属性に関連付けられた第２の属性の属性値を取得してよい。

　上で説明したプログラム又はソフトウエアモジュールは、コンピュータ１２００上又はコンピュータ１２００近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はＲＡＭのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ１２００に提供する。

　本実施形態におけるフローチャート及びブロック図におけるブロックは、オペレーションが実行されるプロセスの段階又はオペレーションを実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、専用回路、コンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、及び／又はコンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタル及び／又はアナログハードウェア回路を含んでよく、集積回路（ＩＣ）及び／又はディスクリート回路を含んでよい。プログラマブル回路は、例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、及びプログラマブルロジックアレイ（ＰＬＡ）等のような、論理積、論理和、排他的論理和、否定論理積、否定論理和、及び他の論理演算、フリップフロップ、レジスタ、並びにメモリエレメントを含む、再構成可能なハードウェア回路を含んでよい。

　コンピュータ可読記憶媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読記憶媒体は、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読記憶媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読記憶媒体のより具体的な例としては、フロッピー（登録商標）ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、電気的消去可能プログラマブルリードオンリメモリ（ＥＥＰＲＯＭ）、静的ランダムアクセスメモリ（ＳＲＡＭ）、コンパクトディスクリードオンリメモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、ブルーレイ（登録商標）ディスク、メモリスティック、集積回路カード等が含まれてよい。

　コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又はＳｍａｌｌｔａｌｋ（登録商標）、ＪＡＶＡ（登録商標）、Ｃ＋＋等のようなオブジェクト指向プログラミング言語、及び「Ｃ」プログラミング言語又は同様のプログラミング言語のような従来の手続型プログラミング言語を含む、１又は複数のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかを含んでよい。

　コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路が、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を生成するために当該コンピュータ可読命令を実行すべく、ローカルに又はローカルエリアネットワーク（ＬＡＮ）、インターネット等のようなワイドエリアネットワーク（ＷＡＮ）を介して、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路に提供されてよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。

　以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。その様な変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、請求の範囲の記載から明らかである。

　請求の範囲、明細書、及び図面中において示した装置、システム、プログラム、及び方法における動作、手順、ステップ、及び段階などの各処理の実行順序は、特段「より前に」、「先立って」などと明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。請求の範囲、明細書、及び図面中の動作フローに関して、便宜上「まず、」、「次に、」などを用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

１００　ネットワーク、１１０　上位コンピューティング、１２０　中間コンピューティング、１３０　下位コンピューティング、２００　自律分散システム、２１０　上位エージェント、２１１　記憶部、２１２　登録部、２１３　情報収集部、２１４　学習実行部、２１５　処理実行部、２１６　情報送信部、２２０　中間エージェント、２２１　記憶部、２２２　登録部、２２３　情報収集部、２２４　学習実行部、２２５　処理実行部、２２６　情報送信部、２３０　下位エージェント、２３１　記憶部、２３２　登録部、２３３　情報収集部、２３４　学習実行部、２３５　処理実行部、２３６　情報送信部、２５０　スイッチエージェント、３００　クラウドネットワーク、３１０　クラウドコンピューティング、３２０　フォグコンピューティング、３３０　エッジコンピューティング、４００　ＩｏＴデバイス、１２００　コンピュータ、１２１０　ホストコントローラ、１２１２　ＣＰＵ、１２１４　ＲＡＭ、１２１６　グラフィックコントローラ、１２１８　ディスプレイデバイス、１２２０　入出力コントローラ、１２２２　通信インタフェース、１２２４　記憶装置、１２２６　ＤＶＤドライブ、１２２７　ＤＶＤ－ＲＯＭ、１２３０　ＲＯＭ、１２４０　入出力チップ

Claims

　ネットワークに配置された、第１階層の第１階層エージェント及び前記第１階層よりも下位の第２階層の複数の第２階層エージェント
　を備え、
　前記複数の第２階層エージェントのそれぞれは、収集した情報を用いて、他の第２階層エージェントと協調して学習を実行し、学習結果を用いて生成した情報を前記第１階層エージェントに送信し、
　前記第１階層エージェントは、前記複数の第２階層エージェントから受信した情報を用いて学習を実行する、
　システム。
　前記第２階層よりも下位の第３階層の複数の第３階層エージェント
　を更に備え、
　前記複数の第３階層エージェントのそれぞれは、収集した情報を用いて、他の第３階層エージェントと協調して学習を実行し、学習結果を用いて生成した情報を前記複数の第２階層エージェントの少なくともいずれかに送信する、請求項１に記載のシステム。
　前記複数の第３階層エージェントのそれぞれは、
　情報を収集する第３情報収集部と、
　前記第３情報収集部によって収集された情報を用いて、他の複数の第３階層エージェントと協調して学習を実行する第３学習実行部と、
　前記第３学習実行部による学習結果を用いて生成した情報を前記複数の第２階層エージェントの少なくともいずれかに送信する第３情報送信部と
　を有し、
　前記複数の第２階層エージェントのそれぞれは、
　複数の前記第３階層エージェントから情報を収集する第２情報収集部と、
　前記第２情報収集部によって収集された情報を用いて、他の複数の第２階層エージェントと協調して学習を実行する第２学習実行部と、
　前記第２学習実行部による学習結果を用いて生成した情報を前記第１階層エージェントに送信する第２情報送信部と
　を有し、
　前記第１階層エージェントは、
　複数の前記第２階層エージェントから情報を収集する第１情報収集部と、
　前記第１情報収集部によって収集された情報を用いて学習を実行する第１学習実行部と
　を有する、請求項２に記載のシステム。
　前記第１階層エージェントは、階層型ネットワークの第１ＮＷ階層に配置され、
　前記複数の第２階層エージェントは、前記階層型ネットワークの前記第１ＮＷ階層よりも下位の第２ＮＷ階層に配置され、
　前記複数の第３階層エージェントは、前記階層型ネットワークの前記第２ＮＷ階層よりも下位の第３ＮＷ階層に配置される、請求項３に記載のシステム。
　前記階層型ネットワークは、クラウドネットワークであり、
　前記第１ＮＷ階層は、クラウドコンピューティングにより構成され、
　前記第２ＮＷ階層は、複数のフォグコンピューティングにより構成され、
　前記第３ＮＷ階層は、複数のエッジコンピューティングにより構成される、請求項４に記載のシステム。
　前記階層型ネットワークは、クラウドネットワークであり、
　前記第１ＮＷ階層は、クラウドコンピューティングにより構成され、
　前記第２ＮＷ階層は、複数のフォグコンピューティングにより構成され、
　前記第３ＮＷ階層は、複数のエッジコンピューティングにより構成され
　前記第３情報収集部は、複数のＩｏＴデバイスから移動体通信によって情報を収集し、
　前記第３情報送信部は、前記第３学習実行部による学習結果を用いて、前記第３情報収集部が収集した情報から選択した情報、又は、前記学習結果を用いて生成した情報を前記複数の第２階層エージェントの少なくともいずれかに送信し、
　前記第２情報収集部は、前記第３情報送信部によって送信された情報を収集し、
　前記第２情報送信部は、前記第２学習実行部による学習結果を用いて、前記第２情報収集部が収集した情報から選択した情報、又は、前記学習結果を用いて生成した情報を前記第１階層エージェントに送信する、請求項４に記載のシステム。