JP2023157091A - システム - Google Patents

システム Download PDF

Info

Publication number
JP2023157091A
JP2023157091A JP2022066766A JP2022066766A JP2023157091A JP 2023157091 A JP2023157091 A JP 2023157091A JP 2022066766 A JP2022066766 A JP 2022066766A JP 2022066766 A JP2022066766 A JP 2022066766A JP 2023157091 A JP2023157091 A JP 2023157091A
Authority
JP
Japan
Prior art keywords
information
learning
layer
agent
agents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022066766A
Other languages
English (en)
Other versions
JP7392027B2 (ja
Inventor
和人 須田
Kazuto SUDA
裕子 石若
Yuko ISHIWAKA
稔 大和田
Minoru Owada
智博 吉田
Tomohiro Yoshida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoftBank Corp
Original Assignee
SoftBank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SoftBank Corp filed Critical SoftBank Corp
Priority to JP2022066766A priority Critical patent/JP7392027B2/ja
Priority to PCT/JP2023/014300 priority patent/WO2023199846A1/ja
Publication of JP2023157091A publication Critical patent/JP2023157091A/ja
Application granted granted Critical
Publication of JP7392027B2 publication Critical patent/JP7392027B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】第1階層エージェントはが、複数の第2階層エージェントから受信した情報を用いて学習を実行するシステムを提供する。【解決手段】画像表示装置60における方法は、ネットワークに配置された、第1階層の第1階層エージェント(上位エージェント210)及び第1階層よりも下位の第2階層の複数の第2階層エージェント(下位エージェント230)を備える。複数の第2階層エージェントのそれぞれは、収集した情報を用いて、他の第2階層エージェントと協調して学習を実行し、学習結果を用いて生成した情報を第1階層エージェントに送信する。第1階層エージェントは、複数の第2階層エージェントから受信した情報を用いて学習を実行する。【選択図】図3

Description

本発明は、システムに関する。
特許文献1には、マルチエージェントの強化学習について記載されている。
[先行技術文献]
[特許文献]
[特許文献1]特開2004-227208号公報
本発明の第1の態様によれば、システムが提供される。前記システムは、ネットワークに配置された、第1階層の第1階層エージェント及び前記第1階層よりも下位の第2階層の複数の第2階層エージェントを備えてよい。前記複数の第2階層エージェントのそれぞれは、収集した情報を用いて、他の第2階層エージェントと協調して学習を実行し、学習結果を用いて生成した情報を前記第1階層エージェントに送信してよい。前記第1階層エージェントは、前記複数の第2階層エージェントから受信した情報を用いて学習を実行してよい。
前記システムは、前記第2階層よりも下位の第3階層の複数の第3階層エージェントを更に備えてよい。前記複数の第3階層エージェントのそれぞれは、収集した情報を用いて、他の第3階層エージェントと協調して学習を実行し、学習結果を用いて生成した情報を前記複数の第2階層エージェントの少なくともいずれかに送信してよい。
前記複数の第3階層エージェントのそれぞれは、情報を収集する第3情報収集部と、前記第3情報収集部によって収集された情報を用いて、他の複数の第3階層エージェントと協調して学習を実行する第3学習実行部と、前記第3学習実行部による学習結果を用いて生成した情報を前記複数の第2階層エージェントの少なくともいずれかに送信する第3情報送信部とを有してよい。前記複数の第2階層エージェントのそれぞれは、複数の前記第3階層エージェントから情報を収集する第2情報収集部と、前記第2情報収集部によって収集された情報を用いて、他の複数の第2階層エージェントと協調して学習を実行する第2学習実行部と、前記第2学習実行部による学習結果を用いて生成した情報を前記第1階層エージェントに送信する第2情報送信部とを有してよい。前記第1階層エージェントは、複数の前記第2階層エージェントから情報を収集する第1情報収集部と、前記第1情報収集部によって収集された情報を用いて学習を実行する第1学習実行部とを有してよい。
前記第1階層エージェントは、階層型ネットワークの第1NW階層に配置されてよく、前記複数の第2階層エージェントは、前記階層型ネットワークの前記第1NW階層よりも下位の第2NW階層に配置されてよく、前記複数の第3階層エージェントは、前記階層型ネットワークの前記第2NW階層よりも下位の第3NW階層に配置されてよい。前記階層型ネットワークは、クラウドネットワークであってよく、前記第1NW階層は、クラウドコンピューティングにより構成されてよく、前記第2NW階層は、複数のフォグコンピューティングにより構成されてよく、前記第3NW階層は、複数のエッジコンピューティングにより構成されてよい。
前記階層型ネットワークは、クラウドネットワークであってよく、前記第1NW階層は、クラウドコンピューティングにより構成されてよく、前記第2NW階層は、複数のフォグコンピューティングにより構成されてよく、前記第3NW階層は、複数のエッジコンピューティングにより構成されてよく、前記第3情報収集部は、複数のIoT(Internet of Thing)デバイスから移動体通信によって情報を収集してよく、前記第3情報送信部は、前記第3学習実行部による学習結果を用いて、前記第3情報収集部が収集した情報から選択した情報、又は、前記学習結果を用いて生成した情報を前記複数の第2階層エージェントの少なくともいずれかに送信してよく、前記第2情報収集部は、前記第3情報送信部によって送信された情報を収集してよく、前記第2情報送信部は、前記第2学習実行部による学習結果を用いて、前記第2情報収集部が収集した情報から選択した情報、又は、前記学習結果を用いて生成した情報を前記第1階層エージェントに送信してよい。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
自律分散システムの適用対象であるネットワーク100の一例を概略的に示す。 ネットワーク100の一例であるクラウドネットワーク300の一例を概略的に示す。 自律分散システム200の一例を概略的に示す。 下位エージェント230の機能構成の一例を概略的に示す。 中間エージェント220の機能構成の一例を概略的に示す。 上位エージェント210の機能構成の一例を概略的に示す。 自律分散システム200の他の一例を概略的に示す。 上位エージェント210、中間エージェント220、又は下位エージェント230を実装するコンピュータ1200のハードウェア構成の一例を概略的に示す。
マルチエージェントシステムの一つである自律分散システムが知られている。自律分散システムでは、複数のエージェントのそれぞれが、独自に自律的に学習し、協調行動を獲得することを目的としている。各エージェントが全く同じ状態(構造やパラメータ)をhomogeniousといい、homogeniousから、それぞれ異なる状態(Heterogenious)になることを機能分化という。自律分散システムの適用例として、Targetと複数のHunterが存在し、複数のHunterがTargetの捕まえ方を学習する、すなわち、複数のHunterエージェントが、自身の役割をそれぞれ学習し、協調してTargetを捕まえる追跡問題のような例がある。自律分散システムでは、同じ性能のエージェント群(homo)が、学習をすることで機能分化し、それぞれが役割を持つようになる(hetero)。例えば、追跡問題では、まっすぐに追いかけるエージェントと、回り込むエージェントに分かれてくる。このような技術を用いることによって、例えば、同じアルゴリズムで、自律的に、環境に適応した学習を行ったり、マルチエージェントで、自律的に分散して学習したりすることができる。本実施形態では、自律分散システムを、ネットワークに適用する。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、自律分散システムの適用対象である通信ネットワーク100の一例を概略的に示す。通信ネットワーク100は、階層型のネットワークである。通信ネットワーク100は、上位コンピューティング110と、複数の中間コンピューティング120と、複数の下位コンピューティング130とによって構成される。
上位コンピューティング110によって、第1NW(NetWork)階層が構成され、複数の中間コンピューティング120によって、第1NW階層よりも下位の第2NW階層が構成され、複数の下位コンピューティング130によって、第2NW階層よりも下位の第3NW階層が構成される。
自律分散システムの適用対象である通信ネットワーク100は、階層構造を備えていればどのような通信ネットワークであってもよい。例えば、通信ネットワーク100は、クラウドネットワークである。
図2は、通信ネットワーク100の一例であるクラウドネットワーク300の一例を概略的に示す。クラウドネットワーク300は、クラウドコンピューティング310と、複数のフォグコンピューティング320と、複数のエッジコンピューティング330とによって構成される。
クラウドコンピューティング310は、上位コンピューティング110の一例であってよい。フォグコンピューティング320は、中間コンピューティング120の一例であってよい。エッジコンピューティング330は、下位コンピューティング130の一例であってよい。
クラウドネットワーク300において、第1NW階層は、クラウドコンピューティング310によって構成され、第2NW階層は、複数のフォグコンピューティング320によって構成され、第3NW階層は、複数のエッジコンピューティング330によって構成される。
複数のエッジコンピューティング330のそれぞれは、移動通信システムを介して、1又は複数のIoTデバイス400と通信する。複数のIoTデバイス400のそれぞれは、無線基地局及びWi-Fi(登録商標)アクセスポイント等を介して、複数のエッジコンピューティング330の少なくともいずれかに対して情報を送信してよい。
IoTデバイス400は、何らかの情報を取得して送信可能であれば、どのようなデバイスであってもよい。IoTデバイス400は、例えば、各種センサを備える。IoTデバイス400が送信する情報の例として、画像データ(静止画像、動画像)、音データ、赤外線データ、位置データ、物体検知データ、距離データ、天候データ、温度データ、及び湿度データ等が挙げられるが、ほんの一例であり、どのような情報であってもよい。
当該移動通信システムは、例えば、5G(5th Generation)通信システムである。当該移動通信システムは、LTE(Long Term Evolution)通信システムであってもよい。当該移動通信システムは、3G(3rd Generation)通信システムであってもよい。当該移動通信システムは、6G(6th Generation)通信システム以降の移動通信システムであってもよい。
図3は、自律分散システム200の一例を概略的に示す。自律分散システム200は、階層構造を有する複数のエージェントによって構成される。図3に示す例において、自律分散システム200は、上位エージェント210、複数の中間エージェント220、及び複数の下位エージェント230を備える。
自律分散システム200は、通信ネットワーク100に適用される。例えば、上位エージェント210が、上位コンピューティング110に配置され、複数の中間エージェント220のそれぞれが、複数の中間コンピューティング120のそれぞれに配置され、複数の下位エージェント230のそれぞれが、複数の下位コンピューティング130のそれぞれに配置される。1つの中間コンピューティング120に対して複数の中間エージェント220が配置されてもよい。1つの下位コンピューティング130に複数の下位エージェント230が配置されてもよい。
図2では、自律分散システム200が3階層によって構成される場合を例示しているが、これに限らない。自律分散システム200は、2階層であってもよく、4階層以上であってもよい。自律分散システム200が2階層である場合、自律分散システム200は、上位エージェント210と、複数の下位エージェント230とを備えてよい。この例において、上位エージェント210は、第1階層の第1階層エージェントの例であってよく、下位エージェント230は、第2階層の複数の第2階層エージェントの一例であってよい。この場合、例えば、上位エージェント210が上位コンピューティング110に配置され、複数の下位エージェント230のそれぞれが、複数の下位コンピューティング130のそれぞれに配置される。また、例えば、上位エージェント210が、複数の中間コンピューティング120のいずれかに配置され、複数の下位エージェント230が、複数の下位コンピューティング130のそれぞれに配置される。なお、この場合、通信ネットワーク100は、複数の中間コンピューティング120を備えずに、2階層により構成されてもよい。
自律分散システム200は、例えば、クラウドネットワーク300に適用される。例えば、上位エージェント210が、クラウドコンピューティング310に配置され、複数の中間エージェント220のそれぞれが、複数のフォグコンピューティング320のそれぞれに配置され、複数の下位エージェント230のそれぞれが、複数のエッジコンピューティング330のそれぞれに配置される。1つのフォグコンピューティング320に対して複数の中間エージェント220が配置されてもよい。1つのエッジコンピューティング330に複数の下位エージェント230が配置されてもよい。
自律分散システム200が2階層である場合、例えば、上位エージェント210がクラウドコンピューティング310に配置され、複数の下位エージェント230のそれぞれが、複数のエッジコンピューティング330のそれぞれに配置される。また、例えば、上位エージェント210が、複数のフォグコンピューティング320のいずれかに配置され、複数の下位エージェント230が、複数のエッジコンピューティング330のそれぞれに配置される。なお、この場合、クラウドネットワーク300は、複数のフォグコンピューティング320を備えずに、2階層により構成されてもよい。
下位エージェント230は、情報を収集する。下位エージェント230は、例えば、IoTデバイス400によって送信された情報を収集する。下位エージェント230は、IoTデバイス400から移動体通信によって情報を収集してよい。下位エージェント230は、IoTデバイス400以外の任意のデバイスによって送信された情報を収集してもよい。下位エージェント230は、IoTデバイス400以外の任意のデバイスから移動体通信によって情報を収集してよい。
下位エージェント230は、収集した情報を用いて、他の下位エージェント230と協調して学習を実行する。下位エージェント230は、予め登録された報酬に従って、学習を実行してよい。下位エージェント230は、予め登録された知識に従って、学習を実行してよい。下位エージェント230は、学習結果を用いて各種処理を実行してよい。例えば、下位エージェント230は、学習結果を用いて、収集した複数の情報のうち、中間エージェント220に送信する情報を選択して、中間エージェント220に送信する。例えば、下位エージェント230は、学習結果を用いて、収集した複数の情報をまとめたサマリ情報を生成して、中間エージェント220に送信する。
例えば、複数のIoTデバイス400によって送信される多量の情報のうち、有用な情報のみを上位階層に送信することを目的とした場合に、下位エージェント230がIoTデバイス400から収集して中間エージェント220又は上位エージェント210に送信する情報の有用度が、報酬として登録される。複数の下位エージェント230のそれぞれは、他の下位エージェント230と協調しながら、それぞれ自律的に報酬を最大化するように学習を進める。複数の下位エージェント230は、異なる1又は複数のIoTデバイス400から情報を収集しており、それぞれ異なる基準で、収集情報から上位階層に送信する情報を選択したり、収集情報から上位階層に送信するサマリ情報を生成したりするようになり、全体的に有用度の高い情報のみが上位階層に伝わるようにシステムが構築され得る。
下位エージェント230は、比較的リアルタイム性の高い処理を実行してよい。例えば、下位エージェント230は、1分及び3分等の予め定められた時間毎に、1又は複数のIoTデバイス400から収集する情報に対して、学習結果を用いて、選択処理を行ったり、サマリ情報の生成処理を行ったりして、情報を上位階層に送信する。これにより、上位階層に送信する情報をリアルタイムに調整することが可能となる。例えば、昼間は画像が、夜は赤外線データが多い情報を扱うエッジコンピューティング330に配置された複数の下位エージェント230の場合、多くの下位エージェント230が、昼は画像を担当し、夜は赤外線データを担当するようになる。このように、下位エージェント230は動的に環境に適応することが可能であるため、例えば、収集対象のIoTデバイス400を変更したり、収集対象のIoTデバイス400が収集する情報の種類が変わったりした場合であっても、適応可能である。このように、下位エージェント230は、処理をリアルタイムに実行してよいが、時間遅れで統計情報を送信したり、サマリ情報を送信したりしてもよい。下位エージェント230は、意図的にディレイを入れることが可能であってもよい。
中間エージェント220は、情報を収集する。中間エージェント220は、下位エージェント230から情報を収集してよい。中間エージェント220は、例えば、下位エージェント230がIoTデバイス400から収集した情報を、下位エージェント230から収集する。中間エージェント220は、例えば、下位エージェント230がIoTデバイス400から収集した複数の情報のうち、下位エージェント230によって選択された情報を下位エージェント230から収集する。中間エージェント220は、例えば、下位エージェント230がIoTデバイス400から収集した複数の情報をまとめたサマリ情報を、下位エージェント230から収集する。
中間エージェント220は、収集した情報を用いて、他の中間エージェント220と協調して学習を実行する。中間エージェント220は、学習結果を用いて各種処理を実行してよい。例えば、中間エージェント220は、学習結果を用いて、収集した複数の情報のうち、中間エージェント220に送信する情報を選択して、上位エージェント210に送信する。例えば、中間エージェント220は、学習結果を用いて、収集した複数の情報をまとめたサマリ情報を生成して、上位エージェント210に送信する。
中間エージェント220は、下位エージェント230と比較してリアルタイム性の低い処理を実行してよい。例えば、中間エージェント220は、1時間及び1日等の予め定められた期間毎に、1又は複数の下位エージェント230から収集する情報を用いた処理を実行する。中間エージェント220は、例えば、予め定められた期間の情報を用いた学習を実行する。中間エージェント220は、他の中間エージェント220と協調して、複数の下位エージェント230から上位階層に送信される情報の量を調整したり、複数の中間エージェント220から上位エージェント210に対して送信する情報の量を調整したりしてもよい。中間エージェント220は、自律分散システム200におけるロバスト性を担保するような学習や処理を実行してもよい。中間エージェント220は、自律分散システム200におけるSpinal Cordの役割を担ってもよい。中間エージェント220は、下位エージェント230から情報を受信した場合に、上位エージェント210に対して当該情報や当該情報に基づいて生成した情報を送信するか、下位エージェント230に対して応答したり指示を送信したりするかを判定してもよい。
上位エージェント210は、情報を収集する。上位エージェント210は、中間エージェント220から情報を収集してよい。上位エージェント210は、例えば、中間エージェント220から下位エージェント230から収集した情報を、下位エージェント230から収集する。上位エージェント210は、例えば、中間エージェント220が下位エージェント230から収集した複数の情報のうち、中間エージェント220によって選択された情報を中間エージェント220から収集する。上位エージェント210は、例えば、中間エージェント220が下位エージェント230から収集した複数の情報をまとめたサマリ情報を、中間エージェント220から収集する。上位エージェント210は、下位エージェント230から情報を収集してもよい。
上位エージェント210は、収集した情報を用いた処理を実行する。上位エージェント210は、例えば、収集した情報を用いた学習を実行する。上位エージェント210は、例えば、学習結果を用いて各種処理を実行する。
上位エージェント210は、中間エージェント220と比較してリアルタイム性の低い処理を実行してよい。例えば、上位エージェント210は、1週間、1カ月、及び1年等の予め定められた期間毎に、収集した情報を用いた処理を実行する。上位エージェント210は、例えば、予め定められた期間の情報を用いた学習を実行する。
上位エージェント210は、自律分散システム200の全体を安定させることを目的とした処理を実行してもよい。例えば、上位エージェント210は、収集した情報に基づいて、通信ネットワーク100やクラウドネットワーク300の全体の通信負荷の要因分析等を実行してよい。上位エージェント210は、収集した情報の内容や、情報の収集状況によって、ネットワークにおける通信負荷が高まっている位置を特定して、通信負荷を低減するように、例えば、IoTデバイス400、下位エージェント230、中間エージェント220によって送信される情報の量を調整したり、伝搬経路を調整したりしてよい。
いわゆるクラウドネットワークにおいて取り扱われる情報の量は非常に増加している。今後、5G移動通信システムの普及がより進み、IoTデバイスの数が増加することによって、情報量はさらに増加することが想定される。このような情報量の増加に対して、ネットワークの通信機能の向上や、ネットワーク機器の性能の向上が、常套手段としての対応策となるが、それのみでは対応しきれない可能性がある。それに対して、本実施形態に係る自律分散システム200をネットワークに適用することによって、処理を階層化することができる。自律分散システム200によれば、例えば、下位エージェント230によってリアルタイム性の高い処理を実行しつつ、有用な情報に絞って上位階層に伝達し、中間エージェント220によって、厳選された情報を用いた、もう少し広いスパンの情報処理を行いつつ、情報をさらに絞り、上位エージェント210において、更に厳選された情報を用いた、更に広いスパンの情報処理を行ったり、ネットワーク全体の安定化が図られたりするので、大量の情報を適切に取り扱える環境の構築に貢献することができる。
図4は、下位エージェント230の機能構成の一例を概略的に示す。下位エージェント230は、記憶部231、登録部232、情報収集部233、学習実行部234、処理実行部235、及び情報送信部236を備える。
登録部232は、各種登録を実行する。登録部232は、例えば、下位エージェント230が学習に用いる学習用情報を登録する。登録部232は、登録した学習用情報を記憶部231に記憶する。学習用情報は、報酬を含んでよい。学習用情報は、知識を含んでよい。登録部232は、例えば、自律分散システム200のオペレータ等による入力を受け付けることによって、学習用情報を登録する。登録部232は、例えば、上位エージェント210から受信した学習用情報を登録する。登録部232は、例えば、中間エージェント220から受信した学習用情報を登録する。登録部232は、第3登録部の一例であってよい。
情報収集部233は、情報を収集する。情報収集部233は、任意のデバイスによって送信された情報を収集してよい。情報収集部233は、例えば、IoTデバイス400によって送信された情報を収集する。情報収集部233は、IoTデバイス400から移動体通信によって情報を収集してよい。情報収集部233は、収集した情報を記憶部231に記憶する。情報収集部233は、第3情報収集部の一例であってよい。
学習実行部234は、情報収集部233が収集した情報を用いて、学習を実行する。学習実行部234は、情報収集部233が収集した情報を用いて、他の下位エージェント230と協調して学習を実行してよい。
学習実行部234は、学習結果を記憶部231に記憶する。学習結果は、学習実行部234が学習によって生成したモデルを含んでよい。学習結果は、学習実行部234が学習によって生成したニューラルネットワークを含んでよい。学習実行部234は、第3学習実行部の一例であってよい。
学習実行部234は、任意の学習方法を用いてよい。例えば、学習実行部234は、まず、シミュレーションによる事前学習(Pre-training)を実行し、情報収集部233が収集する情報によって、モデル及びニューラルネットワーク等を更新する。事前学習には、過去に情報収集部233が収集した実データを用いてよい。事前学習には、シンセティックデータを用いてもよい。学習にトライアンドエラーが許されない環境である場合、強化学習ではなく、ルールベースで学習を行い、そのパラメータのみを学習する方法が有効である。学習方法は、ANN(Artificial Neural Network)、DNN(Deep Neural Network)、ヒューリスティクス等であってもよい。
処理実行部235は、各種処理を実行する。処理実行部235は、学習実行部234による学習結果を用いて、情報収集部233が収集した情報に対して処理を実行してよい。処理実行部235は、情報収集部233が収集した複数の情報を用いて、中間エージェント220に送信する情報を生成してよい。
例えば、処理実行部235は、学習実行部234による学習結果を用いて、情報収集部233が収集した複数の情報から選択した情報を含む送信情報を生成する。例えば、処理実行部235は、学習実行部234による学習結果を用いて、情報収集部233が収集した複数の情報をまとめたサマリ情報を生成する。処理実行部235は、第3処理実行部の一例であってよい。
情報送信部236は、情報を送信する。例えば、情報送信部236は、情報収集部233によって収集された情報を中間エージェント220に送信する。例えば、情報送信部236は、処理実行部235によって生成された情報を中間エージェント220に送信する。情報送信部236は、第3情報送信部の一例であってよい。
図5は、中間エージェント220の機能構成の一例を概略的に示す。中間エージェント220は、記憶部221、登録部222、情報収集部223、学習実行部224、処理実行部225、及び情報送信部226を備える。
登録部222は、各種登録を実行する。登録部222は、例えば、中間エージェント220が学習に用いる学習用情報を登録する。登録部222は、登録した学習用情報を記憶部221に記憶する。学習用情報は、報酬を含んでよい。学習用情報は、知識を含んでよい。登録部222は、例えば、自律分散システム200のオペレータ等による入力を受け付けることによって、学習用情報を登録する。登録部222は、例えば、上位エージェント210から受信した学習用情報を登録する。登録部222は、第2登録部の一例であってよい。
情報収集部223は、情報を収集する。情報収集部223は、下位エージェント230から情報を収集してよい。情報収集部223は、例えば、下位エージェント230の情報送信部236が送信した情報を収集する。情報収集部223は、収集した情報を記憶部221に記憶する。情報収集部223は、第2情報収集部の一例であってよい。
学習実行部224は、情報収集部223が収集した情報を用いて、学習を実行する。学習実行部224は、情報収集部223が収集した情報を用いて、他の中間エージェント220と協調して学習を実行してよい。
学習実行部224は、学習結果を記憶部221に記憶する。学習結果は、学習実行部224が学習によって生成したモデルを含んでよい。学習結果は、学習実行部224が学習によって生成したニューラルネットワークを含んでよい。学習実行部224は、第2学習実行部の一例であってよい。
学習実行部224は、任意の学習方法を用いてよい。例えば、学習実行部224は、まず、シミュレーションによる事前学習を実行し、情報収集部223が収集する情報によって、モデル及びニューラルネットワーク等を更新する。事前学習には、過去に情報収集部223が収集した実データを用いてよい。事前学習には、シンセティックデータを用いてもよい。学習にトライアンドエラーが許されない環境である場合、強化学習ではなく、ルールベースで学習を行い、そのパラメータのみを学習する方法が有効である。学習方法は、ANN、DNN、ヒューリスティクス等であってもよい。
処理実行部225は、各種処理を実行する。処理実行部225は、学習実行部224による学習結果を用いて、情報収集部223が収集した情報に対して処理を実行してよい。処理実行部225は、情報収集部223が収集した複数の情報を用いて、上位エージェント210に送信する情報を生成してよい。
例えば、処理実行部225は、学習実行部224による学習結果を用いて、情報収集部223が収集した複数の情報から選択した情報を含む送信情報を生成する。例えば、処理実行部225は、学習実行部224による学習結果を用いて、情報収集部223が収集した複数の情報をまとめたサマリ情報を生成する。処理実行部225は、第2処理実行部の一例であってよい。
情報送信部226は、情報を送信する。例えば、情報送信部226は、情報収集部223によって収集された情報を上位エージェント210に送信する。例えば、情報送信部226は、処理実行部225によって生成された情報を上位エージェント210に送信する。情報送信部226は、第2情報送信部の一例であってよい。
図6は、上位エージェント210の機能構成の一例を概略的に示す。上位エージェント210は、記憶部211、登録部212、情報収集部213、学習実行部214、処理実行部215、及び情報送信部216を備える。
登録部212は、各種登録を実行する。登録部212は、例えば、上位エージェント210が学習に用いる学習用情報を登録する。登録部212は、登録した学習用情報を記憶部211に記憶する。学習用情報は、報酬を含んでよい。学習用情報は、知識を含んでよい。登録部212は、例えば、自律分散システム200のオペレータ等による入力を受け付けることによって、学習用情報を登録する。登録部212は、第1登録部の一例であってよい。
情報収集部213は、情報を収集する。情報収集部213は、中間エージェント220から情報を収集してよい。情報収集部213は、例えば、中間エージェント220の情報送信部226が送信した情報を収集する。情報収集部213は、収集した情報を記憶部211に記憶する。情報収集部213は、第1情報収集部の一例であってよい。
学習実行部214は、情報収集部213が収集した情報を用いて、学習を実行する。学習実行部214は、第1学習実行部の一例であってよい。学習実行部214は、情報収集部213が収集した情報を用いて、複数の中間エージェント220と協調して学習を実行してもよい。学習実行部214は、情報収集部213が収集した情報を用いて、複数の下位エージェント230と協調して学習を実行してもよい。学習実行部214は、情報収集部213が収集した情報を用いて、複数の中間エージェント220及び複数の下位エージェント230と協調して学習を実行してもよい。
学習実行部214は、学習結果を記憶部211に記憶する。学習結果は、学習実行部214が学習によって生成したモデルを含んでよい。学習結果は、学習実行部214が学習によって生成したニューラルネットワークを含んでよい。学習実行部214は、第1学習実行部の一例であってよい。
学習実行部214は、任意の学習方法を用いてよい。例えば、学習実行部214は、まず、シミュレーションによる事前学習を実行し、情報収集部213が収集する情報によって、モデル及びニューラルネットワーク等を更新する。事前学習には、過去に情報収集部213が収集した実データを用いてよい。事前学習には、シンセティックデータを用いてもよい。学習にトライアンドエラーが許されない環境である場合、強化学習ではなく、ルールベースで学習を行い、そのパラメータのみを学習する方法が有効である。学習方法は、ANN、DNN、ヒューリスティクス等であってもよい。
処理実行部215は、各種処理を実行する。処理実行部215は、第1処理実行部の一例であってよい。処理実行部215は、学習実行部214による学習結果を用いて、情報収集部213が収集した情報に対して処理を実行してよい。処理実行部215は、学習実行部214による学習結果を用いて、自律分散システム200が適用されたネットワークの全体を安定させることを目的とした処理を実行してよい。
処理実行部215は、情報収集部213が収集した情報を解析した結果に基づいて、中間エージェント220又は下位エージェント230に対する指示情報を生成してもよい。処理実行部215は、例えば、下位エージェント230に対して、IoTデバイス400から収集した情報のうちの中間エージェント220に送信する情報を指示する指示情報を生成する。処理実行部215は、例えば、中間エージェント220に対して、中間エージェント220から収集した情報の処理内容を指示する指示情報を生成する。
処理実行部215は、情報収集部213が収集した情報を解析した結果に基づいて、下位エージェント230に送信する学習用情報を生成してもよい。処理実行部215は、情報収集部213が収集した情報を解析した結果に基づいて、中間エージェント220に送信する学習用情報を生成してもよい。例えば処理実行部215は、情報収集部213が収集した情報の傾向の変化に合わせて設定した報酬を含む学習用情報を生成する。
情報送信部216は、情報を送信する。例えば、情報送信部216は、処理実行部215によって生成された指示情報を下位エージェント230に送信する。例えば、情報送信部216は、処理実行部215によって生成された指示情報を中間エージェント220に送信する。
例えば、情報送信部216は、処理実行部215によって生成された学習用情報を下位エージェント230に送信する。例えば、情報送信部216は、処理実行部215によって生成された学習用情報を中間エージェント220に送信する。
例えば、自律分散システム200が、複数のIoTデバイス400によって送信される情報の解析を一つの目的としている場合、下位エージェント230は、よりリアルタイム性を求められる解析を実行し、上位エージェント210は、ある程度長い期間の傾向を解析し、中間エージェント220は、その間に相当する解析を実行する。
具体例として、ある地域における事故の発生状況を管理することを目的とした場合に、複数の下位エージェント230が、当該地域に配置された複数のIoTデバイス400から画像データや物体検知データ等を収集する。例えば、当該地域が複数のサブエリアに分けられ、複数の下位エージェント230のそれぞれが、複数のサブエリアのそれぞれに配置されているIoTデバイス400から情報を収集する。そして、地理的に近接するサブエリアを担当する複数の下位エージェント230が、情報を共有しながら、事故の発生を検出するための学習を実行する。下位エージェント230は、学習結果を用いて、事故の発生を検出してよい。また、複数の中間エージェント220が、サブエリアのグループに対して割り当てられ、グループのサブエリアのIoTデバイス400から情報を収集する下位エージェント230から情報を収集する。例えば、複数の中間エージェント220は、互いに協調することによって、事故の発生を予測するための学習を実行する。中間エージェント220は、学習結果を用いて自己の発生を予測してよい。上位エージェント210は、例えば、複数の中間エージェント220による予測結果によって、全体的な情報の制御を行うための学習を実行する。具体例として、上位エージェント210は、事故の発生が予測されるサブエリアについて、収集する情報量を増やしたり、情報の種類を増やしたりし、それ以外のサブエリアについて、収集する情報量を減らしたり、情報の種類を減らしたりする制御を行う。
例えば、自律分散システム200が、クラウドネットワーク300における、IoTデバイス400によって取得された情報を通知するメッセージのルーティングを円滑に実施することを一つの目的としている場合、下位エージェント230は、メッセージのルーティングを実施する。下位エージェント230は、他の下位エージェント230と協調して、パブリッシャーからのメッセージについて、Topic、To(Copyを含む)、及び分割を制御するような学習を実行する。下位エージェント230は、学習結果を用いて、他の下位エージェント230と協調して、パブリッシャーからのメッセージが、適切なサブスクライバーに到達するようにTopicの生成、Toの決定、メッセージの複製、メッセージの分割などを制御する。
中間エージェント220は、例えば、下位エージェント230から収集する情報によって、下位エージェント230によるルーティングを監視し、ルーティングに発生した問題を解消する処理を実行できるような学習を実行する。例えば、中間エージェント220は、宛先不明の同じToのメッセージが存在する場合に、メッセージをバッファリングし、バッファリングの量が閾値を超えた場合に、バッファリングしているメッセージの一部をネットワークに放つ。その結果、再度戻ってきた場合には、届くようになるまでか、一定時間、バッファリングをする。そして、メッセージが届き始めたら、バッファリングしているメッセージのうち、同じToのメッセージについて送信を開始する。
上位エージェント210は、例えば、中間エージェント220から収集する情報によって、ネットワークにおける問題点を検出するための学習を実行する。そして、上位エージェント210は、学習結果を用いて、ネットワークの問題点を検出した場合に、検出結果をネットワークのオペレータ等に通知したり、ネットワークの構成を変更する指示を出力したりする。
例えば、自律分散システム200が、自動運転に関する制御を実施することを一つの目的としている場合、複数の下位エージェント230のそれぞれは、複数に区切られた地域毎に、その地域内に位置する車両に搭載されたIoTデバイス400、信号機等に搭載されたIoTデバイス400、及び道路等に設置されたIoTデバイス400等から、情報を収集する。具体例として、下位エージェント230は、車両の位置情報、車両のカメラや、街頭のカメラによって撮像された画像、道路のセンサによって検知された車両検知情報や人検知情報、車両のセンサ等によって検知された車両間距離、地域における天候情報、車両のナビゲーション情報、及び車両の走行速度等を収集する。この場合、下位エージェント230は、あるエリアを担当することになり、ある車両が当該エリアに入ったときから、当該車両に搭載されているIoTデバイス400からの情報を収集し、当該車両が当該エリアを出るときに、当該車両が入るエリアを担当する下位エージェント230に、情報の収集を引き継ぐ。
下位エージェント230は、他の下位エージェント230と情報を共有して、車間距離が閾値より短くなっていることや、車両が人等と衝突するような危険の検知を実行する。下位エージェント230は、危険を検知した場合に、対象となる車両に対して、危険検知情報を送信する。車両は、当該危険検知情報を受信したことに応じて、運転者に警告したり、走行を停止したりする。
中間エージェント220は、例えば、下位エージェント230に、何の情報を通信するかを指示する。中間エージェント220は、例えば、過去に下位エージェント230から収集した情報(曜日、時間等)に基づいて、重要情報(人が多い、車が多い等)を分析(学習)し、収集の優先度が高い情報を判定可能にする。そして、中間エージェント220は、期間毎に、優先度の高い情報を収集できるように、下位エージェント230に指示を出す。中間エージェント220は、他の中間エージェント220と協調して学習することによって、優先度の高い情報を高い精度で特定可能になる。具体例として、中間エージェント220は、学習の結果、平日の朝は、車検知結果の優先度を高くして情報が収集できるように指示し、休日の昼は、人検知結果の優先度を高くして情報が収集できるように指示するようになる。
上位エージェント210は、例えば、より広い範囲の解析を実行する。上位エージェント210は、例えば、担当エリア(市、県、国単位の交通情報(交通量、時刻、曜日、イベント、天候)から、数ステップ先の(設定した時刻の)予測を実行し、中間エージェント220に情報を提供する。
図7は、自律分散システム200の他の一例を概略的に示す。自律分散システム200は、スイッチエージェント250を更に備えてよい。スイッチエージェント250は、通信ネットワーク100を流れる情報量を制御してよい。例えば、上位エージェント210、中間エージェント220及び下位エージェント230によって、メッセージのルーティングが制御される場合において、スイッチエージェント250は、通信トラフィックの制御を実行する。
図8は、上位エージェント210、中間エージェント220、又は下位エージェント230を実装するコンピュータ1200のハードウェア構成の一例を概略的に示す。コンピュータ1200にインストールされたプログラムは、コンピュータ1200を、本実施形態に係る装置の1又は複数の「部」として機能させ、又はコンピュータ1200に、本実施形態に係る装置に関連付けられるオペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ1200に、本実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ1200に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU1212によって実行されてよい。
本実施形態によるコンピュータ1200は、CPU1212、RAM1214、及びグラフィックコントローラ1216を含み、それらはホストコントローラ1210によって相互に接続されている。コンピュータ1200はまた、通信インタフェース1222、記憶装置1224、DVDドライブ1226、及びICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ1220を介してホストコントローラ1210に接続されている。DVDドライブ1226は、DVD-ROMドライブ及びDVD-RAMドライブ等であってよい。記憶装置1224は、ハードディスクドライブ及びソリッドステートドライブ等であってよい。コンピュータ1200はまた、ROM1230及びキーボードのようなレガシの入出力ユニットを含み、それらは入出力チップ1240を介して入出力コントローラ1220に接続されている。
CPU1212は、ROM1230及びRAM1214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ1216は、RAM1214内に提供されるフレームバッファ等又はそれ自体の中に、CPU1212によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス1218上に表示されるようにする。
通信インタフェース1222は、ネットワークを介して他の電子デバイスと通信する。記憶装置1224は、コンピュータ1200内のCPU1212によって使用されるプログラム及びデータを格納する。DVDドライブ1226は、プログラム又はデータをDVD-ROM1227等から読み取り、記憶装置1224に提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。
ROM1230はその中に、アクティブ化時にコンピュータ1200によって実行されるブートプログラム等、及び/又はコンピュータ1200のハードウェアに依存するプログラムを格納する。入出力チップ1240はまた、様々な入出力ユニットをUSBポート、パラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ1220に接続してよい。
プログラムは、DVD-ROM1227又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもある記憶装置1224、RAM1214、又はROM1230にインストールされ、CPU1212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ1200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ1200の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。
例えば、通信がコンピュータ1200及び外部デバイス間で実行される場合、CPU1212は、RAM1214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース1222に対し、通信処理を命令してよい。通信インタフェース1222は、CPU1212の制御の下、RAM1214、記憶装置1224、DVD-ROM1227、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。
また、CPU1212は、記憶装置1224、DVDドライブ1226(DVD-ROM1227)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM1214に読み取られるようにし、RAM1214上のデータに対し様々なタイプの処理を実行してよい。CPU1212は次に、処理されたデータを外部記録媒体にライトバックしてよい。
様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU1212は、RAM1214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM1214に対しライトバックする。また、CPU1212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU1212は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
上で説明したプログラム又はソフトウエアモジュールは、コンピュータ1200上又はコンピュータ1200近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ1200に提供する。
本実施形態におけるフローチャート及びブロック図におけるブロックは、オペレーションが実行されるプロセスの段階又はオペレーションを実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、専用回路、コンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、及び/又はコンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタル及び/又はアナログハードウェア回路を含んでよく、集積回路(IC)及び/又はディスクリート回路を含んでよい。プログラマブル回路は、例えば、フィールドプログラマブルゲートアレイ(FPGA)、及びプログラマブルロジックアレイ(PLA)等のような、論理積、論理和、排他的論理和、否定論理積、否定論理和、及び他の論理演算、フリップフロップ、レジスタ、並びにメモリエレメントを含む、再構成可能なハードウェア回路を含んでよい。
コンピュータ可読記憶媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読記憶媒体は、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読記憶媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読記憶媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROM又はフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(登録商標)ディスク、メモリスティック、集積回路カード等が含まれてよい。
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又はSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、及び「C」プログラミング言語又は同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1又は複数のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかを含んでよい。
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路が、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を生成するために当該コンピュータ可読命令を実行すべく、ローカルに又はローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路に提供されてよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。その様な変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
特許請求の範囲、明細書、及び図面中において示した装置、システム、プログラム、及び方法における動作、手順、ステップ、及び段階などの各処理の実行順序は、特段「より前に」、「先立って」などと明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、及び図面中の動作フローに関して、便宜上「まず、」、「次に、」などを用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
100 ネットワーク、110 上位コンピューティング、120 中間コンピューティング、130 下位コンピューティング、200 自律分散システム、210 上位エージェント、211 記憶部、212 登録部、213 情報収集部、214 学習実行部、215 処理実行部、216 情報送信部、220 中間エージェント、221 記憶部、222 登録部、223 情報収集部、224 学習実行部、225 処理実行部、226 情報送信部、230 下位エージェント、231 記憶部、232 登録部、233 情報収集部、234 学習実行部、235 処理実行部、236 情報送信部、250 スイッチエージェント、300 クラウドネットワーク、310 クラウドコンピューティング、320 フォグコンピューティング、330 エッジコンピューティング、400 IoTデバイス、1200 コンピュータ、1210 ホストコントローラ、1212 CPU、1214 RAM、1216 グラフィックコントローラ、1218 ディスプレイデバイス、1220 入出力コントローラ、1222 通信インタフェース、1224 記憶装置、1226 DVDドライブ、1227 DVD-ROM、1230 ROM、1240 入出力チップ

Claims (6)

  1. ネットワークに配置された、第1階層の第1階層エージェント及び前記第1階層よりも下位の第2階層の複数の第2階層エージェント
    を備え、
    前記複数の第2階層エージェントのそれぞれは、収集した情報を用いて、他の第2階層エージェントと協調して学習を実行し、学習結果を用いて生成した情報を前記第1階層エージェントに送信し、
    前記第1階層エージェントは、前記複数の第2階層エージェントから受信した情報を用いて学習を実行する、
    システム。
  2. 前記第2階層よりも下位の第3階層の複数の第3階層エージェント
    を更に備え、
    前記複数の第3階層エージェントのそれぞれは、収集した情報を用いて、他の第3階層エージェントと協調して学習を実行し、学習結果を用いて生成した情報を前記複数の第2階層エージェントの少なくともいずれかに送信する、請求項1に記載のシステム。
  3. 前記複数の第3階層エージェントのそれぞれは、
    情報を収集する第3情報収集部と、
    前記第3情報収集部によって収集された情報を用いて、他の複数の第3階層エージェントと協調して学習を実行する第3学習実行部と、
    前記第3学習実行部による学習結果を用いて生成した情報を前記複数の第2階層エージェントの少なくともいずれかに送信する第3情報送信部と
    を有し、
    前記複数の第2階層エージェントのそれぞれは、
    複数の前記第3階層エージェントから情報を収集する第2情報収集部と、
    前記第2情報収集部によって収集された情報を用いて、他の複数の第2階層エージェントと協調して学習を実行する第2学習実行部と、
    前記第2学習実行部による学習結果を用いて生成した情報を前記第1階層エージェントに送信する第2情報送信部と
    を有し、
    前記第1階層エージェントは、
    複数の前記第2階層エージェントから情報を収集する第1情報収集部と、
    前記第1情報収集部によって収集された情報を用いて学習を実行する第1学習実行部と
    を有する、請求項2に記載のシステム。
  4. 前記第1階層エージェントは、階層型ネットワークの第1NW階層に配置され、
    前記複数の第2階層エージェントは、前記階層型ネットワークの前記第1NW階層よりも下位の第2NW階層に配置され、
    前記複数の第3階層エージェントは、前記階層型ネットワークの前記第2NW階層よりも下位の第3NW階層に配置される、請求項3に記載のシステム。
  5. 前記階層型ネットワークは、クラウドネットワークであり、
    前記第1NW階層は、クラウドコンピューティングにより構成され、
    前記第2NW階層は、複数のフォグコンピューティングにより構成され、
    前記第3NW階層は、複数のエッジコンピューティングにより構成される、請求項4に記載のシステム。
  6. 前記階層型ネットワークは、クラウドネットワークであり、
    前記第1NW階層は、クラウドコンピューティングにより構成され、
    前記第2NW階層は、複数のフォグコンピューティングにより構成され、
    前記第3NW階層は、複数のエッジコンピューティングにより構成され
    前記第3情報収集部は、複数のIoTデバイスから移動体通信によって情報を収集し、
    前記第3情報送信部は、前記第3学習実行部による学習結果を用いて、前記第3情報収集部が収集した情報から選択した情報、又は、前記学習結果を用いて生成した情報を前記複数の第2階層エージェントの少なくともいずれかに送信し、
    前記第2情報収集部は、前記第3情報送信部によって送信された情報を収集し、
    前記第2情報送信部は、前記第2学習実行部による学習結果を用いて、前記第2情報収集部が収集した情報から選択した情報、又は、前記学習結果を用いて生成した情報を前記第1階層エージェントに送信する、請求項4に記載のシステム。
JP2022066766A 2022-04-14 2022-04-14 システム Active JP7392027B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022066766A JP7392027B2 (ja) 2022-04-14 2022-04-14 システム
PCT/JP2023/014300 WO2023199846A1 (ja) 2022-04-14 2023-04-06 システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022066766A JP7392027B2 (ja) 2022-04-14 2022-04-14 システム

Publications (2)

Publication Number Publication Date
JP2023157091A true JP2023157091A (ja) 2023-10-26
JP7392027B2 JP7392027B2 (ja) 2023-12-05

Family

ID=88329680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022066766A Active JP7392027B2 (ja) 2022-04-14 2022-04-14 システム

Country Status (2)

Country Link
JP (1) JP7392027B2 (ja)
WO (1) WO2023199846A1 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004227208A (ja) 2003-01-22 2004-08-12 Matsushita Electric Ind Co Ltd ユーザ適応型行動決定装置および行動決定方法
US10101786B2 (en) 2014-12-22 2018-10-16 Intel Corporation Holistic global performance and power management

Also Published As

Publication number Publication date
JP7392027B2 (ja) 2023-12-05
WO2023199846A1 (ja) 2023-10-19

Similar Documents

Publication Publication Date Title
JP6738932B2 (ja) シミュレーションプラットフォームに配置された、機械学習モデルを訓練するためのシステム及び方法
US11181913B2 (en) Autonomous vehicle fleet model training and testing
Alsrehin et al. Intelligent transportation and control systems using data mining and machine learning techniques: A comprehensive study
CN112400192B (zh) 多模态深度交通信号控制的方法和系统
US11548518B2 (en) Subjective route comfort modeling and prediction
EP3035314B1 (en) A traffic data fusion system and the related method for providing a traffic state for a network of roads
US11398150B2 (en) Navigation analysis for a multi-lane roadway
Louati et al. Deep learning and case-based reasoning for predictive and adaptive traffic emergency management
JP7068260B2 (ja) データ処理を優先順位付けするシステム及び方法
CN111912423B (zh) 一种预测障碍物轨迹以及模型训练的方法及装置
Louati et al. Multi-agent deep neural networks coupled with LQF-MWM algorithm for traffic control and emergency vehicles guidance
US11084496B2 (en) Utilizing qualitative models to provide transparent decisions for autonomous vehicles
CN112783619A (zh) 一种任务调度方法、装置和自动驾驶系统
Liu et al. A novel method for predicting vehicle state in internet of vehicles
Awaisi et al. Deep reinforcement learning approach towards a smart parking architecture
US11727805B2 (en) Systems and methods for utilizing a machine learning model to identify public parking spaces and for providing notifications of available public parking spaces
WO2019228285A1 (zh) 一种任务调度方法及装置
Xu et al. Edge Video Analytics: A Survey on Applications, Systems and Enabling Techniques
JP7392027B2 (ja) システム
CN117408405A (zh) 一种基于交通算网的边缘算力解构及智能调度方法
JP2021076593A (ja) 構築及び位置特定技術分野に焦点を当てた動的マップ生成
US20230177959A1 (en) Vehicle accident prediction system, vehicle accident prediction method, vehicle accident prediction program, and learned model creation system
CN115454082A (zh) 车辆避障方法及系统、计算机可读存储介质和电子设备
WO2023014731A1 (en) System and methods of adaptive relevancy prediction for autonomous driving
Chen et al. The real deal: A review of challenges and opportunities in moving reinforcement learning-based traffic signal control systems towards reality

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230317

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231122

R150 Certificate of patent or registration of utility model

Ref document number: 7392027

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150