JP7251646B2 - 制御装置、方法及びシステム - Google Patents
制御装置、方法及びシステム Download PDFInfo
- Publication number
- JP7251646B2 JP7251646B2 JP2021550732A JP2021550732A JP7251646B2 JP 7251646 B2 JP7251646 B2 JP 7251646B2 JP 2021550732 A JP2021550732 A JP 2021550732A JP 2021550732 A JP2021550732 A JP 2021550732A JP 7251646 B2 JP7251646 B2 JP 7251646B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- network
- learners
- learner
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
第1の実施形態について、図面を用いてより詳細に説明する。
以下、Q学習について概説する。
制御装置20は、DQN(Deep Q Network)と称される深層学習(ディープラーニング)を使った強化学習の結果得られる学習モデルに基づきネットワークを制御してもよい。Q学習では、Qテーブルにより行動価値関数を表現しているが、DQNでは、ディープラーニングにより行動価値関数を表現する。DQNでは、最適行動価値関数を、ニューラルネットワークを使った近似関数により算出する。
続いて、第2の実施形態について図面を参照して詳細に説明する。
なお、上記実施形態にて説明した通信ネットワークシステムの構成、動作等は例示であって、システムの構成等を限定する趣旨ではない。例えば、制御装置20は、ネットワークを制御する装置と学習モデルを生成する装置に分離されていてもよい。あるいは、学習情報(学習モデル)を記憶する記憶部206は、外部のデータベースサーバ等により実現されてもよい。即ち、本願開示は、学習手段、制御手段、記憶手段等を含むシステムとして実施されてもよい。
[付記1]
それぞれが、ネットワークを制御するための行動を学習する、複数の学習器(101、212)と、
前記複数の学習器(101、212)のうち成熟した第1の学習器(101、212)の学習情報に基づいて、前記複数の学習器(101、212)のうち成熟していない第2の学習器(101、212)の学習情報を設定する、学習器管理部(102、211)と、
を備える、制御装置(20、100)。
[付記2]
前記学習器管理部(102、211)は、
前記複数の学習器(101、212)のうち成熟した第1及び第3の学習器(101、212)の学習情報に基づいて、前記第2の学習器(101、212)の学習情報を設定する、付記1に記載の制御装置(20、100)。
[付記3]
前記ネットワークの輻輳状態を示す輻輳レベルを算出する、輻輳レベル算出部をさらに備え、
前記複数の学習器(101、212)それぞれには前記輻輳レベルが割り当てられている、付記1又は2に記載の制御装置(20、100)。
[付記4]
前記学習器管理部(102、211)は、
前記第2の学習器(101、212)に割り当てられた輻輳レベルに基づき、前記学習情報を設定する第1の学習器(101、212)を選択する、付記3に記載の制御装置(20、100)。
[付記5]
前記複数の学習器それぞれが生成した学習モデルから1つの学習モデルを選択し、前記選択された学習モデルから得られる行動に基づき、前記ネットワークを制御する、制御部(204)をさらに備える、付記1乃至4のいずれか一項に記載の制御装置(20、100)。
[付記6]
複数の学習器(101、212)それぞれにおいて、ネットワークを制御するための行動を学習するステップと、
前記複数の学習器(101、212)のうち成熟した第1の学習器(101、212)の学習情報に基づいて、前記複数の学習器(101、212)のうち成熟していない第2の学習器(101、212)の学習情報を設定するステップと、
を含む方法。
[付記7]
前記学習情報を設定するステップは、
前記複数の学習器(101、212)のうち成熟した第1及び第3の学習器(101、212)の学習情報に基づいて、前記第2の学習器(101、212)の学習情報を設定する、付記6に記載の方法。
[付記8]
前記ネットワークの輻輳状態を示す輻輳レベルを算出するステップをさらに含み、
前記複数の学習器(101、212)それぞれには前記輻輳レベルが割り当てられている、付記6又は7に記載の方法。
[付記9]
前記学習情報を設定するステップは、
前記第2の学習器(101、212)に割り当てられた輻輳レベルに基づき、前記学習情報を設定する第1の学習器(101、212)を選択する、付記8に記載の方法。
[付記10]
前記複数の学習器(101、212)それぞれが生成した学習モデルから1つの学習モデルを選択し、前記選択された学習モデルから得られる行動に基づき、前記ネットワークを制御するステップをさらに含む、付記6乃至9のいずれか一項に記載の方法。
[付記11]
端末(10)と、
前記端末(10)と通信するサーバ(30)と、
前記端末(10)及び前記サーバ(30)を含むネットワークを制御する制御装置(20、100)と、
を含み、
前記制御装置(20、100)は、
それぞれが、前記ネットワークを制御するための行動を学習する、複数の学習器(101、212)と、
前記複数の学習器(101、212)のうち成熟した第1の学習器(101、212)の学習情報に基づいて、前記複数の学習器(101、212)のうち成熟していない第2の学習器(101、212)の学習情報を設定する、学習器管理部(102、211)と、
を備える、システム。
[付記12]
前記学習器管理部(102、211)は、
前記複数の学習器(101、212)のうち成熟した第1及び第3の学習器(101、212)の学習情報に基づいて、前記第2の学習器(101、212)の学習情報を設定する、付記11に記載のシステム。
[付記13]
前記ネットワークの輻輳状態を示す輻輳レベルを算出する、輻輳レベル算出部をさらに備え、
前記複数の学習器(101、212)それぞれには前記輻輳レベルが割り当てられている、付記11又は12に記載のシステム。
[付記14]
前記学習器管理部(102、211)は、
前記第2の学習器(101、212)に割り当てられた輻輳レベルに基づき、前記学習情報を設定する第1の学習器(101、212)を選択する、付記13に記載のシステム。
[付記15]
前記複数の学習器(101、212)それぞれが生成した学習モデルから1つの学習モデルを選択し、前記選択された学習モデルから得られる行動に基づき、前記ネットワークを制御する、制御部(204)をさらに備える、付記11乃至14のいずれか一項に記載のシステム。
[付記16]
コンピュータ(311)に、
複数の学習器(101、212)それぞれにおいて、ネットワークを制御するための行動を学習させる処理と、
前記複数の学習器(101、212)のうち成熟した第1の学習器(101、212)の学習情報に基づいて、前記複数の学習器(101、212)のうち成熟していない第2の学習器(101、212)の学習情報を設定する処理と、
を実行させるプログラム。
20、100 制御装置
30 サーバ
101、212、212-1~212-N 学習器
102、211 学習器管理部
201 パケット転送装置
202 特徴量算出部
203 輻輳レベル算出部
204 ネットワーク制御部
205 強化学習実行部
206 記憶部
311 プロセッサ
312 メモリ
313 入出力インターフェイス
314 通信インターフェイス
Claims (10)
- それぞれが、ネットワークを制御するための行動を学習する、複数の学習器と、
前記複数の学習器のうち成熟した第1の学習器の学習情報に基づいて、前記複数の学習器のうち成熟していない第2の学習器の学習情報を設定する、学習器管理手段と、
を備え、
前記複数の学習器は、前記ネットワークの状態レベルに応じて学習モデルを算出する、制御装置。 - 前記学習器管理手段は、
前記複数の学習器のうち成熟した第1及び第3の学習器の学習情報に基づいて、前記第2の学習器の学習情報を設定する、請求項1に記載の制御装置。 - 複数の学習器それぞれにおいて、ネットワークを制御するための行動を学習するステップと、
前記複数の学習器のうち成熟した第1の学習器の学習情報に基づいて、前記複数の学習器のうち成熟していない第2の学習器の学習情報を設定するステップと、
を含み、
前記複数の学習器は、前記ネットワークの状態レベルに応じて学習モデルを算出する方法。 - 前記学習情報を設定するステップは、
前記複数の学習器のうち成熟した第1及び第3の学習器の学習情報に基づいて、前記第2の学習器の学習情報を設定する、請求項3に記載の方法。 - 前記ネットワークの輻輳状態を示す輻輳レベルを算出するステップをさらに含み、
前記複数の学習器それぞれには前記輻輳レベルが割り当てられている、請求項3又は4に記載の方法。 - 前記複数の学習器それぞれが生成した学習モデルから1つの学習モデルを選択し、前記選択された学習モデルから得られる行動に基づき、前記ネットワークを制御するステップをさらに含む、請求項3乃至5のいずれか一項に記載の方法。
- 端末と、
前記端末と通信するサーバと、
前記端末及び前記サーバを含むネットワークを制御する制御装置と、
を含み、
前記制御装置は、
それぞれが、前記ネットワークを制御するための行動を学習する、複数の学習器と、
前記複数の学習器のうち成熟した第1の学習器の学習情報に基づいて、前記複数の学習器のうち成熟していない第2の学習器の学習情報を設定する、学習器管理手段と、
を備え、
前記複数の学習器は、前記ネットワークの状態レベルに応じて学習モデルを算出する、システム。 - 前記学習器管理手段は、
前記複数の学習器のうち成熟した第1及び第3の学習器の学習情報に基づいて、前記第2の学習器の学習情報を設定する、請求項7に記載のシステム。 - 前記ネットワークの輻輳状態を示す輻輳レベルを算出する、輻輳レベル算出手段をさらに備え、
前記複数の学習器それぞれには前記輻輳レベルが割り当てられている、請求項7又は8に記載のシステム。 - 前記複数の学習器それぞれが生成した学習モデルから1つの学習モデルを選択し、前記選択された学習モデルから得られる行動に基づき、前記ネットワークを制御する、制御手段をさらに備える、請求項7乃至9のいずれか一項に記載のシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/038455 WO2021064767A1 (ja) | 2019-09-30 | 2019-09-30 | 制御装置、方法及びシステム |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021064767A1 JPWO2021064767A1 (ja) | 2021-04-08 |
JPWO2021064767A5 JPWO2021064767A5 (ja) | 2022-06-09 |
JP7251646B2 true JP7251646B2 (ja) | 2023-04-04 |
Family
ID=75337004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021550732A Active JP7251646B2 (ja) | 2019-09-30 | 2019-09-30 | 制御装置、方法及びシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220343220A1 (ja) |
JP (1) | JP7251646B2 (ja) |
WO (1) | WO2021064767A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4175370A3 (en) * | 2021-10-28 | 2023-08-30 | Nokia Solutions and Networks Oy | Power saving in radio access network |
JP2023165310A (ja) * | 2022-05-02 | 2023-11-15 | 三菱重工業株式会社 | 学習装置、学習方法及び学習プログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009027303A (ja) | 2007-07-18 | 2009-02-05 | Univ Of Electro-Communications | 通信装置および通信方法 |
JP2013106202A (ja) | 2011-11-14 | 2013-05-30 | Fujitsu Ltd | パラメータ設定装置、コンピュータプログラム及びパラメータ設定方法 |
JP2018106466A (ja) | 2016-12-27 | 2018-07-05 | 株式会社日立製作所 | 制御装置及び制御方法 |
JP2019041338A (ja) | 2017-08-28 | 2019-03-14 | 日本電信電話株式会社 | 無線通信システム、無線通信方法および集中制御局 |
US20190141113A1 (en) | 2017-11-03 | 2019-05-09 | Salesforce.Com, Inc. | Simultaneous optimization of multiple tcp parameters to improve download outcomes for network-based mobile applications |
-
2019
- 2019-09-30 JP JP2021550732A patent/JP7251646B2/ja active Active
- 2019-09-30 US US17/640,847 patent/US20220343220A1/en active Pending
- 2019-09-30 WO PCT/JP2019/038455 patent/WO2021064767A1/ja active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009027303A (ja) | 2007-07-18 | 2009-02-05 | Univ Of Electro-Communications | 通信装置および通信方法 |
JP2013106202A (ja) | 2011-11-14 | 2013-05-30 | Fujitsu Ltd | パラメータ設定装置、コンピュータプログラム及びパラメータ設定方法 |
JP2018106466A (ja) | 2016-12-27 | 2018-07-05 | 株式会社日立製作所 | 制御装置及び制御方法 |
JP2019041338A (ja) | 2017-08-28 | 2019-03-14 | 日本電信電話株式会社 | 無線通信システム、無線通信方法および集中制御局 |
US20190141113A1 (en) | 2017-11-03 | 2019-05-09 | Salesforce.Com, Inc. | Simultaneous optimization of multiple tcp parameters to improve download outcomes for network-based mobile applications |
Also Published As
Publication number | Publication date |
---|---|
WO2021064767A1 (ja) | 2021-04-08 |
JPWO2021064767A1 (ja) | 2021-04-08 |
US20220343220A1 (en) | 2022-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wei et al. | Joint optimization of caching, computing, and radio resources for fog-enabled IoT using natural actor–critic deep reinforcement learning | |
CN111090631B (zh) | 分布式环境下的信息共享方法、装置和电子设备 | |
JP7251646B2 (ja) | 制御装置、方法及びシステム | |
Altman et al. | The evolution of transport protocols: An evolutionary game perspective | |
Math et al. | Reliable federated learning systems based on intelligent resource sharing scheme for big data internet of things | |
Hou et al. | An intelligent transaction migration scheme for RAFT-based private blockchain in Internet of Things applications | |
CN112667400A (zh) | 边缘自治中心管控的边云资源调度方法、装置及系统 | |
CN113966596A (zh) | 用于数据流量路由的方法和设备 | |
Xu et al. | An actor-critic-based transfer learning framework for experience-driven networking | |
JP7259978B2 (ja) | 制御装置、方法及びシステム | |
CN111211984B (zh) | 优化cdn网络的方法、装置及电子设备 | |
Jin et al. | A congestion control method of SDN data center based on reinforcement learning | |
CN113992527A (zh) | 网络服务功能链在线迁移方法及系统 | |
Tosounidis et al. | Deep Q-learning for load balancing traffic in SDN networks | |
Wei et al. | GRL-PS: Graph embedding-based DRL approach for adaptive path selection | |
CN114090108A (zh) | 算力任务执行方法、装置、电子设备及存储介质 | |
Liu et al. | ScaleFlux: Efficient stateful scaling in NFV | |
JP7251647B2 (ja) | 制御装置、制御方法及びシステム | |
Afrasiabi et al. | Reinforcement learning-based optimization framework for application component migration in NFV cloud-fog environments | |
Henna et al. | Distributed and collaborative high-speed inference deep learning for mobile edge with topological dependencies | |
JP7347525B2 (ja) | システム、方法及び制御装置 | |
CN115225512B (zh) | 基于节点负载预测的多域服务链主动重构机制 | |
CN113672372B (zh) | 一种基于强化学习的多边缘协同负载均衡任务调度方法 | |
Vaezpour | Deep learning-driven multi-objective dynamic switch migration in software defined networking (SDN)/network function virtualization (NFV)-based 5G networks | |
CN113170001A (zh) | 适配在网关上执行的软件应用程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220329 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230131 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230306 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7251646 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |