JP7388634B2 - Optimization method for wireless communication system, wireless communication system and program for wireless communication system - Google Patents
Optimization method for wireless communication system, wireless communication system and program for wireless communication system Download PDFInfo
- Publication number
- JP7388634B2 JP7388634B2 JP2020122301A JP2020122301A JP7388634B2 JP 7388634 B2 JP7388634 B2 JP 7388634B2 JP 2020122301 A JP2020122301 A JP 2020122301A JP 2020122301 A JP2020122301 A JP 2020122301A JP 7388634 B2 JP7388634 B2 JP 7388634B2
- Authority
- JP
- Japan
- Prior art keywords
- wireless communication
- communication systems
- communication system
- environment
- wireless
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 title claims description 220
- 238000000034 method Methods 0.000 title claims description 43
- 238000005457 optimization Methods 0.000 title claims description 23
- 230000002787 reinforcement Effects 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 19
- 230000006399 behavior Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 230000007613 environmental effect Effects 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims 2
- 230000009471 action Effects 0.000 description 19
- 230000005540 biological transmission Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- QVFWZNCVPCJQOP-UHFFFAOYSA-N chloralodol Chemical compound CC(O)(C)CC(C)OC(O)C(Cl)(Cl)Cl QVFWZNCVPCJQOP-UHFFFAOYSA-N 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000000060 site-specific infrared dichroism spectroscopy Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Mobile Radio Communication Systems (AREA)
Description
この発明は、無線通信システムの最適化方法、無線通信システムおよび無線通信システム用プログラムに係り、特に、多段階評価の学習を用いて通信状態の最適化を図る無線通信システムの最適化方法、無線通信システムおよび無線通信システム用プログラムに関する。 The present invention relates to a method for optimizing a wireless communication system, a wireless communication system, and a program for a wireless communication system, and in particular, a method for optimizing a wireless communication system that uses multi-level evaluation learning to optimize communication conditions, and a wireless communication system. Related to communication systems and programs for wireless communication systems.
より具体的には、本発明は、異なる無線通信システムが混在いして干渉し合う環境において、通信の最適化を図るものである。ここでは、各々の無線通信システムに異なる要求条件が課される場合に、要求条件の夫々を考慮した最適化が実施される。この最適化は、1つないし複数の無線通信システムに対して、機械学習や強化学習など、計算機を用いた学習により実行される。 More specifically, the present invention aims to optimize communication in an environment where different wireless communication systems coexist and interfere with each other. Here, when different requirements are imposed on each wireless communication system, optimization is performed in consideration of each of the requirements. This optimization is performed for one or more wireless communication systems by learning using a computer, such as machine learning or reinforcement learning.
無線LANは、免許不要帯において廉価に利用できる無線通信システムである。このため、その普及は急激に進み、多数の無線LAN端末が同じエリア内に混在する事態が生じている。その結果、無線LAN端末同士が互いに干渉し合うことが課題となっている。このような課題を受けて、無線LAN端末同士の干渉の影響を最小限にして、個々の、または全体のシステム容量を拡大するための技術が多数提案されている。 Wireless LAN is a wireless communication system that can be used at low cost in an unlicensed band. For this reason, the popularity of wireless LAN has rapidly progressed, and a situation has arisen in which many wireless LAN terminals coexist in the same area. As a result, wireless LAN terminals are interfering with each other, which has become a problem. In response to these issues, many techniques have been proposed to minimize the effects of interference between wireless LAN terminals and expand individual or overall system capacity.
例えば図1は、無線通信端末1~Nが、互いに干渉しあう無線LAN基地局(AP:Access Point)である例を示している。尚、図1の下段に示す無線通信端末N+1~N+Mは、上記のAPと通信を確立するスマートフォン等のユーザ端末である。この例では、APとして機能する無線通信端末1~Nの夫々が、それらの周辺における干渉情報や、無線通信端末N+1~N+Mとの接続成否の情報を取得し、無線環境情報として制御サーバ10へ送信する。
For example, FIG. 1 shows an example in which
制御サーバ10は、無線通信端末1~Nを含むAP群のスループットが最大となるように周波数チャネルや送信電力値の割り当てを算出し、その結果を制御情報として各APへ返送する。
The
ところで、無線LANを使用するアプリケーションやデバイスでは、利用シーンに応じて、重要視するべき項目が異なることがある。例えば、IoTセンサを含む無線通信システム等では、通信速度は重要ではない。一方で、エリア内に多数のIoTセンサを取り付ける場合は、当該エリア内で確立可能な通信の数を増やすことは重要である。 By the way, when it comes to applications and devices that use wireless LAN, the items that should be emphasized may differ depending on the usage scenario. For example, communication speed is not important in wireless communication systems that include IoT sensors. On the other hand, when installing a large number of IoT sensors within an area, it is important to increase the number of communications that can be established within the area.
そのため、システム容量の拡大を目指すのではなく、狭帯域であっても干渉が少ない周波数チャネルを選択することが必要になる。また、広範囲に通信したい場合には、他の無線通信システムからの干渉を重視するのではなく、他の無線通信システムに影響を及ぼさない範囲で送信電力を最大化する制御が必要になる。このように、使用する無線通信システムのアプリケーションによって、要求される制御方針は異なる。 Therefore, rather than aiming to expand system capacity, it is necessary to select a frequency channel with less interference even if it is a narrow band. Furthermore, when it is desired to communicate over a wide range, control is required to maximize transmission power within a range that does not affect other wireless communication systems, rather than focusing on interference from other wireless communication systems. In this way, the required control policy differs depending on the application of the wireless communication system used.
特に、現在日本国内でRFIDやIoT向けに開放されている920MHz帯には複数の無線通信システムが混在している。具体的には、この帯域は、例えば下記のようなシステムで利用されている。
1.位置情報や温度などのセンサ情報を定期的に伝送する無線通信システム
2.監視カメラを使用して動画を伝送する無線通信システム
3.山間部や海洋などの広域な範囲でネットワーク構築が必要な無線通信システム
In particular, multiple wireless communication systems coexist in the 920MHz band, which is currently open to RFID and IoT in Japan. Specifically, this band is used, for example, in the following systems.
1. A wireless communication system that periodically transmits sensor information such as location information and
これらの無線通信システムは、夫々異なる要求条件を持っていると同時に、同じ周波数チャネル上で混在することが想定されている。従って、これらに対する制御情報は、同じ周波数リソース上で混在することを前提として算出する必要がある。 These wireless communication systems each have different requirements, and at the same time, it is assumed that they coexist on the same frequency channel. Therefore, control information for these needs to be calculated on the assumption that they coexist on the same frequency resource.
図1に示す無線通信システムの構成例では、複数の無線通信端末1~Nが、互いに干渉しあう環境で制御サーバ10に接続されている。また、無線通信端末1~Nは、無線通信を用いて他の無線通信端末N+1~N+Mとデータ通信することができる。
In the configuration example of the wireless communication system shown in FIG. 1, a plurality of
当該システム構成では、無線通信端末1~Nの夫々が、無線環境情報を制御サーバ10に送信する。無線環境情報とは、例えば無線LAN通信の場合は、SSIDや、チャネル使用率などの周波数チャネルの利用情報のほか、無線通信端末で設定されているパラメータを意味する。このパラメータには、使用中の周波数チャネル、チャネル帯域幅、送信電力値などが含まれる。無線環境情報は、無線通信端末1~Nが、夫々の周辺に対してキャリアセンスを実施して取得する。
In this system configuration, each of the
従来の方式では、制御サーバ10は、無線環境情報を収集した後、全ての無線通信端末1~Nが、同じ仕様であり、かつ同様に通信容量を必要としていると仮定したうえで、最適化計算を実施する。最適化計算は、例えば、周波数チャネルの位置や幅、送信電力について行われる。計算の結果は、制御情報として制御サーバ10から無線通信端末1~Nに送信される。制御情報を受け取った無線通信端末1~Nは、その制御情報に従って該当設定値を変更する。
In the conventional method, after collecting wireless environment information, the
制御が定期的に、または何らかのトリガに起因して実行される場合は、初期値算出の手法に加え、周波数チャネルの利用情報などの更新された情報をもとに、再度最適パラメータが算出される。そして、その算出により制御情報が決定されて無線通信端末1~Nの夫々に送信され。
When control is executed periodically or due to some trigger, the optimal parameters are calculated again based on the initial value calculation method and updated information such as frequency channel usage information. . Then, control information is determined by the calculation and transmitted to each of the
図2は、従来の制御例についてのフローチャートである。S100では、APとして機能する無線通信端末1~N夫々の無線環境情報が収集される。
FIG. 2 is a flowchart of a conventional control example. In S100, wireless environment information of each of
S102では、収集された情報をもとに最適パラメータが算出される。従来の制御では、無線通信端末1~Nの全てについて同様の通信容量が必要だと判断される。このため、全ての無線通信端末1~Nに対して同じ評価関数が使用され、繰り返し計算や遺伝的アルゴリズムなどのヒューリスティックな手法により最適と考えられる無線通信パラメータが算出される。
In S102, optimal parameters are calculated based on the collected information. In conventional control, it is determined that all
算出されたパラメータ情報は、制御情報として無線通信端末1~Nに送信される(S104)。
The calculated parameter information is transmitted to the
以後、制御トリガの発生が認められるまで(S106)、制御終了が判定されない限り(S108)、待機の処理が採られる(S110)。そして、制御トリガが発生すれば、S100以降の処理が再び実行される。ただし、ヒューリスティックな手法だけでは複数の無線通信システムの環境や制御情報を十分に考慮することが難しいため、機械学習や強化学習を使用した最適化も提案されている。 Thereafter, a standby process is adopted (S110) until the occurrence of a control trigger is recognized (S106), and unless it is determined that the control has ended (S108). Then, if a control trigger occurs, the processes from S100 onwards are executed again. However, since it is difficult to fully consider the environment and control information of multiple wireless communication systems using heuristic methods alone, optimization using machine learning and reinforcement learning has also been proposed.
多様な通信デバイスや無線通信を利用するサービス・アプリケーションに関して、無線通信リソースを最適化するために、繰返し計算や機械学習を取り入れた手法が提案されている。これらの手法は、全ての無線通信システムが、通信容量の拡大など、統一された目的を持つことを前提としている。 Methods that incorporate iterative calculations and machine learning have been proposed to optimize wireless communication resources for a variety of communication devices and services and applications that use wireless communication. These methods assume that all wireless communication systems have a unified purpose, such as increasing communication capacity.
しかしながら、実際には、複数の異なる無線通信システムが混在する環境下で、各々のシステムに同じ要求条件が課されるとは限らない。つまり、現実には、最適化の目的或いは目標がシステム毎に異なる事態が生じ得る。単一的な最適化を目指す従来の手法は、そのような事態に対して不十分である。この場合、無線デバイスの夫々に対する要求条件、或いは利用シーンの夫々に応じた要求条件が反映された最適化を実現することが必要になる。 However, in reality, in an environment where a plurality of different wireless communication systems coexist, the same requirements are not necessarily imposed on each system. That is, in reality, a situation may arise in which the purpose or goal of optimization differs from system to system. Conventional methods that aim at single optimization are insufficient for such situations. In this case, it is necessary to realize optimization that reflects the requirements for each wireless device or the requirements for each usage scene.
本発明は、複数の異なる制約条件、或いは複数の異なる要求条件が課された複数の無線通信システムが、同じ環境の中に干渉しながら混在する状況において、無線通信システムの設定パラメータや利用条件を、計算機を使用した学習を用いて算出する無線通信システムの最適化方法等を提供することを目的とする。 The present invention aims to improve the configuration parameters and usage conditions of a wireless communication system in a situation where multiple wireless communication systems with multiple different constraints or different requirements coexist in the same environment while interfering with each other. The purpose of the present invention is to provide a method for optimizing a wireless communication system using computer-based learning.
第1の発明は、上記の目的を達成するため、異なる複数の無線通信システムが混在する無線通信環境において実行される無線通信システムの最適化方法であって、前記複数の無線通信システムに属する無線通信端末から、無線通信に関する状態を含む無線環境情報を検出するステップと、前記複数の無線通信システムの夫々に課される条件に対応して準備されたエージェントの夫々に、前記無線環境情報を提供するステップと、前記エージェントの夫々に、前記条件および前記無線環境情報を適用させた強化学習を計算機に実施させるステップと、前記複数の無線通信システムの夫々について、前記無線通信環境の下での最適な制御パラメータを、前記強化学習の結果に基づいて計算機に算出させるステップと、前記制御パラメータを、対応する無線通信システムに属する前記無線通信端末に提供するステップと、を含むことが望ましい。 In order to achieve the above object, a first invention is a method for optimizing a wireless communication system that is executed in a wireless communication environment where a plurality of different wireless communication systems coexist, the method comprising: Detecting wireless environment information including a state related to wireless communication from a communication terminal; and providing the wireless environment information to each of the agents prepared in accordance with conditions imposed on each of the plurality of wireless communication systems. a step of causing a computer to perform reinforcement learning applying the conditions and the wireless environment information to each of the agents; The method preferably includes the steps of causing a computer to calculate control parameters based on the results of the reinforcement learning, and providing the control parameters to the wireless communication terminal belonging to the corresponding wireless communication system.
また、第2の発明は、異なる複数の無線通信システムが混在する無線通信環境において動作する無線通信システムであって、前記複数の無線通信システムから無線環境情報を受け取ると共に、当該複数の無線通信システムに制御情報を提供する制御サーバを備え、当該制御サーバは、前記複数の無線通信システムに属する無線通信端末から、無線通信に関する状態を含む無線環境情報を検出する処理と、前記複数の無線通信システムの夫々に課される条件に対応して準備されたエージェントの夫々に、前記無線環境情報を提供する処理と、前記エージェントの夫々に前記条件および前記無線環境情報を適用させた強化学習を実施する処理と、前記複数の無線通信システムの夫々について、前記無線通信環境の下での最適な制御パラメータを、前記強化学習の結果に基づいて算出する処理と、前記制御パラメータを、対応する無線通信システムに属する前記無線通信端末に提供する処理と、を実行することが望ましい。 Further, a second invention is a wireless communication system that operates in a wireless communication environment in which a plurality of different wireless communication systems coexist, the wireless communication system receiving wireless environment information from the plurality of wireless communication systems, and receiving wireless environment information from the plurality of wireless communication systems. a control server that provides control information to the plurality of wireless communication systems; A process of providing the wireless environment information to each of the agents prepared in accordance with the conditions imposed on each of the agents, and reinforcement learning in which the conditions and the wireless environment information are applied to each of the agents. a process of calculating optimal control parameters under the wireless communication environment for each of the plurality of wireless communication systems based on the results of the reinforcement learning; It is desirable to perform a process provided to the wireless communication terminal belonging to the wireless communication terminal.
また、第3の発明は、複数の無線通信システムから無線環境情報を受け取ると共に当該複数の無線通信システムに制御情報を提供する制御サーバに実装される無線通信システム用プログラムであって、当該制御サーバに、前記複数の無線通信システムに属する無線通信端末から、無線通信に関する状態を含む無線環境情報を検出する処理と、前記複数の無線通信システムの夫々に課される条件に対応して準備されたエージェントの夫々に、前記無線環境情報を提供する処理と、前記エージェントの夫々に前記条件および前記無線環境情報を適用させた強化学習を実施する処理と、前記複数の無線通信システムの夫々について、前記複数の無線通信システムが動作している無線通信環境の下での最適な制御パラメータを、前記強化学習の結果に基づいて算出する処理と、前記制御パラメータを、対応する無線通信システムに属する前記無線通信端末に提供する処理と、を実行させるものであることが望ましい。 Further, a third invention is a program for a wireless communication system implemented in a control server that receives wireless environment information from a plurality of wireless communication systems and provides control information to the plurality of wireless communication systems, the program A process for detecting wireless environment information including a state related to wireless communication from wireless communication terminals belonging to the plurality of wireless communication systems, and a process prepared in response to conditions imposed on each of the plurality of wireless communication systems. a process of providing the wireless environment information to each of the agents; a process of implementing reinforcement learning in which the conditions and the wireless environment information are applied to each of the agents; and a process of performing reinforcement learning on each of the multiple wireless communication systems. A process of calculating optimal control parameters under a wireless communication environment in which a plurality of wireless communication systems are operating based on the results of the reinforcement learning; It is desirable that the communication terminal executes the processing provided to the communication terminal.
本発明によれば、無線通信環境の中に、異なる複数の無線通信システムが混在する場合に、無線通信システムに課される条件毎に強化学習のためのエージェントが準備される。そして、エージェントの夫々に対応する条件を適用させて強化学習を進めることができる。このため、本発明によれば、複数の無線通信システムが同じ環境の中に干渉しながら混在する状況において、無線通信システムの設定パラメータや利用条件を、夫々の条件毎に最適化することができる。 According to the present invention, when a plurality of different wireless communication systems coexist in a wireless communication environment, an agent for reinforcement learning is prepared for each condition imposed on the wireless communication system. Reinforcement learning can then proceed by applying conditions corresponding to each agent. Therefore, according to the present invention, in a situation where a plurality of wireless communication systems coexist and interfere with each other in the same environment, the setting parameters and usage conditions of the wireless communication systems can be optimized for each condition. .
実施の形態1.
[実施の形態1の構成]
本発明の実施形態1の無線通信システムは、図1に示す構成例により実現することができる。図1において、中段に示す無線通信端末1~Nは、夫々Access Point(AP)として機能する。これらは、図1の下段に示す無線通信端末N+1~N+Mと通信することができる。無線通信端末N+1~N+Mは、スマートフォン、IoT用のセンサ、スマートメータ等で構成されている。このように、図1に示す構成には、同じ周波数リソースを共用するが、規格や仕様が異なる複数の無線通信システムが含まれている。
[Configuration of Embodiment 1]
The wireless communication system according to the first embodiment of the present invention can be realized by the configuration example shown in FIG. In FIG. 1,
本実施形態の無線通信システムは、制御サーバ10を備えている。制御サーバ10は、通信インターフェース、プロセッサユニット、メモリ等のハードウェアを備えている。制御サーバ10は、これらのハードウェアが、メモリ内に格納されているプログラムに従って処理を進めることにより、後述する機能を実現する。
The wireless communication system of this embodiment includes a
制御サーバ10は、APとして機能する無線通信端末1~Nに対して、制御情報を提供することができる。制御情報には、例えば、利用可能な周波数リソースや送信電力等の情報が含まれている。一方、無線通信端末1~Nは、制御サーバ10に対して無線環境情報を送信することができる。無線環境情報には、無線通信端末1~N夫々の周辺における干渉情報や、無線通信端末N+1~N+Mとの接続成否の情報が含まれている。
The
また、制御サーバ10には、無線環境情報等に基づいて、制御情報に含める各種パラメータを最適化するための学習機能と、それら各種パラメータを、その学習の結果に基づいて決定する機能とが備わっている。
The
[強化学習の概要] [Overview of reinforcement learning]
本実施形態において、制御情報に含める各種パラメータの最適化には、強化学習が用いられる。図3は、一般的な強化学習のモデル図を示す。図3に示すモデルには、学習を行う対象としてエージェント12が存在する。エージェント12は、事象の観測タイミングをtとして、一意な環境14の中で、現在の状態S(t)および報酬R(t)から行動A(t+1)を算出して実行する。その結果、状態S(t+1)が実現される。この状態S(t+1)から、行動を評価する報酬R(t+1)を得て、次の行動が算出される。
In this embodiment, reinforcement learning is used to optimize various parameters included in the control information. FIG. 3 shows a general reinforcement learning model diagram. The model shown in FIG. 3 includes an
以下の説明では、sおよびSが状態、aおよびAが行動、rおよびRが報酬を夫々表すものとする。ここで、小文字は個々のエージェント(最適化対象)に対するパラメータ、大文字はその集合(複数のエージェント)に対するパラメータであることを意味する。また、各パラメータの添え字tは、そのパラメータが、観測タイミングtにおける値であることを示し、St,At,RtはそれぞれS(t),A(t),R(t)と同じであるものとする。 In the following description, it is assumed that s and S represent states, a and A represent actions, and r and R represent rewards, respectively. Here, lowercase letters mean parameters for individual agents (optimization targets), and uppercase letters mean parameters for the set (multiple agents). Also, the subscript t of each parameter indicates that the parameter is the value at observation timing t, and St, At, and Rt are the same as S(t), A(t), and R(t), respectively. shall be taken as a thing.
図3に示す強化学習は、以下のステップの繰り返しにより進められる。
1.エージェント12は、環境14から状態S(t)と報酬R(t)を受け取り、方策πに基づいて決定した行動A(t)を環境14に返す。
2.環境14は、エージェント12から受け取った行動A(t)と現在の状態S(t)とに基づいて次の状態S(t+1)に変化し、遷移後の状態S(t+1)と報酬R(t+1)をエージェント12に提供する。尚、報酬Rは、その直前の行動Aの良し悪しを示すスカラー量である。
The reinforcement learning shown in FIG. 3 proceeds by repeating the following steps.
1. The
2. The
ある状態Sに対するエージェントの行動がAであるとした場合、現時点から無限の未来までに得ることのできる報酬Rの総和、つまり収益Gは、次式のようになる。
但し、γは0≦γ≦1であり、未来の報酬の影響をどの程度収益として評価するかを調整するパラメータである。 However, γ is 0≦γ≦1, and is a parameter that adjusts to what extent the influence of future remuneration is evaluated as profit.
強化学習によるQ学習では、行動aの価値が以下の関数で評価される。
但し、Eは期待値を示す関数である。また、Qπは、状態sから行動aをとるエージェントが方策πに従って行動をとっていった場合の期待値を表す価値関数(以下、「Q関数」とする)である。 However, E is a function indicating an expected value. Further, Q π is a value function (hereinafter referred to as “Q function”) representing the expected value when an agent who takes action a from state s takes action according to policy π.
図3に示す強化学習は、このQ関数を最大化するように進められる。この学習は、例えば、状態sで行動aを行ったときの収益Gを推定するQ関数を、次式のアルゴリズムで求めることにより進めることができる。
ここで、pは学習率と呼ばれるパラメータで、機械学習の設計者が決める代数である。通常は1未満の小さな値に設定される。また、maxQは、理想的に取得すると考えられるQ関数の最大値を示す。Q関数の学習は、各時間tごとに、次の時間t+1に取る行動によって得られるQ値を全て見積もり、その中で最大のものを用いてQ 値を更新するというものである。 Here, p is a parameter called the learning rate, which is an algebra determined by the machine learning designer. Usually it is set to a small value less than 1. Moreover, maxQ indicates the maximum value of the Q function that is considered to be ideally obtained. Learning of the Q function involves estimating all the Q values obtained by actions taken at the next time t+1 at each time t, and updating the Q value using the largest value among them.
[実施の形態1の特徴]
図4は、本実施形態の無線通信システムにおいて実施される強化学習のモデルを示す。本実施形態では、条件の異なる複数の無線通信システムを対象とした最適化が図られる。複数の無線通信システムは、夫々の条件に基づいてグループ化することができる。図4に示すモデルでは、3つのグループが存在し、グループ毎にエージェントが存在している。
[Features of Embodiment 1]
FIG. 4 shows a reinforcement learning model implemented in the wireless communication system of this embodiment. In this embodiment, optimization is aimed at a plurality of wireless communication systems with different conditions. Multiple wireless communication systems can be grouped based on their respective conditions. In the model shown in FIG. 4, there are three groups, and an agent exists for each group.
図4に示すエージェント12-1,12-3,12-3は、夫々のグループに属するユーザiの行動を評価する。例えば、エージェント12-1は、グループ1に含まれるユーザiの状態Sから、報酬Rを計算し、行動Aを計算することができる。また、エージェント12-2,12-3は、夫々に属するユーザiの状態Sから、報酬Rを計算して行動Aを決定する。
Agents 12-1, 12-3, and 12-3 shown in FIG. 4 evaluate the behavior of user i belonging to each group. For example, agent 12-1 can calculate reward R and action A from state S of user i included in
図4に示す3つのエージェント12-1,12-2,12-3は、夫々に提供される報酬Rおよび状態Sに基づいて、夫々異なる行動Aを出力することがある。そして、図4に示すモデルでは、同一の環境14から、エージェント12-1,12-2,12-3の夫々に対して、異なる報酬R並びに異なる状態Sが提供されることがある。
The three agents 12-1, 12-2, and 12-3 shown in FIG. 4 may output different actions A based on the reward R and state S provided to each agent. In the model shown in FIG. 4, different rewards R and different states S may be provided to each of the agents 12-1, 12-2, and 12-3 from the
以下、図5および図6を参照して、同じ無線通信規格を満たす4つの異なる無線通信端末が存在する場合を例にして説明を続ける。図5は、本例で制御対象となる4つの端末についての要求条件等を整理して表した図である。また、図6は、本例で許容されるアグリゲーションの例を示す。 Hereinafter, with reference to FIGS. 5 and 6, the description will be continued using as an example a case where there are four different wireless communication terminals that meet the same wireless communication standard. FIG. 5 is a diagram arranging and expressing the requirements for the four terminals to be controlled in this example. Further, FIG. 6 shows an example of aggregation allowed in this example.
本例では、全ての端末への周波数リソースの割り当て方(周波数チャネル位置および周波数チャネル幅)が制御される。周波数リソースとしては、チャネル1~4の4つの単位チャネルが存在する。これらのチャネルは、2つまたは4つをアグリゲーションして使用することができる。
In this example, the method of allocating frequency resources (frequency channel position and frequency channel width) to all terminals is controlled. There are four unit channels,
また、4つの無線通信端末に対する要求条件は、各々以下の通りである。
1.無線通信端末1については、センサネットワークで親機として利用するため、「多数の端末(センサ)からの上り送信成功率の最大化」が要求条件となる。
2.無線通信端末2については、広域センサネットワークで利用するため、「伝送到達距離の最大化」が要求条件となる。
3.無線通信端末3および4については、データ配信で親機として使用するため、「配下の端末への下りスループットの最大化」が要求条件となる。
Further, the requirements for the four wireless communication terminals are as follows.
1. Since the
2. Since the
3. Since the
尚、夫々の無線通信端末には、上記の要求条件の他にも、当然ながら幾つかの要求条件が課される。上記の要求条件は、夫々の無線通信端末に要求される幾つかの条件の中で、夫々の性質に応じて最も優先されるべき条件である。 Note that, in addition to the above-mentioned requirements, several other requirements are naturally imposed on each wireless communication terminal. The above requirements are the conditions that should be given the highest priority among the several conditions required of each wireless communication terminal, depending on the characteristics of each.
無線通信端末1をエージェント1、無線通信端末2をエージェント2、無線通信端末3および4をエージェント3とした場合、各々の報酬の計算は、下記のように設定することができる。
When
エージェント1の要求条件は、上記の通り「多数端末からの上り送信成功率の最大化」である。従って、エージェント1は、無線通信端末1の配下で上り通信を実施する送信端末の送信成功率が最大化されるように行動Aを決定する。本例では、全ての端末が無LANでキャリアセンスを実施できるものとする。この場合、送信成功率は次式により表すことができる。
但し、上記の式中に示すNは、同じチャネル内に存在する送信端末の総数である。ここで、上りトラヒックについては、同じチャネル内の全ての親機の配下にある端末が送信端末となる。また、下りトラヒックの場合は、同じチャネル内の全ての親機が送信端末となる。そして、上記のNは、上りトラヒックの送信端末の数と、下りトラヒックの送信端末の数との和である。また、上記式中のτは、各送信端末が送信を行う確率である。この確率は、上記の総数Nに基づいて計算することができる。更に、上記式中のn’は制御対象となっている親機に接続される送信端末の数である。 However, N shown in the above formula is the total number of transmitting terminals existing in the same channel. Here, for uplink traffic, all terminals under the master device within the same channel become transmitting terminals. Furthermore, in the case of downlink traffic, all base stations within the same channel become transmitting terminals. The above N is the sum of the number of uplink traffic transmission terminals and the number of downlink traffic transmission terminals. Further, τ in the above formula is the probability that each transmitting terminal transmits. This probability can be calculated based on the total number N mentioned above. Furthermore, n' in the above formula is the number of transmitting terminals connected to the master device being controlled.
エージェント2の要求条件は、「伝送到達距離の最大化」である。このため、エージェント2は、伝搬特性、電力密度、フレームエラー率などを考慮する。複数の周波数チャネルから選択可能である場合、伝搬特性を考慮した報酬、即ち伝送到達距離Dは下記の数式で表現できる。
但し、上記式中のLは、伝搬による減衰を求める関数であり、L-1はその逆関数である。また、fcは伝送信号の中心周波数であり、Bは帯域幅である。 However, L in the above formula is a function for determining attenuation due to propagation, and L -1 is its inverse function. Further, fc is the center frequency of the transmission signal, and B is the bandwidth.
エージェント3については、「配下の端末への下りスループットの最大化」が要求条件である。このため、エージェント3は、例えば、エージェント1の場合と同様に、全ての端末が無線LANでキャリアセンスを実施できるとした場合のスループットを評価する。この場合、そのスループットは次式により算出することができる。
但し、上記式中のE[L]は、送信成功時のビット数平均であり、E[I]は平均待ち時間である。また、式中のTsは平均送信フレーム時間であり、Tcは衝突で浪費する平均時間である。 However, E[L] in the above formula is the average number of bits at the time of successful transmission, and E[I] is the average waiting time. Furthermore, Ts in the formula is the average transmission frame time, and Tc is the average time wasted due to collisions.
従来の方式による最適化の制御は、全ての端末について等しくスループットが最大化されることを目指して実施される。この場合、端末間の干渉が生じないようにチャネルの割り当てが決定される。より具体的には、図7に示すように、無線通信端末1~4に対して、夫々一つずつチャネルが割り当てられる。つまり、下りの送信が主となる無線通信端末3および4については、送信端末間の衝突が殆どないにも関わらず、狭い帯域幅で周波数リソースが割り当てられる。その結果、無線通信端末3および4のスループットは、本来実現できるスループットより低いものとなってしまう。
Optimization control using the conventional method is performed with the aim of maximizing throughput equally for all terminals. In this case, channel allocation is determined so that interference between terminals does not occur. More specifically, as shown in FIG. 7, one channel is allocated to each of
これに対して、本実施形態では、チャネルの割り当てが、例えば図8に示すように決定される。ここでは、無線通信端末1に対してチャネル2が、無線通信端末2に対してチャネル1が割り当てられている。無線通信端末1,2は、センサネットワークの構成要素であるため、外部からの干渉の影響を受けやすい。このため、これらの端末1,2には、狭い帯域幅の単位チャネルが割り当てられる。更に、無線通信端末2には、広域での通信が求められる。信号の伝搬ロスは、通信の中心周波数が低いほど小さくなる。無線通信端末2に割り当てられたチャネル1は、最も周波数が低く、信号の伝搬ロスが最小となると考えられるチャネルである。
In contrast, in this embodiment, channel allocation is determined as shown in FIG. 8, for example. Here,
一方、スループットの最大化が重要である無線通信端末3および4に対しては、単位チャネルを2つアグリゲーションしたチャネル3+4が割り当てられる。この割り当てによれば、無線通信端末3と4は互いに干渉することになる。しかし、それらは何れも下りトラヒックが主たるトラヒックであるため、送信端末は主に親機の2台となる。この場合、同じ周波数チャネル内で共存による衝突が生ずる確率は低い。このため、2台の端末が同じチャネル内で共存していても、互いが常にチャネルを取り合うようなシナリオでなければ、アグリゲーションにより帯域幅を大きくすることで、瞬時スループットが増大する効果が見込める。
On the other hand,
以上説明した通り、本実施形態の無線通信システムによれば、要求条件等の異なる複数の無線通信端末に対して、それぞれ異なるエージェントを設定して最適化のための強化学習を進めることができる。そして、夫々の端末の行動を、夫々に対する要求条件等に応じて、個別独立に最適化することができる。このため、本実施形態の無線通信システムによれば、要求条件等の異なる異種の端末が混在するエリアにおいて、夫々の端末に、夫々に求められている要求に関して、最大限のパフォーマンスを発揮させることができる。 As described above, according to the wireless communication system of this embodiment, reinforcement learning for optimization can be performed by setting different agents for a plurality of wireless communication terminals with different requirements and the like. Then, the behavior of each terminal can be individually and independently optimized according to the requirements for each terminal. Therefore, according to the wireless communication system of the present embodiment, in an area where different types of terminals with different requirements etc. coexist, it is possible to make each terminal exhibit maximum performance in relation to the requirements required of each terminal. I can do it.
なお、本例は簡易な例であるため、例えばマルコフ過程でのモデル化も可能であるが、現実の環境は、隠れ端末などの影響でモデル化が難しい複雑なものとなる。このため、現実の環境を想定した場合、強化学習が必要となる。また、環境が複雑である場合は、数式モデルではなく、シミュレーションや実空間での測定結果を利用する方法、或いはデータベースを使用して状態や報酬を測る方法などを用いてもよい。 Note that since this example is a simple example, modeling using, for example, a Markov process is also possible, but the actual environment is complex and difficult to model due to hidden terminals and the like. For this reason, reinforcement learning is required when assuming a real environment. Furthermore, if the environment is complex, a method that uses simulation or measurement results in real space, or a method that measures states and rewards using a database may be used instead of a mathematical model.
また、本例では、周波数リソースを割り当てる制御の例を示したが、本発明はこれに限定されるものではない。上記の例の他にも、送信電力、送信頻度(もしくはランダムアクセスに要する平均待ち時間)、無線LANのRTS/CTS設定などの無線通信システムに関するパラメータ、接続可能とする端末数、消費電力値など、無線通信に使用するリソースや設定値は、制御の対象とすることができる。 Further, although this example shows an example of control for allocating frequency resources, the present invention is not limited to this. In addition to the above examples, parameters related to wireless communication systems such as transmission power, transmission frequency (or average waiting time required for random access), wireless LAN RTS/CTS settings, number of terminals that can be connected, power consumption values, etc. , resources and setting values used for wireless communication can be controlled.
実施の形態2.
次に、図1と共に図9を参照して、本発明の実施の形態2について説明する。本実施形態の無線通信システムは、実施の形態1の場合と同様に、図1に示す構成により実現することができる。
Next, a second embodiment of the present invention will be described with reference to FIG. 9 together with FIG. The wireless communication system of this embodiment can be realized by the configuration shown in FIG. 1, as in the case of
図9は、本実施形態の無線通信システムにおいて実施される強化学習のモデルを示す。図9に示すモデルには、実施の形態1の場合と同様に、複数のエージェント12-1,12-2,12-3が含まれている。そして、このモデルでは、異なる複数の環境が評価の対象となることが想定されている。より具体的には、図9に示すモデルでは、エージェント12-1,12-2,12-3の夫々が選択した行動を返す環境として、複数の環境が存在している。この場合、選択された行動を評価するために環境を選択する必要が生ずる。 FIG. 9 shows a reinforcement learning model implemented in the wireless communication system of this embodiment. The model shown in FIG. 9 includes a plurality of agents 12-1, 12-2, and 12-3, as in the first embodiment. This model assumes that multiple different environments will be subject to evaluation. More specifically, in the model shown in FIG. 9, there are a plurality of environments in which the actions selected by each of the agents 12-1, 12-2, and 12-3 are returned. In this case, it becomes necessary to select an environment in order to evaluate the selected behavior.
エージェント12-1,12-2,12-3の夫々が、要求条件の違いで定義付けられている場合、環境は、規格の違いや通信システムの違いにより定義付けることができる。例えば、IoT向けの無線通信システムとしては、IEEE 802.11ah、Wi-SUN、或いはLoRaが存在する。これらのシステムでは、規定されている周波数帯域幅や変復調方式が異なっている。このため、受信電力値と干渉電力値が同じであったとしても、送信フレームがエラーとなる確率はシステム毎に異なった値となる。 When each of the agents 12-1, 12-2, and 12-3 is defined by different requirements, the environment can be defined by different standards or communication systems. For example, wireless communication systems for IoT include IEEE 802.11ah, Wi-SUN, and LoRa. These systems have different prescribed frequency bandwidths and modulation/demodulation methods. Therefore, even if the received power value and the interference power value are the same, the probability that a transmitted frame will have an error will be a different value for each system.
このため、異なる無線通信システムが混在し、それらに干渉が生ずるエリアでは、一方のシステムに対する干渉の影響を、他方のシステムに対する影響より大きく見積もる必要が生ずる。同様の事情は、例えば消費電力の評価に関しても発生する。即ち、実機について比較すれば、無線通信端末のハード構成は必ずしも均一ではなく、バッテリ容量の大きいものと、その容量が小さいものとが同じエリアに混在することがある。そして、消費電力の影響は、バッテリ容量の小さい端末では、バッテリ容量の大きい端末より、大きく見積もる必要がある。 Therefore, in an area where different wireless communication systems coexist and interference occurs between them, it is necessary to estimate the influence of interference on one system to be greater than the influence on the other system. A similar situation occurs, for example, regarding evaluation of power consumption. That is, when comparing actual devices, the hardware configurations of wireless communication terminals are not necessarily uniform, and devices with large battery capacities and devices with small battery capacities may coexist in the same area. The influence of power consumption needs to be estimated to be larger for a terminal with a small battery capacity than for a terminal with a large battery capacity.
更に、マルチRFの機能を具備する無線通信端末が制御対象である場合は、周波数帯域毎に環境を評価する必要が生ずる。例えば、920MHz、2.4GHz、5GHzのトライバンドで動作する無線通信端末については、それらの何れの周波数帯域で動作しているかに応じて、環境評価の手法を切り替える必要が生ずる。 Furthermore, if a wireless communication terminal with multi-RF functionality is to be controlled, it becomes necessary to evaluate the environment for each frequency band. For example, for wireless communication terminals that operate in tri-bands of 920 MHz, 2.4 GHz, and 5 GHz, it is necessary to switch the environmental evaluation method depending on which of these frequency bands the terminal operates in.
図9に示すモデルには、3つの環境14-1、14-2、14-3が準備されている。これらの環境14-1、14-2、14-3は、制御の対象となる複数の無線通信端末について成立する可能性のある環境を網羅するように整理されている。このため、本実施形態では、制御サーバ10の管理下にある全ての無線通信端末は、環境14-1、14-2、14-3の何れかの下で動作していることになる。
In the model shown in FIG. 9, three environments 14-1, 14-2, and 14-3 are prepared. These environments 14-1, 14-2, and 14-3 are arranged to cover environments that may exist for a plurality of wireless communication terminals to be controlled. Therefore, in this embodiment, all wireless communication terminals under the control of the
図9に示すモデルは、環境選択部16を備えている。環境選択部16は、エージェント12-1が置かれている環境を、3つの環境14-1、14-2、14-3の中から選択し、選択した環境に行動A1を提供する。これにより、異なる複数の環境が併存する状況下であっても、エージェント12-1の行動A1は正しい環境に戻されることになる。環境選択部16は、エージェント12-2,12-3についても、同様の環境選択を行う。これにより、エージェント12-2,12-3によって選択される行動A2,A3についても、夫々適切な環境に戻されることになる。環境選択部16の機能は、制御サーバ10が、無線環境情報に基づいて無線通信端末1~Nの置かれた環境を判断することにより実現される。
The model shown in FIG. 9 includes an
図9に示すモデルは、更に、エージェント選択部18を備えている。エージェント選択部18は、環境14-1、14-2、14-3の夫々から提供される状態S1、S2、S3並びに報酬R1、R2,R3を、適切なエージェントに提供する。エージェント選択部18の機能は、制御サーバ10が、無線通信端末1~Nのうち適切なものに対して制御情報を提供することにより実現される。
The model shown in FIG. 9 further includes an
以上説明した通り、図9に示すモデルによれば、同じ周波数リソース内で共存する複数の無線通信システムを対象として最適化の制御を行う場合に、複数の環境を適宜切り替えて、選択された行動Aを評価することができる。同様に、図9に示すモデルは、複数の周波数帯域を適宜切り替えて動作するような無線通信端末が制御対象に含まれる場合にも、複数の環境を切り替えることで、選択された行動Aの有用性を適切に評価することができる。 As explained above, according to the model shown in FIG. 9, when performing optimization control targeting multiple wireless communication systems that coexist within the same frequency resource, multiple environments can be appropriately switched to determine the selected behavior. A can be evaluated. Similarly, even when the control target includes a wireless communication terminal that operates by switching between multiple frequency bands as appropriate, the model shown in FIG. be able to appropriately evaluate gender.
10 制御サーバ
12,12-1,12-2,12-3 エージェント
14,14-1,14-2,14-3 環境
16 環境選択部
18 エージェント選択部
10
Claims (7)
前記複数の無線通信システムの夫々に属する一つ以上の無線通信端末から、無線通信に関する状態を含む無線環境情報を検出するステップと、
前記複数の無線通信システムの夫々に課される条件に対応して準備されたエージェントの夫々に、当該エージェントに対応する前記条件が課される無線通信システムに属する前記無線通信端末から検出した前記無線環境情報を提供するステップと、
前記エージェントの夫々を対象として、前記条件および前記無線環境情報を適用させた強化学習を計算機に実施させるステップと、
前記複数の無線通信システムの夫々について、前記無線通信環境の下で当該無線通信システムに課される前記条件を満たすための制御パラメータを、前記強化学習の結果に基づいて計算機に算出させるステップと、
前記制御パラメータを、対応する無線通信システムに属する前記無線通信端末に提供するステップと、
を含み、
前記条件には、互いに異なる複数の条件が含まれる無線通信システムの最適化方法。 A wireless communication system optimization method executed in a wireless communication environment where a plurality of different wireless communication systems coexist while sharing the same frequency resource, the method comprising:
detecting wireless environment information including status regarding wireless communication from one or more wireless communication terminals belonging to each of the plurality of wireless communication systems;
Each of the agents prepared in accordance with the conditions imposed on each of the plurality of wireless communication systems receives the wireless communication detected from the wireless communication terminal belonging to the wireless communication system to which the condition corresponding to the agent is imposed. providing environmental information;
causing a computer to perform reinforcement learning applying the conditions and the wireless environment information to each of the agents;
for each of the plurality of wireless communication systems, causing a computer to calculate control parameters for satisfying the conditions imposed on the wireless communication system under the wireless communication environment, based on the results of the reinforcement learning;
providing the control parameters to the wireless communication terminal belonging to a corresponding wireless communication system;
including;
A wireless communication system optimization method , wherein the conditions include a plurality of mutually different conditions .
前記強化学習では、前記エージェントの報酬、状態および行動を、同一の条件毎に設定して最適化が目指される請求項1に記載の最適化方法。 The plurality of wireless communication systems include wireless communication systems to which different conditions are imposed,
2. The optimization method according to claim 1, wherein the reinforcement learning aims at optimizing the agent's reward, state, and behavior by setting them for each same condition.
前記強化学習では、前記無線通信システムの夫々について最も優先されるべき要求条件を、対応するエージェントに適用させて最適化が目指される請求項2に記載の最適化方法。 The conditions imposed on each of the plurality of wireless communication systems include a plurality of requirements,
3. The optimization method according to claim 2, wherein the reinforcement learning aims at optimization by applying the highest priority requirement for each of the wireless communication systems to the corresponding agent.
前記強化学習では、前記無線通信規格毎に異なる条件を設定して最適化が目指される請求項2に記載の最適化方法。 The wireless communication environment includes a mixture of multiple wireless communication systems that comply with different wireless communication standards,
3. The optimization method according to claim 2, wherein the reinforcement learning aims at optimization by setting different conditions for each of the wireless communication standards.
前記強化学習では、前記エージェントの夫々に対応する環境評価を、前記複数の環境の夫々毎に設定して最適化が目指される請求項1に記載の最適化方法。 The wireless communication environment includes a mixture of different environments,
2. The optimization method according to claim 1, wherein the reinforcement learning aims at optimization by setting an environment evaluation corresponding to each of the agents for each of the plurality of environments.
前記複数の無線通信システムの夫々から無線環境情報を受け取ると共に、当該複数の無線通信システムの夫々に制御情報を提供する制御サーバを備え、
当該制御サーバは、
前記複数の無線通信システムの夫々に属する一つ以上の無線通信端末から、無線通信に関する状態を含む無線環境情報を検出する処理と、
前記複数の無線通信システムの夫々に課される条件に対応して準備されたエージェントの夫々に、当該エージェントに対応する前記条件が課される無線通信システムに属する前記無線通信端末から検出した前記無線環境情報を提供する処理と、
前記エージェントの夫々を対象として、前記条件および前記無線環境情報を適用させた強化学習を実施する処理と、
前記複数の無線通信システムの夫々について、前記無線通信環境の下で当該無線通信システムに課される前記条件を満たすための制御パラメータを、前記強化学習の結果に基づいて算出する処理と、
前記制御パラメータを、対応する無線通信システムに属する前記無線通信端末に提供する処理と、
を実行し、
前記条件には、互いに異なる複数の条件が含まれる無線通信システム。 A wireless communication system that operates in a mixed wireless communication environment where a plurality of different wireless communication systems share the same frequency resource ,
comprising a control server that receives wireless environment information from each of the plurality of wireless communication systems and provides control information to each of the plurality of wireless communication systems,
The control server is
a process of detecting wireless environment information including a state related to wireless communication from one or more wireless communication terminals belonging to each of the plurality of wireless communication systems;
Each of the agents prepared in accordance with the conditions imposed on each of the plurality of wireless communication systems receives the wireless communication detected from the wireless communication terminal belonging to the wireless communication system to which the condition corresponding to the agent is imposed. processing for providing environmental information;
A process of performing reinforcement learning applying the conditions and the wireless environment information to each of the agents;
A process of calculating, for each of the plurality of wireless communication systems, a control parameter for satisfying the condition imposed on the wireless communication system under the wireless communication environment, based on the result of the reinforcement learning;
a process of providing the control parameter to the wireless communication terminal belonging to a corresponding wireless communication system;
Run
A wireless communication system in which the conditions include a plurality of mutually different conditions .
当該制御サーバに、
前記複数の無線通信システムの夫々に属する一つ以上の無線通信端末から、無線通信に関する状態を含む無線環境情報を検出する処理と、
前記複数の無線通信システムの夫々に課される条件に対応して準備されたエージェントの夫々に、当該エージェントに対応する前記条件が課される無線通信システムに属する前記無線通信端末から検出した前記無線環境情報を提供する処理と、
前記エージェントの夫々を対象として、前記条件および前記無線環境情報を適用させた強化学習を実施する処理と、
前記複数の無線通信システムの夫々について、前記無線通信環境の下での当該無線通信システムに課される前記条件を満たすための制御パラメータを、前記強化学習の結果に基づいて算出する処理と、
前記制御パラメータを、対応する無線通信システムに属する前記無線通信端末に提供する処理と、を実行させるためのものであり、
前記条件には、互いに異なる複数の条件が含まれる無線通信システム用プログラム。 In a wireless communication environment where a plurality of different wireless communication systems coexist while sharing the same frequency resource, receiving wireless environment information from each of the plurality of wireless communication systems and providing control information to each of the plurality of wireless communication systems. A program for a wireless communication system implemented in a control server,
To the control server,
a process of detecting wireless environment information including a state related to wireless communication from one or more wireless communication terminals belonging to each of the plurality of wireless communication systems;
Each of the agents prepared in accordance with the conditions imposed on each of the plurality of wireless communication systems receives the wireless communication detected from the wireless communication terminal belonging to the wireless communication system to which the condition corresponding to the agent is imposed. processing for providing environmental information;
A process of performing reinforcement learning applying the conditions and the wireless environment information to each of the agents;
a process of calculating, for each of the plurality of wireless communication systems, control parameters for satisfying the conditions imposed on the wireless communication system under the wireless communication environment, based on the results of the reinforcement learning; ,
providing the control parameters to the wireless communication terminal belonging to the corresponding wireless communication system ;
A program for a wireless communication system , wherein the conditions include a plurality of mutually different conditions .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020122301A JP7388634B2 (en) | 2020-07-16 | 2020-07-16 | Optimization method for wireless communication system, wireless communication system and program for wireless communication system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020122301A JP7388634B2 (en) | 2020-07-16 | 2020-07-16 | Optimization method for wireless communication system, wireless communication system and program for wireless communication system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022018880A JP2022018880A (en) | 2022-01-27 |
JP7388634B2 true JP7388634B2 (en) | 2023-11-29 |
Family
ID=80203454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020122301A Active JP7388634B2 (en) | 2020-07-16 | 2020-07-16 | Optimization method for wireless communication system, wireless communication system and program for wireless communication system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7388634B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023162085A1 (en) * | 2022-02-24 | 2023-08-31 | 株式会社Nttドコモ | Communication device and radio communication method |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013106202A (en) | 2011-11-14 | 2013-05-30 | Fujitsu Ltd | Parameter setting device, computer program, and parameter setting method |
JP2019208188A (en) | 2018-05-30 | 2019-12-05 | 日本電信電話株式会社 | Communication system, traffic control device, and traffic control method |
WO2020031757A1 (en) | 2018-08-10 | 2020-02-13 | シャープ株式会社 | Terminal device and method |
JP2020031250A (en) | 2016-12-20 | 2020-02-27 | シャープ株式会社 | Terminal device, base station device, communication method, and integrated circuit |
JP2020516125A (en) | 2017-03-22 | 2020-05-28 | エルジー エレクトロニクス インコーポレイティド | Method of operating terminal in wireless communication system and apparatus supporting the same |
WO2020244905A1 (en) | 2019-06-07 | 2020-12-10 | Nokia Solutions And Networks Oy | Providing information |
-
2020
- 2020-07-16 JP JP2020122301A patent/JP7388634B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013106202A (en) | 2011-11-14 | 2013-05-30 | Fujitsu Ltd | Parameter setting device, computer program, and parameter setting method |
JP2020031250A (en) | 2016-12-20 | 2020-02-27 | シャープ株式会社 | Terminal device, base station device, communication method, and integrated circuit |
JP2020516125A (en) | 2017-03-22 | 2020-05-28 | エルジー エレクトロニクス インコーポレイティド | Method of operating terminal in wireless communication system and apparatus supporting the same |
JP2019208188A (en) | 2018-05-30 | 2019-12-05 | 日本電信電話株式会社 | Communication system, traffic control device, and traffic control method |
WO2020031757A1 (en) | 2018-08-10 | 2020-02-13 | シャープ株式会社 | Terminal device and method |
WO2020244905A1 (en) | 2019-06-07 | 2020-12-10 | Nokia Solutions And Networks Oy | Providing information |
Non-Patent Citations (1)
Title |
---|
相原 直紀 (et al.),ニューラルネットワークに基づくQ学習を用いた無線リソース割り当て手法 (Wireless Resource Allocation Using Q-Learning Based on Neural Network),電子情報通信学会技術研究報告 [online],日本,一般社団法人電子情報通信学会,2019年01月24日,Vol.118 No.435,第109頁-第114頁 |
Also Published As
Publication number | Publication date |
---|---|
JP2022018880A (en) | 2022-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2043398B1 (en) | Method for reducing inter-cell interference in wireless ofdma networks | |
CN109151864B (en) | Migration decision and resource optimal allocation method for mobile edge computing ultra-dense network | |
Gupta et al. | Application aware networks' resource selection decision making technique using group mobility in vehicular cognitive radio networks | |
Pajarinen et al. | Optimizing spatial and temporal reuse in wireless networks by decentralized partially observable Markov decision processes | |
Balakrishnan et al. | Deep reinforcement learning based traffic-and channel-aware OFDMA resource allocation | |
CN111741450A (en) | Network flow prediction method and device and electronic equipment | |
JP7388634B2 (en) | Optimization method for wireless communication system, wireless communication system and program for wireless communication system | |
Huang et al. | Game theoretic issues in cognitive radio systems | |
Shi et al. | Deep reinforcement learning for 5G radio access network slicing with spectrum coexistence | |
Tosh et al. | Heterogeneous access network (s) selection in multi-interface radio devices | |
Giri Prasad et al. | Group based multi-channel synchronized spectrum sensing in cognitive radio network with 5G | |
Tekin et al. | An experts learning approach to mobile service offloading | |
JP7385869B2 (en) | Optimization method for wireless communication system, wireless communication system and program for wireless communication system | |
Anjum et al. | Quality-of-service-aware weighted-fair medium access control protocol for coexisting cognitive radio networks | |
Xie et al. | A novel collision probability based adaptive contention windows adjustment for QoS fairness on ad hoc wireless networks | |
US8098637B1 (en) | Load balancing in wireless local area networks | |
Fernandes et al. | Exploring the use of control packets in LoRa medium access: A scalability analysis | |
Oklander et al. | Modeling and analysis of system dynamics and state estimation in cognitive radio networks | |
JP6842759B2 (en) | Signal transmission method | |
Eftekhari et al. | Energy and spectrum efficient retransmission scheme with RAW optimization for IEEE 802.11 ah networks | |
Sun et al. | Preamble slice orderly queue access scheme in cell-free dense communication systems | |
CN110233762B (en) | Method for improving throughput of full-duplex CSMA network by using MAB | |
CN114630333B (en) | Multi-parameter statistical learning decision-making method in cognitive satellite communication | |
WO2024013815A1 (en) | Wireless communication system, wireless communication method, centralized control device, and centralized control program | |
Gamage et al. | Adaptive resource allocation with traffic peak duration prediction and admission control for cognitive Wi-Fi networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200722 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220728 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230511 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230620 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7388634 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |