JP2021158458A - Terminal device, program to be executed by computer, and computer readable recording medium with program recorded thereon - Google Patents
Terminal device, program to be executed by computer, and computer readable recording medium with program recorded thereon Download PDFInfo
- Publication number
- JP2021158458A JP2021158458A JP2020055284A JP2020055284A JP2021158458A JP 2021158458 A JP2021158458 A JP 2021158458A JP 2020055284 A JP2020055284 A JP 2020055284A JP 2020055284 A JP2020055284 A JP 2020055284A JP 2021158458 A JP2021158458 A JP 2021158458A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- packet
- transmission
- time
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005540 biological transmission Effects 0.000 claims abstract description 272
- 238000004891 communication Methods 0.000 claims abstract description 79
- 230000009471 action Effects 0.000 claims abstract description 70
- 238000000034 method Methods 0.000 claims description 44
- 230000008569 process Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 19
- 230000007423 decrease Effects 0.000 claims description 10
- 230000007704 transition Effects 0.000 description 26
- 230000000875 corresponding effect Effects 0.000 description 25
- 238000010586 diagram Methods 0.000 description 18
- 238000001228 spectrum Methods 0.000 description 11
- 238000005259 measurement Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 102100026338 F-box-like/WD repeat-containing protein TBL1Y Human genes 0.000 description 4
- 101000835691 Homo sapiens F-box-like/WD repeat-containing protein TBL1X Proteins 0.000 description 4
- 101000835690 Homo sapiens F-box-like/WD repeat-containing protein TBL1Y Proteins 0.000 description 4
- 101100340318 Arabidopsis thaliana IDL2 gene Proteins 0.000 description 2
- 102100023882 Endoribonuclease ZC3H12A Human genes 0.000 description 2
- 101710112715 Endoribonuclease ZC3H12A Proteins 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- QGVYYLZOAMMKAH-UHFFFAOYSA-N pegnivacogin Chemical compound COCCOC(=O)NCCCCC(NC(=O)OCCOC)C(=O)NCCCCCCOP(=O)(O)O QGVYYLZOAMMKAH-UHFFFAOYSA-N 0.000 description 2
- 101150065753 LEG1 gene Proteins 0.000 description 1
- 101100172132 Mus musculus Eif3a gene Proteins 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Mobile Radio Communication Systems (AREA)
Abstract
Description
この発明は、端末装置、コンピュータに実行させるためのプログラムおよびプログラムを記録したコンピュータ読み取り可能な記録媒体に関するものである。 The present invention relates to a terminal device, a program to be executed by a computer, and a computer-readable recording medium on which the program is recorded.
無線LAN(Local Area Network)などに代表されるCSMA/CA(Carrier Sense Multiple Access/ Collision Avoidance)方式では、同時送信などによるパケットの衝突・損失が起きた場合、バックオフ時間(他局からの送信電波が止まったことを検知した後、直ちに送信せず、自局が送信するまでの意図的な待ち時間)を長くすることにより、パケットの衝突確率を低減させる(特許文献1)。 In the CSMA / CA (Carrier Sense Multiple Access / Collision Avoidance) method represented by wireless LAN (Local Area Network), backoff time (transmission from other stations) occurs when packet collision / loss occurs due to simultaneous transmission. After detecting that the radio wave has stopped, the packet is not transmitted immediately, and the packet collision probability is reduced by lengthening the (intentional waiting time until transmission by the own station) (Patent Document 1).
しかし、近年では、端末数の増加により、無闇にバックオフ時間を増加させることは、パケット衝突の解決にはつながらず、端末自身の通信遅延の原因となる.
そこで、この発明の実施の形態によれば、パケット損失を抑制して周波数を有効利用する端末装置を提供する。
However, in recent years, increasing the backoff time indiscriminately due to the increase in the number of terminals does not lead to the resolution of packet collisions and causes the communication delay of the terminals themselves.
Therefore, according to the embodiment of the present invention, there is provided a terminal device that suppresses packet loss and effectively utilizes the frequency.
また、この発明の実施の形態によれば、パケット損失を抑制して周波数の有効利用をコンピュータに実行させるためのプログラムを提供する。 Further, according to the embodiment of the present invention, a program for suppressing packet loss and causing a computer to effectively use a frequency is provided.
更に、この発明の実施の形態によれば、パケット損失を抑制して周波数の有効利用をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。 Further, according to an embodiment of the present invention, there is provided a computer-readable recording medium on which a program for suppressing packet loss and causing a computer to effectively use frequencies is recorded.
(構成1)
この発明の実施の形態によれば、端末装置は、予測手段と、学習器と、選択手段と、送信手段とを備える。予測手段は、チャネルが空いている時間であるチャネル空き時間とチャネルが使用されている時間であるチャネル使用時間とを複数のチャネルの全てについて予測する。学習器は、パケットを基地局へ送信する通信の通信結果と、当該端末装置と競合する競合端末装置の情報である競合端末情報と、1つのパケットを送信してから次のパケットを送信するまでのチャネルの待機時間であるチャネル待機時間とからなる入力情報、またはパケットを前記基地局へ送信できないことを示す送信不可情報からなる入力情報に基づいて、パケットの送信時間の長さを状態とし、チャネルを選択することを行動とし、通信に成功したときのスループットまたはチャネル待機時間の逆数を報酬とするQ学習を実行してQ値の更新をQ学習の終了条件が満たされるまで繰り返し実行し、Q学習の終了条件が満たされたときの各状態と、各状態における最大のQ値と、各状態において最大のQ値が得られるときの行動とを相互に対応付けた構成からなる出力情報を出力する学習処理を実行する。選択手段は、送信したいパケットの送信時間の長さに対応するQ学習の状態に対応する最大のQ値が得られるときの行動を出力情報から検出し、その検出した行動によって選択されたチャネルを送信用チャネルとして選択する。送信手段は、送信用チャネルにおいて予測手段によって予測されたチャネル空き時間が、送信したいパケットの送信時間の長さよりも長いことからなる第1の条件が満たされたとき、バックオフを実行せずに、送信したいパケットを送信用チャネルで基地局へ送信する。
(Structure 1)
According to an embodiment of the present invention, the terminal device includes predictive means, a learner, selection means, and transmission means. The predicting means predicts the channel free time, which is the time when the channel is free, and the channel usage time, which is the time when the channel is used, for all of the plurality of channels. The learner transmits the communication result of the communication for transmitting the packet to the base station, the competing terminal information which is the information of the competing terminal device competing with the terminal device, and from the transmission of one packet to the transmission of the next packet. Based on the input information consisting of the channel standby time, which is the standby time of the channel, or the input information consisting of the non-transmission information indicating that the packet cannot be transmitted to the base station, the length of the packet transmission time is set as the state. The action is to select a channel, Q learning is executed with the reciprocal of the throughput or channel waiting time when communication is successful as a reward, and the Q value is updated repeatedly until the end condition of Q learning is satisfied. Output information consisting of a configuration in which each state when the end condition of Q learning is satisfied, the maximum Q value in each state, and the action when the maximum Q value is obtained in each state are interrelated. Execute the learning process to output. The selection means detects the action when the maximum Q value corresponding to the Q learning state corresponding to the length of the transmission time of the packet to be transmitted is obtained from the output information, and selects the channel selected by the detected action. Select as the transmission channel. The transmitting means does not perform a backoff when the first condition, which consists of the channel free time predicted by the predicting means in the transmitting channel being longer than the length of the transmitting time of the packet to be transmitted, is satisfied. , Send the packet you want to send to the base station on the transmission channel.
(構成2)
構成1において、学習器は、競合端末情報が競合端末装置の個数からなり、かつ、通信結果が通信の成功を示すとき、競合端末装置の個数が少なくなれば大きくなり、競合端末装置の個数が多くなれば小さくなるように報酬を算出する第1の演算処理を実行するとともに、チャネル待機時間が短くなれば大きくなり、チャネル待機時間が長くなれば小さくなるように報酬を算出する第2の演算処理を実行して学習処理を実行する。
(Structure 2)
In the
(構成3)
構成2において、学習器は、競合端末装置の個数が第1の個数であるとき第1の値からなる第1の重み係数をスループットに乗算し、競合端末装置の個数が第1の個数よりも多い第2の個数であるとき第1の値よりも小さい第2の値からなる第1の重み係数をスループットに乗算して第1の演算処理を実行する。
(Structure 3)
In
(構成4)
構成3において、学習器は、競合端末装置の個数の逆数を第1の重み係数としてスループットに乗算して第1の演算処理を実行する。
(Structure 4)
In
(構成5)
構成2から構成4のいずれかにおいて、学習器は、チャネル待機時間が第1の時間長からなるとき、第3の値からなる第2の重み係数をスループットに乗算し、チャネル待機時間が第1の時間長よりも長い第2の時間長からなるとき、第3の値よりも小さい第4の値からなる第2の重み係数をスループットに乗算して第2の演算処理を実行する。
(Structure 5)
In any of
(構成6)
構成2から構成5のいずれかにおいて、学習器は、チャネル待機時間の逆数を第2の重み係数としてスループットに乗算して第2の演算処理を実行する。
(Structure 6)
In any of the
(構成7)
構成1において、学習器は、学習処理において、入力情報が送信不可情報からなるとき、報酬を零としてQ値を更新する。
(Structure 7)
In the
(構成8)
構成1から構成7のいずれかにおいて、端末装置は、受信手段を更に備える。受信手段は、競合端末情報を制御チャネルで基地局から受信する。
(Structure 8)
In any one of
(構成9)
構成1から構成8のいずれかにおいて、通信結果は、送信手段が送信したいパケットを基地局へ送信した後、パケットを受信したことを示すACKパケットを基地局から受信したとき、第1の指標からなり、送信手段が送信したいパケットを基地局へ送信した後、ACKパケットを基地局から受信しないとき、第2の指標からなる。
(Structure 9)
In any of the
(構成10)
構成1から構成9のいずれかにおいて、送信手段は、第1の条件に加え、送信用チャネルにおけるキャリアセンスの結果、他の端末装置が送信用チャネルで通信していないことからなる第2の条件が満たされたとき、バックオフを実行せずに、送信したいパケットを送信用チャネルで基地局へ送信する。
(Structure 10)
In any one of
(構成11)
また、この発明の実施の形態によれば、プログラムは、
予測手段が、チャネルが空いている時間であるチャネル空き時間とチャネルが使用されている時間であるチャネル使用時間とを複数のチャネルの全てについて予測する第1のステップと、
学習器が、パケットを基地局へ送信する通信の通信結果と、当該端末装置と競合する競合端末装置の情報である競合端末情報と、1つのパケットを送信してから次のパケットを送信するまでのチャネルの待機時間であるチャネル待機時間とからなる入力情報、またはパケットを基地局へ送信できないことを示す送信不可情報からなる入力情報に基づいて、パケットの送信時間の長さを状態とし、チャネルを選択することを行動とし、通信に成功したときのスループットまたはチャネル待機時間の逆数を報酬とするQ学習を実行してQ値の更新をQ学習の終了条件が満たされるまで繰り返し実行し、Q学習の終了条件が満たされたときの各状態と、各状態における最大のQ値と、各状態において最大のQ値が得られるときの行動とを相互に対応付けた構成からなる出力情報を出力する学習処理を実行する第2のステップと、
選択手段が、送信したいパケットの送信時間の長さに対応するQ学習の状態に対応する最大のQ値が得られるときの行動を出力情報から検出し、その検出した行動によって選択されたチャネルを送信用チャネルとして選択する第3のステップと、
送信手段が、送信用チャネルにおいて予測手段によって予測されたチャネル空き時間が、送信したいパケットの送信時間の長さよりも長いことからなる第1の条件が満たされたとき、バックオフを実行せずに、送信したいパケットを前記送信用チャネルで前記基地局へ送信する第4のステップとをコンピュータに実行させるためのプログラムである。
(Structure 11)
Also, according to embodiments of the present invention, the program is:
The first step in which the predictor predicts the channel free time, which is the time the channel is free, and the channel usage time, which is the time the channel is used, for all of the plurality of channels.
From the transmission of one packet to the transmission of the next packet, the communication result of the communication in which the learner transmits the packet to the base station, the competing terminal information which is the information of the competing terminal device competing with the terminal device, and the competing terminal information. Based on the input information consisting of the channel standby time, which is the standby time of the channel, or the input information consisting of the non-transmission information indicating that the packet cannot be transmitted to the base station, the length of the packet transmission time is set as the state of the channel. The action is to select, and Q learning is executed with the reciprocal of the throughput or channel waiting time when communication is successful as a reward, and the Q value is updated repeatedly until the end condition of Q learning is satisfied. Outputs output information consisting of a configuration in which each state when the learning end condition is satisfied, the maximum Q value in each state, and the action when the maximum Q value is obtained in each state are interrelated. The second step of executing the learning process to be
The selection means detects the action when the maximum Q value corresponding to the Q learning state corresponding to the length of the transmission time of the packet to be transmitted is obtained from the output information, and selects the channel selected by the detected action. The third step of selecting as the transmission channel and
When the transmitting means satisfies the first condition that the channel free time predicted by the predicting means in the transmitting channel is longer than the length of the transmitting time of the packet to be transmitted, the backoff is not executed. , A program for causing a computer to execute a fourth step of transmitting a packet to be transmitted to the base station on the transmission channel.
(構成12)
構成11において、学習器は、第2のステップにおいて、競合端末情報が競合端末装置の個数からなり、かつ、通信結果が通信の成功を示すとき、競合端末装置の個数が少なくなれば大きくなり、競合端末装置の個数が多くなれば小さくなるように報酬を算出する第1の演算処理を実行するとともに、チャネル待機時間が短くなれば大きくなり、チャネル待機時間が長くなれば小さくなるように報酬を算出する第2の演算処理を実行して学習処理を実行する。
(Structure 12)
In the
(構成13)
構成12において、学習器は、第2のステップにおいて、競合端末装置の個数が第1の個数であるとき第1の値からなる第1の重み係数をスループットに乗算し、競合端末装置の個数が第1の個数よりも多い第2の個数であるとき第1の値よりも小さい第2の値からなる第1の重み係数をスループットに乗算して第1の演算処理を実行する。
(Structure 13)
In configuration 12, in the second step, the learner multiplies the throughput by the first weighting factor consisting of the first value when the number of competing terminal devices is the first number, and the number of competing terminal devices is increased. When the second number is larger than the first number, the throughput is multiplied by the first weighting coefficient consisting of the second value smaller than the first value to execute the first arithmetic processing.
(構成14)
構成13において、学習器は、第2のステップにおいて、競合端末装置の個数の逆数を第1の重み係数として前記スループットに乗算して第1の演算処理を実行する。
(Structure 14)
In
(構成15)
構成12から構成14のいずれかにおいて、学習器は、第2のステップにおいて、チャネル待機時間が第1の時間長からなるとき、第3の値からなる第2の重み係数をスループットに乗算し、チャネル待機時間が第1の時間長よりも長い第2の時間長からなるとき、第3の値よりも小さい第4の値からなる第2の重み係数をスループットに乗算して第2の演算処理を実行する。
(Structure 15)
In any of configurations 12 through 14, the learner multiplies the throughput by a second weighting factor of a third value when the channel latency consists of the first time length in the second step. When the channel standby time consists of a second time length longer than the first time length, the throughput is multiplied by a second weighting factor consisting of a fourth value smaller than the third value to perform the second arithmetic processing. To execute.
(構成16)
構成12から構成15のいずれかにおいて、学習器は、第2のステップにおいて、チャネル待機時間の逆数を第2の重み係数としてスループットに乗算して第2の演算処理を実行する。
(Structure 16)
In any of configurations 12 through 15, the learner executes the second arithmetic processing in the second step by multiplying the throughput by the reciprocal of the channel standby time as the second weighting factor.
(構成17)
構成11において、学習器は、第2のステップの学習処理において、入力情報が送信不可情報からなるとき、報酬を零としてQ値を更新する。
(Structure 17)
In
(構成18)
構成11から構成17のいずれかにおいて、プログラムは、受信手段が、競合端末情報を制御チャネルで基地局から受信する第5のステップを更にコンピュータに実行させる。
(Structure 18)
In any of
(構成19)
構成11から構成18のいずれかにおいて、通信結果は、送信手段が送信したいパケットを基地局へ送信した後、パケットを受信したことを示すACKパケットを基地局から受信したとき、第1の指標からなり、送信手段が送信したいパケットを基地局へ送信した後、ACKパケットを基地局から受信しないとき、第2の指標からなる。
(Structure 19)
In any of the
(構成20)
構成11から構成19のいずれかにおいて、送信手段は、第1の条件に加え、送信用チャネルにおけるキャリアセンスの結果、他の端末装置が送信用チャネルで通信していないことからなる第2の条件が満たされたとき、バックオフを実行せずに送信したいパケットを送信用チャネルで基地局へ送信する。
(Structure 20)
In any one of
(構成21)
更に、この発明の実施の形態によれば、記録媒体は、構成11から構成20のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
(Structure 21)
Further, according to an embodiment of the present invention, the recording medium is a computer-readable recording medium on which the program according to any one of
パケット損失を抑制して周波数を有効利用できる。 Frequency can be used effectively by suppressing packet loss.
本発明の実施の形態について図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰返さない。 Embodiments of the present invention will be described in detail with reference to the drawings. The same or corresponding parts in the drawings are designated by the same reference numerals, and the description thereof will not be repeated.
図1は、この発明の実施の形態における通信システムの概略図である。図1を参照して、通信システム100は、基地局BSと、複数の端末装置TMとを備える。基地局BSおよび複数の端末装置TMは、無線通信空間に配置される。
FIG. 1 is a schematic diagram of a communication system according to an embodiment of the present invention. With reference to FIG. 1, the
基地局BSは、通信範囲REG1を有する。複数の端末装置TMは、通信範囲REG1内に配置される。 The base station BS has a communication range REG1. The plurality of terminal devices TM are arranged within the communication range REG1.
基地局BSは、パケットを複数の端末装置TMのいずれかへ送信するとともに複数の端末装置TMのいずれかからパケットを受信する。 The base station BS transmits the packet to any one of the plurality of terminal devices TM and receives the packet from any one of the plurality of terminal devices TM.
そして、基地局BSは、パケットを受信したとき、パケットを受信したことを示すACK(Acknowledgement)パケットをパケットの送信元の端末装置(複数の端末装置TMのいずれか)へ送信する。 Then, when the base station BS receives the packet, it transmits an ACK (Acknowledgment) packet indicating that the packet has been received to the terminal device (any of a plurality of terminal device TMs) that is the source of the packet.
また、基地局BSは、送信元の端末装置以外の端末装置に関する情報である競合端末情報を制御チャネルで送信元の端末装置へ送信する。 Further, the base station BS transmits competing terminal information, which is information about a terminal device other than the source terminal device, to the source terminal device via a control channel.
複数の端末装置TMの各々は、パケットを基地局BSへ送信する場合、後述する方法によって、送信用チャネルCH_Tを選択し、その選択した送信用チャネルCH_Tにおいてキャリアセンスを実行した後、パケットの送信が可能であると判断すると、バックオフを実行せずにパケットを送信用チャネルで基地局BSへ送信する。 When transmitting a packet to the base station BS, each of the plurality of terminal devices TM selects a transmission channel CH_T by the method described later, executes carrier sense on the selected transmission channel CH_T, and then transmits the packet. If it is determined that this is possible, the packet is transmitted to the base station BS on the transmission channel without executing the backoff.
また、複数の端末装置TMの各々は、基地局BSからパケットを受信する。そして、複数の端末装置TMの各々は、パケットを受信すると、ACKパケットを基地局BSへ送信する。 Further, each of the plurality of terminal devices TM receives a packet from the base station BS. Then, when each of the plurality of terminal devices TM receives the packet, the ACK packet is transmitted to the base station BS.
更に、複数の端末装置TMの各々は、制御チャネルで競合端末情報を基地局BSから受信する。 Further, each of the plurality of terminal devices TM receives competing terminal information from the base station BS on the control channel.
以下においては、複数の端末装置TMの各々を「端末装置10」と表記する。
In the following, each of the plurality of terminal devices TM will be referred to as “
図2は、図1に示す端末装置の概略図である。図2を参照して、端末装置10は、アンテナ1と、受信手段2と、予測手段3と、制御手段4と、学習器5と、アプリケーション6と、送信手段7とを備える。
FIG. 2 is a schematic view of the terminal device shown in FIG. With reference to FIG. 2, the
受信手段2は、制御手段4からの制御に従って、通信システム100において無線通信に用いられる周波数帯域内の相互に異なる複数の周波数からなる複数のチャネルでアンテナ1を介してキャリアセンスを行い、受信電力の時間依存性を示す受信電力スペクトルを取得する。そして、受信手段2は、受信電力スペクトルを予測手段3へ出力する。
According to the control from the control means 4, the receiving means 2 performs carrier sense via the
また、受信手段2は、アンテナ1を介して、制御チャネルで競合端末情報を基地局BSから受信し、その受信した競合端末情報を制御手段4へ出力する。
Further, the receiving means 2 receives the competing terminal information from the base station BS on the control channel via the
更に、受信手段2は、制御手段4からの制御に従って、送信用チャネルCH_Tでアンテナ1を介してキャリアセンスを行い、そのキャリアセンスの結果を制御手段4へ出力する。
Further, the receiving means 2 performs carrier sense via the
更に、受信手段2は、アンテナ1を介して、送信用チャネルCH_Tで基地局BSからACKパケットを受信し、その受信したACKパケットを制御手段4へ出力する。
Further, the receiving means 2 receives an ACK packet from the base station BS on the transmission channel CH_T via the
予測手段3は、受信電力スペクトルを受信手段2から受ける。そして、予測手段3は、制御手段4からの制御に応じて、後述する方法によって、受信電力スペクトルに基づいて、チャネルが空いている時間の長さであるチャネル空き時間と、チャネルが使用されている時間の長さであるチャネル使用時間とを検出し、その検出したチャネル空き時間およびチャネル使用時間に基づいて、パケットを送信した後のチャネル空き時間およびチャネル使用時間を予測する。そして、予測手段3は、その予測した予測チャネル空き時間および予測チャネル使用時間を制御手段4へ出力する。 The prediction means 3 receives the received power spectrum from the receiving means 2. Then, in response to the control from the control means 4, the predictor means 3 uses the channel free time, which is the length of time the channel is free, and the channel, based on the received power spectrum, by the method described later. It detects the channel usage time, which is the length of time, and predicts the channel free time and channel usage time after transmitting the packet based on the detected channel free time and channel usage time. Then, the prediction means 3 outputs the predicted prediction channel free time and the prediction channel usage time to the control means 4.
制御手段4は、複数のチャネルでキャリアセンスを実行するように受信手段2を制御する。 The control means 4 controls the receiving means 2 so as to execute carrier sense on a plurality of channels.
また、制御手段4は、チャネル空き時間およびチャネル使用時間を予測するように予測手段3を制御する。 Further, the control means 4 controls the prediction means 3 so as to predict the channel free time and the channel use time.
更に、制御手段4は、受信手段2から競合端末情報およびACKパケットを受け、予測チャネル空き時間および予測チャネル使用時間を予測手段3から受け、送信したいパケットである送信用パケットをアプリケーション6から受ける。
Further, the control means 4 receives the competing terminal information and the ACK packet from the receiving means 2, receives the predicted channel free time and the predicted channel usage time from the predicting means 3, and receives a transmission packet which is a packet to be transmitted from the
そして、制御手段4は、送信用パケットを送信するときの送信時間の長さが予測チャネル空き時間よりも長いとき、送信用パケットの送信が不可能であると判定し、送信不可情報を生成する。 Then, when the length of the transmission time when transmitting the transmission packet is longer than the predicted channel free time, the control means 4 determines that the transmission packet cannot be transmitted, and generates transmission non-transmission information. ..
また、制御手段4は、送信用パケットを送信手段7へ出力した後、ACKパケットを受信手段2から受けると、パケットを基地局BSへ送信する通信が成功したことを示す第1の指標を生成し、送信用パケットを送信手段7へ出力した後、ACKパケットを受信手段2から受けないとき、パケットを基地局BSへ送信する通信が失敗したことを示す第2の指標を生成する。そして、制御手段4は、第1の指標および第2の指標からなる通信結果を生成する。第1の指標は、例えば、“1”からなり、第2の指標は、例えば、“0”からなる。 Further, when the control means 4 receives the ACK packet from the receiving means 2 after outputting the transmitting packet to the transmitting means 7, it generates a first index indicating that the communication for transmitting the packet to the base station BS is successful. Then, when the transmission packet is output to the transmission means 7 and then the ACK packet is not received from the reception means 2, a second index indicating that the communication for transmitting the packet to the base station BS has failed is generated. Then, the control means 4 generates a communication result including the first index and the second index. The first index is composed of, for example, "1", and the second index is composed of, for example, "0".
更に、制御手段4は、予測チャネル空き時間および予測チャネル使用時間に基づいて、送信用パケットを送信してから次の送信用パケットを送信するまでのチャネルの待機時間の長さであるチャネル待機時間を算出する。 Further, the control means 4 has a channel waiting time which is the length of the waiting time of the channel from the transmission of the transmission packet to the transmission of the next transmission packet based on the predicted channel free time and the predicted channel usage time. Is calculated.
制御手段4は、送信用パケットを送信するときの送信時間の長さが予測チャネル空き時間よりも短いとき、競合端末情報、通信結果およびチャネル待機時間からなる入力情報IF_INPUT1を生成する。そして、制御手段4は、その生成した入力情報IF_INPUT1を学習器5へ出力し、パケットの送信時間の長さを状態とし、チャネルを選択することを行動とし、通信のスループットを報酬としたQ学習を実行するように学習器5を制御する。
When the length of the transmission time when transmitting the transmission packet is shorter than the predicted channel free time, the control means 4 generates the input information IF_INPUT1 including the competing terminal information, the communication result, and the channel standby time. Then, the control means 4 outputs the generated input information IF_INPUT1 to the
制御手段4は、送信不可情報を生成したとき、送信不可情報からなる入力情報IF_INPUT2を生成し、その生成した入力情報IF_INPUT2を学習器5へ出力して報酬を零としてQ値を更新するように学習器5を制御する。
When the control means 4 generates the non-transmission information, the control means 4 generates the input information IF_INPUT2 composed of the non-transmission information, outputs the generated input information IF_INPUT2 to the
制御手段4は、入力情報IF_INPUT1または入力情報IF_INPUT2を学習器5へ出力した後、出力情報IF_OUTを学習器5から受ける。そして、制御手段4は、送信用パケットのデータ量を送信レートで除算して送信用パケットの送信時間を算出する。
The control means 4 outputs the input information IF_INPUT1 or the input information IF_INPUT2 to the
そうすると、制御手段4は、出力情報IF_OUTを参照して、送信用パケットの送信時間の長さに対応する状態における複数のQ値のうち、最大のQ値と、最大のQ値に対応する行動とを検出する。そして、制御手段4は、その検出した行動において選択されたチャネルを送信用チャネルCH_Tとして選択する。 Then, the control means 4 refers to the output information IF_OUT, and among the plurality of Q values in the state corresponding to the length of the transmission time of the transmission packet, the maximum Q value and the action corresponding to the maximum Q value. And detect. Then, the control means 4 selects the channel selected in the detected action as the transmission channel CH_T.
その後、制御手段4は、送信用チャネルCH_Tにおいて、キャリアセンスを実行するように受信手段2を制御する。制御手段4は、受信手段2からキャリアセンスの結果を受けると、その受けたキャリアセンスの結果に基づいて送信用パケットの送信が可能であるか否かを判定する。 After that, the control means 4 controls the receiving means 2 so as to execute the carrier sense in the transmitting channel CH_T. When the control means 4 receives the carrier sense result from the receiving means 2, it determines whether or not the transmission packet can be transmitted based on the received carrier sense result.
制御手段4は、送信用パケットの送信が可能であると判定したとき、送信用パケットおよび送信用チャネルCH_Tを送信手段7へ出力し、送信用パケットを送信用チャネルCH_Tで送信するように送信手段7を制御する。 When the control means 4 determines that the transmission packet can be transmitted, the control means 4 outputs the transmission packet and the transmission channel CH_T to the transmission means 7, and transmits the transmission packet on the transmission channel CH_T so as to transmit the transmission packet. 7 is controlled.
一方、制御手段4は、送信用パケットの送信が不可能であると判定したとき、送信不可情報を生成する。その後、制御手段4は、新たな送信用パケットをアプリケーション6から受ける。
On the other hand, when the control means 4 determines that the transmission of the transmission packet is impossible, the control means 4 generates the transmission non-transmission information. After that, the control means 4 receives a new transmission packet from the
アプリケーション6は、送信用パケットを生成し、その生成した送信用パケットを制御手段4へ出力する。
The
送信手段7は、送信用パケットおよび送信用チャネルCH_Tを制御手段4から受けると、アンテナ1を介して、送信用チャネルCH_Tで送信用パケットを基地局BSへ送信する。
When the transmission means 7 receives the transmission packet and the transmission channel CH_T from the control means 4, the transmission means 7 transmits the transmission packet to the base station BS via the transmission channel CH_T via the
図3は、図2に示す予測手段3の概略図である。図3を参照して、予測手段3は、判定部31と、計測部32と、分類部33と、予測部34と、予測器35とを含む。
FIG. 3 is a schematic view of the prediction means 3 shown in FIG. With reference to FIG. 3, the prediction means 3 includes a
判定部31は、受信手段2から受信電力スペクトルを受け、その受けた受信電力スペクトルに基づいて、ビジー状態(Busy)であるかアイドル状態(Idle)であるかを判定する。そして、判定部31は、ビジー状態(Busy)となる開始時刻と終了時刻とを検出するとともにアイドル状態(Idle)となる開始時刻と終了時刻とを検出する。そうすると、判定部31は、ビジー状態(Busy)となる開始時刻および終了時刻と、アイドル状態(Idle)となる開始時刻および終了時刻とを計測部32へ出力する。
The
計測部32は、ビジー状態(Busy)となる開始時刻および終了時刻と、アイドル状態(Idle)となる開始時刻および終了時刻とを判定部31から受ける。そして、計測部32は、ビジー状態(Busy)となる開始時刻および終了時刻に基づいてビジー継続時間を計測し、アイドル状態(Idle)となる開始時刻および終了時刻に基づいてアイドル継続時間を計測する。そうすると、計測部32は、ビジー継続時間およびアイドル継続時間を分類部33へ出力する。
The
分類部33は、ビジー継続時間およびアイドル継続時間を計測部32から受ける。そして、分類部33は、後述する方法によって、ビジー継続時間およびアイドル継続時間をサブセットに分類する。そうすると、分類部33は、その分類したビジー継続時間およびアイドル継続時間のサブセットを予測部34へ出力する。
The
予測部34は、ビジー継続時間およびアイドル継続時間のサブセットを分類部33から受ける。そして、予測部34は、ビジー継続時間およびアイドル継続時間のサブセットを予測器35へ出力する。その後、予測部34は、将来のビジー継続時間およびアイドル継続時間を予測した結果である予測ビジー継続時間および予測アイドル継続時間を予測器35から受け、その受けた予測ビジー継続時間および予測アイドル継続時間をそれぞれ予測チャネル使用時間および予測チャネル空き時間として制御手段4へ出力する。
The
図4は、受信電力スペクトルの概念図である。図4において、縦軸は、受信電力を表し、横軸は、時間を表す。 FIG. 4 is a conceptual diagram of the received power spectrum. In FIG. 4, the vertical axis represents the received power and the horizontal axis represents the time.
図4を参照して、受信電力スペクトルSP_RSSIは、受信電力が時間の経過とともに変化する。 With reference to FIG. 4, the received power spectrum SP_RSSI changes in received power over time.
判定部31は、受信電力スペクトルSP_RSSIを受信手段2から受けると、しきい値RSSI_thを設定する。しきい値RSSI_thは、例えば、−80[dBm]である。
Upon receiving the received power spectrum SP_RSSI from the receiving means 2, the
そして、判定部31は、受信電力スペクトルSP_RSSIの受信電力がしきい値RSSI_thに一致する時刻t1〜t8を検出する。その後、判定部31は、時刻t1〜t8に基づいて、時刻t1〜t2,t3〜t4,t5〜t6,t7〜t8の区間をビジー状態と判定し、時刻t2〜t3,t4〜t5,t6〜t7の区間をアイドル状態と判定する。
Then, the
そうすると、判定部31は、ビジー状態と時刻t1〜t2,t3〜t4,t5〜t6,t7〜t8の区間とを対応付けた[ビジー状態:t1〜t2,t3〜t4,t5〜t6,t7〜t8]を生成するとともに、アイドル状態と時刻t2〜t3,t4〜t5,t6〜t7の区間とを対応付けた[アイドル状態:t2〜t3,t4〜t5,t6〜t7]を生成する。そして、判定部31は、[ビジー状態:t1〜t2,t3〜t4,t5〜t6,t7〜t8]および[アイドル状態:t2〜t3,t4〜t5,t6〜t7]を計測部32へ出力する。
Then, the
計測部32は、[ビジー状態:t1〜t2,t3〜t4,t5〜t6,t7〜t8]および[アイドル状態:t2〜t3,t4〜t5,t6〜t7]を判定部31から受ける。そして、計測部32は、時刻t1から時刻t2までの時間長Tleg1、時刻t3から時刻t4までの時間長Tleg2、時刻t5から時刻t6までの時間長Tleg3、および時刻t7から時刻t8までの時間長Tleg4を計測し、それぞれ、ビジー継続時間TBusy1〜TBusy4を生成する。
The measuring
また、計測部32は、時刻t2から時刻t3までの時間長Tleg5、時刻t4から時刻t5までの時間長Tleg6、および時刻t6から時刻t7までの時間長Tleg7を計測して、それぞれ、アイドル継続時間TIdl1〜TIde3を生成する。
Further, the measuring
そして、計測部32は、ビジー継続時間TBusy1〜TBusy4と時刻t1〜t2,t3〜t4,t5〜t6,t7〜t8の区間とを対応付けた[t1〜t2:TBusy1/t3〜t4:TBusy2/t5〜t6:TBusy3/t7〜t8:TBusy4]を生成する。
Then, the measuring
また、計測部32は、アイドル継続時間TIdl1〜TIde3と、時刻t2〜t3,t4〜t5,t6〜t7の区間とを対応付けた[t2〜t3:TIdl1/t4〜t5:TIdl2/t6〜t7:TIdl3]を生成する。
Further, the measuring
そうすると、計測部32は、[t1〜t2:TBusy1/t3〜t4:TBusy2/t5〜t6:TBusy3/t7〜t8:TBusy4]および[t2〜t3:TIdl1/t4〜t5:TIdl2/t6〜t7:TIdl3]を分類部33へ出力する。
Then, the measuring
分類部33は、[t1〜t2:TBusy1/t3〜t4:TBusy2/t5〜t6:TBusy3/t7〜t8:TBusy4]および[t2〜t3:TIdl1/t4〜t5:TIdl2/t6〜t7:TIdl3]を計測部32から受ける。
The
また、分類部33は、ビジー継続時間およびアイドル継続時間をサブセットに分類するための時間範囲を予め保持している。
In addition, the
ビジー継続時間およびアイドル継続時間をサブセットに分類するための時間範囲は、例えば、次の通りである。
(1)ビジー継続時間サブセット:1ms未満→step1、1ms以上→step2
(2)アイドル継続時間サブセット:0.5ms未満→step1、0.5ms以上→step2
分類部33は、ビジー継続時間サブセットの時間範囲(1)に基づいて、ビジー継続時間TBusy1〜TBusy4の各々をサブセットstep1,step2のいずれかに分類し、アイドル継続時間サブセットの時間範囲(2)に基づいて、アイドル継続時間TIdl1〜TIdl3の各々をサブセットstep1,step2のいずれかに分類する。
The time range for classifying busy duration and idle duration into subsets is, for example:
(1) Busy duration subset: less than 1 ms → step1, 1 ms or more → step2
(2) Idle duration subset: less than 0.5 ms → step1, 0.5 ms or more → step2
Classifying
図5は、ビジー継続時間サブセットおよびアイドル継続時間サブセットを時系列に配列した例を示す概念図である。 FIG. 5 is a conceptual diagram showing an example in which a busy duration subset and an idle duration subset are arranged in chronological order.
図5を参照して、分類部33は、時刻t1〜t2,t3〜t4,t5〜t6,t7〜t8の区間、時刻t2〜t3,t4〜t5,t6〜t7の区間、サブセットに分類したビジー継続時間TBusy1〜TBusy4、およびサブセットに分類したアイドル継続時間TIdl1〜TIdl3に基づいて、例えば、ビジー継続時間TBusy1(step2)/アイドル継続時間TIdl1(step1)/ビジー継続時間TBusy2(step1)/アイドル継続時間TIdl2(step2)/ビジー継続時間TBusy3(step1)/アイドル継続時間TIdl3(step1)/ビジー継続時間TBusy4(step1)のようにビジー継続時間TBusy1〜TBusy4およびアイドル継続時間TIdl1〜TIdl3を時系列に配列する。
With reference to FIG. 5, the
なお、図5に示す時系列に配列したビジー継続時間およびアイドル継続時間は、複数生成される。 A plurality of busy durations and idle durations arranged in the time series shown in FIG. 5 are generated.
そして、分類部33は、時系列に配列したビジー継続時間TBusy1〜TBusy4およびアイドル継続時間TIdl1〜TIdl3を予測部34へ出力する。
Then, the classification unit 33 outputs the busy durations T Busy 1 to T Busy 4 and the idle durations T Idl 1 to T Idl 3 arranged in time series to the
予測部34は、時系列に配列したビジー継続時間TBusy1〜TBusy4およびアイドル継続時間TIdl1〜TIdl3を分類部33から受けると、その受けた時系列に配列したビジー継続時間TBusy1〜TBusy4およびアイドル継続時間TIdl1〜TIdl3を予測器35へ出力する。
予測器35は、時系列に配列したビジー継続時間TBusy1〜TBusy4およびアイドル継続時間TIdl1〜TIdl3を予測部34から受けると、時系列に配列したビジー継続時間TBusy1〜TBusy4およびアイドル継続時間TIdl1〜TIdl3に基づいて、将来のビジー継続時間およびアイドル継続時間を予測し、その予測した予測ビジー継続時間よび予測アイドル継続時間を予測部34へ出力する。
予測器35における将来のビジー継続時間およびアイドル継続時間の予測方法について説明する。
A method of predicting the future busy duration and idle duration in the
図6は、図3に示す予測器35の概略図である。図6を参照して、予測器35は、1層、2層、・・・、K層を有する。なお、Kは、2以上の整数である。
FIG. 6 is a schematic view of the
1層、2層、・・・、K層の各々は、サブセット数Si(iは、2以上の整数)に一致する個数の解析部(図6の○)を有する。図6においては、サブセット数Siが2個である場合の予測器35の概略図を示す。
Each of the 1st layer, 2nd layer, ..., And K layer has a number of analysis units (◯ in FIG. 6) corresponding to the number of subsets Si (i is an integer of 2 or more). FIG. 6 shows a schematic diagram of the
サブセット数がSiである場合、総データストリームは、S1×S2×・・・×SKになる。図6に示す場合、サブセット数S1〜SKの各々は、“2”であるので、総データストリームは、2×2×・・・×2=2Kになる。
If the number of subsets is S i, total data stream will S 1 × S 2 × ··· × S K. The case shown in FIG. 6, each of the number of
1層、2層、・・・、K層の各々は、ビジー/アイドルの相関性を解析する。そして、1層は、ビジー/アイドルデータを予測部34から受け、その受けたビジー/アイドルデータに基づいてビジー/アイドルの相関性を解析し、ビジー/アイドルの相関性の解析結果を2層へ出力する。
Each of the 1st layer, the 2nd layer, ..., And the K layer analyzes the busy / idle correlation. Then, the first layer receives busy / idle data from the
ビジー/アイドルデータは、図5に示す時系列に配列したビジー継続時間TBusy1〜TBusy4およびアイドル継続時間TIdl1〜TIdl3からなる。1層は、ビジー/アイドルデータに基づいて、ビジー継続時間TBusy1〜TBusy3およびアイドル継続時間TIdl1〜TIdl3が、ビジー継続時間TBusy1(step2)→アイドル継続時間TIdl1(step1)→ビジー継続時間TBusy2(step1)→アイドル継続時間TIdl2(step2)→ビジー継続時間TBusy3(step1)→アイドル継続時間TIdl3(step1)→ビジー継続時間TBusy4(step1)のように変遷している変遷パターンを検出し、その検出した変遷パターンに基づいてビジー継続時間とアイドル継続時間との相関性を解析する。 Busy / idle data consists busy duration T Busy1 ~T Busy4 and idle duration T Idl1 ~T Idl3 arranged in time series as shown in FIG. Based on the busy / idle data, the first layer has busy durations T Busy1 to T Busy3 and idle durations TIdl1 to TIdl3 , busy duration T Busy1 (step2) → idle duration TIdl1 (step1) → busy. Duration T Busy2 (step1) → Idle duration T Idl2 (step2) → Busy duration T Busy3 (step1) → Idle duration T Idl3 (step1) → Busy duration T Busy4 (step1) A transition pattern is detected, and the correlation between the busy duration and the idle duration is analyzed based on the detected transition pattern.
より具体的には、1層は、ビジー継続時間TBusy1(step2)→アイドル継続時間TIdl1(step1)への変遷、アイドル継続時間TIdl1(step1)→ビジー継続時間TBusy2(step1)への変遷、ビジー継続時間TBusy2(step1)→アイドル継続時間TIdl2(step2)への変遷、アイドル継続時間TIdl2(step2)→ビジー継続時間TBusy3(step1)への変遷、ビジー継続時間TBusy3(step1)→アイドル継続時間TIdl3(step1)への変遷、およびアイドル継続時間TIdl3(step1)→ビジー継続時間TBusy4(step1)への変遷に基づいて、サブセットstep2のビジー継続時間TBusy1の後にサブセットstep1のアイドル継続時間TIdl1が到来し、サブセットstep1のアイドル継続時間TIdl1の後にサブセットstep1のビジー継続時間TBusy2が到来し、サブセットstep1のビジー継続時間TBusy2の後にサブセットstep2のアイドル継続時間TIdl2が到来し、サブセットstep2のアイドル継続時間TIdl2の後にサブセットstep1のビジー継続時間TBusy3が到来し、サブセットstep1のビジー継続時間TBusy3の後にサブセットstep1のアイドル継続時間TIdl3が到来し、サブセットstep1のアイドル継続時間TIdl3の後にサブセットstep1のビジー継続時間TBusy4が到来することを検出することによって、隣接するビジー継続時間/アイドル継続時間の相関性および隣接するアイドル継続時間/ビジー継続時間の相関性、即ち、隣接するビジー継続時間/アイドル継続時間におけるビジー継続時間のサブセットとアイドル継続時間のサブセットとの繋がり度合と、隣接するアイドル継続時間/ビジー継続時間におけるアイドル継続時間のサブセットとビジー継続時間のサブセットとの繋がり度合とを解析する。 More specifically, the first layer is a transition from busy duration T Busy1 (step2) to idle duration TIdl1 (step1), idle duration TIdl1 (step1) → busy duration T Busy2 (step1). Transition, busy duration T Busy2 (step1) → idle duration T Idl2 (step2), idle duration T Idl2 (step2) → busy duration T Busy3 (step1), busy duration T Busy3 ( step1) → evolution of idle duration T Idl3 to (step1), and idle duration T Idl3 (step1) → on the basis of the busy continuing transition time T Busy4 to (step1), after the busy duration of a subset step2 T BUSY1 arrives idle duration T Idl1 subset step1, busy duration T BUSY2 subset step1 is reached after the idle duration T Idl1 subset step1, idle duration subset step2 after busy duration of a subset step1 T BUSY2 T IDL2 is reached, busy duration T Busy3 subset step1 is reached after the idle duration T IDL2 subset step2, idle duration T Idl3 subset step1 is reached after the busy duration of a subset step1 T Busy3, By detecting the arrival of the busy duration T Busy4 of the subset step1 after the idle duration TIdl3 of the subset step1, the correlation between the adjacent busy duration / idle duration and the adjacent idle duration / busy duration Correlation, that is, the degree of connection between the busy duration subset and the idle duration subset in the adjacent busy duration / idle duration, and the idle duration subset and busy in the adjacent idle duration / busy duration. Analyze the degree of connection with a subset of duration.
つまり、1層は、サブセットstep1のビジー継続時間TBusyの次に到来するアイドル継続時間TIdleのサブセットがサブセットstep1であるかを示す度合Dg1と、サブセットstep1のビジー継続時間TBusyの次に到来するアイドル継続時間TIdleのサブセットがサブセットstep2であるかを示す度合Dg2と、サブセットstep2のビジー継続時間TBusyの次に到来するアイドル継続時間TIdleのサブセットがサブセットstep1であるかを示す度合Dg3と、、サブセットstep2のビジー継続時間TBusyの次に到来するアイドル継続時間TIdleのサブセットがサブセットstep2であるかを示す度合Dg4と、サブセットstep1のアイドル継続時間TIdleの次に到来するビジー継続時間TBusyのサブセットがサブセットstep1であるかを示す度合Dg5と、サブセットstep1のアイドル継続時間TIdleの次に到来するビジー継続時間TBusyのサブセットがサブセットstep2であるかを示す度合Dg6と、サブセットstep2のアイドル継続時間TIdleの次に到来するビジー継続時間TBusyのサブセットがサブセットstep1であるかを示す度合Dg7と、サブセットstep2のアイドル継続時間TIdleの次に到来するビジー継続時間TBusyのサブセットがサブセットstep2であるかを示す度合Dg8とを解析結果として解析する。
That is, the first layer comes after the busy duration T Busy of the
そうすると、1層は、1層のデータがビジーデータである場合、解析結果(度合Dg1〜Dg8)に基づいて、ビジー継続時間TBusyのサブセット(step1,2のいずれか)の次に到来するアイドル継続時間TIdleのサブセットS_PDC_1_1(step1,2のいずれか)を予測し、その予測したアイドル継続時間TIdleの予測サブセットS_PDC_1_1(step1,2のいずれか)を2層へ出力する。 Then, when the data of the first layer is busy data, the idle that arrives next to the subset of the busy duration T Busy (either step 1 or 2) based on the analysis result (degrees Dg1 to Dg8). predicting a subset of duration T idle S_PDC_1_1 (either step1,2), and outputs the prediction subset of the predicted idle duration T idle S_PDC_1_1 (either Step1,2) to two layers.
また、1層は、1層のデータがアイドルデータである場合、解析結果(度合Dg1〜Dg8)に基づいて、アイドル継続時間TIdleのサブセット(step1,2のいずれか)の次に到来するビジー継続時間TBusyのサブセットS_PDC_1_2(step1,2のいずれか)を予測し、その予測したアイドル継続時間TIdleの予測サブセットS_PDC_1_2(step1,2のいずれか)を2層へ出力する。
Further, the first layer, the busy data of one layer if idle data, based on the analysis result (the degree Dg1~Dg8), arrives next subset of idle duration T Idle (either Step1,2) A subset S_PDC_1_2 (one of
2層は、1層から予測サブセットS_PDC_1_1(step1,2のいずれか)とビジー/アイドルデータ、または予測サブセットS_PDC_1_2(step1,2のいずれか)とビジー/アイドルデータとを受ける。
The second layer receives the predicted subset S_PDC_1_1 (one of
そして、2層は、1層と同様にして、ビジー/アイドルデータに基づいて、上述した度合Dg1〜Dg8を解析する。 Then, the second layer analyzes the above-mentioned degrees Dg1 to Dg8 based on the busy / idle data in the same manner as the first layer.
その後、2層は、2層のデータがアイドルデータである場合、解析結果(度合Dg1〜Dg8)に基づいて、アイドル継続時間TIdleの予測サブセットS_PDC_1_2の次に到来するビジー継続時間TBusyの予測サブセットS_PDC_2_1を生成する。 After that, when the data of the second layer is idle data, the prediction of the busy duration T Busy that comes after the prediction subset S_PDC_1_2 of the idle duration T Idle based on the analysis result (degrees Dg1 to Dg8) is predicted. Generate a subset S_PDC_2_1.
また、2層は、2層のデータがビジーデータである場合、解析結果(度合Dg1〜Dg8)に基づいて、予測サブセットS_PDC_1_1の次に到来するアイドル継続時間TIdleの予測サブセットS_PDC_2_2を生成する。 Further, the two-layer, if the data of the two layers is busy data, analysis results based on (degree Dg1~Dg8), to generate the idle duration T prediction subset S_PDC_2_2 of Idle arriving at the next prediction subset S_PDC_1_1.
そして、2層は、予測サブセットS_PDC_2_1、または予測サブセットS_PDC_2_2を3層へ出力する。 Then, the second layer outputs the predicted subset S_PDC_2 or the predicted subset S_PDC_2 to the third layer.
以下、同様にして、K層は、K−1層から予測サブセットS_PDC_K−1_1とビジー/アイドルデータ、または予測サブセットS_PDC_K−1_2とビジー/アイドルデータとを受ける。 Hereinafter, in the same manner, the K layer receives the predicted subset S_PDC_K-1_1 and busy / idle data, or the predicted subset S_PDC_K-1_2 and busy / idle data from the K-1 layer.
そして、K層は、1層と同様にして、ビジー/アイドルデータに基づいて、上述した度合Dg1〜Dg8を解析する。 Then, the K layer analyzes the above-mentioned degrees Dg1 to Dg8 based on the busy / idle data in the same manner as the first layer.
その後、K層は、K層のデータがアイドルデータである場合、解析結果(度合Dg1〜Dg8)に基づいて、予測サブセットS_PDC_K−1_1の次に到来するビジー継続時間TBusyの予測サブセットS_PDC_K_1を生成する。そして、K層は、予測サブセットS_PDC_K_1をビジーデータ(ビジー継続時間TBusy)の予測値として出力する。 After that, when the data of the K layer is idle data, the K layer generates a predicted subset S_PDC_K_1 of the busy duration T Busy that comes next to the predicted subset S_PDC_K-1_1 based on the analysis results (degrees Dg1 to Dg8). do. Then, the K layer outputs the prediction subset S_PDC_K_1 as the predicted value of the busy data (busy duration T Busy).
また、K層は、K層のデータがビジーデータである場合、解析結果(度合Dg1〜Dg8)に基づいて、予測サブセットS_PDC_K−1_2の次に到来するアイドル継続時間TIdleの予測サブセットS_PDC_K_2を生成する。そして、K層は、予測サブセットS_PDC_K_1をアイドルデータ(アイドル継続時間TIdle)の予測値として出力する。 Also, K layer, if the data of the K layer are busy data, generates an analysis result based on the (degree Dg1~Dg8), prediction subset S_PDC_K-1_2 prediction subset S_PDC_K_2 idle duration arriving at the next T Idle do. Then, K layer outputs the prediction subset S_PDC_K_1 as the predicted value of the idle data (idle duration T Idle).
予測部34は、予測器35のK層が5層である場合、ビジー継続時間TBusyのサブセット(step1,2のいずれか)(1層)/アイドル継続時間TIdleのサブセット(step1,2のいずれか)(2層)/ビジー継続時間TBusyのサブセット(step1,2のいずれか)(3層)/アイドル継続時間TIdleのサブセット(step1,2のいずれか)(4層)/ビジー継続時間TBusyのサブセット(step1,2のいずれか)(5層)からなるアイドル/ビジーデータData1と、アイドル継続時間TIdleのサブセット(step1,2のいずれか)(1層)/ビジー継続時間TBusyのサブセット(step1,2のいずれか)(2層)/アイドル継続時間TIdleのサブセット(step1,2のいずれか)(3層)/ビジー継続時間TBusyのサブセット(step1,2のいずれか)(4層)/アイドル継続時間TIdleのサブセット(step1,2のいずれか)(5層)からなるアイドル/ビジーデータData2とを交互に予測器35へ出力する。
When the K layer of the
予測器35は、アイドル/ビジーデータData1を予測部34から受けたとき、1層、3層および5層は、ビジーデータになり。2層および4層は、アイドルデータになる。その結果、予測器45は、予測アイドル継続時間を出力する。
When the
また、予測器35は、アイドル/ビジーデータData2を予測部34から受けたとき、1層、3層および5層は、アイドルデータになり、2層および4層は、ビジーデータになる。その結果、予測器45は、予測ビジー継続時間を出力する。
Further, when the
このように、予測器35は、予測アイドル継続時間と予測ビジー継続時間とを交互に予測部34へ出力する。
In this way, the
そして、予測部34は、予測器35から受けた予測アイドル継続時間および予測ビジー継続時間を交互に制御手段4へ出力する。
Then, the
予測アイドル継続時間および予測ビジー継続時間は、サブセットstep1,2のいずれかを含むので、制御手段4は、予測アイドル継続時間および予測ビジー継続時間のサブセット(サブセットstep1,2のいずれか)に基づいて、予測アイドル継続時間の長さおよび予測ビジー継続時間の長さを知ることができる。 Since the predicted idle duration and the predicted busy duration include either of the subset steps 1 and 2, the control means 4 is based on a subset of the predicted idle duration and the predicted busy duration (either of the subset steps 1 and 2). , The length of the predicted idle duration and the length of the predicted busy duration can be known.
予測器35は、一般的には、次式によって、予測アイドル継続時間または予測ビジー継続時間を予測する。
The
式(1)において、Xi,Xi−1,・・・,Xi―p−1は、直近p(pは、2以上の整数である。)個のビジー/アイドル計測時間であり、既知の値である。また、Xi+1は、予測値である。更に、b1,b2,・・・,bpは、係数である。 In the equation (1), X i , X i-1 , ..., X i-p-1 are the busy / idle measurement times of the latest p (p is an integer of 2 or more). It is a known value. Further, X i + 1 is a predicted value. Further, b 1 , b 2 , ..., B p are coefficients.
式(1)によって、Xi+1を予測する場合、係数b1,b2,・・・,bpを決定する必要がある。 When predicting X i + 1 by the equation (1), it is necessary to determine the coefficients b 1 , b 2 , ..., B p.
この場合、予測器35は、トレーニング区間において、係数b1,b2,・・・,bpを学習する。
In this case, the
トレーニング区間における係数b1,b2,・・・,bpの学習について説明する。係数b1,b2,・・・,bpを算出するためのトレーニングデータを、例えば、200サンプルとし、予測式(1)の次数を、例えば、2次(p=2)として係数b1,b2を学習する。 Coefficients b 1, b 2 in the training interval, ..., learning of b p will be described. Coefficients b 1, b 2, · · ·, training data for calculating the b p, for example, a 200 sample, the order of the prediction equation (1), for example, the coefficient b 1 as a secondary (p = 2) , B 2 is learned.
予測器35は、200サンプルのトレーニングデータに基づいて、上述した方法によって、ビジー継続時間およびアイドル継続時間の予測値を算出し、係数b1,b2を算出する。この場合、予測器35は、Levinson−Durbin帰納法を用いて最小二乗式から生じる正規方程式を解くことによって係数b1,b2を算出する。
The
なお、予測器35は、トレーニング区間において、ビジー継続時間TBusy/アイドル継続時間TIdleの変遷パターンの全てについて係数b1,b2を算出する。
The
例えば、サブセット数Siが2個であり、K=5である場合、ビジー継続時間TBusy/アイドル継続時間TIdleの変遷パターンは、32個である。 For example, when the number of subsets S i is 2 and K = 5, the transition pattern of busy duration T Busy / idle duration T Idle is 32.
従って、予測器35は、32個の変遷パターンの全てについて、係数b1,b2を算出し、その算出した係数b1,b2を32個の変遷パターンのそれぞれに対応付けて予測部34へ出力する。
Accordingly, the
予測部34は、32個の変遷パターンと、32組の係数b1,b2との対応関係を予測器35から受け、その受けた32個の変遷パターンと、32組の係数b1,b2との対応関係を保持する。
The
予測器35は、pが2以外である場合も、同様にして、32個の変遷パターンの全てについて、係数b1,b2,・・・,bpを算出し、その算出した係数b1,b2,・・・,bpを32個の変遷パターンのそれぞれに対応付けて予測部34へ出力する。
The predictor 35 similarly calculates the coefficients b 1 , b 2 , ..., B p for all 32 transition patterns even when p is other than 2, and the calculated coefficients b 1 , b 2, ···, in association with each of the 32 transition patterns b p outputs to the
予測部34は、32個の変遷パターンと、32組の係数b1,b2,・・・,bpとの対応関係を予測器35から受け、その受けた32個の変遷パターンと、32組の係数b1,b2,・・・,bpとの対応関係を保持する。
図7は、変遷パターンと係数b1,b2,・・・,bpとの対応表を示す図である。図7を参照して、対応表TBL1は、変遷パターンと係数の組とを含む。変遷パターンおよび係数の組は、相互に対応付けられる。 FIG. 7 is a diagram showing a correspondence table between the transition pattern and the coefficients b 1 , b 2 , ..., B p. With reference to FIG. 7, the correspondence table TBL1 includes a transition pattern and a set of coefficients. Transition patterns and coefficient sets are associated with each other.
変遷パターン1、変遷パターン2、変遷パターン3、・・・、変遷パターンm(mは、サブセット数とK層の個数とに基づいて決定される変遷パターンの総数)は、それぞれ、係数の組b11,b12,b13,・・・,b1p、係数の組b21,b22,b23,・・・,b2p、係数の組b31,b32,b33,・・・,b3p、・・・、係数の組bm1,bm2,bm3,・・・,bmpに対応付けられる。
予測部34は、対応表TBL1を保持している。そして、予測部34は、時系列に配列されたビジー継続時間/アイドル継続時間(図5参照)を分類部33から受けると、対応表TBL1を参照して、その受けた時系列に配列されたビジー継続時間/アイドル継続時間(図5参照)の変遷パターンが、対応表TBL1に格納された変遷パターン1〜変遷パターンmのうちのいずれに一致するかを判定し、ビジー継続時間/アイドル継続時間(図5参照)の変遷パターンに一致すると判定した変遷パターン(変遷パターン1〜変遷パターンmのいずれか)に対応する係数の組(b11,b12,b13,・・・,b1p;b21,b22,b23,・・・,b2p;・・・;bm1,bm2,bm3,・・・,bmpのいずれか)を検出する。そして、予測部34は、その検出した係数の組と、時系列に配列されたビジー継続時間/アイドル継続時間(図5参照)とを予測器35へ出力する。
The
その後、予測部34は、予測ビジー継続時間/予測アイドル継続時間を予測器35から受ける。
After that, the
学習器5におけるQ学習について説明する。図8は、チャネル待機時間の概念図である。
Q-learning in the
図8を参照して、時刻tCPTは、チャネル#1〜チャネル#4のいずれかでパケットを送信する通信が完了した時刻であり、現在とする。そして、現在の時刻tCPTから、次のチャネル使用時間(ビジー継続時間TBusy)までの待ち時間の長さをチャネル待機時間WTとする。
With reference to FIG. 8, the time t CPT is the time when the communication for transmitting the packet on any of the
この場合、チャネル#1においては、現在の時刻tCPTから、次のチャネル使用時間(ビジー継続時間TBusy1)までの待ち時間の長さは、チャネル待機時間WT1であり、チャネル#2においては、現在の時刻tCPTから、次のチャネル使用時間(ビジー継続時間TBusy2)までの待ち時間の長さは、チャネル待機時間WT2であり、チャネル#3においては、現在の時刻tCPTから、次のチャネル使用時間(ビジー継続時間TBusy3)までの待ち時間の長さは、チャネル待機時間WT3であり、チャネル#4においては、現在の時刻tCPTから、次のチャネル使用時間(ビジー継続時間TBusy4)までの待ち時間の長さは、チャネル待機時間WT4である。
In this case, in
制御手段4は、予測手段3から受けた予測チャネル空き時間および予測チャネル使用時間に基づいて、各チャネル#1〜チャネル#4におけるチャネル待機時間WT1〜WT4を検出する。
The control means 4 detects the channel standby times WT1 to WT4 in each
図9は、Qテーブルの概念図である。パケットの送信時間の長さは、例えば、「長」、「中」および「短」の3つの状態stを取り得るので、「短」を“1”で表し、「中」を“2”で表し、「長」を“3”で表す。 FIG. 9 is a conceptual diagram of the Q table. The length of the transmission time of the packet, for example, "long", since it can take three states s t "medium" and "short", represented by "short" to "1", the "medium""2" It is represented by, and "length" is represented by "3".
「長」は、例えば、パケットの送信時間の長さが2msであり、「中」は、例えば、パケットの送信時間の長さが1msであり、「短」は、例えば、パケットの送信時間の長さが0.5msである。 “Long” means, for example, the length of the packet transmission time is 2 ms, “medium” means, for example, the length of the packet transmission time is 1 ms, and “short” means, for example, the length of the packet transmission time. The length is 0.5 ms.
通信に用いるチャネルを選択する行動atは、例えば、チャネル#1を選択する、チャネル#2を選択する、チャネル#3を選択する、およびチャネル#4を選択する、の4つの行動atを取り得るので、チャネル#1を選択することを“1”で表し、チャネル#2を選択することを“2”で表し、チャネル#3を選択することを“3”で表し、チャネル#4を選択することを“4”で表す。
Action a t to select a channel to be used for communication, for example, selects the
従って、Qテーブルは、3行×4列の行列によって表され、12個のQ値(=Q1,1〜Q3,4)を含む。 Therefore, the Q table is represented by a matrix of 3 rows × 4 columns and contains 12 Q values (= Q 1, 1 to Q 3, 4 ).
12個のQ値(=Q1,1〜Q3,4)の初期値は、全て、“0”である。そして、端末装置10のパケットの送信時間の長さが状態st(=1〜3のいずれか)にあり、チャネル#1〜チャネル#4のいずれかを選択する行動atを取ったとき、パケットの送信が可能である場合、通信結果(通信の成功/失敗)、競合端末情報およびチャネル待機時間WTに基づいて、次の通信における報酬rt+1が算出される。
The initial values of the 12 Q values (= Q 1,1 to Q 3,4 ) are all "0". Then, there is the
そして、図8に示すチャネル待機時間WTが短い方がチャネル利用効率を高くできるので、チャネル待機時間WTが短い方が、通信のスループットが大きくなり、チャネル待機時間WTが長い方が、通信のスループットが小さくなるようにチャネル待機時間WTに基づいて重み付けを行う。 The shorter the channel standby time WT shown in FIG. 8, the higher the channel utilization efficiency. Therefore, the shorter the channel standby time WT, the larger the communication throughput, and the longer the channel standby time WT, the higher the communication throughput. Weighting is performed based on the channel standby time WT so that
また、競合端末装置の個数が少ない方が、競合が減少して通信のスループットが大きくなり、競合端末装置の個数が多い方が競合して通信のスループットが小さくなるので、競合端末装置の個数が少ない方が通信のスループットが大きくなり、競合端末装置の個数が多い方が通信のスループットが小さくなるように競合端末装置の個数に基づいて重み付けを行う。 Further, the smaller the number of competing terminal devices, the smaller the competition and the larger the communication throughput, and the larger the number of competing terminal devices, the smaller the communication throughput. Weighting is performed based on the number of competing terminal devices so that the smaller the number, the higher the communication throughput, and the larger the number of competing terminal devices, the smaller the communication throughput.
その結果、QテーブルのQ値は、次式によって更新される。 As a result, the Q value in the Q table is updated by the following equation.
式(2)において、rt+1は、報酬であり、αは、学習率であり、γは、割引率である。 In equation (2), rt + 1 is a reward, α is a learning rate, and γ is a discount rate.
この発明の実施の形態においては、αは、例えば、0.5であり、γは、例えば、0である。 In embodiments of the present invention, α is, for example, 0.5 and γ is, for example, 0.
式(2)の報酬rt+1は、次式によって算出される。 The reward rt + 1 of the formula (2) is calculated by the following formula.
式(3A)のFは、通信のスループットである。式(3A)のw1は、式(3B)によって算出される重み係数であり、式(3B)のNCFLは、競合端末装置の個数である。その結果、重み係数w1は、競合端末装置の個数NCFLが多くなれば小さくなり、競合端末装置の個数NCFLが少なくなれば大きくなる。 F of the formula (3A) is the throughput of communication. W 1 of the formula (3A) is a weighting coefficient calculated by the formula (3B), and NCFL of the formula (3B) is the number of competing terminal devices. As a result, the weighting coefficients w 1 is smaller The more the number N CFL competing terminal device, increases if less number N CFL competing terminals.
また、式(3A)のw2は、式(3C)によって算出される重み係数であり、式(3C)のWTは、各チャネルにおけるチャネル待機時間である。その結果、重み係数w2は、チャネル待機時間WTが短くなれば大きくなり、チャネル待機時間WTが長くなれば小さくなる。 Further, w 2 in the formula (3A) is a weighting coefficient calculated by the formula (3C), and WT in the formula (3C) is a channel standby time in each channel. As a result, the weighting coefficient w 2 becomes larger as the channel waiting time WT becomes shorter, and becomes smaller as the channel waiting time WT becomes longer.
更に、式(3A)のvは、通信が成功したとき、“1”からなり、通信が失敗したとき、“0”からなる(式(3D)参照)。従って、通信が失敗したとき、報酬rt+1は、“0”になる。 Further, v of the formula (3A) is composed of "1" when the communication is successful, and is composed of "0" when the communication is unsuccessful (see formula (3D)). Therefore, when the communication fails, the reward rt + 1 becomes “0”.
式(3)に示すように、学習器5は、競合端末装置の個数NCFLが少なくなれば大きくなり、競合端末装置の個数NCFLが多くなれば小さくなるように報酬rt+1を算出する。そして、学習器5は、競合端末装置の個数NCFLが第1の個数であるとき第1の値からなる重み係数w1をスループットFに乗算し、競合端末装置の個数NCFLが第1の個数よりも多い第2の個数であるとき第1の値よりも小さい第2の値からなる重み係数w1をスループットFに乗算する。
As shown in equation (3), the
また、学習器5は、チャネル待機時間WTが短くなれば大きくなり、チャネル待機時間WTが長くなれば小さくなるように報酬rt+1を算出する。そして、学習器5は、チャネル待機時間WTが第1の時間長からなるとき、第3の値からなる重み係数w2をスループットFに乗算し、チャネル待機時間WTが第1の時間長よりも長い第2の時間長からなるとき、第3の値よりも小さい第4の値からなる重み係数w2をスループットに乗算する。
Further, the
なお、パケットの送信が“不可”であるとき、報酬rt+1は、“0”になる。パケットの送信が“不可”であるとき、スループットFを算出できないからである。 When the packet transmission is "impossible", the reward rt + 1 becomes "0". This is because the throughput F cannot be calculated when the packet transmission is "impossible".
学習器5は、状態stと行動atとに対応するQ値(=Qs,a)と、報酬rt+1と、学習率αと、割引率γとを式(2)に代入してQ値(=Qs,a)を更新する。
そして、端末装置10の行動atを決定する場合、ε−greedy法が用いられる。このε−greedy法は、ある一定の小さい数ε(例えば、0.3)を決定しておき、発生した乱数がε以下であるとき、行動atをランダムに決定し、発生した乱数がε以下でないとき、行動atをQ値が最大である行動に決定する方法である。
Then, when determining an action a t of the
なお、制御手段4は、通信結果、競合端末情報(=競合端末装置の個数NCFL)およびチャネル待機時間WTを学習器5へ出力してQ学習を実行するように学習器5を制御する場合、図8に示すチャネル待機時間WT1〜WT4をそれぞれチャネル#1〜#4に対応付けて学習器5へ出力する。これによって、学習器5は、Q学習において状態stおよび行動atを決定した後に報酬rt+1を算出するとき、決定した行動atによって選択されたチャネル(=チャネル#1〜#4のいずれか)に対応するチャネル待機時間WT(=チャネル待機時間WT1〜WT4のいずれか)を用いて重み係数w2を式(3C)によって算出できる。
When the control means 4 controls the
図10から図12は、それぞれ、Qテーブルの更新方法を説明するための第1から第3の概略図である。 10 to 12 are first to third schematic views for explaining a method of updating the Q table, respectively.
図10を参照して、Q学習の初期状態においては、Qテーブルの全てのQ値(Q1,1〜Q3,4)は、“0”である(図10の(a)参照)。 With reference to FIG. 10, in the initial state of Q-learning, all Q values (Q 1, 1 to Q 3, 4 ) in the Q table are “0” (see (a) in FIG. 10).
この発明の実施の形態においては、パケットの送信時間の長さが「短」であるとき、状態stを“1”とし、パケットの送信時間の長さが「中」であるとき、状態stを“2”とし、パケットの送信時間の長さが「長」であるとき、状態stを“3”とする。 In the embodiment of the present invention, when the length of the transmission time of the packet is "short", and a state s t "1", when the length of the transmission time of the packet is "medium", the state s When t is “2” and the length of the packet transmission time is “long”, the state st is set to “3”.
学習器5は、パケットの送信時間の長さとして、「長」、「中」および「短」の複数の長さが存在するので、“1”,“2”,“3”の複数の状態stを選択し得る。そこで。学習器5は、複数の状態stからランダムに1つの状態stを決定する。例えば、学習器5は、“2”の状態stを決定したものとする。
Since the
また、学習器5は、ε−greedy法に従って行動atを決定する。この場合、Qテーブルの全てのQ値(Q1,1〜Q3,4)が“0”であるので(即ち、最大のQ値が1つに決定されないので)、学習器5は、乱数がε以下であるか否かに拘わらず、ランダムに端末装置10の行動atを決定する。そして、学習器5は、例えば、“2”の行動atを決定したものとする。
Also, the
そうすると、学習器5は、端末装置10がパケットを送信可能である場合、通信結果(通信の成功/失敗)、競合端末情報およびチャネル待機時間に基づいて、上述した方法によって、パケットの(t+1)回目の送信における報酬rt+1を算出する。
Then, when the
その後、学習器5は、算出した報酬rt+1と、学習率αと、割引率γと、パケットのt回目の送信におけるQ値(状態st(=“2”)と行動at(=“2”)とに対応する初期状態のQ値)とを式(2)に代入してQ値をQ値(q2,2)に更新する(図10の(b)参照)。
After that, the
ここで、パケットの送信時間の長さによって決定される状態st、およびチャネルを選択することである行動atは、過去の通信の失敗および通信の成功に依存しないものである。また、報酬rt+1は、過去の通信の失敗/成功に依存せず、現在の通信の失敗/成功に依存して算出されるものである。従って、累積報酬についてのパラメータである割引率γは、“0”に設定されるべきである。 Here, the state s t which is determined by the length of the transmission time of the packet, and it is a behavior a t selecting a channel and do not depend on the success of failure and communication of past communications. Further, the reward rt + 1 is calculated not depending on the failure / success of the past communication but on the failure / success of the current communication. Therefore, the discount rate γ, which is a parameter for the cumulative reward, should be set to “0”.
その結果、パケットのt回目の送信におけるQ値は、“0”であり(図10の(a)参照)、γ=0であるので、更新されたQ値(=q2,2)は、実質的に、αrt+1に等しい。 As a result, the Q value in the t-th transmission of the packet is “0” (see (a) in FIG. 10), and γ = 0, so that the updated Q value (= q 2, 2 ) is Substantially equal to αrt + 1.
引き続いて、学習器5は、パケットの送信時間の長さとしての「長」、「中」および「短」に基づいて、例えば、ランダムに状態stを“1”に決定し、ε−greedy法によって行動atを“4”に決定するものとする。
Subsequently, the
そうすると、学習器5は、パケットを送信可能である場合、通信結果(通信の成功/失敗)、競合端末情報およびチャネル待機時間に基づいて、上述した方法によって、(t+1)回目の送信における報酬rt+1を算出する。
Then, when the
その後、学習器5は、算出した報酬rt+1と、学習率αと、割引率γ(=0)と、パケットのt回目の送信におけるQ値(状態st(=“1”)と行動at(=“4”)とに対応する初期状態のQ値)とを式(2)に代入してQ値をQ値(=q1,4)に更新する(図11の(a)参照)。
After that, the
一方、学習器5は、発生した乱数がε以下でないとき、端末装置10の行動atをQ値が最大である行動に決定する。この時点では、Qテーブルは、図10の(b)に示す状態になっているので、最大のQ値は、q2,2になる。従って、学習器5は、端末装置10の行動atを“2”(チャネル#2を選択する行動)に決定する。
On the other hand, the
そして、学習器5は、端末装置10が行動“2”(チャネル#2を選択する行動)を実行したときの報酬rt+1を上述した方法によって算出し、その算出した報酬rt+1を用いて式(2)によってQ値(=q2,2)をQ値(=q’2,2)に更新する(図11の(b)参照)。
Then, the learning device 5 calculates the reward rt + 1 when the
なお、パケットのt回目の送信における通信が失敗であるとき、式(3A)のvは、“0”に設定されるので(式(3D)参照)、報酬rt+1は、“0”になる。従って、学習器5は、パケットのt回目の送信における通信が失敗であるとき、パケットの(t+1)回目の送信における報酬rt+1を“0”と算出してQ値を更新する。
When the communication in the t-th transmission of the packet is unsuccessful, v in the equation (3A) is set to "0" (see equation (3D)), so the reward rt + 1 becomes "0". .. Therefore, when the communication in the t-th transmission of the packet is unsuccessful, the
以後、学習器5は、終了条件が満たされるまで、上述した動作を繰り返し実行してQテーブルのQ値を更新する。なお、終了条件は、例えば、上述したQ値の更新が所定回数実行されたときである。そして、所定回数は、例えば、10回である。
After that, the
学習器5は、終了条件が満たされると、終了条件が満たされたときのQテーブル(図12参照)を参照して、“1”の状態stに対応するq値(=q1,1、q1,3、q1,4)のうちの最大のQ値(=q1_max)と、最大のQ値(=q1_max)に対応する行動at_max1とを検出し、“2”の状態stに対応するq値(=q2,2、q2,3)のうちの最大のQ値(=q2_max)と、最大のQ値(=q2_max)に対応する行動at_max2とを検出し、“3”の状態stに対応するq値(=q3,2、q3,4)のうちの最大のQ値(=q3_max)と、最大のQ値(=q3_max)に対応する行動at_max3とを検出する。そして、学習器5は、“1”の状態stに最大のQ値(=q1_max)と行動at_max1とを対応付けた[“1”の状態st/q1_max/at_max1]を生成し、“2”の状態stに最大のQ値(=q2_max)と行動at_max2とを対応付けた[“2”の状態st/q2_max/at_max2]を生成し、“3”の状態stに最大のQ値(=q3_max)と行動at_max3とを対応付けた[“3”の状態st/q3_max/at_max3]を生成する。
そうすると、学習器5は、[“1”の状態st/q1_max/at_max1]、[“2”の状態st/q2_max/at_max2]および[“3”の状態st/q3_max/at_max3]からなる出力情報IF_OUTを制御手段4へ出力する。
Then, the
制御手段4は、出力情報IF_OUT(=[“1”の状態st/q1_max/at_max1]、[“2”の状態st/q2_max/at_max2]および[“3”の状態st/q3_max/at_max3])を学習器5から受ける。
Control means 4, the output information IF_OUT (= [ "1" state s t / q 1_max / a t_max1 of] [ "2" state s t / q 2_max / a t_max2 of] and [ "3" state s t of / Q 3_max / at_max3 ]) is received from the
そして、制御手段4は、送信用パケットの送信時間の長さに対応する状態stが“1”の状態stであるとき、出力情報IF_OUTから[“1”の状態st/q1_max/at_max1]を検出し、その検出した[“1”の状態st/q1_max/at_max1]から行動at_max1を検出する。そうすると、制御手段4は、行動at_max1によって選択されたチャネル(チャネル#1、チャネル#3、およびチャネル#4のいずれか)を送信用チャネルCH_Tとして選択する。
Then, the
また、制御手段4は、送信用パケットの送信時間の長さに対応する状態stが“2”の状態stであるとき、出力情報IF_OUTから[“2”の状態st/q2_max/at_max2]を検出し、その検出した[“2”の状態st/q2_max/at_max2]から行動at_max2を検出する。そうすると、制御手段4は、行動at_max2によって選択されたチャネル(チャネル#2、およびチャネル#3のいずれか)を送信用チャネルCH_Tとして選択する。
Further, the
更に、制御手段4は、送信用パケットの送信時間の長さに対応する状態stが“3”の状態stであるとき、出力情報IF_OUTから[“3”の状態st/q3_max/at_max3]を検出し、その検出した[“3”の状態st/q3_max/at_max3]から行動at_max3を検出する。そうすると、制御手段4は、行動at_max3によって選択されたチャネル(チャネル#2、およびチャネル#4のいずれか)を送信用チャネルCH_Tとして選択する。
Furthermore, the
図13は、送信用パケットが送信可能か否かを判定する方法を説明するための図である。 FIG. 13 is a diagram for explaining a method of determining whether or not the transmission packet can be transmitted.
図13を参照して、現在の時刻TCPTよりも将来の時刻においては、チャネル#1において、チャネル空き時間TIdle1が存在し、チャネル#2において、チャネル空き時間TIdle2が存在し、チャネル#3において、チャネル空き時間TIdle3が存在し、チャネル#4において、チャネル空き時間TIdle4が存在する。
Referring to FIG. 13, in the current time T time future than CPT, the
チャネル空き時間TIdle1は、送信用パケットの送信時間の長さよりも短い。チャネル空き時間TIdle2,TIdle3,TIdle4は、送信用パケットの送信時間の長さよりも長い。そして、チャネル空き時間TIdle2は、チャネル空き時間TIdle2,TIdle3,TIdle4のうちで最も短い。 The channel free time TIdle1 is shorter than the length of the transmission time of the transmission packet. The channel free time T Idle2 , T Idle 3 , and T Idle 4 are longer than the length of the transmission time of the transmission packet. The channel free time TIdle2 is the shortest among the channel free time TIdle2 , TIdle3 , and TIdle4.
制御手段4は、例えば、送信用チャネルCH_T(チャネル#1〜チャネル#4のいずれか)を選択すると、その選択した送信用チャネルCH_T(チャネル#1〜チャネル#4のいずれか)においてキャリアセンスを実行するように受信手段2を制御し、その後、受信手段2からキャリアセンスの結果を受けると、キャリアセンスの結果に基づいて他の端末装置が送信用チャネルCH_T(チャネル#1〜チャネル#4のいずれか)で通信を行っているか否かを判定する。
When the control means 4 selects, for example, the transmission channel CH_T (any of
制御手段4は、他の端末装置が送信用チャネルCH_Tで通信を行っていないと判定したとき、送信用チャネルCH_T(チャネル#1〜チャネル#4のいずれか)における予測チャネル空き時間が、送信用パケットの送信時間の長さよりも長いか否かを判定する。
When the control means 4 determines that the other terminal device is not communicating on the transmission channel CH_T, the predicted channel free time in the transmission channel CH_T (any of
そして、制御手段4は、送信用チャネルCH_T(チャネル#1〜チャネル#4のいずれか)における予測チャネル空き時間が、送信用パケットの送信時間の長さよりも長いと判定したとき、送信用チャネルCH_Tおよび送信用パケットを送信手段7へ出力し、送信用チャネルCH_Tで送信用パケットを基地局BSへ送信するように送信手段7を制御する。
Then, when the control means 4 determines that the predicted channel free time in the transmission channel CH_T (any of
一方、制御手段4は、送信用チャネルCH_T(チャネル#1〜チャネル#4のいずれか)における予測チャネル空き時間が送信用パケットの送信時間の長さ以下であると判定したとき、またはキャリアセンスの結果に基づいて他の端末装置が送信用チャネルCH_Tで通信を行っていると判定したとき、送信用パケットの送信が不可であると判定し、通信不可情報を生成する。
On the other hand, when the control means 4 determines that the predicted channel free time in the transmission channel CH_T (any of
図13に示す場合、チャネル#2におけるチャネル空き状態TIdle2(=予測チャネル空き時間)は、送信用パケットの送信時間の長さよりも長い。
In the case shown in FIG. 13, the channel free state TIdle2 (= predicted channel free time) in
従って、制御手段4は、チャネル空き時間TIdle2(=予測チャネル空き時間)が送信用パケットの送信時間の長さよりも長いと判定する。 Therefore, the control means 4 determines that the channel free time TIdle2 (= predicted channel free time) is longer than the length of the transmission time of the transmission packet.
そして、制御手段4は、送信用チャネルCH_T(=チャネル#2)および送信用パケットを送信手段7へ出力し、送信用チャネルCH_T(=チャネル#2)で送信用パケットを基地局BSへ送信するように送信手段7を制御する。 Then, the control means 4 outputs the transmission channel CH_T (= channel # 2) and the transmission packet to the transmission means 7, and transmits the transmission packet to the base station BS on the transmission channel CH_T (= channel # 2). The transmission means 7 is controlled so as to.
上述したように、送信用パケットが送信可能であるか否かの判定は、次の2つからなる。
(判定1)送信用チャネルCH_Tにおけるキャリアセンスの結果に基づいて他の端末装置が送信用チャネルCH_Tで通信を行っているか否かを判定する。
(判定2)送信用チャネルCH_Tにおける予測チャネル空き時間が、送信用パケットの送信時間の長さよりも長いか否かを判定する。
As described above, the determination as to whether or not the transmission packet can be transmitted consists of the following two.
(Determination 1) Based on the result of carrier sense in the transmission channel CH_T, it is determined whether or not another terminal device is communicating on the transmission channel CH_T.
(Determination 2) It is determined whether or not the predicted channel free time in the transmission channel CH_T is longer than the transmission time of the transmission packet.
そして、判定1,2の2つの判定結果が肯定的判定結果であるとき、送信用パケットの送信が可能であると判定し、判定1,2のうちの少なくとも1つの判定において、判定結果が否定的判定結果であるとき、送信用パケットの送信が不可能であると判定する。
Then, when the two determination results of the
なお、この発明の実施の形態においては、判定2のみによって送信用チャネルCH_Tにおける予測チャネル空き時間が、送信用パケットの送信時間の長さよりも長いと判定したとき、バックオフを実行せずに送信用パケットを送信用チャネルCH_Tで基地局BSへ送信するようにしてもよい。
In the embodiment of the present invention, when it is determined only by the
図14は、図2に示す端末装置10の動作を説明するためのフローチャートである。図14を参照して、端末装置10の動作が開始されると、制御手段4は、アプリケーション6から送信用パケットを受けたか否かを判定することによって送信用パケットがあるか否かを判定する(ステップS1)。この場合、制御手段4は、アプリケーション6から送信用パケットを受けたとき、送信用パケットがあると判定し、アプリケーション6から送信用パケットを受けなかったとき、送信用パケットがないと判定する。
FIG. 14 is a flowchart for explaining the operation of the
ステップS1において、送信用パケットがあると判定されると、制御手段4は、学習器5から出力された出力情報IF_OUTに基づいて行動at(チャネルを選択する行動)を決定する(ステップS2)。
In step S1, if it is determined that there is a transmission packet, the
そして、制御手段4は、決定した行動atにおいて選択されたチャネルでキャリアセンスを行うように受信手段2を制御し、受信手段2は、制御手段4からの制御に従ってキャリアセンスを行う(ステップS3)。
Then, the
その後、予測手段3は、上述した方法によって、各チャネルにおける予測チャネル空き時間および予測チャネル使用時間を予測し(ステップS4)、その予測した予測チャネル空き時間および予測チャネル使用時間を制御手段4へ出力する。 After that, the prediction means 3 predicts the predicted channel free time and the predicted channel usage time in each channel by the method described above (step S4), and outputs the predicted predicted channel free time and the predicted channel usage time to the control means 4. do.
制御手段4は、予測チャネル空き時間および予測チャネル使用時間を予測手段3から受ける。 The control means 4 receives the prediction channel free time and the prediction channel usage time from the prediction means 3.
引き続いて、制御手段4は、送信用パケットが送信可能であるか否かを判定する(ステップS5)。この場合、制御手段4は、上述した判定1,2によって送信用パケットが送信可能であるか否かを判定する。
Subsequently, the control means 4 determines whether or not the transmission packet can be transmitted (step S5). In this case, the control means 4 determines whether or not the transmission packet can be transmitted by the
ステップS5において、送信用パケットが送信可能でないと判定されたとき、制御手段4は、送信不可情報を生成する(ステップS6)。 When it is determined in step S5 that the transmission packet cannot be transmitted, the control means 4 generates the transmission non-transmission information (step S6).
一方、ステップS5において、送信用パケットが送信可能であると判定されたとき、制御手段4は、ステップS2で決定した行動atにおいて選択されたチャネルを送信用チャネルCH_Tとし、送信用チャネルCH_Tと送信用パケットとを送信手段7へ出力し、送信用チャネルCH_Tで送信用パケットを基地局BSへ送信するように送信手段7を制御する。
On the other hand, in step S5, when the transmission packet is determined to be transmittable, the
送信手段7は、送信用チャネルCH_Tおよび送信用パケットを制御手段4から受け、制御手段4からの制御に従って、アンテナ1を介して、送信用チャネルCH_Tで送信用パケットを基地局BSへ送信する(ステップS7)。
The transmission means 7 receives the transmission channel CH_T and the transmission packet from the control means 4, and transmits the transmission packet to the base station BS on the transmission channel CH_T via the
その後、制御手段4は、ACKパケットを基地局BSから受信したか否かを判定する(ステップS8)。この場合、制御手段4は、受信手段2からACKパケットを受けたとき、ACKパケットを基地局BSから受信したと判定し、受信手段2からACKパケットを受けなかったとき、ACKパケットを基地局BSから受信しなかったと判定する。 After that, the control means 4 determines whether or not the ACK packet has been received from the base station BS (step S8). In this case, when the control means 4 receives the ACK packet from the receiving means 2, it determines that the ACK packet has been received from the base station BS, and when it does not receive the ACK packet from the receiving means 2, the control means 4 receives the ACK packet from the base station BS. It is determined that the packet was not received from.
ステップS8において、ACKパケットを基地局BSから受信したと判定されたとき、制御手段4は、通信結果を“1”に設定する(ステップS9)。 When it is determined in step S8 that the ACK packet has been received from the base station BS, the control means 4 sets the communication result to "1" (step S9).
一方、ステップS8において、ACKパケットを基地局BSから受信しなかったと判定されたとき、制御手段4は、通信結果を“0”に設定する(ステップS10)。 On the other hand, when it is determined in step S8 that the ACK packet has not been received from the base station BS, the control means 4 sets the communication result to "0" (step S10).
そして、ステップS9またはステップS10の後、制御手段4は、制御チャネルを用いて、競合端末情報を基地局BSから取得する(ステップS11)。 Then, after step S9 or step S10, the control means 4 acquires competing terminal information from the base station BS using the control channel (step S11).
引き続いて、ステップS6またはステップS11の後、制御手段4は、競合端末情報、送信不可情報、通信結果およびチャネル空き時間を入力情報として学習器5へ出力し、Q学習を行うように学習器5を制御する。
Subsequently, after step S6 or step S11, the control means 4 outputs competing terminal information, transmission non-transmission information, communication result, and channel free time as input information to the
学習器5は、競合端末情報、送信不可情報、通信結果およびチャネル空き時間を入力情報として受け、その受けた競合端末情報、送信不可情報、通信結果およびチャネル待機時間を用いてQ学習を実行する(ステップS12)。
The
そして、学習器5は、Q学習の結果である出力情報IF_OUTを制御手段4へ出力する。制御手段4は、出力情報IF_OUTを学習器5から受ける。
Then, the
その後、制御手段4は、通信を終了するか否かを判定する(ステップS13)。ステップS13において、通信を終了しないと判定されたとき、一連の動作は、ステップS1へ移行する。その後、ステップS13において、通信を終了すると判定されるまで、ステップS1〜ステップS13が繰り返し実行される。 After that, the control means 4 determines whether or not to terminate the communication (step S13). When it is determined in step S13 that the communication is not terminated, the series of operations shifts to step S1. After that, in step S13, steps S1 to S13 are repeatedly executed until it is determined that the communication is terminated.
そして、ステップS13において、通信を終了すると判定されると、端末装置10の動作が終了する。
Then, in step S13, when it is determined that the communication is terminated, the operation of the
図15は、図14のステップS5の詳細な動作を説明するためのフローチャートである。 FIG. 15 is a flowchart for explaining the detailed operation of step S5 of FIG.
図15を参照して、図14のステップS4の後、制御手段4は、キャリアセンスの結果に基づいて、送信用チャネルCH_Tで他の端末装置が通信を行っているか否かを判定する(ステップS51)。 With reference to FIG. 15, after step S4 of FIG. 14, the control means 4 determines whether or not another terminal device is communicating on the transmission channel CH_T based on the result of carrier sense (step). S51).
ステップS51において、送信用チャネルCH_Tで他の端末装置が通信を行っていないと判定されたとき、制御手段4は、予測手段3から受けた各チャネルにおける予測チャネル空き時間および予測チャネル使用時間に基づいて、送信用チャネルCH_Tにおける予測チャネル空き時間が、送信用パケットの送信時間の長さよりも長いか否かを判定する(ステップS52)。 In step S51, when it is determined in the transmission channel CH_T that no other terminal device is communicating, the control means 4 is based on the predicted channel free time and the predicted channel usage time in each channel received from the predicting means 3. Therefore, it is determined whether or not the predicted channel free time in the transmission channel CH_T is longer than the transmission time of the transmission packet (step S52).
そして、ステップS51において、送信用チャネルCH_Tで他の端末装置が通信を行っていると判定されたとき、またはステップS52において、送信用チャネルCH_Tにおける予測チャネル空き時間が、送信用パケットの送信時間の長さよりも長くないと判定されたとき、制御手段4は、送信用パケットの送信が不可であると判定する(ステップS53)。 Then, in step S51, when it is determined that another terminal device is communicating on the transmission channel CH_T, or in step S52, the predicted channel free time on the transmission channel CH_T is the transmission time of the transmission packet. When it is determined that the length is not longer than the length, the control means 4 determines that the transmission of the transmission packet is impossible (step S53).
一方、ステップS52において、送信用チャネルCH_Tにおける予測チャネル空き時間が、送信用パケットの送信時間の長さよりも長いと判定されたとき、制御手段4は、送信用パケットの送信が可能であると判定する(ステップS54)。 On the other hand, in step S52, when it is determined that the predicted channel free time in the transmission channel CH_T is longer than the length of the transmission time of the transmission packet, the control means 4 determines that the transmission packet can be transmitted. (Step S54).
そして、ステップS53の後、一連の動作は、図14のステップS6へ移行し、ステップS54の後、一連の動作は、図14のステップS7へ移行する。 Then, after step S53, the series of operations shifts to step S6 of FIG. 14, and after step S54, the series of operations shifts to step S7 of FIG.
図16は、図14のステップS12の詳細な動作を説明するためのフローチャートである。 FIG. 16 is a flowchart for explaining the detailed operation of step S12 of FIG.
図16を参照して、図14のステップS6またはステップS11の後、学習器5は、入力情報を制御手段4から受ける(ステップS121)。
With reference to FIG. 16, after step S6 or step S11 of FIG. 14, the
そして、学習器5は、t回目のパケットの送信における状態stをランダムに決定する(ステップS122)。
Then, the
その後、学習器5は、ε−greedy法に基づいて、t回目のパケットの送信における行動atを決定する(ステップS123)。
Then, the
引き続いて、学習器5は、競合端末情報(例えば、競合端末個数)に基づいて式(3B)によって重み係数w1を算出する(ステップS124)。
Subsequently, the
そして、学習器5は、チャネル待機時間WTに基づいて式(3C)によって重み係数w2を算出する(ステップS125)。
Then, the
その後。学習器5は、送信不可情報が入力情報に含まれるか否かを判定する(ステップS126)。
afterwards. The
ステップ126において、送信不可情報が入力情報に含まれないと判定されたとき、学習器5は、状態stにおいて行動atを実行したときの(t+1)回目のパケットの送信における報酬rt+1を重み係数w1および重み係数w2を用いて式(3A)によって算出する(ステップS127)。
In
一方、ステップ126において、送信不可情報が入力情報に含まれると判定されたとき、学習器5は、状態stにおいて行動atを実行したときの(t+1)回目のパケットの送信における報酬rt+1を零と算出する(ステップS128)。
On the other hand, in
そして、ステップS127またはステップS128の後、学習器5は、学習率α、割引率γ(=0)および報酬rt+1を用いて、状態stおよび行動atに対応するQテーブルのQ値を更新する(ステップS129)。
After step S127 or step S128, the
そうすると、学習器5は、Q学習の終了条件が成立するか否かを判定する(ステップS130)。終了条件は、例えば、Q値の更新回数が10回に達したことである。
Then, the
ステップS130において、Q学習の終了条件が成立しないと判定されたとき、一連の動作は、ステップS122へ移行する。その後、ステップS130において、Q学習の終了条件が成立すると判定されるまで、ステップS122〜ステップS130が繰り返し実行される。 When it is determined in step S130 that the Q-learning end condition is not satisfied, the series of operations shifts to step S122. After that, in step S130, steps S122 to S130 are repeatedly executed until it is determined that the Q-learning end condition is satisfied.
そして、ステップS130において、Q学習の終了条件が成立すると判定されると、学習器5は、各状態stと、各状態stにおける最大のQ値と、最大のQ値が得られるときの行動atとの対応関係からなる出力情報IF_OUTを制御手段4へ出力する(ステップS131)。その後、一連の動作は、図14のステップS13へ移行する。
Then, in step S130, the termination condition of the Q-learning is determined to be satisfied, the
図16に示すステップS122〜S125,S126の“NO”,S127,S129を繰り返し実行することによって、競合端末個数が少ないときおよび/またはチャネル待機時間WTが短いとき、報酬rt+1が大きくなる。そして、Q値は、実質的に報酬rt+1によって決定されるので、報酬rt+1が大きくなると、状態stおよび行動atに対応するQ値は、より大きいQ値に更新される。 By repeatedly executing "NO", S127, and S129 in steps S122 to S125 and S126 shown in FIG. 16, the reward rt + 1 becomes large when the number of competing terminals is small and / or when the channel standby time WT is short. Then, the Q value are determined by the substantially reward r t + 1, the reward r t + 1 is large, Q values corresponding to the state s t and action a t is updated to a larger Q value.
その結果、競合端末個数が少ないこと、およびチャネル待機時間WTが短いことは、報酬rt+1を大きくすることを介してQ値を大きくする。 As a result, the small number of competing terminals and the short channel standby time WT increase the Q value through increasing the reward rt + 1.
従って、競合端末個数が少ないことは、端末装置10が他の端末装置に対して競合端末となる確率を低くする。その結果、パケットの衝突確率を低減できる。
Therefore, a small number of competing terminals reduces the probability that the
また、チャネル待機時間WTが短いことは、チャネル待機時間WTが短いチャネルが選択される確率を大きくする。その結果、チャネル利用効率を向上できる。 Further, the short channel waiting time WT increases the probability that a channel having a short channel waiting time WT is selected. As a result, channel utilization efficiency can be improved.
図14のステップS2が1回目に実行される場合、学習器5は、行動atをランダムに決定する(即ち、チャネルをランダムに選択する)。
If step S2 of FIG. 14 is executed for the first time, the
そして、学習器5は、ステップS12(図16に示すフローチャート)においてQ学習を実行し、各状態stと、各状態stにおける最大のQ値と、最大のQ値が得られるときの行動atとの対応関係からなる出力情報IF_OUTを制御手段4へ出力する。
Then, the
図17は、出力情報IF_OUTの概念図である。図17を参照して、出力情報IF_OUTは、状態stと、状態stに対応するQ値のうちの最大のQ値と、最大のQ値が得られるときの行動atとを含む。 FIG. 17 is a conceptual diagram of the output information IF_OUT. Referring to FIG. 17, the output information IF_OUT includes a state s t, and the maximum Q value among the Q value corresponding to the state s t, the action a t when the maximum of Q value is obtained.
状態st、状態stに対応するQ値のうちの最大のQ値、および最大のQ値が得られるときの行動atは、相互に対応付けられる。 State s t, a maximum of Q value, and action a t when the maximum of Q value is obtained from among the Q value corresponding to the state s t is correlated with one another.
ステップS12(図16に示すフローチャート)におけるQ学習の終了時のQテーブルは、図17に示すQテーブルTBL_Qからなる。 The Q-table at the end of Q-learning in step S12 (flow chart shown in FIG. 16) includes the Q-table TBL_Q shown in FIG.
学習器5は、Q学習の終了条件が満たされたと判定すると、“1”の状態stに対応するQ値(=q1,1,q1,3,q1,4)のうちの最大のQ値(例えば、q1,3)と、最大のQ値(例えば、q1,3)が得られるときの行動at(=“3”)とを検出する。
そして、学習器5は、“1”の状態stと、最大のQ値(例えば、q1,3)と、行動at(=“3”)とを相互に対応付けて出力情報IF_OUTに格納する。
Then, the
また、学習器5は、“2”の状態stに対応するQ値(=q2,2,q2,3)のうちの最大のQ値(例えば、q2,2)と、最大のQ値(例えば、q2,2)が得られるときの行動at(=“2”)とを検出する。
Also, the
そして、学習器5は、“2”の状態stと、最大のQ値(例えば、q2,2)と、行動at(=“2”)とを相互に対応付けて出力情報IF_OUTに格納する。
Then, the
更に、学習器5は、“3”の状態stに対応するQ値(=q3,2,q3,4)のうちの最大のQ値(例えば、q3,4)と、最大のQ値(例えば、q3,4)が得られるときの行動at(=“4”)とを検出する。
Furthermore, the
そして、学習器5は、“3”の状態stと、最大のQ値(例えば、q3,4)と、行動at(=“4”)とを相互に対応付けて出力情報IF_OUTに格納する。
Then, the
制御手段4は、出力情報IF_OUTを学習器5から受ける。そして、制御手段4は、ステップS12(図16に示すフローチャート)が実行された後のステップS2において、次のようにして行動atを決定する(即ち、送信用チャネルCH_Tを選択する)。
The control means 4 receives the output information IF_OUT from the
制御手段4は、出力情報IF_OUTに含まれる“1”の状態st、“2”の状態stおよび“3”の状態stから、送信用パケットの送信時間の長さによって決定される状態s’tに一致する状態stを検出する。 State control means 4, the state s t of "1" s contained in the output information IF_OUT, from the state s t "2" state s t and "3" of which is determined by the length of the transmission time of the transmission packet The state st that matches s't is detected.
例えば、制御手段4は、状態s’tに一致する状態stとして“1”の状態stを検出する。そして、制御手段4は、“1”の状態stに対応付けられた最大のQ値(=q1_max(=q1,3))と行動at(=at_max1(=“3”))を検出する。
For example, the
そうすると、制御手段4は、“3”の行動atにおいて選択されたチャネル#3を送信用チャネルCH_Tとして選択する。
Then, the
状態s’tに一致する状態stが“2”の状態または“3”の状態である場合も、制御手段4は、同様にして、チャネル#2またはチャネル#4を送信用チャネルCH_Tとして選択する。
Even when the state s t match the state s' t is the state of "2" state or "3", the
図14に示すフローチャート(図15および図16に示すフローチャートを含む)に従ってパケットを送信することによって、ステップS12における学習器5による学習の初期においては、キャリアセンスによって送信信号が検出されなかった場合、またはランダムアクセスのため、たまたま送信タイミングが同じであった場合には、パケットの衝突が生じるが、このようなパケットの衝突は、最終的に最適なチャネルを選択する上では必要なコストであり、学習が進めばパケットの衝突が減少していくので問題ではない。
By transmitting the packet according to the flowchart shown in FIG. 14 (including the flowchart shown in FIGS. 15 and 16), when the transmission signal is not detected by the carrier sense in the initial stage of learning by the
また、図14に示すフローチャート(図15および図16に示すフローチャートを含む)においては、競合端末装置の個数が多い方が報酬rt+1が小さくなるので(式(3A),(3B)参照)、端末装置10が他の端末装置に対して競合端末となる確率を下げている。
Further, in the flowchart shown in FIG. 14 (including the flowchart shown in FIGS. 15 and 16), the reward rt + 1 becomes smaller as the number of competing terminal devices increases (see equations (3A) and (3B)). The probability that the
従って、空きチャネルの予想だけでチャネル選択を行った場合に比べ、複数の端末装置が同じ空きチャネルに接続しようとする確率を低下することができる。その結果、パケット損失を抑制して周波数を有効利用できる。 Therefore, it is possible to reduce the probability that a plurality of terminal devices will try to connect to the same free channel as compared with the case where the channel is selected only by predicting the free channel. As a result, packet loss can be suppressed and the frequency can be effectively used.
なお、端末装置10の動作は、ソフトウェアによって実現されてもよい。この場合、端末装置10は、CPU(Central Processing Unit)、ROM(Read Only Memory)およびRAM(Random Access Memory)を備える。そして、ROMは、図14に示すフローチャート(図15および図16に示すフローチャートを含む)の各ステップからなるプログラムProg_Aを記憶する。
The operation of the
CPUは、ROMからプログラムProg_Aを読み出し、その読み出したプログラムProg_Aを実行し、送信用パケットの送信時間の長さにマッチする予測チャネル空き時間を有するチャネルを送信用チャネルCH_Tとして選択してパケットを基地局BSへ送信する。RAMは、算出された重み係数w1,w2、算出された報酬rt+1、および更新後のQ値等を一時的に記憶する。 The CPU reads the program Prog_A from the ROM, executes the read program Prog_A, selects a channel having a predicted channel free time that matches the length of the transmission time of the transmission packet as the transmission channel CH_T, and bases the packet. Send to station BS. The RAM temporarily stores the calculated weighting factors w 1 , w 2 , the calculated reward rt + 1 , and the updated Q value.
また、プログラムProg_Aは、CD,DVD等の記録媒体に記録されて流通してもよい。プログラムProg_Aを記録した記録媒体がコンピュータに装着されると、コンピュータは、記録媒体からプログラムProg_Aを読み出して実行し、送信用パケットの送信時間の長さにマッチする予測チャネル空き時間を有するチャネルを送信用チャネルCH_Tとして選択してパケットを基地局BSへ送信する。 Further, the program Prog_A may be recorded on a recording medium such as a CD or DVD and distributed. When the recording medium on which the program Prog_A is recorded is attached to the computer, the computer reads the program Prog_A from the recording medium, executes the program, and sends a channel having a predicted channel free time that matches the length of the transmission time of the transmission packet. The packet is transmitted to the base station BS by selecting it as the credit channel CH_T.
従って、プログラムProg_Aを記録した記録媒体は、コンピュータ読み取り可能な記録媒体である。 Therefore, the recording medium on which the program Prog_A is recorded is a computer-readable recording medium.
なお、上記においては、競合端末情報は、競合端末個数からなると説明したが、この発明の実施の形態においては、これに限らず、競合端末情報は、チャネルを占有するパケット長の期待値であってもよく、端末装置10自身の送信したいパケットのパケット長と似た傾向のパケット長を有する端末装置の個数であってもよい。
In the above, it has been described that the competing terminal information consists of the number of competing terminals, but in the embodiment of the present invention, the competing terminal information is not limited to this, and the competing terminal information is an expected value of the packet length occupying the channel. It may be the number of terminal devices having a packet length having a tendency similar to the packet length of the packet to be transmitted by the
チャネルを占有するパケット長の期待値は、端末装置10以外の端末装置から送信されたパケットがチャネルを占有するときのパケット長の平均値からなる。そして、チャネルを占有するパケット長の期待値は、基地局BSにおいて取得され、競合端末情報として基地局BSから制御チャネルで端末装置10へ送信される。
The expected value of the packet length occupying the channel is the average value of the packet lengths when the packets transmitted from the terminal devices other than the
また、端末装置10自身の送信したいパケットのパケット長と似た傾向のパケット長を有する端末装置の個数は、基地局BSにより取得され、競合端末情報として基地局BSから制御チャネルで端末装置10へ送信される。
Further, the number of terminal devices having a packet length having a tendency similar to the packet length of the packet to be transmitted by the
競合端末情報がチャネルを占有するパケット長の期待値からなるとき、重み係数w1は、チャネルを占有するパケット長の期待値の逆数として算出される。また、競合端末情報が端末装置10自身の送信したいパケットのパケット長と似た傾向のパケット長を有する端末装置の個数からなるとき、重み係数w1は、端末装置10自身の送信したいパケットのパケット長と似た傾向のパケット長を有する端末装置の個数の逆数として算出される。
When competing terminal information is from the expected value of the packet length occupying a channel, the weighting coefficients w 1 is calculated as the inverse of the expected value of the packet length occupying a channel. Further, when a conflict terminal information consists of the number of terminal devices having a packet length of trends similar to the packet length of a packet to be transmitted for the
重み係数w1が、チャネルを占有するパケット長の期待値の逆数として算出された場合、または端末装置10自身の送信したいパケットのパケット長と似た傾向のパケット長を有する端末装置の個数の逆数として算出された場合、端末装置10と同様なチャネルを選択する確率の高い端末装置との競合を抑制することができる。
When the weighting coefficient w 1 is calculated as the reciprocal of the expected value of the packet length occupying the channel, or the reciprocal of the number of terminal devices having a packet length having a tendency similar to the packet length of the packet to be transmitted by the
また、上記においては、チャネル待機時間WTを用いて重み係数w2を算出したが、この発明の実施の形態においては、これに限らず、チャネル待機時間WTの逆数を報酬rt+1として算出してもよい。この場合、報酬rt+1は、式(3A)において、w2=0とし、スループットFをチャネル待機時間WTの逆数に変えた次式によって算出される。 Further, in the above, the weight coefficient w 2 was calculated using the channel standby time WT, but the embodiment of the present invention is not limited to this, and the reciprocal of the channel standby time WT is calculated as the reward rt + 1. May be good. In this case, the reward rt + 1 is calculated by the following equation in which w 2 = 0 in the equation (3A) and the throughput F is changed to the reciprocal of the channel standby time WT.
チャネル待機時間WTの逆数を報酬rt+1とすることによって、チャネル待機時間WTが短い方が報酬rt+1が大きくなり、チャネル待機時間WTが長い方が報酬rt+1が小さくなる。その結果、チャネルの利用効率を向上させるチャネルを送信用チャネルCH_Tとして利用することができる。 By setting the reciprocal of the channel waiting time WT as the reward rt + 1 , the shorter the channel waiting time WT, the larger the reward rt + 1 , and the longer the channel waiting time WT, the smaller the reward rt + 1. As a result, the channel that improves the utilization efficiency of the channel can be used as the transmission channel CH_T.
更に、この発明の実施の形態においては、各チャネル#1〜#4でキャリアセンスを行うとき、送信元の端末装置の識別情報ID(例えば、無線LANのMACアドレス)を検出し、チャネル#1〜#4ごとに検出された送信元の端末装置数と、端末装置10の送信パケット長とに応じて送信用チャネルCH_Tを選択するようにしてもよい。
Further, in the embodiment of the present invention, when the carrier sense is performed on each of the
この場合、制御手段4は、上述した学習器5からの出力情報IF_OUTに加え、チャネル#1〜#4ごとに検出された送信元の端末装置数を考慮して送信用チャネルCH_Tを選択する。
In this case, the control means 4 selects the transmission channel CH_T in consideration of the number of transmission source terminal devices detected for each of
また、チャネル#1〜#4ごとに検出された送信元の端末装置数と、所要伝送遅延とに応じて送信用チャネルCH_Tを選択するようにしてもよい。
Further, the transmission channel CH_T may be selected according to the number of transmission source terminal devices detected for each of
より具体的には、即時に送信できた送信用パケットであれば、チャネルごとに検出された送信元の端末装置の個数が少ないチャネルであり、かつ、チャネル空き時間の予測値が端末装置10の送信用パケット長以上であるチャネルから送信用チャネルCH_Tを選択してもよい。
More specifically, if it is a transmission packet that can be transmitted immediately, the number of source terminal devices detected for each channel is small, and the predicted value of the channel free time is the
この場合、制御手段4は、上述した学習器5からの出力情報IF_OUTに加え、送信用パケットを即時に送信できたことを考慮して送信用チャネルCH_Tを選択する。
In this case, the control means 4 selects the transmission channel CH_T in consideration of the fact that the transmission packet could be transmitted immediately in addition to the output information IF_OUT from the
これにより、各チャネルで通信を行う端末数が増加すると、パケット長やパケット送信間隔などの分散が増加し、自己相関が減少するため、予測手段3による予測値の精度が劣化し、本発明の効果を得にくくなるという問題を解決できる。 As a result, as the number of terminals communicating on each channel increases, the variance such as packet length and packet transmission interval increases, and the autocorrelation decreases, so that the accuracy of the predicted value by the predicting means 3 deteriorates, and the accuracy of the predicted value by the predicting means 3 deteriorates. It can solve the problem that it is difficult to obtain the effect.
なお、自己相関が減少するとは、定期的にパケットを送信している場合、自身の最初のパケットの送信間隔に比較して、時間の経過とともにパケットの送信間隔が大きくずれてくることを示す。 Note that the decrease in autocorrelation means that when packets are transmitted periodically, the packet transmission interval deviates significantly with the passage of time as compared with the transmission interval of its own first packet.
更に、上記においては、重み係数w1は、競合端末装置の個数の逆数として算出されると説明したが、この発明の実施の形態においては、これに限らず、重み係数w1は、競合端末装置の個数が少なくなれば大きくなり、競合端末装置の個数が多くなれば小さくなるように算出されるものであれば、どのような計算式によって算出されてもよい。 Further, in the above, the weighting coefficients w 1 has been described as being calculated as the reciprocal of the number of competing terminal device, in the embodiment of the present invention is not limited thereto, the weight coefficient w 1 is competing terminal Any calculation formula may be used as long as it is calculated so that it increases as the number of devices decreases and decreases as the number of competing terminal devices increases.
更に、上記においては、重み係数w2は、チャネル待機時間の逆数として算出されると説明したが、この発明の実施の形態においては、これに限らず、重み係数w2は、チャネル待機時間が長くなれば小さくなり、チャネル待機時間が短くなれば大きくなるように算出されるものであれば、どのような計算式によって算出されてもよい。
Further, in the above, it has been explained that the weighting coefficient w 2 is calculated as the reciprocal of the channel waiting time, but in the embodiment of the present invention, the weighting coefficient w 2 is not limited to this, and the
この発明の実施の形態においては、送信用パケットの送信時間の長さと、学習器5からの出力情報IF_OUTとに基づいて送信用チャネルCH_Tを選択する制御手段4は、「選択手段」を構成する。
In the embodiment of the present invention, the control means 4 for selecting the transmission channel CH_T based on the length of the transmission time of the transmission packet and the output information IF_OUT from the
また、この発明の実施の形態においては、スループットFに重み係数w1を乗算して報酬rt+1を算出する処理は、「第1の演算処理」を構成し、スループットFに重み係数w2を乗算して報酬rt+1を算出する処理は、「第2の演算処理」を構成する。 Further, in embodiments of the present invention, the process of calculating a reward r t + 1 by multiplying the weighting coefficients w 1 throughput F constitutes a "first processing", the weight coefficient w 2 throughput F The process of multiplying to calculate the reward rt + 1 constitutes a "second arithmetic process".
更に、この発明の実施の形態においては、重み係数w1は、「第1の重み係数」を構成し、重み係数w2は、「第2の重み係数」を構成する。 Furthermore, in embodiments of the present invention, the weighting coefficients w 1 constitutes "a first weighting factor", the weight coefficient w 2 constitutes "the second weighting coefficient".
更に、この発明の実施の形態においては、通信結果の“1”は、「第1の指標」を構成し、通信結果の“0”は、「第2の指標」を構成する。 Further, in the embodiment of the present invention, the communication result "1" constitutes the "first index", and the communication result "0" constitutes the "second index".
上述した実施の形態によれば、次の効果を得ることができる。 According to the above-described embodiment, the following effects can be obtained.
送信したいパケット長に応じて高いスループットが得られるようにチャネルを選択するようになるため、チャネルの周波数利用効率を向上できる。また、互いに異なる送信パケット長のパケットを送信する端末と次回のパケットの送信が競合する場合でも競合相手とならず、結果としてパケット衝突確率を抑制することができる。 Since the channel is selected so that a high throughput can be obtained according to the packet length to be transmitted, the frequency utilization efficiency of the channel can be improved. Further, even when the terminal that transmits packets having different transmission packet lengths and the transmission of the next packet compete with each other, they do not become competitors, and as a result, the packet collision probability can be suppressed.
更に、チャネルごとに観測される端末装置数に応じてチャネル選択することにより、パケット衝突によって生じる再送を抑制し、遅延を抑制できる。 Further, by selecting the channel according to the number of terminal devices observed for each channel, it is possible to suppress the retransmission caused by the packet collision and suppress the delay.
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施の形態の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。 It should be considered that the embodiments disclosed this time are exemplary in all respects and not restrictive. The scope of the present invention is shown by the scope of claims rather than the description of the embodiment described above, and is intended to include all modifications within the meaning and scope equivalent to the scope of claims.
この発明は、端末装置、コンピュータに実行させるためのプログラムおよびプログラムを記録したコンピュータ読み取り可能な記録媒体に適用される。 The present invention applies to terminal devices, programs to be executed by a computer, and a computer-readable recording medium on which the programs are recorded.
1 アンテナ、2 受信手段、3 予測手段、4 制御手段、5 学習器、6 アプリケーション、7 送信手段、10 端末装置、31 判定部、32 計測部、33 分類部、34 予測部、35 予測器、100 通信システム。 1 antenna, 2 receiving means, 3 predicting means, 4 controlling means, 5 learner, 6 application, 7 transmitting means, 10 terminal device, 31 judgment unit, 32 measuring unit, 33 classification unit, 34 predicting unit, 35 predictor, 100 communication system.
Claims (21)
パケットを基地局へ送信する通信の通信結果と、当該端末装置と競合する競合端末装置の情報である競合端末情報と、1つのパケットを送信してから次のパケットを送信するまでのチャネルの待機時間であるチャネル待機時間とからなる入力情報、または前記パケットを前記基地局へ送信できないことを示す送信不可情報からなる入力情報に基づいて、パケットの送信時間の長さを状態とし、チャネルを選択することを行動とし、通信に成功したときのスループットまたは前記チャネル待機時間の逆数を報酬とするQ学習を実行してQ値の更新を前記Q学習の終了条件が満たされるまで繰り返し実行し、前記Q学習の終了条件が満たされたときの各状態と、各状態における最大のQ値と、各状態において前記最大のQ値が得られるときの行動とを相互に対応付けた構成からなる出力情報を出力する学習処理を実行する学習器と、
送信したいパケットの送信時間の長さに対応する前記Q学習の状態に対応する前記最大のQ値が得られるときの行動を前記出力情報から検出し、その検出した行動によって選択されたチャネルを送信用チャネルとして選択する選択手段と、
前記送信用チャネルにおいて前記予測手段によって予測されたチャネル空き時間が前記送信したいパケットの送信時間の長さよりも長いことからなる第1の条件が満たされたとき、バックオフを実行せずに、前記送信したいパケットを前記送信用チャネルで前記基地局へ送信する送信手段とを備える端末装置。 A predictive means for predicting the channel free time, which is the time when the channel is free, and the channel use time, which is the time when the channel is used, for all of the plurality of channels.
The communication result of the communication for transmitting the packet to the base station, the competing terminal information which is the information of the competing terminal device competing with the terminal device, and the waiting of the channel from the transmission of one packet to the transmission of the next packet. Based on the input information consisting of the channel standby time, which is the time, or the input information consisting of the non-transmission information indicating that the packet cannot be transmitted to the base station, the length of the packet transmission time is set as the state and the channel is selected. Q learning is executed with the throughput when communication is successful or the inverse of the channel standby time as a reward, and the Q value is updated repeatedly until the end condition of the Q learning is satisfied. Output information consisting of a configuration in which each state when the end condition of Q learning is satisfied, the maximum Q value in each state, and the action when the maximum Q value is obtained in each state are interrelated. A learner that executes learning processing that outputs
The action when the maximum Q value corresponding to the Q learning state corresponding to the length of the transmission time of the packet to be transmitted is obtained is detected from the output information, and the channel selected by the detected action is sent. Choices to choose as a credit channel and
When the first condition of the transmission channel, which consists of the channel free time predicted by the prediction means being longer than the transmission time of the packet to be transmitted, is satisfied, the backoff is not executed. A terminal device including a transmission means for transmitting a packet to be transmitted to the base station on the transmission channel.
学習器が、パケットを基地局へ送信する通信の通信結果と、当該端末装置と競合する競合端末装置の情報である競合端末情報と、1つのパケットを送信してから次のパケットを送信するまでのチャネルの待機時間であるチャネル待機時間とからなる入力情報、または前記パケットを前記基地局へ送信できないことを示す送信不可情報からなる入力情報に基づいて、パケットの送信時間の長さを状態とし、チャネルを選択することを行動とし、通信に成功したときのスループットまたは前記チャネル待機時間の逆数を報酬とするQ学習を実行してQ値の更新を前記Q学習の終了条件が満たされるまで繰り返し実行し、前記Q学習の終了条件が満たされたときの各状態と、各状態における最大のQ値と、各状態において前記最大のQ値が得られるときの行動とを相互に対応付けた構成からなる出力情報を出力する学習処理を実行する第2のステップと、
選択手段が、送信したいパケットの送信時間の長さに対応する前記Q学習の状態に対応する前記最大のQ値が得られるときの行動を前記出力情報から検出し、その検出した行動によって選択されたチャネルを送信用チャネルとして選択する第3のステップと、
送信手段が、前記送信用チャネルにおいて前記予測手段によって予測されたチャネル空き時間が前記送信したいパケットの送信時間の長さよりも長いことからなる第1の条件が満たされたとき、バックオフを実行せずに、前記送信したいパケットを前記送信用チャネルで前記基地局へ送信する第4のステップとをコンピュータに実行させるためのプログラム。 The first step in which the predictor predicts the channel free time, which is the time when the channel is free, and the channel use time, which is the time when the channel is used, for all of the plurality of channels.
From the transmission of one packet to the transmission of the next packet, the communication result of the communication in which the learner transmits the packet to the base station, the competing terminal information which is the information of the competing terminal device competing with the terminal device, and the competing terminal information. Based on the input information consisting of the channel standby time, which is the standby time of the channel, or the input information consisting of the non-transmission information indicating that the packet cannot be transmitted to the base station, the length of the packet transmission time is set as the state. , The action is to select a channel, Q learning is executed with the throughput when communication is successful or the inverse of the channel standby time as a reward, and the update of the Q value is repeated until the end condition of the Q learning is satisfied. A configuration in which each state when the end condition of the Q learning is satisfied, the maximum Q value in each state, and the action when the maximum Q value is obtained in each state are associated with each other. The second step of executing the learning process to output the output information consisting of
The selection means detects an action when the maximum Q value corresponding to the Q learning state corresponding to the length of the transmission time of the packet to be transmitted is obtained from the output information, and is selected by the detected action. The third step of selecting the channel for transmission and
When the transmitting means satisfies the first condition that the channel free time predicted by the predicting means in the transmitting channel is longer than the length of the transmitting time of the packet to be transmitted, the backoff is executed. A program for causing a computer to execute a fourth step of transmitting a packet to be transmitted to the base station on the transmission channel without using the packet.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020055284A JP7341430B2 (en) | 2020-03-26 | 2020-03-26 | A terminal device, a program to be executed by a computer, and a computer-readable recording medium on which the program is recorded. |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020055284A JP7341430B2 (en) | 2020-03-26 | 2020-03-26 | A terminal device, a program to be executed by a computer, and a computer-readable recording medium on which the program is recorded. |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021158458A true JP2021158458A (en) | 2021-10-07 |
JP7341430B2 JP7341430B2 (en) | 2023-09-11 |
Family
ID=77918555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020055284A Active JP7341430B2 (en) | 2020-03-26 | 2020-03-26 | A terminal device, a program to be executed by a computer, and a computer-readable recording medium on which the program is recorded. |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7341430B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018182405A (en) * | 2017-04-05 | 2018-11-15 | 株式会社国際電気通信基礎技術研究所 | Channel state predicting device, channel state predicting method, radio communication device, and radio communication method |
WO2018235311A1 (en) * | 2017-06-19 | 2018-12-27 | Mitsubishi Electric Corporation | Network system and network device for coexistence of wi-fi halow network and low-rate wireless personal area network (lr-wpan) |
-
2020
- 2020-03-26 JP JP2020055284A patent/JP7341430B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018182405A (en) * | 2017-04-05 | 2018-11-15 | 株式会社国際電気通信基礎技術研究所 | Channel state predicting device, channel state predicting method, radio communication device, and radio communication method |
WO2018235311A1 (en) * | 2017-06-19 | 2018-12-27 | Mitsubishi Electric Corporation | Network system and network device for coexistence of wi-fi halow network and low-rate wireless personal area network (lr-wpan) |
Also Published As
Publication number | Publication date |
---|---|
JP7341430B2 (en) | 2023-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5078302B2 (en) | Radio channel quality measuring method and measuring apparatus | |
US7852820B2 (en) | Systems and methods for reducing data collisions in wireless network communications | |
US8724477B2 (en) | Communication terminal tranmitting or receiving a signal according to a set timing determined by a maximum or minimum value of a backoff time and control apparatus communication method, computer program and integrated circuit performing the same | |
CN104022797B (en) | Semiconductor device | |
US8218493B2 (en) | System and method for interference mitigation in wireless networks | |
US8422444B2 (en) | Dynamic channel and transmission rate selection | |
JP2008512975A (en) | Method and apparatus for determining and managing congestion in a wireless communication system | |
US10084661B2 (en) | Method for evaluating performance of a data communication network | |
JP5871100B2 (en) | Cognitive radio system and resource allocation device and method thereof | |
RU2012131946A (en) | ADAPTIVE COMPETITIVE WINDOW IN INTERRUPTED CHANNELS OF WIRELESS COMMUNICATION | |
CN102379135B (en) | Method and device for improving the management of wireless mesh networks | |
US8891374B2 (en) | Wireless communication device and wireless communication device control method | |
US20100302961A1 (en) | Method for resolving network contention | |
Li et al. | An adaptive channel selection scheme for reliable TSCH-based communication | |
US7729266B2 (en) | Network load detection system, method, apparatus, and program | |
Kotagiri et al. | Distributed convolutional deep reinforcement learning based OFDMA MAC for 802.11 ax | |
JP2021158458A (en) | Terminal device, program to be executed by computer, and computer readable recording medium with program recorded thereon | |
US20220369115A1 (en) | Predicting a radio spectrum usage | |
Zhu et al. | Delay analysis for IEEE 802.15. 4 CSMA/CA scheme with heterogeneous buffered traffic | |
JP4722137B2 (en) | Processing wireless communication frames in a system including at least three wireless transceiver devices | |
CN102869114B (en) | System and method for analyzing throughput performance of common hopping multichannel protocol based on institute of electrical and electronics engineers (IEEE) 802.11 standard | |
JP7272606B2 (en) | A control device, a base station equipped with the same, a program to be executed by a computer, and a computer-readable recording medium recording the program | |
JP7370018B2 (en) | A terminal device, a program to be executed by a computer, and a computer-readable recording medium on which the program is recorded. | |
JP2012513152A (en) | Communication apparatus and method for use in a wireless communication network | |
KR102254714B1 (en) | Method of controlling reinforcement learning enabled rate adaption for 5g radio access networks, recording medium and device for performing the method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220519 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7341430 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |