WO2022079832A1 - Communication information prediction device, communication information prediction method, and communication information prediction program - Google Patents

Communication information prediction device, communication information prediction method, and communication information prediction program Download PDF

Info

Publication number
WO2022079832A1
WO2022079832A1 PCT/JP2020/038785 JP2020038785W WO2022079832A1 WO 2022079832 A1 WO2022079832 A1 WO 2022079832A1 JP 2020038785 W JP2020038785 W JP 2020038785W WO 2022079832 A1 WO2022079832 A1 WO 2022079832A1
Authority
WO
WIPO (PCT)
Prior art keywords
communication
information
machine learning
terminal device
learning block
Prior art date
Application number
PCT/JP2020/038785
Other languages
French (fr)
Japanese (ja)
Inventor
理一 工藤
馨子 高橋
友規 村上
匡史 岩渕
陸 大宮
智明 小川
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP2022556753A priority Critical patent/JP7439947B2/en
Priority to PCT/JP2020/038785 priority patent/WO2022079832A1/en
Publication of WO2022079832A1 publication Critical patent/WO2022079832A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/18Network planning tools
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/40Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]

Abstract

The present invention comprises: an environmental information generation unit for generating environmental information on a device environment of at least one of a terminal device and a wireless communication destination device for the terminal device; a communication unit for generating communication information on wireless communication for the terminal device; a communication environment model generation unit for generating, by using input information including the environmental information, a communication environment model for commoditizing machine learning blocks formed by the same coefficients and structures and outputting communication information corresponding to a plurality of temporal conditions; and a model use unit for predicting communication information on the terminal device by using the generated communication environmental information. In this manner, parameters related to communication can be efficiently output under a plurality of temporal conditions.

Description

通信情報予測装置、通信情報予測方法、および通信情報予測プログラムCommunication information prediction device, communication information prediction method, and communication information prediction program
 本発明は、複数の時間条件に対応する無線通信システムの通信情報を予測する技術に関する。 The present invention relates to a technique for predicting communication information of a wireless communication system corresponding to a plurality of time conditions.
 近年、様々な装置がインターネットにつながるIoT(Internet of Things)の実現が進んでおり、自動車、ドローン、建設機械車両など様々な機器が無線により接続されつつある。また、IEEE802.11規格の無線LAN(Local Area Network)、Bluetooth(登録商標)、LTE(Long Term Evolution)や5Gによるセルラー通信、IoT向けのLPWA(Low Power Wide Area)通信、車通信に用いられるETC(Electronic Toll Collection System)、VICS(Vehicle Information and Communication System(登録商標))、ARIB-STD-T109など、多種多様な無線通信規格が展開され、様々な無線通信サービスが広く利用されている。 In recent years, the realization of IoT (Internet of Things) in which various devices are connected to the Internet is progressing, and various devices such as automobiles, drones, and construction machinery vehicles are being connected wirelessly. It is also used for IEEE802.11 standard wireless LAN (Local Area Network), Bluetooth (registered trademark), LTE (LongTermEvolution) and 5G cellular communication, LPWA (Low Power Wide Area) communication for IoT, and vehicle communication. A wide variety of wireless communication standards such as ETC (Electronic Toll Collection System), VICS (Vehicle Information and Communication System (registered trademark)), and ARIB-STD-T109 have been developed, and various wireless communication services are widely used.
 しかしながら、無線通信サービスによっては、通信品質の要求条件を必ずしも満たすことができない、という問題がある。特に端末装置や周辺のオブジェクトが動く場合、アンテナの指向性や伝搬環境が変動するため、通信品質が大きな影響を受ける。例えば非特許文献1では、移動するロボットと基地局装置との間の距離情報を用いて無線通信の予測モデルを生成し、通信品質を予測する技術が検討されている。 However, there is a problem that some wireless communication services cannot always meet the requirements for communication quality. In particular, when the terminal device or surrounding objects move, the directivity of the antenna and the propagation environment fluctuate, which greatly affects the communication quality. For example, in Non-Patent Document 1, a technique of generating a prediction model of wireless communication using distance information between a moving robot and a base station device and predicting communication quality is studied.
 無線通信システムでは、無線通信機能が搭載された端末装置の位置、姿勢および動きなどの端末装置の状態、端末装置周辺の静的または動的な物体、などにより、通信相手との間の電波伝搬環境が変化して通信品質が影響を受け、無線通信により実現されるサービスやシステムに大きな影響を及ぼすことがある。例えば、高い周波数を用いる場合は電波の直進性が強く、通信品質は電波伝搬環境の変化による影響を受けやすい。このため、端末装置の安定した通信や通信品質をより高度に管理するには、端末装置自身と端末装置の周辺環境による通信品質の変動に対する対策が必要である。 In a wireless communication system, radio wave propagation with a communication partner depends on the position of the terminal device equipped with a wireless communication function, the state of the terminal device such as posture and movement, and static or dynamic objects around the terminal device. The environment may change and communication quality may be affected, which may have a significant impact on the services and systems realized by wireless communication. For example, when a high frequency is used, the straightness of the radio wave is strong, and the communication quality is easily affected by changes in the radio wave propagation environment. Therefore, in order to manage the stable communication and communication quality of the terminal device to a higher degree, it is necessary to take measures against the fluctuation of the communication quality due to the terminal device itself and the surrounding environment of the terminal device.
 この対策として、機械学習を用いて環境情報と通信情報の関係性をモデル化し、未来の通信品質を予測する技術は、良好な通信品質を維持する上で有用な手段の一つである。 As a countermeasure, the technique of modeling the relationship between environmental information and communication information using machine learning and predicting future communication quality is one of the useful means for maintaining good communication quality.
 ところが、環境情報や通信情報に基づいて、未来の通信品質や通信に係るイベント、未来の通信品質を報酬条件および最大化パラメータ、などの通信情報の出力などを行う場合、どの程度の未来において、どの程度の時間幅をターゲットにするかによって、使用するアルゴリズムやモデルを変更しなければならない。特に、複数の時間条件が存在する場合、それぞれの条件に対応する複数のモデルを生成する必要があり、演算コストや学習コストなどの負荷が大きくなるという問題がある。 However, when outputting communication information such as future communication quality and communication-related events, future communication quality as reward conditions and maximization parameters, etc. based on environmental information and communication information, in what future Depending on how much time you are targeting, you will have to change the algorithms and models you use. In particular, when there are a plurality of time conditions, it is necessary to generate a plurality of models corresponding to each condition, and there is a problem that the load such as calculation cost and learning cost becomes large.
 上記課題に鑑み、本発明は、環境情報を含む入力情報から通信に係るパラメータを複数の時間条件で出力する機械学習のモデルを生成し、通信情報を予測することができる通信情報予測装置、通信情報予測方法、および通信情報予測プログラムを提供することを目的とする。 In view of the above problems, the present invention is a communication information prediction device and communication capable of generating a machine learning model that outputs communication-related parameters from input information including environmental information under a plurality of time conditions and predicting communication information. An object of the present invention is to provide an information prediction method and a communication information prediction program.
 本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測装置において、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成部と、前記端末装置の無線通信に係る通信情報を生成する通信部と、前記環境情報を含む入力情報を用いて、同じ係数や構造で構成される機械学習ブロックを共用化し、複数の時間条件に対応する通信情報を含むターゲット情報を出力する通信環境モデルを生成する通信環境モデル生成部と、生成された前記通信環境モデルを用いて前記端末装置の通信情報を予測するモデル利用部とを有することを特徴とする。 The present invention is a communication information prediction device that generates a communication environment model related to wireless communication of a mobile terminal device and predicts communication information of the terminal device, at least one of the terminal device and the wireless communication destination device of the terminal device. The environment information generation unit that generates the environment information related to the device environment, the communication unit that generates the communication information related to the wireless communication of the terminal device, and the input information including the environment information are used and configured with the same coefficient and structure. The terminal uses the communication environment model generator that generates a communication environment model that shares the machine learning block to be generated and outputs target information including communication information corresponding to a plurality of time conditions, and the generated communication environment model. It is characterized by having a model utilization unit that predicts communication information of the device.
 また、本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測方法であって、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、前記端末装置の無線通信に係る通信情報を生成する通信処理と、前記環境情報を含む入力情報を用いて、同じ係数や構造で構成される機械学習ブロックを共用化し、複数の時間条件に対応する通信情報を含むターゲット情報を出力する通信環境モデルを生成する通信環境モデル生成処理と、生成された前記通信環境モデルを用いて前記端末装置の通信情報を予測するモデル利用処理とを行うことを特徴とする。 Further, the present invention is a communication information prediction method for generating a communication environment model related to wireless communication of a mobile terminal device and predicting communication information of the terminal device, and is a wireless communication destination of the terminal device and the terminal device. The same coefficient is used by using the environment information generation process for generating environmental information related to at least one device environment of the device, the communication process for generating communication information related to the wireless communication of the terminal device, and the input information including the environment information. The communication environment model generation process that generates a communication environment model that outputs target information including communication information corresponding to multiple time conditions by sharing the machine learning block composed of the above and the structure, and the generated communication environment model. It is characterized in that it performs a model utilization process for predicting communication information of the terminal device.
 また、本発明は、移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する処理をコンピュータに実行させる通信情報予測プログラムであって、前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、前記端末装置の無線通信に係る通信情報を生成する通信処理と、前記環境情報を含む入力情報を用いて、同じ係数や構造で構成される機械学習ブロックを共用化し、複数の時間条件に対応する通信情報を含むターゲット情報を出力する通信環境モデルを生成する通信環境モデル生成処理と、生成された前記通信環境モデルを用いて前記端末装置の通信情報を予測するモデル利用処理とをコンピュータで実行することを特徴とする。 Further, the present invention is a communication information prediction program for generating a communication environment model related to wireless communication of a mobile terminal device and causing a computer to execute a process of predicting communication information of the terminal device. Environmental information generation processing that generates environmental information related to the environment of at least one of the wireless communication destination devices of the terminal device, communication processing that generates communication information related to wireless communication of the terminal device, and input information including the environmental information. A communication environment model generation process that generates a communication environment model that outputs target information including communication information corresponding to multiple time conditions by sharing a machine learning block composed of the same coefficient and structure using It is characterized in that a computer executes a model utilization process for predicting communication information of the terminal device using the communication environment model.
 本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムは、環境情報を含む入力情報から通信に係るパラメータを複数の時間条件で出力する機械学習のモデルを生成し、通信情報を予測することができる。特に、共通の機械学習ブロックの利用により、学習コストとモデルの利用コストを低減することができる。 The communication information prediction device, the communication information prediction method, and the communication information prediction program according to the present invention generate a machine learning model that outputs communication parameters from input information including environmental information under a plurality of time conditions, and communication information. Can be predicted. In particular, by using a common machine learning block, the learning cost and the model usage cost can be reduced.
無線通信システムの構成例を示す図である。It is a figure which shows the configuration example of a wireless communication system. 通信環境モデル生成部を訓練する場合の構成例を示す図である。It is a figure which shows the configuration example in the case of training a communication environment model generation part. 本実施形態に係る第1の通信環境モデルの一例を示す図である。It is a figure which shows an example of the 1st communication environment model which concerns on this embodiment. 本実施形態に係る第2の通信環境モデルの一例を示す図である。It is a figure which shows an example of the 2nd communication environment model which concerns on this embodiment. 自律移動ロボットの一例を示す図である。It is a figure which shows an example of the autonomous mobile robot. 自律移動ロボットが認識する屋内マップとゴールの位置を示す図である。It is a figure which shows the indoor map and the position of a goal which an autonomous mobile robot recognizes. 第1の構成の通信環境モデルの深層ニューラルネットワークの具体例を示す図である。It is a figure which shows the specific example of the deep neural network of the communication environment model of 1st configuration. 第2の構成の通信環境モデルの深層ニューラルネットワークの具体例を示す図である。It is a figure which shows the specific example of the deep neural network of the communication environment model of the 2nd configuration. RNNの入力と出力の関係を示す図である。It is a figure which shows the relationship between the input and output of RNN. 第1の構成の通信環境モデルの機能ブロックの一例を示す図である。It is a figure which shows an example of the functional block of the communication environment model of 1st configuration. 第2の構成の通信環境モデルの機能ブロックの一例を示す図である。It is a figure which shows an example of the functional block of the communication environment model of the 2nd configuration. 第4の機械学習ブロックの他の構成例を示す図である。It is a figure which shows the other structural example of the 4th machine learning block. 実証実験の比較例の通信環境モデルの一例を示す図である。It is a figure which shows an example of the communication environment model of the comparative example of the demonstration experiment. 実証実験における性能評価の結果を示す図である。It is a figure which shows the result of the performance evaluation in the demonstration experiment.
 以下、図面を参照して本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムの実施形態について説明する。なお、以下に説明する実施形態は本発明の一例であり、本発明は以下の実施形態に制限されるものではない。 Hereinafter, embodiments of the communication information prediction device, the communication information prediction method, and the communication information prediction program according to the present invention will be described with reference to the drawings. The embodiments described below are examples of the present invention, and the present invention is not limited to the following embodiments.
 図1は、無線通信システム100の構成例を示す。無線通信システム100は、基地局装置101、基地局装置101と無線通信を行うM台(Mは正の整数)の端末装置102(1)から102(M)で構成されている。ここで、M台の端末装置102(1)から102(M)に共通する説明を行う場合は、符号末尾の(番号)を省略して端末装置102と記載する。なお、端末装置102を構成する複数の同じブロックに対しても同様に記載する。 FIG. 1 shows a configuration example of the wireless communication system 100. The wireless communication system 100 is composed of M units (M is a positive integer) of terminal devices 102 (1) to 102 (M) that perform wireless communication with the base station device 101 and the base station device 101. Here, when the description common to the M terminals 102 (1) to 102 (M) is given, the terminal device 102 is described by omitting the (number) at the end of the code. The same applies to a plurality of the same blocks constituting the terminal device 102.
 図1の例では、基地局装置101およびM台の端末装置102の全てが本発明に係る通信情報予測装置としての機能を有し、通信情報の予測を行うための通信環境モデルを生成し、通信情報予測を行うことができる。 In the example of FIG. 1, all of the base station device 101 and the M terminal devices 102 have a function as the communication information prediction device according to the present invention, and generate a communication environment model for predicting communication information. Communication information can be predicted.
 なお、本実施形態では、基地局装置101を介してネットワークに接続する構成として説明するが、基地局装置101とは別にネットワークに接続可能な通信装置を有していてもよい。そして、端末装置102は、基地局装置101またはネットワークに接続可能な通信装置を介して、ネットワークに接続されたカメラやセンサを搭載する機器(基地局装置101を含むアクセスポイントや周辺路上の監視カメラなど)からカメラ情報やセンサ情報などの非通信情報を環境情報として収集することができる。また、端末装置102は、他の端末装置102と直接、通信を行って端末装置102に搭載されたカメラ/センサからカメラ情報やセンサ情報を収集してもよい。例えば端末装置102が自動車に搭載された通信装置の場合、車車間通信(車対車間の通信)により、カメラ情報やセンサ情報(位置情報などを含む)が収集される。このようにして、ターゲットとする基地局装置101と端末装置102との間の無線通信のモデルを機械学習により生成するための環境情報が収集される。そして、生成された通信環境モデルを用いて基地局装置101と端末装置102との間の通信情報の予測が行われる。 In the present embodiment, the configuration of connecting to the network via the base station device 101 will be described, but a communication device capable of connecting to the network may be provided separately from the base station device 101. Then, the terminal device 102 is a device (access point including the base station device 101 or a monitoring camera on a peripheral road) equipped with a camera or a sensor connected to the network via the base station device 101 or a communication device connectable to the network. Non-communication information such as camera information and sensor information can be collected as environmental information. Further, the terminal device 102 may directly communicate with another terminal device 102 to collect camera information and sensor information from the camera / sensor mounted on the terminal device 102. For example, when the terminal device 102 is a communication device mounted on an automobile, camera information and sensor information (including position information) are collected by vehicle-to-vehicle communication (vehicle-to-vehicle communication). In this way, environmental information for generating a model of wireless communication between the target base station device 101 and the terminal device 102 by machine learning is collected. Then, the communication information between the base station device 101 and the terminal device 102 is predicted using the generated communication environment model.
 (基地局装置101の構成例)
 図1において、基地局装置101は、ネットワークに接続する機能を有し、M台の端末装置102との間で無線通信を行う。基地局装置101は、NW部201、通信部202(1)から通信部202(N)、通信環境モデル生成部203、環境情報生成部204およびモデル利用部205を有する。
(Configuration example of base station device 101)
In FIG. 1, the base station device 101 has a function of connecting to a network and performs wireless communication with M terminal devices 102. The base station apparatus 101 includes a NW unit 201, a communication unit 202 (1) to a communication unit 202 (N), a communication environment model generation unit 203, an environment information generation unit 204, and a model utilization unit 205.
 NW部201は、外部のネットワークに接続するためのインターフェースである。基地局装置101は、NW部201を介して、外部のネットワークに接続されるカメラやセンサなどの装置からカメラ情報(撮影画像など)やセンサ情報(三次元レーザなど)を取得することができる。これらの情報は、基地局装置101に接続される端末装置102も取得可能である。 The NW unit 201 is an interface for connecting to an external network. The base station device 101 can acquire camera information (photographed image, etc.) and sensor information (three-dimensional laser, etc.) from a device such as a camera or sensor connected to an external network via the NW unit 201. This information can also be acquired by the terminal device 102 connected to the base station device 101.
 通信部202は、通信部202(1)から通信部202(N)までのN個(Nは正の整数)を有し、複数の端末装置102との間で無線通信を行うことができる(通信処理)。また、通信部202は、無線通信に関係する通信情報を生成し、通信環境モデル生成部203およびモデル利用部205に出力する。通信情報は、例えば、受信信号電力、信号対雑音電力比(SNR)、信号対干渉雑音電力比(SINR)、RSSI(Received Signal Strength Indication)、RSRQ(Received Signal Reference Quality)、パケット誤り率、到達ビット数、単位時間当たりの到達ビット数、MCS(Modulation and Coding Scheme index)、再送回数、遅延時間、誤り訂正方式、通信システムの周波数、利用するリソースの帯域幅などの周波数条件、などである。さらに、これらの値の微分情報、これらの値から計算式を用いて算出される指標、これらの指標に影響を与えるシステムの設定項目などであってもよい。 The communication unit 202 has N numbers (N is a positive integer) from the communication unit 202 (1) to the communication unit 202 (N), and can perform wireless communication with a plurality of terminal devices 102 (N). Communication processing). Further, the communication unit 202 generates communication information related to wireless communication and outputs it to the communication environment model generation unit 203 and the model utilization unit 205. Communication information includes, for example, received signal power, signal-to-noise power ratio (SNR), signal-to-noise power ratio (SINR), RSSI (ReceivedSignalStrengthIndication), RSRQ (ReceivedSignalReferenceQuality), packet error rate, and arrival. The number of bits, the number of reached bits per unit time, MCS (Modulation and Coding Scheme index), the number of retransmissions, the delay time, the error correction method, the frequency of the communication system, the frequency conditions such as the bandwidth of the resource to be used, and the like. Further, it may be the differential information of these values, an index calculated from these values using a calculation formula, a system setting item that affects these indexes, and the like.
 通信環境モデル生成部203は、環境情報生成部204が生成する環境情報と、通信部202(1)から通信部202(N)、通信部301(1)から通信部301(M)のうち少なくとも一つが生成する通信情報と、を用いて、通信情報を予測するための通信環境モデルを生成する(通信環境モデル生成処理)。なお、通信環境モデルの生成方法については後述する。 The communication environment model generation unit 203 includes at least one of the environment information generated by the environment information generation unit 204, the communication unit 202 (1) to the communication unit 202 (N), and the communication unit 301 (1) to the communication unit 301 (M). Using the communication information generated by one, a communication environment model for predicting the communication information is generated (communication environment model generation process). The method of generating the communication environment model will be described later.
 環境情報生成部204は、装置環境に係る環境情報を生成する(環境情報生成処理)。環境情報は、端末装置102および基地局装置101の位置/姿勢/状態/動き/制御指令/端末装置102および基地局装置101またはネットワークを介して取得可能な機器のカメラ情報およびセンサ情報(物体の有無、サイズ、材質など様々な情報を含む)/構造物の動作/端末装置102およびネットワークの行動戦略、などの少なくとも一つの情報を含む。 The environmental information generation unit 204 generates environmental information related to the device environment (environmental information generation processing). Environmental information includes camera information and sensor information (of an object) of a device that can be acquired via the position / attitude / state / movement / control command / terminal device 102 of the terminal device 102 and the base station device 101 or the base station device 101 or a network. Includes at least one piece of information such as (including various information such as presence / absence, size, material) / operation of structure / action strategy of terminal device 102 and network.
 ここで、制御指令は、例えば、端末装置102が自律移動ロボットである場合、ロボット正面方向へのタイヤ回転指令、ロボットの回転指令などに対応する。また、端末装置102およびネットワークの行動戦略は、例えば、端末装置102やロボットの予定移動経路、端末装置102の電力モード、端末装置102が利用するアンテナ数、端末装置102へのQoS設定、ネットワークの経路設定、ネットワークの混雑状況、ネットワークにおけるルーティングルール、アプリケーションの設定、などである。 Here, the control command corresponds to, for example, when the terminal device 102 is an autonomous mobile robot, a tire rotation command in the front direction of the robot, a rotation command of the robot, and the like. Further, the action strategies of the terminal device 102 and the network include, for example, the planned movement route of the terminal device 102 and the robot, the power mode of the terminal device 102, the number of antennas used by the terminal device 102, the QoS setting to the terminal device 102, and the network. Route settings, network congestion status, network routing rules, application settings, etc.
 さらに、環境情報は、端末装置102の所有者情報やタイプ(スマートフォンなどの携帯端末、自動車、ロボット、ドローンなど)の情報、入店者情報、自動車の移動履歴、など、通信環境モデルでターゲット情報を予測するために使えるのではないかと思われる全ての非通信情報を含む情報であってもよい。環境情報が多いほど、通信環境モデルの予測精度が向上する可能性がある。 Furthermore, the environmental information is target information in the communication environment model, such as owner information and type information (mobile terminals such as smartphones, automobiles, robots, drones, etc.), store occupant information, automobile movement history, etc. of the terminal device 102. It may be information including all non-communication information that may be used to predict. The more environmental information there is, the better the prediction accuracy of the communication environment model may be.
 モデル利用部205は、通信環境モデル生成部203により生成された通信環境モデルを用いて、ターゲット情報の出力、または報酬を最大化するような戦略情報の出力を行う(モデル利用処理)。例えば、端末装置102が自律移動ロボットの場合、受信電力を最大化することに報酬を設定し、報酬が高くなるようなX座標速度、Y座標速度、回転指令などを戦略情報として出力することができる。なお、モデル利用部205の動作については後述する。 The model utilization unit 205 outputs target information or strategic information that maximizes the reward by using the communication environment model generated by the communication environment model generation unit 203 (model utilization processing). For example, when the terminal device 102 is an autonomous mobile robot, it is possible to set a reward for maximizing the received power and output X-coordinate speed, Y-coordinate speed, rotation command, etc. that increase the reward as strategic information. can. The operation of the model utilization unit 205 will be described later.
 このようにして、基地局装置101が通信情報予測装置として機能する場合、通信環境モデル生成部203は、環境情報生成部204から得られた環境情報と、通信部202から得られる通信情報と、を用いて、通信環境モデルを生成する。そして、モデル利用部205は、通信環境モデル生成部203が生成した通信環境モデルを用いて、通信情報を予測することができる。 In this way, when the base station device 101 functions as a communication information prediction device, the communication environment model generation unit 203 includes the environmental information obtained from the environment information generation unit 204, the communication information obtained from the communication unit 202, and the communication information. To generate a communication environment model using. Then, the model utilization unit 205 can predict the communication information by using the communication environment model generated by the communication environment model generation unit 203.
 (端末装置102の構成例)
 端末装置102(1)から端末装置102(M)は、それぞれ基地局装置101との間で無線通信を行う。
(Configuration example of terminal device 102)
The terminal device 102 (1) to the terminal device 102 (M) each perform wireless communication with the base station device 101.
 端末装置102は、通信部301、通信環境モデル生成部302、環境情報生成部303およびモデル利用部304を有する。 The terminal device 102 has a communication unit 301, a communication environment model generation unit 302, an environment information generation unit 303, and a model utilization unit 304.
 通信部301は、基地局装置101の通信部202、または他の端末装置102との間で無線通信を行う(通信処理)。また、通信部301は、基地局装置101の通信部202と同様に、無線通信に関係する通信情報を生成し、通信環境モデル生成部302およびモデル利用部304に出力する。 The communication unit 301 performs wireless communication with the communication unit 202 of the base station device 101 or another terminal device 102 (communication processing). Further, the communication unit 301 generates communication information related to wireless communication and outputs it to the communication environment model generation unit 302 and the model utilization unit 304, similarly to the communication unit 202 of the base station apparatus 101.
 通信環境モデル生成部302は、基地局装置101の通信環境モデル生成部203と同様に、環境情報生成部303から得られた環境情報と、通信部301から得られる通信情報と、を用いて通信環境モデルを生成する(通信環境モデル生成処理)。 Similar to the communication environment model generation unit 203 of the base station apparatus 101, the communication environment model generation unit 302 communicates using the environment information obtained from the environment information generation unit 303 and the communication information obtained from the communication unit 301. Generate an environment model (communication environment model generation process).
 環境情報生成部303は、基地局装置101の環境情報生成部204と同様に、環境情報を生成する(環境情報生成処理)。なお、通信環境モデルの生成方法については後述する。 The environmental information generation unit 303 generates environmental information (environmental information generation processing) in the same manner as the environmental information generation unit 204 of the base station apparatus 101. The method of generating the communication environment model will be described later.
 モデル利用部304は、基地局装置101のモデル利用部205と同様に、通信環境モデル生成部302により生成された通信環境モデルを用いて、ターゲット情報の出力、または報酬を最大化するような戦略情報の出力を行う(モデル利用処理)。 Similar to the model utilization unit 205 of the base station apparatus 101, the model utilization unit 304 uses the communication environment model generated by the communication environment model generation unit 302 to output target information or maximize the reward. Output information (model usage process).
 このようにして、端末装置102が通信情報予測装置として機能する場合、通信環境モデル生成部302は、環境情報生成部303から得られた環境情報と、通信部301から得られる通信情報と、を用いて、通信環境モデルを生成する。そして、モデル利用部304は、通信環境モデル生成部302が生成した通信環境モデルを用いて、通信情報を予測することができる。 In this way, when the terminal device 102 functions as a communication information prediction device, the communication environment model generation unit 302 can obtain the environmental information obtained from the environment information generation unit 303 and the communication information obtained from the communication unit 301. Use to generate a communication environment model. Then, the model utilization unit 304 can predict the communication information by using the communication environment model generated by the communication environment model generation unit 302.
 ここで、上述の説明では、基地局装置101と端末装置102とに分けて説明したが、基地局装置101と端末装置102との間で機能を分担してもよい。例えば、通信環境モデル生成部203で生成された通信環境モデルを各端末装置102のモデル利用部304が利用するようにしてもよい。 Here, in the above description, the base station device 101 and the terminal device 102 have been described separately, but the functions may be shared between the base station device 101 and the terminal device 102. For example, the communication environment model generated by the communication environment model generation unit 203 may be used by the model utilization unit 304 of each terminal device 102.
 (通信環境モデル生成部)
 次に、基地局装置101の通信環境モデル生成部203および端末装置102の通信環境モデル生成部302について詳しく説明する。なお、ここでは、基地局装置101の通信環境モデル生成部203として説明するが、端末装置102の通信環境モデル生成部302についても基本的な動作は同じである。
(Communication environment model generator)
Next, the communication environment model generation unit 203 of the base station device 101 and the communication environment model generation unit 302 of the terminal device 102 will be described in detail. Although the description is given here as the communication environment model generation unit 203 of the base station device 101, the basic operation is the same for the communication environment model generation unit 302 of the terminal device 102.
 基地局装置101の通信環境モデル生成部203は、複数の端末装置102との間の無線通信における通信情報および環境情報を収集して多くの訓練データを用いることができるので、端末装置102の通信環境モデル生成部302よりも望ましい。しかし、端末装置102ごとに最適化されたモデルとなるように転移学習やファインチューニングなどの技術で調整することが可能である。 Since the communication environment model generation unit 203 of the base station device 101 can collect communication information and environment information in wireless communication with a plurality of terminal devices 102 and use a lot of training data, the communication of the terminal device 102 can be used. It is preferable to the environment model generator 302. However, it is possible to adjust by techniques such as transfer learning and fine tuning so that the model is optimized for each terminal device 102.
 通信環境モデルは、環境情報、または、環境情報および通信情報を入力情報として、同じ時間または未来の時間におけるターゲット情報を出力するように、生成されるモデルである。通信環境モデルは、出力の値が高精度となるように、生成されてもよいし、出力値とは異なるあるパラメータを最大化するように強化学習により生成されてもよい。 The communication environment model is a model generated so as to output environmental information or target information at the same time or future time by using environmental information and communication information as input information. The communication environment model may be generated so that the output value is highly accurate, or may be generated by reinforcement learning so as to maximize a certain parameter different from the output value.
 例えば、未来の時間の受信電力を通信環境モデルにより出力する場合には、未来の時間の受信電力をターゲット情報のパラメータとして訓練データを形成し、通信環境モデルの出力となる受信電力の予測値と実際の受信電力との誤差が少なくなるように、通信環境モデルが生成される。あるいは、端末装置102が自律移動ロボットである場合、受信電力を最大化するように、ロボットのX座標速度、Y座標位置速度、回転指令を出力させるために、強化学習により、受信電力を最大化することに報酬を設定し、報酬が高くなるようなX座標速度、Y座標速度、回転指令を出力するように通信環境モデルが生成される。 For example, when the received power of the future time is output by the communication environment model, the training data is formed by using the received power of the future time as the parameter of the target information, and the predicted value of the received power that is the output of the communication environment model is used. The communication environment model is generated so that the error from the actual received power is small. Alternatively, when the terminal device 102 is an autonomous mobile robot, the received power is maximized by enhanced learning in order to output the X-coordinate speed, Y-coordinate position speed, and rotation command of the robot so as to maximize the received power. A communication environment model is generated so as to set a reward for the robot and output an X-coordinate velocity, a Y-coordinate velocity, and a rotation command so as to increase the reward.
 通信環境モデルは、共通の構造や出力を利用することで、効率的に訓練でき、モデルの係数を最適化しやすいと考えられる。 The communication environment model can be trained efficiently by using a common structure and output, and it is thought that it is easy to optimize the coefficients of the model.
 図2は、通信環境モデル生成部203を訓練する場合の構成例を示す。なお、ここでは、基地局装置101の通信環境モデル生成部203として説明するが、端末装置102の通信環境モデル生成部302の場合も同様である。 FIG. 2 shows a configuration example when training the communication environment model generation unit 203. Although the description is given here as the communication environment model generation unit 203 of the base station device 101, the same applies to the communication environment model generation unit 302 of the terminal device 102.
 図2において、通信環境モデル生成部203(または通信環境モデル生成部302)は、環境情報、または環境情報および通信情報からなる入力情報と、ターゲット情報とから構成される訓練データを用いて、通信環境モデル401を生成する。訓練時に、入力情報に対応する適切なターゲット情報を出力するように生成された通信環境モデル401は、利用時には、環境情報、または環境情報および通信情報からなる入力情報から未来の時間のターゲット情報を出力する。 In FIG. 2, the communication environment model generation unit 203 (or communication environment model generation unit 302) communicates using environment information or training data composed of input information consisting of environment information and communication information and target information. Generate the environment model 401. At the time of training, the communication environment model 401 generated to output appropriate target information corresponding to the input information, at the time of use, obtains the target information of the future time from the environmental information or the input information consisting of the environmental information and the communication information. Output.
 ここで、ターゲット情報は、通信情報、または通信情報のパラメータを最大化する制御に関するパラメータである。制御に関するパラメータとは、端末装置102の動き、基地局装置101または他の端末装置102などの無線通信先装置の動き、物理層からアプリケーション層までのOSI参照モデルにおけるモード/通信宛先/通信経路/通信方式などの制御、電波伝搬環境に影響を与える構造物/メタマテリアル/誘電体の位置・動き・設定などの制御、などである。 Here, the target information is communication information or a parameter related to control that maximizes the parameter of the communication information. The control parameters include the movement of the terminal device 102, the movement of the wireless communication destination device such as the base station device 101 or another terminal device 102, and the mode / communication destination / communication path / in the OSI reference model from the physical layer to the application layer. Control of communication method, etc., control of structure / metamaterial / dielectric position / movement / setting, etc. that affect the radio wave propagation environment.
 図3は、本実施形態に係る第1の通信環境モデル401(1)の一例を示す。第1の通信環境モデル401(1)は、第1の機械学習ブロック501と、第2の機械学習ブロック502(1)から(K)とで構成される。Kは出力するターゲット情報の対応する時間の数であり、共通の第1の機械学習ブロック501を用いて、異なる時間に対応するターゲット情報が生成される。図3において、第1の機械学習ブロック501は、ニューラルネットワーク、決定木、ランダムフォレスト、など任意の機械学習アルゴリズムを用いて構成される。 FIG. 3 shows an example of the first communication environment model 401 (1) according to the present embodiment. The first communication environment model 401 (1) is composed of a first machine learning block 501 and second machine learning blocks 502 (1) to (K). K is the number of corresponding times of the output target information, and the common first machine learning block 501 is used to generate the target information corresponding to different times. In FIG. 3, the first machine learning block 501 is configured using an arbitrary machine learning algorithm such as a neural network, a decision tree, or a random forest.
 ここで、第1の機械学習ブロック501の出力情報を特徴空間情報と定義する。特徴空間情報は、環境情報、または環境情報に何らかの信号処理を行って生成される情報であり、環境情報に関する情報を含んでいたり、環境情報から抽出可能だったりする情報のことである。例えば、第2の機械学習ブロックが異なる時間に対応したターゲット情報を出力するために効果的な情報が、特徴空間情報として第1の機械学習ブロック501から出力される。なお、異なる時間に対する出力を行うため、第1の機械学習ブロック501をリカレントニューラルネットワーク(RNN)で構築することもできる。 Here, the output information of the first machine learning block 501 is defined as the feature space information. The feature space information is environment information or information generated by performing some kind of signal processing on the environment information, and is information that includes information about the environment information or can be extracted from the environment information. For example, information effective for the second machine learning block to output target information corresponding to different times is output from the first machine learning block 501 as feature space information. It should be noted that the first machine learning block 501 can also be constructed by a recurrent neural network (RNN) in order to output for different times.
 図3において、第1の機械学習ブロック501が出力する特徴空間情報は、複数の時間条件のそれぞれに対応するターゲット情報を出力する第2の機械学習ブロック502に入力される。 In FIG. 3, the feature space information output by the first machine learning block 501 is input to the second machine learning block 502 that outputs the target information corresponding to each of the plurality of time conditions.
 ここで、第2の機械学習ブロック502は、複数の時間条件のそれぞれに対応して異なる係数で表現される個別のブロックであり、同じ構造の複数のブロックが時間条件ごと設けられる。これに対して、同じ係数および同じ構造の第1の機械学習ブロック501は共用化され、第1の機械学習ブロック501の出力は、第2の機械学習ブロック502に共通に用いられる。図3の例では、未来の複数の時間条件のターゲット情報として、時間tF,1のターゲット情報503(1)、時間tF,2のターゲット情報503(2)、・・・、時間tF,Kのターゲット情報503(K)のK個(Kは正の整数)の時間条件に対するターゲット情報503が出力される。 Here, the second machine learning block 502 is an individual block represented by a different coefficient corresponding to each of the plurality of time conditions, and a plurality of blocks having the same structure are provided for each time condition. On the other hand, the first machine learning block 501 having the same coefficient and the same structure is shared, and the output of the first machine learning block 501 is commonly used for the second machine learning block 502. In the example of FIG. 3, as target information of a plurality of future time conditions, time t F, 1 target information 503 (1), time t F, 2 target information 503 (2), ..., Time t F , K target information 503 (K) target information 503 for K time conditions (K is a positive integer) is output.
 このように、第1の機械学習ブロック501を共用化することで、第1の機械学習ブロック501を異なる時間条件に対応して個別に設ける必要がなく、効率的な学習が可能となる。 By sharing the first machine learning block 501 in this way, it is not necessary to individually provide the first machine learning block 501 corresponding to different time conditions, and efficient learning becomes possible.
 図4は、本実施形態に係る第2の通信環境モデル401(2)の一例を示す。図4において、通信環境モデル401(2)では、入力情報が第3の機械学習ブロック601に入力されると、複数の時間条件に対応する特徴空間情報602が出力される。 FIG. 4 shows an example of the second communication environment model 401 (2) according to the present embodiment. In FIG. 4, in the communication environment model 401 (2), when the input information is input to the third machine learning block 601, the feature space information 602 corresponding to a plurality of time conditions is output.
 ここで、第3の機械学習ブロック601は、第4の機械学習ブロック603が出力する複数の時間条件にそれぞれ対応した複数の特徴空間情報602を出力する点において、図3で説明した第1の機械学習ブロック501と異なる。図4の例では、第3の機械学習ブロック601は、時間tF,1の特徴空間情報602(1)、時間tF,2の特徴空間情報602(2)、・・・、時間tF,Kの特徴空間情報602(K)のK個の特徴空間情報602を出力する。 Here, the first machine learning block 601 has been described with reference to FIG. 3 in that the third machine learning block 601 outputs a plurality of feature space information 602 corresponding to a plurality of time conditions output by the fourth machine learning block 603. Different from machine learning block 501. In the example of FIG. 4, the third machine learning block 601 has the feature space information 602 (1) at time t F, 1 , the feature space information 602 (2) at time t F, 2, ..., Time t F. , K feature space information 602 (K) K feature space information 602 is output.
 第3の機械学習ブロック601から出力される異なる時間に対応するそれぞれの特徴空間情報602は、同じ構造で共用化される第4の機械学習ブロック603に入力される。第4の機械学習ブロック603は、ある時間条件の特徴空間情報を用い、当該時間と同じ時間条件のターゲット情報を出力する機械学習ブロックである。例えば図4では、時間tF,1の特徴空間情報602(1)から同じ時間条件のターゲット情報604(1)が出力される。同様に、特徴空間情報602(2)から時間tF,2のターゲット情報604(2)、・・・、特徴空間情報602(L)から時間tF,Kのターゲット情報604(K)のK個の時間条件に対するターゲット情報604がそれぞれ出力される。 The feature space information 602 corresponding to different times output from the third machine learning block 601 is input to the fourth machine learning block 603 shared by the same structure. The fourth machine learning block 603 is a machine learning block that uses feature space information of a certain time condition and outputs target information of the same time condition as the time. For example, in FIG. 4, the target information 604 (1) under the same time condition is output from the feature space information 602 (1) at time t F, 1 . Similarly, from the feature space information 602 (2) to the time t F, 2 target information 604 (2), ..., From the feature space information 602 (L) to the time t F, K target information 604 (K) K Target information 604 for each time condition is output.
 このように、第2の構成の通信環境モデル401(2)は、複数の時間条件のそれぞれに対して独立した機械学習ブロックを訓練する必要なく、第4の機械学習ブロック603を共通化することにより、効率的に通信環境モデルの生成が可能である。 As described above, the communication environment model 401 (2) of the second configuration shares the fourth machine learning block 603 without the need to train independent machine learning blocks for each of the plurality of time conditions. Therefore, it is possible to efficiently generate a communication environment model.
 なお、第3の機械学習ブロック601を図3で説明した第1の機械学習ブロック501および第2の機械学習ブロック502を用いて構成し、複数の時間条件に対する特徴空間情報を生成するようにしてもよい。 The third machine learning block 601 is configured by using the first machine learning block 501 and the second machine learning block 502 described with reference to FIG. 3, so as to generate feature space information for a plurality of time conditions. May be good.
 [実証実験]
 実施形態の効果を実証するために行った実験とその結果について説明する。
[Demonstration experiment]
The experiments conducted to demonstrate the effects of the embodiments and the results thereof will be described.
 実験に用いた移動する端末装置102は、パルス状に発光するレーザー照射に対する散乱)を用いたリモートセンシング技術の一つであるLIDAR("Light Detection and Ranging"または"Laser Imaging Detection and Ranging")を搭載した自律移動ロボットである。自律移動ロボットは、LIDARにより、自己の位置情報、向き情報、オドメトリ情報、及び制御指令情報を端末情報として収集することができる。 The mobile terminal device 102 used in the experiment uses LIDAR ("Light Detection and Ringing" or "Laser Imaging Detection and Ringing"), which is one of the remote sensing technologies using pulsed laser irradiation (scattering). It is an on-board autonomous mobile robot. The autonomous mobile robot can collect its own position information, orientation information, odometry information, and control command information as terminal information by using LIDAR.
 また、無線通信はIEEE802.11ac規格の無線LANを用い、0.2秒間に通信するビット量をスループットとして計測し、性能を評価するものとする。 In addition, wireless communication uses a wireless LAN of the IEEE802.11ac standard, and the amount of bits communicated in 0.2 seconds is measured as a throughput to evaluate the performance.
 図5は、自律移動ロボットの一例を示す。図5において、横軸はx-axis[m]、縦軸はy-axis[m]の二次元平面を示し、時刻τにおける自律移動ロボットの位置は(x[τ]、y[τ])である。自己の位置情報は、オドメトリ情報とLIDARの測定結果から、Robot OSのAMCL(Adaptive Monte Carlo Localization)のアルゴリズムにより計算される。向きは、ロボット分野の座標系で用いられるクォータニオンにより、{kz[τ]、w[τ]}={sin(θ[τ]/2)、cos(θ[τ]/2)}で表される。また、ロボットのタイヤの回転から検出されるロボットの正面方向に対する速度や回転速度などのオドメトリ情報、ロボット正面方向へ対応するタイヤ回転指令、ロボットの回転に対応する指令などの制御指令情報、などの特徴量(パラメータ)として、オドメトリ(Vx[τ]、Vθ[τ])、制御指令情報(Ox[τ]、Oθ[τ])を用いることができる。後述の自律移動ロボットを用いた実証実験では、(x[τ]、y[τ]、kz[τ]、w[τ]、Vx[τ]、Vθ[τ]、Ox[τ]、Oθ[τ])の合計8つの特徴量のうち、すべての特徴量(8つの特徴量)を入力情報として使用する場合と、制御指令情報以外の特徴量(6つの特徴量)を入力情報として使用する場合とについて行う。 FIG. 5 shows an example of an autonomous mobile robot. In FIG. 5, the horizontal axis represents a two-dimensional plane of x-axis [m] and the vertical axis represents y-axis [m], and the position of the autonomous mobile robot at time τ is (x [τ], y [τ]). Is. The self-position information is calculated by the algorithm of AMCL (Adaptive Monte Carlo Localization) of Robot OS from the odometry information and the measurement result of LIDAR. The orientation is represented by {kz [τ], w [τ]} = {sin (θ [τ] / 2), cos (θ [τ] / 2)} by the quaternion used in the coordinate system in the robot field. To. In addition, odometry information such as speed and rotation speed with respect to the front direction of the robot detected from the rotation of the robot tire, tire rotation command corresponding to the front direction of the robot, control command information such as a command corresponding to the rotation of the robot, etc. As the feature amount (parameter), odometry (Vx [τ], [τ]) and control command information (Ox [τ], [τ]) can be used. In the demonstration experiment using the autonomous mobile robot described later, (x [τ], y [τ], kz [τ], w [τ], Vx [τ], V θ [τ], Ox [τ], O Of the total of 8 features of θ [τ]), all the features (8 features) are used as input information, and the features other than the control command information (6 features) are used as input information. When to use and when to do.
 さらに、通信情報はRSSIとスループットとを用い、RSSIは10msごとに取得し、0.2秒のタイムスロット内のRSSIの中央値をγave[τ]、分散値をγstd[τ]、スループットをC[τ]とする。 Furthermore, communication information uses RSSI and throughput, RSSI is acquired every 10 ms, the median RSSI in the 0.2 second time slot is γ ave [τ], the dispersion value is γ std [τ], and the throughput. Let be C [τ].
 ここで、実証実験における環境情報は、ロボットから得られる、位置(X軸、Y軸)、向き、オドメトリ(自己位置推定)(X軸上の速度、Y軸上の速度、回転速度)、制御指令情報(ロボット正面方向へのタイヤ回転指令、ロボットの回転指令)、および過去のスループット(現在から過去2秒まで)を用いる。 Here, the environmental information in the demonstration experiment is the position (X-axis, Y-axis), orientation, odometry (self-position estimation) (velocity on X-axis, velocity on Y-axis, rotational velocity) and control obtained from the robot. Command information (tire rotation command in the front direction of the robot, rotation command of the robot), and past throughput (from the present to the past 2 seconds) are used.
 図6は、自律移動ロボットが認識する屋内マップとゴールの位置を示す。図6に示すように、ロボットは、設置された113個のゴールの中から一つを選択して、自律移動を続ける。そして、ロボットが選択されたゴールの周辺30cmに入れば、次のゴールを再設定して、ロボットは次のゴールに向かうように設計されている。実証実験では、ロボットが自動運行でランダムウォークした結果に基づいて、60時間分に亘って得られたデータセットから、未来の通信情報を図3で説明した第1の構成の通信環境モデル401(1)および図4で説明した第2の構成による通信環境モデル401(2)を用いて予測した結果を評価する。 FIG. 6 shows an indoor map recognized by an autonomous mobile robot and the position of a goal. As shown in FIG. 6, the robot selects one of the 113 goals set and continues autonomous movement. Then, when the robot enters 30 cm around the selected goal, the next goal is reset and the robot is designed to move toward the next goal. In the demonstration experiment, the communication environment model 401 of the first configuration described in FIG. 3 for future communication information from the data set obtained over 60 hours based on the result of the random walk of the robot by automatic operation ( The predicted results are evaluated using the communication environment model 401 (2) according to the second configuration described in 1) and FIG.
 図7は、第1の構成の通信環境モデル401(1)の深層ニューラルネットワークの具体例を示す。図7において、第1の構成の通信環境モデル401(1)は、図3で説明したように、第1の機械学習ブロック501と第2の機械学習ブロック502とを有する。第1の機械学習ブロック501はRNN、第2の機械学習ブロック502は全結合層3層によりそれぞれ構成される。 FIG. 7 shows a specific example of the deep neural network of the communication environment model 401 (1) of the first configuration. In FIG. 7, the communication environment model 401 (1) having the first configuration has a first machine learning block 501 and a second machine learning block 502 as described with reference to FIG. The first machine learning block 501 is composed of an RNN, and the second machine learning block 502 is composed of three fully connected layers.
 図7において、横軸は時間軸を示し、第1の機械学習ブロック501の入力情報は複数の時間に対応するΩ[t]で表す。そして、現在時間をtとして、過去1秒間をΔt=0.2秒ごとに、t、t-1=t-0.2秒、t-2=t-0.4秒、t-3=t-0.6秒、t-4=t-0.8秒、・・・、t-9=t-1.8秒の10個のタイミングのパラメータが入力される。 In FIG. 7, the horizontal axis represents the time axis, and the input information of the first machine learning block 501 is represented by Ω [ ti ] corresponding to a plurality of times. Then, with the current time as t 0 , the past 1 second is every Δt = 0.2 seconds, t 0 , t -1 = t 0-0.2 seconds, t -2 = t 0-0.4 seconds, t. Ten timing parameters of -3 = t 0-0.6 seconds, t -4 = t 0-0.8 seconds, ..., T- 9 = t 0-1.8 seconds are input.
 ここで、Ω[t]を{X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]、Ox[t]、Oθ[t]}の8つのパラメータとした場合、図7において、入力される情報のパラメータの数(入力要素数:Input Min)は8、時間方向の入力数は10なので、用いられるパラメータの数は8×10=80となる。なお、離散値で表現すると、タイミングはそれぞれ時間t、t-1、t-2、…、t-9で表わされる。 Here, Ω [t] is changed to {X [t], Y [t], kz [t], w [t], Vx [t], V θ [t], Ox [t], O θ [t]. }, In FIG. 7, the number of input information parameters (number of input elements: Input Min) is 8, and the number of inputs in the time direction is 10, so the number of parameters used is 8 ×. 10 = 80. When expressed as discrete values, the timing is represented by time t 0 , t -1 , t -2 , ..., T- 9 , respectively.
 図7において、点線白色塗りの平行四辺形のブロックは各タイミングにおける入力情報のパラメータを表し、灰色塗りの平行四辺形のブロックはニューラルネットワークの隠れ層や全結合層などの層を表す。図7の例では、第2の機械学習ブロック502は、未来の時間条件(時間tF-4、tF-3、・・・、tの5つの時間)に対応する時系列データのターゲット情報(図7ではスループット)を予測して、Output:C[tF-4]、C[tF-3]、C[tF-2]、C[tF-1]、C[t]を出力する。 In FIG. 7, the dotted white-painted parallelogram block represents the input information parameter at each timing, and the gray-painted parallelogram block represents a layer such as a hidden layer or a fully connected layer of the neural network. In the example of FIG. 7, the second machine learning block 502 is a target of time series data corresponding to future time conditions (five times of time t F-4 , t F-3 , ..., T F ). Predicting information (throughput in FIG. 7), Output: C [t F-4 ], C [t F-3 ], C [t F-2 ], C [t F-1 ], C [t F ] ] Is output.
 第1の機械学習ブロック501のRNNは、GRU(Gated Recurrent Unit)が用いられ、隠れ層が1、隠れ層の次元が35である。 GRU (Gated Recurrent Unit) is used for the RNN of the first machine learning block 501, the hidden layer is 1, and the dimension of the hidden layer is 35.
 RNNでは、時間的に古い層から新しい層へと各層が結合されるので、時間的な関係性が保持される。図7の例では、時間t-9の層から時間t-8の層へ、・・・、時間t-4の層から時間t-3の層へ、時間t-3の層から時間t-2の層へ、時間t-2の層から時間t-1の層へ、時間t-1の層から時間tの層へと各層がそれぞれ結合される。このように、RNNの中では、過去の情報から順にウエイトの乗算やバイアスの加算などの処理が行われる。 In the RNN, each layer is connected from the old layer to the new layer in time, so that the temporal relationship is maintained. In the example of FIG. 7, from the layer of time t- 9 to the layer of time t- 8 , ..., from the layer of time t -4 to the layer of time t -3 , from the layer of time t -3 to the layer of time t Each layer is coupled to the second layer, from the time t -2 layer to the time t -1 layer, and from the time t -1 layer to the time t 0 layer. In this way, in the RNN, processing such as weight multiplication and bias addition is performed in order from the past information.
 第2の機械学習ブロック502の全結合層は、入力35で出力35の層が2つ、入力35で出力1の層が1つ、の合計3層で構成される。 The fully connected layer of the second machine learning block 502 is composed of two layers of the output 35 at the input 35 and one layer of the output 1 at the input 35, for a total of three layers.
 図7において、時間tにおける入力情報のセットをΩ[t]とすると、時間t-9からtまでの入力情報がRNNにより処理され、時間tの最終層の35の次元からの出力が第2の機械学習ブロック502の入力として共通に用いられる。 In FIG. 7, if the set of input information at time t i is Ω [ti ] , the input information from time t- 9 to t 0 is processed by RNN, and the input information from the final layer at time t 0 is from the 35th dimension. The output is commonly used as the input for the second machine learning block 502.
 なお、RNNブロックは最終層以外の層からも出力できるが、図7の例ではRNNブロックの最終層から出力し、第2の機械学習ブロック502の複数の時間のそれぞれに対応する複数の全結合層に共通に入力する構成としている。 Although the RNN block can be output from a layer other than the final layer, in the example of FIG. 7, the RNN block is output from the final layer of the RNN block, and a plurality of fully coupled devices corresponding to each of the plurality of times of the second machine learning block 502 are fully connected. It is configured to be input in common to layers.
 ここで、時間tF-4からtまでの5つの時間に対応する第2の機械学習ブロック502の5つの全結合層は、第1の機械学習ブロック501から出力される同じ情報を入力する。そして、それぞれの全結合層の中でウエイトの乗算やバイアスの加算などの処理を行われ、5つの時間に対応するスループットC[tF-4]、C[tF-3]、C[tF-2]、C[tF-1]、C[t]がそれぞれ出力される。 Here, the five fully connected layers of the second machine learning block 502 corresponding to the five times from time t F-4 to t F input the same information output from the first machine learning block 501. .. Then, processing such as weight multiplication and bias addition is performed in each fully connected layer, and the throughputs C [t F-4 ], C [t F-3 ], and C [t corresponding to the five times are performed. F-2 ], C [t F-1 ], and C [t F ] are output, respectively.
 なお、図7では省略されているが、全結合層の間にReLU(Rectified Linear Unit)による活性化層が用いられる。また、訓練時には、ドロップアウト層を入れて、ニューラルネットワーク間の入出力をランダムに消失させてもよい。さらに、入力情報およびターゲット情報はいずれも、分散や範囲を-1から+1、または0から1になるように、前処理や次元圧縮として用いられる方法(PCA:Principal Component Analysis、LDA:Linear Discriminant Analysisなど)を行うことで、効率的にモデルの生成が可能である。 Although omitted in FIG. 7, an activation layer by ReLU (Rectified Linear Unit) is used between the fully connected layers. At the time of training, a dropout layer may be inserted to randomly eliminate the input / output between the neural networks. Furthermore, both the input information and the target information are methods used for preprocessing and dimensional compression (PCA: Principal Component Analysis, LDA: Linear Discriminant Analysis) so that the variance and range are changed from -1 to +1 or 0 to 1. By doing such as), it is possible to generate a model efficiently.
 ここで、実証実験の予測精度は、式(1)のR2スコアにより評価した。 Here, the prediction accuracy of the demonstration experiment was evaluated by the R2 score of the equation (1).
Figure JPOXMLDOC01-appb-M000001
Figure JPOXMLDOC01-appb-M000001
 なお、Cはスループットの実測値、(^C)は機械学習による予測値、nはサンプル数、iはサンプル番号、Caveはスループットの予測値をそれぞれ表す。 In addition, C i is the measured value of the throughput, (^ C i ) is the predicted value by machine learning, n is the number of samples, i is the sample number, and Ave is the predicted value of the throughput.
 図8は、第2の構成の通信環境モデル401(2)の深層ニューラルネットワークの具体例を示す。図8において、第2の構成の通信環境モデル401(2)は、図4で説明したように、第3の機械学習ブロック601と第4の機械学習ブロック603とを有する。 FIG. 8 shows a specific example of the deep neural network of the communication environment model 401 (2) of the second configuration. In FIG. 8, the communication environment model 401 (2) having the second configuration has a third machine learning block 601 and a fourth machine learning block 603, as described with reference to FIG.
 図8において、第3の機械学習ブロック601は、RNNと、全結合層3層と、第2のRNNとにより構成され、第4の機械学習ブロック603は、全結合層3層により構成される。 In FIG. 8, the third machine learning block 601 is composed of an RNN, three fully connected layers, and a second RNN, and the fourth machine learning block 603 is composed of three fully connected layers. ..
 図8において、横軸は時間軸を示し、第3の機械学習ブロック601の入力情報は複数の時間に対応するΩ[t]で表す。そして、現在時間をtとして、過去1秒間をΔt=0.2秒ごとに、t、t-1=t-0.2秒、t-2=t-0.4秒、t-3=t-0.6秒、t-4=t-0.8秒、・・・、t-9=t-1.8秒の10個のタイミングのパラメータが入力される。 In FIG. 8, the horizontal axis represents the time axis, and the input information of the third machine learning block 601 is represented by Ω [ ti ] corresponding to a plurality of times. Then, with the current time as t 0 , the past 1 second is every Δt = 0.2 seconds, t 0 , t -1 = t 0-0.2 seconds, t -2 = t 0-0.4 seconds, t. Ten timing parameters of -3 = t 0-0.6 seconds, t -4 = t 0-0.8 seconds, ..., T- 9 = t 0-1.8 seconds are input.
 ここで、第3の機械学習ブロック601のRNNは、図7の第1の機械学習ブロック501と同様に構成される。つまり、時間tにおける入力情報のセットをΩ[t]として、RNNの中で過去の情報から順にウエイトの乗算やバイアスの加算などの処理が行われ、時間t-9からtの入力情報が処理された時間tの最終層の35の次元からの出力が次の全結合層3層で共通に用いられる。つまり、RNNから出力される情報は、時間tF-7からtまでの8つの時間にそれぞれ対応する8つの全結合層に共通に入力される。 Here, the RNN of the third machine learning block 601 is configured in the same manner as the first machine learning block 501 of FIG. 7. That is, with the set of input information at time ti as Ω [ti ] , processing such as weight multiplication and bias addition is performed in order from the past information in the RNN, and the input from time t- 9 to t 0 is performed . The output from the 35th dimension of the final layer at time t 0 when the information was processed is commonly used in the next three fully coupled layers. That is, the information output from the RNN is commonly input to the eight fully connected layers corresponding to the eight times from time t F-7 to t F , respectively.
 そして、8つの全結合層の中でウエイトの乗算やバイアスの加算などの処理が行われた後、途中出力1のM’outが出力され、第2のRNNに入力される。第2のRNNは、途中出力1のM’outを入力とし、ターゲットとする5つの未来の時間tF-4からtに対応する特徴空間情報Θ[tF-4]からΘ[t]を途中出力2として出力する。 Then, after processing such as weight multiplication and bias addition is performed in the eight fully connected layers, the M'out of the intermediate output 1 is output and input to the second RNN. The second RNN takes the M'out of the intermediate output 1 as an input, and the feature spatial information Θ [t F-4 ] to Θ [t F ] corresponding to the five future times t F-4 to t F to be targeted. ] Is output as intermediate output 2.
 第4の機械学習ブロック603は、時間tF-4からtにおける特徴空間情報Θ[tF-4]からΘ[t]を用いて、同じ時間に対応するターゲット情報に変換して出力する。ターゲット情報は、例えば5つの時間にそれぞれ対応するスループットC[tF-4]、C[tF-3]、C[tF-2]、C[tF-1]、C[t]である。 The fourth machine learning block 603 converts and outputs the target information corresponding to the same time using the feature space information Θ [t F-4 ] to Θ [t F ] in the time t F-4 to t F. do. The target information is, for example, the throughputs C [t F-4 ], C [t F-3 ], C [t F-2 ], C [t F-1 ], C [t F ] corresponding to each of the five times. Is.
 図8の構成では、第3の機械学習ブロック601が任意の時間に対応する特徴空間情報Θを生成することができるので、第4の機械学習ブロック603は、同じウエイトやバイアスなどの係数で構成される機械学習ブロックを用いて所望のターゲット情報を予測することができる。つまり、第4の機械学習ブロック603は、同じ未来の時間における特徴空間情報とターゲット情報との間の関係性をモデル化するだけでよい。第4の機械学習ブロック603は、情報を取得した時間tに対して、どの程度の未来の時間のターゲット情報を予測するか、という条件に依存することなく、効率的に訓練を行うことができる。このように、本実施形態では、共通のモデルを複数の未来の時間のターゲット情報の予測に用いることができる。 In the configuration of FIG. 8, since the third machine learning block 601 can generate the feature space information Θ corresponding to an arbitrary time, the fourth machine learning block 603 is configured with the same weight, bias, and other coefficients. The desired target information can be predicted using the machine learning block. That is, the fourth machine learning block 603 only needs to model the relationship between the feature space information and the target information in the same future time. The fourth machine learning block 603 can efficiently perform training without depending on the condition of how much future time target information is predicted for the time t 0 when the information is acquired. can. Thus, in this embodiment, a common model can be used to predict target information for a plurality of future times.
 ここで、図8の第3の機械学習ブロック601は、図7の第1の構成の第1の機械学習ブロック501と第2の機械学習ブロック502とを合わせた構成になっている。図7との違いは、時間tF-4からtまでの環境情報を特徴空間情報として出力していることである。 Here, the third machine learning block 601 of FIG. 8 has a configuration in which the first machine learning block 501 and the second machine learning block 502 of the first configuration of FIG. 7 are combined. The difference from FIG. 7 is that the environmental information from the time t F-4 to t F is output as the feature space information.
 訓練時には、収集したデータセットから、未来の時間であるtF-4からtにおける環境情報との間の誤差に基づいて逆伝播により、第3の機械学習ブロック601内のウエイトやバイアスの値を更新する。このようにして、未来の時間の環境情報の時系列データが得られるため、第2のRNNによりターゲットと関係性の高い特徴空間情報Θの生成が可能になる。 During training, the values of weights and biases in the third machine learning block 601 by backpropagation from the collected data set based on the error between the collected data set and the environmental information at t F-4 to t F in the future time. To update. In this way, since the time-series data of the environmental information of the future time can be obtained, the feature space information Θ having a high relationship with the target can be generated by the second RNN.
 図7で説明した第1の機械学習ブロック501では、RNNの最終層を用いて、全結合層への共通の入力とした。これに対して、図8の第4の機械学習ブロック603は、第3の機械学習ブロック601の第2のRNNの途中層の途中出力2を用いることで、異なる時間に対応するターゲット情報を出力することができる。 In the first machine learning block 501 described with reference to FIG. 7, the final layer of the RNN was used as a common input to the fully connected layer. On the other hand, the fourth machine learning block 603 of FIG. 8 outputs the target information corresponding to different times by using the intermediate output 2 of the intermediate layer of the second RNN of the third machine learning block 601. can do.
 図9は、図8のRNNの入力と出力の関係を示す図である。図9において、RNNは、時間tZ-(L-1)からtまでのL個(Lは正の整数)のタイムスロットの入力情報Ω[t]を用い、時間tM-(L-1)からtまでのL個の時間に対応する出力情報Θ[t]が得られることを示している。このように、RNNでは、過去の情報を未来に向かって徐々に伝搬させるように動作するが、その途中で、そこまでの任意の時間に対応する出力を出すことが可能である。例えば、図9において、Z=0の状態で、Mタイムスロット先の未来の時間tM-(L-1)からtに対応する特徴空間情報Θ[t]を出力するように訓練できる。ここで、M=Zの時は、時間tM-iのターゲット情報に対し、Ω[M-i]までの入力情報、Ω[j](j≦M-i)を用いて生成されるΘ[tM-i]が、高い相関を有することが期待できる。これに対し、M>Zになるような特徴空間情報Θを出力する際には、Ω[t]まで全て含んだ結果である、Ω[t]の方が、時間tM-iのターゲット情報と高い相関を有すると期待できる。これは時間差tM-i-tが、時間差tM-i-tZ-iより小さいためである。 FIG. 9 is a diagram showing the relationship between the input and output of the RNN of FIG. In FIG. 9, the RNN uses the input information Ω [ti] of L time slots (L is a positive integer) from the time t Z- (L-1) to t Z , and the time t M- (L) . It is shown that the output information Θ [ti ] corresponding to L times from -1) to t M can be obtained. In this way, the RNN operates so as to gradually propagate past information toward the future, but on the way, it is possible to output an output corresponding to an arbitrary time up to that point. For example, in FIG. 9, in the state of Z = 0, it is possible to train to output the feature space information Θ [ti] corresponding to t M from the future time t M − (L-1) ahead of the M time slot. .. Here, when M = Z, Θ generated by using the input information up to Ω [Mi] and Ω [j] (j≤Mi) with respect to the target information at time tMi . It can be expected that [tM -i ] has a high correlation. On the other hand, when outputting the feature space information Θ such that M> Z, Ω [t M ], which is the result including all up to Ω [t Z ], is the time t M i . It can be expected to have a high correlation with the target information. This is because the time difference t M-i- t Z is smaller than the time difference t M-i- t Z-i .
 RNNの出力の用い方を、図8のRNNと第2のRNNとの2つを例として説明する。図8の最初のRNNは、入力情報に対し、未来の時間に対応する特徴空間情報Θを生成している。図9では、M>Zである。この場合、時間差tF-i-tが、時間差tF-i-t-iより小さいため、最後の情報を出力しており、これにより、できるだけ未来の入力情報を含めて使うことができる。図9の例では、最後の出力情報Θ[t]だけが出力され、時間的にできるだけ新しい情報(時間t)までを出力に含めることができ、予測精度が向上する。 The usage of the output of the RNN will be described by taking two examples, the RNN of FIG. 8 and the second RNN. The first RNN in FIG. 8 generates feature space information Θ corresponding to future time with respect to the input information. In FIG. 9, M> Z. In this case, since the time difference t F- t 0 is smaller than the time difference t F-i- t -i, the last information is output, so that future input information can be included as much as possible. .. In the example of FIG. 9, only the last output information Θ [t M ] is output, and up to new information (time t Z ) can be included in the output as much as possible in terms of time, and the prediction accuracy is improved.
 一方、図8の第2のRNNは、入力の時間と出力の時間が同じ状況となり、図9におけるM=Zとなっている。この場合、tF-iの出力を行うためにtF-iまでの情報を用いる条件でも、入力と出力の対応する時間の時間差は0となり、ターゲット情報は高い精度となることが期待できる。途中の複数の時間の情報を出力する。ここで、図8の例では、時系列の5つの時間の出力情報を得たいので、第2のRNNの8つの隠れ層のうち後半の5つの時間の隠れ層の情報が途中出力2として出力されている。 On the other hand, in the second RNN of FIG. 8, the input time and the output time are the same, and M = Z in FIG. In this case, even under the condition that the information up to tFi is used to output tFi , the time difference between the corresponding times of the input and the output becomes 0, and the target information can be expected to be highly accurate. Output information of multiple times on the way. Here, in the example of FIG. 8, since it is desired to obtain the output information of the five time series in the time series, the information of the hidden layer of the latter five hours out of the eight hidden layers of the second RNN is output as the intermediate output 2. Has been done.
 このようにして、本実施形態に係る第1の構成および第2の構成の通信環境モデルでは、RNNを用いた機械学習ブロックにより、任意の時間および任意の時間幅のターゲット情報を得ることができる。 In this way, in the communication environment model of the first configuration and the second configuration according to the present embodiment, the target information of an arbitrary time and an arbitrary time width can be obtained by the machine learning block using the RNN. ..
 図10は、図7の第1の構成の通信環境モデル401(1)の機能ブロックの一例を示す。 FIG. 10 shows an example of a functional block of the communication environment model 401 (1) having the first configuration of FIG. 7.
 図10では、第1の機械学習ブロックのRNNの最終層の出力が異なる全結合層に共通に入力され、異なる複数の時間に対応するターゲット情報がそれぞれ出力される。 In FIG. 10, the output of the final layer of the RNN of the first machine learning block is input in common to different fully connected layers, and the target information corresponding to a plurality of different times is output respectively.
 図10において、第1の機械学習ブロック501のRNNは、GRUを用い、隠れ層が1、隠れ層の次元が35である。また、第2の機械学習ブロック502は、入力35で出力35の層が2つ、入力35で出力1の層が1つ、を有する全結合層3層により複数の時間のそれぞれに対して構成される。 In FIG. 10, the RNN of the first machine learning block 501 uses GRU, the hidden layer is 1, and the dimension of the hidden layer is 35. Further, the second machine learning block 502 is configured for each of a plurality of times by three fully connected layers having two layers of output 35 at input 35 and one layer of output 1 at input 35. Will be done.
 環境情報(8つのパラメータ)と通信情報(2つのパラメータ)の入力情報が第1の機械学習ブロック501のRNNに入力される。RNNの出力は、複数の時間に対応する全結合層3層からなる第2の機械学習ブロック502の共通の入力として用いられ、第2の機械学習ブロック502は、未来の時間tF-(L-1)、tF-(L-2)、・・・、t、の複数の時間に対応するターゲット情報をそれぞれ出力する。 Input information of environment information (8 parameters) and communication information (2 parameters) is input to the RNN of the first machine learning block 501. The output of the RNN is used as a common input for a second machine learning block 502 consisting of three fully coupled layers corresponding to multiple times, where the second machine learning block 502 is in the future time tF- (L) . -1) Outputs target information corresponding to a plurality of times of, t F- (L-2) , ..., T F , respectively.
 図11は、図8の第2の構成の通信環境モデル401(2)の機能ブロックの一例を示す。 FIG. 11 shows an example of the functional block of the communication environment model 401 (2) having the second configuration of FIG.
 図11では、第3の機械学習ブロック601から出力される異なる複数の時間に対応する出力に対して、第4の機械学習ブロック603の共通の全結合層が用いられている。ここで、第4の機械学習ブロックとして、複数のブロックラインがあるが、並列に存在するニューラルネットワークのウエイトやバイアスなどの係数はそれぞれ同じ構成となっており、ある時間に対応する特徴空間情報Θをその時間と同じ時間に対応するターゲット情報に変換する。 In FIG. 11, a common fully connected layer of the fourth machine learning block 603 is used for outputs corresponding to a plurality of different times output from the third machine learning block 601. Here, as the fourth machine learning block, there are a plurality of block lines, but the coefficients such as weights and biases of the neural networks existing in parallel have the same configuration, and the feature space information Θ corresponding to a certain time. Is converted into the target information corresponding to the same time.
 図11において、第1の機械学習ブロック501のRNNは、GRUを用い、隠れ層を1、隠れ層の次元を35にしている。また、第2の機械学習ブロック502は、入力35で出力35の層が2つ、入力35で出力1の層が1つ、を有する全結合層3層により複数の時間のそれぞれに対して構成され、中間情報を出力する。中間情報は、図8の途中出力1に対応する環境情報と通信情報とからなり、時間方向のサンプル数をLとする。第2のRNNは、隠れ層1、隠れ層の次元35で構成され、複数の時間のうち、L個の時間のそれぞれの情報を出力する(図8の途中出力2に対応)。そして、第2のRNNの出力は、全結合層3層からなる第4の機械学習ブロック603の共通の入力として用いられ、第4の機械学習ブロック603は、未来の時間tF-(L-1)、tF-(L-2)、・・・、tの複数の時間に対応するターゲット情報として、スループットC[tF-(L-1)]、C[tF-(L-2)]、・・・、C[t]をそれぞれ出力する。 In FIG. 11, the RNN of the first machine learning block 501 uses GRU, the hidden layer is 1, and the dimension of the hidden layer is 35. Further, the second machine learning block 502 is configured for each of a plurality of times by three fully connected layers having two layers of output 35 at input 35 and one layer of output 1 at input 35. And output the intermediate information. The intermediate information includes environment information and communication information corresponding to the intermediate output 1 in FIG. 8, and the number of samples in the time direction is L. The second RNN is composed of a hidden layer 1 and a dimension 35 of the hidden layer, and outputs information for each of L times out of a plurality of times (corresponding to the intermediate output 2 in FIG. 8). Then, the output of the second RNN is used as a common input of the fourth machine learning block 603 composed of three fully connected layers, and the fourth machine learning block 603 is used in the future time tF- (L-) . 1) , t F- (L-2) , ..., As target information corresponding to a plurality of times of t F , throughput C [t F- (L-1) ], C [t F- (L- ). 2) ], ..., C [t F ] are output respectively.
 図12は、図11の第4の機械学習ブロック603の他の構成例を示す。図11では、中間情報として環境情報および通信情報の全ての情報を一旦生成した後、第4の機械学習ブロック603に入力した。これに対して、図12では、先ずロボットの位置などの環境情報に関するパラメータのみを中間情報として生成し、第2のRNNは、ターゲットの時間区間(tF-(L-1)からt)に対応する特徴空間情報Θ[tF-(L-1)]からΘ[t]を生成する。 FIG. 12 shows another configuration example of the fourth machine learning block 603 of FIG. In FIG. 11, after all the information of the environment information and the communication information is once generated as the intermediate information, the information is input to the fourth machine learning block 603. On the other hand, in FIG. 12, only parameters related to environmental information such as the position of the robot are first generated as intermediate information, and the second RNN is the target time interval (t F- (L-1) to t F ). The feature space information Θ [t F- (L-1) ] corresponding to Θ [t F ] is generated.
 そして、その情報を2つにコピーし、一方を3層の結合層(入力35で出力35の層が2つ、入力35で出力3の層が1つ)に入力し、時間ごとに第2の中間情報として、通信情報(スループットやRSSIに関するパラメータ、ここではγave[t],γstd[t],C[t]の3つとする)を出力する。なお、第2の中間情報の精度が上がるように逆伝播によりニューラルネットワーク内の係数が更新される。 Then, the information is copied into two, and one of them is input to a three-layer coupling layer (input 35 has two layers of output 35 and input 35 has one layer of output 3), and a second layer is input every time. Communication information (parameters related to throughput and RSSI, in this case, γ ave [t], γ std [t], and C [t]) is output as intermediate information. The coefficients in the neural network are updated by back propagation so that the accuracy of the second intermediate information is improved.
 さらに、この第2の中間情報と、先にコピーした他方の特徴空間情報Θとを3層の全結合層(入力38で出力35の層、入力35で出力35の層、および入力35で出力1の層)に入力し、ターゲットとなる通信情報(ここではC[tF-(L-1)]からC[t])が出力される。 Further, the second intermediate information and the other feature space information Θ copied earlier are output by three fully connected layers (input 38 at output 35, input 35 at output 35, and input 35). It is input to the layer 1), and the target communication information (here, C [t F- (L-1) ] to C [t F ]) is output.
 図13は、実証実験の比較例の通信環境モデルの一例を示す。比較例は、従来方式の通信環境モデルであり、全て共通の機械学習ブロックを用い、未来のスループットを予測する深層学習ブロックである。図13では、RNNと全結合層3層を用いて構成した通信環境モデルの例を示す。 FIG. 13 shows an example of a communication environment model of a comparative example of the demonstration experiment. A comparative example is a conventional communication environment model, which is a deep learning block that predicts future throughput by using a common machine learning block. FIG. 13 shows an example of a communication environment model configured by using an RNN and three fully connected layers.
 図13において、RNNは、GRUを用い、隠れ層を1、隠れ層の次元を35とする。また、全結合層は3層とし、入力35および出力35の層が2つと、入力35および出力5の層が1つである。なお、全結合層の間にReLUによる活性化層が用いられる。 In FIG. 13, the RNN uses a GRU, the hidden layer is 1, and the dimension of the hidden layer is 35. Further, the fully connected layer is three layers, two layers of input 35 and output 35, and one layer of input 35 and output 5. An activated layer by ReLU is used between the fully bonded layers.
 このように、比較例の構成では、RNNのブロックの最終層の出力を全結合層に与え、最終層が単一の時間に対応するターゲット情報を出力する。このため、比較例では、時間的にターゲット情報がどのように変化しているかなど、複数の時間条件に対応する任意の時間位置に対する柔軟な出力が得られ難いという問題がある。 As described above, in the configuration of the comparative example, the output of the final layer of the RNN block is given to the fully connected layer, and the final layer outputs the target information corresponding to a single time. Therefore, in the comparative example, there is a problem that it is difficult to obtain a flexible output for an arbitrary time position corresponding to a plurality of time conditions such as how the target information changes with time.
 次に、本実施形態に係る第1の構成の通信環境モデル401(1)と、第2の構成の通信環境モデル401(2)と、比較例の通信環境モデルの各構成における実証実験の結果について説明する。ここでは、R2スコアで未来のスループットを予測する場合の性能評価の結果を比較する。 Next, the results of demonstration experiments in each configuration of the communication environment model 401 (1) of the first configuration, the communication environment model 401 (2) of the second configuration, and the communication environment model of the comparative example according to the present embodiment. Will be explained. Here, the results of performance evaluation when predicting the future throughput by the R2 score are compared.
 なお、実験データは、前述の屋内実験環境で、自律移動ロボットから収集した全96時間のデータセットを用いた。5.6GHz帯の20MHzチャネルを用い、X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]、Ox[t]、Oθ[t]、γave[t]、γstd[t]、C[t]の各データを収集したデータセットを用いて評価し、このうち10時間分のデータをテストデータとして使用し、R2スコアによる評価を行った。 As the experimental data, a total of 96 hours of data set collected from the autonomous mobile robot in the above-mentioned indoor experimental environment was used. Using a 20 MHz channel in the 5.6 GHz band, X [t], Y [t], kz [t], w [t], Vx [t], V θ [t], Ox [t], O θ [t] ], Γ ave [t], γ std [t], and C [t] are evaluated using the collected data set, and 10 hours of the data are used as test data and evaluated by the R2 score. Was done.
 ここで、実証実験で用いた入力情報は、{X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]}の6つのパラメータの場合と、{X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]、Ox[t]、Oθ[t]}の8つのパラメータの場合の2通りである。いずれの場合においても、図12に示す中間情報として、環境情報{X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]}の6つのパラメータ、第2の中間情報として、通信情報{γave[t],γstd[t],C[t]}の3つのパラメータがそれぞれ出力される。 Here, the input information used in the demonstration experiment is in the case of six parameters {X [t], Y [t], kz [t], w [t], Vx [t], V θ [t]}. And {X [t], Y [t], kz [t], w [t], Vx [t], V θ [t], Ox [t], O θ [t]} There are two cases. In any case, as the intermediate information shown in FIG. 12, the environmental information {X [t], Y [t], kz [t], w [t], Vx [t], V θ [t]} 6 As one parameter and the second intermediate information, three parameters of communication information {γ ave [t], γ std [t], C [t]} are output, respectively.
 なお、本実施形態のもう一つの効果は、入力情報が{X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]}の6つのパラメータの場合、または{X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]、Ox[t]、Oθ[t]}の8つのパラメータの場合において、中間情報が同じであるため、図12に示すニューラルネットワークの係数が共通化できることである。つまり、中間情報を予め定めておくことで、様々な入力情報に対応する複数の時間条件の時系列データの出力が可能になる。 Another effect of this embodiment is that the input information is {X [t], Y [t], kz [t], w [t], Vx [t], V θ [t]}. In the case of parameters, or {X [t], Y [t], kz [t], w [t], Vx [t], V θ [t], Ox [t], O θ [t]} 8 In the case of two parameters, since the intermediate information is the same, the coefficients of the neural network shown in FIG. 12 can be shared. That is, by defining the intermediate information in advance, it is possible to output time-series data of a plurality of time conditions corresponding to various input information.
 図14は、実証実験における性能評価の結果を示す。なお、実証実験全体の96時間分のデータセットから、80時間を訓練に用い、6時間を精度検証データ(Validation)、10時間をテストデータとして評価に用いた。訓練は、最適化アルゴリズム(Optimizer)をAdam、学習率を2.0×10-4、として行い、精度検証データに対するMSE(Mean Square Error)が最小となるまで訓練して通信環境モデルを生成した。 FIG. 14 shows the results of performance evaluation in the demonstration experiment. From the data set for 96 hours of the entire demonstration experiment, 80 hours was used for training, 6 hours was used for accuracy verification data (Validation), and 10 hours was used for evaluation as test data. The training was performed with the optimization algorithm (Optimizer) set to Adam and the learning rate set to 2.0 × 10-4, and training was performed until the MSE (Mean Square Error) for the accuracy verification data was minimized to generate a communication environment model. ..
 また、ターゲットとなるスループットは150Mbpsで規格化したものを用い、1.0から2.0秒後の5つのタイムスロット(t10、t、t、t、t)の各時間に対するスループットC[t10]、C[t]、C[t]、C[t]、C[t]の平均値に対して、R2スコアを評価した。 In addition, the target throughput is standardized at 150 Mbps, and for each time of 5 time slots (t 10 , t 9 , t 8 , t 7 , t 6 ) after 1.0 to 2.0 seconds. The R2 score was evaluated against the average of the throughputs C [t 10 ], C [t 9 ], C [t 8 ], C [t 7 ], and C [t 6 ].
 6種の入力情報{X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]}、および8種の入力情報{X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]、Ox[t]、Oθ[t]}に対してそれぞれモデルを生成し、テストデータに適用した。R2スコアは、先に説明した式(1)において、Caveを(C[t10]+C[t]+C[t]+C[t]+C[t])/5とし、予測値と実測値とを用いて評価した。 6 types of input information {X [t], Y [t], kz [t], w [t], Vx [t], V θ [t]}, and 8 types of input information {X [t], Generate models for Y [t], kz [t], w [t], Vx [t], V θ [t], Ox [t], O θ [t]} and apply them to the test data. bottom. The R2 score is a predicted value in the equation (1) described above, where Cave is (C [t 10 ] + C [t 9 ] + C [t 8 ] + C [t 7 ] + C [t 6 ]) / 5. And the measured value were used for evaluation.
 なお、従来の単一機械学習ブロックでは、ターゲット情報を(C[t10]+C[t]+C[t]+C[t]+C[t])/5に設定し、この時間幅全体に予測を行うように訓練した。これは、1.0から2.0秒後のスループットに対応し、式(1)において、10時間分のプロットはおよそ180000ポイント(n=180000)に対応する。さらに、1.0から1.2秒後のスループットC[t]、1.8から2.0秒後のスループットC[t10]をそれぞれ式(1)のCとして、実測値と予測値とに対してR2スコアを計算した。 In the conventional single machine learning block, the target information is set to (C [t 10 ] + C [t 9 ] + C [t 8 ] + C [t 7 ] + C [t 6 ]) / 5, and this time width is set. Trained to make predictions throughout. This corresponds to the throughput after 1.0 to 2.0 seconds, and in equation (1), the plot for 10 hours corresponds to approximately 180,000 points (n = 180000). Further, the measured value and the predicted value are set as C of the equation (1), respectively, with the throughput C [t 6 ] after 1.0 to 1.2 seconds and the throughput C [t 10 ] after 1.8 to 2.0 seconds, respectively. And the R2 score was calculated.
 図14において、入力情報を{X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]}の6種とした場合の結果を比較する。1.0から2.0秒後のスループットの予測において、まず単一の機械学習ブロックでは0.642948の結果となった。なお、単一の機械学習ブロックのモデルでは、単一の時間の出力しか得られないため、1.8から2.0秒後のスループットを得たい場合には、専用のモデルを別途生成しなければならない。 In FIG. 14, the results when the input information is {X [t], Y [t], kz [t], w [t], Vx [t], V θ [t]} are compared. .. In predicting the throughput after 1.0 to 2.0 seconds, the result was 0.642948 for a single machine learning block. In addition, since the model of a single machine learning block can obtain only the output for a single time, if you want to obtain the throughput after 1.8 to 2.0 seconds, you have to generate a dedicated model separately. Must be.
 一方、図14において、第1の機械学習ブロック501と第2の機械学習ブロック502を用いた結果をみると、R2スコアは0.647799となり、単一の機械学習ブロックに比べて、精度がおよそ0.7%向上している。 On the other hand, looking at the results of using the first machine learning block 501 and the second machine learning block 502 in FIG. 14, the R2 score is 0.647799, which is approximately more accurate than that of a single machine learning block. It has improved by 0.7%.
 また、個別の時間に対しての予測値を用いることもできる。例えば図14の例では、1.8から2.0秒後のスループットC[t10]と1.0から1.2秒後のスループットC[t]に対する短い時間間隔でのR2スコアが示されている。このような短い時間間隔での予測の場合、R2スコアは低くなる。このように、0.4秒間や0.8秒間など、任意の時間幅に対応したスループットをそれぞれ予測することができる。 It is also possible to use predicted values for individual times. For example, in the example of FIG. 14, the R2 score at a short time interval is shown for the throughput C [t 10 ] after 1.8 to 2.0 seconds and the throughput C [t 6 ] after 1.0 to 1.2 seconds. Has been done. For predictions at such short time intervals, the R2 score is low. In this way, it is possible to predict the throughput corresponding to an arbitrary time width such as 0.4 seconds or 0.8 seconds.
 さらに、図14において、第3の機械学習ブロック601と第4の機械学習ブロック603を用いた結果をみると、R2スコアは0.672348と第1の構成よりも改善しており、従来の単一の機械学習ブロックと比較すると精度が4.5%改善している。さらに、1.0から1.2秒後、1.8から2.0秒後に対応するスループットに対する予測性能も、第1の機械学習ブロック501と第2の機械学習ブロック502による第1の構成よりも改善している。 Further, in FIG. 14, looking at the results using the third machine learning block 601 and the fourth machine learning block 603, the R2 score is 0.672348, which is improved from the first configuration, which is a conventional simple. The accuracy is improved by 4.5% compared to one machine learning block. Further, the prediction performance for the corresponding throughput after 1.0 to 1.2 seconds and 1.8 to 2.0 seconds is also obtained from the first configuration by the first machine learning block 501 and the second machine learning block 502. Is also improving.
 また、入力する特徴量を{X[t]、Y[t]、kz[t]、w[t]、Vx[t]、Vθ[t]、Ox[t]、Oθ[t]}の8種とした場合、いずれも従来の単一の機械学習ブロックよりも予測性能が上がるが、入力する特徴量の種類が6つの場合に比べると、予測性能が向上しているのは第3の機械学習ブロック601と第4の機械学習ブロック603を用いた第2の構成のみである。これは、第3の機械学習ブロック601と第4の機械学習ブロック603を用いた第2の構成が他の構成よりも複雑な潜在構造を表しており、入力する特徴量が増えたことにうまく対応ができているものと考えられる。 Further, the feature amount to be input is {X [t], Y [t], kz [t], w [t], Vx [t], V θ [t], Ox [t], O θ [t]}. In the case of 8 types, the prediction performance is higher than that of the conventional single machine learning block, but the prediction performance is improved compared to the case of 6 types of feature quantities to be input. There is only a second configuration using the machine learning block 601 and the fourth machine learning block 603. This is because the second configuration using the third machine learning block 601 and the fourth machine learning block 603 represents a more complicated latent structure than the other configurations, and the number of features to be input has increased. It is considered that the correspondence has been completed.
 (他の実現形態)
 ここで、上述した各実施形態における基地局装置101または端末装置102の各ブロックまたは一部のブロックを構成要素として行う処理をコンピュータで実行するようにしてもよい。その場合、各ブロックまたは一部のブロックが行う処理を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませて、コンピュータに実行させるようにしてもよい。
(Other realization forms)
Here, a computer may execute a process in which each block or a part of the blocks of the base station device 101 or the terminal device 102 in each of the above-described embodiments is used as a component. In that case, a program for realizing the processing performed by each block or a part of the blocks is recorded on a computer-readable recording medium, and the program recorded on this recording medium is read by the computer system so that the computer can read the program. You may let it run.
 なお、「コンピュータ」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵または外部に接続されるハードディスク等の記憶装置である。 Note that the "computer" includes hardware such as an OS and peripheral devices. The "computer-readable recording medium" is a portable medium such as a flexible disk, a magneto-optical disk, a ROM, or a CD-ROM, or a storage device such as a hard disk built in or externally connected to a computer system.
 さらに「コンピュータで読み取り可能な記録媒体」は、インターネット等のネットワークや電話回線等の通信回線を介して取得されるプログラムを含み、短時間だけ保持されるプログラム、動的に保持されるプログラム、なども含まれる。 Furthermore, the "computer-readable recording medium" includes programs acquired via a network such as the Internet or a communication line such as a telephone line, and is a program that is retained only for a short time, a program that is dynamically retained, and the like. Is also included.
 また、サーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものを含んでもよい。また、プログラムは、前述した構成要素の一部を実現するためのものであってもよく、さらに前述した構成要素をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。 Further, it may include a memory that holds a program for a certain period of time, such as a volatile memory inside a computer system that is a server or a client. Further, the program may be for realizing a part of the above-mentioned components, and may be realized by combining the above-mentioned components with a program already recorded in the computer system. good.
 また、プログラムは、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。 Further, the program may be realized by using hardware such as PLD (Programmable Logic Device) or FPGA (Field Programmable Gate Array).
 以上説明したように、本発明に係る通信情報予測装置、通信情報予測方法、および通信情報予測プログラムは、環境情報を含む入力情報を用いて、通信に関するパラメータを時系列データとして複数の時間条件で出力する場合に、効率的に機械学習のモデルを生成し、通信情報を予測することができる。特に、共通の機械学習ブロックの利用により、学習コストとモデルの利用コストを低減することができる。 As described above, the communication information prediction device, the communication information prediction method, and the communication information prediction program according to the present invention use input information including environmental information and set communication-related parameters as time-series data under a plurality of time conditions. When outputting, it is possible to efficiently generate a machine learning model and predict communication information. In particular, by using a common machine learning block, the learning cost and the model usage cost can be reduced.
 なお、本発明の実施形態について図面を参照して説明してきたが、具体的な構成は上述の実施形態に限られるものではなく、本発明の基本的な特徴を逸脱しない範囲の設計等も含まれる。 Although the embodiments of the present invention have been described with reference to the drawings, the specific configuration is not limited to the above-described embodiments, and includes designs and the like within a range that does not deviate from the basic features of the present invention. Will be.
100・・・無線通信システム;101・・・基地局装置;102・・・端末装置;201・・・NW部;202・・・通信部;203・・・通信環境モデル生成部;204・・・環境情報生成部;205・・・モデル利用部;301・・・通信部;302・・・通信環境モデル生成部;303・・・環境情報生成部;304・・・モデル利用部;401・・・通信環境モデル;501・・・第1の機械学習ブロック;502・・・第2の機械学習ブロック;503,604・・・ターゲット情報;601・・・第3の機械学習ブロック;602・・・特徴空間情報;603・・・第4の機械学習ブロック 100 ... wireless communication system; 101 ... base station device; 102 ... terminal device; 201 ... NW section; 202 ... communication section; 203 ... communication environment model generation section; 204 ... -Environmental information generation unit; 205 ... Model utilization unit; 301 ... Communication unit; 302 ... Communication environment model generation unit; 303 ... Environmental information generation unit; 304 ... Model utilization unit; 401. Communication environment model; 501 ... first machine learning block; 502 ... second machine learning block; 503, 604 ... target information; 601 ... third machine learning block; 602 ...・ ・ Feature space information; 603 ・ ・ ・ Fourth machine learning block

Claims (7)

  1.  移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測装置において、
     前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成部と、
     前記端末装置の無線通信に係る通信情報を生成する通信部と、
     前記環境情報を含む入力情報を用いて、同じ係数や構造で構成される機械学習ブロックを共用化し、複数の時間条件に対応する通信情報を出力する通信環境モデルを生成する通信環境モデル生成部と、
     生成された前記通信環境モデルを用いて前記端末装置の通信情報を予測するモデル利用部と
     を有することを特徴とする通信情報予測装置。
    In a communication information prediction device that generates a communication environment model related to wireless communication of a moving terminal device and predicts communication information of the terminal device.
    An environment information generation unit that generates environment information related to the environment of at least one of the terminal device and the wireless communication destination device of the terminal device, and
    A communication unit that generates communication information related to wireless communication of the terminal device, and
    With the communication environment model generator that generates a communication environment model that outputs communication information corresponding to multiple time conditions by sharing machine learning blocks composed of the same coefficients and structures using the input information including the environment information. ,
    A communication information prediction device comprising a model utilization unit that predicts communication information of the terminal device using the generated communication environment model.
  2.  請求項1記載の通信情報予測装置において、
     前記環境情報は、前記端末装置および前記端末装置の無線通信先の装置の位置、姿勢、状態、動き、制御指令、前記端末装置またはネットワークに接続されたカメラおよびセンサの情報、端末やネットワークの行動戦略に関する情報、の少なくとも一つの情報を含む
     ことを特徴とする通信情報予測装置。
    In the communication information prediction device according to claim 1,
    The environmental information includes the position, attitude, state, movement, control command of the terminal device and the device of the wireless communication destination of the terminal device, information of a camera and a sensor connected to the terminal device or the network, and behavior of the terminal or network. A communication information predictor characterized by containing at least one piece of information about a strategy.
  3.  請求項1または請求項2に記載の通信情報予測装置において、
     前記通信環境モデルは、
     時系列の入力情報を入力して機械学習を行う第1の機械学習ブロックと、
     前記第1の機械学習ブロックの出力を用い、複数の時間にそれぞれ対応する通信情報を出力する第2の機械学習ブロックと
     を有することを特徴とする通信情報予測装置。
    In the communication information prediction device according to claim 1 or 2.
    The communication environment model is
    The first machine learning block that inputs time-series input information and performs machine learning,
    A communication information prediction device comprising a second machine learning block that outputs communication information corresponding to a plurality of times by using the output of the first machine learning block.
  4.  請求項1または請求項2に記載の通信情報予測装置において、
     前記通信環境モデルは、
     時系列の入力情報に対して複数の時間に対応する特徴空間情報を出力する第3の機械学習ブロックと、
     前記第3の機械学習ブロックから出力される複数の時間に対応する特徴空間情報を用い、前記特徴空間情報と同じ時間の通信情報を出力する第4の機械学習ブロックと
     を有することを特徴とする通信情報予測装置。
    In the communication information prediction device according to claim 1 or 2.
    The communication environment model is
    A third machine learning block that outputs feature space information corresponding to multiple times for time-series input information,
    It is characterized by having a fourth machine learning block that outputs communication information at the same time as the feature space information by using the feature space information corresponding to a plurality of times output from the third machine learning block. Communication information prediction device.
  5.  請求項4記載の通信情報予測装置であって、
     前記第3の機械学習ブロックは、
     時系列の入力情報を入力して機械学習を行う第1の機械学習ブロックと、
     前記第1の機械学習ブロックの出力を用い、複数の時間にそれぞれ対応する前記特徴空間情報を生成し、前記第4の機械学習ブロックに出力する第2の機械学習ブロックと
     を有することを特徴とする通信情報予測装置。
    The communication information prediction device according to claim 4.
    The third machine learning block is
    The first machine learning block that inputs time-series input information and performs machine learning,
    Using the output of the first machine learning block, the feature space information corresponding to each of a plurality of times is generated, and the second machine learning block is output to the fourth machine learning block. Communication information prediction device.
  6.  移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する通信情報予測方法であって、
     前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、
     前記端末装置の無線通信に係る通信情報を生成する通信処理と、
     前記環境情報を含む入力情報を用いて、同じ係数や構造で構成される機械学習ブロックを共用化し、複数の時間条件に対応する通信情報を含むターゲット情報を出力する通信環境モデルを生成する通信環境モデル生成処理と、
     生成された前記通信環境モデルを用いて前記端末装置の通信情報を予測するモデル利用処理と
     を行うことを特徴とする通信情報予測方法。
    It is a communication information prediction method that generates a communication environment model related to wireless communication of a moving terminal device and predicts the communication information of the terminal device.
    Environmental information generation processing for generating environmental information related to the device environment of at least one of the terminal device and the wireless communication destination device of the terminal device, and
    Communication processing that generates communication information related to wireless communication of the terminal device, and
    A communication environment that uses input information including the environment information to share a machine learning block composed of the same coefficient and structure, and generates a communication environment model that outputs target information including communication information corresponding to a plurality of time conditions. Model generation process and
    A communication information prediction method, characterized in that a model utilization process for predicting communication information of the terminal device is performed using the generated communication environment model.
  7.  移動する端末装置の無線通信に係る通信環境モデルを生成し、前記端末装置の通信情報を予測する処理をコンピュータに実行させる通信情報予測プログラムであって、
     前記端末装置および前記端末装置の無線通信先装置の少なくとも一方の装置環境に係る環境情報を生成する環境情報生成処理と、
     前記端末装置の無線通信に係る通信情報を生成する通信処理と、
     前記環境情報を含む入力情報を用いて、同じ係数や構造で構成される機械学習ブロックを共用化し、複数の時間条件に対応する通信情報を含むターゲット情報を出力する通信環境モデルを生成する通信環境モデル生成処理と、
     生成された前記通信環境モデルを用いて前記端末装置の通信情報を予測するモデル利用処理と
     をコンピュータで実行することを特徴とする通信情報予測プログラム。
    A communication information prediction program that generates a communication environment model related to wireless communication of a mobile terminal device and causes a computer to execute a process of predicting the communication information of the terminal device.
    Environmental information generation processing for generating environmental information related to the device environment of at least one of the terminal device and the wireless communication destination device of the terminal device, and
    Communication processing that generates communication information related to wireless communication of the terminal device, and
    A communication environment that uses input information including the environment information to share a machine learning block composed of the same coefficient and structure, and generates a communication environment model that outputs target information including communication information corresponding to a plurality of time conditions. Model generation process and
    A communication information prediction program characterized in that a computer executes a model utilization process for predicting communication information of the terminal device using the generated communication environment model.
PCT/JP2020/038785 2020-10-14 2020-10-14 Communication information prediction device, communication information prediction method, and communication information prediction program WO2022079832A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022556753A JP7439947B2 (en) 2020-10-14 2020-10-14 Communication information prediction device, communication information prediction method, and communication information prediction program
PCT/JP2020/038785 WO2022079832A1 (en) 2020-10-14 2020-10-14 Communication information prediction device, communication information prediction method, and communication information prediction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/038785 WO2022079832A1 (en) 2020-10-14 2020-10-14 Communication information prediction device, communication information prediction method, and communication information prediction program

Publications (1)

Publication Number Publication Date
WO2022079832A1 true WO2022079832A1 (en) 2022-04-21

Family

ID=81208954

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/038785 WO2022079832A1 (en) 2020-10-14 2020-10-14 Communication information prediction device, communication information prediction method, and communication information prediction program

Country Status (2)

Country Link
JP (1) JP7439947B2 (en)
WO (1) WO2022079832A1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017211799A (en) * 2016-05-25 2017-11-30 キヤノン株式会社 Information processing device and information processing method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017211799A (en) * 2016-05-25 2017-11-30 キヤノン株式会社 Information processing device and information processing method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RIICHI KUDO, KAORUKO TAKAHASHI, TAKESHI INOUE, KOHEI MIZUNO: "Possibility of next-generation wireless communication system by smart connected device opened by machine learning [Potentiality of machine learning based next generation wireless communication systems for smart connected devices]", IEICE TECHNICAL REPORT, vol. 119, no. 183 (CQ2019-72), 20 August 2019 (2019-08-20), JP, pages 79 - 84, XP009536989 *
RIICHI KUDO, MATTHEW COCHRANE, KAORUKO TAKAHASHI, TAKESHI INOUE, KOHEI MIZUNO: "Wireless link quality prediction of the locomotion robot in wireless LAN systems", IEICE TECHNICAL REPORT, vol. 119, no. 406 (SeMI2019-103), 23 January 2020 (2020-01-23), JP, pages 23 - 28, XP009536988 *

Also Published As

Publication number Publication date
JP7439947B2 (en) 2024-02-28
JPWO2022079832A1 (en) 2022-04-21

Similar Documents

Publication Publication Date Title
Huang et al. Deep reinforcement learning for UAV navigation through massive MIMO technique
CN113162679B (en) DDPG algorithm-based IRS (intelligent resilient software) assisted unmanned aerial vehicle communication joint optimization method
Dahrouj et al. An overview of machine learning-based techniques for solving optimization problems in communications and signal processing
Callegaro et al. Optimal edge computing for infrastructure-assisted UAV systems
Huang et al. Reactive 3D deployment of a flying robotic network for surveillance of mobile targets
CN103314543A (en) Forecasting of dynamic environmental parameters to optimize operation of a wireless communication system
Olasupo et al. A framework for optimizing the deployment of wireless sensor networks
US11284361B2 (en) System and method for device-to-device communication
Shrestha et al. Spectrum surveying: Active radio map estimation with autonomous UAVs
Dai et al. Mobile crowdsensing for data freshness: A deep reinforcement learning approach
Luo et al. A two-step environment-learning-based method for optimal UAV deployment
Chiroma et al. Large scale survey for radio propagation in developing machine learning model for path losses in communication systems
Nasr-Azadani et al. Single-and multiagent actor–critic for initial UAV’s deployment and 3-D trajectory design
Hazarika et al. RADiT: Resource allocation in digital twin-driven UAV-aided internet of vehicle networks
Parvaresh et al. A continuous actor–critic deep Q-learning-enabled deployment of UAV base stations: Toward 6G small cells in the skies of smart cities
Eskandari et al. Deep Reinforcement Learning Based Joint 3D Navigation and Phase Shift Control for Mobile Internet of Vehicles Assisted by RIS-equipped UAVs
Jailton et al. Relay positioning strategy for traffic data collection of multiple unmanned aerial vehicles using hybrid optimization systems: A FANET-based case study
Lin et al. Reinforcement learning based UAV trajectory and power control against jamming
Nasr-Azadani et al. Distillation and ordinary federated learning actor-critic algorithms in heterogeneous UAV-aided networks
Jia et al. Online V2X scheduling for raw-level cooperative perception
WO2022079832A1 (en) Communication information prediction device, communication information prediction method, and communication information prediction program
US20220352995A1 (en) Communication system and terminal
WO2022079834A1 (en) Communication information prediction device, communication information prediction method, and communication information prediction program
WO2022079833A1 (en) Communication information prediction device, communication information prediction method, and communication information prediction program
Petrolo et al. ASTRO: A system for off-grid networked drone sensing missions

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20957661

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022556753

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20957661

Country of ref document: EP

Kind code of ref document: A1