JPWO2020004546A1 - 遠隔制御装置、遠隔制御方法及びプログラム - Google Patents

遠隔制御装置、遠隔制御方法及びプログラム Download PDF

Info

Publication number
JPWO2020004546A1
JPWO2020004546A1 JP2020527630A JP2020527630A JPWO2020004546A1 JP WO2020004546 A1 JPWO2020004546 A1 JP WO2020004546A1 JP 2020527630 A JP2020527630 A JP 2020527630A JP 2020527630 A JP2020527630 A JP 2020527630A JP WO2020004546 A1 JPWO2020004546 A1 JP WO2020004546A1
Authority
JP
Japan
Prior art keywords
control
control input
remote control
arrival
delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020527630A
Other languages
English (en)
Other versions
JP7006791B2 (ja
Inventor
裕志 吉田
裕志 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2020004546A1 publication Critical patent/JPWO2020004546A1/ja
Application granted granted Critical
Publication of JP7006791B2 publication Critical patent/JP7006791B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q9/00Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
    • H04Q9/02Automatically-operated arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C17/00Arrangements for transmitting signals characterised by the use of a wireless electrical link
    • G08C17/02Arrangements for transmitting signals characterised by the use of a wireless electrical link using a radio link
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/149Network analysis or design for prediction of maintenance
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C2201/00Transmission systems of control signals via wireless link
    • G08C2201/50Receiving or transmitting feedback, e.g. replies, status updates, acknowledgements, from the controlled devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2209/00Arrangements in telecontrol or telemetry systems
    • H04Q2209/10Arrangements in telecontrol or telemetry systems using a centralized architecture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2209/00Arrangements in telecontrol or telemetry systems
    • H04Q2209/70Arrangements in the main station, i.e. central controller

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Selective Calling Equipment (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

遅延ジッタを有する通信ネットワークを介した遠隔制御の安定性を向上させる遠隔制御装置を提供する。遠隔制御装置は、通信ネットワークにおける通信遅延を計測する遅延計測部と、計測された通信遅延の履歴から通信ネットワークにおける通信遅延の確率分布を生成する確率分布生成部と、通信遅延の確率分布に基づき、送信済み又は送信予定の制御入力が制御対象に到着する時刻を要素とする、複数の到着パターンを生成する到着パターン生成部と、生成された複数の到着パターンそれぞれについて、送信予定の制御入力の到着時刻における制御対象の状態を予測する状態予測部と、予測された複数の状態それぞれに対応する、複数の制御入力を算出することで制御入力の集合を算出する集合算出部と、算出された制御入力の集合に対する統計処理の結果に基づき、制御対象に出力する制御入力を決定する、制御入力決定部と、を備える。

Description

[関連出願についての記載]
本発明は、日本国特許出願:特願2018−123230号(2018年 6月28日出願)の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
本発明は、遠隔制御装置、遠隔制御方法及びプログラムに関する。
近年、IoT(Internet of Things)の構想が浸透するに従い、様々なロボットや機械が無線IP(Internet protocol)ネットワークにより接続されている。このようなネットワーク技術の発展に伴い、上記ロボットや機械が遠隔地からリアルタイムに制御されるようになってきている。
今後、UAV(Unmanned Aerial Vehicle)やUGV(Unmanned Ground Vehicle)等を用いた物品等の搬送、自動車の遠隔運転、ロボットによる災害地の調査や救急など、ロボットや機械の遠隔制御が社会に果たす役割は大きくなると想定される。
しかし、無線IPネットワークでは、通信が保証できない(ネットワークへの接続が保証できない)という無線通信の特性とIPネットワークにおけるキューイングの特性により、大きな通信遅延及びジッタ(ゆらぎ)が発生する可能性がある。当該通信遅延は、ロボット等を対象とする制御理論では「むだ時間」と呼ばれ、遠隔制御システムの安定性を損なわせる大きな要因として扱われる。
ここで、上記のような遅延時間(むだ時間)を有する遠隔制御システムを安定化させるには状態予測制御が効果的であることが知られている(特許文献1及び2参照)。状態予測制御は、観測された状態と遅延時間に基づいて、これから送信する制御系(制御システム)への制御入力が到着するであろう未来における制御対象の状態を予測することを基礎とする。従って、制御対象の状態が正確に予測できれば、予測した状態をフィードバックした制御入力を送信することで、制御システムを安定化できる。なお、本書において、「制御入力」とは、制御器(コントローラ)から制御対象に入力する情報とする。例えば、制御対象にモータ等の駆動源が含まれる場合には、当該モータに印加する電圧値が「制御入力」に該当する。
特許第4955237号公報 特許第3269792号公報
はじめに、本願開示で対象とするネットワークを介した遠隔制御システムについて説明した後、ネットワークが大きな遅延ジッタを有する際の問題を説明する。
図15は、本願開示にて対象とする遠隔制御システムの一例を示す図である。図15を参照すると、制御対象(Target System)と制御器(Remote Controller)はネットワークにより接続されている。当該ネットワークで発生する通信遅延が制御システムのむだ時間である。
図15に示すような遠隔制御システムは、以下の式(1)及び(2)のように定式化できる。
[式1]
Figure 2020004546
[式2]
Figure 2020004546
式(1)、(2)において、xは制御対象の状態変数、uは制御入力、A、Bは制御システムのダイナミクスを表す行列、yは観測できる量である。また、τinは制御入力uが制御対象に到着するまでの通信遅延、τoutは制御対象から状態をフィードバックする際の通信遅延である。
このように、遠隔制御システムでは、往路と復路のそれぞれで通信遅延が発生する。しかし、制御システムのむだ時間としては往路と復路の通信遅延の和が意味を持つ。つまり、τ=τin+τoutが遠隔制御システムにおいて意味のある「むだ時間」であって、往路の通信遅延τinと復路の通信遅延τoutの割合を考慮する必要がない。
上記を考え合わせると、式(1)及び(2)で表される遠隔制御システムのモデルは、下記の式(3)、(4)のように簡略化できる。
[式3]
Figure 2020004546
[式4]
Figure 2020004546
式(3)及び(4)によれば、状態予測制御では、制御対象への制御入力uの到着の遅延時間τに相当する未来の状態x(t+τ)を予測し、予測した状態に基づいて制御入力u(t)を算出する。制御対象が式(3)のような線形システムの場合、未来の状態の予測値x(ハット)(t+τ)は下記の式(5)のように解析的に得られる。
[式5]
Figure 2020004546
式(5)において、右辺の積分項は、送信済かつ未到着の制御入力u(t−τ)から制御入力u(t−0)までの制御入力による挙動を示す。当該積分項は、制御器が過去に送信した制御入力の履歴を参照して計算できる。
ここで、通信ネットワーク介した遠隔制御システムでは、制御入力の送信は当然に離散的になる。このような離散時間系の遠隔制御システムでは、制御対象のダイナミクスや時定数に依存するが、例えば、数msec(ミリ秒)から数100msecの一定間隔で制御入力uを格納したパケットが制御対象に送信されることになる。
その際、通信ネットワークの遅延が一定でジッタが存在しなければ、送信された制御入力が制御対象に到着する間隔も一定となる。この場合、制御対象へ実際に入力される制御入力uは図16のように等間隔の階段関数となる。ここでは、理解の容易のため、制御器による制御入力の送信周期(例えば、数msec〜数100msec程度の期間)を単位時間とする。つまり、制御器は、t=0、1、2、・・・、のタイミングにて制御入力u(制御入力uを含むパケット)を制御対象に送信する。その際、通信遅延が発生しないと仮定すれば、制御対象への制御入力uは連続時間関数u(t)として下記の式(6)として表記できる。なお、連続時間関数uの「e」は、等間隔(equal interval)を示す。
[式6]
Figure 2020004546
しかし、上述のように、ネットワーク、特に無線IPネットワークでは、制御器が送信した制御入力が制御対象に到着するまでに通信遅延が発生し、且つ、その通信遅延は大きなジッタを有することが多い。この場合、制御対象に入力される制御入力u(t)は、図17に示すように不等間隔の階段関数になる。なお、図17において、色の濃い線が通信遅延にジッタが含まれる場合を示し、色の薄い線が通信遅延にジッタが含まれない場合を示す。
図17によれば、制御入力(u、u、・・・)の制御対象への到着時刻をそれぞれt、t、・・・とすると、制御対象へ加わる制御入力の関数u(t)は下記の式(7)として表記できる。なお、制御入力の関数u(t)の「u」は、不等間隔(unequal interval)を示す。
[式7]
Figure 2020004546
特許文献1及び2に代表される状態予測制御では、制御対象に対して送信間隔が等しい制御入力u(t)を式(5)に示される線形システムに代入し状態予測を行っている。しかし、遅延ジッタが存在するような通信環境では、実際の制御入力は式(7)に示されるような関数u(t)である。その結果、制御対象の状態の予測値x(ハット)に大きな誤差が生まれる可能性がある。
制御対象の状態の予測誤差は、状態フィードバック制御において、適切な制御入力(例えば、真の状態xのフィードバックKx;Kはフィードバックゲイン)からのずれに直接影響を与える。一方で、遅延やそのジッタを正確に予測することは困難である。同様に、遅延ジッタの影響を受けた入力u(t)を正確に予測することは現実的に不可能であると言える。
本発明では、遅延ジッタを有する通信ネットワークを介した遠隔制御の安定性を向上させることに寄与する遠隔制御装置、遠隔制御方法及びプログラムを提供することを主たる目的とする。
本発明乃至開示の第1の視点によれば、制御入力の送信時刻と制御対象から送信された状態の受信時刻に基づき通信ネットワークにおける通信遅延を計測する、遅延計測部と、前記計測された通信遅延の履歴から前記通信ネットワークにおける通信遅延の確率分布を生成する、確率分布生成部と、前記通信遅延の確率分布に基づき、送信済み又は送信予定の制御入力が前記制御対象に到着する時刻を要素とする、複数の到着パターンを生成する、到着パターン生成部と、前記生成された複数の到着パターンそれぞれについて、送信予定の制御入力の到着時刻における前記制御対象の状態を予測する、状態予測部と、前記予測された複数の状態それぞれに対応する、複数の制御入力を算出することで制御入力の集合を算出する、集合算出部と、前記算出された制御入力の集合に対する統計処理の結果に基づき、前記制御対象に出力する制御入力を決定する、制御入力決定部と、を備える、遠隔制御装置が提供される。
本発明乃至開示の第2の視点によれば、制御対象を通信ネットワークを介して制御する遠隔制御装置において、制御入力の送信時刻と制御対象から送信された状態の受信時刻に基づき前記通信ネットワークにおける通信遅延を計測し、前記計測された通信遅延の履歴から前記通信ネットワークにおける通信遅延の確率分布を生成し、前記通信遅延の確率分布に基づき、送信済み又は送信予定の制御入力が前記制御対象に到着する時刻を要素とする、複数の到着パターンを生成し、前記生成された複数の到着パターンそれぞれについて、送信予定の制御入力の到着時刻における前記制御対象の状態を予測し、前記予測された複数の状態それぞれに対応する、複数の制御入力を算出することで制御入力の集合を算出し、前記算出された制御入力の集合に対する統計処理の結果に基づき、前記制御対象に出力する制御入力を決定する、ことを含む遠隔制御方法が提供される。
本発明乃至開示の第3の視点によれば、制御対象を通信ネットワークを介して制御する遠隔制御装置に搭載されたコンピュータに、制御入力の送信時刻と制御対象から送信された状態の受信時刻に基づき前記通信ネットワークにおける通信遅延を計測する処理と、前記計測された通信遅延の履歴から前記通信ネットワークにおける通信遅延の確率分布を生成する処理と、前記通信遅延の確率分布に基づき、送信済み又は送信予定の制御入力が前記制御対象に到着する時刻を要素とする、複数の到着パターンを生成する処理と、前記生成された複数の到着パターンそれぞれについて、送信予定の制御入力の到着時刻における前記制御対象の状態を予測する処理と、前記予測された複数の状態それぞれに対応する、複数の制御入力を算出することで制御入力の集合を算出する処理と、前記算出された制御入力の集合に対する統計処理の結果に基づき、前記制御対象に出力する制御入力を決定する処理と、を実行させるプログラムが提供される。
なお、このプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。記憶媒体は、半導体メモリ、ハードディスク、磁気記録媒体、光記録媒体等の非トランジェント(non-transient)なものとすることができる。本発明は、コンピュータプログラム製品として具現することも可能である。
本発明乃至開示の各視点によれば、遅延ジッタを有する通信ネットワークを介した遠隔制御の安定性を向上させることに寄与する遠隔制御装置、遠隔制御方法及びプログラムが、提供される。
一実施形態の概要を説明するための図である。 第1の実施形態に係る遠隔制御システムの概略構成の一例を示す図である。 第1の実施形態に係る遠隔制御装置のハードウェア構成の一例を示す図である。 第1の実施形態に係る遠隔制御装置の動作の一例を示すフローチャートである。 倒立振子のモデル示す図である。 通信遅延のシミュレーション結果の一例を示す図である。 軽い振子を用いた場合の倒立成功率の結果の一例を示す図である。 本願開示を含む種々の制御手法による制御結果の一例を示す図である。 本願開示による提案手法の補正項の一例を示す図である。 本願開示を含む種々の制御手法について倒立成功時の振子角度のLノルムの平均値を示す図である。 重い振子の倒立成功率の一例を示す図である。 重い振子の制御結果の一例を示す図である。 本願開示による提案手法の補正項の一例を示す図である。 重い振子を用いた際の振子角度のLノルムの一例を示す図である。 遠隔制御システムの一例を示す図である。 遠隔制御システムを説明するための図である。 遠隔制御システムを説明するための図である。
はじめに、本発明の一実施形態の概要について説明する。なお、この概要に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、この概要の記載はなんらの限定を意図するものではない。また、各図におけるブロック間の接続線は、双方向及び単方向の双方を含む。一方向矢印については、主たる信号(データ)の流れを模式的に示すものであり、双方向性を排除するものではない。さらに、本願開示に示す回路図、ブロック図、内部構成図、接続図などにおいて、明示は省略するが、入力ポート及び出力ポートが各接続線の入力端及び出力端のそれぞれに存在する。入出力インターフェイスも同様である。
一実施形態に係る遠隔制御装置100は、遅延計測部101と、確率分布生成部102と、到着パターン生成部103と、状態予測部104と、集合算出部105と、制御入力決定部106と、を備える(図1参照)。遅延計測部101は、制御入力の送信時刻と制御対象から送信された状態の受信時刻に基づき通信ネットワークにおける通信遅延を計測する。確率分布生成部102は、計測された通信遅延の履歴から通信ネットワークにおける通信遅延の確率分布を生成する。到着パターン生成部103は、通信遅延の確率分布に基づき、送信済み又は送信予定の制御入力が制御対象に到着する時刻を要素とする、複数の到着パターンを生成する。状態予測部104は、生成された複数の到着パターンそれぞれについて、送信予定の制御入力の到着時刻における制御対象の状態を予測する。集合算出部105は、予測された複数の状態それぞれに対応する、複数の制御入力を算出することで制御入力の集合を算出する。制御入力決定部106は、算出された制御入力の集合に対する統計処理の結果に基づき、制御対象に出力する制御入力を決定する。
上述のように、通信ネットワークを介した遠隔制御では、通信路における通信遅延及びそのジッタの発生が問題となる。遠隔制御装置100は、制御入力の送信時刻と対応する応答(制御対象からの状態フィードバック)の受信時刻に基づき通信路に発生する遅延を計測し蓄積する。遠隔制御装置100は、当該蓄積された遅延情報から通信遅延の確率分布を計算し、通信路における遅延及びそのジッタに関するモデル化を行う。遠隔制御装置100は、モデル化された通信路の遅延の確率分布に自装置から送信済み又は送信予定の制御入力を当てはめ、各制御入力が制御対象に到着する時刻を推定する。遠隔制御装置100は、当該推定を繰り返すことで、各制御入力が制御対象に到着する時刻を要素(系列)とする複数の到着パターンを生成する。制御入力が制御対象に到着する時刻が推定できると、遠隔制御装置100は、送信済みあるいは送信予定の制御入力が反映された制御対象の状態を予測できる。遠隔制御装置100は、当該予測を複数の到着パターンそれぞれについて行うことで、様々な通信路の状態(通信遅延及びジッタ)が反映された送信済み又は送信予定の制御入力が制御対象の状態に与える影響を網羅的に把握することができる。遠隔制御装置100は、複数の到着パターンにより把握される制御対象の各状態について、適切な制御入力(予測した状態をフィードバックした制御入力)を生成することで、複数の制御入力からなる集合を算出する。遠隔制御装置100は、当該算出した集合に対して統計処理を施し、制御入力を要素とする集合の特徴(例えば、制御入力のばらつき)を示す統計値(例えば、標準偏差)を算出する。ここで、通信路における状態(通信遅延、ジッタ)のばらつきが大きければ、算出された集合に含まれる制御入力も大きくばらつくことになる。対して、通信路の状態のばらつきが小さければ、算出された集合に含まれる制御入力のばらつきも小さい。詳細については後述するが、遠隔制御装置100は、このような通信路の状態と制御入力の関係に着目して最終的に制御対象に送信する制御入力を決定する。具体的には、遠隔制御装置100は、算出した統計値(例えば、標準偏差)から複数の制御入力からなる集合のばらつきが大きいと判断すると、制御入力の変化幅を抑えシステムの安定を優先するように制御入力を決定する。その結果、遅延ジッタが存在する通信ネットワークを経由した遠隔制御システムの安定性が改善される。換言するならば、遠隔制御装置100により、通信ネットワークを介した遠隔制御システムにおいて、遅延ジッタに対してロバストな状態予測制御手法が実現できる。
以下に具体的な実施の形態について、図面を参照してさらに詳しく説明する。なお、各実施形態において同一構成要素には同一の符号を付し、その説明を省略する。
[第1の実施形態]
第1の実施形態について、図面を用いてより詳細に説明する。
図2は、第1の実施形態に係る遠隔制御システムの概略構成の一例を示す図である。図2を参照すると、遠隔制御システムは、遠隔制御装置10と、制御対象20と、通信ネットワーク30と、を含んで構成される。
はじめに、第1の実施形態にて対象とする遠隔制御システムについて説明する。第1の実施形態にて対象とする遠隔制御システムは、上述の式(3)、(4)で表される「むだ時間」を含む線形システムとする。また、時間の扱いとしては連続時間システムとする(時刻tは実数の範囲の値を取り得る)。但し、制御器である遠隔制御装置10は、時刻(t=0、1、2、・・・)のように単位時間ごと(例えば、100msecごと)に制御入力(u、u、u、・・・)を制御対象に向けて送信する。
送信された各制御入力uの通信遅延を(τ、τ、τ、・・・)とすると、各制御入力uが制御対象20に到着する時刻は(t=0+τ、t=1+τ、t=2+τ、・・・)となる。
既存の「むだ時間」を含む制御システムでは、τ=τ=τ=・・・=const(固定値)のように通信遅延は一定であった。対して、本願開示では、通信ネットワークは遅延ジッタを有することを前提とし、各制御入力uの制御対象20への到着時刻(t、t、t、・・・)の間隔は不等となる。ただし、本願開示では、t≦t≦t≦・・・の関係は満足し、制御入力uが制御対象に到着する順序の逆転はないものとする。
また、制御対象20は制御入力u(i=0、1、2、・・・)を受信すると、即時にそのときの状態xを制御器にフィードバックする。つまり、制御器である遠隔制御装置10は、離散的にx(t)=xを観測し、当該フィードバックを受けて通信遅延τを計測する。
ここで、時刻はt=Tであり、新たな制御入力(送信予定の制御入力)uを計算しようとしている段階で、制御対象の最新の状態がx=xだけが観測されているとする。即ち、制御対象20に到着している制御入力uはuだけであり、送信済みの制御入力(u、u、・・・、uT−1)は未だ制御対象20に到着していないとする。第1の実施形態に係る遠隔制御装置10は、このような状況下で遠隔制御システムの安定性を改善する制御入力uを算出する。
続いて、遠隔制御システムに含まれる各装置の処理について説明する。
はじめに、遠隔制御装置10の処理構成(処理モジュール)について説明する。
図2に示すように、遠隔制御装置10は、送信部201と、受信部202と、を含んで構成される。さらに、遠隔制御装置10は、遅延計測部203と、遅延確率分布生成部204と、制御入力到着パターン生成部205と、状態予測部206と、制御入力集合算出部207と、制御入力決定部208と、を含む。
送信部201及び受信部202は、通信ネットワーク30を介して制御対象20と通信する。具体的には、送信部201は、制御対象20に向けて制御入力uを格納したパケットを送信する。受信部202は、制御対象20から送信される状態xを格納したパケットを受信する。
遅延計測部203は、制御入力uの送信時刻と制御対象20から送信された状態xの受信時刻に基づき通信ネットワーク30における通信遅延を計測する。より具体的には、遅延計測部203は、制御対象20から受信した状態xと当該状態xに対応する制御入力uに基づき、通信遅延を計測する。例えば、遅延計測部203は、状態xの受信時刻から当該状態xに対応する制御入力uの送信時刻を減算して通信遅延を算出する。
遅延確率分布生成部204は、計測された通信遅延の履歴(蓄積された通信遅延の計算結果)から通信ネットワーク30における通信遅延の確率分布を生成する。上述のとおり、遅延計測部203は制御対象20からのフィードバック(状態x)に基づいて通信ネットワーク30にて生じる通信遅延を計測する。遅延確率分布生成部204は、遅延計測部203により計測された通信遅延の集合{τ|i=0、1、2、・・・}から累積分布関数F(τ)を構築し、当該累積分布関数F(τ)を通信遅延の確率分布とする。あるいは、遅延確率分布生成部204は、時系列解析やその他の確率解析によって、より高精度な確率分布を求めてもよい。
制御入力到着パターン生成部205は、通信遅延の確率分布に基づき、送信済み又は送信予定の制御入力uが制御対象20に到着する時刻を要素とする、複数の集合を生成する。具体的には、制御入力到着パターン生成部205は、算出された通信遅延の確率分布に基づいて、制御入力(u、u、・・・、u)の到着時刻の系列のサンプル(t、t、・・・、t)を生成する。なお、以降の説明において、到着時刻に関する上記サンプルを「到着パターン」と表記する。
例えば、制御入力到着パターン生成部205は、D/G/1待ち行列モデルを用いた制御入力uの到着に関するシミュレーション(モンテカルロシミュレーション)により、上記到着パターンを生成する。「D/G/1」は、ケンドールの記号と呼ばれる待ち行列の表記方法であり、先頭の「D」は到着過程、続く「G」はサービス時間分布、「1」はサービスチャネル数を示している。
到着過程Dは確定的(Deterministic)であり、既に仮定したとおり、等間隔の制御入力uの送信を意味する。サービス時間分布Gは一般(General)であり、先に求めた確率分布F(τ)を用いる。このD/G/1待ち行列モデルで制御入力(u、u、・・・、u)の到着がシミュレートされると、一つの到着パターンが生成される。
ただし、制御入力到着パターン生成部205は、待ち行列モデルのシミュレーションは、サービス時間の経過に関して通常の待ち行列とは異なるカスタマイズを実施する。通常の待ち行列モデルは、キューの先頭のサービスが完了したタイミングで、次のキューにサービス時間が割り当てられる。対して、制御入力到着パターン生成部205によるシミュレーションでは、キューに到着した段階でサービス時間が割り当てられ、サービス時間が経過するものとする。このようなカスタマイズにより、スパイク状の通信遅延後のバースト的な制御入力の到着が再現される。
制御入力到着パターン生成部205は、当該シミュレーションを繰り返し実施することで、複数の到着パターンを生成する。つまり、到着パターンの一つが、
Figure 2020004546
に設定されると、その集合
Figure 2020004546
が得られる。
ここで、先に定義した遅延ジッタが存在する通信環境での制御入力の関数u(t)は、ある到着パターンΔに関する制御入力の関数であることを明示するため、当該関数をu(t;Δ)と表記する。このような表記を用いると、制御入力到着パターン生成部205による到着パターンの生成は、対応する制御入力の関数u(t;Δ)を生成することに等しい。
生成された制御入力の到着パターンに対応する制御入力の関数u(t;Δ)が得られると、当該制御入力によって制御対象20の状態も変化する。
状態予測部206は、生成された複数の到着パターンそれぞれについて、送信予定の制御入力の到着時刻における制御対象20の状態(状態変化)を予測する。具体的には、状態予測部206は、時刻t=t(tは制御入力uの到着予想時刻)における制御対象20の状態x(t)の予測値x(ハット)(t;Δ)を下記の式(8)により算出する。
[式8]
Figure 2020004546
制御入力集合算出部207は、予測された複数の状態それぞれに対応する、複数の制御入力uを算出することで制御入力の集合を算出する。上述のように、多数の到着パターンΔ(i=1、2、・・・)を生成すると、同数の制御対象の予測値x(ハット)(t;Δ)が得られる(i=1、2、・・・)。これら1つ1つの予測値x(ハット)(t;Δ)に対して、制御入力uを用いた状態フィードバック制御uT、Δi=Kx(ハット)(t;Δ)の実行を考える(但し、Kはフィードバックゲイン)。
この場合、到着パターンの数だけ制御入力の候補uT、Δiが得られる(但し、i=1、2、・・・)。制御入力集合算出部207は、上記制御入力の候補を下記の式(9)のように制御入力の集合として捉えて、集合を算出する。
[式9]
Figure 2020004546
制御入力決定部208は、算出された制御入力の集合に対する統計処理の結果に基づき、制御対象20に出力する制御入力uを決定する。具体的には、制御入力決定部208は、算出された制御入力の集合に含まれる要素のばらつきを示す統計値(例えば、標準偏差)と、算出された制御入力の集合に関する代表値(例えば、中央値)と、に基づき制御対象20に出力する制御入力uを決定する。
制御入力uの集合Uの分散σ(U)が大きい場合、遅延ジッタによる制御入力uのばらつきが大きくなる。当然、このような場合には、望ましい制御入力u、即ち、真の状態x(t)に基づく状態フィードバックKx(t)(以下、真の状態フィードバックと表記する)との間のずれも大きくなる。真の状態フィードバックと大きくずれた値を制御入力uに採用すると、制御システムは不安定になる可能性が高い。このような場合、制御入力uの大きさ(絶対値)を抑えた方が、安定点(平衡点)から大きくずれてしまうリスクを低減できる。さらに、制御入力uを小さくしておくことで、システムの状態が仮に真の状態フィードバックからずれた場合であっても、そのずれ(変動)をリカバリ可能な範囲に留めておける可能性が高くなる。
一方、制御入力uの集合Uの分散σ(U)が小さい場合、望ましい制御入力uと真の状態フィードバックの間のずれは小さいことを意味するので、制御入力uの大きさを抑える必要はない(制御入力uを小さくする必要性は低い)。つまり、制御入力uの集合Uの分散σ(U)が小さい場合には、制御入力uの集合Uの代表値(例えば、中央値、平均値、最頻値)を制御対象20に入力したとしても制御システムの安定性は確保される。
制御入力決定部208は、上記知見に基づき、得られた制御入力の集合Uから最終的な制御入力uを下記の式(10)〜(11)により算出する。
[式10]
Figure 2020004546
[式11]
Figure 2020004546
[式12]
Figure 2020004546
なお、式(10)のS(U)は制御入力uを抑制するための補正項である。S(U)の値域は0≦S(U)≦1である。当該補正項は、上述のとおり、分散σ(U)が大きいほど小さくなる(S(U)→0)。逆に、分散σ(U)が小さいほど、当該補正項は大きくなる(S(U)→1)。
式(10)において、σ(U)を|E(U)|で除算しているのは正規化が目的であり、変動係数(標準偏差/平均)に近い意味合いを持つ。ただし、|E(U)|が 0に近い場合、補正項S(U)が急速に0に近づくのを避ける(0除算を避ける)ために、式(10)では正数εを|E(U)|に加算している。また、式(10)のαは調整パラメータである。
式(11)は補正項S(U)自体の変動を抑えるための指数平滑処理である。式(11)に記載したγは平滑化係数であり、その値域は0<γ<1である。
制御入力決定部208は、式(12)による計算結果を最終的な制御入力とする。具体的には、制御入力決定部208は、集合Uの代表値としての中央値M(U)に平滑化した補正項S(アッパーバー)(U)を乗算し、その結果を最終的な制御入力uとする。
このように、制御入力決定部208は、制御入力の集合に関する代表値(例えば、M(U))に比例し、集合のばらつきを示す統計値(例えば、標準偏差σ)に対して単調減少(例えば、補正項S(U))な関数を用いて、制御入力uを決定する。より具体的には、制御入力決定部208は、集合のばらつきを示す統計値が小さい場合には値が大きくなり、ばらつきを示す統計値が大きい場合には値が小さくなる補正項S(U)を算出する。その後、制御入力決定部208は、算出された補正項S(U)と制御入力の集合に関する代表値を乗算することで、最終的な制御入力uを決定する。
続いて、制御対象20の処理構成について説明する。図2を参照すると、制御対象20は、受信部301と、制御部302と、送信部303と、を含んで構成される。
受信部301は、遠隔制御装置10が送信する制御入力uを受信する。受信部301は、受信した制御入力uを制御部302に引き渡す。制御部302は、取得した制御入力uに基づき駆動源(例えば、モータ等;図2において図示せず)を制御する。制御部302による制御結果は、状態xとして送信部303を介して遠隔制御装置10に送信される。
続いて、各装置のハードウェア構成について説明する。
[ハードウェア構成]
図3は、遠隔制御装置10のハードウェア構成の一例を示す図である。遠隔制御装置10は図3に例示する構成を備える。例えば、遠隔制御装置10は、内部バスにより相互に接続される、CPU(Central Processing Unit)11、メモリ12、入出力インターフェイス13及び通信インターフェイスであるNIC(Network Interface Card)14等を備える。
但し、図3に示す構成は、遠隔制御装置10のハードウェア構成を限定する趣旨ではない。遠隔制御装置10は、図示しないハードウェアを含んでもよい。遠隔制御装置10に含まれるCPU等の数も図3の例示に限定する趣旨ではなく、例えば、複数のCPU11が遠隔制御装置10に含まれていてもよい。
メモリ12は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置(ハードディスク等)等である。
入出力インターフェイス13は、図示しない入出力装置のインターフェイスである。入出力装置には、例えば、表示装置、操作デバイス等が含まれる。表示装置は、例えば、液晶ディスプレイ等である。操作デバイスは、例えば、キーボードやマウス等である。
遠隔制御装置10の機能は、上述の処理モジュールにより実現される。当該処理モジュールは、例えば、メモリ12に格納されたプログラムをCPU11が実行することで実現される。また、そのプログラムは、ネットワークを介してダウンロードするか、あるいは、プログラムを記憶した記憶媒体を用いて、更新することができる。さらに、上記処理モジュールは、半導体チップにより実現されてもよい。即ち、上記処理モジュールが行う機能は、何らかのハードウェア、或いはハードウェアを利用して実行されるソフトウェアにより実現できればよい。
なお、制御対象20のハードウェアに関し、CPUやメモリ等を含む基本的な構成は遠隔制御装置10と同一とすることができる。また、モータ等を利用した駆動源に関しては当業者にとって明らかであるため、その説明を省略する。
図4は、第1の実施形態に係る遠隔制御装置10の動作の一例を示すフローチャートである。
遠隔制御装置10は、送信済みの制御入力uに関する送信時間と、当該送信済みの制御入力uに対応する状態x(制御対象20からのフィードバック)に基づき、通信遅延を計測する(ステップS01)。
遠隔制御装置10は、計測された通信遅延に基づき、通信ネットワーク30における通信遅延の確率分布を生成する(ステップS02)。
遠隔制御装置10は、制御入力uに関する到着パターンを生成する(ステップS03)。具体的には、遠隔制御装置10は、上記生成された確率分布を用いて、制御入力uの想定される到着時刻に関するサンプル(時系列)を生成する。具体的には、遠隔制御装置10は、D/G/1待ち行列モデル等を用いた制御入力uの到着に関するシミュレーションにより、上記到着パターンを生成する。その際、遠隔制御装置10は、上記シミュレーションを繰り返すことで、多数の到着パターンを生成する(到着パターンの集合を生成する)。
遠隔制御装置10は、生成された各到着パターンにて制御対象20に到着する制御入力uによる制御対象20の状態変化を予測する(ステップS04)。その結果、遠隔制御装置10は、制御入力uの到着パターンの集合に含まれる要素と同じ数の制御対象20に関する予測値を得る。
遠隔制御装置10は、得られた各予測値を用いて制御入力uを生成する(ステップS05)。即ち、遠隔制御装置10は、各予測値をフィードバックした制御入力uを生成する。遠隔制御装置10は、上記予測値と同数の制御入力uを生成し、制御入力uに関する集合を生成する。遠隔制御装置10は、予測された複数の状態それぞれについて、予測された制御対象の状態をフィードバックした制御入力を複数算出することで制御入力の集合を算出する。
遠隔制御装置10は、制御入力uの集合に基づき制御対象20に送信する制御入力を決定する(ステップS06)。具体的には、遠隔制御装置10は、制御入力uの集合Uの標準偏差を算出し、当該標準偏差を用いて制御対象20に送信する制御入力uを計算する。例えば、遠隔制御装置10は、制御入力uの集合Uの代表値(平均値、中央値及び最頻値のうちいずれか1つ)を算出し、当該代表値に対して集合Uのばらつきを反映した補正項を乗算することで、最終的な制御入力uを決定する。
なお、遠隔制御装置10は、新たな制御入力uを生成するたびに図4に示す動作を実行する。つまり、遠隔制御装置10は、制御入力uの送信時を基準とする過去の所定期間に蓄積(計測)された通信遅延を用いて確率分布を計算し、制御入力uの生成時における通信路の状態を把握する。このようにして計算された確率分布を用いて、到着パターンの生成や制御対象20の状態予測を行うことで、遠隔制御装置10は、制御入力uの生成時における通信路の状態が反映された制御入力uの集合を計算する。その結果、通信路の状態(遅延、ジッタ)に適した制御入力uが決定され、遅延ジッタに対してロバストな遠隔制御システムが実現できる。
続いて、第1の実施形態に係る遠隔制御システムのシミュレーション結果(実験結果)を説明する。
ここでは、倒立振子を制御対象20に設定し、当該倒立振子を遠隔制御装置10により制御する遠隔制御システムをシミュレーションすることで本願開示の制御手法を評価する。
図5は、倒立振子のモデル示す図である。図5(a)は、シミュレーションに用いた制御対象の外観を示す図であり、図5(b)は制御対象のモデル化を示す図である。図5(b)において、mは台車の質量、ζは台車の変位、2lは振子の長さ、mは振子の質量、θは振子の角度をそれぞれ示す。また、台車をモータで駆動するとき、台車に加わる力Fは、モータにかかる電圧u、モータのトルク定数K、モータの抵抗R、ギア半径rにより定まる。
図5に示す倒立振子モデルを先に説明した状態方程式(3)で表すと、状態ベクトルx、行列A、Bはそれぞれ下記の式(13)〜(15)となる。
[式13]
Figure 2020004546
[式14]
Figure 2020004546
[式15]
Figure 2020004546
上記説明した倒立振子システムの各パラメータは、それぞれ以下とする。
=0.4kg
g=9.8kg/s
=0.023Nm/A
=8.3Ω
=0.0065m
また、振子の重さと長さについては軽い振子と重い振子を用意する。
軽い振子の重さと長さについては、そのパラメータを以下のとおりとする。
=0.20kg
=0.42m
重い振子の重さと長さについては、そのパラメータを以下のとおりとする。
=0.36kg
=0.82m
上記重さの異なる2つの振子を用いたシミュレーションを行った。なお、制御入力u(モータに加える電圧[V])の送信間隔は16msecで等間隔とする。
フィードバックゲインKは、最適制御則によって決定される。
軽い振子では、
K=[−11.180、−73.483、−15.733、−12.633]
とする。
重い振子では、
K=[−11.180、−94.457、−17.256、−23.066]
とする。
他の設定パラメータは以下のように設定した。
α=2.0
ε=0.1
γ=0.95
制御入力の到着パターンは50パターンを生成した。即ち、制御入力の集合Uの要素数は50とした。
上述のように、通信遅延τが反映された制御入力uに関する到着パターンは、D/G/1待ち行列モデルにより生成する。到着過程は制御入力uの送信間隔である16msecの等間隔到着である。サービス時間分布は、下記の式(16)に示されるガンマ分布を採用した。通信遅延の分布にはガンマ分布の適合性が高いためである。
[式16]
Figure 2020004546
式(16)において、τは最小遅延、kは形状母数、βは尺度母数である。ただし、上で述べたように通常の待ち行列モデルとは異なり、制御入力uが制御対象に到着した時点でサービス時間が与えられ、それと同時にサービス時間の経過が始まるものとする。
また、今回のシミュレーションでは、τ=10msec、β=3.5とし、尺度母数βを10secごとにβ=15→1→25と変化させ、遅延ジッタ自身にも変動を与えた。
当該条件での通信遅延のシミュレーション例を図6に示す。シミュレーション開始時の振子及び台車の初期状態は以下のとおりとした。
ζ=−0.1m
ζ(ドット)=0.0m/s
θ=0.05rad
θ(ドット)=0.02rad/s
とした。
シミュレーション時間は30secとし、外乱として4secごとに振子の角速度を
θ(ドット)=−0.1rad/s
とした。当該外乱は、振子が少し押された場合を想定している。
シミュレーション時間の30secの間倒立できていれば成功とし、100回実施したうちの成功確率を評価した。さらに、倒立成功時の振子角度θのLノルムを振子のぐらつき(ぶれ)の評価指標として算出した。
図7は、軽い振子を用いた場合の倒立成功率の結果の一例を示す図である。図7において、左から通信遅延がない場合の状態フィードバック制御(No delay)、通信遅延を考慮しない状態フィードバック制御(State-feedback)、通常の状態予測制御(State-predictive)、本願開示の提案手法(Proposed)である。
図7を参照すると、状態フィードバック制御は、通信遅延がない場合は100%の成功率となるが、通信遅延を含む環境ではたちまち不安定になり、今回のシミュレーションでは1度も倒立に成功しなかった。また、通常の状態予測制御では遅延を含む環境で機能するように考案されてはいるが、遅延ジッタへのロバスト性はない。今回のシミュレーションでも当該特性が表れており、通常の状態予測制御にて倒立に成功したのは4度だけであった。
一方、本願開示の提案手法では、遅延ジッタによる制御入力のばらつきを考慮し、制御入力uの大きさを適応的に補正するため、倒立成功率を87%にまで高めることができた。
図8は、各制御手法による制御結果の一例を示す図である。図8では、横軸を時間、左縦軸を台車の位置(car position)ζ、右縦軸を振子の角度(pendulum angle)θとしている。図8(a)は、遅延がない場合の状態フィードバック制御による制御結果を示す。図8(b)は、遅延がある場合の状態フィードバック制御による制御結果を示す。図8(c)は、遅延がある場合の状態予測制御による制御結果を示す。図8(d)は、遅延がある場合の本願開示の提案手法による制御結果を示す。図8(a)〜図8(d)のそれぞれにおいて、4secごとの変動が発生するのは、上述したとおり外乱として角速度の変化を加えているためである。
図8(b)を参照すると、状態フィードバックは遅延ジッタを含むとたちまち不安定になっていることが分かる。また、図8(c)を参照すると、通常の状態予測制御は、20sec経過時までは倒立できているが、20sec以降の遅延ジッタが大きくなった際に不安定になることが分かる。
一方、図8(d)に示す本願開示の提案手法では、20sec以降で多少振動が大きくなっているが、振子の倒立は実現できていることが分かる。本願開示の提案手法では、式(12)に示すとおり、補正項S(アッパーバー)(U)によって、遅延ジッタへのロバスト性を高めている。
図8(d)に示す提案手法のシミュレーションにおいて、補正項S(アッパーバー)(U)の値を図9に示す。図9を参照すると、概して、0.4〜0.8の間で補正項は変動しているが、遅延ジッタが小さくなる10〜20secの間では補正項の値は大きくなり、遅延ジッタが大きくなる20sec以降でその値が小さくなっていることが分かる。当該事実は、遅延ジッタが少ない状況では制御入力uの揺らぎが小さく、真の状態フィードバックからずれのリスクが低くなり、遅延ジッタが大きな状況ではその反対となることを示す。
図10は、各手法について100回試行したうち倒立成功時の振子角度θのLノルムの平均値を示す図である。なお、一度も倒立に成功しなかった状態フィードバックには当該平均値はない。
図10を参照すると、本願開示の提案手法では、通常の状態予測制御手法と比較し、振子角度θのLノルムが半分以下に抑えられている。当該事実は、同じ倒立成功時であっても、本願開示の提案手法は通常の状態予測制御よりも振子のぶれを抑制できていることを示す。
図11は、重い振子の倒立成功率の一例を示す図である。予測をしない状態フィードバック制御は重い振子を用いた場合でも倒立に成功しなかった。また、通常の状態予測制御では95%の成功率を達成できた。
重い振子は、慣性モーメントが大きくなるため、時定数も大きくなる。そのため、相対的に遅延の影響が少なくなることに加え、振子の状態予測のずれも小さくなることが要因である。このように大きな振子の倒立制御では小さな振子の倒立制御よりも有利であるため、本願開示の提案手法では、重い振子を用いることで成功率100%を達成することができた。
図12は、重い振子の制御結果の一例を示す図である。図12(a)は、遅延がない場合の状態フィードバック制御による制御結果を示す。図12(b)は、遅延がある場合の状態フィードバック制御による制御結果を示す。図12(c)は、遅延がある場合の状態予測制御による制御結果を示す。図12(d)は、遅延がある場合の本願開示の提案手法による制御結果を示す。
上述のように、時定数が大きく制御が容易化しているため、状態フィードバック制御と通常の状態予測制御においても倒立できている時間が延びている。一方、振子の慣性モーメントが大きくなっているので、角速度の外乱に対する立て直し(修正)には時間を要するように変化していることが分かる。
図13は、本願開示の提案手法の補正項S(アッパーバー)(U)の一例を示す図である。図9及び図13を参照すると、補正項については、重い振子と軽い振子との間に大きな差異を見出すことができない。
図14は、重い振子を用いた際の振子角度のLノルムの一例を示す図である。図14を参照すると、上述のように、重い振子の方が制御が容易であるため、各制御手法において全体的にノルムの値は小さくなることが分かる。その中でも、本願開示の提案手法は、通常の状態予測制御よりも振子のぶれを低減できていることが分かる。
以上のように、第1の実施形態に係る遠隔制御装置10は、通信遅延に関する確率分布を生成し、当該確率分布を用いて送信済み又は送信予定の制御入力uの到着パターンを生成する。遠隔制御装置10は、当該到着パターンを複数生成し、各到着パターンについて送信予定の制御入力uが制御対象20に与える影響を予測(制御対象20の状態を予測)し、各予測に適した制御入力uを複数生成する。遠隔制御装置10は、複数生成された制御入力uの「ばらつき」が大きい場合には、送信済み又は送信予定の制御入力uが制御対象に与える影響(状態フィードバック)を正確に予測することは難しいと捉え、制御対象20への制御量を小さく抑える。その結果、遠隔制御システムが不安定になる可能性が低くなり、遅延ジッタに対してロバストなシステムが実現できる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
[付記1]
上述の第1の視点に係る遠隔制御装置のとおりである。
[付記2]
前記集合算出部は、
前記予測された複数の状態それぞれについて、前記予測された制御対象の状態をフィードバックした制御入力を複数算出することで前記制御入力の集合を算出する、付記1に記載の遠隔制御装置。
[付記3]
前記制御入力決定部は、
前記算出された制御入力の集合に含まれる要素のばらつきを示す統計値と、前記算出された制御入力の集合に関する代表値と、に基づき前記制御対象に出力する制御入力を決定する、付記1又は2に記載の遠隔制御装置。
[付記4]
前記制御入力決定部は、
前記制御入力の集合に関する代表値に比例し、前記ばらつきを示す統計値に対して単調減少な関数を用いて、前記制御入力を決定する付記3に記載の遠隔制御装置。
[付記5]
前記制御入力決定部は、
前記ばらつきを示す統計値が小さい場合には値が大きくなり、前記ばらつきを示す統計値が大きい場合には値が小さくなる補正項を算出すると共に、前記算出された補正項と前記制御入力の集合に関する代表値を乗算することで、前記制御入力を決定する、付記3又は4に記載の遠隔制御装置。
[付記6]
前記制御入力決定部は、前記算出された制御入力の集合に関する代表値として、平均値、中央値及び最頻値のうちいずれか1つを算出する、付記3乃至5のいずれか一に記載の遠隔制御装置。
[付記7]
前記到着パターン生成部は、
待ち行列モデルを用いたモンテカルロシミュレーションにより前記到着パターンを生成する、付記1乃至6のいずれか一に記載の遠隔制御装置。
[付記8]
前記到着パターン生成部は、
前記待ち行列を用いたモンテカルロシミュレーションを繰り返すことで、前記複数の到着パターンを生成する、付記7に記載の遠隔制御装置。
[付記9]
前記到着パターン生成部は、
前記制御入力が待ち行列のキューに到着した段階でサービス時間を割り当てる、付記7又は8に記載の遠隔制御装置。
[付記10]
前記待ち行列モデルは、D/G/1待ち行列モデルである、付記7乃至9のいずれか一に記載の遠隔制御装置。
[付記11]
上述の第2の視点に係る遠隔制御方法のとおりである。
[付記12]
上述の第3の視点に係るプログラムのとおりである。
なお、付記11の形態及び付記12の形態は、付記1の形態と同様に、付記2の形態〜付記10の形態に展開することが可能である。
なお、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の全開示の枠内において種々の開示要素(各請求項の各要素、各実施形態ないし実施例の各要素、各図面の各要素等を含む)の多様な組み合わせ、ないし、選択(部分的削除を含む)が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。特に、本書に記載した数値範囲については、当該範囲内に含まれる任意の数値ないし小範囲が、別段の記載のない場合でも具体的に記載されているものと解釈されるべきである。
10、100 遠隔制御装置
11 CPU(Central Processing Unit)
12 メモリ
13 入出力インターフェイス
14 NIC(Network Interface Card)
20 制御対象
30 通信ネットワーク
101、203 遅延計測部
102 確率分布生成部
103 到着パターン生成部
104、206 状態予測部
105 集合算出部
106、208 制御入力決定部
201、303 送信部
202、301 受信部
204 遅延確率分布生成部
205 制御入力到着パターン生成部
207 制御入力集合算出部
302 制御部

Claims (12)

  1. 制御入力の送信時刻と制御対象から送信された状態の受信時刻に基づき通信ネットワークにおける通信遅延を計測する、遅延計測部と、
    前記計測された通信遅延の履歴から前記通信ネットワークにおける通信遅延の確率分布を生成する、確率分布生成部と、
    前記通信遅延の確率分布に基づき、送信済み又は送信予定の制御入力が前記制御対象に到着する時刻を要素とする、複数の到着パターンを生成する、到着パターン生成部と、
    前記生成された複数の到着パターンそれぞれについて、送信予定の制御入力の到着時刻における前記制御対象の状態を予測する、状態予測部と、
    前記予測された複数の状態それぞれに対応する、複数の制御入力を算出することで制御入力の集合を算出する、集合算出部と、
    前記算出された制御入力の集合に対する統計処理の結果に基づき、前記制御対象に出力する制御入力を決定する、制御入力決定部と、
    を備える、遠隔制御装置。
  2. 前記集合算出部は、
    前記予測された複数の状態それぞれについて、前記予測された制御対象の状態をフィードバックした制御入力を複数算出することで前記制御入力の集合を算出する、請求項1に記載の遠隔制御装置。
  3. 前記制御入力決定部は、
    前記算出された制御入力の集合に含まれる要素のばらつきを示す統計値と、前記算出された制御入力の集合に関する代表値と、に基づき前記制御対象に出力する制御入力を決定する、請求項1又は2に記載の遠隔制御装置。
  4. 前記制御入力決定部は、
    前記制御入力の集合に関する代表値に比例し、前記ばらつきを示す統計値に対して単調減少な関数を用いて、前記制御入力を決定する請求項3に記載の遠隔制御装置。
  5. 前記制御入力決定部は、
    前記ばらつきを示す統計値が小さい場合には値が大きくなり、前記ばらつきを示す統計値が大きい場合には値が小さくなる補正項を算出すると共に、前記算出された補正項と前記制御入力の集合に関する代表値を乗算することで、前記制御入力を決定する、請求項3又は4に記載の遠隔制御装置。
  6. 前記制御入力決定部は、前記算出された制御入力の集合に関する代表値として、平均値、中央値及び最頻値のうちいずれか1つを算出する、請求項3乃至5のいずれか一項に記載の遠隔制御装置。
  7. 前記到着パターン生成部は、
    待ち行列モデルを用いたモンテカルロシミュレーションにより前記到着パターンを生成する、請求項1乃至6のいずれか一項に記載の遠隔制御装置。
  8. 前記到着パターン生成部は、
    前記待ち行列を用いたモンテカルロシミュレーションを繰り返すことで、前記複数の到着パターンを生成する、請求項7に記載の遠隔制御装置。
  9. 前記到着パターン生成部は、
    前記制御入力が待ち行列のキューに到着した段階でサービス時間を割り当てる、請求項7又は8に記載の遠隔制御装置。
  10. 前記待ち行列モデルは、D/G/1待ち行列モデルである、請求項7乃至9のいずれか一項に記載の遠隔制御装置。
  11. 制御対象を通信ネットワークを介して制御する遠隔制御装置において、
    制御入力の送信時刻と制御対象から送信された状態の受信時刻に基づき前記通信ネットワークにおける通信遅延を計測し、
    前記計測された通信遅延の履歴から前記通信ネットワークにおける通信遅延の確率分布を生成し、
    前記通信遅延の確率分布に基づき、送信済み又は送信予定の制御入力が前記制御対象に到着する時刻を要素とする、複数の到着パターンを生成し、
    前記生成された複数の到着パターンそれぞれについて、送信予定の制御入力の到着時刻における前記制御対象の状態を予測し、
    前記予測された複数の状態それぞれに対応する、複数の制御入力を算出することで制御入力の集合を算出し、
    前記算出された制御入力の集合に対する統計処理の結果に基づき、前記制御対象に出力する制御入力を決定する、ことを含む遠隔制御方法。
  12. 制御対象を通信ネットワークを介して制御する遠隔制御装置に搭載されたコンピュータに、
    制御入力の送信時刻と制御対象から送信された状態の受信時刻に基づき前記通信ネットワークにおける通信遅延を計測する処理と、
    前記計測された通信遅延の履歴から前記通信ネットワークにおける通信遅延の確率分布を生成する処理と、
    前記通信遅延の確率分布に基づき、送信済み又は送信予定の制御入力が前記制御対象に到着する時刻を要素とする、複数の到着パターンを生成する処理と、
    前記生成された複数の到着パターンそれぞれについて、送信予定の制御入力の到着時刻における前記制御対象の状態を予測する処理と、
    前記予測された複数の状態それぞれに対応する、複数の制御入力を算出することで制御入力の集合を算出する処理と、
    前記算出された制御入力の集合に対する統計処理の結果に基づき、前記制御対象に出力する制御入力を決定する処理と、
    を実行させるプログラムを記録した非一時的なコンピュータ可読型記憶媒体。
JP2020527630A 2018-06-28 2019-06-27 遠隔制御装置、遠隔制御方法及びプログラム Active JP7006791B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018123230 2018-06-28
JP2018123230 2018-06-28
PCT/JP2019/025587 WO2020004546A1 (ja) 2018-06-28 2019-06-27 遠隔制御装置、遠隔制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2020004546A1 true JPWO2020004546A1 (ja) 2021-07-08
JP7006791B2 JP7006791B2 (ja) 2022-01-24

Family

ID=68985474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020527630A Active JP7006791B2 (ja) 2018-06-28 2019-06-27 遠隔制御装置、遠隔制御方法及びプログラム

Country Status (3)

Country Link
US (1) US11856345B2 (ja)
JP (1) JP7006791B2 (ja)
WO (1) WO2020004546A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021210133A1 (ja) * 2020-04-16 2021-10-21 日本電信電話株式会社 制御装置、制御方法、及びプログラム
JPWO2023275944A1 (ja) * 2021-06-28 2023-01-05

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3269792B2 (ja) * 1997-08-20 2002-04-02 株式会社東芝 非同期ネットワーク型制御システム、このシステムにおけるプロセス管理方法およびプロセス管理プログラムを記録した記録媒体
WO2004098225A1 (ja) * 2003-04-25 2004-11-11 Fujitsu Limited 複数の受信装置の中から選択した受信装置のデータを共有チャネルに割り当てる送信装置およびデータの割り当て方法
WO2013012583A1 (en) * 2011-07-19 2013-01-24 Smartsignal Corporation Method of sequential kernel regression modeling for forecasting and prognostics

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4955237B2 (ja) 2005-08-12 2012-06-20 Sumco Techxiv株式会社 無駄時間をもつ時変系制御対象のための制御システム及び方法
JP5565431B2 (ja) 2012-04-18 2014-08-06 横河電機株式会社 制御装置及び制御システム
JP2016215357A (ja) 2015-05-26 2016-12-22 国立大学法人 名古屋工業大学 パラメータ推定装置、パラメータ推定方法、プログラム及び制御装置
JP7120014B2 (ja) 2016-08-17 2022-08-17 日本電気株式会社 遠隔制御装置、遅延調整装置、遠隔制御システム、遠隔制御方法、遅延調整方法、遠隔制御プログラムおよび遅延調整プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3269792B2 (ja) * 1997-08-20 2002-04-02 株式会社東芝 非同期ネットワーク型制御システム、このシステムにおけるプロセス管理方法およびプロセス管理プログラムを記録した記録媒体
WO2004098225A1 (ja) * 2003-04-25 2004-11-11 Fujitsu Limited 複数の受信装置の中から選択した受信装置のデータを共有チャネルに割り当てる送信装置およびデータの割り当て方法
WO2013012583A1 (en) * 2011-07-19 2013-01-24 Smartsignal Corporation Method of sequential kernel regression modeling for forecasting and prognostics

Also Published As

Publication number Publication date
WO2020004546A1 (ja) 2020-01-02
US20210274271A1 (en) 2021-09-02
US11856345B2 (en) 2023-12-26
JP7006791B2 (ja) 2022-01-24

Similar Documents

Publication Publication Date Title
CN110235148B (zh) 训练动作选择神经网络
KR20190069582A (ko) 보조 작업들을 통한 강화 학습
JP7006791B2 (ja) 遠隔制御装置、遠隔制御方法及びプログラム
US20180218262A1 (en) Control device and control method
Tian et al. Predictive compensation for variable network delays and packet losses in networked control systems
JP7120014B2 (ja) 遠隔制御装置、遅延調整装置、遠隔制御システム、遠隔制御方法、遅延調整方法、遠隔制御プログラムおよび遅延調整プログラム
KR101242678B1 (ko) 제어 파라미터를 적응적으로 변화시키는 pid 제어 방법 및 이를 이용한 pid 제어 장치
JP5463945B2 (ja) 飛行体順序付けシステム、飛行体順序付け方法および飛行体順序付けプログラム
US20230076192A1 (en) Learning machine learning incentives by gradient descent for agent cooperation in a distributed multi-agent system
CN111669727B (zh) 利用移动出行代理管理车辆
JP6718834B2 (ja) 学習システムおよび学習方法
JP2020144483A (ja) 強化学習方法、強化学習プログラム、および強化学習システム
Marami et al. Implementation of MPC as an AQM controller
WO2018150798A1 (ja) モデル推定システム、方法およびプログラム
US11363120B2 (en) Method for running an application on a distributed system architecture
EP2731302B1 (en) Parameter estimating device, parameter estimating method, and parameter estimating program
JP2020144484A (ja) 強化学習方法、強化学習プログラム、および強化学習システム
WO2021064858A1 (ja) 通信速度予測装置、通信速度予測方法及び記録媒体
Hartman Networked control system co-simulation for co-design: Theory and experiments
WO2021064766A1 (ja) 制御装置、方法及びシステム
JP6984597B2 (ja) 線形パラメータ変動モデル推定システム、方法およびプログラム
Hazarika et al. Hybrid machine learning approach for resource allocation of digital twin in UAV-aided internet-of-vehicles networks
CN114861318A (zh) 自动驾驶控制参数模型的训练方法、参数获取方法和装置
CN114153174A (zh) 主从式控制系统的控制方法以及装置、存储介质
Rosenthal et al. A control approach for cooperative sharing of network resources in cyber-physical systems

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201225

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211220