JP7084582B2 - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP7084582B2 JP7084582B2 JP2021003301A JP2021003301A JP7084582B2 JP 7084582 B2 JP7084582 B2 JP 7084582B2 JP 2021003301 A JP2021003301 A JP 2021003301A JP 2021003301 A JP2021003301 A JP 2021003301A JP 7084582 B2 JP7084582 B2 JP 7084582B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- tree structure
- input data
- data
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Testing And Monitoring For Control Systems (AREA)
Description
(1)シミュレータの構成プロセスの自動化ができない。
(2)測定データが順次得られる場合において、それぞれの測定データを逐次的に解析し、シミュレータを逐次的に改善することができない。
(3)計算量が多く、シミュレータに高い付加価値が望めない。
(4)シミュレータが要求するメモリ容量と計算速度及び精度のバランスを、シミュレータの使用環境に応じて速やかに調整できない。
対象システムから状態データ及び状態遷移速度データを取得する状態データ取得手段と、木構造管理手段と、ノードデータ管理手段と、を含み、
木構造管理手段は木構造データを備え、木構造データは階層型の格子構造を有しており、
ノードデータ管理手段はノードデータを備え、
上記状態データ取得手段に入力された上記対象システムの状態及び/又は状態遷移速度に関するデータを、上記木構造管理手段及びノードデータ管理手段に入力し、
上記状態及び/又は状態遷移速度の関係性を上記木構造データ及びノードデータに基づいて関数により近似することで対象システムの状態及び/又は状態遷移速度を学習し、
上記学習により上記状態及び/又は状態遷移速度を予測し、
該状態及び/又は状態遷移速度の予測値を出力することを特徴とする。
ノードと対応づけられた関数を、ノードが登録された木構造上の深さに応じて対象システムの異なる状態及び/又は状態遷移速度の範囲と対応づけて記録し、
ノードに対応づけられた状態及び/又は状態遷移速度の範囲について、木構造上の深さが浅い位置に対応づけられたノードの範囲に木構造上の深さが深い位置に対応づけられたノードの範囲が内包され、
学習の際には、入力された状態及び/又は状態遷移速度を範囲と照合し、状態及び/又は状態遷移速度が該範囲と一致するノードについて関数を更新するようにしてもよい。
ノードに対応づけられた関数は、好ましくは、状態及び/又は状態遷移速度により構成されるベクトルの平均により構成されてもよい。
状態の入力を受け取り、状態遷移速度を予測してもよい。
対象システムが力学系システムであり、力学系システムに対する制御入力を計算する制御入力計算手段を備えており、木構造管理手段及びノードデータ管理手段を用いて、力学系システムの軌道を学習して予測するようにしてもよい。
図1は、本発明の情報処理装置1を説明するブロック図である。
情報処理装置1は、対象システム2からの状態データ及び/又は状態遷移速度データを取得する状態データ取得手段3と、木構造管理手段5と、ノードデータ管理手段7とからなる木構造4と、を含んで構成されている。
なお、本発明では、情報処理装置1が、力学系の木構造4である場合には、木構造4を力学系の木構造4とも呼ぶ。
図2は、図1に示す情報処理装置1の具体的構成を情報処理装置20として示すブロック図である。
図2に示すように、本発明の情報処理装置20は、中央演算装置(CPU)21と、センサー22と、インターフェース(I/O)23、24と、記憶装置25と、読み出し専用メモリ(ROM)26と、ランダムアクセスメモリ(RAM)27と、を含んで構成されている。本発明の情報処理装置20は、パーソナルコンピュータ(PC)を含んで構成してもよい。さらに小型化のために、CPU21の代わりにマイクロプロッセッサ(Mプ)やマイクロコントローラ(マイコン)等により構成してもよい。
図3は、N階層2次元2分木の木構造管理手段5を模式的に示し、(a)が木構造4、(b)が各階層の状態空間を示す図である。
1階層目の葉ノードは右の状態空間の各領域に対応している。葉ノードは、後述する図7に示すように最外側のノード12である。
木構造管理手段5は、木構造4を用いた階層型学習器であり、根(root)11となるノードがn次元状態空間を表現していると考え、根11から葉の方へn次元(副層)のd分木を形成している。これにより、葉のノードを、根11の状態空間をdn個に分割した各状態空間に一対一に対応させている。
図4は、本発明の木構造4の初期化のフロー図である。図4に示すように、ステップST1において、木構造4の初期化を行い、次のステップST2において、データの学習を行う。
ステップST11において、木構造管理手段5の状態データと状態遷移速度データの次元数を初期化する。
ステップST12において、木構造管理手段5が扱う状態と状態遷移ベクトルの要素毎の最大値と最小値を初期化する。
ステップST13において、木構造管理手段5が扱う状態空間の各軸の分割数を初期化する。
ステップST14において、根11のノード(根ノードとも呼ぶ)を初期化し、そのアドレスを根ノード11のアドレスに登録する。
上記ステップにより、木構造管理手段5の初期化が終了する。
ステップST21において、状態とその状態における状態遷移ベクトルとを、木構造4に与える。具体的には、状態データ取得手段3により対象システム2の状態及び状態遷移速度データを取得する。
具体的には、木構造管理手段5により、木構造データ6内の根ノード11のアドレスを特定し、ノードデータ管理手段7を用いて根ノード11の情報を読み込む。処理中ノードを根ノード11とする。
具体的には、処理中ノードの葉側ノード12に、ステップST21で取得した状態データを内包する分割領域を持つものがあるか否かを調べる。
ステップST28において、作成したノード12に移動し、ステップST23に戻る。
図7(a)~(e)に示すように、図中の8つのノード12(全ノード)は上述した通り、状態遷移ベクトルを保持しており、根11のノードでは2つの状態データの状態遷移ベクトルの加算値を保持することになる。
次に、本発明の情報処理装置1又は20における予測について説明する。
予測とは、上記の学習により状態及び/又は状態遷移速度を予測することである。
図8は、予測の基本フロー図である。
ステップST31において、状態データ取得手段3により対象システム2の状態及び状態遷移速度データを取得する。
ステップST32において、状態遷移速度の予測をする。
ステップST33において、状態遷移速度の予測値9(図1参照)を出力する。
予測を行う際には、状態及び状態遷移速度に関するデータが、木構造管理手段5及びノードデータ管理手段7に入力され、状態及び/又は状態遷移速度が木構造データ6及びノードデータ8により学習される。この学習により状態遷移速度が予測され、状態遷移速度の予測値9が出力される。予測を行う際には、対象システム2の状態の入力を受け取り、状態遷移速度を予測してもよい。
図9に示すように、ステップST41において、状態遷移ベクトルを得たい状態を、木構造4に与える。具体的には、ステップST41では、状態データを取得する。
具体的には、木構造管理手段5により、木構造データ6内の根11のノードのアドレスを特定し、ノードデータ管理手段7を用いて根ノード11の情報を読み込む。処理中のノードを根ノード11とする。
ステップST44において、探索する状態に対応するノード12を、1副階層分探索して、ステップST45に進む。
ノードデータ管理手段7を用いて処理中のノード12のノードデータ8から、状態遷移速度ベクトル数と、状態遷移速度ベクトルの総加算値を読み込む。
次に、状態遷移速度ベクトルの総加算値を状態遷移速度ベクトル数で割ることにより、状態遷移速度の予測値9を作成して、予測値9を出力する。
図10(a)に示すように、状態空間は木構造4の第1主階層に相当するノード12の情報により4分割される。木構造4の各ノード12は、これらの各領域と対応することになる。
ここで、A点に相当する状態が入力され、これに対する状態遷移速度ベクトルの予測を行う場合、木構造4は、図10(b)の網掛けの領域に相当するノード12が記憶した状態遷移速度ベクトルの平均を用いて予測を行う。
B点については近い学習データが無いが、第1主階層で同じ格子にある学習データ群の平均を用いることで、大凡、つまり粗い予測を得ることができる。この状態を「広い汎化」と呼ぶ。このように、データが得られていない状態に対し、学習データが得られている状態つまり、状態遷移ベクトルの対から、状態遷移ベクトルの予測を行うことを汎化と言う。
図11(a)~(d)の順に階層数が深くなっており、階層数が深くなるほど学習データ(状態遷移ベクトル)が存在しない部分が存在する。データがない領域(図中の網掛け領域)では1階層上の領域が保持する状態遷移ベクトルを用いて予測することを示している。
振り子の挙動である単振動の式よりランダムにデータを求め、6階層2次元3分割の力学系の木構造4で学習させた。単振動は単純振り子の動作を表したものであり、位置と速度の次元空間においてその挙動は円を描くものとなる。
振り子の挙動を学習済みの木構造4に初期状態(x, dx/dt)=(0.1、0)を与えて推定した状態遷移速度ベクトルからの加速度を求め、加速度の積分により速度と、速度の積分により位置を求めた。
図12(a)から明らかなように、100回の学習では学習数が少ないために、木構造4の上層データを用いるため予測が正確ではないことが分かる。
一方、図12(b)から明らかなように、5000回の学習では、学習数の増加により単振動の動作予測をより正確に行うことができていることが分かる。これにより、図12の結果から学習数の増加により単振動の挙動を関数近似できていると言える。
力学系学習による自動車や飛行機、船舶の制御への適用について説明する。
自動車や飛行機、船舶などの力学系に従ったシステムに働く加速度aは、無動力無外乱加速度a0、制御入力による加速度at、波の影響を含めた外乱による加速度awの三つに分類でき、船舶の加速度aは、下記(1)式で表せる。また、(1)式より外乱による加速度awを求めるための(2)式が得られる。
aw=a-a0-at (2)
ここで、aは船舶の加速度、a0は無波無動力時加速度、atは制御入力による加速度、awは波の影響を含めた外乱による加速度である。
(1)式より、システムの加速度a、制御入力による加速度at、無動力無外乱加速度a0を求められれば外乱による加速度aw推定できることが分かる。
(2)式より、船舶の加速度a、制御入力による加速度at、無波無動力時加速度a0を求められれば外乱による加速度awが推定できることが分かる。
力学系システムが船舶の場合、a0は水面から船体に働く抗力による加速度を含み、船体形状によっても異なるため、その力学的挙動を数式で表現することは困難である。
図13に示すように、情報処理装置においては、力学系の木構造4により、波の影響を考慮しない目標加速度a1と、波の影響による加速度の予測値a2が、加算器に入力され、目標加速度が、スラスター指令値変換手段により、スラスター指令値に変換されて、小型船舶のスラスター指令値を得る。
目標加速度a*は、下記(3)式で与えられる。
a*=a1-a2 (3)
図14に示すように、情報処理装置40は、図示しない力学系の木構造4と、位置及び速度取得手段41と、角速度検出器42と、第1の微分器43と、第2の微分器44と、加速度予測器45と、減算器46と、図13で説明したスラスター指令値変換手段48と、スラスター指令値を用いて加速度に変換するデータベース50等を含んで構成されている。
画像取得手段41により取得された画像を処理して得られた加速度及びジャイロスコープ42により取得された角速度を処理して得られた角加速度、つまり、a=(dx/dt2, dy/dt2, dθ/dt2)が、減算器46に入力される。
力学系の木構造4で予測された無波無動力時加速度a3が、減算器46に入力される。
スラスター入力指令値が、データベースBを介してスラスターによる加速度aTに変換され、減算器46に入力される。
aw=a-a3-aT (4)
同様に、気球、ロボット、自動車といった力学系によって動作が記述できるシステム全般に対して高速シミュレータを構成し、システムに働く外乱を推定することができる。力学系の複雑さに応じて、測定データの量を増やす必要があり、船体挙動のシミュレータを構成する際には、約2時間分の実機データを測定した。
実験機を用いて無波無動力時加速度を測定し力学系の木構造4に学習させ、学習済みの力学系の木構造4を用いてa0の推定を行う。また、木構造4より推定したa0を適用した(2)式から外乱による加速度の推定を行う。
図17に示すように、実験機60は、図14に示す構成要素を備えて構成されており、スラスター62と、水底の画像を取得するカメラ等のセンサー41と、ジャイロスコープ42と第1の微分器43と第2の微分器44及び減算器46等からなる電子回路と、マイコン64等を備えて構成されている。スラスター62は、モータとモータに接続されるスクリュー等から構成されている。マイコン64と情報処理装置40とは、図示しない通信線により接続されている。このスラスター62を動かすことで様々な速度状態を作り、実験機60の水槽上の位置データを収集した。位置データは、実験機60の上に配設したモーションキャプチャ(株式会社ノビテック製、VENUS3D)を用いて収集した。
図18に示すように、実験機60の中心を、黒丸(●)で示し、実験機60の向きは矢印(↑)で示す方向である。実験機60の5点のマーカー位置(白丸印(○))を、モーションキャプチャを用いて33Hzで測定した。中心(x,y)の位置データを得、位置データを時間で微分して速度を求め、速度を時間で微分して加速度を求めた。
図19に示すように、実験機60の向きは、実験機の初期位置を0度とした角度を、船体中心軸ベクトルの内積と外積から求めた上で、角速度、角加速度も求めた。
さらに、推定したa0を適用した(1)式からスラスター62による加速度を外乱として推定した(at=a-a0, aw=0)。
CPU:Core i5-3340M(2.7GHz×2)
オペレーティングシステム(OS):Windows(登録商標) 8(64bit)
ランダムアクセスメモリ(RAM):4GB
図20から明らかなように、約8秒間迄は、実機の動作と予測とが一致していることが分かる。実際の制御においては学習データ数を33Hzからさらに1Hz毎の制御をすることにより、十分な予測ができると推定できる。
図21(b)から明らかなように、外乱による水槽上のx軸の加速度atが推定できていることが分かる。図21では外乱付加時に、x軸における外乱atが推定できており、水槽上のx軸、回転の加速度(角加速度)においても同様の結果を得られていることから、外乱の推定が可能であることが分かった。
2:対象システム
3:状態データ取得手段
4:木構造
5:木構造管理手段
6:木構造データ
7:ノードデータ管理手段
8:ノードデータ
9:予測値
11:根
12:ノード
21:CPU
22:センサー
23,24:インターフェース
25:記憶装置
26:読み出し専用メモリ
27:ランダムアクセスメモリ
28:入力装置
29:ディスプレイ
40:情報処理装置
41:位置及び速度取得手段
42:角速度検出器
43:第1の微分器
44:第2の微分器
45:加速度予測器
46:減算器
48:スラスター指令値変換手段
50:スラスター指令値を用いて加速度に変換するデータベース
60:実験機
62:スラスター
64:マイコン
Claims (6)
- 階層的に分割された状態空間へとそれぞれ対応付けられた複数のノードを階層的に配置することにより構成された木構造を構成する各ノードへと、入力データと前記入力データに対応する学習対象データを対応付けて得られた学習済モデルを利用した情報処理装置であって、
予測対象入力データを取得する予測対象入力データ取得部と、
前記予測対象入力データに基づいて、前記木構造の基端から末端へと至る経路ノードを特定する、経路ノード特定部と、
前記経路ノード上の一のノードに対応する前記状態空間に包含される前記入力データに対応する前記学習対象データと、当該ノードに対応付けられた関数に基づいて予測値を生成する、予測値生成部と、を備える情報処理装置。 - 前記関数は、基底関数を含む、請求項1に記載の情報処理装置。
- 前記関数は、前記学習対象データの相加平均をとる関数である、請求項1に記載の情報処理装置。
- 階層的に分割された状態空間へとそれぞれ対応付けられた複数のノードを階層的に配置することにより構成された木構造を構成する各ノードへと、入力データと前記入力データに対応する学習対象データを対応付けて得られた学習済モデルを利用した情報処理システムであって、
予測対象入力データを取得する予測対象入力データ取得部と、
前記予測対象入力データに基づいて、前記木構造の基端から末端へと至る経路ノードを特定する、経路ノード特定部と、
前記経路ノード上の一のノードに対応する前記状態空間に包含される前記入力データに対応する前記学習対象データと、当該ノードに対応付けられた関数に基づいて予測値を生成する、予測値生成部と、を備える情報処理システム。 - 階層的に分割された状態空間へとそれぞれ対応付けられた複数のノードを階層的に配置することにより構成された木構造を構成する各ノードへと、入力データと前記入力データに対応する学習対象データを対応付けて得られた学習済モデルを利用した情報処理方法であって、
予測対象入力データを取得する予測対象入力データ取得ステップと、
前記予測対象入力データに基づいて、前記木構造の基端から末端へと至る経路ノードを特定する、経路ノード特定ステップと、
前記経路ノード上の一のノードに対応する前記状態空間に包含される前記入力データに対応する前記学習対象データと、当該ノードに対応付けられた関数に基づいて予測値を生成する、予測値生成ステップと、を備える情報処理方法。 - 階層的に分割された状態空間へとそれぞれ対応付けられた複数のノードを階層的に配置することにより構成された木構造を構成する各ノードへと、入力データと前記入力データに対応する学習対象データを対応付けて得られた学習済モデルを利用した情報処理プログラムであって、
予測対象入力データを取得する予測対象入力データ取得ステップと、
前記予測対象入力データに基づいて、前記木構造の基端から末端へと至る経路ノードを特定する、経路ノード特定ステップと、
前記経路ノード上の一のノードに対応する前記状態空間に包含される前記入力データに対応する前記学習対象データと、当該ノードに対応付けられた関数に基づいて予測値を生成する、予測値生成ステップと、を備える情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021003301A JP7084582B2 (ja) | 2021-01-13 | 2021-01-13 | 情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021003301A JP7084582B2 (ja) | 2021-01-13 | 2021-01-13 | 情報処理装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019102835A Division JP6831523B2 (ja) | 2019-05-31 | 2019-05-31 | 情報処理装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021064404A JP2021064404A (ja) | 2021-04-22 |
JP2021064404A5 JP2021064404A5 (ja) | 2021-06-10 |
JP7084582B2 true JP7084582B2 (ja) | 2022-06-15 |
Family
ID=75488080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021003301A Active JP7084582B2 (ja) | 2021-01-13 | 2021-01-13 | 情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7084582B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000259719A (ja) | 1999-03-08 | 2000-09-22 | Internatl Business Mach Corp <Ibm> | 債務不履行の確率を計算する方法及び装置 |
-
2021
- 2021-01-13 JP JP2021003301A patent/JP7084582B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000259719A (ja) | 1999-03-08 | 2000-09-22 | Internatl Business Mach Corp <Ibm> | 債務不履行の確率を計算する方法及び装置 |
Non-Patent Citations (2)
Title |
---|
中村 恭之 外1名,「空間分割を用いた識別と非線形写像の学習」,情報処理,社団法人情報処理学会,2005年09月15日,第46巻, 第9号,pp.1030-1038 |
加藤 芳秀 外2名,「多次元科学データに対する効率的な問合せのための階層的集約構造」,第3回データ工学と情報マネジメントに関するフォーラム 論文集 [online],電子情報通信学会データ工学専門委員会,2011年07月27日,[2011年8月4日検索],インターネット<URL:http://db-event.jpn.org/deim2011/proceedings/pdf/d6-5.pdf> |
Also Published As
Publication number | Publication date |
---|---|
JP2021064404A (ja) | 2021-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6547171B2 (ja) | 情報処理装置 | |
Mansouri et al. | Cooperative coverage path planning for visual inspection | |
JP6372046B2 (ja) | 外乱加速度の推定方法、船体の自動制御方法及び外乱加速度の推定装置並びに外乱加速度の推定用コンピュータプログラム | |
CN112612290B (zh) | 一种考虑洋流的水下航行器三维多任务路径规划方法 | |
CN110488818A (zh) | 一种基于激光雷达的机器人定位方法、装置和机器人 | |
CN112529963A (zh) | 一种楼梯检测方法、装置及移动机器人 | |
JP2020126617A (ja) | フォールトトレランス及びフラクチュエーションロバスト性のための複数のニューラルネットワークを使用して揺れるカメラにより生成されたビデオからジッタリングを取り除くための学習方法及び学習装置、そしてそれを利用したテスト方法及びテスト装置 | |
CN113238666A (zh) | 基于麻雀搜索算法优化的gru的船舶运动姿态的预测方法 | |
CN115860107B (zh) | 一种基于多智能体深度强化学习的多机探寻方法及系统 | |
JP6831523B2 (ja) | 情報処理装置 | |
CN114692520B (zh) | 一种面向多场景的无人艇虚拟仿真测试平台及测试方法 | |
CN113110455A (zh) | 一种未知初始状态的多机器人协同探索方法、装置及系统 | |
Karapetyan et al. | Human diver-inspired visual navigation: Towards coverage path planning of shipwrecks | |
JP7084582B2 (ja) | 情報処理装置 | |
CN113064422B (zh) | 基于双神经网络强化学习的自主水下航行器路径规划方法 | |
CN114792028A (zh) | 基于物理的高性能仿生水下机器人仿真训练平台构建方法 | |
CN112307685B (zh) | 水声传感网中基于高斯混合模型的流体运动边界预测方法 | |
CN114840928B (zh) | 一种基于深度学习的水下航行器集群运动仿真方法 | |
Zang et al. | Research on constraining strategies of underwater glider's trajectory under the influence of ocean currents based on dqn algorithm | |
My et al. | An Artificial Neural Networks (ANN) Approach for 3 Degrees of Freedom Motion Controlling | |
CN114995468B (zh) | 一种基于贝叶斯深度强化学习的水下机器人智能控制方法 | |
CN116466701A (zh) | 一种无人水面艇能耗最小轨迹规划方法 | |
CN116009583A (zh) | 基于纯粹视觉的分布式无人机协同运动控制方法和装置 | |
CN115303455A (zh) | 水下仿生机器人运动控制方法、装置、设备及存储介质 | |
Mellone et al. | A containerized distributed processing platform for autonomous surface vehicles: Preliminary results for marine litter detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20210113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210331 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220427 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220525 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7084582 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |