JP7007664B2 - 操作方法生成システム - Google Patents
操作方法生成システム Download PDFInfo
- Publication number
- JP7007664B2 JP7007664B2 JP2017174241A JP2017174241A JP7007664B2 JP 7007664 B2 JP7007664 B2 JP 7007664B2 JP 2017174241 A JP2017174241 A JP 2017174241A JP 2017174241 A JP2017174241 A JP 2017174241A JP 7007664 B2 JP7007664 B2 JP 7007664B2
- Authority
- JP
- Japan
- Prior art keywords
- state
- network
- generation system
- target
- operation method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Description
対象となる布が取り得る安定した状態を表したものである。安定した状態とは、外部からの操作がないときに、持続する状態のことをいう。例えば、対象の布が宙に浮いた状態は、安定した状態とは言えない。一方、重力に従って布が落ちた後の状態は、安定した状態である。
平面上の座標[-1,1]からのベクトル3つの組み合わせで、対象に対する操作を表現する。3つのベクトルのうち、2つは対象となる布をつかむ位置であり、残る1つのベクトルは前記つかんだ布の移動を表している。ここで、つかむ位置は2つのベクトルで表現されているが、これらは3つ目のベクトルに従って、同じ方向に同じ距離だけ移動する。本実施では、1または複数の操作を組み合わせて、対象を目標状態へ遷移させる。
本実施形態における操作方法生成システムの一形態について、構成(アーキテクチャ)を図2に示す。このシステムは、三次元畳み込み自己符号化器と、再帰的全結合ネットワークとの組み合わせから構成される。全結合ネットワークでは、あらかじめ対象に対する操作がトレーニングされている。
畳み込み層として使用される自己符号化器は、エンコーダ(符号化部)とデコーダ(復号化部)の2つの構成部分に分割される。エンコーダとデコーダとの間に、反復した全結合ネットワークのインスタンスの可変数を挟む。
対象物である布が平らな面に置かれている。本発明において、ネットワークへの入力はボクセル空間形式で表される。計算上の制約のために、ボクセル空間を大量の物理空間にまで拡張することは困難である。布対象物をいかなる可能な形状に合わせるためにボクセル空間が拡張しうる最小限の物理空間を計算することは可能であるが、実用上は、ボクセル空間内で(前記面と平行な座標軸上で)周期的境界条件を導入することで対応することが望ましい。この場合、自己符号化器における畳み込み演算に、周期性が導入されている必要がある。畳み込みニューラルネットワークにおいては一般に、各畳み込み層においてピクセルの縁が失われるのを避けるためにマップはしばしばゼロで埋められる(zero-padding)。本実施形態では、ゼロではなくマップの反対側の(XとYの両方の次元)の値を使う。これにより、結果的に周期的な空間で畳み込みを行うのと同じ状態を実現する。
全結合ネットワークでは、畳み込み層でエンコードされた対象に対し、操作後の状態を計算し、出力する。この構造は複雑で、ResNetと似た構造により実現される。全結合ネットワークを含むシステムの構成例を図3に示す。
1.開始状態(sa)が入力される。ここでは対象の例を布として、データはボクセルデータとして入力される。
2.エンコーダにより、開始状態saがエンコードされる。
3.エンコードされた状態sa’が、全結合ネットワークに渡される。
4.ステップ3.において、併せて全結合ネットワークに単一操作m0が入力される。
5.全結合ネットワークがsa’とm0に基づいて、エンコードされた処理後状態sb’を算出する。
6.デコードにより、エンコードされた操作後状態sb’から、操作後状態のボクセル表現sbを算出する。
以上がネットワークの動作に基づき状態を演算および出力する手順となる。前記演算が複数回行われ、一連の演算手順となる場合には、ステップ3.から5.の処理が繰り返される。この際には、2回目以降の処理に係る全結合ネットワークは、前回処理時の出力内容を状態sa’として入力され、新たな処理m1..nの入力とで演算処理をすることとなる。
f(sa,m)=sb (1)
本発明のように、操作方法について求める場合には、上記とは異なり、開始状態と目標状態を入力し、操作を演算、出力する必要がある。
f(sa,sb)=m (2)
こうして操作方法を求める場合には、上記のような順方向伝搬処理より、誤差逆伝搬処理や、もしくは遺伝的アルゴリズムが好適に適用可能である。
全結合ネットワークを介したフォワードプロパゲーション(順方向伝搬)により、対象の任意の状態において、任意の操作mを適用したときの状態の予測が可能である。操作方法生成のためには、開始状態saと目標状態sbを与え操作手順mabを得る必要がある。これはバックプロパゲーション(誤差逆伝搬)によって実現することができる。誤差逆伝搬によって、操作手順生成を行う概念を図4に示す。この誤差逆伝搬のプロセスは、ネットワークをトレーニングするための誤差逆伝搬プロセスとは異なる。誤差逆伝搬による操作手順生成のプロセスは、次に示すとおりである。
1.mabのランダム操作手順を生成する([-1,1]の間隔のすべての値)。
2.状態saおよび操作手順mabをネットワークに送り、順方向伝播を実行して予測結果状態spを得る。
3.sbを参照しながらspの損失を計算する。
4.誤差逆伝搬を実行して、前記損失を参照しながら操作入力値の変化傾向を取得する。この損失を減らすようにmabを調整する。
5.ステップ2~4を繰り返して、繰り返し回数を実行する。
ネットワークから操作手順を得る別の方法は、遺伝的アルゴリズム(GA)によるものである。ここでも、入力値の集合を探査する。GAによる操作生成の概念を図5に示す。ここでも10回の探査を並行して実行するが、今回は誤差逆伝搬プロセスの代わりに遺伝的アルゴリズム(GA)処理を用いる。各GA処理は複数個のnpop解の集合(population)を有する。これらの解は操作入力ベクトル(すなわち、mab)の候補である。個々の解の適応度スコアは、その解(操作)のネットワーク計算の予測の損失スコア(sbを参照)によって与えられる。したがって、適応度スコアを最小限に抑える必要がある。
本発明に係る操作生成システムが、操作を生成する際には、あらかじめ操作手順の長さを設定する必要がある。与えられた(sa、sb)ペアに対する操作の最適な長さをあらかじめ計算するのは、一般的には困難であるが、本発明では、この問題に対する2つの簡単なアプローチを採用することでこれを解決する。なお、これら2つのうちいずれかのアプローチを適用した操作方法生成システムを、新たな発明として見出すことも可能である。
(逐次検索法)
操作手順の長さを求める1つ目のアプローチは、逐次検索法による方法である。具体的には、次のアルゴリズムを使用して、予めn(ループ回数)を決定せずに最適解を見つけることができる。
1.n = 1に設定する
2.nステップにおける解mabを見つける。
3.解mab の損失が事前設定された品質しきい値を超える場合は、n=n+1に設定してステップ2に戻る。そうでなければ、検索を終了する。
本発明の目的を達成する2つ目のアプローチとして、nに最初から大きい値を設定する方法が挙げられる。nが必要以上に大きい場合、操作手順にnull操作が含まれることがある。これは、布の外側にある掴み点を定義することによって、布の状態に影響を与えない操作となる。本発明に係る操作方法生成システムでは、null操作を検出し無視することによって、最適な長さに短縮することができる。
本実施例では、自由形式の布操作タスクを取り入れる。ここでの目的は単一の予め設定された出力状態を達成することではなく、与えられた操作のレパートリーが状態空間を通していかに対象物を動かすかを学習するところにある(つまり、1つのアクションがどのように対象物の形と位置を変えるかを学習する)。そこで本実施例では任意の目標状態を実現する操作手順を学習するよう訓練されたネットワークを使う。
本実施例における基本的なシステムの構成(アーキテクチャ)を図5に示す。このアーキテクチャは三次元畳み込み自己符号化器よりなり、エンコーダ(符号化)部とデコーダ(復号化)部に挟まれた全結合型ネットワークを備える。本実施例では、この全結合型ネットワークを操作ネットワークとして利用した。このネットワークはテンソルフロー(オープンソースソフトウェア)により実装されている。ネットワークの設定を以下に示す。
・6層
・マップ数:32、32、64、128、256、512
(デコーダでは順序逆転する)
・カーネルサイズ:3×3×3(全層)
・ストライド(フィルタ適用の位置間隔):2×2×1(第一層)、2×2×2(その他全層)
・エンコーダとデコーダ間には結合重みが共有されない
・10層
・入力層サイズ:512+6ニューロン
・隠れ層サイズ:512+512+6ニューロン
・出力層サイズ:512ニューロン
・状態エンコーディングニューロン間の残余結合
次に、このネットワークを使ってマルチステップの操作手順を生成した。nステップの計画を生成するために、前記操作ネットワークをn回にわたって繰り返し適用した。図6にn=3のときの概要を示す。状態Saを状態Sbに変換する計画mabの探査は以下のように示される:
1.mabに対しランダムな初期化を行う
2.saとmabをネットワークに供給し予想出力spを得るためフォワードプロパゲーション(順方向伝搬処理)を行う。
3.sbに関して、spに対する損失を計算する。
4.この損失に関して、操作入力値の勾配を得るため誤差逆伝搬処理を行う。
5.損失スコアが落ち着く(25繰り返しても改善しない)か、所定の繰り返し数(ここでは100回)が済むまで、ステップ2から4を繰り返す。
20 第2セクション
30 第3セクション
Claims (6)
- 畳み込みニューラルネットワークを用いた操作方法生成システムであって、
対象の開始状態をシステムに入力する手段と、
対象の目標状態をシステムに入力する手段と、
前記畳み込みニューラルネットワークの畳み込み層により、対象の開始状態を符号化する手段と、
前記畳み込みニューラルネットワークの全結合ネットワークに、対象に対する操作パラメータを付加する手段と、
前記畳み込みニューラルネットワークの復号化層により、前記全結合ネットワークにより前記操作パラメータが付加された対象を復号化し、操作後状態を出力する手段と、
を備えることを特徴とする、操作方法生成システム。 - 前記全結合ネットワークが、2以上直列に接続され、互いにデータを伝搬することを特徴とする、請求項1記載の操作方法生成システム。
- 前記目標状態と、前記操作後状態との損失を計算し、該損失を所望の大きさにするよう最適化する手段と、前記操作パラメータを付加する手段に前記最適化する手段により算出された値をフィードバックする手段と、をさらに備えることを特徴とする、請求項1または2記載の操作方法生成システム。
- 前記最適化する手段と、前記フィードバックする手段と、前記操作パラメータを付加する手段とを、2回以上反復することを特徴とする、請求項3に記載の操作方法生成システム。
- 前記最適化する手段が、遺伝的アルゴリズムにより値を算出するものであることを特徴とする、請求項3または4記載の操作方法生成システム。
- 前記対象が、ボクセルデータで表されたデータであることを特徴とする、請求項1~5のいずれか1項記載の操作方法生成システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017174241A JP7007664B2 (ja) | 2017-09-11 | 2017-09-11 | 操作方法生成システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017174241A JP7007664B2 (ja) | 2017-09-11 | 2017-09-11 | 操作方法生成システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019049904A JP2019049904A (ja) | 2019-03-28 |
JP7007664B2 true JP7007664B2 (ja) | 2022-01-24 |
Family
ID=65905587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017174241A Active JP7007664B2 (ja) | 2017-09-11 | 2017-09-11 | 操作方法生成システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7007664B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110007355A (zh) * | 2019-04-15 | 2019-07-12 | 中国科学院电子学研究所 | 一种卷积自编码器及物体内部异常的检测方法和装置 |
JP7392315B2 (ja) | 2019-08-05 | 2023-12-06 | 株式会社リコー | 表示装置、表示方法、プログラム |
-
2017
- 2017-09-11 JP JP2017174241A patent/JP7007664B2/ja active Active
Non-Patent Citations (2)
Title |
---|
出来 寛祥 外2名,「Deep Neural Networkを用いた視覚運動情報の統合化による空間表現の汎化」,第32回日本ロボット学会学術講演会 [DVD-ROM],一般社団法人 日本ロボット学会,2014年09月04日,pp.75-76 (RSJ2014AC1B2-01) |
芦原 佑太 外2名,「DeepLearningにおける中間層の情報表現を利用した,物体の外観変化を予測する転移学習モデル」,情報処理学会研究報告 知能システム(ICS)[online],情報処理学会,2016年02月24日,第2016-ICS-182巻,第1号,pp.1-8,[2016年3月9日検索],インターネット<URL:https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_uri&item_id=157634&file_id=1&file_no=1> |
Also Published As
Publication number | Publication date |
---|---|
JP2019049904A (ja) | 2019-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hornby et al. | Generative representations for the automated design of modular physical robots | |
Tanaka et al. | Emd net: An encode–manipulate–decode network for cloth manipulation | |
Hornby et al. | The advantages of generative grammatical encodings for physical design | |
Lim et al. | Nature inspired algorithms to optimize robot workcell layouts | |
JP7007664B2 (ja) | 操作方法生成システム | |
Collins et al. | Towards the targeted environment-specific evolution of robot components | |
Aguilar et al. | Inverse kinematics solution for robotic manipulators using a cuda-based parallel genetic algorithm | |
Nygaard et al. | Overcoming initial convergence in multi-objective evolution of robot control and morphology using a two-phase approach | |
Veenstra et al. | How different encodings affect performance and diversification when evolving the morphology and control of 2D virtual creatures | |
Muñoz et al. | Geometrically constrained path planning for robotic grasping with Differential Evolution and Fast Marching Square | |
Tanaka et al. | Co-evolving morphology and control of soft robots using a single genome | |
Zhu et al. | Efficient object manipulation planning with monte carlo tree search | |
Bongard | Innocent until proven guilty: Reducing robot shaping from polynomial to linear time | |
Allen et al. | Evolved controllers for simulated locomotion | |
Horibe et al. | Severe damage recovery in evolving soft robots through differentiable programming | |
Singh et al. | Modelling and path planning of snake robot in cluttered environment | |
Liao et al. | Evolutionary path planning for robot assisted part handling in sheet metal bending | |
Kvalsund et al. | Centralized and decentralized control in modular robots and their effect on morphology | |
Huang et al. | DittoGym: Learning to Control Soft Shape-Shifting Robots | |
Weisser et al. | Two-level transplant evolution for optimization of general controllers | |
Rybak et al. | Development of an algorithm for managing a multi-robot system for cargo transportation based on reinforcement learning in a virtual environment | |
Gruau | Modular genetic neural networks for 6-legged locomotion | |
Min et al. | Creative 3D designs using interactive genetic algorithm with structured directed graph | |
JP7410365B2 (ja) | 部材配置システム及び部材配置プログラム | |
Li et al. | Reinforcement learning for freeform robot design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20190304 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190304 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190304 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200812 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210716 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7007664 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |