JP7336856B2 - 情報処理装置、方法及びプログラム - Google Patents
情報処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP7336856B2 JP7336856B2 JP2019037752A JP2019037752A JP7336856B2 JP 7336856 B2 JP7336856 B2 JP 7336856B2 JP 2019037752 A JP2019037752 A JP 2019037752A JP 2019037752 A JP2019037752 A JP 2019037752A JP 7336856 B2 JP7336856 B2 JP 7336856B2
- Authority
- JP
- Japan
- Prior art keywords
- simulation
- information processing
- state
- processing apparatus
- virtual world
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 75
- 230000010365 information processing Effects 0.000 title claims description 30
- 238000004088 simulation Methods 0.000 claims description 187
- 238000013528 artificial neural network Methods 0.000 claims description 21
- 230000008859 change Effects 0.000 claims description 21
- 230000007613 environmental effect Effects 0.000 claims description 14
- 230000015654 memory Effects 0.000 claims description 13
- 230000001419 dependent effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 95
- 238000004364 calculation method Methods 0.000 description 92
- 230000009467 reduction Effects 0.000 description 49
- 230000008569 process Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000012549 training Methods 0.000 description 5
- 239000000470 constituent Substances 0.000 description 4
- 238000002620 method output Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1656—Programme controls characterised by programming, planning systems for manipulators
- B25J9/1671—Programme controls characterised by programming, planning systems for manipulators characterised by simulation, either to verify existing program or to create and verify new program, CAD/CAM oriented, graphic oriented programming systems
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J13/00—Controls for manipulators
- B25J13/08—Controls for manipulators by means of sensing devices, e.g. viewing or touching devices
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1694—Programme controls characterised by use of sensors other than normal servo-feedback from position, speed or acceleration sensors, perception control, multi-sensor controlled systems, sensor fusion
- B25J9/1697—Vision controlled systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/39—Robotics, robotics to robotics hand
- G05B2219/39014—Match virtual world with real world
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Manipulator (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
Description
少なくとも1つのメモリと、
少なくとも1つのプロセッサと、を備え、
前記少なくとも1つのプロセッサは、
現実世界の観測結果に基づく情報と、物体に関する環境変数と、に基づいて、仮想世界の状態についてシミュレーションを実行し、
前記シミュレーションの結果と変化後の前記仮想世界の状態との間の誤差を計算し、前記誤差に基づいて前記環境変数を更新し、
変化後の前記仮想世界の状態は、変化後の前記現実世界の観測結果に基づいて生成される。
<シミュレーションシステムの全体構成>
はじめに、第1の実施形態に係る情報処理装置を含むシミュレーションシステム全体の構成について説明する。図1は、シミュレーションシステムの全体構成の一例を示す図である。
次に、シミュレーション装置120のハードウェア構成について説明する。図2は、シミュレーション装置のハードウェア構成の一例を示す図である。
次に、本実施形態のロボット110の機能構成について説明する。図3は、ロボットの機能構成の一例を示す図である。図3に示すように、センサ装置111は、例えば、カメラ301とセンサ302とを有する。
次に、シミュレーション装置の機能構成について説明する。図4は、シミュレーション装置の機能構成の一例を示す図である。図4に示すように、本実施形態のシミュレーション部121は、例えば、仮想世界記憶部410、ロボット制御処理計算部420、報酬算出部430、微分可能物理シミュレーション計算部440、差異低減処理計算部450、差分部460を有する。
次に、シミュレーションシステム100における処理の流れについて説明する。上記説明から明らかなように、シミュレーションシステム100において実行される処理は、以下の3つの処理(3種類の入力変数を更新し、決定する処理)に大別することができる。
・環境変数を更新し、決定する環境変数決定処理
・差異低減変数を更新し、決定する差異低減変数決定処理
・ロボット制御変数を更新し、決定するロボット制御変数決定処理
以下、これらの処理について、対応する各部の動作(図4で示した機能構成の各部のうち、これらの処理に関わる各部の動作)を参照しながら説明する。
はじめに、環境変数決定処理について、図5及び図6を用いて説明する。図5は、環境変数決定処理の流れの一例を示すフローチャートである。また、図6は、環境変数決定処理に関わるシミュレーション装置の各部の動作の一例を説明するための図である。以下、図6を参照しながら、図5のフローチャートについて説明する。なお、環境変数決定処理を行うにあたり、ロボット制御処理計算部420のロボット制御変数、及び、差異低減処理計算部450の差異低減変数は、所定の値に固定されているものとする。また、以下では、具体例として、ロボット110が物体をつかんで所定の位置に移動させるタスクを実行するケースを挙げ、当該ケースに沿って説明する。
次に、差異低減変数決定処理について、図7及び図8を用いて説明する。図7は、差異低減変数決定処理の流れの一例を示すフローチャートである。また、図8は、差異低減変数決定処理に関わるシミュレーション装置の各部の動作の一例を説明するための図である。以下、図8を参照しながら、図7のフローチャートについて説明する。なお、差異低減変数決定処理を行うにあたり、ロボット制御処理計算部420のロボット制御変数は、所定の値に固定されているものとする。また、環境変数は、図5の環境変数決定処理により決定された環境変数が用いられるものとする。
次に、ロボット制御変数決定処理について、図9及び図10を用いて説明する。図9は、ロボット制御変数決定処理の流れを示すフローチャートである。また、図10は、ロボット制御変数決定処理に関わるシミュレーション装置の各部の動作を説明するための図である。以下、図10を参照しながら、図9のフローチャートについて説明する。なお、ロボット制御変数決定処理を行うにあたり、環境変数は、図5の環境変数決定処理により決定された環境変数が用いられるものとする。また、差異低減変数は、図7の差異低減変数決定処理により決定された差異低減変数が用いられるものとする。なお、ロボット制御変数決定処理を開始するにあたり、仮想世界記憶部410には、予め初期状態が記憶されているものとする。
以上の説明から明らかなように、第1の実施形態に係る情報処理装置の一例であるシミュレーション装置120は、
・現実世界の観測結果に基づいて算出された仮想世界の状態を取得する。
・現実世界に作用するロボットを制御する際のロボット制御方法を取得する。
・所定の環境変数のもとで、仮想世界の状態とロボット制御方法とを入力とし、変化後の仮想世界の状態について、微分可能なシミュレーションを実行することでシミュレーション結果を出力する。
・出力されたシミュレーション結果が、当該ロボット制御方法のもとでロボットを制御し現実世界が変化することで観測結果から算出された、変化後の仮想世界の状態に近づくように環境変数を更新する。
・更新した環境変数のもとで、仮想世界の状態とロボット制御方法とを入力とし、微分可能なシミュレーションを実行することでシミュレーション結果を出力する。
・出力されたシミュレーション結果を修正し、修正後のシミュレーション結果を出力する。
・出力された修正後のシミュレーション結果が、当該ロボット制御方法のもとでロボットを制御し現実世界が変化することで観測結果から算出された、変化後の仮想世界の状態に近づくように、差異低減変数を更新する。つまり、出力されたシミュレーション結果と、修正後のシミュレーション結果との対応関係を訓練する。
・更新した環境変数のもとで、仮想世界の状態を入力とし、ロボット制御方法を出力する。
・更新した環境変数のもとで、仮想世界の状態と、出力されたロボット制御方法とを入力とし、微分可能なシミュレーションを実行することで、シミュレーション結果を出力する。また、出力されたシミュレーション結果を、更新された差異低減変数のもとで修正したうえで、報酬を算出する。
・算出された報酬に基づいて、仮想世界の状態とロボット制御方法との対応関係を訓練する。
上記第1の実施形態では、シミュレーションシステム100が、環境変数決定処理、差異低減変数決定処理、ロボット制御変数決定処理の順序で、各処理を実行する場合について説明した。しかしながら、シミュレーションシステム100が各処理を実行する際の実行順序はこれに限定されない。例えば、環境変数決定処理、差異低減変数決定処理、ロボット制御変数決定処理の順序で、各処理を実行した後に、再度、環境変数決定処理や、差異低減変数決定処理を実行してもよい。
上記第1及び第2の実施形態では、ロボット110が物体をつかんで所定の位置に移動させるタスクを実行する例について説明したが、ロボット110が実行するタスクはこれに限定されない。例えば、物体を移動させること、掃除機のように物体を吸引すること、あるいは、ロボット110自体が移動すること、等のタスクを実行してもよい。
110 :ロボット
111 :センサ装置
112 :駆動装置
113 :制御装置
114 :観測及び制御部
120 :シミュレーション装置
121 :シミュレーション部
311 :現実環境観測部
312 :ロボット制御部
410 :仮想世界記憶部
420 :ロボット制御処理計算部
430 :報酬算出部
440 :微分可能物理シミュレーション計算部
450 :差異低減処理計算部
460 :差分部
Claims (21)
- 少なくとも1つのメモリと、
少なくとも1つのプロセッサと、を備え、
前記少なくとも1つのプロセッサは、
現実世界の観測結果に基づく情報と、物体に関する環境変数と、に基づいて、仮想世界の状態についてシミュレーションを実行し、
前記シミュレーションの結果と変化後の前記仮想世界の状態との間の誤差を計算し、前記誤差に基づいて前記環境変数を更新し、
変化後の前記仮想世界の状態は、変化後の前記現実世界の観測結果に基づいて生成される、
情報処理装置。 - 前記少なくとも1つのプロセッサは、前記誤差を用いた誤差逆伝播を行うことで、前記環境変数を更新する、
請求項1に記載の情報処理装置。 - 前記少なくとも1つのプロセッサは、前記シミュレーションの出力を第1のニューラルネットワークに入力することで、前記シミュレーションの結果を生成する、
請求項1または2に記載の情報処理装置。 - 前記少なくとも1つのプロセッサは、シミュレーションの結果が、変化後の前記仮想世界の状態に近づくように、前記第1のニューラルネットワークを訓練する、
請求項3に記載の情報処理装置。 - 前記少なくとも1つのプロセッサは、前記現実世界の観測結果に基づく情報と、前記環境変数と、前記現実世界における制御方法に関する情報と、に基づいて、前記シミュレーションを実行する、
請求項1乃至4のいずれか1項に記載の情報処理装置。 - 前記少なくとも1つのプロセッサは、前記現実世界の観測結果に基づく情報と、前記環境変数とを第2のニューラルネットワークに入力して、前記現実世界における制御方法に関する情報を生成する、
請求項5に記載の情報処理装置。 - 前記少なくとも1つのプロセッサは、シミュレーションの結果に基づいて、前記第2のニューラルネットワークを訓練する、
請求項6に記載の情報処理装置。 - 前記少なくとも1つのプロセッサは、前記シミュレーションの結果に基づいて報酬を算出し、前記報酬に基づいて前記第2のニューラルネットワークを訓練する、
請求項7に記載の情報処理装置。 - 前記現実世界における制御方法は、駆動装置を用いた制御方法である、
請求項5乃至8のいずれか1項に記載の情報処理装置。 - 前記現実世界における制御方法は、前記物体に対する制御方法である、
請求項5乃至9のいずれか1項に記載の情報処理装置。 - 前記環境変数は、前記物体の物理量に関する情報を含む、
請求項1乃至10のいずれか1項に記載の情報処理装置。 - 前記環境変数は、前記物体の特性に関する情報を含む、
請求項1乃至10のいずれか1項に記載の情報処理装置。 - 前記現実世界の観測結果に基づく情報は、前記仮想世界の状態を含む、
請求項1乃至12のいずれか1項に記載の情報処理装置。 - 前記シミュレーションは微分可能なシミュレーションである、
請求項1乃至13のいずれか1項に記載の情報処理装置。 - 前記シミュレーションは、気象シミュレーションである、
請求項1乃至4のいずれか1項、又は、請求項11乃至14のうち請求項5に従属しないいずれか1項に記載の情報処理装置。 - 複数台のコンピュータで構成される、
請求項1乃至15のいずれか1項に記載の情報処理装置。 - 請求項4、又は、請求項5乃至16のうち請求項4に従属するいずれか1項に記載の情報処理装置が、前記第1のニューラルネットワークを生成する方法。
- 請求項7、又は、請求項8乃至14、16のうち請求項7に従属するいずれか1項に記載の情報処理装置が、前記第2のニューラルネットワークを生成する方法。
- 請求項1乃至16のいずれか1項に記載の情報処理装置が、前記環境変数を生成する方法。
- 少なくとも1つのメモリと、少なくとも1つのプロセッサと、を備える情報処理装置において、前記少なくとも1つのプロセッサが、
現実世界の観測結果に基づく情報と、物体に関する環境変数と、に基づいて、仮想世界の状態についてシミュレーションを実行し、
前記シミュレーションの結果と変化後の前記仮想世界の状態との間の誤差を計算し、前記誤差に基づいて前記環境変数を更新する、方法であって、
変化後の前記仮想世界の状態は、変化後の前記現実世界の観測結果に基づいて生成される、
方法。 - 少なくとも1つのメモリと、少なくとも1つのプロセッサと、を備える情報処理装置において、前記少なくとも1つのプロセッサに、
現実世界の観測結果に基づく情報と、物体に関する環境変数と、に基づいて、仮想世界の状態についてシミュレーションを実行させ、
前記シミュレーションの結果と変化後の前記仮想世界の状態との間の誤差を計算させ、前記誤差に基づいて前記環境変数を更新させる、プログラムであって、
変化後の前記仮想世界の状態は、変化後の前記現実世界の観測結果に基づいて生成される、
プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019037752A JP7336856B2 (ja) | 2019-03-01 | 2019-03-01 | 情報処理装置、方法及びプログラム |
PCT/JP2020/003419 WO2020179299A1 (ja) | 2019-03-01 | 2020-01-30 | 情報処理装置及び情報処理方法 |
US17/446,347 US20210387343A1 (en) | 2019-03-01 | 2021-08-30 | Information processing device and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019037752A JP7336856B2 (ja) | 2019-03-01 | 2019-03-01 | 情報処理装置、方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020140641A JP2020140641A (ja) | 2020-09-03 |
JP2020140641A5 JP2020140641A5 (ja) | 2022-03-03 |
JP7336856B2 true JP7336856B2 (ja) | 2023-09-01 |
Family
ID=72265025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019037752A Active JP7336856B2 (ja) | 2019-03-01 | 2019-03-01 | 情報処理装置、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210387343A1 (ja) |
JP (1) | JP7336856B2 (ja) |
WO (1) | WO2020179299A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3587046A1 (de) * | 2018-06-28 | 2020-01-01 | Siemens Aktiengesellschaft | Verfahren und vorrichtung zum rechnergestützten ermitteln von regelparametern für eine günstige handlung eines technischen systems |
US11645498B2 (en) * | 2019-09-25 | 2023-05-09 | International Business Machines Corporation | Semi-supervised reinforcement learning |
US11921492B2 (en) | 2021-03-30 | 2024-03-05 | Mitsubishi Electric Research Laboratories, Inc. | Transfer between tasks in different domains |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017030135A (ja) | 2015-07-31 | 2017-02-09 | ファナック株式会社 | ワークの取り出し動作を学習する機械学習装置、ロボットシステムおよび機械学習方法 |
WO2017201220A1 (en) | 2016-05-20 | 2017-11-23 | Google Llc | Reinforcement learning using pseudo-counts |
JP2018097680A (ja) | 2016-12-14 | 2018-06-21 | ファナック株式会社 | 制御システム及び機械学習装置 |
JP2018126796A (ja) | 2017-02-06 | 2018-08-16 | セイコーエプソン株式会社 | 制御装置、ロボットおよびロボットシステム |
JP2018144155A (ja) | 2017-03-03 | 2018-09-20 | 株式会社キーエンス | ロボットシミュレーション装置、ロボットシミュレーション方法、ロボットシミュレーションプログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10303825B2 (en) * | 2015-12-28 | 2019-05-28 | Dassault Systemes Simulia Corp. | Convergence estimation of non-linear PDE and linear solvers |
JP2018151876A (ja) * | 2017-03-13 | 2018-09-27 | 株式会社日立製作所 | 機械学習に使用される経験を格納する経験データベースを更新する方法 |
-
2019
- 2019-03-01 JP JP2019037752A patent/JP7336856B2/ja active Active
-
2020
- 2020-01-30 WO PCT/JP2020/003419 patent/WO2020179299A1/ja active Application Filing
-
2021
- 2021-08-30 US US17/446,347 patent/US20210387343A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017030135A (ja) | 2015-07-31 | 2017-02-09 | ファナック株式会社 | ワークの取り出し動作を学習する機械学習装置、ロボットシステムおよび機械学習方法 |
WO2017201220A1 (en) | 2016-05-20 | 2017-11-23 | Google Llc | Reinforcement learning using pseudo-counts |
JP2018097680A (ja) | 2016-12-14 | 2018-06-21 | ファナック株式会社 | 制御システム及び機械学習装置 |
JP2018126796A (ja) | 2017-02-06 | 2018-08-16 | セイコーエプソン株式会社 | 制御装置、ロボットおよびロボットシステム |
JP2018144155A (ja) | 2017-03-03 | 2018-09-20 | 株式会社キーエンス | ロボットシミュレーション装置、ロボットシミュレーション方法、ロボットシミュレーションプログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 |
Also Published As
Publication number | Publication date |
---|---|
US20210387343A1 (en) | 2021-12-16 |
WO2020179299A1 (ja) | 2020-09-10 |
JP2020140641A (ja) | 2020-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7336856B2 (ja) | 情報処理装置、方法及びプログラム | |
US20230330848A1 (en) | Reinforcement and imitation learning for a task | |
US11235461B2 (en) | Controller and machine learning device | |
US10864630B2 (en) | Control device and machine learning device | |
JP5330138B2 (ja) | 強化学習システム | |
US11458630B2 (en) | Mitigating reality gap through simulating compliant control and/or compliant contact in robotic simulator | |
TWI802820B (zh) | 機器人控制裝置、方法和儲存媒體 | |
US20210107144A1 (en) | Learning method, learning apparatus, and learning system | |
US10967505B1 (en) | Determining robot inertial properties | |
US11790042B1 (en) | Mitigating reality gap through modification of simulated state data of robotic simulator | |
WO2020017266A1 (ja) | シミュレーション装置、シミュレーションプログラムおよびシミュレーション方法 | |
WO2022044191A1 (ja) | 調整システム、調整方法および調整プログラム | |
US11707840B1 (en) | Mitigating reality gap through optimization of simulated hardware parameter(s) of simulated robot | |
US10549422B2 (en) | Robot controller, machine learning device and machine learning method | |
CN113910244A (zh) | 用于神经外科的基于力矩前馈的机械臂拖动混合控制方法 | |
CN110147891B (zh) | 应用于强化学习训练过程的方法、装置及电子设备 | |
US20240054393A1 (en) | Learning Device, Learning Method, Recording Medium Storing Learning Program, Control Program, Control Device, Control Method, and Recording Medium Storing Control Program | |
WO2020235061A1 (ja) | 動作規則決定装置、動作規則決定方法および記録媒体 | |
US20220297298A1 (en) | Data generation device, data generation method, control device, control method, and computer program product | |
KR102719462B1 (ko) | 다관절 로봇의 구동을 위한 기구학 모델링 방법, 장치 및 컴퓨터 프로그램 | |
US20240202537A1 (en) | Learning method, learning device, control method, control device, and storage medium | |
JP2024134040A (ja) | 学習方法、学習装置、プログラム、および、学習済みモデルの生成方法 | |
KR20230134890A (ko) | 다관절 로봇의 구동을 위한 기구학 모델링 방법, 장치 및 컴퓨터 프로그램 | |
KR20240079918A (ko) | 프로세서, 이를 포함하는 컴퓨터 장치, 및 이의 구동 방법 | |
JP2021128510A (ja) | 自動操縦ロボットを制御する操作推論学習モデルの学習システム及び学習方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220221 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230612 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7336856 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |