JP2018200539A - 学習装置、学習制御方法、及びそのプログラム - Google Patents
学習装置、学習制御方法、及びそのプログラム Download PDFInfo
- Publication number
- JP2018200539A JP2018200539A JP2017104528A JP2017104528A JP2018200539A JP 2018200539 A JP2018200539 A JP 2018200539A JP 2017104528 A JP2017104528 A JP 2017104528A JP 2017104528 A JP2017104528 A JP 2017104528A JP 2018200539 A JP2018200539 A JP 2018200539A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- control
- result
- neural network
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000013528 artificial neural network Methods 0.000 claims abstract description 46
- 230000036961 partial effect Effects 0.000 claims description 25
- 230000009471 action Effects 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 5
- 238000012856 packing Methods 0.000 claims description 2
- 230000033001 locomotion Effects 0.000 abstract description 29
- 238000012545 processing Methods 0.000 description 17
- 238000001514 detection method Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 238000010801 machine learning Methods 0.000 description 9
- 230000001133 acceleration Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000000123 paper Substances 0.000 description 6
- 238000013075 data extraction Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000000605 extraction Methods 0.000 description 3
- 238000004904 shortening Methods 0.000 description 3
- 238000005401 electroluminescence Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/027—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0221—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0062—Adapting control system settings
- B60W2050/0075—Automatic parameter input, automatic initialising or calibrating means
- B60W2050/0083—Setting, resetting, calibration
- B60W2050/0088—Adaptive recalibration
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Automation & Control Theory (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Fuzzy Systems (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Manipulator (AREA)
- Feedback Control In General (AREA)
- Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
Abstract
【解決手段】所定のタスクに係る動作の制御を学習する学習装置であって、学習目的と、制御を学習する際に行われる学習動作の許容要件とを含む学習データを受け付ける学習データ受付部と、学習データに基づいて、学習を実行するニューラルネットワークと、ニューラルネットワークによる学習結果を出力する出力部と、を備え、ニューラルネットワークは、学習目的の初期段階を達成するための第1学習を実行し、当該第1学習の結果に基づいて、学習動作が許容要件に適合する制御範囲を学習する第2学習を実行し、第2学習の結果に基づいて、制御範囲内において、学習目的を達成するための第3学習を実行する。
【選択図】図1
Description
以下、図面を参照して本発明の実施形態について詳細に説明する。なお、同一の要素には同一の符号を付し、重複する説明を省略する。また、以下の実施の形態は、本発明を説明するための例示であり、本発明をその実施の形態のみに限定する趣旨ではない。さらに、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。
図1乃至図3を参照して本実施形態におけるシステムの概要について説明する。
図1は、本実施形態に係る学習装置1の概略構成を示すブロック図である。学習装置1は、所定のタスクを学習するものである。本実施形態に係る学習装置1は、一例として自動走行制御車両(以下、単に「車両」ともいう。)90に搭載され、所定のコース(図2参照)を自動走行するための車両90の制御を学習する。このとき学習装置1には、例えばオペレータ等から学習データが与えられる。学習データは、例えば次のような学習目的、学習要件、及び許容要件を含むデータである。
(学習目的)
・所定時間以内にコースを10周してゴールする。
(学習要件)
・コースアウトしない
・周回方向は時計回り
・ゴールする
・初期段階レベルでは「コースを1周してゴールする」
(許容要件)
・別の何かに接触しないこと
次に、図4乃至図8を参照して、各ステップにおける学習装置1の処理の詳細について説明する。図4は本実施形態に係る学習装置1の詳細な構成を示すブロック図である。図4に示すように、機械学習部20は、学習データ入出力部21と、ニューラルネットワーク22と、学習結果出力部23とから構成される。また、動作分類部30は、制御データ抽出部31と、動作分類結果抽出部32とから構成される。
以下では、図3のステップごとに、各部の処理の詳細について説明する。
図5は、図3に示したS1の学習初期段階における詳細な処理フローを示すフローチャートである。まず、学習の初期段階(第1学習)において、学習データ入出力部21が学習データを受け付ける(S101)。学習データは、例えば上述した学習目的、学習要件、及び許容要件を含むデータである。
図6は、図3に示したS2の動作の分類における詳細な処理フローを示すフローチャートである。まず、動作の分類処理を行うに当たり、制御データ抽出部31が学習初期段階終了時点における、制御用センサ91のセンサ値と、これに対するアクチュエータ92の制御量及び状態検知用センサ93のセンサ値とを記憶部40から抽出する(S201)。制御データ抽出部31は、抽出した各値をニューラルネットワーク22に対して学習データとして入力する。
場面ア:第1ストレート部分動作(例えば次の第1コーナーに差し掛かる際の減速のタイミングや走行位置等の制御である。)
場面イ:第1コーナー部分動作(例えばコーナーでのハンドル操作や、第2ストレートへ進入するに際した加速のタイミング等の制御である。)
場面ウ:第2ストレート部分動作(例えば次の第2コーナーに差し掛かる際の減速のタイミングや走行位置等の制御である。)
場面エ:第2コーナー部分動作(例えばコーナーでのハンドル操作や、第3ストレートへ進入するに際した加速のタイミング等の制御である。)
場面オ:第3ストレート部分動作(例えば第1ストレートに進入するに際した加速等の制御である。)
図7は、図3に示したS3の動作許容範囲の学習(第2学習)における詳細な処理フローを示すフローチャートである。まず、学習データ入出力部21は、記憶部40を参照し、S2の処理において分類された部分動作のうち、いずれかの部分動作を選択し、当該選択された部分動作に必要なアクチュエータ92への制御量を抽出する。学習データ入出力部21は、抽出した制御量において制御を実行し、その結果、許容要件を満たしたか否かを例えば状態検知用センサ93からの出力等に基づいて判定する。このとき例えば、別の何かに接触しない、という許容要件のもとにおいては、何かに接触したか、それによって停止してしまったか否か等が判定される。学習データ入出力部21は、抽出した制御量とその結果学習動作が許容要件に適合したか否かの情報(判定結果)を学習データとして読み出し、ニューラルネットワーク22に学習データとして与える。ニューラルネットワーク22は、与えられた学習データのもと、Deep Learningにより学習を行う(S301)。ニューラルネットワーク22では、学習の結果、許容要件を満たすアクチュエータ92の制御量の最小値及び最大値を抽出する。学習結果出力部23は、抽出された最小値及び最大値を動作許容範囲として記憶部40に記憶させる。
図8は、図3に示したS4の最適化学習(第3学習)における詳細な処理フローを示すフローチャートである。最適化学習では、S3までのステップで行った学習の最適化を図ることにより、学習開始時に学習データとして与えられた学習目的(本実施形態においては、「所定時間以内にコースを10周してゴールする」ことである。)を達成するための学習を行う。最適化学習においては、S3で学習した動作共範囲内において学習が行われる。このとき、学習データ入出力部21は、記憶部40を参照して、学習初期段階(図3のS1)において入力された学習データ(オペレータが設定したものである)を抽出する。また、学習データ入出力部21は、さらに記憶部40を参照して動作許容範囲を学習した後のニューラルネットワーク22の状態を抽出する。学習データ入出力部21は、抽出したこれらのデータを制御部10に設定する。
図9を参照しながら、上述してきた学習装置1をコンピュータ800により実現する場合のハードウェア構成の一例を説明する。なお、それぞれの装置の構成は、複数台の装置に分けて実現することもできる。
第1実施形態では、学習装置1が自動走行制御車両90に用いられる例について説明した。しかし、学習装置1が適用される装置は、第1実施形態に示した例に限定されず、種々の装置に適用することができる。本実施形態では、紙コップを梱包することをタスクとする、ロボットの制御に適用する例について説明する。なお、第2実施形態では、第1実施形態との差異点を中心に説明する。
本実施形態に係るタスクであるピックアンドプレース動作は、以下の手順で行われる動作をいう。
1)紙コップを1つだけ把持して、所定位置へ載置する
2)上記作業(把持+載置)を所定回数繰り返して、所定個数の紙コップを積み重ねる
3)所定個数の紙コップが積み重なった状態の1つを、袋に入れる
4)袋の先端をひねり、袋の口部分を結束バンドで止める
5)袋の口部分を結束バンドで止められた状態の1つを、段ボール箱に詰める
6)上記1)〜5)の作業を所定回数繰り返して、袋の口部分を結束バンドで止められた状態の別の1つを、段ボール箱に詰める
7)上記6)を所定回数繰り返して、段ボール箱に詰めた状態で、フタを閉める
・所定時間以内に上記の一連作業を完了させる。
(学習要件)
・袋や段ボールからはみ出さないこと
・初期段階レベルでは「一連作業を完了させる」(すなわち、「タスクに係る一連の動作を制御できるようになる」ことである。)
(許容要件)
・紙コップ、袋、段ボール箱にダメージを与えないこと
(付記1)
少なくとも1つのハードウェアプロセッサを備え、
前記ハードウェアプロセッサは、
学習目的、及び制御を学習する際に行われる学習動作の許容要件を含む学習データを受け付け、
前記学習データに基づいて、学習を実行し、
前記ニューラルネットワークによる学習結果を出力し、
前記学習を実行することは、
前記学習目的の初期段階を達成するための第1学習を実行し、当該第1学習の結果に基づいて、前記学習動作が前記許容要件に適合する制御範囲を学習する第2学習を実行し、前記第2学習の結果に基づいて、前記制御範囲内において、前記学習目的を達成するための第3学習を実行することを含む。
(付記2)
少なくとも1つ以上のハードウェアプロセッサによって、
学習を行うステップであって、
学習目的と、前記制御を学習する際に行われる学習動作の許容要件とを含む学習データを受け付けるステップと、
前記学習データに基づいて、学習を実行するステップと、
前記学習を実行するステップによる学習結果を出力するステップと、
を実行し、
前記学習を実行するステップは、
前記学習目的の初期段階を達成するための第1学習を実行し、当該第1学習の結果に基づいて、前記学習動作が前記許容要件に適合する制御範囲を学習する第2学習を実行し、前記第2学習の結果に基づいて、前記制御範囲内において、前記学習目的を達成するための第3学習を実行するステップを含む、学習方法。
10 制御部
20 機械学習部
21 学習データ入出力部
22 ニューラルネットワーク
23 学習結果出力部
30 動作分類部
31 制御データ抽出部
32 動作分類結果抽出部
40 記憶部
90 自動走行制御車両
91 制御用センサ
92 アクチュエータ
93 状態検知用センサ
Claims (8)
- 所定のタスクに係る動作の制御を学習する学習装置であって、
学習目的と、前記制御を学習する際に行われる学習動作の許容要件とを含む学習データを受け付ける学習データ受付部と、
前記学習データに基づいて、学習を実行するニューラルネットワークと、
前記ニューラルネットワークによる学習結果を出力する出力部と、
を備え、
前記ニューラルネットワークは、
前記学習目的の初期段階を達成するための第1学習を実行し、当該第1学習の結果に基づいて、前記学習動作が前記許容要件に適合する制御範囲を学習する第2学習を実行し、前記第2学習の結果に基づいて、前記制御範囲内において、前記学習目的を達成するための第3学習を実行する、
学習装置。 - 前記出力部は、
前記第2学習の結果を出力する、
請求項1に記載の学習装置。 - 前記学習装置は、
所定のタスクに係る一連の動作の制御を学習する学習装置であって、
前記タスクを複数の場面に分割し、分割された前記場面それぞれにおいて、前記一連の動作のうち当該場面において行われる部分動作を特定する分類部をさらに備え、
前記ニューラルネットワークは、前記第2学習及び前記第3学習を、部分動作ごとに実行する、
請求項1に記載の学習装置。 - 所定のコースを周回する車両の自動走行に係る一連の動作について制御を学習する自動走行制御学習装置であって、
前記コースを所定時間以内に所定の回数周回することを目的とする学習目的と、前記制御を学習する際に行われる学習動作の許容要件を含む学習データを受け付ける学習データ受付部と、
前記学習データに基づいて、学習を実行するニューラルネットワークと、
前記ニューラルネットワークによる学習結果を出力する出力部と、
を備え、
前記ニューラルネットワークは、
前記コースを1周できることを達成するための第1学習を実行し、当該第1学習の結果に基づいて、前記学習動作が前記許容要件に適合する制御範囲を学習する第2学習を実行し、当該第2学習の結果に基づいて、前記制御範囲内において、学習目的を達成するための第3学習を実行する、
自動走行制御学習装置。 - 予め定められた載置場所へ所定の対象物を搬送して所定数積み重ね、梱包するタスクに係る一連の動作について制御を学習するロボット制御学習装置であって、
前記タスクをなるべく早く完了させることを目的とする学習目的と、前記制御を学習する際に行われる学習動作の許容要件とを含む学習データを受け付ける学習データ受付部と、
前記学習データに基づいて、学習を実行するニューラルネットワークと、
前記ニューラルネットワークによる学習結果を出力する出力部と、
を備え、
前記ニューラルネットワークは、
前記タスクに係る一連の動作を制御できることを達成するための第1学習を実行し、当該第1学習の結果に基づいて、前記学習動作が前記許容要件に適合する制御範囲を学習する第2学習を実行し、当該第2学習の結果に基づいて、前記制御範囲内において、学習目的を達成するための第3学習を実行する、
ロボット制御学習装置。 - 制御部を備えるコンピュータが実行する、所定のタスクに係る動作の制御を学習する学習方法であって、
前記制御部が、
学習目的と、前記制御を学習する際に行われる学習動作の許容要件とを含む学習データを受け付けるステップと、
前記学習データに基づいて、学習を実行するステップと、
前記学習を実行するステップによる学習結果を出力するステップと、
を実行し、
前記学習を実行するステップは、
前記学習目的の初期段階を達成するための第1学習を実行し、当該第1学習の結果に基づいて、前記学習動作が前記許容要件に適合する制御範囲を学習する第2学習を実行し、前記第2学習の結果に基づいて、前記制御範囲内において、前記学習目的を達成するための第3学習を実行するステップを含む、学習方法。 - 所定のタスクに係る動作の制御を学習するコンピュータに、
学習目的と、前記制御を学習する際に行われる学習動作の許容要件とを含む学習データを受け付ける手順、
前記学習データに基づいて、学習を実行する手順、及び
前記学習を実行する手順による学習結果を出力する手順、
を実行させ、
前記学習を実行する手順は、
前記学習目的の初期段階を達成するための第1学習を実行し、当該第1学習の結果に基づいて、前記学習動作が前記許容要件に適合する制御範囲を学習する第2学習を実行し、前記第2学習の結果に基づいて、前記制御範囲内において、前記学習目的を達成するための第3学習を実行する、手順を含む、
プログラム。 - 所定のタスクを実行する装置であって、
前記装置がタスクを実行するための動作に必要な情報をセンシングする第1センサと、
アクチュエータと、
前記アクチュエータによる前記装置の状態変化をセンシングする第2センサと、
前記第1センサ及び前記第2センサから出力されるセンサ値に基づいて前記アクチュエータを制御する制御部と、
請求項1乃至3の何れか一項に記載された学習装置によって行われた学習結果を記憶する記憶部と、
を備え、
前記制御部は、
前記記憶部に記憶された前記学習結果に基づいて、前記制御範囲に収まるように、前記第1センサ及び前記第2センサから出力されるセンサ値に応じた制御量を決定する、
装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017104528A JP6863082B2 (ja) | 2017-05-26 | 2017-05-26 | 学習装置、学習制御方法、及びそのプログラム |
PCT/JP2018/018133 WO2018216490A1 (en) | 2017-05-26 | 2018-05-10 | Learning apparatus, learning control method, program therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017104528A JP6863082B2 (ja) | 2017-05-26 | 2017-05-26 | 学習装置、学習制御方法、及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018200539A true JP2018200539A (ja) | 2018-12-20 |
JP6863082B2 JP6863082B2 (ja) | 2021-04-21 |
Family
ID=62386888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017104528A Active JP6863082B2 (ja) | 2017-05-26 | 2017-05-26 | 学習装置、学習制御方法、及びそのプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6863082B2 (ja) |
WO (1) | WO2018216490A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020104584A (ja) * | 2018-12-26 | 2020-07-09 | トヨタ自動車株式会社 | 車両の制御装置 |
JPWO2021033315A1 (ja) * | 2019-08-22 | 2021-02-25 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05119815A (ja) * | 1991-10-28 | 1993-05-18 | Toshiba Corp | 神経回路網を用いた障害物回避方法 |
JPH0660300A (ja) * | 1992-08-04 | 1994-03-04 | Takata Kk | 神経回路網による衝突予防予測システム |
JP2002310283A (ja) * | 2001-04-10 | 2002-10-23 | Mitsubishi Electric Corp | 自動変速装置の異常検出装置 |
JP2004017256A (ja) * | 2002-06-19 | 2004-01-22 | Toyota Motor Corp | 人間と共存するロボットの制御装置と制御方法 |
JP2008045651A (ja) * | 2006-08-14 | 2008-02-28 | Toyota Central Res & Dev Lab Inc | 変速シミュレーション装置、変速シミュレーションプログラムおよび自動車 |
US20150127155A1 (en) * | 2011-06-02 | 2015-05-07 | Brain Corporation | Apparatus and methods for operating robotic devices using selective state space training |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3433465B2 (ja) | 1993-04-02 | 2003-08-04 | 日本電信電話株式会社 | ロボットの学習制御方法 |
US9015093B1 (en) * | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
-
2017
- 2017-05-26 JP JP2017104528A patent/JP6863082B2/ja active Active
-
2018
- 2018-05-10 WO PCT/JP2018/018133 patent/WO2018216490A1/en active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05119815A (ja) * | 1991-10-28 | 1993-05-18 | Toshiba Corp | 神経回路網を用いた障害物回避方法 |
JPH0660300A (ja) * | 1992-08-04 | 1994-03-04 | Takata Kk | 神経回路網による衝突予防予測システム |
JP2002310283A (ja) * | 2001-04-10 | 2002-10-23 | Mitsubishi Electric Corp | 自動変速装置の異常検出装置 |
JP2004017256A (ja) * | 2002-06-19 | 2004-01-22 | Toyota Motor Corp | 人間と共存するロボットの制御装置と制御方法 |
JP2008045651A (ja) * | 2006-08-14 | 2008-02-28 | Toyota Central Res & Dev Lab Inc | 変速シミュレーション装置、変速シミュレーションプログラムおよび自動車 |
US20150127155A1 (en) * | 2011-06-02 | 2015-05-07 | Brain Corporation | Apparatus and methods for operating robotic devices using selective state space training |
Non-Patent Citations (1)
Title |
---|
近藤 敏之 TOSHIYUKI KONDO: "拘束ルール抽出機構を用いた自律移動ロボットの段階的行動学習 An Incremental Behavior Learning Using C", 計測自動制御学会論文集 第40巻 第3号 TRANSACTIONS OF THE SOCIETY OF INSTRUMENT AND CONTROL ENGI, vol. 第40巻, JPN6021006714, JP, ISSN: 0004455902 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020104584A (ja) * | 2018-12-26 | 2020-07-09 | トヨタ自動車株式会社 | 車両の制御装置 |
JP7087995B2 (ja) | 2018-12-26 | 2022-06-21 | トヨタ自動車株式会社 | 車両の制御装置 |
JPWO2021033315A1 (ja) * | 2019-08-22 | 2021-02-25 | ||
JP7334784B2 (ja) | 2019-08-22 | 2023-08-29 | 日本電気株式会社 | ロボット制御システム、ロボット制御方法、及び、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6863082B2 (ja) | 2021-04-21 |
WO2018216490A1 (en) | 2018-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180157973A1 (en) | Method and device for a computerized mechanical device | |
JP2018200539A (ja) | 学習装置、学習制御方法、及びそのプログラム | |
Majewski et al. | Conceptual design of innovative speech interfaces with augmented reality and interactive systems for controlling loader cranes | |
EP3867021B1 (en) | Robot navigation using a high-level policy model and a trained low-level policy model | |
Moosmann et al. | Using deep neural networks to separate entangled workpieces in random bin picking | |
JP6978722B2 (ja) | 学習装置、学習制御方法、及びそのプログラム | |
JP6863081B2 (ja) | 学習装置、学習制御方法、及びそのプログラム | |
EP4192658A1 (en) | Fine-grained industrial robotic assemblies | |
Duan et al. | HRC for dual-robot intelligent assembly system based on multimodal perception | |
CN113590455A (zh) | 用于经由多次迭代训练用于控制装置的控制策略的设备和方法 | |
WO2021258023A1 (en) | Robotic intervention systems | |
CN111356558B (zh) | 用于仿真机器人的制动过程的方法和系统 | |
Kang et al. | Fusion drive: End-to-end multi modal sensor fusion for guided low-cost autonomous vehicle | |
CN116803631A (zh) | 自主系统和由自主系统执行的方法 | |
US11868446B2 (en) | Method of operating neural network model using DRM package and method of processing data using the same | |
Kim et al. | Robot intelligence technology and applications 2012: an edition of the presented papers from the 1st international conference on robot intelligence technology and applications | |
Eiband et al. | Intuitive programming of conditional tasks by demonstration of multiple solutions | |
US20220402121A1 (en) | Control and monitoring of a machine arrangement | |
Yusof et al. | Simulation of mobile robot navigation utilizing reinforcement and unsupervised weightless neural network learning algorithm | |
CN115398352A (zh) | 机器人过程 | |
CN112230618A (zh) | 一种从全局任务自动合成多机器人分布式控制器的方法 | |
WO2021160273A1 (en) | Computing system and method using end-to-end modeling for a simulated traffic agent in a simulation environment | |
Herrero et al. | Parametrization of Compliant, Object-Level Controllers from Human Demonstrations | |
Zhang et al. | Zeroth-Order Optimization Attacks on Deep Reinforcement Learning-Based Lane Changing Algorithms for Autonomous Vehicles. | |
US20180012133A1 (en) | Method and system for behavior control of AI-based systems. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210302 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210315 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6863082 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |