JP7378309B2 - working equipment - Google Patents
working equipment Download PDFInfo
- Publication number
- JP7378309B2 JP7378309B2 JP2020020271A JP2020020271A JP7378309B2 JP 7378309 B2 JP7378309 B2 JP 7378309B2 JP 2020020271 A JP2020020271 A JP 2020020271A JP 2020020271 A JP2020020271 A JP 2020020271A JP 7378309 B2 JP7378309 B2 JP 7378309B2
- Authority
- JP
- Japan
- Prior art keywords
- objects
- unit
- evaluation
- prediction
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 claims description 101
- 238000012545 processing Methods 0.000 claims description 48
- 239000004576 sand Substances 0.000 claims description 22
- 230000008859 change Effects 0.000 claims description 9
- 230000003993 interaction Effects 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 239000013049 sediment Substances 0.000 claims description 6
- 238000004088 simulation Methods 0.000 claims description 5
- 230000032258 transport Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 description 43
- 230000006870 function Effects 0.000 description 36
- 238000000034 method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000011439 discrete element method Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Description
本発明は、作業装置に関する。 The present invention relates to a working device.
特許文献1には、ロボットアームを自動運転するシステムが示されている。このシステムは、オペレータによるロボットアームの操作を機械学習によって模倣した複数の模倣モデルと、周辺環境のデータの分類に基づいて使用する模倣モデルを選択するモデル選択部とを備える。
従来、予測モデルを用いて何らかの状態を予測し、この予測結果に基づいて操作を自動化する自動運転システムがある。しかしながら、従来の自動運転システムによる予測は、単体の物体の動作予測など単純な運動の予測が行われるのみであった。そのため、従来の自動運転システムでは、相互作用して互いの配置が変わるような複数の物体を操作対象として扱うことは困難であった。 Conventionally, there are automatic driving systems that predict certain conditions using predictive models and automate operations based on the predicted results. However, predictions made by conventional autonomous driving systems have only made simple motion predictions, such as predicting the motion of a single object. Therefore, in conventional automatic driving systems, it is difficult to handle multiple objects that interact with each other and change their positions.
本発明は、複数の物体に対する操作を自動化できる作業装置を提供することを目的とする。 An object of the present invention is to provide a work device that can automate operations on a plurality of objects.
(1)
本発明の一態様の作業装置は、
容器に複数の物体を収容する作業装置であって、
前記複数の物体に対する操作が可能な可動部と、
前記複数の物体の状態を取得する状態取得部と、
操作後の前記複数の物体の状態の変化を予測して前記複数の物体に対する操作を決定する操作決定部と、
前記操作決定部が決定した操作を前記可動部に行わせる操作制御部と、
を備え、
前記操作決定部は、前記複数の物体の相互作用による状態変化を含めて、前記可動部による操作後の前記複数の物体の状態を予測する機械学習された予測モデルと、前記予測モデルを用いた予測結果を評価する評価処理部と、を有し、かつ、前記予測モデルを用いた予測と前記評価処理部による評価とに基づいて操作を決定し、
前記評価処理部は、前記容器内の複数の物体間の隙間と、前記容器内の物体の数とに基づいて前記予測結果を評価する。
(2)
本発明のもう一つの態様の作業装置は、
複数の物体として土砂を運搬する作業装置であって、
前記複数の物体に対する操作が可能な可動部と、
前記複数の物体の状態を取得する状態取得部と、
操作後の前記複数の物体の状態の変化を予測して前記複数の物体に対する操作を決定する操作決定部と、
前記操作決定部が決定した操作を前記可動部に行わせる操作制御部と、
を備え、
前記操作決定部は、前記複数の物体の相互作用による状態変化を含めて、前記可動部による操作後の前記複数の物体の状態を予測する機械学習された予測モデルと、前記予測モデルを用いた予測結果を評価する評価処理部と、を有し、かつ、前記予測モデルを用いた予測と前記評価処理部による評価とに基づいて操作を決定し、
前記評価処理部は、前記予測結果の土砂形状と目標の土砂形状との比較に基づいて前記予測結果を評価する。
(3)
本発明のもう一つの態様の作業装置は、
複数の物体に対する操作が可能な可動部と、
前記複数の物体の状態を取得する状態取得部と、
操作後の前記複数の物体の状態の変化を予測して前記複数の物体に対する操作を決定する操作決定部と、
前記操作決定部が決定した操作を前記可動部に行わせる操作制御部と、
前記複数の物体の目標状態のデータを設定可能な設定処理部と、
を備え、
前記操作決定部は、前記複数の物体の相互作用による状態変化を含めて、前記可動部による操作後の前記複数の物体の状態を予測する機械学習された予測モデルと、前記予測モデルを用いた予測結果を評価する評価処理部と、を有し、かつ、前記予測モデルを用いた予測と前記評価処理部による評価とに基づいて操作を決定し、
前記評価処理部は、前記目標状態のデータを用いて前記予測結果を評価する。
(1)
A working device according to one embodiment of the present invention includes:
A working device that stores a plurality of objects in a container,
a movable part capable of operating the plurality of objects;
a state acquisition unit that acquires the states of the plurality of objects;
an operation determining unit that predicts a change in the state of the plurality of objects after the operation and determines an operation for the plurality of objects;
an operation control unit that causes the movable unit to perform the operation determined by the operation determination unit;
Equipped with
The operation determining unit uses a machine-learned prediction model that predicts the states of the plurality of objects after the operation by the movable part, including state changes due to interactions of the plurality of objects, and the prediction model. an evaluation processing unit that evaluates a prediction result, and determines an operation based on the prediction using the prediction model and the evaluation by the evaluation processing unit,
The evaluation processing unit evaluates the prediction result based on gaps between a plurality of objects in the container and the number of objects in the container.
(2)
A working device according to another aspect of the present invention includes:
A working device that transports earth and sand as multiple objects,
a movable part capable of operating the plurality of objects;
a state acquisition unit that acquires the states of the plurality of objects;
an operation determining unit that predicts a change in the state of the plurality of objects after the operation and determines an operation for the plurality of objects;
an operation control unit that causes the movable unit to perform the operation determined by the operation determination unit;
Equipped with
The operation determining unit uses a machine-learned prediction model that predicts the states of the plurality of objects after the operation by the movable part, including state changes due to interactions of the plurality of objects, and the prediction model. an evaluation processing unit that evaluates a prediction result, and determines an operation based on the prediction using the prediction model and the evaluation by the evaluation processing unit,
The evaluation processing unit evaluates the prediction result based on a comparison between the sediment shape of the prediction result and the target sediment shape.
(3)
A working device according to another aspect of the present invention includes:
A movable part that can operate on multiple objects,
a state acquisition unit that acquires the states of the plurality of objects;
an operation determining unit that predicts a change in the state of the plurality of objects after the operation and determines an operation for the plurality of objects;
an operation control unit that causes the movable unit to perform the operation determined by the operation determination unit;
a setting processing unit capable of setting target state data of the plurality of objects;
Equipped with
The operation determining unit uses a machine-learned prediction model that predicts the states of the plurality of objects after the operation by the movable part, including state changes due to interactions of the plurality of objects, and the prediction model. an evaluation processing unit that evaluates a prediction result, and determines an operation based on the prediction using the prediction model and the evaluation by the evaluation processing unit,
The evaluation processing unit evaluates the prediction result using the data of the target state.
本発明によれば、複数の物体に対する操作を自動化できる作業装置を提供できる。 According to the present invention, it is possible to provide a work device that can automate operations on a plurality of objects.
以下、本発明の実施形態について図面を参照して詳細に説明する。 Embodiments of the present invention will be described in detail below with reference to the drawings.
(実施形態1)
図1は、本発明の実施形態1に係る作業装置を示すブロック図である。実施形態1において操作対象の物体は射出成形品やグラス等のワークである。実施形態1の作業装置1は、容器(箱)の中に複数のワークを自動的に収容する装置であり、効率的に多くのワークを容器の中に収めることを目的としている。
(Embodiment 1)
FIG. 1 is a block diagram showing a working device according to
作業装置1は、図1に示すように、複数のワークの位置を取得するための撮影部3と、ワークの操作が可能なロボットハンドなどの可動部2と、可動部2を動かして操作の自動運転を行う制御部10とを備える。撮影部3は、本発明に係る状態取得部の一例に相当する。
As shown in FIG. 1, the
可動部2は、ワークを容器に追加する操作、容器内のワークを動かす操作が可能である。
The
制御部10は、制御プログラムを格納した記憶部と、制御プログラムを実行するCPU(Central Processing Unit)と、撮影部3からの撮像画像の入力と可動部2への制御信号の出力とを行うI/Oとを有するコンピュータである。制御部10では、CPUが制御プログラムを実行することで、幾つかの機能モジュールが実現される。機能モジュールには、可動部2の操作を決定する操作決定部11と、可動部2を動かして操作決定部11が決定した操作を実行させる操作制御部12とが含まれる。
The
操作決定部11には、可動部2がワークに操作を加えた場合に複数のワークの状態の変化を予測する機械学習された予測モデル111と、複数のワークの状態の評価を行う評価処理部112とが含まれる。
The
予測モデル111は、相互に影響しあう複数の物体(ワーク等)に対して或る操作を行った後の当該複数の物体の状態を予測する。予測モデル111は、例えば多体問題のシミュレーションを機械学習により近似したニューラルネットワークを適用できる。
The
評価処理部112は、予測モデル111が予測した複数の物体(ワーク等)の状態についての評価を行う。評価処理部112は、複数の物体の状態が望ましい状態であるほど高い評価値を出力するように設計される。望ましい状態は、例えば目標の状態に速く近づく状態であってもよい。評価処理部112は、評価関数を用いて、複数の物体(ワーク等)の状態の評価を行う。評価関数はユーザが設定入力可能に構成されてもよい。
The
操作決定部11は、予測モデル111の予測結果と評価処理部112の評価に基づいて、可動部2の次の操作を決定する。操作決定部11は、例えば、複数の操作ステップ先を予測ホライズンとし、予測ホライズンにおける複数の物体の状態の予測結果と評価に基づいて、次の操作ステップを決定する。操作決定部11は、様々な組み合わせの操作を選択して複数通りの予測ホライズンの状態予測及び評価を、予測モデル111及び評価処理部112を用いて実行させ、その評価を比較する。そして、評価が最も高い予測ホライズンを見つけ、当該予測ホライズンの1つ目の操作ステップの操作を、次の操作として決定する。
The
操作制御部12は、可動部2を動かして操作決定部11が決定した操作を実行させる。
The
続いて、予測モデル111及び評価処理部112の具体的な一例を説明する。本発明に係る予測モデル及び評価処理部は、以下の具体的に限定されるものでない。
Next, a specific example of the
<予測モデル>
予測モデル111においては、i番目の物体(ワーク等)の状態ベクトルをxi
kと記述し、その集合をXk={xi
k|i=1,…,Nk}と記述する。さらに、物体に加える操作をukと記述する。添え字kは、離散時間を表わす。予測モデル111のニューラルネットワークは、次式(1)のように、或る離散時間k-1の物体の状態ベクトル集合Xk-1と操作ukとを入力とし、次の離散時間kの物体の状態ベクトル集合Xkを出力とする関数fとして表わすことができる。
In the
予測モデル111には、多体問題に適した具体例として、例えば、Chang, Michael B. et al., "A compositional object-based approach to learning physical dynamic.", arXiv preprint arXiv:1612.00341 (2016). ICLR2017. に記載のニューラルネットワークを適用できる。上記の文献には、多体問題のシミュレーションを扱うニューラルネットワークが示されている。予測モデル111の機械学習を行う場合、複数の物体に対して様々なパターンの操作を試行したシミュレーションデータから、多くの学習データセット{Xk、Xk-1、uk-1}を用意する。シミュレーションには、Distinct Element Methodなどを用いることができる。{Xk-1、uk-1}は訓練用入力データであり、{Xk}は目標値である。ニューラルネットワークに学習データセットを与えて、バックプロパゲーション(誤差逆伝播法)等により、各パラメータを最適化することで、機械学習された予測モデル111が得られる。
The
物体の状態ベクトルxi kは、複数の要素、例えば、ワークか否か、壁面か否か、ロボットアームか否か、二次元上の位置、二次元方向の速度、基準点からの方位θ、基準点を中心とする角加速度ω、等々を有してもよい。状態ベクトルxi kが、物体の種類を示す要素を有することで、状態ベクトルxi kにより、ワークだけでなく、容器の壁面、可動部2(ロボットアーム)など、他の物体の状態を表わすことができる。そして、状態ベクトル集合Xkに、他の物体の状態を含めることができる。 The state vector x i k of the object includes multiple elements, such as whether it is a workpiece, whether it is a wall surface, whether it is a robot arm or not, a two-dimensional position, a two-dimensional velocity, an orientation θ from a reference point, It may have an angular acceleration ω centered on the reference point, and so on. Since the state vector x i k has an element indicating the type of object, the state vector x i k represents the state of not only the workpiece but also other objects such as the wall of the container and the movable part 2 (robot arm). be able to. The states of other objects can be included in the state vector set Xk .
物体に加える操作ukは、複数の要素、例えば、可動部2による操作の種類akと、可動部2による操作量vkを有する。操作の種類akには、容器にワークを投入する操作、容器内のワークを動かす操作などが含まれる。操作量vkは、可動部2によりワークを移動する方向と長さの情報である。
The operation u k applied to the object has a plurality of elements, for example, the type of operation a k by the
<評価処理部>
評価処理部112は、評価関数Lを有し、状態ベクトル集合Xkを入力して、評価値を出力する。評価関数Lは、状態ベクトル集合Xkが、目標状態に速やかに近づく状態であれば高い評価値に、その逆であれば低い評価値が得られるように設計される。実施形態1では、容器に多くのワークが詰め込める状態が高い評価値となるように評価関数Lが設計される。評価関数Lは、複数の物体に及ぼす操作の種類が複数あれば、操作の種類ごとの項を有してもよい。
<Evaluation processing section>
The
<容器内でワークを押して隙間を空ける操作の評価関数LA>
隙間を空ける操作に関する評価関数LAは、大きな隙間が得られた場合に、高い評価値が得られるように設計されればよい。大きな隙間により、ワークの投入が可能となるためである。評価関数LAを作成するため、先ず、任意な点pと各部との距離を示すベクトルdを導入する。図2は、ベクトルdを説明する図である。
The evaluation function LA related to the operation of creating a gap may be designed so that a high evaluation value is obtained when a large gap is obtained. This is because the large gap makes it possible to insert the workpiece. In order to create the evaluation function LA , first, a vector d indicating the distance between an arbitrary point p and each part is introduced. FIG. 2 is a diagram illustrating the vector d.
ここで、pは容器内の任意な点の位置ベクトル、Dpは2点間の距離を表わす関数、Dlは1点と直線との距離を表わす関数、y1~yMは容器内の各ワークの位置ベクトル、b1~bLは容器の各壁の位置角度平面長さを特定できる量である。ベクトルdの各要素は、任意な点pと各ワークとの距離、並びに、任意な点pと容器の各壁との距離を示す。図2に示すように、容器C1内にM=8個のワークWがあり、容器C1の壁がL=4面であれば、集合Yの元はy1~y8となり、集合Bの元はb1~b4となり、ベクトルdは、M+L=12の要素を有することとなる。 Here, p is a position vector of an arbitrary point in the container, D p is a function representing the distance between two points, D l is a function representing the distance between one point and a straight line, and y 1 to y M are the position vectors of arbitrary points in the container. The position vectors b 1 to b L of each workpiece are quantities that can specify the position angle plane length of each wall of the container. Each element of the vector d indicates the distance between an arbitrary point p and each workpiece, and the distance between an arbitrary point p and each wall of the container. As shown in FIG. 2, if there are M=8 workpieces W in the container C1 and the walls of the container C1 are L=4, the elements of the set Y are y 1 to y 8 , and the elements of the set B are is b 1 to b 4 , and vector d has M+L=12 elements.
ベクトルdの全要素が大きい値であれば、点pの周囲に大きな隙間があることが示される。一方、ベクトルdの要素に大きな値と小さな値とが含まれる場合、大きな値が示す間隔内に、小さな値が示す間隔離れたワークが存在する可能性がある。この場合、大きな値が示す間隔は隙間とはならず、隙間を評価する上で、影響度が低くなる。そこで、このような影響の重みを表わすベクトルηを導入する。
ここで、[]gは、g個の要素を有するベクトルを示す。gは、1、…、M、M+1、…、M+Lであり、ベクトルηの要素数はベクトルdの要素数と一致する。dhは、ベクトルdのh番目の要素を示す。αとcは調整用の定数であり、実際のワークに合わせて、適宜定められる。ベクトルηの式は、遠方のワーク又は壁までの隙間については、評価の値が割り引かれるような重みを表わす。 Here, [ ] g indicates a vector having g elements. g is 1, . . . , M, M+1, . . . , M+L, and the number of elements of vector η matches the number of elements of vector d. d h indicates the h-th element of vector d. α and c are constants for adjustment, and are appropriately determined according to the actual workpiece. The expression for the vector η represents a weight such that the evaluation value is discounted for a distant workpiece or a gap to a wall.
さらに、上記のベクトルd、ηを用いて、次式(6)のように、関数γを導入する。関数γは、任意な点pにおける隙間の大きさの推測値を与える関数であり、ワーク又は壁までの距離を示すベクトルdと、間隔が隙間に与える影響度の重みを示すベクトルηとで、同一要素同士を掛け合わせて総和をとる。関数γは、任意な点pと、容器内の全ワークの位置ベクトルの集合Bと、容器の全壁を特定する情報の集合Yと、を引数として持つ。
評価関数LAは、関数γを用いて、次式(7)のように、任意な点pの中で最大となるηとして定義される。
<ワークを容器内に投入する操作の評価関数LB>
ワークを投入する操作に関する評価関数LBは、ワークの数が増えれば高い評価値が得られるように設計されればよい。このため、評価関数LBは、次式(8)のように、ワークの数(集合Yの元の数)と定義できる。
The evaluation function LB related to the operation of inserting the workpieces may be designed so that a higher evaluation value can be obtained as the number of workpieces increases. Therefore, the evaluation function LB can be defined as the number of works (the number of elements of the set Y) as shown in the following equation (8).
<総合の評価関数L>
総合の評価関数Lは、容器内でワークを押して隙間を空ける操作と、ワークを容器内に投入する操作との、どちらを選ぶかの評価が可能なように設計されればよい。総合の評価関数Lは、次式(9)のように、各操作に関する評価関数LA、LBを重み付けして結合することで定義できる。μは、正の重みを示す定数である。
The overall evaluation function L may be designed such that it is possible to evaluate whether to select an operation of pushing the workpiece in the container to create a gap or an operation of throwing the workpiece into the container. The overall evaluation function L can be defined by weighting and combining the evaluation functions L A and L B regarding each operation, as shown in the following equation (9). μ is a constant indicating positive weight.
評価値をコスト値(良くない値)として扱う場合には、上記評価関数Lの符号を反転させればよい。 When treating the evaluation value as a cost value (bad value), the sign of the evaluation function L may be reversed.
<作業処理>
図3は、制御部が実行する作業処理の手順を示すフローチャートである。図4は、第1の操作と評価の一例を示す説明図である。図5は、第2の操作と評価の一例を示す説明図である。
<Work processing>
FIG. 3 is a flowchart showing the procedure of work processing executed by the control unit. FIG. 4 is an explanatory diagram showing an example of the first operation and evaluation. FIG. 5 is an explanatory diagram showing an example of the second operation and evaluation.
例えばユーザからの開始要求があった場合に、制御部10は作業処理を開始する。作業処理が開始されると、制御部10は、先ず、撮影部3の撮影画像を取得して、複数の物体の状態を検出する(ステップS1)。実施形態1では、複数の物体は操作ステップごとに一旦静止するので、ステップS1では、状態として複数の物体の位置が取得される。
For example, when a start request is received from a user, the
次に、制御部10では、操作決定部11が、ステップS1で取得された状態から、予測に使用する状態ベクトルxi
k-1の集合Xk-1を、初期化、すなわち、ステップS1で取得された状態の値にセットする(ステップS2)。
Next, in the
次に、操作決定部11は、状態ベクトル集合Xk-1に適用できる操作を選択する(ステップS3)。例えば、図4及び図5に示すように、離散時間k-1の状態ベクトル集合Xk-1(容器C1の中に複数のワークWが配置された状態)であれば、一定以上の隙間に新たにワークWを投入するという操作と、容器C1内のいずれかのワークWをどれだけどの方向に押すという操作が選択可能であり、これらの操作の中から、いずれかの操作を選択する。選択は、ランダムに行われてもよいし、分散した選択がなされてもよいし、理想の操作の範囲が予め分かっていれば理想の範囲内の操作が多く選択されるようにされてもよい。図4は、矢印A1の可動部2の動きによって1つのワークW1を押す操作が選択された例を示している。図5は、新たなワークW2を投入する操作が選択された例を示している。
Next, the
次に操作決定部11は、状態ベクトル集合Xk-1と選択された操作uk-1とから次の離散時間kの状態ベクトル集合Xkを予測する(ステップS4)。予測は、予測モデル111を用いて行われる。
Next, the
次に操作決定部11は、予め定められた最大予測ステップ(予測ホライズン)まで予測が到達したか判別し(ステップS5)、NOであれば、処理をステップS3に戻して、ステップS3~S5の処理を繰り返す。予測ホライズンが大きなステップ数になると、演算負荷が高まるので、予測ホライズンは適宜なステップ数に定められるとよい。例えば3ステップ程度としてもよい。
Next, the
ステップS3~S5の繰り返しにより、ステップS2の初期化された状態から、複数回の操作を加えた予測ホライズン(例えば3操作ステップ先)の状態ベクトル集合Xk+2が推測される。図4及び図5は、予測ホライズンを1操作ステップ先とした例を示している。 By repeating steps S3 to S5, a state vector set X k+2 of a prediction horizon (for example, three operation steps ahead) obtained by adding a plurality of operations is estimated from the initialized state of step S2. 4 and 5 show an example in which the prediction horizon is one operation step ahead.
ステップS5でYESと判別されると、操作決定部11は、評価処理部112により予測された状態ベクトル集合Xk+2の評価値を計算させる(ステップS6)。評価処理部112は、評価関数Lに状態ベクトル集合Xk+2を入力して、評価値を計算する。図4及び図5は、予測ホライズンが1操作ステップ先なので、評価値を計算する状態ベクトル集合はXkとなる。図4の例では、予測された状態ベクトル集合Xkから計算された評価関数LAの値が向上し、総合の評価も向上したため、選択された操作uk-1が良い操作と判定されている。図5の例では、予測された状態ベクトル集合Xkから計算された評価関数LBの値が向上し、隙間に関する評価関数LAの増減と合わせて、総合の評価が向上したため、選択された操作uk-1が良い操作と判定されている。操作の選択により、高低さまざまな評価値が計算される。
If YES is determined in step S5, the
続いて、操作決定部11は、ステップS6の評価が、予め定められた最大評価回数に達したか判別し、NOであれば、処理をステップS2に戻して、ステップS2からの処理を繰り返す。ステップS2~S7の繰り返しにより、最大評価回数分の様々な操作に対する予測結果とそれに基づく評価値が得られる。
Subsequently, the
ステップS7でYESとなると、操作決定部11は、ステップS2~S7の繰り返しにより得られた最大評価回数分の評価値を比較し、最も評価値が高い予測ホライズンで選択されていた第1操作ステップの操作を、次に実行する操作として選択する(ステップS8)。
If YES in step S7, the
制御部10では、操作決定部11が次の操作を決定したら、操作制御部12が、可動部2を制御して操作を実行させる(ステップS9)。そして、制御部10は、終了条件に達したか否かを判別し(ステップS10)、達していれば作業処理を終了し、達していなければ、処理をステップS1に戻して、ステップS1からの処理を繰り返す。終了条件は、例えば、操作の実行後に計測された状態ベクトル集合Xkに基づく条件(例えば、容器内のワークの個数が最大詰込み数に達した等)、あるいは、最大繰り返し回数に達した場合等から適宜定められればよい。
In the
ステップS1~S9の処理が繰り返されることで、評価関数Lの値を高くする操作が選択されかつ実行されていき、作業の目的を達成する自動運転が実現される。 By repeating the processing of steps S1 to S9, an operation that increases the value of the evaluation function L is selected and executed, and automatic operation that achieves the purpose of the work is realized.
以上のように、実施形態1の作業装置1によれば、複数のワークの操作が可能な可動部2と、複数のワークの位置を取得する撮影部3と、操作後の複数のワークの配置を予測して複数のワークに対する可動部2の操作を決定する操作決定部11と、操作決定部11が決定した操作を可動部2に行わせる操作制御部12とを備える。したがって、相互に作用する複数のワークに対して、目標の作業(容器に多くのワークを詰める動作等)を達成する自動運転を実現できる。
As described above, according to the working
さらに、実施形態1の作業装置1によれば、複数のワークの相互作用による配置変化を含めて操作後の複数のワークの状態を予測する機械学習された予測モデル111と、予測された複数のワークの状態を評価する評価処理部112とを備え、予測と評価とに基づき次に実行する操作を決定する。したがって、目的に沿った操作の決定を小さな演算負荷で決定することができる。
Further, according to the working
そして、実施形態1の作業装置1により、容器にワークを詰めて収容する操作を自動化できる。
The
(実施形態2)
図6は、本発明の実施形態2に係る作業装置を示すブロック図である。実施形態2の作業装置1は、土砂を自動的に運搬する装置であり、目標の土砂形状の生成を効率的に行うことを目的としている。実施形態2では操作対象の物体、並びに、状態が予測される物体として、土砂が適用される。
(Embodiment 2)
FIG. 6 is a block diagram showing a working device according to
作業装置1は、図6に示すように、可動部2Aがパワーショベル(ショベル、クローラ、旋回装置等)であり、さらに、制御部10には、ユーザが目標状態の設定データを設定できる設定処理部13が追加されている。設定処理部13は、目標状態の設定データを格納する設定部131を有する。その他の構成要素は、実施形態1と同様である。
As shown in FIG. 6, in the working
予測モデル111は、複数の物体の状態として土砂の配置や密度が適用され、土砂をすくう、すくった土砂を運搬する、土砂を下す等の各操作を行った場合の土砂の状態を予測する。予測モデル111は、機械学習されたニューラルネットワークを適用できる。土砂の操作に対しては、操作箇所から遠いところにある土砂への相互作用が少ないことから、予測モデル111は、相互作用が非常に少ないエリアの物体に関する計算がスクリーニングにより外されるように、演算量を削減する機能を有していてもよい。また、土砂の一粒一粒を物体の単位とすると、演算量が膨大になるため、予測モデル111は、予め定めた土砂のまとまりを物体の単位として扱うようにしてもよい。
The
評価処理部112は、実施形態1と同様に予め設計された評価関数に基づき、予測された土砂の配置状態について評価値を計算する。評価関数には、設定部131に登録された目標状態データを使用した関数が含まれ、例えば、予測された土砂形状と目標の土砂形状との差が小さいほど高い評価値が得られる関数を含む。
The
図7は、実施形態2の作業装置の自動運転処理を説明する図である。図7のラインL0は設定部131に登録された目標の土砂形状を示す。実施形態2の作業装置1においても、実施形態1と同様に、制御部10が作業処理の中で、予測モデル111を用いた土砂の配置の予測と、評価処理部112により計算された評価値とに基づいて、操作決定部11が操作を決定し、操作制御部12がその操作を可動部2Aに実行させる。そして、このような操作が繰り返されることで、目標の土砂形状に合わせた土砂の運搬が自動運転により実現される。
FIG. 7 is a diagram illustrating automatic operation processing of the working device according to the second embodiment. A line L0 in FIG. 7 indicates the target earth and sand shape registered in the
以上のように、実施形態2の作業装置1によれば、ユーザが目標状態データを設定できる設定処理部13を備え、評価処理部112は目標状態データを用いて評価値を計算する。したがって、目標状態(目標の土砂形状)が変わる現場に対して、目標状態データの設定により、各現場に対応することができる。
As described above, the working
以上、本発明の各実施形態について説明した。しかし、本発明は上記の実施形態に限られない。例えば、上記実施形態では、操作後に静止する物体を操作対象としたため、状態取得部が取得する物体の状態、並びに、予測モデルが予測する物体の状態として、物体の位置が採用された例を示した。しかし、操作対象の物体は、運動する物体、温度、摩擦抵抗、重量、電流、電圧等の様々な物理量が変化する物体であってもよい。この場合、状態取得部が取得する物体の状態、並びに、予測モデルが予測する物体の状態には、位置の他、速度、各速度、並びに、様々な物理量が含まれてもよい。予測モデルは、物体の状態ベクトルにこれらの物理量を含めて予測を行えばよい。また、状態取得部は、これらの物理量を測定する装置が適用されればよい。その他、実施の形態で示した細部は、発明の趣旨を逸脱しない範囲で適宜変更可能である。 Each embodiment of the present invention has been described above. However, the present invention is not limited to the above embodiments. For example, in the above embodiment, since the operation target is an object that remains stationary after being operated, an example is shown in which the position of the object is adopted as the state of the object acquired by the state acquisition unit and the state of the object predicted by the prediction model. Ta. However, the object to be operated may be a moving object, an object in which various physical quantities such as temperature, frictional resistance, weight, current, voltage, etc. change. In this case, the state of the object acquired by the state acquisition unit and the state of the object predicted by the prediction model may include, in addition to position, velocity, each velocity, and various physical quantities. The prediction model may perform prediction by including these physical quantities in the state vector of the object. Moreover, a device that measures these physical quantities may be applied to the state acquisition unit. Other details shown in the embodiments can be changed as appropriate without departing from the spirit of the invention.
1 作業装置
2、2A 可動部
3 撮影部
10 制御部
11 操作決定部
12 操作制御部
111 予測モデル
112 評価処理部
C1 容器
W、W1、W2 ワーク
1 Working
Claims (7)
前記複数の物体に対する操作が可能な可動部と、
前記複数の物体の状態を取得する状態取得部と、
操作後の前記複数の物体の状態の変化を予測して前記複数の物体に対する操作を決定する操作決定部と、
前記操作決定部が決定した操作を前記可動部に行わせる操作制御部と、
を備え、
前記操作決定部は、前記複数の物体の相互作用による状態変化を含めて、前記可動部による操作後の前記複数の物体の状態を予測する機械学習された予測モデルと、前記予測モデルを用いた予測結果を評価する評価処理部と、を有し、かつ、前記予測モデルを用いた予測と前記評価処理部による評価とに基づいて操作を決定し、
前記評価処理部は、前記容器内の複数の物体間の隙間と、前記容器内の物体の数とに基づいて前記予測結果を評価する、
作業装置。 A working device that stores a plurality of objects in a container,
a movable part capable of operating the plurality of objects;
a state acquisition unit that acquires the states of the plurality of objects;
an operation determining unit that predicts a change in the state of the plurality of objects after the operation and determines an operation for the plurality of objects;
an operation control unit that causes the movable unit to perform the operation determined by the operation determination unit;
Equipped with
The operation determining unit uses a machine-learned prediction model that predicts the states of the plurality of objects after the operation by the movable part, including state changes due to interactions of the plurality of objects, and the prediction model. an evaluation processing unit that evaluates a prediction result, and determines an operation based on the prediction using the prediction model and the evaluation by the evaluation processing unit,
The evaluation processing unit evaluates the prediction result based on the gaps between the plurality of objects in the container and the number of objects in the container.
working equipment.
前記複数の物体に対する操作が可能な可動部と、
前記複数の物体の状態を取得する状態取得部と、
操作後の前記複数の物体の状態の変化を予測して前記複数の物体に対する操作を決定する操作決定部と、
前記操作決定部が決定した操作を前記可動部に行わせる操作制御部と、
を備え、
前記操作決定部は、前記複数の物体の相互作用による状態変化を含めて、前記可動部による操作後の前記複数の物体の状態を予測する機械学習された予測モデルと、前記予測モデルを用いた予測結果を評価する評価処理部と、を有し、かつ、前記予測モデルを用いた予測と前記評価処理部による評価とに基づいて操作を決定し、
前記評価処理部は、前記予測結果の土砂形状と目標の土砂形状との比較に基づいて前記予測結果を評価する、
作業装置。 A working device that transports earth and sand as multiple objects,
a movable part capable of operating the plurality of objects;
a state acquisition unit that acquires the states of the plurality of objects;
an operation determining unit that predicts a change in the state of the plurality of objects after the operation and determines an operation for the plurality of objects;
an operation control unit that causes the movable unit to perform the operation determined by the operation determination unit;
Equipped with
The operation determining unit uses a machine-learned prediction model that predicts the states of the plurality of objects after the operation by the movable part, including state changes due to interactions of the plurality of objects, and the prediction model. an evaluation processing unit that evaluates a prediction result, and determines an operation based on the prediction using the prediction model and the evaluation by the evaluation processing unit,
The evaluation processing unit evaluates the prediction result based on a comparison between the sediment shape of the prediction result and the target sediment shape.
working equipment.
前記複数の物体の状態を取得する状態取得部と、
操作後の前記複数の物体の状態の変化を予測して前記複数の物体に対する操作を決定する操作決定部と、
前記操作決定部が決定した操作を前記可動部に行わせる操作制御部と、
前記複数の物体の目標状態のデータを設定可能な設定処理部と、
を備え、
前記操作決定部は、前記複数の物体の相互作用による状態変化を含めて、前記可動部による操作後の前記複数の物体の状態を予測する機械学習された予測モデルと、前記予測モデルを用いた予測結果を評価する評価処理部と、を有し、かつ、前記予測モデルを用いた予測と前記評価処理部による評価とに基づいて操作を決定し、
前記評価処理部は、前記目標状態のデータを用いて前記予測結果を評価する作業装置。 A movable part that can operate on multiple objects,
a state acquisition unit that acquires the states of the plurality of objects;
an operation determining unit that predicts a change in the state of the plurality of objects after the operation and determines an operation for the plurality of objects;
an operation control unit that causes the movable unit to perform the operation determined by the operation determination unit;
a setting processing unit capable of setting target state data of the plurality of objects;
Equipped with
The operation determining unit uses a machine-learned prediction model that predicts the states of the plurality of objects after the operation by the movable part, including state changes due to interactions of the plurality of objects, and the prediction model. an evaluation processing unit that evaluates a prediction result, and determines an operation based on the prediction using the prediction model and the evaluation by the evaluation processing unit,
The evaluation processing unit is a work device that evaluates the prediction result using data of the target state .
前記可動部の操作によって容器に複数の物体を収容する、
請求項1から請求項3のいずれか一項に記載の作業装置。 The movable part is a robot hand,
accommodating a plurality of objects in a container by operating the movable part;
The working device according to any one of claims 1 to 3 .
前記複数の物体は土砂であり、
前記可動部の操作によって土砂を運搬する、
請求項2又は請求項3に記載の作業装置。 The movable part is a shovel,
the plurality of objects are earth and sand;
transporting the earth and sand by operating the movable part;
The working device according to claim 2 or 3 .
請求項1から請求項5のいずれか一項に記載の作業装置。 The prediction model is a neural network that handles simulation of many-body problems.
The working device according to any one of claims 1 to 5 .
前記複数の物体の一部の配置の変更操作、物体の追加操作、又はこれら両方を含む操作を決定する、
請求項1から請求項6のいずれか一項に記載の作業装置。 The operation determining unit includes:
determining an operation to change the arrangement of some of the plurality of objects, an operation to add an object, or an operation including both;
The working device according to any one of claims 1 to 6 .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020020271A JP7378309B2 (en) | 2020-02-10 | 2020-02-10 | working equipment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020020271A JP7378309B2 (en) | 2020-02-10 | 2020-02-10 | working equipment |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021122924A JP2021122924A (en) | 2021-08-30 |
JP7378309B2 true JP7378309B2 (en) | 2023-11-13 |
Family
ID=77458886
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020020271A Active JP7378309B2 (en) | 2020-02-10 | 2020-02-10 | working equipment |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7378309B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114083545B (en) * | 2022-01-24 | 2022-07-01 | 之江实验室 | Moving object robot grabbing method and device based on visual perception |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10226140A1 (en) | 2002-06-13 | 2004-01-08 | Kuka Roboter Gmbh | Method, for preventing collisions between industrial robots and other objects, involves checking predicted path configuration by distance/obstruction algorithms, stopping robot/other objects if collision impending |
JP2019042828A (en) | 2017-08-30 | 2019-03-22 | 株式会社ダイフク | Picking facility |
JP2019155561A (en) | 2018-03-15 | 2019-09-19 | オムロン株式会社 | Operation control device of robot |
JP2019181620A (en) | 2018-04-10 | 2019-10-24 | 株式会社Ihi | Storage system and storage method |
JP2019214112A (en) | 2018-06-14 | 2019-12-19 | ヤマハ発動機株式会社 | Machine learning device, and robot system equipped with the same |
-
2020
- 2020-02-10 JP JP2020020271A patent/JP7378309B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10226140A1 (en) | 2002-06-13 | 2004-01-08 | Kuka Roboter Gmbh | Method, for preventing collisions between industrial robots and other objects, involves checking predicted path configuration by distance/obstruction algorithms, stopping robot/other objects if collision impending |
JP2019042828A (en) | 2017-08-30 | 2019-03-22 | 株式会社ダイフク | Picking facility |
JP2019155561A (en) | 2018-03-15 | 2019-09-19 | オムロン株式会社 | Operation control device of robot |
JP2019181620A (en) | 2018-04-10 | 2019-10-24 | 株式会社Ihi | Storage system and storage method |
JP2019214112A (en) | 2018-06-14 | 2019-12-19 | ヤマハ発動機株式会社 | Machine learning device, and robot system equipped with the same |
Also Published As
Publication number | Publication date |
---|---|
JP2021122924A (en) | 2021-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109399122B (en) | Control device and machine learning device | |
US10261497B2 (en) | Machine tool for generating optimum acceleration/deceleration | |
JP6169655B2 (en) | Machine tool, simulation device, and machine learning device | |
CN106552974B (en) | Wire electric discharge machine having movable shaft abnormal load warning function | |
JP6744208B2 (en) | Control device and control method | |
Cully et al. | Behavioral repertoire learning in robotics | |
Arruda et al. | Uncertainty averse pushing with model predictive path integral control | |
EP3424650B1 (en) | A method and apparatus for performing control of a movement of a robot arm | |
Zhu et al. | Fast model identification via physics engines for data-efficient policy search | |
JP6077617B1 (en) | Machine tools that generate optimal speed distribution | |
CN111868758B (en) | Information processing device, information processing method, and storage medium | |
US11897066B2 (en) | Simulation apparatus | |
JPWO2021053784A1 (en) | Motor control device and motor control method | |
JP7295421B2 (en) | Control device and control method | |
Delgado et al. | Robotics in construction: A critical review of the reinforcement learning and imitation learning paradigms | |
CN112638596A (en) | Autonomous learning robot device and method for generating operation of autonomous learning robot device | |
JP7378309B2 (en) | working equipment | |
JP2021501433A (en) | Generation of control system for target system | |
CN108687766B (en) | Robot control device, machine learning device, and machine learning method | |
Köker | Design and performance of an intelligent predictive controller for a six-degree-of-freedom robot using the Elman network | |
Agboh et al. | Robust physics-based manipulation by interleaving open and closed-loop execution | |
Ding et al. | Learning to ground objects for robot task and motion planning | |
CN115857323A (en) | Apparatus and method for controlling agent | |
EP3904973A1 (en) | Device and method for controlling a robot | |
JP2004164426A (en) | Output control method, output control system, and output control program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230829 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231003 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7378309 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |