JP6663538B1 - Machine learning device - Google Patents
Machine learning device Download PDFInfo
- Publication number
- JP6663538B1 JP6663538B1 JP2019508980A JP2019508980A JP6663538B1 JP 6663538 B1 JP6663538 B1 JP 6663538B1 JP 2019508980 A JP2019508980 A JP 2019508980A JP 2019508980 A JP2019508980 A JP 2019508980A JP 6663538 B1 JP6663538 B1 JP 6663538B1
- Authority
- JP
- Japan
- Prior art keywords
- reward
- state
- value
- control
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 46
- 238000003754 machining Methods 0.000 claims abstract description 182
- 230000006870 function Effects 0.000 claims description 126
- 238000004364 calculation method Methods 0.000 claims description 59
- 230000007423 decrease Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 description 184
- 230000009471 action Effects 0.000 description 61
- 238000000034 method Methods 0.000 description 41
- 230000008859 change Effects 0.000 description 36
- 238000010586 diagram Methods 0.000 description 33
- 230000008569 process Effects 0.000 description 33
- 238000003860 storage Methods 0.000 description 22
- 238000009826 distribution Methods 0.000 description 17
- 238000005457 optimization Methods 0.000 description 15
- 230000006399 behavior Effects 0.000 description 11
- 238000002789 length control Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 230000003746 surface roughness Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000006872 improvement Effects 0.000 description 4
- 230000002787 reinforcement Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000009760 electrical discharge machining Methods 0.000 description 2
- 239000007772 electrode material Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 206010028197 multiple epiphyseal dysplasia Diseases 0.000 description 2
- 230000004043 responsiveness Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B23—MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
- B23H—WORKING OF METAL BY THE ACTION OF A HIGH CONCENTRATION OF ELECTRIC CURRENT ON A WORKPIECE USING AN ELECTRODE WHICH TAKES THE PLACE OF A TOOL; SUCH WORKING COMBINED WITH OTHER FORMS OF WORKING OF METAL
- B23H1/00—Electrical discharge machining, i.e. removing metal with a series of rapidly recurring electrical discharges between an electrode and a workpiece in the presence of a fluid dielectric
- B23H1/02—Electric circuits specially adapted therefor, e.g. power supply, control, preventing short circuits or other abnormal discharges
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B23—MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
- B23H—WORKING OF METAL BY THE ACTION OF A HIGH CONCENTRATION OF ELECTRIC CURRENT ON A WORKPIECE USING AN ELECTRODE WHICH TAKES THE PLACE OF A TOOL; SUCH WORKING COMBINED WITH OTHER FORMS OF WORKING OF METAL
- B23H7/00—Processes or apparatus applicable to both electrical discharge machining and electrochemical machining
- B23H7/14—Electric circuits specially adapted therefor, e.g. power supply
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B23—MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
- B23H—WORKING OF METAL BY THE ACTION OF A HIGH CONCENTRATION OF ELECTRIC CURRENT ON A WORKPIECE USING AN ELECTRODE WHICH TAKES THE PLACE OF A TOOL; SUCH WORKING COMBINED WITH OTHER FORMS OF WORKING OF METAL
- B23H7/00—Processes or apparatus applicable to both electrical discharge machining and electrochemical machining
- B23H7/14—Electric circuits specially adapted therefor, e.g. power supply
- B23H7/20—Electric circuits specially adapted therefor, e.g. power supply for programme-control, e.g. adaptive
Abstract
機械学習装置(100)は、放電加工機(1)における加工条件を制御する制御パラメータを学習する。機械学習装置(100)は、放電加工中の加工状態を表す複数の状態変数を観測する状態観測部(30)と、複数の状態変数に基づいて制御パラメータを学習する学習部(40)と、を備える。The machine learning device (100) learns control parameters for controlling machining conditions in the electric discharge machine (1). A machine learning device (100) includes a state observation unit (30) for observing a plurality of state variables representing a machining state during electric discharge machining, and a learning unit (40) for learning a control parameter based on the plurality of state variables. Equipped with.
Description
本発明は、放電加工を制御する制御パラメータを学習する機械学習装置、放電加工機および機械学習方法に関する。 The present invention relates to a machine learning device for learning control parameters for controlling electric discharge machining, an electric discharge machine, and a machine learning method.
放電加工機において安定した加工を行うために、電源電圧波形および電源電流波形の変更、サーボ動作である極間制御動作の変更といった物理量として表現される加工条件の自動変更を行う機能として適応制御機能がある。上記加工条件は、ユーザが変更可能な数種から十数種の加工パラメータにより決定される。被加工物を加工するために印加される電圧の大小または加工電流パルスの形状を変更するパラメータ、被加工物と工具となる加工電極との相対距離を調整するパラメータ、加工電極の送り速度を変えるパラメータなどが加工パラメータに該当する。 Adaptive control function to automatically change machining conditions expressed as physical quantities, such as changing power supply voltage waveform and power supply current waveform, and changing the gap control operation, which is a servo operation, in order to perform stable machining in an electric discharge machine There is. The processing conditions are determined by several to more than ten types of processing parameters that can be changed by the user. Parameters for changing the magnitude of the voltage applied to process the workpiece or the shape of the processing current pulse, parameters for adjusting the relative distance between the workpiece and the processing electrode serving as a tool, and changing the feed rate of the processing electrode Parameters and the like correspond to the processing parameters.
これらの加工パラメータの組合せは、代表的な加工形状、被加工材質および電極材質を使用して実験的に適切な値のセットとして求められたりすることにより、放電加工機に予め複数のセットが設定されていて、ユーザが選択できるようになっている場合もある。しかし、放電加工機で加工の対象とされる形状は三次元的な複雑形状であり、また通電できれば加工可能という放電加工機の特性上被加工材質も種々に渡る。したがって、加工パラメータの最適化が必要であり、例えば、特許文献1においては、作業者が入力した加工状態を利用して、加工パラメータを自動設定することが示されている。
A combination of these machining parameters can be experimentally obtained as a set of appropriate values using representative machining shapes, workpiece materials and electrode materials, and a plurality of sets are set in advance in the electric discharge machine. In some cases, it is possible for the user to make a selection. However, the shape to be machined by the electric discharge machine is a three-dimensional complicated shape, and the material to be machined also varies in view of the characteristics of the electric discharge machine, which can be machined if it can be energized. Therefore, it is necessary to optimize the processing parameters. For example,
しかし、特許文献1に記載の自動設定では、単一種類の加工状態に基づいて、ユーザも設定することが可能な加工パラメータの一部を調整するのみである。また、加工パラメータに基づいて、最終的に物理量として表現される加工条件を実現するためには各種制御パラメータがその背景として無数に存在しており、それらの制御パラメータの調整は行われていない。
However, in the automatic setting described in
したがって、放電加工機の適応制御において、物理量としてより適切な加工条件を取得できる適応制御が求められていた。 Therefore, in the adaptive control of the electric discharge machine, there has been a demand for adaptive control capable of acquiring more appropriate machining conditions as physical quantities.
本発明は、上記に鑑みてなされたものであって、放電加工においてより適切な加工条件を自動的に学習することができる機械学習装置を得ることを目的とする。 The present invention has been made in view of the above, and an object of the present invention is to provide a machine learning device capable of automatically learning more appropriate machining conditions in electric discharge machining.
上述した課題を解決し、目的を達成するために、本発明の機械学習装置は、放電加工機における加工条件を決定するための制御パラメータを学習する。本発明の機械学習装置は、放電加工中の加工状態を表す複数の状態変数を観測する状態観測部と、複数の状態変数を前回の状態変数とそれぞれ比較して、加工状態が安定するような制御パラメータを学習する学習部と、を備える。制御パラメータは、ユーザにより設定される加工条件設定値と物理量である加工条件との対応テーブルである。 In order to solve the above-described problem and achieve the object, a machine learning device of the present invention learns control parameters for determining machining conditions in an electric discharge machine. The machine learning device of the present invention is a state observation unit that observes a plurality of state variables representing a machining state during electric discharge machining, and compares the plurality of state variables with a previous state variable so that the machining state is stabilized. A learning unit that learns control parameters. The control parameter is a correspondence table between a processing condition set value set by a user and a processing condition which is a physical quantity.
本発明にかかる機械学習装置は、放電加工においてより適切な加工条件を自動的に学習することができるという効果を奏する。 The machine learning device according to the present invention has an effect that a more appropriate machining condition can be automatically learned in electric discharge machining.
以下に、本発明の実施の形態にかかる機械学習装置、放電加工機および機械学習方法を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。 Hereinafter, a machine learning device, an electric discharge machine, and a machine learning method according to an embodiment of the present invention will be described in detail with reference to the drawings. The present invention is not limited by the embodiment.
実施の形態1.
図1は、本発明の実施の形態1にかかる放電加工機1の構成を示すブロック図である。放電加工機1には、加工工具となる加工電極2と、加工電極2と被加工物3との間の距離を制御するための駆動装置4と、加工電極2と被加工物3との間に放電を発生させるための加工電源5と、駆動装置4および加工電源5を制御する制御装置10とを備える。被加工物3は加工電源5に接続されている。駆動装置4は、加工電極2および被加工物3のいずれか、または両方を駆動することができる。
FIG. 1 is a block diagram illustrating a configuration of the
制御装置10は、駆動装置4を制御する軸駆動制御部11と、加工電源5を制御する加工電源制御部12と、加工条件設定値を設定する加工条件設定部15と、加工条件に対応する制御パラメータを保持する制御パラメータ保持部13と、制御パラメータの初期値を設定する初期パラメータ設定部14と、を備える。なお、加工条件設定値は、加工条件を指定する設定値である。
The
制御パラメータは、加工条件設定値と加工条件との関係を規定するパラメータであり、加工条件設定値および制御パラメータに基づいて具体的な物理量で表現される加工条件が決定される。したがって、加工電極2と被加工物3との間に放電を発生させて加工する際の加工パターンの加工条件は、加工条件設定部15が設定した加工条件設定値と、制御パラメータ保持部13に保持されている制御パラメータとに基づいて決定される。すなわち、放電加工機1における物理量で表現される加工条件は制御パラメータにより制御される。ユーザは、加工条件設定値を設定することができるが、制御パラメータを設定したり変更したりすることはできない。軸駆動制御部11および加工電源制御部12は、加工条件設定部15および制御パラメータ保持部13から与えられた情報に基づいて、上記加工条件の加工パターンに応じた指令を発する。後述するように制御パラメータは変更されるが、制御パラメータ保持部13に最初に設定されている制御パラメータの初期値は初期パラメータ設定部14により設定される。制御パラメータが加工条件設定値と加工条件との対応テーブルで表現される場合、制御パラメータの初期値は、初期値となる対応テーブルとなる。
The control parameter is a parameter that defines a relationship between the processing condition set value and the processing condition, and a processing condition expressed by a specific physical quantity is determined based on the processing condition set value and the control parameter. Therefore, the processing conditions of the processing pattern when processing by generating an electric discharge between the
駆動装置4は、軸駆動制御部11からの上記指令に基づいて、加工電極2と被加工物3との相対距離および相対速度を制御する。加工電源5は、加工電源制御部12からの上記指令に基づいて、加工電極2と被加工物3との間に電圧を印加して、放電時の電流波形を制御する。
The
制御装置10は、さらに、入出力部20と、機械学習装置100と、パラメータ変更部50と、学習結果記憶部80とを備える。
The
入出力部20は、ユーザの入力を受け付け、表示によりユーザの確認作業をサポートする入出力インタフェースである。入出力部20は、加工条件設定部15にユーザが設定させたい加工条件設定値を受け付ける加工条件入力部21と、ユーザが加工状態を観測する確認作業を行うための表示部22とを備える。
The input /
機械学習装置100は、状態観測部30および学習部40を備える。状態観測部30は、軸駆動認識部31と、パルス状態認識部32と、加工状態観測部33とを備える。学習部40は、報酬計算部47および関数更新部48を備え、制御パラメータを学習することにより最適化する。
The
報酬計算部47は、電圧制御にかかる報酬を計算する第1報酬計算部41と、パルス制御にかかる報酬を計算する第2報酬計算部43と、軸駆動制御にかかる報酬を計算する第3報酬計算部45とを備える。関数更新部48は、電圧制御にかかる関数を更新する第1関数更新部42と、パルス制御にかかる関数を更新する第2関数更新部44と、軸駆動制御にかかる関数を更新する第3関数更新部46とを備える。
The
パラメータ変更部50は、電圧制御に関わる加工条件の制御パラメータを変更する第1制御パラメータ変更部51と、パルス制御に関わる加工条件の制御パラメータを変更する第2制御パラメータ変更部52と、軸駆動制御に関わる加工条件の制御パラメータを変更する第3制御パラメータ変更部53とを備える。パラメータ変更部50は、学習部40が学習した結果に基づいて、制御パラメータ保持部13が保持する制御パラメータを変更する。
The
学習結果記憶部80は、機械学習装置100による学習結果を記憶する。
The learning
放電加工機1が放電加工を開始すると、加工条件設定部15が出力する加工条件設定値に基づいて、軸駆動制御部11および加工電源制御部12が指令を行い、駆動装置4および加工電源5の動作によって、加工電極2と被加工物3との間に放電が発生する。
When the
放電加工が行われている間、駆動装置4は軸駆動制御部11の指令に従って、加工電極2と被加工物3との相対距離を小さくまたは大きくさせながら、放電が発生する最適な相対距離を探索する。この時の駆動軸の位置および駆動軸の動作についての情報は、軸駆動認識部31が取得して、加工状態観測部33に軸挙動履歴として記録される。
During the electric discharge machining, the driving
また、放電加工が行われている間は、上記した駆動装置4の動作と同時に、加工電源5は加工電源制御部12の指令によって、加工電極2と被加工物3との間に電圧を印加して、指令された形状の電流波形の電流パルスを発生させる。加工電源制御部12は、加工条件設定部15からの加工条件設定値に基づいて、指令された形状の電流波形の電流パルスを一定周期で発生させるように加工電源5の電圧を制御する。しかし、物理特性上、放電加工において確実に一定周期で電流パルスを発生させることは不可能である。また、電流パルスの形状も理論値が示す電流波形とは異なるものが生成される場合がある。この電流パルスの発生周期および電流パルスの形状、それに加えて、パルス発生の元となる印加電圧の大きさおよび印加周期、電圧パルス形状を示す電圧波形の情報は、パルス状態認識部32が取得して、加工状態観測部33にパルス挙動履歴として記録される。
During the electric discharge machining, the
加工状態観測部33は、パルス挙動履歴および軸挙動履歴から、一定期間における電圧値の分布、電流パルスの発生周期、電流パルスが発生した際の軸の位置情報、速度情報および加速度情報を得る。加工状態観測部33は、現在使用されている制御パラメータの下で実行されている放電加工により得られたこれらの情報を、制御パラメータ保持部13に設定されている現在使用されている制御パラメータと紐付けて学習部40に与える。
The machining
以下では、加工条件及び加工条件と制御パラメータとの関係について詳細に説明する。図2は、実施の形態1にかかる加工条件を制御目的で分類した図である。図3は、実施の形態1にかかる電圧制御に関わる加工条件の制御パラメータを説明する図である。図4は、実施の形態1にかかる電圧制御に関わる加工条件と電流パルスの発生周期との関係を示す図である。図5は、実施の形態1にかかるパルス制御に関わる加工条件の制御パラメータを説明する図である。図6は、実施の形態1にかかるパルス制御に関わる加工条件と電流パルスの形状との関係を示す図である。図7は、実施の形態1にかかる軸駆動制御に関わる加工条件の制御パラメータを説明する図である。図8は、実施の形態1にかかる軸駆動制御に関わる加工条件と軸駆動による極間制御との関係を示す図である。 Hereinafter, the processing conditions and the relationship between the processing conditions and the control parameters will be described in detail. FIG. 2 is a diagram in which machining conditions according to the first embodiment are classified for control purposes. FIG. 3 is a diagram illustrating control parameters of machining conditions related to voltage control according to the first embodiment. FIG. 4 is a diagram illustrating a relationship between processing conditions related to voltage control according to the first embodiment and a generation cycle of a current pulse. FIG. 5 is a diagram for explaining control parameters of processing conditions related to the pulse control according to the first embodiment. FIG. 6 is a diagram illustrating a relationship between processing conditions related to pulse control and the shape of a current pulse according to the first embodiment. FIG. 7 is a diagram for explaining control parameters of machining conditions related to the axis drive control according to the first embodiment. FIG. 8 is a diagram illustrating a relationship between machining conditions related to the shaft drive control and the gap control by the shaft drive according to the first embodiment.
図2では、(1)加工回路の種別、(2)回路補助設定、(3)電流パルスピーク値、(4)電流パルス長さ、(5)パルス休止時間、(6)極間ギャップ調整値、(7)ジャンプスピード、(8)ジャンプ高さ、(9)最深値持続時間、(10)軸応答性、(11)狙い電圧値、といった加工条件が、電圧制御に関わる加工条件、パルス制御に関わる加工条件または軸駆動制御に関わる加工条件に該当する場合には対応する欄に黒丸を付してある。電圧制御に関わる加工条件は電流パルスの発生周期に関係し、パルス制御に関わる加工条件は電流パルスの形状に関係し、軸駆動制御に関わる加工条件は極間制御に関係する。 In FIG. 2, (1) type of processing circuit, (2) circuit auxiliary setting, (3) current pulse peak value, (4) current pulse length, (5) pulse pause time, (6) gap adjustment value between poles , (7) jump speed, (8) jump height, (9) maximum depth duration, (10) axis responsiveness, (11) target voltage value, etc. In the case where the processing condition related to the above or the processing condition related to the axis drive control is satisfied, a black circle is attached to the corresponding column. The processing conditions related to the voltage control relate to the generation cycle of the current pulse, the processing conditions related to the pulse control relate to the shape of the current pulse, and the processing conditions related to the shaft drive control relate to the gap control.
図3、図5および図7は、加工条件設定部15が加工条件設定値を設定する加工条件に対応して制御パラメータ保持部13が保持する制御パラメータを示している。図2に示した各加工条件は、電流パルスの発生周期、電流パルスの形状、極間制御に関わっているが、重複して関わっていることがある。したがって、電流パルスの発生周期、電流パルスの形状または極間制御のいずれかを変更するように関連する加工パラメータを変更すると、他のものにも影響することがある。
FIGS. 3, 5, and 7 show control parameters held by the control
また、各加工条件は加工条件設定値によりノッチが指定され、複数の加工条件は各加工条件の指定されたノッチの組み合わせであるノッチパターンとして表現される。ノッチとは、加工条件を示す物理量を離散的に指定する刻みのことである。通常、数種類または数十種類のノッチパターンが放電加工機1に予め登録されている。各加工条件は、加工条件設定値によるノッチの選択とは別に、ユーザが変更することが出来ない制御パラメータを有している。先に説明したように、ノッチの選択を示す加工条件設定値および制御パラメータに基づいて具体的な物理量である加工条件が決定される。制御パラメータの具体例は、ノッチ分割数およびノッチ配分値である。ノッチ分割数は、当該加工条件において選択可能なノッチの数である。ノッチ配分値は、各ノッチに割当てられる加工条件の物理量の値である。ただし、制御パラメータはこれらに限定されない。図2に挙げた11種類の加工条件それぞれの制御パラメータを変数としてとらえた場合、その変数の総数は、数十から数百に及ぶ。
A notch is specified for each processing condition by a processing condition setting value, and a plurality of processing conditions are expressed as a notch pattern which is a combination of the notch specified for each processing condition. The notch is a step that discretely specifies a physical quantity indicating a processing condition. Usually, several or dozens of notch patterns are registered in the
図3は、電圧制御に関わる加工条件の制御パラメータを説明している。図4は、電圧制御に関わる加工条件である、(4)電流パルス長さ、(5)パルス休止時間、(6)極間ギャップ調整値、(9)最深値持続時間、(10)軸応答性および(11)狙い電圧値が電流パルスの発生周期とどのように関わるかの概略を示している。(4)電流パルス長さおよび(5)パルス休止時間は図4の矢印で示した幅で示した加工条件であり、(6)極間ジャンプ調整値、(9)最深値持続時間、(10)軸応答性および(11)狙い電圧値は電流パルスの発生周期に関連する加工条件である。 FIG. 3 illustrates control parameters of processing conditions related to voltage control. FIG. 4 shows machining conditions related to voltage control, (4) current pulse length, (5) pulse pause time, (6) gap gap adjustment value, (9) deepest value duration, (10) axis response. And (11) how the target voltage value relates to the current pulse generation cycle. The (4) current pulse length and (5) pulse pause time are processing conditions indicated by the width indicated by the arrow in FIG. 4, (6) the gap jump adjustment value, (9) the deepest value duration, and (10) ) The axis response and (11) the target voltage value are machining conditions related to the current pulse generation cycle.
具体例を挙げると、(4)電流パルス長さの制御パラメータは長さ制御パラメータとなるノッチ分割数およびノッチ配分値である。電流パルス長さに対してある制御パラメータであるノッチ分割数およびノッチ配分値が設定されているとする。このとき、加工条件設定値0が指定するノッチに対して電流パルス長さ=2μsecが対応し、加工条件設定値1が指定するノッチに対して電流パルス長さ=4μsecが対応し、加工条件設定値2が指定するノッチに対して電流パルス長さ=8μsecが対応するといった対応関係が上記制御パラメータにより規定される。電流パルス長さの制御パラメータが変更されると上記対応関係が変更されるので、同じ加工条件設定値に対する電流パルス長さが変更されることになる。ただし、制御パラメータが変更されたとしても、変更されたノッチ配分値によっては、全ての加工条件設定値に対する加工条件の値が変更されなくてもかまわない。
To give a specific example, (4) the control parameters of the current pulse length are the number of notch divisions and the notch distribution values which are the length control parameters. It is assumed that notch division numbers and notch distribution values, which are certain control parameters, are set for the current pulse length. At this time, the current pulse length = 2 μsec corresponds to the notch designated by the machining condition set value 0, and the current pulse length = 4 μsec corresponds to the notch designated by the machining condition set
図5は、パルス制御に関わる加工条件の制御パラメータを説明している。図6は、パルス制御に関わる加工条件である、(1)加工回路の種別、(2)回路補助設定、(3)電流パルスピーク値、(4)電流パルス長さ、(6)極間ギャップ調整値、(11)狙い電圧値が電流パルスの形状とどのように関わるかの概略を示している。(1)加工回路の種別の回路呼び出しパラメータが変更されると加工回路が変更されるので電流パルスの形状が変化する。(2)回路補助設定は電流パルスの立ち上がりの傾きを規定する。(3)電流パルスピーク値は電流パルスのピーク値を規定する。(4)電流パルス長さは電流パルスのパルス長さを規定する。(6)極間ギャップ調整値および(11)狙い電圧値は電流パルスの間隔に関連する加工条件である。 FIG. 5 illustrates control parameters of processing conditions related to pulse control. FIG. 6 shows processing conditions related to pulse control, (1) type of processing circuit, (2) circuit auxiliary setting, (3) current pulse peak value, (4) current pulse length, and (6) gap between poles. (11) An outline of how the adjustment value and the target voltage value relate to the shape of the current pulse is shown. (1) When the circuit call parameter of the type of the processing circuit is changed, the processing circuit is changed, so that the shape of the current pulse changes. (2) The circuit auxiliary setting defines the slope of the rise of the current pulse. (3) The current pulse peak value defines the peak value of the current pulse. (4) The current pulse length defines the pulse length of the current pulse. The (6) gap adjustment value and (11) target voltage value are processing conditions related to the interval between current pulses.
具体例を挙げると、(3)電流パルスピーク値の制御パラメータはピーク制御パラメータとなるノッチ分割数およびノッチ配分値である。電流パルスピーク値Ipに対してある制御パラメータであるノッチ分割数およびノッチ配分値が設定されているとする。このとき、加工条件設定値0が指定するノッチに対してIp=1Aが対応し、加工条件設定値1が指定するノッチに対してIp=2Aが対応し、加工条件設定値2が指定するノッチに対してIp=4Aが対応するといった対応関係が上記制御パラメータにより規定される。電流パルスピーク値Ipの制御パラメータが変更されると上記対応関係が変更されるので、同じ加工条件設定値に対するIpの値が変更されることになる。ただし、制御パラメータが変更されたとしても、変更されたノッチ配分値によっては、全ての加工条件設定値に対する加工条件の値が変更されなくてもかまわない。To give a specific example, (3) the control parameters of the current pulse peak value are the number of notch divisions and the notch distribution values which are peak control parameters. It is assumed that a certain control parameter, the notch division number and the notch distribution value, are set for the current pulse peak value Ip . At this time, Ip = 1A corresponds to the notch specified by the processing condition set value 0, Ip = 2A corresponds to the notch specified by the processing condition set
図7は、軸駆動制御に関わる加工条件の制御パラメータを説明している。図8は、軸駆動制御に関わる加工条件である、(6)極間ギャップ調整値、(7)ジャンプスピード、(8)ジャンプ高さ、(9)最深値持続時間、(10)軸応答性および(11)狙い電圧値が軸駆動制御とどのように関わるかの概略を示している。(6)極間ギャップ調整値、(9)最深値持続時間、(10)軸応答性および(11)狙い電圧値は、加工電極2と被加工物3とのアプローチ動作に関連する加工条件である。(7)ジャンプスピード、(8)ジャンプ高さおよび(10)軸応答性は、駆動軸のジャンプ動作を含んだ被加工物3からの加工電極2の退避動作に関連する加工条件である。
FIG. 7 illustrates control parameters of machining conditions related to axis drive control. FIG. 8 shows machining conditions related to axis drive control, (6) gap adjustment value, (7) jump speed, (8) jump height, (9) deepest value duration, (10) axis response. And (11) schematically show how the target voltage value relates to axis drive control. The (6) gap adjustment value, (9) deepest value duration, (10) axis response, and (11) target voltage value are processing conditions related to the approach operation between the
つぎに、放電加工における電圧パルスおよび電流パルスの安定または不安定について説明する。図9は、実施の形態1にかかる電圧パルスおよび電流パルスの状態を説明する図である。図10は、実施の形態1にかかる電圧パルスおよび電流パルスが安定である場合を示す図である。図11は、実施の形態1にかかる電圧パルスおよび電流パルスが不安定である場合を示す図である。図9〜図11においては、上が電圧波形を示し、下が電流波形を示す。 Next, the stability or instability of the voltage pulse and the current pulse in electric discharge machining will be described. FIG. 9 is a diagram illustrating states of a voltage pulse and a current pulse according to the first embodiment. FIG. 10 is a diagram illustrating a case where the voltage pulse and the current pulse according to the first embodiment are stable. FIG. 11 is a diagram illustrating a case where the voltage pulse and the current pulse according to the first embodiment are unstable. 9 to 11, the upper part shows a voltage waveform and the lower part shows a current waveform.
加工電極2と被加工物3との間に電圧が印加されると、予期できないタイミングで絶縁破壊が生じて電流が流れる。安定的に加工を行える理想的な電圧および電流の関係が生じるとトランジスタ回路等で成形された一定の傾きを有する矩形波に近い電流パルスが発生する。この電流パルスが図9に安定した放電として示される。このような理想的な電圧および電流の関係が満たされない場合は、電流パルスの電流波形の形状が理想と異なる図9の不安定な放電のようになったり、加工に有効でない電流として極間に異形状の電流波形が発生する図9の異常放電のようになったりする。
When a voltage is applied between the
放電加工の制御においては、極間の相対距離を制御するためのひとつの指標として、放電発生時における一定の時間あたりの平均電圧値を観測して制御を行う。理想的な電圧および電流の関係が維持される場合は、図10に示すように平均電圧値が理論値となるように維持されて安定した放電が継続する。しかし、図9の不安定な放電または異常放電が繰り返される場合は、図11に示すように平均電圧値が理論値から変動してしまい、不安定な放電が継続する。極間距離が無くなり加工電極2と被加工物3とが接触してしまった場合は短絡状態となり、加工電極2と被加工物3との距離が放電が発生しない距離まで離れてしまう場合は開放状態となるため、理論値に対する平均電圧値の変動が、ただちに放電パルスの安定または不安定を決定するものではない。また、理想的な条件下において図10に示される安定した電流パルスのパターンが発生し続けている場合においても、絶縁破壊が生じるまでの無負荷電圧時間と呼ばれる予期できない時間間隔があるため、放電発生の周期は一定ではない。したがって、放電発生周期の増減は、加工の安定性とは独立した指標である。
In the control of the electric discharge machining, as one index for controlling the relative distance between the electrodes, the control is performed by observing the average voltage value per a certain time when electric discharge occurs. When the ideal relation between voltage and current is maintained, as shown in FIG. 10, the average voltage value is maintained at the theoretical value, and stable discharge continues. However, when the unstable discharge or the abnormal discharge shown in FIG. 9 is repeated, the average voltage value fluctuates from the theoretical value as shown in FIG. 11, and the unstable discharge continues. If the distance between the poles is lost and the
図12は、実施の形態1にかかる理想的な平均電圧値の分布を示す図である。図13は、実施の形態1にかかる安定した放電が継続するときの平均電圧値の分布を示す図である。図14は、実施の形態1にかかる不安定な放電が継続するときの平均電圧値の分布を示す図である。図12〜図14においては、横軸が放電発生時における一定の時間あたりの平均電圧値を示し、縦軸が一定の時間あたりのパルス数を示す。 FIG. 12 is a diagram illustrating an ideal average voltage value distribution according to the first embodiment. FIG. 13 is a diagram showing the distribution of the average voltage value when the stable discharge according to the first embodiment continues. FIG. 14 is a diagram showing the distribution of the average voltage value when the unstable discharge according to the first embodiment continues. 12 to 14, the horizontal axis indicates the average voltage value per fixed time when the discharge occurs, and the vertical axis indicates the number of pulses per fixed time.
理想的な電圧および電流の関係が維持される場合は、図12に示すように、上記平均電圧値は、理論値において定められたパルス数となる。実際の加工においては、物理現象上、目標とする電圧値を示す加工条件である狙い電圧値の周りに平均電圧値は分布すると共にパルス数も分布する。狙い電圧値は、理論値である必要はない。加工が安定していて図10に示すように安定した放電が継続する場合は、図13に示すように平均電圧値のばらつきも小さく、平均電圧値が狙い電圧値においてパルス数が最大になっている。また、加工が不安定で図11に示すように不安定な放電が継続する場合は、図14に示すように平均電圧値が狙い電圧値の周りに分散して大きくばらつくと共に、パルス数もばらついてしまう。 When the ideal relationship between the voltage and the current is maintained, the average voltage value is the number of pulses determined in the theoretical value, as shown in FIG. In actual processing, due to physical phenomena, an average voltage value and a pulse number are distributed around a target voltage value which is a processing condition indicating a target voltage value. The target voltage value does not need to be a theoretical value. When the machining is stable and the stable discharge continues as shown in FIG. 10, the variation in the average voltage value is small as shown in FIG. 13, and the pulse number becomes maximum at the average voltage value at the target voltage value. I have. When the machining is unstable and the unstable discharge continues as shown in FIG. 11, the average voltage value is dispersed around the target voltage value and greatly varies as shown in FIG. 14, and the number of pulses also varies. Would.
パルス状態認識部32は、一定期間における放電発生時の電圧の分布を基に分布の良否判定を行い、パルスが安定しているか不安定であるかを判定する。一例として、パルス状態認識部32は、加工電源制御部12から得た平均電圧値、狙い電圧値および電圧閾値との関係に基づいて、電圧パルスおよび電流パルスが安定しているか不安定であるかを判定する。具体的には、パルス状態認識部32は、加工電源制御部12の指令に基づいて、放電発生時における一定の時間あたりの平均電圧値の狙い電圧値からの偏差の絶対値が電圧閾値より大きい場合はパルスの不安定信号を発生させ、不安定信号の発生回数を上記一定の時間より長い予め定めた期間の間に累積させた値を第1状態の値として求める。さらに、パルス状態認識部32は、加工電源制御部12の指令から得た予め定めた期間において発生したパルス数を第2状態の値として求める。上記予め定めた期間は、例えば、ジャンプ動作と言われる退避動作が終了し、放電を発生させるための極間位置制御が行われ、再び次のジャンプ動作が行われるまでの動作時間とすることができる。軸駆動認識部31は、軸駆動制御部11の指令から得た駆動装置4における軸の送り量を第3状態の値として求める。第3状態の値は、軸の送り量が加工進行方向に大きくなるほど正の大きな値になり、軸の送り量が後退方向に大きくなるほど、負の大きな値になるように設定される。第1状態の値、第2状態の値および第3状態の値はそれぞれ放電加工中の加工状態を表す状態変数であり、加工状態観測部33は、取得した複数の状態変数である第1状態の値、第2状態の値および第3状態の値を分布図または棒グラフによるヒストグラムといった形式でユーザが目視で観測できるように表示部22に表示させる。このようにして、状態観測部30は、複数の状態変数である第1状態の値、第2状態の値および第3状態の値を観測する。そして、学習部40の第1報酬計算部41、第2報酬計算部43および第3報酬計算部45は、加工状態観測部33が取得した第1状態の値、第2状態の値および第3状態の値に基づいて報酬を計算する。
The pulse
状態観測部30、学習部40およびパラメータ変更部50を備えた機械学習装置100が用いる学習アルゴリズムはどのようなものを用いてもよい。一例として、強化学習(Reinforcement Learning)を適用した場合について説明する。
The learning algorithm used by the
強化学習は、ある環境内におけるエージェントである行動主体が、現在の状態を観測し、取るべき行動を決定する、というものである。エージェントは、行動を選択することで環境から報酬を得て、一連の行動を通じて報酬が最も多く得られるような方策を学習する。強化学習の代表的な手法として、Q学習(Q−learning)またはTD学習(TD−learning)が知られている。例えば、Q学習の場合、行動価値関数Q(s,a)の一般的な更新式は、以下の数式(1)で表される。行動価値関数Q(s,a)は、行動価値テーブルとも呼ばれる。 In reinforcement learning, an agent acting as an agent in a certain environment observes the current state and determines an action to be taken. The agent obtains rewards from the environment by selecting an action, and learns a strategy to obtain the highest reward through a series of actions. As a typical method of reinforcement learning, Q learning (Q-learning) or TD learning (TD-learning) is known. For example, in the case of Q learning, a general update equation of the action value function Q (s, a) is represented by the following equation (1). The action value function Q (s, a) is also called an action value table.
数式(1)において、stは時刻tにおける状態を表し、atは時刻tにおける行動を表す。行動atにより、状態はst+1に変わる。rt+1はその状態の変化によってもらえる報酬を表し、γは割引率を表し、αは学習係数を表す。In Equation (1), s t represents the state at time t, a t represents the behavior in time t. By the action a t, the state is changed to s t + 1. rt + 1 represents a reward obtained by the change of the state, γ represents a discount rate, and α represents a learning coefficient.
Q学習における数式(1)で表される更新式は、時刻t+1における最良の行動aの行動価値が、時刻tにおいて実行された行動atの行動価値Qよりも大きければ、時刻tの行動価値Qを大きくし、逆の場合は、時刻tの行動価値Qを小さくする。換言すれば、時刻tにおける行動atの行動価値Qを、時刻t+1における最良の行動価値に近づけるように、行動価値関数Q(st,at)を更新する。それにより、或る環境における最良の行動価値が、それ以前の環境における行動価値に順次伝播していくようになる。Represented update equation in Equation (1) in the Q learning, action value of the best action a at time t + 1 is greater than the action value Q of the executed action a t at time t, activation level at time t Q is increased, and conversely, the action value Q at time t is decreased. In other words, the action value Q action a t at time t, as close to the best action value at
したがって、以下で説明する機械学習装置100の動作において、制御パラメータの変更行動を時刻tにおける行動atとし、上記第1、第2および第3状態を時刻tにおける状態stとすれば、Q学習を行っていると理解することができる。Accordingly, in the operation of the
以下、機械学習装置100による制御パラメータの最適化動作を説明する。
Hereinafter, the operation of optimizing the control parameters by the
図15は、実施の形態1にかかる電圧制御に関わる加工条件の制御パラメータの学習による最適化処理を説明するフローチャートである。電圧制御に関わる加工条件の制御パラメータは、加工条件として設定される狙い電圧値の基となっている電圧制御を行うための変数値であり、これにより電圧の大きさだけでなく電圧波形の形状、放電を検出するための基準電圧と呼ばれる電圧基準値も含まれる。また、電圧制御に関わる加工条件の制御パラメータの最適化により、制御パラメータとして設定されている無負荷電圧時間の電圧および狙い電圧値の初期ノッチパターンを別のノッチパターンに変更するなどの処理も行われる。 FIG. 15 is a flowchart illustrating an optimization process based on learning of control parameters of processing conditions related to voltage control according to the first embodiment. The control parameters of the processing conditions related to the voltage control are variable values for performing the voltage control that are the basis of the target voltage value set as the processing conditions, and thus, not only the magnitude of the voltage but also the shape of the voltage waveform , A voltage reference value called a reference voltage for detecting discharge. In addition, by optimizing the control parameters of the machining conditions related to the voltage control, processing such as changing the initial notch pattern of the no-load voltage time and the target voltage value set as the control parameters to another notch pattern is also performed. Will be
電圧制御にかかる報酬を計算する第1報酬計算部41は、パルス状態認識部32が求めた状態変数である第1状態の値および第2状態の値に基づいて報酬の変化量を計算する。第1報酬計算部41は、第1状態の値が小さく、第2状態の値が大きくなる場合に報酬を増やすように報酬の変化量を計算するのであれば、第1状態の値および第2状態の値をどのように用いて報酬の変化量を求めるかに制限はない。具体的には、第1状態の値が小さくなった場合に報酬を増やし、第1状態の値が大きくなった場合には報酬を減らす。これに加えて、第2状態の値が大きくなった場合に報酬を増やし、第2状態の値が小さくなった場合には報酬を減らす。また、不安定なパルスの数が減り、安定したパルスの数が増えた場合に報酬を増大させるとする基本的な基準に加え、不安定なパルスが減少したとしても安定したパルスの数が減った場合においては報酬が減少するように報酬の計算方法を定めてもよい。
The first
第1報酬計算部41が計算した報酬に基づいて、第1関数更新部42は電圧制御に関わる制御パラメータを決定するための関数である行動価値関数Qを更新する。更新された行動価値関数Qに基づいて、第1制御パラメータ変更部51は、報酬が最も多く得られる制御パラメータとなるように電圧制御に関わる加工条件の制御パラメータを変更する。
Based on the reward calculated by the first
以上をふまえて、図3に示した電圧制御に関わる加工条件の6種類の制御パラメータの最適化について、図15を用いて説明する。図15は放電加工機1が放電加工を継続して実行している状況において実行され、変更される制御パラメータには優先順位が設定されているとして説明するが、6種類の制御パラメータを同時に最適化するようにしてもよい。
Based on the above, the optimization of the six control parameters of the processing conditions related to the voltage control shown in FIG. 3 will be described with reference to FIG. FIG. 15 illustrates that the control is executed in a situation where the
図15のフローチャートが実行される前に、電圧制御にかかる報酬の初期値を第1報酬計算部41がすでに保持しているとする。報酬の初期値は固定値であれば制限されず0としてもよい。まず、現在の加工条件および制御パラメータで加工を実行しているときの、加工電源制御部12の情報を状態観測部30が観測する(ステップS101)。具体的には、加工中の加工電源制御部12の指令を状態観測部30が取得する。そして、加工電源制御部12の指令に基づいて、パルス状態認識部32が第1状態の値および第2状態の値を算出する(ステップS102)。次に、パルス状態認識部32が求めた状態変数である第1状態の値および第2状態の値が加工状態観測部33から第1報酬計算部41に与えられる。ここで、第1状態の値および第2状態の値は、制御パラメータ保持部13に設定されている現在使用されている制御パラメータと紐付けされて加工状態観測部33から第1報酬計算部41に与えられる。
Before the flowchart of FIG. 15 is executed, it is assumed that the first
そして、第1報酬計算部41は、与えられた第1状態の値を前回の第1状態の値と比較する(ステップS103)。第1報酬計算部41は前回与えられた第1状態の値を保持しており、今回与えられた第1状態の値と比較することができる。第1状態の値が前回の第1状態の値より小さい場合(ステップS103:小)、第1報酬計算部41は報酬を増やす(ステップS104)。すなわち、第1状態の値が前回よりも安定した状態を示す場合には、報酬を増やす。ここでの報酬の増加値は予め定めた値である。第1状態の値が前回の第1状態の値と同じ場合(ステップS103:同じ)、第1報酬計算部41は報酬を変化させない(ステップS105)。第1状態の値が前回の第1状態の値より大きい場合(ステップS103:大)、第1報酬計算部41は報酬を減らす(ステップS106)。すなわち、第1状態の値が前回よりも不安定な状態を示す場合には、報酬を減らす。ここでの報酬の減少値は予め定めた値である。なお、最初にステップS103が実行されるときは前回与えられた第1状態の値が存在しないので、ステップS105に進む。
Then, the first
次に、第1報酬計算部41は、与えられた第2状態の値を前回の第2状態の値と比較する(ステップS107)。第1報酬計算部41は前回与えられた第2状態の値を保持しており、今回与えられた第2状態の値と比較することができる。第2状態の値が前回の第2状態の値より大きい場合(ステップS107:大)、第1報酬計算部41は報酬を増やす(ステップS108)。すなわち、第2状態の値が前回よりも安定した状態を示す場合には、報酬を増やす。ここでの報酬の増加値は予め定めた値である。第2状態の値が前回の第2状態の値と同じ場合(ステップS107:同じ)、第1報酬計算部41は報酬を変化させない(ステップS109)。第2状態の値が前回の第2状態の値より小さい場合(ステップS107:小)、第1報酬計算部41は報酬を減らす(ステップS110)。すなわち、第2状態の値が前回よりも不安定な状態を示す場合には、報酬を減らす。ここでの報酬の減少値は予め定めた値である。なお、最初にステップS107が実行されるときは前回与えられた第2状態の値が存在しないので、ステップS109に進む。
Next, the first
そして、第1関数更新部42は、第1報酬計算部41が計算した報酬に基づいて、数式(1)に従って行動価値関数Qを更新する(ステップS111)。さらに、第1関数更新部42は、ステップS111において更新が行われなくなり、行動価値関数Qが収束したか否かを判定する(ステップS112)。行動価値関数Qが収束していないと判定された場合(ステップS112:No)、第1制御パラメータ変更部51は、ステップS111で更新された行動価値関数Qに基づいて、電圧制御に関わる加工条件の制御パラメータを変更する(ステップS113)。ステップS113の後はステップS101に戻る。行動価値関数Qが収束したと判定された場合(ステップS112:Yes)、学習部40は、第1制御パラメータ変更部51によって、電圧制御に関わる加工条件の制御パラメータの全てが変更されたか否かを判定する(ステップS114)。電圧制御に関わる加工条件の制御パラメータの全てが変更されてはいないと判定された場合(ステップS114:No)、ステップS113において第1制御パラメータ変更部51の変更対象となる制御パラメータを別の制御パラメータに替える(ステップS115)。ステップS115において新たな変更対象となった別の制御パラメータとは、電圧制御に関わるまだ変更されていない制御パラメータである。ステップS115の後はステップS113に進む。
Then, the first
ステップS113における、電圧制御に関わる加工条件の制御パラメータの変更について以下に詳細に説明する。上述したように、ステップS113において変更される図3に示した電圧制御に関わる加工条件の6種類の制御パラメータには、変更対象となる優先順位が定められている。最初にステップS113に入ったときに第1制御パラメータ変更部51によって変更されるのは、狙い電圧値の制御パラメータである電圧制御パラメータである。そして、ステップS112において行動価値関数Qが収束したと判定される毎に、第1制御パラメータ変更部51の変更対象となる制御パラメータが、軸応答性の制御パラメータであるGAIN制御パラメータ、パルス休止時間の制御パラメータである長さ制御パラメータ、極間ギャップ調整値の制御パラメータであるギャップ制御パラメータ、最深値持続時間の制御パラメータである長さ制御パラメータ、電流パルス長さの制御パラメータである長さ制御パラメータの順にステップS115で替えられていく。
The change of the control parameter of the processing condition related to the voltage control in step S113 will be described in detail below. As described above, the priority order to be changed is determined for the six control parameters of the processing conditions related to the voltage control shown in FIG. 3 which are changed in step S113. What is changed by the first control
行動価値関数Qが収束して、電圧制御に関わる加工条件の制御パラメータの全てが変更されたと学習部40が判定した場合(ステップS114:Yes)、電圧制御に関わる加工条件の制御パラメータの学習による最適化処理は終了し、学習結果が学習結果記憶部80に記憶される(ステップS116)。学習結果には、ステップS113で変更されて最終的に決定された各制御パラメータに加えて、各制御パラメータの変更過程の値、および制御パラメータに対応する第1状態の値および第2状態の値が含まれる。学習結果記憶部80に記憶された学習結果は、制御パラメータの変更前後の良否判断に利用することができる。また、上記のようにして最終的に決定された制御パラメータは、上記学習において報酬が最も多く得られ、与えられた加工条件設定値において最適な制御パラメータとして制御パラメータ保持部13に保持される。電圧制御に関わる加工条件の制御パラメータを学習により最適化することで、加工開始から終了までの間に不安定信号が発生することを防いで、安定信号のパルスの数を最大化することが可能になる。なお、上述したように、電圧制御に関わる加工条件の6種類の制御パラメータを同時に最適化する場合は、ステップS113において、第1制御パラメータ変更部51は、ステップS111で更新された行動価値関数Qに基づいて、6種類の制御パラメータを同時に変更する。この場合、ステップS114およびS115は不要であり、ステップS112において行動価値関数Qが収束したと判定された場合(ステップS112:Yes)、ただちにステップS116に進むようにすればよい。
When the
図16は、実施の形態1にかかるパルス制御に関わる加工条件の制御パラメータの学習による最適化処理を説明するフローチャートである。パルス制御に関わる加工条件の制御パラメータは、パルスの傾き、パルス発生周期の理論値の元となっている異常放電検出閾値など、電流パルス制御を行うための変数値である。パルス制御に関わる加工条件の制御パラメータには、電流パルスの大きさおよび幅だけでなく電流波形の形状、電流値を理想的な形状に近づけるための加工電極2と被加工物3との相対距離を調整するための極間ギャップの調整値も含まれる。また、パルス制御に関わる加工条件の制御パラメータの最適化により、制御パラメータとして設定されている電流の大きさおよび幅の初期ノッチパターンを別のノッチパターンに変更するなどの処理も行われる。
FIG. 16 is a flowchart illustrating an optimization process based on learning of control parameters of machining conditions related to pulse control according to the first embodiment. The control parameters of the processing conditions related to the pulse control are variable values for performing the current pulse control, such as the pulse inclination and the abnormal discharge detection threshold value that is the basis of the theoretical value of the pulse generation period. The control parameters of the processing conditions related to the pulse control include not only the magnitude and width of the current pulse but also the shape of the current waveform and the relative distance between the
パルス制御にかかる報酬を計算する第2報酬計算部43は、パルス状態認識部32が求めた状態変数である第1状態の値および第2状態の値に基づいて報酬を計算する。第2報酬計算部43の報酬の計算方法は、第1報酬計算部41と同じである。
The second
第2報酬計算部43が計算した報酬に基づいて、第2関数更新部44はパルス制御に関わる制御パラメータを決定するための関数である行動価値関数Qを更新する。更新された行動価値関数Qに基づいて、第2制御パラメータ変更部52は、報酬が最も多く得られる制御パラメータとなるようにパルス制御に関わる加工条件の制御パラメータを変更する。
Based on the reward calculated by the second
以上をふまえて、図5に示したパルス制御に関わる加工条件の6種類の制御パラメータの最適化について、図16を用いて説明する。図16は放電加工機1が放電加工を継続して実行している状況において実行され、変更される制御パラメータには優先順位が設定されているとして説明するが、6種類の制御パラメータを同時に最適化するようにしてもよい。
Based on the above, the optimization of the six control parameters of the processing conditions related to the pulse control shown in FIG. 5 will be described with reference to FIG. FIG. 16 illustrates that the process is executed in a situation where the
図16のフローチャートが実行される前に、パルス制御にかかる報酬の初期値を第2報酬計算部43が保持しているとする。報酬の初期値は固定値であれば制限されず0としてもよい。まず、現在の加工条件および制御パラメータで加工を実行しているときの、加工電源制御部12の情報を状態観測部30が観測する(ステップS201)。具体的には、加工中の加工電源制御部12の指令を状態観測部30が取得する。そして、加工電源制御部12の指令に基づいて、パルス状態認識部32が第1状態の値および第2状態の値を算出する(ステップS202)。次に、パルス状態認識部32が求めた状態変数である第1状態の値および第2状態の値が加工状態観測部33から第2報酬計算部43に与えられる。ここで、第1状態の値および第2状態の値は、制御パラメータ保持部13に設定されている現在使用されている制御パラメータと紐付けされて加工状態観測部33から第2報酬計算部43に与えられる。
Before the flowchart of FIG. 16 is executed, it is assumed that the second
そして、第2報酬計算部43は、与えられた第1状態の値を前回の第1状態の値と比較する(ステップS203)。第2報酬計算部43は前回与えられた第1状態の値を保持しており、今回与えられた第1状態の値と比較することができる。第1状態の値が前回の第1状態の値より小さい場合(ステップS203:小)、第2報酬計算部43は報酬を増やす(ステップS204)。ここでの報酬の増加値は予め定めた値である。第1状態の値が前回の第1状態の値と同じ場合(ステップS203:同じ)、第2報酬計算部43は報酬を変化させない(ステップS205)。第1状態の値が前回の第1状態の値より大きい場合(ステップS203:大)、第2報酬計算部43は報酬を減らす(ステップS206)。ここでの報酬の減少値は予め定めた値である。なお、最初にステップS203が実行されるときは前回与えられた第1状態の値が存在しないので、ステップS205に進む。
Then, the second
次に、第2報酬計算部43は、与えられた第2状態の値を前回の第2状態の値と比較する(ステップS207)。第2報酬計算部43は前回与えられた第2状態の値を保持しており、今回与えられた第2状態の値と比較することができる。第2状態の値が前回の第2状態の値より大きい場合(ステップS207:大)、第2報酬計算部43は報酬を増やす(ステップS208)。ここでの報酬の増加値は予め定めた値である。第2状態の値が前回の第2状態の値と同じ場合(ステップS207:同じ)、第2報酬計算部43は報酬を変化させない(ステップS209)。第2状態の値が前回の第2状態の値より小さい場合(ステップS207:小)、第2報酬計算部43は報酬を減らす(ステップS210)。ここでの報酬の減少値は予め定めた値である。なお、最初にステップS207が実行されるときは前回与えられた第2状態の値が存在しないので、ステップS209に進む。
Next, the second
そして、第2関数更新部44は、第2報酬計算部43が計算した報酬に基づいて、数式(1)に従って行動価値関数Qを更新する(ステップS211)。さらに、第2関数更新部44は、ステップS211において更新が行われなくなり、行動価値関数Qが収束したか否かを判定する(ステップS212)。行動価値関数Qが収束していないと判定された場合(ステップS212:No)、第2制御パラメータ変更部52は、ステップS211で更新された行動価値関数Qに基づいて、パルス制御に関わる加工条件の制御パラメータを変更する(ステップS213)。ステップS213の後はステップS201に戻る。行動価値関数Qが収束したと判定された場合(ステップS212:Yes)、学習部40は、第2制御パラメータ変更部52によって、パルス制御に関わる加工条件の制御パラメータの全てが変更されたか否かを判定する(ステップS214)。パルス制御に関わる加工条件の制御パラメータの全てが変更されてはいないと判定された場合(ステップS214:No)、ステップS213において第2制御パラメータ変更部52の変更対象となる制御パラメータを別の制御パラメータに替える(ステップS215)。ステップS215において新たな変更対象となった別の制御パラメータとは、パルス制御に関わるまだ変更されていない制御パラメータである。ステップS215の後はステップS213に進む。
Then, the second
ステップS213における、パルス制御に関わる加工条件の制御パラメータの変更について以下に詳細に説明する。上述したように、ステップS213において変更される図5に示したパルス制御に関わる加工条件の6種類の制御パラメータには、変更対象となる優先順位が定められている。最初にステップS213に入ったときに第2制御パラメータ変更部52によって変更されるのは、狙い電圧値の制御パラメータである電圧制御パラメータである。そして、ステップS212において行動価値関数Qが収束したと判定される毎に、第2制御パラメータ変更部52の変更対象となる制御パラメータが、極間ギャップ調整値の制御パラメータであるギャップ制御パラメータ、回路補助設定の制御パラメータであるパルス傾き制御パラメータ、電流パルス長さの制御パラメータである長さ制御パラメータ、電流パルスピーク値の制御パラメータであるピーク制御パラメータ、加工回路の種別の制御パラメータである回路呼出しパラメータの順にステップS215で替えられていく。
The change of the control parameter of the processing condition related to the pulse control in step S213 will be described in detail below. As described above, the priority order to be changed is determined for the six control parameters of the processing conditions related to the pulse control shown in FIG. 5 that are changed in step S213. What is changed by the second control
行動価値関数Qが収束して、パルス制御に関わる加工条件の制御パラメータの全てが変更されたと学習部40が判定した場合(ステップS214:Yes)、パルス制御に関わる加工条件の制御パラメータの学習による最適化処理は終了し、学習結果が学習結果記憶部80に記憶される(ステップS216)。学習結果には、ステップS213で変更されて最終的に決定された各制御パラメータに加えて、各制御パラメータの変更過程の値、および制御パラメータに対応する第1状態の値および第2状態の値が含まれる。学習結果記憶部80に記憶された学習結果は、制御パラメータの変更前後の良否判断に利用することができる。また、上記のようにして最終的に決定された制御パラメータは、上記学習において報酬が最も多く得られ、与えられた加工条件設定値において最適な制御パラメータとして制御パラメータ保持部13に保持される。パルス制御に関わる加工条件の制御パラメータを学習により最適化することで、加工開始から終了までの間に不安定信号が発生することを防いで、安定信号のパルスの数を最大化することが可能になる。なお、上述したように、パルス制御に関わる加工条件の6種類の制御パラメータを同時に最適化する場合は、ステップS213において、第2制御パラメータ変更部52は、ステップS211で更新された行動価値関数Qに基づいて、6種類の制御パラメータを同時に変更する。この場合、ステップS214およびS215は不要であり、ステップS212において行動価値関数Qが収束したと判定された場合(ステップS212:Yes)、ただちにステップS216に進むようにすればよい。
When the
図17は、実施の形態1にかかる軸駆動制御に関わる加工条件の制御パラメータの学習による最適化処理を説明するフローチャートである。軸駆動制御に関わる加工条件の制御パラメータは極間制御パラメータとも呼ばれ、加工電極2と被加工物3とを近接させる際の減速距離、ジャンプ動作と呼ばれる瞬時退避行動の挙動を生成する速度および加速度のパラメータなど、放電加工機1の軸駆動挙動の変更を行うための変数値である。極間制御パラメータの変更には、極間に安定的に放電を発生させるための軸応答性の変更だけでなく、極間を清掃するためのジャンプ動作の変更、軸の過応答による固有周波数振動による加振を防ぐためのパラメータの変更も含まれる。
FIG. 17 is a flowchart illustrating an optimization process by learning control parameters of machining conditions related to the axis drive control according to the first embodiment. The control parameter of the machining condition related to the axis drive control is also called a gap control parameter, a deceleration distance when the
軸駆動制御にかかる報酬を計算する第3報酬計算部45は、パルス状態認識部32が求めた状態変数である第2状態の値および軸駆動認識部31が求めた状態変数である第3状態の値に基づいて報酬を計算する。第3報酬計算部45は、第2状態の値が大きく、第3状態の値が大きくなる場合に報酬を増やすように報酬の変化量を計算するのであれば、第2状態の値および第3状態の値をどのように用いて報酬の変化量を求めるかに制限はない。具体的には、第2状態の値が大きくなった場合に報酬を増やし、第2状態の値が小さくなった場合には報酬を減らす。これに加えて、第3状態の値が大きくなった場合に報酬を増やし、第3状態の値が小さくなった場合には報酬を減らす。また、軸の送り量に変化が無くても放電パルスの数が増大すれば報酬が増大するようにするが、軸の送り量が加工進行方向に大きくなっても放電パルスの数が減少した場合は報酬が減少するように報酬の計算方法を定めてもよい。
The third
第3報酬計算部45が計算した報酬に基づいて、第3関数更新部46は軸駆動制御に関わる制御パラメータを決定するための関数である行動価値関数Qを更新する。更新された行動価値関数Qに基づいて、第3制御パラメータ変更部53は、報酬が最も多く得られる制御パラメータとなるように軸駆動制御に関わる加工条件の制御パラメータを変更する。
Based on the reward calculated by the third
以上をふまえて、図7に示した軸駆動制御に関わる加工条件の5種類の制御パラメータの最適化について、図17を用いて説明する。図17は放電加工機1が放電加工を継続して実行している状況において実行され、変更される制御パラメータには優先順位が設定されているとして説明するが、5種類の制御パラメータを同時に最適化するようにしてもよい。
Based on the above, the optimization of the five types of control parameters of the machining conditions related to the shaft drive control shown in FIG. 7 will be described with reference to FIG. FIG. 17 illustrates that the process is performed in a situation where the
図17のフローチャートが実行される前に、軸駆動制御にかかる報酬の初期値を第3報酬計算部45がすでに保持しているとする。報酬の初期値は固定値であれば制限されず0としてもよい。まず、現在の加工条件および制御パラメータで加工を実行しているときの、加工電源制御部12の情報を状態観測部30が観測する(ステップS301)。具体的には、加工中の加工電源制御部12の指令を状態観測部30が取得する。そして、加工電源制御部12の指令に基づいて、パルス状態認識部32が第2状態の値を算出する(ステップS303)。また、現在の加工条件および制御パラメータで加工を実行しているときの、軸駆動制御部11の情報を状態観測部30が観測する(ステップS302)。具体的には、加工中の軸駆動制御部11の指令を状態観測部30が取得する。そして、軸駆動制御部11の指令に基づいて、軸駆動認識部31が第3状態の値を算出する(ステップS304)。次に、パルス状態認識部32が求めた第2状態の値および軸駆動認識部31が求めた第3状態の値が加工状態観測部33から第3報酬計算部45に与えられる。ここで、第2状態の値および第3状態の値は、制御パラメータ保持部13に設定されている現在使用されている制御パラメータと紐付けされて加工状態観測部33から第3報酬計算部45に与えられる。
Before the flowchart in FIG. 17 is executed, it is assumed that the third
そして、第3報酬計算部45は、与えられた第2状態の値を前回の第2状態の値と比較する(ステップS305)。第3報酬計算部45は前回与えられた第2状態の値を保持しており、今回与えられた第2状態の値と比較することができる。第2状態の値が前回の第2状態の値より大きい場合(ステップS305:大)、第3報酬計算部45は報酬を増やす(ステップS306)。ここでの報酬の増加値は予め定めた値である。第2状態の値が前回の第2状態の値と同じ場合(ステップS305:同じ)、第3報酬計算部45は報酬を変化させない(ステップS307)。第2状態の値が前回の第2状態の値より小さい場合(ステップS305:小)、第3報酬計算部45は報酬を減らす(ステップS308)。ここでの報酬の減少値は予め定めた値である。なお、最初にステップS305が実行されるときは前回与えられた第2状態の値が存在しないので、ステップS307に進む。
Then, the third
次に、第3報酬計算部45は、与えられた第3状態の値を前回の第3状態の値と比較する(ステップS309)。第3報酬計算部45は前回与えられた第3状態の値を保持しており、今回与えられた第3状態の値と比較することができる。第3状態の値が前回の第3状態の値より大きい場合(ステップS309:大)、第3報酬計算部45は報酬を増やす(ステップS310)。すなわち、第3状態の値が前回よりも安定した状態を示す場合には、報酬を増やす。ここでの報酬の増加値は予め定めた値である。第3状態の値が前回の第3状態の値と同じ場合(ステップS309:同じ)、第3報酬計算部45は報酬を変化させない(ステップS311)。第3状態の値が前回の第3状態の値より小さい場合(ステップS309:小)、第3報酬計算部45は報酬を減らす(ステップS312)。すなわち、第3状態の値が前回よりも不安定な状態を示す場合には、報酬を減らす。ここでの報酬の減少値は予め定めた値である。なお、最初にステップS309が実行されるときは前回与えられた第3状態の値が存在しないので、ステップS311に進む。
Next, the third
そして、第3関数更新部46は、第3報酬計算部45が計算した報酬に基づいて、数式(1)に従って行動価値関数Qを更新する(ステップS313)。さらに、第3関数更新部46は、ステップS313において更新が行われなくなり、行動価値関数Qが収束したか否かを判定する(ステップS314)。行動価値関数Qが収束していないと判定された場合(ステップS314:No)、第3制御パラメータ変更部53は、ステップS313で更新された行動価値関数Qに基づいて、軸駆動制御に関わる加工条件の制御パラメータを変更する(ステップS315)。ステップS315の後はステップS301およびS302に戻る。行動価値関数Qが収束したと判定された場合(ステップS314:Yes)、学習部40は、第3制御パラメータ変更部53によって、軸駆動制御に関わる加工条件の制御パラメータの全てが変更されたか否かを判定する(ステップS316)。軸駆動制御に関わる加工条件の制御パラメータの全てが変更されてはいないと判定された場合(ステップS316:No)、ステップS315において第3制御パラメータ変更部53の変更対象となる制御パラメータを別の制御パラメータに替える(ステップS317)。ステップS317において新たな変更対象となった別の制御パラメータとは、軸駆動制御に関わるまだ変更されていない制御パラメータである。ステップS317の後はステップS315に進む。
Then, the third function updating unit 46 updates the action value function Q according to the formula (1) based on the reward calculated by the third reward calculating unit 45 (Step S313). Further, the third function update unit 46 determines whether or not the update is not performed in step S313 and the action value function Q has converged (step S314). If it is determined that the action value function Q has not converged (step S314: No), the third control
ステップS315における、軸駆動制御に関わる加工条件の制御パラメータの変更について以下に詳細に説明する。上述したように、ステップS315において変更される図7に示した軸駆動制御に関わる加工条件の5種類の制御パラメータには、変更対象となる優先順位が定められている。最初にステップS315に入ったときに第3制御パラメータ変更部53によって変更されるのは、狙い電圧値の制御パラメータである電圧制御パラメータである。そして、ステップS314において行動価値関数Qが収束したと判定される毎に、第3制御パラメータ変更部53の変更対象となる制御パラメータが、軸応答性の制御パラメータであるGAIN制御パラメータ、最深値持続時間の制御パラメータである長さ制御パラメータ、ジャンプスピードおよびジャンプ高さの制御パラメータであるジャンプ制御パラメータ、極間ギャップ調整値の制御パラメータであるギャップ制御パラメータの順にステップS317で替えられていく。
The change of the control parameter of the machining condition related to the axis drive control in step S315 will be described in detail below. As described above, the priority order to be changed is determined for the five control parameters of the machining conditions related to the axis drive control shown in FIG. 7 that are changed in step S315. What is changed by the third control
行動価値関数Qが収束して、軸駆動制御に関わる加工条件の制御パラメータの全てが変更されたと学習部40が判定した場合(ステップS316:Yes)、軸駆動制御に関わる加工条件の制御パラメータの学習による最適化処理は終了し、学習結果が学習結果記憶部80に記憶される(ステップS318)。学習結果には、ステップS315で変更されて最終的に決定された各制御パラメータに加えて、各制御パラメータの変更過程の値、および制御パラメータに対応する第2状態の値および第3状態の値が含まれる。学習結果記憶部80に記憶された学習結果は、制御パラメータの変更前後の良否判断に利用することができる。また、上記のようにして最終的に決定された制御パラメータは、上記学習において報酬が最も多く得られ、与えられた加工条件設定値において最適な制御パラメータとして制御パラメータ保持部13に保持される。軸駆動制御に関わる加工条件の制御パラメータを学習により最適化することで、ジャンプ動作と言われる退避動作が終了し、放電を発生させるための極間位置制御が行われ、再び次のジャンプ動作が行われるまでといった1回の動作単位におけるパルス数を増大させて、観測毎における軸の送り量を加工進行方向に大きくして加工の進行を促進することが可能になる。なお、上述したように、軸駆動制御に関わる加工条件の5種類の制御パラメータを同時に最適化する場合は、ステップS315において、第3制御パラメータ変更部53は、ステップS313で更新された行動価値関数Qに基づいて、5種類の制御パラメータを同時に変更する。この場合、ステップS316およびS317は不要であり、ステップS314において行動価値関数Qが収束したと判定された場合(ステップS314:Yes)、ただちにステップS318に進むようにすればよい。
When the
また、上記図15から図17の説明において、更新された行動価値関数Qに基づいて変更される制御パラメータの変更の方法は、現状の状態stにおける行動価値関数Q(st,at)で求められる行動価値Qが最大となるような行動atすなわち制御パラメータを求めるやり方であれば特に限定されない。Further, in the description of FIG. 17 from FIG 15, the method of changing the control parameter is changed based on the updated action value function Q is action value in the current state s t function Q (s t, a t) action value Q sought is not particularly limited as long as the manner for obtaining the action a t or control parameters such as the maximum.
なお、同一の加工条件の制御パラメータは同一であるので、図15から図17のフローチャートを並列して実行した場合には、それぞれのフローチャートによる変更を同一の制御パラメータが受けることになる。 Since the control parameters under the same machining conditions are the same, when the flowcharts of FIGS. 15 to 17 are executed in parallel, the same control parameters are changed by the respective flowcharts.
図15から図17のフローチャートによる制御パラメータの最適化の動作は放電加工機1による加工動作が開始され、放電が発生した段階から行われ、放電加工が終了するまで続けられる。すなわち、加工の開始と同時に加工の状態は状態観測部30により観測され、加工が終了するまで最適な制御パラメータの探索が学習部40およびパラメータ変更部50により行われる。すなわち、機械学習装置100によって、図15から図17のフローチャートが並列して実行され、図15から図17の全ての終了条件が満たされるまで制御パラメータの更新は継続する。全ての終了条件が満たされた場合に制御パラメータの変更は終了する。
The operation of optimizing the control parameters according to the flowcharts of FIGS. 15 to 17 is performed from the stage when the
機械学習装置100による上記学習行動は、放電加工開始から加工終了となるまで継続的に行われる。学習行動における報酬を、上記第1、第2および第3状態に基づいて求めて、制御パラメータの変更行動を行う。この学習行動により、加工終了後に得らえた最適な制御パラメータによる行動価値Qは、最初に設定されている制御パラメータによる行動価値Qより高められている。実施の形態1にかかる放電加工機1によって、行動価値Qが高められることにより、加工終了までにかかる時間の短縮、および安定した放電による加工によって得られる被加工物の加工精度および加工面質の向上が効果として得られる。
The above learning behavior by the
従来の適応制御においては、加工が安定するように決められたルールにより加工条件設定値の制御は行なわれていたが、制御パラメータを変更する適応制御は行われていなかった。これに対して、機械学習装置100によれば、加工物形状および加工材質に応じて、実際に放電加工を実行させながら、制御パラメータを調整する最適化学習を実行するので、物理量としてより適切で安定した加工条件を自動的に学習することができる。すなわち、機械学習装置100によれば、被加工物の形状、電極材質、電極形状といった、あらかじめ想定が難しい適応制御使用条件下においても、適応制御の適用範囲を限定することなく制御パラメータの最適化を行うことが可能となり、加工の安定性を高めて、加工速度および加工精度の改善を図ることができる。
In the conventional adaptive control, processing condition setting values are controlled according to rules determined to stabilize processing, but adaptive control for changing control parameters is not performed. On the other hand, according to the
実施の形態2.
図18は、本発明の実施の形態2にかかる放電加工機1Aの構成を示すブロック図である。放電加工機1Aは、実施の形態1にかかる放電加工機1に、加工結果を利用した追加学習を行うための構成である加工結果入力部23を入出力部20に追加している。
FIG. 18 is a block diagram showing a configuration of an
実施の形態1においては、ある特定の加工を行う際の制御パラメータの学習行動について説明したが、実施の形態2においては、同じ被加工物3の材料および同じ加工条件設定値においてあらかじめ一度加工が行われたものとする。一度加工が行われた結果として、被加工物3の加工後の面粗さと、加工電極2の加工後の電極消耗量である消耗重量または消耗長さとが得られているとする。
In the first embodiment, the learning behavior of the control parameter when performing a specific processing has been described. In the second embodiment, however, the processing is performed once in advance with the same material of the
加工結果入力部23は、ユーザが入力した被加工物3の加工後の面粗さおよび加工電極2の加工後の電極消耗量といった加工結果を受け付ける。加工結果の入力の形式は、表示部22が選択可能な選択枝を表示して、ユーザの選択結果を加工結果入力部23が受け付ける形式でもよい。また、ユーザが入力した被加工物3の加工後の面粗さおよび加工電極2の加工後の電極消耗量についての数値データを加工結果入力部23が受け付ける形式でもよく、限定されない。また、加工結果入力部23が受け付けた被加工物3の加工後の面粗さおよび加工電極2の加工後の電極消耗量の良否評価の方法も設計事項であり特に限定しない。また、被加工物3の加工後の面粗さおよび加工電極2の加工後の電極消耗量の良否自体を加工結果入力部23が受け付けるようにしてもかまわない。
The processing
一度行われた加工と同じ加工条件設定で再度加工を実行するときに、加工結果入力部23が受け付けた以前の加工における加工結果を用いることで、図15から図17で説明した制御パラメータの変更における変更量に制限の追加または解除を行うことができる。加工結果入力部23が受け付けた加工結果に基づいて、加工状態観測部33などが、パラメータ変更部50に制御パラメータの変更における変更量に制限の追加または解除を実行させる。
When the machining is performed again with the same machining condition setting as the once performed machining, the machining result in the previous machining received by the machining
具体的には、加工結果入力部23が受け付けた被加工物3の加工後の面粗さの良否評価が悪いとされた場合、加工面質に影響を及ぼす制御パラメータの変更に制限を加える。一例として、電流パルス長さの制御パラメータである長さ制御パラメータを一定値以上変更しないように長さ制御パラメータの変更幅にパラメータ変更部50が制限を加える。
Specifically, if the evaluation of the quality of the surface roughness of the
また、加工結果入力部23が受け付けた加工電極2の加工後の電極消耗量が少なくまだ余裕があると判断された場合は、電極消耗量に影響を及ぼす制御パラメータの変更の制限をパラメータ変更部50が解除する。一例として、回路補助設定のパルス傾き制御パラメータの変更幅を増やして、変更の制限を解除する。逆に電極消耗量が大きい場合は、制御パラメータの変更にパラメータ変更部50がさらに制限を加えることもできる。
If it is determined that the electrode consumption after machining of the
実施の形態2にかかる放電加工機1Aによれば、一度行われた加工による加工結果を受け付けることにより、同じ被加工物3の材料および同じ加工条件設定値において、制御パラメータの変更の制限を加工結果に依存させることができる。これにより、実施の形態1で得られる効果加えて、加工後の加工面の面質の向上といった精度向上効果、電極消耗量の低減といったコスト削減効果が得られる。
According to the
実施の形態3.
図19は、本発明の実施の形態3にかかる放電加工機1Bの構成を示すブロック図である。放電加工機1Bは、実施の形態2にかかる放電加工機1Aに、通信部60が追加されている。通信部60は、学習結果記憶部80に記憶された学習結果を送信可能な学習結果データに変換する学習内容ファイル化部61と、外部から学習結果データを受信する受信部62と、学習結果データを外部に送信する送信部63とを備える。受信部62および送信部63は、放電加工機1Bの外部に存在するクラウドサーバ300に接続されて通信が可能である。
FIG. 19 is a block diagram showing a configuration of an
クラウドサーバ300は、放電加工機1Bの制御装置10と同様な学習機能を有した放電加工機301〜303にも接続されている。したがって、放電加工機1Bは、通信部60を介して他の放電加工機である放電加工機301〜303と通信することができる。クラウドサーバ300は、放電加工機1Bの学習結果データのみならず、放電加工機301〜303の学習結果データも記憶することができる。クラウドサーバ300と放電加工機1B,301〜303との通信方式については、公知の技術を利用すればよく特に制限はない。
The
実施の形態1および2で説明したような制御パラメータの最適化学習が既に実行されている場合に、学習結果記憶部80に記憶されている学習結果を、外部に存在する放電加工機301〜303が利用可能な形式の学習結果データに学習内容ファイル化部61が変換することができる。学習結果データは、制御装置10と同様な制御装置であれば利用が可能なデータ形式であればその形式は限定されない。
When the optimization learning of the control parameters as described in the first and second embodiments has already been executed, the learning results stored in the learning
学習内容ファイル化部61により作成された学習結果データは、送信部63を経由して、クラウドサーバ300に蓄えることができる。クラウドサーバ300に蓄えられた学習結果データは、放電加工機301〜303に対し自動的または能動的に送信され、放電加工機301〜303がその学習結果データを利用するかどうかは、放電加工機301〜303のユーザの判断で決定できるものとする。
The learning result data created by the learning
この学習結果データを放電加工機301〜303の中に存在する機械学習装置に取り込むことにより、機械学習装置100が学習した内容を、放電加工機301〜303でも同様に利用することができる。
By taking the learning result data into the machine learning devices existing in the
また逆に、放電加工機301〜303において学習により作成された学習結果データも、クラウドサーバ300、受信部62を介して、制御装置10にて利用することができる。この際、受信部62を介して放電加工機301〜303の制御装置で学習した内容または観測の状態は、表示部22に表示することができる。
Conversely, learning result data created by learning in the
これにより、遠隔地といった外部に存在する放電加工機301〜303の制御装置による学習結果を放電加工機1Bで利用したり、放電加工機301〜303の加工状態を放電加工機1Bで観測したりできる。また、放電加工機1Bによる学習結果を同一仕様の放電加工機301〜303に利用させることも可能となる。したがって、1つの放電加工機単体の調整のみならず、同一仕様の複数の放電加工機に対する機械性能の向上を、同一仕様の放電加工機の数が増えるほど効率的に実行することが可能になる。
As a result, a learning result obtained by a control device of the
実施の形態1から3にかかる機械学習装置100は、パーソナルコンピュータまたは汎用コンピュータといったコンピュータシステムにより実現される。図20は、実施の形態1から3にかかる機械学習装置100の機能をコンピュータシステムで実現する場合のハードウェア構成を示す図である。機械学習装置100の機能をコンピュータシステムで実現する場合、機械学習装置100の機能は、図20に示すようにCPU(Central Processing Unit)201、メモリ202、記憶装置203、表示装置204および入力装置205により実現される。機械学習装置100が実行する機能は、ソフトウェア、ファームウェア、またはソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェアまたはファームウェアは、プログラムとして記述されて記憶装置203に格納される。CPU201は、記憶装置203に記憶されたソフトウェアまたはファームウェアをメモリ202に読み出して実行することにより、機械学習装置100の機能を実現する。すなわち、コンピュータシステムは、機械学習装置100の機能がCPU201により実行されるときに、実施の形態1から3にかかる機械学習方法を実施するステップが結果的に実行されることになるプログラムを格納するための記憶装置203を備える。また、これらのプログラムは、機械学習装置100の機能が実現する処理をコンピュータに実行させるものであるともいえる。メモリ202は、RAM(Random Access Memory)といった揮発性の記憶領域が該当する。記憶装置203は、ROM(Read Only Memory)、フラッシュメモリといった不揮発性または揮発性の半導体メモリ、磁気ディスクが該当する。表示装置204の具体例は、モニタ、ディスプレイである。入力装置205の具体例は、キーボード、マウス、タッチパネルである。
The
以上の実施の形態に示した構成は、本発明の内容の一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、本発明の要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。 The configurations described in the above embodiments are merely examples of the contents of the present invention, and can be combined with other known technologies, and can be combined with other known technologies without departing from the gist of the present invention. Parts can be omitted or changed.
1,1A,1B,301〜303 放電加工機、2 加工電極、3 被加工物、4 駆動装置、5 加工電源、10 制御装置、11 軸駆動制御部、12 加工電源制御部、13 制御パラメータ保持部、14 初期パラメータ設定部、15 加工条件設定部、20 入出力部、21 加工条件入力部、22 表示部、23 加工結果入力部、30 状態観測部、31 軸駆動認識部、32 パルス状態認識部、33 加工状態観測部、40 学習部、41 第1報酬計算部、42 第1関数更新部、43 第2報酬計算部、44 第2関数更新部、45 第3報酬計算部、46 第3関数更新部、47 報酬計算部、48 関数更新部、50 パラメータ変更部、51 第1制御パラメータ変更部、52 第2制御パラメータ変更部、53 第3制御パラメータ変更部、60 通信部、61 学習内容ファイル化部、62 受信部、63 送信部、80 学習結果記憶部、100 機械学習装置、201 CPU、202 メモリ、203 記憶装置、204 表示装置、205 入力装置、300 クラウドサーバ。 1, 1A, 1B, 301 to 303 EDM, 2 machining electrode, 3 workpiece, 4 drive device, 5 machining power supply, 10 control device, 11 axis drive control unit, 12 machining power control unit, 13 control parameter holding Unit, 14 initial parameter setting unit, 15 processing condition setting unit, 20 input / output unit, 21 processing condition input unit, 22 display unit, 23 processing result input unit, 30 state observation unit, 31 axis drive recognition unit, 32 pulse state recognition Part, 33 machining state observing part, 40 learning part, 41 first reward calculating part, 42 first function updating part, 43 second reward calculating part, 44 second function updating part, 45 third reward calculating part, 46 third Function update unit, 47 reward calculation unit, 48 function update unit, 50 parameter change unit, 51 first control parameter change unit, 52 second control parameter change unit, 53 third control parameter Change unit, 60 communication unit, 61 learning content filing unit, 62 receiving unit, 63 transmitting unit, 80 learning result storage unit, 100 machine learning device, 201 CPU, 202 memory, 203 storage device, 204 display device, 205 input device , 300 cloud server.
Claims (6)
放電加工中の加工状態を表す複数の状態変数を観測する状態観測部と、
複数の前記状態変数に基づいて前記制御パラメータを学習する学習部と、
を備え、
前記状態観測部は、パルスの不安定信号の発生回数を予め定めた期間の間に累積させた値である第1状態の値、前記予め定めた期間において発生したパルス数である第2状態の値、および駆動装置における軸の送り量である第3状態の値を複数の前記状態変数として観測し、
前記学習部は、前記状態変数に基づいて報酬を計算する報酬計算部と、前記報酬に基づいて、前記制御パラメータを決定するための関数を更新する関数更新部を備え、
前記報酬計算部は、電圧制御にかかる報酬を計算する第1報酬計算部と、パルス制御にかかる報酬を計算する第2報酬計算部と、軸駆動制御にかかる報酬を計算する第3報酬計算部とを備え、
前記関数更新部は、電圧制御にかかる関数を更新する第1関数更新部と、パルス制御にかかる関数を更新する第2関数更新部と、軸駆動制御にかかる関数を更新する第3関数更新部とを備え、
前記第1報酬計算部は、前記第1状態の値が前回よりも小さい場合には、前記報酬を増やし、前記第1状態の値が前回よりも大きい場合には、前記報酬を減らす
ことを特徴とする機械学習装置。 A machine learning device for learning control parameters for controlling machining conditions in an electric discharge machine,
A state observation unit that observes a plurality of state variables representing a machining state during electric discharge machining,
A learning unit that learns the control parameter based on a plurality of the state variables;
With
The state observation unit includes a first state value that is a value obtained by accumulating the number of times of generation of an unstable signal of a pulse during a predetermined period, and a second state value that is a number of pulses generated in the predetermined period. Observing the value and the value of the third state, which is the feed amount of the shaft in the driving device, as a plurality of the state variables,
The learning unit includes a reward calculation unit that calculates a reward based on the state variable, and a function update unit that updates a function for determining the control parameter based on the reward.
The reward calculator includes a first reward calculator that calculates a reward for voltage control, a second reward calculator that calculates a reward for pulse control, and a third reward calculator that calculates a reward for axis drive control. With
The function update unit includes a first function update unit that updates a function related to voltage control, a second function update unit that updates a function related to pulse control, and a third function update unit that updates a function related to axis drive control. With
The first reward calculation unit increases the reward when the value of the first state is smaller than the previous time, and decreases the reward when the value of the first state is larger than the previous time. Machine learning device.
放電加工中の加工状態を表す複数の状態変数を観測する状態観測部と、
複数の前記状態変数に基づいて前記制御パラメータを学習する学習部と、
を備え、
前記状態観測部は、パルスの不安定信号の発生回数を予め定めた期間の間に累積させた値である第1状態の値、前記予め定めた期間において発生したパルス数である第2状態の値、および駆動装置における軸の送り量である第3状態の値を複数の前記状態変数として観測し、
前記学習部は、前記状態変数に基づいて報酬を計算する報酬計算部と、前記報酬に基づいて、前記制御パラメータを決定するための関数を更新する関数更新部を備え、
前記報酬計算部は、電圧制御にかかる報酬を計算する第1報酬計算部と、パルス制御にかかる報酬を計算する第2報酬計算部と、軸駆動制御にかかる報酬を計算する第3報酬計算部とを備え、
前記関数更新部は、電圧制御にかかる関数を更新する第1関数更新部と、パルス制御にかかる関数を更新する第2関数更新部と、軸駆動制御にかかる関数を更新する第3関数更新部とを備え、
前記第1報酬計算部は、前記第2状態の値が前回よりも大きい場合には、前記報酬を増やし、前記第2状態の値が前回よりも小さい場合には、前記報酬を減らす
ことを特徴とする機械学習装置。 A machine learning device for learning control parameters for controlling machining conditions in an electric discharge machine,
A state observation unit that observes a plurality of state variables representing a machining state during electric discharge machining,
A learning unit that learns the control parameter based on a plurality of the state variables;
With
The state observation unit includes a first state value that is a value obtained by accumulating the number of times of generation of an unstable signal of a pulse during a predetermined period, and a second state value that is a number of pulses generated in the predetermined period. Observing the value and the value of the third state, which is the feed amount of the shaft in the driving device, as a plurality of the state variables,
The learning unit includes a reward calculation unit that calculates a reward based on the state variable, and a function update unit that updates a function for determining the control parameter based on the reward.
The reward calculator includes a first reward calculator that calculates a reward for voltage control, a second reward calculator that calculates a reward for pulse control, and a third reward calculator that calculates a reward for axis drive control. With
The function update unit includes a first function update unit that updates a function related to voltage control, a second function update unit that updates a function related to pulse control, and a third function update unit that updates a function related to axis drive control. With
The first reward calculation unit increases the reward when the value of the second state is larger than the previous time, and decreases the reward when the value of the second state is smaller than the previous time. Machine learning device.
放電加工中の加工状態を表す複数の状態変数を観測する状態観測部と、
複数の前記状態変数に基づいて前記制御パラメータを学習する学習部と、
を備え、
前記状態観測部は、パルスの不安定信号の発生回数を予め定めた期間の間に累積させた値である第1状態の値、前記予め定めた期間において発生したパルス数である第2状態の値、および駆動装置における軸の送り量である第3状態の値を複数の前記状態変数として観測し、
前記学習部は、前記状態変数に基づいて報酬を計算する報酬計算部と、前記報酬に基づいて、前記制御パラメータを決定するための関数を更新する関数更新部を備え、
前記報酬計算部は、電圧制御にかかる報酬を計算する第1報酬計算部と、パルス制御にかかる報酬を計算する第2報酬計算部と、軸駆動制御にかかる報酬を計算する第3報酬計算部とを備え、
前記関数更新部は、電圧制御にかかる関数を更新する第1関数更新部と、パルス制御にかかる関数を更新する第2関数更新部と、軸駆動制御にかかる関数を更新する第3関数更新部とを備え、
前記第2報酬計算部は、前記第1状態の値が前回よりも小さい場合には、前記報酬を増やし、前記第1状態の値が前回よりも大きい場合には、前記報酬を減らす
ことを特徴とする機械学習装置。 A machine learning device for learning control parameters for controlling machining conditions in an electric discharge machine,
A state observation unit that observes a plurality of state variables representing a machining state during electric discharge machining,
A learning unit that learns the control parameter based on a plurality of the state variables;
With
The state observation unit includes a first state value that is a value obtained by accumulating the number of times of generation of an unstable signal of a pulse during a predetermined period, and a second state value that is a number of pulses generated in the predetermined period. Observing the value and the value of the third state, which is the feed amount of the shaft in the driving device, as a plurality of the state variables,
The learning unit includes a reward calculation unit that calculates a reward based on the state variable, and a function update unit that updates a function for determining the control parameter based on the reward.
The reward calculator includes a first reward calculator that calculates a reward for voltage control, a second reward calculator that calculates a reward for pulse control, and a third reward calculator that calculates a reward for axis drive control. With
The function update unit includes a first function update unit that updates a function related to voltage control, a second function update unit that updates a function related to pulse control, and a third function update unit that updates a function related to axis drive control. With
The second reward calculation unit increases the reward when the value of the first state is smaller than the previous time, and decreases the reward when the value of the first state is larger than the previous time. Machine learning device.
放電加工中の加工状態を表す複数の状態変数を観測する状態観測部と、
複数の前記状態変数に基づいて前記制御パラメータを学習する学習部と、
を備え、
前記状態観測部は、パルスの不安定信号の発生回数を予め定めた期間の間に累積させた値である第1状態の値、前記予め定めた期間において発生したパルス数である第2状態の値、および駆動装置における軸の送り量である第3状態の値を複数の前記状態変数として観測し、
前記学習部は、前記状態変数に基づいて報酬を計算する報酬計算部と、前記報酬に基づいて、前記制御パラメータを決定するための関数を更新する関数更新部を備え、
前記報酬計算部は、電圧制御にかかる報酬を計算する第1報酬計算部と、パルス制御にかかる報酬を計算する第2報酬計算部と、軸駆動制御にかかる報酬を計算する第3報酬計算部とを備え、
前記関数更新部は、電圧制御にかかる関数を更新する第1関数更新部と、パルス制御にかかる関数を更新する第2関数更新部と、軸駆動制御にかかる関数を更新する第3関数更新部とを備え、
前記第2報酬計算部は、前記第2状態の値が前回よりも大きい場合には、前記報酬を増やし、前記第2状態の値が前回よりも小さい場合には、前記報酬を減らす
ことを特徴とする機械学習装置。 A machine learning device for learning control parameters for controlling machining conditions in an electric discharge machine,
A state observation unit that observes a plurality of state variables representing a machining state during electric discharge machining,
A learning unit that learns the control parameter based on a plurality of the state variables;
With
The state observation unit includes a first state value that is a value obtained by accumulating the number of times of generation of an unstable signal of a pulse during a predetermined period, and a second state value that is a number of pulses generated in the predetermined period. Observing the value and the value of the third state, which is the feed amount of the shaft in the driving device, as a plurality of the state variables,
The learning unit includes a reward calculation unit that calculates a reward based on the state variable, and a function update unit that updates a function for determining the control parameter based on the reward.
The reward calculator includes a first reward calculator that calculates a reward for voltage control, a second reward calculator that calculates a reward for pulse control, and a third reward calculator that calculates a reward for axis drive control. With
The function update unit includes a first function update unit that updates a function related to voltage control, a second function update unit that updates a function related to pulse control, and a third function update unit that updates a function related to axis drive control. With
The second reward calculation unit increases the reward when the value of the second state is larger than the previous time, and decreases the reward when the value of the second state is smaller than the previous time. Machine learning device.
放電加工中の加工状態を表す複数の状態変数を観測する状態観測部と、
複数の前記状態変数に基づいて前記制御パラメータを学習する学習部と、
を備え、
前記状態観測部は、パルスの不安定信号の発生回数を予め定めた期間の間に累積させた値である第1状態の値、前記予め定めた期間において発生したパルス数である第2状態の値、および駆動装置における軸の送り量である第3状態の値を複数の前記状態変数として観測し、
前記学習部は、前記状態変数に基づいて報酬を計算する報酬計算部と、前記報酬に基づいて、前記制御パラメータを決定するための関数を更新する関数更新部とを備え、
前記報酬計算部は、電圧制御にかかる報酬を計算する第1報酬計算部と、パルス制御にかかる報酬を計算する第2報酬計算部と、軸駆動制御にかかる報酬を計算する第3報酬計算部とを備え、
前記関数更新部は、電圧制御にかかる関数を更新する第1関数更新部と、パルス制御にかかる関数を更新する第2関数更新部と、軸駆動制御にかかる関数を更新する第3関数更新部とを備え、
前記第3報酬計算部は、前記第2状態の値が前回よりも大きい場合には、前記報酬を増やし、前記第2状態の値が前回よりも小さい場合には、前記報酬を減らす
ことを特徴とする機械学習装置。 A machine learning device for learning control parameters for controlling machining conditions in an electric discharge machine,
A state observation unit that observes a plurality of state variables representing a machining state during electric discharge machining,
A learning unit that learns the control parameter based on a plurality of the state variables;
With
The state observation unit includes a first state value that is a value obtained by accumulating the number of times of generation of an unstable signal of a pulse during a predetermined period, and a second state value that is a number of pulses generated in the predetermined period. Observing the value and the value of the third state, which is the feed amount of the shaft in the driving device, as a plurality of the state variables,
The learning unit includes a reward calculation unit that calculates a reward based on the state variable, and a function update unit that updates a function for determining the control parameter based on the reward,
The reward calculator includes a first reward calculator that calculates a reward for voltage control, a second reward calculator that calculates a reward for pulse control, and a third reward calculator that calculates a reward for axis drive control. With
The function update unit includes a first function update unit that updates a function related to voltage control, a second function update unit that updates a function related to pulse control, and a third function update unit that updates a function related to axis drive control. With
The third reward calculation unit increases the reward when the value of the second state is larger than the previous time, and decreases the reward when the value of the second state is smaller than the previous time. Machine learning device.
放電加工中の加工状態を表す複数の状態変数を観測する状態観測部と、
複数の前記状態変数に基づいて前記制御パラメータを学習する学習部と、
を備え、
前記状態観測部は、パルスの不安定信号の発生回数を予め定めた期間の間に累積させた値である第1状態の値、前記予め定めた期間において発生したパルス数である第2状態の値、および駆動装置における軸の送り量である第3状態の値を複数の前記状態変数として観測し、
前記学習部は、前記状態変数に基づいて報酬を計算する報酬計算部と、前記報酬に基づいて、前記制御パラメータを決定するための関数を更新する関数更新部とを備え、
前記報酬計算部は、電圧制御にかかる報酬を計算する第1報酬計算部と、パルス制御にかかる報酬を計算する第2報酬計算部と、軸駆動制御にかかる報酬を計算する第3報酬計算部とを備え、
前記関数更新部は、電圧制御にかかる関数を更新する第1関数更新部と、パルス制御にかかる関数を更新する第2関数更新部と、軸駆動制御にかかる関数を更新する第3関数更新部とを備え、
前記第3報酬計算部は、前記第3状態の値が前回よりも大きい場合には、前記報酬を増やし、前記第3状態の値が前回よりも小さい場合には、前記報酬を減らす
ことを特徴とする機械学習装置。 A machine learning device for learning control parameters for controlling machining conditions in an electric discharge machine,
A state observation unit that observes a plurality of state variables representing a machining state during electric discharge machining,
A learning unit that learns the control parameter based on a plurality of the state variables;
With
The state observation unit includes a first state value that is a value obtained by accumulating the number of times of generation of an unstable signal of a pulse during a predetermined period, and a second state value that is a number of pulses generated in the predetermined period. Observing the value and the value of the third state, which is the feed amount of the shaft in the driving device, as a plurality of the state variables,
The learning unit includes a reward calculation unit that calculates a reward based on the state variable, and a function update unit that updates a function for determining the control parameter based on the reward,
The reward calculator includes a first reward calculator that calculates a reward for voltage control, a second reward calculator that calculates a reward for pulse control, and a third reward calculator that calculates a reward for axis drive control. With
The function update unit includes a first function update unit that updates a function related to voltage control, a second function update unit that updates a function related to pulse control, and a third function update unit that updates a function related to axis drive control. With
The third reward calculation unit increases the reward when the value of the third state is larger than the previous time, and decreases the reward when the value of the third state is smaller than the previous time. Machine learning device.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/015910 WO2019202672A1 (en) | 2018-04-17 | 2018-04-17 | Machine learning device, electric discharge machine, and machine learning method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6663538B1 true JP6663538B1 (en) | 2020-03-11 |
JPWO2019202672A1 JPWO2019202672A1 (en) | 2020-04-30 |
Family
ID=68239485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019508980A Active JP6663538B1 (en) | 2018-04-17 | 2018-04-17 | Machine learning device |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP6663538B1 (en) |
CN (1) | CN111954582B (en) |
WO (1) | WO2019202672A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022269664A1 (en) * | 2021-06-21 | 2022-12-29 | 三菱電機株式会社 | Machining condition searching device and machining condition searching method |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6695518B1 (en) * | 2019-07-03 | 2020-05-20 | 三菱電機株式会社 | Machine learning device, numerical control device, wire electric discharge machine, and machine learning method |
CN114746203B (en) * | 2019-12-03 | 2023-08-18 | 三菱电机株式会社 | Control device, electric discharge machine, and machine learning device |
WO2021186521A1 (en) * | 2020-03-17 | 2021-09-23 | 三菱電機株式会社 | Machining condition searching device and machining condition searching method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02262915A (en) * | 1989-03-31 | 1990-10-25 | Mitsubishi Electric Corp | Controller for electric discharge machine |
JPH06170645A (en) * | 1992-12-03 | 1994-06-21 | Sodick Co Ltd | Electric discharge machining control method and electric discharge machine control device |
JP2013094940A (en) * | 2011-11-04 | 2013-05-20 | Fanuc Ltd | Machining condition adjusting device for electric discharge machine |
JP2017042882A (en) * | 2015-08-27 | 2017-03-02 | ファナック株式会社 | Wire electric discharge machine for working while adjusting the working condition |
JP2017068566A (en) * | 2015-09-30 | 2017-04-06 | ファナック株式会社 | Machine learning device and machine learning method for optimizing frequency of tool correction for machine tool and machine tool provided with machine learning device |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6311725B2 (en) * | 2013-02-04 | 2018-04-18 | アンカ・ピーティーワイ・リミテッド | Pulse and gap control for electrical discharge machining equipment |
JP6619192B2 (en) * | 2015-09-29 | 2019-12-11 | ファナック株式会社 | Wire electrical discharge machine with function to warn of abnormal load on moving axis |
JP6235543B2 (en) * | 2015-09-30 | 2017-11-22 | ファナック株式会社 | Machine learning device, motor control device, processing machine, and machine learning method for optimizing cycle processing time of processing machine |
-
2018
- 2018-04-17 CN CN201880092284.8A patent/CN111954582B/en active Active
- 2018-04-17 JP JP2019508980A patent/JP6663538B1/en active Active
- 2018-04-17 WO PCT/JP2018/015910 patent/WO2019202672A1/en active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02262915A (en) * | 1989-03-31 | 1990-10-25 | Mitsubishi Electric Corp | Controller for electric discharge machine |
JPH06170645A (en) * | 1992-12-03 | 1994-06-21 | Sodick Co Ltd | Electric discharge machining control method and electric discharge machine control device |
JP2013094940A (en) * | 2011-11-04 | 2013-05-20 | Fanuc Ltd | Machining condition adjusting device for electric discharge machine |
JP2017042882A (en) * | 2015-08-27 | 2017-03-02 | ファナック株式会社 | Wire electric discharge machine for working while adjusting the working condition |
JP2017068566A (en) * | 2015-09-30 | 2017-04-06 | ファナック株式会社 | Machine learning device and machine learning method for optimizing frequency of tool correction for machine tool and machine tool provided with machine learning device |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022269664A1 (en) * | 2021-06-21 | 2022-12-29 | 三菱電機株式会社 | Machining condition searching device and machining condition searching method |
JP7204952B1 (en) * | 2021-06-21 | 2023-01-16 | 三菱電機株式会社 | MACHINING CONDITION SEARCH DEVICE AND MACHINING CONDITION SEARCH METHOD |
Also Published As
Publication number | Publication date |
---|---|
CN111954582A (en) | 2020-11-17 |
CN111954582B (en) | 2021-09-03 |
JPWO2019202672A1 (en) | 2020-04-30 |
WO2019202672A1 (en) | 2019-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6663538B1 (en) | Machine learning device | |
JP6140228B2 (en) | Wire electrical discharge machine for machining while adjusting machining conditions | |
JP6063013B1 (en) | Numerical control device with machining condition adjustment function to suppress chatter or tool wear / breakage | |
JP6219897B2 (en) | Machine tools that generate optimal acceleration / deceleration | |
CN109581962B (en) | Numerical control system | |
JP6077617B1 (en) | Machine tools that generate optimal speed distribution | |
JP2017030067A (en) | Control device-added machining apparatus with machining time measuring function and on-machine measuring function | |
JP4964096B2 (en) | Servo gain adjusting device and servo gain adjusting method | |
KR102224970B1 (en) | Controller and machine learning device | |
CN110549005B (en) | Machining condition adjustment device and machine learning device | |
CN111702769B (en) | Machine learning device, control device, laser processing machine, and machine learning method | |
JP2017191536A (en) | Numerical controller for controlling output values during feedback control | |
CN108400743B (en) | Control device, control method, and computer storage medium | |
JP6704550B1 (en) | Machining condition search device and wire electric discharge machine | |
EP2871016A2 (en) | Wire-cut electrical discharge machining machine and method of machining therein | |
WO2021001974A1 (en) | Machine learning device, numerical control device, wire electric discharge machine, machine learning method | |
JP6880350B1 (en) | Learning device, electric discharge machine and learning method | |
JP2019149041A (en) | Numerical control device | |
JP6739690B1 (en) | Controller, electric discharge machine, and machine learning device | |
JP7204952B1 (en) | MACHINING CONDITION SEARCH DEVICE AND MACHINING CONDITION SEARCH METHOD | |
CN110893515A (en) | Machining condition adjustment device and machine learning device | |
KR20220157437A (en) | Dental machining system for generating process parameters of machining | |
KR20050035463A (en) | Electrical discharge machining apparatus for micro discharge, and method for as the same | |
JPH10217039A (en) | Electric discharge machining control device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190215 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190215 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190215 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190719 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20191008 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191227 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20191227 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20200114 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20200121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6663538 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |