JP6110452B1 - 機械学習装置およびコイル通電加熱装置 - Google Patents

機械学習装置およびコイル通電加熱装置 Download PDF

Info

Publication number
JP6110452B1
JP6110452B1 JP2015194142A JP2015194142A JP6110452B1 JP 6110452 B1 JP6110452 B1 JP 6110452B1 JP 2015194142 A JP2015194142 A JP 2015194142A JP 2015194142 A JP2015194142 A JP 2015194142A JP 6110452 B1 JP6110452 B1 JP 6110452B1
Authority
JP
Japan
Prior art keywords
energization heating
coil
unit
state
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015194142A
Other languages
English (en)
Other versions
JP2017069421A (ja
Inventor
靖典 杉本
靖典 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FANUC Corp
Original Assignee
FANUC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FANUC Corp filed Critical FANUC Corp
Priority to JP2015194142A priority Critical patent/JP6110452B1/ja
Priority to CN201610697200.6A priority patent/CN106558960B/zh
Priority to DE102016011531.9A priority patent/DE102016011531A1/de
Priority to US15/280,975 priority patent/US10004112B2/en
Application granted granted Critical
Publication of JP6110452B1 publication Critical patent/JP6110452B1/ja
Publication of JP2017069421A publication Critical patent/JP2017069421A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B1/00Details of electric heating devices
    • H05B1/02Automatic switching arrangements specially adapted to apparatus ; Control of heating devices
    • H05B1/0227Applications
    • H05B1/0288Applications for non specified applications
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02KDYNAMO-ELECTRIC MACHINES
    • H02K15/00Methods or apparatus specially adapted for manufacturing, assembling, maintaining or repairing of dynamo-electric machines
    • H02K15/04Methods or apparatus specially adapted for manufacturing, assembling, maintaining or repairing of dynamo-electric machines of windings, prior to mounting into machines
    • H02K15/0435Wound windings
    • H02K15/0442Loop windings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01FMAGNETS; INDUCTANCES; TRANSFORMERS; SELECTION OF MATERIALS FOR THEIR MAGNETIC PROPERTIES
    • H01F41/00Apparatus or processes specially adapted for manufacturing or assembling magnets, inductances or transformers; Apparatus or processes specially adapted for manufacturing materials characterised by their magnetic properties
    • H01F41/02Apparatus or processes specially adapted for manufacturing or assembling magnets, inductances or transformers; Apparatus or processes specially adapted for manufacturing materials characterised by their magnetic properties for manufacturing cores, coils, or magnets
    • H01F41/04Apparatus or processes specially adapted for manufacturing or assembling magnets, inductances or transformers; Apparatus or processes specially adapted for manufacturing materials characterised by their magnetic properties for manufacturing cores, coils, or magnets for manufacturing coils

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Manufacturing & Machinery (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Feedback Control In General (AREA)
  • Control Of Resistance Heating (AREA)

Abstract

【課題】手動で動作条件を与えずにコイルを最適に通電加熱することのできる機械学習装置、およびそのような機械学習装置を備えたコイル通電加熱装置を提供する。【解決手段】機械学習装置30は、コイル通電加熱部10により通電加熱されたコイル5の接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つと、コイル通電加熱部における通電加熱時間指令値、電圧および電流のうちの少なくとも一つとから構成される状態変数を観測する状態観測部31と、状態観測部により観測されたコイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つと、状態観測部により観測された通電加熱時間指令値、電圧および電流のうちの少なくとも一つとを関連付けて学習する学習部35とを含む。【選択図】図1

Description

本発明は、機械学習装置およびそのような機械学習装置を含むコイル通電加熱装置に関する。
巻線機により形成された一つのユニットコイル50(以下、単に「コイル」と呼ぶ場合がある)は、図5Aに示されるように固定子60の一つの歯部に挿入される。そして、図5Bに示されるように、複数のユニットコイル50が固定子60の複数の歯部に挿入配置される。
図6Aおよび図6Bはユニットコイルの部分断面拡大図である。図6Aに示されるように、ユニットコイルの形状を整形するために、加熱融着性接着剤3が巻線2に予め塗布されている(特許文献1から特許文献4を参照されたい)。そして、ユニットコイルを巻回した後で、巻線2を通電して加熱(通電加熱)させる。その結果、図6Bに示されるように、加熱融着性接着剤3が融着して複数の巻線2を取囲む層3aが形成され、隣接する巻線が互いに接着するようになる。
特開2005-71644号公報 特開2002-231552号公報 特開平7-50218号公報 特開2002-358836号公報
しかしながら、通電による巻線2の加熱が不足する場合には、加熱融着性接着剤3の接着性が低くなり、それにより、ユニットコイルがほどける。また、通電により巻線2が過剰に加熱された場合には、加熱融着性接着剤3が焦げ付き、接着性を呈さなくなる。また、操作者が試行錯誤してそのような動作条件を手動で与える必要があるので、手間と工数がかかる。
本発明はこのような事情に鑑みてなされたものであり、手動で細かい動作条件を与える必要ことなしに、コイルを最適に通電加熱することのできる機械学習装置、およびそのような機械学習装置を備えたコイル通電加熱装置を提供することを目的とする。
前述した目的を達成するために1番目の発明によれば、コイル通電加熱部と通信可能であって、該コイル通電加熱部によりコイルが通電加熱される動作を学習する機械学習装置であって、前記コイル通電加熱部により通電加熱された前記コイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つと、前記コイル通電加熱部における通電加熱時間指令値、電圧および電流のうちの少なくとも一つとから構成される状態変数を観測する状態観測部と、前記状態観測部により観測された前記コイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つと、前記状態観測部により観測された前記通電加熱時間指令値、電圧および電流のうちの少なくとも一つとを関連付けて学習する学習部とを具備し、前記学習部は、前記状態観測部により観測された前記コイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つに基づいて報酬を計算する報酬計算部と、該報酬計算部により計算された報酬に基づいて、現在の前記状態変数から、前記通電加熱時間指令値、電圧および電流のうちの少なくとも一つを決定する関数を更新する関数更新部とを含んでおり、前記学習部が、前記状態観測部で観測された状態変数を多層構造で演算し、前記関数をリアルタイムで更新することを特徴とする機械学習装置が提供される。
2番目の発明によれば、1番目の発明において、前記学習部の学習結果に基づいて、現在の前記状態変数から、前記通電加熱時間指令値、電圧および電流のうちの少なくとも一つの最適値を決定する意思決定部を具備する。
3番目の発明によれば、1番目または2番目の発明において、他の機械学習装置の関数更新部により更新された関数を用いて、前記関数更新部の前記関数を更新する。
4番目の発明によれば、1番目から3番目のいずれかの機械学習装置を具備するコイル通電加熱装置が提供される。
1番目または2番目の発明においては、操作者が動作条件を手動で与えることなしに、より最適なコイルの接着状態などを自動的に決定することのできる機械学習装置を提供できる。さらに、適切な学習結果を得ることができる。
3番目の発明においては、或る機械学習装置で得られた学習結果を他の機械学習装置に組み入れることができ、信頼性の高い学習結果などを流用できる。
4番目の発明においては、機械学習装置の学習結果に従うことにより、コイルの通電加熱時に操作者が手動で動作条件を与える必要がない。このため、コイルの通電加熱時の手間および工数を低減できる。また、接着力が安定したユニットコイルを自動的に製造し、コイルの個体差によるバラツキを吸収することができる。
添付図面に示される本発明の典型的な実施形態の詳細な説明から、本発明のこれら目的、特徴および利点ならびに他の目的、特徴および利点がさらに明解になるであろう。
本発明に基づくコイル製造装置の機能ブロック図である。 機械学習器を拡大して示す図である。 機械学習器の動作を示すフローチャートである。 通電加熱時間と通電加熱時温度などの関係を示す図である。 一つのユニットコイルを鉄心に挿入する状態を示す図である。 複数のユニットコイルが挿入された鉄心を示す図である。 ユニットコイルの第一の部分断面拡大図である。 ユニットコイルの第二の部分断面拡大図である。 ニューロンのモデルを示す模式図である。 3層のニューラルネットワークモデルを示す模式図である。
以下、添付図面を参照して本発明の実施形態を説明する。以下の図面において同様の部材には同様の参照符号が付けられている。理解を容易にするために、これら図面は縮尺を適宜変更している。
図1は本発明に基づくコイル通電加熱装置の機能ブロック図である。図1に示されるように、コイル通電加熱装置1は、コイル通電加熱部10と、コイル通電加熱部10を制御する制御装置20とを主に含んでいる。
図1の下方においては、コイル通電加熱部10が示されている。コイル通電加熱部10は図示しない巻線機により巻回されたコイル5を通電する。具体的には、図1に示されるようにコイル5の巻始め端部と巻終わり端部とに電源6を接続して通電する。また、前述したようにこのコイル5の線材2は加熱融着性接着剤3により被覆されているものとする(図6Aを参照されたい)。
制御装置20はデジタルコンピュータであり、コイルに通電する際の電流および電圧を指令する電流電圧指令部21と、コイル通電加熱部10が通電加熱する時間を指令する通電加熱時間指令部22とを含んでいる。電流電圧指令部21および通電加熱時間指令部22から指令される指令値は後述する機械学習装置30により決定される。
さらに、制御装置20は、作成されたコイルの接着状態を検出する接着状態検出部23を含んでいる。接着状態検出部23は例えばカメラ等である。さらに、制御装置20は、作成されたコイルの絶縁耐圧を検出する絶縁耐圧検出部24と、通電加熱時のコイルの温度を検出する温度検出部25を含んでいる。さらに、制御装置20は、コイル通電加熱部10がコイルを実際に通電加熱した時間を検出する通電加熱時間検出部26を含んでいる。
図1に示されるように、制御装置20はさらに、機械学習装置30を含んでいる。この機械学習装置30は、制御装置20に外付けされていてもよい。その場合には、制御装置20およびコイル通電加熱部10と互いに通信可能に接続されるものとする。
機械学習装置を拡大して示す図2を参照すると、機械学習装置30は、コイル通電加熱部10により通電加熱されたコイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つと、コイル通電加熱部10における通電加熱時間指令値、電圧および電流のうちの少なくとも一つとから構成される状態変数を観測する状態観測部31を含んでいる。状態観測部31は、前述した状態変数を観測された時間と共に順次記憶できる。
さらに、機械学習装置30は、状態観測部31により観測されたコイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つと、状態観測部31により観測された通電加熱時間指令値、電圧および電流のうちの少なくとも一つとを関連付けて学習する学習部35を含んでいる。
ここで、学習部35は、教師あり学習、教師なし学習、半教師あり学習、強化学習、トランスダクション、マルチタスク学習など各種の機械学習を行い得る。以下においては、学習部35はQ学習(Q−learning)により強化学習を行うものとして説明を続ける。
ここで、図2を参照して分かるように、機械学習装置30は、強化学習におけるエージェントに相当する。また、接着状態検出部23、絶縁耐圧検出部24、温度検出部25、および通電加熱時間検出部26は環境の状態を検出する。
強化学習を行う学習部35は、状態観測部31により観測されたコイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つに基づいて報酬を計算する報酬計算部32と、報酬計算部32により計算された報酬に基づいて、現在の状態変数から、通電加熱時間指令値、電圧および電流のうちの少なくとも一つを決定する関数、例えば行動価値関数(行動価値テーブル)を更新する関数更新部33(人工知能)とを含んでいる。当然のことながら、関数更新部33が他の関数を更新するようにしてもよい。
さらに、機械学習装置30は、学習部35の学習結果に基づいて、現在の状態変数から、通電加熱時間指令値、電圧および電流のうちの少なくとも一つの最適値を決定する意思決定部34を含んでいる。意思決定部34は、より良い行動の選択(意思決定)を学習するものである。なお、意思決定部34が機械学習装置30に含まれなくて制御装置20に含まれていてもよい。
図3は機械学習器の動作を示すフローチャートである。以下、図1〜図3を参照しつつ、機械学習装置30の動作について説明する。図3に示される内容は、コイル通電加熱部10による通電加熱作業が行われるたびに実施されるものとする。
はじめに、図3のステップS11において、コイル通電加熱部10は、通電加熱時間指令値、ならびに電圧および電流の指令値を選択して指令する。これら指令値はそれぞれの所定範囲からランダムに選択される。
あるいは、例えば通電加熱時間指令値は所定範囲内の最小値がはじめに選択され、次いで、微少量だけ増加させた値が次のサイクルのときに選択されるようにしてもよい。他の指令値についても同様である。通電加熱時間指令値、ならびに電圧および電流の指令値の全ての組み合わせが選択されるように、図3の処理を繰返してもよい。
次いで、ステップS12においては、接着状態検出部23によりコイルの接着状態が検出され、これが良好であるか否かが判定される。ここで、図4は通電加熱時間と通電加熱時温度などとの関係の一例を示す図である。図4の横軸は通電加熱時間の実際値を示しており、図4の縦軸はコイルの絶縁耐圧、通電加熱時温度、接着状態を示している。なお、図4においては領域A1はコイルの接着状態が悪い領域、領域A2は接着状態が普通である領域、領域A3は接着状態が良好である領域を示している。さらに図4における直線Bはコイルの絶縁耐圧を示しており、曲線Cはコイルの通電加熱時温度を示している。また、図4に示される曲線Rは報酬を示している。
図4に領域A1〜A3で示されるように、コイルの接着状態は通電加熱時間が長いほど良好であり、通電加熱時間が領域A3にあるときが最も好ましく、巻線2がほどけず、巻線2の加熱融着性接着剤3が焦げ付かない。また、直線Bで示されるように絶縁耐圧は通電加熱時間が所定値を越えると急激に低下する。そして、直線Cで示されるように、コイルの通電加熱時温度は通電加熱時間と共に上昇する。
さらに、図4に直線Rで示されるように、コイルの絶縁耐圧が所定の絶縁耐圧範囲に含まれるとき、通電加熱時温度実際値が所定の温度範囲に含まれるときに、報酬は増加する。ただし、通電加熱時間実際値が所定時間よりも大きくなると、報酬は急激に低下する。以下に示される報酬の増減は例えば図4の内容に基づいて、その増減量が決定されるものとする。
再び、図3を参照すると、ステップS12において接着状態が良い場合には、ステップS13において報酬が増える。これに対し、接着状態が良くない場合には、ステップS20において報酬が減るかまたはそのままとなる。
次いで、ステップS14においては、絶縁耐圧検出部24により検出されたコイルの絶縁耐圧が所定の絶縁耐圧範囲に含まれるか否かが判定される。そして、絶縁耐圧が所定の絶縁耐圧範囲に含まれる場合には、ステップS15において報酬が増え、絶縁耐圧が所定の絶縁耐圧範囲に含まれない場合には、ステップS20において報酬が減るかまたはそのままとなる。なお、絶縁耐圧は高いのが好ましく、絶縁耐圧範囲の上限値がなくてもよい。
次いで、ステップS16においては、温度検出部25により検出されたコイルの通電加熱時温度が所定の温度範囲に含まれるか否かが判定される。そして、コイルの通電加熱時温度が所定の温度範囲に含まれる場合には、ステップS17において報酬が増え、コイルの通電加熱時温度が所定の温度範囲に含まれない場合には、ステップS20において報酬が減るかまたはそのままとなる。なお、通電加熱時温度は温度範囲内で且つその上限値近傍にあるのが好ましい。
次いで、ステップS18においては、通電加熱時間検出部26により検出された通電加熱時間実際値が所定の通電加熱時間範囲に含まれるか否かが判定される。そして、通電加熱時間実際値が所定の通電加熱時間範囲に含まれる場合には、ステップS19において報酬が増え、通電加熱時間実際値が所定の通電加熱時間範囲に含まれない場合には、ステップS20において報酬が減るかまたはそのままとなる。なお、通電加熱時間実際値は短いのが好ましく、通電加熱時間範囲の下限値がなくてもよい。
このような報酬の増減は報酬計算部32によって算出される。また、報酬の増減の額については、ステップに応じてその値が異なるように設定されていても良い。また、ステップS12、S14、S16、S18のうちの少なくとも一つの判定ステップおよび関連する報酬のステップを省略することもできる。
その後、ステップS19においては、関数更新部33が行動価値関数を更新する。ここで、学習部35が実施するQ学習は、或る環境状態sの下で、行動aを選択する価値(行動の価値)Q(s、a)を学習する方法である。そして、或る状態sのときに、Q(s、a)の最も高い行動aを選択する。Q学習では、試行錯誤により、或る状態sの下で様々な行動aをとり、そのときの報酬を用いて正しいQ(s、a)を学習する。行動価値関数Q(s、a)の更新式は以下の式(1)で表される。
Figure 0006110452
ここでs,aは、時刻tにおける環境と行動を表す。行動aにより、環境はst+1に変化し、その環境の変化によって、報酬rt+1が算出される。また、maxの付いた項は、環境st+1の下で、最も(その時に分かっている)Q値の高い行動aを選んだ場合のQ値にγを掛けたものになる。ここでγは0<γ≦1(通常は0.9〜0.99)の割引率であり、αは0<α≦1(通常は0.1程度)の学習係数である。
この更新式は、状態sに於ける行動aの評価値Q(s,a)よりも、aによる次の環境状態に於ける最良の行動の評価値Q(st+1,maxat+1)の方が大きければ、Q(s,a)を大きくするし、逆に小さければ、Q(s,a)も小さくする事を示している。つまり、或る状態に於ける或る行動の価値を、それによる次の状態に於ける最良の行動の価値に近づけるようにしている。言い換えれば、学習部35は、コイルの通電加熱時間指令値、ならびに電圧および電流の指令値のそれぞれの最適値を更新する。
このようにして、ステップS21においては、前述した式(1)を用いて関数更新部33が行動価値関数を更新する。そして、ステップS11に戻り、コイルの他の通電加熱時間指令値、ならびに電圧および電流の他の指令値が選択され、同様にして行動価値関数が更新される。なお、行動価値関数の代わりに、行動価値テーブルを更新するようにしてもよい。
強化学習においてはエージェントとしての学習部35が環境の状況に基づいて、行動を決定する。この場合における行動とは、意思決定部34が、通電加熱時間指令値、ならびに電圧および電流の指令値のそれぞれの新たな値を選択し、これら新たな値に従って動作させることである。そして、これら新たな値の各種の指令値によって図2に示される環境、例えばコイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値が変化する。そのような環境の変化に伴って、前述したように報酬が機械学習装置30に与えられ、機械学習装置30の意思決定部34は、例えばより高い報酬が得られるように、より良い行動の選択(意志決定)を学習する。
このため、図3に示される処理が多数回にわたって繰返し行われることにより、行動価値関数の信頼度が高められる。そして、ステップS11において、信頼性の高い行動価値関数に基づいて、例えばQ値が高くなるように通電加熱時間指令値、ならびに電圧および電流の指令値を選択することによって、より適切な寸法指令値などをより最適に決定することが可能となる。図4に示される例においては、機械学習器30の学習結果は破線で囲まれた領域Zに収束していく。
このようにして、本発明の機械学習装置30の関数更新部33により更新された内容を、コイルを形成するときのより最適な通電加熱時間指令値、ならびに電圧および電流の指令値として自動的に決定することができる。そして、そのような機械学習装置30を制御装置20に導入することによって、通電加熱時間指令値などを自動的に調整できる。このため、接着力が安定したユニットコイルを自動的に製造し、コイルの個体差によるバラツキを吸収できる。また、機械学習装置の学習結果に従うことにより、コイルの製造時に操作者が手動で動作条件を与える必要がない。このため、コイルの製造時の手間および工数を低減できる。その結果、生産効率を向上させられる。
また、図示しない実施形態においては、機械学習器30と同様な構成を備えた他の機械学習装置30’が他のコイル通電加熱部10’の制御装置20’に組入れられている。そして、制御装置20’と制御装置20とが通信可能に接続されている。そのような場合には、他の機械学習装置30’の関数更新部33’により更新された関数を、機械学習器30の関数更新部33にコピーすることができる。そして、その関数を用いて関数更新部33の関数を更新してもよい。この場合には、信頼性の高い学習結果を流用できるのが分かるであろう。
また、行動価値関数として後述するニューラルネットワークを用いて近似した関数を用いても良い。この場合には、状態観測部31で観測された状態変数を多層構造で演算して、行動価値関数をリアルタイムで更新してもよい。これにより、さらに適切な学習結果を得られるのが分かるであろう。また、この場合には、画像データなどのように「s」および「a」の情報量が莫大であるときに特に有利である。
ここで、図2に示される機械学習装置30等について、一部重複するものの、詳細に再度説明する。機械学習装置30は、装置に入力されるデータの集合から、その中にある有用な規則や知識表現、判断基準などを解析により抽出し、その判断結果を出力するとともに、知識の学習を行う機能を有する。その手法は様々であるが、大別すれば「教師あり学習」、「教師なし学習」、「強化学習」に分けられる。さらに、これらの手法を実現するうえで、特徴量そのものの抽出を学習する、「深層学習」と呼ばれる手法がある。
「教師あり学習」とは、ある入力と結果(ラベル)のデータの組を大量に学習装置に与えることで、それらのデータセットにある特徴を学習し、入力から結果を推定するモデル、即ち、その関係性を帰納的に獲得することができる。本実施形態においては、コイルの前述した各種指令値からコイルの寸法実際値などを推定する部分などに用いることが出来る。後述のニューラルネットワークなどのアルゴリズムを用いて実現することができる。
「教師なし学習」とは、入力データのみを大量に学習装置に与えることで、入力データがどのような分布をしているか学習し、対応する教師出力データを与えなくても、入力データに対して圧縮、分類、整形などを行う装置を学習する手法である。それらのデータセットにある特徴を似た者どうしにクラスタリングすることなどができる。この結果を使って、何らかの基準を設けてそれを最適にするような出力の割り当てを行うことで、出力の予測を実現することできる。また「教師なし学習」と「教師あり学習」との中間的な問題設定として、「半教師あり学習」と呼ばれるものもあり、これは一部のみ入力と出力のデータの組が存在し、それ以外は入力のみのデータである場合がこれに当たる。本実施形態においては、実際に巻線機を動作させなくても取得することが出来るデータを教師なし学習で利用し、学習を効率的に行うことが出来る。
強化学習の問題を以下のように設定する。
・巻線機およびその制御装置は環境の状態を観測し、行動を決定する。
・環境は何らかの規則に従って変化し、さらに自分の行動が、環境に変化を与えることもある。
・行動するたびに報酬信号が帰ってくる。
・最大化したいのは将来にわたっての(割引)報酬の合計である。
・行動が引き起こす結果を全く知らない、または不完全にしか知らない状態から学習はスタートする。巻線機は実際に動作して初めて、その結果をデータとして得ることが出来る。つまり、試行錯誤しながら最適な行動を探索する必要がある。
・人間の動作を真似るように事前学習(前述の教師あり学習や、逆強化学習といった手法)した状態を初期状態として、良いスタート地点から学習をスタートさせることもできる。
「強化学習」とは、判定や分類だけではなく、行動を学習することにより、環境に行動が与える相互作用を踏まえて適切な行動を学習、即ち、将来的に得られる報酬を最大にするための学習する方法である。このことは、本実施形態において、未来に影響を及ぼすような行動を獲得できることを表している。例えばQ学習の場合で説明を続けるが、それに限るものではない。
Q学習は、或る環境状態sの下で、行動aを選択する価値Q(s,a)を学習する方法である。つまり、或る状態sのとき、価値Q(s,a)の最も高い行動aを最適な行動として選択すればよい。しかし、最初は状態sと行動aとの組合せについて、価値Q(s,a)の正しい値は全く分かっていない。そこで、エージェント(行動主体)は、或る状態sの下で様々な行動aを選択し、その時の行動aに対して報酬が与えられる。それにより、エージェントはより良い行動の選択、すなわち正しい価値Q(s,a)を学習していく。
行動の結果、将来にわたって得られる報酬の合計を最大化したいので、最終的にQ(s,a)=E[Σγtt]となるようにすることを目指す(期待値は最適な行動に従って状態変化したときについてとる。もちろん、それは分かっていないので、探索しながら学習しなければならない)。そのような価値Q(s,a)の更新式は、例えば次式により表すことができる(前述した式(1)と同じである)。
Figure 0006110452
ここで、stは時刻tにおける環境の状態を表し、atは時刻tにおける行動を表す。行動atにより、状態はst+1に変化する。rt+1は、その状態の変化により貰える報酬を表している。また、maxの付いた項は、状態st+1の下で、その時に分かっている最もQ値の高い行動aを選択した場合のQ値にγを乗じたものになる。γは、0<γ≦1のパラメータで、割引率と呼ばれる。αは学習係数で、0<α≦1の範囲とする。
この式は、試行atの結果帰ってきた報酬rt+1を元に、状態stにおける行動atの評価値Q(st,at)を更新する方法を表している。状態sにおける行動aの評価値Q(st,at)よりも、報酬rt+1+行動aによる次の状態における最良の行動max aの評価値Q(st+1,max at+1)の方が大きければ、Q(st,at)を大きくするし、反対に小さければ、Q(st,at)も小さくする事を示している。つまり、或る状態における或る行動の価値を、結果として即時帰ってくる報酬と、その行動による次の状態における最良の行動の価値に近付けるようにしている。
Q(s,a)の計算機上での表現方法は、すべての状態行動ペア(s,a)に対して、その値をテーブル(行動価値テーブル)として保持しておく方法と、Q(s,a)を近似するような関数を用意する方法がある。後者の方法では、前述の更新式は、確率勾配降下法などの手法で近似関数のパラメータを調整していくことで実現することが出来る。近似関数としては、後述のニューラルネットワークを用いることが出来る。
教師あり学習、教師なし学習、及び強化学習での価値関数の近似アルゴリズムとして、ニューラルネットワークを用いることができる。ニューラルネットワークは、たとえば図7に示すようなニューロンのモデルを模したニューラルネットワークを実現する演算装置及びメモリ等で構成される。図7は、ニューロンのモデルを示す模式図である。
図7に示すように、ニューロンは、複数の入力x(ここでは一例として、入力x1〜入力x3)に対する出力yを出力するものである。各入力x1〜x3には、この入力xに対応する重みw(w1〜w3)が掛けられる。これにより、ニューロンは、次の式により表現される出力yを出力する。なお、入力x、出力y及び重みwは、すべてベクトルである。
Figure 0006110452
ここで、θはバイアスであり、fkは活性化関数である。
次に、上述したニューロンを組み合わせた3層の重みを有するニューラルネットワークについて、図8を参照して説明する。図8は、D1〜D3の3層の重みを有するニューラルネットワークを示す模式図である。
図8に示すように、ニューラルネットワークの左側から複数の入力x(ここでは一例として、入力x1〜入力x3)が入力され、右側から結果y(ここでは一例として、結果y1〜結果y3)が出力される。
具体的には、入力x1〜入力x3は、3つのニューロンN11〜N13の各々に対して対応する重みが掛けられて入力される。これらの入力に掛けられる重みはまとめてw1と標記されている。
ニューロンN11〜N13は、それぞれ、z11〜z13を出力する。これらのz11〜z13はまとめて特徴ベクトルz1と標記され、入力ベクトルの特徴量を抽出したベクトルとみなすことができる。この特徴ベクトルz1は、重みw1と重みw2との間の特徴ベクトルである。
z11〜z13は、2つのニューロンN21、N22の各々に対して対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてw2と標記されている。
ニューロンN21、N22は、それぞれ、z21、z22を出力する。これらは、まとめて特徴ベクトルz2と標記されている。この特徴ベクトルz2は、重みw2と重みw3との間の特徴ベクトルである。
特徴ベクトルz21、z22は、3つのニューロンN31〜N33の各々に対して対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてw3と標記されている。
最後に、ニューロンN31〜N33は、それぞれ、結果y1〜結果y3を出力する。
ニューラルネットワークの動作には、学習モードと価値予測モードとがあり、学習モードにおいて学習データセットを用いて重みwを学習し、そのパラメータを用いて予測モードにおいて巻線機の行動判断を行う(便宜上、予測と書いたが、検出、分類、推論など多様なタスクが可能である)。
予測モードで実際に巻線機を動かして得られたデータを即時学習し、次の行動に反映させる(オンライン学習)ことも、あらかじめ収集しておいたデータ群を用いてまとめた学習を行い、以降はずっとそのパラメータで検知モードを行う(バッチ学習)こともできる。その中間的な、ある程度データが溜まるたびに学習モードを挟むということも可能である。
重みw1〜w3は、誤差逆伝搬法(バックプロパゲーション)により学習可能なものである。誤差の情報は、右側から入り左側に流れる。誤差逆伝搬法は、各ニューロンについて、入力xが入力されたときの出力yと真の出力y(教師)との差分を小さくするように、それぞれの重みを調整(学習)する手法である。
このようなニューラルネットワークは、3層以上にさらに層を増やすことも可能である(深層学習と称される)。入力の特徴抽出を段階的に行い、結果を回帰する演算装置を、教師データのみから自動的に獲得することが可能である。
そこで、本実施形態の機械学習器30は、上述のQ学習を実施すべく、図2に示されるように状態観測部31、学習部35、および意思決定部34を備えている。但し、本発明に適用される機械学習方法は、Q学習に限定されるものではない。たとえば教師あり学習を適用する場合、価値関数は学習モデル、報酬は誤差に対応する。
典型的な実施形態を用いて本発明を説明したが、当業者であれば、本発明の範囲から逸脱することなしに、前述した変更および種々の他の変更、省略、追加を行うことができるのを理解できるであろう。
5 コイル
10 コイル通電加熱部
20 制御装置
21 電流電圧指令部
22 通電加熱時間指令部
23 接着状態検出部
23 接着状態検出部
24 絶縁耐圧検出部
25 温度検出部
26 通電加熱時間検出部
30 機械学習器、機械学習装置
31 状態観測部
32 報酬計算部
33 関数更新部
34 意思決定部
35 学習部

Claims (4)

  1. コイル通電加熱部(10)と通信可能であって、該コイル通電加熱部によりコイルが通電加熱される動作を学習する機械学習装置(30)であって、
    前記コイル通電加熱部により通電加熱された前記コイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つと、前記コイル通電加熱部における通電加熱時間指令値、電圧および電流のうちの少なくとも一つとから構成される状態変数を観測する状態観測部(31)と、
    前記状態観測部により観測された前記コイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つと、前記状態観測部により観測された前記通電加熱時間指令値、電圧および電流のうちの少なくとも一つとを関連付けて学習する学習部(35)とを具備し、
    前記学習部は、前記状態観測部により観測された前記コイルの接着状態、絶縁耐圧、通電加熱時温度、および通電加熱時間実際値のうちの少なくとも一つに基づいて報酬を計算する報酬計算部(32)と、
    該報酬計算部により計算された報酬に基づいて、現在の前記状態変数から、前記通電加熱時間指令値、電圧および電流のうちの少なくとも一つを決定する関数を更新する関数更新部(33)とを含んでおり、
    前記学習部が、前記状態観測部で観測された状態変数を多層構造で演算し、前記関数をリアルタイムで更新することを特徴とする機械学習装置。
  2. 前記学習部の学習結果に基づいて、現在の前記状態変数から、前記通電加熱時間指令値、電圧および電流のうちの少なくとも一つの最適値を決定する意思決定部(34)を具備する、請求項1に記載の機械学習装置。
  3. 他の機械学習装置の関数更新部により更新された関数を用いて、前記関数更新部の前記関数を更新することを特徴とする請求項1または2に記載の機械学習装置。
  4. 請求項1から3のいずれか一項に記載の機械学習装置を具備するコイル通電加熱装置(1)。
JP2015194142A 2015-09-30 2015-09-30 機械学習装置およびコイル通電加熱装置 Active JP6110452B1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015194142A JP6110452B1 (ja) 2015-09-30 2015-09-30 機械学習装置およびコイル通電加熱装置
CN201610697200.6A CN106558960B (zh) 2015-09-30 2016-08-19 机械学习装置以及线圈通电加热装置
DE102016011531.9A DE102016011531A1 (de) 2015-09-30 2016-09-23 Vorrichtung für maschinelles Lernen und elektrische Spulenerwärmungsvorrichtung
US15/280,975 US10004112B2 (en) 2015-09-30 2016-09-29 Machine learning apparatus and coil electric heating apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015194142A JP6110452B1 (ja) 2015-09-30 2015-09-30 機械学習装置およびコイル通電加熱装置

Publications (2)

Publication Number Publication Date
JP6110452B1 true JP6110452B1 (ja) 2017-04-05
JP2017069421A JP2017069421A (ja) 2017-04-06

Family

ID=58281915

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015194142A Active JP6110452B1 (ja) 2015-09-30 2015-09-30 機械学習装置およびコイル通電加熱装置

Country Status (4)

Country Link
US (1) US10004112B2 (ja)
JP (1) JP6110452B1 (ja)
CN (1) CN106558960B (ja)
DE (1) DE102016011531A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7003759B2 (ja) * 2017-06-28 2022-01-21 東京エレクトロン株式会社 熱処理装置、熱処理装置の管理方法及び記憶媒体
CN111140773A (zh) 2018-11-06 2020-05-12 朗德万斯公司 用于半导体灯的多色光引擎
JP7331660B2 (ja) * 2019-11-26 2023-08-23 横河電機株式会社 装置、方法およびプログラム
JP2023535756A (ja) * 2020-07-27 2023-08-21 ワットロー・エレクトリック・マニュファクチャリング・カンパニー システム制御および診断を改善するために中間データを使用するためのシステムおよび方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS528548A (en) * 1975-07-11 1977-01-22 Canon Inc Electric heating system
JPH0750218A (ja) 1993-08-06 1995-02-21 Sony Chem Corp コイルの製造方法
US5630957A (en) * 1995-01-12 1997-05-20 Adkins; Douglas R. Control of power to an inductively heated part
JPH09168261A (ja) * 1995-12-14 1997-06-24 Hitachi Ltd コイルの製造方法とその装置
JP3140685B2 (ja) * 1996-06-17 2001-03-05 日特エンジニアリング株式会社 偏向コイルの通電加熱および溶着装置
JP2002231552A (ja) 2001-01-31 2002-08-16 Taga Seisakusho:Kk コイル巻線装置
JP2002358836A (ja) 2001-06-04 2002-12-13 Hitachi Cable Ltd 自己融着性エナメル線
US7117045B2 (en) * 2001-09-08 2006-10-03 Colorado State University Research Foundation Combined proportional plus integral (PI) and neural network (nN) controller
US7007001B2 (en) * 2002-06-26 2006-02-28 Microsoft Corporation Maximizing mutual information between observations and hidden states to minimize classification errors
JP2005071644A (ja) * 2003-08-28 2005-03-17 Dywa Electronics Kk 自己融着型複線コイルの溶着及び通電加熱装置
US7193187B2 (en) * 2004-02-09 2007-03-20 Advanced Technology Materials, Inc. Feedback control system and method for maintaining constant resistance operation of electrically heated elements
EP2381394B1 (en) 2010-04-20 2014-07-02 Alcatel Lucent A method of reinforcement learning, corresponding computer program product, and data storage device therefor
CN102598468A (zh) 2010-09-10 2012-07-18 松下电器产业株式会社 电力控制装置、电力控制方法及电力供给系统
US20130327313A1 (en) * 2012-06-11 2013-12-12 George R. Arnold High efficiency water heater
CN103057436B (zh) * 2012-12-27 2015-07-01 西安交通大学 一种基于多智能体的独立驱动电动汽车横摆力矩控制方法
JP2015132388A (ja) * 2014-01-09 2015-07-23 日本電信電話株式会社 空調制御方法および空調制御システム

Also Published As

Publication number Publication date
US20170094722A1 (en) 2017-03-30
DE102016011531A1 (de) 2017-03-30
US10004112B2 (en) 2018-06-19
CN106558960A (zh) 2017-04-05
JP2017069421A (ja) 2017-04-06
CN106558960B (zh) 2018-02-16

Similar Documents

Publication Publication Date Title
JP6110451B1 (ja) 機械学習装置およびコイル製造装置
JP6457369B2 (ja) パラメータを自動調整する機能を有する機械学習装置及び電動機制御装置
JP6110452B1 (ja) 機械学習装置およびコイル通電加熱装置
JP6055058B1 (ja) 機械学習器及び組み立て・試験器を備えた生産設備
US11531891B2 (en) Cooking apparatus for determining cooked-state of cooking material and control method thereof
JP6140236B2 (ja) 機械学習装置及び電動機用着磁装置
US10442023B2 (en) Simulation apparatus of wire electric discharge machine having function of determining welding positions of core using machine learning
JP2017068563A (ja) 加工機のサイクル加工時間を最適化する機械学習装置、モータ制御装置、加工機、および機械学習方法
KR102168264B1 (ko) 이동축 이상 부하 경고 기능을 갖는 와이어 방전 가공기
JP6490124B2 (ja) レーザ加工装置および機械学習装置
US20170091667A1 (en) Machine learning device and method for optimizing frequency of tool compensation of machine tool, and machine tool having the machine learning device
JP6174649B2 (ja) ファンモータの予防保全機能を備えたモータ駆動装置
JP6432859B2 (ja) サービス提供システムおよびプログラム
JP2017064837A (ja) 電動機に対する動作指令を学習する機械学習方法および機械学習装置並びに該機械学習装置を備えた工作機械
US20210300198A1 (en) Reinforcement learning-based electric vehicle charging method and system
JP6088613B1 (ja) ロータにおける磁石の配置位置を学習する機械学習装置および方法ならびに該機械学習装置を備えたロータ設計装置
JP7067755B2 (ja) サービス提供システム及び端末
KR20210030796A (ko) 인공 지능을 이용한 조리 기기 제어 방법 및 그 시스템
JP6538573B2 (ja) 抵抗回生開始電圧および抵抗回生停止電圧の値を学習する機械学習器,モータ制御装置,モータ制御システムおよび機械学習方法
JP2022063864A (ja) 機械学習を自動化するための装置及び機械学習自動化方法
JP7044730B2 (ja) 生産設備運転支援システムおよび生産設備運転支援方法
JP2024017106A (ja) エネルギー運用計画装置及びエネルギー運用計画方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170309

R150 Certificate of patent or registration of utility model

Ref document number: 6110452

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150