JP6055058B1 - 機械学習器及び組み立て・試験器を備えた生産設備 - Google Patents

機械学習器及び組み立て・試験器を備えた生産設備 Download PDF

Info

Publication number
JP6055058B1
JP6055058B1 JP2015193852A JP2015193852A JP6055058B1 JP 6055058 B1 JP6055058 B1 JP 6055058B1 JP 2015193852 A JP2015193852 A JP 2015193852A JP 2015193852 A JP2015193852 A JP 2015193852A JP 6055058 B1 JP6055058 B1 JP 6055058B1
Authority
JP
Japan
Prior art keywords
parts
reward
product
result
production facility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015193852A
Other languages
English (en)
Other versions
JP2017068621A (ja
Inventor
佐々木 拓
拓 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FANUC Corp
Original Assignee
FANUC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FANUC Corp filed Critical FANUC Corp
Priority to JP2015193852A priority Critical patent/JP6055058B1/ja
Priority to CN201610818660.XA priority patent/CN106557816B/zh
Priority to DE102016011520.3A priority patent/DE102016011520B4/de
Priority to US15/281,032 priority patent/US9934470B2/en
Application granted granted Critical
Publication of JP6055058B1 publication Critical patent/JP6055058B1/ja
Publication of JP2017068621A publication Critical patent/JP2017068621A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B23MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
    • B23PMETAL-WORKING NOT OTHERWISE PROVIDED FOR; COMBINED OPERATIONS; UNIVERSAL MACHINE TOOLS
    • B23P21/00Machines for assembling a multiplicity of different parts to compose units, with or without preceding or subsequent working of such parts, e.g. with programme control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence

Abstract

【課題】本発明は、人手による工数を掛けず、回路特性のバラツキが少ない生産設備を提供することを目的とする。【解決手段】本発明の一実施例に係る生産設備は、機械学習器と、組み立て・試験器と、を備えた生産設備であって、組み立て・試験器が、特性が異なる複数の部品群の中から複数の部品を選択し、選択した複数の部品を使用して製品の組み立てを行い、組み立てた製品の試験を行い、機械学習器が、製品の試験の結果と複数の部品群についての部品の特性毎の在庫量を観測する状態観測部と、試験の結果、及び在庫量に基づいて報酬を計算する報酬計算部と、状態観測部での観測結果、及び報酬計算部での報酬に基づいて行動の価値を判断する人工知能と、人工知能での判断結果に基づいて、次回の製品の組み立てに使用する複数の部品を複数の部品群から選択する意思決定部と、を有することを特徴とする。【選択図】図1

Description

本発明は、機械学習器及び組み立て・試験器を備えた生産設備に関し、特に、複数の部品を使用して組み立てた製品の性能が目標値に近く、かつ、部品の特性毎の部品の在庫量の偏りが小さくなるように製品を生産する機能を有する機械学習器及び組み立て・試験器を備えた生産設備に関する。
組立工程の多くを自動化して、生産性および品質の安定性がよく、低コストなモータを大量生産することができるモータの組立装置が知られている(例えば、特許文献1)。
従来のモータやモータ駆動装置などの組立装置においては、複数の部品の選択自体は、人手により行われていた。複数の部品はそれぞれの特性に誤差を持ち、製品の特性は複数の部品の誤差によって決まる。従って、ランダムに部品を選択して組み立てると、出来上がった製品の特性は部品ごとの特性の和になってしまうという問題があった。さらに、人手による部品の選別には、多くの労力と時間を要するという問題があった。
特開2003−324909号公報
本発明は、人手による工数を掛けず、回路特性のバラツキが少ない製品を生産する生産設備を提供することを目的とする。
本発明の一実施例に係る生産設備は、機械学習器と、組み立て・試験器と、を備えた生産設備であって、組み立て・試験器が、特性が異なる複数の部品群の中から複数の部品を選択し、選択した複数の部品を使用して製品の組み立てを行い、組み立てた製品の試験を行い、機械学習器が、製品の試験の結果と複数の部品群についての部品の特性毎の在庫量を観測する状態観測部と、試験の結果、及び在庫量に基づいて報酬を計算する報酬計算部と、状態観測部での観測結果、及び報酬計算部での報酬に基づいて行動の価値を判断する人工知能と、人工知能での判断結果に基づいて、次回の製品の組み立てに使用する複数の部品を複数の部品群から選択する意思決定部と、を有することを特徴とする。
本発明の一実施例に係る生産設備によれば、人手による工数を掛けずに、回路特性のバラツキが小さい回路を生産することができる。
本発明の実施例に係る生産設備の構成図である。 本発明の実施例に係る生産設備を用いて、複数の部品群から複数の部品を選択して回路を生産する工程の概念図である。 ニューロンのモデルを示す模式図である。 3層のニューラルネットワークモデルを示す模式図である。 本発明の実施例に係る生産設備の動作手順を説明するためのフローチャートである。
以下、図面を参照して、本発明に係る生産設備について説明する。
図1は、本発明の実施例に係る生産設備の構成図である。本発明の実施例に係る生産設備100は、機械学習器10と、組み立て・試験器20と、を備えている。機械学習器10は、状態観測部1と、報酬計算部2と、人口知能(以下、「学習部」ともいう)3と、意思決定部4と、を備える。
図2は、本発明の実施例に係る生産設備を用いて、複数の部品群から複数の部品を選択して回路を生産する工程の概念図である。組み立て・試験器20は、特性が異なる複数の部品群(A1,A2,A3,B1,B2,B3)の中から複数の部品(11,12)を選択し、選択した複数の部品(11,12)を使用して製品200の組み立てを行い、組み立てた製品の試験を行う。
部品の特性として、部品の抵抗値等の誤差を例に挙げることができるが、これには限られない。例えば、部品の特性は、電圧などの電気的な特性でも、寸法などの機械的な特性でもよい。
図2において、部品A(11)は、部品A第1ロットA1から部品A第3ロットA3までの3つのロットから選択される。同様に、部品B(12)は、部品B第1ロットB1から部品B第3ロットB3までの3つのロットから選択される。ただし、ロット数はこのような例には限られず、2つまたは4つ以上でもよい。
また各ロットには特性がほぼ均一な複数の部品が含まれているものとする。例えば、部品A第1ロットA1には、部品の特性の基準値からの誤差が+1%付近である1000個の部品が含まれ、部品A第2ロットA2には、部品の特性の基準値からの誤差が+0.5%付近である1000個の部品が含まれるものとする。同様に、例えば、部品B第1ロットB1には、部品の特性の基準値からの誤差が+0.5%である700個の部品が含まれ、部品B第2ロットB2には、部品の特性の基準値からの誤差が−1%である700個の部品が含まれるものとする。ただし、上記の部品の種類、ロット数、各ロットに含まれる部品数、各ロットの部品の特性等は一例であって、このような例には限られない。
生産設備100は、図2に示すように、例えば、部品Aの第1ロットA1から1つの部品A(11)を選択し、部品Bの第2ロットB2から1つの部品B(12)を選択して、製品(回路)200を生産する。このとき、部品Aの第1ロットA1に含まれる複数の部品の特性の誤差が+1%であり、部品Bの第2ロットB2に含まれる複数の部品の特性の誤差が−1%であるとすると、製品200の性能である回路出力の目標値からの誤差は±0%となるものと考えられる。
一般に、数十〜数百の部品で構成される回路では、部品の誤差の和が回路出力の誤差となって現れてしまう。ロット毎で誤差に偏りがある部品を使って回路を組み立てる際、出来る限り回路出力は「誤差±0%」としたい。一方で、誤差の大きいロットが、使われずにずっと残ってしまう事態は避けたい。
そこで、本発明の実施例に係る生産設備は、部品をうまく使って、回路出力を±0%に近づけつつ、特性の基準値からの誤差が偏ったロットが在庫として残るのも避けるように学習する。機械学習器10は、最初は各部品の各ロットの誤差がいくらであるかは知らないが、組み合わされた回路出力を測定することで、各ロットの誤差を学習していく。回路出力を誤差0%に近づけるために、誤差の小さいロットを優先的に使いたくなるが、誤差の大きいロットが在庫として残る場合は報酬を低くすることで、特性毎の部品の在庫が偏らないようにする。
状態観測部1は、製品200の試験の結果と複数の部品群(A1,A2,A3,B1,B2,B3)についての部品の特性毎の在庫量を観測する。製品200の試験の結果の例として、部品A(11)として、部品Aの部品群である部品A第1ロットA1(誤差+1%)から1つの部品を選択し、部品B(12)として、部品Bの部品群である部品B第1ロットB1(誤差+0.5%)から1つの部品を選択した場合、製品200の性能の誤差は1.5%程度となるものと考えられる。また、部品の特性毎の在庫量の例として、部品A第1ロットA1には当初1000個の部品が含まれていたものと仮定すると、100個の部品を使用した後には、部品の特性が誤差+1%である部品の在庫量は900個となる。
報酬計算部2は、試験の結果、及び在庫量に基づいて報酬を計算する。報酬の計算方法については後述する。
人工知能(学習部)3は、状態観測部1での観測結果、及び報酬計算部2での報酬に基づいて行動の価値を判断する。行動の価値の判断方法については後述する。
意思決定部4は、人工知能3での判断結果に基づいて、次回の製品の組み立てに使用する複数の部品(部品A,部品B)を複数の部品群(A1,A2,A3,B1,B2,B3)から選択する。
次に、報酬の計算方法について説明する。一例として、報酬計算部2は、試験の結果である製品200の性能が目標値に近いほど高い報酬を算出し、在庫量が部品の特性毎に偏っているほど低い報酬を算出するようにしてもよい。例えば、試験の結果に関して、目標とする性能の誤差を±0%とする。このとき、得られた製品の誤差が+0.5%であれば、+1%の場合よりも高い報酬を与えるようにすることができる。また、得られた製品の誤差が、所定の値(例えば、2%)を超えているような場合にはマイナスの報酬を与えるようにしてもよい。一方、在庫量に関して、部品A第1ロットA1、部品A第2ロットA2、部品A第3ロットA3の各在庫量の偏り、即ち、各ロット内の部品の在庫量の最大個数と最小個数の差が20個の場合は10個の場合よりも低い報酬を与えるようにすることができる。なお、製品の特性は、電圧などの電気的な特性でも、寸法などの機械的な特性でもよい。
人工知能3が、状態観測部1で観測された状態変数を多層構造で演算し、行動の価値を判断するための行動価値テーブルをリアルタイムで更新することが好ましい。ここで、状態変数を多層構造で演算する方法として、例えば、図4に示すような多層ニューラルネットワークを用いることができる。
ここで、図1に示される機械学習器10について詳細に説明する。機械学習器10は、装置に入力されるデータの集合から、その中にある有用な規則や知識表現、判断基準などを解析により抽出し、その判断結果を出力するとともに、知識の学習を行う機能を有する。その手法は様々であるが、大別すれば「教師あり学習」、「教師なし学習」、及び「強化学習」に分けられる。さらに、これらの手法を実現するうえで、特徴量そのものの抽出を学習する、「深層学習」と呼ばれる手法がある。
「教師あり学習」は、ある入力と結果(ラベル)のデータの組を大量に学習装置に与えることで、それらのデータセットにある特徴を学習し、入力から結果を推定するモデル、即ち、その関係性を帰納的に獲得することができる。本実施形態においては、製品の試験の結果及び部品の各特性毎の在庫量の偏りである状態観測部での観測結果並びに報酬計算部での報酬に基づいて、次回組み立てに使用する各部品ロットを推定する部分などに用いることが出来る。後述のニューラルネットワークなどのアルゴリズムを用いて実現することができる。
「教師なし学習」とは、入力データのみを大量に学習装置に与えることで、入力データがどのような分布をしているか学習し、対応する教師出力データを与えなくても、入力データに対して圧縮、分類、整形などを行う装置を学習する手法である。それらのデータセットにある特徴を似た者どうしにクラスタリングすることなどができる。この結果を使って、何らかの基準を設けてそれを最適にするような出力の割り当てを行うことで、出力の予測を実現することができる。また「教師なし学習」と「教師あり学習」との中間的な問題設定として、「半教師あり学習」と呼ばれるものもあり、これは一部のみ入力と出力のデータの組が存在し、それ以外は入力のみのデータである場合がこれに当たる。本実施形態においては、実際に組み立て・試験器を動作させなくても取得することが出来るデータを教師なし学習で利用し、学習を効率的に行うことが出来る。
強化学習の問題を以下のように設定する。
・組み立て・試験器は環境の状態を観測し、行動を決定する。
・環境は何らかの規則に従って変化し、さらに自分の行動が、環境に変化を与えることもある。
・行動するたびに報酬信号が帰ってくる。
・最大化したいのは将来にわたっての(割引)報酬の合計である。
・行動が引き起こす結果を全く知らない、または不完全にしか知らない状態から学習はスタートする。組み立て・試験器は実際に動作して初めて、その結果をデータとして得ることが出来る。つまり、試行錯誤しながら最適な行動を探索する必要がある。
・人間の動作を真似るように事前学習(前述の教師あり学習や、逆強化学習といった手法)した状態を初期状態として、良いスタート地点から学習をスタートさせることもできる。
「強化学習」とは、判定や分類だけではなく、行動を学習することにより、環境に行動が与える相互作用を踏まえて適切な行動を学習、即ち、将来的に得られる報酬を最大にするために学習する方法である。このことは、本実施形態において、未来に影響を及ぼすような行動を獲得できることを表している。例えばQ学習の場合で説明を続けるが、それに限るものではない。
Q学習は、或る環境状態sの下で、行動aを選択する価値Q(s,a)を学習する方法である。つまり、或る状態sのとき、価値Q(s,a)の最も高い行動aを最適な行動として選択すればよい。しかし、最初は状態sと行動aとの組合せについて、価値Q(s,a)の正しい値は全く分かっていない。そこで、エージェント(行動主体)は、或る状態sの下で様々な行動aを選択し、その時の行動aに対して報酬が与えられる。それにより、エージェントはより良い行動の選択、すなわち正しい価値Q(s,a)を学習していく。
行動の結果、将来にわたって得られる報酬の合計を最大化したい。そこで、最終的に、Q(s,a)=E[Σγtt](報酬の割引期待値。γ:割引率)となるようにすることを目指す(期待値は最適な行動に従って状態変化したときについてとる。もちろん、それは分かっていないので、探索しながら学習しなければならない)。そのような価値Q(s,a)の更新式は、例えば次式により表すことができる。
Figure 0006055058
ここで、stは時刻tにおける環境の状態を表し、atは時刻tにおける行動を表す。行動atにより、状態はst+1に変化する。rt+1は、その状態の変化により貰える報酬を表している。また、maxの付いた項は、状態st+1の下で、その時に分かっている最もQ値の高い行動aを選択した場合のQ値にγを乗じたものになる。γは、0<γ≦1のパラメータで、割引率と呼ばれる。αは学習係数で、0<α≦1の範囲とする。
この式は、試行atの結果帰ってきた報酬rt+1を元に、状態stにおける行動atの評価値Q(st,at)を更新する方法を表している。状態sにおける行動aの評価値Q(st,at)よりも、報酬rt+1+行動aによる次の状態における最良の行動max aの評価値Q(st+1,max at+1)の方が大きければ、Q(st,at)を大きくするし、反対に小さければ、Q(st,at)も小さくする事を示している。つまり、或る状態における或る行動の価値を、結果として即時帰ってくる報酬と、その行動による次の状態における最良の行動の価値に近付けるようにしている。
Q(s,a)の計算機上での表現方法は、全ての状態行動ペア(s,a)に対して、その値をテーブル(行動価値テーブル)として保持しておく方法と、Q(s,a)を近似するような関数を用意する方法がある。後者の方法では、前述の更新式は、確率勾配降下法などの手法で近似関数のパラメータを調整していくことで実現することが出来る。近似関数としては、後述のニューラルネットワークを用いることが出来る。
教師あり学習、教師なし学習、及び強化学習での価値関数の近似アルゴリズムとして、ニューラルネットワークを用いることができる。ニューラルネットワークは、例えば図3に示すようなニューロンのモデルを模したニューラルネットワークを実現する演算装置及びメモリ等で構成される。図3は、ニューロンのモデルを示す模式図である。
図3に示すように、ニューロンは、複数の入力x(ここでは一例として、入力x1〜入力x3)に対する出力yを出力するものである。各入力x1〜x3には、この入力xに対応する重みw(w1〜w3)が掛けられる。これにより、ニューロンは、次の式により表現される出力yを出力する。なお、入力x、出力y、及び重みwは、全てベクトルである。
Figure 0006055058
ここで、θはバイアスであり、fkは活性化関数である。
次に、上述したニューロンを組み合わせた3層の重みを有するニューラルネットワークについて、図4を参照して説明する。図4は、D1〜D3の3層の重みを有するニューラルネットワークを示す模式図である。
図4に示すように、ニューラルネットワークの左側から複数の入力x(ここでは一例として、入力x1〜入力x3)が入力され、右側から結果y(ここでは一例として、結果y1〜結果y3)が出力される。
具体的には、入力x1〜入力x3は、3つのニューロンN11〜N13の各々に対して対応する重みが掛けられて入力される。これらの入力に掛けられる重みは、まとめてW1と標記されている。
ニューロンN11〜N13は、それぞれ、Z11〜Z13を出力する。これらのZ11〜Z13はまとめて特徴ベクトルZ1と標記され、入力ベクトルの特徴量を抽出したベクトルとみなすことができる。この特徴ベクトルZ1は、重みW1と重みW2との間の特徴ベクトルである。
Z11〜Z13は、2つのニューロンN21,N22の各々に対して対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてW2と標記されている。
ニューロンN21,N22は、それぞれ、Z21,Z22を出力する。これらは、まとめて特徴ベクトルZ2と標記されている。この特徴ベクトルZ2は、重みW2と重みW3との間の特徴ベクトルである。
特徴ベクトルZ21,Z22は、3つのニューロンN31〜N33の各々に対して対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてW3と標記されている。
最後に、ニューロンN31〜N33は、それぞれ、結果y1〜結果y3を出力する。
ニューラルネットワークの動作には、学習モードと価値予測モードとがあり、学習モードにおいて学習データセットを用いて重みWを学習し、そのパラメータを用いて予測モードにおいて組み立て・試験器の行動判断を行う(便宜上、予測と書いたが、検出、分類、推論など多様なタスクが可能である)。
予測モードで実際に組み立て・試験器を動かして得られたデータを即時学習し、次の行動に反映させる(オンライン学習)ことも、あらかじめ収集しておいたデータ群を用いてまとめた学習を行い、以降はずっとそのパラメータで検知モードを行う(バッチ学習)こともできる。その中間的な、ある程度データが溜まるたびに学習モードを挟むということも可能である。
重みW1〜W3は、誤差逆伝搬法(バックプロパゲーション)により学習可能なものである。誤差の情報は、右側から入り左側に流れる。誤差逆伝搬法は、各ニューロンについて、入力xが入力されたときの出力yと真の出力y(教師)との差分を小さくするように、それぞれの重みを調整(学習)する手法である。
このようなニューラルネットワークは、3層以上にさらに層を増やすことも可能である(深層学習と称される)。入力の特徴抽出を段階的に行い、結果を回帰する演算装置を、教師データのみから自動的に獲得することが可能である。
そこで、本実施形態の機械学習器10は、上述のQ学習を実施すべく、図1に示されるように状態観測部1、人口知能3、及び意思決定部4を備えている。但し、本発明に適用される機械学習方法は、Q学習に限定されるものではない。例えば教師あり学習を適用する場合において、価値関数は学習モデル、報酬は誤差にそれぞれ対応する。
図1に示すように、組み立て・試験器20における状態には、行動で間接的に変化する状態と、行動で直接的に変化する状態とがある。行動で間接的に変化する状態には、各試験結果が含まれる。行動で直接的に変化する状態には、次回組み立てに使用する各部品ロット、及びロット毎の部品在庫量が含まれる。
人工知能3は、更新式及び報酬に基づいて、行動価値テーブルの中から現在の状態変数及び取り得る行動に対応する行動価値を更新する。
機械学習器10がネットワークを介して組み立て・試験器20に接続されるようにし、状態観測部1は、ネットワークを介して、現在の状態変数を取得するように構成してもよい。また、機械学習器10は、クラウドサーバに存在することが好ましい。
機械学習器10は、生産設備100に内蔵されていてもよい。即ち、生産設備100が、機械学習器10と、組み立て・試験器20と、を具備するようにしてもよい。
また、図1に示した例では、自己の機械学習器の人工知能で更新された行動価値テーブルを用いて自己の行動価値テーブルを更新する例を示したが、このような例には限られない。即ち、自己の機械学習器とは別の他の機械学習器の人工知能で更新された行動価値テーブルを用いて自己の行動価値テーブルを更新するようにしてもよい。
次に、本発明の実施例に係る生産設備に含まれる機械学習器の動作について説明する。図5に本発明の実施例に係る機械学習器の動作手順を説明するためのフローチャートを示す。
まず、ステップS101において、組み立て・試験器20の各種状態を状態観測部1で観測する。即ち、状態観測部1は、組み立て・試験器20が生産した製品の試験結果、及び製品の生産後の各特性の部品の在庫量を観測する。
次に、ステップS102において、報酬計算部2が観測した状態から報酬を計算する。例えば、報酬計算部2は、試験の結果である製品の性能が目標値に近いほど高い報酬を算出し、在庫量が部品の特性毎に偏っているほど低い報酬を算出する。
次に、ステップS103において、人工知能3が、観測した状態と報酬から行動価値を学習する。
次に、ステップS104において、状態及び行動価値に基づいて、意思決定部4で最適なパラメータ(行動)を決定する。例えば、所望の製品性能及び在庫量の偏りを得るためのパラメータ(次回組み立てに使用する各部品ロット)を決定する。
次に、ステップS105において、パラメータ(行動)により状態が変化する。即ち、組み立て・試験器20が、所望の製品所望の性能及び在庫量の偏りを得るために次回組み立てに使用する各部品ロットを決定する。
本実施例の生産設備が生産する製品の少なくとも一部にはモータ駆動装置が含まれていてもよい。ただし、これは一例であって他の製品にも本発明を適用することができる。
本実施例の生産設備が製品の組み立てに使用する複数の部品には、モータ駆動装置の電流検出回路における電流センサ及びADコンバータの少なくとも一方が含まれてもよい。
また、部品の特性には、オフセット電圧が含まれてもよく、試験の結果には、モータ駆動装置の電流検出回路のオフセット値が含まれてもよい。
以上説明したように、本発明の実施例に係る生産設備によれば、機械学習によって、所望の製品性能及び在庫量の偏りに対して、組み立て・試験器のパラメータを自動調整することができ、製品性能を向上させ、在庫量の偏りを回避することができる。その結果、誤差のある部品を使いつつ、回路出力は理想値(誤差±0%)に近い商品が生産でき、偏った誤差の部品が在庫として残るのを防ぐことができる。
1 状態観測部
2 報酬計算部
3 人工知能
4 意思決定部
10 機械学習器
20 組み立て・試験器
100 生産設備

Claims (5)

  1. 機械学習器と、組み立て・試験器と、を備えた生産設備であって、
    前記組み立て・試験器が、特性が異なる複数の部品群の中から複数の部品を選択し、選択した前記複数の部品を使用して製品の組み立てを行い、組み立てた前記製品の試験を行い、
    前記機械学習器が、
    前記製品の試験の結果と前記複数の部品群についての部品の特性毎の在庫量を観測する状態観測部と、
    前記試験の結果、及び前記在庫量に基づいて報酬を計算する報酬計算部と、
    前記状態観測部での観測結果、及び前記報酬計算部での報酬に基づいて行動の価値を判断する人工知能と、
    前記人工知能での判断結果に基づいて、次回の製品の組み立てに使用する複数の部品を前記複数の部品群から選択する意思決定部と、
    を有することを特徴とする生産設備。
  2. 前記報酬計算部が、前記試験の結果である製品の性能が目標値に近いほど高い報酬を算出し、前記在庫量が部品の特性毎に偏っているほど低い報酬を算出する、請求項1に記載の生産設備。
  3. 前記人工知能が、前記生産設備の構成と同一の構成を含む他の生産設備の状態観測部での観測結果、及び報酬計算部での報酬に基づいて、自己の行動の価値を判断する、請求項1または2に記載の生産設備。
  4. 前記製品の少なくとも一部にはモータ駆動装置が含まれ、
    前記複数の部品には、前記モータ駆動装置の電流検出回路における電流センサ及びADコンバータの少なくとも一方が含まれる、請求項1乃至3のいずれか一項に記載の生産設備。
  5. 前記部品の特性には、オフセット電圧が含まれ、
    前記試験の結果には、モータ駆動装置の電流検出回路のオフセット値が含まれる、請求項1乃至4のいずれか一項に記載の生産設備。
JP2015193852A 2015-09-30 2015-09-30 機械学習器及び組み立て・試験器を備えた生産設備 Active JP6055058B1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015193852A JP6055058B1 (ja) 2015-09-30 2015-09-30 機械学習器及び組み立て・試験器を備えた生産設備
CN201610818660.XA CN106557816B (zh) 2015-09-30 2016-09-12 具备机械学习器以及组装试验器的生产设备
DE102016011520.3A DE102016011520B4 (de) 2015-09-30 2016-09-23 Produktionsausrüstung mit Maschinenlernsystem und Montage-und Prüfeinheit
US15/281,032 US9934470B2 (en) 2015-09-30 2016-09-29 Production equipment including machine learning system and assembly and test unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015193852A JP6055058B1 (ja) 2015-09-30 2015-09-30 機械学習器及び組み立て・試験器を備えた生産設備

Publications (2)

Publication Number Publication Date
JP6055058B1 true JP6055058B1 (ja) 2016-12-27
JP2017068621A JP2017068621A (ja) 2017-04-06

Family

ID=57582271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015193852A Active JP6055058B1 (ja) 2015-09-30 2015-09-30 機械学習器及び組み立て・試験器を備えた生産設備

Country Status (4)

Country Link
US (1) US9934470B2 (ja)
JP (1) JP6055058B1 (ja)
CN (1) CN106557816B (ja)
DE (1) DE102016011520B4 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018101025A (ja) * 2016-12-19 2018-06-28 ファナック株式会社 光源ユニットの光学部品の調芯手順を学習する機械学習装置および光源ユニット製造装置
JP2018167424A (ja) * 2017-03-29 2018-11-01 ファナック株式会社 状態判定装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6502998B2 (ja) * 2017-04-13 2019-04-17 ファナック株式会社 回路構成最適化装置及び機械学習装置
EP3428746B1 (en) * 2017-07-14 2021-06-02 Siemens Aktiengesellschaft A method and apparatus for providing an adaptive self-learning control program for deployment on a target field device
IT201700085336A1 (it) * 2017-07-26 2019-01-26 Comau Spa "Dispositivo programmabile di assistenza ad un operatore in un ambiente di produzione"
JP6584697B1 (ja) * 2018-07-11 2019-10-02 三菱電機株式会社 機械学習装置、数値制御加工プログラム生成装置および機械学習方法
JP7048455B2 (ja) 2018-08-30 2022-04-05 本田技研工業株式会社 学習装置、シミュレーションシステム、学習方法、およびプログラム
CN110360932B (zh) * 2019-06-10 2020-08-04 上海交通大学 零件在线检测及数据处理平台以及方法
JPWO2022249457A1 (ja) * 2021-05-28 2022-12-01

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01244989A (ja) * 1988-03-28 1989-09-29 Nissan Motor Co Ltd 自動車車体の製造方法
JP2004094900A (ja) * 2002-07-09 2004-03-25 National Institute Of Advanced Industrial & Technology 生産計画作成システム及び方法、並びにプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19828528A1 (de) 1998-06-26 1998-12-17 Eike Prof Dr Ing Muehlenfeld Expertensystem
JP4006580B2 (ja) 2002-05-01 2007-11-14 株式会社富士通ゼネラル モータの組立装置
US7454312B2 (en) * 2006-03-15 2008-11-18 Applied Materials, Inc. Tool health information monitoring and tool performance analysis in semiconductor processing
US20070288419A1 (en) * 2006-06-07 2007-12-13 Motorola, Inc. Method and apparatus for augmenting data and actions with semantic information to facilitate the autonomic operations of components and systems
US8078552B2 (en) * 2008-03-08 2011-12-13 Tokyo Electron Limited Autonomous adaptive system and method for improving semiconductor manufacturing quality
US8190543B2 (en) * 2008-03-08 2012-05-29 Tokyo Electron Limited Autonomous biologically based learning tool
US8725667B2 (en) * 2008-03-08 2014-05-13 Tokyo Electron Limited Method and system for detection of tool performance degradation and mismatch
DE102012216574A1 (de) 2012-09-17 2014-03-20 Siemens Aktiengesellschaft Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01244989A (ja) * 1988-03-28 1989-09-29 Nissan Motor Co Ltd 自動車車体の製造方法
JP2004094900A (ja) * 2002-07-09 2004-03-25 National Institute Of Advanced Industrial & Technology 生産計画作成システム及び方法、並びにプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018101025A (ja) * 2016-12-19 2018-06-28 ファナック株式会社 光源ユニットの光学部品の調芯手順を学習する機械学習装置および光源ユニット製造装置
US10241324B2 (en) 2016-12-19 2019-03-26 Fanuc Corporation Machine learning device for learning procedure for aligning optical part of light source unit, and light-source unit manufacturing apparatus
JP2018167424A (ja) * 2017-03-29 2018-11-01 ファナック株式会社 状態判定装置

Also Published As

Publication number Publication date
CN106557816B (zh) 2019-02-01
CN106557816A (zh) 2017-04-05
US20170091675A1 (en) 2017-03-30
DE102016011520A1 (de) 2017-03-30
US9934470B2 (en) 2018-04-03
DE102016011520B4 (de) 2018-05-09
JP2017068621A (ja) 2017-04-06

Similar Documents

Publication Publication Date Title
JP6055058B1 (ja) 機械学習器及び組み立て・試験器を備えた生産設備
JP6457369B2 (ja) パラメータを自動調整する機能を有する機械学習装置及び電動機制御装置
JP6110451B1 (ja) 機械学習装置およびコイル製造装置
JP6174649B2 (ja) ファンモータの予防保全機能を備えたモータ駆動装置
JP6140236B2 (ja) 機械学習装置及び電動機用着磁装置
CN104217258B (zh) 一种电力负荷条件密度预测方法
JP2001236337A (ja) ニューラルネットワークによる予測装置
Kebriaei et al. Model-based and learning-based decision making in incomplete information cournot games: a state estimation approach
CN110069699B (zh) 排序模型训练方法和装置
US9952574B2 (en) Machine learning device, motor control system, and machine learning method for learning cleaning interval of fan motor
JP6088613B1 (ja) ロータにおける磁石の配置位置を学習する機械学習装置および方法ならびに該機械学習装置を備えたロータ設計装置
JP2017094403A (ja) 加工プログラムの機械学習装置、該機械学習装置を備えた加工組立システムおよび加工プログラムの機械学習方法
CN111724001B (zh) 一种基于深度强化学习的飞行器探测传感器资源调度方法
CN113169044A (zh) 高度共线响应空间中的规范性分析
CN115902642A (zh) 电池荷电状态估算方法、装置、电子设备及存储介质
Leśniak Supporting contractors’ bidding decision: RBF neural networks application
Kirtay et al. Trust me! I am a robot: an affective computational account of scaffolding in robot-robot interaction
US10004112B2 (en) Machine learning apparatus and coil electric heating apparatus
JPWO2020161935A1 (ja) 学習装置、学習方法、及び、プログラム
CN114720129A (zh) 一种基于双向gru的滚动轴承剩余寿命预测方法及系统
CN113779724A (zh) 一种充填包装机故障智能预测方法及其系统
Rahman et al. A Reinforcement Learning Approach to Predicting Human Design Actions Using a Data-Driven Reward Formulation
Hoffmann et al. Flexible Manufacturing based on Autonomous, Decentralized Systems
Lindén Guiding Column Generation using Deep Reinforcement Learning Trainee and Training Device Optimization
CN116562982A (zh) 离线物品推荐方法、装置、设备和存储介质

Legal Events

Date Code Title Description
A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20161006

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20161028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161201

R150 Certificate of patent or registration of utility model

Ref document number: 6055058

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150