JP6760317B2 - 学習支援装置 - Google Patents

学習支援装置 Download PDF

Info

Publication number
JP6760317B2
JP6760317B2 JP2018047258A JP2018047258A JP6760317B2 JP 6760317 B2 JP6760317 B2 JP 6760317B2 JP 2018047258 A JP2018047258 A JP 2018047258A JP 2018047258 A JP2018047258 A JP 2018047258A JP 6760317 B2 JP6760317 B2 JP 6760317B2
Authority
JP
Japan
Prior art keywords
learning
input
abnormal
output
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018047258A
Other languages
English (en)
Other versions
JP2019159957A (ja
Inventor
勇樹 上山
勇樹 上山
信幸 阪谷
信幸 阪谷
泰明 阿部
泰明 阿部
和彦 今竹
和彦 今竹
高史 藤井
高史 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2018047258A priority Critical patent/JP6760317B2/ja
Priority to US16/977,469 priority patent/US20210049506A1/en
Priority to CN201980012032.4A priority patent/CN111684475B/zh
Priority to PCT/JP2019/006185 priority patent/WO2019176480A1/ja
Priority to EP19767171.2A priority patent/EP3767554A4/en
Publication of JP2019159957A publication Critical patent/JP2019159957A/ja
Application granted granted Critical
Publication of JP6760317B2 publication Critical patent/JP6760317B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Description

本発明は、学習支援装置、これを備えた処理装置、学習支援方法、及び学習支援プログラムに関する。
近年、所定の入力から適切な出力を行う制御のために、学習器を用いた制御装置が多数開示されている(例えば、特許文献1)。このような学習器は、事前に与えた学習データによって学習を行うが、学習器の出力精度が下がった場合には、追加学習データを加えた学習器の再学習を行う必要がある。このような再学習のタイミングは、ユーザが任意に判断していた。
特開2018−014838号公報
しかしながら、再学習のタイミングをユーザの判断で行う場合、再学習の基準が明確でないと、再学習を行うことができない。そして、再学習が遅れた場合には、不適切な出力が続くおそれがある。
本発明は、この問題を解決するためになされたものであり、学習器の再学習を効率的に行うことができる、学習支援装置、これを備えた処理装置、学習支援方法、及び学習支援プログラムを提供することを目的とする。
本開示に係る学習支援装置は、所定の入力から所定の出力を行うための学習を行った学習済みの学習器を有する処理部に対し、再学習を行うための学習支援装置であって、前記入力の異常を所定の基準に基づいて判定する判定部と、前記判定部が前記入力を異常入力と判定した場合、所定の条件下で、当該異常入力を追加の学習データとして、前記学習器の再学習を行う再学習部と、を備えている。
この構成によれば、異常入力があったと判定されたときに、学習器の再学習を行うことで、異常入力に対しても理想的な出力が行えるように学習器を学習することができる。すなわち、本発明においては、学習器の再学習を異常入力の発生を契機として行うようにしているため、ユーザが学習器の再学習のタイミングを任意に設定することなく、自動的に学習器の再学習を行うことができる。また、異常入力に対する学習器の更新を遅延なく行うことができるため、学習器の出力の精度を高めることができる。
上記学習支援装置において、再学習部は、前記判定部が前記入力を異常入力と判定したことを条件として、前記再学習を行うように構成することができる。すなわち、判定部が異常入力と判定した場合には、ユーザの判断によらず、つまり、ユーザからの指示を受けることなく、再学習を行うように構成することができる。
上記学習支援装置においては、前記判定部が前記入力を異常入力と判定した場合、当該異常入力の発生を報知する報知部をさらに備えることができる。
上記学習支援装置においては、前記判定部が前記入力を異常入力と判定した場合、当該異常入力の発生を報知する報知部をさらに備え、前記報知部により前記異常入力の発生が報知された場合において、再学習の指令がなされたときに、前記再学習部が再学習を行うように構成することができる。
上記学習支援装置において、前記再学習部は、前記異常入力からの前記処理部による出力に対し、フィードバック制御を行うことで、前記異常入力に対する理想出力を生成し、前記異常入力及び前記理想出力を前記追加の学習データとして、前記再学習を行うように構成することができる。
上記学習支援装置においては、前記処理部による前記入力からの前記出力が、所定の物理モデルに基づくものである場合、前記再学習部は、前記物理モデルに基づいて、前記異常入力に対する理想出力を生成し、前記異常入力及び前記理想出力を前記追加の学習データとして、前記再学習を行うように構成することができる。
本開示は、所定の入力から所定の出力を行う処理システムであって、前記所定の入力から前記所定の出力を行うための学習を行った学習済みの学習器を有する処理部と、上述したいずれかの学習支援装置と、を備えている。
本開示は、所定の入力から所定の出力を行うための学習を行った学習済みの学習器を有する処理部に対し、再学習を行うための学習支援方法であって、前記入力の異常を所定の基準に基づいて判定するステップと、前記入力が異常入力であると判定された場合、所定の条件下で、当該異常入力を追加の学習データとして、前記学習器の再学習を行うステップと、を備えている。
上記学習支援方法においては、前記入力が異常入力であると判定された場合、前記再学習を行うように構成することができる。
上記学習支援方法においては、前記入力が異常入力である判定された場合、当該異常入力の発生を報知するステップをさらに備えることができる。
そして、前記異常入力の発生が報知された場合、前記再学習が必要か否かを判断するステップをさらに備えることができ、前記再学習が必要と判断された場合に、前記再学習が行わせることができる。
本開示は、所定の入力から所定の出力を行うための学習を行った学習済みの学習器を有する処理部に対し、再学習を行うための学習支援プログラムであって、コンピュータに、
前記入力の異常を所定の基準に基づいて判定するステップと、前記入力が異常入力である判定された場合、所定の条件下で、当該異常入力を追加の学習データとして、前記学習器の再学習を行うステップと、を実行させる。
本発明によれば、学習器の再学習を効率的に行うことができる。
本発明の処理装置の一実施形態一実施形態の概要を示すブロック図である。 本発明に係る処理装置をモータ制御システムに適用した例を示すブロック図である。 図2のモータ制御システムのハードウェア構成を示すブロック図である。 図2のモータ制御システムで用いられるニューラルネットワークの一例を示す図である。 トルク値の正常な入力の例を示すグラフである。 トルク値の異常な入力の例を示すグラフである。 トルク値の異常を判定するモデル図である。 図2のモータ制御システムの学習器の学習の一例を示す図である。 図2のモータ制御システムの処理のモデルの例を示す図である。 図2のモータ制御システムにおける学習器の更新の処理手順の一例を例示するフローチャートである。 本発明に係る学習支援装置とモータ制御システムの構成の他の例を示すブロック図である。
以下、本発明に係る学習支援装置、学習支援方法、及び学習支援プログラムの一実施形態について、図面を参照しつつ説明する。ただし、以下で説明する本実施形態は、あらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。
<1.適用例>
以下、本実施形態に係る学習支援装置について図1を参照しつつ説明する。図1は、本実施形態に係る学習支援装置を含む処理システムの機能構成を示すブロック図である。
図1に示すように、この処理システム10は、入力に対して何らかの出力を行う処理部11を備えている。この処理部11は、入力に対して所定の出力を行うように学習された学習済み学習器14を備えている。また、この処理システムは、処理部11と同様に入力を受ける判定部12を備えており、この判定部12によって、入力が異常入力であるか否かを判定する。例えば、何らかの理由で通常の入力から外れた異常入力があった場合、学習器14はそのような異常入力に対して適切な出力をできないおそれがある。そこで、本実施形態に係る処理システムは、異常入力があった場合には、それを判定するために判定部12を有している。判定部12は、異常入力を判定するために、通常の入力パターンを含む異常検出モデル15を有しており、このモデル15を参照することで、入力が異常であるか否かを判定するようになっている。なお、ここでいう異常入力とは、ユーザが見て明らかに通常とは異なる入力も含むが、例えば、一見、正常に見えるが、予め想定されていた入力とは異なる入力、あるいは予め決められていた基準を満たさないような入力を指す。すなわち、明らかな異常は、学習対象から外れる可能性があるが、上記のような一見正常に見えるものは、学習器にとって初めて現れた入力になる可能性があり、そのような入力こそ、再学習すべきものとなり得る。
また、判定部12で異常入力であることを判定した場合には、処理システムにある表示装置(報知部)16に、異常入力を送信する。この表示装置16に異常入力があったことが表示されることで、ユーザが異常入力を知ることができる。
そして、この処理システムは、判定部12が異常入力であるとの判定を行った場合には、その異常入力を用いて学習器14の再学習を行うための再学習部13を有している。再学習部13は、異常入力を入力とし、この入力に対応した理想的な出力、具体的には、再学習部13で算出した、あるいは再学習部13が有する理想的な出力を出力とした追加学習データを生成し、これを現在の学習器14の学習データに加えて、学習器14の再学習を行う。これにより、異常入力であることの判断を自動的に行うことができ、即座に学習器14の再学習を行うことができる。したがって、学習器14が対応できない可能性のある異常入力があった場合には、改めて学習器14の学習を行い、出力の精度を高めるようにしている。すなわち、再学習のタイミングを、自動的に設定することができる。
なお、再学習を行うか否かの判断については、種々の設定を行うことができる。例えば、判定部12が異常入力があったと判定すると、即座に再学習を行うように設定することができる。あるいは、表示装置16により、ユーザが異常入力を知った後、ユーザの判断により再学習を行うように設定することもできる。したがって、異常入力があったとしても、ユーザの判断で再学習を行わないように設定することもできる。
本実施形態に係る処理システムは、種々の処理に適用することができるが、以下では、この処理システムをモータ制御システムに適用した例について説明する。このモータ制御システムは、サーボモータのトルク値に基づいて、サーボモータの処理対象物の位置制御を行うものである。以下、詳細に説明する。
<2.構成例>
<2−1.ハードウェア構成>
まず、本実施形態に係る学習支援装置を含むモータ制御システム2のハードウェア構成について、図2を参照しつつ説明する。図2は、本実施形態に係るモータの制御システムのハードウェア構成を示すブロック図である。
<2−1−1.サーボモータ>
図2に示すサーボモータ1は、特には限定されず、公知のものを用いることができるが、ここでは、サーボモータ1で検出したトルク波形をモータ制御システム2に入力することとする。そして、モータ制御システム2は、入力されたトルク波形を所定周期(例えば、1ms周期)でサンプリングし、このトルク波形に応じて、サーボモータ1への位置制御指令を行う。
<2−1−2.コントローラ>
図2に示すように、本実施形態に係るモータ制御システム2は、制御部21、記憶部22、通信インタフェース23、入力装置24、出力装置25、表示装置26、外部インタフェース27、及びドライブ28が電気的に接続されたコンピュータである。なお、図1では、通信インタフェース及び外部インタフェースをそれぞれ、「通信I/F」及び「外部I/F」と記載している。
制御部21は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を含み、情報処理に応じて各構成要素の制御を行う。記憶部22は、例えば、ハードディスクドライブ、ソリッドステートドライブ等の補助記憶装置であり、制御部21で実行される制御プログラム221、学習支援プログラム222、サーボモータ1から送信されるトルクデータ及び出力する位置指令データを含めたモータの制御の入出力に関するモータデータ223、サーボモータ1のトルク波形の異常を判定するための異常検出データ224、学習済みの学習器に関する情報を示す学習結果データ225、学習器を学習させるための学習データ226等を記憶する。その他、モータ制御装置2の駆動に必要な各種のデータも記憶することもできる。
制御プログラム221は、サーボモータ1から得られるトルクデータに応じて、サーボモータ1の位置制御指令、つまり位置指令の出力を行うものであり、学習器によって、出力を行う。学習支援プログラム222は、学習器の再学習を行うためのプログラムであり、後述する入力の異常判定も行う。モータデータ223は、サーボモータ1から入力されるトルク値、及びサーボモータ1に出力される位置指令値に関するデータである。異常検出データ224は、例えば、入力の正常パターンを有するモデルである。学習結果データ225は、学習済みの学習器の設定を行うためのデータである。また、学習データ226は、現在の学習器の学習に用いたデータである。なお、学習に関する詳細な説明は後述する。
通信インタフェース23は、例えば、有線LAN(Local Area Network)モジュール、無線LANモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。例えば、サーボモータ1と通信したり、あるいはサーボモータ1の制御に関する情報を外部に送信するために用いられる。入力装置24は、例えば、マウス、キーボード等の入力を行うための装置であり、後述するように、再学習を行うか否かの指示を入力することができる。出力装置25は、例えば、スピーカ等の出力を行うための装置である。表示装置26は、ディスプレイ等で構成することができ、例えば、異常入力があったことなどを表示することができる。外部インタフェース27は、USB(Universal Serial Bus)ポート等であり、外部装置と接続するためのインタフェースである。
ドライブ28は、例えば、CD(Compact Disk)ドライブ、DVD(Digital Versatile Disk)ドライブ等であり、記憶媒体91に記憶されたプログラムを読み込むための装置である。ドライブ28の種類は、記憶媒体91の種類に応じて適宜選択されてよい。上記記憶部22に記憶される各種のデータ221〜226の少なくとも一つは、この記憶媒体91に記憶されていてもよい。また、モータデータ223は、制御部21のRAMに記憶させることもできる。
記憶媒体91は、コンピュータその他装置、機械等が記録されたプログラム等の情報を読み取り可能なように、このプログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。モータ制御システム2は、この記憶媒体91から、上記各種のデータ221〜225を取得してもよい。
ここで、図2では、記憶媒体91の一例として、CD、DVD等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体91の種類は、ディスク型に限定される訳ではなく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。
なお、モータ制御システム2の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部21は、複数のプロセッサを含んでもよい。モータ制御システム2は、複数台の情報処理装置で構成されてもよい。また、モータ制御システム2は、提供されるサービス専用に設計された情報処理装置の他、汎用のデスクトップPC(Personal Computer)、タブレットPC等が用いられてもよい。
<2−2.モータ制御システムの機能的構成>
次に、図2及び図3を参照しつつ、本実施形態に係るモータ制御システムの機能構成の一例を説明する。図3は、モータ制御システムの機能構成を示すブロック図である。
<2−2−1.概略構成>
モータ制御システム2の制御部21は、記憶部22に記憶された制御プログラム221及び学習支援プログラム222をRAMに展開する。そして、制御部21は、RAMに展開されたこれらのプログラム221、222をCPUにより解釈及び実行して、各構成要素を制御する。これによって、図3に示すように、本実施形態に係るモータ制御システム2は、処理部211、判定部212、及び再学習部213を備えるコンピュータとして機能する。
<2−2−2.処理部>
処理部211では、サーボモータ1のトルク値を入力とし、この入力に応じたサーボモータへの位置指令値を出力とするように学習した学習器214を備えている。処理部211は、例えば、サーボモータ1からのトルク波形を1msおきにサンプリングし、このトルク波形に応じて、学習器214から出力された位置指令値を、サーボモータ1に出力する。
このような位置指令値の出力を行う学習器214は、例えば、ニューラルネットワークで構成されている。具体的には、図4に示すような、いわゆる深層学習に用いられる多層構造のニューラルネットワークであり、入力から順に、入力層71、中間層(隠れ層)72、及び出力層73を備えている。
図4では、ニューラルネットワーク7は1層の中間層72を備えており、入力層71の出力が中間層72の入力となり、中間層72の出力が出力層73の入力となっている。但し、中間層72の数は1層に限られなくてもよく、ニューラルネットワーク7は、中間層72を2層以上備えてもよい。
各層71〜73は、1又は複数のニューロンを備えている。例えば、入力層71のニューロンの数は、サーボモータ1の数に応じて設定することができる。中間層72のニューロンの数は実施の形態に応じて適宜設定することができる。また、出力層73も、サーボモータ1の数に応じて設定することができる。すなわち、このモータ制御システムは、1つのサーボモータ1の制御に用いることもできるし、あるいは複数のサーボモータ1の制御を並列に行うこともできる。
隣接する層のニューロン同士は適宜結合され、各結合には重み(結合荷重)が設定されている。図4の例では、各ニューロンは、隣接する層の全てのニューロンと結合されているが、ニューロンの結合は、このような例に限定されなくてもよく、実施の形態に応じて適宜設定されてよい。
各ニューロンには閾値が設定されており、基本的には、各入力と各重みとの積の和が閾値を超えているか否かによって各ニューロンの出力が決定される。モータ制御システム2は、このようなニューラルネットワーク7の入力層71に上記トルク波形を入力することで、出力層73から位置指令値を得る。
なお、このようなニューラルネットワーク7の構成(例えば、ニューラルネットワーク7の層数、各層におけるニューロンの個数、ニューロン同士の結合関係、各ニューロンの伝達関数)、各ニューロン間の結合の重み、及び各ニューロンの閾値を示す情報は、学習結果データ225に含まれている。モータ制御システム2は、学習結果データ225を参照して、学習済みの学習器214の設定を行う。
<2−2−3.判定部>
判定部212は、トルク値の異常入力を判定するものである。トルク値の異常は、例えば、ワークの揺らぎ、ワークの熱膨張など、サーボモータ1に対する負荷の変動を起因とするもの、あるいは経年劣化や工具の摩耗など、機械の劣化に起因して発生する。例えば、図5Aを正常なトルク波形とした場合、図5Bのようにトルク波形の中に異常に高いトルク値が発生した場合、異常入力があったとする。このような異常入力の判定には、種々の方法があるが、以下に一例を示す。
まず、サーボモータ1のトルク値を1ms周期でサンプリングする。そして、直前数ms〜数十msの波形データを元に、変数の配列を有するベクトルを生成する。例えば、[区間の最大振幅、振幅数]、または[trq(t-N), trq(t-N+1), trq(t-N+2),……, trq(t)](trq(t)は、時刻tのトルク値)である。そして、正常時のトルク波形から、同様にベクトルを生成し、これを正常モデル(異常検出モデル)215として定義しておき、これに基づいて、異常入力を検知する。例えば、図6に示すように、上記のように定義したベクトル空間において、入力されたトルク値が、事前に定義した集合から外れている度合いを算出する。そして、外れている度合い(異常度)に対する閾値を設定しておき、正常または異常を検知する。すなわち、この閾値以内である場合には正常、閾値から外れている場合には異常と判定することができる。このような異常値の発見の手法は、特には限定されないが、lof(local outlier factor)法(局所外れ値因子法)などを用いることができる。このような閾値が、本発明の所定の基準となる。その他、所定の基準に関し、例えば、正常たる基準を満たさない場合が異常であるという基準でもよいし、異常たる基準を満たした場合が異常であるという基準としてもよい。
こうして、入力されたトルク波形から異常が検知されると、判定部212は、これを表示装置26に送信し、表示を行う。あるいは、異常の発生を条件として、次に説明する再学習を行うこともできる。
異常出力が表示装置26に表示されることで、ユーザは、異常の発生を視認することができる。このとき、ユーザの指示により再学習を行うことができる。すなわち、異常の発生を表示装置26で確認した後、マニュアルでユーザが再学習の指示を行うことができる。あるいは、異常の発生を確認した場合であっても、ユーザの判断で再学習を行わないようにすることもできる。
<2−2−4.再学習部>
判定部212で、異常入力と判定された場合、あるいはユーザが再学習の指示を行ったとき、再学習部213において、学習器214の再学習が行われる。再学習の方法は種々の方法があるが、例えば、以下の方法がある。
まず、学習器214の学習に用いられる追加学習データ2261を生成する。そして、その追加学習データ2261を学習データ226に加えて、学習器214の再学習が行われる。例えば、図7に示すように、異常入力との判定がなされたときの異常入力、及びその異常入力に対する理想的な出力、つまり位置指令値の組み合わせを追加学習データとし、これを学習データ226に加え、学習器214の再学習を行う。
ここで用いられる理想的な位置指令値は、種々の方法で生成されるが、例えば、以下のように生成することができる。まず、異常入力があった場合には、学習なしで実際にこのサーボモータ1による位置制御を行い、その制御結果から理想的な制御との誤差を算出し、フィードバックして理想的な位置指令値を生成する。
あるいは、この制御が所定の物理モデル、つまり指令に対する応答をシミュレーションできるモデルを有している場合には、次のようにすることもできる。図8は、入力と出力との関係を示すグラフの一例である。図8に示すように、現在の学習器における入力と出力との関係は、所定の制御モデル式(物理モデル)に基づいており、この制御モデル式を基準として入力と出力とが学習されている場合、例えば、現在の学習器において学習した入力範囲から外れた入力があった場合には、この学習器では対応できない。そこで、この制御モデル式を用い、異常入力の入力応答からフィードフォワードして、理想的な位置指令値を生成する。
こうして、再学習部213は、異常入力に対する再学習が指示された場合には、異常入力と、これに対応する理想的な位置指令値とを有する追加学習データ2261により、学習器214の再学習を行う。
<2−3.モータ制御システムの動作>
次に、図9を参照しつつ、モータ制御システム2における学習器214の再学習の処理例を説明する。図9は、モータ制御システムの処理手順の一例を例示するフローチャートである。なお、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
図9に示すように、まず、モータ制御システムに対してサーボモータ1からトルク値を入力する(ステップS101)。このトルク値に対し、処理部211は、学習器214によって位置指令値を出力し、サーボモータ1に対して応答する。これと並行して、入力されたトルク値に対して判定部212が、異常入力であるか否かを判定する(ステップS102)。異常入力でないと判定した場合には(ステップS102のNO)、再学習は行わない。一方、判定部212が異常入力であると判定した場合には(ステップS102のYES)、異常入力を表示装置26に表示する。ここで、表示装置26を確認したユーザが再学習を行うと判断した場合には(ステップS103のYES)、再学習部213において追加学習データが生成される(ステップS104)。そして、この追加学習データ2261を学習データ226に追加した上で、学習器214の再学習が行われる(ステップS105)。こうして、学習器214は、異常入力に対する理想的な出力を行えるように学習される。なお、判定部212が異常入力との判定を行った後、ユーザの判断なしに、再学習を行うこともできる。
なお、学習器214の再学習を行った後、学習器214の更新を行うタイミングは、特には限定されないが、例えば、以下のタイミングで行うことができる。まず、再学習が完了した次の制御周期(サーボモータ1の制御処理を実行する周期)の直前に、学習器214の更新を行うことができる。あるいは、学習器214の前回の更新後から処理システム10が安定動作することがある程度保証できる状態(例えば、サーボモータや装置のステートを参照し判断する)を事前にユーザが指定しておき、そのタイミングで更新することができる。具体的には、 周期動作の停止位置に来たときや、メンテナンスモードになったときに更新することができる。
<3.特徴>
以上のように、本実施形態によれば、異常入力があったと判定されたときに、学習器214の学習を行うことで、異常入力に対しても理想的な出力が行えるように学習器214を学習することができる。すなわち、本実施形態においては、学習器214の再学習を異常入力の発生を契機として行うようにしているため、ユーザが学習器214の再学習のタイミングを任意に設定することなく、効率的に学習器214の再学習を行うことができる。また、異常入力に対する学習器214の更新を遅延なく行うことができるため、学習器の出力の精度を高めることができる。
<4.変形例>
以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略した。以下の変形例は適宜組み合わせ可能である。
<1>
上記実施形態では、モータ制御システムの中に、本発明に係る学習支援装置を組み込んでいるが、学習支援装置をモータ制御システムと独立に設け、モータ制御システムとの通信によって、学習器の再学習を行うこともできる。例えば、図10に示すように、処理部211を有するモータ制御システム3とは別に、判定部212及び再学習部213を有する学習支援装置4を設け、処理部211の学習器214に対し、学習支援装置4によって再学習を行うように構成することもできる。この場合、例えば、再学習部213が新たな学習結果データ225を生成し、これを処理部211に送信し、処理部211が学習結果データ225の更新を行うことができる。
<2>
上述したように判定部212における異常入力の判定は種々の方法があり、上記実施形態に限定されない。同様に、再学習を行うための追加学習データ2261の生成についても、特には限定されず、種々の方法で追加学習データ2261を生成することができる。
<3>
異常入力の発生を報知する手段(報知部)は、特には限定されない。例えば、上記実施形態では、異常入力があった場合、表示装置26にその旨が表示されるが、音で異常入力があった旨をユーザに通知することもできる。すなわち、報知部は、表示装置26に代えてスピーカ等の放音装置でもよく、表示装置26及び放音装置でもよい。そして、ユーザは、音によって異常入力があった旨を知った後、再学習の指令を行うことができる。
<4>
上記の例では、ニューラルネットワーク7として、多層構造を有する一般的な順伝播型ニューラルネットワークを用いている。しかしながら、各ニューラルネットワーク7の種類は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。例えば、各ニューラルネットワーク7は、入力層71及び中間層72を畳み込み層及びプーリング層として利用する畳み込みニューラルネットワークであってもよい。また、例えば、各ニューラルネットワーク7は、中間層72から入力層71等のように出力側から入力側に再帰する結合を有する再帰型ニューラルネットワークであってもよい。なお、各ニューラルネットワーク7の層数、各層におけるニューロンの個数、ニューロン同士の結合関係、及び各ニューロンの伝達関数は、実施の形態に応じて適宜決定されてよい。
<5>
上記学習器214の種類は、特には限定されず、ニューラルネットワーク以外に、例えば、決定木、サポートベクターマシン、自己組織化マップ、又は強化学習により学習を行う学習器とすることができる。
<6>
上記実施形態においては、本発明の学習支援装置をモータ制御システムに適用した例を示したが、これに限定されるものではなく、種々のシステムに適用可能である。すなわち、学習器によって入力から出力を行うシステムであって、入力の異常が生じうるようなシステムに対して、適宜適用することができる。
211 処理部
212 判定部
213 再学習部
214 学習器

Claims (13)

  1. 所定の入力から所定の出力を行うための学習を行った学習済みの学習器を有する処理部に対し、再学習を行うための学習支援装置であって、
    前記入力の異常を所定の基準に基づいて判定する判定部と、
    前記判定部が前記入力を異常入力と判定した場合、所定の条件下で、当該異常入力を追加の学習データとして、前記学習器の再学習を行う再学習部と、
    を備え、
    前記再学習部は、
    前記異常入力からの前記処理部による出力に対し、フィードバック制御を行うことで、前記異常入力に対する理想出力を生成し、
    前記異常入力及び前記理想出力を前記追加の学習データとして、前記再学習を行うように構成されている、学習支援装置。
  2. 所定の入力から所定の出力を行うための学習を行った学習済みの学習器を有する処理部に対し、再学習を行うための学習支援装置であって、
    前記入力の異常を所定の基準に基づいて判定する判定部と、
    前記判定部が前記入力を異常入力と判定した場合、所定の条件下で、当該異常入力を追加の学習データとして、前記学習器の再学習を行う再学習部と、
    を備え、
    前記処理部による前記入力からの前記出力が、所定の物理モデルに基づくものであり、
    前記再学習部は、
    前記物理モデルに基づいて、前記異常入力に対する理想出力を生成し、
    前記異常入力及び前記理想出力を前記追加の学習データとして、前記再学習を行うように構成されている、学習支援装置。
  3. 前記再学習部は、前記判定部が前記入力を異常入力と判定したことを条件として、前記再学習を行うように構成されている、請求項1または2に記載の学習支援装置。
  4. 前記判定部が前記入力を異常入力と判定した場合、当該異常入力の発生を報知する報知部をさらに備えている、請求項1から3のいずれかに記載の学習支援装置。
  5. 前記判定部が前記入力を異常入力と判定した場合、当該異常入力の発生を報知する報知部をさらに備え、
    前記報知部により前記異常入力の発生が報知された場合において、再学習の指令がなされたときに、前記再学習部が再学習を行うように構成されている、請求項1または2に記載の学習支援装置。
  6. 所定の入力から所定の出力を行う処理システムであって、
    前記所定の入力から前記所定の出力を行うための学習を行った学習済みの学習器を有する処理部と、
    請求項1からのいずれかに記載の学習支援装置と、
    を備えている、処理システム。
  7. 所定の入力から所定の出力を行うための学習を行った学習済みの学習器を有する処理部に対し、再学習を行うための学習支援方法であって、
    前記入力の異常を所定の基準に基づいて判定するステップと、
    前記入力が異常入力であると判定された場合、所定の条件下で、当該異常入力を追加の学習データとして、前記学習器の再学習を行うステップと、
    を備え、
    前記再学習を行うステップでは、
    前記異常入力からの前記処理部による出力に対し、フィードバック制御を行うことで、前記異常入力に対する理想出力を生成し、
    前記異常入力及び前記理想出力を前記追加の学習データとして、前記再学習を行うように構成されている、学習支援方法。
  8. 所定の入力から所定の出力を行うための学習を行った学習済みの学習器を有する処理部に対し、再学習を行うための学習支援方法であって、
    前記入力の異常を所定の基準に基づいて判定するステップと、
    前記入力が異常入力であると判定された場合、所定の条件下で、当該異常入力を追加の学習データとして、前記学習器の再学習を行うステップと、
    を備え、
    前記処理部による前記入力からの前記出力が、所定の物理モデルに基づくものであり、
    前記再学習を行うステップでは、
    前記物理モデルに基づいて、前記異常入力に対する理想出力を生成し、
    前記異常入力及び前記理想出力を前記追加の学習データとして、前記再学習を行うように構成されている、学習支援方法。
  9. 前記入力が異常入力であると判定された場合、前記再学習を行うように構成されている、請求項7または8に記載の学習支援方法。
  10. 前記入力が異常入力である判定された場合、当該異常入力の発生を報知するステップをさらに備えている、請求項7から9のいずれかに記載の学習支援方法。
  11. 前記異常入力の発生が報知された場合、前記再学習が必要か否かを判断するステップをさらに備え、
    前記再学習が必要と判断された場合に、前記再学習が行われる、請求項10に記載の学習支援方法。
  12. 所定の入力から所定の出力を行うための学習を行った学習済みの学習器を有する処理部に対し、再学習を行うための学習支援プログラムであって、
    コンピュータに、
    前記入力の異常を所定の基準に基づいて判定するステップと、
    前記入力が異常入力である判定された場合、所定の条件下で、当該異常入力を追加の学習データとして、前記学習器の再学習を行うステップと、
    を実行させ、
    前記再学習を行うステップでは、
    前記異常入力からの前記処理部による出力に対し、フィードバック制御を行うことで、前記異常入力に対する理想出力を生成し、
    前記異常入力及び前記理想出力を前記追加の学習データとして、前記再学習を行うように構成されている、学習支援プログラム。
  13. 所定の入力から所定の出力を行うための学習を行った学習済みの学習器を有する処理部に対し、再学習を行うための学習支援プログラムであって、
    コンピュータに、
    前記入力の異常を所定の基準に基づいて判定するステップと、
    前記入力が異常入力である判定された場合、所定の条件下で、当該異常入力を追加の学習データとして、前記学習器の再学習を行うステップと、
    を実行させ、
    前記処理部による前記入力からの前記出力が、所定の物理モデルに基づくものであり、
    前記再学習を行うステップでは、
    前記物理モデルに基づいて、前記異常入力に対する理想出力を生成し、
    前記異常入力及び前記理想出力を前記追加の学習データとして、前記再学習を行うように構成されている、学習支援プログラム。
JP2018047258A 2018-03-14 2018-03-14 学習支援装置 Active JP6760317B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2018047258A JP6760317B2 (ja) 2018-03-14 2018-03-14 学習支援装置
US16/977,469 US20210049506A1 (en) 2018-03-14 2019-02-20 Learning assistance device, processing system, learning assistance method, and storage medium
CN201980012032.4A CN111684475B (zh) 2018-03-14 2019-02-20 学习支援装置、处理系统、学习支援方法以及存储介质
PCT/JP2019/006185 WO2019176480A1 (ja) 2018-03-14 2019-02-20 学習支援装置
EP19767171.2A EP3767554A4 (en) 2018-03-14 2019-02-20 LEARNING ASSISTANT DEVICE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018047258A JP6760317B2 (ja) 2018-03-14 2018-03-14 学習支援装置

Publications (2)

Publication Number Publication Date
JP2019159957A JP2019159957A (ja) 2019-09-19
JP6760317B2 true JP6760317B2 (ja) 2020-09-23

Family

ID=67907630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018047258A Active JP6760317B2 (ja) 2018-03-14 2018-03-14 学習支援装置

Country Status (5)

Country Link
US (1) US20210049506A1 (ja)
EP (1) EP3767554A4 (ja)
JP (1) JP6760317B2 (ja)
CN (1) CN111684475B (ja)
WO (1) WO2019176480A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7363910B2 (ja) * 2019-10-23 2023-10-18 富士通株式会社 表示方法、表示プログラム及び情報処理装置
WO2021079447A1 (ja) * 2019-10-23 2021-04-29 富士通株式会社 表示方法、表示プログラム及び情報処理装置
WO2021079445A1 (ja) * 2019-10-23 2021-04-29 富士通株式会社 表示方法、表示プログラム及び情報処理装置
JP7351718B2 (ja) 2019-11-08 2023-09-27 三菱重工業株式会社 原子力プラントの線量当量予測方法、線量当量予測プログラム、及び、線量当量予測装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5539638A (en) * 1993-08-05 1996-07-23 Pavilion Technologies, Inc. Virtual emissions monitor for automobile
GB2321364A (en) * 1997-01-21 1998-07-22 Northern Telecom Ltd Retraining neural network
JPH11231907A (ja) * 1998-02-12 1999-08-27 Yamaha Motor Co Ltd 学習可能な制御ロジックを用いたフィードフォワード制御における予測学習方法
US20120150334A1 (en) * 2010-12-10 2012-06-14 L'air Liquide Societe Anonyme Pour L'etude Et L'exploitation Des Procedes Georges Claude Integrated Fault Detection And Analysis Tool
JPWO2014042147A1 (ja) * 2012-09-12 2016-08-18 日本電気株式会社 データ集中予測装置、データ集中予測方法、及びそのプログラム
US10311356B2 (en) * 2013-09-09 2019-06-04 North Carolina State University Unsupervised behavior learning system and method for predicting performance anomalies in distributed computing infrastructures
JP6506219B2 (ja) 2016-07-21 2019-04-24 ファナック株式会社 モータの電流指令を学習する機械学習器,モータ制御装置および機械学習方法
CN107256428B (zh) * 2017-05-25 2022-11-18 腾讯科技(深圳)有限公司 数据处理方法、数据处理装置、存储设备及网络设备

Also Published As

Publication number Publication date
US20210049506A1 (en) 2021-02-18
CN111684475A (zh) 2020-09-18
EP3767554A4 (en) 2021-11-17
JP2019159957A (ja) 2019-09-19
WO2019176480A1 (ja) 2019-09-19
CN111684475B (zh) 2023-10-20
EP3767554A1 (en) 2021-01-20

Similar Documents

Publication Publication Date Title
JP6760317B2 (ja) 学習支援装置
US20220146993A1 (en) Machine learning method and machine learning device for learning fault conditions, and fault prediction device and fault prediction system including the machine learning device
US20180174658A1 (en) Machine learning apparatus, life prediction apparatus, numerical control device, production system, and machine learning method for predicting life of nand flash memory
EP3424650B1 (en) A method and apparatus for performing control of a movement of a robot arm
JP6031202B1 (ja) 製造機械の異常の原因を発見するセル制御装置
JP6444851B2 (ja) ノイズの発生原因を検出する学習機能を有する制御装置
WO2019103772A1 (en) Detection and root cause analysis of welding defects
JP6453921B2 (ja) 学習モデル構築装置、及び制御情報最適化装置
JP2017191567A (ja) 生産計画を実施する生産システム
De Filippis et al. ANN modelling to optimize manufacturing process
JP6911798B2 (ja) ロボットの動作制御装置
US20190099849A1 (en) Thermal displacement compensation system
JP2007265345A (ja) 情報処理装置および方法、学習装置および方法、並びにプログラム
CN106687871A (zh) 用于控制器适应的系统和方法
JP4577353B2 (ja) 情報処理装置、情報処理方法、およびプログラム
WO2011083087A1 (en) Method for processing workpieces by means of a cognitive processing head and a cognitive processing head using the same
JP2019155554A (ja) ロボットの制御装置
JP2006268813A (ja) 学習制御装置、学習制御方法、およびプログラム
Rastegarpanah et al. Vision-guided mpc for robotic path following using learned memory-augmented model
WO2022132558A1 (en) Evolutionary imitation learning
JP2018036713A (ja) 複数の製造設備からなる生産設備の稼働停止時に原因を特定する機能を備えた生産制御装置
Verma A survey on machine learning applied to dynamic physical systems
JP2023146535A (ja) 動作指令生成装置および動作指令生成方法
Liu et al. Extreme learning machine based on improved genetic algorithm
Tam Self-Corrective Autonomous Systems using Optimization Processes for Detection and Correction of Unexpected Error Conditions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200817

R150 Certificate of patent or registration of utility model

Ref document number: 6760317

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150