JP2019200453A - 制御システム、学習データ作成装置、学習装置および判定装置 - Google Patents

制御システム、学習データ作成装置、学習装置および判定装置 Download PDF

Info

Publication number
JP2019200453A
JP2019200453A JP2018092840A JP2018092840A JP2019200453A JP 2019200453 A JP2019200453 A JP 2019200453A JP 2018092840 A JP2018092840 A JP 2018092840A JP 2018092840 A JP2018092840 A JP 2018092840A JP 2019200453 A JP2019200453 A JP 2019200453A
Authority
JP
Japan
Prior art keywords
learning
data
artificial intelligence
determination
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018092840A
Other languages
English (en)
Other versions
JP7091820B2 (ja
Inventor
安藤 丹一
Tanichi Ando
丹一 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP2018092840A priority Critical patent/JP7091820B2/ja
Priority to CN201910289524.XA priority patent/CN110488791A/zh
Priority to EP19169386.0A priority patent/EP3570219A1/en
Priority to US16/387,584 priority patent/US20190346836A1/en
Publication of JP2019200453A publication Critical patent/JP2019200453A/ja
Application granted granted Critical
Publication of JP7091820B2 publication Critical patent/JP7091820B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/0227Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions
    • G05B23/0229Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions knowledge based, e.g. expert systems; genetic algorithms
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2178Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
    • G06F18/2185Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor the supervisor being an automated module, e.g. intelligent oracle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

【課題】AIの出力の妥当性を判定する。【解決手段】制御システムは、制御装置と判定装置とを具備する。制御装置は、制御用AIを含む制御部を備える。判定装置は、制御用AIの出力の妥当性を判定する判定用AIを含む判定部を備える。判定用AIには、妥当性を判定する判定能力を獲得する第2の機械学習の学習結果が設定されている。第2の機械学習は、第1の機械学習を実行中の又は第1の機械学習の学習結果を設定されたAIの出力に関するデータに基づいて作成された学習用の判定材料データと、学習用の判定材料データに基づく妥当性の判定結果の正解値を示す教師データとの組み合わせを含む学習データを使用して行われる。学習用の判定材料データは、第1の機械学習を実行中の又は第1の機械学習の学習結果を設定されたAIの出力に関するデータの中から判定能力の仕様に基づいて定められる。【選択図】図1

Description

本発明は、人工知能の出力の妥当性を判定する技術に関する。
人工知能に例えばデータを分類するなどの知的能力を獲得させるために、機械学習が行われる。また、対象の動作または状態を制御する能力(制御能力)を獲得することを目的に機械学習が行われることもある。
しかしながら、人工知能が常に望ましい結果をもたらすとは限らない。すなわち、人工知能は、間違った若しくは不適切な出力データを返したり、対象に意図しない動作を行わせたり意図しない状態に陥らせたりするかもしれない。
特許文献1には、ニューラルネットワークの入力ノード値が学習データの入力ノード値に一致若しくは類似であるか否かにより、当該ニューラルネットワークの出力ノード値の確からしさを評価する技法が開示されている。
特開平5−225163号公報
特許文献1は、ニューラルネットワークの出力ノード値の確からしさを評価するための特定の限られた技法を開示しているに過ぎない。
本発明は、人工知能の出力の妥当性を判定することを目的とする。
本発明の第1の態様によれば、制御システムは、制御装置と判定装置とを具備し、前記制御装置は、対象を制御するための出力データを入力データに基づいて生成する制御用人工知能を含む制御部を備え、前記判定装置は、前記制御用人工知能の出力の妥当性の判定に用いられる判定材料データを取得する取得部と、前記妥当性を前記判定材料データに基づいて判定する判定用人工知能を含む判定部とを備え、前記制御用人工知能は、前記対象を制御する制御能力を獲得する第1の機械学習の学習結果が設定されていて、前記判定用人工知能は、前記妥当性を判定する判定能力を獲得する第2の機械学習の学習結果が設定されていて、前記第2の機械学習は、前記第1の機械学習を実行中の、または前記第1の機械学習の学習結果を設定された人工知能の出力に関するデータに基づいて作成された学習用の判定材料データと、当該学習用の判定材料データに基づく前記妥当性の判定結果の正解値を示す教師データとの組み合わせを含む学習データを使用して行われ、前記学習用の判定材料データは、前記第1の機械学習を実行中の、または前記第1の機械学習の学習結果を設定された人工知能の出力に関するデータの中から前記判定能力の仕様に基づいて定められる。
この制御システムは、制御用人工知能の出力に関するデータである判定材料データに基づいて当該制御用人工知能の出力の妥当性を判定する。かかる判定を遂行する能力は、当該能力の仕様に基づいて定められる学習用の判定材料データと、当該判定材料データに対応する制御用人工知能の出力の妥当性の判定結果の正解値を示す教師データとを含む学習データに基づく第2の機械学習により獲得され、その学習結果が判定用人工知能に設定される。故に、この制御システムによれば、制御用人工知能の出力の妥当性を判定することができる。
第1の態様に係る制御システムにおいて、前記判定装置は、前記制御用人工知能の出力が妥当でないと判定された場合に警報を発する警報部をさらに具備してもよい。この制御システムは、制御用人工知能の出力が妥当でないと判定された場合に警報を出力できる。これにより、制御用人工知能の妥当でない出力データに基づいて対象が制御されるのを予防し、またはこれによる悪影響を早期に検知して対処することが可能となる。すなわち、かかる制御システムは、制御用人工知能を活用して対象を制御しながらも、高い安全性を確保することができる。
第1の態様に係る制御システムにおいて、前記判定装置は、前記制御用人工知能の出力が妥当でないと判定された場合に前記制御装置による前記対象への制御に介入する介入部をさらに具備してもよい。
この制御システムは、制御用人工知能の出力が妥当でないと判定された場合に制御に介入できる。これにより、制御用人工知能の妥当でない出力データに基づいて対象が制御されるのを予防し、またはこれによる悪影響を早期に検知して対処することが可能となる。すなわち、かかる制御システムは、制御用人工知能を活用して対象を制御しながらも、高い安全性を確保することができる。
本発明の第2の態様によれば、学習データ作成装置は、第1の機械学習の学習結果が設定された対象人工知能の出力の妥当性を判定する判定能力を獲得する第2の機械学習に使用される学習データを作成する学習データ作成装置であって、前記第1の機械学習を実行中の第1の人工知能または前記第1の機械学習の学習結果を設定された第2の人工知能の出力に関するデータを取得する取得部と、前記第2の機械学習の対象となる判定用人工知能への入力データとなる学習用の判定材料データと、前記入力データに対応する当該判定用人工知能の出力データの正解値を示す教師データとの組み合わせを含む学習データを、前記取得部によって取得されたデータと前記判定能力の仕様とに基づいて作成する作成部とを具備する。
この学習データ作成装置によれば、対象人工知能の出力の妥当性を判定する能力を獲得するための第2の機械学習に使用可能な学習データを作成することができる。そして、この能力によってどのような判定を行うかは、当該能力の仕様により定めることができる。
第2の態様に係る学習データ作成装置において、前記学習用の判定材料データは、(i)前記第1の人工知能または前記第2の人工知能の出力データと、(ii)前記第1の人工知能または前記第2の人工知能の出力データに基づいて制御された対象の動作または状態の観測結果を表す観測データと、(iii)前記第2の人工知能に出力データを生成させた入力データとのうちの少なくとも一部を含んでもよい。この学習データ作成装置(以降、本発明の第3の態様に係る学習データ作成装置と称する)によれば、上記(i)乃至(iii)のデータの少なくとも一部を学習用の判定材料データとして、学習データを作成できる。
第3の態様に係る学習データ作成装置において、前記作成部は、前記第1の人工知能の出力データに基づいて制御された対象の動作または状態の観測結果を表す観測データに基づいて前記学習用の判定材料データを作成し、前記第1の人工知能の出力が妥当でないことを示す教師データを作成してもよい。この学習データ作成装置によれば、対象人工知能の出力データに基づいて制御される対象の動作または状態から当該対象人工知能の出力の妥当性を判定する能力を獲得するための学習データを作成することができる。
第3の態様に係る学習データ作成装置において、前記作成部は、前記第1の人工知能の出力データに基づいて前記学習用の判定材料データを作成し、前記第1の人工知能の出力が妥当でないことを示す教師データを作成してもよい。
この学習データ作成装置によれば、対象人工知能の出力データが学習途上の出力データに基づいて定められる妥当でない出力データに該当するか否かにより当該対象人工知能の出力の妥当性を判定する能力を獲得するための学習データを作成することができる。
第3の態様に係る学習データ作成装置において、前記作成部は、前記第2の人工知能の出力データに基づいて前記学習用の判定材料データを作成し、前記第2の人工知能の出力が妥当であることを示す教師データを作成してもよい。
この学習データ作成装置によれば、対象人工知能の出力データが学習完了後の出力データに基づいて定められる妥当な出力データに該当するか否かにより当該対象人工知能の出力の妥当性を判定する能力を獲得するための学習データを作成することができる。
第3の態様に係る学習データ作成装置において、前記作成部は、前記第2の人工知能に誤った出力データを生成させた入力データに基づいて前記学習用の判定材料データを作成し、前記第2の人工知能の出力が妥当でないことを示す教師データを作成してもよい。
この学習データ作成装置によれば、対象人工知能の入力データが第2の人工知能が不得意とする入力データに該当するか否かにより当該対象人工知能の出力の妥当性を判定する能力を獲得するための学習データを作成することができる。
第3の態様に係る学習データ作成装置において、前記作成部は、前記第2の人工知能に正しい出力データを生成させた入力データに基づいて前記学習用の判定材料データを作成し、前記第2の人工知能の出力が妥当であることを示す教師データを作成してもよい。
この学習データ作成装置によれば、対象人工知能の入力データが第2の人工知能が得意とする入力データに該当するか否かにより当該対象人工知能の出力の妥当性を判定する能力を獲得するための学習データを作成することができる。
第2の態様または第3の態様に係る学習データ作成装置は、前記判定能力の仕様に基づいて、前記取得部によって取得されるデータと、前記作成部によって作成される学習データとを制御する制御部をさらに具備してもよい。この学習データ作成装置によれば、仕様を通じて設定可能な所望の判定能力を獲得するための学習データを作成することができる。
本発明の第4の態様によれば、学習装置は、第1の機械学習の学習結果が設定された対象人工知能の出力の妥当性を判定する判定能力を獲得する第2の機械学習に使用される学習データを取得する取得部と、前記学習データを使用して判定用人工知能に前記第2の機械学習を行う学習部とを具備し、前記学習データは、前記判定用人工知能への入力データとなる学習用の判定材料データと、前記入力データに対応する当該判定用人工知能の出力データの正解値を示す教師データとの組み合わせを含み、前記学習データは、前記第1の機械学習を実行中の第1の人工知能または前記第1の機械学習の学習結果を設定された第2の人工知能の出力に関するデータと、前記判定能力の仕様とに基づいて作成される。
この学習装置によれば、対象人工知能の出力の妥当性を判定する能力を獲得する第2の機械学習を行うことができる。そして、この能力によってどのような判定を行うかは、当該能力の仕様により定めることができる。
本発明の第5の態様によれば、判定装置は、第1の機械学習の学習結果が設定された対象人工知能の出力に関するデータを取得する取得部と、前記取得部によって取得されたデータに基づく入力データを受けて前記対象人工知能の出力の妥当性を判定する判定用人工知能を含む判定部とを具備し、前記判定用人工知能は、前記妥当性を判定する判定能力を獲得する第2の機械学習の学習結果が設定されていて、前記第2の機械学習は、前記第1の機械学習を実行中の第1の人工知能または前記第1の機械学習の学習結果を設定された第2の人工知能の出力に関するデータに基づいて作成された学習用の判定材料データと、当該学習用の判定材料データに基づく前記妥当性の判定結果の正解値を示す教師データとの組み合わせを含む学習データを使用して行われ、前記学習用の判定材料データは、前記第1の機械学習を実行中の、または前記第1の機械学習の学習結果を設定された人工知能の出力に関するデータの中から前記判定能力に基づいて定められる。この判定装置によれば、対象人工知能の出力の妥当性を判定することができる。そして、どのような判定を行うかは、仕様により定めることができる。
本発明の第5の態様に係る判定装置は、前記対象人工知能の出力が妥当でないと判定された場合に警報を発する警報部をさらに具備してもよい。この判定装置は、対象人工知能の出力が妥当でないと判定された場合に警報を出力できる。これにより、対象人工知能が妥当でない出力データを外部に供給するのを予防し、またはこれによる悪影響を早期に検知して対処することが可能となる。すなわち、かかる判定装置は、対象人工知能の出力データを活用しながらも、高い安全性を確保することができる。
本発明の第5の態様に係る判定装置において、前記対象人工知能は、対象を制御するための出力データを入力データに基づいて生成し、前記判定装置は、前記対象人工知能の出力が妥当でないと判定された場合に前記対象人工知能の出力に基づく前記対象への制御に介入する介入部をさらに具備してもよい。
この判定装置は、対象人工知能の出力が妥当でないと判定された場合に制御に介入できる。これにより、対象人工知能の妥当でない出力データに基づいて対象が制御されるのを予防し、またはこれによる悪影響を早期に検知して対処することが可能となる。すなわち、かかる判定装置は、対象人工知能を活用して対象を制御しながらも、高い安全性を確保することができる。
本発明によれば、人工知能の出力の妥当性を判定することができる。
実施形態に係る制御システムの適用例を示すブロック図。 図1の判定用AI(Artificial Intelligence)のための第2の機械学習を行う学習システムを例示するブロック図。 実施形態に係る第2の学習データ作成装置のハードウェア構成を例示するブロック図。 実施形態に係る第2の学習データ作成装置を例示するブロック図。 図4の学習データ作成装置の動作を例示するフローチャート。 図5の第1の作成処理を適用可能な機械学習システムを例示するブロック図。 図6の機械学習システムの動作を例示するフローチャート。 図5の第2の作成処理を適用可能な機械学習システムを例示するブロック図。 図8の機械学習システムの動作を例示するフローチャート。 図5の第3の作成処理を適用可能な機械学習システムを例示するブロック図。 図10の機械学習システムの動作を例示するフローチャート。 図4の第2の学習データ作成装置を含む機械学習システムを例示するブロック図。 変形例に係る第2の学習データ作成装置を例示するブロック図。 図6の第2の学習装置を例示するブロック図。 図6の第2の学習装置によって行われた機械学習の学習結果を利用する判定装置を例示するブロック図。
以下、本開示の一側面に係る実施の形態(以下、「本実施形態」とも表記する)を、図面に基づいて説明する。
なお、以降、説明済みの要素と同一または類似の要素には同一または類似の符号を付し、重複する説明については基本的に省略する。
§1 適用例
まず、図1を用いて、本実施形態の一適用例について説明する。図1は、本実施形態に係る制御システムの適用例を模式的に示す。この制御システムは、例えば、生産ラインに設置される生産装置などの制御に適用され得る。この制御システムは、例えば上記生産装置などの対象をAI(以降、単に制御用AIと称する)の出力に基づいて制御し、かつ、当該制御用AIの出力の妥当性を別のAI(以降、単に判定用AI)によって判定し、判定結果を表示したり、判定結果に基づいて警報の出力および/または制御への介入を行ったりする。ここで、制御への介入は、例えば、制御用AIによる制御の中止、対象の動作の停止、などを含み得る。
図1に例示されるように、適用例の制御システムは、制御装置1300と、対象1310と、判定装置1320とを含む。なお、図1は、制御用AIおよび判定用AIのいずれも機械学習が実行済み、すなわち両AIが学習段階でなく運用段階にあることを前提としているため、制御用AIおよび/または判定用AIの機械学習に必要な構成は省略されている。
制御装置1300は、制御用AI 1302の出力に基づいて、対象1310の動作または状態を制御する。制御装置1300は、制御部1301を含む。
制御部1301は、例えば、(ハードウェア)プロセッサおよびメモリであり得る。なお、ここで、プロセッサは、典型的にはCPU(Central Processing Unit)および/またはGPU(Graphics Processing Unit)であるが、これに限らず、マイコン、FPGA(Field Programmable Gate Array)、またはDSP(Digital Signal Processor)、などであり得る。
制御部1301は、制御用AI 1302を含む。制御部1301は、外部からデータを受け取り、そのまま、または変換などの加工を行ってから、制御用AI 1302に与える。そして、制御部1301は、入力データに対応する出力データを制御用AI 1302から受け取る。制御部1301は、制御用AI 1302の出力データをそのまま、または変換などの加工を行ってから、制御値として対象1310へ送る。
制御用AI 1302は、例えば、制御部1301としてのプロセッサおよびメモリに実装され得る。制御用AI 1302は、制御部1301から入力データを受け取り、対象1310の動作または状態を制御するための出力データを当該入力データに基づいて生成し、制御部1301に返す。制御用AI 1302には、対象1310または同種の対象を制御する制御能力を獲得する第1の機械学習の学習結果が設定されている。ここで、第1の機械学習の学習結果は、第1の機械学習によって得られた最終的なモデルパラメータを指す。モデルパラメータは、ユニット間のエッジの重みを表す重み行列、ユニットのバイアスを洗わすバイアスベクトル、などを含み得る。なお、制御用AI 1302は、実施形態において説明される第2の人工知能に相当する。制御用AI 1302は、例えばニューラルネットワークなどの統計モデルであり得る。また、第1の機械学習は、例えば強化学習であり得る。
対象1310は、制御装置1300によって直接的に制御される任意の装置、または当該装置の動作または状態によって影響を受けることで間接的に制御される任意の装置であり得る。具体的には、対象1310は、生産ラインに設置される生産装置(例えば、ロボット、セーフティ装置、など)、または車両(自動または半自動運転車両)、などであり得る。例えば、対象1310が車両である場合に、制御装置1300は、対象1310の操舵、加減速またはその他の動作または状態を制御し得る。
判定装置1320は、制御用AI 1302の出力に関するデータを判定材料データとして取得する。ここで、制御用AI 1302の出力に関するデータは、制御用AI 1302の出力データそのものに限られず、当該出力データに基づいて制御される対象1310の動作もしくは状態の観測結果を表す観測データ、および当該出力データの元となる入力データを含み得る。観測データは、例えば対象1310の動作もしくは状態を種々のセンサによって観測することで生成することができる。いかなるデータを判定材料データとして取得すべきかは、判定用AI 1341に要求される判定能力の仕様に基づいて定められる。後述される実施形態の説明では、要求される判定能力は3つのタイプに分類され、タイプ別に詳細が述べられる。
そして、判定装置1320は、この判定材料データをそのまま、または変換などの加工を行ってから判定用AI 1341に与え、制御用AI 1302の出力の妥当性を判定する。判定装置1320は、制御用AI 1302の出力の妥当性の判定結果を図示されない出力装置によって出力(例えば、表示、印刷、音声出力、など)してもよいし、判定結果に基づいて警報の出力または制御への介入を行ってもよい。判定装置1320は、取得部1330と、判定部1340と、警報部1350と、介入部1360とを含む。
取得部1330は、例えば、入力装置、通信インタフェースまたは外部インタフェースなどであり得る。取得部1330は、制御用AI 1302または同種のAIの出力の妥当性の判定に用いられる判定材料データを取得する。図1の例では、取得部1330は、制御装置1300の出力データおよび対象1310の観測データの両方を取得しているが、一方のみを取得してもよい。取得部1330は、判定材料データを判定部1340へ送る。
判定部1340は、例えば、プロセッサおよびメモリであり得る。判定部1340は、判定用AI 1341を含む。判定部1340は、取得部1330から判定材料データを受け取り、そのまま、または変換などの加工を行ってから、判定用AI 1341に与える。そして、判定部1340は、入力データ(判定材料データ)に対応する出力データを判定用AI 1341から受け取る。判定部1340は、判定用AI 1341の出力データをそのまま、または変換などの加工を行ってから、判定結果として図示されない出力装置、警報部1350、および/または介入部1360へ送る。
判定用AI 1341は、例えば、判定部1340としてのプロセッサおよびメモリに実装され得る。判定用AI 1341は、判定部1340から判定材料データを受け取り、制御用AI 1302の出力の妥当性を当該判定材料データに基づいて判定し、判定結果を判定部1340に返す。判定用AI 1341には、制御用AI 1302または同種の制御用AIの出力の妥当性を判定する判定能力を獲得する第2の機械学習の学習結果(第2の機械学習によって得られた最終的なモデルパラメータ)が設定されている。なお、判定用AI 1341は、実施形態において説明される第4の人工知能に相当する。判定用AI 1341は、例えばニューラルネットワークなどの統計モデルであり得る。第2の機械学習は、例えば教師付き学習であり得る。
警報部1350は、例えば、ブザー、スピーカなどの警報装置であってもよいし、外部の警報装置に接続するためのインタフェースであってもよい。判定部1340から判定結果を通知される。警報部1350は、制御用AI 1302の出力が妥当でないことを示す判定結果を通知された場合には、警報を発する。警報は、例えば、人間(対象の使用者、管理者など)に対して制御用AI 1302の出力が妥当でないことを画像、光、音などを用いて視覚的または聴覚的に報知することであってもよいし、制御装置1300または対象1310に対して制御用AI 1302の出力が妥当でないことを報知することであってもよい。具体的には、警報部1350は、メーターパネル上のアイコンを点灯させたり、制御用AI 1302の再学習を促したりしてもよい。警告を受けた人間、または、制御装置1300または対象1310は、対象1310の制御を停止もしくはリセットしたり、対象1310の動作または状態への制御を人間または別の制御装置(例えば、人手でコーディングされた制御プログラムを実行する制御装置)に委ねたり、制御用AI 1302の再学習を行ったりすることで、望ましくない結果を回避することができる。
介入部1360は、例えば、プロセッサおよびメモリであり得る。介入部1360は、判定部1340から判定結果を通知される。介入部1360は、制御用AI 1302の出力が妥当でないことを示す判定結果を通知された場合には、対象1310の動作または状態への制御に介入する。介入は、例えば、対象1310の動作または状態への制御を停止もしくはリセットすることであってもよいし、対象1310の動作または状態への制御を人間または別の制御装置(例えば、人手でコーディングされた制御プログラムを実行する制御装置)に委ねることであってもよい。或いは、介入部1360は、対象1310の動作を停止させてもよいし、対象1310に与えられる制御値が許容範囲内の値となるように制限したり、そのように補正したりしてもよい。
警報部1350は、判定装置1320から削除されてもよい。具体的に、警報部1350は、対象1310または他の装置に組み込まれてもよいし、制御システムにおいて全く存在しなくてもよい。同様に、介入部1360は、判定装置1320から削除されてもよい。具体的に、介入部1360は、対象1310または他の装置に組み込まれてもよいし、制御システムにおいて全く存在しなくてもよい。
前述の第2の機械学習は、図2に例示される学習システムによって行われ得る。図2の学習システムは、制御用AI 1400と、対象1410と、判定用人工知能生成装置1420とを含む。なお、図2の例では、制御用AI 1400に対する第1の機械学習に並行して第2の機械学習のための学習データを収集し、その都度、第2の機械学習を行っている。しかしながら、第1の機械学習の完了後、すなわち第2の機械学習のための学習データの収集が終了した後に第2の機械学習を行ってもよい。また、第2の機械学習のための学習データは、第1の機械学習を実行中の制御用AI 1400に限られず、かかる第1の機械学習の学習結果が設定されたAIの出力に関するデータに基づいて作成され得る。
制御用AI 1400は、例えば、プロセッサおよびメモリに実装され得る。制御用AI 1400は、入力データを受け取り、対象1410の動作または状態を制御するための出力データを当該入力データに基づいて生成する。制御用AI 1400は、第1の機械学習の途上にある。なお、制御用AI 1400は、実施形態において説明される第1の人工知能に相当する。前述の制御用AI 1302は、第1の機械学習の完了後の制御用AI 1400であってもよいし、第1の機械学習の学習結果が設定された別のAIであってもよい。制御用AI 1400に設定されるモデルパラメータは、第1の機械学習の進展に応じて図示されない学習装置によって更新され得る。制御用AI 1400は、例えばニューラルネットワークなどの統計モデルであり得る。
対象1410は、制御用AI 1400の出力データに基づいて直接的に制御される任意の装置、または当該装置の動作または状態によって影響を受けることで間接的に制御される任意の装置であり得る。ただし、対象1410は、前述の対象1310と同一である必要はなく、同種の装置、またはシミュレーションモデルであってもよい。
判定用人工知能生成装置1420は、第2の機械学習に用いられる学習データを作成し、第2の機械学習を行う。判定用人工知能生成装置1420は、取得部1431と、作成部1432と、制御部1433と、学習データ記憶部1440と、学習部1450と、判定用AI 1460と、学習結果記憶部1470とを含む。
取得部1431は、例えば、入力装置、通信インタフェースまたは外部インタフェースなどであり得る。取得部1431は、制御用AI 1400の出力データと、当該出力データに基づいて制御される対象1410の動作もしくは状態の観測結果を表す観測データと、当該出力データの元となる入力データとのうち、判定用AI 1460に要求される判定能力の仕様に基づいて制御部1433によって指定されたデータを、学習用の判定材料データとして取得する。取得部1431は、学習用の判定材料データを作成部1432へ送る。
作成部1432は、例えば、プロセッサおよびメモリであり得る。作成部1432は、取得部1431から学習用の判定材料データを受け取り、これに基づいて、判定用AI 1460に要求される判定能力を獲得するための学習データを作成する。学習データは、学習用の入力データ(例えば、第2の機械学習が実行される判定用AI 1460(これは、実施形態における第3の人工知能に相当する)としてのニューラルネットワークまたはその他の統計モデルの入力ノードに与えられる値)に相当する学習用の判定材料データと、当該学習用の判定材料データに基づく制御用AI 1400の出力の妥当性の判定結果の正解値を示す教師データとを含む。作成部1432が教師データとしていかなる値を設定するかは、制御部1433によって制御され得る。
制御部1433は、例えば、プロセッサおよびメモリであり得る。制御部1433は、判定用AI 1460に要求される判定能力の仕様を示す仕様データを受け取り、当該仕様データに基づいて取得部1431および作成部1432を制御する。具体的には、制御部1433は、取得部1431がどのようなデータを学習用の判定材料データとして取得すべきか、および作成部1432が当該判定材料データに基づいてどのような学習データを作成すべきか、を制御する。
ここで、仕様データは、判定用人工知能生成装置1420のユーザまたは管理者の入力に基づいて図示されない外部装置によって生成されてもよいし、または予め設定されていてもよい。後者の例として、対象1410の特性などに応じて仕様データが予め設定されていてもよく、制御部1433は学習開始指令を受けた後にかかる仕様データを自動的に取得してもよい。
制御部1433は、例えば、要求される判定能力を複数のタイプに分類し、予め用意されている学習データ作成プログラム群から当該判定能力の分類されるタイプにふさわしいプログラムを選択して実行することで、取得部1431および作成部1432を制御してもよい。実施形態を含む以降の説明では、要求される判定能力を3つのタイプに分類することとするが、判定能力は2つまたは4つ以上のタイプに分類されてもよい。
3つのタイプの詳細は、実施形態において説明されるが、第1のタイプの判定能力は、対象の動作または状態が第2の機械学習によって学習される要注意動作または要注意状態に該当するか否かを判定する能力を指す。第2のタイプの判定能力は、対象AIの出力データが第2の機械学習によって学習される妥当でない出力データおよび妥当である出力データのいずれかを判定する能力を指す。第3のタイプの判定能力は、対象AIの出力データが第2の機械学習によって学習される当該対象AIが不得意とする入力データから生成された妥当でない出力データであるか否かを判定する能力を指す。
具体的には、第1のタイプの判定能を獲得する第2の機械学習の学習結果が設定された判定用AIは、例えば、観測データの表す生産装置の動作または状態が当該生産装置について安全上定められた許容範囲を逸脱しているか否かを判定することが可能となる。かかる判定能力を獲得するために、制御部1433は、学習用の判定材料データとしての生産装置の動作または状態を表す観測データと、当該動作または状態が許容範囲内を逸脱しているか否かに応じた教師データとを含む学習データを作成するように作成部1432を制御し得る。
学習データ記憶部1440は、例えばメモリおよび/または補助記憶装置であり得る。学習データ記憶部1440は、作成部1432によって作成された学習データを格納する。学習データは、第2の機械学習の実行時に学習部1450によって必要に応じて読み出される。
学習部1450は、例えば、プロセッサおよびメモリであり得る。学習部1450は、学習データ記憶部1440から学習データを読み出す。学習部1450は、学習データに含まれる学習用の判定材料データに対応する制御用AI 1400の出力が妥当であるか否かを当該判定材料データに基づいて判定用AI 1460に判定させることを含む第2の機械学習を行う。具体的には、学習部1450は、判定用AI 1460に学習データに含まれる学習用の判定材料データを与え、出力データ(判定結果)を得る。学習部1450は、この出力データが学習データに含まれる教師データに近づくように判定用AI 1460に対する第2の機械学習(モデルパラメータの更新)を行う。そして、学習部1450は、第2の機械学習の実行後に得られた最終的なモデルパラメータを第2の機械学習の学習結果として学習結果記憶部1470に保存する。
判定用AI 1460は、例えば、プロセッサおよびメモリに実装され得る。判定用AI 1460は、学習部1450から学習用の判定材料データを受け取り、制御用AI 1400の出力の妥当性を当該判定材料データに基づいて判定し、判定結果を学習部1450に返す。判定用AI 1460に設定されるモデルパラメータは、判定用AI 1460によって更新され得る。判定用AI 1460は、実施形態において説明される第3の人工知能に相当する。判定用AI 1460は、例えばニューラルネットワークなどの統計モデルであり得る。
学習結果記憶部1470は、例えばメモリおよび/または補助記憶装置であり得る。学習結果記憶部1470は、学習部1450により第2の機械学習の学習結果が書き込まれる。学習結果は、図1の判定用AI 1341または他のAIに第2の機械学習によって獲得された判定能力を付与するために、必要に応じて読み出される。かかる学習結果が設定された人工知能が実施形態における第4の人工知能に相当する。
以上説明したように、適用例に係る制御システムは、制御用AIの出力に関するデータである判定材料データに基づいて当該制御用AIの出力の妥当性を判定する。かかる判定を遂行する能力は、当該能力の仕様に基づいて定められる学習用の判定材料データと、当該判定材料データに対応する制御用AIの出力の妥当性の判定結果の正解値を示す教師データとを含む学習データに基づく機械学習により獲得され、その学習結果が判定用AIに設定される。故に、この制御システムによれば、制御用AIの出力の妥当性を判定することができる。さらに、この制御システムは、制御用AIの出力が妥当でないと判定された場合に警報を出力し、および/または制御に介入し得る。これにより、制御用AIの妥当でない出力データに基づいて対象が制御されるのを予防し、またはこれによる悪影響を早期に検知して対処することが可能となる。すなわち、かかる制御システムは、制御用AIを活用して対象を制御しながらも、高い安全性を確保することができる。
§2 構成例
本実施形態の構成例は、第1の人工知能に対する第1の機械学習の学習結果が設定された第2の人工知能の出力の妥当性を判定するための第2の機械学習に用いられる学習データ(便宜的に第2の学習データと称する)を作成する第2の学習データ作成装置に関する。なお、第1の人工知能は、まったく機械学習を行っていない場合もあるし、第1の機械学習とは異なる学習を事前に行っている場合もある。第1の機械学習とは異なる学習を事前に行っている場合は、第1の機械学習は、第1の人工知能に対する、いわゆる強化学習であり得る。そして、第2の人工知能は、第1の機械学習(追加的かそうでないかは場合によって異なるが)の学習済み人工知能である。ここで、第2の人工知能は、第1の機械学習の学習結果が設定された第1の人工知能とは別の人工知能であってもよいし、第1の機械学習の完了後の第1の人工知能であってもよい。本実施形態に係る第2の学習データ作成装置は、判定能力学習データ作成装置に読み替えられてもよい。
本実施形態に係る第2の学習データ作成装置は、第2の機械学習により獲得することが要求される判定能力、すなわち、第2の人工知能の出力の妥当性を判定する能力の仕様を示す仕様データを受け取る。この第2の学習データ作成装置は、この仕様に基づいて第2の学習データを作成する。
[ハードウェア構成]
次に、図3を用いて、本実施形態に係る第2の学習データ作成装置のハードウェア構成の一例について説明する。図3は、本実施形態に係る第2の学習データ作成装置のハードウェア構成の一例を模式的に例示する。
図3に例示するように、本実施形態に係る第2の学習データ作成装置は、制御部1501と、記憶部1502と、通信インタフェース1503と、入力装置1504と、出力装置1505と、外部インタフェース1506と、ドライブ1507とが電気的に接続されたコンピュータであってよい。なお、図3では、通信インタフェース及び外部インタフェースをそれぞれ、「通信I/F」及び「外部I/F」と記載している。
制御部1501は、CPU(および/または他のプロセッサ)と、RAM(Random Access Memory)、ROM(Read Only Memory)などとを含む。CPUは、記憶部1502に格納されたプログラムをRAMに展開する。そして、CPUがこのプログラムを解釈および実行することで、制御部1501は、様々な情報処理、例えば、機能構成の項目において説明される構成要素の処理または制御を実行可能となる。
記憶部1502は、いわゆる補助記憶装置であり、例えば、内蔵または外付けの、ハードディスクドライブ(HDD:Hard Disk Drive)、ソリッドステートドライブ(SSD:Solid State Drive)、もしくはフラッシュメモリなどの半導体メモリであり得る。記憶部1502は、制御部1501で実行されるプログラム(例えば、学習データ作成処理を制御部1501に実行させるためのプログラム)、制御部1501によって使用されるデータなどを記憶する。
通信インタフェース1503は、例えば、WLAN(Wireless Local Area Network)、移動通信(4Gなど)、BLE(Bluetooth(登録商標) Low Energy)、などのための各種無線通信モジュールであって、ネットワークを介して無線通信を行うためのインタフェースであってよい。また、通信インタフェース1503は、無線通信モジュールに加えて、または、無線通信モジュールに代えて、有線LANモジュールなどの有線通信モジュールをさらに備えていてもよい。
入力装置1504は、例えばタッチスクリーン、キーボード、マウス、マイクロホンなどのユーザ入力を受け付けるための装置を含んでもよい。また、入力装置1504は、所定の物理量を測定し、センシングデータを生成および入力するセンサ、撮像を行って画像データを生成するカメラなどを含んでもよい。出力装置1505は、例えば、ディスプレイ、スピーカなどの出力を行うための装置である。
外部インタフェース1506は、USB(Universal Serial Bus)ポート、メモリカードスロットなどであり、外部装置と接続するためのインタフェースである。
なお、通信インタフェース1503、入力装置1504、出力装置1505、および/またはドライブ1507などの一部または全部が、第2の学習データ作成装置とは別体の外部装置であってもよい。
ドライブ1507は、例えば、CD(Compact Disc)ドライブ、DVD(Digital Versatile Disc)ドライブ、BD(Blu−ray(登録商標) Disc)ドライブなどである。ドライブ1507は、記憶媒体1508に記憶されたプログラムおよび/またはデータを読み込み、制御部1501に渡す。なお、前述の記憶部1502に記憶され得ると説明したプログラムおよびデータの一部または全部がドライブ1507によって、記憶媒体1508から読み込まれてもよい。
記憶媒体1508は、コンピュータを含む機械が読み取り可能な形式で、プログラムおよび/またはデータを、電気的、磁気的、光学的、機械的または化学的作用によって蓄積する媒体である。記憶媒体1508は、例えば、CD、DVD、BDなどの着脱可能なディスク媒体であるが、これに限られず、フラッシュメモリまたはその他の半導体メモリであり得る。
なお、第2の学習データ作成装置の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部1501は、複数のプロセッサを含んでもよい。第2の学習データ作成装置は、その実行する情報処理専用に設計された情報処理装置であってもよいし、汎用の情報処理装置、例えば、スマートフォン、タブレットPC(Personal Computer)、ラップトップPC、デスクトップPCなどであってもよい。また、第2の学習データ作成装置は、複数台の情報処理装置などで構成されてもよい。以降の説明において、第2の学習データ作成装置以外の種々の装置も、第2の学習データ作成装置と同一または類似のハードウェア構成を採り得る。
[機能構成]
次に、図4を用いて、本実施形態に係る第2の学習データ作成装置の機能構成の一例を説明する。図4は、第2の学習データ作成装置100の機能構成の一例を模式的に示す。
図4に例示されるように、第2の学習データ作成装置100は、取得部101と、作成部102と、制御部103とを含む。
取得部101は、例えば、入力装置、通信インタフェースまたは外部インタフェースなどであり得る。取得部101は、第1の人工知能の出力に関するデータおよび第2の人工知能の出力に関するデータの中から、要求される判定能力の仕様に基づいて制御部103によって指定されたデータを、学習用の判定材料データとして取得する。取得部101は、学習用の判定材料データを作成部102へ送る。
ここで、出力に関するデータは、第1の人工知能および/または第2の人工知能の出力データと、当該出力データに基づいて制御される対象の動作または状態の観測結果を表す観測データと、当該出力データの元となる入力データとを含み得る。
ここで、対象とは、直接的な制御対象に限られず、当該直接的な制御対象の動作または状態によって影響を受ける間接的な制御対象を含み得る。例えば、対象は、ピックアンドプレース装置(またはロボットハンド)と、当該ピックアンドプレース装置によってつかまれるワークとを含み得る。また、動作または状態とは、動作および状態の一方または両方を含み得る。動作および状態は、明確に区別されなくてよい。
第2の人工知能によって制御される対象は、産業用、手術用、エンターテイメント用若しくはその他のロボット、化学プラント、自動車若しくはその他の機械用のエンジン、ネブライザなどの治療器、ビルの空調システム、などの制御可能な種々の装置であり得る。また、第1の人工知能によって制御される対象は、第2の人工知能によって制御される対象と同一または同種の実機であってもよいし、当該対象のシミュレーションモデルであってもよい。
観測データは、例えば、ピックアンドプレース装置の動きの軌跡、モータの動き、燃焼若しくは他の化学反応の状態(例えば、対象またはその周囲の温度、湿度など)、消費電力などの観測に基づいて得られてよい。
対象の動作または状態の観測には、例えばイメージセンサ(カメラ)、マイクロホン、回転数センサ、加速度センサ、角速度センサ、温度センサ、湿度センサ、振動センサ、騒音センサ、動作時間センサ、消費電力センサなどの種々のセンサを用いることができる。取得部101は、かかるセンサなどの観測装置から直接的に観測データを学習用の判定材料データとして取得してもよいし、かかる観測装置によって図示されないストレージに格納された観測データを学習用の判定材料データとして取得してもよい。
作成部102は、例えば、プロセッサおよびメモリであり得る。作成部102は、取得部101から学習用の判定材料データを受け取り、これに基づいて、第2の人工知能の出力の妥当性を判定する能力を獲得するための第2の学習データを作成する。第2の学習データは、学習用の入力データ(例えば、第2の機械学習が実行される人工知能(以降、第3の人工知能と称する)としてのニューラルネットワークまたはその他の統計モデルの入力ノードに与えられる値)に相当する学習用の判定材料データと、当該学習用の判定材料データに基づく第1の人工知能および/または第2の人工知能の出力の妥当性の判定結果の正解値を示す教師データとを含む。作成部102が教師データとしていかなる値を設定するかは、制御部103によって制御され得る。
用語の整理のために、以降の説明において基本的には、「入力データ」は、第1の機械学習に関わる第1の人工知能または第2の人工知能に与えられる入力データを指すこととする。他方、第2の機械学習に関わる人工知能(第3の人工知能または後述される第4の人工知能)に与えられる入力データは、「判定材料データ」と呼ぶこととする。
制御部103は、例えば、プロセッサおよびメモリであり得る。制御部103は、第3の人工知能に要求される判定能力の仕様を示す仕様データを受け取り、当該仕様データに基づいて取得部101および作成部102を制御する。具体的には、制御部103は、取得部101がどのようなデータを学習用の判定材料データとして取得すべきか、ならびに、作成部102が当該判定材料データに基づいてどのような第2の学習データを作成すべきか、を制御する。
ここで、仕様データは、第2の学習データ作成装置100のユーザまたは管理者の入力に基づいて図示されない外部装置によって生成されてもよいし、または予め設定されていてもよい。後者の例として、第1の人工知能および/または第2の人工知能の出力データに基づいて制御される対象の特性などに応じて仕様データが予め設定されていてもよく、制御部103は学習開始指令を受けた後にかかる仕様データを自動的に取得してもよい。
制御部103は、例えば、要求される判定能力を複数のタイプに分類し、予め用意されている学習データ作成プログラム群から当該判定能力の分類されるタイプにふさわしいプログラムを選択して実行することで、取得部101および作成部102を制御してもよい。
第1のタイプの判定能力は、出力の妥当性が判定される対象人工知能(これは、第1の機械学習を完了済みであるから、第2の人工知能に相当する)によって制御される対象の動作または状態から当該第2の人工知能の出力の妥当性を判定する能力、より具体的には、対象人工知能によって制御される対象の動作または状態が第2の機械学習によって学習される要注意動作または要注意状態に該当するか否かを判定する能力を指す。
対象の動作または制御する能力を獲得するための第1の機械学習は、例えば強化学習であり得る。学習の実行中(特に初期段階)に、対象は、でたらめに決定された制御値を与えられ、危険な動作(例えば、ピックアンドプレース装置が可動範囲ぎりぎりまで動く)を含めて様々な動作を行ったり、危険な状態を含めて様々な状態に陥ったりする。
第1の人工知能は、次第に、望ましくない結果(低報酬)をもたらすような動作または状態を避け、望ましい結果(高報酬)をもたらすような動作または状態を指向するように学習していく。例えば、ピックアンドプレース装置が対象である場合には、この対象に、ワークを把持し、ワークを持ち上げ、ワークを所定位置まで移動し、ワークを設置する、という一連の動作を行わせるために、どのように対象を制御すればよいのかを第1の人工知能は試行錯誤しながら学習する。
故に、第1の機械学習が実行される期間(特に初期段階)における学習用の対象の動作または状態を観測すれば、望ましくない結果をもたらすような対象の要注意動作または要注意状態を把握することができる。
観測対象となる動作または状態は、望ましくない結果をもたらすおそれがあるか否かの判定に用いることができるか否かによって定められてよい。例えば、予め定められた耐用温度、耐用電流若しくは耐用電圧を超えた範囲で対象が稼働することになるおそれがあるか否かを判定する場合には、対象またはその周囲の温度、対象に印加される電流若しくは電圧などを観測すればよい。
なお、観測対象となる動作または状態は、人間(第2の機械学習の学習結果を利用する判定装置の設計者または運用者)が学習依頼を通じて予め指定しておいてもよいし、仕様データの一部として予め定められていてもよい。これらの場合には、不必要なデータを観測する手間を省くことができる。或いは、第1の機械学習が実行される期間には可能な限り多種多様な動作または状態を観測し、事後的に人間またはソフトウェア(人工知能を含む)が要注意動作および要注意状態を定めるために用いる動作または状態を指定してもよい。この場合には、要注意動作および要注意状態の取りこぼしを減らすことができる。
第2のタイプの判定能力は、対象の動作または状態を制御する対象人工知能の出力データそのものから当該第2の人工知能の出力の妥当性を判定する能力、より具体的には、この出力データが第2の機械学習によって学習される妥当でない出力データおよび妥当である出力データのいずれかを判定する能力を指す。前述のように、かかる対象の動作または状態を制御する能力(制御能力)を獲得するための第1の機械学習は、例えば強化学習であり得る。そして、第1の機械学習の実行中(特に初期段階)における第1の人工知能の出力データは、でたらめに決定されるので、妥当でない可能性が高い。
従って、妥当でない出力データは、例えば、第1の機械学習の途上に見られた出力データ(学習途上において得られた出力データ)を用いて学習することができる。また、妥当である出力データは、第1の機械学習の完了後に見られた出力データ(学習完了後に得られた出力データ)を用いて学習することができる。さらに、対象人工知能の出力データは、学習途上において得られた出力データおよび学習完了後に得られた出力データのどちらとも異なる、未知の出力データであるかもしれない。このような場合には、対象人工知能の出力データは、学習途上において得られた出力データおよび学習完了後に得られた出力データのいずれの分類にも適さないかもしれない。かかる出力データの扱いは任意であり、例えば、妥当性不明と判定されてもよいし、妥当であることが保証できないことから妥当でないと判定されてもよい。
第3のタイプの判定能力は、対象人工知能の出力データの元となる入力データから当該対象人工知能の出力の妥当性を判定する能力、より具体的には、この出力データが第2の機械学習によって学習される対象人工知能が不得意とする入力データから生成された妥当でない出力データであるか否かを判定する能力を指す。対象人工知能が不得意とする入力データは、対象人工知能が誤った出力データを生成する可能性の高い入力データを指す。すなわち、かかる入力データに対して対象人工知能が生成する出力データは妥当でない可能性が高い。
対象人工知能が不得意な入力データ(すなわち、第2の機械学習における学習用の判定材料データ)は、例えば、第2の人工知能に正解ラベルが既知である入力データを与えて出力データを生成させ、正解ラベルに一致しない出力データの元となった入力データを抽出することで収集可能である。
なお、第1の機械学習において用いられた入力データに対して、対象人工知能は正しい出力データを生成するであろう。故に、かかる入力データは、対象人工知能が不得意な入力データを収集するために第2の人工知能に与えられる入力データから除外されてよい。
<その他>
第2の学習データ作成装置100の各機能に関しては後述する動作例で詳細に説明する。なお、本実施形態では、第2の学習データ作成装置100の各機能がいずれも汎用のCPUによって実現される例について説明している。しかしながら、以上の機能の一部又は全部が、1または複数の専用のプロセッサにより実現されてもよい。また、第2の学習データ作成装置100の機能構成に関して、実施形態に応じて、適宜、機能の省略、置換及び追加が行われてもよい。
§3 動作例
次に、図5乃至図12、図14および図15を用いて、第2の学習データ作成装置100の動作例と、当該第2の学習データ作成装置100による第2の学習データの作成時に動作する周辺装置とを説明する。なお、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
図5は、第2の学習データ作成装置100の動作の一例を示すフローチャートである。制御部103は、仕様データを受け付け(ステップS201)て、当該仕様データによって要求される判定能力が第1のタイプであるか、第2のタイプであるか、第3のタイプであるかを判定する(ステップS202)。
要求される判定能力が第1のタイプである場合には、制御部103は取得部101および作成部102に第1の作成処理を実行させる(ステップS203)。要求される判定能力が第2のタイプである場合には、制御部103は取得部101および作成部102に第2の作成処理を実行させる(ステップS204)。要求される判定能力が第3のタイプである場合には、制御部103は取得部101および作成部102に第3の作成処理を実行させる。
第1の作成処理は、図6に例示される機械学習システムに適用可能である。図6の機械学習システムは、第2の学習データ作成装置100と、第1の学習データ作成装置200と、第1の学習データ記憶装置210と、第1の学習装置220と、対象230と、観測装置240と、観測データ記憶装置250と、第2の学習データ記憶装置260と、第2の学習装置270と、学習依頼装置280とを含む。
第1の学習データ作成装置200は、第1の人工知能に与えられる入力データに相当する第1の学習データを作成し、第1の学習データ記憶装置210に格納する。入力データは、例えば、画像、温度などの対象230の動作または状態を制御するために参照され得る情報を表す。
第1の学習データ記憶装置210は、第1の学習データを格納する。第1の学習データは、第1の学習データ作成装置200によって作成され、第1の学習装置220によって必要に応じて読み出される。なお、第1の学習データ記憶装置210は、第1の学習到達度を評価するためのテストデータをさらに格納してもよい。
第1の学習装置220は、第1の人工知能に(学習用の)対象230の動作または状態を制御させることを含む第1の機械学習を行う。具体的には、第1の学習装置220は、第1の学習データ記憶装置210から第1の学習データを読み出し、これを入力データとして第1の人工知能に与え、出力データ(対象230に与えられる制御値)を得る。出力データは、例えば、油圧シリンダ、モータ、ソノレイドなどのアクチュエータに与えられる制御値であってもよいし、対象230としてのエンジンへの燃料噴射コマンド、クランク軸の回転数を上げる若しくは下げるコマンドなどであってもよい。第1の人工知能は、この出力データによって制御された対象230が望ましい結果をもたらせば高い報酬を獲得し、望ましくない結果をもたらせば低い報酬を獲得する。対象230がもたらす結果は、例えば観測装置240による観測に基づいて評価することができる。望ましい結果は、第1の機械学習によって獲得することが望まれる能力などに基づいて定められ、例えば、燃費の向上、環境負荷の低減、消費電力の削減などであり得る。かかる情報は、例えば、仕様データに基づいて決定され得る。第1の学習装置220は、この報酬を最大化するように第1の人工知能の機械学習(モデルパラメータの更新)を行う。
第1の学習装置220は、第1の人工知能の学習到達度をテストデータを用いて評価し、学習目標に到達したならば、学習結果(モデルパラメータ)を第2の人工知能に設定する。ここで、第1の人工知能および第2の人工知能、ならびに後述される第3の人工知能および第4の人工知能は、例えば(深層)ニューラルネットワークまたはその他の統計モデルであってよい。第2の人工知能は、第1の機械学習(例えばディープラーニング)を通じて得られたモデルパラメータを設定される。
なお、第1の学習装置220および第2の人工知能は、同一の装置(例えば、対象としてのエンジンの動作または状態を制御するECU(Engine Control Unit)などの制御装置)に組み込まれていてもよい。
対象230は、第1の人工知能から制御値を受け取り、これに応答する。例えば、対象230は、燃料を噴射したり、クランク軸の回転数を変更したり、空調の設定温度を変更したりする。対象230の動作または状態は、観測装置240によって観測される。
観測装置240は、例えば、イメージセンサ(カメラ)、マイクロホン、回転数センサ、加速度センサ、角速度センサ、温度センサ、湿度センサ、振動センサ、騒音センサ、動作時間センサ、消費電力センサなどの種々のセンサを含むことができる。観測装置240は、対象230の動作または状態を観測し、観測データを生成する。観測装置240は、観測データを観測データ記憶装置250に格納する。
具体的には、観測装置240は、第1の学習装置220によって機械学習が実行される期間における対象230の動作または状態を観測し、第1の観測データを生成する。観測装置240は、第1の観測データを観測データ記憶装置250に格納する。第1の観測データは、第1の学習装置220によって機械学習が実行される期間のうち第1の人工知能の学習到達度が閾値以下である期間における対象230の動作または状態の観測結果を表すものであってもよい。一般に、人工知能の学習到達度が高くなるほど(機械学習の完了が近づくほど)、望ましくない結果が生じる可能性は低下する。故に、機械学習の初期段階に限って第1の観測データを収集したとしても要注意動作および要注意状態を正確に学習できるかもしれない。
また、初期段階のうち学習到達度が極めて低い最初期段階では、対象230はその運用時にはあり得ないような動作を行ったり状態に陥ったりするおそれがあり、かかる動作または状態を無視したとしても要注意動作および要注意状態を正確に学習できるかもしれない。すなわち、第1の観測データは、第1の学習装置220によって機械学習が実行される期間のうち第1の人工知能の学習到達度が第1の閾値以上であって第2の閾値以下である期間における対象230の動作または状態の観測結果を表すものであってもよい。
観測データ記憶装置250は、第1の観測データを格納する。第1の観測データは、観測装置240によって生成され、第2の学習データ作成装置100によって必要に応じて読み出される。
第2の学習データ作成装置100は、例えば学習依頼装置280から仕様データを含む学習依頼を受け取り、当該学習依頼に基づいて必要なデータを取得し、第2の学習データを作成する。そして、第2の学習データ作成装置100は、第2の学習データを第2の学習データ記憶装置260に格納する。
図6の例では、第2の学習データ作成装置100は、観測データ記憶装置250から第1の観測データを読み出し、これに基づいて第2の学習データを作成する(第1の作成処理)。
第2の学習データは、例えば、第1の観測データ(学習用の判定材料データ)と、当該判定材料データの表す動作または状態が要注意動作または要注意状態に該当する(すなわち、人工知能の出力が妥当でない)ことを示す値(教師データ)との組であってもよい。
或いは、第2の学習データ作成装置100は、第2の人工知能に何らかの入力データを与えて出力データを生成させてもよい。そして、第2の学習データ作成装置100は、かかる出力データによって制御されている対象(対象230またはこれと同種の実機若しくはシミュレーションモデル)の動作または状態の観測結果を表す第2の観測データに基づいて、より洗練された第2の学習データを作成してもよい。
具体的には、第2の学習データは、第1の観測データの一部または全部である第3の観測データ(学習用の判定材料データ)と、当該第3の観測データの表す動作または状態が要注意動作または要注意状態に該当することを示す値(教師データ)との組であってもよい。ここで、第3の観測データとは、第1の観測データのうち第2の観測データに一致しないものを指す。一般に、第2の観測データの表す動作または状態は、第2の人工知能の出力データに基づいて制御される対象の動作または状態であるから、高い確率で適切であると推測できるので、学習用の判定材料データから除外されてよい。
さらに、第2の観測データに基づいて以下のような第2の学習データが作成されてもよい。かかる第2の学習データは、例えば、第2の観測データ(学習用の判定材料データ)と、当該第2の観測データの表す動作または状態が要注意動作または要注意状態に該当しない(すなわち、人工知能の出力が妥当である)ことを示す値(教師データ)との組である。
第2の学習データ記憶装置260は、第2の学習データを格納する。第2の学習データは、第2の学習データ作成装置100によって作成され、第2の学習装置270によって必要に応じて読み出される。なお、第2の学習データ記憶装置260は、第2の学習到達度を評価するためのテストデータをさらに格納してもよい。
第2の学習装置270は、第2の学習データを用いて、学習用の判定材料データに基づいて当該判定材料データをもたらした人工知能の出力が妥当であるか否かを第3の人工知能に判定させることを含む第2の機械学習を行う。具体的には、第2の学習装置270は、第3の人工知能に学習データに含まれる学習用の判定材料データを与え、出力データ(判定結果)を得る。第2の学習装置270は、この出力データが学習データに含まれる教師データに近づくようにこの第3の人工知能に対する第2の機械学習(モデルパラメータの更新)を行う。
第2の学習装置270は、学習用の第3の人工知能の学習到達度をテストデータを用いて評価し、学習目標に到達したならば、学習結果(モデルパラメータ)を第4の人工知能に設定する。すなわち、第4の人工知能は、第2の機械学習の学習済み人工知能であって、第2の機械学習の学習結果が設定された第3の人工知能とは別の人工知能であってもよいし、第2の機械学習の完了後の第3の人工知能であってもよい。第4の人工知能は、第2の人工知能の出力が妥当であるか否かを判定する判定装置によって利用される。なお、第2の学習装置270は、判定装置に組み込まれていてもよい。
第2の学習装置270は、図14に例示されるように、取得部271と、学習部272とを含み得る。第2の学習装置270のハードウェア構成は、図3を用いて説明した第2の学習データ作成装置のハードウェア構成と同一または類似であり得る。
取得部271は、例えば、入力装置、通信インタフェースまたは外部インタフェースであり得る。取得部271は、第2の学習データ記憶装置260に格納されている第2の学習データを読み出す。取得部271は、第2の学習データを学習部272へと送る。
学習部272は、例えば、プロセッサおよびメモリであり得る。学習部272は、取得部271から第2の学習データを受け取り、これを用いて第3の人工知能に対する第2の機械学習を行う。
第2の人工知能の出力が妥当であるか否かを判定する判定装置は、図15に例示される判定装置1200であり得る。この判定装置1200は、取得部1201と、判定部1202とを含む。判定装置1200のハードウェア構成は、図3を用いて説明した第2の学習データ作成装置のハードウェア構成と同一または類似であり得る。
取得部1201は、例えば、入力装置、通信インタフェースまたは外部インタフェースであり得る。取得部1201は、第2の機械学習の完了後、すなわち要求される判定能力が第4の人工知能に付与された後に、対象人工知能の出力に関するデータを判定材料データとして取得する。取得部1201は、判定材料データを判定部1202へと送る。
判定部1202は、例えば、プロセッサおよびメモリであり得る。判定部1202は、第4の人工知能を含む。判定部1202は、取得部1201から判定材料データを受け取り、そのまま、または変換などの加工を行ってから、第4の人工知能に与える。そして、判定部1202は、入力データ(判定材料データ)に対応する出力データを第4の人工知能から受け取る。判定部1202は、第4の人工知能の出力データをそのまま、またはこれに変換などの加工を施したデータを、対象人工知能の出力の妥当性の判定結果として得る。
判定装置1200は、対象人工知能の出力に関するデータが妥当でない場合に、警報を発したり、対象230の動作または状態への制御に介入したりしてもよい。具体的には、判定装置1200は、取得部1201および判定部1202の他に、図1を用いて説明した警報部1350および/または介入部1360を含んでもよい。
学習依頼装置280は、例えば図6に示されていない利用者端末から学習依頼を受け付けて第2の学習データ作成装置100および第2の学習装置270に送る。学習依頼は、例えば、第2の機械学習の学習開始指令および第2の機械学習によって獲得することが望まれる判定能力を定める仕様データを含む。学習依頼は、さらに、第1の機械学習の学習開始指令および第1の機械学習によって獲得することが望まれる能力を定める仕様データを含んでいてもよい。
図6の機械学習システムは、図7に例示されるように動作する。
第1の学習データ作成装置200は、第1の人工知能に与えられる入力データに相当する第1の学習データを作成する(ステップS401)。第1の学習装置220は、ステップS401において作成された第1の学習データを用いて、第1の人工知能に対象230の動作または状態を制御させることを含む第1の機械学習を行う(ステップS402)。
第2の学習データ作成装置100は、ステップS402の実行中に得られた第1の観測データを取得し、これに基づいて第2の学習データを作成する(ステップS403)。なお、第2の学習データ作成装置100は、ステップS402の後にその学習結果が設定された第2の人工知能に何らかの入力データを与えて出力データを生成させてもよい。そして、第2の学習データ作成装置100は、かかる出力データによって制御される対象の動作または状態の観測結果を表す第2の観測データを取得し、これに基づいて第2の学習データを作成してもよい。
第2の学習装置270は、ステップS403において作成された第2の学習データを用いて、学習用の判定材料データが要注意動作または要注意状態を表すか否かを第3の人工知能に判定させることを含む第2の機械学習を行う(ステップS404)。
第2の作成処理は、図8に例示される機械学習システムに適用可能である。図8の機械学習システムは、第2の学習データ作成装置100と、第1の学習データ作成装置500と、第1の学習データ記憶装置510と、第1の学習装置520と、対象530と、観測装置540と、出力データ記憶装置550と、第2の学習データ記憶装置260と、第2の学習装置270と、学習依頼装置280とを含む。
なお、第1の学習データ作成装置500、第1の学習データ記憶装置510、第1の学習装置520、対象530および観測装置540は、図6の第1の学習データ作成装置200、第1の学習データ記憶装置210、第1の学習装置220、対象230および観測装置240と同一または類似であり得る。
出力データ記憶装置550は、第1の機械学習が実行される期間における第1の人工知能の出力データを格納する。第1の人工知能の出力データは、第2の学習データ作成装置100によって必要に応じて読み出される。
第2の学習データ作成装置100は、例えば学習依頼装置280から仕様データを含む学習依頼を受け取り、当該学習依頼に基づいて必要なデータを取得し、第2の学習データを作成する。そして、第2の学習データ作成装置100は、第2の学習データを第2の学習データ記憶装置260に格納する。
図8の例では、第2の学習データ作成装置100は、出力データ記憶装置550から第1の機械学習が実行される期間における第1の人工知能の出力データを読み出し、これに基づいて第2の学習データを作成する(第2の作成処理)。
第2の学習データは、例えば、第1の機械学習が実行される期間における第1の人工知能の出力データ(学習用の判定材料データ)と、当該出力データが学習途上において得られた出力データであること(すなわち、人工知能の出力が妥当でない)ことを示す値(教師データ)との組であってもよい。
また、第2の学習データ作成装置100は、第2の人工知能に何らかの入力データを与えて出力データを生成させてもよい。そして、第2の学習データ作成装置100は、第2の人工知能の出力データを取得し、これに基づいて第2の学習データを作成してもよい。
具体的には、第2の学習データは、第2の人工知能の出力データ(学習用の判定材料データ)と、当該出力データが学習完了後に得られた出力データに該当すること(すなわち、人工知能の出力が妥当である)ことを示す値(教師データ)との組であってもよい。
図8の機械学習システムは、図9に例示されるように動作する。
第1の学習データ作成装置500は、第1の人工知能に与えられる入力データに相当する第1の学習データを作成する(ステップS601)。第1の学習装置520は、ステップS601において作成された第1の学習データを用いて、第1の人工知能に対象530の動作または状態を制御させることを含む第1の機械学習を行う(ステップS602)。
第2の学習データ作成装置100は、ステップS602の実行中に得られた第1の人工知能の出力データを取得し、これに基づいて第2の学習データを作成する(ステップS603)。なお、第2の学習データ作成装置100は、ステップS602の完了後にその学習結果が設定された第2の人工知能に何らかの入力データを与えて出力データを生成させてもよい。そして、第2の学習データ作成装置100は、かかる出力データを学習用の判定材料データとして取得し、これに基づいて第2の学習データを作成してもよい。
第2の学習装置270は、ステップS603において作成された第2の学習データを用いて、学習用の判定材料データが学習途上において得られた出力データまたは学習完了後に得られた出力データを表すか否かを第3の人工知能に判定させることを含む第2の機械学習を行う(ステップS604)。
第3の作成処理は、図10に例示される機械学習システムに適用可能である。図10の機械学習システムは、第2の学習データ作成装置100と、第1の学習データ作成装置700と、第1の学習データ記憶装置710と、第1の学習装置720と、出力データ記憶装置750と、第2の学習データ記憶装置260と、第2の学習装置270と、学習依頼装置280とを含む。
第1の学習データ作成装置700は、第1の人工知能に与えられる入力データとその教師データとに相当する第1の学習データを作成し、第1の学習データ記憶装置710に格納する。入力データは、例えば、画像、音声、テキスト、動画像、センサによって測定される物理量などを表す。教師データは、入力データに対して第1の人工知能が生成すべき正しい出力データを示す。具体的には、第1の機械学習が手書き文字を認識する能力の獲得を目的としているならば、第1の学習データ作成装置700は、入力データとしての手書き文字を表す画像データと、当該画像データに対応する文字を示す教師データとを含む学習データを作成する。
第1の学習データ記憶装置710は、第1の学習データを格納する。第1の学習データは、第1の学習データ作成装置700によって作成され、第1の学習装置720によって必要に応じて読み出される。なお、第1の学習データ記憶装置710は、第1の学習到達度を評価するためのテストデータをさらに格納してもよい。
第1の学習装置720は、第1の学習データ記憶装置710から第1の学習データを読み出し、これに含まれる入力データを第1の人工知能に与え、出力データを得る。出力データは、第1の機械学習の目的に依存して異なるが、例えば、入力データに対する認識結果(例えば、文字認識、音声認識、画像認識、動画像認識などの結果)を表し得る。第1の学習装置720は、この出力データが教師データに近づくように第1の人工知能の機械学習(モデルパラメータの更新)を行う。
第1の学習装置720は、第1の人工知能の学習到達度をテストデータを用いて評価し、学習目標に到達したならば、学習結果(モデルパラメータ)を第2の人工知能に設定する。なお、第1の学習装置720および第2の人工知能は、同一の装置(例えばサーバ)に組み込まれていてもよい。
出力データ記憶装置750は、第2の人工知能の出力データを格納してもよい。第2の人工知能の出力データは、第2の学習データ作成装置100によって必要に応じて読み出される。
第2の学習データ作成装置100は、学習依頼装置280から仕様データを含む学習依頼を受け取り、当該学習依頼に基づいて必要なデータを取得し、第2の学習データを作成する。そして、第2の学習データ作成装置100は、第2の学習データを第2の学習データ記憶装置260に格納する。
図10の例では、第2の学習データ作成装置100は、出力データ記憶装置750から第2の人工知能の出力データを読み出し、これに基づいて第2の学習データを作成する(第3の作成処理)。
具体的には、第2の学習データ作成装置100は、第2の人工知能に何らかの入力データ(その教師データは既知である)を与えて出力データを生成させてもよい。そして、第2の学習データ作成装置100は、第2の人工知能の出力データを出力データ記憶装置750経由で取得し、これに基づいて第2の学習データを作成してもよい。
そして、第2の学習データ作成装置100は、例えば、第2の人工知能に誤った出力データを生成させた入力データに基づいて第2の学習データに含まれる学習用の判定材料データを作成する。この場合には、第2の学習データ作成装置100は、かかる学習用の判定材料データが第2の人工知能が不得意とする入力データに該当する(すなわち、かかる入力データに対して第2の人工知能が生成する出力データは妥当でない)ことを示す教師データを作成する。
また、第2の学習データ作成装置100は、第2の人工知能に正しい出力データを生成させた入力データに基づいて第2の学習データに含まれる学習用の判定材料データを作成してもよい。この場合には、第2の学習データ作成装置100は、かかる学習用の判定材料データが第2の人工知能が不得意とする入力データに該当しない(すなわち、かかる入力データに対して第2の人工知能が生成する出力データは妥当である)ことを示す教師データを作成する。
図10の機械学習システムは、図11に例示されるように動作する。
第1の学習データ作成装置700は、第1の人工知能に与えられる入力データに相当する第1の学習データを作成する(ステップS801)。第1の学習装置720は、ステップS801において作成された第1の学習データを用いて、第1の人工知能に対する第1の機械学習を行う(ステップS802)。
第2の学習データ作成装置100は、ステップS802の完了後にその学習結果が設定された第2の人工知能に何らかの入力データ(その教師データは既知である)を与えて出力データを生成させる。第2の学習データ作成装置100は、かかる出力データの元となる入力データを学習用の判定材料データとして取得し、これに基づいて第2の学習データを作成する。具体的には、第2の学習データ作成装置100は、誤った出力データに対応する入力データ(学習用の判定材料データ)に基づいて第2の学習データを作成する。また、第2の学習データ作成装置100は、正しい出力データに対応する入力データ(学習用の判定材料データ)に基づいて第2の学習データを作成してもよい。
第2の学習装置270は、ステップS803において作成された第2の学習データを用いて、学習用の判定材料データが第2の人工知能の不得意または得意とするデータを表すか否かを第3の人工知能に判定させることを含む第2の機械学習を行う(ステップS804)。
利用者からの要求に応じて人工知能の出力の妥当性を判定する能力を獲得するための機械学習サービスを提供するサービス提供システムが図12に例示される。
図12のサービス提供システムは、第2の学習データ作成装置100と、第1の学習データ作成装置900と、第1の学習データ記憶装置910と、第1の学習装置920と、対象シミュレータ930と、観測データ記憶装置250と、出力データ記憶装置950と、第2の学習データ記憶装置260と、第2の学習装置270と、学習依頼装置280と、利用者端末990とを含む。各装置は、ネットワークNW経由で互いに接続されている。
なお、図12のサービス提供システムの装置構成は例示に過ぎない。すなわち、図12に示される装置の一部または全部が1つの装置に統合されてもよいし、図12に示される装置の機能が複数の装置に分散されてもよい。また、図12のサービス提供システムの一部の装置が削除または変更され得るし、図12に示されていない装置が追加され得る。
第1の学習データ作成装置900は、前述の第1の学習データ作成装置200、第1の学習データ作成装置500または第1の学習データ作成装置700と同一または類似であってよい。なお、第1の学習データを作成するためのベースとなるデータが学習依頼装置280からの入力データに含まれていてもよい。
第1の学習データ記憶装置910は、前述の第1の学習データ記憶装置210、第1の学習データ記憶装置510または第1の学習データ記憶装置710と同一または類似であってよい。
第1の学習装置920は、前述の第1の学習装置220、第1の学習装置520または第1の学習装置720と同一または類似であってよい。なお、第1の学習装置920は、学習依頼装置280から学習開始指令を受け取り、これに従って第1の機械学習を行ってもよいし、異なるイベントをトリガとして第1の機械学習を行ってもよい。さらに、第1の学習装置920は、例えば、第1の機械学習によって獲得することが望まれる能力を定める仕様データを受け取るかもしれない。第1の学習装置920は、仕様データに基づいて、第1の人工知能の学習目標を設定したり、強化学習における報酬を設定したりしてよい。
対象シミュレータ930は、第1の学習装置920によって行われる第1の機械学習が対象の動作または状態を制御する能力の獲得を目的とする場合(前述の第1の作成処理または第2の作成処理が行われる場合)に使用され得る。対象シミュレータ930は、前述の対象230または対象530のシミュレーションモデルを保持し、当該シミュレーションモデルに第1の人工知能によって生成された出力データを与え、その動作または状態の観測結果を生成する。すなわち、対象シミュレータ930は、前述の対象230および観測装置240の組み合わせ、または、対象530および観測装置540の組み合わせを、シミュレーション上で実現する。但し、対象230または対象530として実機を用いる場合には、対象シミュレータ930は削除可能である。
出力データ記憶装置950は、前述の出力データ記憶装置550または出力データ記憶装置750と同一または類似であってよい。
学習依頼装置280は、利用者端末990から第2の機械学習に関する仕様データおよび学習開始指令を学習依頼として受け付ける。学習依頼装置280は、仕様データおよび学習開始指令を第2の学習装置270へと送る。また、学習依頼装置280は、利用者端末990から第1の機械学習に関する仕様データおよび学習開始指令を学習依頼として受け付けてもよい。この場合には、学習依頼装置280は、仕様データおよび学習開始指令を第1の学習装置920へと送る。
利用者端末990は、利用者の目的にふさわしい機械学習の提供をサービス提供システムに依頼する。利用者端末990は、例えば、利用者の入力に基づいて第2の機械学習に関する仕様データおよび学習開始指令を発行し、これらを学習依頼装置280に送る。仕様データは、対象の構造、用途、目的または耐負荷性能などを示す値を含み得る。
以上説明したように、本実施形態に係る(第2の)学習データ作成装置は、第1の人工知能に対して実行された第1の機械学習の学習結果が設定された第2の人工知能(対象人工知能)の出力の妥当性を判定する能力を獲得するための第2の機械学習に使用される(第2の)学習データを作成する。具体的には、この学習データ作成装置は、第1の人工知能および/または第2の人工知能に関するデータの中から、要求される判定能力の仕様に基づいて定められる(学習用の)判定材料データを取得し、これを第2の機械学習が実行される第3の人工知能の入力データとする。そして、この学習データ作成装置は、この判定材料データと、当該判定材料データに基づく第2の人工知能の出力の妥当性の判定結果の正解値を示す教師データとを含む学習データを作成する。故に、この学習データ作成装置によれば、仕様に合致した判定能力を獲得するための第2の機械学習に用いられる学習データを作成することができる。
また、この学習データ作成装置は、どのようなデータを(学習用の)判定材料データとして取得すべきか、および当該判定材料データに基づいてどのような(第2の)学習データを作成すべきか、を要求される判定能力の仕様に基づいて制御する。故に、この学習データ作成装置によれば、特定の判定能力に制約されない広範な判定能力を獲得するため学習データを作成することができる。
§4 変形例
以上、本開示の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本開示の例示に過ぎない。本開示の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略した。
<4.1>
本実施形態に係る(第2の)学習データ作成装置は、どのようなデータを(学習用の)判定材料データとして取得すべきか、および当該判定材料データに基づいてどのような(第2の)学習データを作成すべきか、を要求される判定能力の仕様に基づいて制御する。しかしながら、かかる制御は、学習データ作成装置の外側で行われてもよい。すなわち、互いに異なる作成処理を実行する複数の学習データ作成装置が用意されてもよい。或いは、かかる制御を前提としなくても、かかる学習データ作成装置は、特定の判定能力を獲得するための第2の機械学習に用いられる学習データを作成できる点で有用である。そこで、この変形例(以降、本変形例とも称する)に係る(第2の)第2の学習データ作成装置は、予め定められた(学習用の)判定材料データを取得し、予め定められたアルゴリズムに従って当該判定材料データに基づいて第2の学習データを作成する。
図13に例示されるように、本変形例に係る第2の学習データ作成装置1000は、取得部1001と、作成部1002とを含む。第2の学習データ作成装置1000のハードウェア構成は、図3を用いて説明した第2の学習データ作成装置のハードウェア構成と同一または類似であり得る。
取得部1001は、例えば、入力装置、通信インタフェースまたは外部インタフェースなどであり得る。取得部1001は、第1の人工知能の出力に関するデータおよび第2の人工知能の出力に関するデータのうち、予め定められたデータを、学習用の判定材料データとして取得する。取得部1001は、学習用の判定材料データを作成部102へ送る。
作成部1002は、例えば、プロセッサおよびメモリであり得る。作成部1002は、取得部101から学習用の判定材料データを受け取り、これに基づいて、第2の学習データを作成する。第2の学習データは、実施形態と同様に、学習用の判定材料データと、当該学習用の判定材料データに基づく第1の人工知能および/または第2の人工知能の出力の妥当性の判定結果の正解値を示す教師データとを含む。作成部1002は、学習データをどのようにして作成するかを予め定められている。
以上説明したように、本変形例に係る(第2の)学習データ作成装置は、第1の人工知能に対して実行された第1の機械学習の学習結果が設定された第2の人工知能の出力の妥当性を判定する能力を獲得するための第2の機械学習に使用される(第2の)学習データを作成する。具体的には、この学習データ作成装置は、第1の人工知能および/または第2の人工知能の出力に関するデータのうち、予め定められた(学習用の)判定材料データを取得し、これを第2の機械学習が実行される第3の人工知能の入力データとする。そして、この学習データ作成装置は、この判定材料データと、当該判定材料データに基づく第2の人工知能の出力の妥当性の判定結果の正解値を示す教師データとを含む学習データを作成する。故に、この学習データ作成装置によれば、特定の判定能力を獲得するための第2の機械学習に用いられる学習データを作成することができる。
また、この学習データ作成装置は、どのようなデータを(学習用の)判定材料データとして取得すべきか、および当該判定材料データに基づいてどのような(第2の)学習データを作成すべきか、を予め定められている。故に、この学習データ作成装置によれば、例えば、実施形態において説明された第1の作成処理乃至第3の作成処理のいずれかを実行して、特定の判定能力を獲得するため学習データを作成することができる。
ただし、ここまで説明した実施形態は全て、あらゆる点において本開示の例示に過ぎない。本開示の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本開示の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、各実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。
上記各実施形態の一部または全部は、特許請求の範囲のほか以下に示すように記載することも可能であるが、これに限られない。
(付記1)
制御装置と判定装置とを具備し、
前記制御装置は、第1のメモリと、前記第1のメモリに接続された第1のプロセッサとを具備し、
前記第1のプロセッサは、対象を制御するための出力データを入力データに基づいて生成する制御用人工知能を実装するように構成され、
前記判定装置は、第2のメモリと、前記第2のメモリに接続された第2のプロセッサとを具備し、
前記第2のプロセッサは、
(a)前記制御用人工知能の出力の妥当性の判定に用いられる判定材料データを取得し、
(b)前記妥当性を前記判定材料データに基づいて判定する判定用人工知能を実装する、
ように構成され、
前記制御用人工知能は、前記対象を制御する制御能力を獲得する第1の機械学習の学習結果が設定されていて、
前記判定用人工知能は、前記妥当性を判定する判定能力を獲得する第2の機械学習の学習結果が設定されていて、
前記第2の機械学習は、前記第1の機械学習を実行中の、または前記第1の機械学習の学習結果を設定された人工知能の出力に関するデータに基づいて作成された学習用の判定材料データと、当該学習用の判定材料データに基づく前記妥当性の判定結果の正解値を示す教師データとの組み合わせを含む学習データを使用して行われ、
前記学習用の判定材料データは、前記第1の機械学習を実行中の、または前記第1の機械学習の学習結果を設定された人工知能の出力に関するデータの中から前記判定能力の仕様に基づいて定められる、
制御システム。
(付記2)
第1の機械学習の学習結果が設定された対象人工知能の出力の妥当性を判定する判定能力を獲得する第2の機械学習に使用される学習データを作成する学習データ作成装置であって、
メモリと、
前記メモリに接続されたプロセッサと
を具備し、
前記プロセッサは、
(a)前記第1の機械学習を実行中の第1の人工知能または前記第1の機械学習の学習結果を設定された第2の人工知能の出力に関するデータを取得し、
(b)前記第2の機械学習の対象となる判定用人工知能への入力データとなる学習用の判定材料データと、前記入力データに対応する当該判定用人工知能の出力データの正解値を示す教師データとの組み合わせを含む学習データを、前記取得部によって取得されたデータと前記判定能力の仕様とに基づいて作成する、
ように構成される、学習データ作成装置。
(付記3)
メモリと、
前記メモリに接続されたプロセッサと
を具備し、
前記プロセッサは、
(a)第1の機械学習の学習結果が設定された対象人工知能の出力の妥当性を判定する判定能力を獲得する第2の機械学習に使用される学習データを取得し、
(b)前記学習データを使用して判定用人工知能に前記第2の機械学習を行う、
ように構成され、
前記学習データは、前記判定用人工知能への入力データとなる学習用の判定材料データと、前記入力データに対応する当該判定用人工知能の出力データの正解値を示す教師データとの組み合わせを含み、
前記学習データは、前記第1の機械学習を実行中の第1の人工知能または前記第1の機械学習の学習結果を設定された第2の人工知能の出力に関するデータと、前記判定能力の仕様とに基づいて作成される、
学習装置。
(付記4)
メモリと、
前記メモリに接続されたプロセッサと
を具備し、
前記プロセッサは、
(a)第1の機械学習の学習結果が設定された対象人工知能の出力に関するデータを取得し、
(b)前記取得部によって取得されたデータに基づく入力データを受けて前記対象人工知能の出力の妥当性を判定する判定用人工知能を実装する、
ように構成され、
前記判定用人工知能は、前記妥当性を判定する判定能力を獲得する第2の機械学習の学習結果が設定されていて、
前記第2の機械学習は、前記第1の機械学習を実行中の第1の人工知能または前記第1の機械学習の学習結果を設定された第2の人工知能の出力に関するデータに基づいて作成された学習用の判定材料データと、当該学習用の判定材料データに基づく前記妥当性の判定結果の正解値を示す教師データとの組み合わせを含む学習データを使用して行われ、
前記学習用の判定材料データは、前記第1の機械学習を実行中の、または前記第1の機械学習の学習結果を設定された人工知能の出力に関するデータの中から前記判定能力に基づいて定められる、
判定装置。
100,1000・・・第2の学習データ作成装置
101,271,1001,1201,1330,1431・・・取得部
102,1002,1432・・・作成部
103,1301,1433,1501・・・制御部
200,500,700,900・・・第1の学習データ作成装置
210,510,710,910・・・第1の学習データ記憶装置
220,520,720,920・・・第1の学習装置
230,530,1310,1410・・・対象
240,540・・・観測装置
250・・・観測データ記憶装置
260・・・第2の学習データ記憶装置
270・・・第2の学習装置
272,1450・・・学習部
280・・・学習依頼装置
550,750,950・・・出力データ記憶装置
930・・・対象シミュレータ
990・・・利用者端末
1200,1320・・・判定装置
1202,1340・・・判定部
1300・・・制御装置
1302,1400・・・制御用AI
1341,1460・・・判定用AI
1350・・・警報部
1360・・・介入部
1420・・・判定用人工知能生成装置
1440・・・学習データ記憶部
1470・・・学習結果記憶部
1502・・・記憶部
1503・・・通信I/F
1504・・・入力装置
1505・・・出力装置
1506・・・外部I/F
1507・・・ドライブ
1508・・・記憶媒体

Claims (15)

  1. 制御装置と判定装置とを具備し、
    前記制御装置は、対象を制御するための出力データを入力データに基づいて生成する制御用人工知能を含む制御部を備え、
    前記判定装置は、
    前記制御用人工知能の出力の妥当性の判定に用いられる判定材料データを取得する取得部と、
    前記妥当性を前記判定材料データに基づいて判定する判定用人工知能を含む判定部と
    を備え、
    前記制御用人工知能は、前記対象を制御する制御能力を獲得する第1の機械学習の学習結果が設定されていて、
    前記判定用人工知能は、前記妥当性を判定する判定能力を獲得する第2の機械学習の学習結果が設定されていて、
    前記第2の機械学習は、前記第1の機械学習を実行中の、または前記第1の機械学習の学習結果を設定された人工知能の出力に関するデータに基づいて作成された学習用の判定材料データと、当該学習用の判定材料データに基づく前記妥当性の判定結果の正解値を示す教師データとの組み合わせを含む学習データを使用して行われ、
    前記学習用の判定材料データは、前記第1の機械学習を実行中の、または前記第1の機械学習の学習結果を設定された人工知能の出力に関するデータの中から前記判定能力の仕様に基づいて定められる、
    制御システム。
  2. 前記判定装置は、前記制御用人工知能の出力が妥当でないと判定された場合に警報を発する警報部をさらに具備する、請求項1に記載の制御システム。
  3. 前記判定装置は、前記制御用人工知能の出力が妥当でないと判定された場合に前記制御装置による前記対象への制御に介入する介入部をさらに具備する、請求項1に記載の制御システム。
  4. 第1の機械学習の学習結果が設定された対象人工知能の出力の妥当性を判定する判定能力を獲得する第2の機械学習に使用される学習データを作成する学習データ作成装置であって、
    前記第1の機械学習を実行中の第1の人工知能または前記第1の機械学習の学習結果を設定された第2の人工知能の出力に関するデータを取得する取得部と、
    前記第2の機械学習の対象となる判定用人工知能への入力データとなる学習用の判定材料データと、前記入力データに対応する当該判定用人工知能の出力データの正解値を示す教師データとの組み合わせを含む学習データを、前記取得部によって取得されたデータと前記判定能力の仕様とに基づいて作成する作成部と
    を具備する、学習データ作成装置。
  5. 前記学習用の判定材料データは、(i)前記第1の人工知能または前記第2の人工知能の出力データと、(ii)前記第1の人工知能または前記第2の人工知能の出力データに基づいて制御された対象の動作または状態の観測結果を表す観測データと、(iii)前記第2の人工知能に出力データを生成させた入力データとのうちの少なくとも一部を含む、請求項4に記載の学習データ作成装置。
  6. 前記作成部は、前記第1の人工知能の出力データに基づいて制御された対象の動作または状態の観測結果を表す観測データに基づいて前記学習用の判定材料データを作成し、前記第1の人工知能の出力が妥当でないことを示す教師データを作成する、請求項5に記載の学習データ作成装置。
  7. 前記作成部は、前記第1の人工知能の出力データに基づいて前記学習用の判定材料データを作成し、前記第1の人工知能の出力が妥当でないことを示す教師データを作成する、請求項5に記載の学習データ作成装置。
  8. 前記作成部は、前記第2の人工知能の出力データに基づいて前記学習用の判定材料データを作成し、前記第2の人工知能の出力が妥当であることを示す教師データを作成する、請求項5または請求項7に記載の学習データ作成装置。
  9. 前記作成部は、前記第2の人工知能に誤った出力データを生成させた入力データに基づいて前記学習用の判定材料データを作成し、前記第2の人工知能の出力が妥当でないことを示す教師データを作成する、請求項5に記載の学習データ作成装置。
  10. 前記作成部は、前記第2の人工知能に正しい出力データを生成させた入力データに基づいて前記学習用の判定材料データを作成し、前記第2の人工知能の出力が妥当であることを示す教師データを作成する、請求項5または請求項9に記載の学習データ作成装置。
  11. 前記判定能力の仕様に基づいて、前記取得部によって取得されるデータと、前記作成部によって作成される学習データとを制御する制御部をさらに具備する、請求項4乃至請求項10のいずれか1項に記載の学習データ作成装置。
  12. 第1の機械学習の学習結果が設定された対象人工知能の出力の妥当性を判定する判定能力を獲得する第2の機械学習に使用される学習データを取得する取得部と、
    前記学習データを使用して判定用人工知能に前記第2の機械学習を行う学習部と
    を具備し、
    前記学習データは、前記判定用人工知能への入力データとなる学習用の判定材料データと、前記入力データに対応する当該判定用人工知能の出力データの正解値を示す教師データとの組み合わせを含み、
    前記学習データは、前記第1の機械学習を実行中の第1の人工知能または前記第1の機械学習の学習結果を設定された第2の人工知能の出力に関するデータと、前記判定能力の仕様とに基づいて作成される、
    学習装置。
  13. 第1の機械学習の学習結果が設定された対象人工知能の出力に関するデータを取得する取得部と、
    前記取得部によって取得されたデータに基づく入力データを受けて前記対象人工知能の出力の妥当性を判定する判定用人工知能を含む判定部と
    を具備し、
    前記判定用人工知能は、前記妥当性を判定する判定能力を獲得する第2の機械学習の学習結果が設定されていて、
    前記第2の機械学習は、前記第1の機械学習を実行中の第1の人工知能または前記第1の機械学習の学習結果を設定された第2の人工知能の出力に関するデータに基づいて作成された学習用の判定材料データと、当該学習用の判定材料データに基づく前記妥当性の判定結果の正解値を示す教師データとの組み合わせを含む学習データを使用して行われ、
    前記学習用の判定材料データは、前記第1の機械学習を実行中の、または前記第1の機械学習の学習結果を設定された人工知能の出力に関するデータの中から前記判定能力に基づいて定められる、
    判定装置。
  14. 前記対象人工知能の出力が妥当でないと判定された場合に警報を発する警報部をさらに具備する、請求項13に記載の判定装置。
  15. 前記対象人工知能は、対象を制御するための出力データを入力データに基づいて生成し、
    前記判定装置は、前記対象人工知能の出力が妥当でないと判定された場合に前記対象人工知能の出力に基づく前記対象への制御に介入する介入部をさらに具備する、
    請求項13に記載の判定装置。
JP2018092840A 2018-05-14 2018-05-14 制御システム、学習データ作成装置、学習装置および判定装置 Active JP7091820B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2018092840A JP7091820B2 (ja) 2018-05-14 2018-05-14 制御システム、学習データ作成装置、学習装置および判定装置
CN201910289524.XA CN110488791A (zh) 2018-05-14 2019-04-11 控制系统、学习数据创建装置、学习装置以及判定装置
EP19169386.0A EP3570219A1 (en) 2018-05-14 2019-04-16 Control system, learning data creation apparatus, learning apparatus, and judgment apparatus
US16/387,584 US20190346836A1 (en) 2018-05-14 2019-04-18 Control system, learning data creation apparatus, learning apparatus, and judgment apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018092840A JP7091820B2 (ja) 2018-05-14 2018-05-14 制御システム、学習データ作成装置、学習装置および判定装置

Publications (2)

Publication Number Publication Date
JP2019200453A true JP2019200453A (ja) 2019-11-21
JP7091820B2 JP7091820B2 (ja) 2022-06-28

Family

ID=66323677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018092840A Active JP7091820B2 (ja) 2018-05-14 2018-05-14 制御システム、学習データ作成装置、学習装置および判定装置

Country Status (4)

Country Link
US (1) US20190346836A1 (ja)
EP (1) EP3570219A1 (ja)
JP (1) JP7091820B2 (ja)
CN (1) CN110488791A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102280489B1 (ko) * 2020-11-19 2021-07-22 주식회사 두유비 대규모 사전학습 모델을 학습하여 지성을 기반으로 대화하는 대화 지능 획득 방법
JP2021117699A (ja) * 2020-01-24 2021-08-10 株式会社東芝 制御装置、制御方法、及びモータ制御装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11345030B2 (en) * 2019-05-28 2022-05-31 Intel Corporation Methods and apparatus for complex assembly via autonomous robots using reinforcement learning action primitives
JP7238610B2 (ja) * 2019-06-04 2023-03-14 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
KR102285472B1 (ko) * 2019-06-14 2021-08-03 엘지전자 주식회사 음향의 이퀄라이징 방법과, 이를 구현하는 로봇 및 ai 서버
EP4002127A4 (en) * 2019-11-22 2023-12-13 Japan Manned Space Systems Corporation SECURITY VERIFICATION SYSTEM FOR ARTIFICIAL INTELLIGENCE SYSTEM, SECURITY VERIFICATION METHOD AND SECURITY VERIFICATION PROGRAM
CN111538233A (zh) * 2020-05-06 2020-08-14 上海雁文智能科技有限公司 一种基于能耗奖励的中央空调人工智能控制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05225163A (ja) * 1992-02-13 1993-09-03 Hitachi Ltd ニューラルネットシステムおよびニューラルネットの学習方法
JPH08505967A (ja) * 1992-11-24 1996-06-25 パヴィリオン・テクノロジーズ・インコーポレイテッド 欠落および/または不完全なデータを有するニューラルネットワークを作動するための方法および装置
JPH0991430A (ja) * 1995-09-27 1997-04-04 Hitachi Ltd パターン認識装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4356716B2 (ja) * 2006-08-03 2009-11-04 パナソニック電工株式会社 異常監視装置
JP6457421B2 (ja) * 2016-04-04 2019-01-23 ファナック株式会社 シミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法
JP6453805B2 (ja) * 2016-04-25 2019-01-16 ファナック株式会社 製品の異常に関連する変数の判定値を設定する生産システム
JP6434462B2 (ja) * 2016-08-30 2018-12-05 ファナック株式会社 溶接の状態を判定するスポット溶接装置
JP6557198B2 (ja) * 2016-09-06 2019-08-07 ファナック株式会社 数値制御装置
CN106874914B (zh) * 2017-01-12 2019-05-14 华南理工大学 一种基于深度卷积神经网络的工业机械臂视觉控制方法
US10636323B2 (en) * 2017-01-24 2020-04-28 Tienovix, Llc System and method for three-dimensional augmented reality guidance for use of medical equipment
CN106842948B (zh) * 2017-03-01 2019-08-06 长春工业大学 基于bp网络的hdp分子蒸馏系统的最优控制方法
CN107527053A (zh) * 2017-08-31 2017-12-29 北京小米移动软件有限公司 目标检测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05225163A (ja) * 1992-02-13 1993-09-03 Hitachi Ltd ニューラルネットシステムおよびニューラルネットの学習方法
JPH08505967A (ja) * 1992-11-24 1996-06-25 パヴィリオン・テクノロジーズ・インコーポレイテッド 欠落および/または不完全なデータを有するニューラルネットワークを作動するための方法および装置
JPH0991430A (ja) * 1995-09-27 1997-04-04 Hitachi Ltd パターン認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021117699A (ja) * 2020-01-24 2021-08-10 株式会社東芝 制御装置、制御方法、及びモータ制御装置
JP7467133B2 (ja) 2020-01-24 2024-04-15 株式会社東芝 制御装置、制御方法、及びモータ制御装置
KR102280489B1 (ko) * 2020-11-19 2021-07-22 주식회사 두유비 대규모 사전학습 모델을 학습하여 지성을 기반으로 대화하는 대화 지능 획득 방법

Also Published As

Publication number Publication date
CN110488791A (zh) 2019-11-22
JP7091820B2 (ja) 2022-06-28
EP3570219A1 (en) 2019-11-20
US20190346836A1 (en) 2019-11-14

Similar Documents

Publication Publication Date Title
JP2019200453A (ja) 制御システム、学習データ作成装置、学習装置および判定装置
CN112119409B (zh) 具有关系存储器的神经网络
JP6526284B2 (ja) 自動ハプティック効果調整システム
Kehoe et al. A survey of research on cloud robotics and automation
KR20120047577A (ko) 대화형 행동모델을 이용한 로봇 인터랙션 서비스 제공 장치 및 방법
US11663474B1 (en) Artificially intelligent systems, devices, and methods for learning and/or using a device's circumstances for autonomous device operation
CN111144580B (zh) 一种基于模仿学习的层级强化学习训练方法和装置
KR102571997B1 (ko) 정보 처리 장치, 중개 장치, 시뮬레이트 시스템 및 정보 처리 방법
US11971709B2 (en) Learning device, control device, learning method, and recording medium
KR20210033809A (ko) 인공 신경망을 이용하여 로봇을 제어하는 제어 서버 및 방법와, 이를 구현하는 로봇
Vassev et al. Awareness in software-intensive systems
CN112859601A (zh) 机器人控制器设计方法、装置、设备及可读存储介质
CN111438692A (zh) 机器人控制方法、装置、介质、设备以及机器人
JP2018024340A (ja) 運転性向判定装置および運転性向判定システム
JP2021082139A (ja) 追加学習装置、方法、及びプログラム
JP2018151959A (ja) 判定装置、判定プログラムおよび学習方法
CN116578024A (zh) 基于混合模态信号的康复机器人多模式控制方法及系统
US11285604B2 (en) Robot collision detection using cascading variational autoencoder
EP4021601A1 (en) Toy construction system for constructing and operating a remote controlled toy vehicle model
CN114683280B (zh) 对象控制方法、装置、存储介质及电子设备
CN112292239A (zh) 用于计算机辅助地确定用于适宜操作技术系统的调节参数的方法和设备
US20210295131A1 (en) Design of machines with feeling analogues
KR20220080464A (ko) 전자 장치 및 그 제어 방법
US20240221438A1 (en) Data processing apparatus and non-transitory recording medium
JP2018200540A (ja) 学習装置、学習制御方法、及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220530

R150 Certificate of patent or registration of utility model

Ref document number: 7091820

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150