JP2020060897A - 機械学習システム、機械学習方法及び機械学習プログラム - Google Patents
機械学習システム、機械学習方法及び機械学習プログラム Download PDFInfo
- Publication number
- JP2020060897A JP2020060897A JP2018190828A JP2018190828A JP2020060897A JP 2020060897 A JP2020060897 A JP 2020060897A JP 2018190828 A JP2018190828 A JP 2018190828A JP 2018190828 A JP2018190828 A JP 2018190828A JP 2020060897 A JP2020060897 A JP 2020060897A
- Authority
- JP
- Japan
- Prior art keywords
- terminal
- unit
- machine learning
- role
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
<構成>
図1は、本開示の実施形態1に係る機械学習システム1を示すブロック構成図である。この機械学習システム1は、例として、所定の目的、例えば、掃除ロボットにより所定の範囲内の掃除を行う目的や、産業用ロボットによりベルトコンベアで搬送される製造物の組み立てを行う目的のために、複数の端末により相互に協調動作を行い、所定の目的のための動作を行うシステムである。
図7を参照しながら、機械学習システム1が実行する機械学習方法の一例の処理の流れについて説明する。図7は、図2の端末100の動作を示すフローチャートである。
以上のように、本実施形態に係る機械学習システムは、検知部により端末の周囲の環境が検知され、評価部により、動作制御部によって制御された端末の動作が検知結果に基づいて評価される。比較部により、自己の端末の評価結果と他の端末から受信した評価結果とが比較され、学習部により、比較結果に基づいて強化学習が行われ、制御情報が更新されて端末の動作制御が行われる。これにより、人工知能のプログラムが組み込まれた複数の端末のみで自律制御することが可能であり、サーバ装置による制御が不要になる。
図8は、本開示の実施形態2に係る機械学習システム1の適用例である、複数の掃除ロボット200A〜200Gが環境E内に配置されている状態の例を示す模式図である。この掃除ロボット200A〜200Gは、実施形態1に係る端末100を、具体的な適用例として掃除ロボットに適用したものであり、それぞれ端末100と同様の構成を備えている。なお、掃除ロボット200A〜200Gは、それぞれ同様の構成を備えるものであり、掃除ロボット200A〜200Gの構成を説明する際、代表して掃除ロボット200と表記する。
図11は、コンピュータ(電子計算機)300の構成の例を示す機能ブロック構成図である。コンピュータ300は、CPU301、主記憶装置302、補助記憶装置303、インタフェース304を備える。
Claims (13)
- 複数の端末により相互に協調動作を行う機械学習システムであって、
各々の前記端末は、
前記端末の周囲の環境を検知する検知部と、
前記端末の周囲の環境に対して動作を行わせる動作制御部と、
前記検知部の検知結果に基づき、前記動作制御部による動作の評価を行う評価部と、
他の前記端末と相互に通信を行い、他の前記端末との間で、前記評価部の評価結果の送受信を行う通信部と、
自己の前記評価結果と、他の前記端末の前記評価結果とを比較する比較部と、
前記比較部の比較結果に基づき機械学習を行い、前記動作制御部の制御情報を更新する学習部と、を備える機械学習システム。 - 前記学習部は、前記比較部の比較結果に基づいて強化学習を行う、請求項1に記載の機械学習システム。
- 前記比較部は、前記比較結果に基づいて前記強化学習における報酬を更新し、
前記学習部は、更新された前記報酬に基づいて前記強化学習を行い、前記制御情報を更新する、請求項2に記載の機械学習システム。 - 前記評価部は、自己の前記端末の役割の進捗度に基づいて評価を行う、請求項1から請求項3のいずれか1項に記載の機械学習システム。
- 前記学習部は、複数の前記端末における複数の役割から自己の前記端末の役割を選択して担当し、前記端末の役割に基づいて前記制御情報を更新して前記動作制御部の動作制御を行わせる、請求項1から請求項4のいずれか1項に記載の機械学習システム。
- 前記学習部は、複数の前記端末において割り振られた自己の前記端末の役割を担当し、前記端末の役割に基づいて前記制御情報を更新して前記動作制御部の動作制御を行わせる、請求項1から請求項4のいずれか1項に記載の機械学習システム。
- 前記端末の役割は、複数の階層に振り分けられ、
前記学習部は、自己の前記評価結果が低い場合、自己の前記端末の役割を複数の階層における上位の階層に変更する、請求項5または請求項6に記載の機械学習システム。 - 前記学習部は、前記比較結果において自己の前記評価結果が低い場合、自己の前記端末の役割を複数の階層における最上位の階層に変更する、請求項7に記載の機械学習システム。
- 前記端末の役割は、動作を行う第1階層の役割、前記第1階層の前記端末が行った動作を取りまとめて第3階層に報告する第2階層の役割、または前記第2階層の前記端末からの報告を取りまとめてジョブに対するシステム全体の進捗度をシステム外部に報告する第3階層の役割のいずれかにそれぞれ振り分けられ、
前記学習部は、自己の前記端末の役割が前記第1階層であって、自己の前記評価結果が低い場合、自己の前記端末の役割を前記第2階層とし、
自己の前記端末の役割が前記第2階層であって、自己の前記評価結果が低い場合、自己の前記端末の役割を前記第3階層とする、請求項6から請求項8のいずれか1項に記載の機械学習システム。 - 前記学習部は、自己の前記端末の役割が前記第1階層であって、他の前記端末の役割が前記第2階層である他の前記端末よりも前記評価結果が低い場合、当該他の前記端末と自己の前記端末との役割を交代し、
自己の前記端末の役割が前記第2階層であって、他の前記端末の役割が前記第3階層である他の前記端末よりも前記評価結果が低い場合、当該他の前記端末と自己の前記端末との役割を交代する、請求項9に記載の機械学習システム。 - 前記検知部は、前記端末に取り付けられたセンサにより構成されている、請求項1から請求項10のいずれか1項に記載の機械学習システム。
- 複数の端末により相互に協調動作を行う機械学習方法であって、
検知部が行う、前記端末の周囲の環境を検知する検知ステップと、
動作制御部が行う、前記端末の周囲の環境に対して動作を行わせる動作制御ステップと、
評価部が行う、前記検知ステップにおける検知結果に基づき、前記動作制御ステップにおける動作の評価を行う評価ステップと、
通信部が行う、他の前記端末と相互に通信を行い、他の前記端末との間で、前記評価ステップにおける評価結果の送受信を行う通信ステップと、
比較部が行う、自己の前記評価結果と、他の前記端末の前記評価結果とを比較する比較ステップと、
学習部が行う、前記比較ステップにおける比較結果に基づき機械学習を行い、前記動作制御ステップの制御情報を更新する学習ステップと、を備える機械学習方法。 - 複数の端末により相互に協調動作を行う機械学習プログラムであって、
前記端末の周囲の環境を検知する検知ステップと、
前記端末の周囲の環境に対して動作を行わせる動作制御ステップと、
前記検知ステップにおける検知結果に基づき、前記動作制御ステップにおける動作の評価を行う評価ステップと、
他の前記端末と相互に通信を行い、他の前記端末との間で、前記評価ステップにおける評価結果の送受信を行う通信ステップと、
自己の前記評価結果と、他の前記端末の前記評価結果とを比較する比較ステップと、
前記比較ステップにおける比較結果に基づき機械学習を行い、前記動作制御ステップの制御情報を更新する学習ステップと、を電子計算機に実行させる、機械学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018190828A JP6501329B1 (ja) | 2018-10-09 | 2018-10-09 | 機械学習システム、機械学習方法及び機械学習プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018190828A JP6501329B1 (ja) | 2018-10-09 | 2018-10-09 | 機械学習システム、機械学習方法及び機械学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6501329B1 JP6501329B1 (ja) | 2019-04-17 |
JP2020060897A true JP2020060897A (ja) | 2020-04-16 |
Family
ID=66166639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018190828A Active JP6501329B1 (ja) | 2018-10-09 | 2018-10-09 | 機械学習システム、機械学習方法及び機械学習プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6501329B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7322538B2 (ja) * | 2019-06-20 | 2023-08-08 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
-
2018
- 2018-10-09 JP JP2018190828A patent/JP6501329B1/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP6501329B1 (ja) | 2019-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102639675B1 (ko) | 이동 로봇 시스템, 이동 로봇 및 이동 로봇 시스템의 제어 방법 | |
JP6949835B2 (ja) | 半自律的モバイルロボットのナビゲーティング | |
JP5469097B2 (ja) | 分散型マルチロボット・システム | |
KR20210017981A (ko) | 로봇을 이용한 서빙 시스템 및 그 작동방법 | |
US20200282549A1 (en) | Control device, control method, and control system | |
US11383390B2 (en) | Robotic work cell and network | |
Rahman et al. | Energy-efficient optimal task offloading in cloud networked multi-robot systems | |
US11747819B1 (en) | Robotic fire extinguisher | |
US20220083066A1 (en) | Learned escape behaviors of a mobile robot | |
CN114269524B (zh) | 机器人控制装置 | |
JP6501329B1 (ja) | 機械学習システム、機械学習方法及び機械学習プログラム | |
Siafara et al. | SAMBA–an architecture for adaptive cognitive control of distributed Cyber-Physical Production Systems based on its self-awareness | |
WO2021044720A1 (ja) | 制御プラットフォーム、制御システム、サービス提供システム、サービス提供方法及び制御方法 | |
CN114008681A (zh) | 电子设备及其控制方法 | |
US20220324115A1 (en) | Systems, devices, and methods for developing robot autonomy | |
EP3633955B1 (en) | An apparatus, method and computer program for controlling wireless network capacity | |
KR102346900B1 (ko) | 픽 앤 플레이스 시스템을 위한 심층 강화학습 장치 및 방법 | |
US10663957B2 (en) | Methods and systems for process automation control | |
US20200198136A1 (en) | Information processing apparatus, information processing method, and program | |
JP7236356B2 (ja) | 制御プラットフォーム及び制御システム | |
CN113467452A (zh) | 移动机器人的避让方法及装置、存储介质及电子装置 | |
WO2023034047A1 (en) | Machine learning-based environment fail-safes through multiple camera views | |
JP2006127047A (ja) | ロボット及び通信ロボットシステム | |
US11440189B2 (en) | Method and robot device for sharing object data | |
EP4156049A1 (en) | Apparatuses, computer-implemented methods, and computer program products for improved object pathing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181010 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20181010 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20181015 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190313 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6501329 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |