JP2021018644A - 機械学習装置、機械学習方法及び機械学習プログラム - Google Patents

機械学習装置、機械学習方法及び機械学習プログラム Download PDF

Info

Publication number
JP2021018644A
JP2021018644A JP2019134502A JP2019134502A JP2021018644A JP 2021018644 A JP2021018644 A JP 2021018644A JP 2019134502 A JP2019134502 A JP 2019134502A JP 2019134502 A JP2019134502 A JP 2019134502A JP 2021018644 A JP2021018644 A JP 2021018644A
Authority
JP
Japan
Prior art keywords
machine learning
reward
unit
learning device
control information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019134502A
Other languages
English (en)
Inventor
知宏 桐山
Tomohiro Kiriyama
知宏 桐山
斎藤 浩一
Koichi Saito
浩一 斎藤
駿 菅井
Shun Sugai
駿 菅井
一彦 小輪▲瀬▼
Kazuhiko Kowase
一彦 小輪▲瀬▼
直史 柏倉
Tadashi Kashiwakura
直史 柏倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2019134502A priority Critical patent/JP2021018644A/ja
Priority to US16/923,509 priority patent/US12010280B2/en
Priority to CN202010685334.2A priority patent/CN112286050B/zh
Publication of JP2021018644A publication Critical patent/JP2021018644A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00567Handling of original or reproduction media, e.g. cutting, separating, stacking
    • H04N1/0057Conveying sheets before or after scanning
    • H04N1/00599Using specific components
    • H04N1/0061Feed belts
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/047Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators the criterion being a time optimal performance criterion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00071Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for characterised by the action taken
    • H04N1/00082Adjusting or controlling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Automation & Control Theory (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Controlling Sheets Or Webs (AREA)
  • Feedback Control In General (AREA)
  • Handling Of Sheets (AREA)
  • Paper Feeding For Electrophotography (AREA)
  • Control Of Conveyors (AREA)

Abstract

【課題】適切に搬送物を搬送するための駆動源の制御情報を生成する。【解決手段】少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する搬送装置における、駆動源の行動を学習する機械学習装置において、搬送経路に設けられた検知部の検知結果に基づいて、少なくとも2つの搬送物の搬送経路上の位置情報を取得し、取得した位置情報に基づいて、予め定めたルールに従って報酬を計算し、取得した位置情報と計算した報酬とに基づいて、強化学習における行動価値を算出することによって、行動を学習し、学習結果に基づいて決定した行動を駆動源に行わせるための制御情報を生成して出力する。【選択図】図8

Description

本発明は、複数の移動物の搬送を制御する搬送装置における駆動源の行動を学習する機械学習装置、機械学習方法及び機械学習プログラムに関し、特に、複数の用紙の搬送を制御する画像形成装置における駆動源の行動を学習する機械学習装置、機械学習方法及び機械学習プログラムに関する。
MFP(Multi-Functional Peripherals)などの画像形成装置は、使用するユーザによって機械の使用環境や使用状況が異なり、機械状態が変化するため、搬送中の用紙のたわみや引っ張りなどに起因するジャムの発生しやすさが変化する。ジャムが発生した場合、機械が停止してメンテナンスが必要となり、メンテナンスまでの時間がダウンタイムになってしまうことから、機械状態に応じた最適な制御が求められる。
しかしながら、使用環境や使用状況の組み合わせは膨大であり、あらゆる使用環境や使用状況を想定した制御を設計するためには多大な開発工数が必要になる。そこで、従来は、最悪な条件や代表的な条件においてもジャムが発生しないように制御設計を行っているが、この方法では、想定していない条件では最適な制御にならない場合があり、顧客満足度が得られない。
このような問題に対して、機械学習を利用して装置の制御条件を求める方法が提案されている。例えば、下記特許文献1には、電動機制御における電流ゲインパラメータの調整に関連付けられる条件を学習する機械学習装置であって、電流制御ループの積分ゲイン関数及び比例ゲイン関数を取得し、かつ実電流を取得し、ステップ状のトルク指令に対する前記実電流のオーバシュート量、アンダーシュート量、及び立ち上がり時間のうちの少なくとも1つ、前記積分ゲイン関数、及び前記比例ゲイン関数から構成される状態変数を観測する状態観測部と、前記状態変数によって構成される訓練データセットに従って、前記電流ゲインパラメータの調整に関連付けられる条件を学習する学習部と、を備える構成が開示されている。
特開2017−034844号公報
しかしながら、画像形成装置の場合は、温度や湿度などの環境条件に加えて、各部品の寿命、スリップ率、紙種、坪量、サイズ、印刷モード、印字率などの印刷条件によって用紙の搬送状態が変化し、実際の用紙の搬送状態に応じてジャムの発生しやすさが変化する。そのため、特許文献1の技術を利用しても、ジャムが発生しないように用紙を搬送する制御条件を求めることができない。
本発明は、上記問題点に鑑みてなされたものであって、その主たる目的は、適切に搬送物を搬送するための駆動源の制御情報を生成することができる機械学習装置、機械学習方法及び機械学習プログラムを提供することにある。
本発明の一側面は、少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する搬送装置における、駆動源の行動を学習する機械学習装置であって、前記搬送経路に設けられた検知部の検知結果に基づいて、前記少なくとも2つの搬送物の前記搬送経路上の位置情報を取得する状態情報取得部と、前記取得した位置情報に基づいて、予め定めたルールに従って報酬を計算する報酬計算部と、前記取得した位置情報と前記計算した報酬とに基づいて、強化学習における行動価値を算出することによって、行動を学習する学習部と、学習結果に基づいて決定した行動を前記駆動源に行わせるための制御情報を生成して出力する制御情報出力部と、を備えることを特徴とする。
本発明の一側面は、少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する搬送装置における、駆動源の行動を学習する機械学習装置における機械学習方法であって、前記搬送経路に設けられた検知部の検知結果に基づいて、前記少なくとも2つの搬送物の前記搬送経路上の位置情報を取得する状態情報取得処理と、前記取得した位置情報に基づいて、予め定めたルールに従って報酬を計算する報酬計算処理と、前記取得した位置情報と前記計算した報酬とに基づいて、強化学習における行動価値を算出することによって、行動を学習する学習処理と、学習結果に基づいて決定した行動を前記駆動源に行わせるための制御情報を生成して出力する制御情報出力処理と、を実行することを特徴とする。
本発明の一側面は、少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する搬送装置における、駆動源の行動を学習する機械学習装置で動作する機械学習プログラムであって、前記機械学習装置の制御部に、前記搬送経路に設けられた検知部の検知結果に基づいて、前記少なくとも2つの搬送物の前記搬送経路上の位置情報を取得する状態情報取得処理、前記取得した位置情報に基づいて、予め定めたルールに従って報酬を計算する報酬計算処理、前記取得した位置情報と前記計算した報酬とに基づいて、強化学習における行動価値を算出することによって、行動を学習する学習処理、学習結果に基づいて決定した行動を前記駆動源に行わせるための制御情報を生成して出力する制御情報出力処理、を実行させることを特徴とする。
本発明の機械学習装置、機械学習方法及び機械学習プログラムによれば、適切に搬送物を搬送するための駆動源の制御情報を生成することができる。
その理由は、少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する搬送装置における、駆動源の行動を学習する機械学習装置において、搬送経路に設けられた検知部の検知結果に基づいて、少なくとも2つの搬送物の搬送経路上の位置情報を取得し、取得した位置情報に基づいて、予め定めたルールに従って報酬を計算し、取得した位置情報と計算した報酬とに基づいて、強化学習における行動価値を算出することによって、行動を学習し、学習結果に基づいて決定した行動を駆動源に行わせるための制御情報を生成して出力するからである。
本発明の一実施例に係る制御システムの構成を示す模式図である。 本発明の一実施例に係る制御システムの他の構成を示す模式図である。 本発明の一実施例に係る機械学習装置の構成を示すブロック図である。 本発明の一実施例に係る画像形成装置の構成を示すブロック図である。 本発明の一実施例に係る画像形成装置の用紙搬送経路におけるセンサ及び駆動源を説明する模式図である。 本発明の一実施例に係る画像形成装置の用紙搬送経路における入出力パラメータを説明する模式図である。 本発明の一実施例に係る画像形成装置の用紙搬送経路におけるステートとアクションの関係を示すテーブルである。 本発明の一実施例に係る制御システムの概略動作を説明するブロック図である。 本発明の一実施例に係る画像形成装置の用紙搬送経路におけるセンサ及び駆動源の他の構成を説明する模式図である。 本発明の一実施例に係る機械学習装置の動作を示すフローチャート図である。 本発明の一実施例に係る機械学習装置の動作(ピッチに基づく報酬計算処理)を示すフローチャート図である。 本発明の一実施例に係る機械学習装置の動作(目標ピッチ条件設定処理)を示すフローチャート図である。 本発明の一実施例に係る機械学習装置の動作(動作時間に基づく報酬計算処理)を示すフローチャート図である。 本発明の一実施例に係る機械学習装置の動作(目標移動完了条件設定処理)を示すフローチャート図である。
背景技術で示したように、MFPなどの画像形成装置は、使用するユーザによって機械の使用環境や使用状況が異なり、機械状態が変化するため、搬送中の用紙のたわみや引っ張りなどに起因するジャムの発生しやすさが変化する。このような背景から、機械状態に応じた最適な制御が求められるが、使用環境や使用状況の組み合わせは膨大であり、あらゆる使用環境や使用状況を想定した制御を設計するためには多大な開発工数が必要になる。そこで、従来は、最悪な条件や代表的な条件においてもジャムが発生しないように制御設計を行っているが、この方法では、想定していない条件では最適な制御にならない場合がある。
そこで、本発明の一実施の形態では、AI(artificial intelligence)の機械学習(特に強化学習)を利用し、ユーザの使用環境や使用状況(湿度、温度、寿命、スリップ率、紙種、坪量、サイズ、印刷モード、印字率など)によって変動する搬送物の実際の状態に基づいて駆動源の行動を学習することによって、駆動源の最適な制御を実現する。
具体的には、少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する搬送装置における、駆動源の行動を学習する機械学習装置において、搬送経路に設けられた検知部の検知結果に基づいて、少なくとも2つの搬送物の搬送経路上の位置情報を取得し、取得した位置情報に基づいて、予め定めたルールに従って報酬を計算し、取得した位置情報と計算した報酬とに基づいて、強化学習における行動価値を算出することによって、行動を学習し、学習結果に基づいて決定した行動を駆動源に行わせるための制御情報を生成して出力する。
例えば、機械学習装置と画像形成装置とを含むシステムにおいて、機械学習装置では、用紙の搬送が開始されたら、用紙の位置情報を取得し、予め設定されたルールに従って報酬を計算し、位置情報と報酬とに基づいて、強化学習における行動価値を算出することによって行動を学習し、学習結果に基づいて決定した行動を駆動源に行わせるための制御情報を生成して出力する。画像形成装置では、その制御情報を取得し、ファームウェアをその都度又はまとめて更新することによって駆動源を制御する。
このように、用紙などの搬送物の搬送制御に強化学習を適用し、目的とする行動に対して適切な報酬を与えて行動価値を算出することによって、様々な状態に対して学習が可能となるため、ユーザの使用環境や使用状況に適した搬送物の搬送制御を自動的に構築することができ、不要なダウンタイムを削減することができる。
上記した本発明の一実施の形態についてさらに詳細に説明すべく、本発明の一実施例に係る機械学習装置、機械学習方法及び機械学習プログラムについて、図1乃至図14を参照して説明する。図1及び図2は、本実施例の制御システムの構成を示す模式図であり、図3及び図4は、各々、本実施例の機械学習装置、画像形成装置の構成を示すブロック図である。また、図5及び図9は、本実施例の画像形成装置の用紙搬送経路におけるセンサ及び駆動源を説明する模式図であり、図6は、用紙搬送経路における入出力パラメータを説明する模式図、図7は、用紙搬送経路におけるステートとアクションの関係を示すテーブルである。また、図8は、本実施例の制御システムの概略動作を説明するブロック図であり、図10乃至図14は、本実施例の機械学習装置の動作を示すフローチャート図である。
図1に示すように、本実施例の制御システム10は、機械学習装置20と、少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する搬送装置(本実施例では画像形成装置30とする。)などで構成され、これらはイーサネット(登録商標)、トークンリング、FDDI(Fiber-Distributed Data Interface)等の規格により定められるLAN(Local Area Network)やWAN(Wide Area Network)等の通信ネットワークを介して接続されている。なお、図2に示すように、機械学習装置20は画像形成装置30に包含される(画像形成装置30の制御部が機械学習装置として機能する)構成としてもよい。以下、図1のシステム構成を前提にして、各装置について詳細に説明する。
[機械学習装置]
機械学習装置20は、クラウドサービスを提供するコンピュータ装置であり、画像形成装置30の駆動源の制御条件を学習する。この機械学習装置20は、図3(a)に示すように、制御部21、記憶部25、ネットワークI/F部26、表示部27、操作部28などで構成される。
制御部21は、CPU(Central Processing Unit)22とROM(Read Only Memory)23やRAM(Random Access Memory)24などのメモリとで構成され、CPU22は、ROM23や記憶部25に記憶した制御プログラムをRAM24に展開して実行することにより、機械学習装置20全体の動作を制御する。上記制御部21は、図3(b)に示すように、状態情報取得部21a、報酬計算部21b、学習部21c、制御情報出力部21dなどとして機能する。
状態情報取得部21aは、搬送経路に設けられた検知部(センサ)の検知結果に基づいて、少なくとも2つの搬送物の搬送経路上の状態情報(位置情報)を取得する。この位置情報は、搬送経路に設けられた検知部の検知結果から取得してもよいし、検知部の検知結果及び搬送物の移動速度から算出して取得してもよいし、制御情報の出力からの経過時間及び搬送物の移動速度から算出して取得してもよいし、制御情報の出力からの経過時間及び制御情報のパルス数から算出して取得してもよい。この位置情報を算出するときに、湿度、温度、寿命、スリップ率、紙種、坪量、サイズ、印刷モード、印字率のいずれか一つを考慮することができる。すなわち、検知部の検知結果から位置情報を取得する場合は、位置情報に、湿度、温度、寿命、スリップ率、紙種、坪量、サイズ、印刷モード、印字率などのユーザの使用環境や使用状況が内在することになり、搬送物の移動速度や制御情報を出力してからの経過時間を利用して位置情報を算出する場合は、位置情報にユーザの使用環境や使用状況を含めることができる。
報酬計算部21bは、状態情報取得部21aが取得した位置情報に基づいて、予め定めたルールに従って報酬を計算する。その際、少なくとも2つの搬送物のうちの1つの搬送物が、搬送経路上の第1の位置から第2の位置に到達する時間と、予め決められた所定時間と、を比較することによって報酬を計算したり、少なくとも2つの搬送物のうちの2つの搬送物の間の距離と、予め決められた所定距離と、を比較することによって報酬を計算したりすることができる。後者の場合、搬送経路のうちの第1の領域にある搬送物に対応する報酬は第1の所定距離と比較することによって計算し、搬送経路のうちの第2の領域にある搬送物に対応する報酬は第2の所定距離と比較することによって計算したり、少なくとも2つの搬送物のうちの2つの搬送物の間の距離が所定距離よりも小さい場合は、報酬を負の値としたり、取得した位置情報と隣り合う駆動源の搬送速度とに基づいて、報酬を計算したりすることができる。また、報酬計算部21bは、取得した位置情報が一定時間変化しない場合は、報酬を負の値としたり、少なくとも2つの搬送物の停止位置に応じて、報酬を算出したりすることができる。
学習部21cは、状態情報取得部21aが取得した状態情報と報酬計算部21bが計算した報酬とに基づいて、強化学習(Q学習)における行動価値を算出することによって行動(駆動源の制御条件)を学習する。その際、取得した状態情報と計算した報酬とに加えて、湿度、温度、寿命、スリップ率のいずれか一も考慮して学習を行ったり、紙種、坪量、サイズ、印刷モード、印字率のいずれか一も考慮して学習を行ったりすることができる。
制御情報出力部21dは、学習部21cの学習結果に基づいて決定した行動(行動価値が最も高い行動)を、駆動源に行わせるための制御情報(制御信号、制御電流、周波数など)を生成して画像形成装置30に出力する。また、制御情報出力部21dは、学習部21cが湿度、温度、寿命、スリップ率のいずれか一も考慮して学習を行った場合は、紙種、坪量、サイズ、印刷モード、印字率のいずれか一も考慮して制御情報を生成することができ、学習部21cが紙種、坪量、サイズ、印刷モード、印字率のいずれか一も考慮して学習を行った場合は、湿度、温度、寿命、スリップ率のいずれか一も考慮して制御情報を生成することができる。
上記状態情報取得部21a、報酬計算部21b、学習部21c、制御情報出力部21dはハードウェアとして構成してもよいし、制御部21を状態情報取得部21a、報酬計算部21b、学習部21c、制御情報出力部21dとして機能させる機械学習プログラムとして構成し、当該機械学習プログラムをCPU22に実行させるようにしてもよい。
記憶部25は、HDD(Hard Disk Drive)やSSD(Solid State Drive)などで構成され、CPU22が各部を制御するためのプログラム、画像形成装置30から取得した状態情報(センサの検知情報や駆動源の駆動情報)、状態情報取得部21aが取得した位置情報、報酬を計算するためのルール、学習部21cが算出した行動価値や学習結果(後述するQテーブル)、制御情報出力部21dが生成した制御情報などを記憶する。
ネットワークI/F部26は、NIC(Network Interface Card)やモデムなどで構成され、機械学習装置20を通信ネットワークに接続し、画像形成装置30との接続を確立する。
表示部27は、液晶表示装置(LCD:Liquid Crystal Display)や有機EL(electroluminescence)表示装置などで構成され、各種画面を表示する。
操作部28は、マウスやキーボードなどで構成され、各種操作を可能にする。
[画像形成装置]
画像形成装置30は、少なくとも2つの搬送物(用紙)を搬送経路に沿って連続的に搬送する装置である。この画像形成装置は、図4(a)に示すように、制御部31、記憶部35、ネットワークI/F部36、表示操作部37、画像処理部38、画像読取部39、印刷処理部40などで構成される。
制御部31は、CPU32とROM33やRAM34などのメモリとで構成され、CPU32は、ROM33や記憶部35に記憶した制御プログラムをRAM34に展開して実行することにより、画像形成装置30全体の動作を制御する。上記制御部31は、図4(b)に示すように、用紙の搬送を制御する搬送制御部31aとして機能し、搬送制御部31aは、状態通知部31b、更新処理部31cなどとして機能する。
状態通知部31bは、印刷処理部40の用紙搬送経路に設けられた検知部(センサ)、駆動源(モータ、クラッチなど)を監視し、検知部の検知情報や駆動源の駆動情報(例えば、モータの回転周波数、モータ1回転当たりの用紙の搬送距離、モータの回転周波数に対応する用紙の搬送速度)などの状態情報を機械学習装置20に通知する。
更新処理部31cは、機械学習装置20から制御情報を取得し、その制御情報に基づいて、駆動源(モータ、クラッチなど)の動作を制御するファームウェアを更新する。その際、機械学習装置20から制御情報を取得するたびにファームウェアを更新してもよいし、複数の制御情報を取得した後にまとめてファームウェアを更新してもよい。
記憶部35は、HDDやSSDなどで構成され、CPU32が各部を制御するためのプログラム、自装置の処理機能に関する情報、装置情報、画像処理部38が生成した画像データなどを記憶する。
ネットワークI/F部36は、NICやモデムなどで構成され、画像形成装置30を通信ネットワークに接続し、機械学習装置20などとの通信を確立する。
表示操作部(操作パネル)37は、表示部上に透明電極が格子状に配置された感圧式や静電容量式の操作部(タッチセンサ)を設けたタッチパネルなどであり、印刷処理に関する各種画面を表示し、印刷処理に関する各種操作を可能にする。
画像処理部38は、RIP部(Raster Image Processor)として機能し、印刷ジョブを翻訳して中間データを生成し、レンダリングを行ってビットマップ形式の画像データを生成する。また、画像処理部38は、必要に応じて、画像データに対して、スクリーン処理、階調補正、濃度バランス調整、細線化、網点処理などを行う。そして、画像処理部38は、生成した画像データを印刷処理部40に出力する。
画像読取部(ADU)39は、原稿台上に載置された原稿から画像データを光学的に読み取る部分であり、原稿を走査する光源と、原稿で反射された光を電気信号に変換するCCD(Charge Coupled Devices)等のイメージセンサと、電気信号をA/D変換するA/D変換器等により構成される。そして、画像読取部39は、読み取った画像データを印刷処理部40に出力する。
印刷処理部40は、画像処理部38又は画像読取部39から取得した画像データに基づいて印刷処理を実行する。この印刷処理部40は、例えば、画像データに基づいてレーザ光を照射して露光する露光部と、感光体ドラムと現像部と帯電部と感光体クリーニング部と1次転写ローラとを備え、CMYKの各色のトナー像を形成する画像形成部と、ローラによって回転され、画像形成部で形成されたトナー像を用紙に搬送する中間転写体として機能する中間ベルトと、中間ベルト上に形成されたトナー像を用紙に転写する2次転写ローラと、用紙に転写されたトナー像を定着させる定着部と、用紙を給紙するトレイなどの給紙部と、給紙ローラやレジストローラ、ループローラ、反転ローラ、排紙ローラ(これらを総称して搬送ローラと呼ぶ。)等の搬送部、搬送部の搬送経路に設けられた、用紙の搬送位置を検出するセンサ、搬送部を駆動する駆動源(モータやモータの動力の伝達を切り替えるクラッチ)などで構成される。上記センサは用紙の搬送位置を検出できるものであればよく、例えば、光のON/OFFや電気接点の接触などに基づいて検出するものを用いることができる。また、駆動源は搬送ローラを駆動するための動力を供給できるものであればよく、モータやクラッチの種類、モータの動力の伝達構造などは特に限定されない。
なお、図1乃至図4は、本実施例の制御システム10の一例であり、各装置の構成や制御は適宜変更可能である。例えば、図4では、少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する装置として画像形成装置30を例示したが、例えば、綴じ止めや折りなどの後処理を行う後処理装置、用紙を分類する仕分け装置、用紙に形成した画像を検査する検査装置などとしてもよい。また、図1では、制御システム10を、機械学習装置20と画像形成装置30とで構成したが、制御システム10に開発部門や販社のコンピュータ装置を含めてもよく、その場合は、画像形成装置30を使用するユーザの個別要求を上記コンピュータ装置が受け付けて機械学習装置20に通知し、機械学習装置20はその個別要求に従って製品仕様を変更するようにしてもよい。
次に、上記画像形成装置30の用紙搬送経路におけるセンサ及び駆動源について説明する。図5は、印刷処理部40内の用紙搬送経路41を示す模式図であり、用紙は図の左側から右側に搬送されるものとする。この用紙搬送経路41には、例えば、複数のセンサ42(図では1〜20の位置に配置される20個のセンサ)が配置されている。また、用紙搬送経路41には、用紙を搬送する複数のローラ(図の黒塗りの丸)が配置されており、ローラの駆動源として、例えば、メインモータ43と定着モータ44と排紙モータ45とを備え、メインモータ43には、モータの動力の伝達をON/OFFする給紙クラッチ43aとタイミングクラッチ43bとを備え、排紙モータ45には、モータの動力の伝達をON/OFFする排紙クラッチ45aを備えている。なお、図5は、用紙搬送経路41の一例であり、センサ42やローラ、モータ、クラッチの数や配置は適宜変更可能である。
このような構成の用紙搬送経路41において、図6に示すように、センサ42の検出結果などの状態情報が入力パラメータとなり、メインモータ43(給紙クラッチ43a、タイミングクラッチ43b)、定着モータ44、排紙モータ45(排紙クラッチ45a)の制御信号や制御電流、周波数などの制御情報が出力パラメータとなり、機械学習装置20は、この入力パラメータと出力パラメータとの関係を学習することになる。
図7は、機械学習装置20が入力パラメータと出力パラメータとの関係を学習する際に利用するテーブルであり、(a)はステート(状態)の詳細(各センサ42のON/OFFの組み合わせ)、(b)はアクション(行動)の詳細(ここでは各クラッチのON/OFFの組み合わせ)、(c)はステート(状態)とアクション(行動)の組み合わせに対応する行動価値(Q値)を示すQテーブルである。
なお、このテーブルではセンサ42の数を14個としており、この時のステート数Nsは、
Ns=センサ状態数^センサ数=2^14=16384
となる。また、このテーブルではアクション(行動)の対象をクラッチとし、クラッチの数を3個としており、この時のアクション数Naは、
Na=クラッチ状態数^クラッチ数=2^3=8
となる。従って、Qテーブルの大きさは、
Q[Ns,Na]=Q[16384,8]となる。
機械学習装置20は、予め定めたルールに従って、ある状態の時にある行動を取ったときの報酬を計算し、報酬の総和を最適化するように、予め定めた計算式に従って行動価値(Q値)を算出してQテーブルを更新することによって行動を学習し、学習結果に基づいて行動を決定(行動価値が最も高い行動を選択)する。
なお、学習係数をα、割引報酬をγ、時刻tにおける報酬をrとすると、行動価値(Q(s,a))は、例えば、
Q(s,a)←(1−α)Q(s,a)+α(rt+1+γmaxQ(st+1,at+1))
などのQ学習の計算式によって計算することができる。
図8は、本実施例の制御システム10の用紙搬送制御の概略を示すブロック図である。画像形成装置30の搬送制御部31a(状態通知部31b)は、用紙搬送経路41に設けたセンサ42やモータの出力信号から、ステップ(所定時間)毎のセンサの検知情報や駆動源の駆動情報(例えば、モータの回転周波数)などの状態情報を取得して機械学習装置20に出力する。機械学習装置20の状態情報取得部21aは、状態情報に基づいて、状態変数として各用紙の位置情報を取得して報酬計算部21bに通知し、報酬計算部21bは位置情報に基づいて報酬を計算して学習部21cに通知する。学習部21cは、状態情報取得部21aから取得した各用紙の位置情報と報酬計算部21bから取得した報酬とに基づいて行動価値を算出することによって行動を学習し、学習結果(状態変数、各行動、行動価値)を制御情報出力部21dに通知する。制御情報出力部21dは、学習結果に基づいて決定した行動を駆動源に行わせるための、制御信号、制御電流、周波数などの制御情報を生成して画像形成装置30に通知する。画像形成装置30の搬送制御部31a(更新処理部31c)は、機械学習装置20から取得した制御情報に従って、モータやクラッチなどの駆動源を駆動するためのファームウェアを更新し、ファームウェアに従ってモータやクラッチの動作を制御する。
なお、図5では、用紙搬送経路41上に20個のセンサ42を配置し、各センサ42の出力信号(ON/OFF)から用紙の位置を特定したが、駆動源の駆動情報などを利用する場合は、実際のセンサ42(図の黒塗りの三角)の数を減らして、センサ42の出力信号とモータの駆動信号と物理パラメータ(モータ1回転当たりの用紙の搬送距離やモータの回転周波数に応じた用紙の搬送速度など)とから仮想的なセンサ42(図のドットのハッチングの三角)を配置するようにしてもよい。
以下、本実施例の機械学習装置20における機械学習方法について説明する。機械学習装置20の制御部21のCPU22は、ROM23又は記憶部25に記憶した機械学習プログラムをRAM24に展開して実行することにより、図10乃至図14のフローチャート図に示す各ステップの処理を実行する。
まず、画像形成装置30の印刷処理部40が用紙の搬送を開始すると、機械学習装置20の制御部21(状態情報取得部21a)は、画像形成装置30の制御部31(状態通知部31b)からセンサ42の検知情報や駆動源の駆動情報などの状態情報を取得し、状態情報に基づいて用紙の位置情報を取得する(S101)。この位置情報は、センサ42の検知情報から取得してもよいし、センサ42の検知情報と駆動源の駆動情報とから算出して取得してもよい。また、位置情報を算出するときに、湿度、温度、寿命、スリップ率、紙種、坪量、サイズ、印刷モード、印字率のいずれか一つを考慮することができる。
次に、制御部21(報酬計算部21b)は、用紙の位置情報に基づいて報酬を計算する(S102)。この報酬の計算の詳細については後述する。次に、制御部21(学習部21c)は、状態情報取得部21aが取得した用紙の位置情報と報酬計算部21bが計算した報酬とに基づき、上述したQ学習の計算式などを用いて行動価値(Q値)を算出することによって行動を学習し(S103)、Qテーブルを更新する(S104)。その際、学習部21cは、用紙の位置情報と報酬とに加えて、湿度、温度、寿命、スリップ率のいずれか一も考慮して学習を行ったり、紙種、坪量、サイズ、印刷モード、印字率のいずれか一も考慮して学習を行ったりすることができる。
そして、制御部21(制御情報出力部21d)は、学習結果(Qテーブル)に基づいて次の行動を決定し(S105)、決定した行動を駆動源に行わせるための制御情報(制御信号、制御電流、周波数など)を生成して画像形成装置30に出力する(S106)。その際、制御情報出力部21dは、学習部21cが湿度、温度、寿命、スリップ率のいずれか一も考慮して学習を行った場合は、紙種、坪量、サイズ、印刷モード、印字率のいずれか一も考慮して制御情報を生成することができ、学習部21cが紙種、坪量、サイズ、印刷モード、印字率のいずれか一も考慮して学習を行った場合は、湿度、温度、寿命、スリップ率のいずれか一も考慮して制御情報を生成することができる。そして、画像形成装置30の制御部31(更新処理部31c)は、機械学習装置20から制御情報を取得したら、制御信号に基づいて駆動源の動作を制御するファームウェアを更新し、更新したファームウェアに従って駆動源を駆動して用紙を搬送する。その後、S101に戻って同様の処理を繰り返す。
次に、S102の報酬計算について説明する。報酬計算の手法はいくつかあり、例えば、用紙のピッチ(用紙間の距離や時間間隔)に基づいて報酬を計算する手法、動作時間に基づいて報酬を計算する手法などがある。
図11は、用紙のピッチ(時間間隔)に基づいて報酬を計算する手法の一例である。報酬計算部21bは、目標ピッチ条件を設定する(S201)。図12はこのステップの詳細を示しており、まず、対象区間を設定する(S301)。次に、区間判定を行い(S302)、区間Aの場合は、目標ピッチを第1の値(ここでは50ms)に設定し(S303)、区間Bの場合は、目標ピッチを第2の値(ここでは200ms)に設定し(S304)、区間Cの場合は、目標ピッチを第3の値(ここでは400ms)に設定する(S305)。図11に戻って、報酬計算部21bは、センサ通過時間(ある用紙がセンサを通過してから次の用紙がセンサを通過するまでの時間、すなわち、2つの用紙の搬送時間間隔)を測定し(S202)、S202の実測とS201の目標との大小関係を判断する(S203)。実績と目標とが略等しい場合は、設定通りに用紙の搬送が行われていることから、報酬を正の所定値(例えば、+1)とし(S204)、実測が目標よりも大きい場合は、設定通りに用紙の搬送は行われてはいないが用紙同士が衝突する恐れはないことから、報酬を0とし(S205)、実測が目標よりも小さい場合は、用紙同士が衝突する恐れがあることから、報酬を負の所定値(例えば、−1)とする(S206)。
なお、図11及び図12では、2つの用紙の時間間隔に基づいて報酬を計算したが、2つの用紙の間の距離に基づいて報酬を計算してもよい。その場合、2つの用紙の間の距離が、目標とする距離よりも小さい場合は、用紙同士が衝突する恐れがあることから、報酬を負の所定値とすることができる。
図13は、動作時間に基づいて報酬を計算する手法の一例である。報酬計算部21bは、目標移動完了条件を設定する(S401)。図14はこのステップの詳細を示しており、まず、用紙の位置情報の変化から、移動速度、移動総距離を取得し、移動中停止時間を算出する(S501)。そして、これらの情報から目標移動完了条件を所定の値(ここでは600ms)に設定する(S502)。図13に戻って、報酬計算部21bは、動作開始から動作終了までの時間を測定し(S402)、実測と目標との大小関係を判断する(S403)。実績と目標とが略等しい場合は、設定通りに用紙の搬送が行われていることから、報酬を正の所定値(例えば、1)とし(S404)、実測が目標よりも大きい場合は、設定通りに用紙の搬送は行われてはいないが用紙同士が衝突する恐れはないことから、報酬を0とし(S405)、実測が目標よりも小さい場合は、用紙同士が衝突する恐れがあることから、報酬を負の所定値(例えば、−1)とする(S406)。
なお、図11及び図12では、用紙のピッチに基づいて報酬を計算する手法について説明し、図13及び図14では、動作時間に基づいて報酬を計算する手法について説明したが、用紙のピッチと動作時間の双方に基づいて報酬を計算したり、用紙のピッチ及び/又は動作時間に、他のパラメータを追加して報酬を計算したりしてもよい。
また、取得した位置情報が一定時間変化しない場合は、ジャムが発生していると考えられるため、報酬を負の値としたり、少なくとも2つの搬送物の停止位置に応じて(所定の停止位置で停止したか否かに応じて)、報酬を計算したりしてもよい。また、駆動源の駆動状態によっては(例えば、隣り合う駆動源の搬送速度が異なる場合は)、用紙のたわみや引っ張りが発生することから、このような不具合を考慮して報酬を計算するようにしてもよい。
以上説明したように、用紙の位置情報を取得し、予め設定されたルールに従って報酬を計算し、位置情報と報酬とに基づいて、強化学習における行動価値を算出することによって行動を学習し、学習結果に基づいて決定した行動を駆動源に行わせるための制御情報を出力することにより、ユーザの使用環境や使用状況に適した搬送物の搬送制御を実現することができる。
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨を逸脱しない限りにおいて、その構成や制御は適宜変更可能である。
例えば、上記実施例では、複数の用紙の搬送を制御して処理を行う画像形成装置に対して、本発明の機械学習方法を適用する場合について記載したが、複数の移動物の搬送を制御して処理を行う任意の装置に対して、本発明の機械学習方法を同様に適用することができる。
本発明は、複数の移動物の搬送を制御する搬送装置における駆動源の行動を学習する機械学習装置、機械学習方法、機械学習プログラム及び当該機械学習プログラムを記録した記録媒体に利用可能である。
10 制御システム
20 機械学習装置
21 制御部
21a 状態情報取得部
21b 報酬計算部
21c 学習部
21d 制御情報出力部
22 CPU
23 ROM
24 RAM
25 記憶部
26 ネットワークI/F部
27 表示部
28 操作部
30 画像形成装置
31 制御部
31a 搬送制御部
31b 状態通知部
31c 更新処理部
32 CPU
33 ROM
34 RAM
35 記憶部
36 ネットワークI/F部
37 表示操作部
38 画像処理部
39 画像読取部
40 印刷処理部
41 用紙搬送経路
42 センサ
43 メインモータ
43a 給紙クラッチ
43b タイミングクラッチ
44 定着モータ
45 排紙モータ
45a 排紙クラッチ

Claims (17)

  1. 少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する搬送装置における、駆動源の行動を学習する機械学習装置であって、
    前記搬送経路に設けられた検知部の検知結果に基づいて、前記少なくとも2つの搬送物の前記搬送経路上の位置情報を取得する状態情報取得部と、
    前記取得した位置情報に基づいて、予め定めたルールに従って報酬を計算する報酬計算部と、
    前記取得した位置情報と前記計算した報酬とに基づいて、強化学習における行動価値を算出することによって、行動を学習する学習部と、
    学習結果に基づいて決定した行動を前記駆動源に行わせるための制御情報を生成して出力する制御情報出力部と、を備える、
    ことを特徴とする機械学習装置。
  2. 前記状態情報取得部は、前記位置情報を、前記検知部の検知結果から取得、前記検知部の検知結果及び前記搬送物の移動速度から算出して取得、前記制御情報の出力からの経過時間及び前記搬送物の移動速度から算出して取得、又は、前記制御情報の出力からの経過時間及び前記制御情報のパルス数から算出して取得する、
    ことを特徴とする請求項1に記載の機械学習装置。
  3. 前記報酬計算部は、前記少なくとも2つの搬送物のうちの1つの搬送物が、前記搬送経路上の第1の位置から第2の位置に到達する時間と、予め決めた所定時間と、を比較することによって、前記報酬を計算する、
    ことを特徴とする請求項1又は2に記載の機械学習装置。
  4. 前記報酬計算部は、前記少なくとも2つの搬送物のうちの2つの搬送物の間の距離と、予め決めた所定距離と、を比較することによって、前記報酬を計算する、
    ことを特徴とする請求項1又は2に記載の機械学習装置。
  5. 前記報酬計算部は、前記搬送経路のうちの第1の領域にある前記搬送物に対応する報酬は、第1の所定距離と比較することによって計算し、前記搬送経路のうちの第2の領域にある前記搬送物に対応する報酬は、第2の所定距離と比較することによって計算する、
    ことを特徴とする請求項4に記載の機械学習装置。
  6. 前記報酬計算部は、前記少なくとも2つの搬送物のうちの2つの搬送物の間の距離が前記所定距離よりも小さい場合は、前記報酬を負の値とする、
    ことを特徴とする請求項4又は5に記載の機械学習装置。
  7. 前記報酬計算部は、前記取得した位置情報と隣り合う前記駆動源の搬送速度とに基づいて、前記報酬を計算する、
    ことを特徴とする請求項1乃至6のいずれか一に記載の機械学習装置。
  8. 前記報酬計算部は、前記取得した位置情報が一定時間変化しない場合は、前記報酬を負の値とする、
    ことを特徴とする請求項1乃至7のいずれか一に記載の機械学習装置。
  9. 前記報酬計算部は、前記少なくとも2つの搬送物の停止位置に応じて、前記報酬を計算する、
    ことを特徴とする請求項1乃至8のいずれか一に記載の機械学習装置。
  10. 前記駆動源は、モータ又は前記モータの動力の伝達を切り替えるクラッチであり、
    前記制御情報は、前記モータ及び/又は前記クラッチを動作させる制御信号、制御電流、周波数である、
    ことを特徴とする請求項1乃至9のいずれか一に記載の機械学習装置。
  11. 前記搬送装置は、用紙を搬送して印刷する画像形成装置である、
    ことを特徴とする請求項1乃至10のいずれか一に記載の機械学習装置。
  12. 前記状態情報取得部は、前記位置情報を算出する際に、湿度、温度、寿命、スリップ率、紙種、坪量、サイズ、印刷モード、印字率のいずれか一も考慮する、
    ことを特徴とする請求項11に記載の機械学習装置。
  13. 前記学習部は、前記取得した位置情報と前記計算した報酬とに加えて、湿度、温度、寿命、スリップ率のいずれか一も考慮して学習を行い、
    前記制御情報出力部は、紙種、坪量、サイズ、印刷モード、印字率のいずれか一も考慮して前記制御情報を生成する、
    ことを特徴とする請求項11又は12に記載の機械学習装置。
  14. 前記学習部は、前記取得した位置情報と前記計算した報酬とに加えて、紙種、坪量、サイズ、印刷モード、印字率のいずれか一も考慮して学習を行い、
    前記制御情報出力部は、湿度、温度、寿命、スリップ率のいずれか一も考慮して前記制御情報を生成する、
    ことを特徴とする請求項11乃至13のいずれか一に記載の機械学習装置。
  15. 請求項1乃至14のいずれか一の前記機械学習装置を備える搬送装置。
  16. 少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する搬送装置における、駆動源の行動を学習する機械学習装置における機械学習方法であって、
    前記搬送経路に設けられた検知部の検知結果に基づいて、前記少なくとも2つの搬送物の前記搬送経路上の位置情報を取得する状態情報取得処理と、
    前記取得した位置情報に基づいて、予め定めたルールに従って報酬を計算する報酬計算処理と、
    前記取得した位置情報と前記計算した報酬とに基づいて、強化学習における行動価値を算出することによって、行動を学習する学習処理と、
    学習結果に基づいて決定した行動を前記駆動源に行わせるための制御情報を生成して出力する制御情報出力処理と、を実行する、
    ことを特徴とする機械学習方法。
  17. 少なくとも2つの搬送物を搬送経路に沿って連続的に搬送する搬送装置における、駆動源の行動を学習する機械学習装置で動作する機械学習プログラムであって、
    前記機械学習装置の制御部に、
    前記搬送経路に設けられた検知部の検知結果に基づいて、前記少なくとも2つの搬送物の前記搬送経路上の位置情報を取得する状態情報取得処理、
    前記取得した位置情報に基づいて、予め定めたルールに従って報酬を計算する報酬計算処理、
    前記取得した位置情報と前記計算した報酬とに基づいて、強化学習における行動価値を算出することによって、行動を学習する学習処理、
    学習結果に基づいて決定した行動を前記駆動源に行わせるための制御情報を生成して出力する制御情報出力処理、を実行させる、
    ことを特徴とする機械学習プログラム。
JP2019134502A 2019-07-22 2019-07-22 機械学習装置、機械学習方法及び機械学習プログラム Pending JP2021018644A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019134502A JP2021018644A (ja) 2019-07-22 2019-07-22 機械学習装置、機械学習方法及び機械学習プログラム
US16/923,509 US12010280B2 (en) 2019-07-22 2020-07-08 Machine learning device, machine learning method, and machine learning program
CN202010685334.2A CN112286050B (zh) 2019-07-22 2020-07-16 机器学习装置、机器学习方法以及机器学习程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019134502A JP2021018644A (ja) 2019-07-22 2019-07-22 機械学習装置、機械学習方法及び機械学習プログラム

Publications (1)

Publication Number Publication Date
JP2021018644A true JP2021018644A (ja) 2021-02-15

Family

ID=74187589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019134502A Pending JP2021018644A (ja) 2019-07-22 2019-07-22 機械学習装置、機械学習方法及び機械学習プログラム

Country Status (3)

Country Link
US (1) US12010280B2 (ja)
JP (1) JP2021018644A (ja)
CN (1) CN112286050B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11645498B2 (en) * 2019-09-25 2023-05-09 International Business Machines Corporation Semi-supervised reinforcement learning
JP2023114275A (ja) * 2022-02-04 2023-08-17 キヤノン株式会社 情報処理装置、システム、情報処理装置の制御方法及びプログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05201564A (ja) * 1992-01-24 1993-08-10 Ricoh Co Ltd 紙送り装置
JP2006072101A (ja) * 2004-09-03 2006-03-16 Fuji Xerox Co Ltd 画像形成装置
JP2007079011A (ja) * 2005-09-13 2007-03-29 Canon Inc 画像形成装置
JP2008181024A (ja) * 2007-01-25 2008-08-07 Ricoh Co Ltd 画像形成装置、制御方法、制御プログラム、及び記憶媒体
JP2013238682A (ja) * 2012-05-14 2013-11-28 Konica Minolta Inc 画像形成装置
JP2017034844A (ja) * 2015-07-31 2017-02-09 ファナック株式会社 ゲインの最適化を学習する機械学習装置及び機械学習装置を備えた電動機制御装置並びに機械学習方法
US20180032841A1 (en) * 2016-08-01 2018-02-01 Siemens Healthcare Gmbh Medical Scanner Teaches Itself To Optimize Clinical Protocols And Image Acquisition
JP2018111154A (ja) * 2017-01-11 2018-07-19 富士ゼロックス株式会社 ロボット装置及びプログラム
JP2019034836A (ja) * 2017-08-18 2019-03-07 ファナック株式会社 制御装置及び機械学習装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100739736B1 (ko) * 2005-09-22 2007-07-13 삼성전자주식회사 화상형성장치 및 이에 적용되는 급지방법
US20090057997A1 (en) * 2007-08-31 2009-03-05 Seiko Epson Corporation Printer, drive control method, and motor control program for printer
CN101739601B (zh) 2008-11-12 2013-03-06 长春工程学院 一种用于开发强化学习系统的框架及方法
JP5444982B2 (ja) * 2009-09-15 2014-03-19 株式会社リコー 画像形成装置及び用紙搬送制御方法
JP5510636B2 (ja) * 2009-10-20 2014-06-04 セイコーエプソン株式会社 被搬送材搬送装置及び画像処理装置
JP5482493B2 (ja) * 2010-06-17 2014-05-07 ブラザー工業株式会社 画像形成装置
JP5195860B2 (ja) 2010-09-28 2013-05-15 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置
JP5790635B2 (ja) * 2012-12-19 2015-10-07 コニカミノルタ株式会社 画像形成装置
US10096067B1 (en) * 2014-01-24 2018-10-09 Allstate Insurance Company Reward system related to a vehicle-to-vehicle communication system
JP6506016B2 (ja) * 2014-11-28 2019-04-24 理想科学工業株式会社 給紙装置
CN106541714B (zh) * 2015-09-16 2018-09-21 山东新北洋信息技术股份有限公司 一种标签打印机的控制方法及标签打印机
JP6744208B2 (ja) * 2016-12-27 2020-08-19 株式会社日立製作所 制御装置及び制御方法
US10134279B1 (en) * 2017-05-05 2018-11-20 Toyota Motor Engineering & Manufacturing North America, Inc. Systems and methods for visualizing potential risks
JP6697491B2 (ja) * 2018-01-25 2020-05-20 ファナック株式会社 機械学習装置、サーボモータ制御装置、サーボモータ制御システム、及び機械学習方法
US11107002B2 (en) * 2018-06-11 2021-08-31 Traxen Inc. Reinforcement learning based ground vehicle control techniques

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05201564A (ja) * 1992-01-24 1993-08-10 Ricoh Co Ltd 紙送り装置
JP2006072101A (ja) * 2004-09-03 2006-03-16 Fuji Xerox Co Ltd 画像形成装置
JP2007079011A (ja) * 2005-09-13 2007-03-29 Canon Inc 画像形成装置
JP2008181024A (ja) * 2007-01-25 2008-08-07 Ricoh Co Ltd 画像形成装置、制御方法、制御プログラム、及び記憶媒体
JP2013238682A (ja) * 2012-05-14 2013-11-28 Konica Minolta Inc 画像形成装置
JP2017034844A (ja) * 2015-07-31 2017-02-09 ファナック株式会社 ゲインの最適化を学習する機械学習装置及び機械学習装置を備えた電動機制御装置並びに機械学習方法
US20180032841A1 (en) * 2016-08-01 2018-02-01 Siemens Healthcare Gmbh Medical Scanner Teaches Itself To Optimize Clinical Protocols And Image Acquisition
JP2018111154A (ja) * 2017-01-11 2018-07-19 富士ゼロックス株式会社 ロボット装置及びプログラム
JP2019034836A (ja) * 2017-08-18 2019-03-07 ファナック株式会社 制御装置及び機械学習装置

Also Published As

Publication number Publication date
CN112286050B (zh) 2023-05-30
US12010280B2 (en) 2024-06-11
US20210029255A1 (en) 2021-01-28
CN112286050A (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
US10757295B2 (en) Printing apparatus, control method for printing apparatus, and storage medium for generating an image forming condition based on a reading result
CN103809415B (zh) 图像形成装置
JP2017142342A (ja) 画像形成装置
CN112286050B (zh) 机器学习装置、机器学习方法以及机器学习程序
US20210088985A1 (en) Machine learning device, machine learning method, and machine learning program
US9354574B2 (en) Method of controlling performance of auto color registration and image forming apparatus using the same
JP2013148664A (ja) 画像形成装置
US8644723B2 (en) Image forming apparatus
JP2019025721A (ja) 画像形成装置および画像形成装置の制御方法
US20160148081A1 (en) Printing apparatus, control method in printing apparatus, and storage medium
JP2018101121A (ja) 画像形成装置
JP2009063660A (ja) 画像形成装置
JP2006309140A (ja) 画像形成装置および画像形成方法
JP2007036411A (ja) 画像処理装置および画像処理方法
JP5381324B2 (ja) 画像形成制御装置、画像形成装置および画像形成制御方法
JP2011164609A (ja) 画像形成装置および画像濃度補正方法
JP2017044940A (ja) データ生成装置、画像形成装置及びデータ生成方法
JP2022037951A (ja) 情報処理装置、用紙情報通知方法及びプログラム
JP5381532B2 (ja) 画像形成制御装置、画像形成装置、および画像形成制御方法
JP7439459B2 (ja) 機械学習装置、搬送装置、画像形成装置、機械学習方法、およびプログラム
JP2015093403A (ja) 画像形成装置及び画像形成システム
US20210362970A1 (en) Paper feeder, image forming apparatus, and non-transitory computer readable medium
JP2005258384A (ja) 異常判定方法、並びにこれを用いる異常判定装置及び画像形成装置。
JP2021195209A (ja) 学習方法、搬送装置及び画像形成装置
JP2021005003A (ja) 画像形成装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190821

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20191120

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20191122

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230707

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231024