JP2021088417A - 給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置 - Google Patents
給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置 Download PDFInfo
- Publication number
- JP2021088417A JP2021088417A JP2019217741A JP2019217741A JP2021088417A JP 2021088417 A JP2021088417 A JP 2021088417A JP 2019217741 A JP2019217741 A JP 2019217741A JP 2019217741 A JP2019217741 A JP 2019217741A JP 2021088417 A JP2021088417 A JP 2021088417A
- Authority
- JP
- Japan
- Prior art keywords
- paper
- learning
- unit
- feeding device
- fan
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Sheets, Magazines, And Separation Thereof (AREA)
Abstract
【課題】用紙の種類や装置の設置環境によらずに、高精度な用紙供給を実施することが可能な給紙装置システムを提供する。【解決手段】空気の吹き出しによって給紙トレイ上の用紙束から用紙を浮上させる機能を有するファンと、前記浮上させた用紙を吸着して搬送する吸着搬送部と、駆動制御プログラムに基づいて前記ファンと前記吸着搬送部の駆動を制御する駆動制御部と、前記吸着搬送部によって前記用紙が所定位置にまで搬送される搬送時間に基づいて報酬を付与する強化学習の実施により、前記駆動制御プログラムを更新するための制御情報を作成する学習装置と備えた給紙装置システムである。【選択図】図4
Description
本発明は、給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置に関する。
複写機、プリンタ装置、ファクシミリ装置、印刷機、複合機等の画像形成装置には、用紙を積層した用紙束から一枚の用紙を取り出して搬送する給紙装置が装備されている。このような給紙装置の一つとして、用紙束から用紙を浮上させるための空気を吹き出すファン、および浮上した用紙を1枚ずつに分離するための空気を吹き出すファンを備え、分離した最上部の用紙を吸着ベルトに吸着させて搬送する方式のものがある。
このような方式の給紙装置においては、一度に複数枚の用紙が搬送される重送が発生した場合、用紙詰まり等の異常発生の原因となる。そこで、用紙の搬送状況を検出する検出手段と、検出手段の検出結果に応じてファンから吹き出す空気の流量を調整する調整手段を設けることにより、空気の流量を適正化して重送を抑止する構成が提案されている(下記特許文献1参照)。
しかしながら、検出手段での検出結果に応じてファンから吹き出す空気の流量を調整する構成では、経験に基づいて予め設定された仕様に基づき、予め設定されたパターンにしたがった流量調整しか行うことができない。このため、実際に使用される多種多様な種類の用紙や、様々な装置環境に対して装置性能を満足するような調整を実施することは難しかった。
そこで本発明は、用紙の種類や装置の設置環境によらずに、高精度な用紙供給を実施することが可能な給紙装置システム、給紙装置、および給紙装置制御プログラムを提供することを目的とする。また本発明は、これらの給紙装置システム、給紙装置、給紙装置制御プログラムを用いることにより、複数枚の用紙に対して連続した円滑な画像形成が可能な画像形成装置を提供することを目的とする。
このような目的を達成するための本発明は、空気の吹き出しによって給紙トレイ上の用紙束から用紙を浮上させる機能を有するファンと、前記浮上させた用紙を吸着して搬送する吸着搬送部と、駆動制御プログラムに基づいて前記ファンと前記吸着搬送部の駆動を制御する駆動制御部と、前記吸着搬送部によって前記用紙が所定位置にまで搬送される搬送時間に基づいて報酬を付与する強化学習の実施により、前記駆動制御プログラムを更新するための制御情報を作成する学習装置と備えた給紙装置システムである。
本発明によれば、用紙の種類や装置の設置環境によらずに、高精度な用紙供給を実施することが可能な給紙装置システム、給紙装置、および給紙装置制御プログラムを提供すること、および複数枚の用紙に対して連続した円滑な画像形成が可能な画像形成装置を提供することができる。
以下、本発明の給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置を実施するための形態を、図面に基づいて説明する。なお以下の説明において、各図に共通の部材には同一の符号を付し、重複する説明は省略する。
≪給紙装置システム≫
図1は、本発明の実施形態に係る給紙装置システム1の概略構成図である。また図2は、本実施形態の給紙装置本体10の概略断面図であって、図1のA−A’断面に相当する図である。これらの図に示す給紙装置システム1は、給紙装置本体10と、学習装置20(図1のみに図示)とを備える。
図1は、本発明の実施形態に係る給紙装置システム1の概略構成図である。また図2は、本実施形態の給紙装置本体10の概略断面図であって、図1のA−A’断面に相当する図である。これらの図に示す給紙装置システム1は、給紙装置本体10と、学習装置20(図1のみに図示)とを備える。
このうち給紙装置本体10は、積層複数の用紙Pを積層した用紙束Pbに空気を吹き付けることで用紙Pを浮上させて分離し、分離した1枚の用紙Pを搬送方向Xに搬送する空気分離方式のものである。このような給紙装置本体10は、用紙Pが積載される給紙トレイ11、用紙規制部材12、側方ファン13L,13R、先端ファン14、吸着搬送部15、用紙搬送部16(図2のみに図示)、制御部17、および入力部18(図1のみに図示)を備えている。また給紙装置本体10は、図2のみに図示した、用紙位置センサーPS1〜PS4、重送センサーDfS、および開閉センサーOpSを備えている。
一方、学習装置20は、給紙装置本体10を駆動するためのファームウェアである駆動制御プログラムを更新するための強化学習を実施するものである。この学習装置20は、複数の給紙装置本体10によって共有される構成のものであってもよい。さらに学習装置20は、給紙装置本体10または複数の給紙装置本体10を備えた給紙システムに組み込まれ、これらと共に給紙装置を構成してもよい。
以下、図1および図2に基づき、必要に応じて他の図を参照しつつ、本実施形態に係る給紙装置システム1の詳細を、給紙装置本体10の構成要素から順に説明し、次いで給紙装置本体10の駆動の概要を説明し、その後、学習装置20の詳細を説明する。
<給紙トレイ11>
給紙トレイ11は、図示しない昇降機構によって、図中の白抜き矢印に示すように昇降可能となっている。すなわち、用紙Pは給紙トレイ11上に昇降可能に収容されている。また、ここでの詳細な説明は省略するが、給紙トレイ11は、上部に積載された用紙束Pbの高さが、以降に説明する側方ファン13L,13R、および先端ファン14からの空気の吹き付けによる用紙Pの浮上および用紙Pの分離に最適な高さを維持する構成となっている。
給紙トレイ11は、図示しない昇降機構によって、図中の白抜き矢印に示すように昇降可能となっている。すなわち、用紙Pは給紙トレイ11上に昇降可能に収容されている。また、ここでの詳細な説明は省略するが、給紙トレイ11は、上部に積載された用紙束Pbの高さが、以降に説明する側方ファン13L,13R、および先端ファン14からの空気の吹き付けによる用紙Pの浮上および用紙Pの分離に最適な高さを維持する構成となっている。
<用紙規制部材12>
用紙規制部材12は、給紙トレイ11上における用紙Pの載置位置を規制する部材であって、給紙トレイ11上に積載された用紙Pの四方向に配置されている。このような用紙規制部材12は、前端規制部材12A、後端規制部材12B、側部規制部材12L,12Rである。
用紙規制部材12は、給紙トレイ11上における用紙Pの載置位置を規制する部材であって、給紙トレイ11上に積載された用紙Pの四方向に配置されている。このような用紙規制部材12は、前端規制部材12A、後端規制部材12B、側部規制部材12L,12Rである。
[前端規制部材12A]
前端規制部材12Aは、給紙トレイ11上に積載された用紙Pの搬送方向Xの前方に配置され、用紙Pの搬送方向Xの前端位置を規制している。ここで用紙Pの搬送方向Xとは、以降に説明する吸着搬送部15が用紙Pを搬送する方向である。このような前端規制部材12Aは、例えば板状の部材であって、上端部を切り欠いた前端開口121(図2のみに図示)を有する。この前端開口121は、以降に説明する先端ファン14から吹き出された空気を、用紙束Pbの前端側から給紙トレイ11上に積載された用紙Pの用紙束Pbの上部に吹き付けるための開口となっている。
前端規制部材12Aは、給紙トレイ11上に積載された用紙Pの搬送方向Xの前方に配置され、用紙Pの搬送方向Xの前端位置を規制している。ここで用紙Pの搬送方向Xとは、以降に説明する吸着搬送部15が用紙Pを搬送する方向である。このような前端規制部材12Aは、例えば板状の部材であって、上端部を切り欠いた前端開口121(図2のみに図示)を有する。この前端開口121は、以降に説明する先端ファン14から吹き出された空気を、用紙束Pbの前端側から給紙トレイ11上に積載された用紙Pの用紙束Pbの上部に吹き付けるための開口となっている。
なお、前端規制部材12Aは、次に説明する先端ファン14を収容する箱状の筐体であってもよい。この場合、前端規制部材12Aは、給紙トレイ11側に向く部分と、給紙トレイ11側において上方に向く部分とに設けられ、これらの部分は連通していてもよい。
[後端規制部材12B]
後端規制部材12Bは、給紙トレイ11上に積載された用紙Pの搬送方向Xの後端側に配置さている。この後端規制部材12Bは、用紙Pの搬送方向Xに移動自在に構成された板状の部材であって、給紙トレイ11上に積載された用紙Pを、搬送方向Xの後端側から軽く押圧することによって用紙Pの搬送方向Xの後端位置を規制している。
後端規制部材12Bは、給紙トレイ11上に積載された用紙Pの搬送方向Xの後端側に配置さている。この後端規制部材12Bは、用紙Pの搬送方向Xに移動自在に構成された板状の部材であって、給紙トレイ11上に積載された用紙Pを、搬送方向Xの後端側から軽く押圧することによって用紙Pの搬送方向Xの後端位置を規制している。
[側部規制部材12L,12R]
側部規制部材12L,12Rは、給紙トレイ11上に積載された用紙Pの幅方向Yの両側に配置されている。用紙Pの幅方向Yとは、給紙トレイ11上に積載された用紙Pの搬送方向Xに対して垂直な方向である。これらの側部規制部材12L,12Rは、幅方向Yに移動自在に設けられており、給紙トレイ11上に積載された用紙Pの用紙幅に対応して、用紙Pを両側から軽く押圧することによって用紙Pの両側位置を規制する。
側部規制部材12L,12Rは、給紙トレイ11上に積載された用紙Pの幅方向Yの両側に配置されている。用紙Pの幅方向Yとは、給紙トレイ11上に積載された用紙Pの搬送方向Xに対して垂直な方向である。これらの側部規制部材12L,12Rは、幅方向Yに移動自在に設けられており、給紙トレイ11上に積載された用紙Pの用紙幅に対応して、用紙Pを両側から軽く押圧することによって用紙Pの両側位置を規制する。
またこれらの側部規制部材12L,12Rは、次に説明する側方ファン13L,13Rを収容する筐体として構成されている。このような側部規制部材12L,12Rは、給紙トレイ11側に向く上方部分に側部開口122を有し、給紙トレイ11上に積載された用紙Pの用紙束Pbの上部に、用紙束Pbの幅方向Yの両側方から空気を吹き付ける構成となっている。
<側方ファン13L,13R>
側方ファン13L,13Rは、用紙束Pbの上部の用紙Pを浮上させる浮上ファンとして用いられるものであり、側部規制部材12L,12Rの内部に収容されている。各側方ファン13L,13Rは、送風管131を有し、送風管131の吹出口132は、側部規制部材12L,12Rの側部開口122に一致して設けられている。これにより、側方ファン13L,13Rは、用紙Pの搬送方向Xに直交する幅方向Yの両側から用紙束Pbの上部に空気を吹き付け、用紙束Pbの上部の用紙Pを浮上させる浮上ファンとして機能する。このような側方ファン13L,13Rは、以降に説明する制御部17からの指示に基づいて、オン/オフおよび風量の調整が自在である。
側方ファン13L,13Rは、用紙束Pbの上部の用紙Pを浮上させる浮上ファンとして用いられるものであり、側部規制部材12L,12Rの内部に収容されている。各側方ファン13L,13Rは、送風管131を有し、送風管131の吹出口132は、側部規制部材12L,12Rの側部開口122に一致して設けられている。これにより、側方ファン13L,13Rは、用紙Pの搬送方向Xに直交する幅方向Yの両側から用紙束Pbの上部に空気を吹き付け、用紙束Pbの上部の用紙Pを浮上させる浮上ファンとして機能する。このような側方ファン13L,13Rは、以降に説明する制御部17からの指示に基づいて、オン/オフおよび風量の調整が自在である。
なお、各側方ファン13L,13Rの吹出口132からの空気の吹き出し方向は、幅方向Yに完全に一致している必要はなく、次に説明する先端ファン14からの空気の吹き出しとのバランスを考慮し、必要に応じた角度で搬送方向Xに向けられていていることとする。また各側方ファン13L,13Rの吹出口132からの空気の吹き出しの高さ方向、すなわち搬送方向Xおよび幅方向Yに対して垂直な方向の角度も同様である。
以上のような側方ファン13L,13Rは、側部規制部材12L,12R内に収容されているため、用紙Pのサイズが変更された場合でも、側部規制部材12L,12Rを移動させることによって、側方ファン13L,13Rも一緒に移動することになる。なお、本例では、2つの側方ファン13L,13Rを用紙Pの両側に設ける構成を採っているが、片側だけに側方ファン13L,13Rを設ける構成としてもよい。
<先端ファン14>
先端ファン14は、用紙束Pbから浮上した複数の用紙Pを捌いて分離させるための分離ファン、および用紙束Pbの上部の用紙Pを浮上させる浮上ファンとで機能を切り替えて用いられる機能切替ファンである。このような先端ファン14は、前端規制部材12Aに近接して配置されている。前端規制部材12Aが、筐体として構成されている場合であれば、先端ファン14は前端規制部材12Aの内部に収容されていることとする。このような先端ファン14は、送風管141を有する。送風管141の吹出口142(図2のみに図示)は、前端規制部材12Aの前端開口121に一致して設けられている。
先端ファン14は、用紙束Pbから浮上した複数の用紙Pを捌いて分離させるための分離ファン、および用紙束Pbの上部の用紙Pを浮上させる浮上ファンとで機能を切り替えて用いられる機能切替ファンである。このような先端ファン14は、前端規制部材12Aに近接して配置されている。前端規制部材12Aが、筐体として構成されている場合であれば、先端ファン14は前端規制部材12Aの内部に収容されていることとする。このような先端ファン14は、送風管141を有する。送風管141の吹出口142(図2のみに図示)は、前端規制部材12Aの前端開口121に一致して設けられている。
図3は、本実施形態の給紙装置本体10の要部拡大図であって、先端ファン14の上部を含む部分を拡大した概要図である。この図に示すように、先端ファン14は、送風管141の吹出口142側に、先端ファン14からの空気の吹き出し角度を制御するための先端シャッター143を備えている。先端シャッター143は、切替駆動部144を備える。切替駆動部144は、ソレノイドであって、以降に説明する制御部17(図1および図2参照)による制御に基づいて駆動し、先端ファン14からの空気の吹き出し角度を可変とし、先端ファン14の機能を、用紙Pの浮上用と分離用とで切り替える。
より具体的には、切替駆動部144の駆動により、送風管141の吹出口142側の下方を先端シャッター143で閉じることにより、図3中の実線矢印に示すように、先端ファン14からの空気の吹き出し角度が上方側となる。これにより、先端ファン14は、上方に浮上した複数の用紙P間に空気を吹き込んで用紙Pを分離する分離ファンとして機能するようになる。
これに対し、切替駆動部144の駆動により、送風管141の吹出口142側の上方を先端シャッター143で閉じる(図3中の二点鎖線の状態とする)ことにより、図3中の破線矢印で示すように、先端ファン14からの空気の吹き出し角度が水平側となる。これにより、先端ファン14は、用紙Pの搬送方向Xから用紙束Pbの上部に空気を吹き付け、用紙束Pbの上部の用紙Pを浮上させる浮上ファンとして機能するようになる。
以上のように、先端ファン14は、送風管141の吹出口142側に配置した先端シャッター143を切替駆動部144によって駆動することにより、分離ファンまたは浮上ファンのいずれか一方に切り替えられる。このような先端ファン14は、以降に説明する制御部17からの指示に基づいて、分離ファンと浮上ファンとの機能の切り替えと、オン/オフ、および風量の調整が自在である。
<吸着搬送部15>
図1および図2に戻り、吸着搬送部15は、用紙Pの搬送方向Xの前端部上方に配置されている。この吸着搬送部15は、駆動ローラー151、2つの従動ローラー152A,152B、吸着ベルト153、および吸引装置154を有する。
図1および図2に戻り、吸着搬送部15は、用紙Pの搬送方向Xの前端部上方に配置されている。この吸着搬送部15は、駆動ローラー151、2つの従動ローラー152A,152B、吸着ベルト153、および吸引装置154を有する。
駆動ローラー151は、用紙Pの幅方向Yに軸を向けた状態で、用紙Pの搬送方向Xの上流側に配置されている。従動ローラー152A,152Bは、用紙Pの積層方向に並べて配置されている。これらの従動ローラー152A,152Bは、駆動ローラー151に対して軸を平行に保った状態で、駆動ローラー151に対して用紙Pの搬送方向Xの下流側に所定の距離だけ離間して配置されている。
吸着ベルト153は、無端状のものであって、駆動ローラー151と、従動ローラー152A,152Bとにわたって巻回されている。この吸着ベルト153は、多数の小径の貫通孔153a(図1のみに図示)を有する。
吸引装置154は、駆動ローラー151と、従動ローラー152A,152Bとの間で、これらに巻回された吸着ベルト153の内周部に配置されている。吸引装置154は、吸着ベルト153に穿設された貫通孔153aを介して用紙Pを上方から吸引する。すなわち、吸着搬送部15は、吸引装置154によって吸着ベルト153に用紙Pを吸着させつつ、駆動ローラー151の駆動による吸着ベルト153の回動によって用紙Pを搬送方向Xに搬送する。
この吸引装置154は、用紙Pの搬送方向(X方向)に沿って2つの吸引ダクトに分割され、一方の吸引ダクトのみで用紙Pを吸引する場合と、2つの吸引ダクトで用紙Pを吸引する場合とに切り換え可能な構成となっていてもよい。
以上のような吸着搬送部15は、以降に説明する制御部17からの指示に基づいて、駆動ローラー151による用紙Pの搬送のオン/オフ、および吸引装置154による用紙Pの吸着のオン/オフが自在である。
<用紙搬送部16>
図2に示すように、用紙搬送部16は、吸着搬送部15における用紙Pの搬送方向Xの下流側に配置されている。この用紙搬送部16は、下方ガイド部材161、上方ガイド部材162、下方搬送ローラー163、および上方搬送ローラー164を備える。
図2に示すように、用紙搬送部16は、吸着搬送部15における用紙Pの搬送方向Xの下流側に配置されている。この用紙搬送部16は、下方ガイド部材161、上方ガイド部材162、下方搬送ローラー163、および上方搬送ローラー164を備える。
下方ガイド部材161および上方ガイド部材162は、例えば板状のものであって、吸着搬送部15から搬送された用紙Pの経路を、上下方向から間隔を設けて挟むように配置されている。また下方ガイド部材161は、下方搬送ローラー163を回動自在に支持する。上方ガイド部材162は、上方搬送ローラー164を回動自在に支持する。
下方搬送ローラー163および上方搬送ローラー164は、それぞれが下方ガイド部材161と上方ガイド部材162とに対して回動自在に支持された状態で、用紙Pを挟持するニップ部を形成する。これらの下方搬送ローラー163および上方搬送ローラー164は、ニップした用紙Pを搬送方向Xに排出する。
<制御部17>
図4は、本発明の実施形態に係る給紙装置システム1のブロック図である。以下、図4に基づき、先の図1〜図3を参照しつつ、制御部17の構成を説明する。制御部17は、以降に説明する入力部18、用紙位置センサーPS1〜PS4、重送センサーDfS、および開閉センサーOpSに接続され、これらで検知した信号が入力される。また制御部17は、側方ファン13L,13R、先端ファン14、先端ファン14に設けた切替駆動部144、吸着搬送部15、用紙搬送部16に接続され、これらの駆動を制御する。さらに制御部17は、以降に説明する学習装置20に接続され、学習装置20との間での通信が可能である。
図4は、本発明の実施形態に係る給紙装置システム1のブロック図である。以下、図4に基づき、先の図1〜図3を参照しつつ、制御部17の構成を説明する。制御部17は、以降に説明する入力部18、用紙位置センサーPS1〜PS4、重送センサーDfS、および開閉センサーOpSに接続され、これらで検知した信号が入力される。また制御部17は、側方ファン13L,13R、先端ファン14、先端ファン14に設けた切替駆動部144、吸着搬送部15、用紙搬送部16に接続され、これらの駆動を制御する。さらに制御部17は、以降に説明する学習装置20に接続され、学習装置20との間での通信が可能である。
このような制御部17は、マイクロコンピューターなどの計算機によって構成されている。計算機は、いわゆるコンピューターとして用いられるハードウェアであって、ここでの図示を省略したCPU(Central Processing Unit)、RAM(Random Access Memory)、およびROM(Read Only Memory)やHDD(hard disk drive)のような不揮発性の記憶部を備える。また計算機は、RTC(real-time clock)および通信インタフェースを備えている。
以上のような計算機によって構成された制御部17は、機能要素として駆動制御部171と、学習情報収集部172と、学習情報通知部173と、更新処理部174とを有する。これらの各機能要素によって実行される手順は、ROMに保存されたプログラム、または外部装置からRAMにロードされて保存されたプログラムであることとする。以下、これらの各機能要素を説明する。
[駆動制御部171]
駆動制御部171は、入力部18からの指示、用紙位置センサーPS1〜PS4、重送センサーDfS、および開閉センサーOpSから入力された信号に基づいて、給紙装置本体10の各駆動部分の駆動を制御する。駆動制御部171による給紙装置本体10の各駆動部分の駆動の制御は、駆動制御プログラムに従って実施される。
駆動制御部171は、入力部18からの指示、用紙位置センサーPS1〜PS4、重送センサーDfS、および開閉センサーOpSから入力された信号に基づいて、給紙装置本体10の各駆動部分の駆動を制御する。駆動制御部171による給紙装置本体10の各駆動部分の駆動の制御は、駆動制御プログラムに従って実施される。
駆動制御プログラムは、例えば(1)側方ファン13L,13Rのオン/オフ、(2)先端ファン14のオン/オフ、(3)先端ファン14の機能の切り替え、(4)側方ファン13L,13Rの風量、および(5)先端ファン14の風量の制御を含む。また駆動制御プログラムは、(6)吸着搬送部15における駆動ローラー151の駆動、および(7)用紙搬送部16の駆動の制御を含む。
以上の駆動制御プログラムに従った駆動制御部171による制御の手順は、以降の給紙装置本体10の駆動の概要において説明する。
[学習情報収集部172]
学習情報収集部172は、学習装置20で実施する強化学習に必要な情報を、学習情報として収集する。このような学習情報は、給紙装置本体10の駆動情報、および用紙Pに関する用紙情報である。
学習情報収集部172は、学習装置20で実施する強化学習に必要な情報を、学習情報として収集する。このような学習情報は、給紙装置本体10の駆動情報、および用紙Pに関する用紙情報である。
駆動情報は、用紙位置センサーPS1〜PS4、および重送センサーDfSが検知したセンシングデータであって、給紙装置本体10の装置状態を示す装置情報を含む。また駆動情報は、駆動制御部171によって実施される駆動制御プログラムを含む。
また用紙情報は、給紙装置本体10において給紙した用紙Pについての用紙情報、および次に給紙を実施する用紙Pについての用紙情報である。これらの用紙情報は、例えば用紙Pの種類、サイズ、および坪量である。用紙Pの種類は、普通紙、上質紙、表面が平滑な塗工紙、OHPフィルム、トレース用紙、厚手紙、光沢紙などを例示することができる。また用紙Pの種類には、封筒も含まれることとする。用紙Pのサイズは、用紙Pの搬送方向Xおよび幅方向Yの大きさであり、A4サイズ、B5サイズ、B4サイズ、A3サイズなどを例示することができる。用紙Pの坪量は、用紙Pの1m2当たりの重量である。
学習情報収集部172は、これらの学習情報を、駆動制御部171から収集してもよいし、用紙位置センサーPS1〜PS4、および重送センサーDfSから直接収集してもよい。この学習情報収集部172による学習情報の収集の手順は、駆動制御プログラムを更新するための更新プログラムに従って実施される。この更新プログラムは、この給紙装置システム1によって実施される給紙装置制御プログラムの一部であり、以降の給紙装置の制御方法において詳細に説明する。
[学習情報通知部173]
学習情報通知部173は、学習情報収集部172で収集した学習情報を、以次に説明する学習装置20に通知する。この学習情報通知部173による学習情報の通知の手順は、上述した更新プログラムに従って実施される手順である。
学習情報通知部173は、学習情報収集部172で収集した学習情報を、以次に説明する学習装置20に通知する。この学習情報通知部173による学習情報の通知の手順は、上述した更新プログラムに従って実施される手順である。
[更新処理部174]
更新処理部174は、以次に説明する学習装置20から出力された制御情報に基づいて、駆動制御部171において実行される駆動制御プログラムを更新する。この更新処理部174による駆動制御プログラムの更新の手順は、上述した更新プログラムに従って実施される手順である。
更新処理部174は、以次に説明する学習装置20から出力された制御情報に基づいて、駆動制御部171において実行される駆動制御プログラムを更新する。この更新処理部174による駆動制御プログラムの更新の手順は、上述した更新プログラムに従って実施される手順である。
<入力部18>
入力部18は、給紙装置本体10による給紙開始の指示、および給紙装置本体10で給紙する用紙Pの種類、サイズ、および坪量を入力する。このような入力部18は、例えば図示したタッチパネル式の操作部のようにユーザーが任意に指定操作する構成のものであってよい。なお、用紙Pの種類、サイズ、および坪量は、センサーなどを用いて自動的に判別される構成であってもよい。この場合、用紙Pの種類、サイズ、および坪量を判別するためのセンサーも、入力部となる。
入力部18は、給紙装置本体10による給紙開始の指示、および給紙装置本体10で給紙する用紙Pの種類、サイズ、および坪量を入力する。このような入力部18は、例えば図示したタッチパネル式の操作部のようにユーザーが任意に指定操作する構成のものであってよい。なお、用紙Pの種類、サイズ、および坪量は、センサーなどを用いて自動的に判別される構成であってもよい。この場合、用紙Pの種類、サイズ、および坪量を判別するためのセンサーも、入力部となる。
<用紙位置センサーPS1〜PS4>
図3に示すように、用紙位置センサーPS1〜PS4は、用紙Pの搬送方向Xに沿って複数配置され、用紙Pの搬送方向Xの先端位置を検知する。ここでは4つの用紙位置センサーPS1〜PS4を設けた場合を例示したが、これに限定されることはない。これらの用紙位置センサーPS1〜PS4は、例えば、搬送方向Xにおいて吸着搬送部15の中央付近から、吸着搬送部15を外れた位置までの間に、搬送方向Xの下流側に向かって、用紙位置センサーPS1、PS2,PS3、PS4の順に配置されていることとする。
図3に示すように、用紙位置センサーPS1〜PS4は、用紙Pの搬送方向Xに沿って複数配置され、用紙Pの搬送方向Xの先端位置を検知する。ここでは4つの用紙位置センサーPS1〜PS4を設けた場合を例示したが、これに限定されることはない。これらの用紙位置センサーPS1〜PS4は、例えば、搬送方向Xにおいて吸着搬送部15の中央付近から、吸着搬送部15を外れた位置までの間に、搬送方向Xの下流側に向かって、用紙位置センサーPS1、PS2,PS3、PS4の順に配置されていることとする。
これにより、用紙位置センサーPS1、PS2がオン、用紙位置センサーPS3、PS4がオフであれば、用紙Pの先端が、用紙位置センサーPS2と用紙位置センサーPS3との間に位置していることが検知される。
またこれらの用紙位置センサーPS1〜PS4のうち、搬送方向Xの最下流に設けられた用紙位置センサーPS4は、特に後述する用紙Pの搬送時間[t]を算出するためのセンサーとして用いられることとする。なお、用紙位置センサーPS1〜PS4は、用紙Pの搬送方向Xの位置を検知できれば、個々に設けられたセンサーに限定されることはなく、複数の撮像素子を有するラインセンサーのような撮像装置であってもよい。
<重送センサーDfS>
図2に示すように、重送センサーDfSは、用紙位置センサーPS1〜PS4に対して、搬送方向Xのさらに下流側に配置され、吸着搬送部15によって搬送された用紙Pが1枚であるか複数枚積層されているかを検知する。
図2に示すように、重送センサーDfSは、用紙位置センサーPS1〜PS4に対して、搬送方向Xのさらに下流側に配置され、吸着搬送部15によって搬送された用紙Pが1枚であるか複数枚積層されているかを検知する。
<開閉センサーOpS>
開閉センサーOpSは、給紙トレイ11上への用紙Pの出し入れを検知する。このような開閉センサーOpSは、一例として後端規制部材12Bに設けられ、後端規制部材12Bの移動を検知することによって、給紙トレイ11上への用紙Pの出し入れを検知する構成であるが、これに限定されることはない。
開閉センサーOpSは、給紙トレイ11上への用紙Pの出し入れを検知する。このような開閉センサーOpSは、一例として後端規制部材12Bに設けられ、後端規制部材12Bの移動を検知することによって、給紙トレイ11上への用紙Pの出し入れを検知する構成であるが、これに限定されることはない。
<給紙装置本体10の駆動の概要>
次に、駆動制御プログラムに従った駆動制御部171での制御による給紙装置本体10の駆動の概要を説明する。図5〜図7は、本実施形態の給紙装置本体の駆動の概要を説明する図(その1)〜(その3)である。以下、これらの図に基づいて、上述した構成の給紙装置本体10の駆動の概要を説明する。
次に、駆動制御プログラムに従った駆動制御部171での制御による給紙装置本体10の駆動の概要を説明する。図5〜図7は、本実施形態の給紙装置本体の駆動の概要を説明する図(その1)〜(その3)である。以下、これらの図に基づいて、上述した構成の給紙装置本体10の駆動の概要を説明する。
先ず図5に示すように、吸着搬送部15の駆動ローラー151をオフ、吸引装置154をオン状態としておく。この状態で、側方ファン13L,13Rをオン状態として、用紙束Pbの上部に、側方ファン13L,13Rからの空気を吹き出し、用紙束Pbの上部の用紙Pを浮上させる。この際、切替駆動部144の切り替えにより、先端ファン14を浮上ファンに切り替えた状態で、先端ファン14をオン状態として用紙Pの浮上を補助する。そして、最上部の用紙Pが、吸着センサーASに達すると、側方ファン13L,13Rをオフ状態とする。
次に、図6に示すように、側方ファン13L,13Rをオフ状態とし、先端ファン14をオン状態とし、切替駆動部144の切り替えにより、先端ファン14を分離ファンに切り替える。これにより、分離ファンとして機能させた先端ファン14により、浮上した複数枚の用紙P間に空気を吹き込んで用紙P間を捌いて分離し、1枚の用紙Pのみを吸着搬送部15の吸着ベルト153に吸着させる。
この状態で、図7に示すように、側方ファン13L,13Rと共に、先端ファン14をオフ状態とし、所定のタイミングで吸着搬送部15の駆動ローラー151をオン状態とする。これにより、吸着ベルト153に吸着させた1枚の用紙Pを、搬送方向Xに搬送する。また吸着搬送部15によって搬送方向Xに搬送された用紙Pは、図2に示した用紙搬送部16によって、さらに搬送方向Xに搬送される。
以上説明した給紙装置本体10の駆動手順は、給紙装置本体10の駆動の概要であって、駆動制御部171が有する駆動制御プログラムは、上述した側方ファン13L,13Rおよび先端ファン14のオン/オフや、先端ファン14の機能の切り替えのタイミング、および風量を、精密に制御する。このような駆動制御プログラムは、次に説明する学習装置20からの出力に基づき、更新プログラムに従って適宜のタイミングで更新される。
<学習装置20>
図4に戻り、学習装置20は、給紙装置本体10の駆動制御部171が有する駆動制御プログラムを更新するための制御情報を、強化学習によって作成するためのものである。このような学習装置20は、計算機によって構成されている。計算機は、上述したコンピューターとして用いられるハードウェアである。
図4に戻り、学習装置20は、給紙装置本体10の駆動制御部171が有する駆動制御プログラムを更新するための制御情報を、強化学習によって作成するためのものである。このような学習装置20は、計算機によって構成されている。計算機は、上述したコンピューターとして用いられるハードウェアである。
この学習装置20において実施する制御情報の作成の手順は、以降の給紙装置の制御方法において詳細に説明する。この学習装置20において実施する制御情報の作成手順は、学習プログラムとしてROMに保存されたプログラムであるか、または外部装置からRAMや他の記憶部にロードされて保存されたプログラムである。このような学習プログラムは、この給紙装置システム1によって実施される給紙装置制御プログラムの一部である。
またこのような学習装置20は、給紙装置本体10に対して近接して、または給紙装置本体10と一体に設けられて給紙装置を構成してもよいが、これに限定されることはない。すなわち学習装置20は、ネットワーク上のサーバーに設けられ、複数の給紙装置本体10によって共有されるものであってもよい。
以上のような学習装置20は、機能要素として学習情報取得部21、報酬計算部22、学習部23、および制御情報出力部24を有する。以下、これらの各機能要素を説明する。
[学習情報取得部21]
学習情報取得部21は、給紙装置本体10の制御部17から通知された学習情報を取得する。この学習情報取得部21が取得した学習情報は、報酬計算部22と学習部23とに出力される。
学習情報取得部21は、給紙装置本体10の制御部17から通知された学習情報を取得する。この学習情報取得部21が取得した学習情報は、報酬計算部22と学習部23とに出力される。
[報酬計算部22]
報酬計算部22は、学習情報取得部21から出力された学習情報に基づいて、次の学習部23において実施する学習のための報酬の計算を実施する。この報酬計算部22における報酬の計算手順は、予め定めたルールに従って実施される。このような報酬の計算は、以降の給紙装置の制御方法において詳細に説明する。
報酬計算部22は、学習情報取得部21から出力された学習情報に基づいて、次の学習部23において実施する学習のための報酬の計算を実施する。この報酬計算部22における報酬の計算手順は、予め定めたルールに従って実施される。このような報酬の計算は、以降の給紙装置の制御方法において詳細に説明する。
[学習部23]
学習部23は、学習情報取得部21で取得した学習情報と、報酬計算部22において計算した報酬の計算結果とに基づく学習を実施する。この学習部23において実施する学習は、学習における行動価値を算出することにより、行動価値が最も高くなるような行動を学習する。また学習部23は、学習結果から、給紙装置本体10において実施する次の行動を決定する。
学習部23は、学習情報取得部21で取得した学習情報と、報酬計算部22において計算した報酬の計算結果とに基づく学習を実施する。この学習部23において実施する学習は、学習における行動価値を算出することにより、行動価値が最も高くなるような行動を学習する。また学習部23は、学習結果から、給紙装置本体10において実施する次の行動を決定する。
ここで次の行動とは、学習に基づいて決定した行動価値が最も高い行動であって、給紙装置本体10の駆動を制御するための駆動制御プログラムにおいて更新の対象となる制御パラメーターのタイミングや値に相当する。具体的には、駆動制御プログラムにおける(1)側方ファン13L,13Rのオン/オフ、(2)先端ファン14のオン/オフ、(3)先端ファン14の機能の切り替え、(4)側方ファン13L,13Rの風量、および(5)先端ファン14の風量のうちの少なくとも何れか1つである。この学習部23における学習の手順は、以降の給紙装置の制御方法において詳細に説明する。
[制御情報出力部24]
制御情報出力部24は、学習部23での学習結果に基づいて決定した次の行動を、制御プログラムの更新情報として給紙装置本体10に出力する。
制御情報出力部24は、学習部23での学習結果に基づいて決定した次の行動を、制御プログラムの更新情報として給紙装置本体10に出力する。
≪給紙装置制御プログラムによる給紙装置の制御方法≫
次に、以上のような構成の給紙装置システム1によって実施される給紙装置の制御方法を説明する。ここで説明する給紙装置の制御方法は、図1〜図4を用いて説明した給紙装置システム1における給紙装置本体10の制御部17と、学習装置20とが、給紙装置制御プログラムを実行することによって実現される。給紙装置制御プログラムは、給紙装置本体10の制御部17が実行する駆動制御プログラムを更新するためのプログラムである。この給紙装置制御プログラムは、給紙装置本体10の制御部17が実行する更新プログラムと、学習装置20が実行する学習プログラムとを含む。
次に、以上のような構成の給紙装置システム1によって実施される給紙装置の制御方法を説明する。ここで説明する給紙装置の制御方法は、図1〜図4を用いて説明した給紙装置システム1における給紙装置本体10の制御部17と、学習装置20とが、給紙装置制御プログラムを実行することによって実現される。給紙装置制御プログラムは、給紙装置本体10の制御部17が実行する駆動制御プログラムを更新するためのプログラムである。この給紙装置制御プログラムは、給紙装置本体10の制御部17が実行する更新プログラムと、学習装置20が実行する学習プログラムとを含む。
ここでは先ず、学習装置20において実施される学習プログラムによる学習処理の手順を説明し、次に給紙装置本体10の制御部17において実施される更新プログラムによる更新処理の手順を説明する。
<学習処理の手順>、
図8は、本実施形態に係る給紙装置システムによって実施される学習処理の手順を示すフローチャートである。ここで説明する学習処理の手順は、給紙装置制御プログラムの一部である学習プログラムの手順であって、学習装置20によって実施される。以下、図8のフローチャートに示す順に、図1〜図4および必要に応じて他の図を参照しつつ、学習処理の手順を説明する。
図8は、本実施形態に係る給紙装置システムによって実施される学習処理の手順を示すフローチャートである。ここで説明する学習処理の手順は、給紙装置制御プログラムの一部である学習プログラムの手順であって、学習装置20によって実施される。以下、図8のフローチャートに示す順に、図1〜図4および必要に応じて他の図を参照しつつ、学習処理の手順を説明する。
[ステップS1]
ステップS1において、学習情報取得部21は、給紙装置本体10の制御部17から学習情報を取得したか否かを判断し、取得した(Yes)と判断されるまで待機する。ここで学習情報取得部21が取得する学習情報は、制御部17の学習情報収集部172が収集して学習情報通知部173から通知された情報であって、上述したような給紙装置本体10の駆動情報、および用紙Pに関する用紙情報を含む。
ステップS1において、学習情報取得部21は、給紙装置本体10の制御部17から学習情報を取得したか否かを判断し、取得した(Yes)と判断されるまで待機する。ここで学習情報取得部21が取得する学習情報は、制御部17の学習情報収集部172が収集して学習情報通知部173から通知された情報であって、上述したような給紙装置本体10の駆動情報、および用紙Pに関する用紙情報を含む。
学習情報取得部21は、制御部17から通知された学習情報を取得した(Yes)と判断した場合に、次のステップS2に進む。
[ステップS2]
ステップS2において、学習情報取得部21は、取得した学習情報を、報酬計算部22と学習部23とに伝達する。この場合、報酬計算部22には、駆動情報と、給紙装置本体10において給紙した用紙Pについての用紙情報を伝達する。また学習部23には、駆動情報と、次に給紙を実施する用紙Pについての用紙情報を伝達する。
ステップS2において、学習情報取得部21は、取得した学習情報を、報酬計算部22と学習部23とに伝達する。この場合、報酬計算部22には、駆動情報と、給紙装置本体10において給紙した用紙Pについての用紙情報を伝達する。また学習部23には、駆動情報と、次に給紙を実施する用紙Pについての用紙情報を伝達する。
[ステップS3]
ステップS3において、報酬計算部22は、学習情報取得部21が取得した学習情報に基づいて、強化学習における報酬の計算を実施する。この場合、報酬計算部22は、学習情報の通知があった給紙装置本体10について、強化学習における各状態の場合の各行動においての各報酬を計算する。以下、強化学習における状態と行動、および報酬の計算の具体例を説明する。
ステップS3において、報酬計算部22は、学習情報取得部21が取得した学習情報に基づいて、強化学習における報酬の計算を実施する。この場合、報酬計算部22は、学習情報の通知があった給紙装置本体10について、強化学習における各状態の場合の各行動においての各報酬を計算する。以下、強化学習における状態と行動、および報酬の計算の具体例を説明する。
−強化学習における状態と行動−
この場合の強化学習における状態は、用紙位置センサーPS1〜PS4のオン/オフによって検知される用紙Pの位置と、先端ファン14の機能の少なくとも1つであることとする。
この場合の強化学習における状態は、用紙位置センサーPS1〜PS4のオン/オフによって検知される用紙Pの位置と、先端ファン14の機能の少なくとも1つであることとする。
このうち用紙位置センサーPS1〜PS4のオン/オフによって検知される用紙Pの位置とは、図3を参照して次のようである。すなわち、用紙位置センサーPS1〜PS4は、吸着搬送部15に吸着された用紙Pが用紙位置センサーPS1〜PS4に達することにより、オン状態となる。用紙Pの吸着搬送部15への吸着は、ここでの図示を省略した吸着センサーによって検知されてもよい。一例として、用紙位置センサーPS1〜SP3がオン、用紙位置センサーPS4がオフの場合の用紙Pの位置は、用紙位置センサーPS3から用紙位置センサーPS4までの間に、用紙Pの先端が位置する状態であると検知される。
また先端ファン14の機能とは、先端ファン14が浮上ファンとして機能している状態か、分離ファンとして機能している状態の何れかである。
またこの場合の強化学習における行動は、(1)側方ファン13L,13Rのオン/オフ、(2)先端ファン14のオン/オフ、(3)先端ファン14の機能、(4)側方ファン13L,13Rの風量、および(5)先端ファン14の風量のうちの少なくとも何れか1つである。なお、強化学習における行動は、給紙装置本体10の駆動を制御するための駆動制御プログラムにおいて更新の対象となる制御パラメーターに相当する。
次に、強化学習において報酬の計算を実施する場合の、状態と行動の具体例を説明する。
図9は、本実施形態に係る強化学習の一例を説明するQテーブルの図である。Qテーブルは、強化学習の状態と行動の関係を学習する際に利用するテーブルであり、状態と行動の組み合わせに対応する行動価値(Q値)を示している。
この図9に示すように、強化学習における状態は、用紙位置センサーPS1〜PS4のオン/オフによって検知される用紙Pの位置と、先端ファン14の機能の両方とすることができる。
またこれら状態と組み合わせる行動は、(5)先端ファン14の風量とすることができる。ここで風量は、一例として0%〜100%の間の10%刻みで設定される。またこの場合の行動には、(5)先端ファン14の風量に替えて、または追加で(1)側方ファン13L,13Rのオン/オフ、(2)先端ファン14のオン/オフ、および(4)側方ファン13L,13Rの風量のうちの少なくとも何れか1つが選択されてもよい。
図10は、本実施形態に係る強化学習の他の例を説明するQテーブルの図であって、Qテーブルの他の例である。また図11は、図10のQテーブルにおける行動の詳細を示す図である。これらの図10および図11に示すように、強化学習における状態は、用紙位置センサーPS1〜PS4のオン/オフによって検知される用紙Pの位置のみとしてもよい。
この場合の状態と組み合わせる行動は、(1)側方ファン13L,13Rのオン/オフ、(2)先端ファン14のオン/オフ、および(3)先端ファン14の機能とすることができる。またこの場合の行動には、これらの行動に替えて、または追加で(4)側方ファン13L,13Rの風量、および(5)先端ファン14の風量のうちの少なくとも一方が選択されてもよい。
なお、行動として採用されなかった制御パラメーターは、予め設定された基準値として、以降の学習処理を進める。
−報酬について(その1)−
本実施形態に係る強化学習の報酬は、用紙Pの搬送時間[t]に基づいて算出される。図12,図13は、本実施形態に係る強化学習において報酬の計算処理に用いる搬送時間[t]を説明する図(その1),(その2)である。
本実施形態に係る強化学習の報酬は、用紙Pの搬送時間[t]に基づいて算出される。図12,図13は、本実施形態に係る強化学習において報酬の計算処理に用いる搬送時間[t]を説明する図(その1),(その2)である。
ここで搬送時間[t]とは、これらの図に示すように、吸着搬送部15に吸着された用紙Pの先端が、吸着搬送部15による搬送を開始してから所定に位置にまで搬送されるのに要する時間である。所定の位置とは、例えば用紙位置センサーPS1〜PS4のうち、搬送方向Xの最下流に配置された用紙位置センサーPS4で用紙Pの先端が検知される位置であることとする。
この搬送時間[t]は、側方ファン13L,13Rおよび先端ファン14からの送風によって浮上して分離された用紙Pが、吸着搬送部15に吸着される位置に依存する。
図12に示すように、浮上ファンとして機能させた先端ファン14の風量に対して、側方ファン13L,13Rの風量が大きい場合、側方ファン13L,13Rの影響が強く、用紙Pは、搬送方向Xの下流側に浮上する。その結果、吸着搬送部15に吸着させた用紙Pの先端と、所定位置に配置された用紙位置センサーPS4との距離[d]が短くなる。これにより、吸着搬送部15に用紙Pが吸着した後に、吸着搬送部15の駆動ローラー151を駆動して用紙Pを搬送方向Xに搬送した場合、所定位置に配置された用紙位置センサーPS4に用紙Pの先端が到達する時間、すなわち搬送時間[t]が短くなる。
このような場合には、先端ファン14を分離ファンに切り替えた場合に、上方に浮上した複数の用紙P間に、先端ファン14からの空気が吹き込まれにくくなる。これにより、複数枚の用紙Pが搬送される連れ送りと、これによる複数の用紙Pが同時に供給される重送ジャムが発生し易い。
一方、図13に示すように、浮上ファンとして機能させた先端ファン14の風量に対して、側方ファン13L,13Rの風量が小さい場合、先端ファン14の影響が強く、用紙Pは、搬送方向Xの上流側に浮上する。その結果、吸着搬送部15に吸着させた用紙Pの先端と、所定位置に配置された用紙位置センサーPS4との距離[d]が長くなる。これにより、吸着搬送部15に用紙Pが吸着した後に、吸着搬送部15の駆動ローラー151を駆動して用紙Pを搬送方向Xに搬送した場合に、所定位置に配置された用紙位置センサーPS4に用紙Pの先端が到達する時間、すなわち搬送時間[t]が長くなる。
このような場合には、吸着搬送部15による用紙Pの搬送の遅れが生じ、所定の時間に用紙Pが供給されない、空送りジャムが発生し易い。
以上のように、搬送時間[t]は、用紙Pの供給状態を表す指標となる。そこで、本実施形態における学習処理においては、用紙Pの搬送時間[t]に基づいて報酬を算出する強化学習を行う。
次に、搬送時間[t]に基づく報酬の算出を説明する。図14は、搬送時間[t]に基づく報酬の計算処理においてする報酬の付与を説明するためのグラフである。この図に示すように、報酬の算出においては先ず、搬送時間[t]に対して、重送ジャムやノーフィードジャムが最も発生し難い目標搬送時間[Tg]を事前に設定する。そして、目標搬送時間[Tg]に対する近さによって報酬を付与する。
この場合、例えば目標搬送時間[Tg]を含む所定の時間範囲である第1搬送閾値[Tth1]と、第1搬送閾値[Tth1]を含むもう一つの所定の時間範囲である第2搬送閾値[Tth2]を設定する。
第1搬送閾値[Tth1]は、例えば重送ジャムやノーフィードジャムが発生しないことが確認されている範囲である。第1搬送閾値[Tth1]は、目標搬送時間[Tg]を中心とした範囲であってもよいが、これに限定されることはない。
第2搬送閾値[Tth2]は、例えば重送ジャムやノーフィードジャムが発生する場合がある範囲である。第2搬送閾値[Tth2]の上限値を超えた範囲は、ノーフィードジャムが発生する範囲となる。また第2搬送閾値[Tth2]の下限値を下回る範囲は、重送ジャムが発生する範囲となる。
なお、以上の目標搬送時間[Tg]、第1搬送閾値[Tth1]、および第2搬送閾値[Tth2]は、用紙Pの種類毎、サイズ毎、および坪量毎に、予め設定された値であって、給紙装置本体10において給紙した用紙Pについての用紙情報に基づいて設定される。
そして、本ステップS3(図8参照)における報酬の計算処理においては、次に説明するように、第1搬送閾値[Tth1]内の搬送時間[t]となる状態と行動の組み合わせに対して、正の報酬を与える。一方、第2搬送閾値[Tth1]外の搬送時間[t]となる状態と行動の組み合わせに対して、負の報酬を与える。それ以外の搬送時間[t]となる状態と行動の組み合わせに対しては、報酬をゼロとする。
−報酬の計算処理(その1)−
次に、報酬計算部22が実施する報酬の計算処理の手順を説明する。図15は、搬送時間[t]に基づく報酬の計算処理を示すフローチャートであって、図8のステップS3における報酬の計算処理の手順を示す図である。以下、図15に従って報酬の計算処理の手順を説明する。
次に、報酬計算部22が実施する報酬の計算処理の手順を説明する。図15は、搬送時間[t]に基づく報酬の計算処理を示すフローチャートであって、図8のステップS3における報酬の計算処理の手順を示す図である。以下、図15に従って報酬の計算処理の手順を説明する。
=ステップS301=
ステップS301において、報酬計算部22は、学習情報取得部21から伝達された学習情報に基づいて、ある状態においてある行動によって過去に給紙を実施した、ある用紙情報を有する用紙Pの搬送時間[t]を算出する。搬送時間[t]の算出は、学習情報として取得した駆動制御プログラムのうちの、(6)吸着搬送部15における駆動ローラー151の駆動開始のタイミングと、用紙位置センサーPS4のオン/オフ情報であって用紙位置情報とから算出する。
ステップS301において、報酬計算部22は、学習情報取得部21から伝達された学習情報に基づいて、ある状態においてある行動によって過去に給紙を実施した、ある用紙情報を有する用紙Pの搬送時間[t]を算出する。搬送時間[t]の算出は、学習情報として取得した駆動制御プログラムのうちの、(6)吸着搬送部15における駆動ローラー151の駆動開始のタイミングと、用紙位置センサーPS4のオン/オフ情報であって用紙位置情報とから算出する。
=ステップS302=
ステップS302において、報酬計算部22は、算出した搬送時間[t]が第1搬送閾値[Tth1]の範囲内であるか否かを判断する。そして範囲内である(Yes)と判断した場合にはステップS303に進み、範囲内ではない(No)と判断した場合にはステップS304に進む。
ステップS302において、報酬計算部22は、算出した搬送時間[t]が第1搬送閾値[Tth1]の範囲内であるか否かを判断する。そして範囲内である(Yes)と判断した場合にはステップS303に進み、範囲内ではない(No)と判断した場合にはステップS304に進む。
=ステップS303=
ステップS303において、報酬計算部22は、ステップS301において搬送時間[t]を算出したある状態の場合のある行動に対して正の報酬を付与し、処理を終了させる。
ステップS303において、報酬計算部22は、ステップS301において搬送時間[t]を算出したある状態の場合のある行動に対して正の報酬を付与し、処理を終了させる。
=ステップS304=
ステップS304において、報酬計算部22は、算出した搬送時間[t]が、第2搬送閾値[Tth2]の範囲内であるか否かを判断する。そして範囲内である(Yes)と判断した場合には、報酬を付与せずにゼロとして処理を終了させる。一方、範囲内ではない(No)と判断した場合にはステップS305に進む。
ステップS304において、報酬計算部22は、算出した搬送時間[t]が、第2搬送閾値[Tth2]の範囲内であるか否かを判断する。そして範囲内である(Yes)と判断した場合には、報酬を付与せずにゼロとして処理を終了させる。一方、範囲内ではない(No)と判断した場合にはステップS305に進む。
=ステップS305=
ステップS305において、報酬計算部22は、ステップS301において搬送時間[t]を算出したある状態の場合のある行動に対して負の報酬を付与し、処理を終了させる。
ステップS305において、報酬計算部22は、ステップS301において搬送時間[t]を算出したある状態の場合のある行動に対して負の報酬を付与し、処理を終了させる。
なお、図8のステップS3において、報酬計算部22は、学習情報取得部21から伝達された学習情報に基づいて、過去に給紙を実施した全ての用紙Pまたは選択された条件の用紙Pについて、図15に示したステップS301〜ステップS305を実施し、報酬の計算処理を終了させる。その後は、図8のステップS4に進む。
−報酬について(その2)−
本実施形態に係る強化学習の報酬は、さらに、用紙Pの重送が検知されたか否かに基づいて算出されてもよい。用紙Pの重送は、重送センサーDfS(図2〜図4参照)で検知される。
本実施形態に係る強化学習の報酬は、さらに、用紙Pの重送が検知されたか否かに基づいて算出されてもよい。用紙Pの重送は、重送センサーDfS(図2〜図4参照)で検知される。
−報酬の計算処理(その2)−
図16は、重送の検知に基づく報酬の計算処理を示すフローチャートであって、図8のステップS3における報酬の計算処理として追加で実施する手順を示す図である。この図に示す報酬の計算処理は、図15を用いて説明した報酬の計算処理と合わせて、報酬計算部22において実施されることが好ましい報酬の計算処理の手順である。以下、図16に従って報酬の計算処理の手順の他の例を説明する。
図16は、重送の検知に基づく報酬の計算処理を示すフローチャートであって、図8のステップS3における報酬の計算処理として追加で実施する手順を示す図である。この図に示す報酬の計算処理は、図15を用いて説明した報酬の計算処理と合わせて、報酬計算部22において実施されることが好ましい報酬の計算処理の手順である。以下、図16に従って報酬の計算処理の手順の他の例を説明する。
=ステップS301’=
ステップS301’において、報酬計算部22は、学習情報取得部21から伝達された学習情報に基づいて、ある状態においてある行動によって過去に給紙を実施した用紙Pが、封筒であるか否かの判断を行う。封筒である(Yes)と判断した場合には、処理を終了させる。一方、封筒ではない(No)と判断した場合には、次のステップS302’に進む。
ステップS301’において、報酬計算部22は、学習情報取得部21から伝達された学習情報に基づいて、ある状態においてある行動によって過去に給紙を実施した用紙Pが、封筒であるか否かの判断を行う。封筒である(Yes)と判断した場合には、処理を終了させる。一方、封筒ではない(No)と判断した場合には、次のステップS302’に進む。
=ステップS302’=
ステップS302’において、報酬計算部22は、学習情報取得部21から伝達された学習情報に基づいて、ステップS301’で封筒ではないと判断した場合において、重送センサーDfSが重送を検知したか否かの判断を実施する。重送を検知した(Yes)と判断した場合には、次のステップS303’に進む。一方、重送を検知していない(No)と判断した場合には、処理を終了させる。
ステップS302’において、報酬計算部22は、学習情報取得部21から伝達された学習情報に基づいて、ステップS301’で封筒ではないと判断した場合において、重送センサーDfSが重送を検知したか否かの判断を実施する。重送を検知した(Yes)と判断した場合には、次のステップS303’に進む。一方、重送を検知していない(No)と判断した場合には、処理を終了させる。
=ステップS303’=
ステップS303’において、報酬計算部22は、ステップS302’で重送を検知したと判断した場合の給紙に対して負の報酬を付与し、処理を終了させる。
ステップS303’において、報酬計算部22は、ステップS302’で重送を検知したと判断した場合の給紙に対して負の報酬を付与し、処理を終了させる。
なお、報酬計算部22は、学習情報取得部21から伝達された学習情報に基づいて、過去に給紙を実施した全ての用紙Pまたは選択された条件の用紙Pについて、図16に示したステップS301’〜ステップS303’を実施し、報酬の計算処理を終了させる。その後は、図8のステップS4に進む。
[ステップS4]
以上のようなステップS3の後のステップS4において、学習部23は、学習情報取得部21から伝達された学習情報と、報酬計算部22で算出した各用紙情報を有する用紙Pの各状態の場合の各行動においての各報酬に基づいて、行動の学習を実施する。ここでは、予め定めたルールに従って、ある状態の時にある行動を取った時の報酬を計算し、報酬の総和を最適化するように行動価値を算出してQテーブル(図9および図10参照)を更新して行動を学習する。
以上のようなステップS3の後のステップS4において、学習部23は、学習情報取得部21から伝達された学習情報と、報酬計算部22で算出した各用紙情報を有する用紙Pの各状態の場合の各行動においての各報酬に基づいて、行動の学習を実施する。ここでは、予め定めたルールに従って、ある状態の時にある行動を取った時の報酬を計算し、報酬の総和を最適化するように行動価値を算出してQテーブル(図9および図10参照)を更新して行動を学習する。
図17は、本実施形態に係る強化学習における行動の学習を示すフローチャートであって、図8のステップS4における行動の学習処理の手順を示す図である。以下、図17に従って行動の学習処理の手順を説明する。
=ステップS401=
ステップS401において、学習部23は、学習情報取得部21から伝達された学習情報に基づいて、ある状態である行動をとった場合の用紙供給のシミュレーションを実施する。なお、このシミュレーションは、次に給紙を実施する用紙Pの用紙情報に基づいて実施される。またここでは、給紙装置本体10に対して実際に用紙供給を実施させてもよい。
ステップS401において、学習部23は、学習情報取得部21から伝達された学習情報に基づいて、ある状態である行動をとった場合の用紙供給のシミュレーションを実施する。なお、このシミュレーションは、次に給紙を実施する用紙Pの用紙情報に基づいて実施される。またここでは、給紙装置本体10に対して実際に用紙供給を実施させてもよい。
=ステップS402=
ステップS402において、学習部23は、ステップS401でのある状態である行動をとった場合の報酬を判断する。この際、学習部23は、報酬計算部22で実施した報酬の計算結果に基づいて、テップS401でのある状態である行動をとった場合の報酬を判断する。
ステップS402において、学習部23は、ステップS401でのある状態である行動をとった場合の報酬を判断する。この際、学習部23は、報酬計算部22で実施した報酬の計算結果に基づいて、テップS401でのある状態である行動をとった場合の報酬を判断する。
=ステップS403=
ステップS403において、学習部23は、Qテーブルを更新する。ここで図9,図10に示したQテーブルは、学習を開始する前の初期の状態においては、各状態および各行動におけるQ値が初期値(例えば0.5)となっている。学習部23は、ステップS402で判断した報酬に従い、該当する状態および行動のQ値を更新する。
ステップS403において、学習部23は、Qテーブルを更新する。ここで図9,図10に示したQテーブルは、学習を開始する前の初期の状態においては、各状態および各行動におけるQ値が初期値(例えば0.5)となっている。学習部23は、ステップS402で判断した報酬に従い、該当する状態および行動のQ値を更新する。
この場合、例えば、ステップS402において正の報酬と判断された場合には、該当する状態および行動のQ値に、所定の値(例えば0.005)を加算する。一方、ステップS402において負の報酬と判断された場合には、該当する状態および行動のQ値から、所定の値(例えば0.005)を減算する。
=ステップS404=
ステップS404において、学習部23は、ステップS402の報酬判断の結果が、所定回収(例えば100回)連続して正の報酬の判断であったか否かの判断を実施する。正の報酬の判断が所定回数連続した(Yes)と判断した場合には、処理を終了させる。一方、正の報酬の判断が所定回数連続していない(No)と判断した場合には、ステップS405に進む。
ステップS404において、学習部23は、ステップS402の報酬判断の結果が、所定回収(例えば100回)連続して正の報酬の判断であったか否かの判断を実施する。正の報酬の判断が所定回数連続した(Yes)と判断した場合には、処理を終了させる。一方、正の報酬の判断が所定回数連続していない(No)と判断した場合には、ステップS405に進む。
=ステップS405=
ステップS405において、学習部23は、ステップS403において更新したQテーブルに基づき、予め定めたルールにしたがって行動を変更し、ステップS401に戻る。
ステップS405において、学習部23は、ステップS403において更新したQテーブルに基づき、予め定めたルールにしたがって行動を変更し、ステップS401に戻る。
この際、学習部23は、先ずは1番最後の状態、すなわち図9において用紙位置センサーPS1〜PS3はOFF、用紙位置センサーPS4はON、先端ファン機能は分離とした状態において、先端ファン風量をどの風量にすれば良いかを、探索するように行動を変更する。
そして、ステップS404におけるQテーブルの更新によって行動を学習し、最終状態において、行動価値(すなわちQ値)が最も高くなる行動が決定した場合に、状態を遡った次の状態において、先端ファン風量をどの風量にすれば良いかを、探索するように行動を変更する。
図9の例においては、最終状態において、先端ファン流量20%の場合のQ値(=0.84)が最も高い。このため、最終状態における行動は、先端ファン流量20%に決定し、次に遡った状態において先端ファン風量をどの風量にすれば良いかを、探索するように行動を変更し、全ての状態の行動を決定していく。なお、以上は図10および図11の例においても同様である。
[ステップS5]
図8に戻り、ステップS5において、学習部23は、ステップS4での行動の学習結果にも続いて、次の行動を選択する。この際、学習部23は、ステップS4での行動の学習において、最終的に更新されたQテーブル(ステップS403)に基づいて、各状態においてQ値が最も大きい行動を選択する。
図8に戻り、ステップS5において、学習部23は、ステップS4での行動の学習結果にも続いて、次の行動を選択する。この際、学習部23は、ステップS4での行動の学習において、最終的に更新されたQテーブル(ステップS403)に基づいて、各状態においてQ値が最も大きい行動を選択する。
先の図9に示すQテーブルの場合であれば、1番目の状態は20%、2番目の状態は20%、3番目の状態は50%…最終状態は20%が選択される。また図10に示すQテーブルの場合であれば(図11を参照し)、1番目の状態はa1、2番目の状態はa4、3番目の状態はa4、…最終状態はa8となる。
[ステップS6]
ステップS6において、制御情報出力部24は、ステップS5で選択した次の行動を、制御情報として給紙装置本体10に出力する。そして、学習装置20による学習処理を終了させる。
ステップS6において、制御情報出力部24は、ステップS5で選択した次の行動を、制御情報として給紙装置本体10に出力する。そして、学習装置20による学習処理を終了させる。
<駆動制御プログラムの更新処理の手順>
図18は、本実施形態に係る給紙装置システムによって実施される駆動制御プログラムの更新処理を示すフローチャートである。ここで説明する駆動制御プログラムの更新処理の手順は、給紙装置制御プログラムの一部である更新プログラムの手順であって、給紙装置本体10の制御部17によって実施される。以下、図18のフローチャートに示す順に、図1〜図4および必要に応じて他の図を参照しつつ、駆動制御プログラムの更新処理の手順を説明する。
図18は、本実施形態に係る給紙装置システムによって実施される駆動制御プログラムの更新処理を示すフローチャートである。ここで説明する駆動制御プログラムの更新処理の手順は、給紙装置制御プログラムの一部である更新プログラムの手順であって、給紙装置本体10の制御部17によって実施される。以下、図18のフローチャートに示す順に、図1〜図4および必要に応じて他の図を参照しつつ、駆動制御プログラムの更新処理の手順を説明する。
[ステップS001]
ステップS001において、学習情報収集部172は、給紙装置本体10において、用紙Pの変更があったか否かの判断を実施する。ここで、用紙Pの変更とは、給紙装置本体10から給紙する用紙Pが、変更されたか否かを意味している。学習情報収集部172は、例えば、入力部18から駆動制御部171に入力された情報に基づいて、この判断を実施する。そして、変更された(Yes)と判断した場合に、次のステップS002に進み、変更されていない(No)と判断された場合には、次のステップS001’に進む。
ステップS001において、学習情報収集部172は、給紙装置本体10において、用紙Pの変更があったか否かの判断を実施する。ここで、用紙Pの変更とは、給紙装置本体10から給紙する用紙Pが、変更されたか否かを意味している。学習情報収集部172は、例えば、入力部18から駆動制御部171に入力された情報に基づいて、この判断を実施する。そして、変更された(Yes)と判断した場合に、次のステップS002に進み、変更されていない(No)と判断された場合には、次のステップS001’に進む。
[ステップS001’]
ステップS001’において、学習情報収集部172は、トレイの開閉があったか否かの判断を実施する。ここで、トレイとは用紙Pが載置される給紙トレイ11であり、学習情報収集部172は、例えば開閉センサーOpSから駆動制御部171に入力された情報に基づいて、この判断を実施する。そして、開閉された(Yes)と判断した場合に、次のステップS002に進む。用紙Pが変更されていない場合、つまり用紙Pの種類、サイズ、坪量などが変更されていない場合であっても、給紙トレイ11が開閉された場合、用紙Pの給紙トレイ11上への載置状態が変わっている可能性があるので、同様に学習を開始する。一方、本ステップS001’において、開閉されていない(No)と判断された場合には、ステップS001に戻る。
ステップS001’において、学習情報収集部172は、トレイの開閉があったか否かの判断を実施する。ここで、トレイとは用紙Pが載置される給紙トレイ11であり、学習情報収集部172は、例えば開閉センサーOpSから駆動制御部171に入力された情報に基づいて、この判断を実施する。そして、開閉された(Yes)と判断した場合に、次のステップS002に進む。用紙Pが変更されていない場合、つまり用紙Pの種類、サイズ、坪量などが変更されていない場合であっても、給紙トレイ11が開閉された場合、用紙Pの給紙トレイ11上への載置状態が変わっている可能性があるので、同様に学習を開始する。一方、本ステップS001’において、開閉されていない(No)と判断された場合には、ステップS001に戻る。
[ステップS002]
ステップ002において、学習情報収集部172は、駆動制御部171から学習情報を収集する。ここで学習情報収集部172が収集する学習情報は、先に説明した通りの情報であって、給紙装置本体10に関する駆動情報、および用紙Pに関する用紙情報である。
ステップ002において、学習情報収集部172は、駆動制御部171から学習情報を収集する。ここで学習情報収集部172が収集する学習情報は、先に説明した通りの情報であって、給紙装置本体10に関する駆動情報、および用紙Pに関する用紙情報である。
[ステップS003]
ステップS003において、学習情報通知部173は、学習情報収集部172が収取した学習情報を、学習装置20に通知する。
ステップS003において、学習情報通知部173は、学習情報収集部172が収取した学習情報を、学習装置20に通知する。
[ステップS004]
ステップS004において、更新処理部174は、学習装置20から制御情報を受信したか否かの判断を実施する。ここで更新処理部174が受信する制御情報は、先に説明した学習装置20における学習処理において、学習装置20の制御情報出力部24が出力した制御情報である(図8のステップS6)。更新処理部174は、制御情報を受信した(Yes)と判断されるまで待機する。制御情報を受信した(Yes)と判断された場合に、次のステップS005に進む。
ステップS004において、更新処理部174は、学習装置20から制御情報を受信したか否かの判断を実施する。ここで更新処理部174が受信する制御情報は、先に説明した学習装置20における学習処理において、学習装置20の制御情報出力部24が出力した制御情報である(図8のステップS6)。更新処理部174は、制御情報を受信した(Yes)と判断されるまで待機する。制御情報を受信した(Yes)と判断された場合に、次のステップS005に進む。
[ステップS005]
ステップS005において、更新処理部174は、学習装置20から受信した制御情報に基づいて、駆動制御部171のファームウェアである駆動制御プログラムの更新を実施し、処理を終了させる。
ステップS005において、更新処理部174は、学習装置20から受信した制御情報に基づいて、駆動制御部171のファームウェアである駆動制御プログラムの更新を実施し、処理を終了させる。
≪画像形成装置≫
図19は、本実施形態に係る給紙装置システムを有する画像形成装置の一例を示す構成図である。
図19は、本実施形態に係る給紙装置システムを有する画像形成装置の一例を示す構成図である。
上述した本例の給紙装置システム1は、画像形成装置へ用紙を供給する給紙装置の制御システムとして好適に用いられる。このような画像形成装置として、複写機、プリンタ装置、ファクシミリ装置、印刷機、複合機等を例示することができる。以下に、本実施形態に係る給紙装置システム1を適用した画像形成装置(本発明の画像形成装置)が例えば複写機の場合を例に挙げて説明する。
この図に示す画像形成装置100は、画像形成装置本体200、画像読取装置300、自動原稿送り装置400、および給紙装置500を有する構成となっている。
画像形成装置本体200は、例えば、給紙カセット201、給紙部202、画像形成部203、および排紙部204を備える。給紙カセット201は、複数枚の用紙Pを収容する。給紙部202は、給紙カセット201に収容された用紙Pを、給紙カセット201から取り出して画像形成部203に搬送する。
画像形成部203は、画像読取装置300から送信された画像信号に基づいて、給紙部202から搬送された用紙Pに画像を形成する部分である。この画像形成部203は、画像形成方式が限定されることはなく、例えば電子写真方式、またはインクジェット方式のものが適用される。一例として、電子写真方式の画像形成部203であれば、トナー画像形成ユニット、中間転写ベルト、および定着部などを備え、用紙Pの一主面上にトナー画像を形成する。またインクジェット方式の画像形成部203であれば、インクジェットヘッドを備え、用紙Pの一主面上にインク画像を形成する。
排紙部204は、画像形成部203において画像が形成された用紙Pを、排紙する。
画像読取装置300は、自動原稿送り装置400から搬送された原稿から、光学的に画像を読み取り、読み取った画像信号を処理して画像形成部に送信する。
自動原稿送り装置400は、原稿台を備え、原稿台上に載置された原稿を画像読取装置300に搬送する。
給紙装置500は、画像形成装置本体200に接続されて、画像形成装置本体200に用紙Pを給紙する。この給紙装置500は、先に説明した給紙装置本体10を複数備え、各給紙装置本体10から画像形成装置本体200の給紙部202に、用紙Pを1枚ずつ分離しつつ給紙する。
これらの各給紙装置本体10は、先に説明した学習装置20との間で通信が可能なものである。これらの各給紙装置本体10は、例えば共通の駆動制御部171によって駆動制御されるものであってよいが、先に説明した学習装置20による学習は、給紙装置本体10毎に実施されることとする。またこの場合、学習装置20は、他の画像形成装置100に設けられた給紙装置500の各給紙装置本体10と共有されるものであってよい。
また給紙装置500は、複数の給紙装置本体10と共に1つの学習装置20を装置内に組み込んだ構成のものであってもよい。
≪実施形態の効果≫
以上説明した実施形態によれば、吸着搬送部15に吸着された用紙Pが所定に位置にまで搬送される搬送時間[t]によって報酬を判断する強化学習に基づいて、給紙装置本体10の駆動制御プログラムを更新する構成である。先にも述べたように、搬送時間[t]は、用紙Pの供給状態を正確に表す指標である。このため、この強化学習に基づいて、給紙装置本体10の駆動制御プログラムを更新することにより、用紙の種類や装置の設置環境によらずに、重送や空送りの発生なく、度高精度な用紙供給を実施することが可能になる。
以上説明した実施形態によれば、吸着搬送部15に吸着された用紙Pが所定に位置にまで搬送される搬送時間[t]によって報酬を判断する強化学習に基づいて、給紙装置本体10の駆動制御プログラムを更新する構成である。先にも述べたように、搬送時間[t]は、用紙Pの供給状態を正確に表す指標である。このため、この強化学習に基づいて、給紙装置本体10の駆動制御プログラムを更新することにより、用紙の種類や装置の設置環境によらずに、重送や空送りの発生なく、度高精度な用紙供給を実施することが可能になる。
また、このような高精度な用紙供給が実施される給紙装置システムを用いた画像形成装置100によれば、複数枚の用紙Pに対して連続した円滑な画像形成が可能となる。
1…給紙装置システム
11…給紙トレイ
13L,13R…側方ファン
14…先端ファン(機能切替ファン)
15…吸着搬送部
171…駆動制御部
20…学習装置
100…画像形成装置
174…更新処理部
203…画像形成部
500…給紙装置
DfS…重送センサー
P…用紙
Pb…用紙束
PS1〜PS4…用紙位置センサー
[t]…搬送時間
[Tth1]…第1搬送閾値(所定の時間範囲)
[Tth2]…第2搬送閾値(もう一つの所定の時間範囲)
11…給紙トレイ
13L,13R…側方ファン
14…先端ファン(機能切替ファン)
15…吸着搬送部
171…駆動制御部
20…学習装置
100…画像形成装置
174…更新処理部
203…画像形成部
500…給紙装置
DfS…重送センサー
P…用紙
Pb…用紙束
PS1〜PS4…用紙位置センサー
[t]…搬送時間
[Tth1]…第1搬送閾値(所定の時間範囲)
[Tth2]…第2搬送閾値(もう一つの所定の時間範囲)
Claims (20)
- 空気の吹き出しによって給紙トレイ上の用紙束から用紙を浮上させる機能を有するファンと、
前記浮上させた用紙を吸着して搬送する吸着搬送部と、
駆動制御プログラムに基づいて前記ファンと前記吸着搬送部の駆動を制御する駆動制御部と、
前記駆動制御プログラムを更新するための制御情報を作成する学習装置と備え、
前記学習装置は、前記吸着搬送部によって前記用紙が所定位置にまで搬送される搬送時間に基づいて報酬を付与する強化学習の実施により、前記制御情報を作成する
給紙装置システム。 - 前記吸着搬送部によって搬送される用紙の位置を検知するための複数の用紙位置センサーを備え、
前記駆動制御部は、前記複数の用紙位置センサーからの信号に基づいて前記ファンと前記吸着搬送部の駆動を制御し、
前記学習装置は、前記駆動制御部による駆動情報に基づいて、前記吸着搬送部による前記用紙の搬送を開始してから前記複数の用紙センサーのうちの所定の用紙位置センサーに前記用紙が達するまでの時間を前記搬送時間として算出し、前記強化学習を実施する
請求項1に記載の給紙装置システム。 - 前記学習装置は、予め設定した時間と、前記搬送時間とを比較して前記報酬を算出する
請求項1または2に記載の給紙装置システム。 - 前記学習装置は、前記搬送時間が所定の時間範囲内の場合に、前記報酬として正の報酬を付与する
請求項1〜3のうちの何れか1項に記載の給紙装置システム。 - 前記学習装置は、前記搬送時間が前記所定の時間範囲を含むもう一つの所定の時間範囲外の場合に、前記報酬として負の報酬を付与する
請求項4に記載の給紙装置システム。 - 前記所定の時間範囲は、前記用紙の種類、サイズ、および坪量毎に設定された値である
請求項4または5に記載の給紙装置システム。 - 前記吸着搬送部で搬送された用紙の重送を検知する重送センサーを備え、
前記学習装置は、前記搬送時間に基づいて報酬を付与し、さらに前記重送センサーでの検知結果に応じて報酬を付与する
請求項1〜6のうちの何れか1項に記載の給紙装置システム。 - 前記学習装置は、前記重送センサーにおいて重送を検知した場合に、前記報酬として負の報酬を付与する
請求項7に記載の給紙装置システム。 - 前記学習装置は、前記用紙が封筒である場合には、前記重送センサーでの検知結果に応じた報酬の付与を実施しない
請求項7または8に記載の給紙装置システム。 - 前記学習装置は、前記用紙位置センサーからの信号に基づく用紙位置を状態とし、前記ファンの制御パラメーターを行動とした強化学習を実施する
請求項1〜9のうちの何れか1項に記載の給紙装置システム。 - 複数の前記ファンを備え、
前記複数のファンのうちの少なくとも一つは、前記空気の吹き出し方向が可変なものであって、用紙を浮上させる機能と、前記用紙束から浮上させた複数の用紙間に空気を吹き込んで前記複数の用紙を分離させる機能とを有する機能切替ファンであり、
前記学習装置は、前記機能切替ファンの機能を、状態または行動とした強化学習を実施する
請求項10に記載の給紙装置システム。 - 前記学習装置が実施する強化学習において前記行動となる前記ファンの制御パラメーターは、前記複数のファンのそれぞれのオン/オフおよび風量、さらには前記機能切替ファンの機能のうちの少なくとも1つである
請求項11に記載の給紙装置システム。 - 前記学習装置が作成した前記ファンの制御情報に基づいて、前記駆動制御プログラムを更新する更新処理部を備えた
請求項1〜12のうちの何れか1項に記載の給紙装置システム。 - 前記学習装置は、前記用紙の種類、サイズ、および坪量のうちに何れか1つでも変更された場合に、前記強化学習を開始する
請求項1〜13のうちの何れか1項に記載の給紙装置システム。 - 前記学習装置は、前記給紙トレイの開閉を検知した場合に、前記強化学習を開始する
請求項1〜14のうちの何れか1項に記載の給紙装置システム。 - 前記学習装置は、前記強化学習において正の報酬が所定回数連続した場合に、前記強化学習を終了させる
請求項1〜15のうちの何れか1項に記載の給紙装置システム。 - 前記学習装置は、ネットワーク上のサーバーに設けられたものであり、
前記ファンと前記吸着搬送部とを備えた複数の給紙装置本体によって、前記学習装置が共有される
請求項1〜16のういちの何れか1項に記載の給紙装置システム。 - 請求項1〜17のうちの何れか1項に記載の給紙装置システムの学習装置が、前記ファンと前記吸着搬送部とを備えた給紙装置本体に対して一体に組み込まれた
給紙装置。 - 空気の吹き出しによって給紙トレイ上の用紙束から用紙を浮上させる機能を有するファンと、前記浮上させた用紙を吸着して搬送する吸着搬送部と、駆動制御プログラムに基づいて前記ファンと前記吸着搬送部の駆動を制御する駆動制御部とを備えた給紙装置の制御プログラムであって、
前記吸着搬送部によって前記用紙が所定位置にまで搬送される搬送時間に基づいて報酬を付与する強化学習の実施により、前記駆動制御プログラムを更新するための制御情報を、学習装置に作成させる
給紙装置制御プログラム。 - 請求項1〜17のうちの何れか1項に記載の給紙装置システムと、
前記給紙装置システムから給紙された用紙に画像を形成する画像形成部とを備えた
画像形成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019217741A JP2021088417A (ja) | 2019-12-02 | 2019-12-02 | 給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019217741A JP2021088417A (ja) | 2019-12-02 | 2019-12-02 | 給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021088417A true JP2021088417A (ja) | 2021-06-10 |
Family
ID=76219350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019217741A Pending JP2021088417A (ja) | 2019-12-02 | 2019-12-02 | 給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021088417A (ja) |
-
2019
- 2019-12-02 JP JP2019217741A patent/JP2021088417A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8444138B2 (en) | Sheet feeding apparatus and image forming system with air blower device | |
JP6663591B2 (ja) | 給紙装置、及び、画像形成装置 | |
JP5720646B2 (ja) | 給紙装置および画像形成装置 | |
US7832720B2 (en) | Sheet feeding device and image forming apparatus | |
JP5787611B2 (ja) | シート給送装置及び画像形成装置 | |
JP4649340B2 (ja) | シート給送装置及び画像形成装置 | |
JP2018188272A (ja) | 給紙装置及び画像形成装置 | |
JP2016183046A (ja) | 給紙装置及び画像形成装置 | |
JP5884518B2 (ja) | 給紙装置及び画像形成装置 | |
JP2024123069A (ja) | パラメータ決定装置、画像形成装置、給紙装置、決定モデルの作成方法、および制御プログラム | |
JP7135611B2 (ja) | 給紙装置及び画像形成システム | |
JP2021088417A (ja) | 給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置 | |
JP4667097B2 (ja) | シート給送装置及び画像形成装置 | |
JP2009208945A (ja) | 給紙装置及び画像形成装置 | |
JP2021098597A (ja) | 給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置 | |
JP7392502B2 (ja) | 給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置 | |
JP2011225289A (ja) | 給紙装置及び画像形成装置 | |
JP2017024841A (ja) | 給紙装置及び画像形成装置 | |
JP2006256819A (ja) | シート供給装置及び画像形成装置 | |
JP2006001699A (ja) | シート供給装置 | |
JP6277799B2 (ja) | 給紙装置及び画像形成システム | |
JP2018111556A (ja) | 給紙装置及び画像形成装置 | |
JP5219723B2 (ja) | 画像形成装置 | |
JP2017052643A (ja) | 給紙装置及び画像形成装置 | |
JP4995668B2 (ja) | 媒体供給装置、画像形成装置、および紙葉類処理装置 |