JP2021147112A - Method of feed processing - Google Patents
Method of feed processing Download PDFInfo
- Publication number
- JP2021147112A JP2021147112A JP2020045073A JP2020045073A JP2021147112A JP 2021147112 A JP2021147112 A JP 2021147112A JP 2020045073 A JP2020045073 A JP 2020045073A JP 2020045073 A JP2020045073 A JP 2020045073A JP 2021147112 A JP2021147112 A JP 2021147112A
- Authority
- JP
- Japan
- Prior art keywords
- printing paper
- processing method
- base material
- control value
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Feedback Control In General (AREA)
- Ink Jet (AREA)
- Handling Of Sheets (AREA)
- Controlling Rewinding, Feeding, Winding, Or Abnormalities Of Webs (AREA)
Abstract
Description
本発明は、長尺帯状の基材を長手方向に搬送しながら基材の表面に処理物質を吐出する、搬送処理方法に関する。 The present invention relates to a transport processing method in which a processing substance is discharged onto the surface of a base material while transporting a long strip-shaped base material in the longitudinal direction.
従来、長尺帯状の印刷用紙を長手方向に搬送しつつ、複数の記録ヘッドからインクを吐出することにより、印刷用紙に画像を記録するインクジェット方式の画像記録装置が知られている。画像記録装置は、複数のヘッドから、それぞれ異なる色のインクを吐出する。そして、各色のインクにより形成される単色画像の重ね合わせによって、印刷用紙の表面に多色画像を記録する。 Conventionally, there is known an inkjet type image recording device that records an image on a printing paper by ejecting ink from a plurality of recording heads while transporting a long strip-shaped printing paper in the longitudinal direction. The image recording device ejects inks of different colors from a plurality of heads. Then, a multicolor image is recorded on the surface of the printing paper by superimposing the monochromatic images formed by the inks of each color.
この種の画像記録装置においては、複数のローラにより、印刷用紙を一定の搬送速度で搬送することが求められる。しかしながら、ローラの表面と印刷用紙との間のスリップや、インクによる印刷用紙の伸びによって、記録ヘッドの下方における印刷用紙の搬送速度が、理想的な搬送速度からずれる場合がある。そうすると、印刷用紙の表面における各色のインクの吐出位置が搬送方向にずれる虞がある。そこで、このようなずれを補償する方法が、例えば、特許文献1に記載されている。
In this type of image recording apparatus, it is required that printing paper is conveyed at a constant transfer speed by a plurality of rollers. However, the transfer speed of the printing paper below the recording head may deviate from the ideal transfer speed due to the slip between the surface of the roller and the printing paper or the stretching of the printing paper due to the ink. Then, the ejection position of the ink of each color on the surface of the printing paper may shift in the transport direction. Therefore, for example,
特許文献1には、ジェッティングドラムを回転させることによって印刷基材を搬送しつつ、印刷基材にインク滴を滴下して画像(9)を記録する方法が開示されている。そして、ジェッティングドラムの駆動トルクの測定結果と、印刷基材に記録された画像データのグレースケール値推移(10)に基づき、補償トルクを計算し、当該補償トルクを考慮してジェッティングドラムを駆動制御するステップが開示されている。また、補償トルクを計算する際に機械学習を行うことが記載されている。
しかしながら、実装置を用いて一から機械学習を行う場合、所望のレベルに達するまでに膨大な時間を要する虞がある。また、学習初期段階においては、理想的な動作と大きく離れた制御を行うことによって、実装置に損傷に及ぼす虞がある。 However, when machine learning is performed from scratch using an actual device, it may take an enormous amount of time to reach a desired level. In addition, in the initial stage of learning, there is a risk of damaging the actual device by performing control that is far from the ideal operation.
本発明は、このような事情に鑑みなされたものであり、機械学習に要する時間を短縮できる技術を提供することを目的とする。また、学習初期段階においても、実装置に損傷に及ぼすことを防止できる技術を提供することを目的とする。 The present invention has been made in view of such circumstances, and an object of the present invention is to provide a technique capable of shortening the time required for machine learning. It is also an object of the present invention to provide a technique capable of preventing damage to an actual device even in the initial stage of learning.
上記課題を解決するため、本願の第1発明は、長尺帯状の基材を長手方向に搬送しながら、前記基材の表面に処理物質を吐出する搬送処理方法であって、a)実際に前記基材を搬送しながら、前記基材を搬送するための駆動源であるモータの回転数を含む搬送に係る制御値、または前記処理物質の吐出タイミングを含む吐出に係る制御値に係る情報と、前記基材の張力または搬送速度に係る計測値とを複数取得する工程と、b)前記工程a)による取得結果に基づいて、前記制御値と、前記計測値との関係を示す簡易シミュレーションモデルをコンピュータ上で作成する工程と、c)前記コンピュータ上で、前記制御値を更新しつつ、前記簡易シミュレーションモデルからの出力値を所定の範囲に維持するための強化学習を行うことにより、学習中モデルを作成する工程と、d)前記学習中モデルから出力される前記制御値を更新しつつ、実際に前記基材を搬送しながら前記基材の表面に前記処理物質を吐出する場合における、前記計測値を所定の範囲に維持するための強化学習を行う工程と、を有する。 In order to solve the above problems, the first invention of the present application is a transport processing method in which a processing substance is discharged onto the surface of the base material while transporting the long strip-shaped base material in the longitudinal direction. While transporting the base material, the control value related to the transport including the rotation speed of the motor which is the drive source for transporting the base material, or the information related to the control value related to the discharge including the discharge timing of the processing substance. , A simple simulation model showing the relationship between the control value and the measured value based on the step of acquiring a plurality of measured values related to the tension or the transport speed of the base material and b) the acquisition result in the step a). On a computer, and c) Reinforcement learning for maintaining the output value from the simple simulation model within a predetermined range while updating the control value on the computer is being learned. The step of creating a model and d) the case where the processing substance is discharged to the surface of the base material while actually transporting the base material while updating the control value output from the learning model. It has a step of performing reinforcement learning for maintaining the measured value within a predetermined range.
本願の第2発明は、第1発明の搬送処理方法であって、前記基材は、複数のローラに掛け渡され、前記複数のローラの少なくとも1つである駆動ローラが前記モータにより駆動されて回転することによって、搬送され、前記搬送に係る制御値は、前記駆動ローラの回転速度を含む。 The second invention of the present invention is the transport processing method of the first invention, in which the base material is hung on a plurality of rollers, and a drive roller which is at least one of the plurality of rollers is driven by the motor. It is conveyed by rotating, and the control value related to the transfer includes the rotation speed of the drive roller.
本願の第3発明は、第1発明または第2発明の搬送処理方法であって、前記吐出に係る制御値は、前記処理物質の吐出量を含む。 The third invention of the present application is the transport processing method of the first invention or the second invention, and the control value related to the discharge includes the discharge amount of the processed substance.
本願の第4発明は、第1発明から第3発明までのいずれか1発明の搬送処理方法であって、前記工程a)では、前記基材の厚みまたは種類に係る情報をさらに取得し、前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記基材の情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する。 The fourth invention of the present application is the transport processing method of any one of the first to third inventions, and in the step a), information on the thickness or type of the base material is further acquired, and the above-mentioned In the step b), the simple simulation model showing the relationship between the control value, the information on the base material, and the measured value is created based on the acquisition result in the step a).
本願の第5発明は、第1発明から第4発明までのいずれか1発明の搬送処理方法であって、前記工程a)では、前記処理物質の特性に係る情報をさらに取得し、前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記処理物質の情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する。 The fifth invention of the present application is the transport processing method of any one of the first to fourth inventions, and in the step a), information relating to the characteristics of the treated substance is further acquired, and the step b. ), The simple simulation model showing the relationship between the control value, the information of the processing substance, and the measured value is created based on the acquisition result in the step a).
本願の第6発明は、第1発明から第5発明までのいずれか1発明の搬送処理方法であって、前記工程a)では、前記基材の周囲の温度または湿度を含む環境条件に係る情報をさらに取得し、前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記環境条件に係る情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する。 The sixth invention of the present application is the transport processing method of any one of the first to fifth inventions, and in the step a), information relating to environmental conditions including the temperature or humidity around the base material. In the step b), the simple simulation model showing the relationship between the control value, the information related to the environmental condition, and the measured value is created based on the acquisition result in the step a).
本願の第7発明は、第1発明から第6発明までのいずれか1発明の搬送処理方法であって、前記工程b)において、前記簡易シミュレーションモデルは、決定木を含み、前記決定木に含まれるパラメータが調整される。 The seventh invention of the present application is the transport processing method of any one invention from the first invention to the sixth invention, and in the step b), the simple simulation model includes a decision tree and is included in the decision tree. Parameters are adjusted.
本願の第8発明は、第1発明から第7発明までのいずれか1発明の搬送処理方法であって、前記工程c)において行われる前記強化学習は、PPOまたはDQNの技法によって実行される機械学習である。 The eighth invention of the present application is the transport processing method of any one invention from the first invention to the seventh invention, and the reinforcement learning performed in the step c) is a machine executed by the technique of PPO or DQN. Learning.
本願の第1発明〜第8発明によれば、予め実装置においてデータ取りをした結果を用いて、コンピュータ上で簡易シミュレーションモデルを作成し、当該簡易シミュレーションモデルを用いてコンピュータ上で強化学習を行う。そして、コンピュータ上で強化学習を行うことによって得られた学習中モデルを、再度、実装置に移して、引き続き強化学習を行う。これにより、実装置の動作に見合ったある程度進んだ状態から強化学習を開始することができる。また、コンピュータ上で相当量の強化学習を行うことができる。この結果、機械学習に要する時間を大幅に短縮できる。また、学習初期段階に、制御値が過大になった場合でも、実装置に損傷に及ぼすことを防止できる。さらに、最終的に再度実装置を用いて強化学習を行うことにより、より高精度な制御値を出力する学習済みモデルを作成することができる。 According to the first to eighth inventions of the present application, a simple simulation model is created on a computer using the result of collecting data in an actual device in advance, and reinforcement learning is performed on the computer using the simple simulation model. .. Then, the learning model obtained by performing reinforcement learning on the computer is transferred to the actual device again, and reinforcement learning is continuously performed. As a result, reinforcement learning can be started from a state advanced to some extent commensurate with the operation of the actual device. In addition, a considerable amount of reinforcement learning can be performed on a computer. As a result, the time required for machine learning can be significantly reduced. In addition, even if the control value becomes excessive in the initial stage of learning, it is possible to prevent damage to the actual device. Furthermore, by finally performing reinforcement learning using the actual device again, it is possible to create a trained model that outputs more accurate control values.
以下、本発明の実施形態について、図面を参照しつつ説明する。本発明の一実施形態では、搬送処理装置の例として、搬送される印刷用紙に画像を記録する画像記録装置を例に挙げて、説明する。そして、印刷用紙の搬送速度または張力の計測値を所定の範囲に維持するための方法について、説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In one embodiment of the present invention, as an example of the transfer processing device, an image recording device that records an image on the transferred printing paper will be described as an example. Then, a method for maintaining the measured value of the transport speed or tension of the printing paper within a predetermined range will be described.
<1.第1実施形態>
<1−1.画像記録装置の構成>
まず、本発明の搬送処理装置の一例となる画像記録装置1の全体構成について、図1を参照しつつ説明する。図1は、画像記録装置1の構成を示した図である。この画像記録装置1は、長尺帯状の基材である印刷用紙9を搬送しつつ、複数の記録ヘッド21〜24から印刷用紙9へ向けてインクを吐出することにより、印刷用紙9に画像を記録するインクジェット方式の印刷装置である。図1に示すように、画像記録装置1は、搬送機構10、画像記録部20、2つのエッジ位置検出部30、エンコーダ40、張力検出部50、情報取得部60、制御部80、およびシミュレーション用のコンピュータ90を備えている。
<1. First Embodiment>
<1-1. Image recording device configuration>
First, the overall configuration of the
搬送機構10は、印刷用紙9をその長手方向に沿う搬送方向に搬送する機構である。本実施形態の搬送機構10は、巻き出しローラ11、複数の搬送ローラ12、および巻き取りローラ13を含む複数のローラと、1または複数(本実施形態では、3つ)のモータ14とを有する。印刷用紙9は、当該複数のローラに掛け渡される。また、本実施形態では、巻き出しローラ11、複数の搬送ローラ12のうちの1つ(図1における搬送ローラ121)、および巻き取りローラ13に、それぞれモータ14が接続される。モータ14は、印刷用紙9を搬送するための駆動源である。巻き出しローラ11、搬送ローラ121、および巻き取りローラ13は、モータ14により駆動され、それぞれ回転軸を中心として回転する。各搬送ローラ12は、回転軸を中心として回転することによって、印刷用紙9を搬送経路の下流側へ案内する。これにより、印刷用紙9は、巻き出しローラ11から繰り出され、複数の搬送ローラ12により構成される搬送経路に沿って搬送される。また、搬送後の印刷用紙9は、巻き取りローラ13へ回収される。
The
すなわち、本実施形態では、複数のローラのうちの巻き出しローラ11、搬送ローラ121、および巻き取りローラ13が、モータ14に接続される駆動ローラとなっている。ただし、モータ14が接続されるローラは、これに限定されない。印刷用紙9は、複数のローラの少なくとも1つである駆動ローラが、モータ14に駆動されて回転することによって、搬送されればよい。
That is, in the present embodiment, the unwinding
図1に示すように、印刷用紙9は、後述する複数の記録ヘッド21〜24の下方において、複数の記録ヘッド21〜24の配列方向と略平行に移動する。このとき、印刷用紙9の表面(記録面)は、上方(記録ヘッド21〜24側)に向けられている。また、印刷用紙9は、張力が掛かった状態で、複数の搬送ローラ12に掛け渡される。これにより、搬送中における印刷用紙9の弛みや皺が抑制される。
As shown in FIG. 1, the
画像記録部20は、搬送機構10により搬送される印刷用紙9に対して、インクの液滴(以下「インク滴」と称する)を吐出する処理部である。本実施形態の画像記録部20は、第1記録ヘッド21、第2記録ヘッド22、第3記録ヘッド23、および第4記録ヘッド24を有する。第1記録ヘッド21、第2記録ヘッド22、第3記録ヘッド23、および第4記録ヘッド24は、印刷用紙9の搬送経路に沿って配置されている。
The
図2は、画像記録部20付近における画像記録装置1の部分上面図である。4つの記録ヘッド21〜24は、それぞれ、印刷用紙9の幅方向の全体を覆っている。また、図2中に破線で示したように、各記録ヘッド21〜24の下面には、印刷用紙9の幅方向と平行に配列された複数のノズル250が設けられている。各記録ヘッド21〜24は、複数のノズル250から印刷用紙9の上面へ向けて、多色画像の色成分となるK(ブラック)、C(シアン)、M(マゼンタ)、Y(イエロー)の各色のインク滴を、それぞれ吐出する。
FIG. 2 is a partial top view of the
すなわち、第1記録ヘッド21は、搬送経路上の第1処理位置P1において、印刷用紙9の上面に、K色のインク滴を吐出する。第2記録ヘッド22は、第1処理位置P1よりも下流側の第2処理位置P2において、印刷用紙9の上面に、C色のインク滴を吐出する。第3記録ヘッド23は、第2処理位置P2よりも下流側の第3処理位置P3において、印刷用紙9の上面に、M色のインク滴を吐出する。第4記録ヘッド24は、第3処理位置P3よりも下流側の第4処理位置P4において、印刷用紙9の上面に、Y色のインク滴を吐出する。本実施形態では、第1処理位置P1、第2処理位置P2、第3処理位置P3、および第4処理位置P4は、印刷用紙9の搬送方向に沿って、等間隔に配列されている。
That is, the
4つの記録ヘッド21〜24は、インク滴を吐出することによって、印刷用紙9の上面に、それぞれ単色画像を記録する。そして、4つの単色画像の重ね合わせにより、印刷用紙9の上面に、多色画像が形成される。したがって、仮に、4つの記録ヘッド21〜24から吐出されるインク滴の印刷用紙9上における搬送方向の位置が相互にずれていると、印刷物の画像品質が低下する。このような、印刷用紙9上における単色画像の位置の誤差を許容範囲内に抑えることが、画像記録装置1の印刷品質を向上させるための重要な要素となる。
The four recording heads 21 to 24 record a single color image on the upper surface of the
なお、記録ヘッド21〜24の搬送方向下流側に、印刷用紙9の記録面に吐出されたインクを乾燥させる乾燥処理部が、さらに設けられていてもよい。乾燥処理部は、例えば、印刷用紙9へ向けて加熱された気体を吹き付けて、印刷用紙9に付着したインク中の溶媒を気化させることにより、インクを乾燥させる。ただし、乾燥処理部は、ヒートローラによる加熱や、光照射等の他の方法で、インクを乾燥させるものであってもよい。
A drying processing unit for drying the ink discharged on the recording surface of the
2つのエッジ位置検出部30はそれぞれ、印刷用紙9のエッジ(幅方向の端部)91の幅方向の位置を検出する検出部である。本実施形態では、搬送経路上の第1処理位置P1よりも上流側の第1検出位置Paと、搬送経路上において第1検出位置Paから下流側へ離間した第4処理位置P4よりもさらに下流側の第2検出位置Pbとに、エッジ位置検出部30が配置されている。ただし、エッジ位置検出部30は、必ずしも設けられなくてもよい。
Each of the two edge
図3は、エッジ位置検出部30の構造を模式的に示した図である。図3に示すように、エッジ位置検出部30は、印刷用紙9のエッジ91の上方に位置する投光器301と、エッジ91の下方に位置するラインセンサ302とを有する。投光器301は、下方へ向けて平行光を照射する。ラインセンサ302は、幅方向に配列された複数の受光素子321を有する。図3のように、印刷用紙9のエッジ91よりも外側においては、投光器301から照射された光が受光素子321に入射し、受光素子321が光を検出する。一方、印刷用紙9のエッジ91よりも内側においては、投光器301から照射された光が印刷用紙9に遮られるため、受光素子321は光を検出しない。エッジ位置検出部30は、このような複数の受光素子321における光検出の有無に基づいて、印刷用紙9のエッジ91の幅方向の位置を検出する。
FIG. 3 is a diagram schematically showing the structure of the edge
図1および図2に示すように、以下では、第1検出位置Paに配置されたエッジ位置検出部30を、第1エッジ位置検出部31と称する。また、第2検出位置Pbに配置されたエッジ位置検出部30を、第2エッジ位置検出部32と称する。第1エッジ位置検出部31は、第1検出位置Paにおいて、印刷用紙9のエッジ91の幅方向の位置を、断続的に検出する。これにより、第1検出位置Paにおけるエッジ91の幅方向の位置の経時変化を示す検出結果を取得する。そして、得られた検出結果を示す検出信号(以下、「第1エッジ信号Ed1」と称する)を、制御部80へ出力する。第2エッジ位置検出部32は、第2検出位置Pbにおいて、印刷用紙9のエッジ91の幅方向の位置を、断続的に検出する。これにより、第2検出位置Pbにおけるエッジ91の幅方向の位置の経時変化を示す検出結果を取得する。そして、得られた検出結果を示す検出信号(以下、「第2エッジ信号Ed2」と称する)を、制御部80へ出力する。ただし、第1エッジ位置検出部31および第2エッジ位置検出部32はそれぞれ、印刷用紙9のエッジ91の幅方向の位置を連続的に検出してもよい。
As shown in FIGS. 1 and 2, in the following, the edge
エンコーダ40は、複数の搬送ローラ12のうちの1つ(図1における搬送ローラ122)の軸芯に取り付けられる。ただし、エンコーダ40が取り付けられるローラは、搬送ローラ122には限定されない。エンコーダ40は、搬送機構10に含まれる複数のローラの少なくとも1つに取り付けられればよい。本実施形態では、エンコーダ40は、搬送ローラ122の回転駆動量を検出し、搬送ローラ122の回転に同期した連続パルス信号Enを、制御部80へ出力する。連続パルス信号Enは、搬送ローラ122を含む複数の搬送ローラ12によって搬送される印刷用紙9の搬送速度の経時変化を反映したデータとなる。制御部80は、入力された連続パルス信号Enに基づいて、後述する速度算出部81において、搬送ローラ122を含む複数の搬送ローラ12によって搬送される印刷用紙9の搬送速度の計測値Msを算出する。
The
張力検出部50は、複数の搬送ローラ12のうちの1つ(図1における搬送ローラ123)に取り付けられる。ただし、張力検出部50が取り付けられるローラは、搬送ローラ123には限定されない。張力検出部50は、搬送機構10に含まれる複数のローラの少なくとも1つに取り付けられればよい。本実施形態では、張力検出部50は、搬送ローラ123において印刷用紙9から受ける力を連続的または断続的に計測する。これにより、張力検出部50は、印刷用紙9に加わる張力を検出し、検出結果に係る張力信号Teを、制御部80へ出力する。張力信号Teは、搬送ローラ123に接触しつつ搬送ローラ123を含む複数の搬送ローラ12によって搬送される印刷用紙9に加わる張力の経時変化を反映したデータとなる。ただし、張力検出部50は、必ずしも設けられなくてもよい。
The
情報取得部60は、画像記録装置1における様々な設定値および条件に係る情報を取得する装置である。情報取得部60は、例えば、タッチパネル等の入力インターフェースを含む。作業員は、当該入力インターフェースを介して、例えば、画像記録部20の複数の記録ヘッド21〜24から吐出されるインクの種類または特性、印刷用紙9の周囲の温度または湿度を含む環境条件、および印刷用紙9の種類、形状、または厚み等に係る情報(以下、「情報Sc」と称する)を入力する。これにより、情報取得部60は、これらの情報Scを取得する。ただし、情報取得部60は、温度計や湿度計等のセンサを独自に有していてもよい。また、情報取得部60は、当該センサを介して情報Scを直接的に取得してもよい。また、情報取得部60は、上述した様々な設定値および条件に係る情報の少なくとも一つを取得するものであればよい。さらに、情報取得部60は、上述した様々な設定値および条件に係る情報以外の情報を取得するものであってもよい。情報取得部60によって取得された情報Scに係る信号は、制御部80へ送信される。
The
制御部80は、画像記録装置1内の各部を動作制御するための手段である。図1中に概念的に示したように、制御部80は、CPU等のプロセッサ801、RAM等のメモリ802、およびハードディスクドライブ等の記憶部803を有する。また、記憶部803内には、画像記録装置1を動作制御するためのプログラム80Pおよびデータ80Dが、記憶されている。また、図1中に破線で示したように、制御部80は、搬送機構10、4つの記録ヘッド21〜24、2つのエッジ位置検出部30、エンコーダ40、張力検出部50、および情報取得部60と、それぞれ電気的に接続されている。また、制御部80は、さらにコンピュータ90と電気的に接続されてもよい。
The
制御部80は、記憶部803に記憶されたプログラム80Pやデータ80Dをメモリ802に読み出し、プログラム80Pおよびデータ80Dに基づいて、プロセッサ801が演算処理を行うことにより、画像記録装置1内の上記各部を動作制御する。これにより、画像記録装置1における印刷処理が進行する。
The
また、記憶部803には、後述する事前学習により取得された学習済みモデルM3が、記憶されている。制御部80は、学習済みモデルM3から出力される制御値に基づき、3つのモータ14をそれぞれ回転させて印刷用紙9を搬送し、かつ、記録ヘッド21〜24からインクを吐出して印刷を行う。これにより、画像記録装置1において印刷処理を行う際に、印刷用紙9の搬送速度が所定の範囲に維持される。
Further, the
コンピュータ90は、上記の印刷用紙9の搬送経路とは別に設けられる。コンピュータ90は、市販のパーソナルコンピュータ(パソコン)の形態を有している。また、コンピュータ90は、図示を省略したモニタ、キーボード、ポインティングデバイス、またはタッチパネル等を有していてもよい。コンピュータ90は、CPU等のプロセッサ901、RAM等のメモリ902、およびハードディスクドライブ等の記憶部903を有する。記憶部903内には、コンピュータ90に所定の処理を実行させるためのプログラム90Pおよびデータ90Dが、記憶されている。ただし、コンピュータ90は、上記の制御部80に組み込まれていてもよい。
The
<1−2.事前学習について>
続いて、画像記録装置1において印刷処理を行う前に予め実行される事前学習について、説明する。なお、事前学習のうち、後述するステップS1およびステップS4は、実際に画像記録装置1を駆動しつつ行う。ステップS1またはステップS4を行う際に用いられる、後述する速度算出部81および判定部800の機能は、記憶部803に記憶されたプログラム80Pおよびデータ80Dをメモリ802に一時的に読み出し、当該プログラム80Pおよびデータ80Dに基づいて、プロセッサ801が演算処理を行うことによって、実現される。また、後述するステップS2およびステップS3は、コンピュータ90上で行う。ステップS2およびステップS3を行う際に用いられる、後述する判定部900の機能は、記憶部903に記憶されたプログラム90Pおよびデータ90Dをメモリ902に一時的に読み出し、当該プログラム90Pおよびデータ90Dに基づいて、プロセッサ901が演算処理を行うことによって、実現される。
<1-2. About pre-learning >
Subsequently, the pre-learning that is executed in advance before the printing process is performed in the
図4は、事前学習の流れを示すフローチャートである。図4に示すように、事前学習を行う際には、まず、画像記録装置1において実際に印刷用紙9を搬送しながら、印刷用紙9の表面にインクを吐出しつつ、画像記録装置1の各部における様々な計測値を複数取得する(ステップS1)。具体的には、搬送に係る制御値CVdを複数パターン変えながら、実際に印刷用紙9を搬送する。搬送に係る制御値CVdは、例えば、巻き出しローラ11、搬送ローラ121、および巻き取りローラ13にそれぞれ接続されるモータ14の回転数(駆動ローラの回転速度)である。同時に、インクの吐出に係る制御値CVeを複数パターン変えながら、実際に印刷用紙9の表面にインクを吐出する。インクの吐出に係る制御値CVeは、例えば、記録ヘッド21〜24からのインクの吐出タイミング(各ノズル250からのインク滴の吐出タイミング)である。なお、搬送に係る制御値CVdは、制御部80から各モータ14に入力される。インクの吐出に係る制御値CVeは、制御部80から記録ヘッド21〜24に入力される。
FIG. 4 is a flowchart showing the flow of pre-learning. As shown in FIG. 4, when performing pre-learning, first, while actually transporting the
なお、ステップS1において、モータ14の回転数は、時間に依らず一定であってもよいし、時間の経過とともに変化してもよい。また、インクの吐出タイミングは、規則的であってもよいし、不規則であってもよい。また、吐出に係る制御値CVeとして、インクの吐出タイミングの代わりに、またはインクの吐出タイミングに加えて、記録ヘッド21〜24からのインクの吐出量(各ノズル250からのインク滴の吐出量)を複数パターン変えながら、実際に印刷用紙9の表面にインクを吐出してもよい。また、モータ14の回転数を過大にして複数のローラの表面と印刷用紙9との間のスリップを生じさせたり、インクの吐出量を過大にして印刷用紙9を大きく膨張させたりしてもよい。さらに、画像記録装置1の電源をオフにして、モータ14を駆動させない場合や、インクを吐出しない場合を含めた、多岐に亘るパターンを実施してもよい。すなわち、搬送に係る制御値CVdは、少なくともモータ14の回転数に係る情報を含んでいれば、自由に設定できる。また、インクの吐出に係る制御値CVeは、少なくとも記録ヘッド21〜24からのインクの吐出タイミングに係る情報を含んでいれば、自由に設定できる。さらに、搬送に係る制御値CVdおよび吐出に係る制御値CVeの一方は、制御値として扱わず、予め定めた所定の値としてもよい。
In step S1, the rotation speed of the
ステップS1では、実際に印刷用紙9を搬送しながら、印刷用紙9の表面にインクを吐出しつつ、エンコーダ40から制御部80へ連続パルス信号Enを入力する。制御部80は、速度算出部81(後述する図9参照)を有する。制御部80は、入力された連続パルス信号Enに基づいて、速度算出部81において、印刷用紙9の搬送速度の計測値Msを算出する。
In step S1, a continuous pulse signal En is input from the
ただし、ステップS1では、印刷用紙9の搬送速度の計測値Ms以外の計測値をさらに複数取得してもよい。例えば、搬送される印刷用紙9の加速度や振動数の計測値を取得してもよい。
However, in step S1, a plurality of measured values other than the measured value Ms of the transport speed of the
また、ステップS1では、第1エッジ位置検出部31が、第1検出位置Paにおけるエッジ91の幅方向の位置の経時変化を検出し、その検出結果を示す第1エッジ信号Ed1を、制御部80へ出力する。本実施形態では、制御部80は、第1エッジ信号Ed1を第1参照値CF1として取得する。また、第2エッジ位置検出部32が、第2検出位置Pbにおけるエッジ91の幅方向の位置の経時変化を検出し、その検出結果を示す第2エッジ信号Ed2を、制御部80へ出力する。本実施形態では、制御部80は、第2エッジ信号Ed2を第2参照値CF2として取得する。また、ステップS1では、張力検出部50が、印刷用紙9に加わる張力の経時変化を検出し、その検出結果を示す張力信号Teを、制御部80へ出力する。本実施形態では、制御部80は、張力信号Teを第3参照値CF3として取得する。ただし、制御部80は、第1参照値CF1、第2参照値CF2、または第3参照値CF3を取得しなくてもよい。
Further, in step S1, the first edge
さらに、ステップS1では、情報取得部60によって、インクの種類または特性(インクの情報)、印刷用紙9の周囲の温度または湿度を含む環境条件、および印刷用紙9の種類、形状、または厚み(印刷用紙9の情報)に係る情報Scが取得される。情報取得部60によって取得された情報Scに係る信号は、制御部80へ送信される。
Further, in step S1, the
取得された印刷用紙9の搬送速度の計測値Msは、制御部80の記憶部803において、搬送に係る制御値CVdおよび吐出に係る制御値CVeと、上記の第1参照値CF1、第2参照値CF2、または第3参照値CF3と、情報Scとに関連付けられ、データ集合体DAとして蓄積される。図5は、データ集合体DAの例を概念的に示した図である。ただし、データ集合体DAは、作業員によってコンピュータ90等において手動で記録されてもよい。
The acquired measured values Ms of the transport speed of the
データ集合体DAとして十分な数のデータが蓄積されると、作業員はコンピュータ90上で、蓄積された制御値CVd,CVe、計測値Ms、参照値CF1,CF2,CF3、および情報Scに基づいて、制御値CVd,CVe、参照値CF1,CF2,CF3、および情報Scと、計測値Msとの関係を示す簡易シミュレーションモデルSiMoを作成する(ステップS2)。具体的には、印刷用紙9の搬送速度の計測値Msを教師データ(正解のデータ)としつつ、制御値CVd,CVe、参照値CF1,CF2,CF3、および情報Scから、印刷用紙9の搬送速度を高精度に算出するための簡易シミュレーションモデルSiMoを機械学習する。
When a sufficient number of data is accumulated as the data aggregate DA, the worker is based on the accumulated control values CVd, CVe, measured value Ms, reference values CF1, CF2, CF3, and information Sc on the
簡易シミュレーションモデルSiMoは、決定木X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)を含む。図6は、本実施形態の決定木X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)の例を概念的に示した図である。ステップS2では、機械学習において、入力された制御値CVd,CVe、計測値Ms、参照値CF1,CF2,CF3、および情報Scに基づいて算出した印刷用紙9の搬送速度の算出値CAsと、データ集合体DAに蓄積された対応する計測値Msとの差異を最小化するように、決定木X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)に含まれる複数のパラメータ(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)を調整しつつ更新保存していく。
The simple simulation model SiMo includes decision trees X (a, b, c, f (CVd, CVe, CF1, CF2, CF3, Sc) ...). FIG. 6 is a diagram conceptually showing an example of the decision tree X (a, b, c, f (CVd, CVe, CF1, CF2, CF3, Sc) ...) Of the present embodiment. In step S2, in machine learning, the calculated value CAs of the transfer speed of the
簡易シミュレーションモデルSiMoから出力される算出値CAsとデータ集合体DAに蓄積された対応する計測値Msとの差異が、所定値以下になると、機械学習が完了する。これにより、簡易シミュレーションモデルSiMoを用いて、入力された制御値CVd,CVe、計測値Ms、参照値CF1,CF2,CF3、および情報Scに基づいて、印刷用紙9の搬送速度を高精度に算出することが可能となる。ただし、簡易シミュレーションモデルSiMoに入力される値として、制御値CVd,CVe、計測値Ms、参照値CF1,CF2,CF3、および情報Scの一部が省略されてもよい。
Machine learning is completed when the difference between the calculated value CAs output from the simple simulation model SiMo and the corresponding measured value Ms stored in the data aggregate DA is equal to or less than a predetermined value. As a result, the transfer speed of the
ただし、簡易シミュレーションモデルSiMoは、決定木以外の機械学習(例えば、GBM(Gradient Boosting Machine))によって作成されたモデルを含むものであってもよい。また、簡易シミュレーションモデルSiMoは、機械学習によって作成されたモデルの代わりに、制御値CVd,CVe、参照値CF1,CF2,CF3、または情報Scと、印刷用紙9の搬送速度の算出値CAsとの関係を示す計算式(関数)を含むものであってもよい。また、簡易シミュレーションモデルSiMoは、例えば「画像記録装置1の電源がオンかオフか」等の条件式(例えば、電源がオフのときは0(ゼロ)を出力する式等)を含むものであってもよい。
However, the simple simulation model SiMo may include a model created by machine learning (for example, GBM (Gradient Boosting Machine)) other than the decision tree. Further, in the simple simulation model SiMo, instead of the model created by machine learning, the control values CVd, CVe, the reference values CF1, CF2, CF3, or the information Sc, and the calculated value CAs of the transfer speed of the
続いて、コンピュータ90上で、簡易シミュレーションモデルSiMoを用いて、印刷用紙9の搬送速度を所定の範囲に維持するための制御ルールを、自律的に学習(機械学習)する(ステップS3)。ステップS3では、強化学習を行うことにより、後述する第2段階学習中モデルM2を作成する。図7は、ステップS3において強化学習を行う様子を概念的に示したブロック図である。また、図8は、ステップS3の詳細な流れを示すフローチャートである。
Subsequently, on the
コンピュータ90上で強化学習を行うときには、強化学習プログラムに基づいて、後述する学習済みモデルM3の原型となる学習前モデルM0を用意する。そして、用意された学習前モデルM0に、制御値CVd,CVeと、簡易シミュレーションモデルSiMoからの出力を反映した報酬との関係を、学習させる。なお、本実施形態では、簡易シミュレーションモデルSiMoに入力される参照値CF1,CF2,CF3、および情報Scは、予め設定される。
When performing reinforcement learning on the
具体的には、まず、学習前モデルM0から、搬送に係る制御値CVdおよび吐出に係る制御値CVeとしてそれぞれ、ある値を出力して、簡易シミュレーションモデルSiMoへ入力する(ステップS31)。ただし、上記のとおり、搬送に係る制御値CVdおよび吐出に係る制御値CVeの一方は、予め定めた所定の値としてもよい。また、搬送に係る制御値CVdについては、巻き出しローラ11に接続されるモータ14へ入力する値と、搬送ローラ121に接続されるモータ14へ入力する値と、巻き取りローラ13に接続されるモータ14へ入力する値とが、互いに異なっていてもよい。
Specifically, first, from the pre-learning model M0, certain values are output as the control value CVd related to the transfer and the control value CVe related to the discharge, and are input to the simple simulation model SiMo (step S31). However, as described above, one of the control value CVd related to transport and the control value CVe related to discharge may be a predetermined value set in advance. Further, regarding the control value CVd related to the transfer, the value input to the
ステップS31の初期段階では、学習前モデルM0から出力される値は、ランダムな値となる。簡易シミュレーションモデルSiMoは、学習前モデルM0から入力された値と、上記の参照値CF1,CF2,CF3、および情報Scとに基づいて、印刷用紙9の搬送速度に係る算出値CAsを出力する(ステップS32)。以下では、このように学習が開始された後の学習前モデルM0を、第1段階学習中モデルM1と呼ぶこととする。
In the initial stage of step S31, the value output from the pre-learning model M0 is a random value. The simple simulation model SiMo outputs the calculated value CAs related to the transport speed of the
コンピュータ90は、判定部900としての機能をさらに有する。判定部900は、強化学習プログラムに基づいて、簡易シミュレーションモデルSiMoからの出力値である印刷用紙9の搬送速度に係る算出値CAsに応じた報酬RE1を付与する(ステップS33)。このとき、判定部900は、算出値CAsが予め設定された目標値に近づくほど、高い報酬RE1を付与する。一方、判定部900は、算出値CAsが予め設定された目標値から離れるほど、低い報酬RE1を付与する。
The
第1段階学習中モデルM1は、判定部900から報酬RE1を付与されると、当該付与された報酬RE1を踏まえて、搬送に係る制御値CVdおよび吐出に係る制御値CVeとしての次の値を出力する。例えば、第1段階学習中モデルM1は、判定部900から高い報酬RE1を付与されると、その高い報酬RE1を付与されるに至った制御値CVd,CVeに近い値を、次の値として出力する。また、第1段階学習中モデルM1は、判定部900から低い報酬RE1を付与されると、その低い報酬RE1を付与されるに至った制御値CVd,CVeから離れた値を、次の値として出力する。
When the reward RE1 is given by the
このように、ステップS3では、第1段階学習中モデルM1から出力する値(搬送に係る制御値CVdおよび吐出に係る制御値CVe)を更新しつつ、簡易シミュレーションモデルSiMoへ入力し、さらに簡易シミュレーションモデルSiMoからの算出値CAsを所定の範囲に維持するための強化学習を行う。また、本実施形態では、強化学習(深層強化学習)として、例えば、PPO(Proximal Policy Optimization)の技法によって実行される機械学習を行う。ただし、強化学習として、DQN(Deep Q Network)、Q学習法、SARSA、モンテカルロ法、epsilon-greedy法、BoltzmannQPolicy法等の技法によって実行される機械学習を行ってもよい。 In this way, in step S3, while updating the values output from the first-stage learning model M1 (control value CVd related to transport and control value CVe related to discharge), they are input to the simple simulation model SiMo, and further simple simulation is performed. Reinforcement learning is performed to maintain the calculated value CAs from the model SiMo within a predetermined range. Further, in the present embodiment, as reinforcement learning (deep reinforcement learning), for example, machine learning executed by a technique of PPO (Proximal Policy Optimization) is performed. However, as reinforcement learning, machine learning executed by techniques such as DQN (Deep Q Network), Q-learning method, SARSA, Monte Carlo method, epsilon-greedy method, and Boltzmann QPolicy method may be performed.
上記のとおり、コンピュータ90上での強化学習の初期段階では、第1段階学習中モデルM1は、制御値CVd,CVeとしてランダムな値を出力する。しかしながら、コンピュータ90は、ステップS31〜S33の処理を繰り返す過程で、判定部900から付与される報酬RE1に応じて、制御値CVd,CVeの増加、維持、減少等を試行する。これにより、制御値CVd,CVeと、簡易シミュレーションモデルSiMoからの出力を反映した報酬との関係を、自動的に学習する。そして、第1段階学習中モデルM1は、次第に、高い報酬RE1を得ることができるようになる。すなわち、第1段階学習中モデルM1は、次第に、簡易シミュレーションモデルSiMoからの算出値CAsを所定の範囲内に維持するための制御値CVd,CVeを、出力できるようになる。
As described above, in the initial stage of reinforcement learning on the
その後、コンピュータ90は、強化学習プログラムに基づいて、強化学習を終了するか否かを判断する(ステップS34)。判定部900による報酬RE1が、所望のレベルに達していない場合には、引き続き、コンピュータ90上での強化学習を継続する(ステップS34:no)。その場合、上述したステップS31〜S34の処理を、再度実行する。
After that, the
一方、ステップS34において、付与される報酬RE1が所望のレベルに達したと判断されると、強化学習プログラムに基づいて、コンピュータ90上での強化学習を終了する(ステップS34:yes)。そして、以上のコンピュータ90上での強化学習が完了した第1段階学習中モデルM1は、第2段階学習中モデルM2となる。
On the other hand, in step S34, when it is determined that the reward RE1 to be given has reached a desired level, the reinforcement learning on the
その後、制御部80の記憶部803に、第2段階学習中モデルM2がインストールされる。そして、図4に示すように、再度、実際に印刷用紙9を搬送しながら、印刷用紙9の表面にインクを吐出しつつ、印刷用紙9の搬送速度を所定の範囲に維持するための制御ルールを、自律的に強化学習(機械学習)する(ステップS4)。
After that, the second-stage learning model M2 is installed in the
図9は、ステップS4において強化学習を行う様子を概念的に示したブロック図である。また、図10は、ステップS4の詳細な流れを示すフローチャートである。図9および図10に示すように、実装置での強化学習を行うときには、まず、第2段階学習中モデルM2から、搬送に係る制御値CVd(モータ14の回転数)として、ある値を出力し、この値に基づき、駆動ローラである巻き出しローラ11、搬送ローラ121、および巻き取りローラ13にそれぞれ接続されるモータ14を回転させる。また、同時に、第2段階学習中モデルM2から、吐出に係る制御値CVe(吐出タイミング)として、ある値を出力し、この値に基づき、記録ヘッド21〜24からインクを吐出する(ステップS41)。
FIG. 9 is a block diagram conceptually showing how reinforcement learning is performed in step S4. Further, FIG. 10 is a flowchart showing a detailed flow of step S4. As shown in FIGS. 9 and 10, when performing reinforcement learning in an actual device, first, a certain value is output as a control value CVd (rotational speed of the motor 14) related to transportation from the model M2 during the second stage learning. Then, based on this value, the
次に、上記のとおり、印刷用紙9を搬送しながら、印刷用紙9の表面にインクを吐出しつつ、さらにエンコーダ40から制御部80へ連続パルス信号Enを入力する。制御部80は、入力された連続パルス信号Enに基づいて、速度算出部81において、印刷用紙9の搬送速度の計測値Msを取得する(ステップS42)。
Next, as described above, while transporting the
制御部80は、判定部800としての機能をさらに有する。判定部800は、強化学習プログラムに基づいて、上記の印刷用紙9の搬送速度の計測値Msに応じた報酬RE2を付与する(ステップS43)。このとき、判定部800は、計測値Msが予め設定された目標値に近づくほど、高い報酬RE2を付与する。一方、判定部800は、計測値Msが予め設定された目標値から離れるほど、低い報酬RE2を付与する。
The
第2段階学習中モデルM2は、判定部800から報酬RE2を付与されると、当該付与された報酬RE2を踏まえて、搬送に係る制御値CVdおよび吐出に係る制御値CVeとしての次の値を出力する。例えば、第2段階学習中モデルM2は、判定部800から高い報酬RE2を付与されると、その高い報酬RE2を付与されるに至った制御値CVd,CVeに近い値を、次の値として出力する。また、第2段階学習中モデルM2は、判定部800から低い報酬RE2を付与されると、その低い報酬RE2を付与されるに至った制御値CVd,CVeから離れた値を、次の値として出力する。
When the reward RE2 is given by the
このように、ステップS4では、第2段階学習中モデルM2から出力する値(搬送に係る制御値CVdおよび吐出に係る制御値CVe)を更新しつつ、モータ14および記録ヘッド21〜24を駆動し、エンコーダ40からの連続パルス信号Enに基づく印刷用紙9の搬送速度の計測値Msを所定の範囲に維持するための強化学習を行う。また、本実施形態では、強化学習(深層強化学習)として、例えば、PPO(Proximal Policy Optimization)の技法によって実行される機械学習を行う。ただし、強化学習として、DQN(Deep Q Network)、Q学習法、SARSA、モンテカルロ法、epsilon-greedy法、BoltzmannQPolicy法等の技法によって実行される機械学習を行ってもよい。
In this way, in step S4, the
上記のとおり、ステップS4では、予めコンピュータ90上での強化学習が完了した第2段階学習中モデルM2を用いて、実装置においてさらに強化学習を行う。そして、ステップS41〜S43の処理を繰り返す過程で、判定部800から付与される報酬RE2に応じて、実装置において制御値CVd,CVeの増加、維持、減少等を試行する。これにより、制御値CVd,CVeと、実際に搬送される印刷用紙9の搬送速度の計測値Msを反映した報酬との関係を、自動的に学習する。そして、第2段階学習中モデルM2は、次第に、高い報酬RE2を得ることができるようになる。すなわち、第2段階学習中モデルM2は、次第に、実装置において印刷用紙9の搬送速度の計測値Msを所定の範囲内に維持するための制御値CVd,CVeを、出力できるようになる。
As described above, in step S4, further reinforcement learning is performed in the actual device using the second-stage learning in-flight model M2 for which reinforcement learning on the
その後、制御部80上で、強化学習プログラムに基づいて、強化学習を終了するか否かを判断する(ステップS44)。判定部800による報酬RE2が、所望のレベルに達していない場合には、引き続き、実装置を用いた強化学習を継続する(ステップS44:no)。その場合、上述したステップS41〜S44の処理を、再度実行する。
After that, on the
一方、ステップS44において、付与される報酬RE2が所望のレベルに達したと判断されると、強化学習プログラムに基づいて、実装置での強化学習を終了する(ステップS44:yes)。そして、以上の実装置での強化学習が完了した第2段階学習中モデルM2は、学習済みモデルM3となる。 On the other hand, in step S44, when it is determined that the reward RE2 to be given has reached a desired level, the reinforcement learning in the actual device is terminated based on the reinforcement learning program (step S44: yes). Then, the second-stage learning model M2 for which the reinforcement learning on the actual device is completed becomes the trained model M3.
上記のとおり、本実施形態では、予め実装置においてデータ取りをした結果を用いて(ステップS1)、コンピュータ90上で簡易シミュレーションモデルSiMoを作成し(ステップS2)、当該簡易シミュレーションモデルSiMoを用いてコンピュータ90上で強化学習を行う(ステップS3)。そして、コンピュータ90上で強化学習を行うことによって得られた第2段階学習中モデルM2を、再度、実装置に移して、引き続き強化学習を行う(ステップS4)。これにより、実装置の動作に見合ったある程度進んだ状態から強化学習を開始することができる。また、コンピュータ90上で相当量の強化学習を行うことができる。この結果、機械学習に要する時間を大幅に短縮できる。また、学習初期段階に、コンピュータ90上で第1段階学習中モデルM1から出力される制御値CVd,CVeが過大になった場合でも、実装置に損傷に及ぼすことを防止できる。さらに、最終的に再度実装置を用いて強化学習を行うことにより、より高精度な制御値CVd,CVeを出力する学習済みモデルM3を作成することができる。これにより、例えば、実装置毎の特徴(例えば、装置の経年に伴い現れる特徴や、印刷用紙9における微小な凹凸による厚みの違いや、インク毎の粘性の僅かな違い等)に沿った、より良い動作を実現することができる。
As described above, in the present embodiment, a simple simulation model SiMo is created on the computer 90 (step S2) using the result of collecting data in the actual device in advance (step S1), and the simple simulation model SiMo is used. Reinforcement learning is performed on the computer 90 (step S3). Then, the second-stage learning model M2 obtained by performing reinforcement learning on the
ステップS4に係る実装置での強化学習が完了した後、画像記録装置1における印刷処理が開始される。制御部80は、学習済みモデルM3に基づき、3つのモータ14をそれぞれ回転させて印刷用紙9を搬送し、かつ、記録ヘッド21〜24からインクを吐出して印刷を行う。これにより、搬送機構10のローラの表面と印刷用紙9との間のスリップや、インクによる印刷用紙9の伸びが発生した場合でも、印刷用紙9の搬送速度が所定の範囲に維持される。これにより、印刷用紙9上における各色のインクの吐出位置の搬送方向の誤差が抑制される。この結果、画像記録装置1の印刷品質を向上できる。
After the reinforcement learning in the actual device according to step S4 is completed, the printing process in the
<2.変形例>
以上、本発明の一実施形態について説明したが、本発明は、上記の実施形態に限定されるものではない。以下では、種々の変形例について、上記の実施形態との相違点を説明する。
<2. Modification example>
Although one embodiment of the present invention has been described above, the present invention is not limited to the above embodiment. Hereinafter, the differences between the various modifications and the above-described embodiments will be described.
<2−1.第1変形例>
上記の実施形態では、制御部80の速度算出部81は、搬送ローラ122に接続されたエンコーダ40から入力された連続パルス信号Enに基づき、搬送ローラ122を含む複数の搬送ローラ12によって搬送される印刷用紙9の搬送速度の計測値Msを算出していた。しかしながら、制御部80は、第1エッジ位置検出部31から入力された第1エッジ信号Ed1および第2エッジ位置検出部32から入力された第2エッジ信号Ed2に基づき、印刷用紙9の搬送速度の計測値Msを算出してもよい。以下に、詳細を説明する。
<2-1. First modification>
In the above embodiment, the
図11は、第1エッジ信号Ed1の例および第2エッジ信号Ed2の例をそれぞれ示したグラフである。図11において、横軸は時刻を示す。図11の縦軸は、エッジ91の幅方向の位置を示す。なお、図11のグラフの横軸は、左端が現在時刻であり、右側へ向かうほど時刻が古くなる。したがって、図11中のデータ線は、時間の経過とともに、白抜き矢印のように右側へ移動する。印刷用紙9のエッジ91には、微細な凹凸が存在する。第1エッジ位置検出部31および第2エッジ位置検出部32は、予め設定された微小時間ごとに(例えば50マイクロ秒ごとに)、印刷用紙9のエッジ91の幅方向の位置を検出する。これにより、図11のように、印刷用紙9のエッジ91の幅方向の位置の経時変化を示すデータが得られる。第1エッジ信号Ed1は、第1検出位置Paを通過する印刷用紙9のエッジ91の形状を反映したデータとなる。第2エッジ信号Ed2は、第2検出位置Pbを通過する印刷用紙9のエッジ91の形状を反映したデータとなる。
FIG. 11 is a graph showing an example of the first edge signal Ed1 and an example of the second edge signal Ed2, respectively. In FIG. 11, the horizontal axis represents the time. The vertical axis of FIG. 11 indicates the position of the
制御部80は、第1エッジ信号Ed1と第2エッジ信号Ed2とを比較する。そして、第1エッジ信号Ed1と第2エッジ信号Ed2とで、印刷用紙9の同一のエッジ91を検出した箇所を特定する。具体的には、第1エッジ信号Ed1に含まれるデータ区間(一定の時間範囲)ごとに、第2エッジ信号Ed2に含まれる複数のデータ区間(一定の時間範囲)のうち、一致性の高いデータ区間を特定する。以下では、第1エッジ信号Ed1に含まれるデータ区間を、第1データ区間DS1と称する。また、第2エッジ信号Ed2に含まれるデータ区間を、第2データ区間DS2と称する。
The
一致性の高いデータ区間の特定には、例えば、相互相関や残差平方和等のマッチング手法が用いられる。制御部80は、第1データ区間DS1ごとに、複数の第2データ区間DS2を、対応するデータ区間の候補として選択する。また、選択された候補である複数の第2データ区間DS2のそれぞれについて、第1データ区間DS1との一致性を示す評価値を算出する。そして、評価値が最も高くなる第2データ区間DS2を、第1データ区間DS1に対応する(第1データ区間DS1と最も一致性が高い)第2データ区間DS2として特定する。
For example, a matching method such as cross-correlation or residual sum of squares is used to identify a data interval with high consistency. The
その後、制御部80は、第1データ区間DS1の検出時刻TM1と、第1データ区間DS1と最も一致性の高い第2データ区間DS2の検出時刻TM2との時間差に基づいて、第1検出位置Paから第2検出位置Pbまでの印刷用紙9の搬送にかかる実際の搬送時間ΔT(時刻TM2と時刻TM1との間の時間差)を算出する。そして、第1検出位置Paから第2検出位置Pbまでの距離を、搬送時間ΔTで除することによって、画像記録部20の下方における印刷用紙9の搬送速度を算出することができる。
After that, the
<2−2.第2変形例>
上記の実施形態または変形例に記載された方法のほか、印刷用紙9の搬送速度を検出するためのレーザ速度計(図示省略)が用いられてもよい。そして、当該レーザ速度計から、印刷用紙9へ向けて2本のレーザ光線を照射し、これらがそれぞれ印刷用紙9によって反射された反射光の波長を解析した結果に基づいて、印刷用紙9の搬送速度を算出してもよい。
<2-2. Second modification>
In addition to the methods described in the above embodiments or modifications, a laser speedometer (not shown) for detecting the transport speed of the
<2−3.第3変形例>
上記の実施形態では、画像記録装置1において印刷処理を行う前に予め実行される事前学習の際に、印刷用紙9の搬送速度の計測値Msを所定の範囲に維持するための強化学習を行っていた。しかしながら、事前学習において、印刷用紙9の張力の計測値Mtを所定の範囲に維持するための強化学習を行ってもよい。
<2-3. Third variant>
In the above embodiment, reinforcement learning for maintaining the measured value Ms of the transport speed of the
具体的には、上記のステップS1において、実際に印刷用紙9を搬送しながら、印刷用紙9の表面にインクを吐出しつつ、張力検出部50から出力される張力信号Teに基づき、張力検出部50が接続された搬送ローラ123に接触しつつ搬送ローラ123を含む複数の搬送ローラ12によって搬送される印刷用紙9に加わる張力の計測値を複数取得して、データ集合体DAに蓄積してもよい。
Specifically, in step S1 described above, the tension detection unit is based on the tension signal Te output from the
また、上記のステップS2において、印刷用紙9の張力の計測値Mtを教師データ(正解のデータ)としつつ、制御値CVd,CVe、参照値CF1,CF2,CF3、および情報Scから、印刷用紙9の張力を高精度に算出するための簡易シミュレーションモデルSiMoを機械学習してもよい。そして、簡易シミュレーションモデルSiMoは、決定木X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)を含み、入力された制御値CVd,CVe、計測値Ms、参照値CF1,CF2,CF3、および情報Scに基づいて算出した印刷用紙9の張力の算出値CAtと、データ集合体DAに蓄積された対応する計測値Mtとの差異を最小化するように、決定木X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)に含まれる複数のパラメータ(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)を調整しつつ更新保存してもよい。簡易シミュレーションモデルSiMoからの出力値である印刷用紙9の張力の算出値CAtとデータ集合体DAに蓄積された対応する計測値Mtとの差異が、所定値以下になると、機械学習が完了する。
Further, in step S2 above, the
また、上記のステップS3において、コンピュータ90上で、簡易シミュレーションモデルSiMoを用いて、印刷用紙9の張力を所定の範囲に維持するための制御ルールを、機械学習してもよい。具体的には、ステップS31において、搬送に係る制御値CVdおよび吐出に係る制御値CVeとしてそれぞれ、ある値を出力して、簡易シミュレーションモデルSiMoへ入力してもよい。ステップS32では、簡易シミュレーションモデルSiMoは、学習前モデルM0から入力された値と、上記の参照値CF1,CF2,CF3、および情報Scとに基づいて、印刷用紙9の張力の算出値CAtを出力してもよい。
Further, in step S3 described above, the control rule for maintaining the tension of the
ステップS33では、簡易シミュレーションモデルSiMoからの出力値である、印刷用紙9の張力の算出値CAtに応じた報酬RE1を付与してもよい。これにより、ステップS3では、第1段階学習中モデルM1から出力する値(搬送に係る制御値CVdおよび吐出に係る制御値CVe)を更新しつつ、簡易シミュレーションモデルSiMoへ入力し、さらに簡易シミュレーションモデルSiMoからのCAtを所定の範囲に維持するための強化学習を行ってもよい。さらに、ステップS34では、報酬RE1が所望のレベルに達したと判断されると、コンピュータ90上での強化学習を終了してもよい。そして、当該ステップS3において作成された学習モデルを、第2段階学習中モデルM2としてもよい。
In step S33, the reward RE1 corresponding to the calculated value CAt of the tension of the
また、上記のステップS4において、ステップS3において作成された第2段階学習中モデルM2から、搬送に係る制御値CVd(モータ14の回転数)として、ある値を出力し、この値に基づき、駆動ローラである巻き出しローラ11、搬送ローラ121、および巻き取りローラ13にそれぞれ接続されるモータ14を回転させてもよい。また、同時に、第2段階学習中モデルM2から、吐出に係る制御値CVe(吐出タイミング)として、ある値を出力し、この値に基づき、記録ヘッド21〜24からインクを吐出してもよい(ステップS41)。また、ステップS42において、張力検出部50から出力される張力信号Teに基づき、このときの印刷用紙9に加わる張力の計測値Mtを取得してもよい。
Further, in step S4 described above, a certain value is output as the control value CVd (rotational speed of the motor 14) related to the transfer from the second stage learning model M2 created in step S3, and the drive is performed based on this value. The
ステップS43では、印刷用紙9の張力の計測値Mtに応じた報酬RE2を付与してもよい。そして、ステップS44では、報酬RE2が所望のレベルに達したと判断されると、実装置を用いた強化学習を終了してもよい。
In step S43, the reward RE2 corresponding to the measured value Mt of the tension of the
さらに、事前学習において、上記の実施形態および変形例のほか、印刷用紙9の伸びの計測値を所定の範囲に維持するための強化学習を行ってもよい。
Further, in the pre-learning, in addition to the above-described embodiment and modification, reinforcement learning for maintaining the measured value of the elongation of the
<2−4.他の変形例>
また、上記の画像記録装置1は、印刷用紙9を搬送しながら、処理物質としてインクを吐出して印刷用紙9の表面に画像を記録するものであった。しかしながら、画像記録装置1は、インク以外の処理物質を印刷用紙9の表面に吐出して画像を記録するものであってもよい。また、本発明の搬送処理装置は、インクジェット以外の方法(例えば、電子写真方式や露光等)で、印刷用紙9に画像を記録する装置であってもよい。また、上記の画像記録装置1は、基材としての印刷用紙9に印刷処理を行うものであった。しかしながら、本発明の搬送処理装置は、一般的な紙以外の長尺帯状の基材(例えば、樹脂製のフィルム,金属箔等)に、所定の処理を行うものであってもよい。
<2-4. Other variants>
Further, the above-mentioned
また、上記の実施形態や変形例に登場した各要素を、矛盾が生じない範囲で、適宜に組み合わせてもよい。 Further, the elements appearing in the above-described embodiments and modifications may be appropriately combined as long as there is no contradiction.
1 画像記録装置
9 印刷用紙
10 搬送機構
11 巻き出しローラ
12 搬送ローラ
13 巻き取りローラ
14 モータ
20 画像記録部
21 第1記録ヘッド
22 第2記録ヘッド
23 第3記録ヘッド
24 第4記録ヘッド
30 エッジ位置検出部
31 第1エッジ位置検出部
32 第2エッジ位置検出部
40 エンコーダ
50 張力検出部
60 情報取得部
80 制御部
81 速度算出部
90 コンピュータ
91 エッジ
121 搬送ローラ
122 搬送ローラ
123 搬送ローラ
800 判定部
900 判定部
CAs (搬送速度の)算出値
CAt (張力の)算出値
CF1,CF2,CF3 参照値
CVd 搬送に係る制御値
CVe 吐出に係る制御値
DA データ集合体
M0 学習前モデル
M1 第1段階学習中モデル
M2 第2段階学習中モデル
M3 学習済みモデル
Ms (搬送速度の)計測値
Mt (張力の)計測値
RE1,RE2 報酬
Re1,Re2 参照値
Sc 情報
SiMo 簡易シミュレーションモデル
Te 張力信号
X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)) 決定木
1
Claims (8)
a)実際に前記基材を搬送しながら、前記基材を搬送するための駆動源であるモータの回転数を含む搬送に係る制御値、または前記処理物質の吐出タイミングを含む吐出に係る制御値に係る情報と、前記基材の張力または搬送速度に係る計測値とを複数取得する工程と、
b)前記工程a)による取得結果に基づいて、前記制御値と、前記計測値との関係を示す簡易シミュレーションモデルをコンピュータ上で作成する工程と、
c)前記コンピュータ上で、前記制御値を更新しつつ、前記簡易シミュレーションモデルからの出力値を所定の範囲に維持するための強化学習を行うことにより、学習中モデルを作成する工程と、
d)前記学習中モデルから出力される前記制御値を更新しつつ、実際に前記基材を搬送しながら前記基材の表面に前記処理物質を吐出する場合における、前記計測値を所定の範囲に維持するための強化学習を行う工程と、
を有する、搬送処理方法。 A transport processing method in which a processing substance is discharged onto the surface of the substrate while the long strip-shaped substrate is conveyed in the longitudinal direction.
a) A control value related to transportation including the rotation speed of a motor which is a drive source for transporting the base material while actually transporting the base material, or a control value related to discharge including the discharge timing of the processed substance. And the step of acquiring a plurality of measured values related to the tension or the transport speed of the base material, and
b) A step of creating a simple simulation model showing the relationship between the control value and the measured value on a computer based on the acquisition result in the step a).
c) A step of creating a learning model by performing reinforcement learning to maintain the output value from the simple simulation model within a predetermined range while updating the control value on the computer.
d) While updating the control value output from the learning model, the measured value in the case of discharging the processed substance to the surface of the base material while actually transporting the base material is set within a predetermined range. The process of performing reinforcement learning to maintain,
A transport processing method.
前記基材は、複数のローラに掛け渡され、前記複数のローラの少なくとも1つである駆動ローラが前記モータにより駆動されて回転することによって、搬送され、
前記搬送に係る制御値は、前記駆動ローラの回転速度を含む、搬送処理方法。 The transport processing method according to claim 1.
The base material is spread over a plurality of rollers, and is conveyed by rotating a drive roller, which is at least one of the plurality of rollers, driven by the motor.
The control value related to the transfer is a transfer processing method including the rotation speed of the drive roller.
前記吐出に係る制御値は、前記処理物質の吐出量を含む、搬送処理方法。 The transport processing method according to claim 1 or 2.
The control value related to the discharge is a transport processing method including a discharge amount of the processing substance.
前記工程a)では、前記基材の厚みまたは種類に係る情報をさらに取得し、
前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記基材の情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する、搬送処理方法。 The transport processing method according to any one of claims 1 to 3.
In the step a), information on the thickness or type of the base material is further acquired.
In the step b), a transport processing method for creating the simple simulation model showing the relationship between the control value, the information on the base material, and the measured value based on the acquisition result in the step a).
前記工程a)では、前記処理物質の特性に係る情報をさらに取得し、
前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記処理物質の情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する、搬送処理方法。 The transport processing method according to any one of claims 1 to 4.
In the step a), information on the characteristics of the processed substance is further acquired, and the information is obtained.
In the step b), a transport processing method for creating the simple simulation model showing the relationship between the control value, the information on the processing substance, and the measured value based on the acquisition result in the step a).
前記工程a)では、前記基材の周囲の温度または湿度を含む環境条件に係る情報をさらに取得し、
前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記環境条件に係る情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する、搬送処理方法。 The transport processing method according to any one of claims 1 to 5.
In the step a), information on environmental conditions including the temperature or humidity around the base material is further acquired.
In the step b), a transport processing method for creating the simple simulation model showing the relationship between the control value, the information related to the environmental condition, and the measured value based on the acquisition result in the step a).
前記工程b)において、前記簡易シミュレーションモデルは、決定木を含み、前記決定木に含まれるパラメータが調整される、搬送処理方法。 The transport processing method according to any one of claims 1 to 6.
In the step b), the simple simulation model includes a decision tree, and the parameters included in the decision tree are adjusted.
前記工程c)において行われる前記強化学習は、PPOまたはDQNの技法によって実行される機械学習である、搬送処理方法。 The transport processing method according to any one of claims 1 to 7.
The reinforcement learning performed in the step c) is a transfer processing method, which is machine learning executed by a technique of PPO or DQN.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020045073A JP2021147112A (en) | 2020-03-16 | 2020-03-16 | Method of feed processing |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020045073A JP2021147112A (en) | 2020-03-16 | 2020-03-16 | Method of feed processing |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021147112A true JP2021147112A (en) | 2021-09-27 |
Family
ID=77850768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020045073A Pending JP2021147112A (en) | 2020-03-16 | 2020-03-16 | Method of feed processing |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021147112A (en) |
-
2020
- 2020-03-16 JP JP2020045073A patent/JP2021147112A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6715120B2 (en) | Substrate processing device and meandering prediction method | |
JP6468805B2 (en) | Image recording apparatus and image recording method | |
JP6548416B2 (en) | Recording device, control method of recording device, and program | |
JP7493651B2 (en) | Substrate processing device and substrate processing method | |
US9519447B2 (en) | Apparatus and method for determining suitable printing conditions for printing sheets in a printing system | |
JP2018162161A (en) | Base material treatment apparatus and detection method | |
US10479116B2 (en) | Base material processing apparatus and detection method | |
JP2018051765A (en) | Substrate processing device and substrate processing method | |
US20200346470A1 (en) | Base material processing apparatus and detection method | |
JP6437829B2 (en) | Printing position correction method and printing apparatus using the same | |
JP2021146510A (en) | Learning method, control method and printer | |
JP2021147112A (en) | Method of feed processing | |
JP7198019B2 (en) | Base material processing apparatus and detection method | |
JP7198020B2 (en) | Base material processing apparatus and detection method | |
JP7449732B2 (en) | Abnormality detection method and transport device | |
JP2022115319A (en) | Base material processing method | |
JP2021147228A (en) | Conveying device and conveying method | |
JP7428671B2 (en) | Image forming device and image forming method | |
WO2023068091A1 (en) | Printing device and printing method | |
JP7460517B2 (en) | Printing devices and management methods | |
JP2020158262A (en) | Base material processing device and detecting method | |
JP2022122676A (en) | Carrying device, processing device, carrying method, and processing method | |
JP7221763B2 (en) | Base material treatment method | |
WO2023166812A1 (en) | Estimation method, control method, and device | |
US20240208249A1 (en) | Deformation factors based on tension and media advancement data |