JP2021147112A - Method of feed processing - Google Patents

Method of feed processing Download PDF

Info

Publication number
JP2021147112A
JP2021147112A JP2020045073A JP2020045073A JP2021147112A JP 2021147112 A JP2021147112 A JP 2021147112A JP 2020045073 A JP2020045073 A JP 2020045073A JP 2020045073 A JP2020045073 A JP 2020045073A JP 2021147112 A JP2021147112 A JP 2021147112A
Authority
JP
Japan
Prior art keywords
printing paper
processing method
base material
control value
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020045073A
Other languages
Japanese (ja)
Inventor
充宏 吉田
Mitsuhiro Yoshida
充宏 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2020045073A priority Critical patent/JP2021147112A/en
Publication of JP2021147112A publication Critical patent/JP2021147112A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Feedback Control In General (AREA)
  • Ink Jet (AREA)
  • Handling Of Sheets (AREA)
  • Controlling Rewinding, Feeding, Winding, Or Abnormalities Of Webs (AREA)

Abstract

To provide a technology allowing for reducing the time required for machine learning and preventing damages to a real installation.SOLUTION: A method of feed processing includes ejecting a processing substance to a surface while feeding a base material. The method has a) a step of acquiring plural pieces of information related to a control value related to feeding including a rotational speed of a motor to feed a base material or to a control value related to ejection including ejection timing of a processing substance and a measured value related to a tension or feed rate of the base material, while actually feeding the base material, b) a step of preparing a simplified simulation model indicative of a relationship between the control value and the measured value on a computer, c) a step of preparing an in-learning model by conducting reinforcement learning to maintain an output value from the simplified simulation model in a predetermined range while updating the control value on the computer, and d) a step of conducting reinforcement learning to maintain the measured value in the predetermined range in the case of ejecting a processing substance to a surface while actually feeding the base material with updating the control value outputted from the in-learning model.SELECTED DRAWING: Figure 4

Description

本発明は、長尺帯状の基材を長手方向に搬送しながら基材の表面に処理物質を吐出する、搬送処理方法に関する。 The present invention relates to a transport processing method in which a processing substance is discharged onto the surface of a base material while transporting a long strip-shaped base material in the longitudinal direction.

従来、長尺帯状の印刷用紙を長手方向に搬送しつつ、複数の記録ヘッドからインクを吐出することにより、印刷用紙に画像を記録するインクジェット方式の画像記録装置が知られている。画像記録装置は、複数のヘッドから、それぞれ異なる色のインクを吐出する。そして、各色のインクにより形成される単色画像の重ね合わせによって、印刷用紙の表面に多色画像を記録する。 Conventionally, there is known an inkjet type image recording device that records an image on a printing paper by ejecting ink from a plurality of recording heads while transporting a long strip-shaped printing paper in the longitudinal direction. The image recording device ejects inks of different colors from a plurality of heads. Then, a multicolor image is recorded on the surface of the printing paper by superimposing the monochromatic images formed by the inks of each color.

この種の画像記録装置においては、複数のローラにより、印刷用紙を一定の搬送速度で搬送することが求められる。しかしながら、ローラの表面と印刷用紙との間のスリップや、インクによる印刷用紙の伸びによって、記録ヘッドの下方における印刷用紙の搬送速度が、理想的な搬送速度からずれる場合がある。そうすると、印刷用紙の表面における各色のインクの吐出位置が搬送方向にずれる虞がある。そこで、このようなずれを補償する方法が、例えば、特許文献1に記載されている。 In this type of image recording apparatus, it is required that printing paper is conveyed at a constant transfer speed by a plurality of rollers. However, the transfer speed of the printing paper below the recording head may deviate from the ideal transfer speed due to the slip between the surface of the roller and the printing paper or the stretching of the printing paper due to the ink. Then, the ejection position of the ink of each color on the surface of the printing paper may shift in the transport direction. Therefore, for example, Patent Document 1 describes a method for compensating for such a deviation.

特開2019−166832号公報Japanese Unexamined Patent Publication No. 2019-166832

特許文献1には、ジェッティングドラムを回転させることによって印刷基材を搬送しつつ、印刷基材にインク滴を滴下して画像(9)を記録する方法が開示されている。そして、ジェッティングドラムの駆動トルクの測定結果と、印刷基材に記録された画像データのグレースケール値推移(10)に基づき、補償トルクを計算し、当該補償トルクを考慮してジェッティングドラムを駆動制御するステップが開示されている。また、補償トルクを計算する際に機械学習を行うことが記載されている。 Patent Document 1 discloses a method of recording an image (9) by dropping ink droplets on a printing substrate while transporting the printing substrate by rotating a jetting drum. Then, the compensation torque is calculated based on the measurement result of the drive torque of the jetting drum and the grayscale value transition (10) of the image data recorded on the printing substrate, and the jetting drum is set in consideration of the compensation torque. The steps of drive control are disclosed. In addition, it is described that machine learning is performed when calculating the compensation torque.

しかしながら、実装置を用いて一から機械学習を行う場合、所望のレベルに達するまでに膨大な時間を要する虞がある。また、学習初期段階においては、理想的な動作と大きく離れた制御を行うことによって、実装置に損傷に及ぼす虞がある。 However, when machine learning is performed from scratch using an actual device, it may take an enormous amount of time to reach a desired level. In addition, in the initial stage of learning, there is a risk of damaging the actual device by performing control that is far from the ideal operation.

本発明は、このような事情に鑑みなされたものであり、機械学習に要する時間を短縮できる技術を提供することを目的とする。また、学習初期段階においても、実装置に損傷に及ぼすことを防止できる技術を提供することを目的とする。 The present invention has been made in view of such circumstances, and an object of the present invention is to provide a technique capable of shortening the time required for machine learning. It is also an object of the present invention to provide a technique capable of preventing damage to an actual device even in the initial stage of learning.

上記課題を解決するため、本願の第1発明は、長尺帯状の基材を長手方向に搬送しながら、前記基材の表面に処理物質を吐出する搬送処理方法であって、a)実際に前記基材を搬送しながら、前記基材を搬送するための駆動源であるモータの回転数を含む搬送に係る制御値、または前記処理物質の吐出タイミングを含む吐出に係る制御値に係る情報と、前記基材の張力または搬送速度に係る計測値とを複数取得する工程と、b)前記工程a)による取得結果に基づいて、前記制御値と、前記計測値との関係を示す簡易シミュレーションモデルをコンピュータ上で作成する工程と、c)前記コンピュータ上で、前記制御値を更新しつつ、前記簡易シミュレーションモデルからの出力値を所定の範囲に維持するための強化学習を行うことにより、学習中モデルを作成する工程と、d)前記学習中モデルから出力される前記制御値を更新しつつ、実際に前記基材を搬送しながら前記基材の表面に前記処理物質を吐出する場合における、前記計測値を所定の範囲に維持するための強化学習を行う工程と、を有する。 In order to solve the above problems, the first invention of the present application is a transport processing method in which a processing substance is discharged onto the surface of the base material while transporting the long strip-shaped base material in the longitudinal direction. While transporting the base material, the control value related to the transport including the rotation speed of the motor which is the drive source for transporting the base material, or the information related to the control value related to the discharge including the discharge timing of the processing substance. , A simple simulation model showing the relationship between the control value and the measured value based on the step of acquiring a plurality of measured values related to the tension or the transport speed of the base material and b) the acquisition result in the step a). On a computer, and c) Reinforcement learning for maintaining the output value from the simple simulation model within a predetermined range while updating the control value on the computer is being learned. The step of creating a model and d) the case where the processing substance is discharged to the surface of the base material while actually transporting the base material while updating the control value output from the learning model. It has a step of performing reinforcement learning for maintaining the measured value within a predetermined range.

本願の第2発明は、第1発明の搬送処理方法であって、前記基材は、複数のローラに掛け渡され、前記複数のローラの少なくとも1つである駆動ローラが前記モータにより駆動されて回転することによって、搬送され、前記搬送に係る制御値は、前記駆動ローラの回転速度を含む。 The second invention of the present invention is the transport processing method of the first invention, in which the base material is hung on a plurality of rollers, and a drive roller which is at least one of the plurality of rollers is driven by the motor. It is conveyed by rotating, and the control value related to the transfer includes the rotation speed of the drive roller.

本願の第3発明は、第1発明または第2発明の搬送処理方法であって、前記吐出に係る制御値は、前記処理物質の吐出量を含む。 The third invention of the present application is the transport processing method of the first invention or the second invention, and the control value related to the discharge includes the discharge amount of the processed substance.

本願の第4発明は、第1発明から第3発明までのいずれか1発明の搬送処理方法であって、前記工程a)では、前記基材の厚みまたは種類に係る情報をさらに取得し、前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記基材の情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する。 The fourth invention of the present application is the transport processing method of any one of the first to third inventions, and in the step a), information on the thickness or type of the base material is further acquired, and the above-mentioned In the step b), the simple simulation model showing the relationship between the control value, the information on the base material, and the measured value is created based on the acquisition result in the step a).

本願の第5発明は、第1発明から第4発明までのいずれか1発明の搬送処理方法であって、前記工程a)では、前記処理物質の特性に係る情報をさらに取得し、前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記処理物質の情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する。 The fifth invention of the present application is the transport processing method of any one of the first to fourth inventions, and in the step a), information relating to the characteristics of the treated substance is further acquired, and the step b. ), The simple simulation model showing the relationship between the control value, the information of the processing substance, and the measured value is created based on the acquisition result in the step a).

本願の第6発明は、第1発明から第5発明までのいずれか1発明の搬送処理方法であって、前記工程a)では、前記基材の周囲の温度または湿度を含む環境条件に係る情報をさらに取得し、前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記環境条件に係る情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する。 The sixth invention of the present application is the transport processing method of any one of the first to fifth inventions, and in the step a), information relating to environmental conditions including the temperature or humidity around the base material. In the step b), the simple simulation model showing the relationship between the control value, the information related to the environmental condition, and the measured value is created based on the acquisition result in the step a).

本願の第7発明は、第1発明から第6発明までのいずれか1発明の搬送処理方法であって、前記工程b)において、前記簡易シミュレーションモデルは、決定木を含み、前記決定木に含まれるパラメータが調整される。 The seventh invention of the present application is the transport processing method of any one invention from the first invention to the sixth invention, and in the step b), the simple simulation model includes a decision tree and is included in the decision tree. Parameters are adjusted.

本願の第8発明は、第1発明から第7発明までのいずれか1発明の搬送処理方法であって、前記工程c)において行われる前記強化学習は、PPOまたはDQNの技法によって実行される機械学習である。 The eighth invention of the present application is the transport processing method of any one invention from the first invention to the seventh invention, and the reinforcement learning performed in the step c) is a machine executed by the technique of PPO or DQN. Learning.

本願の第1発明〜第8発明によれば、予め実装置においてデータ取りをした結果を用いて、コンピュータ上で簡易シミュレーションモデルを作成し、当該簡易シミュレーションモデルを用いてコンピュータ上で強化学習を行う。そして、コンピュータ上で強化学習を行うことによって得られた学習中モデルを、再度、実装置に移して、引き続き強化学習を行う。これにより、実装置の動作に見合ったある程度進んだ状態から強化学習を開始することができる。また、コンピュータ上で相当量の強化学習を行うことができる。この結果、機械学習に要する時間を大幅に短縮できる。また、学習初期段階に、制御値が過大になった場合でも、実装置に損傷に及ぼすことを防止できる。さらに、最終的に再度実装置を用いて強化学習を行うことにより、より高精度な制御値を出力する学習済みモデルを作成することができる。 According to the first to eighth inventions of the present application, a simple simulation model is created on a computer using the result of collecting data in an actual device in advance, and reinforcement learning is performed on the computer using the simple simulation model. .. Then, the learning model obtained by performing reinforcement learning on the computer is transferred to the actual device again, and reinforcement learning is continuously performed. As a result, reinforcement learning can be started from a state advanced to some extent commensurate with the operation of the actual device. In addition, a considerable amount of reinforcement learning can be performed on a computer. As a result, the time required for machine learning can be significantly reduced. In addition, even if the control value becomes excessive in the initial stage of learning, it is possible to prevent damage to the actual device. Furthermore, by finally performing reinforcement learning using the actual device again, it is possible to create a trained model that outputs more accurate control values.

画像記録装置の構成を示した図である。It is a figure which showed the structure of the image recording apparatus. 画像記録部付近における画像記録装置の部分上面図である。It is a partial top view of the image recording apparatus in the vicinity of an image recording unit. エッジ位置検出部の構造を模式的に示した図である。It is a figure which showed typically the structure of the edge position detection part. 事前学習の流れを示すフローチャートである。It is a flowchart which shows the flow of the pre-learning. データ集合体の例を概念的に示した図である。It is a figure which showed the example of the data aggregate conceptually. 簡易シミュレーションモデルに含まれる決定木の例を概念的に示した図である。It is a figure which conceptually showed the example of the decision tree included in the simple simulation model. コンピュータ上で強化学習を行う様子を概念的に示したブロック図である。It is a block diagram conceptually showing the state of performing reinforcement learning on a computer. コンピュータ上での強化学習の詳細な流れを示すフローチャートである。It is a flowchart which shows the detailed flow of reinforcement learning on a computer. 実装置で強化学習を行う様子を概念的に示したブロック図である。It is a block diagram conceptually showing the state of performing reinforcement learning with an actual device. 実装置での強化学習の詳細な流れを示すフローチャートである。It is a flowchart which shows the detailed flow of reinforcement learning in an actual device. 第1エッジ信号の例および第2エッジ信号の例を示したグラフである。It is a graph which showed the example of the 1st edge signal and the example of the 2nd edge signal.

以下、本発明の実施形態について、図面を参照しつつ説明する。本発明の一実施形態では、搬送処理装置の例として、搬送される印刷用紙に画像を記録する画像記録装置を例に挙げて、説明する。そして、印刷用紙の搬送速度または張力の計測値を所定の範囲に維持するための方法について、説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In one embodiment of the present invention, as an example of the transfer processing device, an image recording device that records an image on the transferred printing paper will be described as an example. Then, a method for maintaining the measured value of the transport speed or tension of the printing paper within a predetermined range will be described.

<1.第1実施形態>
<1−1.画像記録装置の構成>
まず、本発明の搬送処理装置の一例となる画像記録装置1の全体構成について、図1を参照しつつ説明する。図1は、画像記録装置1の構成を示した図である。この画像記録装置1は、長尺帯状の基材である印刷用紙9を搬送しつつ、複数の記録ヘッド21〜24から印刷用紙9へ向けてインクを吐出することにより、印刷用紙9に画像を記録するインクジェット方式の印刷装置である。図1に示すように、画像記録装置1は、搬送機構10、画像記録部20、2つのエッジ位置検出部30、エンコーダ40、張力検出部50、情報取得部60、制御部80、およびシミュレーション用のコンピュータ90を備えている。
<1. First Embodiment>
<1-1. Image recording device configuration>
First, the overall configuration of the image recording apparatus 1 which is an example of the transport processing apparatus of the present invention will be described with reference to FIG. FIG. 1 is a diagram showing a configuration of an image recording device 1. The image recording device 1 transfers an image on the printing paper 9 by ejecting ink from a plurality of recording heads 21 to 24 toward the printing paper 9 while conveying the printing paper 9 which is a long strip-shaped base material. This is an inkjet printing device for recording. As shown in FIG. 1, the image recording device 1 includes a transport mechanism 10, an image recording unit 20, two edge position detection units 30, an encoder 40, a tension detection unit 50, an information acquisition unit 60, a control unit 80, and a simulation unit. It is equipped with a computer 90.

搬送機構10は、印刷用紙9をその長手方向に沿う搬送方向に搬送する機構である。本実施形態の搬送機構10は、巻き出しローラ11、複数の搬送ローラ12、および巻き取りローラ13を含む複数のローラと、1または複数(本実施形態では、3つ)のモータ14とを有する。印刷用紙9は、当該複数のローラに掛け渡される。また、本実施形態では、巻き出しローラ11、複数の搬送ローラ12のうちの1つ(図1における搬送ローラ121)、および巻き取りローラ13に、それぞれモータ14が接続される。モータ14は、印刷用紙9を搬送するための駆動源である。巻き出しローラ11、搬送ローラ121、および巻き取りローラ13は、モータ14により駆動され、それぞれ回転軸を中心として回転する。各搬送ローラ12は、回転軸を中心として回転することによって、印刷用紙9を搬送経路の下流側へ案内する。これにより、印刷用紙9は、巻き出しローラ11から繰り出され、複数の搬送ローラ12により構成される搬送経路に沿って搬送される。また、搬送後の印刷用紙9は、巻き取りローラ13へ回収される。 The transport mechanism 10 is a mechanism for transporting the printing paper 9 in the transport direction along the longitudinal direction thereof. The transport mechanism 10 of the present embodiment includes a plurality of rollers including a winding roller 11, a plurality of transport rollers 12, and a winding roller 13, and one or a plurality of (three in this embodiment) motors 14. .. The printing paper 9 is hung on the plurality of rollers. Further, in the present embodiment, the motor 14 is connected to the unwinding roller 11, one of the plurality of conveying rollers 12 (the conveying roller 121 in FIG. 1), and the take-up roller 13, respectively. The motor 14 is a drive source for conveying the printing paper 9. The unwinding roller 11, the transport roller 121, and the take-up roller 13 are driven by a motor 14 and rotate about a rotation axis, respectively. Each transfer roller 12 guides the printing paper 9 to the downstream side of the transfer path by rotating around the rotation axis. As a result, the printing paper 9 is unwound from the unwinding roller 11 and is conveyed along the conveying path composed of the plurality of conveying rollers 12. Further, the printed paper 9 after being conveyed is collected by the take-up roller 13.

すなわち、本実施形態では、複数のローラのうちの巻き出しローラ11、搬送ローラ121、および巻き取りローラ13が、モータ14に接続される駆動ローラとなっている。ただし、モータ14が接続されるローラは、これに限定されない。印刷用紙9は、複数のローラの少なくとも1つである駆動ローラが、モータ14に駆動されて回転することによって、搬送されればよい。 That is, in the present embodiment, the unwinding roller 11, the transport roller 121, and the take-up roller 13 of the plurality of rollers are drive rollers connected to the motor 14. However, the roller to which the motor 14 is connected is not limited to this. The printing paper 9 may be conveyed by a drive roller, which is at least one of a plurality of rollers, driven by a motor 14 to rotate.

図1に示すように、印刷用紙9は、後述する複数の記録ヘッド21〜24の下方において、複数の記録ヘッド21〜24の配列方向と略平行に移動する。このとき、印刷用紙9の表面(記録面)は、上方(記録ヘッド21〜24側)に向けられている。また、印刷用紙9は、張力が掛かった状態で、複数の搬送ローラ12に掛け渡される。これにより、搬送中における印刷用紙9の弛みや皺が抑制される。 As shown in FIG. 1, the printing paper 9 moves below the plurality of recording heads 21 to 24, which will be described later, substantially parallel to the arrangement direction of the plurality of recording heads 21 to 24. At this time, the surface (recording surface) of the printing paper 9 is directed upward (recording heads 21 to 24 side). Further, the printing paper 9 is hung on a plurality of transport rollers 12 in a state where tension is applied. As a result, slack and wrinkles of the printing paper 9 during transportation are suppressed.

画像記録部20は、搬送機構10により搬送される印刷用紙9に対して、インクの液滴(以下「インク滴」と称する)を吐出する処理部である。本実施形態の画像記録部20は、第1記録ヘッド21、第2記録ヘッド22、第3記録ヘッド23、および第4記録ヘッド24を有する。第1記録ヘッド21、第2記録ヘッド22、第3記録ヘッド23、および第4記録ヘッド24は、印刷用紙9の搬送経路に沿って配置されている。 The image recording unit 20 is a processing unit that ejects ink droplets (hereinafter referred to as “ink droplets”) onto the printing paper 9 conveyed by the conveying mechanism 10. The image recording unit 20 of the present embodiment includes a first recording head 21, a second recording head 22, a third recording head 23, and a fourth recording head 24. The first recording head 21, the second recording head 22, the third recording head 23, and the fourth recording head 24 are arranged along the transport path of the printing paper 9.

図2は、画像記録部20付近における画像記録装置1の部分上面図である。4つの記録ヘッド21〜24は、それぞれ、印刷用紙9の幅方向の全体を覆っている。また、図2中に破線で示したように、各記録ヘッド21〜24の下面には、印刷用紙9の幅方向と平行に配列された複数のノズル250が設けられている。各記録ヘッド21〜24は、複数のノズル250から印刷用紙9の上面へ向けて、多色画像の色成分となるK(ブラック)、C(シアン)、M(マゼンタ)、Y(イエロー)の各色のインク滴を、それぞれ吐出する。 FIG. 2 is a partial top view of the image recording device 1 in the vicinity of the image recording unit 20. Each of the four recording heads 21 to 24 covers the entire width direction of the printing paper 9. Further, as shown by a broken line in FIG. 2, a plurality of nozzles 250 arranged in parallel with the width direction of the printing paper 9 are provided on the lower surface of each of the recording heads 21 to 24. Each of the recording heads 21 to 24 is directed from the plurality of nozzles 250 toward the upper surface of the printing paper 9, and is composed of K (black), C (cyan), M (magenta), and Y (yellow), which are color components of the multicolor image. Ink droplets of each color are ejected.

すなわち、第1記録ヘッド21は、搬送経路上の第1処理位置P1において、印刷用紙9の上面に、K色のインク滴を吐出する。第2記録ヘッド22は、第1処理位置P1よりも下流側の第2処理位置P2において、印刷用紙9の上面に、C色のインク滴を吐出する。第3記録ヘッド23は、第2処理位置P2よりも下流側の第3処理位置P3において、印刷用紙9の上面に、M色のインク滴を吐出する。第4記録ヘッド24は、第3処理位置P3よりも下流側の第4処理位置P4において、印刷用紙9の上面に、Y色のインク滴を吐出する。本実施形態では、第1処理位置P1、第2処理位置P2、第3処理位置P3、および第4処理位置P4は、印刷用紙9の搬送方向に沿って、等間隔に配列されている。 That is, the first recording head 21 ejects K-color ink droplets onto the upper surface of the printing paper 9 at the first processing position P1 on the transport path. The second recording head 22 ejects C-color ink droplets onto the upper surface of the printing paper 9 at the second processing position P2 on the downstream side of the first processing position P1. The third recording head 23 ejects M-color ink droplets onto the upper surface of the printing paper 9 at the third processing position P3 on the downstream side of the second processing position P2. The fourth recording head 24 ejects Y-color ink droplets onto the upper surface of the printing paper 9 at the fourth processing position P4 on the downstream side of the third processing position P3. In the present embodiment, the first processing position P1, the second processing position P2, the third processing position P3, and the fourth processing position P4 are arranged at equal intervals along the transport direction of the printing paper 9.

4つの記録ヘッド21〜24は、インク滴を吐出することによって、印刷用紙9の上面に、それぞれ単色画像を記録する。そして、4つの単色画像の重ね合わせにより、印刷用紙9の上面に、多色画像が形成される。したがって、仮に、4つの記録ヘッド21〜24から吐出されるインク滴の印刷用紙9上における搬送方向の位置が相互にずれていると、印刷物の画像品質が低下する。このような、印刷用紙9上における単色画像の位置の誤差を許容範囲内に抑えることが、画像記録装置1の印刷品質を向上させるための重要な要素となる。 The four recording heads 21 to 24 record a single color image on the upper surface of the printing paper 9 by ejecting ink droplets. Then, a multicolor image is formed on the upper surface of the printing paper 9 by superimposing the four monochromatic images. Therefore, if the positions of the ink droplets ejected from the four recording heads 21 to 24 on the printing paper 9 in the transport direction are deviated from each other, the image quality of the printed matter deteriorates. Suppressing such an error in the position of a single-color image on the printing paper 9 within an allowable range is an important factor for improving the print quality of the image recording apparatus 1.

なお、記録ヘッド21〜24の搬送方向下流側に、印刷用紙9の記録面に吐出されたインクを乾燥させる乾燥処理部が、さらに設けられていてもよい。乾燥処理部は、例えば、印刷用紙9へ向けて加熱された気体を吹き付けて、印刷用紙9に付着したインク中の溶媒を気化させることにより、インクを乾燥させる。ただし、乾燥処理部は、ヒートローラによる加熱や、光照射等の他の方法で、インクを乾燥させるものであってもよい。 A drying processing unit for drying the ink discharged on the recording surface of the printing paper 9 may be further provided on the downstream side of the recording heads 21 to 24 in the transport direction. The drying processing unit dries the ink by, for example, blowing a heated gas toward the printing paper 9 to vaporize the solvent in the ink adhering to the printing paper 9. However, the drying processing unit may be one that dries the ink by another method such as heating with a heat roller or light irradiation.

2つのエッジ位置検出部30はそれぞれ、印刷用紙9のエッジ(幅方向の端部)91の幅方向の位置を検出する検出部である。本実施形態では、搬送経路上の第1処理位置P1よりも上流側の第1検出位置Paと、搬送経路上において第1検出位置Paから下流側へ離間した第4処理位置P4よりもさらに下流側の第2検出位置Pbとに、エッジ位置検出部30が配置されている。ただし、エッジ位置検出部30は、必ずしも設けられなくてもよい。 Each of the two edge position detection units 30 is a detection unit that detects the position of the edge (edge in the width direction) 91 of the printing paper 9 in the width direction. In the present embodiment, the first detection position Pa on the upstream side of the first processing position P1 on the transfer path and the fourth processing position P4 further downstream from the first detection position Pa on the transfer path are further downstream. The edge position detection unit 30 is arranged at the second detection position Pb on the side. However, the edge position detection unit 30 does not necessarily have to be provided.

図3は、エッジ位置検出部30の構造を模式的に示した図である。図3に示すように、エッジ位置検出部30は、印刷用紙9のエッジ91の上方に位置する投光器301と、エッジ91の下方に位置するラインセンサ302とを有する。投光器301は、下方へ向けて平行光を照射する。ラインセンサ302は、幅方向に配列された複数の受光素子321を有する。図3のように、印刷用紙9のエッジ91よりも外側においては、投光器301から照射された光が受光素子321に入射し、受光素子321が光を検出する。一方、印刷用紙9のエッジ91よりも内側においては、投光器301から照射された光が印刷用紙9に遮られるため、受光素子321は光を検出しない。エッジ位置検出部30は、このような複数の受光素子321における光検出の有無に基づいて、印刷用紙9のエッジ91の幅方向の位置を検出する。 FIG. 3 is a diagram schematically showing the structure of the edge position detection unit 30. As shown in FIG. 3, the edge position detecting unit 30 has a floodlight 301 located above the edge 91 of the printing paper 9 and a line sensor 302 located below the edge 91. The floodlight 301 irradiates parallel light downward. The line sensor 302 has a plurality of light receiving elements 321 arranged in the width direction. As shown in FIG. 3, outside the edge 91 of the printing paper 9, the light emitted from the floodlight 301 is incident on the light receiving element 321 and the light receiving element 321 detects the light. On the other hand, inside the edge 91 of the printing paper 9, the light emitted from the floodlight 301 is blocked by the printing paper 9, so that the light receiving element 321 does not detect the light. The edge position detection unit 30 detects the position of the edge 91 of the printing paper 9 in the width direction based on the presence or absence of light detection in the plurality of light receiving elements 321.

図1および図2に示すように、以下では、第1検出位置Paに配置されたエッジ位置検出部30を、第1エッジ位置検出部31と称する。また、第2検出位置Pbに配置されたエッジ位置検出部30を、第2エッジ位置検出部32と称する。第1エッジ位置検出部31は、第1検出位置Paにおいて、印刷用紙9のエッジ91の幅方向の位置を、断続的に検出する。これにより、第1検出位置Paにおけるエッジ91の幅方向の位置の経時変化を示す検出結果を取得する。そして、得られた検出結果を示す検出信号(以下、「第1エッジ信号Ed1」と称する)を、制御部80へ出力する。第2エッジ位置検出部32は、第2検出位置Pbにおいて、印刷用紙9のエッジ91の幅方向の位置を、断続的に検出する。これにより、第2検出位置Pbにおけるエッジ91の幅方向の位置の経時変化を示す検出結果を取得する。そして、得られた検出結果を示す検出信号(以下、「第2エッジ信号Ed2」と称する)を、制御部80へ出力する。ただし、第1エッジ位置検出部31および第2エッジ位置検出部32はそれぞれ、印刷用紙9のエッジ91の幅方向の位置を連続的に検出してもよい。 As shown in FIGS. 1 and 2, in the following, the edge position detection unit 30 arranged at the first detection position Pa will be referred to as a first edge position detection unit 31. Further, the edge position detection unit 30 arranged at the second detection position Pb is referred to as a second edge position detection unit 32. The first edge position detection unit 31 intermittently detects the position of the edge 91 of the printing paper 9 in the width direction at the first detection position Pa. As a result, the detection result indicating the time-dependent change of the position of the edge 91 in the width direction at the first detection position Pa is acquired. Then, a detection signal (hereinafter, referred to as “first edge signal Ed1”) indicating the obtained detection result is output to the control unit 80. The second edge position detection unit 32 intermittently detects the position of the edge 91 of the printing paper 9 in the width direction at the second detection position Pb. As a result, the detection result indicating the time-dependent change of the position of the edge 91 in the width direction at the second detection position Pb is acquired. Then, a detection signal (hereinafter, referred to as “second edge signal Ed2”) indicating the obtained detection result is output to the control unit 80. However, the first edge position detection unit 31 and the second edge position detection unit 32 may continuously detect the position of the edge 91 of the printing paper 9 in the width direction, respectively.

エンコーダ40は、複数の搬送ローラ12のうちの1つ(図1における搬送ローラ122)の軸芯に取り付けられる。ただし、エンコーダ40が取り付けられるローラは、搬送ローラ122には限定されない。エンコーダ40は、搬送機構10に含まれる複数のローラの少なくとも1つに取り付けられればよい。本実施形態では、エンコーダ40は、搬送ローラ122の回転駆動量を検出し、搬送ローラ122の回転に同期した連続パルス信号Enを、制御部80へ出力する。連続パルス信号Enは、搬送ローラ122を含む複数の搬送ローラ12によって搬送される印刷用紙9の搬送速度の経時変化を反映したデータとなる。制御部80は、入力された連続パルス信号Enに基づいて、後述する速度算出部81において、搬送ローラ122を含む複数の搬送ローラ12によって搬送される印刷用紙9の搬送速度の計測値Msを算出する。 The encoder 40 is attached to the shaft core of one of the plurality of transfer rollers 12 (transfer roller 122 in FIG. 1). However, the roller to which the encoder 40 is attached is not limited to the transport roller 122. The encoder 40 may be attached to at least one of a plurality of rollers included in the transport mechanism 10. In the present embodiment, the encoder 40 detects the rotation drive amount of the transfer roller 122 and outputs a continuous pulse signal En synchronized with the rotation of the transfer roller 122 to the control unit 80. The continuous pulse signal En is data that reflects a change over time in the transfer speed of the printing paper 9 conveyed by the plurality of transfer rollers 12 including the transfer roller 122. Based on the input continuous pulse signal En, the control unit 80 calculates the measured value Ms of the transfer speed of the printing paper 9 conveyed by the plurality of transfer rollers 12 including the transfer roller 122 in the speed calculation unit 81 described later. do.

張力検出部50は、複数の搬送ローラ12のうちの1つ(図1における搬送ローラ123)に取り付けられる。ただし、張力検出部50が取り付けられるローラは、搬送ローラ123には限定されない。張力検出部50は、搬送機構10に含まれる複数のローラの少なくとも1つに取り付けられればよい。本実施形態では、張力検出部50は、搬送ローラ123において印刷用紙9から受ける力を連続的または断続的に計測する。これにより、張力検出部50は、印刷用紙9に加わる張力を検出し、検出結果に係る張力信号Teを、制御部80へ出力する。張力信号Teは、搬送ローラ123に接触しつつ搬送ローラ123を含む複数の搬送ローラ12によって搬送される印刷用紙9に加わる張力の経時変化を反映したデータとなる。ただし、張力検出部50は、必ずしも設けられなくてもよい。 The tension detection unit 50 is attached to one of the plurality of transfer rollers 12 (convey roller 123 in FIG. 1). However, the roller to which the tension detection unit 50 is attached is not limited to the transport roller 123. The tension detection unit 50 may be attached to at least one of a plurality of rollers included in the transport mechanism 10. In the present embodiment, the tension detection unit 50 continuously or intermittently measures the force received from the printing paper 9 by the transport roller 123. As a result, the tension detection unit 50 detects the tension applied to the printing paper 9, and outputs the tension signal Te related to the detection result to the control unit 80. The tension signal Te is data that reflects the change over time in the tension applied to the printing paper 9 conveyed by the plurality of transfer rollers 12 including the transfer roller 123 while being in contact with the transfer roller 123. However, the tension detection unit 50 does not necessarily have to be provided.

情報取得部60は、画像記録装置1における様々な設定値および条件に係る情報を取得する装置である。情報取得部60は、例えば、タッチパネル等の入力インターフェースを含む。作業員は、当該入力インターフェースを介して、例えば、画像記録部20の複数の記録ヘッド21〜24から吐出されるインクの種類または特性、印刷用紙9の周囲の温度または湿度を含む環境条件、および印刷用紙9の種類、形状、または厚み等に係る情報(以下、「情報Sc」と称する)を入力する。これにより、情報取得部60は、これらの情報Scを取得する。ただし、情報取得部60は、温度計や湿度計等のセンサを独自に有していてもよい。また、情報取得部60は、当該センサを介して情報Scを直接的に取得してもよい。また、情報取得部60は、上述した様々な設定値および条件に係る情報の少なくとも一つを取得するものであればよい。さらに、情報取得部60は、上述した様々な設定値および条件に係る情報以外の情報を取得するものであってもよい。情報取得部60によって取得された情報Scに係る信号は、制御部80へ送信される。 The information acquisition unit 60 is a device that acquires information related to various set values and conditions in the image recording device 1. The information acquisition unit 60 includes an input interface such as a touch panel, for example. The worker can use the input interface to perform, for example, the type or characteristics of ink ejected from the plurality of recording heads 21 to 24 of the image recording unit 20, environmental conditions including the ambient temperature or humidity of the printing paper 9, and environmental conditions including the ambient temperature or humidity of the printing paper 9. Information related to the type, shape, thickness, etc. of the printing paper 9 (hereinafter referred to as "information Sc") is input. As a result, the information acquisition unit 60 acquires these information Scs. However, the information acquisition unit 60 may have its own sensor such as a thermometer or a hygrometer. Further, the information acquisition unit 60 may directly acquire the information Sc via the sensor. Further, the information acquisition unit 60 may acquire at least one of the information related to the various set values and conditions described above. Further, the information acquisition unit 60 may acquire information other than the information related to the various set values and conditions described above. The signal related to the information Sc acquired by the information acquisition unit 60 is transmitted to the control unit 80.

制御部80は、画像記録装置1内の各部を動作制御するための手段である。図1中に概念的に示したように、制御部80は、CPU等のプロセッサ801、RAM等のメモリ802、およびハードディスクドライブ等の記憶部803を有する。また、記憶部803内には、画像記録装置1を動作制御するためのプログラム80Pおよびデータ80Dが、記憶されている。また、図1中に破線で示したように、制御部80は、搬送機構10、4つの記録ヘッド21〜24、2つのエッジ位置検出部30、エンコーダ40、張力検出部50、および情報取得部60と、それぞれ電気的に接続されている。また、制御部80は、さらにコンピュータ90と電気的に接続されてもよい。 The control unit 80 is a means for controlling the operation of each unit in the image recording device 1. As conceptually shown in FIG. 1, the control unit 80 includes a processor 801 such as a CPU, a memory 802 such as a RAM, and a storage unit 803 such as a hard disk drive. Further, the program 80P and the data 80D for controlling the operation of the image recording device 1 are stored in the storage unit 803. Further, as shown by a broken line in FIG. 1, the control unit 80 includes a transport mechanism 10, four recording heads 21 to 24, two edge position detection units 30, an encoder 40, a tension detection unit 50, and an information acquisition unit. It is electrically connected to each of the 60s. Further, the control unit 80 may be further electrically connected to the computer 90.

制御部80は、記憶部803に記憶されたプログラム80Pやデータ80Dをメモリ802に読み出し、プログラム80Pおよびデータ80Dに基づいて、プロセッサ801が演算処理を行うことにより、画像記録装置1内の上記各部を動作制御する。これにより、画像記録装置1における印刷処理が進行する。 The control unit 80 reads the program 80P and the data 80D stored in the storage unit 803 into the memory 802, and the processor 801 performs arithmetic processing based on the program 80P and the data 80D to perform arithmetic processing on each of the above units in the image recording device 1. To control the operation. As a result, the printing process in the image recording device 1 proceeds.

また、記憶部803には、後述する事前学習により取得された学習済みモデルM3が、記憶されている。制御部80は、学習済みモデルM3から出力される制御値に基づき、3つのモータ14をそれぞれ回転させて印刷用紙9を搬送し、かつ、記録ヘッド21〜24からインクを吐出して印刷を行う。これにより、画像記録装置1において印刷処理を行う際に、印刷用紙9の搬送速度が所定の範囲に維持される。 Further, the storage unit 803 stores the learned model M3 acquired by the pre-learning described later. Based on the control values output from the learned model M3, the control unit 80 rotates each of the three motors 14 to convey the printing paper 9, and ejects ink from the recording heads 21 to 24 to perform printing. .. As a result, when the image recording apparatus 1 performs the printing process, the transport speed of the printing paper 9 is maintained within a predetermined range.

コンピュータ90は、上記の印刷用紙9の搬送経路とは別に設けられる。コンピュータ90は、市販のパーソナルコンピュータ(パソコン)の形態を有している。また、コンピュータ90は、図示を省略したモニタ、キーボード、ポインティングデバイス、またはタッチパネル等を有していてもよい。コンピュータ90は、CPU等のプロセッサ901、RAM等のメモリ902、およびハードディスクドライブ等の記憶部903を有する。記憶部903内には、コンピュータ90に所定の処理を実行させるためのプログラム90Pおよびデータ90Dが、記憶されている。ただし、コンピュータ90は、上記の制御部80に組み込まれていてもよい。 The computer 90 is provided separately from the transfer path of the printing paper 9. The computer 90 has the form of a commercially available personal computer (personal computer). Further, the computer 90 may have a monitor, a keyboard, a pointing device, a touch panel, or the like (not shown). The computer 90 has a processor 901 such as a CPU, a memory 902 such as a RAM, and a storage unit 903 such as a hard disk drive. The program 90P and the data 90D for causing the computer 90 to execute a predetermined process are stored in the storage unit 903. However, the computer 90 may be incorporated in the control unit 80 described above.

<1−2.事前学習について>
続いて、画像記録装置1において印刷処理を行う前に予め実行される事前学習について、説明する。なお、事前学習のうち、後述するステップS1およびステップS4は、実際に画像記録装置1を駆動しつつ行う。ステップS1またはステップS4を行う際に用いられる、後述する速度算出部81および判定部800の機能は、記憶部803に記憶されたプログラム80Pおよびデータ80Dをメモリ802に一時的に読み出し、当該プログラム80Pおよびデータ80Dに基づいて、プロセッサ801が演算処理を行うことによって、実現される。また、後述するステップS2およびステップS3は、コンピュータ90上で行う。ステップS2およびステップS3を行う際に用いられる、後述する判定部900の機能は、記憶部903に記憶されたプログラム90Pおよびデータ90Dをメモリ902に一時的に読み出し、当該プログラム90Pおよびデータ90Dに基づいて、プロセッサ901が演算処理を行うことによって、実現される。
<1-2. About pre-learning >
Subsequently, the pre-learning that is executed in advance before the printing process is performed in the image recording apparatus 1 will be described. Of the pre-learning, steps S1 and S4, which will be described later, are performed while actually driving the image recording device 1. The functions of the speed calculation unit 81 and the determination unit 800, which will be described later, used when performing step S1 or step S4, temporarily read the program 80P and the data 80D stored in the storage unit 803 into the memory 802, and the program 80P. And, based on the data 80D, it is realized by the processor 801 performing arithmetic processing. Further, steps S2 and S3, which will be described later, are performed on the computer 90. The function of the determination unit 900, which will be described later, used when performing step S2 and step S3 is to temporarily read the program 90P and data 90D stored in the storage unit 903 into the memory 902, and based on the program 90P and data 90D. Therefore, it is realized by the processor 901 performing arithmetic processing.

図4は、事前学習の流れを示すフローチャートである。図4に示すように、事前学習を行う際には、まず、画像記録装置1において実際に印刷用紙9を搬送しながら、印刷用紙9の表面にインクを吐出しつつ、画像記録装置1の各部における様々な計測値を複数取得する(ステップS1)。具体的には、搬送に係る制御値CVdを複数パターン変えながら、実際に印刷用紙9を搬送する。搬送に係る制御値CVdは、例えば、巻き出しローラ11、搬送ローラ121、および巻き取りローラ13にそれぞれ接続されるモータ14の回転数(駆動ローラの回転速度)である。同時に、インクの吐出に係る制御値CVeを複数パターン変えながら、実際に印刷用紙9の表面にインクを吐出する。インクの吐出に係る制御値CVeは、例えば、記録ヘッド21〜24からのインクの吐出タイミング(各ノズル250からのインク滴の吐出タイミング)である。なお、搬送に係る制御値CVdは、制御部80から各モータ14に入力される。インクの吐出に係る制御値CVeは、制御部80から記録ヘッド21〜24に入力される。 FIG. 4 is a flowchart showing the flow of pre-learning. As shown in FIG. 4, when performing pre-learning, first, while actually transporting the printing paper 9 in the image recording device 1, ink is ejected to the surface of the printing paper 9, and each part of the image recording device 1 is performed. Acquire a plurality of various measured values in (step S1). Specifically, the printing paper 9 is actually conveyed while changing a plurality of patterns of control values CVd related to the transfer. The control value CVd related to the transfer is, for example, the rotation speed (rotational speed of the drive roller) of the motor 14 connected to the unwind roller 11, the transfer roller 121, and the take-up roller 13, respectively. At the same time, the ink is actually ejected to the surface of the printing paper 9 while changing a plurality of patterns of the control value CVe related to the ejection of the ink. The control value CVe related to ink ejection is, for example, the ink ejection timing from the recording heads 21 to 24 (ink ejection timing from each nozzle 250). The control value CVd related to the transfer is input from the control unit 80 to each motor 14. The control value CVe related to ink ejection is input from the control unit 80 to the recording heads 21 to 24.

なお、ステップS1において、モータ14の回転数は、時間に依らず一定であってもよいし、時間の経過とともに変化してもよい。また、インクの吐出タイミングは、規則的であってもよいし、不規則であってもよい。また、吐出に係る制御値CVeとして、インクの吐出タイミングの代わりに、またはインクの吐出タイミングに加えて、記録ヘッド21〜24からのインクの吐出量(各ノズル250からのインク滴の吐出量)を複数パターン変えながら、実際に印刷用紙9の表面にインクを吐出してもよい。また、モータ14の回転数を過大にして複数のローラの表面と印刷用紙9との間のスリップを生じさせたり、インクの吐出量を過大にして印刷用紙9を大きく膨張させたりしてもよい。さらに、画像記録装置1の電源をオフにして、モータ14を駆動させない場合や、インクを吐出しない場合を含めた、多岐に亘るパターンを実施してもよい。すなわち、搬送に係る制御値CVdは、少なくともモータ14の回転数に係る情報を含んでいれば、自由に設定できる。また、インクの吐出に係る制御値CVeは、少なくとも記録ヘッド21〜24からのインクの吐出タイミングに係る情報を含んでいれば、自由に設定できる。さらに、搬送に係る制御値CVdおよび吐出に係る制御値CVeの一方は、制御値として扱わず、予め定めた所定の値としてもよい。 In step S1, the rotation speed of the motor 14 may be constant regardless of time, or may change with the passage of time. Further, the ink ejection timing may be regular or irregular. Further, as the control value CVe related to ejection, the amount of ink ejected from the recording heads 21 to 24 (the amount of ink droplets ejected from each nozzle 250) instead of the ink ejection timing or in addition to the ink ejection timing. Ink may be actually ejected onto the surface of the printing paper 9 while changing a plurality of patterns. Further, the rotation speed of the motor 14 may be excessive to cause slip between the surfaces of the plurality of rollers and the printing paper 9, or the ink ejection amount may be excessive to cause the printing paper 9 to be greatly expanded. .. Further, a wide variety of patterns may be performed, including a case where the power of the image recording device 1 is turned off and the motor 14 is not driven, and a case where ink is not ejected. That is, the control value CVd related to transportation can be freely set as long as it includes at least information related to the rotation speed of the motor 14. Further, the control value CVe related to ink ejection can be freely set as long as it includes at least information related to ink ejection timing from the recording heads 21 to 24. Further, one of the control value CVd related to transport and the control value CVe related to discharge may not be treated as a control value, but may be a predetermined value set in advance.

ステップS1では、実際に印刷用紙9を搬送しながら、印刷用紙9の表面にインクを吐出しつつ、エンコーダ40から制御部80へ連続パルス信号Enを入力する。制御部80は、速度算出部81(後述する図9参照)を有する。制御部80は、入力された連続パルス信号Enに基づいて、速度算出部81において、印刷用紙9の搬送速度の計測値Msを算出する。 In step S1, a continuous pulse signal En is input from the encoder 40 to the control unit 80 while actually conveying the printing paper 9 and ejecting ink to the surface of the printing paper 9. The control unit 80 has a speed calculation unit 81 (see FIG. 9 described later). The control unit 80 calculates the measured value Ms of the transport speed of the printing paper 9 in the speed calculation unit 81 based on the input continuous pulse signal En.

ただし、ステップS1では、印刷用紙9の搬送速度の計測値Ms以外の計測値をさらに複数取得してもよい。例えば、搬送される印刷用紙9の加速度や振動数の計測値を取得してもよい。 However, in step S1, a plurality of measured values other than the measured value Ms of the transport speed of the printing paper 9 may be acquired. For example, the measured values of the acceleration and the frequency of the printed paper 9 to be conveyed may be acquired.

また、ステップS1では、第1エッジ位置検出部31が、第1検出位置Paにおけるエッジ91の幅方向の位置の経時変化を検出し、その検出結果を示す第1エッジ信号Ed1を、制御部80へ出力する。本実施形態では、制御部80は、第1エッジ信号Ed1を第1参照値CF1として取得する。また、第2エッジ位置検出部32が、第2検出位置Pbにおけるエッジ91の幅方向の位置の経時変化を検出し、その検出結果を示す第2エッジ信号Ed2を、制御部80へ出力する。本実施形態では、制御部80は、第2エッジ信号Ed2を第2参照値CF2として取得する。また、ステップS1では、張力検出部50が、印刷用紙9に加わる張力の経時変化を検出し、その検出結果を示す張力信号Teを、制御部80へ出力する。本実施形態では、制御部80は、張力信号Teを第3参照値CF3として取得する。ただし、制御部80は、第1参照値CF1、第2参照値CF2、または第3参照値CF3を取得しなくてもよい。 Further, in step S1, the first edge position detection unit 31 detects a change with time in the position of the edge 91 in the width direction at the first detection position Pa, and outputs the first edge signal Ed1 indicating the detection result to the control unit 80. Output to. In the present embodiment, the control unit 80 acquires the first edge signal Ed1 as the first reference value CF1. Further, the second edge position detection unit 32 detects a change with time in the position of the edge 91 in the width direction at the second detection position Pb, and outputs a second edge signal Ed2 indicating the detection result to the control unit 80. In the present embodiment, the control unit 80 acquires the second edge signal Ed2 as the second reference value CF2. Further, in step S1, the tension detection unit 50 detects a change in tension applied to the printing paper 9 with time, and outputs a tension signal Te indicating the detection result to the control unit 80. In the present embodiment, the control unit 80 acquires the tension signal Te as the third reference value CF3. However, the control unit 80 does not have to acquire the first reference value CF1, the second reference value CF2, or the third reference value CF3.

さらに、ステップS1では、情報取得部60によって、インクの種類または特性(インクの情報)、印刷用紙9の周囲の温度または湿度を含む環境条件、および印刷用紙9の種類、形状、または厚み(印刷用紙9の情報)に係る情報Scが取得される。情報取得部60によって取得された情報Scに係る信号は、制御部80へ送信される。 Further, in step S1, the information acquisition unit 60 determines the type or characteristic of the ink (ink information), the environmental conditions including the ambient temperature or humidity of the printing paper 9, and the type, shape, or thickness of the printing paper 9 (printing). Information Sc related to (information on Form 9) is acquired. The signal related to the information Sc acquired by the information acquisition unit 60 is transmitted to the control unit 80.

取得された印刷用紙9の搬送速度の計測値Msは、制御部80の記憶部803において、搬送に係る制御値CVdおよび吐出に係る制御値CVeと、上記の第1参照値CF1、第2参照値CF2、または第3参照値CF3と、情報Scとに関連付けられ、データ集合体DAとして蓄積される。図5は、データ集合体DAの例を概念的に示した図である。ただし、データ集合体DAは、作業員によってコンピュータ90等において手動で記録されてもよい。 The acquired measured values Ms of the transport speed of the printing paper 9 are the control value CVd related to transport and the control value CVe related to ejection in the storage unit 803 of the control unit 80, and the above-mentioned first reference values CF1 and second reference. It is associated with the value CF2 or the third reference value CF3 and the information Sc, and is accumulated as a data aggregate DA. FIG. 5 is a diagram conceptually showing an example of a data aggregate DA. However, the data aggregate DA may be manually recorded by a worker on a computer 90 or the like.

データ集合体DAとして十分な数のデータが蓄積されると、作業員はコンピュータ90上で、蓄積された制御値CVd,CVe、計測値Ms、参照値CF1,CF2,CF3、および情報Scに基づいて、制御値CVd,CVe、参照値CF1,CF2,CF3、および情報Scと、計測値Msとの関係を示す簡易シミュレーションモデルSiMoを作成する(ステップS2)。具体的には、印刷用紙9の搬送速度の計測値Msを教師データ(正解のデータ)としつつ、制御値CVd,CVe、参照値CF1,CF2,CF3、および情報Scから、印刷用紙9の搬送速度を高精度に算出するための簡易シミュレーションモデルSiMoを機械学習する。 When a sufficient number of data is accumulated as the data aggregate DA, the worker is based on the accumulated control values CVd, CVe, measured value Ms, reference values CF1, CF2, CF3, and information Sc on the computer 90. Then, a simple simulation model SiMo showing the relationship between the control values CVd, CVe, the reference values CF1, CF2, CF3, and the information Sc and the measured value Ms is created (step S2). Specifically, while using the measured value Ms of the transfer speed of the printing paper 9 as the teacher data (correct answer data), the transfer of the printing paper 9 is performed from the control values CVd, CVe, the reference values CF1, CF2, CF3, and the information Sc. Machine learning is performed on the simple simulation model SiMo for calculating the speed with high accuracy.

簡易シミュレーションモデルSiMoは、決定木X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)を含む。図6は、本実施形態の決定木X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)の例を概念的に示した図である。ステップS2では、機械学習において、入力された制御値CVd,CVe、計測値Ms、参照値CF1,CF2,CF3、および情報Scに基づいて算出した印刷用紙9の搬送速度の算出値CAsと、データ集合体DAに蓄積された対応する計測値Msとの差異を最小化するように、決定木X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)に含まれる複数のパラメータ(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)を調整しつつ更新保存していく。 The simple simulation model SiMo includes decision trees X (a, b, c, f (CVd, CVe, CF1, CF2, CF3, Sc) ...). FIG. 6 is a diagram conceptually showing an example of the decision tree X (a, b, c, f (CVd, CVe, CF1, CF2, CF3, Sc) ...) Of the present embodiment. In step S2, in machine learning, the calculated value CAs of the transfer speed of the printing paper 9 calculated based on the input control values CVd, CVe, measured value Ms, reference values CF1, CF2, CF3, and information Sc, and data. Included in the decision tree X (a, b, c, f (CVd, CVe, CF1, CF2, CF3, Sc) ...) so as to minimize the difference from the corresponding measured value Ms accumulated in the aggregate DA. The plurality of parameters (a, b, c, f (CVd, CVe, CF1, CF2, CF3, Sc) ...) Are adjusted and updated and saved.

簡易シミュレーションモデルSiMoから出力される算出値CAsとデータ集合体DAに蓄積された対応する計測値Msとの差異が、所定値以下になると、機械学習が完了する。これにより、簡易シミュレーションモデルSiMoを用いて、入力された制御値CVd,CVe、計測値Ms、参照値CF1,CF2,CF3、および情報Scに基づいて、印刷用紙9の搬送速度を高精度に算出することが可能となる。ただし、簡易シミュレーションモデルSiMoに入力される値として、制御値CVd,CVe、計測値Ms、参照値CF1,CF2,CF3、および情報Scの一部が省略されてもよい。 Machine learning is completed when the difference between the calculated value CAs output from the simple simulation model SiMo and the corresponding measured value Ms stored in the data aggregate DA is equal to or less than a predetermined value. As a result, the transfer speed of the printing paper 9 is calculated with high accuracy based on the input control values CVd, CVe, measured values Ms, reference values CF1, CF2, CF3, and information Sc using the simple simulation model SiMo. It becomes possible to do. However, as the values input to the simple simulation model SiMo, the control values CVd, CVe, the measured values Ms, the reference values CF1, CF2, CF3, and a part of the information Sc may be omitted.

ただし、簡易シミュレーションモデルSiMoは、決定木以外の機械学習(例えば、GBM(Gradient Boosting Machine))によって作成されたモデルを含むものであってもよい。また、簡易シミュレーションモデルSiMoは、機械学習によって作成されたモデルの代わりに、制御値CVd,CVe、参照値CF1,CF2,CF3、または情報Scと、印刷用紙9の搬送速度の算出値CAsとの関係を示す計算式(関数)を含むものであってもよい。また、簡易シミュレーションモデルSiMoは、例えば「画像記録装置1の電源がオンかオフか」等の条件式(例えば、電源がオフのときは0(ゼロ)を出力する式等)を含むものであってもよい。 However, the simple simulation model SiMo may include a model created by machine learning (for example, GBM (Gradient Boosting Machine)) other than the decision tree. Further, in the simple simulation model SiMo, instead of the model created by machine learning, the control values CVd, CVe, the reference values CF1, CF2, CF3, or the information Sc, and the calculated value CAs of the transfer speed of the printing paper 9 are used. It may include a calculation formula (function) indicating the relationship. Further, the simple simulation model SiMo includes a conditional expression such as "whether the power of the image recording device 1 is on or off" (for example, an expression that outputs 0 (zero) when the power is off). You may.

続いて、コンピュータ90上で、簡易シミュレーションモデルSiMoを用いて、印刷用紙9の搬送速度を所定の範囲に維持するための制御ルールを、自律的に学習(機械学習)する(ステップS3)。ステップS3では、強化学習を行うことにより、後述する第2段階学習中モデルM2を作成する。図7は、ステップS3において強化学習を行う様子を概念的に示したブロック図である。また、図8は、ステップS3の詳細な流れを示すフローチャートである。 Subsequently, on the computer 90, the simple simulation model SiMo is used to autonomously learn (machine learning) the control rules for maintaining the transport speed of the printing paper 9 within a predetermined range (step S3). In step S3, the second-stage learning model M2, which will be described later, is created by performing reinforcement learning. FIG. 7 is a block diagram conceptually showing how reinforcement learning is performed in step S3. Further, FIG. 8 is a flowchart showing a detailed flow of step S3.

コンピュータ90上で強化学習を行うときには、強化学習プログラムに基づいて、後述する学習済みモデルM3の原型となる学習前モデルM0を用意する。そして、用意された学習前モデルM0に、制御値CVd,CVeと、簡易シミュレーションモデルSiMoからの出力を反映した報酬との関係を、学習させる。なお、本実施形態では、簡易シミュレーションモデルSiMoに入力される参照値CF1,CF2,CF3、および情報Scは、予め設定される。 When performing reinforcement learning on the computer 90, a pre-learning model M0, which is a prototype of the learned model M3 described later, is prepared based on the reinforcement learning program. Then, the prepared pre-learning model M0 is made to learn the relationship between the control values CVd and CVe and the reward reflecting the output from the simple simulation model SiMo. In the present embodiment, the reference values CF1, CF2, CF3, and the information Sc input to the simple simulation model SiMo are set in advance.

具体的には、まず、学習前モデルM0から、搬送に係る制御値CVdおよび吐出に係る制御値CVeとしてそれぞれ、ある値を出力して、簡易シミュレーションモデルSiMoへ入力する(ステップS31)。ただし、上記のとおり、搬送に係る制御値CVdおよび吐出に係る制御値CVeの一方は、予め定めた所定の値としてもよい。また、搬送に係る制御値CVdについては、巻き出しローラ11に接続されるモータ14へ入力する値と、搬送ローラ121に接続されるモータ14へ入力する値と、巻き取りローラ13に接続されるモータ14へ入力する値とが、互いに異なっていてもよい。 Specifically, first, from the pre-learning model M0, certain values are output as the control value CVd related to the transfer and the control value CVe related to the discharge, and are input to the simple simulation model SiMo (step S31). However, as described above, one of the control value CVd related to transport and the control value CVe related to discharge may be a predetermined value set in advance. Further, regarding the control value CVd related to the transfer, the value input to the motor 14 connected to the unwinding roller 11 and the value input to the motor 14 connected to the transport roller 121 are connected to the take-up roller 13. The values input to the motor 14 may be different from each other.

ステップS31の初期段階では、学習前モデルM0から出力される値は、ランダムな値となる。簡易シミュレーションモデルSiMoは、学習前モデルM0から入力された値と、上記の参照値CF1,CF2,CF3、および情報Scとに基づいて、印刷用紙9の搬送速度に係る算出値CAsを出力する(ステップS32)。以下では、このように学習が開始された後の学習前モデルM0を、第1段階学習中モデルM1と呼ぶこととする。 In the initial stage of step S31, the value output from the pre-learning model M0 is a random value. The simple simulation model SiMo outputs the calculated value CAs related to the transport speed of the printing paper 9 based on the values input from the pre-learning model M0, the above reference values CF1, CF2, CF3, and the information Sc ( Step S32). In the following, the pre-learning model M0 after the learning is started in this way will be referred to as the first-stage learning in-learning model M1.

コンピュータ90は、判定部900としての機能をさらに有する。判定部900は、強化学習プログラムに基づいて、簡易シミュレーションモデルSiMoからの出力値である印刷用紙9の搬送速度に係る算出値CAsに応じた報酬RE1を付与する(ステップS33)。このとき、判定部900は、算出値CAsが予め設定された目標値に近づくほど、高い報酬RE1を付与する。一方、判定部900は、算出値CAsが予め設定された目標値から離れるほど、低い報酬RE1を付与する。 The computer 90 further has a function as a determination unit 900. Based on the reinforcement learning program, the determination unit 900 grants the reward RE1 according to the calculated value CAs related to the transport speed of the printing paper 9, which is the output value from the simple simulation model SiMo (step S33). At this time, the determination unit 900 gives a higher reward RE1 as the calculated value CAs approaches the preset target value. On the other hand, the determination unit 900 gives a lower reward RE1 as the calculated value CAs deviates from the preset target value.

第1段階学習中モデルM1は、判定部900から報酬RE1を付与されると、当該付与された報酬RE1を踏まえて、搬送に係る制御値CVdおよび吐出に係る制御値CVeとしての次の値を出力する。例えば、第1段階学習中モデルM1は、判定部900から高い報酬RE1を付与されると、その高い報酬RE1を付与されるに至った制御値CVd,CVeに近い値を、次の値として出力する。また、第1段階学習中モデルM1は、判定部900から低い報酬RE1を付与されると、その低い報酬RE1を付与されるに至った制御値CVd,CVeから離れた値を、次の値として出力する。 When the reward RE1 is given by the determination unit 900, the first-stage learning model M1 sets the following values as the control value CVd related to transportation and the control value CVe related to discharge based on the given reward RE1. Output. For example, in the first stage learning model M1, when a high reward RE1 is given by the determination unit 900, a value close to the control values CVd and CVe that led to the high reward RE1 being given is output as the next value. do. Further, in the first-stage learning model M1, when a low reward RE1 is given by the determination unit 900, a value away from the control values CVd and CVe that led to the low reward RE1 being given is set as the next value. Output.

このように、ステップS3では、第1段階学習中モデルM1から出力する値(搬送に係る制御値CVdおよび吐出に係る制御値CVe)を更新しつつ、簡易シミュレーションモデルSiMoへ入力し、さらに簡易シミュレーションモデルSiMoからの算出値CAsを所定の範囲に維持するための強化学習を行う。また、本実施形態では、強化学習(深層強化学習)として、例えば、PPO(Proximal Policy Optimization)の技法によって実行される機械学習を行う。ただし、強化学習として、DQN(Deep Q Network)、Q学習法、SARSA、モンテカルロ法、epsilon-greedy法、BoltzmannQPolicy法等の技法によって実行される機械学習を行ってもよい。 In this way, in step S3, while updating the values output from the first-stage learning model M1 (control value CVd related to transport and control value CVe related to discharge), they are input to the simple simulation model SiMo, and further simple simulation is performed. Reinforcement learning is performed to maintain the calculated value CAs from the model SiMo within a predetermined range. Further, in the present embodiment, as reinforcement learning (deep reinforcement learning), for example, machine learning executed by a technique of PPO (Proximal Policy Optimization) is performed. However, as reinforcement learning, machine learning executed by techniques such as DQN (Deep Q Network), Q-learning method, SARSA, Monte Carlo method, epsilon-greedy method, and Boltzmann QPolicy method may be performed.

上記のとおり、コンピュータ90上での強化学習の初期段階では、第1段階学習中モデルM1は、制御値CVd,CVeとしてランダムな値を出力する。しかしながら、コンピュータ90は、ステップS31〜S33の処理を繰り返す過程で、判定部900から付与される報酬RE1に応じて、制御値CVd,CVeの増加、維持、減少等を試行する。これにより、制御値CVd,CVeと、簡易シミュレーションモデルSiMoからの出力を反映した報酬との関係を、自動的に学習する。そして、第1段階学習中モデルM1は、次第に、高い報酬RE1を得ることができるようになる。すなわち、第1段階学習中モデルM1は、次第に、簡易シミュレーションモデルSiMoからの算出値CAsを所定の範囲内に維持するための制御値CVd,CVeを、出力できるようになる。 As described above, in the initial stage of reinforcement learning on the computer 90, the first stage learning model M1 outputs random values as control values CVd and CVe. However, in the process of repeating the processes of steps S31 to S33, the computer 90 tries to increase, maintain, decrease, and the like the control values CVd and CVe according to the reward RE1 given by the determination unit 900. As a result, the relationship between the control values CVd and CVe and the reward reflecting the output from the simple simulation model SiMo is automatically learned. Then, the first-stage learning model M1 can gradually obtain a high reward RE1. That is, the first-stage learning model M1 can gradually output the control values CVd and CVe for maintaining the calculated values CAs from the simple simulation model SiMo within a predetermined range.

その後、コンピュータ90は、強化学習プログラムに基づいて、強化学習を終了するか否かを判断する(ステップS34)。判定部900による報酬RE1が、所望のレベルに達していない場合には、引き続き、コンピュータ90上での強化学習を継続する(ステップS34:no)。その場合、上述したステップS31〜S34の処理を、再度実行する。 After that, the computer 90 determines whether or not to end the reinforcement learning based on the reinforcement learning program (step S34). If the reward RE1 by the determination unit 900 does not reach the desired level, the reinforcement learning on the computer 90 is continued (step S34: no). In that case, the process of steps S31 to S34 described above is executed again.

一方、ステップS34において、付与される報酬RE1が所望のレベルに達したと判断されると、強化学習プログラムに基づいて、コンピュータ90上での強化学習を終了する(ステップS34:yes)。そして、以上のコンピュータ90上での強化学習が完了した第1段階学習中モデルM1は、第2段階学習中モデルM2となる。 On the other hand, in step S34, when it is determined that the reward RE1 to be given has reached a desired level, the reinforcement learning on the computer 90 is terminated based on the reinforcement learning program (step S34: yes). Then, the first-stage learning model M1 for which the reinforcement learning on the computer 90 is completed becomes the second-stage learning model M2.

その後、制御部80の記憶部803に、第2段階学習中モデルM2がインストールされる。そして、図4に示すように、再度、実際に印刷用紙9を搬送しながら、印刷用紙9の表面にインクを吐出しつつ、印刷用紙9の搬送速度を所定の範囲に維持するための制御ルールを、自律的に強化学習(機械学習)する(ステップS4)。 After that, the second-stage learning model M2 is installed in the storage unit 803 of the control unit 80. Then, as shown in FIG. 4, a control rule for maintaining the transport speed of the printing paper 9 within a predetermined range while ejecting ink to the surface of the printing paper 9 while actually transporting the printing paper 9 again. Is autonomously reinforced learning (machine learning) (step S4).

図9は、ステップS4において強化学習を行う様子を概念的に示したブロック図である。また、図10は、ステップS4の詳細な流れを示すフローチャートである。図9および図10に示すように、実装置での強化学習を行うときには、まず、第2段階学習中モデルM2から、搬送に係る制御値CVd(モータ14の回転数)として、ある値を出力し、この値に基づき、駆動ローラである巻き出しローラ11、搬送ローラ121、および巻き取りローラ13にそれぞれ接続されるモータ14を回転させる。また、同時に、第2段階学習中モデルM2から、吐出に係る制御値CVe(吐出タイミング)として、ある値を出力し、この値に基づき、記録ヘッド21〜24からインクを吐出する(ステップS41)。 FIG. 9 is a block diagram conceptually showing how reinforcement learning is performed in step S4. Further, FIG. 10 is a flowchart showing a detailed flow of step S4. As shown in FIGS. 9 and 10, when performing reinforcement learning in an actual device, first, a certain value is output as a control value CVd (rotational speed of the motor 14) related to transportation from the model M2 during the second stage learning. Then, based on this value, the motor 14 connected to the unwinding roller 11, the transport roller 121, and the winding roller 13, which are the driving rollers, is rotated. At the same time, a certain value is output from the second-stage learning model M2 as the control value CVe (ejection timing) related to ejection, and ink is ejected from the recording heads 21 to 24 based on this value (step S41). ..

次に、上記のとおり、印刷用紙9を搬送しながら、印刷用紙9の表面にインクを吐出しつつ、さらにエンコーダ40から制御部80へ連続パルス信号Enを入力する。制御部80は、入力された連続パルス信号Enに基づいて、速度算出部81において、印刷用紙9の搬送速度の計測値Msを取得する(ステップS42)。 Next, as described above, while transporting the printing paper 9, ink is ejected to the surface of the printing paper 9, and a continuous pulse signal En is further input from the encoder 40 to the control unit 80. The control unit 80 acquires the measured value Ms of the transport speed of the printing paper 9 in the speed calculation unit 81 based on the input continuous pulse signal En (step S42).

制御部80は、判定部800としての機能をさらに有する。判定部800は、強化学習プログラムに基づいて、上記の印刷用紙9の搬送速度の計測値Msに応じた報酬RE2を付与する(ステップS43)。このとき、判定部800は、計測値Msが予め設定された目標値に近づくほど、高い報酬RE2を付与する。一方、判定部800は、計測値Msが予め設定された目標値から離れるほど、低い報酬RE2を付与する。 The control unit 80 further has a function as a determination unit 800. Based on the reinforcement learning program, the determination unit 800 grants the reward RE2 according to the measured value Ms of the transport speed of the printing paper 9 (step S43). At this time, the determination unit 800 gives a higher reward RE2 as the measured value Ms approaches the preset target value. On the other hand, the determination unit 800 gives a lower reward RE2 as the measured value Ms deviates from the preset target value.

第2段階学習中モデルM2は、判定部800から報酬RE2を付与されると、当該付与された報酬RE2を踏まえて、搬送に係る制御値CVdおよび吐出に係る制御値CVeとしての次の値を出力する。例えば、第2段階学習中モデルM2は、判定部800から高い報酬RE2を付与されると、その高い報酬RE2を付与されるに至った制御値CVd,CVeに近い値を、次の値として出力する。また、第2段階学習中モデルM2は、判定部800から低い報酬RE2を付与されると、その低い報酬RE2を付与されるに至った制御値CVd,CVeから離れた値を、次の値として出力する。 When the reward RE2 is given by the determination unit 800, the second-stage learning model M2 sets the following values as the control value CVd related to transportation and the control value CVe related to discharge based on the given reward RE2. Output. For example, in the second stage learning model M2, when a high reward RE2 is given by the determination unit 800, a value close to the control values CVd and CVe that led to the high reward RE2 being given is output as the next value. do. Further, in the second-stage learning model M2, when a low reward RE2 is given by the determination unit 800, a value away from the control values CVd and CVe that led to the low reward RE2 being given is set as the next value. Output.

このように、ステップS4では、第2段階学習中モデルM2から出力する値(搬送に係る制御値CVdおよび吐出に係る制御値CVe)を更新しつつ、モータ14および記録ヘッド21〜24を駆動し、エンコーダ40からの連続パルス信号Enに基づく印刷用紙9の搬送速度の計測値Msを所定の範囲に維持するための強化学習を行う。また、本実施形態では、強化学習(深層強化学習)として、例えば、PPO(Proximal Policy Optimization)の技法によって実行される機械学習を行う。ただし、強化学習として、DQN(Deep Q Network)、Q学習法、SARSA、モンテカルロ法、epsilon-greedy法、BoltzmannQPolicy法等の技法によって実行される機械学習を行ってもよい。 In this way, in step S4, the motor 14 and the recording heads 21 to 24 are driven while updating the values output from the second-stage learning model M2 (control value CVd related to transport and control value CVe related to discharge). , Reinforcement learning is performed to maintain the measured value Ms of the transport speed of the printing paper 9 based on the continuous pulse signal En from the encoder 40 within a predetermined range. Further, in the present embodiment, as reinforcement learning (deep reinforcement learning), for example, machine learning executed by a technique of PPO (Proximal Policy Optimization) is performed. However, as reinforcement learning, machine learning executed by techniques such as DQN (Deep Q Network), Q-learning method, SARSA, Monte Carlo method, epsilon-greedy method, and Boltzmann QPolicy method may be performed.

上記のとおり、ステップS4では、予めコンピュータ90上での強化学習が完了した第2段階学習中モデルM2を用いて、実装置においてさらに強化学習を行う。そして、ステップS41〜S43の処理を繰り返す過程で、判定部800から付与される報酬RE2に応じて、実装置において制御値CVd,CVeの増加、維持、減少等を試行する。これにより、制御値CVd,CVeと、実際に搬送される印刷用紙9の搬送速度の計測値Msを反映した報酬との関係を、自動的に学習する。そして、第2段階学習中モデルM2は、次第に、高い報酬RE2を得ることができるようになる。すなわち、第2段階学習中モデルM2は、次第に、実装置において印刷用紙9の搬送速度の計測値Msを所定の範囲内に維持するための制御値CVd,CVeを、出力できるようになる。 As described above, in step S4, further reinforcement learning is performed in the actual device using the second-stage learning in-flight model M2 for which reinforcement learning on the computer 90 has been completed in advance. Then, in the process of repeating the processes of steps S41 to S43, the control values CVd and CVe are increased, maintained, decreased, and the like in the actual device according to the reward RE2 given by the determination unit 800. As a result, the relationship between the control values CVd and CVe and the reward reflecting the measured value Ms of the transport speed of the printing paper 9 actually transported is automatically learned. Then, the second-stage learning model M2 can gradually obtain a high reward RE2. That is, the second-stage learning model M2 can gradually output the control values CVd and CVe for maintaining the measured value Ms of the transport speed of the printing paper 9 within a predetermined range in the actual device.

その後、制御部80上で、強化学習プログラムに基づいて、強化学習を終了するか否かを判断する(ステップS44)。判定部800による報酬RE2が、所望のレベルに達していない場合には、引き続き、実装置を用いた強化学習を継続する(ステップS44:no)。その場合、上述したステップS41〜S44の処理を、再度実行する。 After that, on the control unit 80, it is determined whether or not to end the reinforcement learning based on the reinforcement learning program (step S44). If the reward RE2 by the determination unit 800 does not reach the desired level, reinforcement learning using the actual device is continued (step S44: no). In that case, the processes of steps S41 to S44 described above are executed again.

一方、ステップS44において、付与される報酬RE2が所望のレベルに達したと判断されると、強化学習プログラムに基づいて、実装置での強化学習を終了する(ステップS44:yes)。そして、以上の実装置での強化学習が完了した第2段階学習中モデルM2は、学習済みモデルM3となる。 On the other hand, in step S44, when it is determined that the reward RE2 to be given has reached a desired level, the reinforcement learning in the actual device is terminated based on the reinforcement learning program (step S44: yes). Then, the second-stage learning model M2 for which the reinforcement learning on the actual device is completed becomes the trained model M3.

上記のとおり、本実施形態では、予め実装置においてデータ取りをした結果を用いて(ステップS1)、コンピュータ90上で簡易シミュレーションモデルSiMoを作成し(ステップS2)、当該簡易シミュレーションモデルSiMoを用いてコンピュータ90上で強化学習を行う(ステップS3)。そして、コンピュータ90上で強化学習を行うことによって得られた第2段階学習中モデルM2を、再度、実装置に移して、引き続き強化学習を行う(ステップS4)。これにより、実装置の動作に見合ったある程度進んだ状態から強化学習を開始することができる。また、コンピュータ90上で相当量の強化学習を行うことができる。この結果、機械学習に要する時間を大幅に短縮できる。また、学習初期段階に、コンピュータ90上で第1段階学習中モデルM1から出力される制御値CVd,CVeが過大になった場合でも、実装置に損傷に及ぼすことを防止できる。さらに、最終的に再度実装置を用いて強化学習を行うことにより、より高精度な制御値CVd,CVeを出力する学習済みモデルM3を作成することができる。これにより、例えば、実装置毎の特徴(例えば、装置の経年に伴い現れる特徴や、印刷用紙9における微小な凹凸による厚みの違いや、インク毎の粘性の僅かな違い等)に沿った、より良い動作を実現することができる。 As described above, in the present embodiment, a simple simulation model SiMo is created on the computer 90 (step S2) using the result of collecting data in the actual device in advance (step S1), and the simple simulation model SiMo is used. Reinforcement learning is performed on the computer 90 (step S3). Then, the second-stage learning model M2 obtained by performing reinforcement learning on the computer 90 is transferred to the actual device again, and reinforcement learning is continuously performed (step S4). As a result, reinforcement learning can be started from a state advanced to some extent commensurate with the operation of the actual device. In addition, a considerable amount of reinforcement learning can be performed on the computer 90. As a result, the time required for machine learning can be significantly reduced. Further, even if the control values CVd and CVe output from the model M1 during the first stage learning on the computer 90 become excessive in the initial stage of learning, it is possible to prevent damage to the actual device. Furthermore, by finally performing reinforcement learning using the actual device again, it is possible to create a trained model M3 that outputs more accurate control values CVd and CVe. As a result, for example, in line with the characteristics of each actual device (for example, the characteristics that appear with the aging of the device, the difference in thickness due to minute irregularities on the printing paper 9, the slight difference in viscosity for each ink, etc.). Good operation can be achieved.

ステップS4に係る実装置での強化学習が完了した後、画像記録装置1における印刷処理が開始される。制御部80は、学習済みモデルM3に基づき、3つのモータ14をそれぞれ回転させて印刷用紙9を搬送し、かつ、記録ヘッド21〜24からインクを吐出して印刷を行う。これにより、搬送機構10のローラの表面と印刷用紙9との間のスリップや、インクによる印刷用紙9の伸びが発生した場合でも、印刷用紙9の搬送速度が所定の範囲に維持される。これにより、印刷用紙9上における各色のインクの吐出位置の搬送方向の誤差が抑制される。この結果、画像記録装置1の印刷品質を向上できる。 After the reinforcement learning in the actual device according to step S4 is completed, the printing process in the image recording device 1 is started. Based on the learned model M3, the control unit 80 rotates each of the three motors 14 to convey the printing paper 9, and ejects ink from the recording heads 21 to 24 to perform printing. As a result, the transport speed of the printing paper 9 is maintained within a predetermined range even when the surface of the roller of the transport mechanism 10 and the printing paper 9 slip or the printing paper 9 is stretched by the ink. As a result, an error in the transport direction of the ink ejection position of each color on the printing paper 9 is suppressed. As a result, the print quality of the image recording device 1 can be improved.

<2.変形例>
以上、本発明の一実施形態について説明したが、本発明は、上記の実施形態に限定されるものではない。以下では、種々の変形例について、上記の実施形態との相違点を説明する。
<2. Modification example>
Although one embodiment of the present invention has been described above, the present invention is not limited to the above embodiment. Hereinafter, the differences between the various modifications and the above-described embodiments will be described.

<2−1.第1変形例>
上記の実施形態では、制御部80の速度算出部81は、搬送ローラ122に接続されたエンコーダ40から入力された連続パルス信号Enに基づき、搬送ローラ122を含む複数の搬送ローラ12によって搬送される印刷用紙9の搬送速度の計測値Msを算出していた。しかしながら、制御部80は、第1エッジ位置検出部31から入力された第1エッジ信号Ed1および第2エッジ位置検出部32から入力された第2エッジ信号Ed2に基づき、印刷用紙9の搬送速度の計測値Msを算出してもよい。以下に、詳細を説明する。
<2-1. First modification>
In the above embodiment, the speed calculation unit 81 of the control unit 80 is conveyed by a plurality of transfer rollers 12 including the transfer roller 122 based on the continuous pulse signal En input from the encoder 40 connected to the transfer roller 122. The measured value Ms of the transport speed of the printing paper 9 was calculated. However, the control unit 80 determines the transfer speed of the printing paper 9 based on the first edge signal Ed1 input from the first edge position detection unit 31 and the second edge signal Ed2 input from the second edge position detection unit 32. The measured value Ms may be calculated. Details will be described below.

図11は、第1エッジ信号Ed1の例および第2エッジ信号Ed2の例をそれぞれ示したグラフである。図11において、横軸は時刻を示す。図11の縦軸は、エッジ91の幅方向の位置を示す。なお、図11のグラフの横軸は、左端が現在時刻であり、右側へ向かうほど時刻が古くなる。したがって、図11中のデータ線は、時間の経過とともに、白抜き矢印のように右側へ移動する。印刷用紙9のエッジ91には、微細な凹凸が存在する。第1エッジ位置検出部31および第2エッジ位置検出部32は、予め設定された微小時間ごとに(例えば50マイクロ秒ごとに)、印刷用紙9のエッジ91の幅方向の位置を検出する。これにより、図11のように、印刷用紙9のエッジ91の幅方向の位置の経時変化を示すデータが得られる。第1エッジ信号Ed1は、第1検出位置Paを通過する印刷用紙9のエッジ91の形状を反映したデータとなる。第2エッジ信号Ed2は、第2検出位置Pbを通過する印刷用紙9のエッジ91の形状を反映したデータとなる。 FIG. 11 is a graph showing an example of the first edge signal Ed1 and an example of the second edge signal Ed2, respectively. In FIG. 11, the horizontal axis represents the time. The vertical axis of FIG. 11 indicates the position of the edge 91 in the width direction. On the horizontal axis of the graph of FIG. 11, the left end is the current time, and the time becomes older toward the right side. Therefore, the data line in FIG. 11 moves to the right as shown by the white arrow with the passage of time. The edge 91 of the printing paper 9 has fine irregularities. The first edge position detection unit 31 and the second edge position detection unit 32 detect the position of the edge 91 of the printing paper 9 in the width direction every minute time set in advance (for example, every 50 microseconds). As a result, as shown in FIG. 11, data showing the time-dependent change in the position of the edge 91 of the printing paper 9 in the width direction can be obtained. The first edge signal Ed1 is data that reflects the shape of the edge 91 of the printing paper 9 that passes through the first detection position Pa. The second edge signal Ed2 is data that reflects the shape of the edge 91 of the printing paper 9 that passes through the second detection position Pb.

制御部80は、第1エッジ信号Ed1と第2エッジ信号Ed2とを比較する。そして、第1エッジ信号Ed1と第2エッジ信号Ed2とで、印刷用紙9の同一のエッジ91を検出した箇所を特定する。具体的には、第1エッジ信号Ed1に含まれるデータ区間(一定の時間範囲)ごとに、第2エッジ信号Ed2に含まれる複数のデータ区間(一定の時間範囲)のうち、一致性の高いデータ区間を特定する。以下では、第1エッジ信号Ed1に含まれるデータ区間を、第1データ区間DS1と称する。また、第2エッジ信号Ed2に含まれるデータ区間を、第2データ区間DS2と称する。 The control unit 80 compares the first edge signal Ed1 and the second edge signal Ed2. Then, the location where the same edge 91 of the printing paper 9 is detected is specified by the first edge signal Ed1 and the second edge signal Ed2. Specifically, for each data section (constant time range) included in the first edge signal Ed1, data with high consistency among a plurality of data sections (constant time range) included in the second edge signal Ed2. Identify the section. Hereinafter, the data section included in the first edge signal Ed1 is referred to as the first data section DS1. Further, the data section included in the second edge signal Ed2 is referred to as a second data section DS2.

一致性の高いデータ区間の特定には、例えば、相互相関や残差平方和等のマッチング手法が用いられる。制御部80は、第1データ区間DS1ごとに、複数の第2データ区間DS2を、対応するデータ区間の候補として選択する。また、選択された候補である複数の第2データ区間DS2のそれぞれについて、第1データ区間DS1との一致性を示す評価値を算出する。そして、評価値が最も高くなる第2データ区間DS2を、第1データ区間DS1に対応する(第1データ区間DS1と最も一致性が高い)第2データ区間DS2として特定する。 For example, a matching method such as cross-correlation or residual sum of squares is used to identify a data interval with high consistency. The control unit 80 selects a plurality of second data sections DS2 as candidates for the corresponding data sections for each first data section DS1. In addition, for each of the plurality of second data sections DS2 that are selected candidates, an evaluation value indicating consistency with the first data section DS1 is calculated. Then, the second data section DS2 having the highest evaluation value is specified as the second data section DS2 corresponding to the first data section DS1 (which has the highest consistency with the first data section DS1).

その後、制御部80は、第1データ区間DS1の検出時刻TM1と、第1データ区間DS1と最も一致性の高い第2データ区間DS2の検出時刻TM2との時間差に基づいて、第1検出位置Paから第2検出位置Pbまでの印刷用紙9の搬送にかかる実際の搬送時間ΔT(時刻TM2と時刻TM1との間の時間差)を算出する。そして、第1検出位置Paから第2検出位置Pbまでの距離を、搬送時間ΔTで除することによって、画像記録部20の下方における印刷用紙9の搬送速度を算出することができる。 After that, the control unit 80 determines the first detection position Pa based on the time difference between the detection time TM1 of the first data section DS1 and the detection time TM2 of the second data section DS2 having the highest coincidence with the first data section DS1. The actual transport time ΔT (time difference between the time TM2 and the time TM1) required for transporting the printing paper 9 from the second detection position Pb to the second detection position Pb is calculated. Then, by dividing the distance from the first detection position Pa to the second detection position Pb by the transfer time ΔT, the transfer speed of the printing paper 9 below the image recording unit 20 can be calculated.

<2−2.第2変形例>
上記の実施形態または変形例に記載された方法のほか、印刷用紙9の搬送速度を検出するためのレーザ速度計(図示省略)が用いられてもよい。そして、当該レーザ速度計から、印刷用紙9へ向けて2本のレーザ光線を照射し、これらがそれぞれ印刷用紙9によって反射された反射光の波長を解析した結果に基づいて、印刷用紙9の搬送速度を算出してもよい。
<2-2. Second modification>
In addition to the methods described in the above embodiments or modifications, a laser speedometer (not shown) for detecting the transport speed of the printing paper 9 may be used. Then, the laser speed meter irradiates the printing paper 9 with two laser beams, and the printing paper 9 is conveyed based on the result of analyzing the wavelengths of the reflected light reflected by the printing paper 9, respectively. The speed may be calculated.

<2−3.第3変形例>
上記の実施形態では、画像記録装置1において印刷処理を行う前に予め実行される事前学習の際に、印刷用紙9の搬送速度の計測値Msを所定の範囲に維持するための強化学習を行っていた。しかしながら、事前学習において、印刷用紙9の張力の計測値Mtを所定の範囲に維持するための強化学習を行ってもよい。
<2-3. Third variant>
In the above embodiment, reinforcement learning for maintaining the measured value Ms of the transport speed of the printing paper 9 within a predetermined range is performed during the pre-learning that is executed in advance before the printing process is performed in the image recording apparatus 1. Was there. However, in the pre-learning, reinforcement learning for maintaining the measured value Mt of the tension of the printing paper 9 within a predetermined range may be performed.

具体的には、上記のステップS1において、実際に印刷用紙9を搬送しながら、印刷用紙9の表面にインクを吐出しつつ、張力検出部50から出力される張力信号Teに基づき、張力検出部50が接続された搬送ローラ123に接触しつつ搬送ローラ123を含む複数の搬送ローラ12によって搬送される印刷用紙9に加わる張力の計測値を複数取得して、データ集合体DAに蓄積してもよい。 Specifically, in step S1 described above, the tension detection unit is based on the tension signal Te output from the tension detection unit 50 while actually transporting the printing paper 9 and ejecting ink to the surface of the printing paper 9. Even if a plurality of measured values of tension applied to the printing paper 9 conveyed by a plurality of transfer rollers 12 including the transfer roller 123 while being in contact with the transfer roller 123 to which the 50 is connected are acquired and stored in the data aggregate DA. good.

また、上記のステップS2において、印刷用紙9の張力の計測値Mtを教師データ(正解のデータ)としつつ、制御値CVd,CVe、参照値CF1,CF2,CF3、および情報Scから、印刷用紙9の張力を高精度に算出するための簡易シミュレーションモデルSiMoを機械学習してもよい。そして、簡易シミュレーションモデルSiMoは、決定木X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)を含み、入力された制御値CVd,CVe、計測値Ms、参照値CF1,CF2,CF3、および情報Scに基づいて算出した印刷用紙9の張力の算出値CAtと、データ集合体DAに蓄積された対応する計測値Mtとの差異を最小化するように、決定木X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)に含まれる複数のパラメータ(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)を調整しつつ更新保存してもよい。簡易シミュレーションモデルSiMoからの出力値である印刷用紙9の張力の算出値CAtとデータ集合体DAに蓄積された対応する計測値Mtとの差異が、所定値以下になると、機械学習が完了する。 Further, in step S2 above, the printing paper 9 is obtained from the control values CVd, CVe, the reference values CF1, CF2, CF3, and the information Sc, while using the measured value Mt of the tension of the printing paper 9 as the teacher data (correct answer data). The simple simulation model SiMo for calculating the tension of the above with high accuracy may be machine-learned. Then, the simple simulation model SiMo includes the decision trees X (a, b, c, f (CVd, CVe, CF1, CF2, CF3, Sc) ...), and the input control values CVd, CVe, measured values Ms, To minimize the difference between the calculated tension CAt of the printing paper 9 calculated based on the reference values CF1, CF2, CF3, and the information Sc, and the corresponding measured value Mt stored in the data aggregate DA. A plurality of parameters (a, b, c, f (CVd, CVe, CF1, CF2, CF3) included in the decision tree X (a, b, c, f (CVd, CVe, CF1, CF2, CF3, Sc) ...) , Sc) ...) may be updated and saved. Machine learning is completed when the difference between the calculated value CAt of the tension of the printing paper 9 which is the output value from the simple simulation model SiMo and the corresponding measured value Mt stored in the data aggregate DA becomes equal to or less than a predetermined value.

また、上記のステップS3において、コンピュータ90上で、簡易シミュレーションモデルSiMoを用いて、印刷用紙9の張力を所定の範囲に維持するための制御ルールを、機械学習してもよい。具体的には、ステップS31において、搬送に係る制御値CVdおよび吐出に係る制御値CVeとしてそれぞれ、ある値を出力して、簡易シミュレーションモデルSiMoへ入力してもよい。ステップS32では、簡易シミュレーションモデルSiMoは、学習前モデルM0から入力された値と、上記の参照値CF1,CF2,CF3、および情報Scとに基づいて、印刷用紙9の張力の算出値CAtを出力してもよい。 Further, in step S3 described above, the control rule for maintaining the tension of the printing paper 9 within a predetermined range may be machine-learned on the computer 90 by using the simple simulation model SiMo. Specifically, in step S31, certain values may be output as the control value CVd related to the transfer and the control value CVe related to the discharge, and input to the simple simulation model SiMo. In step S32, the simple simulation model SiMo outputs the calculated value CAt of the tension of the printing paper 9 based on the values input from the pre-learning model M0, the above reference values CF1, CF2, CF3, and the information Sc. You may.

ステップS33では、簡易シミュレーションモデルSiMoからの出力値である、印刷用紙9の張力の算出値CAtに応じた報酬RE1を付与してもよい。これにより、ステップS3では、第1段階学習中モデルM1から出力する値(搬送に係る制御値CVdおよび吐出に係る制御値CVe)を更新しつつ、簡易シミュレーションモデルSiMoへ入力し、さらに簡易シミュレーションモデルSiMoからのCAtを所定の範囲に維持するための強化学習を行ってもよい。さらに、ステップS34では、報酬RE1が所望のレベルに達したと判断されると、コンピュータ90上での強化学習を終了してもよい。そして、当該ステップS3において作成された学習モデルを、第2段階学習中モデルM2としてもよい。 In step S33, the reward RE1 corresponding to the calculated value CAt of the tension of the printing paper 9, which is the output value from the simple simulation model SiMo, may be given. As a result, in step S3, while updating the values output from the first-stage learning model M1 (control value CVd related to transport and control value CVe related to discharge), the values are input to the simple simulation model SiMo, and further, the simple simulation model. Reinforcement learning may be performed to maintain the CAt from SiMo within a predetermined range. Further, in step S34, when it is determined that the reward RE1 has reached a desired level, the reinforcement learning on the computer 90 may be terminated. Then, the learning model created in step S3 may be used as the second-stage learning in-progress model M2.

また、上記のステップS4において、ステップS3において作成された第2段階学習中モデルM2から、搬送に係る制御値CVd(モータ14の回転数)として、ある値を出力し、この値に基づき、駆動ローラである巻き出しローラ11、搬送ローラ121、および巻き取りローラ13にそれぞれ接続されるモータ14を回転させてもよい。また、同時に、第2段階学習中モデルM2から、吐出に係る制御値CVe(吐出タイミング)として、ある値を出力し、この値に基づき、記録ヘッド21〜24からインクを吐出してもよい(ステップS41)。また、ステップS42において、張力検出部50から出力される張力信号Teに基づき、このときの印刷用紙9に加わる張力の計測値Mtを取得してもよい。 Further, in step S4 described above, a certain value is output as the control value CVd (rotational speed of the motor 14) related to the transfer from the second stage learning model M2 created in step S3, and the drive is performed based on this value. The motor 14 connected to the unwinding roller 11, the transport roller 121, and the winding roller 13, which are rollers, may be rotated. At the same time, a certain value may be output from the second-stage learning model M2 as a control value CVe (ejection timing) related to ejection, and ink may be ejected from the recording heads 21 to 24 based on this value ( Step S41). Further, in step S42, the measured value Mt of the tension applied to the printing paper 9 at this time may be acquired based on the tension signal Te output from the tension detection unit 50.

ステップS43では、印刷用紙9の張力の計測値Mtに応じた報酬RE2を付与してもよい。そして、ステップS44では、報酬RE2が所望のレベルに達したと判断されると、実装置を用いた強化学習を終了してもよい。 In step S43, the reward RE2 corresponding to the measured value Mt of the tension of the printing paper 9 may be given. Then, in step S44, when it is determined that the reward RE2 has reached a desired level, reinforcement learning using the actual device may be terminated.

さらに、事前学習において、上記の実施形態および変形例のほか、印刷用紙9の伸びの計測値を所定の範囲に維持するための強化学習を行ってもよい。 Further, in the pre-learning, in addition to the above-described embodiment and modification, reinforcement learning for maintaining the measured value of the elongation of the printing paper 9 within a predetermined range may be performed.

<2−4.他の変形例>
また、上記の画像記録装置1は、印刷用紙9を搬送しながら、処理物質としてインクを吐出して印刷用紙9の表面に画像を記録するものであった。しかしながら、画像記録装置1は、インク以外の処理物質を印刷用紙9の表面に吐出して画像を記録するものであってもよい。また、本発明の搬送処理装置は、インクジェット以外の方法(例えば、電子写真方式や露光等)で、印刷用紙9に画像を記録する装置であってもよい。また、上記の画像記録装置1は、基材としての印刷用紙9に印刷処理を行うものであった。しかしながら、本発明の搬送処理装置は、一般的な紙以外の長尺帯状の基材(例えば、樹脂製のフィルム,金属箔等)に、所定の処理を行うものであってもよい。
<2-4. Other variants>
Further, the above-mentioned image recording device 1 discharges ink as a processing substance while conveying the printing paper 9, and records an image on the surface of the printing paper 9. However, the image recording device 1 may record an image by ejecting a processing substance other than ink onto the surface of the printing paper 9. Further, the transport processing device of the present invention may be a device that records an image on the printing paper 9 by a method other than inkjet (for example, electrophotographic method, exposure, etc.). Further, the above-mentioned image recording apparatus 1 performs a printing process on printing paper 9 as a base material. However, the transport processing apparatus of the present invention may perform a predetermined treatment on a long strip-shaped base material (for example, a resin film, a metal foil, etc.) other than general paper.

また、上記の実施形態や変形例に登場した各要素を、矛盾が生じない範囲で、適宜に組み合わせてもよい。 Further, the elements appearing in the above-described embodiments and modifications may be appropriately combined as long as there is no contradiction.

1 画像記録装置
9 印刷用紙
10 搬送機構
11 巻き出しローラ
12 搬送ローラ
13 巻き取りローラ
14 モータ
20 画像記録部
21 第1記録ヘッド
22 第2記録ヘッド
23 第3記録ヘッド
24 第4記録ヘッド
30 エッジ位置検出部
31 第1エッジ位置検出部
32 第2エッジ位置検出部
40 エンコーダ
50 張力検出部
60 情報取得部
80 制御部
81 速度算出部
90 コンピュータ
91 エッジ
121 搬送ローラ
122 搬送ローラ
123 搬送ローラ
800 判定部
900 判定部
CAs (搬送速度の)算出値
CAt (張力の)算出値
CF1,CF2,CF3 参照値
CVd 搬送に係る制御値
CVe 吐出に係る制御値
DA データ集合体
M0 学習前モデル
M1 第1段階学習中モデル
M2 第2段階学習中モデル
M3 学習済みモデル
Ms (搬送速度の)計測値
Mt (張力の)計測値
RE1,RE2 報酬
Re1,Re2 参照値
Sc 情報
SiMo 簡易シミュレーションモデル
Te 張力信号
X(a,b,c,f(CVd,CVe,CF1,CF2,CF3,Sc)…)) 決定木
1 Image recording device 9 Printing paper 10 Conveying mechanism 11 Unwinding roller 12 Conveying roller 13 Rewinding roller 14 Motor 20 Image recording unit 21 1st recording head 22 2nd recording head 23 3rd recording head 24 4th recording head 30 Edge position Detection unit 31 1st edge position detection unit 32 2nd edge position detection unit 40 Encoder 50 Tension detection unit 60 Information acquisition unit 80 Control unit 81 Speed calculation unit 90 Computer 91 Edge 121 Transport roller 122 Transport roller 123 Transport roller 800 Judgment unit 900 Judgment unit CAs (conveyance speed) calculated value CAt (tension) calculated value CF1, CF2, CF3 Reference value CVd Conveyance control value CVe discharge control value DA data aggregate M0 Pre-learning model M1 First stage learning Model M2 Second stage Learning model M3 Trained model Ms (conveyance speed) measured value Mt (tension) measured value RE1, RE2 Reward Re1, Re2 Reference value Sc Information SiMo Simple simulation model Te Tension signal X (a, b) , C, f (CVd, CVe, CF1, CF2, CF3, Sc) ...)) Determining tree

Claims (8)

長尺帯状の基材を長手方向に搬送しながら、前記基材の表面に処理物質を吐出する搬送処理方法であって、
a)実際に前記基材を搬送しながら、前記基材を搬送するための駆動源であるモータの回転数を含む搬送に係る制御値、または前記処理物質の吐出タイミングを含む吐出に係る制御値に係る情報と、前記基材の張力または搬送速度に係る計測値とを複数取得する工程と、
b)前記工程a)による取得結果に基づいて、前記制御値と、前記計測値との関係を示す簡易シミュレーションモデルをコンピュータ上で作成する工程と、
c)前記コンピュータ上で、前記制御値を更新しつつ、前記簡易シミュレーションモデルからの出力値を所定の範囲に維持するための強化学習を行うことにより、学習中モデルを作成する工程と、
d)前記学習中モデルから出力される前記制御値を更新しつつ、実際に前記基材を搬送しながら前記基材の表面に前記処理物質を吐出する場合における、前記計測値を所定の範囲に維持するための強化学習を行う工程と、
を有する、搬送処理方法。
A transport processing method in which a processing substance is discharged onto the surface of the substrate while the long strip-shaped substrate is conveyed in the longitudinal direction.
a) A control value related to transportation including the rotation speed of a motor which is a drive source for transporting the base material while actually transporting the base material, or a control value related to discharge including the discharge timing of the processed substance. And the step of acquiring a plurality of measured values related to the tension or the transport speed of the base material, and
b) A step of creating a simple simulation model showing the relationship between the control value and the measured value on a computer based on the acquisition result in the step a).
c) A step of creating a learning model by performing reinforcement learning to maintain the output value from the simple simulation model within a predetermined range while updating the control value on the computer.
d) While updating the control value output from the learning model, the measured value in the case of discharging the processed substance to the surface of the base material while actually transporting the base material is set within a predetermined range. The process of performing reinforcement learning to maintain,
A transport processing method.
請求項1に記載の搬送処理方法であって、
前記基材は、複数のローラに掛け渡され、前記複数のローラの少なくとも1つである駆動ローラが前記モータにより駆動されて回転することによって、搬送され、
前記搬送に係る制御値は、前記駆動ローラの回転速度を含む、搬送処理方法。
The transport processing method according to claim 1.
The base material is spread over a plurality of rollers, and is conveyed by rotating a drive roller, which is at least one of the plurality of rollers, driven by the motor.
The control value related to the transfer is a transfer processing method including the rotation speed of the drive roller.
請求項1または請求項2に記載の搬送処理方法であって、
前記吐出に係る制御値は、前記処理物質の吐出量を含む、搬送処理方法。
The transport processing method according to claim 1 or 2.
The control value related to the discharge is a transport processing method including a discharge amount of the processing substance.
請求項1から請求項3までのいずれか1項に記載の搬送処理方法であって、
前記工程a)では、前記基材の厚みまたは種類に係る情報をさらに取得し、
前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記基材の情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する、搬送処理方法。
The transport processing method according to any one of claims 1 to 3.
In the step a), information on the thickness or type of the base material is further acquired.
In the step b), a transport processing method for creating the simple simulation model showing the relationship between the control value, the information on the base material, and the measured value based on the acquisition result in the step a).
請求項1から請求項4までのいずれか1項に記載の搬送処理方法であって、
前記工程a)では、前記処理物質の特性に係る情報をさらに取得し、
前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記処理物質の情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する、搬送処理方法。
The transport processing method according to any one of claims 1 to 4.
In the step a), information on the characteristics of the processed substance is further acquired, and the information is obtained.
In the step b), a transport processing method for creating the simple simulation model showing the relationship between the control value, the information on the processing substance, and the measured value based on the acquisition result in the step a).
請求項1から請求項5までのいずれか1項に記載の搬送処理方法であって、
前記工程a)では、前記基材の周囲の温度または湿度を含む環境条件に係る情報をさらに取得し、
前記工程b)では、前記工程a)による取得結果に基づいて、前記制御値および前記環境条件に係る情報と、前記計測値との関係を示す前記簡易シミュレーションモデルを作成する、搬送処理方法。
The transport processing method according to any one of claims 1 to 5.
In the step a), information on environmental conditions including the temperature or humidity around the base material is further acquired.
In the step b), a transport processing method for creating the simple simulation model showing the relationship between the control value, the information related to the environmental condition, and the measured value based on the acquisition result in the step a).
請求項1から請求項6までのいずれか1項に記載の搬送処理方法であって、
前記工程b)において、前記簡易シミュレーションモデルは、決定木を含み、前記決定木に含まれるパラメータが調整される、搬送処理方法。
The transport processing method according to any one of claims 1 to 6.
In the step b), the simple simulation model includes a decision tree, and the parameters included in the decision tree are adjusted.
請求項1から請求項7までのいずれか1項に記載の搬送処理方法であって、
前記工程c)において行われる前記強化学習は、PPOまたはDQNの技法によって実行される機械学習である、搬送処理方法。
The transport processing method according to any one of claims 1 to 7.
The reinforcement learning performed in the step c) is a transfer processing method, which is machine learning executed by a technique of PPO or DQN.
JP2020045073A 2020-03-16 2020-03-16 Method of feed processing Pending JP2021147112A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020045073A JP2021147112A (en) 2020-03-16 2020-03-16 Method of feed processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020045073A JP2021147112A (en) 2020-03-16 2020-03-16 Method of feed processing

Publications (1)

Publication Number Publication Date
JP2021147112A true JP2021147112A (en) 2021-09-27

Family

ID=77850768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020045073A Pending JP2021147112A (en) 2020-03-16 2020-03-16 Method of feed processing

Country Status (1)

Country Link
JP (1) JP2021147112A (en)

Similar Documents

Publication Publication Date Title
JP6715120B2 (en) Substrate processing device and meandering prediction method
JP6468805B2 (en) Image recording apparatus and image recording method
JP6548416B2 (en) Recording device, control method of recording device, and program
JP7493651B2 (en) Substrate processing device and substrate processing method
US9519447B2 (en) Apparatus and method for determining suitable printing conditions for printing sheets in a printing system
JP2018162161A (en) Base material treatment apparatus and detection method
US10479116B2 (en) Base material processing apparatus and detection method
JP2018051765A (en) Substrate processing device and substrate processing method
US20200346470A1 (en) Base material processing apparatus and detection method
JP6437829B2 (en) Printing position correction method and printing apparatus using the same
JP2021146510A (en) Learning method, control method and printer
JP2021147112A (en) Method of feed processing
JP7198019B2 (en) Base material processing apparatus and detection method
JP7198020B2 (en) Base material processing apparatus and detection method
JP7449732B2 (en) Abnormality detection method and transport device
JP2022115319A (en) Base material processing method
JP2021147228A (en) Conveying device and conveying method
JP7428671B2 (en) Image forming device and image forming method
WO2023068091A1 (en) Printing device and printing method
JP7460517B2 (en) Printing devices and management methods
JP2020158262A (en) Base material processing device and detecting method
JP2022122676A (en) Carrying device, processing device, carrying method, and processing method
JP7221763B2 (en) Base material treatment method
WO2023166812A1 (en) Estimation method, control method, and device
US20240208249A1 (en) Deformation factors based on tension and media advancement data