JP2004178574A - Control parameter optimization method, control parameter optimization device, and control apparatus optimization program - Google Patents

Control parameter optimization method, control parameter optimization device, and control apparatus optimization program Download PDF

Info

Publication number
JP2004178574A
JP2004178574A JP2003378616A JP2003378616A JP2004178574A JP 2004178574 A JP2004178574 A JP 2004178574A JP 2003378616 A JP2003378616 A JP 2003378616A JP 2003378616 A JP2003378616 A JP 2003378616A JP 2004178574 A JP2004178574 A JP 2004178574A
Authority
JP
Japan
Prior art keywords
environment
individual
population
evaluation
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003378616A
Other languages
Japanese (ja)
Inventor
Hirotaka Kaji
洋隆 梶
Hajime Kita
一 喜多
Yasuhito Sano
泰仁 佐野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Motor Co Ltd
Original Assignee
Yamaha Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Motor Co Ltd filed Critical Yamaha Motor Co Ltd
Priority to JP2003378616A priority Critical patent/JP2004178574A/en
Publication of JP2004178574A publication Critical patent/JP2004178574A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a control parameter optimization method, a control parameter optimization device and a control parameter optimization program, which effectively perform optimization under an actual operation environment and dynamically changing environment, by providing a plurality of individuals corresponding to an environment in a condition where the environment discretely changes, and by including an environment preliminary assumption part for preliminarily assuming an environment, and an environment retroactive assumption part for assuming an actual environment after evaluation. <P>SOLUTION: A sailing control apparatus 3 includes a cruising control section 30 and a parameter optimization device 31. The parameter optimization device 31 includes an environment preliminary assumption part 31a, a genetic operation part 31b, an individual group set 31c, and an environment retroactive assumption part 31d. A genetic operation is applied to an individual of the individual group corresponding to the preliminary environment assumed by the environment preliminary assumption part 31a. A generation change of the individuals is made based on a comparison between the retroactive environment assumed by the environment retroactive assumption part 31d and the preliminary environment. <P>COPYRIGHT: (C)2004,JPO

Description

本発明は、制御装置の制御に係り、特に、制御条件が動的に変化する環境下における制御装置の制御パラメータを最適化するのに好適な制御パラメータの最適化方法に関する。   The present invention relates to control of a control device, and more particularly, to a control parameter optimization method suitable for optimizing a control parameter of a control device in an environment where control conditions change dynamically.

従来、特性が事前に不明な制御対象を制御する手法として、様々な適応制御手法が提案されており、中でも進化型計算法を用いて制御装置の制御パラメータを実動作環境下において最適化する手法は、評価値のみを用いればよいので教師信号を必要とせず、大域的探索能力に優れるために想定外の制御対象について最適化を行うことが出来、その柔軟なフレームワークで様々な問題に適用が可能であるという特徴がある。そのため、近年の進化型計算法の研究は従来のテスト関数を用いた基礎研究から、実システムのシミュレーションやそのものを用いた応用研究へとシフトしてきている。   Conventionally, various adaptive control methods have been proposed as methods for controlling a control target whose characteristics are unknown in advance. Among them, a method of optimizing control parameters of a control device in an actual operating environment using an evolutionary calculation method. Does not require a teacher signal because only evaluation values need to be used, and because of its excellent global search capability, it can optimize unexpected control targets, and its flexible framework can be applied to various problems. Is possible. For this reason, research on evolutionary computation methods in recent years has shifted from basic research using conventional test functions to simulation of real systems and applied research using the same.

しかしながら、実システムに進化型計算法を用いた制御パラメータのオンライン最適化を用いる場合には、観測値や評価値にノイズが含まれていること、最適化に必要な評価回数が限定されていることなどの問題がある。特に、環境の変化によって適応度の景観が変化すると個体群全体の適応度が変化してしまうために、最適化が上手く行かないという問題は、実システムへの応用を困難なものとしている。環境が、ある程度離散的に変化すると考えられる場合は、環境に対応した複数の個体群を用意し、それぞれ進化させることで環境の変化に応じた最適化が可能となる。しかし、個体を評価する前にどの環境で個体が評価されるかが事前にわからなければ、どの個体を選択すればよいのかがわからないという問題もある。   However, when using online optimization of control parameters using an evolutionary calculation method in a real system, the observed values and evaluation values include noise, and the number of evaluations required for optimization is limited. There are problems such as things. In particular, if the landscape of fitness changes due to a change in the environment, the fitness of the entire population changes, and the problem that optimization is not successful makes application to real systems difficult. When the environment is considered to change discretely to some extent, a plurality of individual groups corresponding to the environment are prepared and each of them is evolved, so that optimization according to the change in the environment can be performed. However, there is also a problem that if it is not known in advance in which environment the individual will be evaluated before evaluating the individual, it is impossible to know which individual to select.

具体的には、例えば,船外機による小型船舶の定速航走制御を考えた場合、船外機は取り付けられる艇体(大きさ、船底形状、用途,等)が大きく異なり、設計段階ではどのような制御対象かを予測することはほぼ不可能であるため、効果的に定速航走制御を行うための制御パラメータを事前に決定出来ないという問題がある。そこで、この問題を解決する手段として遺伝的アルゴリズムを用いた制御パラメータのオンライン最適化が有効であるが、艇体が一意に決まったとしても使用環境に応じてその特性が大きく異なってしまう。具体的には、気象や海象の変化といった自然によるもの、ステアリング操作やトリム操作といった人為的なものによって、艇体の水面から受ける抵抗が変化し、速度制御の制御性が大きく異なる。この現象、すなわち環境の変化は、ある艇体について実動作環境下における最適化を行う期間よりも短い周期で発生するため、最適化中に最適解や適応度の景観が動的に変化してしまい、最適化が上手く行かない原因となる。   Specifically, for example, when considering the constant speed cruise control of a small boat by an outboard motor, the hull (size, bottom shape, application, etc.) attached to the outboard motor differs greatly, and at the design stage Since it is almost impossible to predict what kind of control target, there is a problem that control parameters for effectively performing constant speed cruise control cannot be determined in advance. To solve this problem, online optimization of control parameters using a genetic algorithm is effective. However, even if the hull is uniquely determined, its characteristics greatly differ depending on the use environment. Specifically, the resistance received from the water surface of the hull changes due to natural factors such as changes in weather and sea conditions, and artificial factors such as steering operation and trim operation, and the controllability of speed control greatly differs. This phenomenon, that is, the change in the environment, occurs in a cycle shorter than the period for optimizing a certain hull under the actual operating environment, so the optimal solution and the landscape of the fitness dynamically change during the optimization. This causes optimization to fail.

そこで、本発明は、このような従来の技術の有する未解決の課題に着目してなされたものであって、環境が離散的に変化する条件において、環境に対応した複数の個体群を用意し、環境を事前に推定する環境事前推定部と評価後に実際の環境を推定する環境事後推定部を備えることで、動的に変化する環境に対しても効果的に実動作環境下における最適化を実施することが可能な制御パラメータの最適化方法、制御パラメータの最適化装置及び制御パラメータの最適化プログラムを提供することを目的としている。   Therefore, the present invention has been made by focusing on the unsolved problem of the conventional technology, and prepares a plurality of individual groups corresponding to the environment under conditions where the environment changes discretely. , An environment pre-estimation unit that pre-estimates the environment and an environmental post-estimation unit that estimates the actual environment after the evaluation make it possible to effectively optimize the environment that changes dynamically in the actual operation It is an object of the present invention to provide a control parameter optimization method, a control parameter optimization device, and a control parameter optimization program that can be implemented.

上記目的を達成するために、本発明に係る請求項1記載の制御パラメータの最適化方法は、制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化する最適化方法であって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成し、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定し、
前記個体群の中から当該推定結果の環境に対応する個体群を選択し、
当該選択された個体群に対して、前記遺伝的操作として、
前記事前に推定した環境に対応する個体群の中から特定の個体を選択し、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成し、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行い、
当該評価結果に基づき評価後の個体の更新処理を行うことを特徴としている。
In order to achieve the above object, a method for optimizing a control parameter according to claim 1 of the present invention provides a method for optimizing a control parameter of a control device used in an environment in which a control condition changes dynamically by using a genetic algorithm. An optimization method that uses and optimizes,
For each of the changing environment, to generate a population of the genetic algorithm according to the control parameters,
Based on predetermined information obtained under the current environment, the environment at the time of the next genetic operation by the genetic algorithm is estimated in advance from the environment that is in correspondence with the population,
From the population, select a population corresponding to the environment of the estimation result,
For the selected population, as the genetic manipulation,
Select a specific individual from the population corresponding to the environment estimated in advance,
A new individual is generated by performing a crossover process using a predetermined crossover method on the specific individual,
Perform evaluation of these individuals based on the evaluation value obtained from the control result using the new individual and the specific individual,
It is characterized in that the individual is updated after the evaluation based on the evaluation result.

つまり、制御条件が動的に変化する環境ごとに、それぞれの環境に対応した個体群を複数用意しておき、遺伝的アルゴリズムを次に適用する環境を事前に推定してから、推定された環境に対応する個体群を選択し、この個体群の個体に対して遺伝的操作を行うことで、環境に合った個体群の最適化を行うことが可能となり、且つ、制御結果のサンプリングデータを有効的に利用することが可能となる。   In other words, for each environment in which the control condition changes dynamically, a plurality of populations corresponding to each environment are prepared, and the environment to which the genetic algorithm will be applied next is estimated in advance, and then the estimated environment By selecting a population corresponding to the above, and performing a genetic operation on the individuals in this population, it becomes possible to optimize the population according to the environment, and to use the sampling data of the control results It becomes possible to use it.

ここで、遺伝的アルゴリズム(以下GAと称す)は、各個体にランダムな初期値を与えて探索空間内に配置し、世代ごとに交叉、突然変異と呼ばれる遺伝的操作を適用し、個体の評価値に応じて個体の増殖および選択を行うことにより、次世代の個体の集合を得る。このような世代交代を繰り返すことにより、漸近的に最適解に近づくことを目的とする。以下、遺伝的操作である交叉、突然変異、選択について説明する。   Here, the genetic algorithm (hereinafter referred to as GA) assigns random initial values to each individual, arranges them in a search space, applies genetic operations called crossover and mutation for each generation, and evaluates each individual. Propagation and selection of individuals according to the value yields a set of individuals for the next generation. An object is to asymptotically approach an optimal solution by repeating such generation alternation. Hereinafter, crossover, mutation, and selection, which are genetic operations, will be described.

交叉とは、少なくとも2つの個体を親とし、親となる個体の個体情報の一部を入れ替えることにより、子孫となる個体を1以上生成する操作である。ある個体の個体情報のよい部分と別の個体の個体情報のよい部分を合体させることにより、より評価値の高い個体を得ることが期待できる。例えば、2つの個体を親として子孫となる2つの個体を生成する場合、一方の親となる個体の個体情報を「000110」、他方の親となる個体の個体情報を「110111」とし、3番目の位置で交叉させることにより、「000111」の個体情報をもつ個体と、「110110」の個体情報をもつ個体とを子孫となる個体として得る。   Crossover is an operation in which at least two individuals are set as parents, and one or more individual descendants are generated by replacing part of the individual information of the individual parent. By combining the good part of the individual information of a certain individual with the good part of the individual information of another individual, it is expected that an individual with a higher evaluation value will be obtained. For example, in a case where two individuals are generated as descendants using two individuals as parents, the individual information of one parent individual is set to “000110” and the individual information of the other parent individual is set to “110111”. Are obtained, the individual having the individual information of "000111" and the individual having the individual information of "110110" are obtained as the descendants.

突然変異とは、所定の確率で個体の個体情報のうち特定部分を変更する操作であり、個体群内での多様性を増加させる。具体的には、個体情報の特定のビットを反転させる操作であり、例えば、ある個体の個体情報を「000111」とし、その3番目の位置で突然変異を起こすことにより、「001111」の個体情報をもつ個体を得る。
選択とは、個体の評価値に応じて個体群のなかのよりよい個体を次世代に残すための操作である。ルーレット選択と呼ばれる選択方法では、各個体は評価値に比例した確率で選択される。例えば、ある世代において、「000000」、「111011」、「110111」、「010111」の個体情報をもつ個体の評価値がそれぞれ「8」、「4」、「2」、「2」であったとする。それぞれの個体が選択される確率は、「8/16」、「4/16」、「2/16」、「2/16」となる。したがって、平均的には、次世代において、「000000」の個体情報をもつ個体は2つに増え、「111011」の個体情報をもつ個体は一つのままで、「110111」の個体情報をもつ個体または「010111」の個体情報をもつ個体はいずれかが残るような個体群が得られる。
Mutation is an operation of changing a specific portion of individual information of an individual with a predetermined probability, and increases diversity within an individual group. Specifically, this is an operation of inverting a specific bit of the individual information. For example, the individual information of a certain individual is set to “000111”, and a mutation is caused at the third position, whereby the individual information of “001111” is obtained. Obtain an individual with
The selection is an operation for leaving a better individual from the population to the next generation according to the evaluation value of the individual. In a selection method called roulette selection, each individual is selected with a probability proportional to the evaluation value. For example, in a certain generation, the evaluation values of individuals having individual information of “000000”, “111011”, “110111”, and “010111” are “8”, “4”, “2”, and “2”, respectively. I do. The probability that each individual is selected is “8/16”, “4/16”, “2/16”, “2/16”. Therefore, on average, in the next generation, the number of individuals having the individual information of “000000” increases to two, the number of individuals having the individual information of “111011” remains one, and the individual having the individual information of “110111” remains Alternatively, an individual group having any of the individuals having the individual information “010111” is obtained.

また、本発明に係る請求項2記載の制御パラメータの最適化方法は、制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化する最適化方法であって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成し、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定し、
前記個体群の中から当該推定結果の環境に対応する個体群を選択し、
当該選択された個体群に対して、前記遺伝的操作として、
前記事前に推定した個体群の中から特定の個体を選択し、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成し、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行い、
当該評価後の環境下から得られる所定情報に基づき、このときの環境を前記個体群と対応関係にある環境の中から推定し、
当該評価後に推定した環境と前記事前に推定した環境とを比較し、
当該比較結果に基づき前記評価後の個体の更新処理を行うことを特徴としている。
According to a second aspect of the present invention, there is provided a method for optimizing a control parameter, wherein the control parameter of a control device used in an environment where a control condition is dynamically changed is optimized using a genetic algorithm. An optimization method,
For each of the changing environment, to generate a population of the genetic algorithm according to the control parameters,
Based on predetermined information obtained under the current environment, the environment at the time of the next genetic operation by the genetic algorithm is estimated in advance from the environment that is in correspondence with the population,
From the population, select a population corresponding to the environment of the estimation result,
For the selected population, as the genetic manipulation,
Select a specific individual from the population estimated in advance,
A new individual is generated by performing a crossover process using a predetermined crossover method on the specific individual,
Perform evaluation of these individuals based on the evaluation value obtained from the control result using the new individual and the specific individual,
Based on the predetermined information obtained from the environment after the evaluation, the environment at this time is estimated from the environment corresponding to the population,
Compare the environment estimated after the evaluation and the environment estimated in advance,
An update process of the individual after the evaluation is performed based on the comparison result.

つまり、制御条件が動的に変化する環境ごとに、それぞれの環境に対応した個体群を複数用意しておき、遺伝的アルゴリズムを次に適用する環境を事前に推定してから、推定された環境に対応する個体群を選択し、この個体群の個体に対して遺伝的アルゴリズムによる遺伝的操作を行い、更に、この遺伝的操作における個体評価後の環境を推定して、この環境と事前に推定した環境とを比較し、この比較結果に基づき評価後の個体を更新するようにしたので、実際の環境と異なる環境に対応する個体群の個体に遺伝的操作を行った場合に、適切な処置を行うことが可能となり、最適化の精度を向上させることが可能となる。   In other words, for each environment in which the control condition changes dynamically, a plurality of populations corresponding to each environment are prepared, and the environment to which the genetic algorithm will be applied next is estimated in advance, and then the estimated environment Select a population corresponding to, perform a genetic operation on the individuals in this population using a genetic algorithm, and further estimate the environment after the individual evaluation in this genetic operation, and estimate this environment in advance. In the case of performing genetic manipulation on individuals in a population group corresponding to an environment different from the actual environment, appropriate Can be performed, and the accuracy of optimization can be improved.

また、請求項3に係る発明は、請求項2記載の制御パラメータの最適化方法において、前記推定された環境の比較において、前記事前に推定された環境と前記評価後に推定された環境とが異なる環境であったときに、前記評価後の個体を当該評価後に推定した環境に対応する個体群の所定の個体と入れ換えることを特徴としている。
つまり、制御条件が動的に変化する環境ごとに、それぞれの環境に対応した個体群を複数用意しておき、遺伝的アルゴリズムを次に適用する環境を事前に推定してから、推定された環境に対応する個体群を選択し、この個体群の個体に対して遺伝的アルゴリズムによる遺伝的操作を行い、更に、この遺伝的操作における個体評価後の環境を推定して、この環境と事前に推定した環境とを比較し、この比較結果によって両者が異なる環境であったときに、評価後の個体を、同じく評価後に推定された環境に対応する個体群の所定の個体と入れ換えるようにしたので、実際の環境と異なる環境に対応する個体群の個体に遺伝的操作を行った場合でも、その結果を破棄せずに利用するようにしたので、複数の環境に適応した進化の可能性が増し、且つ、制御結果のサンプリングデータの有効利用にもなる。
According to a third aspect of the present invention, in the control parameter optimizing method according to the second aspect, in the comparison of the estimated environment, the environment estimated in advance and the environment estimated after the evaluation are different. When the environment is different, the individual after the evaluation is replaced with a predetermined individual of an individual group corresponding to the environment estimated after the evaluation.
In other words, for each environment in which the control condition changes dynamically, a plurality of populations corresponding to each environment are prepared, and the environment to which the genetic algorithm will be applied next is estimated in advance, and then the estimated environment Select a population corresponding to, perform a genetic operation on the individuals in this population using a genetic algorithm, and further estimate the environment after the individual evaluation in this genetic operation, and estimate this environment in advance. Compared to the environment, when the two were different environments according to the comparison result, the individual after the evaluation was replaced with a predetermined individual of the population corresponding to the environment also estimated after the evaluation, Even if genetic manipulation is performed on individuals in a population that corresponds to an environment different from the actual environment, the results are used without discarding, so the possibility of evolution adapted to multiple environments increases, And Also enabled the use of the sampling data of the control results.

また、請求項4に係る発明は、請求項2記載の制御パラメータの最適化方法において、前記推定された環境の比較において、前記事前に推定された環境と前記評価後に推定された環境とが異なる環境であったときに、これらの環境に対応する個体群の中からそれぞれ特定の個体を選択して前記遺伝的操作を行い、この遺伝的操作後の個体を前記評価後に推定された環境に対応する個体群の所定の個体と入れ換えることを特徴としている。
つまり、環境の変わり目においては、事前に推定される環境が間違う可能性が高くなるので、中間的な個体から成る個体群を生成することで安定した評価を得ることが可能となる。
According to a fourth aspect of the present invention, in the control parameter optimizing method according to the second aspect, in the comparison of the estimated environment, the environment estimated in advance and the environment estimated after the evaluation are different. When the environment was different, the individual was selected from the populations corresponding to these environments and the genetic operation was performed, and the individual after the genetic operation was changed to the environment estimated after the evaluation. It is characterized by being replaced with a predetermined individual of a corresponding individual group.
That is, at the transition of the environment, there is a high possibility that the environment estimated in advance is wrong, so that it is possible to obtain a stable evaluation by generating a population including intermediate individuals.

また、請求項5に係る発明は、請求項2乃至請求項4のいずれか1項に記載の制御パラメータの最適化方法において、前記特定の個体は、最良の個体を含むことを特徴としている。
つまり、選択する特定の個体に最良の個体を含ませるようにしたので、適切な進化をし易くし最適化の速度をあげることが可能となる。
また、請求項6に係る発明は、請求項1乃至請求項5のいずれか1項に記載の制御パラメータの最適化方法において、前記環境に対応する個体群の個体が評価済みか否かを判定し、評価済みであると判定された場合は、その個体の評価を省略して以前獲得した評価値を保持し、当該保持された評価値を用いて前記更新処理を行うことを特徴としている。
According to a fifth aspect of the present invention, in the control parameter optimizing method according to any one of the second to fourth aspects, the specific individual includes a best individual.
That is, since the best individual is included in the specific individual to be selected, it is possible to facilitate appropriate evolution and increase the speed of optimization.
According to a sixth aspect of the present invention, in the control parameter optimizing method according to any one of the first to fifth aspects, it is determined whether or not an individual of an individual population corresponding to the environment has been evaluated. When it is determined that the evaluation has been completed, the evaluation of the individual is omitted, the previously obtained evaluation value is held, and the updating process is performed using the held evaluation value.

つまり、一度評価した個体は再評価を行わないようにしたので、評価回数を減らすことが可能となり最適化の速度を上げることが可能である。
また、請求項7に係る発明は、請求項6記載の制御パラメータの最適化方法において、評価済みと判断された個体に対してそのことを示すフラグを設定し、前記環境に対応する個体群の個体が前記更新処理時に生き残った回数を記録し、当該記録された回数が所定数を超えたときに、設定された前記フラグを解除することを特徴としている。
That is, since the individual evaluated once is not re-evaluated, the number of evaluations can be reduced, and the speed of optimization can be increased.
According to a seventh aspect of the present invention, in the control parameter optimizing method according to the sixth aspect, a flag indicating the fact is set for an individual determined to have been evaluated, and an individual group corresponding to the environment is set. The number of times the individual has survived during the updating process is recorded, and when the recorded number exceeds a predetermined number, the set flag is released.

つまり、更新処理時に生き残った回数の多い個体は、実際の評価値よりも高い評価値を得てしまっている可能性が高いので、所定回数以上生き残った個体は評価済みを示すフラグを無効にして再評価を行うことで、淘汰されるべき個体をより確実に淘汰することが可能となる。
具体的には、再評価を行わない状態で事後推定を誤った場合は、評価した個体を間違った環境に対応する個体群に戻すとその後の最適化に悪影響を及ぼす。これは、同じ個体でもそれぞれの環境から得られる評価値が異なるために、例えば、環境1で評価され良い評価値を得た後、事後推定を誤って環境2に対応する個体群に戻され、環境2で飛び抜けて良い評価値を持つ最良個体となってしまった場合、環境2では本来淘汰されるべき個体であったとしても再評価が行われないために何時までも淘汰されないという問題が生じる。更に、常に最良個体を親個体として選択する場合、環境2では本来淘汰されるべき個体の周囲に子個体が生成されることになり、探索の効率が落ちるという問題も生じる。そのため、上記したように所定回数以上生き残った個体に対して再評価を行うことで、正しい評価をし直す。
In other words, individuals who have survived a large number of times during the update process have a high possibility of having obtained an evaluation value higher than the actual evaluation value. By performing the re-evaluation, it is possible to more reliably select individuals to be selected.
Specifically, if the posterior estimation is incorrect without re-evaluation, returning the evaluated individual to a population corresponding to the wrong environment adversely affects the subsequent optimization. This is because the evaluation value obtained from each environment is different even for the same individual. For example, after obtaining a good evaluation value in environment 1, the posterior estimation is erroneously returned to the population corresponding to environment 2, In the case where the best individual having a remarkably good evaluation value is surpassed in the environment 2, there is a problem that the individual is not culled indefinitely because the reevaluation is not performed even if the individual should be originally culled in the environment 2. . Furthermore, when the best individual is always selected as a parent individual, in environment 2, a child individual is generated around an individual that should be originally selected, which causes a problem that search efficiency is reduced. Therefore, as described above, the individual that has survived a predetermined number of times or more is re-evaluated, and the correct evaluation is performed again.

また、請求項8に係る発明は、請求項6又は請求項7記載の制御パラメータの最適化方法において、前記複数の個体群における各個体の現在の評価値と、前記複数の個体群における過去において最も良い評価値とを比較し、現在の評価値の方が過去の評価値より優れている個体に対して再評価を行ってから前記更新処理を行うことを特徴としている。
つまり、前回の更新処理までの最良個体よりも良い評価値を持つ個体は、実際の評価値よりも高い評価値を得てしまっている可能性があるので、この個体に対しては再評価を行うことで、本来淘汰されるべき個体を個体群に戻さないことが可能となる。
According to an eighth aspect of the present invention, in the control parameter optimizing method according to the sixth or seventh aspect, a current evaluation value of each individual in the plurality of individuals and a past evaluation value in the plurality of individuals are used. The present invention is characterized in that the updating process is performed after comparing with the best evaluation value, re-evaluating the individual whose current evaluation value is superior to the past evaluation value, and then re-evaluating the individual.
In other words, an individual with an evaluation value better than the best individual up to the previous update process may have obtained an evaluation value higher than the actual evaluation value. By doing so, it is possible not to return the individuals that should be originally selected to the population.

また、請求項9に係る発明は、請求項1乃至請求項8のいずれか1項に記載の制御パラメータの最適化方法において、前記制御装置は船舶に備わる船外機であり、前記変化する環境は、当該船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき決定されることを特徴としている。
また、請求項10に係る発明は、請求項1乃至請求項9のいずれか1項に記載の制御パラメータの最適化方法において、船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき、前記事前の環境を推定することを特徴としている。
According to a ninth aspect of the present invention, in the control parameter optimizing method according to any one of the first to eighth aspects, the control device is an outboard motor provided on a ship, and Is determined based on at least one of the following information: the traveling speed of the ship, the engine speed, the throttle operation amount, the steering operation amount, and the trim angle.
According to a tenth aspect of the present invention, in the method for optimizing the control parameters according to any one of the first to ninth aspects, the traveling speed, the engine speed, the throttle operation amount, and the steering operation amount of the ship are provided. And the trimming angle is estimated based on at least one of the trim angle and the trim angle.

また、請求項11に係る発明は、請求項2乃至請求項10のいずれか1項に記載の制御パラメータの最適化方法において、船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき、前記評価後の環境を推定することを特徴としている。
また、本発明に係る請求項12記載の制御パラメータの最適化装置は、制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化する最適化装置であって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成する個体群生成手段と、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定する環境事前推定手段と、
前記個体群の中から当該推定結果の環境に対応する個体群を選択する個体群選択手段と、
当該選択された個体群に対して前記遺伝的操作を行う遺伝的操作手段と、を備え、
前記遺伝的操作手段は、
前記事前に推定した環境に対応する個体群の中から特定の個体を選択する特定個体選択部と、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成する交叉処理部と、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行う個体評価部と、
当該評価結果に基づき評価後の個体の更新処理を行う個体更新部と、を備えることを特徴としている。
According to an eleventh aspect of the present invention, in the method for optimizing a control parameter according to any one of the second to tenth aspects, the traveling speed, the engine speed, the throttle operation amount, and the steering operation amount of the ship are provided. And the environment after the evaluation is estimated on the basis of at least one of the information and the trim angle.
A control parameter optimizing device according to a twelfth aspect of the present invention optimizes a control parameter of a control device used in an environment where a control condition changes dynamically using a genetic algorithm. An optimization device,
Corresponding to each of the changing environment, a population generating means for generating a population of the genetic algorithm according to the control parameter,
Based on predetermined information obtained under the current environment, environment prior estimation means for preliminarily estimating an environment at the time of the next genetic operation by the genetic algorithm from among the environments in correspondence with the population,
Population selecting means for selecting a population corresponding to the environment of the estimation result from the population,
Genetic manipulation means for performing the genetic manipulation on the selected population,
The genetic manipulation means,
A specific individual selection unit for selecting a specific individual from a population corresponding to the environment estimated in advance,
A crossover processing unit that generates a new individual by performing a crossover process using a predetermined crossover method on the specific individual;
An individual evaluation unit that evaluates these new individuals and the individual based on an evaluation value obtained from a control result using the specific individual,
And an individual updating unit that updates the individual after the evaluation based on the evaluation result.

このような構成であれば、個体群生成手段によって変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成することが可能であり、環境事前推定手段によって現在の環境下において得られる所定情報に基づき前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を前記対応する個体群のある環境の中から事前に推定することが可能であり、個体群選択手段によって前記個体群の中から当該推定結果の環境に対応する個体群を選択することが可能であり、遺伝的操作手段によって選択された個体群に対して前記遺伝的操作を行うことが可能であり、遺伝的操作手段は遺伝的操作として、特定個体選択部によって事前に推定した環境に対応する個体群の中から特定の個体を選択することが可能であり、交叉処理部によって前記選択された特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成することが可能であり、個体評価部によって前記新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行うことが可能であり、個体更新部によって評価結果に基づき評価後の個体の更新処理を行うことが可能である。   With such a configuration, it is possible to generate a population of the genetic algorithm according to the control parameter, which corresponds to each environment changed by the population generation unit, and the current environment estimation unit estimates the current population. It is possible to preliminarily estimate the environment at the time of the next genetic operation by the genetic algorithm from the environment of the corresponding population based on the predetermined information obtained under the environment. It is possible to select a population corresponding to the environment of the estimation result from the population, and to perform the genetic operation on the population selected by the genetic operation means, The specific operation means can select a specific individual from a population corresponding to the environment estimated in advance by the specific individual selection unit as a genetic operation. Therefore, it is possible to generate a new individual by performing a crossover process using a predetermined crossover method on the selected specific individual by the crossover processing unit, and the new individual and the It is possible to evaluate these individuals based on the evaluation value obtained from the control result using the specific individual, and it is possible to perform the individual updating process after the evaluation based on the evaluation result by the individual updating unit. .

ここで、本発明は、請求項1記載の制御パラメータの最適化方法を実現する装置であり、その効果は重複するので記載を省略する。
また、本発明に係る請求項13記載の制御パラメータの最適化装置は、制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化する最適化装置であって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成する個体群生成手段と、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定する環境事前推定手段と、
前記個体群の中から当該推定結果の環境に対応する個体群を選択する個体群選択手段と、
当該選択された個体群に対して前記遺伝的操作を行う遺伝的操作手段と、を備え、
前記遺伝的操作手段は、
前記事前に推定した環境に対応する個体群の中から特定の個体を選択する特定個体選択部と、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成する交叉処理部と、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行う個体評価部と、
当該評価後の環境下から得られる所定情報に基づき、このときの環境を前記対応した個体群のある環境の中から推定する環境事後推定部と、
当該評価後に推定した環境と前記事前に推定した環境とを比較する環境比較部と、
当該比較結果に基づき前記評価後の個体の更新処理を行う個体更新部と、を備え前記遺伝的操作を行うことを特徴としている。
Here, the present invention is an apparatus for realizing the control parameter optimizing method according to the first aspect, and its effects are duplicated, so that the description is omitted.
A control parameter optimizing device according to a thirteenth aspect of the present invention optimizes a control parameter of a control device used in an environment where a control condition dynamically changes using a genetic algorithm. An optimization device,
Corresponding to each of the changing environment, a population generating means for generating a population of the genetic algorithm according to the control parameter,
Based on predetermined information obtained under the current environment, environment prior estimation means for preliminarily estimating an environment at the time of the next genetic operation by the genetic algorithm from among the environments in correspondence with the population,
Population selecting means for selecting a population corresponding to the environment of the estimation result from the population,
Genetic manipulation means for performing the genetic manipulation on the selected population,
The genetic manipulation means,
A specific individual selection unit for selecting a specific individual from a population corresponding to the environment estimated in advance,
A crossover processing unit that generates a new individual by performing a crossover process using a predetermined crossover method on the specific individual;
An individual evaluation unit that evaluates these new individuals and the individual based on an evaluation value obtained from a control result using the specific individual,
Based on predetermined information obtained from the environment after the evaluation, an environment posterior estimating unit for estimating the environment at this time from a certain environment of the corresponding population,
An environment comparison unit that compares the environment estimated after the evaluation with the environment estimated in advance,
And an individual updating unit that updates the individual after the evaluation based on the comparison result.

このような構成であれば、個体群生成手段によって変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成することが可能であり、環境事前推定手段によって現在の環境下において得られる所定情報に基づき前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を前記対応する個体群のある環境の中から事前に推定することが可能であり、個体群選択手段によって前記個体群の中から当該推定結果の環境に対応する個体群を選択することが可能であり、遺伝的操作手段によって選択された個体群に対して前記遺伝的操作を行うことが可能であり、遺伝的操作手段は遺伝的操作として、特定個体選択部によって事前に推定した環境に対応する個体群の中から特定の個体を選択することが可能であり、交叉処理部によって前記選択された特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成することが可能であり、個体評価部によって前記新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行うことが可能であり、環境事後推定部によって評価後の環境下から得られる所定情報に基づき、このときの環境を前記対応した個体群のある環境の中から推定することが可能であり、環境比較部によって評価後に推定した環境と前記事前に推定した環境とを比較することが可能であり、個体更新部によって当該比較結果に基づき前記評価後の個体の更新処理を行うことが可能である。   With such a configuration, it is possible to generate a population of the genetic algorithm according to the control parameter, which corresponds to each environment changed by the population generation unit, and the current environment estimation unit estimates the current population. It is possible to preliminarily estimate the environment at the time of the next genetic operation by the genetic algorithm from the environment of the corresponding population based on the predetermined information obtained under the environment. It is possible to select a population corresponding to the environment of the estimation result from the population, and to perform the genetic operation on the population selected by the genetic operation means, The specific operation means can select a specific individual from a population corresponding to the environment estimated in advance by the specific individual selection unit as a genetic operation. Therefore, it is possible to generate a new individual by performing a crossover process using a predetermined crossover method on the selected specific individual by the crossover processing unit, and the new individual and the It is possible to evaluate these individuals based on the evaluation value obtained from the control result using the specific individual, based on predetermined information obtained from the environment after the evaluation by the environmental posterior estimating unit, the environment at this time Can be estimated from a certain environment of the corresponding population, and it is possible to compare the environment estimated after evaluation by the environment comparison unit with the environment estimated in advance, and the individual update unit Thus, it is possible to update the individual after the evaluation based on the comparison result.

ここで、本発明は、請求項2記載の制御パラメータの最適化方法を実現する装置であり、その効果は重複するので記載を省略する。
また、請求項14に係る発明は、請求項13記載の制御パラメータの最適化装置において、前記環境比較部における比較結果が、前記事前に推定された環境と前記評価後に推定された環境とが異なる環境であったときに、前記個体更新部は、前記評価後の個体を当該評価後に推定した環境に対応する個体群の所定の個体と入れ換えるようになっていることを特徴としている。
Here, the present invention is an apparatus for realizing the control parameter optimizing method according to the second aspect, and its effects are duplicated, so that the description is omitted.
According to a fourteenth aspect of the present invention, in the control parameter optimizing device according to the thirteenth aspect, the comparison result in the environment comparison unit is such that the environment estimated in advance and the environment estimated after the evaluation are different. When the environment is different, the individual updating unit replaces the individual after the evaluation with a predetermined individual of an individual group corresponding to the environment estimated after the evaluation.

つまり、環境比較部における比較結果が、前記事前に推定された環境と前記評価後に推定された環境とが異なる環境のときに、個体更新部によって、前記評価後の個体を当該評価後に推定した環境に対応する個体群の所定の個体と入れ換えることが可能である。
ここで、本発明は、請求項3記載の制御パラメータの最適化方法を実現する装置であり、その効果は重複するので記載を省略する。
That is, when the comparison result in the environment comparison unit is an environment in which the environment estimated beforehand and the environment estimated after the evaluation are different, the individual updating unit estimates the individual after the evaluation after the evaluation. It is possible to replace a predetermined individual of the population corresponding to the environment.
Here, the present invention is an apparatus for realizing the control parameter optimizing method according to the third aspect, and the description thereof is omitted because the effects are duplicated.

また、請求項15に係る発明は、請求項13記載の制御パラメータの最適化装置において、前記環境比較部における比較結果が、前記事前に推定された環境と前記評価後に推定された環境とが異なる環境であったときに、前記遺伝的操作手段は、これらの環境に対応する個体群の中からそれぞれ特定の個体を選択して前記遺伝的操作を行い、この遺伝的操作後の個体を前記評価後に推定された環境に対応する個体群の所定の個体と入れ換えるようになっていることを特徴としている。   According to a fifteenth aspect of the present invention, in the control parameter optimizing device according to the thirteenth aspect, the comparison result in the environment comparing unit is such that the environment estimated in advance and the environment estimated after the evaluation are different. When the environment is different, the genetic manipulation means selects a specific individual from a population corresponding to these environments, performs the genetic manipulation, and sets the individual after the genetic manipulation to the It is characterized in that a predetermined individual of an individual group corresponding to the environment estimated after the evaluation is replaced.

つまり、環境比較部における比較結果が、前記事前に推定された環境と前記評価後に推定された環境とが異なる環境のときに、前記遺伝的操作手段によってこれらの環境に対応する個体群の中からそれぞれ特定の個体を選択して前記遺伝的操作を行い、この遺伝的操作後の個体を前記評価後に推定された環境に対応する個体群の所定の個体と入れ換えることが可能である。
ここで、本発明は、請求項4記載の制御パラメータの最適化方法を実現する装置であり、その効果は重複するので記載を省略する。
また、請求項16に係る発明は、請求項13乃至請求項15のいずれか1項に記載の制御パラメータの最適化装置において、前記特定の個体は、最良の個体を含むことを特徴としている。
That is, when the comparison result in the environment comparison unit is an environment in which the environment estimated in advance and the environment estimated after the evaluation are different from each other, the , It is possible to perform the genetic operation by selecting a specific individual from the group, and replace the individual after the genetic operation with a predetermined individual of an individual group corresponding to the environment estimated after the evaluation.
Here, the present invention is an apparatus for realizing the control parameter optimizing method according to claim 4, and its effect is duplicated, so that the description is omitted.
According to a sixteenth aspect of the present invention, in the control parameter optimizing device according to any one of the thirteenth to fifteenth aspects, the specific individual includes a best individual.

ここで、本発明は、請求項5記載の制御パラメータの最適化方法を実現する装置であり、その効果は重複するので記載を省略する。
また、請求項17に係る発明は、請求項13乃至16のいずれか1項に記載の制御パラメータの最適化装置において、前記遺伝的操作手段は、前記環境に対応する個体群の個体が評価済みか否かを判定し、評価済みであると判定された場合は、その個体の評価を省略して以前獲得した評価値を保持し、当該保持された評価値を用いて前記更新処理を行うことを特徴としている。
Here, the present invention is an apparatus for realizing the control parameter optimizing method according to claim 5, and its effect is duplicated, so that the description is omitted.
According to a seventeenth aspect of the present invention, in the control parameter optimizing device according to any one of the thirteenth to sixteenth aspects, the genetic operation means has evaluated an individual of an individual group corresponding to the environment. It is determined whether or not the evaluation has been completed, and if it is determined that the evaluation has been completed, the evaluation value of the individual is omitted, the previously obtained evaluation value is retained, and the updating process is performed using the retained evaluation value. It is characterized by.

ここで、本発明は、請求項6記載の制御パラメータの最適化方法を実現する装置であり、その効果は重複するので記載を省略する。
また、請求項18に係る発明は、請求項17記載の制御パラメータの最適化装置において、前記遺伝的操作手段は、評価済みと判断された個体に対して、そのことを示すフラグを設定し、前記環境に対応する個体群の個体が前記更新処理時に生き残った回数を記録し、当該記録された回数が所定数を超えたときに、設定された前記フラグを解除することを特徴としている。
Here, the present invention is an apparatus for realizing the control parameter optimizing method according to claim 6, and its effect is duplicated, so that the description is omitted.
According to an eighteenth aspect of the present invention, in the control parameter optimizing device according to the seventeenth aspect, the genetic operation means sets a flag indicating that the individual is determined to have been evaluated, The number of surviving individuals in the individual group corresponding to the environment during the updating process is recorded, and when the recorded number exceeds a predetermined number, the set flag is released.

ここで、本発明は、請求項7記載の制御パラメータの最適化方法を実現する装置であり、その効果は重複するので記載を省略する。
また、請求項19に係る発明は、請求項17又は請求項18記載の制御パラメータの最適化装置において、前記遺伝的操作手段は、前記複数の個体群における各個体の現在の評価値と、前記複数の個体群における過去において最も良い評価値とを比較し、現在の評価値の方が過去の評価値より優れている個体に対して再評価を行ってから前記更新処理を行うことを特徴としている。
Here, the present invention is an apparatus for realizing the control parameter optimizing method according to claim 7, and its effect is duplicated, so that the description is omitted.
According to a nineteenth aspect of the present invention, in the control parameter optimizing device according to the seventeenth or eighteenth aspect, the genetic operation means includes: a current evaluation value of each individual in the plurality of individuals; Compared with the best evaluation value in the past in a plurality of populations, the current evaluation value is characterized by performing the update process after re-evaluating individuals that are better than the past evaluation value I have.

ここで、本発明は、請求項8記載の制御パラメータの最適化方法を実現する装置であり、その効果は重複するので記載を省略する。
また、請求項20に係る発明は、請求項12乃至請求項19のいずれか1項に記載の制御パラメータの最適化装置において、前記制御装置は船舶に備わる船外機であり、前記変化する環境は、当該船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき決定されることを特徴としている。
Here, the present invention is an apparatus for realizing the control parameter optimizing method according to claim 8, and its effect is duplicated, so that the description is omitted.
According to a twentieth aspect of the present invention, in the control parameter optimizing device according to any one of the twelfth to nineteenth aspects, the control device is an outboard motor provided in a ship, and Is determined based on at least one of the following information: the traveling speed of the ship, the engine speed, the throttle operation amount, the steering operation amount, and the trim angle.

つまり、制御装置は船舶に備わる船外機であり、前記変化する環境は、当該船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき決定される。
また、請求項21に係る発明は、請求項12乃至請求項20のいずれか1項に記載の制御パラメータの最適化装置において、前記環境事前推定手段は、船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき、前記事前の環境を推定することを特徴としている。
That is, the control device is an outboard motor provided in the ship, and the changing environment is determined based on at least one of information on the running speed, the engine speed, the throttle operation amount, the steering operation amount, and the trim angle of the ship. Is done.
According to a twenty-first aspect of the present invention, in the control parameter optimizing device according to any one of the twelfth to twentieth aspects, the environment pre-estimating means includes a cruising speed of a ship, an engine speed, The prior environment is estimated based on at least one of a throttle operation amount, a steering operation amount, and a trim angle.

つまり、前記環境事前推定手段によって船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき、前記事前の環境を推定することが可能である。
また、請求項22に係る発明は、請求項13乃至請求項21のいずれか1項に記載の制御パラメータの最適化装置において、前記環境事後推定部は、船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき、前記評価後の環境を推定することを特徴としている。
That is, the environment in advance can be estimated by the environment pre-estimating means based on at least one of the following information: the traveling speed of the ship, the engine speed, the throttle operation amount, the steering operation amount, and the trim angle. .
According to a twenty-second aspect of the present invention, in the control parameter optimizing device according to any one of the thirteenth to twenty-first aspects, the environmental posterior estimating unit includes: The environment after the evaluation is estimated based on at least one of a throttle operation amount, a steering operation amount, and a trim angle.

つまり、前記環境事後推定部によって船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき、前記評価後の環境を推定することが可能である。
また、本発明に係る請求項23記載の制御パラメータの最適化プログラムは、制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化するコンピュータ実行可能なプログラムであって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成し、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定し、
前記個体群の中から当該推定結果の環境に対応する個体群を選択し、
当該選択された個体群に対して、前記遺伝的操作として、
前記事前に推定した環境に対応する個体群の中から特定の個体を選択し、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成し、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行い、
当該評価結果に基づき評価後の個体の更新処理を行うことを特徴としている。
That is, the environment after the evaluation can be estimated by the environment posterior estimating unit based on at least one of the following information: the traveling speed of the ship, the engine speed, the throttle operation amount, the steering operation amount, and the trim angle. .
A control parameter optimization program according to claim 23 of the present invention optimizes a control parameter of a control device used in an environment in which control conditions change dynamically using a genetic algorithm. A computer executable program,
For each of the changing environment, to generate a population of the genetic algorithm according to the control parameters,
Based on predetermined information obtained under the current environment, the environment at the time of the next genetic operation by the genetic algorithm is estimated in advance from the environment that is in correspondence with the population,
From the population, select a population corresponding to the environment of the estimation result,
For the selected population, as the genetic manipulation,
Select a specific individual from the population corresponding to the environment estimated in advance,
A new individual is generated by performing a crossover process using a predetermined crossover method on the specific individual,
Perform evaluation of these individuals based on the evaluation value obtained from the control result using the new individual and the specific individual,
It is characterized in that the individual is updated after the evaluation based on the evaluation result.

ここで、本発明は、請求項1記載の制御パラメータの最適化方法を実現するためプログラムであり、その効果は重複するので記載を省略する。
また、本発明に係る請求項24記載の制御パラメータの最適化プログラムは、制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化するコンピュータ実行可能なプログラムであって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成し、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定し、
前記個体群の中から当該推定結果の環境に対応する個体群を選択し、
当該選択された個体群に対して、前記遺伝的操作として、
前記事前に推定した環境に対応する個体群の中から特定の個体を選択し、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成し、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行い、
当該評価後の環境下から得られる所定情報に基づき、このときの環境を前記対応した個体群のある環境の中から推定し、
当該評価後に推定した環境と前記事前に推定した環境とを比較し、
当該比較結果に基づき前記評価後の個体の更新処理を行うことを特徴としている。
ここで、本発明は、請求項2記載の制御パラメータの最適化方法を実現するためプログラムであり、その効果は重複するので記載を省略する。
Here, the present invention is a program for realizing the control parameter optimizing method according to the first aspect, and its effects are duplicated, so that the description is omitted.
A control parameter optimizing program according to claim 24 of the present invention optimizes a control parameter of a control device used in an environment in which control conditions change dynamically using a genetic algorithm. A computer executable program,
For each of the changing environment, to generate a population of the genetic algorithm according to the control parameters,
Based on predetermined information obtained under the current environment, the environment at the time of the next genetic operation by the genetic algorithm is estimated in advance from the environment that is in correspondence with the population,
From the population, select a population corresponding to the environment of the estimation result,
For the selected population, as the genetic manipulation,
Select a specific individual from the population corresponding to the environment estimated in advance,
A new individual is generated by performing a crossover process using a predetermined crossover method on the specific individual,
Perform evaluation of these individuals based on the evaluation value obtained from the control result using the new individual and the specific individual,
Based on the predetermined information obtained from the environment after the evaluation, the environment at this time is estimated from the environment of the corresponding population,
Compare the environment estimated after the evaluation and the environment estimated in advance,
An update process of the individual after the evaluation is performed based on the comparison result.
Here, the present invention is a program for realizing the control parameter optimizing method according to the second aspect, and its effect is duplicated, so that the description is omitted.

以上説明したように、本発明に係る請求項1記載の制御パラメータの最適化方法によれば、制御条件が動的に変化する環境ごとに、それぞれの環境に対応した個体群を複数用意しておき、次に遺伝的アルゴリズムを適用する環境を事前に推定してから、推定された環境に対応する個体群を選択し、この個体群の個体に対して遺伝的操作を行うようにしたので、環境に合った個体群の最適化を行うことが可能となり、且つ、制御結果のサンプリングデータを有効的に利用することが可能となる。   As described above, according to the control parameter optimizing method according to claim 1 of the present invention, for each environment in which the control condition dynamically changes, a plurality of individual groups corresponding to each environment are prepared. Since, after estimating the environment to which the genetic algorithm is to be applied in advance, a population corresponding to the estimated environment is selected, and genetic operations are performed on individuals in this population. This makes it possible to optimize a group of individuals suitable for the environment, and to effectively use the sampling data of the control result.

また、請求項2記載の制御パラメータの最適化方法によれば、制御条件が動的に変化する環境ごとに、それぞれの環境に対応した個体群を複数用意しておき、次に遺伝的アルゴリズムを適用する環境を事前に推定してから、推定された環境に対応する個体群を選択し、この個体群の個体に対して遺伝的アルゴリズムによる遺伝的操作を行い、更に、この遺伝的操作における個体評価後の環境を推定して、この環境と事前に推定した環境とを比較し、この比較結果に基づき評価後の個体を更新するようにしたので、実際の環境と異なる環境に対応する個体群の個体に遺伝的操作を行った場合に、適切な処置を行うことが可能となり、最適化の精度を向上させることが可能となる。   According to the control parameter optimizing method of the present invention, for each environment in which the control condition changes dynamically, a plurality of individuals corresponding to each environment are prepared, and then the genetic algorithm is used. After estimating the environment to be applied in advance, select a population corresponding to the estimated environment, perform a genetic operation on the individuals in this population by a genetic algorithm, Since the environment after the evaluation is estimated, the environment is compared with the environment estimated in advance, and the individual after the evaluation is updated based on the comparison result. When the genetic manipulation is performed on the individual, the appropriate treatment can be performed, and the precision of the optimization can be improved.

また、請求項3記載の制御パラメータの最適化方法によれば、制御条件が動的に変化する環境ごとに、それぞれの環境に対応した個体群を複数用意しておき、遺伝的アルゴリズムを次に適用する環境を事前に推定してから、推定された環境に対応する個体群を選択し、この個体群の個体に対して遺伝的アルゴリズムによる遺伝的操作を行い、更に、この遺伝的操作における個体評価後の環境を推定して、この環境と事前に推定した環境とを比較し、この比較結果によって両者が異なる環境であったときに、評価後の個体を、同じく評価後に推定された環境に対応する個体群の所定の個体と入れ換えるようにしたので、実際の環境と異なる環境に対応する個体群の個体に遺伝的操作を行った場合でも、その結果を破棄せずに利用するようにしたので、複数の環境に適応した進化の可能性が増し、且つ、制御結果のサンプリングデータの有効利用にもなる。   According to the control parameter optimizing method of the present invention, for each environment in which the control condition changes dynamically, a plurality of individuals corresponding to each environment are prepared, and After estimating the environment to be applied in advance, select a population corresponding to the estimated environment, perform a genetic operation on the individuals in this population by a genetic algorithm, The environment after the evaluation is estimated, and this environment is compared with the environment estimated in advance. When the two environments are different according to the comparison result, the individual after the evaluation is replaced with the environment estimated after the evaluation. Replaced with a specific individual of the corresponding population, so that even if genetic operations were performed on individuals of the population corresponding to an environment different from the actual environment, the results were used without discarding In the possibility of evolution adapted to multiple environments increases, and, also the effective use of the sampling data of the control results.

また、請求項4記載の制御パラメータの最適化方法によれば、環境の変わり目においては、事前に推定される環境が間違う可能性が高くなるので、中間的な個体から成る個体群を生成するようにしたので、これにより安定した評価を得ることが可能となる。
また、請求項5記載の制御パラメータの最適化方法によれば、選択する特定の個体に最良の個体を含ませるようにしたので、適切な進化をし易くし最適化の速度をあげることが可能となる。
また、請求項6記載の制御パラメータの最適化方法によれば、一度評価した個体は再評価を行わないようにしたので、評価回数を減らすことが可能となり最適化の速度を上げることが可能となる。
Further, according to the control parameter optimizing method of the present invention, at the transition of the environment, there is a high possibility that the environment estimated in advance is wrong, so that the population of intermediate individuals is generated. Therefore, a stable evaluation can be obtained.
According to the control parameter optimizing method described in claim 5, the best individual is included in the specific individual to be selected, so that appropriate evolution can be facilitated and the speed of optimization can be increased. It becomes.
According to the control parameter optimizing method of the present invention, since the individual evaluated once is not re-evaluated, the number of evaluations can be reduced, and the speed of optimization can be increased. Become.

また、請求項7記載の制御パラメータの最適化方法によれば、更新処理時に所定回数以上生き残った個体は評価済みを示すフラグを無効にして再評価を行うようにしたので、淘汰されるべき個体をより確実に淘汰することが可能となる。
また、請求項8記載の制御パラメータの最適化方法によれば、前回の更新処理までの最良個体よりも良い評価値を持つ個体に対しては再評価を行うようにしたので、本来淘汰されるべき個体を個体群に戻さないことが可能となる。
また、請求項9乃至請求項11記載の制御パラメータの最適化方法は、制御装置を船舶に備わる船外機にしたものである。
According to the control parameter optimizing method of the present invention, individuals that have survived a predetermined number of times or more during the update process are re-evaluated by invalidating the flag indicating that evaluation has been completed. Can be more reliably eliminated.
According to the control parameter optimizing method of the present invention, an individual having an evaluation value better than that of the best individual up to the previous update process is re-evaluated. It is possible not to return the power individual to the population.
In the control parameter optimizing method according to the ninth to eleventh aspects, the control device is an outboard motor provided in the marine vessel.

ここで、請求項12乃至請求項22記載の制御パラメータの最適化装置は、それぞれ請求項1乃至請求項11記載の制御パラメータの最適化方法を実現する装置であり、その効果は重複するので記載を省略する。
また、請求項23及び請求項24記載の制御パラメータの最適化プログラムは、それぞれ請求項1及び請求項2記載の制御パラメータの最適化方法を実現するプログラムであり、その効果は重複するので記載を省略する。
Here, the control parameter optimizing devices according to claims 12 to 22 are devices for realizing the control parameter optimizing methods according to claims 1 to 11, respectively, and their effects are duplicated. Is omitted.
Further, the control parameter optimizing programs according to claims 23 and 24 are programs for realizing the control parameter optimizing methods according to claim 1 and claim 2, respectively. Omitted.

以下、本発明の実施の形態を図面に基づき説明する。図1乃至図15は、本発明に係るパラメータ最適化装置を備える航走制御システムの実施の形態を示す図である。
まず、本発明に係る航走制御システムの構成を図1に基づき説明する。図1は、本発明に係る航走制御システムの構成を示すブロック図である。
航走制御システム1は、船外機2と、航走制御装置3と、を含んだ構成となっている。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. 1 to 15 are diagrams showing an embodiment of a navigation control system including a parameter optimizing device according to the present invention.
First, the configuration of a navigation control system according to the present invention will be described with reference to FIG. FIG. 1 is a block diagram showing a configuration of a cruise control system according to the present invention.
The cruise control system 1 has a configuration including an outboard motor 2 and a cruise control device 3.

船外機2は、推進力調整装置として電子スロットル弁2aを備えている。
航走制御装置3は、定速航走制御部30と、パラメータ最適化装置31と、を含んだ構成となっている。
定速航走制御部30は、所定の入力情報に基づき目標エンジン回転数を算出する目標エンジン回転数算出モジュール30aと、当該算出された目標エンジン回転数に基づき電子スロットル弁開度を算出する電子スロットル弁開度算出モジュール30bと、を含んだ構成となっている。
The outboard motor 2 includes an electronic throttle valve 2a as a thrust adjusting device.
The cruise control device 3 has a configuration including a constant speed cruise control unit 30 and a parameter optimizing device 31.
The constant speed cruise control unit 30 includes a target engine speed calculation module 30a that calculates a target engine speed based on predetermined input information, and an electronic engine that calculates an electronic throttle valve opening based on the calculated target engine speed. And a throttle valve opening calculation module 30b.

目標エンジン回転数算出モジュール30aは、ファジイ推論システムによって構成されており、速度偏差(現在の速度と目標速度との差)、加速度を入力として目標エンジン回転数変化量を推論し、この推論結果に1つ前の算出処理における目標エンジン回転数を加えて現在の目標エンジン回転数を出力するものである。
電子スロットル弁開度算出モジュール30bは、目標エンジン回転数算出モジュール30aと同様にファジイ推論システムによって構成されており、エンジン回転数偏差(現在のエンジン回転数と目標エンジン回転数との差)と、エンジン回転数変化量とを入力として電子スロットル弁開度変化量を推論し、この推論結果に1つ前の算出処理における電子スロットル弁開度を加えて現在の電子スロットル弁解度として出力するものである。ここで、ファジイ推論システムのファジィテーブルは、熟練者の操船知識をもとに設計され、且つ、推論法には簡略推論法を用いており、この方法におけるファジィルールは実数値で表される。
The target engine speed calculation module 30a is configured by a fuzzy inference system, and infers a target engine speed change amount by using a speed deviation (difference between the current speed and the target speed) and an acceleration as inputs. The present target engine speed is output by adding the target engine speed in the immediately preceding calculation process.
The electronic throttle valve opening calculation module 30b is configured by a fuzzy inference system similarly to the target engine speed calculation module 30a, and includes an engine speed deviation (a difference between the current engine speed and the target engine speed), The electronic throttle valve opening change amount is inferred by using the engine rotational speed change amount as an input, and the electronic throttle valve opening degree in the immediately preceding calculation process is added to the inference result, and the result is output as the current electronic throttle valve resolution. is there. Here, the fuzzy table of the fuzzy inference system is designed based on the knowledge of maneuvering by a skilled person, and uses the simplified inference method as the inference method, and the fuzzy rules in this method are represented by real values.

パラメータ最適化装置31は、環境事前推定部31aと、遺伝的操作部31bと、個体群集合31cと、環境事後推定部31dと、を含んだ構成となっている。
環境事前推定部31aは、船舶の航走中に動的に変化する所定情報を入力として現在の船舶の航走状態(環境)を事前に推定して出力するものである。
遺伝的操作部31bは、GAを採用しており、電子スロットル弁開度算出モジュール30bにおける前件部あるいは後件部ファジイメンバシップ関数の規格化係数をコード化して個体を生成し、GAを用いて、これらの規格化係数の最適化を行うものである。ここで規格化係数とは、入出力情報の大きさを調整する係数を意味するものである。
The parameter optimizing device 31 has a configuration including an environment pre-estimation unit 31a, a genetic operation unit 31b, a population set 31c, and an environment post-estimation unit 31d.
The pre-environment estimating unit 31a is configured to input predetermined information that dynamically changes during the voyage of a ship as an input, and to estimate and output the current marine running state (environment) of the ship in advance.
The genetic operation unit 31b employs a GA, encodes a normalization coefficient of a fuzzy membership function of the antecedent part or the consequent part in the electronic throttle valve opening calculation module 30b, generates an individual, and uses the GA. Thus, these normalization coefficients are optimized. Here, the normalization coefficient means a coefficient for adjusting the size of input / output information.

個体群集合31cは、動的に変化する船舶の航走状態(環境)に対応して生成した個体群の集合である。遺伝的操作部31bでは、環境事前推定部31aによって推定された船舶の航走状態に対応する個体群を当該個体群集合31cから選択し、その個体群の個体に対してGAを適用することで規格化係数を最適化する。
環境事後推定部31dは、GAによる遺伝的操作を施した後で、船舶の航走中に動的に変化する所定情報を入力としてそのときの船舶の航走状態(環境)を推定するものである。
The population set 31c is a set of populations generated in accordance with the dynamically changing cruising state (environment) of the ship. The genetic operation unit 31b selects a population corresponding to the cruising state of the ship estimated by the environment pre-estimation unit 31a from the population set 31c, and applies GA to the individuals in the population. Optimize the normalization factor.
The environmental posterior estimating unit 31d estimates the cruising state (environment) of the vessel at that time by inputting predetermined information that dynamically changes during the cruising of the vessel after performing the genetic operation by the GA. is there.

以下、本システム1を電子スロットル弁装置を有する船外機を備えた船舶の定速航走制御に適用した場合の動作を図2乃至図8、図11及び図15(a)に基づき説明する。図2は、目標エンジン回転数算出モジュール30aにおいて目標エンジン回転数を算出するためのファジィルールの説明図であり、図3は、電子スロットル弁開度算出モジュール30bにおいて電子スロットル弁解度を算出するためのファジィルールの説明図であり、図4は、船舶が旋回時の適応度関数の景観を示す図である。   Hereinafter, an operation when the present system 1 is applied to constant-speed cruise control of a boat equipped with an outboard motor having an electronic throttle valve device will be described with reference to FIGS. 2 to 8, FIG. 11, and FIG. . FIG. 2 is an explanatory diagram of a fuzzy rule for calculating a target engine speed in the target engine speed calculation module 30a. FIG. 3 is a diagram for calculating an electronic throttle valve solvability in the electronic throttle valve opening calculation module 30b. FIG. 4 is a diagram showing a landscape of a fitness function when a ship makes a turn.

また、図5は、ステアリング操作に対する前の航走状況の持続時間を示す図であり、図6は、GAの初期個体として規格化係数の初期値を生成する際の生成範囲を示す図であり、図7は、単峰性正規分布交叉手法を示す図であり、図8は、単峰性正規分布交叉手法を用いて親個体から子個体を生成する様子を示す図であり、図10は、事後環境との評価に基づく個体の世代交代を示す図である。
また、図15(a)は、第1の実施の形態における個体のデータ構造を示す図である。
FIG. 5 is a diagram showing the duration of the previous cruising situation with respect to the steering operation, and FIG. 6 is a diagram showing the generation range when generating the initial value of the normalization coefficient as the initial individual of GA. 7 is a diagram showing a unimodal normal distribution crossover method, FIG. 8 is a diagram showing how a single individual is generated from a parent individual using a unimodal normal distribution crossover method, and FIG. FIG. 9 is a diagram showing generational change of individuals based on evaluation with a post-environment.
FIG. 15A is a diagram illustrating a data structure of an individual according to the first embodiment.

以下、本発明の第1の実施の形態を説明する。
まず、使用者は目標速度の設定を行う。目標速度は使用者が決定した任意の値を入力しても良いし、また、メーカが出荷段階で用意した複数の値の中から選択しても良い。目標速度が設定されると、次に、この速度に基づき目標エンジン回転数の初期値が設定されることになる。例えば、現在の船舶の航走速度が目標速度付近であるときは、現在のエンジン回転数が目標エンジン回転数として設定され、一方、現在の船舶の航走速度が目標速度付近で無いときは、予め設定された目標エンジン回転数の初期値を用いる。ここで、目標エンジン回転数の初期値は、使用者が決定した任意の値を入力しても良いし、また、メーカが出荷段階で用意した複数の値の中から選択しても良い。
Hereinafter, a first embodiment of the present invention will be described.
First, the user sets a target speed. As the target speed, an arbitrary value determined by the user may be input, or the target speed may be selected from a plurality of values prepared at the shipping stage by the manufacturer. After the target speed is set, an initial value of the target engine speed is set based on this speed. For example, when the current speed of the ship is near the target speed, the current engine speed is set as the target engine speed, while when the current speed of the ship is not near the target speed, An initial value of a preset target engine speed is used. Here, the initial value of the target engine speed may be an arbitrary value determined by the user, or may be selected from a plurality of values prepared at the time of shipment by the manufacturer.

目標エンジン回転数の初期値設定後は、実際の船舶の航走状態に応じて、図2に示すファジィルールに基づき、そのときの航走速度に応じた目標エンジン回転数を算出することになる。つまり、図2(a)に示すメンバシップ関数から速度偏差及び加速度の推論値を求め、これを図2(b)のファジィルールに当てはめて重みの平均を求め目標エンジン回転数の変化量を算出する。メンバシップ関数の速度偏差(目標速度と実際の速度との差)は、実際の速度の検出値から求め、加速度は検出された速度を演算して求める。図2(a)に示すように、速度偏差及び加速度に応じてメンバシップ関数から、プラス側の大小(PL、PS)及びマイナス側の大小(NL、NS)に対応した4つの値が求まり、これらを図2(b)に示すファジィルールの対応する4つの値に重み付けして平均値を算出する。これにより、目標エンジン回転数の変化量が求められる。この変化量を現在の目標エンジン回転数に加えることで、新たな目標エンジン回転数が求まる。   After setting the initial value of the target engine speed, the target engine speed corresponding to the running speed at that time is calculated based on the fuzzy rule shown in FIG. 2 according to the actual running state of the ship. . That is, the inferred values of the speed deviation and the acceleration are obtained from the membership functions shown in FIG. 2A, and the inferred values are applied to the fuzzy rules of FIG. I do. The speed deviation (difference between the target speed and the actual speed) of the membership function is obtained from the detected value of the actual speed, and the acceleration is obtained by calculating the detected speed. As shown in FIG. 2 (a), four values corresponding to the magnitudes on the plus side (PL, PS) and the magnitudes on the minus side (NL, NS) are obtained from the membership function according to the speed deviation and the acceleration. These are weighted to the corresponding four values of the fuzzy rule shown in FIG. 2B to calculate an average value. As a result, the amount of change in the target engine speed is obtained. By adding this change amount to the current target engine speed, a new target engine speed is obtained.

そして、目標エンジン回転数算出モジュール30aは、目標エンジン回転数を、電子スロットル弁開度算出モジュール30bに対して出力し、当該電子スロットル弁開度算出モジュール30bは、入力された目標エンジン回転数に基づきスロットル弁開度を算出する。ここで、電子スロットル弁開度算出モジュール30bも、目標エンジン回転数算出モジュール30aと同様にファジィ推論システムにより電子スロットル弁開度を算出する。つまり、目標エンジン回転数算出モジュール30aから目標エンジン回転数を取得すると、図3(a)に示すメンバシップ関数に基づき、エンジン回転数の検出値からエンジン回転数偏差の推論値を求め、また、エンジン回転数の変化量は、エンジン回転数の検出値から演算により求める。つまり、上記図2と同様に、メンバシップ関数の値から、図3(b)のファイジィルールの重み付けによる演算処理を行って電子スロットル弁開度の変化量が求められる。この変化量を現在の電子スロットル弁開度に加えることで、新たな電子スロットル開度が求まる。   Then, the target engine speed calculation module 30a outputs the target engine speed to the electronic throttle valve opening calculation module 30b, and the electronic throttle valve opening calculation module 30b outputs the target engine speed to the input target engine speed. The throttle valve opening is calculated based on the throttle valve opening. Here, the electronic throttle valve opening calculation module 30b also calculates the electronic throttle valve opening by a fuzzy inference system, similarly to the target engine speed calculation module 30a. That is, when the target engine speed is obtained from the target engine speed calculation module 30a, an inference value of the engine speed deviation is obtained from the detected value of the engine speed based on the membership function shown in FIG. The amount of change in the engine speed is obtained by calculation from the detected value of the engine speed. That is, similarly to FIG. 2, the amount of change in the electronic throttle valve opening is obtained from the value of the membership function by performing arithmetic processing by weighting the fuzzy rule of FIG. 3B. By adding this change amount to the current electronic throttle valve opening, a new electronic throttle opening is obtained.

このようにして新たな電子スロットル弁解度が算出されると、定速航走制御部30は、この算出された新たな電子スロットル弁開度に一致するように電子スロットル弁装置2aの制御を行う。
本実施の形態においては、パラメータ最適化装置31の遺伝的操作部31bにおいて、電子スロットル弁開度算出モジュール30bにおける前件部あるいは後件部ファジィメンバシップ関数の規格化係数をコード化して個体を生成し、GAを用いて、これら規格化係数の最適化を行う。ここで、各個体の評価は、本実施の形態においては、ある時間内の目標エンジン回転数に対する現在のエンジン回転数の偏差がゼロに近づくほど、そして、エンジン回転数変動が小さいほど適応度が良くなるように設定された適応度関数(以下に示す式(1))に従って行うようになっている。
When the new electronic throttle valve solvability is calculated in this way, the constant speed cruise control unit 30 controls the electronic throttle valve device 2a so as to match the calculated new electronic throttle valve opening. .
In the present embodiment, the genetic operation unit 31b of the parameter optimizing device 31 encodes the normalization coefficient of the fuzzy membership function of the antecedent or the consequent part in the electronic throttle valve opening calculation module 30b to identify the individual. Generate and optimize these normalization coefficients using GA. Here, in the present embodiment, the fitness is evaluated as the deviation of the current engine speed from the target engine speed within a certain time approaching zero and the variation in the engine speed is smaller in this embodiment. This is performed according to a fitness function (formula (1) shown below) set to be better.

F=Σ(|N’−N|+ΔN)・Δt・・・・・・・・・(1)
ここで、式(1)においてNはエンジン回転数、N’はある時間内の目標エンジン回転数、ΔNはエンジン回転数の変動数、Δtは変化時間である。式(1)により、電子スロットル弁開度算出モジュールの規格化係数は目標となるエンジン回転数制御特性に向けて自動的に最適化され、使用環境や艇体が変化した場合においても、最適なエンジン回転数制御特性が得られるようになる。
F = Σ (| N′−N | + ΔN) · Δt (1)
Here, in equation (1), N is the engine speed, N 'is the target engine speed within a certain time, ΔN is the number of changes in the engine speed, and Δt is the change time. According to the equation (1), the normalization coefficient of the electronic throttle valve opening calculation module is automatically optimized toward the target engine speed control characteristic, and even when the use environment and the hull change, the optimum coefficient is obtained. The engine speed control characteristic can be obtained.

ここで問題となるのが、上記エンジン回転数制御特性に対する最適な規格化係数は環境によって変化するもので、具体的には、旋回時に発生する艇体の抵抗変化によってエンジン回転数制御の適応度関数の景観が変化し、これに伴って最適な規格化係数の位置が変化する点である。
図4に示すように、式(1)において旋回の大きさごとに後件部メンバシップ関数の規格化係数を変化させた場合の適応度関数の景観は、直進状態では追従性よりも変動の悪化を抑えるために規格化係数を小さくすると適応度が良くなることがわかり、一方、旋回半径が小さくなると、艇体の受ける抵抗が大きくなるために、変動よりも追従性の悪化を抑えるために規格化係数を大きくすると適応度が良くなることがわかる。この他にも、前件部メンバシップ関数の規格化係数2つを変化させた場合も、同様に考えられる。
The problem here is that the optimum normalization coefficient for the engine speed control characteristic varies depending on the environment. Specifically, the adaptability of the engine speed control is determined by the change in the resistance of the hull generated during turning. The point is that the landscape of the function changes, and the position of the optimum normalization coefficient changes accordingly.
As shown in FIG. 4, the landscape of the fitness function when the normalization coefficient of the membership function of the consequent part is changed for each magnitude of the turn in the equation (1) shows that the change in the fitness function is less than the followability in the straight traveling state. It can be seen that if the normalization coefficient is reduced to suppress the deterioration, the fitness improves, while if the turning radius decreases, the resistance received by the hull increases. It can be seen that the larger the normalization coefficient, the better the fitness. In addition, the case where two normalization coefficients of the membership function of the antecedent part are changed is similarly considered.

本実施の形態においては、上記の点に着目し、旋回状態を図中40a〜40cの3つの環境(直進状態40a、緩旋回40b、急旋回40c)に分け、パラメータ最適化装置31において、前記40a〜40cにそれぞれに対応する3つの個体群P1、P2、P3から成る個体群集合31cを生成した。
従って、各個体のデータ構造は、図15(a)に示すように、上記した3つの旋回状態にそれぞれ対応した規格化係数1〜3と、個体の評価値と、から構成される。
In the present embodiment, focusing on the above points, the turning state is divided into three environments 40a to 40c in the drawing (straight running state 40a, gentle turning 40b, and sharp turning 40c). respectively produces three populations P 1, P 2, populations set 31c consisting of P 3 corresponding to the 40a to 40c.
Therefore, as shown in FIG. 15A, the data structure of each individual is composed of the normalization coefficients 1 to 3 respectively corresponding to the above three turning states and the evaluation value of the individual.

ここで、環境変化を表すパラメータとして、ある時刻tの速度Vtとエンジン回転数Ntの比を推進効率Stとして、以下の式(2)を定義するものとする。
t=Vt/Nt・・・・・・・・・(2)
つまり、旋回状態が直進状態40a、緩旋回状態40b、急旋回状態40cと遷移するにつれて艇体の接水面積が増加し、エンジンの負荷が変化するため、同じ速度でもエンジン回転数が上昇することになり、旋回状態によって推進効率が変わることになる。そこで、本実施の形態においては、次に述べる環境事前推定部31a及び環境事後推定部31dによって旋回状態が動的に変化しても最適なエンジン回転数制御特性が得られるようにしている。
Here, as a parameter representing the environmental change, it is assumed that a certain time t velocity V t and the engine speed N t ratio propulsive efficiency S t of, define the following equation (2).
S t = V t / N t ········· (2)
That is, as the turning state transits to the straight traveling state 40a, the gentle turning state 40b, and the sharp turning state 40c, the water contact area of the hull increases, and the engine load changes, so that the engine speed increases even at the same speed. , And the propulsion efficiency changes depending on the turning state. Therefore, in the present embodiment, an optimum engine speed control characteristic is obtained even when the turning state dynamically changes by the environment pre-estimation unit 31a and the environment post-estimation unit 31d described below.

環境事前推定部31aは、旋回の要因であるステアリング操作量を入力として次の環境を予測する。基本的にはステアリング操作量から旋回の状況を判断することが可能であるが、実際には、ステアリング操作が旋回動作に反映されるまでには時間遅れが存在し、また、旋回を行うと速度低下や波などが発生し、ステアリングを直進に戻しても推進効率で見ると旋回によって生じた抵抗変化が持続し、単純にステアリング操作量で環境を区別しようとすると抵抗変化の持続により評価が上手くいかないという問題がある。抵抗変化の持続時間は旋回の時間と関係があるため、本実施の形態においては、ステアリング操作量から環境変化の持続時間を推定することで次の環境を予測することとする。   The pre-environment estimating unit 31a predicts the next environment by inputting the steering operation amount that is a factor of turning. Basically, it is possible to determine the turning situation from the amount of steering operation, but in reality, there is a time delay before the steering operation is reflected in the turning operation. If the steering returns to straight ahead, the change in resistance caused by turning will continue when viewed in terms of propulsion efficiency.If the environment is simply distinguished by the amount of steering operation, the evaluation will be successful due to the sustained change in resistance. There is a problem of not going. Since the duration of the resistance change is related to the turn time, in the present embodiment, the next environment is predicted by estimating the duration of the environment change from the steering operation amount.

具体的には、以下に示す式(3)〜(6)に従って、持続時間を算出する。
2=ΣAt・Δt2・・・・・・・・・(3)
3=ΣAt・Δt3・・・・・・・・・(4)
但し、Atはステアリング操作量、Δt2はAtが緩旋回操作の閾値A2を上回っている時間、I2はその積分値、Δt3はAtが急旋回操作の閾値A3を上回っている時間、I3はその積分値である。
Specifically, the duration is calculated according to the following equations (3) to (6).
I 2 = ΣA t · Δt 2 (3)
I 3 = ΣA t · Δt 3 (4)
However, A t is a steering operation amount, Delta] t 2 is the time exceeds the threshold value A 2 of the slow turning operation is A t, I 2 is the integrated value, Delta] t 3 is greater than the threshold value A 3 of A t suddenly turning operation During this time, I 3 is its integral value.

つまり、積分値Iは、ステアリング操作量Atとサンプリング時間間隔Δtとの積をAtが閾値Aを上回っている間加算することで算出することができる。
次に、事前実験から求めた線形近似の式から環境変化の持続時間は以下の式(5)及び式(6)から算出することができる。
2=α2・I2+β2・・・・・・・・・(5)
3=α3・I3+β3・・・・・・・・・(6)
但し、α2、α3及びβ2、β3は、それぞれ緩旋回操作及び急旋回動作における係数であり、T2及びT3は、それぞれ緩旋回操作及び急旋回動作における持続時間である。
In other words, the integral value I can be calculated by adding between the product of the steering operation amount A t and the sampling time interval Delta] t A t exceeds the threshold value A.
Next, the duration of the environmental change can be calculated from the following equations (5) and (6) from the linear approximation equation obtained from the preliminary experiment.
T 2 = α 2 · I 2 + β 2 (5)
T 3 = α 3 · I 3 + β 3 (6)
Here, α 2 , α 3 and β 2 , β 3 are coefficients in the gentle turning operation and the sharp turning operation, respectively, and T 2 and T 3 are the durations in the gentle turning operation and the sudden turning operation, respectively.

つまり、持続時間Tは、係数αと上記式(3)、(4)で求められる積分値Iとの積に、係数βを加算することで算出することができる。
上記式(3)〜(6)を用いることで、ステアリング操作量から環境変化の持続時間を推定することが可能となり、例えば、図5に示すように、緩旋回操作を一定時間行った後にステアリングを直進に戻しても、環境変化の持続時間内であれば引き続き緩旋回状態の環境として評価が行われ、同様に、図示しないが、急旋回操作を一定時間行った後にステアリングを直進に戻しても、環境変化の持続時間内であれば引き続き急旋回状態の環境として評価が行われる。
That is, the duration T can be calculated by adding the coefficient β to the product of the coefficient α and the integral value I obtained by the above equations (3) and (4).
By using the above equations (3) to (6), it is possible to estimate the duration of the environmental change from the steering operation amount. For example, as shown in FIG. Even if it is returned to straight ahead, if it is within the duration of the environmental change, the environment is continuously evaluated as a gentle turning state, and similarly, although not shown, the steering is returned to straight after performing a sharp turning operation for a certain period of time. Also, the evaluation is continuously performed as the environment of the sharp turning state within the duration of the environmental change.

また、環境事後推定部31dは、遺伝的操作部31bにおける評価終了後に、評価中の推進効率Stを算出し、旋回状態の閾値S2、S3と比較して実際の評価中の環境を推定する。具体的には、「St>S2」であれば環境は「直進状態」とし、「S3<St≦S2」であれば環境は「緩旋回状態」とし、「St≦S3」であれば環境は「急旋回状態」として推定する。 The environmental posteriori estimation section 31d, after the end of evaluation in the genetic manipulation unit 31b, calculates the thrust efficiency S t being evaluated, the environment of the actual rating compared with a threshold S 2, S 3 of the turning state presume. Specifically, the environment is a "straight-running state" if "S t> S 2" environment if it is "S 3 <S t ≦ S 2" is set to "slow turning condition", "S t ≦ S If “ 3 ”, the environment is estimated as “sudden turning state”.

更に、上記したパラメータ最適化装置31の遺伝的操作部31bにおけるGAによる実動作環境下の最適化処理について具体的に説明する。
遺伝的操作部31bでは、図6に示すように、始めに規格化係数の初期値を、極端な値にならない範囲内で乱数によって決定し、これを初期個体とする処理が行われる。そして、図6に示すようにこの複数の初期個体から構成される個体群(第1世代)を環境に対応した数だけ生成する。つまり、本実施の形態においては、直進状態、緩旋回状態及び急旋回状態の3つの環境に対応した個体群を生成することになる。
Further, the optimization process in the real operation environment by the GA in the genetic operation unit 31b of the parameter optimization device 31 will be specifically described.
In the genetic operation unit 31b, as shown in FIG. 6, first, an initial value of the normalization coefficient is determined by a random number within a range that does not become an extreme value, and a process of setting the initial value as an initial individual is performed. Then, as shown in FIG. 6, an individual group (first generation) composed of the plurality of initial individuals is generated in a number corresponding to the environment. That is, in the present embodiment, individual groups corresponding to three environments of a straight traveling state, a gentle turning state, and a sharp turning state are generated.

次に、環境事前推定部31aでは、使用者によるステアリング操作量から上記した環境変化の持続時間を予測することで次の遺伝的操作を行う環境を推定し、事前推定環境番号Epriを決定する。
そして、環境Epriに割り当てられた個体群P_Epriを選択し、これに遺伝的操作を施す。この遺伝的操作においては、図8に示すように、まず、個体群P_Epriから親個体を選択することになるが、本実施の形態において、親個体は、個体群P_Epriから最良の評価値を持つ最良個体1つとランダムに選択された個体1つの計2つを選択することになる。
Next, the environment pre-estimation unit 31a estimates the environment for performing the next genetic operation by estimating the duration of the above-described environment change from the amount of steering operation performed by the user, and determines the pre-estimated environment number E pri . .
Then, select the assigned population P_E pri environmentally E pri, this subjected to genetic manipulation. In this genetic operation, as shown in FIG. 8, first, a parent individual is selected from the population P_E pri . In this embodiment, the parent individual is the best evaluation value from the population P_E pri. In this case, a total of two, one of the best individual having and the one selected at random.

そして、次に、選択された親個体2つに対して交叉処理を行い、それぞれの親個体に対応する子個体2つを生成し、図8に示すように、選択された親個体2つとこれら子個体2つから成る家族個体F_Epriを得る。本実施の形態において、各個体の値は、固定小数点数であるために、図7に示す、実数値GAの代表的交叉手法である単峰性正規分布交叉(Unimodal Normal DistributionCrossover : UNDX)を用いる。ここで、単峰性正規分布交叉では、対象問題における設計変数間の依存関係に沿って子個体を生成することができる。 Next, crossover processing is performed on the two selected parent individuals to generate two child individuals corresponding to each parent individual, and as shown in FIG. get the family individual F_E pri consisting of child individual two. In the present embodiment, since the value of each individual is a fixed-point number, a unimodal normal distribution crossover (UNDX) shown in FIG. 7 which is a representative crossover method of the real-valued GA is used. . Here, in the unimodal normal distribution crossover, offspring individuals can be generated along the dependencies between design variables in the target problem.

単峰性正規分布交叉によって子個体が生成されると、更に、これらにより構成される家族個体F_Epriの各個体の評価を行う。
更に、評価された家族個体は、評価値の良い順に、個体群中の元の親個体と置き換えられる。
そして、個体の評価が終了した時点で、環境事後推定部31dは、個体評価中の推進効率を確認し、これに基づき事後環境を推定し、事後環境推定番号Epostを決定する。Epostが決定した時点で、Epriの環境とEpostの環境とを比較し、Epri=Epost、すなわち事前に推定された環境が正しかった場合は、そのままEpostに対応する個体群であるF_Epostに評価個体を返し、世代交代を行う。
When unimodal normal distribution offspring individuals by crossover is generated, further, the evaluation of each individual constituted family individual f_e pri these.
Further, the evaluated family individuals are replaced with the original parent individuals in the population in descending order of the evaluation value.
Then, when the evaluation of the individual is completed, the environmental posterior estimating unit 31d confirms the propulsion efficiency during the individual evaluation, estimates the posterior environment based on the efficiency, and determines the posterior environment estimation number E post . When E post is determined, the environment of E pri and the environment of E post are compared, and if E pri = E post , that is, if the environment estimated in advance is correct, the population corresponding to E post is used as it is. An evaluation individual is returned to a certain F_E post , and generation change is performed.

一方、Epri≠Epost、すなわち事前に推定された環境が誤りであった場合は、環境事後推定部31dにおいて推定された環境に対応した個体群中の家族個体の評価されていない個体に代入する。
ここで、事前に推定した環境と事後に推定した環境とが異なっていたときは、図10(a)に示す流れで処理が行われることになる。まず、環境事前推定部31aは、環境が次に環境1に変化すると推定し、遺伝的操作部31bは、評価する個体として個体群集合31cから個体群1の家族個体を選択する(図中(1))。次に、評価を行うために、定速航走制御部30のパラメータを、個体の遺伝子としてコード化されているパラメータに書き換える(図中(2))。そして、実際に定速航走制御部30を動作させ、定速航走制御部30の性能を評価する(図中(3))。更に、評価後、環境事後推定部は評価中の環境は環境2であったと推定し、個体群2の家族個体を選択する(図中(4))。最後に、評価済みの個体を、評価待ちの家族個体と入れ換える(図中(5))。
On the other hand, if E pri ≠ E post , that is, if the environment estimated in advance is incorrect, substitute it into an unevaluated individual of a family individual in the population corresponding to the environment estimated by the environmental posterior estimating unit 31d. I do.
Here, when the environment estimated in advance is different from the environment estimated afterwards, the processing is performed according to the flow illustrated in FIG. First, the pre-environment estimation unit 31a estimates that the environment will change to environment 1 next, and the genetic operation unit 31b selects a family individual of the population 1 from the population set 31c as the individual to be evaluated (( 1)). Next, in order to perform evaluation, the parameters of the constant-speed cruise control unit 30 are rewritten to parameters coded as individual genes ((2) in the figure). Then, the cruise control unit 30 is actually operated to evaluate the performance of the cruise control unit 30 ((3) in the figure). Further, after the evaluation, the environmental posterior estimating unit estimates that the environment under evaluation is Environment 2, and selects a family individual of the population 2 ((4) in the figure). Finally, the evaluated individual is replaced with a family individual waiting for evaluation ((5) in the figure).

つまり、事前推定した環境と事後推定した環境が異なっていた場合は、評価した個体をそのまま元の環境に対応する個体群に戻すことは出来ない。これは、同じ個体でもそれぞれの環境から得られる評価値が異なるために、例えば、環境1で優秀な個体が、環境2で評価された場合に悪い評価値を得た後、環境1に対応する個体群に戻されると淘汰されてしまい、また、環境2で本来淘汰されるべき個体が、環境1で評価された場合に良い評価値を得たのち、環境2に対応する個体群に戻されると何時までも淘汰されないという問題が生じるからである。そのため、通常はそういった個体は破棄することが考えられるが、探索初期はサンプリングの機会を無駄にすると探索が進まないといった問題が発生する。そこで、図10aに示すような手法を用いることで、探索初期のサンプリングの機会を無駄にすることがなくなり、さらに間違った環境で評価された個体も世代交代の候補となるため、両方で優れた評価値を持つ個体が選択される可能性が増加する。   In other words, if the environment estimated in advance and the environment estimated after are different, the evaluated individual cannot be returned to the individual group corresponding to the original environment. This is because, even for the same individual, evaluation values obtained from the respective environments are different. For example, when an individual excellent in environment 1 obtains a bad evaluation value when evaluated in environment 2, it corresponds to environment 1. When returned to the population, they are eliminated. In addition, individuals that should be originally eliminated in environment 2 obtain good evaluation values when evaluated in environment 1 and then returned to the population corresponding to environment 2. This is because there is a problem that it is not culled forever. Therefore, such individuals are usually considered to be discarded, but a problem arises in that the search does not proceed if sampling opportunities are wasted in the early stage of the search. Therefore, by using the method as shown in FIG. 10A, the chance of sampling at the initial stage of the search is not wasted, and the individual evaluated in the wrong environment is also a candidate for the generation change. The possibility that an individual having an evaluation value is selected increases.

このようにして、最適化を繰り返すことで、次第に適応度の良い個体、すなわち適応度の良い規格化係数が選択され、最終的に複数の環境に応じたエンジン回転数制御特性を獲得することが可能となる。
また、図10(b)に示すように、環境の変わり目に環境の前後の個体を親とする中間的な個体を生成しておくことで、事前推定のミスに予め対処する方法もある。その処理の流れを説明すると、まず、環境事後推定部31dは、先の評価中の環境が環境2であったと推定したとする(図中(1))。環境事後推定部31dは、環境が次に環境1に変化すると推定したとする。ここで、遺伝的操作部31bは、先の環境2からの変わり目であると判断し、個体群1、2の家族個体中の最良個体をそれぞれ選択する(図中(2))。そして、最良個体同士を交叉させた個体の評価を行うために、定速航走制御部30のパラメータを、個体の遺伝子としてコード化されているパラメータに書き換える(図中(3))。その後、実際に定速航走制御部30を動作させ、定速航走制御部30の性能を評価する(図中(4))。更に、評価後、環境事後推定部は評価中の環境は環境1であったと推定し、個体群1の家族個体を選択する(図中(5))。最後に、評価済みの個体を、評価待ちの家族個体と入れ換える(図中(6))。
In this way, by repeating the optimization, an individual with good fitness, that is, a normalization coefficient with good fitness is gradually selected, and finally, the engine speed control characteristics corresponding to a plurality of environments can be obtained. It becomes possible.
Further, as shown in FIG. 10B, there is a method of coping with a mistake in the pre-estimation in advance by generating an intermediate individual whose parents are individuals before and after the environment at the transition of the environment. The flow of the process will be described. First, it is assumed that the environmental posterior estimating unit 31d has estimated that the environment under evaluation was the environment 2 ((1) in the figure). It is assumed that the post-environment estimation unit 31d estimates that the environment will change to the environment 1 next. Here, the genetic operation unit 31b determines that this is a change from the previous environment 2, and selects the best individual among the family individuals of the individual groups 1 and 2 ((2) in the figure). Then, in order to evaluate the individual in which the best individuals cross each other, the parameters of the constant-speed cruise control unit 30 are rewritten to parameters coded as individual genes ((3) in the figure). Thereafter, the constant speed cruise control unit 30 is actually operated to evaluate the performance of the constant speed cruise control unit 30 ((4) in the figure). Further, after the evaluation, the environmental posterior estimating unit estimates that the environment under evaluation was Environment 1, and selects a family individual of the individual group 1 ((5) in the figure). Finally, the evaluated individual is replaced with a family individual waiting for evaluation ((6) in the figure).

つまり、環境の変わり目は、前後の環境の特徴を合わせ持つ領域であるので、事前推定のミスが発生する可能性が高く、上記図10(a)の説明で述べたような問題が頻発する。そこで、環境の変わり目を検出した場合はそれぞれの環境で優れた評価値を持つ個体を親個体とする中間的な子個体を生成すれば、どちらの環境でも優れた評価値を得られると考えられる.そこで、上記図10(b)の説明において述べた手法を用いることで、事前推定のミスに予め対処することが出来る。   That is, since the transition of the environment is a region having the characteristics of the preceding and following environments, there is a high possibility that a mistake in the pre-estimation occurs, and the problem described in the description of FIG. 10A frequently occurs. Therefore, when a change in environment is detected, it is considered that an excellent evaluation value can be obtained in either environment by generating an intermediate child individual whose parent is an individual having an excellent evaluation value in each environment. . Therefore, by using the method described in the description of FIG. 10B, it is possible to deal with a mistake in the preliminary estimation in advance.

更に、図9に基づき、定速航走制御部30における動作処理の流れを説明する。図9は、定速航走制御部30における動作処理を示すフローチャートである。
図9に示すように、まずステップS100に移行し、目標速度の設定を行いステップS102に移行する。ここで、目標速度は、上記したように、使用者が決定した任意の値を入力しても良く、また、メーカが出荷段階で用意した複数の値の中から選択しても良い。
Furthermore, the flow of the operation processing in the constant-speed cruise control unit 30 will be described with reference to FIG. FIG. 9 is a flowchart showing an operation process in the constant-speed cruise control unit 30.
As shown in FIG. 9, the process first proceeds to step S100, sets the target speed, and proceeds to step S102. Here, the target speed may be an arbitrary value determined by the user as described above, or may be selected from a plurality of values prepared by the manufacturer at the time of shipment.

ステップS102では、目標エンジン回転数の初期値を設定してステップS104に移行する。ここで、目標エンジン回転数の初期値は、上記したように、使用者が決定した任意の値を入力しても良く、また、メーカが出荷段階で用意した複数の値の中から選択しても良い。
ステップS104では、目標エンジン回転数算出モジュール30aによって、上記したようにファジィ推論システムを用いて、目標エンジン回転数を算出して、算出結果を電子スロットル弁開度算出モジュール30bに入力してステップS106に移行する。
In step S102, an initial value of the target engine speed is set, and the process proceeds to step S104. Here, the initial value of the target engine speed may be an arbitrary value determined by the user as described above, or may be selected from a plurality of values prepared by the manufacturer at the shipping stage. Is also good.
In step S104, the target engine speed is calculated by the target engine speed calculation module 30a using the fuzzy inference system as described above, and the calculation result is input to the electronic throttle valve opening calculation module 30b. Move to

ステップS106では、電子スロットル弁開度算出モジュール30bによって、前記入力された目標エンジン回転数に基づき、上記したように、ファジィ推論システムを用いて目標エンジン回転数に応じた電子スロットル弁開度を算出してステップS108に移行する。
ステップS108では、定速航走制御部30によって、算出された電子スロットル弁開度に基づき船外機2の電子スロットル弁装置2aを制御してステップS110に移行する。
In step S106, the electronic throttle valve opening calculation module 30b calculates the electronic throttle valve opening corresponding to the target engine speed using the fuzzy inference system based on the input target engine speed as described above. Then, control proceeds to a step S108.
In step S108, the constant-speed cruise control unit 30 controls the electronic throttle valve device 2a of the outboard motor 2 based on the calculated electronic throttle valve opening, and then proceeds to step S110.

ステップS110では、航走制御がOFFになっているか否かを判定し、OFFになっていると判定された場合(Yes)はステップS112移行し、そうでない場合(No)はステップS104に移行する。
ステップS112に移行した場合は、スロットル開度を検出して処理を終了する。
更に、図11に基づき、第1の実施の形態におけるパラメータ最適化装置31の動作処理の流れを説明する。図11は、パラメータ最適化装置31の動作処理を示すフローチャートである。
In step S110, it is determined whether or not the cruise control is OFF. If it is determined that the cruise control is OFF (Yes), the process proceeds to step S112, and if not (No), the process proceeds to step S104. .
If the process has proceeded to step S112, the throttle opening is detected and the process ends.
Further, the flow of the operation processing of the parameter optimizing device 31 according to the first embodiment will be described with reference to FIG. FIG. 11 is a flowchart showing the operation processing of the parameter optimization device 31.

図11に示すように、まずステップS200に移行し、規格化係数の初期値を、上記したように極端な値にならない範囲内で乱数によって決定しステップS202に移行する。
ステップS202では、環境事前推定部31aにおいて、上記したように旋回の要因であるステアリング操作量を入力として、環境変化の持続時間を推定することで、事前の環境(Epri)を推定してステップS204に移行する。
As shown in FIG. 11, first, the process proceeds to step S200, the initial value of the normalization coefficient is determined by a random number within a range that does not become an extreme value as described above, and the process proceeds to step S202.
In step S202, in advance, the environment (E pri ) is estimated by estimating the duration of the environmental change by inputting the steering operation amount, which is the factor of the turning, as described above, in the environment preliminary estimating unit 31a. The process moves to S204.

ステップS204では、環境に対応した家族個体群F_Epriに未評価の個体が存在するか否かを判定し、未評価個体が存在しない場合(Yes)はステップS206に移行し、未評価個体が存在する場合(No)はS210に移行する。
ステップS206に移行した場合は、遺伝的操作部31bにおいて、上記生成された個体群集合31cのうち環境に対応した個体群P_Epriの中から、親個体を、個体群中の最良個体とランダムに選択された個体の2個体選択しステップS208に移行する。
In step S204, to determine whether there unevaluated individuals in family population f_e pri for environments, if unrated individual does not exist (Yes), the process moves to step S206, there unevaluated individuals If yes (No), the process moves to S210.
When the process proceeds to step S206, in the genetic manipulation section 31b, from a population P_E pri for environments among the generated population set 31c, the parent individual, the best individual and random in the population Two of the selected individuals are selected, and the process proceeds to step S208.

ステップS208では、選択された親個体に対して、上記したように単峰性正規分布交叉手法を用いた交叉処理を行い、2つの個体を生成して家族個体群F_Epriを形成してステップS210に移行する。
ステップS210では、家族個体群F_Epriの未評価個体(親個体を含む)を定速航走制御部30に伝送してステップS212に移行する。
In step S208, the parent individuals selected, performs a crossover process with monomodal normal distribution crossover technique as described above, the step to form a product to families populations f_e pri two individuals S210 Move to
In step S210, unrated individual family population f_e pri (including parent individuals) was transferred to the constant-speed cruising control unit 30 proceeds to step S212.

ステップS212では、上記したように遺伝的操作部31bにおいて、未評価個体について電子スロットル弁制御を行うことにより算出された評価値を取得したか否かを判定し、取得したと判定された場合(Yes)はステップS214に移行し、そうでない場合(No)は取得するまで待機する。
ステップS214に移行した場合は、個体の評価が終了した時点で、環境事後推定部31dによって、推進効率を入力としてそのときの環境(Epost)を推定してステップS216に移行する。
In step S212, as described above, the genetic operation unit 31b determines whether or not the evaluation value calculated by performing the electronic throttle valve control on the unevaluated individual has been obtained. If it is determined that the evaluation value has been obtained ( (Yes) moves on to step S214, otherwise (No) stands by until acquisition.
When the process proceeds to step S214, when the evaluation of the individual is completed, the environment (E post ) at that time is estimated by the environment ex post estimation unit 31d using the propulsion efficiency as an input, and the process proceeds to step S216.

ステップS216では、事前環境(Epri)と事後環境(Epost)とが等しいか否かを判定し、等しいと判定された場合(Yes)はステップS218に移行し、そうでない場合(No)はステップS220に移行する。
ステップS218に移行した場合は、上記したように、家族個体群F_Epostに評価済みの個体を返す操作を行いステップS222に移行する。
In step S216, it is determined whether or not the pre-environment (E pri ) and the post-environment (E post ) are equal. If it is determined that they are equal (Yes), the process proceeds to step S218; Move to step S220.
When the process proceeds to step S218, an operation of returning the evaluated individual to the family population F_E post is performed as described above, and the process proceeds to step S222.

一方、ステップS220に移行した場合は、上記したように、環境事後推定部31dにおいて推定された環境に対応した家族個体群F_Epostのうち未評価の個体と評価済みの個体を入れ換えてステップS222に移行する。
ステップS222では、遺伝的操作部31bによって、家族個体群F_Epostに未評価の個体が存在するか否かを判定し、未評価個体が存在しない場合(Yes)はステップS224に移行し、未評価個体が存在する場合(No)はS202に移行する。
On the other hand, when the process proceeds to step S220, as described above, among the family population F_E post corresponding to the environment estimated by the environmental posterior estimating unit 31d, the unevaluated individual and the evaluated individual are replaced, and the process proceeds to step S222. Transition.
In step S222, it is determined by the genetic operation unit 31b whether or not an unevaluated individual exists in the family population F_E post. If there is no unevaluated individual (Yes), the process proceeds to step S224, and the unevaluated individual is determined. If an individual exists (No), the process proceeds to S202.

ステップS224に移行した場合は、家族個体群F_Epostの個体を評価値の小さい順に並べ替えてステップS226に移行する。
ステップS226では、遺伝的操作部31bによって、家族個体群F_Epostの評価値のよい上位2個体を個体群P_Epostの親個体があった場所に戻してステップS228に移行する。
When the process proceeds to step S224, the individuals of the family population F_E post are rearranged in ascending order of the evaluation value, and the process proceeds to step S226.
In step S226, the genetic operation unit 31b returns the top two individuals with good evaluation values of the family population F_E post to the place where the parent individuals of the population P_E post existed, and proceeds to step S228.

ステップS228では、遺伝的操作部31bによって、最適化が終了したか否かを判定し、終了したと判定された場合(Yes)は処理を終了し、そうでない場合(No)はステップS202に移行する。
更に、図12及び図15(b)に基づき、本発明の第2の実施の形態におけるパラメータ最適化装置31の動作処理について説明する。図12は、第2の実施の形態におけるパラメータ最適化装置31の動作処理を示すフローチャートであり、図15(b)は、第2の実施の形態における個体のデータ構造を示す図である。
In step S228, the genetic operation unit 31b determines whether or not the optimization has been completed. If it is determined that the optimization has been completed (Yes), the process ends. If not (No), the process proceeds to step S202. I do.
Further, an operation process of the parameter optimizing device 31 according to the second embodiment of the present invention will be described based on FIG. 12 and FIG. FIG. 12 is a flowchart illustrating an operation process of the parameter optimizing device 31 according to the second embodiment, and FIG. 15B is a diagram illustrating a data structure of an individual according to the second embodiment.

本実施の形態においては、パラメータ最適化装置31において、一度評価された個体に対して評価済みフラグを有効にし(評価フラグの値を1にする)、以降の最適化処理においては、評価済みフラグが有効状態の個体に対して評価を行わずに以前の評価値をそのまま保持し、この保持された評価値を用いて最適化処理を行うようになっている。
従って、本実施の形態において、個体のデータ構造は、図15(b)に示すように、上記した旋回状態にそれぞれ対応した3つの規格化係数1〜3と、評価値と、評価済みフラグ値と、を含んだ構成となっている。
In the present embodiment, the parameter optimization device 31 enables the evaluated flag for the individual evaluated once (sets the value of the evaluation flag to 1), and in the subsequent optimization processing, the evaluated flag is used. Does not evaluate the individual in the effective state, retains the previous evaluation value as it is, and performs optimization processing using the retained evaluation value.
Therefore, in the present embodiment, as shown in FIG. 15B, the data structure of the individual includes three normalization coefficients 1 to 3 respectively corresponding to the above-described turning state, an evaluation value, and an evaluated flag value. And is included.

なお、上記以外の構成及び動作については、上記した第1の実施の形態と同様であるので説明を省略する。
更に、図12に基づき、第2の実施の形態におけるパラメータ最適化装置31の動作処理の流れを説明する。
図12に示すように、まずステップS400に移行し、規格化係数の初期値を、上記したように極端な値にならない範囲内で乱数によって決定し、且つ、各個体の評価済みフラグを無効にして(評価済みフラグの値を0にする)ステップS402に移行する。
The configuration and operation other than those described above are the same as those in the above-described first embodiment, and a description thereof will not be repeated.
Further, a flow of operation processing of the parameter optimizing device 31 according to the second embodiment will be described with reference to FIG.
As shown in FIG. 12, the process first proceeds to step S400, where the initial value of the normalization coefficient is determined by a random number within a range that does not become an extreme value as described above, and the evaluated flag of each individual is invalidated. (The value of the evaluated flag is set to 0), and the process proceeds to step S402.

ステップS402では、環境事前推定部31aにおいて、上記したように旋回の要因であるステアリング操作量を入力として、環境変化の持続時間を推定することで、事前の環境(Epri)を推定してステップS404に移行する。
ステップS404では、環境に対応した家族個体群F_Epriに未評価の個体が存在するか否かを判定し、未評価個体が存在しない場合(Yes)はステップS406に移行し、未評価個体が存在する場合(No)はS410に移行する。
In step S402, the pre-environment (E pri ) is estimated in the pre-environment estimating unit 31a by estimating the duration of the environmental change by inputting the steering operation amount that is the factor of the turn as described above. Move to S404.
In step S404, to determine whether there unevaluated individuals in family population f_e pri for environments, if unrated individual does not exist (Yes), the process moves to step S406, there unevaluated individuals If yes (No), the process moves to S410.

ステップS406に移行した場合は、遺伝的操作部31bにおいて、上記生成された個体群集合31cのうち環境に対応した個体群P_Epriの中から、親個体を、個体群中の最良個体とランダムに選択された個体の2個体選択しステップS408に移行する。
ステップS408では、選択された親個体に対して、上記したように単峰性正規分布交叉手法を用いた交叉処理を行い、評価済みフラグが無効状態である2つの個体を生成して、家族個体群F_Epriを形成して、ステップS410に移行する。
When the process proceeds to step S406, in the genetic manipulation section 31b, from a population P_E pri for environments among the generated population set 31c, the parent individual, the best individual and random in the population Two of the selected individuals are selected, and the routine goes to Step S408.
In step S408, the selected parent individual is subjected to a crossover process using the unimodal normal distribution crossover method as described above, to generate two individuals whose evaluated flag is in an invalid state, and to generate a family individual A group F_E pri is formed, and the routine goes to Step S410.

ステップS410では、家族個体群F_Epriの評価済みフラグが無効状態である個体を定速航走制御部30に伝送してステップS412に移行する。
ステップS412では、上記したように遺伝的操作部31bにおいて、家族個体の評価済みフラグが無効状態である個体について電子スロットル弁制御を行うことにより算出された評価値を取得したか否かを判定し、取得したと判定された場合(Yes)は評価済みフラグを有効にしてステップS414に移行し、そうでない場合(No)は取得するまで待機する。
In step S410, the evaluation flag family population f_e pri is disabled individuals by transmitting the constant-speed cruising control unit 30 proceeds to step S412.
In step S412, as described above, it is determined whether or not the genetic operation unit 31b has obtained an evaluation value calculated by performing electronic throttle valve control on an individual whose family individual evaluated flag is in an invalid state. If it is determined that the information has been acquired (Yes), the evaluation-completed flag is made valid and the process proceeds to step S414. If not (No), the process waits until the information is acquired.

ここで、図12に示す、ステップS416〜ステップS428までの処理は、上記第1の実施の形態における図11のステップS216〜ステップS228までの処理と同様の処理となるので記載を省略する。
更に、図13及び図15(c)に基づき、本発明の第3の実施の形態におけるパラメータ最適化装置31の動作処理について説明する。図13は、第3の実施の形態におけるパラメータ最適化装置31の動作処理を示すフローチャートであり、図15(c)は、第3の実施の形態における個体のデータ構造を示す図である。
Here, the processing from step S416 to step S428 shown in FIG. 12 is the same as the processing from step S216 to step S228 in FIG. 11 in the first embodiment, and a description thereof will be omitted.
Further, an operation process of the parameter optimizing device 31 according to the third embodiment of the present invention will be described with reference to FIGS. FIG. 13 is a flowchart illustrating an operation process of the parameter optimizing device 31 according to the third embodiment, and FIG. 15C is a diagram illustrating a data structure of an individual according to the third embodiment.

本実施の形態においては、上記第2の実施の形態と同様に、パラメータ最適化装置31において、一度評価された個体に対して評価済みフラグを有効にし(評価フラグの値を1にする)、以降の最適化処理においては、評価済みフラグが有効状態の個体に対して評価を行わずに以前の評価値をそのまま保持し、この保持された評価値を用いて最適化処理を行うようになっている。   In the present embodiment, as in the second embodiment, the parameter optimization device 31 enables the evaluated flag for the individual evaluated once (sets the value of the evaluation flag to 1), In the subsequent optimization process, the individual with the evaluated flag in the valid state is not evaluated, the previous evaluation value is held as it is, and the optimization process is performed using the held evaluation value. ing.

更に、本実施の形態では、最適化処理において、各個体の更新されなかった回数をカウントする未更新カウンタを備えており、この未更新カウンタの値が、予め設定された閾値である所定値aを超えたときに、評価済みフラグを無効にするようになっている。
従って、本実施の形態において、個体のデータ構造は、図15(c)に示すように、上記した旋回状態にそれぞれ対応した3つの規格化係数1〜3と、評価値と、評価済みフラグ値と、未更新カウンタ値と、を含んだ構成となっている。
Furthermore, in the present embodiment, an unupdated counter for counting the number of times each individual has not been updated in the optimization process is provided, and the value of the unupdated counter is set to a predetermined value a which is a preset threshold value. When the value exceeds, the evaluated flag is invalidated.
Therefore, in the present embodiment, as shown in FIG. 15C, the data structure of the individual includes three normalization coefficients 1 to 3 corresponding to the above-described turning states, an evaluation value, and an evaluated flag value. And an unupdated counter value.

なお、上記以外の構成及び動作については、上記した第1の実施の形態と同様であるので説明を省略する。
更に、図13に基づき、第3の実施の形態におけるパラメータ最適化装置31の動作処理の流れを説明する。
図13に示すように、まずステップS500に移行し、規格化係数の初期値を、上記したように極端な値にならない範囲内で乱数によって決定し、且つ、各個体の評価済みフラグを無効にして(評価済みフラグの値を0にする)ステップS502に移行する。
The configuration and operation other than those described above are the same as those in the above-described first embodiment, and a description thereof will not be repeated.
Further, a flow of operation processing of the parameter optimizing device 31 according to the third embodiment will be described with reference to FIG.
As shown in FIG. 13, the process first proceeds to step S500, where the initial value of the normalization coefficient is determined by a random number within a range that does not become an extreme value as described above, and the evaluated flag of each individual is invalidated. (The value of the evaluated flag is set to 0), and the process proceeds to step S502.

ステップS502では、環境事前推定部31aにおいて、上記したように旋回の要因であるステアリング操作量を入力として、環境変化の持続時間を推定することで、事前の環境(Epri)を推定してステップS504に移行する。
ステップS504では、環境に対応した家族個体群F_Epriに未評価の個体が存在するか否かを判定し、未評価個体が存在しない場合(Yes)はステップS506に移行し、未評価個体が存在する場合(No)はS510に移行する。
In step S502, the pre-environment (E pri ) is estimated in the pre-environment estimating unit 31a by estimating the duration of the environmental change by inputting the steering operation amount that is the factor of the turn as described above. The process moves to S504.
In step S504, to determine whether there unevaluated individuals in family population f_e pri for environments, if unrated individual does not exist (Yes), the process moves to step S506, there unevaluated individuals If yes (No), the process moves to S510.

ステップS506に移行した場合は、遺伝的操作部31bにおいて、上記生成された個体群集合31cのうち環境に対応した個体群P_Epriの中から、親個体を、個体群中の最良個体とランダムに選択された個体の2個体選択しステップS508に移行する。
ステップS508では、選択された親個体に対して、上記したように単峰性正規分布交叉手法を用いた交叉処理を行い、評価済みフラグが無効状態である2つの個体を生成して、家族個体群F_Epriを形成して、ステップS510に移行する。
When the process proceeds to step S506, in the genetic manipulation section 31b, from a population P_E pri for environments among the generated population set 31c, the parent individual, the best individual and random in the population Two of the selected individuals are selected, and the process proceeds to step S508.
In step S508, the selected parent individual is subjected to the crossover process using the unimodal normal distribution crossover method as described above, and two individuals whose evaluated flag is in an invalid state are generated. to form a group f_e pri, the process proceeds to step S510.

ステップS510では、家族個体群F_Epriの評価済みフラグが無効状態である個体を定速航走制御部30に伝送してステップS512に移行する。
ステップS512では、上記したように遺伝的操作部31bにおいて、家族個体の評価済みフラグが無効状態である個体について電子スロットル弁制御を行うことにより算出された評価値を取得したか否かを判定し、取得したと判定された場合(Yes)は評価済みフラグを有効にしてステップS514に移行し、そうでない場合(No)は取得するまで待機する。
At step S510, the evaluation flag family population f_e pri is disabled individuals by transmitting the constant-speed cruising control unit 30 proceeds to step S512.
In step S512, as described above, it is determined whether or not the genetic operation unit 31b has obtained an evaluation value calculated by performing electronic throttle valve control on an individual whose family individual evaluated flag is in an invalid state. If it is determined that the information has been acquired (Yes), the evaluation-completed flag is enabled and the process proceeds to step S514; otherwise (No), the process waits until the information is acquired.

ここで、図13に示す、ステップS514〜ステップS522までの処理は、上記第1の実施の形態における図11のステップS214〜ステップS222までの処理と同様の処理となるので記載を省略する。
ステップS524では、家族個体群F_Epostの個体を評価値の小さい順に並べ替えてステップS550に移行する。
Here, the processing from step S514 to step S522 shown in FIG. 13 is the same as the processing from step S214 to step S222 in FIG. 11 in the first embodiment, and a description thereof will be omitted.
In step S524, the individuals in the family individual group F_E post are rearranged in ascending order of the evaluation value, and the process proceeds to step S550.

ステップS550では、家族個体群F_Epostの評価値の良い上位2個体の未更新カウンタ値を1インクリメントしてステップS552に移行する。
ステップS552では、未更新カウンタの値が予め設定された閾値aを超えたか否かを判定し、超えたと判定された場合(Yes)はステップS554に移行し、そうでない場合(No)はステップS526に移行する。
In step S550, the non-updated counter values of the top two individuals with good evaluation values of the family individual group F_E post are incremented by one, and the flow shifts to step S552.
In step S552, it is determined whether or not the value of the non-update counter has exceeded a preset threshold value a. If it is determined that the value has been exceeded (Yes), the process proceeds to step S554, and if not (No), the process proceeds to step S526. Move to

ステップS554では、評価済みフラグを無効にし、且つ、未更新カウンタ値を0にしてステップS526に移行する。
ステップS526では、遺伝的操作部31bによって、家族個体群F_Epostの評価値のよい上位2個体を個体群P_Epostの親個体があった場所に戻してステップS528に移行する。
In step S554, the evaluated flag is invalidated, the unupdated counter value is set to 0, and the flow shifts to step S526.
In step S526, the genetic operation unit 31b returns the top two individuals with good evaluation values of the family population F_E post to the place where the parent individuals of the population P_E post existed, and proceeds to step S528.

ステップS528では、遺伝的操作部31bによって、最適化が終了したか否かを判定し、終了したと判定された場合(Yes)は処理を終了し、そうでない場合(No)はステップS502に移行する。
更に、図14及び図15(d)に基づき、本発明の第4の実施の形態におけるパラメータ最適化装置31の動作処理について説明する。図14は、第4の実施の形態におけるパラメータ最適化装置31の動作処理を示すフローチャートであり、図15(d)は、第4の実施の形態における個体のデータ構造を示す図である。
In step S528, the genetic operation unit 31b determines whether or not the optimization has been completed. If it is determined that the optimization has been completed (Yes), the process ends. If not (No), the process proceeds to step S502. I do.
Furthermore, an operation process of the parameter optimizing device 31 according to the fourth embodiment of the present invention will be described with reference to FIGS. 14 and 15D. FIG. 14 is a flowchart illustrating an operation process of the parameter optimizing device 31 according to the fourth embodiment, and FIG. 15D is a diagram illustrating a data structure of an individual according to the fourth embodiment.

本実施の形態においては、上記第2及び第3の実施の形態と同様に、パラメータ最適化装置31において、一度評価された個体に対して評価済みフラグを有効にし(評価フラグの値を1にする)、以降の最適化処理においては、評価済みフラグが有効状態の個体に対して評価を行わずに以前の評価値をそのまま保持し、この保持された評価値を用いて最適化処理を行うようになっている。   In the present embodiment, similarly to the above-described second and third embodiments, the parameter optimization device 31 enables the evaluated flag for the individual evaluated once (the value of the evaluation flag is set to 1). Do), in the subsequent optimization processing, the evaluation flag is not evaluated for the individual in the valid state, the previous evaluation value is held as it is, and the optimization processing is performed using the held evaluation value. It has become.

更に、本実施の形態においては、家族個体群F_Epostにおける最も評価値の良い個体によって、前回の評価処理までにおいて最良の個体が更新されたときに、家族個体群F_Epostにおける最も評価値の良い個体に対して優先評価フラグを有効にし(優先評価フラグの値を1にする)、この優先評価フラグが有効状態である個体の評価を優先して行うようになっている。 Further, in this embodiment, the good individuals most evaluation value in the family population f_e post, when the best individuals has been updated in up to the previous evaluation process, good most evaluation value in the family population f_e post The priority evaluation flag is made valid for the individual (the value of the priority evaluation flag is set to 1), and the evaluation of the individual whose priority evaluation flag is in the valid state is performed with priority.

従って、本実施の形態において、個体のデータ構造は、図15(d)に示すように、上記した旋回状態にそれぞれ対応した3つの規格化係数1〜3と、評価値と、評価済みフラグ値と、優先評価フラグ値と、を含んだ構成となっている。
なお、上記以外の構成及び動作については、上記した第1の実施の形態と同様であるので説明を省略する。
Therefore, in the present embodiment, as shown in FIG. 15D, the data structure of the individual includes three normalization coefficients 1 to 3 respectively corresponding to the above-described turning state, an evaluation value, and an evaluated flag value. And a priority evaluation flag value.
The configuration and operation other than those described above are the same as those in the above-described first embodiment, and a description thereof will not be repeated.

更に、図14に基づき、第4の実施の形態におけるパラメータ最適化装置31の動作処理の流れを説明する。
図14に示すように、まずステップS600に移行し、規格化係数の初期値を、上記したように極端な値にならない範囲内で乱数によって決定し、且つ、各個体の評価済みフラグを無効にして(評価済みフラグの値を0にする)ステップS602に移行する。
Furthermore, the flow of the operation processing of the parameter optimizing device 31 according to the fourth embodiment will be described with reference to FIG.
As shown in FIG. 14, the process first proceeds to step S600, where the initial value of the normalization coefficient is determined by a random number within a range that does not become an extreme value as described above, and the evaluated flag of each individual is invalidated. (The value of the evaluated flag is set to 0), and the process proceeds to step S602.

ステップS602では、環境事前推定部31aにおいて、事前の環境(Epri)を推定してステップS604に移行する。
ステップS604では、家族個体群F_Epriに優先評価フラグが有効状態の個体があるか否かを判定し、あると判定された場合(Yes)はステップS606に移行し、そうでない場合(No)はS620に移行する。
In step S602, the pre-environment estimating unit 31a estimates the pre-environment (E pri ) and proceeds to step S604.
At step S604, the family population F_E priority evaluation flag pri it is determined whether there is an individual in the available state, when it is determined that there (Yes), the process moves to step S606, the otherwise (No) The process moves to S620.

ステップS606に移行した場合は、先にステップS638で得られた新しい最良個体を定速航走制御部30に伝送してステップS608に移行する。
ステップS608では、上記したように遺伝的操作部31bにおいて、新しい最良個体について電子スロットル弁制御を行うことにより算出された評価値を取得したか否かを判定し、取得したと判定された場合(Yes)はステップS610に移行し、そうでない場合(No)は取得するまで待機する。
When the process proceeds to step S606, the new best individual previously obtained in step S638 is transmitted to the constant-speed cruise control unit 30, and the process proceeds to step S608.
In step S608, as described above, the genetic operation unit 31b determines whether or not the evaluation value calculated by performing the electronic throttle valve control on the new best individual has been obtained. If it is determined that the evaluation value has been obtained ( (Yes) moves on to step S610, otherwise (No) stands by until acquisition.

ステップS610では、家族個体群F_Epostの個体を評価値の小さい順に並べ替えてステップS612に移行する。
ステップS612では、優先評価フラグを無効にしてステップS614に移行する。
ステップS614では、個体の評価が終了した時点で、環境事後推定部31dによって、そのときの環境(Epost)を推定してステップS616に移行する。
In step S610, the individuals in the family individual group F_E post are rearranged in ascending order of the evaluation value, and the process proceeds to step S612.
In step S612, the priority evaluation flag is invalidated, and the flow shifts to step S614.
In step S614, when the evaluation of the individual is completed, the environment (E post ) at that time is estimated by the environment posterior estimating unit 31d, and the process proceeds to step S616.

ステップS616では、事前環境(Epri)と事後環境(Epost)とが等しいか否かを判定し、等しいと判定された場合(Yes)はステップS644に移行し、そうでない場合(No)はステップS618に移行する。
一方、ステップS618に移行した場合は、上記したように、環境事後推定部31dにおいて推定された環境に対応した家族個体群F_Epostのうち未評価の個体と評価済みの個体を入れ換えてステップS636に移行する。
In step S616, it is determined whether or not the pre-environment (E pri ) and the post-environment (E post ) are equal. If it is determined that the pre-environment (E post ) is equal (Yes), the process proceeds to step S644, and if not (No), It moves to step S618.
On the other hand, when the process proceeds to step S618, as described above, among the family population F_E post corresponding to the environment estimated by the environmental posterior estimating unit 31d, the unevaluated individual and the evaluated individual are replaced, and the process proceeds to step S636. Transition.

また、ステップS604において、家族個体群F_Epriに優先評価フラグが有効状態の個体が無く、ステップS620に移行した場合は、環境に対応した家族個体群F_Epriに未評価の個体が存在するか否かを判定し、未評価個体が存在しない場合(Yes)はステップS626に移行し、未評価個体が存在する場合(No)はS622に移行する。
ステップS622に移行した場合は、遺伝的操作部31bにおいて、上記生成された個体群集合31cのうち環境に対応した個体群P_Epriの中から、親個体を、個体群中の最良個体とランダムに選択された個体の2個体選択しステップS624に移行する。
Further, in step S604, the family population f_e pri priority evaluation flag is not a valid state individuals, or when the process proceeds to step S620, unrated individuals present in the family population f_e pri for environments not If no unevaluated individual exists (Yes), the process proceeds to step S626, and if an unevaluated individual exists (No), the process proceeds to S622.
When the process proceeds to step S622, in the genetic manipulation section 31b, from a population P_E pri for environments among the generated population set 31c, the parent individual, the best individual and random in the population Two of the selected individuals are selected, and the routine goes to Step S624.

ステップS624では、選択された親個体に対して、上記したように単峰性正規分布交叉手法を用いた交叉処理を行い、評価済みフラグが無効状態である2つの個体を生成して、家族個体群F_Epriを形成して、ステップS626に移行する。
ステップS626では、家族個体群F_Epriの評価済みフラグが無効状態である個体を定速航走制御部30に伝送してステップS628に移行する。
In step S624, the selected parent individual is subjected to a crossover process using the unimodal normal distribution crossover method as described above, to generate two individuals whose evaluated flag is in an invalid state, and to generate a family individual to form a group f_e pri, the process proceeds to step S626.
In step S626, an individual evaluation completion flag family population f_e pri is invalid state by transmitting the constant-speed cruising control unit 30 proceeds to step S628.

ステップS628では、上記したように遺伝的操作部31bにおいて、家族個体の評価済みフラグが無効状態である個体について電子スロットル弁制御を行うことにより算出された評価値を取得したか否かを判定し、取得したと判定された場合(Yes)は評価済みフラグを有効にしてステップS630に移行し、そうでない場合(No)は取得するまで待機する。   In step S628, as described above, it is determined whether or not the genetic operation unit 31b has obtained an evaluation value calculated by performing electronic throttle valve control on an individual whose family individual evaluated flag is in an invalid state. If it is determined that the information has been acquired (Yes), the evaluated flag is enabled and the process proceeds to step S630. If not (No), the process waits until the information is acquired.

ここで、図14に示す、ステップS630〜ステップS636までの処理は、上記第2の実施の形態における図12のステップS414〜ステップS422までの処理と同様の処理となるので記載を省略する。
ステップS638では、家族個体群F_Epostの個体を評価値の小さい順に並べ替えてステップS640に移行する。
Here, the processing from step S630 to step S636 shown in FIG. 14 is the same as the processing from step S414 to step S422 in FIG. 12 in the above-described second embodiment, and a description thereof will be omitted.
In step S638, the individuals in the family individual group F_E post are rearranged in ascending order of the evaluation value, and the flow advances to step S640.

ステップS640では、家族個体群F_Epostの最も評価値の良い個体によりこれまでの最良個体が更新されたか否かを判定し、更新されたと判定された場合(Yes)はステップS642に移行し、そうでない場合(No)はS644に移行する。
ステップS642に移行した場合は、新しい最良個体の優先評価フラグを有効にしてステップS644に移行する。
In step S640, it is determined whether or not the best individual so far has been updated by the individual with the highest evaluation value of the family population F_E post. If it is determined that the individual has been updated (Yes), the process proceeds to step S642, and so on. If not (No), the flow shifts to S644.
When the process proceeds to step S642, the priority evaluation flag of the new best individual is made valid, and the process proceeds to step S644.

ステップS644では、遺伝的操作部31bによって、家族個体群F_Epostの評価値のよい上位2個体を個体群P_Epostの親個体があった場所に戻してステップS646に移行する。
ステップS646では、遺伝的操作部31bによって、最適化が終了したか否かを判定し、終了したと判定された場合(Yes)は処理を終了し、そうでない場合(No)はステップS602に移行する。
In step S644, the genetic operation unit 31b returns the top two individuals with good evaluation values of the family population F_E post to the place where the parent individuals of the population P_E post existed, and proceeds to step S646.
In step S646, the genetic operation unit 31b determines whether or not the optimization has been completed. If it is determined that the optimization has been completed (Yes), the process ends. If not (No), the process proceeds to step S602. I do.

なお、上記第4の実施の形態において、上記第3の実施の形態において説明した未更新カウンタによる個体の未更新回数の監視処理を加え、事後推定の誤りの影響に対して更に頑健性を増すようにしても良い。
ここで、図1に示す、遺伝的操作部31bにおける、個体群の生成処理は、請求項12及び請求項13記載の個体群生成手段に対応し、事前環境に対応した個体群の選択処理は、請求項12及び請求項13記載の個体群選択手段に対応し、環境に対応した個体群の中から特定の個体を選択する処理は、請求項12及び請求項13記載の特定個体選択部に対応し、単峰性正規分布交叉手法による選択した特定個体の交叉処理は請求項12及び請求項13記載の交叉処理部に対応し、評価値に基づく個体の評価処理は、請求項12及び請求項13記載の個体評価部に対応し、環境事前推定部31aは、請求項12、13、21記載の環境事前推定手段に対応し、環境事後推定部31dは、請求項13及び請求項22記載の環境事後推定部に対応する。
In the fourth embodiment, the process of monitoring the number of unupdated times of the individual using the unupdated counter described in the third embodiment is added to further increase the robustness against the influence of an error in post estimation. You may do it.
Here, the generation processing of the individual group in the genetic operation unit 31b shown in FIG. 1 corresponds to the individual group generation means according to claim 12 and claim 13, and the selection processing of the individual group corresponding to the prior environment is performed. The processing for selecting a specific individual from the population corresponding to the environment, which corresponds to the individual group selecting means according to claim 12 and claim 13, is performed by the specific individual selection unit according to claim 12 and claim 13. Correspondingly, the crossover process of the specific individual selected by the unimodal normal distribution crossover method corresponds to the crossover processing unit according to claim 12 and claim 13, and the individual evaluation process based on the evaluation value is described in claim 12 and claim The pre-environment estimating section 31a corresponds to the individual evaluation section described in claim 13, the pre-environment estimating section 31d corresponds to the pre-environment estimating means described in claim 12, 13, and 21, and the post-environment estimating section 31d corresponds to claim 13 and 22. Corresponding to the environmental .

なお、上記実施の形態においては、個体の選択方法として、評価値の優れた個体とランダムな個体を選択する方法を例として説明しているが、これに限らず、ルーレット選択方式、トーナメント選択方式など他の選択方法を用いるようにしても良い。
また、上記実施の形態においては、交叉手法として単峰性正規分布交叉手法を用いた例を示しているが、これに限らず、遺伝子がビットストリングで表される場合は一点交叉手法を用いるなど、他の交叉手法を用いるようにしても良い。
Note that, in the above embodiment, a method of selecting an individual having an excellent evaluation value and a random individual has been described as an example of a method of selecting an individual. However, the present invention is not limited thereto, and a roulette selection method, a tournament selection method, and the like. Other selection methods may be used.
Further, in the above embodiment, an example in which the unimodal normal distribution crossover method is used as the crossover method is shown. However, the present invention is not limited to this, and when a gene is represented by a bit string, a one-point crossover method is used. Alternatively, another crossover method may be used.

本発明に係る航走制御システムの構成を示すブロック図である。FIG. 1 is a block diagram illustrating a configuration of a navigation control system according to the present invention. 目標エンジン回転数算出モジュール30aにおいて目標エンジン回転数を算出するためのファジィルールの説明図である。FIG. 4 is an explanatory diagram of a fuzzy rule for calculating a target engine speed in a target engine speed calculation module 30a. 電子スロットル弁開度算出モジュール30bにおいて電子スロットル弁解度を算出するためのファジィルールの説明図である。FIG. 9 is an explanatory diagram of a fuzzy rule for calculating an electronic throttle valve degree of solution in an electronic throttle valve opening calculation module 30b. 船舶が旋回時の適応度関数の景観を示す図である。It is a figure which shows the landscape of the fitness function at the time of a ship turning. ステアリング操作に対する前の航走状況の持続時間を示す図である。It is a figure which shows the duration of the previous running situation with respect to a steering operation. GAの初期個体として規格化係数の初期値を生成する際の生成範囲を示す図である。FIG. 9 is a diagram illustrating a generation range when an initial value of a normalization coefficient is generated as an initial individual of a GA. 単峰性正規分布交叉手法を示す図である。It is a figure which shows the unimodal normal distribution crossover technique. 単峰性正規分布交叉手法を用いて親個体から子個体を生成する様子を示す図である。It is a figure showing signs that a child individual is generated from a parent individual using the unimodal normal distribution crossover method. 定速航走制御部30における動作処理を示すフローチャートである。4 is a flowchart showing an operation process in a constant speed cruise control unit 30. 事後環境との評価に基づく個体の世代交代を示す図である。It is a figure showing generation change of an individual based on evaluation with a posterior environment. 第1の実施の形態におけるパラメータ最適化装置31の動作処理を示すフローチャートである。5 is a flowchart illustrating an operation process of the parameter optimization device 31 according to the first embodiment. 第2の実施の形態におけるパラメータ最適化装置31の動作処理を示すフローチャートである。11 is a flowchart illustrating an operation process of a parameter optimizing device 31 according to the second embodiment. 第3の実施の形態におけるパラメータ最適化装置31の動作処理を示すフローチャートである。13 is a flowchart illustrating an operation process of a parameter optimizing device 31 according to the third embodiment. 第4の実施の形態におけるパラメータ最適化装置31の動作処理を示すフローチャートである。15 is a flowchart illustrating an operation process of a parameter optimizing device 31 according to a fourth embodiment. (a)は、第1の実施の形態における個体のデータ構造を示す図であり、(b)は、第2の実施の形態における個体のデータ構造を示す図であり、(c)は、第3の実施の形態における個体のデータ構造を示す図であり、(d)は、第4の実施の形態における個体のデータ構造を示す図である。(A) is a diagram showing a data structure of an individual in the first embodiment, (b) is a diagram showing a data structure of an individual in the second embodiment, and (c) is a diagram showing the data structure of the individual in the second embodiment. It is a figure which shows the data structure of the individual in 3rd Embodiment, (d) is a figure which shows the data structure of the individual in 4th Embodiment.

符号の説明Explanation of reference numerals

1 航走制御システム
2 船外機
2a 電子スロットル弁装置
3 航走制御装置
30 定速航走制御部
30a 目標エンジン回転数算出モジュール
30b 電子スロットル弁開度算出モジュール
31 パラメータ最適化装置
31a 環境事前推定部
31b 遺伝的操作部
31c 個体群集合
31d 環境事後推定部
Reference Signs List 1 cruise control system 2 outboard motor 2a electronic throttle valve device 3 cruise control device 30 constant speed cruise control unit 30a target engine speed calculation module 30b electronic throttle valve opening calculation module 31 parameter optimization device 31a environment pre-estimation Unit 31b genetic operation unit 31c population set 31d environmental ex-post estimation unit

Claims (24)

制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化する最適化方法であって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成し、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定し、
前記個体群の中から当該推定結果の環境に対応する個体群を選択し、
当該選択された個体群に対して、前記遺伝的操作として、
前記事前に推定した環境に対応する個体群の中から特定の個体を選択し、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成し、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行い、
当該評価結果に基づき評価後の個体の更新処理を行うことを特徴とする制御パラメータの最適化方法。
An optimization method for optimizing a control parameter of a control device used in an environment where a control condition dynamically changes, using a genetic algorithm,
For each of the changing environment, to generate a population of the genetic algorithm according to the control parameters,
Based on predetermined information obtained under the current environment, the environment at the time of the next genetic operation by the genetic algorithm is estimated in advance from the environment that is in correspondence with the population,
From the population, select a population corresponding to the environment of the estimation result,
For the selected population, as the genetic manipulation,
Select a specific individual from the population corresponding to the environment estimated in advance,
A new individual is generated by performing a crossover process using a predetermined crossover method on the specific individual,
Perform evaluation of these individuals based on the evaluation value obtained from the control result using the new individual and the specific individual,
A method of optimizing a control parameter, comprising performing an updating process on an individual after evaluation based on the evaluation result.
制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化する最適化方法であって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成し、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定し、
前記個体群の中から当該推定結果の環境に対応する個体群を選択し、
当該選択された個体群に対して、前記遺伝的操作として、
前記事前に推定した個体群の中から特定の個体を選択し、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成し、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行い、
当該評価後の環境下から得られる所定情報に基づき、このときの環境を前記個体群と対応関係にある環境の中から推定し、
当該評価後に推定した環境と前記事前に推定した環境とを比較し、
当該比較結果に基づき前記評価後の個体の更新処理を行うことを特徴とする制御パラメータの最適化方法。
An optimization method for optimizing a control parameter of a control device used in an environment where a control condition dynamically changes, using a genetic algorithm,
For each of the changing environment, to generate a population of the genetic algorithm according to the control parameters,
Based on the predetermined information obtained under the current environment, the environment at the time of the next genetic operation by the genetic algorithm is estimated in advance from the environment that is in correspondence with the population,
From the population, select a population corresponding to the environment of the estimation result,
For the selected population, as the genetic manipulation,
Select a specific individual from the population estimated in advance,
A new individual is generated by performing a crossover process using a predetermined crossover method on the specific individual,
Perform evaluation of these individuals based on the evaluation value obtained from the control result using the new individual and the specific individual,
Based on the predetermined information obtained from the environment after the evaluation, the environment at this time is estimated from the environment corresponding to the population,
Compare the environment estimated after the evaluation and the environment estimated in advance,
A control parameter optimizing method, characterized in that an update process of the individual after the evaluation is performed based on the comparison result.
前記推定された環境の比較において、前記事前に推定された環境と前記評価後に推定された環境とが異なる環境であったときに、前記評価後の個体を当該評価後に推定した環境に対応する個体群の所定の個体と入れ換えることを特徴とする請求項2記載の制御パラメータの最適化方法。   In the comparison of the estimated environment, when the environment estimated beforehand and the environment estimated after the evaluation are different environments, the individual after the evaluation corresponds to the environment estimated after the evaluation. 3. The control parameter optimizing method according to claim 2, wherein a predetermined individual of the population is replaced. 前記推定された環境の比較において、前記事前に推定された環境と前記評価後に推定された環境とが異なる環境であったときに、これらの環境に対応する個体群の中からそれぞれ特定の個体を選択して前記遺伝的操作を行い、この遺伝的操作後の個体を前記評価後に推定された環境に対応する個体群の所定の個体と入れ換えることを特徴とする請求項2記載の制御パラメータの最適化方法。   In the comparison of the estimated environment, when the environment estimated in advance and the environment estimated after the evaluation are different environments, specific individuals are respectively selected from the populations corresponding to these environments. The genetic parameter is selected and the genetic operation is performed, and the individual after the genetic operation is replaced with a predetermined individual of a population corresponding to the environment estimated after the evaluation. Optimization method. 前記特定の個体は、最良の個体を含むことを特徴とする請求項2乃至請求項4のいずれか1項に記載の制御パラメータの最適化方法。   The control parameter optimization method according to any one of claims 2 to 4, wherein the specific individual includes a best individual. 前記環境に対応する個体群の個体が評価済みか否かを判定し、評価済みであると判定された場合は、その個体の評価を省略して以前獲得した評価値を保持し、当該保持された評価値を用いて前記更新処理を行うことを特徴とする請求項1乃至請求項5のいずれか1項に記載の制御パラメータの最適化方法。   It is determined whether or not the individual of the population corresponding to the environment has been evaluated.If it is determined that the individual has been evaluated, the evaluation value of the individual is omitted and the previously acquired evaluation value is retained. The control parameter optimization method according to any one of claims 1 to 5, wherein the updating process is performed using the obtained evaluation value. 評価済みと判断された個体に対してそのことを示すフラグを設定し、前記環境に対応する個体群の個体が前記更新処理時に生き残った回数を記録し、当該記録された回数が所定数を超えたときに、設定された前記フラグを解除することを特徴とする請求項6記載の制御パラメータの最適化方法。   A flag indicating that fact is set for an individual determined to be evaluated, the number of individuals of the individual group corresponding to the environment that has survived during the update process is recorded, and the recorded number exceeds a predetermined number. 7. The control parameter optimizing method according to claim 6, wherein the flag that has been set is released when the error occurs. 前記複数の個体群における各個体の現在の評価値と、前記複数の個体群における過去において最も良い評価値とを比較し、現在の評価値の方が過去の評価値より優れている個体に対して再評価を行ってから前記更新処理を行うことを特徴とする請求項6又は請求項7記載の制御パラメータの最適化方法。   Compare the current evaluation value of each individual in the plurality of populations with the best evaluation value in the past in the plurality of populations, and compare the current evaluation value to an individual whose current evaluation value is superior to the past evaluation value. 8. The control parameter optimizing method according to claim 6, wherein the updating process is performed after re-evaluation is performed. 前記制御装置は船舶に備わる船外機であり、前記変化する環境は、当該船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき決定されることを特徴とする請求項1乃至請求項8のいずれか1項に記載の制御パラメータの最適化方法。   The control device is an outboard motor provided in the ship, and the changing environment is determined based on at least one of information on a running speed of the ship, an engine speed, a throttle operation amount, a steering operation amount, and a trim angle. The control parameter optimization method according to any one of claims 1 to 8, wherein: 船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき、前記事前の環境を推定することを特徴とする請求項1乃請求項9のいずれか1項に記載の制御パラメータの最適化方法。   10. The environment according to claim 1, wherein the preliminary environment is estimated based on at least one of information of a cruising speed of the ship, an engine speed, a throttle operation amount, a steering operation amount, and a trim angle. The control parameter optimizing method according to any one of the preceding claims. 船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき、前記評価後の環境を推定することを特徴とする請求項2乃至請求項10のいずれか1項に記載の制御パラメータの最適化方法。   The environment after the evaluation is estimated on the basis of at least one of information on a running speed of a ship, an engine speed, a throttle operation amount, a steering operation amount, and a trim angle. The control parameter optimizing method according to any one of the preceding claims. 制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化する最適化装置であって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成する個体群生成手段と、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定する環境事前推定手段と、
前記個体群の中から当該推定結果の環境に対応する個体群を選択する個体群選択手段と、
当該選択された個体群に対して前記遺伝的操作を行う遺伝的操作手段と、を備え、
前記遺伝的操作手段は、
前記事前に推定した環境に対応する個体群の中から特定の個体を選択する特定個体選択部と、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成する交叉処理部と、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行う個体評価部と、
当該評価結果に基づき評価後の個体の更新処理を行う個体更新部と、を備えることを特徴とする制御パラメータの最適化装置。
An optimization device for optimizing a control parameter of a control device used in an environment in which a control condition changes dynamically, using a genetic algorithm,
Corresponding to each of the changing environment, a population generating means for generating a population of the genetic algorithm according to the control parameter,
Based on predetermined information obtained under the current environment, environment prior estimation means for preliminarily estimating an environment at the time of the next genetic operation by the genetic algorithm from among the environments in correspondence with the population,
Population selecting means for selecting a population corresponding to the environment of the estimation result from the population,
Genetic manipulation means for performing the genetic manipulation on the selected population,
The genetic manipulation means,
A specific individual selection unit for selecting a specific individual from a population corresponding to the environment estimated in advance,
A crossover processing unit that generates a new individual by performing a crossover process using a predetermined crossover method on the specific individual;
An individual evaluation unit that evaluates these new individuals and the individual based on an evaluation value obtained from a control result using the specific individual,
A control unit for optimizing the control parameter, comprising: an individual updating unit for performing an updating process of the individual after the evaluation based on the evaluation result.
制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化する最適化装置であって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成する個体群生成手段と、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定する環境事前推定手段と、
前記個体群の中から当該推定結果の環境に対応する個体群を選択する個体群選択手段と、
当該選択された個体群に対して前記遺伝的操作を行う遺伝的操作手段と、を備え、
前記遺伝的操作手段は、
前記事前に推定した環境に対応する個体群の中から特定の個体を選択する特定個体選択部と、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成する交叉処理部と、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行う個体評価部と、
当該評価後の環境下から得られる所定情報に基づき、このときの環境を前記対応した個体群のある環境の中から推定する環境事後推定部と、
当該評価後に推定した環境と前記事前に推定した環境とを比較する環境比較部と、
当該比較結果に基づき前記評価後の個体の更新処理を行う個体更新部と、を備え前記遺伝的操作を行うことを特徴とする制御パラメータの最適化装置。
An optimization device for optimizing a control parameter of a control device used in an environment in which a control condition changes dynamically, using a genetic algorithm,
Corresponding to each of the changing environment, a population generating means for generating a population of the genetic algorithm according to the control parameter,
Based on predetermined information obtained under the current environment, environment prior estimation means for preliminarily estimating an environment at the time of the next genetic operation by the genetic algorithm from among the environments in correspondence with the population,
Population selecting means for selecting a population corresponding to the environment of the estimation result from the population,
Genetic manipulation means for performing the genetic manipulation on the selected population,
The genetic manipulation means,
A specific individual selection unit for selecting a specific individual from a population corresponding to the environment estimated in advance,
A crossover processing unit that generates a new individual by performing a crossover process using a predetermined crossover method on the specific individual;
An individual evaluation unit that evaluates these new individuals and the individual based on an evaluation value obtained from a control result using the specific individual,
Based on predetermined information obtained from the environment after the evaluation, an environment posterior estimating unit for estimating the environment at this time from a certain environment of the corresponding population,
An environment comparison unit that compares the environment estimated after the evaluation with the environment estimated in advance,
A control unit for optimizing the control parameters, comprising: an individual updating unit that performs an updating process on the individual after the evaluation based on the comparison result.
前記環境比較部における比較結果が、前記事前に推定された環境と前記評価後に推定された環境とが異なる環境であったときに、前記個体更新部は、前記評価後の個体を当該評価後に推定した環境に対応する個体群の所定の個体と入れ換えるようになっていることを特徴とする請求項13記載の制御パラメータの最適化装置。   When the comparison result in the environment comparison unit is different from the environment estimated beforehand and the environment estimated after the evaluation, the individual updating unit converts the individual after the evaluation after the evaluation. 14. The control parameter optimizing device according to claim 13, wherein a predetermined individual of an individual group corresponding to the estimated environment is replaced. 前記環境比較部における比較結果が、前記事前に推定された環境と前記評価後に推定された環境とが異なる環境であったときに、前記遺伝的操作手段は、これらの環境に対応する個体群の中からそれぞれ特定の個体を選択して前記遺伝的操作を行い、この遺伝的操作後の個体を前記評価後に推定された環境に対応する個体群の所定の個体と入れ換えるようになっていることを特徴とする請求項13記載の制御パラメータの最適化装置。   When the comparison result in the environment comparison unit is an environment in which the environment estimated in advance and the environment estimated after the evaluation are different, the genetic manipulation means sets a population corresponding to these environments And performing the genetic operation by selecting a specific individual from among the individuals, and replacing the individual after the genetic operation with a predetermined individual of an individual group corresponding to the environment estimated after the evaluation. The control parameter optimizing device according to claim 13, characterized in that: 前記特定の個体は、最良の個体を含むことを特徴とする請求項13乃至請求項15のいずれか1項に記載の制御パラメータの最適化装置。   The control parameter optimizing device according to claim 13, wherein the specific individual includes a best individual. 前記遺伝的操作手段は、前記環境に対応する個体群の個体が評価済みか否かを判定し、評価済みであると判定された場合は、その個体の評価を省略して以前獲得した評価値を保持し、当該保持された評価値を用いて前記更新処理を行うことを特徴とする請求項13乃至請求項16のいずれか1項に記載の制御パラメータの最適化装置。   The genetic manipulation means determines whether or not the individual of the population corresponding to the environment has been evaluated, and when it is determined that the individual has been evaluated, the evaluation value obtained by omitting the evaluation of the individual is omitted. 17. The control parameter optimizing device according to claim 13, wherein the update processing is performed using the held evaluation value. 前記遺伝的操作手段は、評価済みと判断された個体に対して、そのことを示すフラグを設定し、前記環境に対応する個体群の個体が前記更新処理時に生き残った回数を記録し、当該記録された回数が所定数を超えたときに、設定された前記フラグを解除することを特徴とする請求項17記載の制御パラメータの最適化装置。   The genetic operation means sets a flag indicating that the individual is judged to be evaluated, records the number of times the individual of the individual group corresponding to the environment has survived the update process, and 18. The control parameter optimizing device according to claim 17, wherein the set flag is released when the number of times exceeds a predetermined number. 前記遺伝的操作手段は、前記複数の個体群における各個体の現在の評価値と、前記複数の個体群における過去において最も良い評価値とを比較し、現在の評価値の方が過去の評価値より優れている個体に対して再評価を行ってから前記更新処理を行うことを特徴とする請求項17又は請求項18記載の制御パラメータの最適化装置。   The genetic operation means compares a current evaluation value of each individual in the plurality of populations with a past best evaluation value in the plurality of populations, and the current evaluation value is a past evaluation value. 19. The control parameter optimizing apparatus according to claim 17, wherein the updating process is performed after re-evaluating a better individual. 前記制御装置は船舶に備わる船外機であり、前記変化する環境は、当該船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき決定されることを特徴とする請求項12乃至請求項19のいずれか1項に記載の制御パラメータの最適化装置。   The control device is an outboard motor provided in the ship, and the changing environment is determined based on at least one of information on a running speed of the ship, an engine speed, a throttle operation amount, a steering operation amount, and a trim angle. 20. The control parameter optimizing device according to claim 12, wherein the control parameter is optimized. 前記環境事前推定手段は、船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき、前記事前の環境を推定することを特徴とする請求項12乃請求項20のいずれか1項に記載の制御パラメータの最適化装置。   The environment pre-estimating means estimates the pre-environment based on at least one of the following information: a traveling speed of a ship, an engine speed, a throttle operation amount, a steering operation amount, and a trim angle. Item 12. The control parameter optimizing device according to claim 20. 前記環境事後推定部は、船舶の航走速度、エンジン回転数、スロットル操作量、ステアリング操作量及びトリム角度のうち少なくとも一の情報に基づき、前記評価後の環境を推定することを特徴とする請求項13乃至請求項21のいずれか1項に記載の制御パラメータの最適化装置。   The post-environment estimating unit estimates the post-evaluation environment based on at least one of information among a cruising speed of a ship, an engine speed, a throttle operation amount, a steering operation amount, and a trim angle. The control parameter optimizing device according to any one of claims 13 to 21. 制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化するコンピュータ実行可能なプログラムであって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成し、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定し、
前記個体群の中から当該推定結果の環境に対応する個体群を選択し、
当該選択された個体群に対して、前記遺伝的操作として、
前記事前に推定した環境に対応する個体群の中から特定の個体を選択し、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成し、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行い、
当該評価結果に基づき評価後の個体の更新処理を行うことを特徴とする制御パラメータの最適化プログラム。
A computer-executable program for optimizing a control parameter of a control device used in an environment in which a control condition dynamically changes using a genetic algorithm,
For each of the changing environment, to generate a population of the genetic algorithm according to the control parameters,
Based on predetermined information obtained under the current environment, the environment at the time of the next genetic operation by the genetic algorithm is estimated in advance from the environment that is in correspondence with the population,
From the population, select a population corresponding to the environment of the estimation result,
For the selected population, as the genetic manipulation,
Select a specific individual from the population corresponding to the environment estimated in advance,
A new individual is generated by performing a crossover process using a predetermined crossover method on the specific individual,
Perform evaluation of these individuals based on the evaluation value obtained from the control result using the new individual and the specific individual,
A control parameter optimizing program for performing an updating process of an individual after an evaluation based on the evaluation result.
制御条件が動的に変化する環境下において使用される制御装置の制御パラメータを、遺伝的アルゴリズムを利用して最適化するコンピュータ実行可能なプログラムであって、
前記変化する環境毎にそれぞれ対応する、前記制御パラメータに係る前記遺伝的アルゴリズムの個体群を生成し、
現在の環境下において得られる所定情報に基づき、前記遺伝的アルゴリズムによる次の遺伝的操作時の環境を、前記個体群と対応関係にある環境の中から事前に推定し、
前記個体群の中から当該推定結果の環境に対応する個体群を選択し、
当該選択された個体群に対して、前記遺伝的操作として、
前記事前に推定した環境に対応する個体群の中から特定の個体を選択し、
当該特定の個体に対して所定の交叉手法を用いた交叉処理を行うことで新たな個体を生成し、
当該新たな個体及び前記特定の個体を用いた制御結果から得られる評価値に基づきこれら個体の評価を行い、
当該評価後の環境下から得られる所定情報に基づき、このときの環境を前記対応した個体群のある環境の中から推定し、
当該評価後に推定した環境と前記事前に推定した環境とを比較し、
当該比較結果に基づき前記評価後の個体の更新処理を行うことを特徴とする制御パラメータの最適化プログラム。
A computer-executable program for optimizing a control parameter of a control device used in an environment in which a control condition dynamically changes using a genetic algorithm,
For each of the changing environment, to generate a population of the genetic algorithm according to the control parameters,
Based on predetermined information obtained under the current environment, the environment at the time of the next genetic operation by the genetic algorithm is estimated in advance from the environment that is in correspondence with the population,
From the population, select a population corresponding to the environment of the estimation result,
For the selected population, as the genetic manipulation,
Select a specific individual from the population corresponding to the environment estimated in advance,
A new individual is generated by performing a crossover process using a predetermined crossover method on the specific individual,
Perform evaluation of these individuals based on the evaluation value obtained from the control result using the new individual and the specific individual,
Based on the predetermined information obtained from the environment after the evaluation, the environment at this time is estimated from the environment of the corresponding population,
Compare the environment estimated after the evaluation and the environment estimated in advance,
A control parameter optimizing program for performing an updating process of the individual after the evaluation based on the comparison result.
JP2003378616A 2002-11-11 2003-11-07 Control parameter optimization method, control parameter optimization device, and control apparatus optimization program Pending JP2004178574A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003378616A JP2004178574A (en) 2002-11-11 2003-11-07 Control parameter optimization method, control parameter optimization device, and control apparatus optimization program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002327423 2002-11-11
JP2003378616A JP2004178574A (en) 2002-11-11 2003-11-07 Control parameter optimization method, control parameter optimization device, and control apparatus optimization program

Publications (1)

Publication Number Publication Date
JP2004178574A true JP2004178574A (en) 2004-06-24

Family

ID=32716125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003378616A Pending JP2004178574A (en) 2002-11-11 2003-11-07 Control parameter optimization method, control parameter optimization device, and control apparatus optimization program

Country Status (1)

Country Link
JP (1) JP2004178574A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009006996A (en) * 2007-05-30 2009-01-15 Yamaha Motor Co Ltd Sailing control device and vessel with the same
WO2011041846A1 (en) * 2009-10-09 2011-04-14 Commonwealth Scientific And Industrial Research Organisation A dynamically controlled learning system
JP6336174B1 (en) * 2017-04-10 2018-06-06 三菱電機株式会社 Ship motion control apparatus and motion control method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009006996A (en) * 2007-05-30 2009-01-15 Yamaha Motor Co Ltd Sailing control device and vessel with the same
WO2011041846A1 (en) * 2009-10-09 2011-04-14 Commonwealth Scientific And Industrial Research Organisation A dynamically controlled learning system
JP6336174B1 (en) * 2017-04-10 2018-06-06 三菱電機株式会社 Ship motion control apparatus and motion control method
JP2018176922A (en) * 2017-04-10 2018-11-15 三菱電機株式会社 Motion control device and motion control method for vessel

Similar Documents

Publication Publication Date Title
Oleynikova et al. Voxblox: Incremental 3d euclidean signed distance fields for on-board mav planning
Walther et al. Modeling and optimization algorithms in ship weather routing
JP2004334714A (en) Parameter optimization method, parameter optimization device, parameter optimization program, and sailing control device
Gras et al. An individual-based evolving predator-prey ecosystem simulation using a fuzzy cognitive map as the behavior model
JP2019164793A5 (en)
Begum et al. Integrated fuzzy logic and genetic algorithmic approach for simultaneous localization and mapping of mobile robots
Ge et al. A self-evolving fuzzy system which learns dynamic threshold parameter by itself
Sun et al. A machine learning-based method for prediction of ship performance in ice: Part I. ice resistance
US6721647B1 (en) Method for evaluation of a genetic algorithm
CN113358840A (en) Water quality early warning method and system
Heaney et al. Validation of genetic algorithm-based optimal sampling for ocean data assimilation
Soulignac et al. Time-minimal path planning in dynamic current fields
Dickson et al. Uncertainty in marine weather routing
JP2004178574A (en) Control parameter optimization method, control parameter optimization device, and control apparatus optimization program
Gautam et al. Simulation for path planning of autonomous underwater vehicle using flower pollination algorithm, genetic algorithm and Q-learning
CN117172372B (en) Typhoon path prediction method and typhoon path prediction system
Wagner et al. Evolving type-2 fuzzy logic controllers for autonomous mobile robots
Konakoglu et al. Application of a metaheuristic gradient‐based optimizer algorithm integrated into artificial neural network model in a local geoid modeling with global navigation satellite systems/leveling measurements
Nam et al. Prediction of drifter trajectory using evolutionary computation
CN113008223B (en) Seabed terrain synchronous positioning and mapping method based on particle filtering and mapping optimization
CN112182834B (en) Cluster-intelligence-based adaptive rate determination method for water and sand model parameters of multi-sand river
EP3904973A1 (en) Device and method for controlling a robot
Agogino et al. Efficient credit assignment through evaluation function decomposition
Palacios-Leyva et al. Combination of reinforcement learning with evolution for automatically obtaining robot neural controllers
CN116295449B (en) Method and device for indicating path of autonomous underwater vehicle