WO2020189235A1

WO2020189235A1 - 学習済みモデル、制御装置、摩擦攪拌接合システム、ニューラルネットワークシステム、及び学習済みモデルの生成方法

Info

Publication number: WO2020189235A1
Application number: PCT/JP2020/008622
Authority: WO
Inventors: 藤井　英俊; 好昭森貞
Original assignee: 国立大学法人大阪大学
Priority date: 2019-03-20
Filing date: 2020-03-02
Publication date: 2020-09-24
Also published as: JPWO2020189235A1

Abstract

摩擦攪拌接合において、接合条件から継手特性を精度よく予測する。摩擦攪拌接合の接合条件を示す入力データに基づいて継手特性の予測値を出力するよう、コンピュータを機能させるための学習済みモデルであって、入力層、出力層、及び、前記入力層と前記出力層との間に介在し、非線形の活性化関数で表される複数の隠れユニットを有する隠れ層、を含むニューラルネットワークから構成され、前記ニューラルネットワークが、前記継手特性を示す実験データのバラツキを示す情報を用いて、前記実験データと前記予測値との誤差で表される関数を最小化するように重み係数を学習し、前記入力層に入力された、摩擦攪拌接合の接合条件を示す入力データに対し、前記学習済みモデルに基づく演算を行い、継手特性の予測値を前記出力層から出力するとともに当該予測値の信頼性を示す情報を出力するよう、コンピュータを機能させるための学習済みモデルである。

Description

学習済みモデル、制御装置、摩擦攪拌接合システム、ニューラルネットワークシステム、及び学習済みモデルの生成方法

　本発明は、摩擦攪拌接合における継手特性を予測するための学習済みモデル、その学習済みを含む制御装置、その制御装置を含む摩擦攪拌接合システム、学習済みモデルを生成するためのニューラルネットワークシステム、及び学習済みモデルの生成方法に関する。

　摩擦攪拌接合は、棒状のツールを高速で回転させながら材料と接触させ、材料との摩擦熱を利用して接合する手法である（例えば特許文献１）。かかる摩擦攪拌接合は、接合中の最高到達温度が母材の融点に到達しない固相接合であり、従来の溶融溶接と比べて継手効率が高く、場合によっては接合部が母材よりも高強度化されるという画期的な接合法である（例えば、特許文献１参照）。

特許第２７１２８３８号公報

　摩擦攪拌接合では、接合速度やツール回転速度等の接合条件を設定すれば、基本的に同じ継手を再現性良く得ることができる。しかし、適切な接合条件は、被接合材の材質、サイズ、形状等によって異なり、接合条件を決定するためには接合部ごとに多数の予備実験が必要となる。換言すれば、接合条件から継手特性を精度よく予測することは困難である。

　そこで、本発明は、摩擦攪拌接合において、接合条件から継手特性を精度よく予測することを目的とする。なお、本発明において、摩擦攪拌接合は、突合せ接合、重ね接合、線接合、点接合及びこれらの組合せを全て含み、表面改質技術である摩擦攪拌プロセスも含むものである。

　上述した課題を解決すべく、本発明は、摩擦攪拌接合の接合条件を示す入力データに基づいて継手特性の予測値を出力するよう、コンピュータを機能させるための学習済みモデルであって、入力層、出力層、及び、前記入力層と前記出力層との間に介在し、非線形の活性化関数で表される複数の隠れユニットを有する隠れ層、を含むニューラルネットワークから構成され、前記ニューラルネットワークが、前記継手特性を示す実験データのバラツキを用いて、前記実験データと前記予測値との誤差で表される関数を最小化するように重み係数を学習し、前記入力層に入力された、摩擦攪拌接合の接合条件を示す入力データに対し、前記学習済みモデルに基づく演算を行い、継手特性の予測値を前記出力層から出力するとともに当該予測値の信頼性を示す情報を出力するよう、コンピュータを機能させるための学習済みモデルを提供する。
　ここで、学習済みモデルは接合条件を出力してもよい。例えば、学習済みモデルは、継手特性の予測値を用いて、より良い継手特性を得るための接合条件を算出し、出力してもよい。

　上記のような構成を有する本発明の学習済みモデルでは、前記ニューラルネットワークが、更に前記重み係数のバラツキを用いて、前記重み係数を学習し、前記予測値に対する前記接合条件の影響度合いを示す情報を更に出力するよう、コンピュータを機能させること、が好ましい。

　また、上記のような構成を有する本発明の学習済みモデルでは、前記ニューラルネットワークは、異なる数の隠れユニットを有する複数のモデルのそれぞれについて前記重み係数を学習し、前記複数のモデルのうち、予測値と実験データとの誤差が最小となるモデルを予測モデルとすること、が好ましい。

　また、上記のような構成を有する本発明の学習済みモデルでは、前記ニューラルネットワークは、異なる数の隠れユニットを有する複数のモデルのそれぞれについて前記重み係数を学習し、前記複数のモデルを、予測値と実験データとの誤差に基づいて順位付け、高順位のモデルから順次組み合わせて生成される新たな複数のモデルのうち、予測値と実験データとの誤差が最小となるモデルを予測モデルとすること、が好ましい。

　また、本発明は、摩擦攪拌接合における接合条件を示す観測データを取得する入力部と、上記の学習済みモデルを記憶する記憶部と、前記観測データの前記学習済みモデルへの適用結果に基づいて摩擦攪拌接合装置の操作量を決定する演算装置と、決定された前記操作量を前記摩擦攪拌接合装置に指示する出力部と、を含む制御装置をも提供する。

　また、本発明は、摩擦攪拌接合における接合条件及び継手特性を示す観測データを取得する入力部と、所定の学習アルゴリズムを記憶する記憶部と、前記観測データの前記所定の学習アルゴリズムへの適用結果に基づいて摩擦攪拌接合装置の操作量を決定する演算部と、決定された前記操作量を前記摩擦攪拌接合装置に指示する出力部と、を含む制御装置であって、前記所定の学習アルゴリズムは、前記摩擦攪拌接合装置の接合条件及び前記継手特性を示す入力データに基づいて前記摩擦攪拌接合装置の適切な操作量を出力するように前記制御装置を機能させるべく、入力層、出力層、及び、前記入力層と前記出力層との間に介在し、非線形の活性化関数で表される複数の隠れユニットを有する隠れ層、を含むニューラルネットワークから構成され、前記ニューラルネットワークが、前記接合条件と前記継手特性との関係性を含む価値関数で表される誤差関数を最小化するように重み係数を学習し、前記入力層に入力された、摩擦攪拌接合の接合条件を示す入力データに対し、前記学習済みモデルに基づく演算を行い、前記摩擦攪拌接合装置の操作量を前記出力層から出力する、制御装置をも提供する。

　更に、本発明は、摩擦攪拌接合を実行する摩擦攪拌接合装置と、前記摩擦攪拌接合における接合条件を示す観測データを計測する計測器と、上記の制御装置と、を含む摩擦攪拌接合システムをも提供する。

　また、本発明は、摩擦攪拌接合の接合条件を示す入力データに基づいて継手特性の予測値を出力するようにコンピュータを機能させるための学習済みモデルを生成するニューラルネットワークシステムであって、入力層、出力層、及び、前記入力層と前記出力層との間に介在し、非線形の活性化関数で表される複数の隠れユニットを有する隠れ層、を含むニューラルネットワークを含み、前記ニューラルネットワークは、前記継手特性を示す実験データのバラツキを用いて、前記実験データと前記予測値との誤差で表される関数を最小化するように重み係数を学習し、前記入力層に入力された、摩擦攪拌接合の接合条件を示す入力データに対し、前記学習済みモデルに基づく演算を行い、継手特性の予測値を前記出力層から出力するとともに当該予測値の信頼性を示す情報を出力する学習済みモデルを生成するように構成されているニューラルネットワークシステムをも提供する。

　更に、本発明は、摩擦攪拌接合の接合条件を示す入力データに基づいて継手特性の予測値を出力するようにコンピュータを機能させるための学習用モデルの生成方法であって、前記学習済みモデルを生成するための学習用モデルは、入力層、出力層、及び、前記入力層と前記出力層との間に介在し、非線形の活性化関数で表される複数の隠れユニットを有する隠れ層、を含むニューラルネットワークを含み、前記ニューラルネットワークにおいて、前記継手特性を示す実験データのバラツキを用いて、前記実験データと前記予測値との誤差で表される関数を最小化するように重み係数を学習するステップと、前記入力層に入力された、摩擦攪拌接合の接合条件を示す入力データに対し、前記学習済みモデルに基づく演算を行い、継手特性の予測値を前記出力層から出力するとともに当該予測値の信頼性を示す情報を出力する学習済みモデルを生成するステップと、を含む、学習用モデルの生成方法をも提供する。

　本発明によれば、摩擦攪拌接合において、接合条件から継手特性を精度よく予測することができる。したがって、本発明をＦＳＷ装置の制御に適用することで、多数の予備実験を必要とせず、また作業者の技術レベルによらずに、最適な接合条件を用いて各種継手を簡単に得ることができる。ＦＳＷで得られる継手が種々の優れた特性を有していることは広く知られており、適切な接合条件を自動的に把握することができれば、摩擦攪拌接合の利用者は飛躍的に増加すると見込まれる。

本発明の実施形態に係る摩擦攪拌接合システム１の概略図である。摩擦攪拌接合において使用される回転ツール１１の一例を示す図である。材料４１，４２の接合部の一例を示す断面図である。ニューラルネットワークの一例を示す概念図である。学習済みモデルの生成手順の一例を示すフローチャートである。ニューラルネットワークの層数の決定手順例を示すフローチャートである。複数の予測モデルを組み合わせてより適切なモデルを生成する手順例を示すフローチャートである。予測モデルから出力される予測値及びエラーバーの一例を示すグラフである。予測モデルから出力される接合条件の重要度の一例を示すグラフである。制御装置２０の機能構成例を示すブロック図である。制御装置２０の動作例を示すフローチャートである。制御装置１２０の機能構成例を示すブロック図である。制御装置１２０の動作例を示すフローチャートである。

　以下、本発明の代表的な実施形態を、図面を参照しつつ詳細に説明する。ただし、本発明はこれら図面に限定されるものではない。また、図面は、本発明を概念的に説明するためのものであるから、理解容易のために、必要に応じて寸法、比又は数を誇張又は簡略化して表している場合もある。

　ここでは、摩擦攪拌接合システムの全体像を説明したうえで、継手特性の予測モデル（学習済みモデル）及びその学習法、並びに当該モデルの制御への適用について説明することとする。

１．摩擦攪拌接合システムの全体構成
　本実施形態に係る摩擦攪拌接合（ＦＳＷ）システム１は、種々の材料４０を摩擦攪拌により接合するためのものである。ここで、接合対象となる材料４０は、典型的には、アルミニウム、マグネシウム、銅、チタン、亜鉛、鉛、鉄鋼、ニッケル、コバルト及びこれら材料の合金や複合材料などの金属材料であるが、例えばプラスチックやＣＦＲＰなどの樹脂材料でもよい。

　図１に示されるように、ＦＳＷシステム１は、摩擦攪拌接合を実行する摩擦攪拌接合（ＦＳＷ）装置１０、ＦＳＷ装置１０を制御する制御装置２０、及び計測器３０を含んでいる。計測器３０は、ＦＳＷの接合条件及び継手特性を計測する１種又は複数種類の計測機器の総称であり、例えば、ＦＳＷ装置１０及び材料４０の状態（例えば回転ツール１１の回転速度・押圧荷重・角度・移動速度や、接合部の温度・幅等）を計測する。計測器３０は、接合部を撮影する撮像デバイスを含むものである。なお、計測器３０はＦＳＷ装置１０及び制御装置２０に含まれていてもよい。

１－１．摩擦攪拌接合装置の概要
　ＦＳＷ装置１０は、所望の回転速度で回転する回転ツール１１を取り付けて摩擦攪拌接合を実施するものである。
　図２に示すように、回転ツール１１は、柱状のショルダ１２と、ショルダ１２の先端に配置されてショルダ１２よりも小さい径を持つプローブ１３と、を含む。回転ツール１１としては、プローブ１３とショルダ１２とが一体的に駆動されるタイプと、プローブ１３とショルダ１２とが各々独立して駆動されるタイプとの、いずれのタイプの回転ツール１１を使用することができる。

　プローブ１３は、図１に示すように、材料４０中に押し入れられ、接合すべき突合せ面に沿って移動する。このとき、材料は裏当て板に拘束され、固体の状態を維持しながら、回転ツール１１による塑性流動によって接合されることになる。なお、材料４０中に圧入した回転ツール１１は必ずしも横移動させる必要はなく、そのまま引き抜くことで点接合を達成することができる。

　材料４０がアルミニウム合金やマグネシウム合金等の摩擦攪拌が容易な材料の場合、プローブ１３にはネジ１４が形成されていることが好ましい。プローブ１３の長さは、材料４０の板厚とほぼ等しいが、裏当ての板と接触しないように僅かに（例えば０．０５ｍｍ～０．２ｍｍ程度）短いことが好ましい。プローブ１３の断面形状としては、円柱状が一般的であるが、楕円状等の他の形状でもよいものとする。

　ショルダ１２は、軟化した材料４０が飛び出すのを防止するとともに、摩擦熱を発生及び維持する役割を担う。ショルダ１２は、材料４０に接触しながら回転するとともに、接合方向Ｘに向かって所望の移動速度（接合速度）で移動する。

　ＦＳＷ装置１０はまた、回転ツール１１を保持するツールホルダ、回転ツール１１を駆動するモータ、回転ツール１１を材料４０に向かって押圧する押圧機構、回転ツール１１を接合方向（Ｘ方向）及び接合方向と直交する方向（Ｙ方向）に移動させる移動機構、並びに、材料４０を保持する材料ホルダ（いずれも図示せず）を含んでいる。なお、ツールホルダは、回転ツール１１を材料に対して一定の角度だけ傾けた状態で回転ツール１１を保持することができる。したがって、接合時には、回転ツール１１は、プローブ１３の先端がショルダ１２よりも先行するように、所定の角度（例えば１～５度程度）だけ傾けられる。

　図３に示すように、ＦＳＷにより接合された材料４０（４１，４２）の断面組織は、幾つかの領域に分けられる。つまり、接合部位の中央には、通常は数μｍの等軸粒からなる再結晶組織を有する攪拌部（接合部）４３が存在する。攪拌部４３の外側には、塑性変形により結晶粒が伸びた形状を持つ熱加工影響部４４が存在し、更にその外側には、塑性変形は受けていないが熱の影響を受けた熱影響部（ＨＡＺ）４５が存在する。なお、攪拌部４３、熱加工影響部４４及びＨＡＺ４５の状態（例えば幅、軟化の程度など）は継手特性に影響を及ぼす。

　したがって、ＦＳＷでは、接合対象となる材料４０の確実な保持のほか、回転ツール１１の形状、押圧荷重、角度、回転速度、接合速度等の接合条件（ＦＳＷ条件）を適切に調節することが、良い継手を得るために重要となる。ただし、接合条件は、材料の種類、板厚及び接合形状に応じて異なる。また、接合の良し悪し、つまり継手特性は、例えば、継手の機械的性質（引張強度、曲げ強度、疲労強度、耐食性など）、バリの発生量、エネルギー投入量、接合速度等で評価することができる。

１－２．制御装置の概要
　制御装置２０は、計測器３０から計測データを取得し、この計測データに基づいてＦＳＷ装置１０を制御する。かかる制御装置２０は、演算装置（ＣＰＵ、ＧＰＵなど）及び記憶装置（ＲＡＭ、ＲＯＭなど）を含むコンピュータとして構成することができる。制御装置２０は、１台のコンピュータでもよいし、複数台のコンピュータで構成されてもよい。

　制御装置２０によるＦＳＷ装置１０の制御は、学習済みの予測モデルを用いて行うことができる。予測モデルは、制御装置２０において生成されてもよいし、例えばクラウドコンピューティングのように外部コンピュータにおいて生成されてもよい。
　以下、制御装置２０の詳細を説明するに先立ち、本実施形態における機会学習について説明することとする。

２．予測モデルの構築
２－１．ニューラルネットワークによる学習
　ニューラルネットワークは、非線形関数を組み合わせることで複雑な関係性を表現することができる。本実施形態では、このようなニューラルネットワークの柔軟性に注目し、ニューラルネットワークを、多くの要素が複雑に絡み合う継手特性のデータ処理に適用することとしている。

　ただし、ニューラルネットワークを継手特性の予測に直ちに適用することは容易ではなく、データのバラツキ及びフィッティングによる誤差を適切に処理する必要がある。そこで、発明者らは、ニューラルネットワークにベイズ推定の考え方を導入することとした。これにより、統計的なエラーバーを予測することができる。エラーバーの大きさはその時の入力条件に依存し、データのバラツキが大きく信頼性の低い場合には、エラーバーは大きくなる。

　詳細に説明すると、図４に、ニューラルネットワークの構造の概略を示す。図示のとおり、ニューラルネットワークは、入力層及び出力層を含んでいる。入力ｘ_ｉとして各種の接合条件（ＦＳＷ条件）を与えると、出力として継手特性の予測値ｙを得る。出力ｙは１つでも複数でもよいが、ここでは説明の便宜上、出力ｙが１つであるものとしている。

　入力される接合条件としては、例えば、試料の化学組成、回転ツール１１の回転速度、移動速度、印加荷重（又はプローブ１３の挿入量）、前進角、試料の形状、試料の厚さ、押え冶具形状、ツール形状等の「接合前パラメータ」と、接合部の温度、接合中のツールトルク、接合中のツール荷重、接合中のツール位置等の「接合中パラメータ」がある。また、出力される継手特性は、接合部の特性を定量的に表した数値であり、例えば継手強度、攪拌部４３の幅、バリ発生量、ＨＡＺ軟化、硬度分布、最高硬度、耐食性などがある。

　入力層と出力層との間には、複数の隠れユニットを有する隠れ層が配置され、複雑な関数の表現を可能にしている。ここでは、説明の便宜上、隠れユニットは１層の隠れ層を構成するものとしているが、当然のことながら、隠れユニットは複数層の隠れ層を構成することができる。なお、全ての隠れユニットが非線形関数で表される必要はなく、線形関数で表されるユニットを含んでいてもよい。

　このようなニューラルネットワークにおいて、入力ｘ_ｊとｉ番目の隠れユニットｈ_ｉとの間の関係式は、非線形な活性化関数を用いて次のように表せる。

ただし、ｗ_ｉｊ ^（１）はｘ_ｊとｈ_ｉとの間の重みであり、θ_ｉ ^（１）はしきい値である。双曲線正接関数ｔａｎｈは非線形関数の一例であり、例えばシグモイド関数、正規化線形関数（ＲｅＬＵ）などの他の非線形関数を用いてもよい。

　また、隠れユニットｈ_ｉと出力ｙの間の関係は次のように線形関数で表せる。

ただし、ｗ_ｉ ^（２）はｈ_ｉとｙとの間の重みであり、θ^（２）はしきい値である。

　上記式１のように入力ｘと隠れユニットｈとの関係を非線形関数で表現することにより、複雑な関係を表現できるネットワークを構成することができる。以下、式１，２における重みｗ_ｉｊ ^（１）及びｗ_ｉ ^（２）を単に重み係数ｗと言い、しきい値θ_ｉ ^（１）及びθ^（２）を単にしきい値θと言うがある。

　ここで、入力変数ｘを次式で±０．５の範囲に規格化してもよく、出力変数ｙもまた同じ手法で規格化してもよい。

ただし、ｘ_Ｎは規格化されたｘ、ｘ_ｍａｘは元のデータの最大値、ｘ_ｍｉｎは最小値である。

２－２．エネルギー関数Ｍ（ｗ）
　上述した重み係数ｗ及びしきい値θを決定するために、次式で表されるエネルギー関数Ｍ（ｗ）を最小にすることを考える。

ここで、Ｅ_Ｄは誤差関数、Ｅ_ｗ（ｃ）は適切化項（正則化項）であり、追って詳しく述べる。また、パラメータベクトルｗは、重み係数ｗ及びしきい値θを含むものとする。α_ｃ及びβは、モデルの複雑さを制御するパラメータである。

　エネルギー関数Ｍ（ｗ）の最小化をコンピュータ上で実現するためには、例えば可変計量法を用いることができ、また、Ｍ（ｗ）の勾配の計算には例えば逆誤差伝播法を用いることができるが、ここでは詳細に立ち入らない。

　上式のようにエネルギー関数Ｍ（ｗ）は、誤差関数Ｅ_Ｄと適切化項Ｅ_ｗ（ｃ）とからなる。そして、誤差関数Ｅ_Ｄは、次式のように予測モデルの予測値ｙ（ｘ^ｍ；ｗ）と実験値ｔ^ｍの差の二乗和で表すことができる。

ここで｛ｘ^ｍ、ｔ^ｍ｝はデータセットであり、ｘ^ｍは入力変数を、ｔ^ｍは実験データすなわちターゲットを示す。ｍはデータとターゲットの組合せのラベルである。

　上式から、予測モデルの予測結果が実験データに良く一致するとき、すなわちｙ（ｘ^ｍ；ｗ）がｔ^ｍに近いとき、誤差関数Ｅ_Ｄは最小となる。

　次いで、適切化項Ｅ_ｗは、モデル出力ｙ（ｘ；ｗ）を入力ｘの滑らかな関数にする働きがある。換言すれば、適切化項は重み係数ｗを小さくすることを促し、予測モデルがデータセットのばらつきにオーバーフィットすること、つまり過学習を抑制する。

　適切化項Ｅ_ｗは複数の適切化項Ｅ_ｗ（ｃ）の和で表されてもよい。例えば、入力ｘと隠れユニットｈ間の重み係数で一つのクラス、隠れユニットｈと出力ｙとの間の重み係数で一つのクラス、隠れユニットｈのしきい値で一つのクラスをつくり、各適切化項Ｅ_ｗ（ｃ）を計算してもよい。この場合、各適切化項Ｅ_ｗ（ｃ）は、次式で示されるように、各クラスに属する係数ｗ_ｉの二乗和で表される。

　次いで、パラメータα_ｃ及びβは、隠れユニットｈの個数とともに、モデルの複雑さをコントロールしている。例えばデータがσ_νの標準偏差で示されるガウス分布でばらついているとすると、βはデータのバラツキσ_ν ^２＝１／βを規定し、α_ｃは重み係数ｗのバラツキσ_ｗ（ｃ） ^２＝１／α_ｃを規定していることになる。

　式４から、パラメータα_ｃは重み係数ｗを減少させる効果がある。したがって、大きなσ_ｗは、それに対応する入力が出力に大きな変化を与えることを意味している。このことから、σ_ｗを、各入力の重要性を示す指標とすることができる。また、σ_νはデータのバラツキを示し、後述するようにエラーバーとして使用できる。

　本実施形態では、追って詳しく述べるように、パラメータα_ｃおよびβは、ベイズ推定の考え方を用いて算出できる。各パラメータの初期値は、ユーザが適宜決定してもよく、例えば、重み係数ｗに小さなバラツキを持たせて初期値を設定してもよい。

２－３．パラメータα _ｃ、βの決定
　次いで、パラメータα_ｃ、βについて詳細に説明する。
　パラメータβが大きすぎると関数の自由度が大きくなり、オーバーフィッティングが起こりやすくなる。逆に、パラメータα_ｃ（以下、単にαと表記する）が大きくなると関数が滑らかになりすぎ、データにフィットしなくなる。このようなα、βの重要性を考慮し、発明者らは、ベイズ推定の考え方を導入してα、βに統計的な意味を持たせることとした。

　一般に、あるデータＤが起こるという条件のもとで、重み係ｗおよびしきい値θに対してある組合せｗが起こりうる条件付き確率ｐ（ｗ｜Ｄ）は、次のように表される。

　最も確からしい重み係数ｗやしきい値θを決定するには、ｐ（ｗ｜Ｄ）が最大になるようにすれば良い。つまり、上式より、

の関係があるので、右辺に含まれる確率ｐ（ｗ｜Ｄ）、ｐ（ｗ）について正規分布に従ったばらつきがあるものとして、各確率を求めることとする。

　まず確率ｐ（ｗ｜Ｄ）を求める。
　一般に、正規分布ｆ（ｘ）は、平均をｍ、標準偏差をσとすると、次式で表される。

したがって、重み係数ｗ及びしきい値θがあるベクトルｗで表される場合のデータのばらつきは、次式で表される。

このとき、ｘ^（ｍ）は入力変数を、ｔ^（ｍ）は実験データすなわちターゲットであり、Ｚ_Ｄは規格化定数、σ_νはデータのバラツキである。

　ここで、式５で表される誤差関数Ｅ_Ｄ（ｗ）を式１０に代入すると、次式を得る。

　次いで確率ｐ（ｗ）を求めると、ｐ（ｗ）にもバラツキがあり、その確率は、式５を考慮すると、

で表される。ここでＺ_ｗは規格化定数であり、σ_ｗは真のｗの値からのバラツキである。

　式１１、１２を式８に代入すると、

となる。

　したがって、ｐ（ｗ｜Ｄ）を最大にするには、

を最小にすれば良い。

　そして、式４で表されるエネルギー関数Ｍ（ｗ）を最小にすることと比較すると、パラメータα、βは

という統計的意味を持つことがわかる。これにより的確なトレーニングが可能になる。

　このとき、エラーバーσは、次式で表される。

２－４．トレーニング手順
　以上から、予測モデル生成のためのトレーニングは、次の手順で行われる。トレーニングは、制御装置２０におけるトレーニング用プログラムの実行を介して行われてもよいし、トレーニング用プログラムを実行可能な外部コンピュータで行われてもよい。

　具体的に説明すると、図５のステップＳ１１において、訓練データ（ｘ^ｍ，ｔ^ｍ）を取得する。ここで、ｘ^ｍは入力変数となる接合条件であり、ｔ^ｍはターゲットとなる継手特性（実験データ）である。併せて、ステップＳ１２において、パラメータベクトルｗを設定する。ここでベクトルｗは、重み係数ｗ及びしきい値θを含んでいてもよい。

　次いで、ステップＳ１３において、訓練データ（ｘ^ｍ，ｔ^ｍ）のバラツキσ_ν及びパラメータベクトルｗのバラツキσ_ｗを算出する。

　そして、ステップＳ１４において、エネルギー関数Ｍ（ｗ）を最小化するようなパラメータベクトルｗを算出する。この計算には可変計量法を用いることができ、Ｍ（ｗ）の勾配の計算には例えば逆誤差伝播法を用いることができる

　ステップＳ１５において、前手順の計算結果にしたがってパラメータベクトルｗを更新するとともに、そのバラツキσ_ｗを算出及び更新する。

　そして、ステップＳ１４，Ｓ１５を所定の回数だけ繰り返し、一連の手順を終了する。あるいは、パラメータベクトルｗが予め設定した範囲内に収束することを終了条件にしてもよい。このようにして得られたパラメータベクトルｗを、予測モデルのパラメータとして用いる。

　この作業を、隠れユニットｈの個数、つまりパラメータベクトルｗの要素数を調整しながら繰り返す。そうすると、隠れユニットの個数が増えるにしたがって、予測モデルの予測値と実験データとの差が単調に減少する。ここで、入力と出力の関係が複雑であるほど、多くの隠れユニットが必要であるが、実験データは常に誤差を含んでいるため、隠れユニットｈの個数を増やし過ぎるとオーバーフィット（過学習）が生じ、予測精度つまり汎化性能が逆に低下する。

　そこで、例えば、データの半分をランダムに選択し、その半分のデータだけでニューラルネットワークをトレーニングし、残りの半分をモデルの汎化性能を調べるためのテストデータとしてもよい。テストデータを用いて、モデルの予測値とテストデータとの間の誤差、つまりテストエラーを測定するのである。なお、データセットの数が少ない場合には、大部分のデータをトレーニング用とし、残りのデータをテスト用としてよい。例えば、データセット数が３０個の場合、その内の２７個をトレーニング用に、残りの３個をテスト用とすることが好ましい。

　隠れユニットｈが、ある個数となるとき、テストエラーは最小となる。この時のモデルを最適と判断し、学習済みモデルとして用いると予測精度が向上する。

　したがって、隠れユニットｈの適切な個数ｋ^＊を決定する手順は次のようにすればよい。
　まず図６のステップＳ２１において、前述したトレーニングを繰り返すことで、ｋ個（ｋ＝１，２，・・・）の隠れユニットｈ^ｋを持つ複数の予測モデルを準備する。

　次いで、ステップＳ２２において、各予測モデルについてテストエラーを算出し、ステップＳ２３において、テストエラーが最小となる個数ｋ^＊を決定し、それに対応する予測モデルを最適モデルとする。なお、次に述べる予測モデルの組合せのために、テストエラーが小さい順に、最適モデル、第２最適モデル、第３最適モデル・・・のように順序付けしておいてもよい。

２－５．予測モデルの組合せによる最適化
　予測精度を更に向上させるために、複数のモデルを組み合わせてもよい。つまり、ニューラルネットワークでは、誤差の点では最適モデルとあまり変わらないが、全く異なった構造を持つモデルを数多く作ることができる。これらモデルを組み合わせることで、単体モデルの欠点を相互に補うことができ、予測精度を更に向上させることができる。

　具体的には、図７のステップＳ３１において、誤差関数（又は上述したテストエラーの比較結果）を用いて、複数の予測モデルを最適モデル、第２最適モデル、第３最適モデル・・・のように順位付けする。

　ステップＳ３２において、次式に従い、最適モデルの予測値と第２最適モデルの予測値との平均値を新たなモデルの予測値とし、ステップＳ３３において、この予測値と実験データとの誤差を算出する。

　そして、ステップＳ３４において、先に算出した誤差が最小となるかどうかを判定する。最小でないと判定されると、ステップＳ３５において、上式にしたがって次順位のモデルを組み合わせて、再度ステップＳ３３，Ｓ３４を実行する。

　誤差が最小と判定されると、ステップＳ３６において、そのときのモデルの組合せを予測モデルとして採用する。例えば、第４最適モデルまでを組み合わせることによって誤差が小さくなるが、第５最適モデル以降を足し合わせると逆に誤差が大きくなるとき、最適モデルから第４最適モデルまでを組み合わせたものを予測モデルとすればよい。

　このとき、新たな予測のエラーバーσは、次式を用いて計算すればよい。

ただし、Ｎ：モデル数、ｙ_ｉ、σ_ｉ：個々のモデルの予測値及びエラーバーである。

　ところで、本実施形態の予測モデルでは、ある接合条件に対して継手特性の予測値及びエラーバーを出力することができる。例えば図８の例では、接合速度と接合強度の予測値との関係が曲線Ｌで表されるとともに、曲線Ｌを挟むようにエラーバーの上限及び下限を示す曲線Ｄで表されている。あるいは、エラーバーはバラツキσ_νに対応する長さを持つ線分Ｅで表されてもよい。もちろん、予測値及びエラーバーは数値で表されてもよい。

　このような予測値及びエラーバーを得ることで、ユーザは、継手特性の妥当な予測を得るとともに予測の確かさを知ることができる。エラーバーが大きいことは、実験データの数が不足しているか又は実験の精度が不十分であることを意味しているから、ユーザは、エラーバーの大きい領域において実験データを増やすか又は精度の高い実験を行うとよく（補強実験の実施）、これによりモデルの予測の信頼性を高めたり、当該材料に関する研究を更に深めたりすることができる。あるいは、予測モデルをＦＳＷ装置１０の制御のために利用する場合に、エラーバーの小さい領域にある予測値を優先的に採用することで、高精度かつ安定的な制御を期待できる。

　また、予測モデルは、パラメータベクトルｗのバラツキσ_ｗに基づいて、例えば図９のように、継手特性に対する接合条件ごとの重要度（影響度合い）を示すことができる。これにより、ユーザは、該当する継手特性に対して影響力のある接合条件を把握することができ、これを研究・開発の指針として利用できる。また、ＦＳＷ装置１０の制御においては、例えば、重要度の高い接合条件を優先的に調整することで目標値に素早くかつ効率的に近づけることも可能である。
　あるいは、予測モデルは接合条件を出力してもよい。例えば、予測モデルは、継手特性の予測値を用いて、より良い継手特性を得るための接合条件を算出し、出力してもよい。予測モデルは、より良い接合条件の選定に際して、上述したエラーバー及び重要度を参照してもよい。これによりユーザは、より優れた継手を得るための示唆を得ることができる。

　このようにして得られた予測モデルについて、複数の入力変数（接合条件）のうち特定の入力を変化させ、残りの入力を変化させないと、出力（予測値）は、その特定の入力に対する応答特性を示すことになる。このような出力の応答特性を全ての入力変数について調べると、入力に対する出力のトレンドを把握することができるから、パラメータベクトルｗのバラツキσ_ｗとともに又はこれに代えて、応答特性に優れた接合条件を把握することができる。この知見をＦＳＷ装置１０の制御のために利用することもできるし、当該材料に関する研究に使用することもできる。

３．制御手法の例
　上述したモデルはＦＳＷ装置の制御にも適用することができる。幾つかの適用形態が考えられ、その中には強化学習を利用した制御があるので、まず強化学習の概略を述べることとする。

３－１．強化学習
　強化学習とは、試行錯誤を通じて環境に適応する学習制御の枠組である。
　学習主体であるエージェントは、時刻ｔにおいて、制御対象である環境の状態の観測値ｓ（ｔ）に応じて意志決定を行い、行動ａ（ｔ）を出力する。エージェントの行動により、環境はｓ（ｔ＋１）へ状態遷移し、その遷移に応じた報酬ｒ（ｔ）をエージェントへ与える。この一連の流れが繰り返されて、エージェントは、利得の最大化を目的として、状態観測から行動出力への方策πを学習する。

　例えば、強化学習の一種であるＱ学習では、エージェントが、試行錯誤により、ある状態ｓの下で様々な行動ａをとり、そのときの報酬を用いて最適な行動価値Ｑ（ｓ，ａ）を学習する。行動価値関数Ｑ（ｓ，ａ）の更新式は、次式で表される。

ここで、ｓ_ｔ及びａ_ｔは、時刻ｔにおける環境の状態ｓ及び行動ａである。

　行動ａ_ｔにより、環境は状態ｓ_ｔ＋１に遷移し、それに伴って報酬ｒ_ｔ＋１が算出される。上式において、ｍａｘＱ（ｓ_ｔ＋１，ａ）の項は、状態ｓ_ｔ＋１の下で、最もＱ値の高い行動ａに対応するＱ値であり、割引率γ（γは０＜γ≦１）が乗算されている。また、α（０＜α≦１）は学習係数である。

　この更新式は、状態ｓ_ｔにおける行動ａ_ｔの評価値Ｑ（ｓ_ｔ、ａ_ｔ）よりも、次の状態ｓ_ｔ＋１における最良の行動の評価値ｍａｘ_ａＱ（ｓ_ｔ＋１、ａ）の方が大きければ、Ｑ（ｓ_ｔ、ａ_ｔ）を増加させ、逆に小さければ、Ｑ（ｓ_ｔ、ａ_ｔ）を減少させる。

　ところで、Ｑ学習などの強化学習をＦＳＷ装置の制御に適用する場合、行動ａを例えば接合条件の操作量に対応させ、状態ｓを例えば種々の観測データに対応させればよい。また、報酬に関する条件としては、例えば接合の品質、接合速度、エネルギー消費量が挙げられ、これら要素に応じて変化する価値関数を構築するとよい。例えば接合の強度が目標値に近付くか一致すると報酬が増え、目標値から離れるほど報酬は小さくなるか減る。また、バリ発生量が少なければ報酬が増え、多ければ減る。さらに、エネルギー消費量が多ければ報酬は減り、少なければ増える。

　ＦＳＷが複雑な現象を伴うことを踏まえれば、行動価値関数Ｑ（ｓ，ａ）は、テーブルよりもむしろ、関数近似で表現されることが好ましい。行動価値関数Ｑ（ｓ，ａ）の関数近似を行うためには、まず行動価値関数Ｑ（ｓ，ａ）を、パラメータベクトルｗで表される関数Ｑ’（ｓ，ａ；ｗ）としてモデル化する。そして、学習中はＱ値そのものを更新するのではなく、Ｑ’のパラメータベクトルｗを更新するものとする。

　そして、パラメータｗの学習のために、教師あり学習を応用することができる。摩擦攪拌接合のように複雑な問題に対処するためには、例えばニューラルネットワークを利用することができる。例えば、状態ｓを入力すると、可能な全ての行動ａに対する価値関数Ｑを出力するニューラルネットワークを準備し、これを関数近似Ｑ’（ｓ，ａ；ｗ）として用いればよい（Ｑネットワーク）。

　ここで、関数近似のパラメータｗはニューラルネットワークの重みパラメータに対応している。そして、重みパラメータの調整は、次式の誤差関数を最小化するように行えばよい。

ここで、ｙ_ｔ（ｓ，ａ）は標的値（ターゲット）である。
　したがって、先に述べた式４のエネルギー関数Ｍ（ｗ）や式５の誤差関数Ｅ_Ｄを利用することができる。

　もっとも、強化学習では標的値ｙ_ｔ（ｓ，ａ）として用いる教師データは与えられないので、上式の標的値ｙ_ｔを、例えば、環境から実際にサンプリングされた状態及び報酬で置き換えた、次式

を用いてもよい。

　そうすると、価値関数Ｑ’のパラメータｗの更新は、例えば次式

を用いて行えばよい。

　そして、パラメータｗ及び評価関数Ｑ’の更新は、例えば接合の度に行えばよい。なお、Ｑネットワークの実現方法として様々な手法が提案されており、このような手法を本実施形態に取り入れることができる。その際、上式を適宜修正したうえで実行処理が行われることになる。

４．制御装置の詳細
　本実施形態では、上述の学習済みモデル又は学習モデルを用いてＦＳＷ装置１０を制御している。例えば、制御装置は、学習済みモデル（予測モデル）が出力した予測値に基づいてＦＳＷ装置の操作量を決定してもよいし（構成例１）、あるいは、強化学習の学習モデルに最適な操作量を判断させてもよい（構成例２）。

４－１．制御装置の機能構成例１
　まず、予測モデルの予測値に基づいてＦＳＷ装置の操作量を決定するタイプの制御装置２０について説明する。制御装置２０は、図１０に示すように、入力部２１、演算部２２、記憶部２３及び出力部２４の各機能部を含む。

　入力部２１は、ＦＳＷに関する観測量（観測データ）を取得する。入力部は、観測データを自ら計測して取得してもよいし、例えばＦＳＷ装置１０や他の計測器から取得してもよいし、更にはユーザ入力によって取得してもよい。また、観測データは、ＦＳＷの実行中に取得されてもよいし、実行後に取得されてもよい。更に、観測データは、例えばエネルギー消費量のように、複数の観測量の演算により得られるものでもよい。

　ここで、観測データは、ＦＳＷの接合条件に関するものと、継手特性に関するものを含む。ただし、接合条件に関する観測データと継手特性に関する観測データとは重複していてもよい。

　具体的には、接合条件に関する観測データとして、例えば、回転ツールの回転速度、移動速度、印加荷重（又はツール挿入量）、前進角がある。なお、各接合条件の調整量は、制御装置２０により決定される。

　また、継手特性に関する観測データしては、例えば、ＦＳＷ中の接合温度、ツール回転トルク、ツールＹ軸（接合方向）荷重、ツールＺ軸（垂直方向）荷重、攪拌部幅、施工部周辺でのバリ発生量、継手強度、ＨＡＺ軟化、硬度分布、最高硬度、耐食性等がある。これらの物理量の多くは攪拌部に関する情報であり、接合条件に応じて変化する。

　次いで演算部２２について説明すると、演算部２２は、記憶部２３に記憶された制御プログラムをメモリに読み込んで実行することで、観測データに基づいて継手特性を予測し、予測結果に基づいて最適な接合条件を決定する。演算部２２は、設定部２５、予測部２６及び更新部２７を含んでいる。

　設定部２５は、ユーザ入力等に基づいて接合条件の初期設定を行う。設定される条件としては、例えば、接合対象となる材料の情報、目標とする継手特性（強度等）・作業時間・エネルギー消費量といった情報がある。また、設定部２５は、学習済みの予測モデルを用いて、目標となる継手特性を満たす接合条件を把握し、この条件を初期設定としてもよい。

　次いで、予測部２６は、予測モデルに観測データを入力し、継手特性に関する予測値を得る。そして、更新部２７は、この予測値を目標値と比較し、比較結果に基づいて接合条件の操作量を更新する。例えば、接合強度が目標より不足している場合、更新部２７は、接合条件に微少量Δを加えた量を予測モデルに入力して予測値の変化を把握し、接合強度が目標値に近付くようにその接合条件を調整すればよい。このとき、更新部２７は、該当する接合条件の影響度合い及び信頼性（バラツキ）を考慮してもよい。

　そして、演算部２２は、予め設定された時間間隔で、観測と接合条件の調整とを繰り返し、決定した調整量を、出力部２４を介してＦＳＷ装置１０に指示する。

　次いで、記憶部２３は、例えば、学習済みの予測モデル、ＦＳＷ装置１０の制御プログラム及び各種データを記憶している。各種データとしては、例えば、観測データ、接合条件の設定、報酬設定等がある。記憶部２３はまた、例えば継手形状、板厚、母材姿勢、ギャップ量などの施工条件を記憶してもよい。なお、記憶部２３の全部又は一部は、制御装置２０内に組み込まれていてもよいし、例えば外部コンピュータの記憶領域でもよい。

　出力部２４は、演算部２２からの指示をＦＳＷ装置１０に出力するほか、例えば、演算部２２の予測結果及びＦＳＷ装置１０への指示内容を、図示しないディスプレイに表示させてもよい。

　次いで、図１１を参照して、制御装置２０の動作例を説明する。
　まずステップＳ４１において、設定部２５は、ユーザ入力に応じて接合条件を設定する。次いで、ステップＳ４２において、入力部２１は観測データを取得し、記憶部２３又は外部の記憶装置に記憶する。そして、ステップＳ４３において、予測部２６は、学習済みの予測モデルを用いて継手特性の予測値を算出する。更に、ステップＳ４４において、更新部２７は、予測部２５の予測結果を参照し、継手特性を目標値に近付けるように接合条件を調整及び更新するとともに、調整後の接合条件を出力する。

　そして、制御装置２０は、これらステップＳ４２～Ｓ４４を設定された時間間隔で繰り返し実行する。これにより、ユーザの所望する継手特性に応じて適切な接合条件を自動的に決定することができる。

　つまり、予測モデルは、非線形関数で表現された隠れユニットを含むニューラルネットワークにより生成されるから、複雑な関係を伴う接合現象を適切に表現できる。これにより継手特性の予測精度が高まると同時に、この予測モデルが制御装置２０に組み込まれることで、ユーザの要望に応じて、より適切な接合条件を設定することが可能となる。そして、予測モデルの予測精度は、学習機会の増加に伴って更に高まり、更に適切な接合条件の設定が可能になる。したがって、多数の予備実験を必要とせず、また作業者の技術レベルによらずに、最適な接合条件を用いて各種継手を簡単に得ることができる。

　加えて、予測モデルは予測値にエラーバーを設けることができる。予測値のバラツキは使用したデータの不足及び／又は信頼性の不足を意味しており、積極的にデータを収集するべき対象を明確にすることができる。また、このエラーバーを踏まえた制御を行うことで、信頼性の高い制御を実現できる。

４－２．制御装置の機能構成例２
　次に、強化学習の学習モデルに最適な操作量を判断させるタイプの制御装置１２０について説明する。

　制御装置１２０は、接合条件を決定した結果（環境の状態遷移）に基づいて報酬を計算し、計算された報酬に基づいて評価関数を更新し、かかる評価関数の更新を繰り返すことによって、報酬が最も多く得られるような（より好適な）接合条件を決定するようにプログラムされている。制御装置１２０は、図１２に示すように、入力部１２１、演算部１２２、記憶部１２３及び出力部１２４の各機能部を含む。

　入力部１２１は、先に述べた入力部２１と同様に、ＦＳＷに関する観測データを取得する。記憶部１２３は、例えば、学習モデル、制御プログラム、観測データ、設定情報等を記憶している。また、出力部１２４は、演算部１２２が決定した接合条件の操作量をＦＳＷ装置１０に指示する。

　演算部１２２は、観測データに基づいて機械学習を実行し、最適な接合条件を決定する。つまり、演算部１２２は、強化学習におけるエージェントに相当する役割を果たす。かかる演算部１２２は、設定部１２５、関数更新部１２６、報酬計算部１２７及び方策決定部１２８を含んでいる。

　設定部１２５は、ユーザ入力等に基づいて接合条件の初期設定を行うとともに、報酬に関する設定（例えば報酬及び価値関数の初期値、報酬の付与条件など）を行う。なお、接合条件の初期設定に当たっては、設定部１２５は、記憶部１２３又は外部の記憶装置に記憶された学習済みの予測モデルを用いて、目標となる継手特性を満たす接合条件を把握し、この条件を初期設定としてもよい

　関数更新部１２６は、例えば、観測データ及び式２１を用いてパラメータベクトルｗを更新することで、可能な行動ａに対して最大となる価値関数Ｑ^＊を選択し、価値関数Ｑ’を更新する。報酬計算部１２７は、観測された環境の状態ｓに基づき、更新された価値関数Ｑ’を用いて報酬を計算する。方策決定部１２８は、更新された価値関数Ｑ’に対応する方策πを決定する。

　そして、演算部２２は、予め設定された時間間隔で、観測と接合条件の調整とを繰り返し、決定した方策つまり接合条件の調整量を、出力部２４を介してＦＳＷ装置１０に指示する。

　次いで、図１３を参照して、制御装置１２０の動作例を説明する。
　まずステップＳ５１において、設定部１２５は、ユーザ入力に応じて接合条件等の初期設定を行う。次いで、ステップＳ５２において、方策決定部１２８は価値関数Ｑ’に基づいて方策πを決定する。併せて、ステップＳ５３において、関数更新部１２６は、学習モデルを用いて価値関数Ｑ’のパラメータベクトルｗを更新し、これにより価値関数Ｑ’を更新する。

　ステップＳ５４において、制御部１２０は、ＦＳＷ装置１０に方策πを実行させ、計測器３０から環境の新たな状態ｓを取得する。ステップＳ５５において、報酬計算部１２７は、観測された環境の新たな状態ｓ及び更新された価値関数Ｑ’を用いて報酬を計算する。

　そして、制御装置２０は、これらステップＳ５２～Ｓ５５を設定された時間間隔で繰り返し実行する。これにより環境の状態に応じて接合条件を最適化することができる。つまり、このような処理が繰返されることで行動価値関数の信頼度が高められ、また、信頼性の高い行動価値関数に基づいてより多くの報酬を得るように方策を決定することで接合条件の設定をより最適に決定することが可能となる。

　換言すれば、制御装置２０は、種々の接合条件と当該接合条件の下で得られる接合部との関係を報酬の概念を介して学習し、ユーザの所望する継手特性に応じて適切な接合条件を自動的に決定することができる。したがって、多数の予備実験を必要とせず、また作業者の技術レベルによらずに、最適な接合条件を用いて各種継手を簡単に得ることができる。

　以上、本発明の代表的な実施形態について説明したが、本発明はこれらに限定されるものではなく、種々の設計変更が可能であり、それらも本発明に含まれる。

　　１・・・摩擦攪拌接合（ＦＳＷ）システム、
　１０・・・摩擦攪拌接合（ＦＳＷ）装置、
　２０・・・制御装置、
　３０・・・計測器。

Claims

　摩擦攪拌接合の接合条件を示す入力データに基づいて継手特性の予測値を出力するよう、コンピュータを機能させるための学習済みモデルであって、
　入力層、出力層、及び、前記入力層と前記出力層との間に介在し、非線形の活性化関数で表される複数の隠れユニットを有する隠れ層、を含むニューラルネットワークから構成され、
　前記ニューラルネットワークが、前記継手特性を示す実験データのバラツキを示す情報を用いて、前記実験データと前記予測値との誤差で表される関数を最小化するように重み係数を学習し、
　前記入力層に入力された、摩擦攪拌接合の接合条件を示す入力データに対し、前記学習済みモデルに基づく演算を行い、継手特性の予測値を前記出力層から出力するとともに当該予測値の信頼性を示す情報を出力するよう、コンピュータを機能させるための学習済みモデル。
　前記ニューラルネットワークが、更に前記重み係数のバラツキを示す情報を用いて、前記重み係数を学習し、
　前記予測値に対する前記接合条件の影響度合いを示す情報を更に出力するよう、コンピュータを機能させるための請求項１に記載の予測済みモデル。
　前記ニューラルネットワークは、
　異なる数の隠れユニットを有する複数のモデルのそれぞれについて前記重み係数を学習し、
　前記複数のモデルのうち、予測値と実験データとの誤差が最小となるモデルを予測モデルとする、請求項１又は２に記載の学習済みモデル。
　前記ニューラルネットワークは、
　異なる数の隠れユニットを有する複数のモデルのそれぞれについて前記重み係数を学習し、
　前記複数のモデルを、予測値と実験データとの誤差に基づいて順位付け、
　高順位のモデルから順次組み合わせて生成される新たな複数のモデルのうち、予測値と実験データとの誤差が最小となるモデルを予測モデルとする、請求項１又は２に記載の学習済みモデル。
　摩擦攪拌接合における接合条件を示す観測データを取得する入力部と、
　請求項１～４のいずれかに記載の学習済みモデルを記憶する記憶部と、
　前記観測データの前記学習済みモデルへの適用結果に基づいて摩擦攪拌接合装置の操作量を決定する演算部と、
　決定された前記操作量を前記摩擦攪拌接合装置に指示する出力部と、
　を含む制御装置。
　摩擦攪拌接合における接合条件及び継手特性を示す観測データを取得する入力部と、
　所定の学習アルゴリズムを記憶する記憶部と、
　前記観測データの前記所定の学習アルゴリズムへの適用結果に基づいて摩擦攪拌接合装置の操作量を決定する演算部と、
　決定された前記操作量を前記摩擦攪拌接合装置に指示する出力部と、
　を含む制御装置であって、
　前記所定の学習アルゴリズムは、
　前記摩擦攪拌接合装置の接合条件及び前記継手特性を示す入力データに基づいて前記摩擦攪拌接合装置の適切な操作量を出力するように前記制御装置を機能させるべく、
　入力層、出力層、及び、前記入力層と前記出力層との間に介在し非線形の活性化関数で表される隠れ層を含むニューラルネットワークから構成され、
　前記ニューラルネットワークが、前記接合条件と前記継手特性との関係性を含む価値関数で表される誤差関数を最小化するように重み係数を学習し、
　前記入力層に入力された、摩擦攪拌接合の接合条件を示す入力データに対し、前記学習済みモデルに基づく演算を行い、前記摩擦攪拌接合装置の操作量を前記出力層から出力する、制御装置。
　摩擦攪拌接合を実行する摩擦攪拌接合装置と、
　前記摩擦攪拌接合における接合条件を示す観測データを計測する計測器と、
　請求項５又は６に記載の制御装置と、
　を含む摩擦攪拌接合システム。
　摩擦攪拌接合の接合条件を示す入力データに基づいて継手特性の予測値を出力するようにコンピュータを機能させるための学習済みモデルを生成するニューラルネットワークシステムであって、
　入力層、出力層、及び、前記入力層と前記出力層との間に介在し、非線形の活性化関数で表される複数の隠れユニットを有する隠れ層、を含むニューラルネットワークを含み、
　前記ニューラルネットワークは、
　前記継手特性を示す実験データのバラツキを示す情報を用いて、前記実験データと前記予測値との誤差で表される関数を最小化するように重み係数を学習し、
　前記入力層に入力された、摩擦攪拌接合の接合条件を示す入力データに対し、前記学習済みモデルに基づく演算を行い、継手特性の予測値を前記出力層から出力するとともに当該予測値の信頼性を示す情報を出力する学習済みモデルを生成する
　ように構成されているニューラルネットワークシステム。
　摩擦攪拌接合の接合条件を示す入力データに基づいて継手特性の予測値を出力するようにコンピュータを機能させるための学習用モデルの生成方法であって、
　前記学習済みモデルを生成するための学習用モデルは、入力層、出力層、及び、前記入力層と前記出力層との間に介在し、非線形の活性化関数で表される複数の隠れユニットを有する隠れ層、を含むニューラルネットワークを含み、
　前記ニューラルネットワークにおいて、前記継手特性を示す実験データのバラツキを示す情報を用いて、前記実験データと前記予測値との誤差で表される関数を最小化するように重み係数を学習するステップと、
　前記入力層に入力された、摩擦攪拌接合の接合条件を示す入力データに対し、前記学習済みモデルに基づく演算を行い、継手特性の予測値を前記出力層から出力するとともに当該予測値の信頼性を示す情報を出力する学習済みモデルを生成するステップと、
　を含む、学習用モデルの生成方法。