JP7318383B2

JP7318383B2 - 情報処理プログラム、情報処理方法、及び情報処理装置

Info

Publication number: JP7318383B2
Application number: JP2019134863A
Authority: JP
Inventors: 晃一白幡; アミルハデルバシュ; 安基富田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-07-22
Filing date: 2019-07-22
Publication date: 2023-08-01
Anticipated expiration: 2039-07-22
Also published as: EP3779735A1; CN112288124A; US20210027004A1; US11625517B2; JP2021018683A

Description

本発明は、情報処理プログラム、情報処理方法、及び情報処理装置に関する。

近年、製品の構造にかかる応力の検証、気体や液体の振る舞いの検証等に、構造解析や流体解析のシミュレーションが用いられるようになっている。解析シミュレーションでは、非線形解析ではニュートン法などの反復法が用いられ、各反復において線形ソルバを解く。線形ソルバ自体も反復法で解かれることが多い。

デバイス特性に関する所定の条件を解析に用いる方程式により得た解の行列が線形方程式の収束判定を満たすか否かに応じて収束判定の条件を変更することで、当該解の行列の非線形方程式による収束条件を満たすまでの計算時間を短縮する技術等が知られている。

特開２００３－１６２５１７号公報特開２０１７－１２３１６０号公報特開２０１６－１４６１３９号公報特開２０００－３３９１７９号公報

構造解析や流体解析のシミュレーションでは、非線形解析を行う場合がある。非線形解析ではニュートン法などの反復法では収束条件として残差の閾値があり、シミュレーションの演算時間を高速化するためには、残差閾値を最適な値に設定することが有効であるが、事前に最適な残差閾値を得ることができない。

したがって、１つの側面では、最適な残差閾値の設定を可能とし、非線形解析の反復回数を低減することで、演算時間を短縮することを目的とする。

一態様によれば、１又は複数のコンピュータに、線形解析を反復して非線形解析を行う第１の処理を実行させ、前記第１の処理により複数の実験値で残差閾値ごとに求めた前記線形解析の反復ごとの残差推移と演算時間とに基づいて、ＮＮにより前記線形解析の収束判定に用いる残差閾値を推論させる第２の処理とを実行させ、前記第１の処理と前記第２の処理との間で行われるデータの受け渡しを、メモリに設定された共有メモリを用いたプロセス間通信により行わせることを特徴とする情報処理プログラムが提供される。

また、本開示によれば、情報処理方法、及び情報処理装置が提供される。

最適な残差閾値の設定を可能とし、非線形解析の反復回数を低減することで、演算時間を短縮することができる。

情報処理装置のハードウェア構成例を示す図である。情報処理装置の機能構成例を示す図である。学習処理を説明するための図である。推論処理を説明するための図である。検証結果のグラフを示す図である。第１実施例におけるプロセス間通信によるデータ送受信を説明するための図である。異種プログラム言語間におけるプロセス間通信の概要を説明するための図である。シミュレーションでＡＩが利用される場合のプロセス間通信の概要を説明するための図である。図６における実装例を示す図である。図７における実装例を示す図である。シミュレーション処理を説明するためのフローチャート図である。シミュレーションとの連携において動作する機械学習処理を説明するためのフローチャート図である。シミュレーションのメインプロセスにおけるプロセス間通信に係る処理の一例を説明するための図である。シミュレーションのメインプロセスにおけるプロセス間通信に係る処理の一例を説明するための図である。 Python子プロセスにおけるプロセス間通信に係る処理の一例を説明するための図である。プロセス間通信における状態例を示す図である。オーバーヘッドの検証結果例を示す図である。ディスクへの入出力によるデータサイズごとの検証結果を示す図である。ディスクへの入出力によるデータサイズごとの検証結果を示す図である。非線形解析を説明するための図である。第２実施例における情報処理装置の第１の機能構成例において学習部の概要を説明するための図である。第２実施例における情報処理装置の第１の機能構成例において推論部の概要を説明するための図である。候補閾値ごとのシミュレーション時間の検証例を示す図である。第１の機能構成例における学習処理を説明するためのフローチャート図である。第１の機能構成例における推論処理を説明するためのフローチャート図である。第２実施例における情報処理装置の第２の機能構成例において学習部の概要を説明するための図である。第２実施例における情報処理装置の第１の機能構成例において推論部の概要を説明するための図である。第２の機能構成例における学習処理の第１の例を説明するためのフローチャート図である。第２の機能構成例における推論処理を説明するためのフローチャート図である。第２の機能構成例における学習処理の第２の例を説明するためのフローチャート図である。第２の機能構成例における学習処理の第３の例を説明するためのフローチャート図である。学習処理の第１の例による候補閾値ごとの学習結果を示す図である。図３２のラベル付けに基づく学習結果を示す図である。学習処理の第２の例による候補閾値ごとの学習結果を示す図である。図３４のラベル付けに基づく学習結果を示す図である。学習処理の第２の例による候補閾値ごとの学習結果を示す図である。実行時間の検証結果を示す図である。シミュレーション結果の検証結果を示す図である。閾値の変化例を示す図である。処理時間の経過例を示す図である。反復回数の経過例を示す図である。第２実施例における実行ログの例を示す図である。

以下、本発明の実施の形態を図面に基づいて説明する。構造解析や流体解析のシミュレーションでは非線形方程式の解析（「非線形解析」という）を行うこともあり、非線形解析ではNewton法などを用いて線形ソルバを反復的に解くことで解を求めている。線形ソルバ自体も大規模な問題に対しては反復法（ＣＧ（Conjugate Gradient：共役勾配法）など）を用いて解を求めることが多い。

シミュレーションの演算時間を高速化するために、発明者等は、非線形解析における反復処理の収束条件となる残差閾値の調整方向をＡＩ（Artificial Intelligence：人工知能）に学習させて動的に増加又は減少することによりシミュレーションを実行することを見出した。この場合、線形ソルバの反復処理により収束するまでの時間経過による残差の系列（「残差曲線」又は「残差推移」という）を、シミュレーションプログラムから機械学習プログラムへと渡すことで、残差閾値の学習が行われる。この手法は第２実施例で詳述する。

しかしながら、シミュレーションプログラムと機械学習プログラムとは一般的に言語が異なるため、シミュレーションと学習との間でデータをやり取りするためのファイルアクセスに時間が掛かる。この問題を解決するために、発明者等は、第１実施例によるプロセス間通信を見出した。第２実施例では、動的な残差閾値の調整手法について説明する。

後述される第１実施例～第２実施例は、図１に示すようなハードウェア構成を有する情報処理装置に実装可能であり、第１実施例～第２実施例のいずれか又は両方を実装することにより、シミュレーションの処理速度を改善することができる。

図１は、情報処理装置のハードウェア構成例を示す図である。図１より、情報処理装置１００は、コンピュータであって、ＣＰＵ（Central Processing Unit）１１と、メインメモリ１２と、ディスク１３と、ＧＰＵ（Graphics Processing Unit）１４ｇと、ＧＰＵメモリ１４ｍと、入力装置１５と、表示装置１６と、通信Ｉ／Ｆ１７と、ドライブ装置１８とを有し、バスＢに接続される。このハードウェア構成は、第２実施例においても同様である。

ＣＰＵ１１は、情報処理装置１００全体を制御するプロセッサに相当し、ディスク１３から読み込まれメインメモリ１２（例えば、ＲＡＭ（Random Access Memory））に格納されたシミュレーションプログラムを実行し以下に説明する本実施例における処理を実現する。ＣＰＵ１１は、また、シミュレーション以外の様々な処理を行う。

ＧＰＵ１４ｇは、ＡＩ推論用のプロセッサに相当し、シミュレーションの実行により得られたシミュレーションデータを用いて、本実施例における残差閾値の調整方向を推定するＡＩ推論を行う。ＧＰＵ１４ｍは、ＧＰＵ１４ｇが利用するローカルメモリでありＡＩ推論を行うＮＮ２７０（図３）のプログラムを記憶している。ＡＩ推論は、ＧＰＵ１４ｇがＧＰＵ１４ｍに記憶されたプログラムを実行することにより、ＮＮ２７０の最適なパラメータ値を学習する。

入力装置１５は、ユーザによって操作され、操作に応じてデータを入力し、表示装置１６は、ユーザーインタフェースとして様々な画面を表示する。通信Ｉ／Ｆ１７は、外部装置との通信を制御する。

記憶媒体１９（例えば、ＣＤ－ＲＯＭ（Compact Disc Read-Only Memory）等）に記憶された本実施例に係るシミュレーションプログラムは、ドライブ装置１８を介してディスク１３にインストールされ、ＣＰＵ１１によって実行可能となる。また、機械学習プログラムも同様に記憶媒体１９からドライブ装置１８を介してディスク１３にインストールされ、ＧＰＵ１４ｇによって実行可能となる。

記憶媒体１９（例えば、ＣＤ－ＲＯＭ（Compact Disc Read-Only Memory）等）に記憶された本実施例に係るシミュレーションプログラム及び機械学習プログラムは、ドライブ装置１８を介して記憶部１３０にインストールされ、ＣＰＵ１１によって実行可能となる。シミュレーションプログラム及び機械学習プログラムはそれぞれ別の記憶媒体１９からインストールされてもよい。

尚、本実施例に係るプログラムを格納する記憶媒体１９はＣＤ－ＲＯＭに限定されず、コンピュータが読み取り可能な、構造（structure）を有する１つ以上の非一時的（non-transitory）な、有形（tangible）な媒体であればよい。コンピュータ読取可能な記憶媒体として、ＣＤ－ＲＯＭの他に、ＤＶＤ（Digital Versatile Disk）ディスク、ＵＳＢメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。

［第１実施例］
また、第１実施例では、図２に示すような機能構成を有する情報処理装置１００において、プロセス間通信によりシミュレーションを高速化する手法について説明する。図２は、情報処理装置の機能構成例を示す図である。

図２より、情報処理装置１００は、主に、シミュレーション部３０と、機械学習部４０とを処理部として有する。また、問題データ２、閾値Ｔｈ、シミュレーションデータ２０４ｄ、シミュレーション結果５、推論結果７１等は、第１実施例で説明するように一部を共有メモリ１２ａ（図８）として用いることにより、メインメモリ１２に記憶されるものとして示す。

シミュレーション部３０は、ＣＰＵ１１がシミュレーションプログラムを実行することにより実現される処理部であり、問題データ２に対して所定の解析を行い、主に、非線形解析部３２と、線形解析部３４とを有する。所定の解析とは、構造解析、流体解析等である。シミュレーション部３０によって得られた解析結果は表示装置１６に表示されてもよい。

非線形解析部３２は、問題データ２を読み込んで非線形解析を行う処理部である。非線形解析ではNewton-Raphson法などの反復法を用いて解を得る。非線形解析部３２は、非線形回数を所定の回数分繰り返し、繰り返しごとに、線形解析部３４に、問題データ２から得られるパラメータ値等と、収束判定に用いる閾値Ｔｈ（即ち、残差閾値）とを与え、線形方程式による解析を行わせる。非線形解析によって得られた非線形解析データは、後述されるnonlin_dataに相当する。

線形解析部３４は、閾値Ｔｈを満たすまで線形方程式を用いた解析を反復し、反復ごとの解と閾値Ｔｈとの差分を示す残差と、シミュレーション時間等の線形解析データをメインメモリ１２に出力する。閾値Ｔｈを満たすまで線形方程式を用いた解析を反復する処理には、線形ソルバが用いられる。線形解析部３４によって得られた線形解析データは、後述されるlin_dataに相当する。

非線形解析データは、非線形解析の繰り返しごとに得られるデータであり、また、線形解析データは反復ごとに累積されたデータである。そして、様々なパラメータ値、解等を含む、非線形解析データ及び線形解析データがシミュレーションデータ２０４ｄに相当する。シミュレーションデータ２０４ｄは、ＡＩ推論ごとに機械学習部４０に読み込まれる。

また、シミュレーションの開始から終了までの時間経過で示された実行環境及び実行状態を示すデータの集まりを実行ログ４ａ（図４２）という。実行ログ４ａには、シミュレーションデータ２０４ｄが含まれる。また、問題データ２に対する目的の解をシミュレーション結果５という。

第１実施例では、非線形解析を行うために線形解析を用いる情報処理装置１００において、実験値で閾値Ｔｈごとに求めた反復ごとの残差推移、演算時間などを示すログデータに基づいて残差の閾値Ｔｈを決定する。

機械学習部４０は、線形解析部３４で用いる閾値Ｔｈを調整するＮＮ２７０のパラメータ値を学習する学習部５０と、訓練済みのＮＮ２７０を用いて閾値Ｔｈの増減（調整方向）を推論する推論部６０とを有する。

学習部５０は、図３に示すように、シミュレーションデータ２０４ｄにラベル付けして作成した学習データ６ｇをＮＮ２７０に入力し、ＮＮ２７０が推論したクラスを示す推論結果７１と、学習データ６ｇのラベルとの誤差をＮＮ２７０にフィードバックする。

推論部６０は、訓練済みのＮＮ２７０により閾値Ｔｈの増減を示す推論結果７１を得る。一例として、推論結果７１は、ＮＮ２７０によって分類されるクラス「１」、「２」、及び「３」のいずれかを示すものとする。この場合、クラス「１」は、閾値Ｔｈの増加を指定し（閾値up）、クラス「２」は、閾値Ｔｈの調整不要を指定し（閾値keep）、クラス「３」は、閾値Ｔｈの減少を指定する（閾値down）。

推論部６０は、訓練済みのＮＮ２７０に、シミュレーションデータ２０４ｄに対して残差を小さくするようにクラスを推論する。推論結果７１はメインメモリ１２に記憶され、シミュレーション部３０の非線形解析部３２への戻り値となる。

非線形解析部３２では、推論部６０が推論した推論結果７１に基づいて閾値Ｔｈを更新し線形解析部３４に与える。このような閾値Ｔｈの調整によりシミュレーションに掛かる時間を短縮することが可能となる。

閾値Ｔｈは、反復法での収束条件の一つであり、線形解析部３４への閾値Ｔｈの与え方が解の精度と実行時間に影響を与える。閾値Ｔｈは任意の値に設定しても、非線形解析が収束する限り、最終的な解の精度には影響を与えないと考えられる。しかしながら、最適な残差閾値を高速に推定できれば、非線形解析全体を高速化することが可能となる。

このような観点から、発明者等は、ＮＮ２７０を用いて閾値Ｔｈの増減を学習し、また、訓練済みのＮＮ２７０を用いて、閾値Ｔｈの増減を予測することで、最適値へと閾値Ｔｈを近付けることができ、線形解析が収束するまでの反復回数及び処理時間を短縮できることを見出した。図３及び図４を参照して、情報処理装置１００で行われる処理の概要について説明する。この例では、ＮＮ２７０としてＣＮＮ（Convolutional Neural Network）を用いた場合で説明するが、ＮＮはＣＮＮに限定されるものではない。

図３は、学習処理を説明するための図である。図３において、問題データ２に対して異なる候補閾値を用いたシミュレーションごとのシミュレーションデータ２０４ｄを参照して、反復ごとの残差推移、演算時間等に基づいて候補閾値の中から、学習用に用いる基準閾値を決定する。そして、残差曲線データ４ｄそれぞれには、この基準閾値と候補閾値との差分に基づいてラベル付けを行い、学習データ６ｇとして使用される。候補閾値は、実験値に相当する。

基準閾値より小さい候補閾値を使用したシミュレーションデータ２０４ｄには、ラベル「１」が付与されている。基準閾値より大きい候補閾値を使用したシミュレーションデータ２０４ｄは、ラベル「３」が付与されている。また、基準閾値と一致する候補閾値を使用したシミュレーションデータ２０４ｄには、ラベル「２」が付与されている。即ち、前述した最短時間でシミュレーションが終了したときのシミュレーションデータ２０４ｄに対しては、ラベル「２」が付与される。

シミュレーションデータ２０４ｄをＮＮ２７０に入力することで推論結果７１を得る。一例として、推論結果７１は、閾値Ｔｈを上げるクラス１、閾値Ｔｈを維持するクラス２、及び閾値Ｔｈを下げるクラス３のいずれか１つを示す。推論結果７１は、学習データ６ｇのラベルと比較され、比較結果としての誤差がＮＮ２７０にフィードバックされる。この誤差のフィードバックによりＮＮ２７０のパラメータ値が更新される。訓練済みのＮＮ２７０が、推論部６０で用いられる。

上述では、クラス１、２、及び３に分類する場合を例としたが、閾値Ｔｈを上げる場合とそれ以外の場合のみに分類してもよい。その場合には、学習部５０では、学習時に候補閾値３が基準閾値３ｒｅｆより低い場合にラベル０を付与し、それ以外ではラベル１を付与するようにし、推論結果７１として、クラス０又はクラス１を推論するようにしてもよい。

図４は、推論処理を説明するための図である。図４では、シミュレーション部３０としてＣＰＵ１１を機能させるシミュレーションプログラムの一例として、疑似コード３１を示している。

疑似コード３１において、“call fstr_Newton”により非線形解析が実行されると、非線形解析部３２内で、“call auto_threshold”により、機械学習部４０の推論部６０が呼び出される。推論部６０は、シミュレーションデータ２０４ｄをＮＮ２７０に入力し、推論結果７１を得る。得られた推論結果７１は、“call auto_threshold”の戻り値として非線形解析部３２に渡される。非線形解析部３２は、推論結果７１に基づいて閾値Ｔｈを更新し、“call solve_LINEQ”を実行し、更新された閾値Ｔｈで線形ソルバでの処理が行われる。

“call auto_threshold”による推論結果７１の取得は、線形ソルバの実行ごとに行わなくてもよい。予め定めた線形ソルバの実行回数ごとに、推論結果７１を取得し閾値Ｔｈを更新してもよい。

上述したような構成において、発明者等は、シミュレーションデータ２０４ｄが１ＧＢのデータサイズの場合でオーバーヘッドを検証した。図５は、検証結果のグラフを示す図である。図５において、縦軸に反復ごとのオーバーヘッドを時間（秒）で示し、横軸に反復回数を示している。シミュレーションデータ２０４ｄの入出力によるオーバーヘッドが反復ごとに線形解析の処理時間を示している。

図５のグラフ３ａでは、シミュ―レーションにおける線形解析の反復が８６回の場合、シミュレーションデータ２０４ｄに対するファイルアクセスを伴う処理時間３ｂを示している。この検証結果から、ＮＮ２７０を用いて閾値Ｔｈを調整することで、シミュレーションを高速化できたことが分かる。

ところで、前述したように、シミュレーション部３０を実現するシミュレーションプログラムと、機械学習部４０を実現する機械学習プログラムとは言語が異なっている。一例として、シミュレーションプログラムは、構造解析ソルバであれば、FrontISTR等の科学計算用の手続き型言語のプログラムである。機械学習プログラムについては、Python等のＮＮを構築するスクリプト言語と、Python等から利用可能なライブラリのKeras等では深層学習言語が使用されている。

そのため、シミュレーション部３０のプログラミング言語と、機械学習部４０のうち、ＮＮ２７０を利用するスクリプト言語とは、ＣＰＵ１１で実行され、ＮＮ２７０はライブラリとしてＧＰＵｍに記憶され、ＧＰＵ１５ｇによって実行される。

プログラミング言語とスクリプト言語とはＣＰＵ１１で実行されるがプログラム言語が異なるため、シミュレーションデータ２０４ｄと、推論結果７１とは、通常、ディスク１３に格納し、シミュレーション部３０と機械学習部４０との間のデータの送受信にはファイルアクセスが行われている。このファイルアクセスは、シミュレーション時間を消費する問題がある。ファイルアクセスとは、具体的には、図４において、推論部６０によるシミュレーションデータ２０４ｄの取得と、非線形解析部３２による推論結果７１の取得の際に行われる。

第１実施例では、このファイルアクセスによる処理時間の消費を改善するための仕組みについて図６及び図７で説明する。シミュレーションデータ２０４ｄ等のＮＮ２７０への入力データ及びＮＮからの戻り値である推論結果７１は、共有メモリを介して転送し、ディスク１３へのアクセスを回避する。また、閾値Ｔｈが更新されるまでシミュレーション部３０による共有メモリへのアクセスをブロックする。

図６は、第１実施例におけるプロセス間通信によるデータ送受信を説明するための図である。図６中、点線はデータの流れを示し、実線は処理の流れを示す。以下、情報処理装置１００は、UNIX系のOS（一例として、LINUX等）を実装している場合で説明するが、OSを限定するものではない。

図６において、反復ループを含む高性能（High-Performance Computing、HPC）アプリケーション２３０は、処理の反復ごとにシミュレーションデータ２０４ｄが出力される。シミュレーションデータ２３４ｄは、ここでは、シミュレーション処理の高速化に関する値の調整を行うためにＮＮ２７０に入力するデータである。

高性能アプリケーション２３２は、高性能アプリケーション２３０の一部であり、データ転送機能を有する部分に相当する。高性能アプリケーション２３２は、シミュレーションデータ２０４ｄを共有メモリ１２ａに書き込み（send_data()）、名前付きパイプ１２ｂにデータ転送完了を設定する。具体的には、シミュレーションデータ２０４ｄの先頭アドレスを設定することによりデータ転送完了を示す。

一方、機械学習メインプログラム２５０は、名前付きパイプ１２ｂから先頭アドレスを読み込み、共有メモリ１２ａにアクセスしてシミュレーションデータ２０４ｄを読み込んで、ＮＮ２７０へ入力する。ＮＮ２７０によるＡＩ推論が実行される。機械学習メインプログラム２５０は、ＮＮ２７０から推論結果７１を得ると、名前付きパイプ１２ｂに推論結果７１を設定する。

高性能アプリケーション２３２は、名前付きパイプ１２ｂから推論結果７１を取得し、シミュレーションを続行する。即ち、取得した推論結果７１を用いて閾値Ｔｈを増減又は維持し（X<-get_AI_prediction()）、調整後の閾値Ｔｈ（変数X）を用いて、シミュレーションを継続する（continue_simulation(X)）。

図６において、図２のシミュレーション部３０、非線形解析部３２及び線形解析部３４が、それぞれ、高性能アプリケーション２３０、高性能アプリケーション２３２、及びcontinue_simulation(X)に相当する。また、図２の機会学習部４０は、機械学習メインプログラム２５０により実現される。以下の説明において、同様の図において同様の対応付けとなる。

図７は、異種プログラム言語間におけるプロセス間通信の概要を説明するための図である。図７において、シミュレーション３８は、シミュレーション部３０によって実行される処理であり、仮想メモリアドレス３８ａｄを用いてＯＳ仮想メモリ１２ｖを介してメインメモリ１２にアクセスする。また、機械学習処理４８は、機械学習部４０によって実行される処理であり、仮想メモリアドレス４８ａｄを用いてＯＳ仮想メモリ１２ｖを介してメインメモリ１２にアクセスする。

メインメモリ１２には、シミュレーション３８により仮想メモリアドレス３８ａｄを用いて、ディスク１３からＮＮ２７０の入力データとなるシミュレーションデータ２０４ｄが書き込まれる。また、機械学習処理４８により仮想メモリアドレス４８ａｄを用いてシミュレーションデータ２０４ｄがメインメモリ１２から読み込まれる。

名前付きパイプ１２ｂは、シミュレーションデータ２０４ｄの送受信用に用いる名前付きパイプ１２ｂ－１と、推論結果７１（即ち、戻り値）の出力用に名前付きパイプ１２ｂ－２とを有することが好ましい。

図８は、シミュレーションでＡＩが利用される場合のプロセス間通信の概要を説明するための図である。図８において、メインメモリ１２は、ＣＭ領域１２ｍ－１と、共有メモリ１２ａと、名前付きパイプ領域１２ｐと、ＭＬ領域１２ｍ－２とを有する。

ＣＭ領域１２ｍ－１には、シミュレーションプログラムの命令（以下、「シミュレーション命令」という）と処理にデータとが記憶され、ＭＬ領域１２ｍ－２には、機械学習プログラムの命令（以下、「スクリプト命令」という）とデータとが記憶される。また、共有メモリ１２ａには、ディスク１３からＤＭＡ（Direct Memory Access）によりデータ転送されたシミュレーションデータ２０４ｄが記憶される。名前付きパイプ領域１２ｐは、名前付きパイプ１２ｂ－１と名前付きパイプ１２ｂ－２として利用される領域である。

ＣＰＵ１１は、ＣＭ領域１２ｍ－１から順にシミュレーション命令を実行することでシミュレーションを行い、シミュレーションにより得られたシミュレーションデータ２０４ｄをディスク１３に記憶し、データ転送指示を行う。最新のシミュレーションデータ２０４ｄがＤＭＡにより共有メモリ１２ａへとデータ転送させる。一方、ＣＰＵ１１は、名前付きパイプ領域１２内において名前付きパイプ１２ｂ－１に先頭アドレスを書き込む。

ＣＰＵ１１は、機械学習による閾値Ｔｈの調整の学習時及び推論時には、ＭＬ領域１２、－２から順にスクリプト命令を実行する。ＣＰＵ１１は、ＮＮ２７０に与えるシミュレーションデータ２０４ｄを共有メモリ１２ａから読み出して、入力データとしてＮＮ２７０に与える。ＮＮ２７０は、ＧＰＵ１４ｍを用いるＧＰＵ１４ｇにより実行される。

次に、実装例を図９及び図１０に示す。図９は、図６における実装例を示す図である。図９では、図６に対応付けて、図２の機能構成において実装され得るプログラム言語の例を示している。

高性能アプリケーション２３０及び２３２は、Fortran言語であるFrontISTRでプログラムされ、高性能アプリケーション２３０により繰り返し処理がｎ回行われた場合、シミュレーションデータ２０４ｄは、非線形解析の繰り返し（iteration 0 to n-1）ごとの線形解析の残差推移を示すログを含む。また、機械学習メインプログラム２５０は、スクリプト言語のPythonでプログラムされ、Keras等のＡＰＩ（Application Programming Interface）を介してGoogle社製のTensorflowなどによるＮＮ２７０を利用する。

図１０は、図７における実装例を示す図である。図１０では、シミュレーション３８は、ニュートン・ラフソン法に基づく処理（ニュートン・ラフソン処理）がFortran、C、又はC++等によりプログラムされ実装される。機械学習処理４８は、深層学習処理がPython等によりプログラムされ実装される。

次に、プロセス間通信による情報処理装置１００の処理について図１１及び図１２で説明する。図１１及び図１２において、名前付きパイプ１２ｂ－１を“sync”で指定し、名前付きパイプ１２ｂ－２を“return”で指定する。図１１は、シミュレーション処理を説明するためのフローチャート図である。

図１１より、シミュレーション部３０は、シミュレーションプロセスを開始すると、共有メモリ１２ａを設定し（ステップＳ３１１）、Pythonプロセスを起動する（fork）（ステップＳ３１２）。共有メモリ１２ａは、メモリマップトファイルによりＯＳ仮想メモリ１２ｖに展開される。そして、機械学習部４０による機械学習が開始する（図１２）。

そして、非線形解析部３２は、非線形解析部３２により非線形解析ループを開始し（ステップＳ３１３）、ＡＩ推論を行うか否かを判定する（ステップＳ３１４）。第１実施例において、ＡＩ推論とは、残差の閾値Ｔｈの増減を予測する機械学習処理に相当する。また、ＡＩ推論の要否判定の一例として、図４に例示したような“call auto_threshold”による機械学習処理の呼び出しのイベントがあったか否かを判定すればよい。

ＡＩ推論を行わない場合（ステップＳ３１４のＮＯ）、シミュレーション部３０は、線形ソルバを実行する（ステップＳ３１５）。線形解析部３４により線形解析が行われる。その後、シミュレーション部３０は、ステップＳ３１３へと戻り、非線形解析を繰り返す。一方、ＡＩ推論を行う場合（ステップＳ３１４のＹＥＳ）、非線形解析部３２は、名前付きパイプ“sync”に接続して、ロック解除を待つ（ステップＳ３１７）。

非線形解析部３２は、ロック解除を検出すると、シミュレーションデータ２０４ｄを共有メモリ１２ａにコピーする（書き込む）（ステップＳ３１８）。共有メモリ１２ａにシミュレーションデータ２０４ｄがＤＭＡデータ転送により書き込まれる。一方で、非線形解析部３２は、機械学習部４０を呼び出して調整要求を行う。

その後、非線形解析部３２は、名前付きパイプ“return”から推論結果７１を読み込んで取得し（ステップＳ３２１）、得られた推論結果７１を用いて更新した閾値Ｔｈで線形ソルバを実行する（ステップＳ３２２）。線形ソルバの処理が終了すると、非線形解析部３２は、ステップＳ３１３へと戻り、上述した同様の処理を繰り返す。

図１２は、シミュレーションとの連携において動作する機械学習処理を説明するためのフローチャート図である。図１２において、機械学習部４０は、Pythonでプログラムされているとする。シミュレーションプロセスからのPythonプロセスの開始に応じて、機械学習部４０による機械学習処理が開始される（ステップＳ４１０）。また、以下の説明では推論部６０による推論処理が行われる場合で説明する。学習部５０の学習処理については、第２実施例で詳述する。

機械学習部４０は、共有メモリ１２ａを設定し（ステップＳ４１１）、推論部６０は、訓練済みモデルをロードする（ステップＳ４１２）。共有メモリ１２ａは、シミュレーションプロセスと同じメモリマップトファイルにより設定される。練済みモデルとは、学習部５０により訓練済みのＮＮ２７０に相当する。

そして、推論部６０は、無限ループを開始する（ステップＳ４１３）。無限ループの開始により、名前付きパイプ“sync”に接続する（ステップＳ４１４）。名前付きパイプ“sync”への接続により、非線形解析部３２へロック解除が通知される。推論部６０は、新たな調整要求があるか否かを判断する（ステップＳ４１５）。

推論部６０は、ＮＮ２７０にするためにシミュレーションデータ２０４ｄから入力データを構築し（ステップＳ１７）、入力データをＮＮ２７０へと入力して閾値Ｔｈの調整方向を推論する（ステップＳ４１８）。

次に、プロセス間通信を例を用いて説明する。図１３及び図１４は、シミュレーションのメインプロセスにおけるプロセス間通信に係る処理の一例を説明するための図である。

図１３より、シミュレーション部３０は、シミュレーションの開始時に共有メモリ１２ａを設定する（ステップＳ３５１）。そして、シミュレーション部３０は、Pythonプロセスを起動（fork）する（ステップＳ３５２）。Python子プロセスが起動し、Python子プロセスと共有メモリ１２ａを共有するために、共有メモリアドレスとタイミングとが通知される。タイミングは、調整要求が行われるタイミングを指定する。タイミングが２を示す場合、非線形解析を２回行うごとに調整要求がなされることを示す。

シミュレーション部３０は、線形解析用の閾値lin_thを初期化する（ステップＳ３５３）。閾値lin_thは、図２の閾値Ｔｈに相当する変数である。閾値lin_thの初期設定値は、シミュレーション部３０のプログラムに組み込まれていても良いし、シミュレーション開始時に、ユーザにより設定されてもよい。

閾値lin_thが初期設定されると、シミュレーションループが開始される（ステップＳ３５４）。即ち、非線形解析部３２による非線形解析処理が、定めた回数（#nonlin_iter）分繰り返されるように、繰り返し回数を示すイテレーションの値に#nonlin_iterが設定される。#nonlin_iterの初期値は０であるため、初期設定時にはイテレーションの値に０が設定される。そして、非線形解析部３２は、前処理を実行する（ステップＳ３５５）。具体的な前処理の内容は、ステップＳ３５６からＳ３６１で説明する。

イテレーションの値が０であるか否かが判断される（ステップＳ３５６）。同時に、機械学習部４０へ閾値Ｔｈの調整要求が送信される。イテレーションの値が０である場合（ステップＳ３５６のＹＥＳ）、非線形解析部３２は、ステップＳ３６２へと進む。

一方、イテレーションの値が０でない場合（ステップＳ３５６のＮＯ）、非線形解析部３２は、ライトモードで名前付きパイプ“sync”をオープンする（ステップＳ３５７）。非線形解析部３２は、機械学習部４０からのロック解除を待って、共有メモリ１２ａへの書き込みを開始する。

ロック解除の検出に応じて、非線形解析部３２は、共有メモリ１２ａにシミュレーションデータ２０４ｄを書き込む（ステップＳ３５８）。ディスク１３に蓄積されたシミュレーションデータ２０４ｄが共有メモリ１２ａにＤＭＡデータ転送によりコピーされる。

次に、非線形解析部３２は、以下のＷ１～Ｗ４の手順で共有メモリ１２ａへの書き込みを行う。以下の説明において、共有メモリ１２ａが２４（＝４×６）セルの例で説明するが、このメモリサイズに限定するものではない。

また、addresss_1は#nonlin_iter（非線形解析の繰り返し回数）が記憶されるセルのアドレスを示し、addresss_2は#lin_iter（線形解析の反復回数）が記憶されるセルのアドレスを示し、addresss_3は非線形解析データの先頭アドレスを示す。非線形解析データは、非線形解析を繰り返すごとに蓄積されるため、セル数が累積される。そのため、線形解析データの開始アドレスは、addresss_3に#nonlin_iterを加算した値で示される。

Ｗ１：addresss_3から非線形データを書き込む。
Ｗ２：addresss_3に#nonlin_iterを加算したアドレスから線形データを書き込む。
Ｗ３：addresss_1に#nonlin_iterを記憶する。#nonlin_iterが更新される。
Ｗ４：addresss_2に#lin_iterを記憶する。#lin_iterが更新される。
非線形データ及び線形データを書き込み後に、カウンタとなる#nonlin_iter及び#lin_iterを更新する。Ｗ１～Ｗ４の終了で、新たなデータの書き込みが完了したこととなる。

図１４より、非線形解析部３２は、リードモードで名前付きパイプ“return”をオープンする（ステップＳ３５９）。機械学習部４０によるロック解除に応じて、非線形解析部３２は、名前付きパイプ“return”から値を読み出して今回の推論結果７１を取得する（ステップＳ３６０）。

そして、非線形解析部３２は、得られた推論結果と前回の閾値lin_thとから、今回の閾値lin_thを取得する（ステップＳ３６１）。一例として、閾値lin_thを推論結果に基づいて更新する処理部（algorithm）を備えるようにすればよい。

更新により今回の閾値lin_thを取得すると、ステップＳ３５６の条件節を抜けて、非線形解析部３２は、線形解析部３４に線形解析を行わせ、線形解析結果を得る（ステップＳ３６２）。線形解析部３４に対して今回の閾値lin_thが通知される。そして、繰り返し回数iterationを１インクリメントする（ステップＳ３６４）。

非線形解析部３２は、非線形解析が収束条件に達したか否かを判断する（ステップＳ３６４）。非線形解析が収束条件に達していない場合（ステップＳ３６４のＮＯ）、非線形解析部３２は、図１３のステップＳ３５６へと戻り、上述した同様の処理を繰り返す。一方、非線形解析が収束条件に達した場合（ステップＳ３６４のＹＥＳ）、非線形解析部３２は、シミュレーションループを終了する。

シミュレーションループが終了すると、シミュレーション部３０は、ライトモードで名前付きパイプ“sync”をオープンする（ステップＳ３６５）。そして、このメインプロセスが終了する。

図１５は、Python子プロセスにおけるプロセス間通信に係る処理の一例を説明するための図である。図１５において、シミュレーション部３０からの共有メモリアドレスとタイミングとの通知に応じて、Python子プロセスが起動し、Python子プロセス内で、機械学習部４０による閾値Ｔｈの調整に係る機械学習が行われる。

機械学習部４０は、シミュレーション部３０から通知された共有メモリアドレスに基づいて、共有メモリ１２ａを設定し（ステップＳ４７１）、訓練済みモデルをロードする（ステップＳ４７２）。そして、機械学習部４０による無限ループが開始される（ステップＳ４７３）。各無限ループにおいて行われる処理内容は、ステップＳ４７４～Ｓ４８３で説明する。

機械学習部４０は、リードモードで名前付きパイプ“sync”をオープンする（ステップＳ４７４）。シミュレーションメインプロセス（シミュレーション部３０）にロック解除が通知される。機械学習部４０は、新たな調整要求の有無判定ループを行う（ステップＳ４７５）。

即ち、機械学習部４０は、解析回数を示す#nonlin_iterと#lin_iterとを共有メモリ１２ａから読み出して（ステップＳ４７６）、データが書き込まれているか否かを判定する（ステップＳ４７７）。具体的には、以下のような処理を行う。

#nonlin_iterが前回の非線形解析回数にタイミングを加算した値に一致しない（条件Ａ）、又は、#lin_iterが前回の線形解析回数と一致する場合（条件Ｂ）、カウントを１インクリメントする。条件Ａと条件Ｂの両方が成立する場合、又は、カウントの更新後、現在のカウントが設定値（例えば、“1000”）以上の場合、機械学習部４０は、新たな調整要求はないと判断し、Pythonプログラムを終了する。

一方、条件Ａ及び条件Ｂが成立しない場合、即ち、データの書き込みが確認できた場合、機械学習部４０は、新たな調整要求があると判断し、この新たな調整要求の有無判定ループから抜けて（ステップＳ４７８）、共有メモリ１２ａからデータを読み込む（ステップＳ４７９）。

推論部４０は、推論に用いる入力データを構築し（ステップＳ４８０）、ＮＮ２７０を用いて閾値Ｔｈの調整を推論する（ステップＳ４８１）。ＮＮ２７０は、Kerase等であり、ＧＰＵ１４ｇで動作する。推論部４０から推論結果７１が出力される。

機械学習部４０は、ライトモードで名前付きパイプ“return”をオープンし（ステップＳ４８２）、“return”モードで推論結果を名前付きパイプ“return”に書き込む。その後、無限ループを終了させて、機械学習部４０による処理を終了する。Python子プロセスが終了する。

図１６は、プロセス間通信における状態例を示す図である。調整要求が行われるタイミングは２であるとする。図１６（Ａ）では、シミュレーションが４回繰り返された直後の共有メモリ１２ａの状態例を示している。共有メモリ１２ａ内には、#nonlin_iterは４回を示し、非線形解析データは４個のセルに書き込まれている。また、#lin_iterは１２回を示し、線形解析データは１２個のセルに書き込まれている。

機械学習部４０の状態は、現在の#nonlin_iterは２回であると認識し、#lin_iterは６回であると認識しているものとする。タイミングは２であるとする。この場合、現在の#nonlin_iter「２回」とタイミング「２」とを加算して得た値「４」が、共有メモリ１２ａの#nonlin_iter「４回」と一致する。また、現在の#lin_iter「６回」と#lin_iter「１２回」とは一致しない。この場合に新たな調整要求があったと判定する。

図１６（Ｂ）では、シミュレーションによりデータ書き込まれたが、カウンタ更新されていない状態例を示している。共有メモリ１２ａ内には、#nonlin_iterは４回を示し、非線形解析データは６個のセルに記憶されている。また、#lin_iterは１２回を示し、線形解析データは１６個のセルに記憶されている。

非線形解析を２回行って、それぞれの結果が各セルに書き込まれ、合計６個のセルが利用されている状態である。図１６（Ａ）で更新された閾値Ｔｈを用いて、線形解析が２回実行され、実行ごとに２個のセルに線形解析データが書き込まれるため、前回までのデータを含めて全体で１６個のセルが利用された状態である。#lin_iterは未更新の状態である。

機械学習部４０の状態は、現在の#nonlin_iterは４回であると認識し、#lin_iterは１２回であると認識している。この場合、現在の#nonlin_iter「４回」とタイミング「２」とを加算して得た値「６」が、共有メモリ１２ａの#nonlin_iter「４回」と一致しない。一方、現在の#lin_iter「１２回」と#lin_iter「１２回」とは一致する。この場合には新たな調整要求はないと判定する。

図１６（Ｃ）では、データ書き込み完了後、シミュレーションがカウンタを共有メモリに記憶した状態例を示している。共有メモリ１２ａ内には、#nonlin_iterは６回に更新されている。また、#lin_iterは１６回に更新されいる。

機械学習部４０の状態は、現在の#nonlin_iterは４回であると認識し、#lin_iterは１２回であると認識している。この場合、現在の#nonlin_iter「４回」とタイミング「２」とを加算して得た値「６」が、共有メモリ１２ａの#nonlin_iter「６回」と一致する。また、現在の#lin_iter「１２回」と#lin_iter「１２回」とは一致する。この場合には新たな調整要求があったと判定する。

図１７は、オーバーヘッドの検証結果例を示す図である。図１７において、横軸にシミュレーション（即ち、非線形解析）の繰り返し回数を示し、縦軸に繰り返し当たりのオーバーヘッドの時間を示している。

動作環境は、データサイズは１ＧＢの場合に、オーバーヘッド１７ａは、第１実施例による共有メモリ１２ａを用いて、シミュレーション部３０と機械学習部４０との間で共有するデータをメモリマップトファイルとしたことによるオーバーヘッドを示し、オーバーヘッド１７ｂは、ディスク１３への入出力により掛かったオーバーヘッドを示している。

オーバーヘッド１７ｂの合計と、第１実施例におけるオーバーヘッド１７ａから、第１実施例により、オーバーヘッドを削減できたことが分かる。

更に、データサイズの違いによりオーバーヘッドを検証した結果を図１８及び図１９で示す。

図１８は、ディスクへの入出力によるデータサイズごとの検証結果を示す図である。図１８では、データサイズごとの、オーバーヘッドとシミュレーションのそれぞれの時間と、オーバーヘッドが全時間に占める割合とが示されている。

図１９は、ディスクへの入出力によるデータサイズごとの検証結果を示す図である。図１８では、データサイズごとの、オーバーヘッドとシミュレーションのそれぞれの時間と、オーバーヘッドが全時間に占める割合とが示されている。

上述したように、機械学習を用いたシミュレーションにおいて、第１実施例による処理時間を明らかに短縮することができる。

以下に、第２実施例において、機械学習による閾値Ｔｈの調整精度を向上させる仕組みについて詳述する。

［第２実施例］
第２実施例では、線形解析を反復的に解くことで解を求める非線形解析による、構造解析、流体解析等のシミュレーションにおいて、シミュレーションの実行状況に応じて、線形解析における収束判定に用いる閾値Ｔｈを、機械学習により動的に調整する。

図２０は、非線形解析を説明するための図である。線形解析を行う線形ソルバでは反復法にＣＧ法を用いて解を求めることが多い。図２０より、反復用では、収束条件を満たすまで解ベクトルｘを繰り返し更新していく。収束条件の一つに残差の閾値Ｔｈが用いられる。残差は、残差ベクトルｒのノルムで表され、残差ベクトルｒは、ｒ_０＝ｂ－Ａｘで初期化される。この残差が閾値Ｔｈ以下になった時点で解ベクトルｘが収束したとみなされ反復を終了する。

閾値Ｔｈは、解の精度と実行時間に影響を与える。閾値を小さくするほど解の精度が高くなるが、反復回数が増加して実行時間が増加するため、求める精度の解をできるだけ少ない反復回数で得られるような閾値を設定することが好ましい。しかしながら、閾値Ｔｈは、経験則又はヒューリスティックに基づいたユーザの判断によって設定されている。したがって、最適な残差の閾値Ｔｈを機械学習により高速に推定し、非線形解析全体（即ち、シミュレーション全体）を高速化する手法について説明する。

図２１は、第２実施例における情報処理装置の第１の機能構成例において学習部の概要を説明するための図である。図２１において、情報処理装置１００は、主に、シミュレーション部３０と、機械学習部４０とを有する。メインメモリ１２には、問題データ２、ログデータ４ｃ、候補閾値３、基準閾値３ｒｅｆ、学習データ６ｇ等を記憶する。メインメモリ１２の一部が共有メモリ１２ａとして利用されることは、第１実施例で説明した通りである。

シミュレーション部３０は、図２で説明したように、非線形解析部３２と、線形解析部３４とを有し、線形解析の反復ごとの残差と時刻とを取得し、ログデータ４ｃを出力する。ログデータ４ｃには、閾値Ｔｈ内に残差が収束するまで反復して実行された線形解析時の残差と時間とが非線形解析の所定の繰り返し回数分記録されている。

また、シミュレーション部３０は、学習部５０から呼び出された場合には、学習部５０から与えられた閾値Ｔｈ固定でシミュレーションを行う。即ち、機械学習を用いないシミュレーションが行われる。具体的には、図４の疑似コード３１内の“call auto_threshold”を無効にしてシミュレーションが行われる。

機械学習部４０は、図４に示すようにＮＮ２７０により閾値Ｔｈの調整を学習する学習部５０と、シミュレーション中の閾値Ｔｈの調整を行う推論部６０とを有する。推論部６０については図２２で説明する。

学習部５０は、シミュレーション部３０が、問題データ２ごとに、候補閾値３の複数の候補閾値３のそれぞれを与えて得られたログデータ４ｃを用いて、閾値Ｔｈを調整するＮＮ２７０を学習する。複数の候補閾値３のそれぞれをシミュレーション部３０に与えてシミュレーションを行わせてログデータ４ｃ取得しておく。又は、学習部５０が、複数の候補閾値３のそれぞれに対してシミュレーションを行わせる処理部を有するようにしてもよい。

学習部５０は、選択した候補閾値３をシミュレーション部３０に与えることで、シミュレーション部３０に、問題データ２に対するシミュレーションを行わせる。シミュレーション部３０は、線形解析の反復ごとに掛かった時間と残差ｒとを表すログデータ４ｃを出力する。候補閾値３ごとに得られたログデータ４ｃを得られる。ログデータ４ｃの入出力には、第１実施例で説明したような共有メモリ１２ａを用いた同様のプロセス間通信で行ってもよい。

学習部５０は、候補閾値３ごとに得られたログデータ４ｃを参照して、反復ごとの残差推移、演算時間などを用いて、候補閾値３の中から基準閾値３ｒｅｆを決定し、メインメモリ１２に記憶する。

学習部５０は、ログデータ４ｃごとに、基準閾値３ｒｅｆに基づいてラベルを付与し、学習データ６ｇを作成する。ラベル付けは、ログデータ４ｃの候補閾値３と基準閾値３ｒｅｆとの比較結果に基づいて行われる。

ラベル付けの一例として、基準閾値３ｒｅｆより小さい候補閾値３のログデータ４ｃにはラベル「１」を付与し、基準閾値３ｒｅｆより大きい候補閾値３のログデータ４ｃにはラベル「３」を付与する。学習部５０は、基準閾値３ｒｅｆと一致する候補閾値３を使用したログデータ４ｃには、ラベル「２」を付与する。

学習部５０では、学習データ６ｇから入力データ６ｇを構築しＮＮ２７０に入力し推論結果７１を得ると、学習データ６ｇに付与されているラベルと比較して得られた誤差がＮＮ２７０にフィードバックされる。学習部５０は、シミュレーション部３０よって得られた全てのログデータ４ｃを用いてＮＮ２７０を学習する。

図２２は、第２実施例における情報処理装置の第１の機能構成例において推論部の概要を説明するための図である。図２２において、情報処理装置１００では、推論時には、主に、シミュレーション部３０と、機械学習部４０の推論部６０とが動作する。メインメモリ１２には、問題データ２、ログデータ４ｃ、シミュレーション結果５、閾値Ｔｈ、推論結果７１等を記憶する。ここでは推論部６０について説明する。

シミュレーション部３０は、未知の問題データ２を解析し、得られたログデータ４ｃを出力する。ログデータ４ｃは、第１実施例におけるシミュレーションデータ２０４ｄに相当し、メモリマップトファイルとして扱えばよい。ログデータ４ｃは、共有メモリ１２ａに記憶され、名前付きパイプ１２ｂ－１にログデータ４ｃの先頭アドレスが指定される。

推論部６０は、シミュレーション部３０の非線形解析部３２からの呼び出しに応じて、シミュレーション部３０によって得られたログデータ４ｃを用いて、訓練済みのＮＮ２７０を用いて閾値Ｔｈの増減を推論し、得られた推論結果７１を出力する。推論結果７１は、非線形解析部３２へと戻り値として通知される。戻り値は、名前付きパイプ１２ｂ－２に設定されればよい（図７、図１１）。

次に、基準閾値３ｒｅｆの決定例について説明する。一例として、予め、候補閾値ごとのシミュレーション時間を検証し、得られた実行時間のうち最短の実行時間であった候補閾値３を基準閾値３ｒｅｆに設定すればよい。

図２３は、候補閾値ごとのシミュレーション時間の検証例を示す図である。

それぞれの候補閾値３でシミュレーションを行ったときのシミュレーション時間から、最も短かった候補閾値が基準閾値３ｒｅｆに設定される。このように定めた基準閾値３ｒｅｆを境界として、境界に基づいて閾値の変更を決定する。

図２４は、第１の機能構成例における学習処理を説明するためのフローチャート図である。図２４において、機械学習部４０では、学習部５０が、複数の候補閾値３を順にシミュレーション部３０に与え、シミュレーションを行わせて、候補閾値３ごとのログデータ４ｃを取得する（ステップＳ１１１０）。ログデータ４ｃは、線形解析の反復ごとの残差とシミュレーションの実行時間とを含む。

ログデータ４ｃを取得すると、学習部５０は、複数のログデータ４ｃの中から、最短時間でシミュレーションを終了した候補閾値３を特定する（ステップＳ１１２０）。そして、学習部５０は、特定した候補閾値３を基準閾値３ｒｅｆとして設定し、基準閾値３ｒｅｆと、候補閾値３との大小関係に基づいて、ログデータ４ｃにラベル付けを行って学習データ６ｇを生成する（ステップＳ１１３０）。

学習部５０は、生成した学習データ６ｇを用いてＮＮ２７０を学習する（ステップＳ１１５０）。学習部５０は、複数の問題データ２に対して、候補閾値３の異なる学習データ６ｇを用いた学習を終えると、この学習処理を終了する。

一方、シミュレーション３０では、閾値候補３の受信に応じてシミュレーションを開始し、問題データ２を１つ読み込んで、閾値候補３を閾値Ｔｈに設定する。そして、非線形解析部３２が非線形解析の前処理を行う（ステップＳ２０１１）。

次に、線形解析部３４が前処理を行ったのち（ステップＳ２０１２）、線形解析による近似解を計算し（ステップＳ２０１３）、得られた残差と時刻とをメインメモリ１２に記憶する（ステップＳ２０１４）。線形解析部３４は、閾値Ｔｈ（＝候補閾値３）を用いて線形解析の解が収束したか否かの収束判定を行う（ステップＳ２０１５）。収束していないと判定した場合（ステップＳ２０１５のＮＯ）、線形解析部３４は、ステップＳ２０１３へと戻り上述した同様の処理を繰り返す。

収束したと判定した場合（ステップＳ２０１５のＹＥＳ）、非線形解析部３２は、非線形解析の後処理（近似解の計算）を行い（ステップＳ２０１６）、非線形解析の解が収束したか否かの収束判定を行う（ステップＳ２０１７）。非線形解析の収束判定では、非線形解析用の閾値を用いて判定する。

その結果、収束していないと判定した場合（ステップＳ２０１７のＮＯ）、非線形解析部３２は、ステップＳ２０１１へと戻り上述した同様の処理を繰り返す。一方、収束したと判定した場合（ステップＳ２０１７のＹＥＳ）、シミュレション部３０は、シミュレーション終了時刻をメインメモリ１２に記憶して、このシミュレーションを終了する。シミュレーション終了時には、残差を０とし、シミュレーション終了時刻を記憶してもよい。

シミュレーション部３０は、機械学習部４０の学習部５０に、問題データ２それぞれのシミュレーションの終了ごとに終了を通知してもよいし、最後の候補閾値３に対するシミュレーションが終了してから終了を通知してもよい。或いは、シミュレーション部３０は、問題データ２と候補閾値３の全ての組み合せに対してログデータ４ｃを出力してから、学習部５０にシミュレーションの終了を通知してもよい。第２実施例における他の機能構成例についても同様である。

図２５は、第１の機能構成例における推論処理を説明するためのフローチャート図である。図２５において、シミュレーション部３０の起動時に、ミュレーション時間はリセットされ、時間計測が開始される。

シミュレーション部３０は、シミュレーション開始時に閾値Ｔｈを初期設定し、非線形解析部３２は、非線形解析の前処理を行う（ステップＳ３０１１）。そして、線形解析部３４は、線形解析の前処理を行い（ステップＳ３０１２）、線形解析の近似解を計算し（ステップＳ３０１３）、閾値Ｔｈを用いて線形解析の解が収束したか否かの収束判定を行う（ステップＳ３０１４）。収束していないと判定した場合（ステップＳ３０１４のＮＯ）、線形解析部３４は、ステップＳ３０１３へと戻り上述した同様の処理を繰り返す。

収束したと判定した場合（ステップＳ３０１４のＹＥＳ）、非線形解析部３２は、非線形解析の後処理（近似解の計算）を行い（ステップＳ３０１５）、非線形解析の解が収束したか否かの収束判定を行う（ステップＳ３０１６）。非線形解析の収束判定では、非線形解析用の閾値を用いて判定する。

その結果、収束していないと判定した場合（ステップＳ３０１６のＮＯ）、非線形解析部３２は、調整要求を発行し、推論部６０に閾値Ｔｈの調整を推論させて、得られた推論結果７１を用いて閾値Ｔｈを更新し（ステップＳ３０１７）、ステップＳ３０１１へと戻り上述同様の処理を繰り返す。収束したと判定した場合（ステップＳ３０１６のＹＥＳ）、非線形解析部３２は、ステップＳ３０１３へと戻り上述した同様の処理を繰り返す。

一方、推論部６０は、調整要求に応じて、直近で得られたログデータ４ｃから現在の線形解析の閾値Ｔｈが基準閾値３ｒｅｆより低いか高いかを訓練済みＮＮ２７０を用いて推論する（ステップＳ４０１０）。推論部６０は、得られた推論結果７１を出力し（ステップＳ４０２０）、この推論処理を終了する。

上記第１の機能構成例では、ログデータ４ｃをそのまま用いたが、ログデータ４ｃを定めた区間ごとに区切って学習させることによりデータ拡張を行い、第１の機能構成例における閾値Ｔｈの調整精度を向上させ得ることを可能とする。

第１の機能構成例では、クラス１、２、及び３に分類する場合を例としたが、閾値Ｔｈを上げる場合とそれ以外の場合のみに分類してもよい。その場合には、学習部４０では、学習時に候補閾値３が基準閾値３ｒｅｆより低い場合にラベル０を付与し、それ以外ではラベル１を付与するようにし、推論結果７１として、クラス０又はクラス１を推論するようにしてもよい。また、非線形解析部３２は、内部に線形ソルバを含むような定常解析であってもよい。以下の第２の機能構成例においても同様である。

図２６は、第２実施例における情報処理装置の第２の機能構成例において学習部の概要を説明するための図である。図２６中、図２１と同様の処理部及びデータには同様の符号を付し、それらの説明を省略する。第２実施例では、残差曲線を一定区間ごとに区切ることで複数の入力データを作成し学習する。ログデータ４ｃに含まれる残差曲線を表すデータを残差曲線データ４ｄというものとする。

学習部５０は、第１の機能構成例と同様に、シミュレーション部３０が、問題データ２ごとに、候補閾値３の複数の候補閾値３のそれぞれを与えて得られた複数の残差曲線データ４ｄのから基準閾値３ｒｅｆを決定する。学習部５０は、最短時間でシミュレーションを終了した候補閾値３を特定し、基準閾値３ｒｅｆとする。また、学習部５０は、残差曲線データ４ｄの候補閾値３が基準閾値３ｒｅｆより小さいか否かに基づいてラベルを決定する。

その後、第２の機能構成例では、学習部５０は、残差曲線データ４ｄを定めた区間ごとに区切って複数の入力データ６ａを作成し、複数の入力データ６ａのそれぞれに、残差曲線データ４ｄに対して決定したラベルを付与して、複数の学習データ６ｇを生成する。ラベル付けは上述した通りである。

学習部５０は、生成した一つ一つの学習データ６ｇをＮＮ２７０に入力して得られた推測結果７１と学習データ６ｇに付与されたラベルとの誤差を、ＮＮ２７０にフィードバックし、ＮＮ２７０の正解精度を改善する。

図２７は、第２実施例における情報処理装置の第１の機能構成例において推論部の概要を説明するための図である。図２７において、情報処理装置１００では、推論時には、主に、シミュレーション部３０と、機械学習部４０の推論部６０とが動作する。メインメモリ１２には、問題データ２、残差曲線データ４ｄ、閾値Ｔｈ、推論結果７１等を記憶する。メインメモリ１２の一部が共有メモリ１２ａとして利用されることは、第１実施例で説明した通りである。ここでは推論部６０について説明する。

シミュレーション部３０は、残差曲線データ４ｄを出力し、推論部６０は、シミュレーション部３０の非線形解析部３２からの調整要求に応じて、シミュレーション部３０によって得られた残差曲線データ４ｄを用いて、訓練済みのＮＮ２７０により閾値Ｔｈの増減を推論し、得られた推論結果７１を出力する。推論結果７１は、非線形解析部３２へと戻り値として通知される。

訓練済みのＮＮ２７０を用いる際に、推論部６０は、シミュレーション部３０の非線形解析部３２からの調整要求に応じて、シミュレーション部３０によって得られた残差曲線データ４ｄを用いて、訓練済みのＮＮ２７０により閾値Ｔｈの増減を推論し、得られた推論結果７１を出力する。推論結果７１は、非線形解析部３２へと戻り値として通知される。

図２８は、第２の機能構成例における学習処理の第１の例を説明するためのフローチャート図である。図２８中、図２４と同様の内容には同一ステップ番号を付し、その説明を省略する。図２８において、機械学習部４０では、学習部５０が、複数の候補閾値３を順にシミュレーション部３０に与え、シミュレーションを行わせて、候補閾値３ごとの残差曲線データ４ｄを取得する（ステップＳ１１１０）。残差曲線データ４ｄは、線形解析の反復ごとの残差とシミュレーションの実行時間とを含む。

残差曲線データ４ｄを取得すると、学習部５０は、複数の残差曲線データ４ｄの中から、最短時間でシミュレーションを終了した候補閾値３を特定する（ステップＳ１１２０）。そして、学習部５０は、特定した候補閾値３を基準閾値３ｒｅｆとして設定し、基準閾値３ｒｅｆと、候補閾値３との大小関係に基づいて、残差曲線データ４ｄに対するラベルを決定する（ステップＳ１１３１）。

学習部５０は、残差曲線を一定区間ごとに区切って複数の入力データ６ａを作成し、作成した複数の入力データのそれぞれにＳ１１３０で決定したラベルを付与して、学習データ６ｇを生成する（ステップＳ１１４０）。

シミュレーション３０による処理は、第１の機能構成例における処理（図２４）と同様であるため、その説明を省略する。

図２９は、第２の機能構成例における推論処理を説明するためのフローチャート図である。図２９中、図２５と同様の内容には同一ステップ番号を付し、その説明を省略する。第２の機能構成例では、シミュレーション部３０による、推論結果７１を用いた、閾値Ｔｈの調整例について説明する。推論部６０による処理は第１の機能構成例と同様であるため、その説明を省略する。

図２９において、非線形解析部３２は、残差曲線データ４ｄを指定して調整要求を調整部６０に行うことで、調整部６０から得た推論結果７１に従って、線形解析の残差閾値の変化率ｎ又は１／ｎで閾値Ｔｈを調整し（ステップＳ３０１８）、ステップＳ３０１１へと戻り上述同様の処理を繰り返す。

ステップＳ３０１８では、具体的には、変化率ｎ（ｎは２以上の自然数）を用いて、推論結果７１が閾値Ｔｈを上げることを示す場合、非線形解析部３２は、閾値Ｔｈをｎ倍する。一方、下げる場合、非線形解析部３２は、閾値Ｔｈを１／ｎ倍（変化率の逆数倍）する。他の例として、推論結果７１が閾値Ｔｈを上げることを示さない場合に閾値Ｔｈを１／ｎ倍してもよい。

図３０は、第２の機能構成例における学習処理の第２の例を説明するためのフローチャート図である。図３０中、図２８と同様の内容には同一ステップ番号を付し、その説明を省略する。学習処理の第２の例では、候補閾値３から基準閾値３ｒｅｆを特定するのではなく、問題データ２ごとに、複数の候補閾値３間のシミュレーション結果５の比較から基準閾値３ｒｅｆを作成する。

図３０において、機械学習部４０では、学習部５０が、複数の候補閾値３を順にシミュレーション部３０に与え、シミュレーションを行わせて、候補閾値３ごとの残差曲線データ４ｄとシミュレーション結果５とを取得する（ステップＳ１１１２）。残差曲線データ４ｄは、線形解析の反復ごとの残差とシミュレーションの実行時間とを含む。

学習部５０は、問題データ２ごとに、それぞれの候補閾値３でのシミュレーション結果５に対して、最も候補閾値３が低いときのシミュレーション結果５との結果誤差を計算する（ステップＳ１１２３）。結果誤差の算出例として、学習部５０は、シミュレーション結果５の各要素ごとに、同一問題で最も候補閾値３が低いときの要素の値との差を算出して平均絶対誤差（ＭＡＥ：Mean Absolute Error）を算出して、結果誤差を求める。

そして、学習部５０は、問題データ２ごとに、結果誤差と実行時間とを、候補閾値３ごとに比較した結果に基づいて、基準閾値３ｒｅｆを設定し、基準閾値３ｒｅｆと、候補閾値３との大小関係に基づいて、残差曲線データ４ｄに対するラベルを決定する（ステップＳ１１４５）。基準閾値３ｒｅｆの決定方法の一例として、学習部５０は、結果誤差（即ち精度）と実行時間（即ち速度）の両方を参照し、予め定めた条件に最も近い候補閾値３を求める。条件の例として、ユーザ使用を満たす精度の中で最速となる候補閾値３を基準閾値３ｒｅｆとしてもよい。或いは、結果誤差と実行時間との積を最小化するときの候補閾値３を基準閾値３ｒｅｆに適用してもよい。

学習部５０は、各問題データ２の残差曲線データ４ｄそれぞれに対して、残差曲線を一定区間ごとに区切って複数の入力データ６ａを作成し、作成した複数の入力データ６ａのそれぞれにＳ１１４６で決定したラベルを付与して、学習データ６ｇを生成する（ステップＳ１１４７）。そして、学習部５０は、生成した学習データ６ｇを用いてＮＮ２７０を学習する（ステップＳ１１５０）。

図３１は、第２の機能構成例における学習処理の第３の例を説明するためのフローチャート図である。図３１中、図３０と同様の内容には同一ステップ番号を付し、その説明を省略する。学習処理の第３の例では、ユーザが所望するシミュレーションの精度を考慮して候補閾値３から基準閾値３ｒｅｆを特定する。シミュレーション部３０の処理は、図３０と同等であるため簡略化し、その説明を省略する。

図３０において、機械学習部４０では、ユーザが所望するシミュレーションの精度を結果誤差の基準値に設定する（ステップＳ１１５０）。一例としてMAE<0.0001などである。そのため、図３０のステップＳ１１４５の代わりに、ステップＳ１１４６を行う。

ステップＳ１１４６では、学習部５０は、問題データ２ごとに、結果誤差がユーザの所望する精度を満たすものの中で、実行時間が最も短いときの候補閾値３を基準閾値３ｒｅｆに設定し、基準閾値３ｒｅｆと、候補閾値３との大小関係に基づいて、残差曲線データに対するラベルを決定する。以下、ステップＳ１１４７及びＳ１１５０は、図３０と同様であるため説明を省略する。

上述した第１実施例及び第２実施例における学習環境として、
・ＮＮ２７０
一例として、AlexNetを用いてＣＮＮを構成すればよい。
・ＡＩフレームワーク
TensorFlow及びTensorFlowへのＡＰＩとしてKerasなどを用いればよい。このような学習環境を持つ情報処理装置１００において、発明者等が開発した線形解析の閾値Ｔｈを動的に調整する手法をシミュ―レーションに適用し、当該手法を適用した結果として得られた様々な情報を、以下に提示する。

次に、第２の機能構成例における学習処理の第１の例の学習結果について図３２及び図３３に示す。図３２は、学習処理の第１の例による候補閾値ごとの学習結果を示す図である。この例では、図２３で説明した線形解析の残差閾値の範囲にある１５個の候補閾値３を用いている。

図３２では、候補閾値３のそれぞれについて、線形残差曲線を収束２回ごとの残差曲線が示されている。また、基準閾値３ｒｅｆより小さい候補閾値３に対してラベル「０」を設定し、それ以外の候補閾値３に対してはラベル「１」を設定する。

このようにラベル付けした学習データ６ｇを用いた場合の学習結果を図３３に示す。図３３は、図３２のラベル付けに基づく学習結果を示す図である。

上述した検証より、図３３（Ａ）に損失グラフ３３ａでは、学習時損失値３３ａ－１と検証時損失値３３ａ－２とを示し、図３３（Ｂ）に示す精度グラフ３３ｂでは、学習時精度値３３ｂ－１と検証時精度値３３ｂ－２とを示している。損失は、エポックの少ない時期に急速に改善し、検証用のデータにおいても学習時と同様の傾向を示している。また、精度についても、エポックの少ない時期に急速に改善し、検証用のデータにおいても学習時と同様の傾向を示している。適切な学習が行われたと言える。

次に、第２の機能構成例における学習処理の第２の例の学習結果について図３４及び図３５を参照して説明する。図３４は、学習処理の第２の例による候補閾値ごとの学習結果を示す図である。この例では、線形解析の残差閾値１５個の候補閾値３を用いている。

図３４では、候補閾値３のそれぞれについて、線形残差曲線を収束２回ごとの残差曲線が示されている。ＣＧとＡＭＧ（Algebraic Multigrid）とを用いた構造解析のモデル用いている。また、シミュレーション結果の精度が十分で最速時の候補閾値３より小さい場合にラベル「０」を設定し、それ以外の候補閾値３に対してはラベル「１」を設定する。

このようにラベル付けした学習データ６ｇを用いた場合の学習結果を図３５に示す。図３５は、図３４のラベル付けに基づく学習結果を示す図である。

上述した検証より、図３５（Ａ）に示す損失グラフ３５ａと、図３５（Ｂ）に示す精度グラフ３５ｂとを得た。図３５（Ａ）に損失グラフ３５ａでは、学習時損失値３５ａ－１と検証時損失値３５ａ－２とを示し、図３５（Ｂ）に示す精度グラフ３５ｂでは、学習時精度値３５ｂ－１と検証時精度値３５ｂ－２とを示している。損失は、エポックの少ない時期に急速に改善し、検証用のデータにおいても学習時と同様の傾向を示している。また、精度についても、エポックの少ない時期に急速に改善し、検証用のデータにおいても学習時と同様の傾向を示している。学習処理の第２の例では、特に、検証時損失値３５ａ－２と検証時精度値３５ｂ－２とが、非常に滑らかに推移しており、学習処理の第１の例以上に高精度な学習が行われたと言える。

更に、第２実施例における学習処理の第１の例と学習処理の第２の例とを比較検証した結果を以下に示す。検証環境は、以下の通りである。
学習部５０（ＡＩ部）の呼び出し間隔: 非線形ループ２回ずつ
訓練済みモデル:
・第１の例のラベル付け:
線形解析の残差閾値が最速時の候補閾値３より小さいときラベル０を設定し、
それ以外のときラベル１を設定する。

・第２の例のラベル付け:
シミュレーション結果の精度が十分であり、かつ、
最速時の候補閾値３より小さいときラベル０を設定し、
それ以外のときラベル１を設定する。

線形解析の残差閾値の変化率:２倍又は１／２倍
としたときの結果を説明する。

図３６は、学習データの生成例を説明するための図である。図３６では、第２実施例において学習部５０が残差曲線データ４ｄ－１、４ｄ－２のそれぞれを定めた区間ごとに区切って、入力データ６ａを作成する。

残差曲線データ４ｄの候補閾値３が基準閾値３ｒｅｆ以上の場合に区切った全ての入力データ６ａにラベル「１」を付与し、それ以外の場合にラベル「０」を付与した例をそれぞれ示している。一例として、１つの残差曲線データ４ｄに対して１２個の学習データ６ｇが生成されたものとする。

学習部５０は、１つの残差曲線データ４ｄに対して、同一ラベルが付与された複数の学習データ６ｇを用いてＮＮ２７０を学習する。ＮＮ２７０に対して誤差はフィードバックされ、第２実施例では、１つの残差曲線データ４ｄから同一ラベルの複数の学習データ６ｇを得られるため、ＮＮ２７０にラベル「１」又は「０」を精度良く学習させることができる。そのため、推論部６０において、閾値Ｔｈを最適な値へと適切に変化させ、シミュレーション時間を高速化することができる。

シミュレーションの実行時間とシミュレーション結果５の精度とについて検証した結果を以下に示す。

図３７は、実行時間の検証結果を示す図である。図３７において、縦軸を時間（秒）で示し、左から
・初期設定に用いる規定値「1.0e-08」でシミュレーションを実行した場合
・第２の例の場合、
・第１の例の場合、
・図２３に例示したような実行時間が最速時の閾値でシミュレーションを実行した場合
のそれぞれの実行時間を示している。

初期設定、第２の例、第１の例、そして最速設定の順に実行時間が減少している。最速設定が最も実行時間が短いが、第２の例及び第１の例は、最も実行時間が長い初期設定に対して高速化を実現している。

図３８は、シミュレーション結果の検証結果を示す図である。図３８では、縦軸にシミュレーション結果の誤差を示し、図３７同様に、初期設定、第２の例、第１の例、そして最速設定の順に誤差を示している。

初期設定は、有効数字が平均４桁一致の基準３８ａに到達している。第２の例では、基準３８ａを上回る誤差を示すものの基準３８ａに近い精度を示している。一方、第１の例及び最速設定の精度では、有効数字が平均３桁一致の基準３８ｂを超えているが、略同程度の誤差を示している。

上述した検証より、シミュレーション結果５の精度を維持しつつ高速化を試みる観点において、第１の例及び第２の例では、実行速度を改善しつつ精度を保つことを実現しているといえる。

図３９は、閾値の変化例を示す図である。図３９では、縦軸に線形解析の閾値を示し、横軸にニュートン法のステップ数を示す。本実施例におけるシミュレーションの閾値変化３９ａと、本実施例を用いない既存のシミュレーションの閾値変化３９ｂとを所定ステップごとに示している。

本実施例におけるシミュレーションとは、第１実施例及び第２実施例において例示した機能構成を有する情報処理装置１００によって行われたシミュレーションに相当する。また、ステップとは、ニュートン法に基づく線形ソルバにおけるステップに相当し、所定ステップとは、この例では２ステップである。

図３９より、情報処理装置１００における閾値変化３９ａは、閾値Ｔｈは、ステップ１で初期値に設定されてからステップ４１まで上昇し、その後、動的に変化しながら線形解析が行われていることが分かる。一方、既存のシミュレーションの閾値変化３９ｂは、初期値を維持した状態を示す。

図４０は、処理時間の経過例を示す図である。図４０では、縦軸に実行時間を示し、横軸にニュートン法のステップ数を示す。実行時間は、ニュートン法１ステップに掛かった時間を示している。本実施例における処理時間経過４０ａと、本実施例を用いない既存の処理時間経過４０ｂとをステップごとに計測した時間を示している。

既存の処理時間経過４０ｂは、実行時間が一定の変動範囲で推移を繰り返している。一方、本実施例における処理時間経過４０ａでは、ステップを反復するごとに実行時間が短縮され、凡そ３５ステップ以降では、一定の変動範囲で推移を繰り返している。本実施例における処理時間経過４０ａの変動範囲は、既存の処理時間経過４０ｂにおける変動範囲より明らかに高速な範囲である。

図４１は、反復回数の経過例を示す図である。図４１では、縦軸に線形解析の反復回数を示し、横軸にニュートン法のステップ数を示す。本実施例のシミュレーションにおける線形解析の反復回数の経過４１ａと、本実施例を用いない既存のシミュレーションにおける線形解析の反復回数の経過４１ｂとを示している。

反復回数の経過４１ｂは、ステップ数が増加しても略同様の反復回数で線形解析を行い続け、この例では、６０回以下で線形解析が収束することがない。一方、反復回数の経過４１ａは、減少し続け、一定の反復回数の間で変動しながら推移する。

上述した第２実施例に係る検証は、以下のような言語及びライブラリを用いた例として示している。
・シミュレーション部３０
構造解析ＯＳＳ（Open Source Software）であるFrontISTRを用いる。
・機械学習部４０
学習部５０及び推論部６０のメインプログラムは、多くのアプリケーションに組み込み可能なPython等の汎用スクリプト言語を用いればよい。

学習部５０及び推論部６０から呼び出すＡＩ推論（ＮＮ２７０に相当）を行うプログラムには、機械学習用ライブラリであるTensorFlowを用い、TensorFlowを呼び出し容易なKerasのＡＰＩを用いればよい。

このように、シミュレーション部３０と機械学習部４０とではプログラム言語の構造が異なっている。シミュレーション部３０と機械学習部４０との間でのデータの受け渡しは、既存のディスク１３（図１）を介して行うことが可能であるので、第１実施例の実装は必須ではない。しかしながら、図３７及び図３８で示したように実行速度とシミュレーション結果５の精度とは、トレードオフの関係にある。シミュレーションの精度を維持しつつより高速化する観点において、第１実施例で説明したようなプロセス間通信を実装することがより好ましい。

また、上記言語及びライブラリを用いた第２実施例において、シミュレーションを実行した場合には、図４２のような実行ログを得ることができる。図４２は、第２実施例における実行ログの例を示す図である。

図４２に例示される実行ログ４ａは、FrontISTRでプログラムされたシミュレーション部３０が実行されると出力されるログに相当する。実行ログ４ａでは、ログ記述４２ａにより、ＮＮ２７０に相当するＡＩ処理を実行するプロセッサが呼び出されている。プロセッサは、ＧＰＵ１４の製品名等で示される。ログ記述４２ｂではＡＩフレームワークが呼び出され、この例ではTensorflowが呼び出されたことが示されている。

ログ記述４２ｃ及び４２ｄから、残差の閾値Ｔｈが略1e-08から略2e-08に変化したことが分かる。第２実施例の適用のない既存のシミュレーションでは、このように閾値Ｔｈが変動することはなく、例えば、閾値Ｔｈが1e-08であれば、常に1e-08を示すログが記録される。

なお、第１実施例及び第２実施例を実現する情報処理装置１００では、
・ＡＩ処理を行うプログラム用として、メインプログラムがPythonであれば、
python_main_path=/path/to/ai_main.py
などの設定ファイルが作成され特定の記憶領域に保存される。また、この特定の記憶領域には、
・訓練済みＡＩモデルが生成されると、推論部６０により利用可能なように、一例として、
trained_model_path=/path/to/trained_model.h5
などの設定ファイルが作成され保存される。

上述において、残差曲線は残差推移を表すデータの一例であり、実行時間は、シミュレーションの演算時間の一例であり、ＮＮ２７０は、推論モデルの一例である。

本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、主々の変形や変更が可能である。

以上の第１実施例～第２実施例を含む実施形態に関し、更に以下の付記を開示する。
（付記１）
１又は複数のコンピュータに、
線形解析を反復して非線形解析を行う第１の処理を実行させ、
前記第１の処理により複数の実験値で残差閾値ごとに求めた前記線形解析の反復ごとの残差推移と演算時間とに基づいて、推論モデルにより前記線形解析の収束判定に用いる残差閾値を推論させる第２の処理とを実行させ、
前記第１の処理と前記第２の処理との間で行われるデータの受け渡しを、メモリに設定された共有メモリを用いたプロセス間通信により行わせる
ことを特徴とする情報処理プログラム。
（付記２）
前記第１の処理は、
前記共有メモリに前記線形解析の反復ごとの前記残差推移と前記演算時間とを前記共有メモリに記憶して、第１の名前付きパイプにアドレスを設定し、
第２の名前付きパイプから前記第２の処理において書き込まれた前記推論モデルの推論結果を取得し、
前記第２の処理は、
前記共有メモリ内の前記第１の名前付きパイプで指定される前記アドレスから前記残差推移と前記演算時間とを取得し、
前記残差推移と前記演算時間とから定めた基準閾値と該残差推移とから前記推論モデルに前記残差閾値を推論する学習を行わせ、該推論モデルにより出力された前記推論結果を前記第２の名前付きパイプに書き込む
ことを特徴とする付記１記載の情報処理プログラム。
（付記３）
前記第２の処理は、
前記演算時間が最も短いときの前記実験値を前記基準閾値に設定し、
前記残差推移ごとに用いた実験値と前記基準閾値とを比較した結果に応じて、該残差推移にラベル付けして学習データを生成し、
前記学習データを用いて前記推論モデルを行う
ことを特徴とする付記２記載の情報処理プログラム。
（付記４）
前記第２の処理は、
前記演算時間が最も短いときの前記実験値を前記基準閾値に設定し、
前記残差推移ごとに用いた前記実験値と前記基準閾値とを比較した結果に応じて、該残差推移に対するラベルを決定し、
前記残差推移を一定区間ごとに区切って複数の入力データを作成し、作成した複数の入力データのそれぞれに決定した前記ラベルを付与して複数の学習データを生成し、
前記複数の学習データのそれぞれに対して前記推論モデルを行う
ことを特徴とする付記２記載の情報処理プログラム。
（付記５）
前記第２の処理は、
前記非線形解析の問題データごとに、前記演算時間が最も短いときの前記実験値を特定し、特定した該実験値を用いたときの前記第１の処理で得られた第１の結果と、他の実験値を用いたときの該第１の処理で得られた第２の結果それぞれとの結果誤差を計算し、
前記問題データごとに、前記結果誤差と実行時間とを、前記実験値ごとに比較した結果に基づいて、前記基準閾値を設定し、
前記残差推移ごとに用いた前記実験値と前記基準閾値とを比較した結果に応じて、該残差推移に対するラベルを決定し、
前記残差推移を一定区間ごとに区切って複数の入力データを作成し、作成した複数の入力データのそれぞれに決定した前記ラベルを付与して複数の学習データを生成し、
前記複数の学習データのそれぞれに対して前記推論モデルを行う
ことを特徴とする付記２記載の情報処理プログラム。
（付記６）
前記第２の処理は、
前記第１の処理からの呼び出しに応じて、前記第１の処理によって得られた前記残差推移を用いて、訓練済みモデルにより前記残差閾値を推論させた前記推論結果を取得して、前記第１の処理への戻り値として前記第２の名前付きパイプに書き込み、
前記第１の処理は、前記第２の名前付きパイプから前記推論結果を読み出し、読み出した該推論結果と予め定めた変化率とを用いて前記残差閾値を更新する付記３乃至５のいずれか一項に記載の情報処理プログラム。
（付記７）
前記第１の処理は、
前記第１の名前付きパイプに接続し、前記第２の処理からの第１のロック解除を待ち、
前記第１のロック解除の検出に応じて、前記共有メモリに、前記非線形解析により得られた非線形解析データと前記線形解析により得られた線形解析データとを書き込み、
前記共有メモリに、前記非線形解析の繰り返し回数と、前記線形解析の反復回数とを書き込み、
前記第２の名前付きパイプに接続し、前記第２の処理からの第２のロック解除を待ち、
前記第２のロック解除に応じて、前記第２の名前付きパイプから前記推論結果を取得する
ことを特徴とする付記２乃至６のいずれか一項に記載の情報処理プログラム。
（付記８）
前記第２の処理は、
前記第１の名前付きパイプに接続し、該第１の名前付きパイプのロックを解除し、
前記第１の処理からの要求に応じて、前記共有メモリから前記線形解析データと前記非線形解析データとを読み込み、それぞれから前記残差推移と前記演算時間とを取得し、訓練済みの前記推論モデルに前記残差閾値を推論させ、
前記第２の名前付きパイプに接続し、訓練済みの前記推論モデルによる推論結果を該第２の名前付きパイプに書き込んで、該第２の名前付きパイプをロック解除する
ことを特徴とする付記７に記載の情報処理プログラム。
（付記９）
前記第１の処理は、科学計算用の手続き型言語による第１のプログラムを第１のプロセッサが実行することにより行われ、
前記第２の処理は、前記第１のプログラムとは異なるスクリプト言語による第２のプログラムを前記第１のプロセッサが実行することにより行われ、
前記推論モデルは、前記第１のプロセッサとは異なる前記第２のプロセッサが、深層学習言語によるプログラムを実行することにより行われる
ことを特徴とする付記１乃至８のいずれか一項記載の情報処理プログラム。
（付記１０）
１又は複数のコンピュータが、
線形解析を反復して非線形解析を行う第１の処理を実行し、
前記第１の処理により複数の実験値で残差閾値ごとに求めた前記線形解析の反復ごとの残差推移と演算時間とに基づいて、推論モデルにより前記線形解析の収束判定に用いる残差閾値を推論させる第２の処理とを実行し、
前記第１の処理と前記第２の処理との間で行われるデータの受け渡しは、メモリに設定された共有メモリを用いたプロセス間通信により行う
ことを特徴とする情報処理方法。
（付記１１）
メモリと、
前記メモリに接続された１又は複数のプロセッサとを有し、該１又は複数のコンピュータが、
線形解析を反復して非線形解析を行う第１の処理と、
前記第１の処理により複数の実験値で残差閾値ごとに求めた前記線形解析の反復ごとの残差推移と演算時間とに基づいて、推論モデルにより前記線形解析の収束判定に用いる残差閾値を推論させる第２の処理とを実行し、
前記第１の処理と前記第２の処理との間で行われるデータの受け渡しは、前記メモリに設定された共有メモリを用いたプロセス間通信により行うことを特徴とする情報処理装置。

２問題データ
３候補閾値
３ｒｅｆ基準閾値
４ａ実行ログ
４ｄ残差曲線データ
５シミュレーション結果
６ａ入力データ
６ｇ学習データ
１１ＣＰＵ
１２メインメモリ
１２ａ共有メモリ
１２ｍ－１ＣＭ領域
１２ｍ－２ＭＬ領域
１２ｐ名前付きパイプ領域
１２ｖＯＳ仮想メモリ
１３ディスク
１４ｇＧＰＵ
１４ｍＧＰＵメモリ
１５入力装置
１６表示装置
１７通信Ｉ／Ｆ
１８ドライブ装置
１９記憶媒体
３０シミュレーション部
３２非線形解析部
３４線形解析部
４０機械学習部
５０学習部
６０推論部
２３０高性能アプリケーション
２３２高性能アプリケーション
２０４ｄシミュレーションデータ
１００情報処理装置

Claims

１又は複数のコンピュータに、
線形解析を反復して非線形解析を行う第１の処理を実行させ、
前記第１の処理により複数の実験値で残差閾値ごとに求めた前記線形解析の反復ごとの残差推移と演算時間とに基づいて、ＮＮにより前記線形解析の収束判定に用いる残差閾値を推論させる第２の処理とを実行させ、
前記第１の処理と前記第２の処理との間で行われるデータの受け渡しを、メモリに設定された共有メモリを用いたプロセス間通信により行わせる
ことを特徴とする情報処理プログラム。
前記第１の処理は、
前記線形解析の反復ごとの前記残差推移と前記演算時間とを前記共有メモリに記憶して、第１の名前付きパイプにアドレスを設定し、
第２の名前付きパイプから前記第２の処理において書き込まれた前記ＮＮの推論結果を取得し、
前記第２の処理は、
前記共有メモリ内の前記第１の名前付きパイプで指定される前記アドレスから前記残差推移と前記演算時間とを取得し、
前記残差推移と前記演算時間とから定めた基準閾値と該残差推移とから前記ＮＮに前記残差閾値を推論する学習を行わせ、該ＮＮにより出力された前記推論結果を前記第２の名前付きパイプに書き込む
ことを特徴とする請求項１記載の情報処理プログラム。
前記第２の処理は、
前記演算時間が最も短いときの前記実験値を前記基準閾値に設定し、
前記残差推移ごとに用いた実験値と前記基準閾値とを比較した結果に応じて、該残差推移にラベル付けして学習データを生成し、
前記学習データを用いて前記ＮＮの学習を行う
ことを特徴とする請求項２記載の情報処理プログラム。
前記第２の処理は、
前記演算時間が最も短いときの前記実験値を前記基準閾値に設定し、
前記残差推移ごとに用いた前記実験値と前記基準閾値とを比較した結果に応じて、該残差推移に対するラベルを決定し、
前記残差推移を一定区間ごとに区切って複数の入力データを作成し、作成した複数の入力データのそれぞれに決定した前記ラベルを付与して複数の学習データを生成し、
前記複数の学習データを用いて前記ＮＮの学習を行う
ことを特徴とする請求項２記載の情報処理プログラム。
前記第２の処理は、
前記非線形解析の問題データごとに、前記演算時間が最も短いときの前記実験値を特定し、特定した該実験値を用いたときの前記第１の処理で得られた第１の結果と、他の実験値を用いたときの該第１の処理で得られた第２の結果それぞれとの結果誤差を計算し、
前記問題データごとに、前記結果誤差と実行時間とを、前記実験値ごとに比較した結果に基づいて、前記基準閾値を設定し、
前記残差推移ごとに用いた前記実験値と前記基準閾値とを比較した結果に応じて、該残差推移に対するラベルを決定し、
前記残差推移を一定区間ごとに区切って複数の入力データを作成し、作成した複数の入力データのそれぞれに決定した前記ラベルを付与して複数の学習データを生成し、
前記複数の学習データを用いて前記ＮＮの学習を行う
ことを特徴とする請求項２記載の情報処理プログラム。
前記第２の処理は、
前記第１の処理からの呼び出しに応じて、前記第１の処理によって得られた前記残差推移を用いて、訓練済みの前記ＮＮにより前記残差閾値を推論させた前記推論結果を取得して、前記第１の処理への戻り値として前記第２の名前付きパイプに書き込み、
前記第１の処理は、前記第２の名前付きパイプから前記推論結果を読み出し、読み出した該推論結果と予め定めた変化率とを用いて前記残差閾値を更新する請求項３乃至５のいずれか一項に記載の情報処理プログラム。
前記第１の処理は、
前記第１の名前付きパイプに接続し、前記第２の処理からの第１のロック解除を待ち、
前記第１のロック解除の検出に応じて、前記共有メモリに、前記非線形解析により得られた非線形解析データと前記線形解析により得られた線形解析データとを書き込み、
前記共有メモリに、前記非線形解析の繰り返し回数と、前記線形解析の反復回数とを書き込み、
前記第２の名前付きパイプに接続し、前記第２の処理からの第２のロック解除を待ち、
前記第２のロック解除に応じて、前記第２の名前付きパイプから前記推論結果を取得する
ことを特徴とする請求項２乃至６のいずれか一項に記載の情報処理プログラム。
前記第２の処理は、
前記第１の名前付きパイプに接続し、該第１の名前付きパイプのロックを解除し、
前記第１の処理からの要求に応じて、前記共有メモリから前記線形解析データと前記非線形解析データとを読み込み、それぞれから前記残差推移と前記演算時間とを取得し、訓練済みの前記ＮＮに前記残差閾値を推論させ、
前記第２の名前付きパイプに接続し、訓練済みの前記ＮＮによる推論結果を該第２の名前付きパイプに書き込んで、該第２の名前付きパイプをロック解除する
ことを特徴とする請求項７に記載の情報処理プログラム。
１又は複数のコンピュータが、
線形解析を反復して非線形解析を行う第１の処理を実行し、
前記第１の処理により複数の実験値で残差閾値ごとに求めた前記線形解析の反復ごとの残差推移と演算時間とに基づいて、ＮＮにより前記線形解析の収束判定に用いる残差閾値を推論させる第２の処理とを実行し、
前記第１の処理と前記第２の処理との間で行われるデータの受け渡しは、メモリに設定された共有メモリを用いたプロセス間通信により行う
ことを特徴とする情報処理方法。
メモリと、
前記メモリに接続された１又は複数のプロセッサとを有し、該１又は複数のコンピュータが、
線形解析を反復して非線形解析を行う第１の処理と、
前記第１の処理により複数の実験値で残差閾値ごとに求めた前記線形解析の反復ごとの残差推移と演算時間とに基づいて、ＮＮにより前記線形解析の収束判定に用いる残差閾値を推論させる第２の処理とを実行し、
前記第１の処理と前記第２の処理との間で行われるデータの受け渡しは、前記メモリに設定された共有メモリを用いたプロセス間通信により行うことを特徴とする情報処理装置。