JP2023017335A

JP2023017335A - 機械学習プログラム，情報処理装置および機械学習方法

Info

Publication number: JP2023017335A
Application number: JP2021121539A
Authority: JP
Inventors: 晶大田渕; Akihiro Tabuchi
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2021-07-26
Filing date: 2021-07-26
Publication date: 2023-02-07
Also published as: EP4125001A1; US20230023241A1; CN115688874A

Abstract

【課題】モデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、演算リソースを効率的に利用できるようにする。【解決手段】ニューラルネットワークを分割して作成され、複数のプロセスでモデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、複数のプロセスのそれぞれにおいて処理される非並列処理ブロックにおいて、複数のプロセス毎に異なるノイズを付与する。【選択図】図１

Description

本発明は、機械学習プログラム，情報処理装置および機械学習方法に関する。

近年、ニューラルネットワークにおける機械学習において、機械学習モデルの巨大化に伴い、学習の高速化が求められている。

例えば、ダークマターデータから宇宙論的パラメータを推定するCosmoFlowを用いたシミュレーションにおいては、データ量が５．１ＴＢとなり、１台のＶ１００ＧＰＵ（Graphics Processing Unit）で機械学習に１週間もかかる。

また、機械学習において主流の高速化方法であるデータ並列は精度の面で限界がある。すなわち、並列度を上げるとバッチサイズが大きくなり、学習精度に悪影響を及ぼすおそれがある。

そこで、近年においては、ニューラルネットワークにおける機械学習モデルを分割して複数の計算機で並列処理するモデル並列手法が知られている。以下、ニューラルネットワークにおける機械学習モデルを、ニューラルネットワークモデルもしくは単にモデルという場合がある。

ニューラルネットワークモデルを分割して作成した各モデルを複数の計算機で並列処理することで、学習精度に影響を及ぼすことなく、機械学習を高速化することができる。
図８はニューラルネットワークにおける従来のモデル並列手法を説明するための図である。

図８中において、符号Ａは並列化なしのニューラルネットワークモデルを示す。また、符号Ｂは、モデル並列されたニューラルネットワークモデルを示し、符号Ａに示す１つのモデルを分割して作成した２つ（プロセス#0，#1）のモデルを表す。

符号Ｂに示すモデル並列化されたニューラルネットワークにおいては、符号Ａで示すニューラルネットワークの畳み込み層および全結合層の全ての層（レイヤ）を分割して並列化している。

しかしながら、この符号Ｂに示すモデル並列化されたニューラルネットワークにおいては、各レイヤの前後において、プロセス＃０とプロセス＃１との間で頻繁に通信（allgather，allreduce）が発生する。これにより、通信負荷の増大や同期待ち等による遅延等が生じる。
そこで、ニューラルネットワークに備えられた複数の層のうち、計算量が多い畳み込み層のみを並列化する手法が考えられる。
図９はニューラルネットワークにおける従来のモデル並列手法を説明するための図である。
図９は、図８において符号Ａで示した並列化なしのニューラルネットワークモデルに基づいて作成した、モデル並列化されたニューラルネットワークを示す。

この図９に示すニューラルネットワークは、図８に符号Ａで示した並列化なしのニューラルネットワークモデルの畳み込み層のみを２つに分割している。すなわち、畳み込み層の処理をプロセス＃０，＃１で並列に行ない、全結合層の処理をプロセス＃０のみにおいて行なう。

一般に、畳み込み層における処理は、計算量が多いが、通信は隣接部分間でのデータ交換のみが行なわれるので、畳み込み層を分割することによるデメリットは少ない。また、後段の全結合層はニューロン数が少ないため、並列化せずとも計算時間がそれほど増加せず、モデル並列させるよりも処理が速い場合がある。

特表２０１７―５１４２５１号公報米国特許出願公開第２０２０／０３７２３３７号明細書

しかしながら、図９に示す従来のモデル並列化したニューラルネットワークにおいては、プロセス＃１は、畳み込み層以外の処理を行なわないので、計算リソースを無駄に遊ばせることになり非効率的である。

また、図９に示すモデル並列化したニューラルネットワークにおいても、プロセス＃０において最終的に算出されるＬｏｓｓをプロセス＃１との間で共有するために、プロセス＃０からプロセス＃１に対してデータ通信が行なわれる。かかるデータ通信による時間を削減するために、プロセス＃１においても、プロセス＃０と同様に、各全結合層の演算を行なうことでＬｏｓｓを算出することが考えられる。しかしながら、この場合においては、プロセス＃０とプロセス＃１とで全結合層の同じ演算を重複して行なうことになり非効率である。
１つの側面では、本発明は、モデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、演算リソースを効率的に利用できるようにすることを目的とする。

このため、この機械学習プログラムは、ニューラルネットワークを分割して作成され、複数のプロセスでモデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、前記複数のプロセスのそれぞれにおいて処理される非並列処理ブロックにおいて、前記複数のプロセス毎に異なるノイズを付与する処理をプロセッサに実行させる。

一実施形態によれば、モデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、演算リソースを効率的に利用することができる。

実施形態の一例としてのコンピュータシステムのハードウェア構成を模式的に示す図である。実施形態の一例としてのコンピュータシステムの管理装置の機能構成図である。実施形態の一例としてのコンピュータシステムにより生成されるニューラルネットワークモデルを例示する概念図である。実施形態の一礼としてのコンピュータシステムのモデル管理部による処理を説明するためのフローチャートである。実施形態の一例としてのコンピュータシステムにより作成された複数の分散モデルによる機械学習処理を説明するための図である。実施形態の一例としてのコンピュータシステムにより作成された複数の分散モデルによる機械学習処理を説明するための図である。実施形態の一例としてのコンピュータシステムにより作成された複数の分散モデルによる機械学習処理を説明するための図である。ニューラルネットワークにおける従来のモデル並列手法を説明するための図である。ニューラルネットワークにおける従来のモデル並列手法を説明するための図である。

以下、図面を参照して本機械学習プログラム，情報処理装置および機械学習方法にかかる実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。

（Ａ）構成
図１は実施形態の一例としてのコンピュータシステム１のハードウェア構成を模式的に示す図、図２はその管理装置の機能構成図である。

本コンピュータシステム１は、図１に示すように、管理装置１０と複数の計算ノード２とを備える。管理装置１０と各計算ノード２とは、ネットワーク３を介して相互に通信可能に接続されている。ネットワーク３は、例えば、ＬＡＮ（Local Area Network）である。
本コンピュータシステム１においては、ニューラルネットワークにおける機械学習モデル（ニューラルネットワークモデル）を分割して複数の計算ノード２によるモデル並列処理を実現する。

計算ノード２は、図示しないプロセッサとメモリとを備える情報処理装置（コンピュータ）であり、それぞれ後述する管理装置１０によって割り当てられるプロセスを実行する。各計算ノード２は、割り当てられたニューラルネットワークモデルの訓練（機械学習）や当該ニューラルネットワークモデルを用いた推論等を行なう。

管理装置１０は、例えば、サーバ機能を備える情報処理装置（コンピュータ）であり、ニューラルネットワークモデルを管理する機能を備える。
管理装置１０は、図１に示すように、例えば、プロセッサ１１，メモリ１２および記憶装置１３を備える。

記憶装置１３は、ハードディスクドライブ（Hard Disk Drive：ＨＤＤ）、ＳＳＤ（Solid State Drive），ストレージクラスメモリ（Storage Class Memory：ＳＣＭ）等の記憶装置であって、種々のデータを格納するものである。

メモリ１２はＲＯＭ（Read Only Memory）およびＲＡＭ（Random Access Memory）を含む記憶メモリである。メモリ１２のＲＯＭには、機械学習モデルの管理にかかるソフトウェアプログラムやこのプログラム用のデータ類が書き込まれている。機械学習モデルの管理にかかるソフトウェアプログラムは機械学習プログラムを含む。

メモリ１２上のソフトウェアプログラムは、プロセッサ１１に適宜読み込まれて実行される。また、メモリ１２のＲＡＭは、一次記憶メモリあるいはワーキングメモリとして利用される。

プロセッサ（処理部）１１は、管理装置１０全体を制御する。プロセッサ１１は、マルチプロセッサであってもよい。プロセッサ１１は、例えばＣＰＵ（Central Processing Unit），ＭＰＵ（Micro Processing Unit），ＤＳＰ（Digital Signal Processor），ＡＳＩＣ（Application Specific Integrated Circuit），ＰＬＤ（Programmable Logic Device），ＦＰＧＡ（Field Programmable Gate Array）のいずれか一つであってもよい。また、プロセッサ１１は、ＣＰＵ，ＭＰＵ，ＤＳＰ，ＡＳＩＣ，ＰＬＤ，ＦＰＧＡのうちの２種類以上の要素の組み合わせであってもよい。

そして、プロセッサ１１が、制御プログラムを実行することにより、図２に示すモデル管理部１００，訓練制御部１０２および推論制御部１０３として機能する。制御プログラムには機械学習プログラムが含まれる。プロセッサ１１がこの機械学習プログラムを実行することで、訓練制御部１０２としての機能が実現される。

なお、これらのモデル管理部１００，訓練制御部１０２および推論制御部１０３としての機能を実現するためのプログラム（制御プログラム）は、例えばフレキシブルディスク，ＣＤ（ＣＤ－ＲＯＭ，ＣＤ－Ｒ，ＣＤ－ＲＷ等），ＤＶＤ（ＤＶＤ－ＲＯＭ，ＤＶＤ－ＲＡＭ，ＤＶＤ－Ｒ，ＤＶＤ＋Ｒ，ＤＶＤ－ＲＷ，ＤＶＤ＋ＲＷ，ＨＤＤＶＤ等），ブルーレイディスク，磁気ディスク，光ディスク，光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。また、そのプログラムを、例えば磁気ディスク，光ディスク，光磁気ディスク等の記憶装置（記録媒体）に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。

モデル管理部１００，訓練制御部１０２および推論制御部１０３としての機能を実現する際には、内部記憶装置（本実施形態ではメモリ１２）に格納されたプログラムがコンピュータのマイクロプロセッサ（本実施形態ではプロセッサ１１）によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
モデル管理部１００は、ニューラルネットワークモデルを管理する。
本コンピュータシステム１においては、ニューラルネットワークモデルを分割して複数の計算ノード２によるモデル並列処理を実現する。
図３は本コンピュータシステム１により生成されるニューラルネットワークモデルを例示する概念図である。

この図３に示す例においては、１つのニューラルネットワークモデルを分割して作成された２つのニューラルネットワークモデルを示す。また、この図３に示すニューラルネットワークモデルは、畳み込み層のみが分割され並列化されるものであって、他の層については並列化されない。

以下、１つのニューラルネットワークモデルを分割して作成される複数のニューラルネットワークモデルのそれぞれを、分散ニューラルネットワークモデルもしくは分散モデルという場合がある。また、分割される前の１つのニューラルネットワークモデルをオリジナルニューラルネットワークモデルといってもよい。

作成された各分散モデルは、それぞれ別の計算ノード２によって処理される。すなわち、各分散モデルは別のプロセスとして処理される。図３においては、２つの分散モデルが生成され、プロセス＃０とプロセス＃１とがそれぞれ１つの分散モデルを処理する例を示す。
図３に例示する各分散モデルは、畳み込み層と全結合層とを備える。また、全結合層にはドロップアウト層を備える。

ドロップアウト層は、一定割合のノードを不活性化（無効化）させながら機械学習を行なうことで過学習を抑制する。なお、この図３に示す例においては、全結合層にドロップアウト層が備えられているが、これに限定されるものではなく、ドロップアウト層を畳み込み層等に備えてもよい。

本コンピュータシステム１においては、複数（図３に示す例では２つ）のプロセス間において、ドロップアウト層は異なる不活性化（無効化）を行なう。以下、ドロップアウト層において特定のノードを不活性化することをノイズを付与するという場合がある。ドロップアウト層は、機械学習にノイズを付与するノイズ付与層として機能する。

モデル管理部１００は、図３に例示するような並列化したニューラルネットワークモデルを生成する。例えば、モデル管理部１００は、並列化されたニューラルネットワークモデルを構成する複数の分散モデルのそれぞれに対して、他の分散モデルに備えられるドロップアウト層とは異なるノイズを付与させる。

オリジナルニューラルネットワークにおける畳み込み層は、プロセス＃０とプロセス＃１とに分割され、異なる計算ノード２により並列処理される。各分散モデルにおいて、畳み込み層をモデル並列部といってもよい。また、各分散モデルにおいて、プロセス＃０とプロセス＃１とによる並列処理がされない全結合層およびドロップアウト層を非モデル並列部といってもよい。さらに、畳み込み層の処理を並列して行なう複数のプロセスを、モデル並列プロセスといってもよい。

各分散モデルの非モデル並列部には、同じ処理を行なう処理ブロックが備えられる。このような処理ブロックは、複数の分散モデルの非モデル並列部に重複して備えられる。このように、複数の分散モデルの非モデル並列部に重複して備えられる処理ブロックを重複ブロックといってもよい。重複ブロックは、モデル並列を行なうプロセス間でモデル並列を行なわずに重複処理する層のまとまりである。各分散モデルにおいて、ドロップアウト層は重複ブロックに含まれる。
モデル管理部１００は、図２に示すように、ノイズ設定部１０１としての機能を備える。

ノイズ設定部１０１は、複数の分散モデルの各ドロップアウト層に対して、それぞれ異なるドロップアウトの処理が行なわれるように、ドロップアウト層を構成する各種のパラメータを設定する。

例えば、ノイズ設定部１０１は、分散モデル毎に、不活性化させるノードの割合（以下、ドロップアウト率という）が異なるように設定してもよい。分散モデル毎に異なるドロップアウト率を設定するためには、例えば、各分散モデルのドロップアウト層のそれぞれに対して、乱数を用いて複数種類のドロップアウト率の中から任意のドロップアウト率を選択してもよく、適宜変更して実施することができる。

また、ノイズ設定部１０１によるノイズ設定方法は、分散モデル毎にドロップアウト率を異ならせることに限定されるものではなく、適宜変更して実施することができる。例えば、分散モデル毎に不活性化するノードを異ならせてもよく、また、分散モデル毎に入力要素をドロップアウトする確率を異ならせてもよい。

ノイズ設定部１０１は、分散モデルを構成するデータを読み込み、当該分散モデルを構成する各層の処理ブロックについて、ドロップアウト層の有無を判断する。そして、分散モデルにドロップアウト層が含まれている場合には、複数の分散モデル間において、異なるドロップアウトの処理が行なわれるように、各ドロップアウト層のパラメータ設定を行なう。

複数の分散モデルの各ドロップアウト層に対して、それぞれ異なるドロップアウトの処理が行なわれるように、ドロップアウト層を構成する各種のパラメータを設定することを、モデル並列プロセス毎に異なるノイズを設定するといってもよい。

ノイズ設定部１０１は、各分散モデルに設定したドロップアウト処理（例えば、ドロップアウト率，不活性化させるノード）を実績情報として管理（記憶）し、この実績情報を参照して、複数の分散モデル間においてドロップアウト処理が重複しないように各分散モデルに設定するドロップアウト処理を決定してもよい。
訓練制御部１０２は、モデル管理部１００により設定された各分散モデルを、それぞれ計算ノード２に割り当てて、訓練（機械学習）を行なわせる。

この訓練制御部１０２からの機械学習の実行指示に従い、複数の計算ノード２は、オリジナルニューラルネットワークを分割して作成された複数の分散ニューラルネットワークモデルの機械学習を並行して行なう。

各計算ノード２に割り当てられた分散モデルは、それぞれ非並列ブロック（重複ブロック）にドロップアウト層を備える。従って、複数の計算ノード２が分散モデルの機械学習のプロセスをそれぞれ行なうに際には、各非並列処理ブロック（重複ブロック，ドロップアウト層）において異なるノイズが付与される。
推論制御部１０３は、各計算ノード２に対して、分散モデルによる推論を行なわせる。

（Ｂ）動作
上述の如く構成された実施形態の一礼としてのコンピュータシステム１のモデル管理部１００による処理を、図４に示すフローチャート（ステップＳ１～Ｓ８）に従って説明する。

ステップＳ１において、モデル管理部１００は、予め作成された分散モデルを構成する情報を読み込む。モデル管理部１００は、例えば、オリジナルニューラルネットワークから作成された複数の分散モデルの情報を読み込む。

ステップＳ２において、モデル管理部１００は、読み込んだ複数の分散モデルのうち、一つの分散モデルを選択して、当該分散モデルの先頭から順に処理ブロックを確認し、複数の分散モデル（モデル並列プロセス）間において重複する重複ブロックを探索する。

ステップＳ３において、モデル管理部１００は、重複ブロックがあるか（候補があるか）を確認し、重複ブロックがある場合には（ステップＳ３のＹＥＳルート参照）、ステップＳ４に移行する。ステップＳ４において、ノイズ設定部１０１が、当該重複ブロックがノイズを設定可能であるかを確認する。すなわち、ノイズ設定部１０１は、当該重複ブロックがドロップアウト層であるかを確認する。

確認の結果、当該重複ブロックが、モデル並列プロセス毎に異なるノイズを設定可能である場合、すなわち、重複ブロックがドロップアウト層である場合には（ステップＳ４のＹＥＳルート参照）、ステップＳ５に移行する。

ステップＳ５において、ノイズ設定部１０１は、ユーザに対して、複数の分散モデル間において異なるノイズを設定するかを確認する。例えば、ノイズ設定部１０１は、ユーザに対して、複数の分散モデル間において異なるノイズを設定してもよいかを問い合わせるメッセージをディスプレイ（図示省略）等に表示させてもよい。
ユーザは、マウスやキーボード（いずれも図示省略）を用いて、この問い合わせに対する応答を入力してもよい。

ステップＳ６において、ノイズ設定部１０１は、複数の分散モデル間において異なるノイズを設定することについてユーザが同意したかを確認する。ノイズ設定部１０１は、例えば、ユーザが、マウスやキーボードを用いて、複数の分散モデル間において異なるノイズを設定することに同意する旨の入力を行なったかを確認する。この確認の結果、ユーザが、複数の分散モデル間において異なるノイズを設定することに同意しない場合には（ステップＳ６のＮＯルート参照）、ステップＳ２に戻る。

一方、ユーザが、複数の分散モデル間において異なるノイズを設定することに同意する場合には（ステップＳ６のＹＥＳルート参照）、ステップＳ７に移行する。

ステップＳ７において、ノイズ設定部１０１は、複数の分散モデルにおける、当該ドロップアウト層に対応する各ドロップアウト層のパラメータを、互いに異なるドロップアウト処理が行われるように設定する（書き換える）。その後、ステップＳ２に戻る。

また、ステップＳ４における確認の結果、当該重複ブロックがノイズを設定可能でない場合、すなわち、当該重複ブロックがドロップアウト層でない場合には（ステップＳ４のＮＯルート参照）、ステップＳ２に戻る。
また、ステップＳ３における確認の結果、重複ブロックがない場合には（ステップＳ３のＮＯルート参照）、ステップＳ８に移行する。
ステップＳ８においては、各分散モデルを構成する情報を記憶装置１３等の所定の記憶領域に書き出す（記憶させる）。その後、処理を終了する。

なお、上述したフローチャートにおいて、ステップＳ５およびステップＳ６の処理は、省略してもよい。すなわち、ユーザに対する、複数の分散モデル間において異なるノイズを設定するか否かの確認は行なわずに、ステップＳ７において、対応する各ドロップアウト層のパラメータを、互いに異なるドロップアウト処理が行われるように書き換えてもよい。
次に、本コンピュータシステム１によって作成された複数の分散モデルによる機械学習処理を図５～図７を用いて説明する。

これらの図５～図７においては、オリジナルニューラルネットワークを３つの分散モデルに分割し、プロセス＃０～＃２に処理させるモデル並列を実現する例を示す。

なお、図５は順伝搬の処理を、図６は逆伝搬の処理を、図７は重み更新の処理を、それぞれ示す。また、図５において、図中の上から下に向かう方向が順伝搬のデータの流れを示す。

順伝搬においては、図５に示すように、各プロセス＃０～＃２がそれぞれ実行する分散モデルのモデル並列部において行なわれた各処理の出力が結合される（符号Ｐ１参照）。結合された各出力は、プロセス＃０～＃２がそれぞれ実行する分散モデルの非モデル並列部にそれぞれ入力される。各分散モデルの非モデル並列部には、それぞれ同じデータが入力される。

図５に示す例において、各分散モデルの非モデル並列部はそれぞれ、ドロップアウト層（符号Ｐ２～Ｐ４参照）を含む３つの処理ブロック（重複ブロック）を備える。

また、これらの３つのドロップアウト層には、上述したノイズ設定部１０１により異なるパラメータ設定が行なわれており、これにより、各ドロップアウト層のドロップアウト率は異なる。
従って。各分散モデルの非モデル並列部における、これらのドロップアウト層の下流側の処理ブロックにおいては、互いに異なる出力が得られる。
また、各分散モデルの非モデル並列部の最後段の各処理ブロックの出力は結合される（符号Ｐ５参照）。

結合された各出力は、プロセス＃０～＃２がそれぞれ実行する分散モデルにおける、後続するモデル並列部にそれぞれ入力される。各分散モデルの非モデル並列部には、それぞれ同じデータが入力される。
図６において、図中の下から上に向かう方向が逆伝搬のデータの流れの方向を示す。

逆伝搬においては、図６に示すように、各プロセス＃０～＃２がそれぞれ実行する分散モデルのモデル並列部において行なわれた各処理の出力が結合される（符号Ｐ６参照）。結合された各出力は、プロセス＃０～＃２がそれぞれ実行する分散モデルの非モデル並列部にそれぞれ入力される。各分散モデルの非モデル並列部には、それぞれ同じデータが入力される。

各分散モデルの非モデル並列部において、ドロップアウト層（符号Ｐ７～Ｐ９参照）以外の各処理ブロック（重複ブロック）においては、例えば、勾配降下法を用いて、訓練データに対する機械学習モデルの推論結果と正解データとの誤差を定義した損失関数を小さくする方向に重みΔwの算出が行なわれる。

各分散モデルの非モデル並列部に備えられた各ドロップアウト層には、上述したノイズ設定部１０１により異なるパラメータ設定が行なわれており、これにより、各ドロップアウト層のドロップアウト率は異なる。
従って。各分散モデルの非モデル並列部における、これらのドロップアウト層の下流側の処理ブロックにおいては、互いに異なる出力が得られる。

各分散モデルの非モデル並列部の最後段の各処理ブロックの出力は結合される（符号Ｐ１０参照）。結合された各出力は、プロセス＃０～＃２がそれぞれ実行する分散モデルにおける、後続するモデル並列部にそれぞれ入力される。各分散モデルの非モデル並列部には、それぞれ同じデータが入力される。

重み更新においては、図７に示すように、各プロセス＃０～＃２がそれぞれ実行する分散モデルの非モデル並列部において逆伝搬により算出された各重みΔwが結合され、この結合された重み（combined Δw）を用いて、各処理ブロックの重みが更新される。重みΔwの結合は、例えば、平均値の算出であってもよく、適宜変更して実施することができる。

（Ｃ）効果
このように、実施形態の一例としてのコンピュータシステム１によれば、ノイズ設定部１０１が、複数の分散モデルの各ドロップアウト層に対して、それぞれ異なるドロップアウトの処理が行なわれるように、ドロップアウト層を構成する各種のパラメータを設定する。

これにより、機械学習時に、分散モデルを処理する各プロセスにおいて、非モデル並列部（重複ブロック）における各ドロップアウト層において異なるドロップアウトの処理が行なわれる。

従って、プロセス間で重複する処理を行なう非モデル並列部において、プロセス毎に異なる手法でノイズの生成を行なうことで、演算リソースを効率的に利用できる。
また、各分散モデルのそれぞれに異なるノイズを付与することで、並列処理される分散モデルのロバスト性を向上させ、学習精度を向上させることができる。

非モデル並列部を構成する処理ブロックは、もともと複数のプロセス（分散モデル）において並列に重複して処理される。従って、本コンピュータシステム１において、モデル並列を行なう複数のプロセスでそれぞれドロップアウト処理を行なうことに計算時間の増加がほとんどない。学習精度を向上させることができる。

（Ｄ）その他
本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
そして、開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。

例えば、上述した実施形態においては、ノイズを設定可能な重複ブロックとしてドロップアウト層が用いられているが、これに限定されるものではなく、適宜変更して実施することができる。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。

（Ｅ）付記
以上の実施形態に関し、さらに以下の付記を開示する。
（付記１）
ニューラルネットワークを分割して作成され、複数のプロセスでモデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、
前記複数のプロセスのそれぞれにおいて処理される非並列処理ブロックにおいて、前記複数のプロセス毎に異なるノイズを付与する
処理をプロセッサに実行させることを特徴とする、機械学習プログラム。

（付記２）
前記非並列処理ブロックがドロップアウト層であり、前記プロセス毎に異なるドロップアウトの処理を行なう
処理を前記プロセッサに実行させることを特徴とする、付記１に記載の機械学習プログラム。

（付記３）
ニューラルネットワークを分割して作成され、複数のプロセスでモデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、
前記複数のプロセスのそれぞれにおいて処理される非並列処理ブロックにおいて、前記複数のプロセス毎に異なるノイズを付与する
処理部を備えることを特徴とする情報処理装置。

（付記４）
前記処理部が、
前記非並列処理ブロックがドロップアウト層であり、前記プロセス毎に異なるドロップアウトの処理を行なう
ことを特徴とする、付記３に記載の情報処理装置。

（付記５）
ニューラルネットワークを分割して作成され、複数のプロセスでモデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、
前記複数のプロセスのそれぞれにおいて処理される非並列処理ブロックにおいて、前記複数のプロセス毎に異なるノイズを付与する
処理をコンピュータが実行することを特徴とする機械学習方法。

（付記６）
前記非並列処理ブロックがドロップアウト層であり、前記プロセス毎に異なるドロップアウトの処理を行なう
処理を前記コンピュータが実行することを特徴とする付記５に記載の機械学習方法。

１コンピュータシステム
２計算ノード
１０管理装置
１１プロセッサ（処理部）
１２メモリ
１３記憶装置
１００モデル管理部
１０１ノイズ設定部
１０２訓練制御部
１０３推論制御部

Claims

ニューラルネットワークを分割して作成され、複数のプロセスでモデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、
前記複数のプロセスのそれぞれにおいて処理される非並列処理ブロックにおいて、前記複数のプロセス毎に異なるノイズを付与する
処理をプロセッサに実行させることを特徴とする、機械学習プログラム。
前記非並列処理ブロックがドロップアウト層であり、前記プロセス毎に異なるドロップアウトの処理を行なう
処理を前記プロセッサに実行させることを特徴とする、請求項１に記載の機械学習プログラム。
ニューラルネットワークを分割して作成され、複数のプロセスでモデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、
前記複数のプロセスのそれぞれにおいて処理される非並列処理ブロックにおいて、前記複数のプロセス毎に異なるノイズを付与する
処理部を備えることを特徴とする情報処理装置。
ニューラルネットワークを分割して作成され、複数のプロセスでモデル並列処理される複数の分散ニューラルネットワークモデルの機械学習において、
前記複数のプロセスのそれぞれにおいて処理される非並列処理ブロックにおいて、前記複数のプロセス毎に異なるノイズを付与する
処理をコンピュータが実行することを特徴とする機械学習方法。