JP7396847B2

JP7396847B2 - 学習装置、学習方法および学習プログラム

Info

Publication number: JP7396847B2
Application number: JP2019184138A
Authority: JP
Inventors: 裕貴造酒; 良介丹野; 恵介切通
Original assignee: NTT Communications Corp
Current assignee: NTT Communications Corp
Priority date: 2019-10-04
Filing date: 2019-10-04
Publication date: 2023-12-12
Anticipated expiration: 2039-10-04
Also published as: JP2021060762A; WO2021066194A1; CN114270372A; US20220230067A1

Description

本発明は、学習装置、学習方法および学習プログラムに関する。

従来、ニューラルネットワークの学習を行うには各層毎に予め重みの初期値を設定する必要があり、初期重みは乱数として初期化される事が多い。設定された重みの初期値によってはニューラルネットワークの学習結果も大きく変化するなど初期値依存性が高く、適切な重みの初期化をする必要があり、様々な重み初期化の方法が存在する。良い初期値を得ることで、精度が向上する、学習が安定する、学習のロスの収束が早い、過学習を抑止する等をもたらし良い学習結果を得るために重要である。

特に、画像の分野において現在最も顕著な成功を収めている畳み込みニューラルネットワーク（Convolutional Neural Network、以下、ＣＮＮと略して記載）により構成されるネットワークについては、事前に大規模な学習データを用いた教師あり学習を行って得られた学習済みのパラメータを重みの初期値として、対象となるタスクを学習するファインチューニング（Fine-tuning）と呼ばれる重み初期値のアプローチを取る事が一般的である。

これはImangeNetのような質が良い大規模データセットを用いて学習させたＣＮＮの中間層から得られる特徴は非常に汎用性が高く、物体認識・画像変換・画像検索といった様々なタスクへ転用可能であることが知られている。

このように画像分野においてはファインチューニングは、基本技術として確立されており、様々な学習済みモデルがオープンソースで共有されるのが今日の現状である。ただし、上記で述べたファインチューニングといった転移学習手法は画像分野に限定され、自然言語処理、音声認識といった他分野においてはこの限りではない。

また、時系列データへのニューラルネットワークの応用に関する研究は発達段階にあり研究事例自体が少ない。特に時系列データへの転移学習手法は確立されておらず、一般的にネットワークの重み初期化は乱数による初期化を利用する。

"Transfer learning for time series classification"、［online］、［2019年9月6日検索］、インターネット＜https://arxiv.org/pdf/1811.01533.pdf＞

しかしながら、従来の手法では、時系列データに関するモデルについて、迅速かつ精度よく学習を行うことができない場合があるという課題があった。例えば、画像分野では一般的に行われているファインチューニングや、転移学習は時系列解析の分野ではほとんど用いられていない。なぜなら、時系列データはデータによって、ドメイン（対象、データ収集過程、平均・分散・データの特性、生成過程）が異なるなど単純なファインチューニングは困難である。また、画像分野のImageNetのような汎用かつ大規模なデータセットが存在しないことも一因である。

そのため、時系列データを入力とするモデルの学習においてはファインチューニングや、転移学習を用いずにモデルの重み初期値としてランダムな値を用いることが一般的だが、そのために精度が低い、学習速度が遅いなどの問題がある。

上述した課題を解決し、目的を達成するために、本発明の学習装置は、処理対象に関する時系列データを取得する取得部と、前記取得部によって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習部と、前記学習用データセットを用いて、前記第一の学習部によって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習部とを有することを特徴とする。

また、本発明の学習方法は、学習装置によって実行される学習方法であって、処理対象に関する時系列データを取得する取得工程と、前記取得工程によって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習工程と、前記学習用データセットを用いて、前記第一の学習工程によって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習工程とを含むことを特徴とする。

また、本発明の学習プログラムは、処理対象に関する時系列データを取得する取得ステップと、前記取得ステップによって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習ステップと、前記学習用データセットを用いて、前記第一の学習ステップによって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習ステップとをコンピュータに実行させることを特徴とする。

本発明によれば、時系列データに関するモデルについて、迅速かつ精度よく学習を行うことができるという効果を奏する。

図１は、第１の実施形態に係る学習装置の構成例を示すブロック図である。図２は、モデル全体のパラメータを更新する処理を説明する図である。図３は、モデルの一部のパラメータを更新する処理を説明する図である。図４は、学習装置によって実行される学習処理の概要について説明する図である。図５は、第１の実施形態に係る学習装置における学習処理の流れの一例を示すフローチャートである。図６は、学習プログラムを実行するコンピュータを示す図である。

以下に、本願に係る学習装置、学習方法および学習プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態により本願に係る学習装置、学習方法および学習プログラムが限定されるものではない。

［第１の実施形態］
以下の実施の形態では、第１の実施形態に係る学習装置１０の構成、学習装置１０の処理の流れを順に説明し、最後に第１の実施形態による効果を説明する。

［学習装置の構成］
まず、図１を用いて、学習装置１０の構成を説明する。図１は、第１の実施形態に係る学習装置の構成例を示すブロック図である。学習装置１０は、時系列データを入力とするモデルを学習する装置である。学習装置１０が学習するモデルはどのようなモデルであってもよい。例えば、学習装置１０は、工場やプラントなどの監視対象設備に設置されるセンサによって取得された複数のデータを収集し、収集された複数のデータを入力として、監視対象設備の異常を予測するためのモデルを学習する。

図１に示すように、この学習装置１０は、通信処理部１１、制御部１２および記憶部１３を有する。以下に学習装置１０が有する各部の処理を説明する。

通信処理部１１は、接続される装置との間でやり取りする各種情報に関する通信を制御する。また、記憶部１３は、制御部１２による各種処理に必要なデータおよびプログラムを格納し、データ記憶部１３ａおよび学習済みモデル記憶部１３ｂを有する。例えば、記憶部１３は、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子等の記憶装置である。

データ記憶部１３ａは、後述する取得部１２ａによって取得された時系列データを記憶する。例えば、データ記憶部１３ａは、工場、プラント、ビル、データセンタ等の対象機器に設けられたセンサのデータ（例えば、温度や圧力、音、振動等のデータ）や、人体に取り付けられたセンサのデータ（例えば、加速度センサの加速度のデータ）を記憶する。

学習済みモデル記憶部１３ｂは、後述する第二の学習部１２ｃによって学習された学習済みモデルを記憶する。例えば、学習済みモデル記憶部１３ｂは、学習済みモデルとして、監視対象設備の異常を予測するためのニューラルネットワークの予測モデルを記憶する。

制御部１２は、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する。例えば、制御部１２は、取得部１２ａ、第一の学習部１２ｂおよび第二の学習部１２ｃを有する。ここで、制御部１２は、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）、ＧＰＵ（Graphical Processing Unit）などの電子回路やＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの集積回路である。

取得部１２ａは、処理対象に関する時系列データを取得する。例えば、取得部１２ａは、センサデータを取得する。具体例を挙げて説明すると、取得部１２ａは、例えば、工場やプラントなどの監視対象設備に設置されるセンサから多変量時系列の数値データを定期的（例えば、１分ごと）に受信し、データ記憶部１３ａに格納する。

ここでセンサが取得するデータとは、例えば、監視対象設備である工場、プラント内の装置や反応炉についての温度や圧力、音、振動等の各種データである。また、センサデータは上記に限定されるものではなく、取得部１２ａは、例えば、センサデータとして、人体に取り付けた加速度センサからセンサデータを取得するようにしてもよい。また、取得部１２ａが取得するデータはセンサが取得したデータに限定されるものではなく、例えば、人的に入力された数値データ等でもよい。

第一の学習部１２ｂは、取得部１２ａによって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで第一のモデルのパラメータを更新する学習処理を行う。

例えば、第一の学習部１２ｂは、データ記憶部１３ａに記憶された時系列データを学習用データセットとして読み出す。そして、第一の学習部１２ｂは、例えば、入力層、畳込み層、全結合層および出力層で構成されるニューラルネットワークに学習用データセットを入力し、本来解きたいタスク（ターゲットタスク）とは異なる疑似的なタスクを解かせることで、第一のモデルのパラメータを更新する学習処理を行う。

第二の学習部１２ｃは、学習用データセットを用いて、第一の学習部１２ｂによって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで第二のモデルのパラメータを更新する学習処理を行う。

例えば、第二の学習部１２ｃは、第一の学習部１２ｂで使用された時系列データと同一の時系列データを学習用データセットとしてデータ記憶部１３ａから読み出す。そして、第二の学習部１２ｃは、例えば、第一の学習部１２ｂによって学習したモデルを初期値として、学習用データセットを入力し、本来解きたいタスクを解かせることで、第二のモデルのパラメータを更新する学習処理を行う。

ここで、第二の学習部１２ｃは、第二のタスクを解かせることで第二のモデル全体のパラメータを更新する学習処理を行うようにしてもよいし、第二のタスクを解かせることで第二のモデルの一部のパラメータを更新する学習処理を行うようにしてもよい。

ここで、図２および図３を用いて、学習装置１０によって実行される学習処理について説明する。図２は、モデル全体のパラメータを更新する処理を説明する図である。図３は、モデルの一部のパラメータを更新する処理を説明する図である。図２および図３の例では、（１）が第一の学習部１２ｂの学習処理であり、（２）が第二の学習部１２ｃの学習処理を示すものである。

図２（１）および図３（１）に例示するように、まず、学習装置１０の第一の学習部１２ｂは、第一のモデルの重み初期値を得るために、本来解きたいタスクとは異なる疑似的なタスク（例えば、回帰）で、自己教師あり学習を行う。

そして、図２の（２）例では、学習装置１０の第二の学習部１２ｃは、第一の学習部１２ｂによって学習した第一のモデルを初期値として、図２の（１）と同じ学習用データセットを入力し、本来解きたいタスクを解かせることで、第二のモデル全体（入力層、畳み込み層、全結合層、出力層）のファインチューニングを行う。

また、図３の（２）例では、学習装置１０の第二の学習部１２ｃは、第一の学習部１２ｂによって学習した第一のモデルを初期値として、図３の（１）と同じ学習用データセットを入力し、本来解きたいタスクを解かせることで、第二のモデル一部のファインチューニングを行う。

例えば、図３の（２）に例示するように、第二の学習部１２ｃは、入力層、畳み込み層、および、全結合層の一部についてはパラメータをそのまま適用し、全結合層のその他の一部と出力層のみファインチューニングを行う。つまり、第二の学習部１２ｂは、入力層により近い一部の層については第一の学習部１２ｂで学習したパラメータをそのまま適用し、出力層により近い一部の層のみ、解きたいタスクで学習処理を行う。

このように、学習装置１０の第二の学習部１２ｃは、第一の学習部１２ｂによって学習した第一のモデルを初期値として、学習用データセットを入力し、本来解きたいタスクを解かせることで、第二のモデルのファインチューニングを行う。つまり、学習装置１０では、時系列データに対して自己教師あり学習を行うことによって従来では困難だった時系列データに対するファインチューニング、転移学習を実行する。

なお、上記した疑似的なタスクは、本来解きたいターゲットタスクと異なるタスクであればよく、どのようなタスクを疑似的に設定してもよい。例えば、本来解きたいターゲットタスクが、センサデータを分類するタスク（例えば、体につけた加速度センサから行動を分類するタスク）である場合には、疑似タスクとして、センサデータの所定時間後の値を予測するタスクを設定してもよい。

この場合には、例えば、第一の学習部１２ｂは、取得部１２ａによって取得されたセンサデータを学習用データセットとして用いて、第一のモデルに対して、センサデータの所定時間後の値を予測するタスクを解かせることで第一のモデルのパラメータを更新する学習処理を行う。つまり、第一の学習部１２ｂは、例えば、疑似タスクとして取得した複数のセンサから疑似タスクとして取得した複数のセンサからある１つのセンサの数ステップ後の未来の値を予測するタスクで第一のモデルの学習を行う。

そして、第二の学習部１２ｃは、学習用データセットを用いて、第一の学習部１２ｂによって学習処理が行われたモデルのパラメータを初期値として、センサデータを分類するタスクを解かせることでモデルのパラメータを更新する学習処理を行う。つまり、第二の学習部１２ｃは、第一の学習部１２ｂで学習した第一のモデルを初期値としてセンサデータを分類するタスクで第二のモデルのファインチューニングを行う。

また、例えば、本来解きたいターゲットタスクが、センサデータの異常値を検知するタスクである場合（例えば、体につけた加速度センサから異常行動を検知するタスク）に、疑似タスクとして、センサデータの所定時間後の値を予測するタスクを設定してもよい。

この場合には、例えば、第一の学習部１２ｂは、取得部１２ａによって取得されたセンサデータを学習用データセットとして用いて、第一のモデルに対して、センサデータの所定時間後の値を予測するタスクを解かせることで第一のモデルのパラメータを更新する学習処理を行う。つまり、第一の学習部１２ｂは、例えば、疑似タスクとして取得した複数のセンサからある１つのセンサの数ステップ後の未来の値を予測するタスクで第一のモデルの学習を行う。

そして、第二の学習部１２ｃは、第一の学習部１２ｂによって学習処理が行われた第一のモデルのパラメータを初期値として、センサデータの異常値を検知するタスクを解かせることでモデルのパラメータを更新する学習処理を行う。つまり、第二の学習部１２ｃは、第一の学習部１２ｂで学習したモデルを初期値としてセンサデータ異常検知するタスクで第二のモデルのファインチューニングを行う。

また、例えば、本来解きたいターゲットタスクが、センサデータの所定時間後の値を予測するタスクを解かせるである場合（例えば、体につけた加速度センサから数秒後の加速度を予測するタスク）に、疑似タスクとして、センサデータを一定区間で区切り、順番をランダムに並び替えたものを正しい順番に並び替えるタスクを設定してもよい。

この場合には、例えば、第一の学習部１２ｂは、取得部１２ａによって取得されたセンサデータを学習用データセットとして用いて、第一のモデルに対して、センサデータを一定区間で区切り、順番をランダムに並び替えたものを正しい順番に並び替えるタスクを解かせることで第一のモデルのパラメータを更新する。つまり、第一の学習部１２ｂは、例えば、疑似タスクとして取得した複数のセンサのデータをある一定区間で区切り、順番をランダムに並び替えたものを正しい順番に並び替えるような学習を行う。

そして、第二の学習部１２ｃは、学習用データセットを用いて、第一の学習部１２ｂによって学習処理が行われた第一のモデルのパラメータを初期値として、センサデータの所定時間後の値を予測するタスクを解かせることで第二のモデルのパラメータを更新する。つまり、第二の学習部１２ｃは、学習したモデルを初期値としてセンサデータを回帰するタスクでモデルのファインチューニングを行う。

ここで、図４の例を用いて、学習装置１０によって実行される学習処理の概要を説明する。図４は、学習装置によって実行される学習処理の概要について説明する図である。図４に例示するように、学習装置１０では、疑似タスクを解く学習ステップ（学習ＳＴＥＰ１）、および、本来解きたいターゲットタスクを解く学習ステップ（学習ＳＴＥＰ２）の２段階の学習ステップを実行する。学習装置１０は、学習ＳＴＥＰ１で学習したモデルの重みを学習ＳＴＥＰ２のモデルの初期値として使う。

つまり、学習装置１０の第一の学習部１２ｂは、第一のモデルの重み初期値を得るために、本来解きたいタスクとは異なる疑似的なタスク（例えば、回帰）で、自己教師あり学習を行う。

そして、学習装置１０の第二の学習部１２ｃは、第一の学習部１２ｂによって学習した第一のモデルを初期値として、学習用データセットを入力し、本来解きたいタスク（例えば、分類）を解かせることで、第二のモデルのファインチューニングを行う。つまり、学習装置１０では、時系列データに対して自己教師あり学習を行うことによって従来では困難だった時系列データに対するファインチューニングを実行する。なお、図４の例では、疑似タスク（pretextタスク）が、センサデータを回帰するタスク、もしくは、ランダムに並び替えられたセンサデータを正しい順番に並び替えるタスク（Jigsaw pazzle）を例示しているが、その他のタスクであってもよい。

このように、学習装置１０の第一の学習部１２ｃは、第一のモデルの重み初期値を得るために、本来解きたいタスクとは異なる疑似的なタスク（例えば、回帰）で、自己教師あり学習を行う。そして、学習装置１０の第二の学習部１２ｃは、第一の学習部１２ｂによって学習した第一のモデルを初期値として、学習用データセットを入力し、本来解きたいタスクを解かせることで、第二のモデルのファインチューニングを行う。つまり、学習装置１０では、時系列データに対して自己教師あり学習を行うことによって従来では困難だった時系列データに対するファインチューニングを実行することができ、時系列データに関するモデルについて、迅速かつ精度よく学習を行うことが可能である。

［学習装置の処理手順］
次に、図５を用いて、第１の実施形態に係る学習装置１０による処理手順の例を説明する。図５は、第１の実施形態に係る学習装置における学習処理の流れの一例を示すフローチャートである。

図５に例示するように、学習装置１０の取得部１２ａがデータを取得すると（ステップＳ１０１肯定）、第一の学習部１２ｂは、疑似的なタスクでモデルを学習する（ステップＳ１０２）。例えば、第一の学習部１２ｂは、ニューラルネットワークに学習用データセットを入力し、本来解きたいタスクとは異なる疑似的なタスクを解かせることで、第一のモデルのパラメータを更新する学習処理を行う。

続いて、第二の学習部１２ｃは、学習したモデルを初期値として、解きたいタスクでモデルを学習する（ステップＳ１０３）。例えば、第二の学習部１２ｃは、例えば、第一の学習部１２ｂによって学習したモデルを初期値として、学習用データセットを入力し、本来解きたいタスクを解かせることで、第二のモデルのパラメータを更新する学習処理を行う。

そして、第二の学習部１２ｃは、所定の終了条件を満たして学習処理を終了すると、学習済みモデルを記憶部１３の学習済みモデル記憶部１３ｃに格納する（ステップＳ１０４）。

［第１の実施形態の効果］
第１の実施形態に係る学習装置１０は、処理対象に関する時系列データを取得する。そして、学習装置１０は、取得した時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで第一のモデルのパラメータを更新する学習処理を行う。続いて、学習装置１０は、学習用データセットを用いて、学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで第二のモデルのパラメータを更新する学習処理を行う。これにより、第１の実施形態に係る学習装置１０では、時系列データに関するモデルについて、迅速かつ精度よく学習を行うことができる。

つまり、第１の実施形態に係る学習装置１０では、従来では困難であった時系列データに対してファインチューニングが可能となり、モデルにランダムな初期値を用いた学習に比べて精度や学習速度、汎用性が向上する。

また、従来の画像分野における自己教師あり学習では画像のドメインに応じて適切なpretext task（疑似タスク）を設定する必要があるが、第１の実施形態に係る学習装置１０では、例えば、時系列データはその性質上数ステップ後を予測するような回帰は簡単に設定できるので疑似タスクを考える負担が少ない。なお、時系列データの特性上、擬似的なタスクとして回帰タスクを解くことは容易であり、自己教師あり学習との親和性が高い。

学習装置１０では、例えば、時系列データに対して解きたいターゲットタスクに有効なデータの特徴表現を擬似的なタスクを事前に解くことで獲得する。また、自己教師あり学習のメリットとして、ラベル付きの新しいデータセットを作る必要がない、大多数のラベルがついてないデータを活用できるという点がある。時系列データに対して自己教師あり学習を用いることによって、汎用で大規模なデータセットが存在しないために困難であったファインチューニングが可能となり、時系列データに対する様々なタスクに対して精度、汎化性能の向上が期待できる。

［システム構成等］
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵやＧＰＵおよび当該ＣＰＵやＧＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

また、本実施の形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

［プログラム］
また、上記実施形態において説明した学習装置が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、実施形態に係る学習装置１０が実行する処理をコンピュータが実行可能な言語で記述した算出プログラムを作成することもできる。この場合、コンピュータが算出プログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかる算出プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された算出プログラムをコンピュータに読み込ませて実行することにより上記実施形態と同様の処理を実現してもよい。

図６は、算出プログラムを実行するコンピュータを示す図である。図６に例示するように、コンピュータ１０００は、例えば、メモリ１０１０と、ＣＰＵ１０２０と、ハードディスクドライブインタフェース１０３０と、ディスクドライブインタフェース１０４０と、シリアルポートインタフェース１０５０と、ビデオアダプタ１０６０と、ネットワークインタフェース１０７０とを有し、これらの各部はバス１０８０によって接続される。

メモリ１０１０は、図６に例示するように、ＲＯＭ（Read Only Memory）１０１１及びＲＡＭ１０１２を含む。ＲＯＭ１０１１は、例えば、ＢＩＯＳ（Basic Input Output System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、図６に例示するように、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、図６に例示するように、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、図６に例示するように、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、図６に例示するように、例えばディスプレイ１１３０に接続される。

ここで、図６に例示するように、ハードディスクドライブ１０９０は、例えば、ＯＳ１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、上記の、算出プログラムは、コンピュータ１０００によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ１０９０に記憶される。

また、上記実施形態で説明した各種データは、プログラムデータとして、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０が、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出し、各種処理手順を実行する。

なお、算出プログラムに係るプログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限られず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、算出プログラムに係るプログラムモジュール１０９３やプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）等）を介して接続された他のコンピュータに記憶され、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

上記の実施形態やその変形は、本願が開示する技術に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

１０学習装置
１１通信処理部
１２制御部
１２ａ取得部
１２ｂ第一の学習部
１２ｃ第二の学習部
１３記憶部
１３ａデータ記憶部
１３ｂ学習済みモデル記憶部

Claims

処理対象に関する時系列データを取得する取得部と、
前記取得部によって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習部と、
前記学習用データセットを用いて、前記第一の学習部によって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習部と
を有し、
前記取得部は、前記時系列データとして、センサデータを取得し、
前記第一の学習部は、前記取得部によって取得されたセンサデータを学習用データセットとして用いて、前記第一のモデルに対して、前記センサデータの所定時間後の値を予測するタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行い、
前記第二の学習部は、前記学習用データセットを用いて、前記第一の学習部によって学習処理が行われた第一のモデルのパラメータを初期値として、前記センサデータを分類するタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行うことを特徴とする学習装置。
処理対象に関する時系列データを取得する取得部と、
前記取得部によって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習部と、
前記学習用データセットを用いて、前記第一の学習部によって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習部と
を有し、
前記取得部は、前記時系列データとして、センサデータを取得し、
前記第一の学習部は、前記取得部によって取得されたセンサデータを学習用データセットとして用いて、前記第一のモデルに対して、前記センサデータの所定時間後の値を予測するタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行い、
前記第二の学習部は、前記学習用データセットを用いて、前記第一の学習部によって学習処理が行われた第一のモデルのパラメータを初期値として、前記センサデータの異常値を検知するタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行うことを特徴とする学習装置。
処理対象に関する時系列データを取得する取得部と、
前記取得部によって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習部と、
前記学習用データセットを用いて、前記第一の学習部によって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習部と
を有し、
前記取得部は、前記時系列データとして、センサデータを取得し、
前記第一の学習部は、前記取得部によって取得されたセンサデータを学習用データセットとして用いて、前記第一のモデルに対して、前記センサデータを一定区間で区切り、順番をランダムに並び替えたものを正しい順番に並び替えるタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行い、
前記第二の学習部は、前記学習用データセットを用いて、前記第一の学習部によって学習処理が行われた第一のモデルのパラメータを初期値として、前記センサデータの所定時間後の値を予測するタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行うことを特徴とする学習装置。
前記第二の学習部は、前記第二のタスクを解かせることで前記第二のモデル全体のパラメータを更新する学習処理を行うことを特徴とする請求項１に記載の学習装置。
前記第二の学習部は、前記第二のタスクを解かせることで前記第二のモデルにおける一部のパラメータを更新する学習処理を行うことを特徴とする請求項１に記載の学習装置。
学習装置によって実行される学習方法であって、
処理対象に関する時系列データを取得する取得工程と、
前記取得工程によって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習工程と、
前記学習用データセットを用いて、前記第一の学習工程によって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習工程と
を含み、
前記取得工程は、前記時系列データとして、センサデータを取得し、
前記第一の学習工程は、前記取得工程によって取得されたセンサデータを学習用データセットとして用いて、前記第一のモデルに対して、前記センサデータの所定時間後の値を予測するタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行い、
前記第二の学習工程は、前記学習用データセットを用いて、前記第一の学習工程によって学習処理が行われた第一のモデルのパラメータを初期値として、前記センサデータを分類するタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行うことを特徴とする学習方法。
学習装置によって実行される学習方法であって、
処理対象に関する時系列データを取得する取得工程と、
前記取得工程によって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習工程と、
前記学習用データセットを用いて、前記第一の学習工程によって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習工程と
を含み、
前記取得工程は、前記時系列データとして、センサデータを取得し、
前記第一の学習工程は、前記取得工程によって取得されたセンサデータを学習用データセットとして用いて、前記第一のモデルに対して、前記センサデータの所定時間後の値を予測するタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行い、
前記第二の学習工程は、前記学習用データセットを用いて、前記第一の学習工程によって学習処理が行われた第一のモデルのパラメータを初期値として、前記センサデータの異常値を検知するタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行うことを特徴とする学習方法。
学習装置によって実行される学習方法であって、
処理対象に関する時系列データを取得する取得工程と、
前記取得工程によって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習工程と、
前記学習用データセットを用いて、前記第一の学習工程によって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習工程と
を含み、
前記取得工程は、前記時系列データとして、センサデータを取得し、
前記第一の学習工程は、前記取得工程によって取得されたセンサデータを学習用データセットとして用いて、前記第一のモデルに対して、前記センサデータを一定区間で区切り、順番をランダムに並び替えたものを正しい順番に並び替えるタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行い、
前記第二の学習工程は、前記学習用データセットを用いて、前記第一の学習工程によって学習処理が行われた第一のモデルのパラメータを初期値として、前記センサデータの所定時間後の値を予測するタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行うことを特徴とする学習方法。
処理対象に関する時系列データを取得する取得ステップと、
前記取得ステップによって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習ステップと、
前記学習用データセットを用いて、前記第一の学習ステップによって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習ステップと
をコンピュータに実行させ、
前記取得ステップは、前記時系列データとして、センサデータを取得し、
前記第一の学習ステップは、前記取得ステップによって取得されたセンサデータを学習用データセットとして用いて、前記第一のモデルに対して、前記センサデータの所定時間後の値を予測するタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行い、
前記第二の学習ステップは、前記学習用データセットを用いて、前記第一の学習ステップによって学習処理が行われた第一のモデルのパラメータを初期値として、前記センサデータを分類するタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行うことを特徴とする学習プログラム。
処理対象に関する時系列データを取得する取得ステップと、
前記取得ステップによって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習ステップと、
前記学習用データセットを用いて、前記第一の学習ステップによって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習ステップと
をコンピュータに実行させ、
前記取得ステップは、前記時系列データとして、センサデータを取得し、
前記第一の学習ステップは、前記取得ステップによって取得されたセンサデータを学習用データセットとして用いて、前記第一のモデルに対して、前記センサデータの所定時間後の値を予測するタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行い、
前記第二の学習ステップは、前記学習用データセットを用いて、前記第一の学習ステップによって学習処理が行われた第一のモデルのパラメータを初期値として、前記センサデータの異常値を検知するタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行うことを特徴とする学習プログラム。
処理対象に関する時系列データを取得する取得ステップと、
前記取得ステップによって取得された時系列データを学習用データセットとして用いて、複数の層で構成されるニューラルネットワークを含む第一のモデルに対して、第一のタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行う第一の学習ステップと、
前記学習用データセットを用いて、前記第一の学習ステップによって学習処理が行われた第一のモデルのパラメータを初期値としたニューラルネットワークを含む第二のモデルに対して、第一のタスクと異なる第二のタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行う第二の学習ステップと
をコンピュータに実行させ、
前記取得ステップは、前記時系列データとして、センサデータを取得し、
前記第一の学習ステップは、前記取得ステップによって取得されたセンサデータを学習用データセットとして用いて、前記第一のモデルに対して、前記センサデータを一定区間で区切り、順番をランダムに並び替えたものを正しい順番に並び替えるタスクを解かせることで前記第一のモデルのパラメータを更新する学習処理を行い、
前記第二の学習ステップは、前記学習用データセットを用いて、前記第一の学習ステップによって学習処理が行われた第一のモデルのパラメータを初期値として、前記センサデータの所定時間後の値を予測するタスクを解かせることで前記第二のモデルのパラメータを更新する学習処理を行うことを特徴とする学習プログラム。