JP6973106B2 - 学習プログラム、学習方法および学習装置 - Google Patents

学習プログラム、学習方法および学習装置 Download PDF

Info

Publication number
JP6973106B2
JP6973106B2 JP2018007640A JP2018007640A JP6973106B2 JP 6973106 B2 JP6973106 B2 JP 6973106B2 JP 2018007640 A JP2018007640 A JP 2018007640A JP 2018007640 A JP2018007640 A JP 2018007640A JP 6973106 B2 JP6973106 B2 JP 6973106B2
Authority
JP
Japan
Prior art keywords
learning
graph data
matrix
distance
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018007640A
Other languages
English (en)
Other versions
JP2019128610A (ja
Inventor
孝広 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018007640A priority Critical patent/JP6973106B2/ja
Priority to US16/246,581 priority patent/US20190228302A1/en
Publication of JP2019128610A publication Critical patent/JP2019128610A/ja
Application granted granted Critical
Publication of JP6973106B2 publication Critical patent/JP6973106B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/10Interfaces, programming languages or software development kits, e.g. for simulating neural networks
    • G06N3/105Shells for specifying net layout

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、学習プログラム、学習方法および学習装置に関する。
グラフ構造のデータを深層学習することが可能なグラフ構造学習技術(以降、このようなグラフ構造学習を行う装置の一形態を「ディープテンソル」と呼ぶ。)が知られている。ディープテンソルによる学習においては、深層学習を行うニューラルネットワークの学習と共に、判別に寄与する部分構造を自動的に抽出して学習を行う事ができる。
また、機械学習については、自己組織化ニューラルネットワークにおいて、学習結果を安定させるために、入力ベクトルの最近傍および第2近傍ノードとの距離によって入力ベクトルを学習させるかどうかを判定することが提案されている。さらに、入力データについてラプラシアン行列を用いてクラスタに分割することが提案されている。また、異なるクラスに属する処理データ間の測地線距離関係とクラス間の距離とを求め、クラス間の距離に応じたクラス間分離度に基づいて、同じクラスに属する処理データ間の測地線距離を他クラスの処理データとの間よりも小さくすることが提案されている。
特開2014−164396号公報 特開2016−004579号公報 特開2015−079381号公報 特開2013−065336号公報
"Deep Tensor: Eliciting New Insights from Graph Data that Express Relationships between People and Things" Koji Maruhashi著 Fujitsu Sci. Tech. J., Vol.53, No.5, pp.26-31 (September 2017)
グラフ構造のデータを深層学習させる場合、グラフに含まれるノードの各要素、および、リンク(エッジ)の接続状態が学習対象とされている。一方、深層学習の判別モデル(学習モデル)における判別ルールは、単にノードの値やリンクの有無に留まらず、例えば、リンクの連鎖状況に関連するルールも存在し得る。すなわち、判別に寄与する部分グラフ構造におけるノード間の接続について、複数のノードを経由するような接続状態を含むルールも存在し得る。
しかしながら、ディープテンソルでは、判別ルールを部分グラフ構造とするため、リンクの連鎖状況に関連するルールを含めるためには、判別ルールの連鎖を表す部分グラフ構造の全てのバリエーションが訓練データに含まれていることが求められる。ところが、このような連鎖が遠距離ノードを含む場合や、連鎖のノード間距離に関する条件として「幾つ以内」を含む場合に、部分グラフ構造のバリエーションが増大するので、その全バリエーションを訓練する事が困難となり、学習が不完全となる。このため、訓練データに含まれない当該連鎖を表す部分グラフ構造のバリエーションを有する新規データを正しく判別することが難しい。つまり、学習時と異なる連鎖状況のグラフについての機械学習の判別精度が低下する。
一つの側面では、学習時と異なる連鎖状況のグラフについての機械学習の判別精度を向上できる学習プログラム、学習方法および学習装置を提供することにある。
一つの態様では、学習プログラムは、グラフデータに対する機械学習処理をコンピュータに実行させる。すなわち、学習プログラムは、学習対象のグラフデータから、前記グラフデータに含まれる各ノードの値、および、前記グラフデータに含まれる各ノードと他ノードとの距離に対応する値を有する、拡張グラフデータを生成する処理をコンピュータに実行させる。学習プログラムは、生成した前記拡張グラフデータを入力テンソルデータとしてテンソル分解し、深層学習する際に、ニューラルネットワークに入力し、前記ニューラルネットワークの深層学習を行うとともに、前記テンソル分解の方法を学習する処理をコンピュータに実行させる。
学習時と異なる連鎖状況のグラフについての機械学習の判別精度を向上できる。
図1は、実施例の学習装置の構成の一例を示すブロック図である。 図2は、グラフ構造とテンソルとの関係の一例を示す図である。 図3は、部分グラフ構造の抽出の一例を示す図である。 図4は、ディープテンソルにおける重み付き接続行列の一例を示す図である。 図5は、条件を満たす部分グラフ構造の一例を示す図である。 図6は、接続行列の数学的性質を説明する図である。 図7は、訓練データの一例を示す図である。 図8は、算出過程の一例を示す図である。 図9は、拡張グラフデータからの部分グラフ構造の抽出の一例を示す図である。 図10は、学習可能な他の判別ルールの一例を示す図である。 図11は、拡張グラフデータからの他の判別ルールに対応する部分グラフ構造の抽出の一例を示す図である。 図12は、学習可能な他の判別ルールの一例を示す図である。 図13は、学習可能な他の判別ルールの一例を示す図である。 図14は、実施例の学習処理の一例を示すフローチャートである。 図15は、実施例の判別処理の一例を示すフローチャートである。 図16は、学習プログラムを実行するコンピュータの一例を示す図である。
以下、図面に基づいて、本願の開示する学習プログラム、学習方法および学習装置の実施例を詳細に説明する。なお、本実施例により、開示技術が限定されるものではない。また、以下の実施例は、矛盾しない範囲で適宜組みあわせてもよい。
図1は、実施例の学習装置の構成の一例を示すブロック図である。図1に示す学習装置100は、グラフ構造のデータを深層学習するディープテンソルによって判別モデルを生成し、判別モデルを用いて新規なグラフ構造のデータを判別する学習装置の一例である。学習装置100は、学習対象のグラフデータから、グラフデータに含まれる各ノードの値、および、グラフデータに含まれる各ノードと他ノードとの距離に対応する値を有する、拡張グラフデータを生成する。学習装置100は、生成した拡張グラフデータを入力テンソルデータとしてテンソル分解し、深層学習する際に、ニューラルネットワークに入力し、ニューラルネットワークの深層学習を行うとともに、テンソル分解の方法を学習する。テンソル分解の結果得られたコアテンソルには、判別に寄与する部分構造を含み、これにより、学習装置100は、学習時と異なる連鎖状況のグラフについての機械学習の判別精度を向上できる。
まず、ディープテンソルについて説明する。ディープテンソルとは、テンソル(グラフ情報)を入力とするディープラーニングであり、ニューラルネットワークの学習とともに、判別に寄与する部分グラフ構造を自動的に抽出する。この抽出処理は、ニューラルネットワークの学習とともに、入力テンソルデータのテンソル分解のパラメータを学習することによって実現される。
次に、図2および図3を用いてグラフ構造について説明する。図2は、グラフ構造とテンソルとの関係の一例を示す図である。図2に示すグラフ20は、4つのノードがノード間の関係性(例えば「相関係数が所定値以上」)を示すエッジで結ばれている。なお、エッジで結ばれていないノード間は、当該関係性がないことを示す。グラフ20を2階のテンソル、つまり行列で表す場合、例えば、ノードの左側の番号に基づく行列表現は「行列A」で表され、ノードの右側の番号(囲み線で囲んだ数字)に基づく行列表現は「行列B」で表される。これらの行列の各成分は、ノード間が結ばれている(接続している)場合「1」で表され、ノード間が結ばれていない(接続していない)場合「0」で表される。以下の説明では、この様な行列を接続行列ともいう。ここで、「行列B」は、「行列A」の2,3行目および2,3列目を同時に置換することで生成できる。ディープテンソルでは、この様な置換処理を用いることで順序の違いを無視して処理を行う。すなわち、「行列A」および「行列B」は、ディープテンソルでは順序性が無視され、同じグラフとして扱われる。なお、3階以上のテンソルについても同様の処理となる。
図3は、部分グラフ構造の抽出の一例を示す図である。図3に示すグラフ21は、6つのノードがエッジで結ばれたものである。グラフ21は、行列(テンソル)で表すと行列22に示すように表現できる。行列22に対して、特定の行および列を入れ替える演算、特定の行および列を抽出する演算、ならびに、接続行列における非ゼロ要素をゼロに置換する演算を組み合わせることで、部分グラフ構造を抽出できる。例えば、行列22の「ノード1,4,5」に対応する行列を抽出すると、行列23となる。次に、行列23の「ノード4,5」間の値をゼロに置換すると、行列24となる。行列24に対応する部分グラフ構造は、グラフ25となる。
このような部分グラフ構造の抽出処理は、テンソル分解と呼ばれる数学的演算によって実現される。テンソル分解とは、入力されたn階テンソルをn階以下のテンソルの積で近似する演算である。例えば、入力されたn階テンソルを1つのn階テンソル(コアテンソルと呼ばれる。)、および、より低階のn個のテンソル(n>2の場合、通常は2階のテンソル、つまり行列が用いられる。)の積で近似する。この分解は一意ではなく、入力データが表すグラフ構造中の任意の部分グラフ構造をコアテンソルに含める事ができる。
続いて、ディープテンソルにおける重み付き接続行列の扱いについて説明する。重み付き接続行列は、ノード間の接続がない場合を「0」、接続がある場合はその重み(>0)が記載された行列である。重み付き接続行列は、例えば、計算機ネットワークにおいて、ノードiとノードjとの間における単位時間あたりの通信回数を(i,j)成分とする行列が挙げられる。一方、ディープテンソルでは、接続行列の重みはエッジのラベルとして扱われる。このため、例えば、大小関係や演算方法等の元々の数値の持つ性質は、考慮されないことになる。上述の計算機ネットワークの例では、(i,j)成分が「2」である場合、この成分が「1」である場合よりも多くの通信を行っていることを表す。つまり、(i,j)成分は、値の大小性を表している。これに対し、ディープテンソルにおいては、この様な関係は無視され、(i,j)成分が「2」である行列が示すグラフと、「1」である行列が示すグラフとは、異なるグラフとして扱われる。
図4は、ディープテンソルにおける重み付き接続行列の一例を示す図である。図4に示すように、例えば、学習時に、訓練データから判別に寄与する部分グラフ構造として、重み「1」のグラフ26および行列27が抽出されたとする。一方、判別時には、重み「2」のグラフ28および行列29が判別対象であるとした場合、グラフ26および行列27とエッジラベルが異なるので、マッチしないと判別される。つまり、ディープテンソルでは、重み付き接続行列の全てのバリエーションが訓練データに含まれていないと、学習が不完全になる場合がある。この様な場合、判別ルールとして、重み付き接続行列の重みに相当する情報が汎化された判別ルールを学習できることが望まれる。
ここで、具体例を挙げて部分グラフ構造のバリエーションについて説明する。まず、具体的な判別タスクは、「対象者の知人関係グラフを入力として、対象者の依存症リスクを判定したい。」であるとする。ここで、依存症としては、例えば、ギャンブル依存症やアルコール依存症等が挙げられる。これらの依存症では、「知人が依存症患者であると、その人も依存症になりやすい。」という知見があり、知人関係のグラフに依存症患者がいるかどうかで依存症リスクを判定可能であるとする。このとき、真の判別ルールの例としては、「距離3以内に2人の依存症患者が存在すれば高リスク。」であるとする。なお、ここでの距離は、判定対象者と直接接続する人物を距離「1」、1人を介して接続する人物を距離「2」といったように表すものである。
図5は、条件を満たす部分グラフ構造の一例を示す図である。図5に示すように、上述の真の判別ルールの条件を満たす部分グラフ構造は、13個のバリエーションがあり、適切な学習を実現するには、訓練データがこの13個を全てカバーすることが求められる。図5では、◎印が判定対象者を示し、○印が非依存症患者を示し、●印が依存症患者を示す。なお、以下の説明においても、グラフおよび接続行列のラベルに同様の印を用いる場合がある。例えば、「●−○−◎−●」は、距離「1」および「2」に依存症患者が1人ずつ存在することを示す。また、距離「2」の依存症患者は、非依存症患者の知人、つまり、非依存症患者を介して判定対象者と接続していることを示す。
上述の真の判別ルールの条件は、13個であるので、全てのバリエーションを訓練データとして用意可能である場合もある。ところが、さらに複雑な判別ルールの条件では、バリエーションの数が増大するため、全てのバリエーションの訓練データを集められないことがある。これに対し、本実施例では、ノード間における距離nの経路数を、接続行列の数学的性質を用いて表現することで、汎化された部分グラフ構造を抽出し、抽出した部分グラフ構造を学習する。
ここで、図6を用いて接続行列の数学的性質を説明する。図6は、接続行列の数学的性質を説明する図である。図6に示すように、グラフ30は、ノード「1〜3」が、それぞれ接続されたグラフ構造である。グラフ30の接続行列31をAとすると、A^nの(i,j)成分は、ノードi,j間における距離nの経路数となる。ただし、この値には、途中の往復経路も含む。つまり、接続行列のn乗における(i,j)成分は、ノードiとノードjとの間の長さnのパスの数を表す。なお、隣接ノードは、距離「3,5,7,・・・」のノードでもある。
例えば、A^2を示す接続行列32は、距離「2」の経路数を表し、A^3を示す接続行列33は、距離「3」の経路数を表す。接続行列32の算出結果の一例としては、A^2(1,1)=2の場合、ノード「1−2−1」、ノード「1−3−1」の2パターンとなる。同様に、例えば、A^2(1,2)=1の場合、ノード「1−3−2」の1パターンとなる。
また、接続行列33の算出結果の一例としては、A^3(1,1)=2の場合、ノード「1−2−3−1」、ノード「1−3−2−1」の2パターンとなる。同様に、例えば、A^3(1,2)=3の場合、ノード「1−2−1−3」、ノード「1−3−1−3」、ノード「1−3−2−3」の3パターンとなる。ここで、距離kで到達する経路がある場合には、その中の1本のエッジで往復することで距離k+2の経路となる。つまり、A^k(i,j)≦A^(k+2)(i,j)が成立する。
次に、学習装置100の構成について説明する。図1に示すように、学習装置100は、通信部110と、表示部111と、操作部112と、記憶部120と、制御部130とを有する。なお、学習装置100は、図1に示す機能部以外にも既知のコンピュータが有する各種の機能部、例えば各種の入力デバイスや音声出力デバイス等の機能部を有することとしてもかまわない。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。通信部110は、図示しないネットワークを介して他の情報処理装置と有線または無線で接続され、他の情報処理装置との間で情報の通信を司る通信インタフェースである。通信部110は、例えば、管理者などの端末から学習用の訓練データや判別対象の新規データを受信する。また、通信部110は、管理者などの端末に、学習結果や判別結果を送信する。
表示部111は、各種情報を表示するための表示デバイスである。表示部111は、例えば、表示デバイスとして液晶ディスプレイ等によって実現される。表示部111は、制御部130から入力された表示画面等の各種画面を表示する。
操作部112は、学習装置100のユーザから各種操作を受け付ける入力デバイスである。操作部112は、例えば、入力デバイスとして、キーボードやマウス等によって実現される。操作部112は、ユーザによって入力された操作を操作情報として制御部130に出力する。なお、操作部112は、入力デバイスとして、タッチパネル等によって実現されるようにしてもよく、表示部111の表示デバイスと、操作部112の入力デバイスとは、一体化されるようにしてもよい。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、ハードディスクや光ディスク等の記憶装置によって実現される。記憶部120は、訓練データ記憶部121と、拡張グラフデータ記憶部122と、判別モデル記憶部123とを有する。また、記憶部120は、制御部130での処理に用いる情報を記憶する。
訓練データ記憶部121は、例えば、通信部110を介して入力された学習対象の訓練データを記憶する。訓練データ記憶部121には、例えば、依存症患者に関する判定ルールの一部を表すグラフに対応する学習対象のグラフデータが訓練データとして記憶される。
拡張グラフデータ記憶部122は、訓練データに含まれる各ノード間の最長距離までの距離数に応じて訓練データのグラフに対応する接続行列を冪乗した行列に基づく距離行列を対角成分とする行列を、拡張グラフデータとして記憶する。
判別モデル記憶部123は、拡張グラフデータを深層学習した判別モデルを記憶する。判別モデルは、学習モデルとも呼ばれ、例えば、ニューラルネットワークの各種パラメータ(重み係数)や、テンソル分解の方法等を記憶する。
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、内部の記憶装置に記憶されているプログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されるようにしてもよい。制御部130は、取得部131と、生成部132と、学習部133と、判別部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図1に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
取得部131は、例えば、通信部110を介して、管理者などの端末から学習用の訓練データを受信して取得する。なお、取得部131は、訓練データがグラフである場合には、対応する接続行列に変換する。取得部131は、取得した行列(接続行列)、または、変換した接続行列を訓練データとして訓練データ記憶部121に記憶する。取得部131は、訓練データを訓練データ記憶部121に記憶すると、生成部132に生成指示を出力する。
ここで、図7を用いて訓練データについて説明する。図7は、訓練データの一例を示す図である。図7のグラフ34は、「●−◎−●」であるので、2人の依存症患者がどちらも判定対象者から距離「1」であることを示す。グラフ34は、行列で表現すると、接続行列35に示すようになる。取得部131は、例えば、接続行列35を訓練データとして訓練データ記憶部121に記憶する。
図1の説明に戻って、生成部132は、取得部131から生成指示が入力されると、訓練データ記憶部121を参照し、訓練データに基づいて、拡張グラフデータを生成する。生成部132は、まず、各訓練データにおける最長距離を算出する。生成部132は、算出した各訓練データにおける最長距離のうち、最大値を最長距離mとする。例えば、図5に示す13パターン(13個のバリエーション)の部分グラフ構造では、最長距離m=3となる。なお、最長距離mは、判定する分野の知識に基づいて、適当な値を決定してもよい。例えば、ある分野において「距離「10」以上離れている場合は影響がない。」という知見があれば、最長距離m=9とすることができる。
次に、生成部132は、最長距離mに基づいて、k=1,2,・・・,mを用いて、距離k以内の経路数を表すS_kを算出する。つまり、生成部132は、S_k=A+A^2+・・・+A^kを算出する。ここで、Aは、接続行列を示す。続いて、生成部132は、S_kに基づいて、次のルールR1,R2で定義されるn×nの行列B_kを算出する。なお、以下の説明では、B_kを距離行列とも表現する。また、S_kは、図6に示す接続行列の数学的性質を用いて、k>1の場合に、S_k=A^(k−1)+A^kとしてもよい。
S_kの成分(i,j)について、ルールR1は、i=jのとき、B_k(i,j)=1とする。ルールR2は、i≠jのとき、S_k(i,j)>0ならばB_k(i,j)=k+1、S_k(i,j)=0ならばB_k(i,j)=0とする。つまり、距離行列B_kは、S_kから無駄な往復を除いている。
このように算出された距離行列B_kは、接続行列Aにおいて距離k以内の経路が存在するノードの組が、重みk+1で接続されているとした重み付き接続行列となる。すなわち、生成部132は、A+A^2+・・・+A^kの非ゼロ要素をk+1、対角成分を1とする重み付き接続行列B_kを算出する。
ここで、図8を用いて距離行列B_kの算出過程を説明する。図8は、算出過程の一例を示す図である。図8では、図7に示す接続行列35をAとして、S_kおよびB_k(k=3)の算出過程を示す。まず、A^1は、接続行列35となり、S_1=Aから、S_1は、接続行列35と同じである接続行列35aとなる。また、B_1は、上述のルールR1,R2に基づいて、距離行列35bとなる。
A^2は、接続行列36となり、S_2=A+A^2から、S_2は、接続行列36aとなる。また、B_2は、上述のルールR1,R2に基づいて、距離行列36bとなる。A^3は、接続行列37となり、S_3=A+A^2+A^3から、S_3は、接続行列37aとなる。また、B_3は、上述のルールR1,R2に基づいて、距離行列37bとなる。
次に、生成部132は、生成した距離行列B_kに基づいて、下記の式(1)に示す行列を生成する。ここで、Eはn×nの単位行列である。図8の例では、生成部132は、B_1,B_2,B_3を対角成分とする行列Yを生成する。つまり、生成部132は、B_1〜B_mをノード間関係情報とともに合成した行列Yを生成する。
Figure 0006973106
生成部132は、式(1)で示す行列Yを、拡張グラフデータとして拡張グラフデータ記憶部122に記憶する。生成部132は、拡張グラフデータを拡張グラフデータ記憶部122に記憶すると、学習部133に学習指示を出力する。
言い換えると、生成部132は、学習対象のグラフデータから、グラフデータに含まれる各ノードの値、および、グラフデータに含まれる各ノードと他ノードとの距離に対応する値を有する、拡張グラフデータを生成する。つまり、生成部132は、各ノードと他ノードとの接続を表す接続行列(A)を生成し、生成した接続行列に基づく距離行列(B_k)を対角成分とする行列(Y)を拡張グラフデータとして生成する。すなわち、生成部132は、グラフデータに含まれる各ノード間の最長距離(m)を算出し、算出した最長距離までの距離数に応じて接続行列(A)を冪乗した行列(S_k)に基づく距離行列(B_k)をそれぞれ生成する。生成部132は、生成したそれぞれの距離行列を対角成分とする行列(Y)を拡張グラフデータとして生成する。
学習部133は、生成部132から学習指示が入力されると、拡張グラフデータ記憶部122を参照し、拡張グラフデータを学習して判別モデルを生成または更新する。つまり、学習部133は、拡張グラフデータをテンソル分解し、コアテンソル(部分グラフ構造)を生成する。学習部133は、生成したコアテンソルをニューラルネットワークに入力して出力を得る。学習部133は、出力値の誤差が小さくなるように学習するとともに、判定精度が高くなるようにテンソル分解のパラメータを学習する。テンソル分解においては自由度があり、テンソル分解のパラメータとして、分解モデル、制約、最適化アルゴリズムの組み合わせ等が挙げられる。分解モデルは、例えば、CP(Canonical Polyadic decomposition)やTuckerが挙げられる。制約は、例えば、直交制約、スパース制約、スムース制約、非負制約等が挙げられる。最適化アルゴリズムは、例えば、ALS(Alternating Least Square)、HOSVD(Higher Order Singular Value Decomposition)、HOOI(Higher Order Orthogonal Iteration of tensors)等が挙げられる。ディープテンソルにおいては、「判定精度が高くなる」という制約下でテンソル分解を行う事になる。
その後、学習部133は、所定回数の学習が実行された場合、または、誤差が所定値より小さくなった場合に学習を終了し、各種パラメータやテンソル分解の方法等を判別モデルとして判別モデル記憶部123に記憶する。なお、ニューラルネットワークは、RNN(再帰型ニューラルネットワーク:Recurrent Neural Network)など様々なニューラルネットワークを用いることができる。また、学習方法は、誤差逆伝播法など様々な手法を採用することができる。
ここで、図9を用いて部分グラフ構造の抽出について説明する。図9は、拡張グラフデータからの部分グラフ構造の抽出の一例を示す図である。図9に示すように、行列39は、拡張グラフデータ(Y)である行列38を展開した行列であり、対角成分には、例えば、図8のB_1,B_2,B_3に対応する距離行列35b,36b,37bを有する。学習部133は、行列39に対して、特定の行および列を入れ替える演算、特定の行および列を抽出する演算、ならびに、接続行列における非ゼロ要素をゼロに置換する演算を組み合わせることで、部分グラフ構造の行列40を抽出する。図9の例では、学習部133は、B_3に対応する距離行列37bの値の一部をゼロに置換する演算により行列40を生成する。行列40に対応する部分グラフ構造は、グラフ41となる。なお、ディープテンソルにおいては、入力の成分における各値の数値的な意味、例えば、値の大小関係は考慮されず、エッジのラベルとして扱われる。ラベルの意味は、ラベル「1」が同一人物であることを表し、ラベル「n(n>1)」が距離n未満で接続可能であることを表す。
グラフ41は、判定対象者と2人の依存症患者のそれぞれとを接続するエッジに距離「4」未満を表すラベルが付されている重み付きグラフである。つまり、グラフ41は、2人の依存症患者がどちらも判定対象者から距離「4」未満に存在することを表す。すなわち、グラフ41は、上述の真の判別ルールの例として挙げた「距離3以内に2人の依存症患者が存在すれば高リスク。」を表す部分グラフ構造である。このため、図5の例では、13個のバリエーションの全ての部分グラフ構造を抽出して学習することが求められたが、学習装置100では、グラフ41の1個のバリエーションの部分グラフ構造を抽出して学習すればよいことになる。従って、学習装置100は、訓練データが少なくても、汎化された判別ルールを学習することができる。
言い換えると、学習部133は、生成した拡張グラフデータを入力テンソルデータとしてテンソル分解し、深層学習する際に、ニューラルネットワークに入力し、ニューラルネットワークの深層学習を行うとともに、テンソル分解の方法を学習する。
図1の説明に戻って、判別部134は、判別モデルの学習後に、新規データを取得し、判別モデルを用いて判別した判別結果を出力する。判別部134は、例えば、通信部110を介して、管理者などの端末から判別対象の新規データを受信して取得する。判別部134は、学習時の生成部132と同様に、取得した新規データに基づいて、拡張グラフデータを生成する。
判別部134は、判別モデル記憶部123を参照し、判別モデルを用いて、生成した拡張グラフデータを判別する。すなわち、判別部134は、判別モデルの各種パラメータを設定したニューラルネットワークを構築し、テンソル分解の方法を設定する。判別部134は、生成した拡張グラフデータをテンソル分解し、ニューラルネットワークに入力して、判別結果を取得する。判別部134は、取得した判別結果を表示部111に出力して表示したり、記憶部120に出力して記憶したりする。
ここで、図10から図13を用いて他の判別ルールの場合について説明する。図10は、学習可能な他の判別ルールの一例を示す図である。図10の例では、判別ルールとして「距離「3」以内に2人の依存症患者が存在し、うち1人は距離「1」である。」であったとする。この判別ルールに対応する部分グラフ構造を示す行列は、行列42となる。グラフ43は、行列42を重み付きグラフで表現した場合のグラフである。図7に示す訓練データのグラフ34は、この判別ルールにマッチする。グラフ34に基づいて生成した行列である図9の行列39は、行列42を含む。つまり、行列39は、グラフ43で示す部分グラフ構造を含む。従って、学習装置100は、当該判別ルールを学習することができる。
図11を用いて、行列39から行列42を抽出する手順について説明する。図11は、拡張グラフデータからの他の判別ルールに対応する部分グラフ構造の抽出の一例を示す図である。図11に示すように、学習装置100は、行列39から、1,2,7,9行および列を抽出して、行列44を生成する。学習装置100は、行列44の2,3行および列を入れ替えて、行列45を生成する。学習装置100は、行列45の対角成分をゼロに置換して、行列42を生成する。このように、行列42は、部分グラフ構造の抽出に許される演算を用いて行列39から得ることができるので、行列39に示す拡張グラフデータは、行列42に対応する部分グラフ構造であるグラフ43を含むといえる。
図12および図13を用いて、学習可能な汎化された判別ルールの他の例について説明する。図12は、学習可能な他の判別ルールの一例を示す図である。図12の例では、判別ルールとして「距離「4」以内に2人の依存症患者が存在し、うち1人は距離「1」である。」であったとする。この判別ルールにマッチする訓練データは、グラフ47に示す部分グラフ構造を含むことになる。グラフ47に対応する行列表現は、行列48となる。つまり、学習装置100は、行列48を含む訓練データを学習することで、上述の判別ルールを学習することができる。
図13は、学習可能な他の判別ルールの一例を示す図である。図13の例では、判別ルールとして「距離「4」以内に3人の依存症患者が存在し、その依存症患者中の少なくとも2人は距離「2」以内である。」であったとする。この判別ルールにマッチする訓練データは、グラフ49に示す部分グラフ構造を含むことになる。グラフ49に対応する行列表現は、行列50となる。つまり、学習装置100は、行列50を含む訓練データを学習することで、上述の判別ルールを学習することができる。学習装置100は、図12および図13に示すような複雑な判別ルールであっても、判別ルールにマッチする全ての訓練データが同一の部分グラフ構造を含むので、判別ルールを容易に学習することができる。
次に、実施例の学習装置100の動作について説明する。まず、判別モデルを学習する学習処理について説明する。図14は、実施例の学習処理の一例を示すフローチャートである。
取得部131は、例えば、管理者などの端末から学習用の訓練データを受信して取得する(ステップS1)。取得部131は、取得した訓練データを訓練データ記憶部121に記憶する。取得部131は、訓練データを訓練データ記憶部121に記憶すると、生成部132に生成指示を出力する。
生成部132は、取得部131から生成指示が入力されると、各訓練データにおける最長距離を算出する。生成部132は、算出した各訓練データにおける最長距離のうち、最大値を最長距離mに設定する(ステップS2)。生成部132は、訓練データ記憶部121を参照し、訓練データおよび最長距離mに基づいて、拡張グラフデータを生成する(ステップS3)。生成部132は、生成した拡張グラフデータを拡張グラフデータ記憶部122に記憶する。生成部132は、拡張グラフデータを拡張グラフデータ記憶部122に記憶すると、学習部133に学習指示を出力する。
学習部133は、生成部132から学習指示が入力されると、拡張グラフデータ記憶部122を参照し、拡張グラフデータを学習する(ステップS4)。学習部133は、所定回数の学習が実行された場合、または、誤差が所定値より小さくなった場合に学習を終了し、各種パラメータやテンソル分解の方法等を判別モデルとして判別モデル記憶部123に記憶する(ステップS5)。これにより、学習装置100は、学習時と異なる連鎖状況のグラフについての機械学習の判別精度を向上できる。また、学習装置100は、拡張グラフデータが遠距離ノード間の接続が隣接ノードとなる部分グラフ構造を含むため、遠距離ノードを含む部分グラフ構造のバリエーションが大きく抑制されるので、少ない訓練データでも判別ルールが学習できる。
続いて、新規データを判別する判別処理について説明する。図15は、実施例の判別処理の一例を示すフローチャートである。
判別部134は、例えば、管理者などの端末から判別対象の新規データを受信して取得する(ステップS11)。判別部134は、取得した新規データおよび最長距離mに基づいて、拡張グラフデータを生成する(ステップS12)。判別部134は、判別モデル記憶部123を参照し、判別モデルを用いて、生成した拡張グラフデータを判別する(ステップS13)。判別部134は、判別モデルの判別結果を、例えば、表示部111に出力して表示させる(ステップS14)。これにより、学習装置100は、学習時と異なる連鎖状況のグラフであって、訓練データと共通する部分グラフ構造を有するグラフ構造のデータを判別できる。つまり、学習装置100は、学習時と異なる連鎖状況のグラフについての機械学習の判別精度を向上できる。
このように、学習装置100は、学習対象のグラフデータから、グラフデータに含まれる各ノードの値、および、グラフデータに含まれる各ノードと他ノードとの距離に対応する値を有する、拡張グラフデータを生成する。また、学習装置100は、生成した拡張グラフデータを入力テンソルデータとしてテンソル分解し、深層学習する際に、ニューラルネットワークに入力し、ニューラルネットワークの深層学習を行うとともに、テンソル分解の方法を学習する。その結果、学習装置100は、学習時と異なる連鎖状況のグラフについての機械学習の判別精度を向上できる。
また、学習装置100は、各ノードと他ノードとの接続を表す接続行列を生成し、生成した接続行列に基づく距離行列を対角成分とする行列を拡張グラフデータとして生成する。その結果、学習装置100は、遠距離ノードを含む場合や、距離幾つ以内といった条件を含む場合であっても、少ない訓練データで学習することができる。
また、学習装置100は、グラフデータに含まれる各ノード間の最長距離を算出し、算出した最長距離までの距離数に応じて接続行列を冪乗した行列に基づく距離行列をそれぞれ生成する。また、学習装置100は、生成したそれぞれの距離行列を対角成分とする行列を拡張グラフデータとして生成する。その結果、学習装置100は、遠距離ノードを含む場合や、距離幾つ以内といった条件を含む場合であっても、少ない訓練データで学習することができる。
なお、上記実施例では、ニューラルネットワークとして、RNNを一例として挙げたが、これに限定されない。例えば、CNN(Convolutional Neural Network)など様々なニューラルネットワークを用いることができる。また、学習の手法も、誤差逆伝播以外にも公知の様々な手法を採用することができる。また、ニューラルネットワークは、例えば入力層、中間層(隠れ層)、出力層から構成される多段構成であり、各層は複数のノードがエッジで結ばれる構造を有する。各層は、「活性化関数」と呼ばれる関数を持ち、エッジは「重み」を持ち、各ノードの値は、前の層のノードの値、接続エッジの重みの値、層が持つ活性化関数から計算される。なお、計算方法については、公知の様々な手法を採用できる。また、機械学習としては、ニューラルネットワーク以外にも、SVM(support vector machine)等の各種手法を用いてもよい。
また、図示した各部の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、取得部131と生成部132とを統合してもよい。また、図示した各処理は、上記の順番に限定されるものでなく、処理内容を矛盾させない範囲において、同時に実施してもよく、順序を入れ替えて実施してもよい。
さらに、各装置で行われる各種処理機能は、CPU(またはMPU、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、CPU(またはMPU、MCU等のマイクロ・コンピュータ)で解析実行されるプログラム上、またはワイヤードロジックによるハードウェア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。
ところで、上記の各実施例で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の各実施例と同様の機能を有するプログラムを実行するコンピュータの一例を説明する。図16は、学習プログラムを実行するコンピュータの一例を示す図である。
図16に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、データ入力を受け付ける入力装置202と、モニタ203とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読み取る媒体読取装置204と、各種装置と接続するためのインタフェース装置205と、他の情報処理装置等と有線または無線により接続するための通信装置206とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM207と、ハードディスク装置208とを有する。また、各装置201〜208は、バス209に接続される。
ハードディスク装置208には、図1に示した取得部131、生成部132、学習部133および判別部134の各処理部と同様の機能を有する学習プログラムが記憶される。また、ハードディスク装置208には、訓練データ記憶部121、拡張グラフデータ記憶部122、判別モデル記憶部123、および、学習プログラムを実現するための各種データが記憶される。入力装置202は、例えば、コンピュータ200の管理者から操作情報等の各種情報の入力を受け付ける。モニタ203は、例えば、コンピュータ200の管理者に対して表示画面等の各種画面を表示する。インタフェース装置205は、例えば印刷装置等が接続される。通信装置206は、例えば、図1に示した通信部110と同様の機能を有し図示しないネットワークと接続され、他の情報処理装置と各種情報をやりとりする。
CPU201は、ハードディスク装置208に記憶された各プログラムを読み出して、RAM207に展開して実行することで、各種の処理を行う。また、これらのプログラムは、コンピュータ200を図1に示した取得部131、生成部132、学習部133および判別部134として機能させることができる。
なお、上記の学習プログラムは、必ずしもハードディスク装置208に記憶されている必要はない。例えば、コンピュータ200が読み取り可能な記憶媒体に記憶されたプログラムを、コンピュータ200が読み出して実行するようにしてもよい。コンピュータ200が読み取り可能な記憶媒体は、例えば、CD−ROMやDVD(Digital Versatile Disc)、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN等に接続された装置にこの学習プログラムを記憶させておき、コンピュータ200がこれらから学習プログラムを読み出して実行するようにしてもよい。
100 学習装置
110 通信部
111 表示部
112 操作部
120 記憶部
121 訓練データ記憶部
122 拡張グラフデータ記憶部
123 判別モデル記憶部
130 制御部
131 取得部
132 生成部
133 学習部
134 判別部

Claims (5)

  1. グラフデータに対する機械学習処理をコンピュータに実行させる学習プログラムであって、
    学習対象のグラフデータから、前記グラフデータに含まれる各ノードの値、および、前記グラフデータに含まれる各ノードと他ノードとの距離に対応する値を有する、拡張グラフデータを生成し、
    生成した前記拡張グラフデータを入力テンソルデータとしてテンソル分解し、深層学習する際に、ニューラルネットワークに入力し、前記ニューラルネットワークの深層学習を行うとともに、前記テンソル分解の方法を学習する、
    処理を前記コンピュータに実行させることを特徴とする学習プログラム。
  2. 前記生成する処理は、各ノードと他ノードとの接続を表す接続行列を生成し、生成した前記接続行列に基づく距離行列を対角成分とする行列を前記拡張グラフデータとして生成する、
    ことを特徴とする請求項1に記載の学習プログラム。
  3. 前記生成する処理は、前記グラフデータに含まれる各ノード間の最長距離を算出し、算出した前記最長距離までの距離数に応じて前記接続行列を冪乗した行列に基づく前記距離行列をそれぞれ生成し、生成したそれぞれの前記距離行列を対角成分とする行列を前記拡張グラフデータとして生成する、
    ことを特徴とする請求項2に記載の学習プログラム。
  4. グラフデータに対する機械学習処理をコンピュータが実行する学習方法であって、
    学習対象のグラフデータから、前記グラフデータに含まれる各ノードの値、および、前記グラフデータに含まれる各ノードと他ノードとの距離に対応する値を有する、拡張グラフデータを生成し、
    生成した前記拡張グラフデータを入力テンソルデータとしてテンソル分解し、深層学習する際に、ニューラルネットワークに入力し、前記ニューラルネットワークの深層学習を行うとともに、前記テンソル分解の方法を学習する、
    処理を前記コンピュータが実行することを特徴とする学習方法。
  5. グラフデータに対する機械学習を行う学習装置であって、
    学習対象のグラフデータから、前記グラフデータに含まれる各ノードの値、および、前記グラフデータに含まれる各ノードと他ノードとの距離に対応する値を有する、拡張グラフデータを生成する生成部と、
    生成した前記拡張グラフデータを入力テンソルデータとしてテンソル分解し、深層学習する際に、ニューラルネットワークに入力し、前記ニューラルネットワークの深層学習を行うとともに、前記テンソル分解の方法を学習する学習部と、
    を有することを特徴とする学習装置。
JP2018007640A 2018-01-19 2018-01-19 学習プログラム、学習方法および学習装置 Active JP6973106B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018007640A JP6973106B2 (ja) 2018-01-19 2018-01-19 学習プログラム、学習方法および学習装置
US16/246,581 US20190228302A1 (en) 2018-01-19 2019-01-14 Learning method, learning device, and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018007640A JP6973106B2 (ja) 2018-01-19 2018-01-19 学習プログラム、学習方法および学習装置

Publications (2)

Publication Number Publication Date
JP2019128610A JP2019128610A (ja) 2019-08-01
JP6973106B2 true JP6973106B2 (ja) 2021-11-24

Family

ID=67299391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018007640A Active JP6973106B2 (ja) 2018-01-19 2018-01-19 学習プログラム、学習方法および学習装置

Country Status (2)

Country Link
US (1) US20190228302A1 (ja)
JP (1) JP6973106B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11037330B2 (en) * 2017-04-08 2021-06-15 Intel Corporation Low rank matrix compression
JP7006296B2 (ja) * 2018-01-19 2022-01-24 富士通株式会社 学習プログラム、学習方法および学習装置
CN111460822B (zh) * 2020-03-27 2024-02-27 北京百度网讯科技有限公司 主题扩展的方法、装置、设备和存储介质
CN113760959A (zh) * 2020-11-30 2021-12-07 浙江华云信息科技有限公司 一种站内图间隔智能修改方法
WO2022145089A1 (ja) * 2020-12-28 2022-07-07 Soinn株式会社 情報処理装置、情報処理方法及び非一時的なコンピュータ可読媒体
CN116819599B (zh) * 2022-12-26 2024-01-23 成都理工大学工程技术学院 一种中子-伽马射线甄别方法、系统、设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10268964B2 (en) * 2016-03-30 2019-04-23 1Qb Information Technologies Inc. Method and system for solving a minimum connected dominating set problem using quantum annealing for distance optimization

Also Published As

Publication number Publication date
JP2019128610A (ja) 2019-08-01
US20190228302A1 (en) 2019-07-25

Similar Documents

Publication Publication Date Title
JP6973106B2 (ja) 学習プログラム、学習方法および学習装置
US11699004B2 (en) Method and system for quantum computing
Feki et al. Federated learning for COVID-19 screening from Chest X-ray images
Aridas et al. Uncertainty based under-sampling for learning naive bayes classifiers under imbalanced data sets
US11580363B2 (en) Systems and methods for assessing item compatibility
JP7006296B2 (ja) 学習プログラム、学習方法および学習装置
JP7063080B2 (ja) 機械学習プログラム、機械学習方法および機械学習装置
JP7006297B2 (ja) 学習プログラム、学習方法および学習装置
JP6977886B2 (ja) 機械学習方法、機械学習装置、及び機械学習プログラム
JP7115207B2 (ja) 学習プログラム、学習方法および学習装置
Colliri et al. A network-based high level data classification technique
JP7063274B2 (ja) 情報処理装置、ニューラルネットワークの設計方法及びプログラム
JP7225874B2 (ja) モデル出力プログラム、モデル出力方法及びモデル出力装置
WO2021255778A1 (ja) 学習データ選択方法、学習データ選択装置、及び学習データ選択プログラム
Fabian et al. Estimating the execution time of the coupled stage in multiscale numerical simulations
WO2020040007A1 (ja) 学習装置、学習方法及び学習プログラム
JP7343032B2 (ja) 学習装置、学習方法および学習プログラム
Mao et al. Quantum Circuit Fidelity Improvement with Long Short-Term Memory Networks
KR20200061154A (ko) 시각 및 텍스트 정보를 포함하는 다이어그램의 분석 방법 및 장치
JP6633267B2 (ja) 次元削減装置、方法及びプログラム
JP7405148B2 (ja) 情報処理装置、学習方法、及び、プログラム
JPWO2009075128A1 (ja) 統合異常検知システム、統合異常検知装置、統合異常検知方法およびプログラム
WO2022137386A1 (ja) ルール更新プログラム、ルール更新方法およびルール更新装置
Bhattacharya et al. Repeated Active Screening of Networks for Diseases
Bevilacqua et al. Bayesian Gene Regulatory Network Inference Optimization by means of Genetic Algorithms.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211018

R150 Certificate of patent or registration of utility model

Ref document number: 6973106

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150