JP6600917B2

JP6600917B2 - Ａｉ学習による経路制御手法、サーバ装置及び経路制御プログラム

Info

Publication number: JP6600917B2
Application number: JP2016230507A
Authority: JP
Inventors: 后宏水谷; 武井上; 修明石; 寧加藤; ズバイルモハンマドファドウルラ
Original assignee: Tohoku University NUC; Nippon Telegraph and Telephone Corp
Current assignee: Tohoku University NUC; Nippon Telegraph and Telephone Corp
Priority date: 2016-11-28
Filing date: 2016-11-28
Publication date: 2019-11-06
Anticipated expiration: 2036-11-28
Also published as: JP2018088602A

Description

本開示は、通信ネットワークにおけるＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）学習を用いた経路制御手法、サーバ装置及び経路制御プログラムに関する。

通信ネットワークにおける経路制御手法において、宛先に向けてパケットを転送するだけではなく、ＴＥ（ＴｒａｆｆｉｃＥｎｇｉｎｅｅｒｉｎｇ）などの高度な目的を持つ手法が提案されている（例えば、非特許文献１参照。）。ＴＥの技術向上は、ネットワークの到達性や信頼性を向上させることから、ＮＷの運用上、極めて重要な技術要素であり、本開示の貢献は大きい。

ＴＥのためには、様々な通信要求に対して、いずれも輻輳しないようにそれぞれのパスを決定する必要がある。しかし、そのような計算はＮＰ（Ｎｏｎ−ｄｅｔｅｒｍｉｎｉｓｔｉｃＰｏｌｙｎｏｍｉａｌｔｉｍｅ）困難であり、通信要求が発生してからリアルタイムにパスを計算することは難しい。

Ｂ．ＦｏｒｔｚａｎｄＭ．Ｔｈｏｒｕｐ， "ＩｎｔｅｒｎｅｔｔｒａｆｆｉｃｅｎｇｉｎｅｅｒｉｎｇｂｙｏｐｔｉｍｉｚｉｎｇＯＳＰＦｗｅｉｇｈｔｓ，" ｉｎＩＥＥＥＩＮＦＯＣＯＭ，ｖｏｌ．２，２０００，ｐｐ．５１９−５２８．Ｒ．ＳａｌａｋｈｕｔｄｉｎｏｖａｎｄＧ．Ｈｉｎｔｏｎ， "Ａｎｅｆｆｉｃｉｅｎｔｌｅａｒｎｉｎｇｐｒｏｃｅｄｕｒｅｆｏｒｄｅｅｐｂｏｌｔｚｍａｎｎｍａｃｈｉｎｅｓ，" Ｎｅｕｒａｌｃｏｍｐｕｔａｔｉｏｎ，ｖｏｌ．２４，ｎｏ．８，ｐｐ．１９６７−２００６，２０１２．

本開示は、ルータ数が増加した場合であっても、ＮＰ困難の問題を解くことなく、最適なパスを現実的な期間で学習可能にすることを目的とする。

本開示は、通信ネットワークにおける経路制御を行うため、通信要求を表す交流行列に対して各入口ルータから出口ルータまでのパスを事前学習する方法において、各ルータごとに次ホップを学習する。

具体的には、本開示に係る経路制御方法は、
ネットワークに含まれるルータの経路を制御する経路制御方法であって、
最適パス計算部が、前記ネットワークに含まれるルータの経路における入口ルータ及び出口ルータを対とする教師データ用の通信要求及び最適経路を取得し、最適経路上の各ルータにおける次ホップを、各最適経路について求める次ホップ導出ステップと、
関数学習部が、最適経路上の各ルータについて、当該最適経路のときの各ルータの通信要求及び当該最適経路のときの次ホップを教師データに用い、次ホップを求める次ホップ導出関数を学習する関数学習ステップと、
次ホップ設定部が、前記ネットワークにおいて発生した通信要求及び当該通信要求の入口ルータ及び出口ルータを取得し、当該通信要求に対する次ホップを、前記次ホップ導出関数を用いて求める次ホップ設定ステップと、
を有する。

本開示は、
前記ネットワークに含まれるルータが、
パケットを受信するステップと、
当該パケットの入口ルータ及び出口ルータを決定するステップと、
決定した入口ルータ及び出口ルータに対応する次ホップを、前記次ホップ設定部で設定された次ホップに従って選択するステップと、
選択した次ホップへ向けて当該パケットを送出するステップと、
を有する態様を含む。

本開示は、
前記次ホップ設定部は、前記ネットワークに含まれるルータの経路を制御するサーバ装置に備わり、
前記サーバ装置が、前記次ホップ設定部の設定した次ホップを、前記ネットワークに含まれる各ルータに設定するルータ設定ステップをさらに有する態様を含む。

本開示は、
前記関数学習部は、前記ネットワークに含まれるルータの経路を制御するサーバ装置に備わり、
前記次ホップ設定部は、前記ネットワークに含まれる各ルータに備わり、
前記サーバ装置が、前記次ホップ導出関数を、前記ネットワークに含まれる各ルータに設定するルータ設定ステップを、前記関数学習ステップと前記次ホップ設定ステップの間にさらに有し、
前記次ホップ設定ステップにおいて、前記次ホップ設定部が、前記ネットワークにおいて発生した通信要求に対する自装置の次ホップを、前記次ホップ導出関数を用いて求める態様を含む。

本開示は、
前記次ホップ設定ステップにおいて、前記次ホップ設定部が、前記ネットワークにおいて発生した通信要求に対する当該通信要求の入口ルータから出口ルータまでの各ルータにおける次ホップを、前記次ホップ導出関数を用いて求め、
前記ネットワークに含まれるルータは、
受信したパケットの入口ルータが自装置である場合、
当該パケットの入口ルータから出口ルータまでの各ルータにおける次ホップを用いて、受信したパケットの経路を設定する態様を含む。

具体的には、本開示に係るサーバ装置は、
ネットワークに含まれるルータの経路を制御するサーバ装置であって、
前記ネットワークに含まれるルータの経路における入口ルータ及び出口ルータを対とする教師データ用の通信要求及び最適経路を取得し、最適経路上の各ルータにおける次ホップを、各最適経路について求める最適パス計算部と、
最適経路上の各ルータについて、当該最適経路のときの各ルータの通信要求及び当該最適経路のときの次ホップを教師データに用い、次ホップを求める次ホップ導出関数を学習する関数学習部と、
前記ネットワークにおいて発生した通信要求及び当該通信要求の入口ルータ及び出口ルータを取得し、当該通信要求に対する次ホップを、前記次ホップ導出関数を用いて求める次ホップ設定部と、
を備える。

具体的には、本開示に係る経路制御プログラムは、本開示に係る経路制御方法に備わる各ステップをコンピュータに実行させ、本開示に係るサーバ装置に備わる各機能部としてコンピュータを機能させる。

なお、上記各開示は、可能な限り組み合わせることができる。

本開示によれば、ルータ数が増加した場合であっても、ＮＰ困難の問題を解くことなく、最適なパスを現実的な期間で学習することができ、リアルタイムに交流行列に適したパスを設定することが可能となる。

ネットワークの例。パス学習・設定サーバの一例を示す機能ブロック図。ルータの一例を示す機能ブロック図。基本技術における事前準備のフローチャート。パス学習・設定サーバが実行する。教師データの例。基本技術におけるパス計算・設定のフローチャート。パス学習・設定サーバが実行する。基本技術におけるパケット転送のフローチャート。ルータｓが実行する。実施形態１における事前準備の第１のフローチャート。パス学習・設定サーバが実行する。実施形態１における事前準備の第２のフローチャート。パス学習・設定サーバが実行する。ルータβを入口ルータｓ、ルーラδを出口ルータｄとするとき、ルータβの次ホップを学習するための教師データの一例。実施形態１におけるパス計算・設定のフローチャート。パス学習・設定サーバが実行する。実施形態１におけるパケット転送のフローチャート。ルータｒが実行する。実施形態２におけるルータの一例を示す機能ブロック図。

以下、本開示の実施形態について、図面を参照しながら詳細に説明する。なお、本開示は、以下に示す実施形態に限定されるものではない。これらの実施の例は例示に過ぎず、本開示は当業者の知識に基づいて種々の変更、改良を施した形態で実施することができる。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。

（開示のポイント）
交流行列に対して、各入口ルータから出口ルータまでのパスを学習する場合、ネットワークが大規模になると、オフラインでも現実的な期間で完了しないほどに、事前の学習時間が長くなる。本開示では、交流行列に対して、各入口ルータから出口ルータまでのパスを学習するのではなく、ルータごとに次ホップを学習することにより、学習の高速化を行った。各ルータの次ホップの数は、ルータ数に対して指数的に増加することはない。これにより、事前学習にて最適なパスを現実的な期間で学習でき、リアルタイムにＮＰ困難の問題を解くことなく、交流行列に適したパスを設定するＴＥを実現できる。

また、トラフィック以外の教師データを用いることで、教師データの値を加味したＴＥが実現できる。例として、ユーザの体感品質を示すＱｏＥ（ＱｕａｌｉｔｙｏｆＥｘｐｅｒｉｅｎｃｅ）値を用いることで、当品質の向上を目的とするＴＥを達成することも可能である。

（基本技術）
〔機械学習〕
ＴＥのために機械学習を利用する。本開示では、機械学習を次のように定義する。関数の引数と戻り値のペアがいくつか与えられているとする。たとえば、ｘを引数、ｙを戻り値とすると、（ｘ^（１），ｙ^（１））、（ｘ^（２），ｙ^（２））、…となる。機械学習では、これらを教師データと呼ぶ。機械学習は、近年、注目されているディープニューラルネットワーク等の技術（非特許文献２）を示しており、教師データから、ｙ＝ｆ（ｘ）の関数形を「学習」する。すると、教師データに含まれないｘ’に対しても、ｙ’＝ｆ（ｘ’）を推定できるようになる。なお、ｘ、ｙはベクトルや行列でもよい。

図１に、本実施形態に係るネットワークの一例を示す。本実施形態では、ネットワーク９３の一例として、ルータα，β，γ，δがネットワーク９３の入り口又は出口として機能する例を示す。また本実施形態では、パスの学習と設定を行う経路制御サーバ装置を「パス学習・設定サーバ」と呼ぶ。実際には、パス学習・設定サーバ９１の機能が、ルータα，β，γ，δに備わっていても構わない。また、本実施形態に係るルータα，β，γ，δは、次ホップを決定しうる任意のネットワーク機器を用いることができる。

図２は、パス学習・設定サーバの一例を示す機能ブロック図である。パス学習・設定サーバ９１は、最適パス計算部１１、関数学習部１２、学習済み関数格納部１３、ルータ設定部１４を備える。図３は、ルータの一例を示す機能ブロック図である。ルータ９２は、ルータα，β，γ，δとして機能し、関数受信部２１、パス／次ホップ格納部２２、パス／次ホップ選択部２３、パケット受信・転送部２４を備える。基本技術において、パス／次ホップ格納部２２はパス格納部として機能し、パス／次ホップ選択部２３はパス選択部として機能する。

〔パスの学習〕
パス学習・設定サーバ９１は、事前準備を実行する。図４に、事前準備のフローチャートの一例を示す。事前準備では、最適パス計算部１１が教師データを用いて最適なパスｐ_ｓｄを計算し（Ｓ１０３）、関数学習部１２が最適なパスｐ_ｓｄを用いて関数を学習する（Ｓ１０５）。

本開示の教師データは、通信要求と、適用するパスを含む。本実施形態では、教師データに含まれる通信要求を交流行列Ｄで表す。Ｄの要素ｄ_ｓｄは、ｓを入口ルータとし、ｄを出口ルータとするトラフィック量やトラフィックの時系列変動を表す。例えば、本実施形態では、４つのルータα〜δが備わるため、交流行列Ｄは次式で表すことができる。

図５に、交流行列Ｄの一例を示す。本実施形態では、交流行列Ｄ^（１）から交流行列Ｄ^（２）に変動した場合を想定する。交流行列Ｄ^（１）は、αからδと、βからδに、それぞれ１０のトラフィックがあることを表している。最適パス計算部１１は、過去のトラフィックデータなどを参考に、実際に発生しそうな交流行列をいくつか取得しておく（Ｓ１０１）。これを教師データとして用いる。なお、ここで用いる交流行列Ｄは、必ずしも後述の運用時に同じものが現れる必要はない。つまり、正確に「当てる」ことを目的としない。それよりも、運用時の推定に役に立つように、様々なパターンを挙げておくのがよい。

次に、最適パス計算部１１が、非特許文献１のＴＥ手法を用いて、交流行列Ｄ^（ｉ）ごとにｓ、ｄペアごとの最適なパスｐ_ｓｄ ^（ｉ）を計算する（Ｓ１０２、Ｓ１０３）。例えば、本実施形態では、４つのルータα〜δが備わるため、最適なパスｐ_ｓｄ ^（ｉ）は次式のような行列Ｐで表すことができる。

図５に、行列Ｐの一例を示す。ルータαを入口ルータとし、ルータδを出口ルータとする最適なパスはα−δであることから、最適なパスｐ_αδ ^（１）＝αδとなる。またルータβを入口とし、ルータδを出口とする最適なパスはβ−γ−δであることから、最適なパスｐ_βδ ^（１）＝βγδとなる。ここで、リンクα−δの輻輳を避けるために、ＴＥ手法は、パスｐ_βδをα回りではなくγ回りとしている。Ｄ^（２）も同様に、リンクγ−δの輻輳を避けるように、パスｐ_βδをα回りで設定している。最適なパスｐ_ｓｄ ^（ｉ）の計算は、運用中にリアルタイムで行う必要はなく、事前にオフラインで交流行列Ｄ^（ｉ）ごとに計算しておけばよい。

続いて、関数学習部１２が、関数の学習を行い、学習済み関数格納部１３に格納する（Ｓ１０４〜Ｓ１０５）。トラフィックの出入口ｓ、ｄごとに別々の関数を用意し、学習する。教師データを（Ｄ^（１），ｐ_ｓｄ ^（１））、（Ｄ^（２），ｐ_ｓｄ ^（２））、…と表し、学習対象の関数をｐ_ｓｄ＝ｆ_ｓｄ（Ｄ）とする。輻輳を避けるようにｓ、ｄ間のパスを決定するためには、他ルータ間のトラフィック量も必要となるため、ｄ_ｓｄではなく、最適パスを求めたときの各ルータの通信要求を表す交流行列Ｄそのものを入力とする。

ネットワーク９３を運用し始める前に、この教師データを用いて、関数ｐ_ｓｄ＝ｆ_ｓｄ（Ｄ）を学習しておく。

〔パスの設定〕
運用開始後、パス学習・設定サーバ９１は、パスの計算及び設定を実行する。図６に運用開始後のフローチャートの一例を示す。運用開始後、ルータ設定部１４は、一定時間ごとに交流行列Ｄ’を更新する（Ｓ２０１）。そして、ルータ設定部１４は、学習済みの関数ｆ_ｓｄを用いてパスｐ’_ｓｄ＝ｆ_ｓｄ（Ｄ’）を計算し、計算結果であるパスｐ’_ｓｄを入口ルータｓに設定する。

例えば、ｓ＝αのパスｐ’_ｓｄをルータαに設定し、ｓ＝βのパスｐ’_ｓｄをルータβに設定し、ｓ＝γのパスｐ’_ｓｄをルータγに設定し、ｓ＝δのパスｐ’_ｓｄをルータδに設定する。各ルータα〜δの関数受信部２１は、入口ルータｓ及び出口ルータｄに対応するパスｐ’_ｓｄをルータ設定部１４から受信し、パス／次ホップ格納部２２に格納する。

ここで、パスｐ’_ｓｄ＝ｆ_ｓｄ（Ｄ’）の計算は、観測トラフィックや疑似的に生成したトラフィックから求めてもよいし、顧客との契約条件から決定してもよい。ただし、事前準備の交流行列Ｄ^（ｉ）と異なり、実トラフィックを表していなければならない。ｆ_ｓｄ（Ｄ’）の計算は、ＮＰ困難の最適化問題を解くよりも簡単であり、一度学習してしまえば高速に計算できる。

〔パケット転送〕
各ルータα〜δは、ルータ設定部１４の設定に従ってパケット転送を行う。図７に、パケット転送のフローチャートの一例を示す。入口ルータｓはパケットを受信すると（Ｓ３０１）、経路表などを用いて、出口ルータｄを決定し（Ｓ３０２）、設定されたパスｐ’_ｓｄに従って送り出す（Ｓ３０３）。

例えば、ルータαにおいて、パケット受信・転送部２４がパケットを受信すると、パス／次ホップ選択部２３は、パケットの送信元及び送信先を読み出し、パケットの送信先に対応する出口ルータｄを決定する。そして、パス／次ホップ選択部２３は、パス／次ホップ格納部２２に格納されているパスｐ’_ｓｄのなかから、出口ルータｄに対応するパスｐ’_ｓｄを選択する。パケット受信・転送部２４は、パス／次ホップ選択部２３の選択したパスに向けてパケットを転送する。

ここでのパケットの転送方法は任意である。たとえばＭＰＬＳのようなｌａｂｅｌｓｗｉｔｃｈｉｎｇを用いる場合には、パスｐ’_ｓｄに対応するｌａｂｅｌを付与して送出すればよい。あるいは、ｓｏｕｒｃｅｒｏｕｔｉｎｇを行う場合は、パスｐ’_ｓｄそのものをパケットヘッダに記載する。

（実施形態１）
〔次ホップの学習〕
ネットワーク９３が大規模になると、事前の学習時間が長くなる。これは、関数ｆの値域（パス数）が大きいことが原因である。パス数は、ネットワーク規模に対して指数的に増加することがある。そこで、パスを学習するのではなく、ルータごとに次ホップを学習することで、この問題を解決する。

具体的には、本実施形態では、図２において、学習済み関数格納部１３が次ホップを求める次ホップ導出関数を学習し、ルータ設定部１４が次ホップ設定部として機能し、図３において、パス／次ホップ格納部２２が次ホップ格納部として機能し、パス／次ホップ選択部２３が次ホップ選択部として機能する。

次ホップは、隣接ルータのいずれかであるため、パスのようにルータ数に対して指数的に増加することはなく、最大でもルータ数を超えない。図１に示すルータαで説明すると、隣接ルータはβとδであり、いずれかが次ホップとなる。

図８に、パス学習・設定サーバ９１における事前準備のフローチャートの一例を示す。本実施形態では、最適パス計算部１１が、教師データとして、図５に示すような交流行列Ｄ及び最適パスｐ_ｓｄの組を取得し、次ホップをフォーマルに定義する（Ｓ１１１〜Ｓ１１２）。入口ルータｓから出口ルータｄへのパス上に、ルータｒがあるとする。このとき、ｎ_ｓｄｒを、ｓからｄへのパスにおけるｒの次ホップとする。図５のパスｐ_βδ＝βγδを例に取ると、γの次ホップはδなので、ｎ_βγδ＝δとなる。

図９に、教師データとして交流行列Ｄと共に最適パスｐ_ｓｄが得られない場合のパス学習・設定サーバ９１における事前準備のフローチャートの一例を示す。教師データとして交流行列Ｄと共に最適パスｐ_ｓｄが得られない場合、最適パス計算部１１は、基本技術と同様に最適パスｐ_ｓｄを計算し（Ｓ１０２〜Ｓ１０３）、それに基づいて次ホップｎ_ｓｄｒ ^（ｉ）を計算すればよい（Ｓ１１１〜Ｓ１１２）。

基本技術では、関数学習部１２が、入口ルータｓ及び出口ルータｄのルータペアごとに、関数ｐ_ｓｄ＝ｆ_ｓｄ（Ｄ）を学習した。本実施形態では、関数学習部１２が、３つ組みｓ、ｄ、ｒごとに、次ホップ導出関数である関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）を学習する。本実施形態では、ｒごとに関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）を学習するため、最適パス上のルータごとの学習となる。

なお、入口ルータｓと出口ルータｄ毎に次ホップを決定しているが、出口ルータｄのみで次ホップを決定する場合は、ｎ_ｓｄｒ＝ｎ_ｓ’ｄｒ∀ｓ，ｓ’となり、この場合の次ホップ導出関数は、ｆ_ｓｄｒではなくｆ_ｄｒと表現できる。

本実施形態の教師データは（Ｄ^（ｉ），ｎ_ｓｄｒ ^（ｉ））となる。図１と同じネットワーク９３を想定し、ルータβからルータδへのパスを考えるとき、ルータβの次ホップを学習するための教師データは、図１０のようになる。たとえば、ｐ_βδ ^（１）＝βγδから、βの次ホップがγであるとわかる。よって、ｐ_βδ ^（１）＝βγδの場合のルータβの次ホップは、ｎ_βδβ ^（１）＝γとなる。

ネットワーク９３を運用し始める前に、関数学習部１２が、この教師データを用いて、次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）を学習しておく。

〔次ホップの設定〕
運用開始後、パス学習・設定サーバ９１は、次ホップの計算及び設定を実行する。図１１に運用開始後のフローチャートの一例を示す。基本技術と同様に、運用開始後、ルータ設定部１４は、一定時間ごとに交流行列Ｄ’を更新する（Ｓ２０１）。そして、学習済みの次ホップ導出関数ｎ_ｓｄｒを用いて次ホップｎ’_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ’）を計算し、ルータｒに設定する（Ｓ２１１〜Ｓ２１２）。

例えば、ｒ＝αの次ホップｎ’_ｓｄｒをルータαに設定し、ｒ＝βの次ホップｎ’_ｓｄｒをルータβに設定し、ｒ＝γの次ホップｎ’_ｓｄｒをルータγに設定し、ｒ＝δの次ホップｎ’_ｓｄｒをルータδに設定する。このとき、各ルータα〜δの関数受信部２１は、入口ルータｓ及び出口ルータｄに対応する次ホップｎ’_ｓｄｒをルータ設定部１４から受信し、パス／次ホップ格納部２２に格納する。

〔パケット転送〕
各ルータα〜δは、ルータ設定部１４の設定に従ってパケット転送を行う。図１２に、パケット転送のフローチャートの一例を示す。ルータｒはパケットを受信すると（Ｓ３０１）、送信元アドレスや経路表を用いて入口ルータｓと出口ルータｄを決定し（Ｓ３１１）、パス／次ホップ格納部２２に格納された次ホップｎ’_ｓｄｒに送り出す（Ｓ３１２）。

例えば、ルータαにおいて、パケット受信・転送部２４がパケットを受信すると、パス／次ホップ選択部２３は、パケットの送信元及び送信先を読み出し、パケットの送信元に対応する入口ルータｓを決定し、パケットの送信先に対応する出口ルータｄを決定する。そして、パス／次ホップ選択部２３は、パス／次ホップ格納部２２に格納されている次ホップｎ’_ｓｄｒのなかから、入口ルータｓ及び出口ルータｄに対応する次ホップｎ’_ｓｄｒを選択する。パケット受信・転送部２４は、パス／次ホップ選択部２３の選択した次ホップｎ’_ｓｄｒに向けてパケットを転送する。

以上説明したように、本実施形態は、機械学習における出力層に次ホップｎ_ｓｄｒを用いているため、機械学習における出力層にパスｐ_ｓｄを用いた場合に比べ、次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）における中間層の素子数を非常に減らすことができる。このため、本実施形態は、ルータ数が増加した場合であっても、ＮＰ困難の問題を解く必要はない。

さらに、次ホップ導出関数ｎ’_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ’）の計算における中間層の素子数を少なくすることができるため、運用開始後に通信要求が発生してからであっても、次ホップ導出関数ｎ’_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ’）の計算をリアルタイムに行うことができる。

ここで、ルータｒは最適パス上のルータであるため、最適なパスを学習することできる。したがって、本実施形態は、ルータ数が増加した場合であっても、ＮＰ困難の問題を解くことなく、最適なパスを現実的な期間で学習可能にすることができる。

（実施形態２）
実施形態１では、次ホップｎ’_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ’）をルータｒに設定したが、本開示はこれに限定されない。例えば、ルータ９２は学習済みの次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）を保持していてもよい。この場合のルータ９２の機能ブロックの一例を図１３に示す。ルータ９２は、次ホップ設定部２７をさらに備え、パス／次ホップ格納部２２に代えて学習済み関数格納部２５を備え、パス／次ホップ選択部２３に代えて次ホップ選択部２６を備える。パス学習・設定サーバ９１の機能ブロックは図２のとおりである。以下、実施形態１と異なる点について説明する。

〔次ホップの学習〕
実施形態１において説明したように、ネットワーク９３を運用し始める前に、関数学習部１２が、教師データを用いて、次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）を学習しておく。学習完了後、図２に示すルータ設定部１４は、学習済み関数格納部１３に格納されている学習済みの次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）をルータｒに送信する。

例えば、ルータ設定部１４は、ｒ＝αの次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）をルータαに送信し、ｒ＝βの次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）をルータβに送信し、ｒ＝γの次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）をルータγに送信し、ｒ＝δの次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）をルータδに送信する。各ルータα〜δの関数受信部２１は、次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）をルータ設定部１４から受信し、学習済み関数格納部２５に格納する。

〔次ホップの設定〕
運用開始後、次ホップ設定部２７は、次ホップの計算及び設定を実行する。次ホップの計算及び設定は、実施形態１におけるルータ設定部１４と同様である。すなわち、次ホップ設定部２７は、一定時間ごとに交流行列Ｄ’を更新し（Ｓ２０１）、学習済みの次ホップ導出関数ｎ_ｓｄｒを用いて次ホップｎ’_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ’）を計算し、ルータｒに設定する（Ｓ２１１〜Ｓ２１２）。

ここで、本実施形態では、ルータｒにおいて次ホップｎ’_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ’）の計算を行っているため、自装置への設定となる。そして、次ホップ設定部２７は、計算によって得られた入口ルータｓ及び出口ルータｄに対応する次ホップｎ’_ｓｄｒを、学習済み関数格納部２５に格納する。

〔パケット転送〕
各ルータα〜δにおいて、パケット受信・転送部２４がパケットを受信すると、次ホップ選択部２６は、パケットの送信元及び送信先をパケットから読み出し、パケットの入口ルータｓ及び出口ルータｄを特定する。そして、次ホップ選択部２６は、学習済み関数格納部２５に格納されている次ホップｎ’_ｓｄｒのなかから、入口ルータｓ及び出口ルータｄに対応する次ホップｎ’_ｓｄｒを選択する。パケット受信・転送部２４は、次ホップ選択部２６の選択した次ホップｎ’_ｓｄｒに向けてパケットを転送する。

以上説明したように、本開示は、次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）における中間層の素子数を非常に減らすことができるため、学習済みの次ホップ導出関数ｎ_ｓｄｒを各ルータに搭載し、各ルータにおいて次ホップｎ’_ｓｄｒの計算を行うことができる。これにより、本実施形態は、各ルータにおける次ホップｎ’_ｓｄｒをリアルタイムで更新することができる。

（実施形態３）
〔パスによる転送〕
実施形態１及び２において、各ルータα〜δが次ホップを選択するとしたが、本開示はこれに限定されない。例えば、入口ルータに集約してパスを構成し、基本技術と同様にパスを指定して送出してもよい。次ホップｎ’_ｓｄｒを入口ルータｓから出口ルータｄへ順に並べれば、パスを構成できる。この場合、図１１は、図６と同様に、入口ルータｓのみにパスを設定することになる。また、図１２は、図７と同じになる。

例えば、実施形態２の図１３に示すように、学習済みの次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）を次ホップ情報として各ルータα〜δに格納する。ここで、本実施形態の場合、入口ルータｓから出口ルータｄまでの各ルータをルータｒとしうる次ホップの次ホップ導出関数ｎ_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ）を学習済み関数格納部２５に格納する。そして、運用開始後の次ホップの設定において、入口ルータｓから出口ルータｄまでの各ルータをルータｒとしたときの次ホップ導出関数ｎ’_ｓｄｒ＝ｆ_ｓｄｒ（Ｄ’）を用いて、次ホップの計算及び設定を実行する。

各ルータα〜δのいずれかのパケット受信・転送部２４がパケットを受信すると、次ホップ選択部２６は、学習済み関数格納部２５に格納されている次ホップｎ’_ｓｄｒのなかから、入口ルータｓ及び出口ルータｄに対応しかつ入口ルータｓから出口ルータｄまでの各ルータをルータｒとする次ホップｎ’_ｓｄｒを選択する。そして、次ホップ選択部２６は、入口ルータｓから出口ルータｄへ順に並べ、パスとしてパケットに格納する。パケット受信・転送部２４は、次ホップ選択部２６の設定したパスに従ってパケットを転送する。

入口ルータｓから出口ルータｄまでの各ルータは、パケットに設定されているパスに従って、パケットを転送する。パケットの転送方法は、基本技術と同様に任意である。これにより、各ルータでの演算処理を軽減することができる。

以上説明したように、本実施形態は、入口ルータｓにおいて、入口ルータｓから出口ルータｄまでの各ルータをルータｒとする次ホップｎ’_ｓｄｒを選択する。これにより、本実施形態は、パスを学習することなく、入口ルータｓから出口ルータｄまでのパスを設定することができる。したがって、本実施形態は、ルータ数が増加した場合であっても、ＮＰ困難の問題を解くことなく、最適なパスを現実的な期間で学習可能にすることができる。

なお、本開示の装置は、コンピュータとプログラムによっても実現でき、プログラムを記録媒体に記録することも、ネットワークを通して提供することも可能である。

本開示は情報通信産業に適用することができる。

１１：最適パス計算部
１２：関数学習部
１３：学習済み関数格納部
１４：ルータ設定部
２１：関数受信部
２２：パス／次ホップ格納部
２３：パス・次ホップ選択部
２４：パケット受信・転送部
２５：学習済み関数格納部
２６：次ホップ選択部
２７：次ホップ設定部
９１：パス学習・設定サーバ
９２：ルータ
９３：ネットワーク

Claims

ネットワークに含まれるルータの経路を制御する経路制御方法であって、
最適パス計算部が、前記ネットワークに含まれるルータの経路における入口ルータ及び出口ルータを対とする教師データ用の通信要求及び最適経路を取得し、最適経路上の各ルータにおける次ホップを、各最適経路について求める次ホップ導出ステップと、
関数学習部が、最適経路上の各ルータについて、当該最適経路のときの各ルータの通信要求及び当該最適経路のときの次ホップを教師データに用い、次ホップを求める次ホップ導出関数を学習する関数学習ステップと、
次ホップ設定部が、前記ネットワークにおいて発生した通信要求及び当該通信要求の入口ルータ及び出口ルータを取得し、当該通信要求に対する次ホップを、前記次ホップ導出関数を用いて求める次ホップ設定ステップと、
を有する経路制御方法。
前記ネットワークに含まれるルータが、
パケットを受信するステップと、
当該パケットの入口ルータ及び出口ルータを決定するステップと、
決定した入口ルータ及び出口ルータに対応する次ホップを、前記次ホップ設定部で設定された次ホップに従って選択するステップと、
選択した次ホップへ向けて当該パケットを送出するステップと、
を有する、
請求項１に記載の経路制御方法。
前記次ホップ設定部は、前記ネットワークに含まれるルータの経路を制御するサーバ装置に備わり、
前記サーバ装置が、前記次ホップ設定部の設定した次ホップを、前記ネットワークに含まれる各ルータに設定するルータ設定ステップをさらに有する、
請求項１又は２に記載の経路制御方法。
前記関数学習部は、前記ネットワークに含まれるルータの経路を制御するサーバ装置に備わり、
前記次ホップ設定部は、前記ネットワークに含まれる各ルータに備わり、
前記サーバ装置が、前記次ホップ導出関数を、前記ネットワークに含まれる各ルータに設定するルータ設定ステップを、前記関数学習ステップと前記次ホップ設定ステップの間にさらに有し、
前記次ホップ設定ステップにおいて、前記次ホップ設定部が、前記ネットワークにおいて発生した通信要求に対する自装置の次ホップを、前記次ホップ導出関数を用いて求める、
請求項１又は２に記載の経路制御方法。
前記次ホップ設定ステップにおいて、前記次ホップ設定部が、前記ネットワークにおいて発生した通信要求に対する当該通信要求の入口ルータから出口ルータまでの各ルータにおける次ホップを、前記次ホップ導出関数を用いて求め、
前記ネットワークに含まれるルータは、
受信したパケットの入口ルータが自装置である場合、
当該パケットの入口ルータから出口ルータまでの各ルータにおける次ホップを用いて、受信したパケットの経路を設定する、
請求項４に記載の経路制御方法。
ネットワークに含まれるルータの経路を制御するサーバ装置であって、
前記ネットワークに含まれるルータの経路における入口ルータ及び出口ルータを対とする教師データ用の通信要求及び最適経路を取得し、最適経路上の各ルータにおける次ホップを、各最適経路について求める最適パス計算部と、
最適経路上の各ルータについて、当該最適経路のときの各ルータの通信要求及び当該最適経路のときの次ホップを教師データに用い、次ホップを求める次ホップ導出関数を学習する関数学習部と、
前記ネットワークにおいて発生した通信要求及び当該通信要求の入口ルータ及び出口ルータを取得し、当該通信要求に対する次ホップを、前記次ホップ導出関数を用いて求める次ホップ設定部と、
を備えるサーバ装置。
請求項１から５のいずれかに記載の各ステップをコンピュータに実行させるための経路制御プログラム。