JP2010263442A - Optical path setting method, and optical information communication system - Google Patents

Optical path setting method, and optical information communication system Download PDF

Info

Publication number
JP2010263442A
JP2010263442A JP2009113071A JP2009113071A JP2010263442A JP 2010263442 A JP2010263442 A JP 2010263442A JP 2009113071 A JP2009113071 A JP 2009113071A JP 2009113071 A JP2009113071 A JP 2009113071A JP 2010263442 A JP2010263442 A JP 2010263442A
Authority
JP
Japan
Prior art keywords
optical path
path setting
action
optical
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009113071A
Other languages
Japanese (ja)
Inventor
Takuji Tachibana
拓至 橘
Itsumi Koyanagi
衣津美 小柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nara Institute of Science and Technology NUC
Original Assignee
Nara Institute of Science and Technology NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nara Institute of Science and Technology NUC filed Critical Nara Institute of Science and Technology NUC
Priority to JP2009113071A priority Critical patent/JP2010263442A/en
Publication of JP2010263442A publication Critical patent/JP2010263442A/en
Pending legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an optical path setting method for a plurality of on-demands that attains differentiation of service for optical path setting and effective utilization of wavelength (optical path) and can be used in actual environment, and to provide an optical information communication system. <P>SOLUTION: An optical path setting table or link information sets a reward to obtain when an optical path is set, for each service class, as well as a cost when the setting of the optical path fails. They determine the acceptance or refusal of the optical path setting request of each class so that a reward function calculated from the reward and cost may be a maximum, and find out an optimal action for next link status from the present link status in transmission node by using a reinforcement learning algorithm based on the reward function. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、光パスを用いてデータ伝送を行うWDM(Wavelength Division Multiplexing;波長分割多重)ネットワークの光パス設定方法の技術に関するものである。   The present invention relates to a technique of an optical path setting method for a WDM (Wavelength Division Multiplexing) network that performs data transmission using an optical path.

WDM技術を用いた光ネットワークでは、送受信ノード間に設定された波長(光パス)を用いてデータ伝送する。近年、各ユーザがインターネット上で伝送するデータ量は劇的に増加しており、将来的には各ユーザが1ギガビット/秒程度のデータを伝送することが想定され、オンデマンドで光パスを設定して大容量データを伝送する利用方法の検討が進められている。   In an optical network using the WDM technology, data is transmitted using a wavelength (optical path) set between transmitting and receiving nodes. In recent years, the amount of data transmitted by each user over the Internet has increased dramatically. In the future, it is assumed that each user will transmit data of about 1 gigabit / second, and an optical path is set on demand. As a result, studies on utilization methods for transmitting a large amount of data are in progress.

オンデマンドでの光パス設定においては、利用料金に応じた複数の光パス設定サービスをユーザに提供するべく、各サービスクラスが設定できる最大光パス数を事前に決定する方法が研究されている(例えば、特許文献1、特許文献2を参照。)。
最大光パス数を事前に決定する方法では、高優先クラスの最大光パス設定数を低優先クラスの最大光パス設定数よりも多くするやり方が行われている。しかし、このやり方では、空き波長が多数存在する場合でも、低優先クラスは決められた光パス設定数以上の光パスを設定することができないため、高優先クラスの光パス設定要求頻度が低優先クラスの光パス設定要求頻度よりも少ない場合には波長利用率が低下し、波長資源が有効利用できないといった問題点がある。
In on-demand optical path setting, research has been conducted on a method for determining in advance the maximum number of optical paths that can be set for each service class in order to provide users with multiple optical path setting services according to usage charges ( For example, see Patent Document 1 and Patent Document 2.)
In the method of determining the maximum number of optical paths in advance, a method is employed in which the maximum number of optical paths set for the high priority class is made larger than the maximum number of optical paths set for the low priority class. However, in this method, even when there are many free wavelengths, the low priority class cannot set more optical paths than the set number of optical paths, so the optical path setting request frequency of the high priority class is low priority. When the frequency is less than the optical path setting request frequency of the class, there is a problem that the wavelength utilization rate is lowered and wavelength resources cannot be effectively used.

かかる問題を解決するため、マルコフ決定過程(MDP:Markov Decision Process)を用いた方法が提案されている。このマルコフ決定過程を用いた方法は、光パスの設定状況に応じて、どのクラスの光パス設定要求を受け入れるべきかを事前に決定するものである。すなわち、マルコフ決定過程によって各ノードがとるべき最適行動を導出し、各ノードは導出された最適行動に従って光パス設定の受け入れ可否を決定する。ここで、最適行動は、マルコフ決定過程において報酬関数に依存するものである。しかし、マルコフ決定過程を用いた方法では、送受信ノード間に設定された波長(光パス)数が大きくなると、報酬関数が収束しないことから、実環境での利用、すなわち、ネットワーク規模が大きくなった場合の利用に困難であるといった問題がある。また、ネットワーク全体のトポロジ情報や各リンク内の波長数などの情報が必要であり、分散環境では使用することができない.   In order to solve this problem, a method using a Markov Decision Process (MDP) has been proposed. This method using the Markov decision process determines in advance which class of optical path setting request should be accepted in accordance with the setting condition of the optical path. That is, the optimum behavior to be taken by each node is derived by the Markov decision process, and each node decides whether or not to accept the optical path setting according to the derived optimum behavior. Here, the optimum behavior depends on the reward function in the Markov decision process. However, in the method using the Markov decision process, when the number of wavelengths (optical paths) set between the transmitting and receiving nodes increases, the reward function does not converge, so the use in the real environment, that is, the network scale increases. There is a problem that it is difficult to use in some cases. In addition, information such as the topology information of the entire network and the number of wavelengths in each link is necessary and cannot be used in a distributed environment.

特開2006−279767号公報JP 2006-279767 A 特開2008−17256号公報JP 2008-17256 A

上述したように、ユーザがオンデマンドで光パスを設定して大容量データを伝送する利用方法において、従来技術では、サービスの差別化を重要視しすぎたり、柔軟性にかけるといった点から波長資源(光パスのチャネル資源)が有効利用できないといった問題点や、ネットワーク規模が大きくなった場合に使用する計算法が利用できないといった問題点があった。
また、従来の方法では、ネットワークトポロジーや使用可能な波長数、トラヒック情報などの収集可能な情報を活用して、光パスを設定することができなかった。
As described above, in a usage method in which a user sets an optical path on demand to transmit a large amount of data, the conventional technology uses wavelength resources from the point of placing too much importance on service differentiation and flexibility. There is a problem that (optical channel channel resources) cannot be effectively used, and a calculation method used when the network scale becomes large cannot be used.
Further, in the conventional method, it is not possible to set an optical path by utilizing information that can be collected such as network topology, the number of usable wavelengths, and traffic information.

上記状況に鑑みて、本発明は、光パス設定のサービス差別化と波長(光パス)有効利用が図れ、実環境で使用できる、複数のオンデマンドでの光パス設定方法と光情報通信システムを提供することを目的とする。   In view of the above situation, the present invention provides a plurality of on-demand optical path setting methods and an optical information communication system that can be used in a real environment and can differentiate services of optical path setting and effectively use wavelengths (optical paths). The purpose is to provide.

また、本発明は、ネットワークトポロジーやトラヒック情報など収集可能な情報を活用し得る光パス設定方法を提供することを目的とする。また、ネットワークトポロジーやトラヒック情報などが得られない分散環境においても、同様の効果を提供できることを目的とする.
さらに、本発明は、ネットワーク上の各ノードの波長変換機能に制限がある場合にも適用できる。
It is another object of the present invention to provide an optical path setting method that can utilize collectable information such as network topology and traffic information. Moreover, it aims at providing the same effect even in a distributed environment where network topology and traffic information cannot be obtained.
Furthermore, the present invention can also be applied to cases where the wavelength conversion function of each node on the network is limited.

上記目的を達成すべく、本発明の第1の観点の光パス設定方法は、波長分割多重ネットワークにおける送信ノードから受信ノードへの複数のサービスクラスを有する光パス設定方法であって、各ノードには光パスが設定される場合に得られる報酬をサービスクラス毎に設定し、かつ、光パス設定が失敗したときのコストを設定し、報酬およびコストから導出した報酬関数を使用してQ関数を更新し、現在の状態に対する各行動のQ値が最大となるように各クラスの光パス設定要求の受け入れ可否を決定して、送信ノードにおける現在のリンク状態から次のリンク状態へのQ関数を報酬関数に基づき更新する構成とされる。   In order to achieve the above object, an optical path setting method according to a first aspect of the present invention is an optical path setting method having a plurality of service classes from a transmission node to a reception node in a wavelength division multiplexing network. Sets the reward for each service class when the optical path is set, sets the cost when the optical path setting fails, and uses the reward function derived from the reward and cost to calculate the Q function Update, determine whether to accept the optical path setting request of each class so that the Q value of each action for the current state is maximized, and calculate the Q function from the current link state to the next link state in the transmitting node It is set as the structure updated based on a reward function.

かかる構成によれば、WDM技術を用いた光ネットワークにおいて、サービス品質の異なる複数のオンデマンド光パス設定サービスをユーザに提供でき、かつ、限られた波長資源を有効利用できる。
本発明では、WDM技術を用いた光ネットワークにおいて、強化学習を利用して光パスを設定する点が特徴である。具体的には、各ノードには光パスが設定される場合に得られる報酬をサービスクラス毎に設定し、また光パス設定が失敗したときのコストも設定し、これらの報酬から導出した報酬関数が最大になるように、各クラスの光パス設定要求の受け入れ可否を決定する。また、この最適な光パス設定の行動(最適行動)は、ネットワークの情報が得られる集中管理環境であれば、擬似ネットワーク環境下でモンテカルロシミュレーション等を事前に行うことによって獲得することができる。ネットワークの情報が全く得られず各ノードは隣接するリンクの波長数と提供すべきサービスクラス数しかわからない分散環境であれば、実際に運用してサービスを提供しながら徐々に最適行動を学習し獲得する。獲得した最適行動により、各ノードはグローバルな光パス設定情報を使用することなく、複数の品質の光パス設定サービスを提供しながら波長の有効利用が可能となるのである。
また、強化学習を用いることにより、マルコフ決定過程(MDP)のように、送受信ノード間に設定された波長(光パス)数が大きくなると、報酬関数が収束しないという問題がなく、使用可能な波長数が例えば10以上といった実環境での利用が可能となる。
According to such a configuration, in an optical network using the WDM technology, a plurality of on-demand optical path setting services having different service qualities can be provided to the user, and limited wavelength resources can be effectively used.
The present invention is characterized in that an optical path is set using reinforcement learning in an optical network using WDM technology. Specifically, the reward obtained when an optical path is set for each node is set for each service class, the cost when the optical path setting fails is also set, and the reward function derived from these rewards To determine whether or not to accept the optical path setting request of each class. In addition, this optimum optical path setting action (optimum action) can be obtained by performing a Monte Carlo simulation or the like in advance in a pseudo network environment in a centralized management environment where network information can be obtained. In a distributed environment where no network information is available and each node knows only the number of wavelengths of adjacent links and the number of service classes to be provided, it gradually learns and acquires optimal behavior while actually operating and providing services. To do. The acquired optimum behavior enables each node to effectively use wavelengths while providing a plurality of optical path setting services without using global optical path setting information.
Further, by using reinforcement learning, there is no problem that the reward function does not converge when the number of wavelengths (optical paths) set between the transmitting and receiving nodes increases as in the Markov decision process (MDP), and the usable wavelength. The number can be used in an actual environment such as 10 or more.

ここで、上記のリンク状態は、具体的には、光パス設定要求到着イベントを単位とする離散時間を考えた場合に、時刻(t)におけるクラス数Mのサービスクラスiの光パス設定数N(t)と、前回時刻(t−1)の光パス設定要求に対する受け入れ結果I(t−1)を用いて、下記数1で定義される。 Here, the above-mentioned link state specifically refers to the number N of optical paths set for the service class i of the number M of classes at time (t) when considering a discrete time with an optical path setting request arrival event as a unit. Using i (t) and the acceptance result I (t−1) for the optical path setting request at the previous time (t−1), the following equation 1 is used.

(数1)
t=(N(t),N(t),・・・,N(t),I(t−1))
(Equation 1)
s t = (N 1 (t ), N 2 (t), ···, N M (t), I (t-1))

また、上記の報酬関数は、具体的には、現在のリンク状態stから行動atを取って、次のリンク状態s(t+1)=(N(t+1),N(t+1),・・・,N(t+1),I(t))へ遷移した時に、下記数2で定義される。なお、パラメータ変数Rは0以上1以下の値を取り、i<jの時Rj<Riとなり、パラメータCは0より大きい値を取り、パラメータ変数βは0以上1以下の値をとる。 In addition, the above-mentioned reward function, specifically, from the current link state s t taking the action a t, the next link state s (t + 1) = ( N 1 (t + 1), N 2 (t + 1), · .., N M (t + 1), I (t)) is defined by the following formula 2 when transiting. The parameter variable R i takes a value between 0 and 1, and when i <j, R j <R i , the parameter C takes a value greater than 0, and the parameter variable β takes a value between 0 and 1 inclusive. .

(数2)
t+1=β(R(t)+R(t)+・・・+R(t))−(1−β)CI(t) (但し、0<R<RM−1<・・・<R<・・・<R<R<=1,0<=β<=1,0<C)
(Equation 2)
r t + 1 = β (R 1 N 1 (t) + R 2 N 2 (t) +... + R M N M (t)) − (1-β) CI (t) (where 0 <R M <R M-1 <... <R i <... <R 2 <R 1 <= 1, 0 <= β <= 1, 0 <C)

そして、報酬関数を基づいて、状態stに対する行動atの行動価値関数(Q関数)は下記数3で定義され、状態stに対して最も大きなQ値を持つ行動atを最適行動として光パス設定の受け入れ可否が決定される。 Then, based on reward function, action value function action a t for the state s t (Q function) is defined by the following Expression 3, the action a t with the highest Q value for state s t as optimal action Whether to accept the optical path setting is determined.

(数3)
Q(st,at)← Q(st,at)+α[rt+1+γmaxQ(st+1,a)−Q(st,at)] (但し、0<α<=1,0<=γ<1)
(Equation 3)
Q (s t , a t ) ← Q (s t , a t ) + α [r t + 1 + γmaxQ (s t + 1 , a) −Q (s t , a t )] (where 0 <α <= 1, 0 <= γ <1)

リンク状態および報酬関数を上記の定義とすることにより、サービスクラスに応じて光パスの設定のしやすさを変化でき、かつ、空き波長はできるだけ有効利用することが可能になる。
ここで、パラメータ変数Rは、各ノードには光パスが設定される場合に得られる報酬をサービスクラス毎に設定したものであり、またパラメータ変数Cは、光パス設定が失敗したときの設定コストである。パラメータ変数βを用いることで、光パス設定のサービス差別化と波長(光パス)有効利用が図れることになる。
By defining the link state and the reward function as described above, the ease of setting the optical path can be changed according to the service class, and the free wavelength can be used as effectively as possible.
Here, the parameter variable R i is a reward set for each service class when an optical path is set in each node, and the parameter variable C is set when the optical path setting fails. Cost. By using the parameter variable β, optical path setting service differentiation and wavelength (optical path) effective use can be achieved.

さらに、パラメータαは学習率であり、α=0のときは学習ができないので除外され、α=1のときは最新の情報だけを考慮する。パラメータγは割引率であり、過去の情報がどの程度影響するかを示している。パラメータγ=0のときは現在の報酬だけを考慮し、γ=1のときは過去の情報を長期間考慮しすぎるため除外される。   Further, the parameter α is a learning rate. When α = 0, learning is not possible because it cannot be learned. When α = 1, only the latest information is considered. The parameter γ is a discount rate and indicates how much past information affects. When the parameter γ = 0, only the current reward is considered, and when γ = 1, the past information is excessively considered for a long time and is excluded.

また、上記の強化学習アルゴリズムは、ネットワークトポロジーやノード数,使用可能な波長数,トラヒック情報などが把握可能な集中管理環境の下では、
1)少なくともネットワークトポロジー,ノード数,使用可能な波長数,各クラスの平均光パス設定要求間隔,各クラスの平均光パス使用時間が与えられた擬似ネットワーク環境を構築するステップと、
2)擬似ネットワーク環境上で、疑似的に各クラスの光パス設定要求イベントと光パス使用終了イベントを発生させるステップと、
3)各ノードが状態sに応じた行動aをとりながら、Q値を更新していくステップと、
4)その都度変更された最適行動ペア(s,a)に従って光パス設定要求の受け入れ可否を決定していくステップと、
を備えた構成とされる。
In addition, the above reinforcement learning algorithm is used in a centralized management environment where the network topology, number of nodes, number of usable wavelengths, traffic information, etc. can be grasped.
1) constructing a pseudo network environment given at least the network topology, the number of nodes, the number of usable wavelengths, the average optical path setting request interval of each class, and the average optical path usage time of each class;
2) A step of generating an optical path setting request event and an optical path use end event of each class in a pseudo manner in a pseudo network environment;
3) while taking the action a t in which each node is in accordance with the state s t, and the step to continue to update the Q value,
4) determining whether or not to accept the optical path setting request according to the optimal action pair (s t , a t ) changed each time;
It is set as the structure provided with.

疑似ネットワーク環境下で、光パス設定要求イベント間隔と各クラスの平均光パス使用時間を基に、実際に光パスの設定要求イベントと光パス使用終了イベントを発生させる。この場合に、各ノードのリンク状態の初期値sを(0,0,0,0,…,0)とし、各リンク状態sに対する行動aをランダムに与えておく。そのようにすることにより、各ノードは、到着イベントが発生すると、リンク状態s=(0,0,0,…,0)に対する行動aに従って発生した光パス設定要求に対する行動aを実際に実行する。十分な学習が行われると各リンク状態sに対する最適な行動aが導出され、サービスの差別化と波長の有効利用が実現されることになる。 In a pseudo network environment, an optical path setting request event and an optical path use end event are actually generated based on the optical path setting request event interval and the average optical path usage time of each class. In this case, the initial value s 0 of the link state of each node is set to (0, 0, 0, 0,..., 0), and the action a 0 for each link state s 0 is given at random. By doing so, each node, the arrival event occurs, the link state s 0 = (0,0,0, ..., 0) action a 0 with respect to the optical path setting request generated according action a 0 for the actual To run. Sufficient optimum action a t learning and is performed for each link state s t is derived, so that the effective use of differentiation and the wavelength of the service is achieved.

次に、本発明の第2の観点の光パス設定方法は、波長分割多重ネットワークにおける送信ノードから受信ノードへの複数のサービスクラスを有する光パス設定を行う光パス設定方法であって、
1)各ノードに対して、光パスが設定される場合に得られる報酬をサービスクラス毎に設定し、また、光パス設定が失敗したときのコストを設定するステップと、
2)自ノードに隣接するリンクの波長数とサービスクラス数を設定するステップと、
3)光パス設定要求イベント又は光パス使用終了イベントが発生した場合に、リンク状態に応じた行動をとりながら、行動価値関数(Q関数)のQ値を更新していくステップと、
4)光パス設定要求イベントが発生した場合に、リンク状態と行動の最適行動ペアに従って、光パス設定要求イベントの受け入れ可否を決定していくステップと、を備えたことを特徴とする。
Next, an optical path setting method according to a second aspect of the present invention is an optical path setting method for setting an optical path having a plurality of service classes from a transmission node to a reception node in a wavelength division multiplexing network,
1) A step of setting a reward obtained when an optical path is set for each node for each service class, and setting a cost when the optical path setting fails;
2) setting the number of wavelengths and the number of service classes of links adjacent to the own node;
3) a step of updating a Q value of an action value function (Q function) while taking an action according to a link state when an optical path setting request event or an optical path use end event occurs;
4) The step of determining whether or not to accept the optical path setting request event according to the optimum behavior pair of the link state and the action when an optical path setting request event occurs is provided.

また、本発明の光パス設定プログラムは、
波長分割多重ネットワークにおける送信ノードから受信ノードへの複数のサービスクラスを有する光パス設定を行うプログラムであって、
各ノードのコンピュータに、
1)光パスが設定される場合に得られる報酬をサービスクラス毎に設定し、また、光パス設定が失敗したときのコストを設定するステップと、
2)自ノードに隣接するリンクの波長数とサービスクラス数を設定するステップと、
3)光パス設定要求イベント又は光パス使用終了イベントが発生した場合に、リンク状態に応じた行動をとりながら、行動価値関数(Q関数)のQ値を更新していくステップと、
4)光パス設定要求イベントが発生した場合に、リンク状態と行動の最適行動ペアに従って、光パス設定要求イベントの受け入れ可否を決定していくステップと、
を実行させるものである。
The optical path setting program of the present invention is
A program for setting an optical path having a plurality of service classes from a transmission node to a reception node in a wavelength division multiplexing network,
On each node's computer,
1) setting a reward obtained when an optical path is set for each service class, and setting a cost when the optical path setting fails;
2) setting the number of wavelengths and the number of service classes of links adjacent to the own node;
3) a step of updating a Q value of an action value function (Q function) while taking an action according to a link state when an optical path setting request event or an optical path use end event occurs;
4) When an optical path setting request event occurs, determining whether or not to accept the optical path setting request event according to the optimal behavior pair of the link state and the action;
Is to execute.

上記の第2の観点の光パス設定方法または上記の光パス設定プログラムによれば、疑似シミュレーションを全く行わずとも、最終的に最適な行動aを見つけることができる。
すなわち、疑似シミュレーションを全く行わずとも、上記の本発明の光パス設定プログラムを備えた光スイッチを波長分割多重ネットワークに置き、隣接するリンクの波長数と差別化すべきクラス数だけが分かっている状態(すなわちリンク状態sと行動aの取りうる範囲だけがわかっている状態)で、実際に光パス設定要求イベントと光パス使用終了イベントが発生したら、状態sに応じた行動aを行ってQ値を更新し、それに応じて状態sに対してとるべき行動aも変更されていくことで、最終的に最適な行動aが見つかるということになるのである。
なお、リンク状態sやQ値については、上述の本発明の第1の観点の光パス設定方法の説明と同様であるので、説明は省略する。
According to the second aspect of the optical path setting method or the optical path setting program, without performing a pseudo simulation at all, it is possible to find the final optimal action a t.
In other words, without performing pseudo simulation at all, the optical switch having the above-described optical path setting program of the present invention is placed in a wavelength division multiplexing network, and only the number of wavelengths of adjacent links and the number of classes to be differentiated are known. (i.e. a state in which only a range that can be taken in the link state s t and action a t is known), the actual When the optical path setting request event and a light path using end event occurs, the action a t in accordance with the state s t performing update the Q value, that will also change action a t to be taken with respect to the state s t accordingly, it become that ultimately optimal action a t is found.
Since the link state s t and Q values, are as described for optical path setting method of the first aspect of the present invention described above, description thereof will be omitted.

本発明の光スイッチは、上記本発明のプログラムを搭載し、波長分割多重ネットワークにおける送信ノードから受信ノードへの複数のサービスクラスを有する光パス設定を行うものである。
本発明の光パス設定プログラムおよび本プログラムを搭載した光スイッチによれば、他のノードの情報が全く必要なく、分散環境で使用できるというメリットを有する。
The optical switch of the present invention is equipped with the above-described program of the present invention, and performs optical path setting having a plurality of service classes from a transmission node to a reception node in a wavelength division multiplexing network.
According to the optical path setting program of the present invention and the optical switch equipped with the present program, there is an advantage that no information of other nodes is required and it can be used in a distributed environment.

なお、本発明の光パス設定プログラムや光スイッチに対して、ネットワークトポロジーなどが既知の場合、疑似シミュレーションを用いて、ある程度学習させておいた値を初期値データとして使用させることでもかまわない。かかる場合、本発明の光パス設定プログラムや光スイッチに対して、ネットワークに導入して使用しながら追加の学習をさせることになる。   If the network topology or the like is known for the optical path setting program or optical switch of the present invention, a value that has been learned to some extent may be used as initial value data by using a pseudo simulation. In such a case, the optical path setting program and the optical switch of the present invention are additionally learned while being introduced into the network and used.

また、本発明の光情報通信システムは、複数のサービスクラスを有する波長分割多重ネットワークにおける各ノードが、光送信手段と、光受信手段と、光電気変換手段と、電気光変換手段と、演算手段と、記憶手段を備え、記憶手段は、上述の光パス設定方法により設定されたリンク状態と最適行動のテーブル情報が記憶されており、演算手段は、サービスクラスiの光パス設定要求を受信した場合、テーブル情報を用いて、現在のリンク状態に対応した最適行動に従って、光パス設定要求を棄却するか否かを判別し、Q関数を用いた各状態に対する各行動のQ値を更新する構成とされる。   In the optical information communication system of the present invention, each node in the wavelength division multiplexing network having a plurality of service classes includes an optical transmission unit, an optical reception unit, an optical / electrical conversion unit, an electric / optical conversion unit, and an arithmetic unit. And the storage means stores the table information of the link state and the optimum behavior set by the above-described optical path setting method, and the calculation means receives the optical path setting request of the service class i In this case, the table information is used to determine whether or not to reject the optical path setting request according to the optimum behavior corresponding to the current link state, and the Q value of each behavior for each state using the Q function is updated. It is said.

ここで、上記の演算手段は、ネットワークトポロジー,ノード数,使用可能な波長数、各クラスの平均光パス設定要求間隔,各クラスの平均光パス使用時間に基づいて、テーブル情報をオンラインで生成することを特徴とする。   Here, the computing means generates table information online based on the network topology, the number of nodes, the number of usable wavelengths, the average optical path setting request interval of each class, and the average optical path usage time of each class. It is characterized by that.

また、上記の光情報通信システムは、サービス差別化と波長利用効率化の均衡を図る報酬関数のパラメータを調整できるパラメータ調整手段を更に備えた構成とされる。   In addition, the optical information communication system described above further includes a parameter adjustment unit that can adjust a parameter of a reward function that balances service differentiation and wavelength utilization efficiency.

本発明の光パス設定方法ならびに光情報通信システムによれば、光パス設定のサービス差別化と波長(光パス)有効利用が図れ、実環境で使用できるといった効果を有する。   According to the optical path setting method and the optical information communication system of the present invention, there is an effect that service differentiation of optical path setting and effective use of wavelength (optical path) can be achieved, and it can be used in an actual environment.

WDMネットワークの説明図Illustration of WDM network WDMネットワークにおける光パス設定の説明図Illustration of optical path setting in WDM network WDMネットワークにおける各ノードの概略構成図Schematic configuration diagram of each node in the WDM network 強化学習アルゴリズムの処理フロー図Processing flow diagram of reinforcement learning algorithm 実施例1の光パス設定の説明図(1)Explanatory drawing of optical path setting of Example 1 (1) 実施例1の光パス設定の説明図(2)Explanatory drawing of optical path setting of Example 1 (2) 実施例1の光パス設定の場合における棄却率を示すグラフThe graph which shows the rejection rate in the case of the optical path setting of Example 1. 実施例1の光パス設定の場合における棄却率を示すグラフ(パラメータγを横軸)The graph which shows the rejection rate in the case of the optical path setting of Example 1 (parameter γ is abscissa) 実施例1の光パス設定の場合における棄却率を示すグラフ(パラメータαを横軸)The graph which shows the rejection rate in the case of the optical path setting of Example 1 (parameter α is a horizontal axis) 実施例1の光パス設定の場合における棄却率を示すグラフ(波長数を横軸)The graph which shows the rejection rate in the case of the optical path setting of Example 1 (the number of wavelengths is a horizontal axis)

以下、本発明の実施形態について、図面を参照しながら詳細に説明していく。なお、本発明の範囲は、以下の実施例や図示例に限定されるものではなく、幾多の変更及び変形が可能である。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. The scope of the present invention is not limited to the following examples and illustrated examples, and various changes and modifications can be made.

図1に示すように、従来の光ネットワークが1本の光ファイバで1波長を使用してデータ伝送するものであるのに対し、WDMネットワークは、1本の光ファイバで複数の波長を多重化して数倍のデータ量を伝送でき通信を行う送受信ノード間(送信ノードと受信ノードの間)に複数波長のうち,他の送受信ノード間で使用されていない1以上の波長を割り当てることで、各送受信ノード間で伝送波長を占有して大容量データ伝送を実現するものであり、波長の使用終了後はただちに他のノードが使用できるようにして光ファイバの帯域を有効活用するものである。   As shown in FIG. 1, a conventional optical network transmits data using one wavelength using one optical fiber, whereas a WDM network multiplexes a plurality of wavelengths using one optical fiber. By assigning one or more wavelengths that are not used between other transmitting / receiving nodes among a plurality of wavelengths between transmitting / receiving nodes (between the transmitting node and the receiving node) that can transmit several times the amount of data and perform communication, It occupies the transmission wavelength between the transmitting and receiving nodes and realizes large-capacity data transmission, and makes effective use of the optical fiber bandwidth by allowing other nodes to use it immediately after the use of the wavelength.

WDMネットワークでは、波長(光パス)を効率的に利用して光パスの確保の公平性を図るために、各ノードが自律的に波長(光パス)を選択し、送受信ノード間で物理的な通信チャネルである光パスを確保することが望ましいとされている。   In a WDM network, each node autonomously selects a wavelength (optical path) and uses a physical path between the transmitting and receiving nodes in order to efficiently use the wavelength (optical path) and to ensure fairness in securing the optical path. It is desirable to secure an optical path that is a communication channel.

図2に示すようなWDMネットワークにおける光パス設定では、送信側コンピュータから受信側コンピュータに大容量データを送信する場合、先ず、送信側コンピュータ(ユーザ)から光パスの設定要求を行い、WDMネットワーク内の空き波長を使用して光パスを設定してから、データ伝送を行う。もし、空き波長がなければ光パスの設定に失敗することとなり、データ伝送は行わない。データ伝送を行う際は、送信側コンピュータと受信側コンピュータの間で1波長の帯域を占有することになる。   In the optical path setting in the WDM network as shown in FIG. 2, when transmitting a large amount of data from the transmitting computer to the receiving computer, first, an optical path setting request is made from the transmitting computer (user) and the WDM network is set up. Data transmission is performed after setting the optical path using the available wavelengths. If there is no free wavelength, the optical path setting will fail and data transmission will not be performed. When data transmission is performed, one wavelength band is occupied between the transmitting computer and the receiving computer.

ここで、図2に示す各ノードの概略構成について、図3を参照して説明する。WDMネットワークの光ファイバ11を介する信号は、分波/多重器(12,13)で分波または多重化される。分波された光は、光スイッチ14で、光信号の伝搬する物理チャネルが切り換えられる。光スイッチ14は、制御器15で制御されるものである。この制御器15は、光または電気チャネル8を介して送られてくるノード制御信号を、トランシーバ18を用いて受信する。また、制御器15は、メモリ16に蓄積された光パス設定テーブルやリンク情報などを参照して、光パス設定を行う。   Here, a schematic configuration of each node illustrated in FIG. 2 will be described with reference to FIG. A signal passing through the optical fiber 11 of the WDM network is demultiplexed or multiplexed by a demultiplexer / multiplexer (12, 13). The demultiplexed light is switched by the optical switch 14 in the physical channel through which the optical signal propagates. The optical switch 14 is controlled by the controller 15. The controller 15 receives a node control signal sent via the optical or electrical channel 8 using the transceiver 18. Further, the controller 15 performs optical path setting with reference to the optical path setting table and link information stored in the memory 16.

次に、各ノードの制御器15が参照するメモリ16に蓄積された光パス設定テーブルやリンク情報について、以下に説明する。
本発明においては、光パス設定テーブルやリンク情報は、光パスが設定される場合に得られる報酬をサービスクラス毎に設定し、かつ、光パス設定が失敗したときのコストを設定し、報酬およびコストから導出した報酬関数が最大になるように各クラスの光パス設定要求の受け入れ可否を決定して、送信ノードにおける現在のリンク状態から次のリンク状態への最適行動を、報酬関数に基づき強化学習アルゴリズムを用いて導出することとしている。
Next, an optical path setting table and link information stored in the memory 16 referred to by the controller 15 of each node will be described below.
In the present invention, the optical path setting table and link information set the reward obtained when the optical path is set for each service class, and sets the cost when the optical path setting fails, and the reward and Decide whether to accept the optical path setting request of each class so that the reward function derived from cost is maximized, and strengthen the optimal action from the current link state to the next link state at the sending node based on the reward function Derived using a learning algorithm.

各ノードにおける時刻tのリンク状態sは、s=(N(t),N(t),・・・,N(t),I(t−1))と定義する。
ここで、Mはサービスクラス数であり、N(t)は時刻tにおけるサービスクラスiの光パス設定数であり、I(t−1)は前回の光パス設定要求に対する受け入れ結果(失敗したら1、成功したら0)である。このIは、光パス設定が失敗したときのコストとなる。すなわち、後述する報酬関数において、Iに重み係数を乗算したものを減算して報酬を求めることとしており、光パス設定要求に失敗したら報酬が少なくなるようになっている。
また、現在のリンク状態stから行動aを取って、次の時刻t+1にリンク状態st+1へ遷移した場合、リンク状態st+1は、st+1=(N(t+1),N(t+1),・・・,N(t+1),I(t))と定義する。
Link state s t at time t at each node, s t = is defined as (N 1 (t), N 2 (t), ···, N M (t), I (t-1)).
Here, M is the number of service classes, N i (t) is the number of optical path settings for service class i at time t, and I (t−1) is the acceptance result for the previous optical path setting request (if it fails) 1. If successful, 0). This I is a cost when the optical path setting fails. That is, in a reward function to be described later, a reward is obtained by subtracting I multiplied by a weighting factor, and the reward is reduced if the optical path setting request fails.
In addition, the current link status s t acted a t, if a transition is made to the next time t + 1 to the link state s t + 1, the link state s t + 1 is, s t + 1 = (N 1 (t + 1), N 2 (t + 1 ,..., N M (t + 1), I (t)).

ここで、行動aは、Mのサービスクラスのうち、どのサービスクラスの光パス要求を受け入れ光パスを設定し、どのサービスクラスの光パス要求を棄却し光パスを設定しないかを示すものである。
サービスクラスがMある場合、取り得る行動aは、(2−1)通り存在する。例えば、サービスクラスが3の場合、取り得る行動aは以下の7通り存在する。
Here, the action a t, among the class of service M, which service class to set the optical path request acceptance light path, indicates whether not set rejected by optical paths of light path request any service class is there.
If the service class is M, the possible actions a t exists as (2 M -1). For example, if the service class is 3, the possible actions a t exists ways following 7.

1)サービスクラス1の光パス設定要求のみ受け入れる。
2)サービスクラス2の光パス設定要求のみ受け入れる。
3)サービスクラス3の光パス設定要求のみ受け入れる。
4)サービスクラス1とサービスクラス2の光パス設定要求のみ受け入れる。
5)サービスクラス2とサービスクラス3の光パス設定要求のみ受け入れる。
6)サービスクラス1とサービスクラス3の光パス設定要求のみ受け入れる。
7)全サービスクラス1,2,3の光パス設定要求を受け入れる。
1) Only service class 1 optical path setting requests are accepted.
2) Only service class 2 optical path setting requests are accepted.
3) Only an optical path setting request for service class 3 is accepted.
4) Accepts only optical class setting requests for service class 1 and service class 2.
5) Accepts only optical path setup requests for service class 2 and service class 3.
6) Accepts only optical class setting requests for service class 1 and service class 3.
7) Accept all service class 1, 2, and 3 optical path setting requests.

そして、報酬関数は、下記数4で定義される。この報酬関数を用いて、状態sで行動aを取り、状態がst+1へ遷移したときの報酬が算出できる。
ここで、パラメータ変数Rは、各ノードには光パスが設定される場合に得られる報酬をサービスクラス毎に設定したものであり、またパラメータ変数Cは、光パス設定が失敗したときの設定コストである。パラメータ変数βを用いることで、光パス設定のサービス差別化と波長(光パス)有効利用が図れることになる。パラメータ変数βの値が小さくなるにつれて、波長有効利用に対する重みが増加し、サービスの差別化が提供されにくくなる一方、波長を有効利用できるようになる。なお、パラメータ変数Rおよびパラメータ変数βは、1以下の正の値をとり、Cは正の値をとる。
The reward function is defined by the following formula 4. Using this reward function, takes action a r a state s t, compensation can be calculated when the state changes to s t + 1.
Here, the parameter variable R i is a reward set for each service class when an optical path is set in each node, and the parameter variable C is set when the optical path setting fails. Cost. By using the parameter variable β, optical path setting service differentiation and wavelength (optical path) effective use can be achieved. As the value of the parameter variable β decreases, the weight for effective wavelength use increases, making it difficult to provide service differentiation, while enabling effective use of wavelengths. The parameter variable R i and the parameter variable β take a positive value of 1 or less, and C takes a positive value.

(数4)
t+1=β(R(t)+R(t)+・・・+R(t))−(1−β)CI(t)
(Equation 4)
r t + 1 = β (R 1 N 1 (t) + R 2 N 2 (t) +... + R M N M (t)) − (1-β) CI (t)

そして、強化学習アルゴリズムは、図4のフロー図に示すように、
(ステップ1)少なくともネットワークトポロジー,ノード数,使用可能な波長数,各クラスの平均光パス設定要求間隔,各クラスの平均光パス使用時間が与えられた擬似ネットワーク環境を構築するステップ
(ステップ2)擬似ネットワーク環境上で、擬似的に各クラスの光パス設定要求イベントと光パス使用終了イベントを発生させるステップ
(ステップ3)各ノードがリンク状態sに応じた行動aをとりながら、Q値を更新していくステップ
(ステップ4)その都度変更されるリンク状態sと行動aの最適行動ペア(s,a)に従って、光パス設定要求の受け入れ可否を決定していくステップ
から成る。
And the reinforcement learning algorithm, as shown in the flow diagram of FIG.
(Step 1) Step of constructing a pseudo network environment given at least the network topology, the number of nodes, the number of usable wavelengths, the average optical path setting request interval of each class, and the average optical path usage time of each class (Step 2) on pseudo network environment, while pseudo-step of generating a light path setting request event and a light path using end event of each class (step 3) each node takes action a t in accordance with the link state s t, Q value (Step 4) is a step of determining whether or not to accept the optical path setting request according to the optimum behavior pair (s t , a t ) of the link state s and behavior a that is changed each time.

各ノードの制御器またはノードとは別個独立のコンピュータ上で、光ネットワークのネットワークトポロジー,ノード数,使用可能な波長数,各クラスの平均光パス設定要求間隔,各クラスの平均光パス使用時間が与えられた模擬ネットワーク環境を構築して、モンテカルロシミュレーションを実行して、報酬関数の値を算出する。   The network topology of the optical network, the number of nodes, the number of usable wavelengths, the average optical path setting request interval for each class, and the average optical path usage time for each class on a computer independent of the controller or node of each node A given simulated network environment is constructed, a Monte Carlo simulation is executed, and a reward function value is calculated.

最後に、ステップ5として、報酬関数の値が最大となる最適行動ペア(s,a)に基づいて、リンク状態と最適行動の光パス設定テーブル情報を生成し、リンク状態と最適行動の光パス設定テーブル情報として各ノードのメモリ16に記憶させるのである。
各ノードでは、サービスクラスiの光パス設定要求を受信した場合、メモリ16に記憶された光パス設定テーブル情報を用いて、現在のリンク状態に対応した最適行動に従って、光パス設定要求を棄却するか否かを判別することとなる。
Finally, as step 5, based on the optimal action pair (s t , a t ) with the maximum reward function value, the optical path setting table information of the link state and the optimal action is generated, and the link state and the optimal action It is stored in the memory 16 of each node as optical path setting table information.
When each node receives an optical path setup request for service class i, it rejects the optical path setup request according to the optimum behavior corresponding to the current link state using the optical path setup table information stored in the memory 16. It will be determined whether or not.

上記の光パス設定方法ならびに光情報通信システムによれば、光パス設定のサービス差別化と波長(光パス)有効利用が図れ、実環境で使用できることになる。以下に、具体的な実施例を通じて説明する。   According to the above optical path setting method and optical information communication system, service differentiation of optical path setting and effective use of wavelength (optical path) can be achieved, and it can be used in an actual environment. Below, it demonstrates through a specific Example.

図5−1および図5−2は、ノード数が3の光ネットワークトポロジーの光パス設定の様子を示している。ここでは、サービスクラス数が3で、波長数が8の場合を想定している。
図5−1において、ノードBの時刻tにおける状態sは、(2,3,1,0)であり、2つの空き波長が存在している。この状態で、ノードAからノードCへサービスクラス2のデータ伝送要求が発生した場合を考える。状態s=(2,3,1,0)に対する最適行動aが“サービスクラス1とサービスクラス2の光パス設定要求のみ受け入れる”といった行動であるならば、サービスクラス2の光パス設定要求は受け入れされて、状態sは状態st+1=(2,4,1,0)に遷移することになる(光パス設定は成功)。
FIG. 5A and FIG. 5B illustrate how an optical path is set in an optical network topology with three nodes. Here, it is assumed that the number of service classes is 3 and the number of wavelengths is 8.
In FIG. 5A, the state s t of the node B at time t is (2, 3, 1, 0), and there are two free wavelengths. Consider a case where a service class 2 data transmission request is generated from node A to node C in this state. If state s t = (2,3,1,0) optimal action a t for is actions like "Accept only service class 1 and service class 2 of the optical path setting request", the service class 2 optical path setting request Is accepted and the state s t transitions to the state s t + 1 = ( 2, 4, 1, 0) (the optical path setting is successful).

次に、図5−2において、状態st+1で、ノードAからノードCへサービスクラス2のデータ伝送要求が発生した場合、状態st+1=(2,4,1,0)に対する最適行動at+1が“サービスクラス1の光パス設定要求のみ受け入れる”といった行動であるならば、サービスクラス2の光パス設定要求は受け入れられずに、状態st+1=(2,4,1,1)に遷移することになる(光パス設定は失敗)。 Next, in Figure 5-2, in the state s t + 1, if the data transmission request for service class 2 to node C is generated from the node A, the state s t + 1 = optimal action a t + 1 for the (2,4,1,0) Is an action such as “accept only service class 1 optical path setup request”, the service class 2 optical path setup request is not accepted, and the state transits to the state s t + 1 = ( 2, 4, 1, 1 ). (Optical path setting failed).

次に、ノードAからノードCへの光パス設定を行う場合に、中継ノードBにおけるノードAからの光パス設定要求に対する棄却率について、従来の光パス設定方法と本発明の光パス設定方法を比較する。従来の光パス設定方法には、各クラスが設定可能な光パス数を固定した方式を用いている。波長数は8で、サービスクラス数は3としている。
また、Q関数のαは0.1、γは0.95、報酬関数のCが1.0で、R,R,Rは、0.05から1.0まで、0.05刻みで変化させることにした。但し、R<R<Rで、β=0.1である。
また、ユーザの要求として、サービスクラスiの失敗確率は、ζi以下としている。ξ1=0.4,ξ2=0.9,ξ3=1.0である。
Next, when performing optical path setting from node A to node C, the conventional optical path setting method and the optical path setting method of the present invention are used for the rejection rate for the optical path setting request from node A in relay node B. Compare. A conventional optical path setting method uses a method in which the number of optical paths that can be set for each class is fixed. The number of wavelengths is 8, and the number of service classes is 3.
Also, α of the Q function is 0.1, γ is 0.95, C of the reward function is 1.0, and R 1 , R 2 , and R 3 are changed from 0.05 to 1.0 in increments of 0.05. However, R 3 <R 2 <R 1 and β = 0.1.
Further, as a user request, the failure probability of service class i is set to ζi or less. ξ1 = 0.4, ξ2 = 0.9, ξ3 = 1.0.

図6は、光パス設定の場合における棄却率を示すグラフを示している。従来の光パス設定方法と比較して、本発明の光パス設定方法では、サービスクラス1もサービスクラス2も棄却率が低減されており、サービスの差別化と波長の有効利用が更に改善されていることが理解できる。   FIG. 6 shows a graph showing the rejection rate in the case of setting an optical path. Compared with the conventional optical path setting method, in the optical path setting method of the present invention, the rejection rate is reduced in both service class 1 and service class 2, and service differentiation and effective use of wavelengths are further improved. I can understand that.

また、図7は、波長数が6,クラス数が3,Q関数のαが0.1、報酬関数のCが1.0で、R=0.8,R=0.4,R=0.2で、β=0.1の時に、パラメータγを横軸にとって、本発明の光パス設定方法を用いた場合の各クラスの棄却率を示している。
図7に示されるように、γが0.65より大きくなると学習によりサービスの差別化が実現できている。このことから、本発明の光パス設定方法の性能は、パラメータγの影響を受けることが理解できる。
FIG. 7 also shows that the number of wavelengths is 6, the number of classes is 3, the Q function α is 0.1, the reward function C is 1.0, R 1 = 0.8, R 2 = 0.4, R 3 = 0.2, and β = 0.1. At this time, the rejection rate of each class when the optical path setting method of the present invention is used is shown with the parameter γ on the horizontal axis.
As shown in FIG. 7, when γ is larger than 0.65, service differentiation can be realized by learning. From this, it can be understood that the performance of the optical path setting method of the present invention is affected by the parameter γ.

また、図8は、波長数が6,クラス数が3,Q関数のγが0.95、報酬関数のCが1.0で、R=0.8,R=0.4,R=0.2で、β=0.1の時に、パラメータαを横軸にとって、本発明の光パス設定方法を用いた場合の各クラスの棄却率を示している。
図8に示されるように、αが0から0.1に変化すると、サービスの差別化がより有効になっている。またαが1.0に近づくと棄却率の差が小さくなる。従って、本発明の光パス設定方法の性能はパラメータαの影響を受けることが理解できる。
FIG. 8 shows that the number of wavelengths is 6, the number of classes is 3, the γ of the Q function is 0.95, the C of the reward function is 1.0, R 1 = 0.8, R 2 = 0.4, R 3 = 0.2, and β = 0.1. At this time, the rejection rate of each class when the optical path setting method of the present invention is used is shown with the parameter α as the horizontal axis.
As shown in FIG. 8, when α changes from 0 to 0.1, service differentiation becomes more effective. Also, as α approaches 1.0, the difference in rejection rate becomes smaller. Therefore, it can be understood that the performance of the optical path setting method of the present invention is affected by the parameter α.

また、図9は、クラス数が3で、Q関数のγが0.95で、αが0.1、報酬関数のCが1.0で、R=0.8,R=0.4,R=0.2で、β=0.1の時に、波長数を横軸にとって、本発明の光パス設定方法を用いた場合の各クラスの棄却率を示している。
図9に示されるように、本発明の光パス設定方法を用いると波長数が100の時にでも利用可能であることがわかり、先行研究のマルコフ決定過程の方式よりも有効である。
FIG. 9 shows that the number of classes is 3, the γ of the Q function is 0.95, α is 0.1, the reward function C is 1.0, R 1 = 0.8, R 2 = 0.4, R 3 = 0.2, and β = When 0.1, the horizontal axis indicates the rejection rate of each class when the optical path setting method of the present invention is used.
As shown in FIG. 9, it can be seen that the optical path setting method of the present invention can be used even when the number of wavelengths is 100, which is more effective than the Markov decision process method of the previous research.

本発明は、遠隔医療や高精細動画ストリーミング,グリッドコンピューティングへの利用が期待される。   The present invention is expected to be used for telemedicine, high-definition video streaming, and grid computing.

1 光ファイバ
2 送信側コンピュータ
3 受信側コンピュータ
4 データ
5 光パス
7 光ネットワーク
8 ノード
11 光ファイバ
12、13 分波/多重器
14 光スイッチ
15 制御器
16 メモリ
17 トランシーバ
18 光または電気チャネル
21 光パス設定情報テーブル
22 リンク状態情報テーブル
DESCRIPTION OF SYMBOLS 1 Optical fiber 2 Transmission side computer 3 Reception side computer 4 Data 5 Optical path 7 Optical network 8 Node 11 Optical fiber 12, 13 Demultiplexer / Multiplexer 14 Optical switch 15 Controller 16 Memory 17 Transceiver 18 Optical or electrical channel 21 Optical path Setting information table 22 Link status information table

Claims (12)

波長分割多重ネットワークにおける送信ノードから受信ノードへの複数のサービスクラスを有する光パス設定方法であって、
各ノードには光パスが設定される場合に得られる報酬をサービスクラス毎に設定し、かつ、光パス設定が失敗したときのコストを設定し、
前記報酬およびコストから導出した報酬関数が最大になるように各クラスの光パス設定要求の受け入れ可否を決定して、
前記送信ノードにおける現在のリンク状態から次のリンク状態への最適行動を、報酬関数に基づき強化学習アルゴリズムを用いて導出することを特徴とする光パス設定方法。
An optical path setting method having a plurality of service classes from a transmission node to a reception node in a wavelength division multiplexing network,
Remuneration obtained when an optical path is set for each node is set for each service class, and the cost when the optical path setting fails is set,
Deciding whether to accept the optical path setting request for each class so that the reward function derived from the reward and cost is maximized,
An optical path setting method, wherein an optimal behavior from the current link state to the next link state in the transmitting node is derived using a reinforcement learning algorithm based on a reward function.
前記リンク状態は、
光パス設定要求到着イベントを単位とする離散時間tを導入し、
時刻(t)におけるクラス数Mのサービスクラスiの光パス設定数N(t)と、前回時刻(t−1)の光パス設定要求に対する受け入れ結果I(t−1)を用いて、下記数1で定義され、
前記報酬関数は、現在のリンク状態sから行動aを取って、次のリンク状態st+1へ遷移した時に、下記数2で定義され、
前記報酬関数を基づいて、下記数3で定義される行動価値関数(Q関数)から得られる状態stに対する各行動atのQ値を用いて、状態stに対して最も大きなQ値を持つ行動atを最適行動として光パス設定の受け入れ可否が決定されることを特徴とする請求項1に記載の光パス設定方法。
(数1)
t=(N(t),N(t),・・・,N(t),I(t−1))
(数2)
t+1=β(R(t)+R(t)+・・・+R(t))−(1−β)CI(t) (但し、0<R<RM−1<・・・<R<・・・<R<R<=1,0<=β<=1,0<C)
(数3)
Q(st,at)← Q(st,at)+α[rt+1+γmaxQ(st+1,a)−Q(st,at)] (但し、0<α<=1,0<=γ<1)
The link state is
Introduce a discrete time t in units of optical path setting request arrival events,
By using the optical path setting number N i (t) of the service class i of the class number M at the time (t) and the acceptance result I (t−1) for the optical path setting request at the previous time (t−1), Defined by the number 1,
The reward function is defined by the following equation 2 when taking the action a t from the current link state s t and transitioning to the next link state s t + 1 :
Based the reward function, using the Q value of each behavior a t to the state s t obtained from the action-value function defined by the following Expression 3 (Q function), the largest Q value for state s t optical path setting method according to claim 1, receiving availability of optical path setting is being determined action a t as optimal action with.
(Equation 1)
s t = (N 1 (t ), N 2 (t), ···, N M (t), I (t-1))
(Equation 2)
r t + 1 = β (R 1 N 1 (t) + R 2 N 2 (t) +... + R M N M (t)) − (1-β) CI (t) (where 0 <R M <R M-1 <... <R i <... <R 2 <R 1 <= 1, 0 <= β <= 1, 0 <C)
(Equation 3)
Q (s t , a t ) ← Q (s t , a t ) + α [r t + 1 + γmaxQ (s t + 1 , a) −Q (s t , a t )] (where 0 <α <= 1, 0 <= γ <1)
前記強化学習アルゴリズムは、
少なくともネットワークトポロジー,ノード数,使用可能な波長数,各クラスの平均光パス設定要求間隔,各クラスの平均光パス使用時間が与えられた擬似ネットワーク環境を構築するステップと、
前記擬似ネットワーク環境上で、擬似的に各クラスの光パス設定要求イベントと光パス使用終了イベントを発生させるステップと、
各ノードが前記リンク状態sに応じた前記行動aをとりながら、前記Q値を更新していくステップと、
都度変更される前記リンク状態sと前記行動aの最適行動ペア(s,a)に従って、光パス設定要求の受け入れ可否を決定していくステップと、
を備えたものであることを特徴とする請求項2に記載の光パス設定方法。
The reinforcement learning algorithm is:
Constructing a pseudo network environment given at least the network topology, the number of nodes, the number of usable wavelengths, the average optical path setting request interval of each class, and the average optical path usage time of each class;
On the pseudo network environment, generating an optical path setting request event and an optical path use end event for each class in a pseudo manner;
While taking the action a t each node according to the link state s t, and the step to continue to update the Q value,
A step in accordance with the link state s t and optimal action pairs of the actions a t are each time changed (s t, a t), will determine the acceptance possibility of the optical path setting request,
The optical path setting method according to claim 2, further comprising:
波長分割多重ネットワークにおける送信ノードから受信ノードへの複数のサービスクラスを有する光パス設定を行う光パス設定方法であって、
各ノードに対して、光パスが設定される場合に得られる報酬をサービスクラス毎に設定し、また、光パス設定が失敗したときのコストを設定するステップと、
自ノードに隣接するリンクの波長数とサービスクラス数を設定するステップと、
光パス設定要求イベント又は光パス使用終了イベントが発生した場合に、リンク状態に応じた行動をとりながら、行動価値関数(Q関数)のQ値を更新していくステップと、
光パス設定要求イベントが発生した場合に、リンク状態と行動の最適行動ペアに従って、光パス設定要求イベントの受け入れ可否を決定していくステップと、
を備えたことを特徴とする光パス設定方法。
An optical path setting method for setting an optical path having a plurality of service classes from a transmission node to a reception node in a wavelength division multiplexing network,
For each node, setting a reward obtained when an optical path is set for each service class, and setting a cost when the optical path setting fails,
Setting the number of wavelengths and the number of service classes of links adjacent to the own node;
A step of updating a Q value of an action value function (Q function) while taking an action according to a link state when an optical path setting request event or an optical path use end event occurs;
Determining whether to accept the optical path setting request event according to the optimal behavior pair of the link state and the action when the optical path setting request event occurs; and
An optical path setting method comprising:
前記リンク状態は、
光パス設定要求到着イベントを単位とする離散時間tを導入し、
時刻(t)におけるクラス数Mのサービスクラスiの光パス設定数N(t)と、前回時刻(t−1)の光パス設定要求に対する受け入れ結果I(t−1)を用いて、下記数4で定義され、
前記報酬関数は、現在のリンク状態sから行動aを取って、次のリンク状態st+1へ遷移した時に、下記数5で定義され、
前記報酬関数を基づいて、下記数6で定義されるQ関数から得られる状態stに対する各行動atのQ値を用いて、状態stに対して最も大きなQ値を持つ行動atを最適行動として光パス設定の受け入れ可否が決定されることを特徴とする請求項4に記載の光パス設定方法。
(数4)
t=(N(t),N(t),・・・,N(t),I(t−1))
(数5)
t+1=β(R(t)+R(t)+・・・+R(t))−(1−β)CI(t) (但し、0<R<RM−1<・・・<R<・・・<R<R<=1,0<=β<=1,0<C)
(数6)
Q(st,at)← Q(st,at)+α[rt+1+γmaxQ(st+1,a)−Q(st,at)] (但し、0<α<=1,0<=γ<1)
The link state is
Introduce a discrete time t in units of optical path setting request arrival events,
By using the optical path setting number N i (t) of the service class i of the class number M at the time (t) and the acceptance result I (t−1) for the optical path setting request at the previous time (t−1), Defined by equation (4)
The reward function is defined by the following equation 5 when taking the action a t from the current link state s t and transitioning to the next link state s t + 1 :
On the basis of the compensation function, with the Q value of each behavior a t to the state s t obtained from the Q function defined by the following Expression 6, a behavior a t with the highest Q value for state s t 5. The optical path setting method according to claim 4, wherein acceptability of the optical path setting is determined as the optimum behavior.
(Equation 4)
s t = (N 1 (t ), N 2 (t), ···, N M (t), I (t-1))
(Equation 5)
r t + 1 = β (R 1 N 1 (t) + R 2 N 2 (t) +... + R M N M (t)) − (1-β) CI (t) (where 0 <R M <R M-1 <... <R i <... <R 2 <R 1 <= 1, 0 <= β <= 1, 0 <C)
(Equation 6)
Q (s t , a t ) ← Q (s t , a t ) + α [r t + 1 + γmaxQ (s t + 1 , a) −Q (s t , a t )] (where 0 <α <= 1, 0 <= γ <1)
波長分割多重ネットワークにおける送信ノードから受信ノードへの複数のサービスクラスを有する光パス設定を行うプログラムであって、
各ノードのコンピュータに、
光パスが設定される場合に得られる報酬をサービスクラス毎に設定し、また、光パス設定が失敗したときのコストを設定するステップと、
自ノードに隣接するリンクの波長数とサービスクラス数を設定するステップと、
光パス設定要求イベント又は光パス使用終了イベントが発生した場合に、リンク状態に応じた行動をとりながら、行動価値関数(Q関数)のQ値を更新していくステップと、
光パス設定要求イベントが発生した場合に、リンク状態と行動の最適行動ペアに従って、光パス設定要求イベントの受け入れ可否を決定していくステップと、
を実行させるための光パス設定プログラム。
A program for setting an optical path having a plurality of service classes from a transmission node to a reception node in a wavelength division multiplexing network,
On each node's computer,
A step of setting a reward obtained when an optical path is set for each service class, and setting a cost when the optical path setting fails;
Setting the number of wavelengths and the number of service classes of links adjacent to the own node;
A step of updating a Q value of an action value function (Q function) while taking an action according to a link state when an optical path setting request event or an optical path use end event occurs;
Determining whether to accept the optical path setting request event according to the optimal behavior pair of the link state and the action when the optical path setting request event occurs; and
Optical path setting program to execute.
前記リンク状態は、
光パス設定要求到着イベントを単位とする離散時間tを導入し、
時刻(t)におけるクラス数Mのサービスクラスiの光パス設定数N(t)と、前回時刻(t−1)の光パス設定要求に対する受け入れ結果I(t−1)を用いて、下記数7で定義され、
前記報酬関数は、現在のリンク状態sから行動aを取って、次のリンク状態st+1へ遷移した時に、下記数8で定義され、
前記報酬関数を基づいて、下記数9で定義されるQ関数から得られる状態stに対する各行動atのQ値を用いて、状態stに対して最も大きなQ値を持つ行動atを最適行動として光パス設定の受け入れ可否が決定されることを特徴とする請求項6に記載の光パス設定プログラム。
(数7)
t=(N(t),N(t),・・・,N(t),I(t−1))
(数8)
t+1=β(R(t)+R(t)+・・・+R(t))−(1−β)CI(t) (但し、0<R<RM−1<・・・<R<・・・<R<R<=1,0<=β<=1,0<C)
(数9)
Q(st,at)← Q(st,at)+α[rt+1+γmaxQ(st+1,a)−Q(st,at)] (但し、0<α<=1,0<=γ<1)
The link state is
Introduce a discrete time t in units of optical path setting request arrival events,
By using the optical path setting number N i (t) of the service class i of the class number M at the time (t) and the acceptance result I (t−1) for the optical path setting request at the previous time (t−1), Defined by Equation 7,
The reward function is defined by the following equation 8 when taking the action at from the current link state s t and transitioning to the next link state s t + 1 :
On the basis of the compensation function, with the Q value of each behavior a t to the state s t obtained from the Q function defined by the following Expression 9, the action a t with the highest Q value for state s t The optical path setting program according to claim 6, wherein acceptability of the optical path setting is determined as the optimum action.
(Equation 7)
s t = (N 1 (t ), N 2 (t), ···, N M (t), I (t-1))
(Equation 8)
r t + 1 = β (R 1 N 1 (t) + R 2 N 2 (t) +... + R M N M (t)) − (1-β) CI (t) (where 0 <R M <R M-1 <... <R i <... <R 2 <R 1 <= 1, 0 <= β <= 1, 0 <C)
(Equation 9)
Q (s t , a t ) ← Q (s t , a t ) + α [r t + 1 + γmaxQ (s t + 1 , a) −Q (s t , a t )] (where 0 <α <= 1, 0 <= γ <1)
請求項3に記載の強化学習アルゴリズムの光パス設定方法により得られた最適行動ペア(st,at)を初期値として設定するステップを、更に備えたことを特徴とする請求項6に記載の光パス設定プログラム。 The step of setting the optimal action pair (s t , a t ) obtained by the optical path setting method of the reinforcement learning algorithm according to claim 3 as an initial value is further provided. Optical path setting program. 波長分割多重ネットワークにおける送信ノードから受信ノードへの複数のサービスクラスを有する光パス設定を行う光スイッチであって、
請求項6〜8のいずれかに記載のプログラムを搭載した光スイッチ。
An optical switch for performing optical path setting having a plurality of service classes from a transmission node to a reception node in a wavelength division multiplexing network,
An optical switch equipped with the program according to claim 6.
複数のサービスクラスを有する波長分割多重ネットワークにおける各ノードが、光送信手段と、光受信手段と、光電気変換手段と、電気光変換手段と、演算手段と、記憶手段を備え、
前記記憶手段は、請求項1〜5のいずれかに記載の光パス設定方法により設定された前記リンク状態と前記最適行動のテーブル情報が記憶されており、
前記演算手段は、サービスクラスiの光パス設定要求を受信した場合、前記テーブル情報を用いて、現在のリンク状態に対応した最適行動に従って、前記光パス設定要求を棄却するか否かを判別し、前記Q関数を用いた各状態に対する各行動の前記Q値を更新する、
ことを特徴とする光情報通信システム。
Each node in the wavelength division multiplexing network having a plurality of service classes includes an optical transmission means, an optical reception means, an optical / electrical conversion means, an electric / optical conversion means, an arithmetic means, and a storage means,
The storage unit stores table information of the link state and the optimum behavior set by the optical path setting method according to any one of claims 1 to 5,
When receiving the service class i optical path setup request, the computing means determines whether to reject the optical path setup request according to the optimum behavior corresponding to the current link state using the table information. Updating the Q value of each action for each state using the Q function;
An optical information communication system.
前記演算手段は、ネットワークトポロジー,ノード数,使用可能な波長数、各クラスの平均光パス設定要求間隔,各クラスの平均光パス使用時間に基づいて、前記テーブル情報をオンラインで生成することを特徴とする請求項10に記載の光情報通信システム。   The computing means generates the table information online based on the network topology, the number of nodes, the number of usable wavelengths, the average optical path setting request interval of each class, and the average optical path usage time of each class. The optical information communication system according to claim 10. サービス差別化と波長利用効率化の均衡を図る前記報酬関数のパラメータを調整できるパラメータ調整手段を更に備えたことを特徴とする請求項10に記載の光情報通信システム。
11. The optical information communication system according to claim 10, further comprising parameter adjusting means capable of adjusting a parameter of the reward function for achieving a balance between service differentiation and wavelength utilization efficiency.
JP2009113071A 2009-05-07 2009-05-07 Optical path setting method, and optical information communication system Pending JP2010263442A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009113071A JP2010263442A (en) 2009-05-07 2009-05-07 Optical path setting method, and optical information communication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009113071A JP2010263442A (en) 2009-05-07 2009-05-07 Optical path setting method, and optical information communication system

Publications (1)

Publication Number Publication Date
JP2010263442A true JP2010263442A (en) 2010-11-18

Family

ID=43361164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009113071A Pending JP2010263442A (en) 2009-05-07 2009-05-07 Optical path setting method, and optical information communication system

Country Status (1)

Country Link
JP (1) JP2010263442A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8737836B2 (en) 2011-05-27 2014-05-27 Fujitsu Limited Apparatus and method for setting an optical path in an optical network
JP2020150518A (en) * 2019-03-15 2020-09-17 Kddi株式会社 Network management system and program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200801065007; 小柳衣津美・橘拓至・杉本謙二: '波長変換に制限のあるWDM網におけるサービスの差別化を実現するマルコフ決定過程モデル' 電子情報通信学会技術研究報告 NS2008-115 Vol.108 No.359, 20081211, pp.41-46, 社団法人電子情報通信学会 *
JPN6013020246; 小柳衣津美・橘拓至・杉本謙二: '波長変換に制限のあるWDM網におけるサービスの差別化を実現するマルコフ決定過程モデル' 電子情報通信学会技術研究報告 NS2008-115 Vol.108 No.359, 20081211, pp.41-46, 社団法人電子情報通信学会 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8737836B2 (en) 2011-05-27 2014-05-27 Fujitsu Limited Apparatus and method for setting an optical path in an optical network
JP2020150518A (en) * 2019-03-15 2020-09-17 Kddi株式会社 Network management system and program
JP7079059B2 (en) 2019-03-15 2022-06-01 Kddi株式会社 Network management systems and programs

Similar Documents

Publication Publication Date Title
JP4796668B2 (en) Bus control device
Xia et al. Risk-aware provisioning for optical WDM mesh networks
Klinkowski et al. On performance gains of flexible regeneration and modulation conversion in translucent elastic optical networks with superchannel transmission
US9820021B2 (en) Methods and apparatus for determining a path in a communications network
WO2011093396A1 (en) Virtual network control method and system based on fluctuations
Yang et al. Adaptive path selection in OBS networks
Tanwir et al. Dynamic scheduling of network resources with advance reservations in optical grids
Zhong et al. Provisioning short-term traffic fluctuations in elastic optical networks
JP2011155509A (en) Virtual network control method and virtual network control device
US20150295654A1 (en) System architecture for global optimization of flexible grid optical network and global optimization method therefor
Constantinou et al. A load balancing technique for efficient survivable multicasting in mesh optical networks
JP2010263442A (en) Optical path setting method, and optical information communication system
Zheng et al. Optimal peer-to-peer technique for massive content distribution
Aibin et al. Adaptive survivability algorithm for path protection with various traffic classes in elastic optical networks
Truong-Huu et al. Dynamic flow scheduling with uncertain flow duration in optical data centers
Koseoglu et al. Joint resource and network scheduling with adaptive offset determination for optical burst switched grids
JP2013038571A (en) Virtual network control method and management node device
Yang et al. Cross stratum optimization for software defined multi-domain and multi-layer optical transport networks deploying with data centers
Yang et al. Dynamic global load balancing strategy for cross stratum optimization of OpenFlow-enabled triple-M optical networks
Kmiecik et al. Dynamic overlay multicasting for deadline-driven requests provisioning in elastic optical networks
JP4822446B2 (en) Network control device, network control method, network system, and program
CN103731366B (en) The adaptive weight leading method of dynamic service flow in optical-fiber network
Zangoulechi et al. An adaptive traffic engineering approach based on retransmission timeout adjustment for software-defined networks
Pedrola et al. Metaheuristic hybridizations for the regenerator placement and dimensioning problem in sub-wavelength switching optical networks
JP5300104B2 (en) Optical path network configuration equipment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120502

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120514

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130426

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140401