JP7428831B2 - Otnネットワークリソース最適化方法および装置、コンピュータデバイスならびに記憶媒体 - Google Patents

Otnネットワークリソース最適化方法および装置、コンピュータデバイスならびに記憶媒体 Download PDF

Info

Publication number
JP7428831B2
JP7428831B2 JP2022572468A JP2022572468A JP7428831B2 JP 7428831 B2 JP7428831 B2 JP 7428831B2 JP 2022572468 A JP2022572468 A JP 2022572468A JP 2022572468 A JP2022572468 A JP 2022572468A JP 7428831 B2 JP7428831 B2 JP 7428831B2
Authority
JP
Japan
Prior art keywords
service
creation state
service creation
created
quantization index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022572468A
Other languages
English (en)
Other versions
JP2023527007A (ja
Inventor
王大江
叶友道
王振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Publication of JP2023527007A publication Critical patent/JP2023527007A/ja
Application granted granted Critical
Publication of JP7428831B2 publication Critical patent/JP7428831B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/645Splitting route computation layer and forwarding layer, e.g. routing according to path computational element [PCE] or based on OpenFlow functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q11/0067Provisions for optical access or distribution networks, e.g. Gigabit Ethernet Passive Optical Network (GE-PON), ATM-based Passive Optical Network (A-PON), PON-Ring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/14Routing performance; Theoretical aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0062Network aspects
    • H04Q2011/0086Network resource allocation, dimensioning or optimisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/1301Optical transmission, optical switches

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Telephonic Communication Services (AREA)

Description

本願は2020年8月31日に提出された中国特許出願第202010899110.1号の優先権を主張し、当該中国特許出願の全ての内容を援用によって引用することとする。
本開示は自動制御技術分野に関し、具体的には、OTNネットワークリソース最適化方法および装置、コンピュータデバイスならびにコンピュータ可読記憶媒体に関するものである。
人工知能技術の発展に伴い、強化学習技術の応用は様々な分野と業界においてますます広く重視されている。強化学習(Reinforcement Learning)は再奨励学習、評価学習とも呼ばれ、重要な機械学習方法であり、知能制御ロボットおよびネットワーク分析予測などの分野において多く応用されている。コネクショニズム機械学習流派において、学習アルゴリズムは、教師なし学習(unsupervised learning)、教師あり学習(supervised leaning)と強化学習という3種類に分けられている。
強化学習は、エージェント(Agent)が「試行錯誤」で学習を行い、環境と対話することで獲得した賞与指導行為であり、エージェントに最大の賞与を獲得させることをターゲットとし、強化学習はコネクショニズム学習における教師あり学習と異なり、その違いは強化信号に主に現われ、強化学習において、環境によって提供された強化信号は、如何に正しい行動を生じさせるかを強化学習システム(Reinforcement Learning System,RLS)に知らせるのではなく、生じた行動の良し悪しを評価するものである(通常、スカラー信号)。外部環境が提供する情報は少ないため、RLSは、自身の経験に依存して学習を行わなくてはならず、このような方式を通じて、行動-評価の環境で知識を獲得し、環境に適応するように行動方式を改善する。
近年、強化学習技術の応用と普及に伴い、この技術の強みをOTN(Optical Transport Network、光伝達網)ネットワークインテリジェント化管理・制御と運営・メンテナンス分野に如何に応用するか、特に、強化学習のOTNネットワークリソース最適化での応用は、OTN分野専門家によって広く注目されている。
一態様では、本開示実施例は、カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新することであって、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であることと、数量の予め設けられたエピソードを反復して、最適な量子化インデックス重みベクトルを得ることと、前記最適な量子化インデックス重みベクトルに基づいて前記行動方策を更新することと、を含む、OTNネットワークリソース最適化方法を提供する。
さらに別の態様では、本開示実施例は、第一処理モジュール、第二処理モジュールと更新モジュールを含み、前記第一処理モジュールは、カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新し、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であるように構成され、前記第二処理モジュールは、数量の予め設けられたエピソードを反復して、最適な前記量子化インデックス重みベクトルを得るように構成され、前記更新モジュールは、最適な前記量子化インデックス重みベクトルに基づいて前記行動方策を更新するように構成されたOTNネットワークリソース最適化装置をさらに提供する。
さらに別の態様では、本開示の実施例は、一つまたは複数のプロセッサと、一つまたは複数のプログラムが記憶された記憶装置とを、含み、前記一つまたは複数のプログラムが前記一つまたは複数のプロセッサによって実行されると、前記一つまたは複数のプロセッサが前出したようなOTNネットワークリソース最適化方法を実現するようにするコンピュータデバイスをさらに提供する。
さらに別の態様では、本開示の実施例はコンピュータプログラムが記憶されたコンピュータ可読記憶媒体であって、前記プログラムがプロセッサによって実行されると、前述したようなOTNネットワークリソース最適化方法を実現するコンピュータ可読記憶媒体をさらに提供する。
図1は本開示実施例によって提供されるSDONアーキテクチャにおけるOTNネットワークリソース最適化の模式図である。 図2は本開示実施例によって提供されるOTNネットワークリソース最適化のフロー模式図である。 図3は本開示実施例によって提供される、カレントサービス作成状態での作成予定サービスを決定するフロー模式図である。 図4は本開示実施例によって提供される、総合最適化パラメータを計算するフロー模式図である。 図5は本開示実施例によって提供されるOTNネットワークリソース最適化装置の構成模式図である。
以下、実施形態について図面を参照してより充分に説明するが、前記実施例は、本開示に記述の実施例に限定されると解釈するべきではなく、異なる形態で体現することができる。むしろ、これら実施例を提供するのは、本開示を徹底して完全なものにするとともに、当業者に本開示の範囲を十分に理解させることを目的とする。
本開示で使用される用語「および/または」には、1つ以上の関連する列挙項目の任意またはすべての組み合わせが含まれる。
本開示にて使用される用語は特定の実施例について説明するためのものにすぎず、かつ、本開示を制限するものではない。本開示にて使用される、「一つの」と「当該」という単数形は、文脈が別途明らかに説明しない限り、複数形を含む意図がある。本明細書にて「含む」、「…からなる」が使用されるときに、特定の特徴、実体、ステップ、オペレーション、要素、および/またはコンポーネントの存在を指定するが、1つまたは複数の他の特徴、実体、ステップ、オペレーション、要素、コンポーネント、および/またはそれらのグループ、の存在または追加を除外するものでないことが、さらに理解されるであろう。
本明細書に記載の実施例は、本開示の理想的な模式図を借りて平面図および/または断面図を参照して説明することができる。したがって、例示は、製造技術および/または許容範囲に応じて修正され得る。本開示の実施例は図示した実施例に限定されず、製造プロセスに基づいて形成された配置の修正を含む。よって、図示したエリアは概略的な属性を有し、かつ、図示したエリアの形状は素子のエリアの具体的な形状を例示するが、限定的であることを意図していない。
別段の限定がない限り、本開示にて使用されるすべての用語(技術と科学用語を含む)の意味は当業者が通常理解している意味と同一である。また、常用辞典にて限定されるそれら用語は、関連技術案および本開示の背景での意味と一致する意味を有し、本開示にて明確に定義しない限り、理想化された意味に、または過度に形式的な意味に解釈されないであろうことが、さらに理解されるであろう。
SDON(Software Defined Optical Network、ソフトウェア定義オプティカルネットワークネットワーク)アーキテクチャに基づいたOTNネットワークリソース最適化(Global Co-current Optimization,GCO)ソリューションは図1に示すとおりであり、GCOは、OTNネットワークリソース割当プロセスにおいて、OTNネットワークサービス開通に関して規格またはバッチ作成を行う場合、各サービスルーティング計算とリソース割当妨害を回避する前提で、各サービスの計算によるルーティングとリソース占用総和は、ユーザ(ネットワークサービスオペレータ)のネットワークサービス全体に対する既定のリソース割当最適化目標を最大限満たすことを主な目的とする。OTNネットワークリソース最適化技術を通じて、ユーザの運営・メンテナンスコストCAPEX(資本支出)/OPEX(運営コスト)を最大限削減し、運営・メンテナンス収益を向上させ、伝送性能と品質を最適化することができ、これはユーザネットワーク運営の経済効率に直接関連し、このため、該技術はユーザによって高く重視され、OTNネットワークリソース最適化技術を如何に実現するかは重要である。
OTNネットワークサービス配置において、通常、運営の必要に応じて、各サービスにそれぞれ対応するOTNネットワークリソース(例えば、帯域幅、スペクトル、波長、変調フォーマット、ルーティングなど)を割り当てる必要があり、また、指定の最適化方策でのサービス全体のリソース最適化を満たすよう求められ、最適化方策は、サービス全体の時間遅延を最短にし、ルーティングコストを最小にすることなどを含む。これと同時に、運営収益最大化、サービス性能最適化、投入CAPEX/OPEXの最小化などの角度から考慮すれば、OTNサービス運営はさらに、既定の最適化方策を巡って、OTNネットワークサービスのネットワークリソース使用での全体最適化を満たす必要があり、これは、OTNネットワークサービス時間遅延を最小にすること、OTNネットワークルーティングコストを最小にすること、或いはOTNネットワークサービス帯域幅利用率を最高にすることなどを含む。これには、作成プロセスにおいて、OTNネットワークサービスが、それ自体のサービスリソース最適化を満たす必要があると同時に、すべてのサービスの作成手順を編成することでOTNネットワークリソースをサービスが使用するグローバル最適化を満たす必要もある。
OTNネットワークサービス作成プロセスは通常、ある時点で複数のサービスを集中してバッチ作成するという並行性作成の方式を採用し、サービス作成プロセスは実際にすべてのサービスの作成手順を決定するものであり、OTNネットワークサービスの作成手順は、OTNネットワークリソースに対する占用形態とOTNネットワークリソース割当の最適化状態を決定する。OTNネットワークサービスを作成する手順を、サービス作成編成方策(即ち、行動方策)と呼び、優れたサービス作成編成方策は、OTNネットワークサービスがネットワークリソースを使用する最適化方策を満たすことができる。
しかし、実際のOTNネットワークリソースの割当と使用においては、ネットワークリソース最適化が多次元で考えられており、ある次元のネットワークリソース量子化インデックスの最適化のみを考慮するだけでは、他の量子化インデックスの使用と最適化に影響を及ぼすだろう。よって、ユーザはネットワークリソースの複数の量子化インデックスを総合的に最適化し、複数の量子化インデックスの最適な組み合わせモードを得る必要がある。このプロセスにおいて、単体の量子化インデックスに対しできるだけグローバル最適化を実現するよう保証するとともに、OTNネットワークリソースすべての量子化インデックスの総合グローバル最適化を実現し、こうしてこそOTNネットワークリソースに対する利用の最大化を保証し、また、収益の最大化、伝送性能の最適化を保証できる。
Figure 0007428831000001
初期化フェーズでは、OTNネットワークトポロジー(mesh、星型などの構造類型を含む)の環境条件に基づいてn本のOTNサービスを作成し、ネットワーク環境状態、行動空間、行動最適化目標方策、行動方策を初期化する。強化学習アルゴリズムの関連パラメータは以下に定義される。
1.OTNネットワーク総合インデックス最適化目的関数を定義する。
Figure 0007428831000002
Figure 0007428831000003
Figure 0007428831000004
Figure 0007428831000005
Figure 0007428831000006
Figure 0007428831000007
Figure 0007428831000008
Figure 0007428831000009
3.エピソード(Episode)を定義する。
ある行動方策を採用して、OTNネットワークサービスに対する順次作成を完了させることは、一つのEpisodeとして定義される。
Figure 0007428831000010
行動は、現在のネットワークトポロジー環境状態で、作成予定サービスにおいて、一つの作成予定サービスを次の作成対象となるサービスとして選択し、当該作成予定サービスの複数本の代替経路選択(ネットワークリソースがすでに割り当てられたルーティング)から1つを当該サービスのリソースルーティングとして選択し、当該サービスの作成を完了するプロセスを指す。作成予定サービスの複数本のリソースの代替経路選択は、KSP(An Efficient Algorithm for K Shortest Simple Paths)+RWA(routing and wave length assignment algorithm、ルーティング波長割当アルゴリズム)+RSA(Asymmetric encryption algorithm、非対称暗号化アルゴリズム)で計算され得、また割り当てられた、対応するネットワークリソースによって得られ、かつ単独の代替経路選択は各量子化インデックスの閾値要求を満たす。
Figure 0007428831000011
5.量子化インデックスを定義する。
Figure 0007428831000012
Figure 0007428831000013
6.量子化インデックス評価体系を定義する
Figure 0007428831000014
Figure 0007428831000015
OTNネットワーク総合量子化インデックス閾値は以下のように定義する。
Figure 0007428831000016
各サービスの代替経路選択の量子化インデックス採点は量子化インデックスの種別に従って3種類の状況に分けられる。
Figure 0007428831000017
Figure 0007428831000018
Figure 0007428831000019
Figure 0007428831000020
Figure 0007428831000021
Figure 0007428831000022
Figure 0007428831000023
Figure 0007428831000024
Figure 0007428831000025
Figure 0007428831000026
Figure 0007428831000027
OTNネットワーク総合量子化インデックス閾値は以下のように定義する。
Figure 0007428831000028
Figure 0007428831000029
Figure 0007428831000030
各サービスのリソースの代替経路選択のインデックス評価は以下のように3種類に分け得る。
Figure 0007428831000031
Figure 0007428831000032
Figure 0007428831000033
Figure 0007428831000034
Figure 0007428831000035
Figure 0007428831000036
Figure 0007428831000037
Figure 0007428831000038
Figure 0007428831000039
Figure 0007428831000040
Figure 0007428831000041
Figure 0007428831000042
Figure 0007428831000043
Figure 0007428831000044
各サービスの代替経路選択の量子化インデックス採点は量子化インデックスの種別に従って3種類の状況に分け得る。
Figure 0007428831000045
Figure 0007428831000046
Figure 0007428831000047
Figure 0007428831000048
Figure 0007428831000049
Figure 0007428831000050
Figure 0007428831000051
Figure 0007428831000052
Figure 0007428831000053
Figure 0007428831000054
Figure 0007428831000055
Figure 0007428831000056
OTNネットワーク総合量子化インデックス閾値は以下のように定義する。
Figure 0007428831000057
各サービスの代替経路選択の量子化インデックス採点は量子化インデックスの種別に従って3種類の状況に分け得る。
Figure 0007428831000058
Figure 0007428831000059
Figure 0007428831000060
Figure 0007428831000061
Figure 0007428831000062
Figure 0007428831000063
Figure 0007428831000064
Figure 0007428831000065
Figure 0007428831000066
Figure 0007428831000067
Figure 0007428831000068
本開示実施例は、図2に示すように、以下のステップS11~S13を含むOTNネットワークリソース最適化方法を提供する。
ステップS11:カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、また、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、また、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新する。
前述したように、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数である。
本ステップにおいて、一つのエピソードでは、一つの作成予定サービス(当該作成予定サービスのルーティングの決定を含む)を行動方策に基づいて決定し、当該作成予定サービス作成後に、当該サービス作成状態での即時報酬を計算し、カレントサービス作成状態が終了し、次のサービス作成状態に移る。上記ステップに従って、一つのエピソード中におけるそれぞれのサービス作成状態に対し、作成予定サービスをそれぞれ作成し、相応のサービス作成状態での即時報酬を一つのエピソードが終了するまで計算し、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算・更新する。
本ステップにおいて、異なるアルゴリズムで総合最適化パラメータを計算・更新してよく、なお、用いたアルゴリズムが異なると、総合最適化パラメータも異なり、後で各種のアルゴリズムについて詳細に解説する。
ステップS12:数量の予め設けられたエピソードを反復して、最適な前記量子化インデックス重みベクトルを得る。
本ステップにおいて、ステップS11の実行を繰り返し、数量の予め設けられたエピソードを反復し、各エピソードにおける各サービス作成状態での総合最適化パラメータを計算・更新する。本ステップによって、OTNネットワークのすべての作成予定サービスに対応するすべてのサービス作成状態での最適な総合最適化パラメータを得ることができる。
ステップS13:各サービス作成状態での最適な総合最適化パラメータに基づいて前記行動方策を更新する。
Figure 0007428831000069
本開示実施例によって提供されるOTNネットワークリソース最適化方法は、カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、また、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、また、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新し、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であり、数量の予め設けられたエピソードを反復して、最適な前記量子化インデックス重みベクトルを得、前記最適な量子化インデックス重みベクトルに基づいて前記行動方策を更新することを含む。本開示実施例では、強化学習アルゴリズムの賞罰メカニズムを用いてOTNネットワークサービス作成のソートを最適化し、得られた行動方策は収束性が良く、厳密性と信頼性が高く、OTNネットワークリソース最適化問題をOTNネットワークサービス作成のソート問題に総括し、かつ、強化学習の行動方策設計にパラメータベクトルを導入し、正しい改善によって最適化した行動方策を獲得し、OTNネットワークリソースに対するグローバル最適化を実現させる。
Figure 0007428831000070
Figure 0007428831000071
Figure 0007428831000072
Figure 0007428831000073
Figure 0007428831000074
Figure 0007428831000075
Figure 0007428831000076
幾つかの実施形態では、図3に示すように、前記カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定することは、以下のステップS21~S25を含む。
ステップS21:各作成予定サービスをカレントサービス作成状態で選択する確率を計算する。
本ステップにおいて、選択した量子化インデックス評価体系に応じて、相応するアルゴリズムを決定し、各作成予定サービスが選択される確率を計算し、異なる量子化インデックス評価体系での、各作成予定サービスを選択する確率は前述したとおりであり、ここでは省略する。
ステップS22:各作成予定サービスを前記カレントサービス作成状態で選択する確率に基づいて一つの作成予定サービスを決定する。
なお、強化学習のexploration(探索)の考え方に基づき、作成予定サービスの選択にあたっては、方策のランダム性に従う。
ステップS23:予め設けられたOTNネットワーク総合インデックス最適化目的関数に基づいて、決定された作成予定サービスの代替経路選択をソートする。
Figure 0007428831000077
ステップS24:前記ソートにおける各代替経路選択の選択確率を計算する。
ステップS25:前記ソートにおける各代替経路選択の選択確率に基づいて一つの代替経路選択を決定し、カレントサービス作成状態での作成予定サービスのルーティングとする。
Figure 0007428831000078
Figure 0007428831000079
幾つかの実施形態では、図4に示すように、前記各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算・更新することは、以下のステップS31とS32を含む。
ステップS31:次のサービス作成状態の後の各サービス作成状態での即時報酬に基づいてカレントサービス作成状態での期待収益を計算する。
Figure 0007428831000080
なお、最後のサービス作成状態下の期待収益とは当該サービス作成状態での即時報酬である。
ステップS32:前記カレントサービス作成状態での期待収益に基づいてカレントサービス作成状態での総合最適化パラメータを計算・更新する。
ステップS31とS32によって、補強アルゴリズムの賞罰メカニズムで総合最適化パラメータの最適化を実現させる。
以下、それぞれQ-Based Actor-CriticアルゴリズムとPGアルゴリズムでOTNネットワークリソース最適化を実現するプロセスについて説明する。
(1)Q-Based Actor-CriticアルゴリズムでOTNネットワークリソース最適化を実現させる処理プロセスは以下の通りである。
Figure 0007428831000081
Figure 0007428831000082
Figure 0007428831000083
Figure 0007428831000084
(2)PGアルゴリズムでOTNネットワークリソース最適化を実現させる処理プロセスは以下の通りである。
Figure 0007428831000085
同じ技術思想に基づき、本開示実施例はOTNネットワークリソース最適化装置をさらに提供し、図5に示すように、前記OTNネットワークリソース最適化装置は、第一処理モジュール101、第二処理モジュール102と更新モジュール103を備える。
前記第一処理モジュール101は、カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、また、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、また、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新し、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であるように配置されている。
前記第二処理モジュール102は数量の予め設けられたエピソードを反復して、最適な前記量子化インデックス重みベクトルを得るように配置されている。
前記更新モジュール103は、前記最適な量子化インデックス重みベクトルに基づいて前記行動方策を更新するように配置されている。
幾つかの実施形態では、前記第一処理モジュール101はさらに、複数の量子化インデックスとインデックス重みベクトルとに基づいて総合量子化インデックス採点を計算し、前記総合量子化インデックス採点に基づいて欲張り係数を計算し、作成予定サービスの選択確率と前記欲張り係数とに基づいて前記行動方策を決定するように配置されている。
幾つかの実施形態では、前記量子化インデックスは、第1種の量子化インデックス、第2種の量子化インデックスと第3種の量子化インデックスを含み、前記第1種の量子化インデックスの取り得る値は第1種の量子化インデックス採点に反比例し、前記第2種の量子化インデックスの取り得る値は第2種の量子化インデックス採点に反比例し、前記第3種の量子化インデックス採点は、一つのエピソードの最後のサービスが作成された後に得られる。
Figure 0007428831000086
幾つかの実施形態では、第一処理モジュール101は更に、以下の式に従って、欲張り係数を計算するように配置されている。
Figure 0007428831000087
Figure 0007428831000088
Figure 0007428831000089
Figure 0007428831000090
Figure 0007428831000091
Figure 0007428831000092
Figure 0007428831000093
Figure 0007428831000094
Figure 0007428831000095
Figure 0007428831000096
Figure 0007428831000097
Figure 0007428831000098
Figure 0007428831000099
幾つかの実施形態では、第一処理モジュール101は、各作成予定サービスをカレントサービス作成状態で選択する確率を計算し、各作成予定サービスを前記カレントサービス作成状態で選択する確率に基づいて一つの作成予定サービスを決定し、予め設けられたOTNネットワーク総合インデックス最適化目的関数に基づいて、決定された作成予定サービスの代替経路選択をソートし、前記ソートにおける各代替経路選択の選択確率を計算し、前記ソートにおける各代替経路選択の選択確率に基づいて一つの代替経路選択を決定し、カレントサービス作成状態での作成予定サービスのルーティングとするように配置されている。
Figure 0007428831000100
幾つかの実施形態では、第一処理モジュール101は、以下のように配置されている。
Figure 0007428831000101
幾つかの実施形態では、第一処理モジュール101は次のサービス作成状態の後の各サービス作成状態での即時報酬に基づいてカレントサービス作成状態での期待収益を計算し、前記カレントサービス作成状態での期待収益に基づいてカレントサービス作成状態での総合最適化パラメータを計算・更新するように配置されている。
幾つかの実施形態では、第一処理モジュール10は以下のように配置されている。
Figure 0007428831000102
本開示実施例は、一つまたは複数のプロセッサと、一つまたは複数のプログラムが記憶された記憶装置とを含み、上記一つまたは複数のプログラムが上記一つまたは複数のプロセッサによって実行されると、上記一つまたは複数のプロセッサに、前記各実施例によって提供されたOTNネットワークリソース最適化方法を実現させるコンピュータデバイスを更に提供する。
本開示実施例は、コンピュータプログラムが記憶され、当該コンピュータプログラムがプロセッサによって実行されると、前記各実施例によって提供されたOTNネットワークリソース最適化方法を実現するコンピュータ可読記憶媒体をさらに提供する。
当業者は、上文で公開されている方法におけるすべてまたはあるステップ、装置の機能モジュール/ユニットが、ソフトウェア、ファームウェア、ハードウェア、およびそれらの適切な組み合わせとして実施されうることを理解するであろう。ハードウェア実施形態において、上記の説明で言及された機能モジュール/ユニット間の区分は、必ずしも物理的構成要素の区分に対応せず、例えば、1つの物理的構成要素は、複数の機能を有してもよく、または1つの機能またはステップは、幾つかの物理的構成要素によって協働して実行されてもよい。いくつかの物理的構成要素またはすべての物理的構成要素は、中央処理装置、デジタル信号プロセッサ、またはマイクロプロセッサなどのプロセッサによって実行されるソフトウェアとして、またはハードウェアとして、または特定用途向け集積回路などの集積回路として実施され得る。このようなソフトウェアは、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含み得るコンピュータ可読媒体上に配置され得る。当業者によく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報を記憶するための任意の方法または技術で実施される揮発性および不揮発性、取り外し可能および取り外し不可能な媒体を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリ若しくは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)若しくは他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ若しくは他の磁気ストレージデバイス、または所望の情報を記憶するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体を含むが、これらに限定されない。さらに、通信媒体は、一般に、コンピュータ可読命令、データ構造、プログラムモジュール、または搬送波もしくは他の搬送機構などの変調データ信号における他のデータを含み、任意の情報配信媒体を含み得ることが当業者に知られている。
本明細書において実施形態の例が公開されており、また、特定の用語が用いられているが、それらは一般的な説明的な意味としてのみ使用され、解釈されるべきであり、限定を目的としたものではない。いくつかの実例では、特定の実施例と組み合わせて説明される特徴、特性、および/または要素は、別途明確に指摘しない限り、単独で、または他の実施例にて説明される特徴、特性、および/または要素と組み合わせて使用され得ることが当業者に明らかであろう。したがって、添付の請求項によって明らかにされている本開示の範囲から逸脱しない限り、様々な形態および詳細における変更が行われ得ることを当業者は理解するであろう。

Claims (19)

  1. カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新することであって、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であることと、
    数量の予め設けられたエピソードを反復して、最適な量子化インデックス重みベクトルを得ることと、
    前記最適な量子化インデックス重みベクトルに基づいて前記行動方策を更新することと、
    を含む、OTNネットワークリソース最適化方法。
  2. カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定する前に、複数の量子化インデックスとインデックス重みベクトルとに基づいて総合量子化インデックス採点を計算することと、
    前記総合量子化インデックス採点に基づいて欲張り係数を計算することと、
    作成予定サービスの選択確率と前記欲張り係数とに基づいて前記行動方策を決定することと、
    をさらに含む、請求項1に記載の方法。
  3. Figure 0007428831000103
  4. Figure 0007428831000104
  5. Figure 0007428831000105
  6. Figure 0007428831000106
    Figure 0007428831000107
  7. Figure 0007428831000108
    Figure 0007428831000109
  8. Figure 0007428831000110
    Figure 0007428831000111
  9. Figure 0007428831000112
  10. Figure 0007428831000113
  11. Figure 0007428831000114
  12. カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定することは、
    各作成予定サービスをカレントサービス作成状態で選択する確率を計算することと、
    各作成予定サービスを前記カレントサービス作成状態で選択する確率に基づいて一つの作成予定サービスを決定することと、
    予め設けられたOTNネットワーク総合インデックス最適化目的関数に基づいて、決定された作成予定サービスの代替経路選択をソートすることと、
    前記ソートにおける各代替経路選択の選択確率を計算することと、
    前記ソートにおける各代替経路選択の選択確率に基づいて一つの代替経路選択を決定し、カレントサービス作成状態での作成予定サービスのルーティングとすることと、
    を含む、請求項3~11のいずれか一項に記載の方法。
  13. Figure 0007428831000115
  14. Figure 0007428831000116
  15. 各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算・更新することは、
    次のサービス作成状態の後の各サービス作成状態での即時報酬に基づいてカレントサービス作成状態での期待収益を計算することと、
    前記カレントサービス作成状態での期待収益に基づいてカレントサービス作成状態での総合最適化パラメータを計算・更新することと、を含む、請求項3~11のいずれか一項に記載の方法。
  16. Figure 0007428831000117
  17. 第一処理モジュール、第二処理モジュールと更新モジュールを含み、
    前記第一処理モジュールは、カレントサービス作成状態での作成予定サービスを行動方策に基づいて決定し、前記作成予定サービスを作成し、カレントサービス作成状態での即時報酬を計算し、一つのエピソードが終了するまで次のサービス作成状態に入り、各々のサービス作成状態での即時報酬に基づいて各々のサービス作成状態での総合最適化パラメータを計算し、前記各々のサービス作成状態での総合最適化パラメータに基づいて量子化インデックス重みベクトルを計算・更新し、前記行動方策は、複数の量子化インデックスに対応する量子化インデックス重みベクトルに関する確率関数であるように構成され、
    前記第二処理モジュールは、数量の予め設けられたエピソードを反復して、最適な前記量子化インデックス重みベクトルを得るように構成され、
    前記更新モジュールは、最適な前記量子化インデックス重みベクトルに基づいて前記行動方策を更新するように構成されたOTNネットワークリソース最適化装置。
  18. 一つまたは複数のプロセッサと、
    一つまたは複数のプログラムが記憶された記憶装置とを、含み、
    前記一つまたは複数のプログラムが前記一つまたは複数のプロセッサによって実行されると、前記一つまたは複数のプロセッサが請求項1~16のいずれか一項に記載のOTNネットワークリソース最適化方法を実現するようにするコンピュータデバイス。
  19. コンピュータプログラムが記憶されたコンピュータ可読記憶媒体であって、前記プログラムがプロセッサによって実行されると、請求項1~16のいずれか一項に記載のOTNネットワークリソース最適化方法を実現するコンピュータ可読記憶媒体。
JP2022572468A 2020-08-31 2021-08-09 Otnネットワークリソース最適化方法および装置、コンピュータデバイスならびに記憶媒体 Active JP7428831B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010899110.1 2020-08-31
CN202010899110.1A CN114125593A (zh) 2020-08-31 2020-08-31 Otn网络资源优化方法、装置、计算机设备和介质
PCT/CN2021/111489 WO2022042276A1 (zh) 2020-08-31 2021-08-09 Otn网络资源优化方法及装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
JP2023527007A JP2023527007A (ja) 2023-06-26
JP7428831B2 true JP7428831B2 (ja) 2024-02-06

Family

ID=80354528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022572468A Active JP7428831B2 (ja) 2020-08-31 2021-08-09 Otnネットワークリソース最適化方法および装置、コンピュータデバイスならびに記憶媒体

Country Status (5)

Country Link
US (1) US20230319446A1 (ja)
EP (1) EP4195687A4 (ja)
JP (1) JP7428831B2 (ja)
CN (1) CN114125593A (ja)
WO (1) WO2022042276A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020127182A (ja) 2019-02-06 2020-08-20 日本電信電話株式会社 制御装置、制御方法及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100499534C (zh) * 2003-04-24 2009-06-10 华为技术有限公司 一种实现光同步数字传送网多业务优化的方法
US11126929B2 (en) * 2017-11-09 2021-09-21 Ciena Corporation Reinforcement learning for autonomous telecommunications networks
CN109768940B (zh) * 2018-12-12 2020-12-29 北京邮电大学 多业务sdn网络的流量分配方法及装置
CN111106999A (zh) * 2019-12-27 2020-05-05 国网江苏省电力公司信息通信分公司 一种ip-光网络通信业务联合分配方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020127182A (ja) 2019-02-06 2020-08-20 日本電信電話株式会社 制御装置、制御方法及びプログラム
US20220124003A1 (en) 2019-02-06 2022-04-21 Nippon Telegraph And Telephone Corporation Control apparatus, control method and non-transitory computer-readable medium

Also Published As

Publication number Publication date
WO2022042276A1 (zh) 2022-03-03
CN114125593A (zh) 2022-03-01
EP4195687A4 (en) 2024-08-07
US20230319446A1 (en) 2023-10-05
JP2023527007A (ja) 2023-06-26
EP4195687A1 (en) 2023-06-14

Similar Documents

Publication Publication Date Title
US11153229B2 (en) Autonomic resource partitions for adaptive networks
Chen et al. DeepRMSA: A deep reinforcement learning framework for routing, modulation and spectrum assignment in elastic optical networks
Quang et al. Multi-domain non-cooperative VNF-FG embedding: A deep reinforcement learning approach
Wang et al. A reinforcement learning approach for online service tree placement in edge computing
JP7436747B2 (ja) Otnネットワークリソース最適化方法および装置、コンピュータデバイスと記憶媒体
Santos et al. Resource provisioning in fog computing through deep reinforcement learning
Guan et al. Slice reconfiguration based on demand prediction with dueling deep reinforcement learning
CN111800352B (zh) 基于负载均衡的服务功能链部署方法和存储介质
Cai et al. SARM: service function chain active reconfiguration mechanism based on load and demand prediction
Zhou et al. Multi-task deep learning based dynamic service function chains routing in SDN/NFV-enabled networks
Di Cicco et al. DRL-FORCH: A Scalable Deep Reinforcement Learning-based Fog Computing Orchestrator
US11552858B2 (en) Reinforcement learning for optical network re-grooming
JP7428831B2 (ja) Otnネットワークリソース最適化方法および装置、コンピュータデバイスならびに記憶媒体
CN117749697A (zh) 云网融合预调度方法、装置、系统及存储介质
US10505840B2 (en) Methods and systems for failure recovery in a virtual network environment
CN117354227A (zh) 基于强化学习智能体探索优化的跨层路由方法及相关设备
CN110233763B (zh) 一种基于时序差分学习的虚拟网络嵌入算法
WO2022105642A1 (zh) 单业务资源配置方法和装置、计算机设备和介质
CN115633083A (zh) 一种电力通信网业务编排方法、装置及存储介质
CN116389266A (zh) 一种基于强化学习的数字孪生网络切片的方法和装置
Hara et al. Deep reinforcement learning with graph neural networks for capacitated shortest path tour based service chaining
Qu et al. A game theory based approach for distributed dynamic spectrum access
Mohammadi et al. Automatic delay-sensitive applications quality of service improvement with deep flows discrimination in software defined networks
CN113608830A (zh) 基于故障预测的vnf迁移方法及装置
CN115484520B (zh) 弹性光网络的频谱分配网络获取方法和频谱分配方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240125

R150 Certificate of patent or registration of utility model

Ref document number: 7428831

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150