TWI769911B - 基於自適性學習之聯合波束選擇和功率控制的系統和方法 - Google Patents

基於自適性學習之聯合波束選擇和功率控制的系統和方法 Download PDF

Info

Publication number
TWI769911B
TWI769911B TW110129844A TW110129844A TWI769911B TW I769911 B TWI769911 B TW I769911B TW 110129844 A TW110129844 A TW 110129844A TW 110129844 A TW110129844 A TW 110129844A TW I769911 B TWI769911 B TW I769911B
Authority
TW
Taiwan
Prior art keywords
input data
neural network
power
base stations
probability
Prior art date
Application number
TW110129844A
Other languages
English (en)
Other versions
TW202308339A (zh
Inventor
陳昱安
Original Assignee
中華電信股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中華電信股份有限公司 filed Critical 中華電信股份有限公司
Priority to TW110129844A priority Critical patent/TWI769911B/zh
Application granted granted Critical
Publication of TWI769911B publication Critical patent/TWI769911B/zh
Publication of TW202308339A publication Critical patent/TW202308339A/zh

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Feedback Control In General (AREA)

Abstract

提出一種基於自適性學習之聯合波束選擇和功率控制的系統和方法。方法包含:取得對應於多個基地台的第一輸入資料,並且將第一輸入資料輸入至第一神經網路以產生第一功率以及多個波束的第一機率向量;根據第一功率以及第一機率向量產生第二輸入資料以及第一用戶反饋,並且將第二輸入資料輸入至第二神經網路以產生第二功率以及多個波束的第二機率向量;根據第一用戶反饋、第二功率以及第二機率向量產生第三輸入資料;根據第三輸入資料、第三神經網路以及第四神經網路產生聯合波束組態;以及輸出聯合波束組態。

Description

基於自適性學習之聯合波束選擇和功率控制的系統和方法
本發明是有關於一種無線網路技術,且特別是有關於一種基於自適性學習之聯合波束選擇和功率控制的系統和方法。
由於用戶對行動網路數據量需求日益漸增,行動通訊網路已朝向Heterogeneous Network(HetNet)網路發展,多層次及高密度佈建方式為各營運商發展趨勢,以提高每單位面積的頻譜效率。但於基地台密集佈建環境下,基地台間干擾問題為營運商所需面對的重要議題之一,當基地台間干擾降低,系統的傳輸品質及頻譜效益會提升,進而提升整體用戶的傳輸感受。
在高密度基地台佈建環境下,小型化基地台(Small Cell)為營運商選擇方案之一,其具有小功率、即插即用以及佈建方便等優點,但營運商對小型化基地台的管控較不易。此外,因小型化基地台功能較簡單,雖有即插即用功能,但也易對周圍其它基地台造成干擾。
因此,如何配置多個小型化基地台的波束以及功率以提升通訊網路系統效能,是本領域人員的重要課題之一。
本發明提供一種基於自適性學習之聯合波束選擇和功率控制的系統和方法,可為多個基地台訓練出聯合最佳波束和最佳功率的模型。
本發明的一種無線通訊網路的基於自適性學習之聯合波束選擇和功率控制的系統,適用於多個基地台,其中多個基地台的每一者對應於多個波束,其中系統包含處理器、儲存媒體以及收發器。儲存媒體儲存第一神經網路、第二神經網路、第三神經網路以及第四神經網路。處理器耦接儲存媒體以及收發器,其中處理器經配置以執行:通過收發器取得對應於多個基地台的第一輸入資料,並且將第一輸入資料輸入至第一神經網路以產生第一功率以及多個波束的第一機率向量;根據第一功率以及第一機率向量產生第二輸入資料以及第一用戶反饋,並且將第二輸入資料輸入至第二神經網路以產生第二功率以及多個波束的第二機率向量;根據第一用戶反饋、第二功率以及第二機率向量產生第三輸入資料;根據第三輸入資料、第三神經網路以及第四神經網路產生聯合波束組態;以及通過收發器輸出聯合波束組態。
在本發明的一實施例中,上述的處理器更經配置以執行:將第三輸入資料輸入至第三神經網路以產生第三功率以及多個波束的第三機率向量;根據第三功率以及第三機率向量產生第四輸入資料以及第二用戶反饋,並且將第四輸入資料輸入至第四神經網路以產生第四功率以及多個波束的第四機率向量;根據第四輸入資料、第四功率以及第四機率向量更新第三神經網路的超參數以產生更新的第三神經網路;以及根據更新的第三神經網路產生聯合波束組態。
在本發明的一實施例中,上述的處理器更經配置以執行:根據第一機率向量從多個波束中選出最佳波束;以及根據對應於最佳波束的機率以及第一功率產生第二輸入資料以及第一用戶反饋。
在本發明的一實施例中,上述的處理器更經配置以執行:根據第二輸入資料產生新的多筆第一輸入資料;根據分別對應於多筆第一輸入資料的多筆第二輸入資料產生多個第二功率、多個第二機率向量以及多個第一用戶反饋;根據多個第二功率、多個第二機率向量以及多個第一用戶反饋以從多筆第二輸入資料中選出第二輸入資料;以及根據選擇的第二輸入資料產生第三輸入資料。
在本發明的一實施例中,上述的處理器更經配置以執行:根據多個第二功率、多個第二機率向量以及多個第一用戶反饋計算多個均方誤差;以及根據多個均方誤差以從多筆第二輸入資料中選出第二輸入資料。
在本發明的一實施例中,上述的處理器更經配置以執行:根據第二機率向量從多個波束中選出最佳波束;以及根據對應於最佳波束的機率以及第二功率產生第三輸入資料。
在本發明的一實施例中,上述的處理器更經配置以執行:根據第三機率向量從多個波束中選出最佳波束;以及根據對應於最佳波束的機率以及第三功率產生第四輸入資料以及第二用戶反饋。
在本發明的一實施例中,上述的處理器更經配置以執行:根據第四輸入資料產生新的多筆第三輸入資料;根據分別對應於多筆第三輸入資料的多筆第四輸入資料產生多個第四功率、多個第四機率向量以及多個第二用戶反饋;根據多個第四功率、多個第四機率向量以及多個第二用戶反饋計算多個均方誤差;以及根據多筆第四輸入資料以及多個均方誤差更新超參數。
在本發明的一實施例中,上述的處理器更經配置以執行:根據第四機率向量從多個波束中選出最佳波束;以及根據對應於最佳波束的機率以及第四功率計算多個均方誤差的其中之一。
在本發明的一實施例中,上述的第一輸入資料包含對應於多個基地台的下列的至少其中之一:訊號分布圖、基地台之間的干擾狀態以及用戶位置圖。
本發明的一種無線通訊網路的基於自適性學習之聯合波束選擇和功率控制的方法,適用於多個基地台,其中多個基地台的每一者對應於多個波束,其中方法包含:取得第一神經網路、第二神經網路、第三神經網路以及第四神經網路;取得對應於多個基地台的第一輸入資料,並且將第一輸入資料輸入至第一神經網路以產生第一功率以及多個波束的第一機率向量;根據第一功率以及第一機率向量產生第二輸入資料以及第一用戶反饋,並且將第二輸入資料輸入至第二神經網路以產生第二功率以及多個波束的第二機率向量;根據第一用戶反饋、第二功率以及第二機率向量產生第三輸入資料;根據第三輸入資料、第三神經網路以及第四神經網路產生聯合波束組態;以及輸出聯合波束組態。
基於上述,本發明用以解決最佳波束與發射功率的計算複雜度隨著基地台佈建數目急劇提升的問題。本發明基於自適學習演算法訓練出回授式深層類神經網路,以作為輸出聯合最佳波束與功率配置之模型。此外,本發明還提出了加重取樣機制、權重回補機制與頻率複用之正交編碼配置等方法,這些方法均能加速學習速度以及提升學習能力。本發明還藉由充分利用過往資料搭配自動權重回補計算以提高資料利用率,減少此無線通訊網路聯合最佳波束方向與功率配置搜索時間,以即時地修正模型的參數或調整模型的架構,達到線上學習目的與優點。
本發明因應無線通訊網路能調整參數眾多,故能獲得高用戶體驗的波束方向與功率配置著實不易,所以此種資料有必要以較高機率進行學習。然而,引入人為觀點勢必造成強烈偏差(bias),此偏差能於神經網路學習初期存在卻不能長久存在否則違背人工智慧演算法的假設(即:每筆資料均從相同分布中取樣)。本發明經適當數學邊際條件推導轉換可得每個樣本需要進行權重調整(和均方誤差有關係)。
本發明尚考慮神經網路調整易有震盪情形發生,所以訓練好的神經網路可被複製為兩組,第一組神經網路提供動態線上更新學習,第二組神經網路的更新則較為緩慢,其可基於固定週期與第一組神經網路進行參數同步。
本發明尚考慮無線通訊環境變化快速且用戶動態移動將造成聯合最佳波束選擇與功率控制困難,故於演算法中適度引入隨機探索機制,避免無法跳脫區域最佳解的窘境,待神經網路學習漸入佳境後即可逐步縮小隨機搜索的比率。
本發明尚考慮無線通訊環境變化快速引入的隨機性,所以最佳目標中亦引入熵(entropy)為一部份最大化標的。
本發明尚考慮為基地台頻率配置的正交矩陣編碼方式以減少輸入資料佔據記憶體空間。
本發明為透過週期性、中央集中的方式收集基地台和用戶終端之相關資訊,並考量系統的整體性,最佳化同一區域中多個基地台的網路效能。
本發明能夠支援事先以模擬軟體對場域進行訊號強度模擬並預訓練神經網路,此動作能避免神經網路訓練初期的不穩定性。
本發明於完成各最佳化功能後,會對基地台下發最佳化後的組態參數。此步驟可以為人工方式或是自動化方式進行,此外此神經網路亦能包裝於容器(docker)中以適應各操作系統。
圖1根據本發明的一實施例繪示一種無線通訊網路的基於自適性學習之聯合波束選擇和功率控制的系統100的示意圖。系統100適用於多個基地台,其中所述多個基地台的每一者對應於多個波束。系統100可包含處理器110、儲存媒體120以及收發器130。
處理器110例如是中央處理單元(central processing unit,CPU),或是其他可程式化之一般用途或特殊用途的微控制單元(micro control unit,MCU)、微處理器(microprocessor)、數位信號處理器(digital signal processor,DSP)、可程式化控制器、特殊應用積體電路(application specific integrated circuit,ASIC)、圖形處理器(graphics processing unit,GPU)、影像訊號處理器(image signal processor,ISP)、影像處理單元(image processing unit,IPU)、算數邏輯單元(arithmetic logic unit,ALU)、複雜可程式邏輯裝置(complex programmable logic device,CPLD)、現場可程式化邏輯閘陣列(field programmable gate array,FPGA)或其他類似元件或上述元件的組合。處理器110可耦接至儲存媒體120以及收發器130,並且存取和執行儲存於儲存媒體120中的多個模組和各種應用程式。
儲存媒體120例如是任何型態的固定式或可移動式的隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)、硬碟(hard disk drive,HDD)、固態硬碟(solid state drive,SSD)或類似元件或上述元件的組合,而用於儲存可由處理器110執行的多個模組或各種應用程式。在本實施例中,儲存媒體120可儲存包含神經網路A、神經網路B、神經網路C以及神經網路D。儲存媒體120中的神經網路例如是卷積神經網路或深層神經網路,本發明不限於此。當輸入資料為訊號分布圖時,以卷積神經網路作為初級的輸入資料處理工具能有效降低參數數目,並可直接取得訊號分布的空間特徵。本發明的神經網路可考慮以隨機執行波束發射或功率發射以探索無線環境可能優質的波束方向或發射功率。處理器110能將訓練好的神經網路以容器包裝並快速部署在所需環境。基於基地台輸出資料不盡相同,神經網路可自動進行輸入資料的格式裁剪或資料填補。
收發器130以無線或有線的方式傳送及接收訊號。收發器130還可以執行例如低噪聲放大、阻抗匹配、混頻、向上或向下頻率轉換、濾波、放大以及類似的操作。處理器110可週期性地通過收發器130接收例如基地台相關資料,諸如行動網路運作狀態、用戶識別資訊、用戶測量回報資訊或射頻訊號資訊。處理器110具有將不同格式的基地台相關資料轉換為統一標準的能力。行動網路運作狀態可包含基地台組態管理(configuration management,CM)資訊、性能管理(performance management,PM)資訊或關鍵效能指示(key performance indication,KPI)等資訊。用戶識別資訊可包含位置資訊、服務類型、訊務量或移動路徑等資訊。用戶測量回報資訊可包含用戶終端測量回報(measurement report,MR)資訊。射頻訊號資訊可包含掃描器的量測結果或手機的量測結果等。
處理器110能有效利用卷積神經網路特性學習空間特徵,並降低神經網路參數數目以減少訓練與推測階段所需時間。處理器110能針對基地台頻率執行具正交化編碼方式的特徵轉換。處理器110還能自動進行補點程序以補足無線通訊網路常出現資料疏漏情形。處理器110具有將儲存在儲存媒體120中的資料做視覺化或表格化的能力,可以依據技術人員需求自動化產生神經網路需要的輸入。處理器110還可對接收到的射頻訊號進行預處理和整理(例如:濾除缺失訊號或消除雜訊等)。處理器110具有轉化輸出標準化的能力,可就不同類型的基地台給予相應格式的自動轉換參數型式。
在以下的實施例中,假設N個基地台設置在一場域中,並且每一個基地台可具有分別對應於不同方向的M個波束,其中N和M為正整數。系統100可用於輸出N個基地台的聯合波束組態,以最佳化場域中的無線通訊網路。
處理器110可通過收發器130取得對應於N個基地台的輸入資料
Figure 02_image001
。舉例來說,處理器110可通過模擬軟體隨機地產生輸入資料
Figure 02_image001
。傳統神經網路訓練以隨機權重為初始值。本發明可考慮軟體模擬結果或其他頻率設置訓練結果作為神經網路訓練的初始值,藉以提升後續訓練流程的穩定度。
實施例所述輸入資料可包含對應於多個基地台的訊號分布圖、基地台之間干擾狀態或用戶位置圖。以圖2為例,圖2根據本發明的一實施例繪示輸入資料200的示意圖。假設場域中設置有基地台210、基地台220以及基地台230。輸入資料200可包含對應於基地台210的二維資料、對應於基地台220的二維資料、對應於基地台230的二維資料以及對應於場域的用戶位置圖250。這些資料可依序堆疊為三維的輸入資料200。
以對應於基地台210的二維資料為例,所述二維資料可包含訊號分布圖211、基地台之間的干擾狀態212以及基地台之間的干擾狀態213。訊號分布圖用以表示場域中各個區域的訊號強度。訊號強度例如是參考訊號接收功率(reference signal receiving power,RSRP)。一般來說,訊號強度越強的地方,網路服務的品質越佳。基地台之間的干擾狀態212以及基地台之間的干擾狀態213分別表示不同的基地台對基地台210的干擾狀態。舉例來說,基地台之間的干擾狀態212可表示基地台210與基地台210之間的干擾狀態。由於兩基地台為相同的基地台,故基地台之間的干擾狀態212表示基地台210受到嚴重的干擾。舉另一例來說,基地台之間的干擾狀態212可表示基地台210與基地台220之間的干擾狀態。由於基地台220與基地台210的距離十分遙遠,故基地台之間的干擾狀態213表示基地台210並未受到嚴重的干擾。
用戶位置圖250可代表用戶設備(user equipment,UE)在場域中的位置分布。用戶設備在場域中的移動範圍可以範圍251表示。
圖3根據本發明的一實施例繪示神經網路訓練的第一階段的流程圖。在步驟S101中,處理器110可將輸入資料
Figure 02_image001
輸入至神經網路A以產生對應於基地台n(n = 1~N)的組態,其中組態可包含機率向量
Figure 02_image003
以及功率
Figure 02_image005
,其中i為輸入資料的索引(即:第i筆輸入資料),n為基地台的索引(即:N個基地台中的第n個基地台),m為波束的索引(即:M個波束中的第m個波束)。機率向量
Figure 02_image003
中的元素可包含對應於波束m(m = 1~M)的機率
Figure 02_image007
,如方程式(1)所示。神經網路A可對輸入資料
Figure 02_image001
進行一連串的卷積運算或池化運算,並進行適當的正規化(例如:對功率執行適當的整流或平移)以產生機率向量
Figure 02_image003
以及功率
Figure 02_image005
。機率向量
Figure 02_image003
以及功率
Figure 02_image005
可用以產生輸入資料
Figure 02_image009
以及用戶反饋
Figure 02_image011
Figure 02_image013
…(1)
在步驟S102中,處理器110可根據機率向量
Figure 02_image003
從M個波束中選出最佳波束
Figure 02_image015
,從而取得對應於最佳波束
Figure 02_image015
的機率
Figure 02_image017
。在一實施例中,處理器110可選出與機率向量
Figure 02_image003
中的最大機率相對應的波束以作為最佳波束
Figure 02_image015
,並取得機率
Figure 02_image017
,如方程式(2)和方程式(3)所示。機率
Figure 02_image017
以及功率
Figure 02_image005
可用以產生輸入資料
Figure 02_image009
以及用戶反饋
Figure 02_image011
Figure 02_image019
…(2)
Figure 02_image021
…(3)
在步驟S103中,處理器110可根據最佳波束
Figure 02_image015
以及功率
Figure 02_image005
產生輸入資料
Figure 02_image009
以及用戶反饋
Figure 02_image011
。在一實施例中,處理器110可將最佳波束
Figure 02_image015
以及功率
Figure 02_image005
輸入至模擬軟體以模擬場域中由各個基地台發射的波束,藉以產生輸入資料
Figure 02_image009
。模擬軟體可將模擬的用戶設備設置在場域的範圍251,藉以通過用戶設備測量訊號以產生用戶反饋
Figure 02_image011
。模擬軟體可根據例如參考訊號接收功率或服務品質(quality of service,QoS)等用戶感受指標來產生用戶反饋
Figure 02_image011
。在一實施例中,處理器110可實際地控制場域中的各個基地台,以由各個基地台根據最佳波束
Figure 02_image015
以及功率
Figure 02_image005
等參數發射波束,藉以產生輸入資料
Figure 02_image009
。設置在場域中的用戶設備可測量訊號並將測量結果傳送給處理器110。處理器110可根據測量結果產生用戶反饋
Figure 02_image011
。處理器110可根據例如參考訊號接收功率等用戶感受指標來產生用戶反饋
Figure 02_image011
在步驟S104中,處理器110可將輸入資料
Figure 02_image009
輸入至神經網路B以產生對應於基地台n(n = 1~N)的組態,其中組態可包含機率向量
Figure 02_image023
以及功率
Figure 02_image025
。機率向量
Figure 02_image023
中的元素可包含對應於波束m(m = 1~M)的機率
Figure 02_image027
,如方程式(4)所示。神經網路B可對輸入資料
Figure 02_image009
進行一連串的卷積運算或池化運算,並進行適當的正規化(例如:對功率執行適當的整流或平移)以產生機率向量
Figure 02_image023
以及功率
Figure 02_image025
。機率向量
Figure 02_image023
、功率
Figure 02_image025
以及用戶反饋
Figure 02_image011
可用以計算均方誤差
Figure 02_image029
以產生輸入資料
Figure 02_image031
Figure 02_image033
…(4)
在步驟S105中,處理器110可根據機率向量
Figure 02_image023
從M個波束中選出最佳波束
Figure 02_image035
,從而取得對應於最佳波束
Figure 02_image035
的機率
Figure 02_image037
。在一實施例中,處理器110可選出與機率向量
Figure 02_image023
中的最大機率相對應的波束以作為最佳波束
Figure 02_image035
,並取得機率
Figure 02_image037
,如方程式(5)和方程式(6)所示。機率
Figure 02_image037
以及功率
Figure 02_image025
可用以產生輸入資料
Figure 02_image031
Figure 02_image039
…(5)
Figure 02_image041
…(6)
在步驟S106中,處理器110可根據功率
Figure 02_image025
、機率
Figure 02_image037
以及用戶反饋
Figure 02_image011
計算均方誤差
Figure 02_image029
,如方程式(7)所示,其中
Figure 02_image043
為權重。本發明考慮無線環境優良參數的稀疏性而引入權重概念,經適當的數學邊際條件推導轉換可得每筆輸入資料樣本需要適當的權重調整。本發明考慮無線環境的隨機特徵引入衡量隨機量的指標「熵(
Figure 02_image029
)」以作為目標函數。
Figure 02_image045
…(7)
在步驟S107中,處理器110可將輸入資料
Figure 02_image009
設為輸入資料
Figure 02_image047
。在步驟S108中,處理器110可使輸入資料的索引
Figure 02_image049
。在步驟S109中,處理器110可判斷輸入資料的索引i是否大於或等於預設的閾值T1。若索引i大於或等於閾值T1,則進入步驟S110。若索引i小於閾值T1,則進入步驟S101。也就是說,處理器110重複執行步驟S101至步驟S108的流程,直到i大於或等於閾值T1為止。每一次的疊代,處理器110都可產生對應的均方誤差
Figure 02_image029
(i = 1~T1)。多個均方誤差
Figure 02_image029
(i = 1~T1)可用以從多筆輸入資料
Figure 02_image009
(i = 1~T1)中選出輸入資料
Figure 02_image051
,其中
Figure 02_image053
在步驟S110中,處理器110可根據多個均方誤差
Figure 02_image029
(i = 1~T1)以從多筆輸入資料
Figure 02_image009
(i = 1~T1)中選出輸入資料
Figure 02_image051
,如方程式(8)所示,其中
Figure 02_image053
Figure 02_image055
…(8)
在步驟S111中,處理器110可根據輸入資料
Figure 02_image051
產生初始的輸入資料
Figure 02_image031
(即:輸入資料
Figure 02_image057
),其中j為輸入資料的索引(即:第j筆輸入資料)。輸入資料
Figure 02_image031
可用以產生對應於N個基地台的聯合波束組態。具體來說,處理器110可根據方程式(8)計算出索引X。接著,處理器110可根據索引X取得最佳波束
Figure 02_image059
以及功率
Figure 02_image061
。在一實施例中,處理器110可將最佳波束
Figure 02_image059
以及功率
Figure 02_image061
輸入至模擬軟體以模擬場域中由各個基地台發射的波束,藉以產生輸入資料
Figure 02_image057
。在一實施例中,處理器110可實際地控制場域中的各個基地台,以由各個基地台根據最佳波束
Figure 02_image059
以及功率
Figure 02_image061
等參數發射波束,藉以產生輸入資料
Figure 02_image057
圖4根據本發明的一實施例繪示神經網路訓練的第二階段的流程圖。在取得輸入資料
Figure 02_image031
後,在步驟S201中,處理器110可將輸入資料
Figure 02_image031
輸入至神經網路C以產生對應於基地台n(n = 1~N)的組態,其中組態可包含機率向量
Figure 02_image063
以及功率
Figure 02_image065
。機率向量
Figure 02_image063
中的元素可包含對應於波束m(m = 1~M)的機率
Figure 02_image067
,如方程式(9)所示。神經網路C可對輸入資料
Figure 02_image031
進行一連串的卷積運算或池化運算,並進行適當的正規化(例如:對功率執行適當的整流或平移)以產生機率向量
Figure 02_image063
以及功率
Figure 02_image065
。機率向量
Figure 02_image063
以及功率
Figure 02_image065
可用以產生輸入資料
Figure 02_image069
以及用戶反饋
Figure 02_image071
Figure 02_image073
…(9)
在步驟S202中,處理器110可根據機率向量
Figure 02_image063
從M個波束中選出最佳波束
Figure 02_image075
,從而取得對應於最佳波束
Figure 02_image075
的機率
Figure 02_image077
。在一實施例中,處理器110可選出與機率向量
Figure 02_image063
中的最大機率相對應的波束以作為最佳波束
Figure 02_image075
,並取得機率
Figure 02_image077
,如方程式(10)和方程式(11)所示。機率
Figure 02_image077
以及功率
Figure 02_image065
可用以產生輸入資料
Figure 02_image069
以及用戶反饋
Figure 02_image071
Figure 02_image079
…(10)
Figure 02_image081
…(11)
在步驟S203中,處理器110可根據最佳波束
Figure 02_image075
以及功率
Figure 02_image065
產生輸入資料
Figure 02_image069
以及用戶反饋
Figure 02_image071
。在一實施例中,處理器110可將最佳波束
Figure 02_image075
以及功率
Figure 02_image065
輸入至模擬軟體以模擬場域中由各個基地台發射的波束,藉以產生輸入資料
Figure 02_image069
。模擬軟體可將模擬的用戶設備設置在場域的範圍251,藉以通過用戶設備測量訊號以產生用戶反饋
Figure 02_image071
。模擬軟體可根據例如參考訊號接收功率或服務品質等用戶感受指標來產生用戶反饋
Figure 02_image071
。在一實施例中,處理器110可實際地控制場域中的各個基地台,以由各個基地台根據最佳波束
Figure 02_image075
以及功率
Figure 02_image065
等參數發射波束,藉以產生輸入資料
Figure 02_image069
。設置在場域中的用戶設備可測量訊號並將測量結果傳送給處理器110。處理器110可根據測量結果產生用戶反饋
Figure 02_image071
。處理器110可根據例如參考訊號接收功率等用戶感受指標來產生用戶反饋
Figure 02_image071
在步驟S204中,處理器110可將輸入資料
Figure 02_image069
輸入至神經網路D以產生對應於基地台n(n = 1~N)的組態,其中組態可包含機率向量
Figure 02_image083
以及功率
Figure 02_image085
。機率向量
Figure 02_image083
中的元素可包含對應於波束m(m = 1~M)的機率
Figure 02_image087
,如方程式(12)所示。神經網路D可對輸入資料
Figure 02_image069
進行一連串的卷積運算或池化運算,並進行適當的正規化(例如:對功率執行適當的整流或平移)以產生機率向量
Figure 02_image083
以及功率
Figure 02_image085
。輸入資料
Figure 02_image069
、功率
Figure 02_image085
以及機率向量
Figure 02_image083
可用以更新神經網路C的超參數以產生更新的神經網路C。功率
Figure 02_image085
、機率向量
Figure 02_image083
以及用戶反饋
Figure 02_image071
可用以計算均方誤差
Figure 02_image089
Figure 02_image091
…(12)
在步驟S205中,處理器110可根據機率向量
Figure 02_image083
從M個波束中選出最佳波束
Figure 02_image093
,從而取得對應於最佳波束
Figure 02_image093
的機率
Figure 02_image095
。在一實施例中,處理器110可選出與機率向量
Figure 02_image083
中的最大機率相對應的波束以作為最佳波束
Figure 02_image093
,並取得機率
Figure 02_image095
,如方程式(13)和方程式(14)所示。機率
Figure 02_image095
以及功率
Figure 02_image085
可用以計算均方誤差
Figure 02_image089
Figure 02_image039
…(13)
Figure 02_image041
…(14)
在步驟S206中,處理器110可根據功率
Figure 02_image085
、機率
Figure 02_image095
以及用戶反饋
Figure 02_image071
計算均方誤差
Figure 02_image089
,如方程式(15)、方程式(16)以及方程式(17)所示,其中
Figure 02_image097
為權重。本發明考慮無線環境優良參數的稀疏性而引入權重概念,經適當的數學邊際條件推導轉換可得每筆輸入資料樣本需要適當的權重調整。本發明考慮無線環境的隨機特徵引入衡量隨機量的指標「熵(
Figure 02_image089
)」以作為目標函數。
Figure 02_image099
…(15)
Figure 02_image101
…(16)
Figure 02_image103
…(17)
在步驟S207中,處理器110可根據輸入資料
Figure 02_image069
以及均方誤差
Figure 02_image089
更新神經網路C的超參數,藉以產生更新的神經網路C。
在步驟S208中,處理器110可將輸入資料
Figure 02_image069
設為輸入資料
Figure 02_image105
。在步驟S209中,處理器110可使輸入資料的索引
Figure 02_image107
。在步驟S210中,處理器110可判斷輸入資料的索引j是否大於或等於預設的閾值T2。若索引j大於或等於閾值T2,則進入步驟S211。若索引j小於閾值T2,則進入步驟S201。也就是說,處理器110重複執行步驟S201至步驟S209的流程,直到j大於或等於閾值T2為止。每一次的疊代,處理器110都可產生對應的均方誤差
Figure 02_image089
(j = 1~T2)。多個均方誤差
Figure 02_image089
(j = 1~T2)可分別用以更新神經網路C的超參數,藉以產生更新的神經網路C。
在步驟S211中,處理器110可根據更新的神經網路C產生聯合波束組態。聯合波束組態可用以配置N個基地台的每一者所使用的波束以及發射功率。處理器110可通過收發器130輸出聯合波束組態。在一實施例中,處理器110可將更新的神經網路C包裝於容器中並輸出,藉以將神經網路C部署於行動網路中。
圖5根據本發明的一實施例繪示一種無線通訊網路的基於自適性學習之聯合波束選擇和功率控制的方法的流程圖,其中所述方法可由如圖1所示的系統100實施。所述方法適用於多個基地台,其中所述多個基地台的每一者對應於多個波束。在步驟S501中,取得第一神經網路、第二神經網路、第三神經網路以及第四神經網路。在步驟S502中,取得對應於多個基地台的第一輸入資料,並且將第一輸入資料輸入至第一神經網路以產生第一功率以及多個波束的第一機率向量。在步驟S503中,根據第一功率以及第一機率向量產生第二輸入資料以及第一用戶反饋,並且將第二輸入資料輸入至第二神經網路以產生第二功率以及多個波束的第二機率向量。在步驟S504中,根據第一用戶反饋、第二功率以及第二機率向量產生第三輸入資料。在步驟S505中,根據第三輸入資料、第三神經網路以及第四神經網路產生聯合波束組態。在步驟S506中,輸出聯合波束組態。
綜上所述,本發明為多基地台聯合優化方法解決基地台間干擾議題。由於行動網路參數環環相扣,相較於各基地台各自優化,基地台間聯合優化才能得到最佳解。本發明於行動網路後端不間斷收集組態管理(CM)、性能管理(PM)及用戶終端量測回報(MR)等資訊以訓練基於自適學習的神經網路模型,此神經網路模型尚接受即時行動網路回傳資訊以達到線上學習的目的。本發明尚考慮無線通訊領域偶有特殊事件,針對稀少事件有必要做額外加重取樣處理,否則基於人工智慧的神經網路模型不見得處理稀少事件。稀少事件也可能增加模型的學習時間,故本發明提出了額外機率估測機制、加重取樣機制與權重調整功能。
本發明更提出多基地台頻率複用之低成本正交編碼方式,此方式能舒緩輸入多維度資料時造成圖形處理器的記憶體不敷使用而需降低解析度的窘境。
本發明提出之方法能利用過往歷史的資料,有別於傳統人工智慧方法直接針對目標函數進行梯度(gradient)操作使得參數調整機制只能接受當前資料。這類方法在無線通訊環境中並不適合,因在無線通訊環境所收集的資料常有遺漏或重複的問題。本發明提出之方法則不受此限,不管是當前資料或是過往歷史資料均能拿來利用,顯著增加資料利用效率。
本發明除了最佳化波束選擇空間尚考慮功率空間之優化,且本發明屬兩空間聯合優化方法而非階層式次最佳演算法優化。本發明能輸出高度向量化的已訓練神經網路參數,搭配裝置於基地台內部的圖形處理器能加速訊號處理。此已訓練神經網路參數能在實際環境中得一次運算結果於毫秒等級以符合即時服務訴求。
本發明輸入資料多樣性較重者僅基於基地台與波束方向乘積線性增長,而多樣性較低者則基地台數目指數增長,惟後者資料內容經低成本正交編碼後僅包含0/1資料格式,使其尤其適合陣列訊號處理,且對基地台或波束選擇空間的干擾(inference)幾可忽略。
本發明產生的神經網路能視環境所需模擬資料取得的缺漏程度,間接增加神經網路對無線通訊環境隨機性的強健程度。
100:系統 110:處理器 120:儲存媒體 130:收發器 210、220、230:基地台 200:輸入資料 211:訊號分布圖 212、213:基地台之間的干擾狀態 250:用戶位置圖 251:範圍 A、B、C、D:神經網路 S101、S102、S103、S104、S105、S106、S107、S108、S109、S110、S111、S201、S202、S203、S204、S205、S206、S207、S208、S209、S210、S211、S501、S502、S503、S504、S505、S506:步驟
圖1根據本發明的一實施例繪示一種無線通訊網路的基於自適性學習之聯合波束選擇和功率控制的系統的示意圖。 圖2根據本發明的一實施例繪示輸入資料的示意圖。 圖3根據本發明的一實施例繪示神經網路訓練的第一階段的流程圖。 圖4根據本發明的一實施例繪示神經網路訓練的第二階段的流程圖。 圖5根據本發明的一實施例繪示一種無線通訊網路的基於自適性學習之聯合波束選擇和功率控制的方法的流程圖。
S501、S502、S503、S504、S505、S506:步驟

Claims (11)

  1. 一種無線通訊網路的基於自適性學習之聯合波束選擇和功率控制的系統,適用於多個基地台,其中所述多個基地台的每一者對應於多個波束,其中所述系統包括:收發器;儲存媒體,儲存第一神經網路、第二神經網路、第三神經網路以及第四神經網路;以及處理器,耦接所述儲存媒體以及所述收發器,其中所述處理器經配置以執行:通過所述收發器取得對應於所述多個基地台的第一輸入資料,並且將所述第一輸入資料輸入至所述第一神經網路以產生第一功率以及所述多個波束的第一機率向量,其中所述第一輸入資料包括對應於所述多個基地台的多個二維資料以及對應於場域的用戶位置圖,且所述多個二維資料以及所述用戶位置圖依序堆疊為三維的所述第一輸入資料,其中所述多個基地台的所述多個二維資料包括所述多個基地台之間的干擾狀態;根據所述第一功率以及所述第一機率向量產生第二輸入資料以及第一用戶反饋,並且將所述第二輸入資料輸入至所述第二神經網路以產生第二功率以及所述多個波束的第二機率向量;根據所述第一用戶反饋、所述第二功率以及所述第二機率向量產生第三輸入資料;根據所述第三輸入資料、所述第三神經網路以及所述第四神 經網路產生聯合波束組態;以及通過所述收發器輸出所述聯合波束組態。
  2. 如請求項1所述的系統,其中所述處理器更經配置以執行:將所述第三輸入資料輸入至所述第三神經網路以產生第三功率以及所述多個波束的第三機率向量;根據所述第三功率以及所述第三機率向量產生第四輸入資料以及第二用戶反饋,並且將所述第四輸入資料輸入至所述第四神經網路以產生第四功率以及所述多個波束的第四機率向量;根據所述第四輸入資料、所述第四功率以及所述第四機率向量更新所述第三神經網路的超參數以產生更新的所述第三神經網路;以及根據所述更新的所述第三神經網路產生所述聯合波束組態。
  3. 如請求項1所述的系統,其中所述處理器更經配置以執行:根據所述第一機率向量從所述多個波束中選出最佳波束;以及根據對應於所述最佳波束的機率以及所述第一功率產生所述第二輸入資料以及所述第一用戶反饋。
  4. 如請求項1所述的系統,其中所述處理器更經配置以執行:根據所述第二輸入資料產生新的多筆第一輸入資料; 根據分別對應於所述多筆新的第一輸入資料的多筆第二輸入資料產生多個第二功率、多個第二機率向量以及多個第一用戶反饋;根據所述多個第二功率、所述多個第二機率向量以及所述多個第一用戶反饋以從所述多筆第二輸入資料中選出所述第二輸入資料;以及根據選擇的所述第二輸入資料產生所述第三輸入資料。
  5. 如請求項4述的系統,其中所述處理器更經配置以執行:根據所述多個第二功率、所述多個第二機率向量以及所述多個第一用戶反饋計算多個均方誤差;以及根據所述多個均方誤差以從所述多筆第二輸入資料中選出所述第二輸入資料。
  6. 如請求項1所述的系統,其中所述處理器更經配置以執行:根據所述第二機率向量從所述多個波束中選出最佳波束;以及根據對應於所述最佳波束的機率以及所述第二功率產生所述第三輸入資料。
  7. 如請求項2所述的系統,其中所述處理器更經配置以執行:根據所述第三機率向量從所述多個波束中選出最佳波束;以 及根據對應於所述最佳波束的機率以及所述第三功率產生所述第四輸入資料以及所述第二用戶反饋。
  8. 如請求項2所述的系統,其中所述處理器更經配置以執行:根據所述第四輸入資料產生新的多筆第三輸入資料;根據分別對應於所述多筆新的第三輸入資料的多筆第四輸入資料產生多個第四功率、多個第四機率向量以及多個第二用戶反饋;根據所述多個第四功率、所述多個第四機率向量以及所述多個第二用戶反饋計算多個均方誤差;以及根據所述多筆第四輸入資料以及所述多個均方誤差更新所述超參數。
  9. 如請求項8所述的系統,其中所述處理器更經配置以執行:根據所述第四機率向量從所述多個波束中選出最佳波束;以及根據對應於所述最佳波束的機率以及所述第四功率計算所述多個均方誤差的其中之一。
  10. 如請求項1所述的系統,其中所述第一輸入資料包括對應於所述多個基地台的下列的至少其中之一:訊號分布圖、基地台之間的干擾狀態以及用戶位置圖。
  11. 一種無線通訊網路的基於自適性學習之聯合波束選擇和功率控制的方法,適用於多個基地台,其中所述多個基地台的每一者對應於多個波束,其中所述方法包括:取得第一神經網路、第二神經網路、第三神經網路以及第四神經網路;取得對應於所述多個基地台的第一輸入資料,並且將所述第一輸入資料輸入至所述第一神經網路以產生第一功率以及所述多個波束的第一機率向量,其中所述第一輸入資料包括對應於所述多個基地台的多個二維資料以及對應於場域的用戶位置圖,且所述多個二維資料以及所述用戶位置圖依序堆疊為三維的所述第一輸入資料,其中所述多個基地台的所述多個二維資料包括所述多個基地台之間的干擾狀態;根據所述第一功率以及所述第一機率向量產生第二輸入資料以及第一用戶反饋,並且將所述第二輸入資料輸入至所述第二神經網路以產生第二功率以及所述多個波束的第二機率向量;根據所述第一用戶反饋、所述第二功率以及所述第二機率向量產生第三輸入資料;根據所述第三輸入資料、所述第三神經網路以及所述第四神經網路產生聯合波束組態;以及輸出所述聯合波束組態。
TW110129844A 2021-08-12 2021-08-12 基於自適性學習之聯合波束選擇和功率控制的系統和方法 TWI769911B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW110129844A TWI769911B (zh) 2021-08-12 2021-08-12 基於自適性學習之聯合波束選擇和功率控制的系統和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW110129844A TWI769911B (zh) 2021-08-12 2021-08-12 基於自適性學習之聯合波束選擇和功率控制的系統和方法

Publications (2)

Publication Number Publication Date
TWI769911B true TWI769911B (zh) 2022-07-01
TW202308339A TW202308339A (zh) 2023-02-16

Family

ID=83439672

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110129844A TWI769911B (zh) 2021-08-12 2021-08-12 基於自適性學習之聯合波束選擇和功率控制的系統和方法

Country Status (1)

Country Link
TW (1) TWI769911B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110786046A (zh) * 2017-07-06 2020-02-11 华为技术有限公司 使用深度学习优化蜂窝网络
CN111434049A (zh) * 2017-06-19 2020-07-17 弗吉尼亚科技知识产权有限公司 使用多天线收发器无线传输的信息的编码和解码
US20200358514A1 (en) * 2019-05-01 2020-11-12 Qualcomm Incorporated Beam management using adaptive learning
CN112136334A (zh) * 2018-06-01 2020-12-25 三星电子株式会社 蜂窝网络中基于机器学习的宽波束优化的方法和装置
TW202123095A (zh) * 2019-12-12 2021-06-16 中華電信股份有限公司 基於深度強化學習之無線通訊網路波束選擇方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111434049A (zh) * 2017-06-19 2020-07-17 弗吉尼亚科技知识产权有限公司 使用多天线收发器无线传输的信息的编码和解码
CN110786046A (zh) * 2017-07-06 2020-02-11 华为技术有限公司 使用深度学习优化蜂窝网络
CN112136334A (zh) * 2018-06-01 2020-12-25 三星电子株式会社 蜂窝网络中基于机器学习的宽波束优化的方法和装置
US20200358514A1 (en) * 2019-05-01 2020-11-12 Qualcomm Incorporated Beam management using adaptive learning
TW202123095A (zh) * 2019-12-12 2021-06-16 中華電信股份有限公司 基於深度強化學習之無線通訊網路波束選擇方法

Also Published As

Publication number Publication date
TW202308339A (zh) 2023-02-16

Similar Documents

Publication Publication Date Title
CN110770761B (zh) 深度学习系统和方法以及使用深度学习的无线网络优化
Maksymyuk et al. Deep learning based massive MIMO beamforming for 5G mobile network
Ranasinghe et al. Graph neural network based access point selection for cell-free massive MIMO systems
JP7486659B2 (ja) 基地局の省エネルギー処理方法及び処理装置
US11871251B2 (en) Method of association of user equipment in a cellular network according to a transferable association policy
CN111817805A (zh) 一种信道传播模型参数的调整方法、装置和介质
CN114826462B (zh) 面向大规模mimo统计端口选择的波束域信道增广方法
CN113239632A (zh) 无线性能预测方法及装置、电子设备和存储介质
US11140561B2 (en) Electronic device and method for wireless communication
TWI769911B (zh) 基於自適性學習之聯合波束選擇和功率控制的系統和方法
KR20230091093A (ko) 조건부 변이형 오토-인코더들을 사용한 무선 채널들의 데이터-기반 확률론적 모델링
CN106028345A (zh) 一种基于自适应禁忌搜索的小基站容量与覆盖优化方法
Alabbasi et al. On cascaded federated learning for multi-tier predictive models
EP4358446A1 (en) Model training method and related apparatus
CN113923141B (zh) 一种高密度ap分布的无线局域网络吞吐量估计方法及系统
CN113595599B (zh) 面向5g的群簇协作通信异构系统和干扰抑制的方法
Gill et al. Three-way deep neural network for radio frequency map generation and source localization
Zhang et al. The 5G NOMA networks planning based on the multi-objective evolutionary algorithm
CN116506863A (zh) 决策优化方法、装置、电子设备及可读存储介质
CN114285504A (zh) 一种大规模无线供能反向散射通信网络传输性能研究方法
TW202224472A (zh) 基於類神經網路的波束選擇方法及管理伺服器
CN114764610A (zh) 一种基于神经网络的信道估计方法及通信装置
Benfaid et al. ProSky: NEAT Meets NOMA-mmWave in the Sky of 6G
TWI828324B (zh) 基於線上強化學習之無線通訊參數調整系統及其方法
CN113645001B (zh) 一种针对高速移动场景下时变信道的srs周期配置方法