CN113727451A - 一种混合供电c-ran资源分配方法及装置 - Google Patents

一种混合供电c-ran资源分配方法及装置 Download PDF

Info

Publication number
CN113727451A
CN113727451A CN202110998544.1A CN202110998544A CN113727451A CN 113727451 A CN113727451 A CN 113727451A CN 202110998544 A CN202110998544 A CN 202110998544A CN 113727451 A CN113727451 A CN 113727451A
Authority
CN
China
Prior art keywords
parameter
radio frequency
function
determining
pull head
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110998544.1A
Other languages
English (en)
Inventor
路永玲
胡成博
张国江
杨景刚
付慧
贾骏
王真
朱雪琼
秦剑华
刘子全
姚楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Jiangsu Electric Power Co Ltd
Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Jiangsu Electric Power Co Ltd
Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Jiangsu Electric Power Co Ltd, Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Jiangsu Electric Power Co Ltd
Priority to CN202110998544.1A priority Critical patent/CN113727451A/zh
Publication of CN113727451A publication Critical patent/CN113727451A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/0446Resources in time domain, e.g. slots or frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/50Allocation or scheduling criteria for wireless resources
    • H04W72/53Allocation or scheduling criteria for wireless resources based on regulatory allocation policies
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请涉及电力物联网技术领域,公开了一种混合供电C‑RAN资源分配方法及装置,在该方法中,首先量化场景中不同射频远拉头的计算资源需求,通过动态映射基带处理单元与射频远拉头的关联关系,来实现基带处理单元计算资源的动态分配。然后利用机器学习的线性回归模型学习EH模块能量到达率的特征,并适时修正以达到预测可再生能量到达率的目的。根据上述所得结果,由强化学习使无线信道状态与网络进行交互,再基于强化学习中的算法来确定电力物联网中输变电物联网节点设备的调度方案以及射频远拉头资源分配方案。有效解决现有技术中云无线接入网在面向电力物联网应用中的资源利用不合理的技术问题。

Description

一种混合供电C-RAN资源分配方法及装置
技术领域
本申请涉及电力物联网技术领域,尤其涉及一种混合供电C-RAN资源分配方法及装置。
背景技术
传统依靠电量增长、引进消化吸收再创新的发展模式难以为继。泛在电力物联网的建设对于促 进电网提质增效具有重要意义。然而,由于当前电网呈现规模大、分枝多的特点,需要一种广覆盖、 大连接的接入方式来满足其泛在通信需求。其次,对于输变电节点的物联网设备,因为部署环境的 特殊性,不易于维护。因此,为输变电物联网节点充能,提升网络整体能量效率是保障电力物联网 正常运行的关键。
云无线接入网(Cloud Radio Access Network,C-RAN)作为一种新型组网方式,在增加小区 网络吞吐量,提高区域覆盖面积和实现无缝覆盖方面有着显著优势。云无线接入网这种架构不同于 传统的一体式基站,而是通过集中化基站中的基带处理单元(BuildingBase band Unite,BBU), 分散化无线发射单元,并由高带宽低时延光纤连接两者构成。此方式将无源光网络与无线通信网络 的优点进行高效融合,其中时分复用无源光网络(TimeDivision Multiplexed Passive Optical Network,TDM-PON)具有高能效、低延迟以及高传输容量的特点,将其作为前传网络连接基带处理 单元与射频远拉头(Remote RadioHead,RRH)能有效提高网络性能。虽然,在提高资源利用率、 降低系统更新、维护成本和运营支出方面,基于TDM-PON的C-RAN有显著成效。但是,以大规模部 署RRH来实现广覆盖的方式会使得RRH消耗较多能量,导致碳足迹的激增。基于物联网节点充能和 RRH碳排放减少两个目的,将能量收集(Energy Harvesting,EH)技术加入输变电物联网节点与RRH 中,使得两者能够从环境能源中收集绿色可再生能量,不但能保障物联网节点正常工作,而且还减少对传统能源的消耗。
现有技术中,对EH技术的学术研究,以提高绿色能源利用率,降低传统能耗为主要目标。在 具有EH能力的单用户应用场景中,第一种是采用排队模型对能量的收集和业务的分组进行建模, 并通过马尔可夫决策过程来调度业务分组使其达到最佳。第二种是对异构网络中微蜂窝的开启或关 闭进行了研究,通过将用户业务迁移以减少微蜂窝的开启数量来达到降低整体异构网络能耗的目 的。第三种是考虑双用户的无线通信场景,并由混合能源对其发射机进行供电。为了合理分配混合 功率资源,实现低功耗的目的,提出了根据传输功率的动态决策方案。第四种是提出一种功率分配 算法,功率分配算法基于用户具有的EH能力来降低传统能耗,同时由于其算法复杂度,提出了两 个次优算法以降低算法复杂度。第五种是以用户服务质量(Quality of Service,QoS)为衡量指标, 将能效问题建模为凸优化问题,并通过算法求解得到优化方案来提高网络能效。第六种是对分层用 户调度与功率控制之间的影响关系进行了深入研究,定义了小区能耗目标函数,并通过搭建斯塔克尔伯格博弈模型来优化网络的能耗成本。第七种是为了降低处于异构网络中的设备能耗,提高系统 资源利用率,同样采用斯塔克尔伯格模型来建立能耗模型,利用物联网设备实现灾难恢复,提出一 个包含物联网设备的分布式智能电网框架,并进行灾难恢复策略演示,仿真结果表明其能有效解决 一些突发灾难问题。第八种是提出一种创新的智能电表来监测智能电网中的能量流,并搭建实物场 景验证其想法,印证了引入物联网设备对于提高电网效率和功能有着显著成效。
但是现有技术中的研究忽略了因为绿色能源的时变特性,造成EH收集的能量也是变化的,而 不是某个特定值。其次,没有考虑独立的RRH个体所服务的业务数量对资源分配带来的影响以及分 析BBU和RRH之间的映射关系。以上会导致云无线接入网在面向电力物联网应用中的资源利用不合 理。
发明内容
本申请公开了一种混合供电C-RAN资源分配方法及装置,用于解决现有技术中,忽略了因为绿 色能源的时变特性,造成EH收集的能量也是变化的,而不是某个特定值。其次,没有考虑独立的 RRH个体所服务的业务数量对资源分配带来的影响以及分析BBU和RRH之间的映射关系,导致云无 线接入网在面向电力物联网应用中的资源利用不合理的技术问题。
本申请第一方面公开了一种混合供电C-RAN资源分配方法,包括:
在时隙开始时,获取射频远拉头的计算资源需求,以及获取初始基带处理单元集合,并根据所 述射频远拉头的计算资源需求和所述初始基带处理单元集合,确定射频远拉头与基带处理单元之间 的映射关系,所述初始基带处理单元集合为已激活的全部基带处理单元;
获取EH模块的能量到达率正态分布模型,并根据所述能量到达率正态分布模型确定能量到达 率二元线性回归模型;
根据所述能量到达率二元线性回归模型,确定所述能量到达率二元线性回归模型的最优解;
根据所述能量到达率正态分布模型、所述能量到达率二元线性回归模型和所述能量到达率二元 线性回归模型的最优解,确定能量到达率回归模型;
获取目标射频远拉头的传输速率,以及获取所述目标射频远拉头的中断概率,以及获取所述目 标射频远拉头的时延,并根据所述目标射频远拉头的传输速率、所述目标射频远拉头的时延中断概 率和所述目标射频远拉头的时延,确定所述目标射频远拉头的质量因子,所述目标射频远拉头为任 一射频远拉头;
获取射频远拉头的总能耗模型,并根据所述总能耗模型和所述质量因子,生成优化因子模型;
获取时隙的网络状态,并根据所述网络状态和所述优化因子模型,生成所述网络状态的收益模 型;
根据所述收益模型,确定目标函数表达式;
获取预设的第一参数,并根据所述第一参数和所述目标函数表达式,确定目标函数梯度表达式, 所述第一参数用于构建射频远拉头的策略,其中,所述射频远拉头的策略用于对射频远拉头进行资 源分配;
获取预设的第二参数和预设的第三参数,所述第二参数用于表示网络状态对应的函数表达式, 所述第三参数用于表示网络状态影响网络决策作用的函数表达式;其中,所述第一参数、所述第二 参数和所述第三参数用于对所述目标函数表达式进行优化;
根据所述第二参数和所述第三参数,确定优势函数;
根据所述优势函数和所述目标函数梯度表达式,确定目标函数梯度更新式;
根据所述目标函数梯度更新式、所述第一参数、所述第二参数和所述第三参数,确定所述第一 参数、所述第二参数和所述第三参数的参数综合最优解;
根据所述射频远拉头与基带处理单元之间的映射关系、所述能量到达率回归模型、所述优化因 子模型以及所述参数综合最优解,确定混合供电C-RAN的资源分配。
可选的,所述根据所述射频远拉头的计算资源需求和所述初始基带处理单元集合,确定射频远 拉头与基带处理单元之间的映射关系,包括:
根据所述射频远拉头的计算资源需求确定射频远拉头需求集合;
获取所述初始基带处理单元集合中任一基带处理单元的计算资源;
根据所述任一基带处理单元的计算资源和所述射频远拉头需求集合,将计算资源大于所述射频 远拉头的计算资源需求的基带处理单元,确定目标基带处理单元集合;;
根据所述目标基带处理单元集合,确定射频远拉头与基带处理单元之间的映射关系。
可选的,所述根据所述能量到达率二元线性回归模型,确定所述能量到达率二元线性回归模型 的最优解,包括:
获取所述能量到达率二元线性回归模型中多组预设数据的真实值和预测值,并根据所述所述能 量到达率二元线性回归模型多组预设数据的真实值和预测值,确定所述能量到达率二元线性回归模 型的均方误差;
根据所述能量到达率二元线性回归模型的均方误差,确定所述能量到达率二元线性回归模型的 最优解。
可选的,所述获取目标射频远拉头的传输速率,包括:
获取所述射频远拉头下行传输所述目标电力物联网节点的平均信噪比;
根据所述平均信噪比,确定所述目标射频远拉头的传输速率。
可选的,所述获取时隙的网络状态,包括:
根据所述平均信噪比和所述能量到达率回归模型,获取所述网络状态。
可选的,所述根据所述网络状态,生成所述网络状态的收益模型,包括:
根据所述网络状态,确定网络中的状态转移概率;
根据所述网络中的状态转移概率,确定所述收益模型。
可选的,所述根据所述第二参数和所述第三参数,确定优势函数,包括:
获取状态值函数和状态作用值函数;
根据所述状态值函数、所述状态作用值函数、所述第二参数和所述第三参数,确定所述状态值 函数的线性逼近函数,以及确定所述状态作用值函数的线性逼近函数;
根据所述状态值函数的线性逼近函数、所述状态作用值函数的线性逼近函数、所述第二参数和 所述第三参数,确定所述优势函数。
可选的,在所述确定所述状态值函数的线性逼近函数,以及确定所述状态作用值函数的线性逼 近函数之后,还包括:
根据所述状态值函数的线性逼近函数和所述状态作用值函数的线性逼近函数,确定时间差分误 差表达式;
根据所述时间差分误差表达式和预设的学习速率,对所述第二参数和所述第三参数进行更新。
可选的,在所述根据所述能量到达率正态分布模型确定能量到达率二元线性回归模型之后,还 包括:
利用可决系数判断所述能量到达率二元线性回归模型是否适用,若否,则重新建立所述能量到 达率二元线性回归模型。
本申请第二方面公开了一种混合供电C-RAN资源分配装置,所述混合供电C-RAN资源分配装置 应用于本申请第一方面公开的混合供电C-RAN资源分配方法,所述混合供电C-RAN资源分配装置包 括:
映射关系获取模块,用于在时隙开始时,获取射频远拉头的计算资源需求,以及获取初始基带 处理单元集合,并根据所述射频远拉头的计算资源需求和所述初始基带处理单元集合,确定射频远 拉头与基带处理单元之间的映射关系,所述初始基带处理单元集合为已激活的全部基带处理单元;
第一模型生成模块,用于获取EH模块的能量到达率正态分布模型,并根据所述能量到达率正 态分布模型确定能量到达率二元线性回归模型;
模型最优解获取模块,用于根据所述能量到达率二元线性回归模型,确定所述能量到达率二元 线性回归模型的最优解;
第二模型生成模块,用于根据所述能量到达率正态分布模型、所述能量到达率二元线性回归模 型和所述能量到达率二元线性回归模型的最优解,确定能量到达率回归模型;
质量因子确定模块,用于获取目标射频远拉头的传输速率,以及获取所述目标射频远拉头的中 断概率,以及获取所述目标射频远拉头的时延,并根据所述目标射频远拉头的传输速率、所述目标 射频远拉头的时延中断概率和所述目标射频远拉头的时延,确定所述目标射频远拉头的质量因子, 所述目标射频远拉头为任一射频远拉头;
第三模型生成模块,用于获取射频远拉头的总能耗模型,并根据所述总能耗模型和所述质量因 子,生成优化因子模型;
第四模型生成模块,用于获取时隙的网络状态,并根据所述网络状态和所述优化因子模型,生 成所述网络状态的收益模型;
目标函数表达式获取模块,用于根据所述收益模型,确定目标函数表达式;
梯度表达式获取模块,用于获取预设的第一参数,并根据所述第一参数和所述目标函数表达式, 确定目标函数梯度表达式,所述第一参数用于构建射频远拉头的策略,其中,所述射频远拉头的策 略用于对射频远拉头进行资源分配;
参数获取模块,用于获取预设的第二参数和预设的第三参数,所述第二参数用于表示网络状态 对应的函数表达式,所述第三参数用于表示网络状态影响网络决策作用的函数表达式;其中,所述 第一参数、所述第二参数和所述第三参数用于对所述目标函数表达式进行优化;
优势函数获取模块,用于根据所述第二参数和所述第三参数,确定优势函数;
梯度更新式获取模块,用于根据所述优势函数和所述目标函数梯度表达式,确定目标函数梯度 更新式;
参数综合最优解获取模块,用于根据所述目标函数梯度更新式、所述第一参数、所述第二参数 和所述第三参数,确定所述第一参数、所述第二参数和所述第三参数的参数综合最优解;
资源分配模块,用于根据所述射频远拉头与基带处理单元之间的映射关系、所述能量到达率回 归模型和所述参数综合最优解,确定混合供电C-RAN的资源分配。
可选的,所述映射关系获取模块包括:
需求集合获取单元,用于根据所述射频远拉头的计算资源需求确定射频远拉头需求集合;
计算资源获取单元,用于获取所述初始基带处理单元集合中任一基带处理单元的计算资源;
集合确定单元,用于根据所述任一基带处理单元的计算资源和所述射频远拉头需求集合,将计 算资源大于所述射频远拉头的计算资源需求的基带处理单元,确定目标基带处理单元集合;;
映射关系确定单元,用于根据所述目标基带处理单元集合,确定射频远拉头与基带处理单元之 间的映射关系。
可选的,所述模型最优解获取模块包括:
预测值获取单元,用于获取任一时刻EH模块的能量到达率的真实值,并根据所述能量到达率 二元线性回归模型,确定所述任一时刻EH模块的能量到达率的预测值;
均方误差获取单元,用于根据所述任一时刻EH模块的能量到达率的真实值和所述任一时刻EH 模块的能量到达率的预测值,确定所述能量到达率二元线性回归模型的均方误差;
最优解获取单元,用于根据所述能量到达率二元线性回归模型的均方误差,确定所述能量到达 率二元线性回归模型的最优解。
可选的,所述质量因子确定模块包括:
平均信噪比获取单元,用于获取所述射频远拉头下行传输所述目标电力物联网节点的平均信噪 比;
传输速率获取单元,用于根据所述平均信噪比,确定所述目标射频远拉头的传输速率。
可选的,所述第四模型生成模块包括:
网络状态获取单元,用于根据所述平均信噪比和所述能量到达率回归模型,获取所述网络状态。
可选的,所述第四模型生成模块包括:
状态转移概率获取单元,用于根据所述网络状态,确定网络中的状态转移概率;
收益模型生成单元,用于根据所述网络中的状态转移概率,确定所述收益模型。
可选的,所述优势函数获取模块包括:
状态函数获取单元,用于获取状态值函数和状态作用值函数;
线性逼近函数获取单元,用于根据所述状态值函数、所述状态作用值函数、所述第二参数和所 述第三参数,确定所述状态值函数的线性逼近函数,以及确定所述状态作用值函数的线性逼近函数;
优势函数获取单元,用于根据所述状态值函数的线性逼近函数、所述状态作用值函数的线性逼 近函数、所述第二参数和所述第三参数,确定所述优势函数。
可选的,所述优势函数获取模块还包括:
参数更新单元,用于在所述确定所述状态值函数的线性逼近函数,以及确定所述状态作用值函 数的线性逼近函数之后,根据所述状态值函数的线性逼近函数和所述状态作用值函数的线性逼近函 数,确定时间差分误差表达式;根据所述时间差分误差表达式和预设的学习速率,对所述第二参数 和所述第三参数进行更新。
可选的,所述第一模型生成模块还包括:
模型判断单元,用于在所述根据所述能量到达率正态分布模型确定能量到达率二元线性回归模 型之后,利用可决系数判断所述能量到达率二元线性回归模型是否适用,若否,则重新建立所述能 量到达率二元线性回归模型。
本申请涉及电力物联网技术领域,公开了一种混合供电C-RAN资源分配方法及装置,在该方法 中,首先量化场景中不同射频远拉头的计算资源需求,通过动态映射基带处理单元与射频远拉头的 关联关系,来实现基带处理单元计算资源的动态分配。然后利用机器学习的线性回归模型学习EH 模块能量到达率的特征,并适时修正以达到预测可再生能量到达率的目的。根据上述所得结果,由 强化学习使无线信道状态与网络进行交互,再基于强化学习中的算法来确定电力物联网中输变电物 联网节点设备的调度方案以及射频远拉头资源分配方案。有效解决现有技术中云无线接入网在面向 电力物联网应用中的资源利用不合理的技术问题。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显 而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获 得其他的附图。
图1为本申请本申请实施例公开的一种含有EH模块的泛在电力物联网架构;
图2为本申请本申请实施例公开的一种含有EH功能的RRH模块;
图3为本申请本申请实施例公开的一种含有EH功能的物联网节点模块;
图4为本申请本申请实施例公开的一种混合供电C-RAN资源分配方法的工作流程示意图;
图5为本申请本申请实施例公开的一种混合供电C-RAN资源分配装置的结构示意图。
具体实施方式
为了解决现有技术中,忽略了因为绿色能源的时变特性,造成EH收集的能量也是变化的,而 不是某个特定值。其次,没有考虑独立的RRH个体所服务的业务数量对资源分配带来的影响以及分 析BBU和RRH之间的映射关系,导致云无线接入网在面向电力物联网应用中的资源利用不合理的技 术问题,本申请通过以下两个实施例公开了一种混合供电C-RAN资源分配方法及装置。
本申请第一实施例公开了一种混合供电C-RAN资源分配方法,如图1所示,为本申请实施例提 供的含有EH模块的泛在电力物联网架构。网络端主要由集中式BBU资源池(BBUPOOL),增加了 EH模块的RRH以及连接两者的TDM-PON组成,终端则是增加了EH模块的输变电物联网节点。集中 化部署大量通用服务器形成基带资源池,每个物理通用服务器的计算能力是相同的,并且通过软件 定义网络技术以全局视角智能的进行用户调度和分配资源。BBU集中放置在数据中心,它到核心网 的传输网络被称为回传网络(Backhaul),到RRH的传输网络被称为前传网络(Fronthaul)。
假设网络中RRH集合N={1,2,……,N}部署在BBU下,同时每个RRH有m条发射天线。物联网节 点集合为R={1,2,……,R}。假定每个时隙为常量Ts,并在每个时隙的开始制定网络资源分配决策。
相关调查表明通信网络中电费支出超过运营商成本的一半,并且电量消耗的同时也排放了大量 的二氧化碳,其次,处于高原山林地区的输变电物联网节点存在维护成本较高的问题。因此,无论 是出于环保还是经济效益考虑,使用EH模块来减少传统能源的消耗及伴随的二氧化碳排放,延长 物联网节点使用寿命,减少支出成本有着巨大的现实意义。图2为一种含有EH功能的RRH模块, 图3为一种含有EH功能的物联网节点模块,展示了含有EH模块的主要构成部分:第一部分是收集 绿色能源并转化成自身可用能量。第二部分是存储前者转换得到的能量,称为能量缓存单元。由于 RRH与物联网节点主要作用不同,因此具有EH能力的RRH第三部分为信号收发模块,包含天线系 统和信号发射器,用于设备间的数据传输。而物联网节点则是对收集来的能量用于设备自身供电。
参见图4所示的工作流程示意图,所述混合供电C-RAN资源分配方法包括:
步骤S101,在时隙开始时,获取射频远拉头的计算资源需求,以及获取初始基带处理单元集 合,并根据所述射频远拉头的计算资源需求和所述初始基带处理单元集合,确定射频远拉头与基带 处理单元之间的映射关系,所述初始基带处理单元集合为已激活的全部基带处理单元。
进一步的,所述根据所述射频远拉头的计算资源需求和所述初始基带处理单元集合,确定射频 远拉头与基带处理单元之间的映射关系,包括:
根据所述射频远拉头的计算资源需求确定射频远拉头需求集合。
获取所述初始基带处理单元集合中任一基带处理单元的计算资源。
根据所述任一基带处理单元的计算资源和所述射频远拉头需求集合,将计算资源大于所述射频 远拉头的计算资源需求的基带处理单元,确定目标基带处理单元集合;。
根据所述目标基带处理单元集合,确定射频远拉头与基带处理单元之间的映射关系。
具体来说,本步骤的目标是解决前传网络中BBU与RRH的连接问题,即优化BBU计算资源分配。 因为每个BBU的计算能力都是有限且固定的,本实施例采用每秒的计算次数来表征其计算能力,记 Hz为BBUz的计算资源,单位为百万次每秒,考虑到网络的能耗问题,那么需要尽可能的减少BBU 的活跃数目。
下行传输过程中,BBU通过由TDM-PON构成的前传网络将数据传输到合适的RRH发送给设备, 在上行传输时,RRH接收到设备传来的数据并发送至其所连接的数据中心,数据在数据中心的BBU 间可以互相迁移。因此通过映射任意数量的RRH来实现业务的聚合,从而提高BBU端计算资源利用 率。为确定RRH与BBU之间的映射关系,首先假设BBU的计算能力为背包容量,RRH所需要的计算 资源为物品大小,因此可以将映射关系转化为背包问题。这里提出一种贪婪实时算法来解决此问题, 并得到优化的BBU计算资源分配策略。时隙开始时,进行如下操作:
令RRHn的计算资源需求为hn,得到按升序排列的RRH需求集合H={h1,h2,……,hn},同时由BE和 BA分别表示初始基带处理单元集合与目标基带处理单元集合,BE集合为已激活的所有BBU设备,BA初始为空集。集合H中的元素按从后往前的顺序进行处理,对H中的元素,首先遍历集合BE,对 于满足Hz>hn条件的BBU加入集合BA,若当前集合中没有满足条件的BBU,则开启新的BBU并映射 到目标RRH,同时将其加入到集合BA。遍历集合BE寻找最佳BBU的判决式如下式:
H=min{hn+H1,hn+H2,…};
以此确定集合BA,然后然后建立目标RRH与BBU之间映射关系,最后初始化集合BA与H,并 对目标BBU的计算资源Hz进行更新,更新方式如下:
Hz=Hz-hn
当Hz=0时,从集合BE中移除该BBU,更新集合BE,当集合H为空时停止上述操作。
在本申请的部分实施例中,因不同业务对传输时延需求不同,本实施例将其分为实时业务和非 实时业务。为保障实时业务的时效性,需调整在同一连接内的下行分组调度策略。考虑到业务被分 为两类,故光链路终端(Optical Line Terminal,OLT)会为每个光网络单元(Optical Network Unit, ONU)设置两组缓存队列,分别缓存两类业务的数据。当一个间隔周期开始时,OLT通过轮询方式安 排各个ONU数据来决定数据的传输顺序。ONU集合Mw表示所有需要服务的业务,将其中最小时延 要求发送到OLT,分别把实时业务与非实时业务的最小时延要求记为
Figure BDA0003234689300000091
Figure BDA0003234689300000092
ONU中的业务传 输可看作为一个排队等待处理过程,因此,可以认为其遵循服务时间为指数分布的泊松过程,业务 采用先到先处理的准则,并且缓存空间为无穷。则ONUj内一个数据业务的平均排队时延
Figure BDA0003234689300000093
可表示 为:
Figure BDA0003234689300000094
输入过程中单位时间内数据到达数量由λ表示,单位时间内ONU的处理能力由μ表示,则平均 服务时间与平均总时延表达式如下所示:
Figure BDA0003234689300000095
Figure BDA0003234689300000096
通过计算ONU的缓存数据分组中时延容忍最小值与业务数据时延之差,再结合上式得出平均时 延之差。对于时延差越小的业务,说明其实时性要求越高,意味着此业务需要尽快完成。同时当存 在实时业务时先进行实时业务的时延差排序,根据时延差的大小进行排序传输。
步骤S102,获取EH模块的能量到达率正态分布模型,并根据所述能量到达率正态分布模型确 定能量到达率二元线性回归模型。
进一步的,在所述根据所述能量到达率正态分布模型确定能量到达率二元线性回归模型之后, 还包括:
利用可决系数判断所述能量到达率二元线性回归模型是否适用,若否,则重新建立所述能量到 达率二元线性回归模型。
具体来说,由于可再生能源受到环境因素的影响,因此EH模块收集到的能量也随之改变,故 令Γ(t)表示t时刻EH模块的能量到达率。机器学习提取抽象事物的特征,输出一个接近实际的描述, 所以机器学习可以模拟环境变化给EH模块带来的影响。本实施例利用机器学习方法建立了时变的 能量到达率模型来预测未来时刻EH模块能收集到的能量大小。本实施例通过机器学习中的回归模 型来建立能量到达率模型,依据现有技术中揭示的可再生能源数据分布情况,一天中的8:00-18:00 时间段内绿色能源比较集中,其余时段左右对称并逐渐下降。因此可判定能量到达率大致服从正态 分布,得到所述EH模块的能量到达率正态分布模型如下所示:
Figure BDA0003234689300000101
其中μ表示一天中能量到达率的均值,σ2表示能量的集中程度。为了简化求解过程,将上述 模型转化为多元线性回归模型,令Γ'(t)=lnΓ(t),
Figure BDA0003234689300000102
那么a′=lna,将Γ'(t)和a′代入公式(6), 则其可以改写为如下所示的公式:
Γ'(t)=a′-πe2a′(t-μ)2=-πe2a′t2+2μtπe2a′-πe2a′μ2+a′;
接着令t2=t2,t1=t,b2=-πe2a′,b1=2πμe2a′,b0=a′-πμ2e2a′,然后带入上式中,得到所述能量到达率 二元线性回归模型,如下所示:
Γ′(t)=b2t2+b1t1+b0
步骤S103,根据所述能量到达率二元线性回归模型,确定所述能量到达率二元线性回归模型 的最优解。
进一步的,所述根据所述能量到达率二元线性回归模型,确定所述能量到达率二元线性回归模 型的最优解,包括:
获取任一时刻EH模块的能量到达率的真实值,并根据所述能量到达率二元线性回归模型,确 定所述任一时刻EH模块的能量到达率的预测值;
根据所述任一时刻EH模块的能量到达率的真实值和所述任一时刻EH模块的能量到达率的预测 值,确定所述能量到达率二元线性回归模型的均方误差;
根据所述能量到达率二元线性回归模型的均方误差,确定所述能量到达率二元线性回归模型的 最优解。
具体来说,回归模型中常利用均方误差来衡量模型的好坏,文中均方误差可由E表示,具体如 下所示:
Figure BDA0003234689300000111
其中
Figure BDA0003234689300000112
和Γi(t)分别表示取t时刻EH模块的能量到达率的第i个数据的真实值和预测值,
Figure BDA0003234689300000113
Figure BDA0003234689300000114
代表基于第i个数据的时间下的自变量t1,t2
令B=(b2,b1,b0)T
Figure BDA0003234689300000115
则误差函数的向量形式为 e=(Vr-TB)T(Vr-TB)。为了优化模型性能需要最小化误差e。而对于满秩矩阵T通过数学运算求出 解B,令B*为回归模型的最优解,则有目标函数如下所示:
Figure BDA0003234689300000116
而由上述函数的极值点可以得到所述能量到达率二元线性回归模型的最优解B*
Figure BDA0003234689300000117
令φ和
Figure BDA0003234689300000118
分别为总离差平方和及剩余平方和,
Figure BDA0003234689300000119
为数据的平均值,对模型拟合度进行检验如 下所示:
Figure BDA00032346893000001110
由可决系数来判断模型是否适用,可决系数越大,表示模型效果越好,具体表达式如下所示:
Figure BDA00032346893000001111
若可决系数小于设定阈值,则重新建立机器学习模型。
步骤S104,根据所述能量到达率正态分布模型、所述能量到达率二元线性回归模型和所述能 量到达率二元线性回归模型的最优解,确定能量到达率回归模型。
具体来说:根据所述能量到达率二元线性回归模型的最优解B*求得变量a′,再根据a′=lna,
Figure BDA00032346893000001112
和公式(11),求解得到变量σ为:
Figure BDA0003234689300000121
由公式b2=-πe2a′和b1=2πμe2a′,求得均值μ为:
Figure BDA0003234689300000122
根据所述变量σ、均值μ和所述能量到达率正态分布模型,确定能量到达率回归模型,如下所 示:
Figure BDA0003234689300000123
步骤S105,获取目标射频远拉头的传输速率,以及获取所述目标射频远拉头的中断概率,以 及获取所述目标射频远拉头的时延,并根据所述目标射频远拉头的传输速率、所述目标射频远拉头 的时延中断概率和所述目标射频远拉头的时延,确定所述目标射频远拉头的质量因子,所述目标射 频远拉头为任一射频远拉头。
进一步的,所述获取目标射频远拉头的传输速率,包括:
获取所述射频远拉头下行传输所述目标电力物联网节点的平均信噪比。
根据所述平均信噪比,确定所述目标射频远拉头的传输速率。
现有评价网络性能主要指标有传输速率、时延和中断概率等,系统分配的带宽和当前信道状态 等因素影响着传输速率。时延则是衡量业务完成情况的重要参考条件之一。中断概率则表示数据传 输成功情况。为提升网络性能,合理分配资源,本实施例提出基于电力物联网节点业务QoS的RRH 资源分配策略。
具体来说,定义γr,sum为物联网节点r的总传输速率,
Figure BDA0003234689300000124
为业务r传输的中断概率,下行无线传 输时延用trr表示。假设信道为平坦衰落,则γr,sum受到RRH分配资源的大小和信道质量的影响。由 香农定理可知,所获得带宽资源大小被固定时,传输速率随着传输功率的增大而增加;当传输功率 大小一定时,传输速率受到分配的带宽资源影响,两者呈现正相关趋势。
因为资源总量是固定的,因此传输业务数量的大小影响着资源分配情况,故设rn(t)∈{0,1,…,R}为 在时隙t时RRHn下的节点集合,且有
Figure BDA0003234689300000125
在下行链路传输时,令RRHn在时隙t分配给节 点r的传输功率为pn,r(t),因此平均信噪比为:
Figure BDA0003234689300000131
时隙t时RRHn下行传输节点r的平均信道增益用gn,r(t)表示,在式(17)中分母首项为RRH间的 干扰,其它RRH的发射总功率用pi(t)表示,
Figure BDA0003234689300000132
是RRHr的信道中高斯白噪声功率,RRHr表示第r 个RRH。设RRH总带宽大小为W,每条子信道均分后获得带宽为B′,若br(t)∈{0,1,…W/B′},则RRHr获得带宽资源为
Figure BDA0003234689300000133
传输速率可表示为:
vr,sum(t)=br(t)B′log2(1+γr(t));
当物联网节点接收到所有信息视为业务的完成,因此中断概率可看作所有子信道传输失败概率 之和,设
Figure BDA0003234689300000134
为第r个RRH的第i条子信道中断概率,则RRHr的中断概率表达式如下所示:
Figure BDA0003234689300000135
其中
Figure BDA0003234689300000136
表示不同信道下第r个RRH的第i条子信道中断概率。
考虑现实场景因素,任务的请求来自不同地点,从而导致每条信息到达RRH的时间存在差异, 因此以所有子信道中时延最长的节点r的时延trr为基准,即:
trr=max{trr,1,…,trr,W/B′};
综上所述,我们通过质量因子O来量化节点的状态情况,再结合速率、时延和中断概率综合估 计节点状态,使得结果更具有现实意义。定义参数
Figure BDA0003234689300000137
分别代表最大传输速率、中 断概率以及最大容忍时延,为方便后续运算,处理如所示:
Figure BDA0003234689300000138
Figure BDA0003234689300000139
Figure BDA00032346893000001310
O值越大表示节点的QoS越好,反之O值越小,节点的QoS越差,因此质量因子O定义为:
Figure BDA0003234689300000141
步骤S106,获取射频远拉头的总能耗模型,并根据所述总能耗模型和所述质量因子,生成优 化因子模型。
在本申请的部分实施例中,RRH由传统电网和EH模块提供设备工作所需能量;物联网节点的 充能来自自身电池和EH模块。EH模块将收集到的能量存储在缓存模块中,但由于缓存受限,为减 少收集能量的浪费,优先选择EH模块供能,实现可再生资源分配的时间和空间多样性。将时隙t内 RRH和物联网节点获得的绿色能源定义为:
Figure BDA0003234689300000142
其中
Figure BDA0003234689300000143
表示传统电网在时隙t获得的能量,vn(t)表示在时隙t的能量到达率,第二项表示EH 模块在单位时间Ts收集到的能量。设备本身电子器件的能耗以及数据传输时信号放大等能耗为RRH 和输变电节点能量消耗主要部分,得出本实施例的能耗模型如下所示:
Figure BDA0003234689300000144
单位时间总能量消耗由
Figure BDA0003234689300000145
表示,
Figure BDA0003234689300000146
为单位时间内的基本能量消耗,η表示无线发射效率。 在保障设备正常运行下最大化可再生资源的利用率,总能耗模型如下所示:
Figure BDA0003234689300000147
其中,Pn(t)表示单位时间内的发射能量消耗。
定义优化因子ρt来衡量优化后的网络性能,其是指QoS的O值与传统能量消耗的比值,当ρt越 大表明网络性能越好。通过归一化处理后可得到所述优化因子模型如下:
Figure BDA0003234689300000148
其中,
Figure BDA0003234689300000149
表示单位时间总能量消耗的最大值。
步骤S107,获取时隙的网络状态,并根据所述网络状态和所述优化因子模型,生成所述网络 状态的收益模型。
进一步的,所述获取时隙的网络状态,包括:
根据所述平均信噪比和所述能量到达率回归模型,获取所述网络状态。
进一步的,所述根据所述网络状态,生成所述网络状态的收益模型,包括:
根据所述网络状态,确定网络中的状态转移概率。
根据所述网络中的状态转移概率,确定所述收益模型。
具体来说,RRH和电力物联网节点之间数据传输的无线信道质量具有时变性,此外RRH负载变 化跟节点的调度有关。强化学习基于马尔可夫决策原理,可以模拟环境改变后的网络收益情况。因 此,通过强化学习方法来制定资源分配策略可以将环境变化进行建模,从而得到某环境下网络的最 大收益策略。将节点的调度策略、RRH的资源分配策略分别用状态空间和动作空间来表示。而由于 无线信道的状态是模糊的,引入一种基于行动者评论家(Actor-Critic,AC)框架的异步优势动作评 价算法(Asynchronous advantageactor-critic,A3C),利用A3C算法来进行资源的分配以及节点 的调度。算法主要由行动者(actor)和评论家(critic)两部分组成,其中actor使用策略梯度法得 到特定环境下的最优策略,但是其容易陷入到局部最优。为了解决陷入局部最优问题,通过critic 使用值函数对前者的决策进行评价,根据不同的评价结果解决上述问题。
状态和动作为强化学习两个核心思想,因此令st表示当前时隙t的状态,S表示其状态空间, 由上述分析可得出网络状态受到平均信噪比与能量到达率的影响,通过对E(t)进行归一化处理,则 时间t下的网络状态可由如下式得出:
st=(γ1(t),γ1(t),…,γr(t),Γ1(t),Γ2(t),…Γn(t));
假设状态不会处于某个特定情况,即状态是时变的,at∈A是在时隙t中执行的操作,A表示 一个操作的集合,f为状态转换密度函数,它定义了状态空间中从当前状态st转换到下一个状态s′ 的概率分布。则网络中的状态转移概率表示为:
Figure BDA0003234689300000151
actor网络会决策出时隙t内每个RRH下有多少个节点设备以及每个节点设备所需的发射功率 和带宽资源。因此,其在时隙t时的行为at可以定义为:
at=(un(t),br(t),pn,r(t));
其中un(t)为RRHn下的RRH个数集合,由于actor的行为存在多种变化,因此其是一个向量矩 阵,由RRH个数集合un(t),网络中所有子信道集合br(t),以及传输功率集合pn,r(t)组成。每个状态 的值不仅由当前状态决定,还受后面状态的影响,所以将状态的累积奖励函数求期望可得当前状态 s的状态值:
Figure BDA0003234689300000161
其中,π表示射频远拉头的策略,是网络状态到行为的映射,由π(a|s)=Pr(at=a|st=s)表示, 平均值由函数E[g]表示,β为执行状态的折扣因子,
根据所述当前状态s的状态值,进而确定所述收益模型,如下所示,其中网络动作函数表达式 由Qπ(s,a)表示,含义为当网络状态为s时采取策略π执行动作a获得的收益:
Figure BDA0003234689300000163
步骤S108,根据所述收益模型,确定目标函数表达式。
在本申请的部分实施例中,本步骤使用梯度法求解最优策略,目标函数的优化可以通过调整参 数来完成,从而得到可执行的最优策略。同时为解决因状态空间或动作空间无限带来的一系列问题, 梯度法是一种常见的方法,因为其在求解时不受上述问题的影响。令dπ(s)表示状态s的分布函数, 目标函数表达式的具体表达式如下所示:
J(π)=E[Qπ(s,a)]=∫Sdπ(s)∫Aπ(a|s)Qπ(s,a)dads;
步骤S109,获取预设的第一参数,并根据所述第一参数和所述目标函数表达式,确定目标函 数梯度表达式,所述第一参数用于构建射频远拉头的策略,其中,所述射频远拉头的策略用于对射 频远拉头进行资源分配。
在本申请的部分实施例中,使用第一参数θ=(θ12…,θn)T构建策略π,同时定义πθ(s,a)=Pr(a|s,θ),假设策略π在第一参数θ为非零时是可微的,则目标函数梯度表达式可以如下 所示:
Figure BDA0003234689300000164
函数J(πθ)利用数学运算中的递增梯度方法可以求解出局部最优值。
其中,第一参数θ的梯度变换公式如下所示:
Figure BDA0003234689300000171
其中αa,t>0是采取策略的变换速率,大部分文献中定义为αa,t=0.01。为了合理选择动作的随机 策略π,通过高斯模型来计算策略的出现情况,具体计算方法如下式所示:
Figure BDA0003234689300000172
μ(s)代表在状态s时某个动作出现概率的均值,σ1表示动作的出现波动情况,由πθ(s,a)可得出 网络状态与选择动作的概率分布情况。
步骤S110,获取预设的第二参数和预设的第三参数,所述第二参数用于表示网络状态对应的 函数表达式,所述第三参数用于表示网络状态影响网络决策作用的函数表达式。其中,所述第一参 数、所述第二参数和所述第三参数用于对所述目标函数表达式进行优化。
在本申请的部分实施例中,Bellman方程限定了网络中状态与行为评估的数量,因此有必要对 状态值函数和状态作用值函数做近似处理。基于特征的线性逼近方法在值函数的逼近处理中被广泛 使用,并且在收敛性和稳定性方面都具有出色的性能。因此,基于特征的线性逼近用于状态值函数 V(s)和状态作用值函数Q(s,a)。设第二参数ω=(ω12…,ωm)T,第三参数ξ=(ξ12…,ξm)T分别表示网 络状态对应的函数表达式和此网络状态影响网络决策作用的函数表达式。
步骤S111,根据所述第二参数和所述第三参数,确定优势函数。
进一步的,所述根据所述第二参数和所述第三参数,确定优势函数,包括:
获取状态值函数和状态作用值函数。
根据所述状态值函数、所述状态作用值函数、所述第二参数和所述第三参数,确定所述状态值 函数的线性逼近函数,以及确定所述状态作用值函数的线性逼近函数。
根据所述状态值函数的线性逼近函数、所述状态作用值函数的线性逼近函数、所述第二参数和 所述第三参数,确定所述优势函数。
进一步的,在所述确定所述状态值函数的线性逼近函数,以及确定所述状态作用值函数的线性 逼近函数之后,还包括:
根据所述状态值函数的线性逼近函数和所述状态作用值函数的线性逼近函数,确定时间差分误 差表达式。
根据所述时间差分误差表达式和预设的学习速率,对所述第二参数和所述第三参数进行更新。
具体来说,设状态s中函数表达式V(s)的特征向量为
Figure BDA0003234689300000173
对于某状态在 执行动作a时的状态作用值函数的特征向量为Φ(s,a)=(φ1(s,a),φ2(s,a),…,φm(s,a))T,则状态值函数和状 态作用值函数的线性逼近函数可以表示为:
Figure BDA0003234689300000181
时间差分(Temporal Difference,TD)误差用来计算系统输出结果与真实之间的差值,以此表 示该网络性能好坏。本文利用TD来更新和评估值函数,在给定状态转移样本(st,att+1,st+1,at+1)后, 通过上述函数得到时间差分误差表达式如下:
Figure BDA0003234689300000182
将αc,t>0作为评估值函数的学习速率。为了避免震荡,它的值通常很小,但是如果值太小,则 会引起长期失败收敛的问题,从而影响其执行效率。因此,在确定其大小时需要综合考虑。一般设 为αc,t=0.02。然后,可以使用以下公式更新线性函数逼近方法中参数向量ω和ξ:
Figure BDA0003234689300000183
在本申请的部分实施例中,基于AC框架的计算模型主要包括GAE,PPO,A3C等。A3C模型因 为可以更快的将值函数输出,因此连续迭代步骤处理得更快。另一方面,该框架引入异步训练思想, 使得数据的采样和样本的训练可以并行处理,不但节省了系统存储空间,还提高了模型的训练速度。 A3C核心思想体现为对输出动作质量的评估,若一个动作得到反馈效果较好,则增加actor网络对 此动作的使用概率。否则降低其出现次数。最后通过迭代训练得到符合网络的最佳动作。
假设网络处于状态s时的V为2,且下一步操作中执行动作1的Q值为3,而动作2的Q值为1, 如果仅将Q用作动作评估,由于动作1和2的奖励值都为正,因此网络会增加两个动作的出现概率。 而动作1的出现相比动作2具有更高价值,因此我们更倾向于动作1的出现而不是动作2。故为了 优化此算法的性能,加入优势函数来评价动作值Q,所述优势函数如下所示:
A=Qξ(s,a;ξ)-Vω(s,ω);
步骤S112,根据所述优势函数和所述目标函数梯度表达式,确定目标函数梯度更新式。
在本申请的部分实施例中,根据优势函数,可以将梯度的更新公式改写为:
Figure BDA0003234689300000191
步骤S113,根据所述目标函数梯度更新式、所述第一参数、所述第二参数和所述第三参数, 确定所述第一参数、所述第二参数和所述第三参数的参数综合最优解。
步骤S114,根据所述射频远拉头与基带处理单元之间的映射关系、所述能量到达率回归模型 和所述参数综合最优解,确定混合供电C-RAN的资源分配。
本申请上述实施例公开的一种混合供电C-RAN资源分配方法,首先量化场景中不同射频远拉头 的计算资源需求,通过动态映射基带处理单元与射频远拉头的关联关系,来实现基带处理单元计算 资源的动态分配。然后利用机器学习的线性回归模型学习EH模块能量到达率的特征,并适时修正 以达到预测可再生能量到达率的目的。根据上述所得结果,由强化学习使无线信道状态与网络进行 交互,再基于强化学习中的算法来确定电力物联网中输变电物联网节点设备的调度方案以及射频远 拉头资源分配方案。有效解决现有技术中云无线接入网在面向电力物联网应用中的资源利用不合理 的技术问题。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露 的细节,请参照本申请方法实施例。
本申请第二实施例公开了一种混合供电C-RAN资源分配装置,所述混合供电C-RAN资源分配装 置应用于本申请第一实施例公开的混合供电C-RAN资源分配方法,参见图5所示的结构示意图,所 述混合供电C-RAN资源分配装置包括:
映射关系获取模块201,用于在时隙开始时,获取射频远拉头的计算资源需求,以及获取初始 基带处理单元集合,并根据所述射频远拉头的计算资源需求和所述初始基带处理单元集合,确定射 频远拉头与基带处理单元之间的映射关系,所述初始基带处理单元集合为已激活的全部基带处理单 元。
进一步的,所述映射关系获取模块201包括:
需求集合获取单元,用于根据所述射频远拉头的计算资源需求确定射频远拉头需求集合。
计算资源获取单元,用于获取所述初始基带处理单元集合中任一基带处理单元的计算资源。
集合确定单元,用于根据所述任一基带处理单元的计算资源和所述射频远拉头需求集合,将计 算资源大于所述射频远拉头的计算资源需求的基带处理单元,确定目标基带处理单元集合;。
映射关系确定单元,用于根据所述目标基带处理单元集合,确定射频远拉头与基带处理单元之 间的映射关系。
第一模型生成模块202,用于获取EH模块的能量到达率正态分布模型,并根据所述能量到达 率正态分布模型确定能量到达率二元线性回归模型。
进一步的,所述第一模型生成模块202还包括:
模型判断单元,用于在所述根据所述能量到达率正态分布模型确定能量到达率二元线性回归模 型之后,利用可决系数判断所述能量到达率二元线性回归模型是否适用,若否,则重新建立所述能 量到达率二元线性回归模型。
模型最优解获取模块203,用于根据所述能量到达率二元线性回归模型,确定所述能量到达率 二元线性回归模型的最优解。
进一步的,所述模型最优解获取模块203包括:
预测值获取单元,用于获取任一时刻EH模块的能量到达率的真实值,并根据所述能量到达率 二元线性回归模型,确定所述任一时刻EH模块的能量到达率的预测值;
均方误差获取单元,用于根据所述任一时刻EH模块的能量到达率的真实值和所述任一时刻EH 模块的能量到达率的预测值,确定所述能量到达率二元线性回归模型的均方误差;
最优解获取单元,用于根据所述能量到达率二元线性回归模型的均方误差,确定所述能量到达 率二元线性回归模型的最优解。
第二模型生成模块204,用于根据所述能量到达率正态分布模型、所述能量到达率二元线性回 归模型和所述能量到达率二元线性回归模型的最优解,确定能量到达率回归模型。
质量因子确定模块205,用于获取目标射频远拉头的传输速率,以及获取所述目标射频远拉头 的中断概率,以及获取所述目标射频远拉头的时延,并根据所述目标射频远拉头的传输速率、所述 目标射频远拉头的时延中断概率和所述目标射频远拉头的时延,确定所述目标射频远拉头的质量因 子,所述目标射频远拉头为任一射频远拉头。
进一步的,所述质量因子确定模块205包括:
平均信噪比获取单元,用于获取所述射频远拉头下行传输所述目标电力物联网节点的平均信噪 比。
传输速率获取单元,用于根据所述平均信噪比,确定所述目标射频远拉头的传输速率。
第三模型生成模块206,用于获取射频远拉头的总能耗模型,并根据所述总能耗模型和所述质 量因子,生成优化因子模型。
第四模型生成模块207,用于获取时隙的网络状态,并根据所述网络状态和所述优化因子模型, 生成所述网络状态的收益模型。
进一步的,所述第四模型生成模块207包括:
网络状态获取单元,用于根据所述平均信噪比和所述能量到达率回归模型,获取所述网络状态。
进一步的,所述第四模型生成模块207包括:
状态转移概率获取单元,用于根据所述网络状态,确定网络中的状态转移概率。
收益模型生成单元,用于根据所述网络中的状态转移概率,确定所述收益模型。
目标函数表达式获取模块208,用于根据所述收益模型,确定目标函数表达式。
梯度表达式获取模块209,用于获取预设的第一参数,并根据所述第一参数和所述目标函数表 达式,确定目标函数梯度表达式,所述第一参数用于构建射频远拉头的策略,其中,所述射频远拉 头的策略用于对射频远拉头进行资源分配。
参数获取模块210,用于获取预设的第二参数和预设的第三参数,所述第二参数用于表示网络 状态对应的函数表达式,所述第三参数用于表示网络状态影响网络决策作用的函数表达式。其中, 所述第一参数、所述第二参数和所述第三参数用于对所述目标函数表达式进行优化。
优势函数获取模块211,用于根据所述第二参数和所述第三参数,确定优势函数。
进一步的,所述优势函数获取模块211包括:
状态函数获取单元,用于获取状态值函数和状态作用值函数。
线性逼近函数获取单元,用于根据所述状态值函数、所述状态作用值函数、所述第二参数和所 述第三参数,确定所述状态值函数的线性逼近函数,以及确定所述状态作用值函数的线性逼近函数。
优势函数获取单元,用于根据所述状态值函数的线性逼近函数、所述状态作用值函数的线性逼 近函数、所述第二参数和所述第三参数,确定所述优势函数。
进一步的,所述优势函数获取模块211还包括:
参数更新单元,用于在所述确定所述状态值函数的线性逼近函数,以及确定所述状态作用值函 数的线性逼近函数之后,根据所述状态值函数的线性逼近函数和所述状态作用值函数的线性逼近函 数,确定时间差分误差表达式。根据所述时间差分误差表达式和预设的学习速率,对所述第二参数 和所述第三参数进行更新。
梯度更新式获取模块212,用于根据所述优势函数和所述目标函数梯度表达式,确定目标函数 梯度更新式。
参数综合最优解获取模块213,用于根据所述目标函数梯度更新式、所述第一参数、所述第二 参数和所述第三参数,确定所述第一参数、所述第二参数和所述第三参数的参数综合最优解。
资源分配模块214,用于根据所述射频远拉头与基带处理单元之间的映射关系、所述能量到达 率回归模型和所述参数综合最优解,确定混合供电C-RAN的资源分配。
以上结合具体实施方式和范例性实例对本申请进行了详细说明,不过这些说明并不能理解为对 本申请的限制。本领域技术人员理解,在不偏离本申请精神和范围的情况下,可以对本申请技术方 案及其实施方式进行多种等价替换、修饰或改进,这些均落入本申请的范围内。本申请的保护范围 以所附权利要求为准。

Claims (10)

1.一种混合供电C-RAN资源分配方法,其特征在于,包括:
在时隙开始时,获取射频远拉头的计算资源需求,以及获取初始基带处理单元集合,并根据所述射频远拉头的计算资源需求和所述初始基带处理单元集合,确定射频远拉头与基带处理单元之间的映射关系,所述初始基带处理单元集合为已激活的全部基带处理单元;
获取EH模块的能量到达率正态分布模型,并根据所述能量到达率正态分布模型确定能量到达率二元线性回归模型;
根据所述能量到达率二元线性回归模型,确定所述能量到达率二元线性回归模型的最优解;
根据所述能量到达率正态分布模型、所述能量到达率二元线性回归模型和所述能量到达率二元线性回归模型的最优解,确定能量到达率回归模型;
获取目标射频远拉头的传输速率,以及获取所述目标射频远拉头的中断概率,以及获取所述目标射频远拉头的时延,并根据所述目标射频远拉头的传输速率、所述目标射频远拉头的时延中断概率和所述目标射频远拉头的时延,确定所述目标射频远拉头的质量因子,所述目标射频远拉头为任一射频远拉头;
获取射频远拉头的总能耗模型,并根据所述总能耗模型和所述质量因子,生成优化因子模型;
获取时隙的网络状态,并根据所述网络状态和所述优化因子模型,生成所述网络状态的收益模型;
根据所述收益模型,确定目标函数表达式;
获取预设的第一参数,并根据所述第一参数和所述目标函数表达式,确定目标函数梯度表达式,所述第一参数用于构建射频远拉头的策略,其中,所述射频远拉头的策略用于对射频远拉头进行资源分配;
获取预设的第二参数和预设的第三参数,所述第二参数用于表示网络状态对应的函数表达式,所述第三参数用于表示网络状态影响网络决策作用的函数表达式;其中,所述第一参数、所述第二参数和所述第三参数用于对所述目标函数表达式进行优化;
根据所述第二参数和所述第三参数,确定优势函数;
根据所述优势函数和所述目标函数梯度表达式,确定目标函数梯度更新式;
根据所述目标函数梯度更新式、所述第一参数、所述第二参数和所述第三参数,确定所述第一参数、所述第二参数和所述第三参数的参数综合最优解;
根据所述射频远拉头与基带处理单元之间的映射关系、所述能量到达率回归模型和所述参数综合最优解,确定混合供电C-RAN的资源分配。
2.根据权利要求1所述的混合供电C-RAN资源分配方法,其特征在于,所述根据所述射频远拉头的计算资源需求和所述初始基带处理单元集合,确定射频远拉头与基带处理单元之间的映射关系,包括:
根据所述射频远拉头的计算资源需求确定射频远拉头需求集合;
获取所述初始基带处理单元集合中任一基带处理单元的计算资源;
根据所述任一基带处理单元的计算资源和所述射频远拉头需求集合,将计算资源大于所述射频远拉头的计算资源需求的基带处理单元,确定目标基带处理单元集合;
根据所述目标基带处理单元集合,确定射频远拉头与基带处理单元之间的映射关系。
3.根据权利要求1所述的混合供电C-RAN资源分配方法,其特征在于,所述根据所述能量到达率二元线性回归模型,确定所述能量到达率二元线性回归模型的最优解,包括:
获取任一时刻EH模块的能量到达率的真实值,并根据所述能量到达率二元线性回归模型,确定所述任一时刻EH模块的能量到达率的预测值;
根据所述任一时刻EH模块的能量到达率的真实值和所述任一时刻EH模块的能量到达率的预测值,确定所述能量到达率二元线性回归模型的均方误差;
根据所述能量到达率二元线性回归模型的均方误差,确定所述能量到达率二元线性回归模型的最优解。
4.根据权利要求1所述的混合供电C-RAN资源分配方法,其特征在于,所述获取目标射频远拉头的传输速率,包括:
获取所述射频远拉头下行传输所述目标电力物联网节点的平均信噪比;
根据所述平均信噪比,确定所述目标射频远拉头的传输速率。
5.根据权利要求4所述的混合供电C-RAN资源分配方法,其特征在于,所述获取时隙的网络状态,包括:
根据所述平均信噪比和所述能量到达率回归模型,获取所述网络状态。
6.根据权利要求1所述的混合供电C-RAN资源分配方法,其特征在于,所述根据所述网络状态,生成所述网络状态的收益模型,包括:
根据所述网络状态,确定网络中的状态转移概率;
根据所述网络中的状态转移概率,确定所述收益模型。
7.根据权利要求1所述的混合供电C-RAN资源分配方法,其特征在于,所述根据所述第二参数和所述第三参数,确定优势函数,包括:
获取状态值函数和状态作用值函数;
根据所述状态值函数、所述状态作用值函数、所述第二参数和所述第三参数,确定所述状态值函数的线性逼近函数,以及确定所述状态作用值函数的线性逼近函数;
根据所述状态值函数的线性逼近函数、所述状态作用值函数的线性逼近函数、所述第二参数和所述第三参数,确定所述优势函数。
8.根据权利要求7所述的混合供电C-RAN资源分配方法,其特征在于,在所述确定所述状态值函数的线性逼近函数,以及确定所述状态作用值函数的线性逼近函数之后,还包括:
根据所述状态值函数的线性逼近函数和所述状态作用值函数的线性逼近函数,确定时间差分误差表达式;
根据所述时间差分误差表达式和预设的学习速率,对所述第二参数和所述第三参数进行更新。
9.根据权利要求1所述的混合供电C-RAN资源分配方法,其特征在于,在所述根据所述能量到达率正态分布模型确定能量到达率二元线性回归模型之后,还包括:
利用可决系数判断所述能量到达率二元线性回归模型是否适用,若否,则重新建立所述能量到达率二元线性回归模型。
10.一种混合供电C-RAN资源分配装置,其特征在于,所述混合供电C-RAN资源分配装置应用于权利要求1-9任一项所述的混合供电C-RAN资源分配方法,所述混合供电C-RAN资源分配装置包括:
映射关系获取模块,用于在时隙开始时,获取射频远拉头的计算资源需求,以及获取初始基带处理单元集合,并根据所述射频远拉头的计算资源需求和所述初始基带处理单元集合,确定射频远拉头与基带处理单元之间的映射关系,所述初始基带处理单元集合为已激活的全部基带处理单元;
第一模型生成模块,用于获取EH模块的能量到达率正态分布模型,并根据所述能量到达率正态分布模型确定能量到达率二元线性回归模型;
模型最优解获取模块,用于根据所述能量到达率二元线性回归模型,确定所述能量到达率二元线性回归模型的最优解;
第二模型生成模块,用于根据所述能量到达率正态分布模型、所述能量到达率二元线性回归模型和所述能量到达率二元线性回归模型的最优解,确定能量到达率回归模型;
质量因子确定模块,用于获取目标射频远拉头的传输速率,以及获取所述目标射频远拉头的中断概率,以及获取所述目标射频远拉头的时延,并根据所述目标射频远拉头的传输速率、所述目标射频远拉头的时延中断概率和所述目标射频远拉头的时延,确定所述目标射频远拉头的质量因子,所述目标射频远拉头为任一射频远拉头;
第三模型生成模块,用于获取射频远拉头的总能耗模型,并根据所述总能耗模型和所述质量因子,生成优化因子模型;
第四模型生成模块,用于获取时隙的网络状态,并根据所述网络状态和所述优化因子模型,生成所述网络状态的收益模型;
目标函数表达式获取模块,用于根据所述收益模型,确定目标函数表达式;
梯度表达式获取模块,用于获取预设的第一参数,并根据所述第一参数和所述目标函数表达式,确定目标函数梯度表达式,所述第一参数用于构建射频远拉头的策略,其中,所述射频远拉头的策略用于对射频远拉头进行资源分配;
参数获取模块,用于获取预设的第二参数和预设的第三参数,所述第二参数用于表示网络状态对应的函数表达式,所述第三参数用于表示网络状态影响网络决策作用的函数表达式;其中,所述第一参数、所述第二参数和所述第三参数用于对所述目标函数表达式进行优化;
优势函数获取模块,用于根据所述第二参数和所述第三参数,确定优势函数;
梯度更新式获取模块,用于根据所述优势函数和所述目标函数梯度表达式,确定目标函数梯度更新式;
参数综合最优解获取模块,用于根据所述目标函数梯度更新式、所述第一参数、所述第二参数和所述第三参数,确定所述第一参数、所述第二参数和所述第三参数的参数综合最优解;
资源分配模块,用于根据所述射频远拉头与基带处理单元之间的映射关系、所述能量到达率回归模型、所述优化因子模型以及所述参数综合最优解,确定混合供电C-RAN的资源分配。
CN202110998544.1A 2021-08-27 2021-08-27 一种混合供电c-ran资源分配方法及装置 Pending CN113727451A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110998544.1A CN113727451A (zh) 2021-08-27 2021-08-27 一种混合供电c-ran资源分配方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110998544.1A CN113727451A (zh) 2021-08-27 2021-08-27 一种混合供电c-ran资源分配方法及装置

Publications (1)

Publication Number Publication Date
CN113727451A true CN113727451A (zh) 2021-11-30

Family

ID=78678660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110998544.1A Pending CN113727451A (zh) 2021-08-27 2021-08-27 一种混合供电c-ran资源分配方法及装置

Country Status (1)

Country Link
CN (1) CN113727451A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118555510A (zh) * 2024-07-30 2024-08-27 苏州爱雄斯通信技术有限公司 基于虚拟化技术的光通信装置资源分配方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103945548A (zh) * 2014-04-29 2014-07-23 西安电子科技大学 一种c-ran网络中的资源分配系统及任务/业务调度方法
WO2015060562A1 (ko) * 2013-10-24 2015-04-30 엘지전자 주식회사 클라우드 랜 환경에서 rrh를 통한 하향링크 전송 전력을 설정하는 방법
CN107241223A (zh) * 2017-06-07 2017-10-10 重庆电子工程职业学院 一种基于sdr和虚拟化技术资源弹性协作映射方法及装置
CN108200665A (zh) * 2018-01-31 2018-06-22 电子科技大学 一种远程无线电头和基带处理单元的资源调度优化方法
CN109831808A (zh) * 2019-02-25 2019-05-31 重庆邮电大学 一种基于机器学习的混合供电c-ran的资源分配方法
CN110099415A (zh) * 2019-04-29 2019-08-06 哈尔滨工业大学(深圳) 一种基于流量预测的云无线接入网计算资源分配方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015060562A1 (ko) * 2013-10-24 2015-04-30 엘지전자 주식회사 클라우드 랜 환경에서 rrh를 통한 하향링크 전송 전력을 설정하는 방법
CN103945548A (zh) * 2014-04-29 2014-07-23 西安电子科技大学 一种c-ran网络中的资源分配系统及任务/业务调度方法
CN107241223A (zh) * 2017-06-07 2017-10-10 重庆电子工程职业学院 一种基于sdr和虚拟化技术资源弹性协作映射方法及装置
CN108200665A (zh) * 2018-01-31 2018-06-22 电子科技大学 一种远程无线电头和基带处理单元的资源调度优化方法
CN109831808A (zh) * 2019-02-25 2019-05-31 重庆邮电大学 一种基于机器学习的混合供电c-ran的资源分配方法
CN110099415A (zh) * 2019-04-29 2019-08-06 哈尔滨工业大学(深圳) 一种基于流量预测的云无线接入网计算资源分配方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张阳: "基于TDM-PON和C-RAN架构的休眠", 中国优秀硕士学位论文全文数据库(电子期刊), no. 2020, pages 3 - 4 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118555510A (zh) * 2024-07-30 2024-08-27 苏州爱雄斯通信技术有限公司 基于虚拟化技术的光通信装置资源分配方法及系统

Similar Documents

Publication Publication Date Title
CN110099384B (zh) 基于边-端协同的多用户多mec任务卸载资源调度方法
Zhang et al. Distributed energy management for multiuser mobile-edge computing systems with energy harvesting devices and QoS constraints
CN110113195B (zh) 一种移动边缘计算系统中联合卸载判决和资源分配的方法
CN110928654B (zh) 一种边缘计算系统中分布式的在线任务卸载调度方法
Ke et al. Joint optimization of data offloading and resource allocation with renewable energy aware for IoT devices: A deep reinforcement learning approach
CN109831808B (zh) 一种基于机器学习的混合供电c-ran的资源分配方法
CN107171701B (zh) 一种MassiveMIMO系统基于混合能量采集的功率分配方法
Xie et al. Backscatter-assisted computation offloading for energy harvesting IoT devices via policy-based deep reinforcement learning
Han et al. Energy-aware and QoS-aware load balancing for HetNets powered by renewable energy
Bi et al. Stable online computation offloading via lyapunov-guided deep reinforcement learning
CN113821346B (zh) 基于深度强化学习的边缘计算中计算卸载与资源管理方法
CN116939866A (zh) 一种基于协同计算和资源分配联合优化的无线联邦学习效率提升方法
Jin et al. Deep reinforcement learning based scheduling for minimizing age of information in wireless powered sensor networks
CN115866787A (zh) 融合终端直传通信和多接入边缘计算的网络资源分配方法
Liu et al. Learning-based multi-UAV assisted data acquisition and computation for information freshness in WPT enabled space-air-ground PIoT
CN113727451A (zh) 一种混合供电c-ran资源分配方法及装置
Chen et al. Two-phase deep reinforcement learning of dynamic resource allocation and client selection for hierarchical federated learning
Yu et al. Task delay minimization in wireless powered mobile edge computing networks: A deep reinforcement learning approach
Binh et al. A reinforcement learning algorithm for resource provisioning in mobile edge computing network
CN114615705B (zh) 一种基于5g网络下单用户资源分配策略方法
CN116341679A (zh) 一种高时效的联邦边缘学习调度策略设计方法
Li et al. Real-time optimal resource allocation in multiuser mobile edge computing in digital twin applications with deep reinforcement learning
Zhang et al. Distributed Joint Resource Optimization for Federated Learning Task Distribution
Wan et al. Deep reinforcement learning based computation offloading in SWIPT-assisted MEC networks
Lassila et al. Near-optimal uplink scheduling for age-energy tradeoff in wireless systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination