CN118014256A - 一种基于语义描述的站点价值评估方法和装置 - Google Patents
一种基于语义描述的站点价值评估方法和装置 Download PDFInfo
- Publication number
- CN118014256A CN118014256A CN202410076999.1A CN202410076999A CN118014256A CN 118014256 A CN118014256 A CN 118014256A CN 202410076999 A CN202410076999 A CN 202410076999A CN 118014256 A CN118014256 A CN 118014256A
- Authority
- CN
- China
- Prior art keywords
- site
- value
- model
- data
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000013135 deep learning Methods 0.000 claims abstract description 22
- 238000004364 calculation method Methods 0.000 claims description 55
- 239000013598 vector Substances 0.000 claims description 47
- 230000009466 transformation Effects 0.000 claims description 35
- 238000013136 deep learning model Methods 0.000 claims description 18
- 238000013507 mapping Methods 0.000 claims description 17
- 238000010276 construction Methods 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000010606 normalization Methods 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 13
- 238000005259 measurement Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000002360 preparation method Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 2
- 238000012217 deletion Methods 0.000 abstract description 2
- 230000037430 deletion Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012821 model calculation Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06316—Sequencing of tasks or work
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明属于无线通信技术领域,且公开了一种基于语义描述的站点价值评估方法和装置,该评估方法如下:步骤1,站点基础数据和对应评估测算价值输入;2、对站点数据处理;步骤3,站点价值语义特征模型对站点属性描述数据进行转化:步骤4,采用深度学习站点价值测算模型对站点的价值进行输出:步骤5,最终将训练好的模型进行部署:步骤6,构建编码堆叠的编码器;步骤7,通过编码器模型训练站点价值语义特征模型,步骤8,整合特征预测结果。本发明通过利用站点价值语义特征模型对站点属性进行多维度描述,捕捉隐藏特征,避免数据缺失影响,该方法提高评估准确性,降低成本,支持科学决策,且适用广泛。
Description
技术领域
本发明属于无线通信技术领域,具体为一种基于语义描述的站点价值评估方法和装置。
背景技术
随着5G网络部署带来站点规模扩大、组网复杂化、业务多样化,导致网络规划难度升级,站点优先级规划成为基础工作,站点价值测算尤为重要。传统人力处理速度受限,大数据分析在精细化场景自适应价值匹配方面存在不足,现有方法无法应对,主要体现在5G基站的高密度、低空间、微小化特点,使得站点规模相较于4G网络提升2~3倍,传统的站址选取方法已无法满足5G高密度站址需求,且分析过程复杂费时,同时,5G建设及运维成本高昂,对经济效益提出更高要求,但现有手段缺乏技术支持,站点的描述涉及数值和类别信息,直接转换数字表示会影响预测价值,因此,需探索新的方法,准确定义站点,以满足5G网络规划的复杂需求。
发明内容
本发明的目的在于提供一种基于语义描述的站点价值评估方法和装置,以解决上述背景技术中提出的问题。
为了实现上述目的,本发明提供如下技术方案:一种基于语义描述的站点价值评估方法和装置,该评估方法如下:
步骤1,站点基础数据和对应评估测算价值输入:准备站点类别和文本描述数据,供深度神经网络学习语义知识;
步骤2、对站点属性描述数据进行处理:按照区域、需求、场景、问题点、建设、结构顺序排列指标,使用逗号分割站点属性描述数据;
步骤3,站点价值语义特征模型对站点属性描述数据进行转化:将步骤2处理后的数据通过站点价值语义特征模型转化为特征,输入深度学习模型进行离线训练;
步骤4,采用深度学习站点价值测算模型对站点的价值进行输出:将步骤3中生成的站点价值语义特征输入到深度学习模型中进行离线训练,模型学习到站点属性描述数据与价值测算分数之间的映射关系,并输出预测的站点价值;
步骤5,最终将训练好的模型进行部署,对新输入的站点信息进行价值预测:将训练好的模型部署到实际生产环境中,当输入新的站点信息时,系统自动进行价值预测并输出结果;
步骤6,构建编码堆叠的编码器:利用步骤3中的站点价值语义特征模型进行编码堆叠的编码器进行编码;
步骤7,通过编码器模型训练站点价值语义特征模型,利用深度学习模型进行特征变换和规范化处理,实现非线性映射和随机采样,以准确预测站点价值;
步骤8,整合特征并映射为站点价值预测结果,完成价值评估。
优选地,所述步骤1中的评估测算价值输入,准备数据包括准备区域、需求、场景、问题点、建设、结构类型特征数据,以及人工标注的站点价值测算分数作为测试和验证数据,这些数据将用于构建深度学习模型,并进行相应处理;
输入的数据涵盖了区域、需求、场景、问题点、建设、结构类型特征,以及相应的价值测算分数,数据细节反映了站点的多样性和复杂性,为深度学习模型的构建提供了丰富的信息,通过特征和分数,模型能够更精确地预测站点的价值,为后续的决策提供有力支持,处理这些数据是构建高效、准确的站点价值预测模型的关键步骤,对于提高网络覆盖和容量,优化资源配置具有重要意义,其中输入数据样例如图5所示。
优选地,所述步骤2中站点数据处理是将指标按照固定顺序进行排列,顺序为区域类型、需求类型、场景类型、问题点类型、建设类型、结构问题类,标明不同站点属性描述数据的指标属性,并用分割字符逗号进行区分,如站点a的描述站点属性描述数据为:“主城区,覆盖+容量,高校,劣于竞争对手,共址新建,超远”,并将其切换为具有语义的属性文本描述,其中,数据处理后的数据样例图如图6所示。
优选地,所述步骤3中的站点价值语义特征模型是将步骤2中处理后的数据通过站点价值语义特征模型转化为站点价值语义特征,然后输入到基于深度学习的站点价值测算模型中进行离线训练,以学习站点属性描述数据和价值测算分数之间的映射关系;
该模型的具体的步骤如下:
A1,将处理后的站点属性描述数据加入标识符[CLS]和[SEP],进行向量嵌入操作,生成特征矩阵;
A2,通过多个编码器堆叠结构组成的站点价值计算模块,对特征矩阵进行信息增强和注意力计算,提取站点价值语义特征;
A3,将提取的特征向量作为站点价值语义特征,用于后续的深度学习模型训练和站点价值预测。
优选地,
所述步骤4中站点价值计算模块具备强大的特征提取能力,深度学习站点预测模型采用两次价值特征计算和一次结果预测的网络结构,该结构利用特征变换、数据规范化处理、非线性变换和价值数据随机采样技术,以实现准确的站点价值预测;
具体步骤如下:
B1,通过第一个价值特征计算对数据进行处理,得到新的向量,包括特征变换、数据规范化处理、非线性变换和随机采样;
B2,第二个价值特征计算对第一个价值特征计算的输出进行相同的处理,生成更高层次的特征表示;
B3,通过结果预测特征变换对第二个价值特征计算的输出进行线性变换,得到站点价值预测的标量,同时利用损失函数优化模型参数,不断减小预测与真实值之间的差异,提高预测准确度。
优选地,所述步骤5中训练好的模型进行部署,以对新输入的站点信息进行价值预测,对于输入的站点a信息,首先对其进行处理,将描述属性组合成完整的属性描述数据,目的是将原始数据转化为模型可接受的格式,然后,将处理后的数据输入到站点价值语义特征模型中,生成站点价值的语义特征向量,这个向量捕捉站点的潜在价值信息,最后,将特征向量输入到深度学习站点预测模型中,得出站点的最终价值评分为89.63,反映模型对站点的价值估计。
优选地,所述步骤6中模型通过掩码预测和下一段预测两个任务对站点属性描述数据进行训练,以有效捕捉文本中的上下文和语义关系,首先,利用掩码预测任务,随机掩盖输入数据中的部分词语,然后通过编码器模型进行编码,该编码器模型由分布信息增强模块和特征计算前馈模块组成,能够逐层学习和整合输入数据的特征表示,在处理掩盖输入时,编码器利用上下文信息和语义关联预测被掩盖的词语,接下来,通过下一段预测任务,将站点属性描述数据分为两段进行输入,编码器模型对这两段句子进行编码。
优选地,所述步骤7中在特征提取过程中,编码器模型逐层对新的站点属性描述数据进行编码,生成相应的特征表示,这些特征表示包含了详细的语义信息和上下文关联,能够更准确地表达站点的特征和潜在价值,通过步骤3中站点价值语义特征模型,将站点属性描述数据转化为具有一定维度的价值语义特征,以便深度学习站点价值预测模型更好地利用这些特征进行预测和评估,在步骤4中深度学习站点价值预测模型,特征变换利用神经网络结构对输入的特征进行非线性映射和提取,得到更具代表性的特征表示,对特征向量进行规范化处理和激活函数映射,以消除量纲差异、提高稳定性和准确性,并捕捉更复杂的特征模式,最后,通过随机采样部分特征进行训练,降低过拟合风险并增强模型的泛化能力,以适应更广泛的站点数据。
优选地,所述步骤8中是对权利8中的内容进行总结,通过步骤7中完成两次的价值特征计算后,得到的特征进行汇总和整合,接下来,通过一次结果预测的网络层,将这些特征映射为最终的站点价值预测结果,这一网络层由全连接层和输出层组成,能够对特征进行加权和综合,从而得出最终的站点价值预测。
优选地,所述该装置由数据规范化处理、特征计算前馈模块和分布信息增强模块组成。
本发明的有益效果如下:
本发明通过利用站点价值语义特征模型对站点属性进行多维度描述,捕捉隐藏特征,避免数据缺失影响,该方法提高评估准确性,降低成本,支持科学决策,且适用广泛,同时,使用预训练的站点价值语义特征模型,对站点的属性描述数据进行深度学习和建模,提高了价值评估的准确性,该模型能够全面、准确地评估站点价值,更好地应对复杂多变的情况,与传统的基于规则或简单模型的方法相比,本发明能够节省大量的人力和时间成本,降低人工干预和数据标注的需求,此外,根据模型的输出结果,可以为站点规划和网络优化决策提供科学支持,使决策更加准确、有效,同时,该方法具有广泛的适用性,不仅适用于基站价值评估,还可扩展至房地产、城市规划、商业营销领域,综上所述,基于语义描述的站点价值评估方法具有显著的技术先进性和广阔的商业前景。
附图说明
图1为本发明方法和装置图;
图2为本发明站点价值语义特征模型结构图;
图3为本发明站点价值计算模块结构图;
图4为本发明站点预测模型结构图;
图5为本发明输入数据样例图;
图6为本发明数据处理后的数据样例图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1至图6所示,本发明实施例提供了一种基于语义描述的站点价值评估方法和装置该评估方法如下:
步骤1,站点基础数据和对应评估测算价值输入:准备站点类别和文本描述数据,供深度神经网络学习语义知识;
步骤2、对站点属性描述数据进行处理:按照区域、需求、场景、问题点、建设、结构顺序排列指标,使用逗号分割站点属性描述数据;
步骤3,站点价值语义特征模型对站点属性描述数据进行转化:将步骤2处理后的数据通过站点价值语义特征模型转化为特征,输入深度学习模型进行离线训练。
步骤4,采用深度学习站点价值测算模型对站点的价值进行输出:将步骤3中生成的站点价值语义特征输入到深度学习模型中进行离线训练,模型学习到站点属性描述数据与价值测算分数之间的映射关系,并输出预测的站点价值;
步骤5,最终将训练好的模型进行部署,对新输入的站点信息进行价值预测:将训练好的模型部署到实际生产环境中,当输入新的站点信息时,系统自动进行价值预测并输出结果;
步骤6,构建编码堆叠的编码器:利用步骤3中的站点价值语义特征模型进行编码堆叠的编码器进行编码;
步骤7,通过编码器模型训练站点价值语义特征模型,利用深度学习模型进行特征变换和规范化处理,实现非线性映射和随机采样,以准确预测站点价值;
步骤8,整合特征并映射为站点价值预测结果,完成价值评估。
其中,所述步骤1中的评估测算价值输入,准备数据包括准备区域、需求、场景、问题点、建设、结构类型特征数据,以及人工标注的站点价值测算分数作为测试和验证数据,这些数据将用于构建深度学习模型,并进行相应处理;
输入的数据涵盖了区域、需求、场景、问题点、建设、结构类型特征,以及相应的价值测算分数,数据细节反映了站点的多样性和复杂性,为深度学习模型的构建提供了丰富的信息,通过特征和分数,模型能够更精确地预测站点的价值,为后续的决策提供有力支持,处理这些数据是构建高效、准确的站点价值预测模型的关键步骤,对于提高网络覆盖和容量,优化资源配置具有重要意义,其中输入数据样例如图5所示。
其中,所述步骤2中站点数据处理是将指标按照固定顺序进行排列,顺序为区域类型、需求类型、场景类型、问题点类型、建设类型、结构问题类,标明不同站点属性描述数据的指标属性,并用分割字符逗号进行区分,如站点a的描述站点属性描述数据为:“主城区,覆盖+容量,高校,劣于竞争对手,共址新建,超远”,并将其切换为具有语义的属性文本描述,其中,数据处理后的数据样例图如图6所示。
其中,所述步骤3中的站点价值语义特征模型是将步骤2中处理后的数据通过站点价值语义特征模型转化为站点价值语义特征,然后输入到基于深度学习的站点价值测算模型中进行离线训练,以学习站点属性描述数据和价值测算分数之间的映射关系;
该模型的具体的步骤如下:
A1,将处理后的站点属性描述数据加入标识符[CLS]和[SEP],进行向量嵌入操作,生成特征矩阵;
在向量嵌入操作中,对站点属性描述数据的属性编号和顺序编号进行嵌入。以站点a为例,其属性编号为“00001111…”,顺序编号为“01234567…”。将三个序列的信息都做向量嵌入,再将三者的嵌入向量按顺序对应相加,得到特征矩阵X={x1,…xn}∈Rn×d,d为每个向量扩展的维度。该矩阵为每个向量扩展一定维度,并送入到站点价值计算模块中。此操作旨在为深度学习模型提供准确信息,以便更好地预测站点价值,站点价值计算模块具体结构如图3所示。
A2,通过多个编码器堆叠结构组成的站点价值计算模块,对特征矩阵进行信息增强和注意力计算,提取站点价值语义特征;
站点价值计算模块通过多个编码器堆叠结构组成,每个编码器包含多个分布式信息增强模块,采用信息自增强算法处理特征信息矩阵,具体而言,通过对特征信息矩阵应用3个独立的权重向量,WQ,WK,WV∈Rd×h(其中维度为(d*h),进行线性变换操作。其中,表示隐藏维度。这一操作得到了查询矩阵Q=(q1,…qn)∈Rn×h,键矩阵K=(k1,…kn)∈Rn×h,值矩阵V=(v1,…vn)∈Rn×h,这里的qi,ki,vi分别代表查询向量、键向量和值向量,其中取自于集合。通过这种方式,信息增强机制能够有效地提取和处理特征信息,为站点价值计算模块的功能提供支持;
在获得3个向量矩阵后,进行放缩点积注意力计算,通过点积运算计算查询向量与键向量之间的相似度,避免其过大影响,规范化后得到概率分布衡量关注程度。最后,将概率分布与值向量进行点积运算,并相加以得到最终权重,从而得到了最终的权重矩阵输出放缩点积注意力计算的表达式如公式所示;
分布信息增强机制拼接权重矩阵特征,经1层特征变换送入前馈模块2层特征变换+非线性变换,公式如下;
FFN(X)=max(0,xW1+b1)W2+b2
通过前馈模块输出的特征信息长度n与站点属性描述数据输入长度相同,每个向量扩展的维度与输入时一致,所以站点价值计算模块可以依次堆叠起来组合使用。
A3,将提取的特征向量作为站点价值语义特征,用于后续的深度学习模型训练和站点价值预测。
在站点价值计算模块中,每个站点属性描述数据都通过添加[CLS]标识符进行特征提取。该模块对输入数据进行编码,生成每个位置的输出向量。特别地,[CLS]位置的输出向量完整地包含了输入数据的所有信息,代表了该站点的价值语义特征这个特征可以用于预测站点的价值。经过统一化处理后,这些数据可用于下游任务的训练。
其中,所述步骤4中站点价值计算模块具备强大的特征提取能力,深度学习站点预测模型采用两次价值特征计算和一次结果预测的网络结构。该结构利用特征变换、数据规范化处理、非线性变换和价值数据随机采样技术,以实现准确的站点价值预测;
具体步骤如下:
B1,通过第一个价值特征计算对数据进行处理,得到新的向量,包括特征变换、数据规范化处理、非线性变换和随机采样;
进行特征变换处理,提取和变换输入数据的特征,接着对新向量进行数据规范化处理,使其服从正态分布,提高模型的泛化能力和训练速度。然后使用激活函数进行非线性变换,增强模型的表达能力和复杂度。最后进行价值数据随机采样,减少参数间的相互依赖,避免过拟合;
第一个价值特征计算的输入尺寸为[N,d],输出尺寸为[N,160],这里的是价值语义特征的扩展维度,而则表示批次样本数据个数,第一个价值特征计算能够有效地对数据进行处理和提取特征,为后续处理提供支持。
B2,第二个价值特征计算对第一个价值特征计算的输出进行相同的处理,生成更高层次的特征表示;
第二个价值特征计算对第一个价值特征的输出进行相同处理,得到新的向量。这一过程包括特征变换、数据规范化、非线性变换和价值数据随机采样,以进一步提取和变换特征,与第一个价值特征计算相比,第二个价值特征计算的输出具有更高层次和更抽象的特征表示能力,能够更好地反映特征之间的差异和相似度,提供更深入细致的价值信息,第二个价值特征计算的输入尺寸为[N,160],输出尺寸为[N,32],经过第二个价值特征计算后,每个样本的特征维度被压缩为32,这种维度的压缩可以减少特征的冗余程度,并且有助于提高模型的运行效率和表达能力。
B3,通过结果预测特征变换对第二个价值特征计算的输出进行线性变换,得到站点价值预测的标量,同时利用损失函数优化模型参数,不断减小预测与真实值之间的差异,提高预测准确度。
通过结果预测特征变换,对第二个价值特征计算的输出进行线性变换,得到站点的价值预测。此变换将高维特征向量映射为实数值,用于回归任务。参数可利用反向传播算法更新,以提升模型准确性和稳定性。优化参数使模型更好地适应数据,提高站点价值预测的准确度。
通过将站点价值语义特征转化为预测值,利用损失函数评估预测与真实值的差异,调整网络模型参数,提高预测准确度。优化目标为不断减小损失函数的值,利用反向传播算法更新参数,使模型预测结果接近真实值,直至损失函数收敛。损失函数Loss公式下所示:
其中Yi代表真实值,代表网络预测值,N则是批次样本数据个数。
站点价值语义特征模型和深度学习站点价值测算模型的任务不同,因此参数调整方式也不同。对于前者,只需微调模型参数,即在已训练好的基础上,设置小学习率进行优化,以保留原有参数的有效性并使模型更适应当前问题。
其中,所述步骤5中训练好的模型进行部署,以对新输入的站点信息进行价值预测,对于输入的站点a信息,首先对其进行处理,将描述属性组合成完整的属性描述数据,目的是将原始数据转化为模型可接受的格式。然后,将处理后的数据输入到站点价值语义特征模型中,生成站点价值的语义特征向量。这个向量捕捉站点的潜在价值信息,最后,将特征向量输入到深度学习站点预测模型中,得出站点的最终价值评分为89.63,反映模型对站点的价值估计。
预测站点价值是关键环节,需要经过预处理、特征提取和模型计算步骤。首先,对原始数据进行清理和整合,确保质量和一致性,为特征提取打下基础。接着,从预处理后的数据中识别与站点价值相关的特征,如网站流量、内容质量、用户互动度。这些特征将作为输入传递给站点价值语义特征模型和深度学习站点预测模型。在模型计算阶段,特征被输入到站点价值语义特征模型中,利用先进算法和技术生成表示站点价值的语义特征向量。最后,将生成的语义特征向量输入到深度学习站点预测模型中,利用其强大的学习和预测能力得出站点的最终价值评分。
其中,所述步骤6中模型通过掩码预测和下一段预测两个任务对站点属性描述数据进行训练,以有效捕捉文本中的上下文和语义关系,首先,利用掩码预测任务,随机掩盖输入数据中的部分词语,然后通过编码器模型进行编码。该编码器模型由分布信息增强模块和特征计算前馈模块组成,能够逐层学习和整合输入数据的特征表示,在处理掩盖输入时,编码器利用上下文信息和语义关联预测被掩盖的词语,接下来,通过下一段预测任务,将站点属性描述数据分为两段进行输入,编码器模型对这两段句子进行编码。
编码器比较第一段语句的特征表示与第二段语句的特征表示,判断它们是否连续,从而培养模型对语句之间关系的理解能力。这种训练方式使模型能够更准确地提取站点属性描述数据的特征表示,为后续的站点价值预测提供有力支持。
其中,所述步骤7中在特征提取过程中,编码器模型逐层对新的站点属性描述数据进行编码,生成相应的特征表示,这些特征表示包含了详细的语义信息和上下文关联,能够更准确地表达站点的特征和潜在价值,通过步骤3中站点价值语义特征模型,将站点属性描述数据转化为具有一定维度的价值语义特征,以便深度学习站点价值预测模型更好地利用这些特征进行预测和评估,在步骤4中深度学习站点价值预测模型,特征变换利用神经网络结构对输入的特征进行非线性映射和提取,得到更具代表性的特征表示,对特征向量进行规范化处理和激活函数映射,以消除量纲差异、提高稳定性和准确性,并捕捉更复杂的特征模式,最后,通过随机采样部分特征进行训练,降低过拟合风险并增强模型的泛化能力,以适应更广泛的站点数据。
其中,所述步骤8中是对权利8中的内容进行总结,通过步骤7中完成两次的价值特征计算后,得到的特征进行汇总和整合,接下来,通过一次结果预测的网络层,将这些特征映射为最终的站点价值预测结果,这一网络层由全连接层和输出层组成,能够对特征进行加权和综合,从而得出最终的站点价值预测,这一过程确保了预测结果的准确性和可靠性,为决策者提供了有价值的参考信息。
采用深度学习站点价值测算模型,通过多次处理和整合,充分利用提取的价值向量特征,能够更准确、全面地预测站点价值这为站点选址决策和评估提供更可靠、更有针对性的信息参考,有助于做出明智的决策。
其中,所述该装置由数据规范化处理、特征计算前馈模块和分布信息增强模块组成。
通过数据规范化处理,我们确保了数据的规范性和一致性,消除了不同来源数据间的差异和冲突。这为后续的数据分析和模型训练提供了高质量的数据输入,确保了准确性和可靠性。
特征计算前馈模块在模型中起到了关键作用,显著增强了特征提取能力。它使模型能够逐层学习和整合输入数据的特征表示,深入挖掘数据的内在规律和特征。这不仅有助于提取更有意义的特征表示,还提高了模型的泛化能力和鲁棒性,使其能更好地适应各种复杂场景和数据变化。
此外,分布信息增强模块提高了模型的预测精度。在文本处理和自然语言处理中,该模块利用上下文信息和语义关联来预测被掩盖的词语。这增强了模型对上下文信息的理解和处理能力,提高了模型在处理自然语言相关任务时的准确性和可靠性
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其同物限定。
Claims (10)
1.一种基于语义描述的站点价值评估方法,其特征在于:该评估方法如下:
步骤1,站点基础数据和对应评估测算价值输入:准备站点类别和文本描述数据,供深度神经网络学习语义知识;
步骤2、对站点属性描述数据进行处理:按照区域、需求、场景、问题点、建设、结构顺序排列指标,使用逗号分割站点属性描述数据;
步骤3,站点价值语义特征模型对站点属性描述数据进行转化:将步骤2处理后的数据通过站点价值语义特征模型转化为特征,输入深度学习模型进行离线训练;
步骤4,采用深度学习站点价值测算模型对站点的价值进行输出:将步骤3中生成的站点价值语义特征输入到深度学习模型中进行离线训练,模型学习到站点属性描述数据与价值测算分数之间的映射关系,并输出预测的站点价值;
步骤5,最终将训练好的模型进行部署,对新输入的站点信息进行价值预测:将训练好的模型部署到实际生产环境中,当输入新的站点信息时,系统自动进行价值预测并输出结果;
步骤6,构建编码堆叠的编码器:利用步骤3中的站点价值语义特征模型进行编码堆叠的编码器进行编码;
步骤7,通过编码器模型训练站点价值语义特征模型,利用深度学习模型进行特征变换和规范化处理,实现非线性映射和随机采样,以准确预测站点价值;
步骤8,整合特征并映射为站点价值预测结果,完成价值评估。
2.根据权利要求1所述的一种基于语义描述的站点价值评估方法,其特征在于:所述步骤1中的评估测算价值输入,准备数据包括准备区域、需求、场景、问题点、建设、结构类型特征数据,以及人工标注的站点价值测算分数作为测试和验证数据,这些数据将用于构建深度学习模型,并进行相应处理;
输入的数据涵盖了区域、需求、场景、问题点、建设、结构类型特征,以及相应的价值测算分数,通过特征和分数,模型能够更精确地预测站点的价值,处理这些数据是构建高效、准确的站点价值预测模型的关键步骤。
3.根据权利要求1所述的一种基于语义描述的站点价值评估方法,其特征在于:所述步骤2中站点数据处理是将指标按照固定顺序进行排列,顺序为区域类型、需求类型、场景类型、问题点类型、建设类型、结构问题类,标明不同站点属性描述数据的指标属性,并用分割字符逗号进行区分,如站点a的描述站点属性描述数据为:“主城区,覆盖+容量,高校,劣于竞争对手,共址新建,超远”,并将其切换为具有语义的属性文本描述。
4.根据权利要求1所述的一种基于语义描述的站点价值评估方法,其特征在于:所述步骤3中的站点价值语义特征模型是将步骤2中处理后的数据通过站点价值语义特征模型转化为站点价值语义特征,然后输入到基于深度学习的站点价值测算模型中进行离线训练,以学习站点属性描述数据和价值测算分数之间的映射关系;
该模型的具体的步骤如下:
A1,将处理后的站点属性描述数据加入标识符[CLS]和[SEP],进行向量嵌入操作,生成特征矩阵;
A2,通过多个编码器堆叠结构组成的站点价值计算模块,对特征矩阵进行信息增强和注意力计算,提取站点价值语义特征;
A3,将提取的特征向量作为站点价值语义特征,用于后续的深度学习模型训练和站点价值预测。
5.根据权利要求1所述的一种基于语义描述的站点价值评估方法,其特征在于:所述步骤4中站点价值计算模块具备强大的特征提取能力,深度学习站点预测模型采用两次价值特征计算和一次结果预测的网络结构,该结构利用特征变换、数据规范化处理、非线性变换和价值数据随机采样技术,以实现准确的站点价值预测;
具体步骤如下:
B1,通过第一个价值特征计算对数据进行处理,得到新的向量,包括特征变换、数据规范化处理、非线性变换和随机采样;
B2,第二个价值特征计算对第一个价值特征计算的输出进行相同的处理,生成更高层次的特征表示;
B3,通过结果预测特征变换对第二个价值特征计算的输出进行线性变换,得到站点价值预测的标量,同时利用损失函数优化模型参数,不断减小预测与真实值之间的差异,提高预测准确度。
6.根据权利要求1所述的一种基于语义描述的站点价值评估方法,其特征在于:所述步骤5中训练好的模型进行部署,以对新输入的站点信息进行价值预测,对于输入的站点a信息,首先对其进行处理,将描述属性组合成完整的属性描述数据,目的是将原始数据转化为模型可接受的格式,然后,将处理后的数据输入到站点价值语义特征模型中,生成站点价值的语义特征向量,这个向量捕捉站点的潜在价值信息,最后,将特征向量输入到深度学习站点预测模型中,得出站点的最终价值评分为89.63,反映模型对站点的价值估计。
7.根据权利要求1所述的一种基于语义描述的站点价值评估方法,其特征在于:所述步骤6中模型通过掩码预测和下一段预测两个任务对站点属性描述数据进行训练,利用掩码预测任务,随机掩盖输入数据中的部分词语,然后通过编码器模型进行编码,该编码器模型由分布信息增强模块和特征计算前馈模块组成,能够逐层学习和整合输入数据的特征表示,在处理掩盖输入时,编码器利用上下文信息和语义关联预测被掩盖的词语,接下来,通过下一段预测任务,将站点属性描述数据分为两段进行输入,编码器模型对这两段句子进行编码。
8.根据权利要求1所述的一种基于语义描述的站点价值评估方法,其特征在于:所述步骤7中在特征提取过程中,编码器模型逐层对新的站点属性描述数据进行编码,生成相应的特征表示,这些特征表示包含了详细的语义信息和上下文关联,能够更准确地表达站点的特征和潜在价值;
通过步骤3中站点价值语义特征模型,将站点属性描述数据转化为具有一定维度的价值语义特征,在步骤4中深度学习站点价值预测模型,特征变换利用神经网络结构对输入的特征进行非线性映射和提取,得到更具代表性的特征表示,对特征向量进行规范化处理和激活函数映射,并捕捉更复杂的特征模式,最后,通过随机采样部分特征进行训练,降低过拟合风险并增强模型的泛化能力,以适应更广泛的站点数据。
9.根据权利要求8所述的一种基于语义描述的站点价值评估方法,其特征在于:所述步骤8中是对权利8中的内容进行总结,通过步骤7中完成两次的价值特征计算后,得到的特征进行汇总和整合,接下来,通过一次结果预测的网络层,将这些特征映射为最终的站点价值预测结果,这一网络层由全连接层和输出层组成,能够对特征进行加权和综合,从而得出最终的站点价值预测。
10.根据权利要求1所述的一种基于语义描述的站点价值评估装置,其特征在于:该装置由数据规范化处理、特征计算前馈模块和分布信息增强模块组成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410076999.1A CN118014256A (zh) | 2024-01-18 | 2024-01-18 | 一种基于语义描述的站点价值评估方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410076999.1A CN118014256A (zh) | 2024-01-18 | 2024-01-18 | 一种基于语义描述的站点价值评估方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118014256A true CN118014256A (zh) | 2024-05-10 |
Family
ID=90942112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410076999.1A Pending CN118014256A (zh) | 2024-01-18 | 2024-01-18 | 一种基于语义描述的站点价值评估方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118014256A (zh) |
-
2024
- 2024-01-18 CN CN202410076999.1A patent/CN118014256A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112419096B (zh) | 基于nlp信息萃取与少样本自学习的用户用电诉求工单自动流转方法 | |
CN117436724B (zh) | 一种基于智慧城市的多源数据可视化分析方法及系统 | |
CN111401603A (zh) | 一种多类型能源需求预测方法 | |
CN113887694A (zh) | 一种注意力机制下基于特征表征的点击率预估模型 | |
CN113298318A (zh) | 一种新型的配电变压器重过载预测方法 | |
CN115983710A (zh) | 高比例新能源接入的电力系统基建项目决策方法及系统 | |
CN118260689A (zh) | 一种基于自适应低秩参数高效微调的日志异常检测方法 | |
CN114707829A (zh) | 基于结构化数据线性展开的目标人员再犯风险预测方法 | |
CN117634459B (zh) | 目标内容生成及模型训练方法、装置、系统、设备及介质 | |
CN118194487A (zh) | 一种电路与用电设备自动化布置方法、介质及系统 | |
CN117034780B (zh) | 一种基于深度学习的多尺度次季节降水量预测方法 | |
CN113705695A (zh) | 一种基于卷积神经网络的配电网故障数据辨识方法 | |
CN116186350B (zh) | 基于知识图谱和主题文本的输电线路工程搜索方法和装置 | |
CN112801360A (zh) | 一种出租车需求预测方法、系统和设备 | |
CN114647987B (zh) | 基于时空相关性模型的分布式光伏电站日前出力预测方法 | |
CN118014256A (zh) | 一种基于语义描述的站点价值评估方法和装置 | |
CN115801152A (zh) | 基于层次化transformer模型的WiFi动作识别方法 | |
CN113487194B (zh) | 一种基于文本分类的电力系统调度员等级评估系统 | |
CN114997475A (zh) | 一种基于Kmeans的融合模型光伏发电短期预测方法 | |
Zhong et al. | An incremental identification method for fraud phone calls based on broad learning system | |
CN113469267A (zh) | 一种基于深度特征检索的文本图像字符识别方法与系统 | |
CN115633090B (zh) | 一种基于eSIM卡和5G网络的多源数据链接方法 | |
CN117640695B (zh) | 基于通讯标识信息的物联网通信平台和物联网通信方法 | |
CN117692026B (zh) | 一种电力线通信的链路感知方法及装置 | |
CN114170664B (zh) | 一种基于自注意力机制进行链接预测的人脸图像聚类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |