CN113642822A - 用于评估建筑群结构安全的基于vae的样本集指向性扩展法 - Google Patents

用于评估建筑群结构安全的基于vae的样本集指向性扩展法 Download PDF

Info

Publication number
CN113642822A
CN113642822A CN202110369675.3A CN202110369675A CN113642822A CN 113642822 A CN113642822 A CN 113642822A CN 202110369675 A CN202110369675 A CN 202110369675A CN 113642822 A CN113642822 A CN 113642822A
Authority
CN
China
Prior art keywords
latent variable
index
latent
sample
contribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110369675.3A
Other languages
English (en)
Other versions
CN113642822B (zh
Inventor
焦柯
王俊杰
彭子祥
赖鸿立
蒋运林
吴桂广
胡承恩
袁辉
王文波
谭丽红
杨新
邱敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Architectural Design and Research Institute of Guangdong Province
Original Assignee
Architectural Design and Research Institute of Guangdong Province
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Architectural Design and Research Institute of Guangdong Province filed Critical Architectural Design and Research Institute of Guangdong Province
Publication of CN113642822A publication Critical patent/CN113642822A/zh
Application granted granted Critical
Publication of CN113642822B publication Critical patent/CN113642822B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Operations Research (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种用于评估建筑群结构安全的基于VAE的样本集指向性扩展法,可一定程度内对原有样本指标没有取值的样本空间进行指向性补充,使基础样本能遍布样本取值空间,由于VAE模型的潜变量空间具有先验分布的特性,且土木工程技术领域的样本分布与高斯分布相符,因此对样本进行指向性补充后,再以扩充样本集训练得出的解码器能产生适合深度学习模型容量的有效样本集,以便于依据改样本数据来进行深度学习以对建筑群进行安全评估。

Description

用于评估建筑群结构安全的基于VAE的样本集指向性扩展法
技术领域
本发明设计一种机器学习领域,特别涉及一种专业领域样本集指向性扩展 的方法。
背景技术
自2006年深度学习兴起以来,人工智能已初有规模地应用于各行各业。但 传统行业因样本收集难度大、成本高、涉及个人隐私等原因,难以收集到足以代 表总体的样本数量及分布进行深度学习。如土木工程行业,一栋房屋结构有关的 详细信息涉及地基勘察、结构设计、环境状况、历史使用情况等方面,不整合及 建立全地区房屋信息库的情况下,单个机构拥有的样本数量及质量远不足以进 行深度学习。
深度学习在对样本分布没有先验知识、噪音及错误样本的干扰下,容易拟 合出不符合实际总体,只对当前训练集有效的模型,即过拟合。通过改进学习模 型解决此问题的方法有:
给样本加入随机噪声,淡化原噪声的影响及一定程度上平均化异常样本;
通过正则化控制权重取值偏向取小值,使该学习模型不对某些特定样本产 生过大偏好。
上述这类着手于改进学习模型的方法一定程度上能缓和过拟合的问题,但 其有效性不能保证,而且需要多次重复调整超参数才能找到过拟合相对较小的 模型。
为了加快传统行业进入智能时代的步伐,在针对传统行业训练集少且分布 不均匀的情况下,VAE(Variational-Autoencoder)作为一种生成式模型,具备 高自由度、有指向性、且能满足已有样本分布,通过新样本集最大化利用原有样 本,结合专业领域知识,使训练集趋近满足i.d.d.(independent and identically distributed)假设,该假设是大多数模型训练结果有效性的保证。
而在土木工程技术领域,特别是建筑群的安全评估领域中,很多过程和步骤 都满足深度学习的应用条件——一个有限维空间到另一个有限维空间的Borel 可测函数映射(万能近似定理),同时由于土木工程技术领域在原始样本的积累 极为稀少,远远达不到深度学习所具备的复杂度下所需的样本容量,导致无法利 用深度学习对建筑群进行安全评估。
发明内容
本发明提供了一种用于评估建筑群结构安全的基于VAE的样本集指向性扩 展法,旨在对建筑群安全评估领域的原始样本进行扩展,以扩充出足够数量的样 本数据,并依据改样本数据来进行深度学习以对建筑群进行安全评估。
上述技术目的,通过以下技术方案实现。
一种用于评估建筑群结构安全的基于VAE的样本集指向性扩展法,其特征 在于,包括如下步骤:
步骤一,根据土木工程技术领域知识和数据库的特性确定物理意义指标及 数量;
步骤二,以所述物理意义指标的个数作为潜变量个数,构建构建VAE模型 并进行参数学习;
步骤三,提取VAE模型中编码器的连接权重,然后通过输入特征与隐藏层 单元的贡献度公式、隐藏层单元对潜变量的贡献度公式以及输入特征对潜变量 的贡献度公式计算得出贡献度矩阵;
步骤四,由土木工程技术领域技术人员填写物理意义指标与输入特征的依 赖关系矩阵,具备依赖关系的项填1,其余为0;
步骤五,计算潜变量相对各物理意义指标的距离矩阵,获得各潜变量到各物 理意义指标的距离;
步骤六,通过“潜变量-指标匹配算法”,赋予潜变量对应所述物理意义指标 的物理意义;
步骤七,各潜变量到各物理意义指标的距离作为与所述物理意义指标匹配 的明晰度,依据所述明晰度判断是否采用所赋予的潜变量的物理意义,若是则生 成期望指标样本,否则重新进行步骤一。
上述技术方案,可以作如下改进:
所述步骤三中,输入特征与隐藏层单元的贡献度公式、隐藏层单元对潜变量 的贡献度公式以及输入特征对潜变量的贡献度公式依次为:
Figure BDA0003007803500000021
Figure BDA0003007803500000031
Figure BDA0003007803500000032
式中各代数的意义如下:
N为输入特征个数;
M为隐藏层单元个数;
L为潜变量个数;
WFi,Hj为输入层各单元与隐藏层各单元的连接权重;
WHj,μk为隐藏层各单元与潜变量层的连接权重;
CFi,Hj为第i个输入特征(F)对第j个隐藏层单元(H)的贡献度;
CHj,μk为第j个隐藏层单元(H)对第k个潜变量(μ)的贡献度;
CFi,μk为第i个输入特征(F)对第k个潜变量(μ)的贡献度;
依据式3.1~3.3,计算得出贡献度矩阵行列式如下:
Figure BDA0003007803500000033
式中各代数的意义如下:
μi为第i个潜变量;
Fk为第k个输入特征;
Ci,k为第i个潜变量对第k个输入特征的贡献度矩阵。
所述步骤五中,潜变量到各物理意义指标的距离,通过如下公式计算:
Figure BDA0003007803500000034
其中,Di,j为潜变量(μi)与物理意义指标(Ij)的相对距离。
所述步骤六中,所述“潜变量-指标匹配算法”,具体包括如下步骤:
依据潜变量(μi)与指标(Ij)的距离矩阵(Di,j),判断是否还有潜变量(μi) 未被赋予物理意义;
若是,则从距离矩阵(Di,j)搜索最小值,抹去该最小值对应的行(μi)与 列(Ij),并完成第i个潜变量与第j个指标的匹配;否则,算法结束。
所述步骤七中,生成期望指标样本,具体步骤如下:
查询期望物理意义指标的潜变量空间分布;
根据期望取值幅度和已有潜变量空间分布,确定需控制的单个或多个抽样 函数S~N(μ,1)(-3<μ<3);
根据已有样本的数量及潜变量空间分布,确定期望指标取值样本的抽样数 量,并代入编码器生成新样本。
本发明具有如下优点:
通过本发明提出的样本集扩展法,可一定程度内对原有样本指标没有取值 的样本空间进行指向性补充,使基础样本能遍布样本取值空间,由于VAE模型 的潜变量空间具有先验分布的特性,且土木工程技术领域的样本分布与高斯分 布相符,因此对样本进行指向性补充后,再以扩充样本集训练得出的解码器 (decoder)能产生适合深度学习模型容量的有效样本集,以便于依据改样本数 据来进行深度学习以对建筑群进行安全评估。
附图说明
图1为本变分自编码机架构示意图;
图2为权重作为x到y映射的敏感度示意图;
图3为第i个输入特征(F)对第j个隐藏层单元(H)的贡献度示意图;
图4为本发明算法流程图;
图5为VAE学习质量检测(蓝色为抽样潜变量,黄色为再生成潜变量);
图6为贡献度矩阵色阶可视化示意图;
图7为输入特征对潜变量的贡献度矩阵二值化示意图;
图8为以各输入特征对潜变量的贡献度平均值为界所生成的贡献度矩阵二 值化示意图
图9为明晰度矩阵色阶可视化示意图;
图10为原始样本1各指标程度值示意图;
图11为原始样本2各指标程度值示意图;
图12为原始样本加密后潜变量(指标)分布图;
图13为原始样本加密后指标分布图(扩充样本训练的编码器);
图14为扩充样本加密后指标分布图(扩充样本训练的编码器)。
具体实施方式
下面将结合附图,对发明实施例中的技术方案进行清楚、完整地描述。
由于VAE实际上生成的是潜变量的分布,例如高斯分布Z~N(μ,σ),与 隐藏层相连的是两个并行的潜变量层μ与σ,通过公式z=μ+σ⊙ε得出 潜变量Z的值。因为潜变量Z层是计算层,不与隐藏层直接相连,能代表潜变 量Z的是其分布均值μ。因此,各隐藏层单元Hi对潜变量Z的贡献度等价于各 隐藏层单元Hi对潜变量μ的贡献度,如图3所示。
为避免因输入特征本身的取值范围的影响(偏置一定程度会消除该影响), 贡献度的测量采用单个输入特征与所有隐藏层单元相对贡献度的度量方式。
输入特征个数为N,隐藏层单元个数为M,潜变量个数为L。输入层各单元 与隐藏层各单元的连接权重记为WFi,Hj,隐藏层各单元与潜变量层的连接权重记 为WHj,Zk,第i个输入特征F对第j个隐藏层单元H的贡献度为:
Figure BDA0003007803500000051
以此类推,第j个隐藏层单元(H)对第k个潜变量μ的贡献度为:
Figure BDA0003007803500000052
因此,第i个输入特征F对第k个潜变量μ的贡献度,如图4所示,也 可写为:
Figure BDA0003007803500000053
而赋予潜变量的物理意义,则是通过衡量VAE模型学到的潜变量与输入特 征的依赖关系,和专业人员赋予的物理意义指标与输入特征依赖关系间的“距 离”。根据相对距离匹配与该潜变量最接近的指标,并给出物理意义的明晰度作 为土木工程技术领域技术人员是否采用或是否重新定义输入特征-指标的依赖 关系的判定依据。
由专业人员得出的指标Ij-输入特征Fk的依赖关系矩阵Rj,k如下式所示 (判断有依赖关系的对应项填1,其余填0):
Figure BDA0003007803500000054
依据式3.1~3.3,计算得出贡献度矩阵行列式如下:
Figure BDA0003007803500000061
物理意义提炼的方法是求出各潜变量与各指标最接近的项,潜变量μi对 应的各输入特征Fk的贡献度减去指标Ij对应各输入特征Fk的依赖度即为其“距 离”。由于贡献度矩阵Ci,k的计算值范围为(0,1),均值在1除以潜变量个数 附近,与依赖关系矩阵Ri,j的取值(0或1)绝对距离较远。换言之,输入特征 对各潜变量贡献度的变化幅度相对于依赖关系矩阵的取值差别较大,使贡献度 的差异淹没在与依赖关系矩阵的绝对距离差中。因此,需将贡献度矩阵的取值 转换为与依赖关系矩阵同一量级,其中一个方法是将输入特征对所有潜变量的 相对贡献度大于均值的取1,其余取0。
而潜变量μi与指标Ij的距离Di,j数学表达式如下:
Figure BDA0003007803500000062
上式求出的是潜变量μ与各指标Ij的相对距离,因此单个潜变量μ与各 指标Ij的相对距离之和为1。由相对距离的特性可知,该潜变量与指标Ij相对 距离越小,其与其它指标的距离越大,即越小的相对距离代表该潜变量的物理 意义提炼的明晰度越高。故潜变量与指标匹配的明晰度(距离Di,j)能准确地 反映该匹配的置信度。明晰度的定义为物理意义指标与潜变量匹配的准确度。 其计算内容为各潜变量与指标之间的平均距离,该距离越小,潜变量与纸指标 越吻合。
而潜变量-指标匹配算法,算法程序具体如下:
Figure BDA0003007803500000063
Figure BDA0003007803500000071
对于生成期望指标样本,通过如下算法程序:
Figure BDA0003007803500000072
本发明所述的一种用于评估建筑群结构安全的基于VAE的样本集指向性扩 展法,算法流程如图5所示,步骤如下。
步骤一,根据土木工程技术领域知识和数据库的特性确定物理意义指标及 数量。
具体地,依据《民用建筑可靠性鉴定标准》等规范进行过专业鉴定的样本作 为原始样本,所搜集到的30个原始数据集,共35个涵盖结构各方面要素的输 入特征如下表:
Figure BDA0003007803500000073
首先由土木工程技术领域的技术人员确定结构体系与布置、耐久性等八个 物理意义指标。训练过程中,通过调整超参数,使VAE中的神经网络的损失函数 达到相对最小后,随机抽样出一组潜变量进行还原(decode)后加密(encode), 统计随机抽样的潜变量与加密后的潜变量之间的差异来判断VAE的学习质量, 如图6所示,通过画出前两个潜变量的分布空间来直观表示学习质量。
步骤二,以所述物理意义指标的个数作为潜变量个数,构建VAE模型并进 行参数学习。
具体地,VAE(Variational-Autoencoder)是一种生成式模型,由编码器(Encoder)和解码器(Decoder)两部分组成。训练完成后通过控制潜变量(code) 的取值,可生成随机的新样本。
VAE算法的编码过程本质上就是高维特征空间向低维特征空间的映射,即 把原始特征表示提炼为比原始输入特征数目少的高级特征(指标)表示,若原 始特征具有物理意义,提炼出的高级特征也存在鲜明且相互依赖的物理意义。
以土木工程行业建筑结构安全数据库为例,输入特征对应建筑结构安全的 录入数据,潜变量对应该类数据的大指标,如结构布置、裂缝及损坏情况等指标 评价,如图1所示。
参照图1,输入特征经过神经网络再到达潜变量层后,其与潜变量层的连接 不再明晰,本发明通过借神经网络的连接权重来反映输入特征与潜变量层的联 系,即各输入特征对各潜变量(指标)的贡献度。
如图2所示,神经网络的神经元激活计算公式y=w*x+b可看作线性映射, 偏置b代表的是对原始输入特征值偏离的矫正;权重w代表的是该神经元的激 活对上游神经元连接传递值的敏感程度。因此,权重可用以反映各层神经元的 连接强度,推广即为输入特征与潜变量层的依赖程度。权重的正负号反映互相 连接的两神经元的正负/相关关系;权重的绝对值大小反映该相关关系的强 弱。因此,以权重的绝对值作为两神经元连接强弱的度量。
步骤三,提取VAE模型中编码器的连接权重,然后通过输入特征与隐藏层 单元的贡献度公式、隐藏层单元对潜变量的贡献度公式以及输入特征对潜变量 的贡献度公式计算得出贡献度矩阵;
具体地,提取VAE模型中编码器的连接权重,根据公式3.1~3.3计算出输 入特征对潜变量的贡献度矩阵Ci,k,该贡献度矩阵可视化如图7所示。然后以各 输入特征对潜变量的贡献度平均值为界,使贡献度矩阵二值化,如图8所示。
步骤四,由土木工程技术领域技术人员填写物理意义指标与输入特征的依 赖关系矩阵,具备依赖关系的项填1,其余为0。
具体地,由土木工程技术领域的技术人员填写指标与输入特征的依赖关系 矩阵(Rj,k),有依赖项填1,其余为0,如下表:
Figure RE-GDA0003265650880000091
步骤五,计算潜变量相对各物理意义指标的距离矩阵,获得各潜变量到各物 理意义指标的距离。
具体地,得到贡献度矩阵Ci,k和依赖关系矩阵Rj,k后,根据式3.4计算出反 映潜变量μi与指标Ij距离Di,j的明晰度矩阵,该明晰度矩阵可视化如图9所示, 可直观反映出各潜变量到各物理意义指标的距离,当距离越小时,物理意义指标 与潜变量越接近。
步骤六,通过“潜变量-指标匹配算法”,赋予潜变量对应所述物理意义指标 的物理意义。
具体地,通过“算法一:潜变量一指标匹配算法”,最大程度为每个潜变量 匹配最接近的物理意义指标,并以平均距离(平均明晰度)反映出本次匹配的准 确度,供专业人员参考是否接受结果或重新训练,完成物理意义提炼。
程序输出如下:
潜变量:4与指标:整体和构件变形匹配,明晰度为0.052;
潜变量:5与指标:地基基础状况匹配,明晰度为0.089;
潜变量:0与指标:环境情况匹配,明晰度为0.105;
潜变量:2与指标:历史情况匹配,明晰度为0.105;
潜变量:3与指标:耐久性匹配,明晰度为0.107;
潜变量:7与指标:结构体系和布置匹配,明晰度为0.109;
潜变量:1与指标:连接关系匹配,明晰度为0.114;
潜变量:6与指标:裂缝及损坏情况匹配,明晰度为0.118;
本次匹配已完成,平均明晰度为0.100。
步骤七,各潜变量到各物理意义指标的距离作为与所述物理意义指标匹配 的明晰度,依据所述明晰度判断是否采用所赋予的潜变量的物理意义,若是则生 成期望指标样本,否则重新进行步骤一。
具体地,物理意义提炼完成后,在训练质量可靠的前提下,各潜变量分布趋 近于标准高斯分布Z~N(0,1),通过“算法二:期望指标样本生成法”对样本 集进行指向性扩充,一定程度上可得出每个样本在各物理意义指标上的倾向(可 靠度取决于匹配的明晰度)。
如图10和图12所示,正负号反映取值与物理意义的正/负相关关系,绝对 值反映出该项物理意义的突出程度,取值接近零的意义为该项指标下对应特征 大部分为众值/平均值,指向性生成时结合对原始样本集的统计分析、专业知识, 确定期望指标的抽样均值及抽样数量。
比如,原始训练集大部分来自于某城中村房屋群的鉴定,因此可初步判断该 训练集的“结构体系和布置”比较单一,且“历史状况”,如使用年限、使用荷 载变化情况,较为相似。从原始样本加密(encode)得出的潜变量分布图,即图 13,亦反映出此特点。
需要注意的是,训练的得出P(x)联合分布是仅满足训练集样本的联合分 布,并非满足真实总体的联合分布。因此需对原始样本集进行统计分析及结合专 业知识,利用本发明提出的高自由度且能指向性生成期望样本的方法,扩充样本 空间。VAE的实际工作可以通俗理解为把离散的样本点用曲线连成连续空间,并 依据趋势在样本边缘扩展一定区域。
因此,抽样时理论上可抽极端值生成出与原有样本差异大的样本。但取边缘 值时,样本会因“扭曲”严重而失去有效性。因此,实际应用扩展样本时,可循 环进行指向性抽样生成新样本,把新样本并入原有样本集训练出新生成器再抽 样新样本。
此过程可理解为保持原有样本集分布趋势下,使样本集向抽样函数分布扩 展(通常为高斯分布)。
最后,图13和图14展示经过扩充后的样本集在利用扩充样本训练的编码 器(encoder)生成的潜变量分布与原样本集在同一编码器下生成的潜变量分布 的对比,可看出扩充后样本集覆盖更大的潜变量空间。
上面结合附图对本发明的实施方式做了详细说明,但是本发明并不限于上 述实施方式,在本领域普通技术人员所具备的知识范围内,还可以对其做出种种 变化。

Claims (4)

1.一种用于评估建筑群结构安全的基于VAE的样本集指向性扩展法,其特征在于,包括如下步骤:
步骤一,根据土木工程技术领域知识和数据库的特性确定物理意义指标及数量;
步骤二,以所述物理意义指标的个数作为潜变量个数,构建构建VAE模型并进行参数学习;
步骤三,提取VAE模型中编码器的连接权重,然后通过输入特征与隐藏层单元的贡献度公式、隐藏层单元对潜变量的贡献度公式以及输入特征对潜变量的贡献度公式计算得出贡献度矩阵;
步骤四,由土木工程技术领域技术人员填写物理意义指标与输入特征的依赖关系矩阵,具备依赖关系的项填1,其余为0;
步骤五,计算潜变量相对各物理意义指标的距离矩阵,获得各潜变量到各物理意义指标的距离;
步骤六,通过“潜变量-指标匹配算法”,赋予潜变量对应所述物理意义指标的物理意义;
步骤七,各潜变量到各物理意义指标的距离作为与所述物理意义指标匹配的明晰度,依据所述明晰度判断是否采用所赋予的潜变量的物理意义,若是则生成期望指标样本,否则重新进行步骤一。
2.根据权利要求1所述的用于评估建筑群结构安全的基于VAE的样本集指向性扩展法,其特征在于,所述步骤三中,输入特征与隐藏层单元的贡献度公式、隐藏层单元对潜变量的贡献度公式以及输入特征对潜变量的贡献度公式依次为:
Figure FDA0003007803490000011
Figure FDA0003007803490000012
Figure FDA0003007803490000013
式中各代数的意义如下:
N为输入特征个数;
M为隐藏层单元个数;
L为潜变量个数;
WFi,Hj为输入层各单元与隐藏层各单元的连接权重;
WHj,μk为隐藏层各单元与潜变量层的连接权重;
CFi,Hj为第i个输入特征(F)对第j个隐藏层单元(H)的贡献度;
CHj,μk为第j个隐藏层单元(H)对第k个潜变量(μ)的贡献度;
CFi,μk为第i个输入特征(F)对第k个潜变量(μ)的贡献度;
依据式3.1~3.3,计算得出贡献度矩阵行列式如下:
Figure FDA0003007803490000021
式中各代数的意义如下:
μi为第i个潜变量;
Fk为第k个输入特征;
Ci,k为第i个潜变量对第k个输入特征的贡献度矩阵。
所述步骤五中,潜变量到各物理意义指标的距离,通过如下公式计算:
Figure FDA0003007803490000022
其中,Di,j为潜变量(μi)与物理意义指标(Ij)的相对距离。
3.根据权利要求2所述的用于评估建筑群结构安全的基于VAE的样本集指向性扩展法,其特征在于,所述步骤五中,潜变量到各物理意义指标的距离,通过如下公式计算:
Figure FDA0003007803490000023
其中,Di,j为潜变量(μi)与物理意义指标(Ij)的相对距离。
所述步骤六中,所述“潜变量-指标匹配算法”,具体包括如下步骤:
依据潜变量(μi)与指标(Ij)的距离矩阵(Di,j),判断是否还有潜变量(μi)未被赋予物理意义;
若是,则从距离矩阵(Di,j)搜索最小值,抹去该最小值对应的行(μi)与列(Ij),并完成第i个潜变量与第j个指标的匹配;否则,算法结束。
4.根据权利要求3所述的用于评估建筑群结构安全的基于VAE的样本集指向性扩展法,其特征在于,所述步骤七中,生成期望指标样本,具体步骤如下:
查询期望物理意义指标的潜变量空间分布;
根据期望取值幅度和已有潜变量空间分布,确定需控制的单个或多个抽样函数S~N(μ,1)(-3<μ<3);
根据已有样本的数量及潜变量空间分布,确定期望指标取值样本的抽样数量,并代入编码器生成新样本。
CN202110369675.3A 2020-12-04 2021-04-06 用于评估建筑群结构安全的基于vae的样本集指向性扩展法 Active CN113642822B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011405556 2020-12-04
CN2020114055560 2020-12-04

Publications (2)

Publication Number Publication Date
CN113642822A true CN113642822A (zh) 2021-11-12
CN113642822B CN113642822B (zh) 2024-03-01

Family

ID=78415748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110369675.3A Active CN113642822B (zh) 2020-12-04 2021-04-06 用于评估建筑群结构安全的基于vae的样本集指向性扩展法

Country Status (1)

Country Link
CN (1) CN113642822B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117710371A (zh) * 2024-02-05 2024-03-15 成都数之联科技股份有限公司 一种扩充缺陷样本的方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932705A (zh) * 2018-06-27 2018-12-04 北京工业大学 一种基于矩阵变量变分自编码器的图像处理方法
KR20190037025A (ko) * 2017-09-28 2019-04-05 서울대학교산학협력단 딥러닝 기반 Variational Inference 모델을 이용한 신호 단위 특징 추출 방법 및 시스템
CN109886388A (zh) * 2019-01-09 2019-06-14 平安科技(深圳)有限公司 一种基于变分自编码器的训练样本数据扩充方法和装置
CN111258992A (zh) * 2020-01-09 2020-06-09 电子科技大学 一种基于变分自编码器的地震数据扩充方法
CN111595489A (zh) * 2020-05-27 2020-08-28 吉林大学 一种基于变分自编码器的启发式高分辨率海洋水温分布建立方法
CN111612078A (zh) * 2020-05-25 2020-09-01 中国人民解放军军事科学院国防工程研究院 一种基于条件变分自动编码器的变压器故障样本增强方法
CN111915881A (zh) * 2020-06-11 2020-11-10 西安理工大学 一种基于变分自动编码器的小样本交通流量预测方法
US20200372214A1 (en) * 2019-05-21 2020-11-26 Royal Bank Of Canada System and method for machine learning architecture with variational autoencoder pooling

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190037025A (ko) * 2017-09-28 2019-04-05 서울대학교산학협력단 딥러닝 기반 Variational Inference 모델을 이용한 신호 단위 특징 추출 방법 및 시스템
CN108932705A (zh) * 2018-06-27 2018-12-04 北京工业大学 一种基于矩阵变量变分自编码器的图像处理方法
CN109886388A (zh) * 2019-01-09 2019-06-14 平安科技(深圳)有限公司 一种基于变分自编码器的训练样本数据扩充方法和装置
US20200372214A1 (en) * 2019-05-21 2020-11-26 Royal Bank Of Canada System and method for machine learning architecture with variational autoencoder pooling
CN111258992A (zh) * 2020-01-09 2020-06-09 电子科技大学 一种基于变分自编码器的地震数据扩充方法
CN111612078A (zh) * 2020-05-25 2020-09-01 中国人民解放军军事科学院国防工程研究院 一种基于条件变分自动编码器的变压器故障样本增强方法
CN111595489A (zh) * 2020-05-27 2020-08-28 吉林大学 一种基于变分自编码器的启发式高分辨率海洋水温分布建立方法
CN111915881A (zh) * 2020-06-11 2020-11-10 西安理工大学 一种基于变分自动编码器的小样本交通流量预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
尹爱军 等: "基于变分自编码器的轴承健康状态评估", 振动.测试与诊断, no. 5, pages 1011 - 1016 *
马小鹏 等: "基于集合光滑的深度学习自动历史拟合方法", 中国石油大学学报(自然科学版), no. 4, pages 68 - 76 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117710371A (zh) * 2024-02-05 2024-03-15 成都数之联科技股份有限公司 一种扩充缺陷样本的方法、装置、设备及存储介质
CN117710371B (zh) * 2024-02-05 2024-04-26 成都数之联科技股份有限公司 一种扩充缺陷样本的方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113642822B (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
CN112819207B (zh) 基于相似性度量的地质灾害空间预测方法、系统及存储介质
CN111382542A (zh) 一种面向全寿命周期的公路机电设备寿命预测系统
CN113469470B (zh) 基于电力大脑中枢的用能数据与碳排放量关联分析方法
CN110561191B (zh) 基于pca与自编码器的数控机床刀具磨损数据处理方法
CN116448419A (zh) 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法
US20220261655A1 (en) Real-time prediction method for engine emission
CN105183928A (zh) 铸铝构件中的残余应力和变形的快速分析
CN116150897A (zh) 一种基于数字孪生的机床主轴性能测评方法及系统
CN113901977A (zh) 一种基于深度学习的电力用户窃电识别方法及系统
CN112001110A (zh) 一种基于振动信号空间时时递归图卷积神经网络的结构损伤识别监测方法
CN112084709B (zh) 基于遗传算法和径向基神经网络的大型发电机绝缘状态评估方法
CN114297918A (zh) 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法
CN115456044A (zh) 一种基于知识图谱多集池化的装备健康状态评估方法
CN114819777A (zh) 一种基于数字孪生技术的企业销售业务分析管理系统
CN113642822A (zh) 用于评估建筑群结构安全的基于vae的样本集指向性扩展法
CN112241832B (zh) 一种产品质量分级评价标准设计方法及系统
CN117370766A (zh) 一种基于深度学习的卫星任务规划方案评估方法
CN115935187B (zh) 基于核敏感度对齐网络的变工况下机械故障诊断方法
CN112241808A (zh) 路面技术状况预测方法、装置、电子设备及存储介质
Wang et al. Fuzzy least squares support vector machine soft measurement model based on adaptive mutative scale chaos immune algorithm
CN113973403B (zh) 基于结构离散测点拓扑的温致应变场重分布智能感知方法
CN112184037B (zh) 一种基于加权svdd的多模态过程故障检测方法
CN109840479B (zh) 健康状态匹配方法及装置
KR102667862B1 (ko) 정보 시각화를 이용한 중전기기 모니터링 시스템 및 그 방법
Napolitano et al. Unsupervised Data-Driven Methods for Damage Identification in Discontinuous Media

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant