CN111258992A - 一种基于变分自编码器的地震数据扩充方法 - Google Patents

一种基于变分自编码器的地震数据扩充方法 Download PDF

Info

Publication number
CN111258992A
CN111258992A CN202010020471.4A CN202010020471A CN111258992A CN 111258992 A CN111258992 A CN 111258992A CN 202010020471 A CN202010020471 A CN 202010020471A CN 111258992 A CN111258992 A CN 111258992A
Authority
CN
China
Prior art keywords
data
encoder
distribution
seismic data
vae
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010020471.4A
Other languages
English (en)
Inventor
胡光岷
陈松
李坤鸿
蔡涵鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010020471.4A priority Critical patent/CN111258992A/zh
Publication of CN111258992A publication Critical patent/CN111258992A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Abstract

本发明公开一种基于变分自编码器的地震数据扩充方法,应用于地球物理勘探解释技术及深度学习领域,为了解决现有的人工获取稳定、可靠的某类地震数据要花费大量的人力物力的问题,本发明先利用无标签的数据去训练整个VAE网络模型,对于某一类想要扩充样本的标签数据,将其输入到训练好的VAE网络中,通过编码器得到一个二维的隐变量数据,再利用高斯混合模型得到此二维隐变量的具体分布;在已知隐变量分布的情况下,可以采样得到同分布的更多的隐变量数据,将这些隐变量数据输入到训练好的VAE网络模型的解码器中,就可以得到大量的接近某一类标签数据的样本,以此达到一个实现扩充地震数据的目的。

Description

一种基于变分自编码器的地震数据扩充方法
技术领域
本发明属于地球物理勘探解释技术及深度学习领域,特别涉及一种地震数据处理技术。
背景技术
近年来,在深度学习领域,无监督学习模型受到越来越多的关注,尤其是在深度生成模型方面,取得了突破性的进展。其中,变分自编码器(Variational Auto-Encoders,VAE)和生成对抗网络(Generative Adversarial Networks,GAN)被视为无监督学习领域最具有研究价值的方法之一,在深度生成模型领域得到越来越多的应用。变分自编码器(VAE)作为深度生成模型的一种形式,是由Kingma等人于2014年提出的基于变分贝叶斯(Variational Bayes,VB)推断的生成式网络结构。变分自编码器作为特殊形式的自编码器模型,一经提出就迅速成为深度生成模型领域最受关注的形式之一,VAE是一种深度隐空间生成模型,在数据生成方面表现出巨大的应用价值,尤其是在图像生成方面,得到了非常广泛的应用。
变分自编码器(VAE)模型是一个数学逻辑性极强的数据生成模型,结合深度学习和统计学习构造了一套逻辑自洽的数据生成流程,VAE采取了弱监督的学习方式,是对自编码器的一种拓展,不使用人工标记而是样本本身作为训练标签,其目的不再是提取原始样本的隐藏变量,而是生成全新的样本数据。VAE有两大核心点,一是以自编码器为核心搭建的神经网络,二是以变分推断为核心构造的损失函数,VAE使用自编码器获取隐藏变量的信息,通过假设隐藏变量服从标准正态分布进而获取到变分推断需要的先验概率分布,因此VAE是个显式数据生成模型。
目前,作为在深度生成模型领域最具有价值的方法之一的变分自编码器这种无监督的数据生成方法在地质领域的应用基本上很少,尤其是在地震数据生成方面还是一个空白。而在实际中要人工获取稳定、可靠的某类地震数据要花费大量的人力物力。
发明内容
为解决上述技术问题,本发明提出一种基于变分自编码器的地震数据扩充方法,通过利用变分自编码器(Variational Auto-Encoders,VAE),在某类地震样本数据数量不足的情况下生成大量分布接近此类样本的数据;从而实现了以数据驱动方式就扩充地震数据的目的。
本发明采用的技术方案为:一种基于变分自编码器的地震数据扩充方法,包括:
S1、将不同类型的无标签地震数据作为训练集,
S2、采用步骤S1的训练集对VAE网络进行训练,得到训练好的VAE网络模型;
S3、将待扩充样本的标签数据输入步骤S2训练好的VAE网络模型,得到新的样本数据。
步骤S3具体为:
S31、将待扩充样本的标签数据作为VAE网络模型的编码器的输入;
S32、VAE网络模型的编码器输出隐变量;
S32、通过高斯混合模型拟合出隐变量的分布;
S33、根据拟合的分布,从该分布中采样得到大量隐变量;
S34、将步骤S33获得的大量的隐变量输入VAE网络模型的解码器,得到新样本数据。
步骤S32具体为:采用模拟采样技术从标准正态分布中采样辅助噪声变量ε,通过辅助噪声变量ε来得到隐变量z的分布。
所述编码器还包括输出标准正态分布的均值μ和方差σ2
步骤S33具体为:根据辅助噪声变量ε、标准正态分布的均值μ和方差σ2获得生成因子z*,计算式如下:
z*=σ2(ε-μ)。
步骤S33具体为:将生成因子z*输入解码器,解码得到新样本数据,将新样本数据作为扩充样本。
本发明的有益效果:本发明先利用无标签的数据去训练整个VAE网络模型,对于某一类想要扩充样本的标签数据,将其输入到训练好的VAE网络中,通过编码器得到一个二维的隐变量数据,再利用高斯混合模型得到此二维隐变量的具体分布;在已知隐变量分布的情况下,可以采样得到同分布的更多的隐变量数据,将这些隐变量数据输入到训练好的VAE网络模型的解码器中,就可以得到大量的接近某一类标签数据的样本,以此达到一个实现扩充地震数据的目的。相比于利用人工手段扩充地震数据的技术,本发明的优点是通过深度学习的方法生成比较稳定、可靠的地震数据以实现快速的扩充,在一定程度上节省了人力物力。目前,这种数据生成方法在地质领域尚未应用,尤其是在以数据驱动方式为基础的地震数据扩充领域。
附图说明
图1为VAE基本网络结构;
图2为AEVB算法流程;
图3为VAE模型基本训练流程;
图4为扩充地震数据算法流程图;
图5为正演得到的两类理论地震数据;
图6为扩充生成的两类理论地震数据;
图7为两类理论地震数据对应真实数据和生成数据主频比较;
图8为某地区的三类实际地震数据;
图9为扩充生成的某地区的三类实际地震数据;
图10为三类实际地震数据对应真实数据和生成数据主频比较。
具体实施方式
为便于本领域技术人员理解本发明的技术内容,下面结合附图1-10对本发明内容进一步阐释。
利用深度学习领域的深度生成模型生成地震数据是一种高度非线性、多模态的问题。
GAN把所有的输出看作是在一个分布中,因此GAN只能生成一种类别的输出(比如只能生成猫或狗的一种)。目前用GAN来生成正演记录,从理论上来说,只知道生成的伪样本数据分布和真实数据是一样的,但是在真实数据数量不多的情况下,会导致模型的训练效果不好,也就是无法很好的生成某一类伪样本。继而对于其他类型的伪样本来说也是一样的情况。
而VAE将每一个输出分类看作一个分布,这样就可以生成多种分类输出(比如既可以生成猫又可以生成狗等)。由于GAN是用来生成和某一种数据类型一样的伪样本的,它无法很好的利用多种类型的数据样本。VAE确恰好可以将这些不同类型的数据全部当做训练集来训练模型。
传统自动编码器由于隐藏层输出的向量混乱且未知导致其不能够自主地生成数据,基于此,2014年Diederik P.Kingma和Max Welling在传统自动编码器的隐含层中加入了隐变量z,然后通过这个隐变量来自动生成数据从而形成了变分自编码器(VAE)。变分自编码器作为一种结合了深度学习和统计学习特点的生成模型,很好的利用了深度模型在应用于非线性拟合时候非常强大的能力。
VAE是对自动编码器的一种拓展,其目标不再是提取原始样本的隐藏变量,而是生成全新的样本数据,因此目标输出不是编码器的输出而是解码器的输出,其基本结构如图1所示。合理损失函数是指导神经网络模拟成数据生成模型的关键,VAE采取的是一种相对传统的思路,即损失函数由概率似然为核心来构建,生成的新样本满足训练集样本的概率分布是其构造损失函数的理论依据。
本发明在人工获取地震数据需要耗费大量人力物力的背景下,通过结合深度学习领域深度生成模型方面的方法(变分自编码器,VAE),在某类地震数据样本不足的情况下生成大量有效、可靠的数据,从而实现了以数据驱动方式就可以扩充地震数据的目的。
本发明的实现原理为:
1、构建隐变量模型
当我们训练一个某类数据的生成模型时,该数据的不同维度之间的相关性越复杂,那么模型的训练难度系数就越大。根据手写数据集为例子,如果字符左边包含了数字8的左半部分,那么该字符的右边不可能是数字5的右半部分,否则这个字符看上去就不像真的数字了。
从理论上来说,如果模型首先决定生成哪个数字,我们就不用担心生成的数字左右不符了。我们将这种生成数据前做的事情称之为一个隐变量。从另一个角度说,在模型生成数字字符之前,它首先从集合{0,...,9}中随机选取一个数值z,然后确保生成的所有笔画都与该数字有关。之所以称z为隐变量,是因为对于该模型生成的某一个数字,我们无需知道它是由怎样的一组隐变量生成的。
为了使生成模型能够代表整个数据集,我们需要确保对于数据集中每一个数据点x,都有一组或者多组隐变量与之对立。通过概率密度函数p(z)在高维空间Z上采样得到一组样本z,定义f(z;θ)为一组确定性函数,其中θ是向量参数,利用函数f(z;θ)将隐变量z映射到原始数据空间X,我们希望通过优化参数θ使f(z;θ)与数据库中的真实数据尽可能的相似。即最大化以下概率:
p(x)=∫pθ(x|z)p(z)dz (1)
其中,p(x)为生成某个真实数据x的概率,pθ(x|z)表示条件概率分布。这里用pθ(x|z)代替f(z;θ),这样做方便用全概率公式来明确地表示x在z上的依赖性。
最大似然是VAE框架的真正的关键,即可认为如果模型有可能产生训练集样本,那就应该有能力产生与原始数据相似的样本,同时不可能产生与样本完全不相干的数据。在模型中输出的分布也可以是任意的分布,但是一般来说高斯分布式VAE的首选输出分布。例如,p(x|z;θ)=N(x|f(z;θ),σ2*I),其均值为f(z;θ),协方差矩阵等于单位矩阵与协方差σ标量的乘积。在训练的早期阶段,模型是无法产生与特定的x相匹配的输出的。
引入一个高斯分布之后,可以利用梯度下降或者是其他的优化技术来用f(z;θ)逼近x的方式增加p(x),也就是使得在生成模型中训练数据更加相似。例如数据集是二值化类型的时候,输入z时,输出某个真实数据x的概率p(x|z)可能会是一个参数化的伯努利分布,这样其中p(x|z)是可以被计算的。
2、VAE的变分推断
边缘相似性由孤立点的边缘似然之和构成,可以记为:
Figure BDA0002360576780000051
其中,xi表示数据集
Figure BDA0002360576780000052
中的一个数据,pθ(z|xi)表示后验概率,l(θ,φ;xi)表示边缘似然函数的变分下限,
Figure BDA0002360576780000053
表示边缘似然函数的对数。第一部分是真实后验的近似KL散度,是非负的。第二部分是数据点i边际可能性的变分下界,因此可记做:
Figure BDA0002360576780000054
其中,
Figure BDA0002360576780000055
表示求变分分布qφ(z|x)的期望值,
Figure BDA0002360576780000056
表示变分分布qφ(z|x)的对数似然函数,
Figure BDA0002360576780000057
表示数据x和z的联合分布的对数似然函数。也可写成:
Figure BDA0002360576780000058
其中,
Figure BDA0002360576780000059
表示变分分布qφ(z|x)的对数似然函数。
在对变分参数φ和生成参数θ的下界进行评估和优化的时候,通常采用的蒙特卡洛梯度来解决φ的下界梯度这种类型的问题。当第l次采样的隐变量zl~qφ(z|xi)时:
Figure BDA00023605767800000510
如果用这个来估计梯度,将会失去意义。
引入随机梯度变分贝叶斯方法(SGVB)实现估计近似推理,从而得到自编码变分贝叶斯方法VAE。最后结合变分下界的重参化形成一个下界评估器,能够有效地对非离散隐变量进行近似后验推理,同时直接使用随机梯度下降对算法优化。
本发明还提供另一种实用的关于下界及其导数的估计方法,即如图2所示的AEVB算法。
假定公式qφ(x|z)的近似后验,引入变分贝叶斯方法,在一定条件下,对于所选择的近似后验使用一个辅助噪声变量ε~p(ε)的微分变换gφ(ε,x)来重参化随机变量
Figure BDA0002360576780000061
从而可以得到蒙特卡洛估计函数:
Figure BDA0002360576780000068
其中,f(z)是关于z的一个确定性函数,Εp(ε)表示辅助噪声变量ε分布的期望值,f(gφ(ε,xi))表示经过微分变换gφ(ε,x)之后重参化的确定性函数,L表示辅助噪声变量ε样本个数。
结合公式(3),可以得到一般的随机梯度变分贝叶斯估计(SGVB),即
Figure BDA0002360576780000062
Figure BDA0002360576780000063
其中,
Figure BDA0002360576780000064
表示数据xi的原始变分下限l(θ,φ;xi)的近似,
Figure BDA0002360576780000065
表示数据xi和z的联合分布的对数似然函数,z(i,l)表示对于数据xi来说第l次采样得到的隐变量,通过辅助噪声变量εl进行gφ(ε,x)微分变换,z(i,l)=gφ(i,l),xi),εl~p(ε)。ε(i,l)表示对于数据xi来说第l次采样得到的辅助噪声变量。此时公式(3)中,只需要对重构误差进行采样分析,先验分布则与近似后验分布接近。从而可以得到SGVB估计的另外一种表达形式:
Figure BDA0002360576780000066
引入minbatch后可以构建得到关于整个数据集的边缘下界估计:
Figure BDA0002360576780000067
其中,X是一个包含N个数据的数据集,M是随机从X中抽取的采样点个数,
Figure BDA0002360576780000071
表示数据集X原始变分下限l(θ,φ;X)的近似,
Figure BDA0002360576780000072
表示数据xi的原始变分下限l(θ,φ;xi)的近似。在实际中只要minibatch的尺寸足够大的时候(例如2000)M可以设为1.引入minibatch之后的AEVB算法流程见下图2。
在公式(7)中第一项作为一个正则化项的近似后验估计KL散度,第二项是负的重构误差项。选择函数gφ(.)的时候,它需要满足将一个数据点xi和一个随机噪声向量εl映射到一个近似后验样本,其中数据点xi满足:z(i,l)=gφl,xi)且z(i,l)~qφ(z|xi),然后将z(i ,l)输入到
Figure BDA0002360576780000073
函数中,等同于在生成模型的数据点xi的概率密度上给定z(i,l)
如图3所示为VAE训练过程,包括:
VAE首先在理论上做了一个假设,即p(z|x)服从标准正态分布
p(z|x)~N(0,1)u=0,σ2=1
然后根据贝叶斯公式
p(z)=∫xp(x)p(z|x)=∫xp(x)N(0,1)=N(0,1) (9)
由上可知p(z)的概率分布也服从标准正态分布,在变分推断中需要完成的三个未知分布的建模剩下p(x|z),从形式上看这与前文所述判别式模型推断的条件概率分布p(y|x)相同,实际上类别y可以理解为样本变量x的最高抽象的隐藏变量,并且分布p(x|z)恰好表达出了由变量z还原为变量x的过程,这恰好就是自编码器中解码器执行的过程,同时p(z|x)分布的形式能够对应上自编码器的编码器部分的逻辑表达式,也适合作为变分推断中的概率分布q(z),因此VAE以自编码器的结构为基础搭建出了能够表达变分推断数学逻辑的架构,VAE模型的基本运作流程如图3所示。
VAE编码器部分的目标是构造证据下界L中的-DKL(q(z)||p(z)),其中q(z)在VAE的应用中被指定为与编码器有关的概率分布p(z|x)。编码器的输入是样本数据x,也就是样本数据的特征值,但是编码器的输出不再是维度被压缩后的主要特征值,而是有意的输出两个意义明确的值,标准正态分布p(z|x)的均值μ和方差σ2,目的在于结合p(z)服从标准正态分布的已知条件构造如下的L的KL散度
Figure BDA0002360576780000081
其中,j表示样本的编号,
Figure BDA0002360576780000082
是方差,
Figure BDA0002360576780000083
是均值的平方,公式(10)使用了蒙特卡洛模拟的技巧,使用离散的累加计算近似了p(z|x)的期望积分,如此便得到了L损失函数的第一项表达式。VAE的编码器的输出并不像自编码器一样直接与解码器输入相连,因为VAE关注的是样本的生成能力,因此解码器的输入应该是和隐藏变量同分布的不同样本,这里VAE使用了一种技巧,利用模拟采样技术从标准正态分布中采样辅助噪声变量ε(通过辅助噪声变量ε来得到隐变量z的分布)与编码器输出的均值μ和方差σ2做如下运算获得生成因子z*
z*=σ2(ε-μ) (11)
生成因子z*保存了样本x的主要特征同时获得了生成新样本的能力。
综上可知,VAE生成样本的概率分布并不是由样本对象决定的,而是人工设定一些适用度高的概率分布,例如上文经常例举的正态分布,然后通过调整这些分布的参数,使其与对象的真实分布相接近,以达到生成和真实样本类似的新样本,VAE固定了生成样本的概率分布形式,在固定形式的框架下拟合出与真实样本概率分布近似的分布,这个理论和GAN的生成理念是不一样的。
如图4所示为生成地震数据的实现流程,具体为:
在有很多无标签地震数据的情况下,我们想要生成大量的某一种类型的地震数据。通过前文可知VAE将每一个输出分类看作一个分布,这样就可以生成多种分类输出(比如既可以生成猫又可以生成狗等)。
因此,其可以将这些不同类型的数据全部当做训练集来训练模型。也就是先利用无标签的数据去训练整个VAE网络模型。对于某一类想要扩充样本的标签数据,我们将其输入到训练好的VAE网络中,通过编码器得到一个二维的隐变量数据,再利用高斯混合模型得到此二维隐变量的具体分布。在已知隐变量分布的情况下,可以采样得到同分布的更多的隐变量数据。将这些隐变量数据输入到训练好的VAE网络模型的解码器中,我们就可以得到大量的接近某一类标签数据的样本,以此达到一个实现扩充地震数据的目的。
为了充分的说明上述算法的可行性,在仿真过程中,我们先后利用理论地震数据和实际地震数据来进行验证。
我们采用的理论数据是利用正演得到的单反射地震数据和双反射地震数据,具体分别见图5(a)、图5(b)。由于两类数据分别对应两种二维隐变量数据分布,为了直观的验证VAE网络模型编码器的效果,我们将这两类数据分别输入训练好的VAE网络模型编码器得到两类隐变量数据。在此基础上,将这两类隐变量数据通过高斯混合模型之后采样扩充得到相对应的同分布新的隐变量数据。然后我们将两类新的隐变量数据输入到训练好的VAE网络模型的解码器中,得到了两类相对应的输出数据,分别是单反射地震数据和双反射地震数据,具体见图6(a)、图6(b)。
为了进一步验证生成数据的正确性,我们分别对比了单反射地震数据对应的真实数据和生成数据的主频,以及双反射地震数据对应的真实数据和生成数据的主频。具体见图7(a)、图7(b)。从图中,可以明显的看到两类地震数据的真实数据和生成数据的主频基本上是吻合的,说明生成的理论地震数据是有效、可靠的。至此,我们能够证明本发明提出的基于变分自编码器(VAE)的地震数据生成方法是有效的。
为进一步检验基于变分自编码器的地震数据生成方法的适用性,利用此方法来扩充某地区的三类实际地震数据,具体如图8(a)、8(b)、8(c)所示。它们分别通过训练好的VAE网络模型的编码器之后得到对应的三类隐变量数据,将这三类隐变量数据通过高斯混合模型采样扩充后得到相对应的同分布新的隐变量数据。然后将新的隐变量通过训练好的VAE网络模型的解码器,得到三类相对应的生成地震数据,如图9(a)、图9(b)、图9(c)所示。最后比较三类实际地震数据对应真实数据和生成数据的主频,如图10(a)、图10(b)、图(c)所示。从图中,可以明显的看到三类实际地震数据的真实数据和生成数据的主频基本上是吻合的,说明生成的实际地震数据是有效、可靠的。
通过图5-10,我们可以证明本发明的方法是应用到实际中去的,可以在某类地震数据样本不足的情况下扩充生成大量数据分布接近此类数据的可靠地震数据,在一定程度上实现了以数据驱动方式就可以扩充地震数据的目的。
Trace number,Time表示时间,Normalized sepectral amplitude表示归一化分离振幅,Frequency(Wavelengths per 1000samples)表示频率(每1000个样本的波长)
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (6)

1.一种基于变分自编码器的地震数据扩充方法,其特征在于,包括:
S1、将不同类型的无标签地震数据作为训练集,
S2、采用步骤S1的训练集对VAE网络进行训练,得到训练好的VAE网络模型;
S3、将待扩充样本的标签数据输入步骤S2训练好的VAE网络模型,得到新的样本数据。
2.根据权利要求1所述的一种基于变分自编码器的地震数据扩充方法,其特征在于,步骤S3具体为:
S31、将待扩充样本的标签数据作为VAE网络模型的编码器的输入;
S32、VAE网络模型的编码器输出隐变量;
S32、通过高斯混合模型拟合出隐变量的分布;
S33、根据拟合的分布,从该分布中采样得到大量隐变量;
S34、将步骤S33获得的大量的隐变量输入VAE网络模型的解码器,得到新样本数据。
3.根据权利要求2所述的一种基于变分自编码器的地震数据扩充方法,其特征在于,步骤S32具体为:采用模拟采样技术从标准正态分布中采样辅助噪声变量ε,通过辅助噪声变量ε来得到隐变量z的分布。
4.根据权利要求3所述的一种基于变分自编码器的地震数据扩充方法,其特征在于,所述编码器还包括输出标准正态分布的均值μ和方差σ2
5.根据权利要求4所述的一种基于变分自编码器的地震数据扩充方法,其特征在于,步骤S33具体为:根据辅助噪声变量ε、标准正态分布的均值μ和方差σ2获得生成因子z*,计算式如下:
z*=σ2(ε-μ)。
6.根据权利要求4所述的一种基于变分自编码器的地震数据扩充方法,其特征在于,步骤S33具体为:将生成因子z*输入解码器,解码得到新样本数据,将新样本数据作为扩充样本。
CN202010020471.4A 2020-01-09 2020-01-09 一种基于变分自编码器的地震数据扩充方法 Pending CN111258992A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010020471.4A CN111258992A (zh) 2020-01-09 2020-01-09 一种基于变分自编码器的地震数据扩充方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010020471.4A CN111258992A (zh) 2020-01-09 2020-01-09 一种基于变分自编码器的地震数据扩充方法

Publications (1)

Publication Number Publication Date
CN111258992A true CN111258992A (zh) 2020-06-09

Family

ID=70954072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010020471.4A Pending CN111258992A (zh) 2020-01-09 2020-01-09 一种基于变分自编码器的地震数据扩充方法

Country Status (1)

Country Link
CN (1) CN111258992A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200307A (zh) * 2020-10-16 2021-01-08 南通大学 一种基于图片数据扩充的识别器处理方法
CN113315524A (zh) * 2021-05-26 2021-08-27 武汉理工大学 一种基于深度学习的界标数据压缩传输方法及装置
CN113342655A (zh) * 2021-06-08 2021-09-03 浙江工商大学 一种面向众包系统的仿真测试用例生成方法及装置
CN113542222A (zh) * 2021-06-16 2021-10-22 浙江工业大学 一种基于双域vae的零日多步威胁识别方法
CN113611367A (zh) * 2021-08-05 2021-11-05 湖南大学 一种基于VAE数据增强的CRISPR/Cas9脱靶预测方法
CN113642822A (zh) * 2020-12-04 2021-11-12 广东省建筑设计研究院有限公司 用于评估建筑群结构安全的基于vae的样本集指向性扩展法
CN113707331A (zh) * 2021-07-30 2021-11-26 电子科技大学 一种中医辨证数据生成方法与系统
CN113822437A (zh) * 2020-06-18 2021-12-21 辉达公司 深度分层的变分自动编码器
CN115291108A (zh) * 2022-06-27 2022-11-04 东莞新能安科技有限公司 数据生成方法、装置、设备及计算机程序产品
CN116958712A (zh) * 2023-09-20 2023-10-27 山东建筑大学 基于先验概率分布的图像生成方法、系统、介质及设备
CN112085252B (zh) * 2020-08-03 2024-01-05 清华大学 一种关于集合类型决策效果的反事实预测方法
CN117710371A (zh) * 2024-02-05 2024-03-15 成都数之联科技股份有限公司 一种扩充缺陷样本的方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875818A (zh) * 2018-06-06 2018-11-23 西安交通大学 基于变分自编码机与对抗网络结合的零样本图像分类方法
CN109637634A (zh) * 2018-12-11 2019-04-16 厦门大学 一种基于生成对抗网络的医学图像合成方法
CN109829478A (zh) * 2018-12-29 2019-05-31 平安科技(深圳)有限公司 一种基于变分自编码器的问题分类方法和装置
CN109886388A (zh) * 2019-01-09 2019-06-14 平安科技(深圳)有限公司 一种基于变分自编码器的训练样本数据扩充方法和装置
CN110232480A (zh) * 2019-03-01 2019-09-13 电子科技大学 利用变分的正则化流实现的项目推荐方法及模型训练方法
CN110245380A (zh) * 2019-05-10 2019-09-17 西安理工大学 软仪表训练和样本补充方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875818A (zh) * 2018-06-06 2018-11-23 西安交通大学 基于变分自编码机与对抗网络结合的零样本图像分类方法
CN109637634A (zh) * 2018-12-11 2019-04-16 厦门大学 一种基于生成对抗网络的医学图像合成方法
CN109829478A (zh) * 2018-12-29 2019-05-31 平安科技(深圳)有限公司 一种基于变分自编码器的问题分类方法和装置
CN109886388A (zh) * 2019-01-09 2019-06-14 平安科技(深圳)有限公司 一种基于变分自编码器的训练样本数据扩充方法和装置
CN110232480A (zh) * 2019-03-01 2019-09-13 电子科技大学 利用变分的正则化流实现的项目推荐方法及模型训练方法
CN110245380A (zh) * 2019-05-10 2019-09-17 西安理工大学 软仪表训练和样本补充方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DIEDERIK P. KINGMA 等: "Auto-Encoding Variational Bayes", 《ARXIV:1312.6114V10》 *
陈松: "正演记录约束的伪样本库构建", 《中国优秀博硕士学位论文全文数据库(硕士)基础科学辑》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822437A (zh) * 2020-06-18 2021-12-21 辉达公司 深度分层的变分自动编码器
CN112085252B (zh) * 2020-08-03 2024-01-05 清华大学 一种关于集合类型决策效果的反事实预测方法
CN112200307A (zh) * 2020-10-16 2021-01-08 南通大学 一种基于图片数据扩充的识别器处理方法
CN113642822A (zh) * 2020-12-04 2021-11-12 广东省建筑设计研究院有限公司 用于评估建筑群结构安全的基于vae的样本集指向性扩展法
CN113642822B (zh) * 2020-12-04 2024-03-01 广东省建筑设计研究院有限公司 用于评估建筑群结构安全的基于vae的样本集指向性扩展法
CN113315524A (zh) * 2021-05-26 2021-08-27 武汉理工大学 一种基于深度学习的界标数据压缩传输方法及装置
CN113342655A (zh) * 2021-06-08 2021-09-03 浙江工商大学 一种面向众包系统的仿真测试用例生成方法及装置
CN113342655B (zh) * 2021-06-08 2023-09-29 浙江工商大学 一种面向众包系统的仿真测试用例生成方法及装置
CN113542222A (zh) * 2021-06-16 2021-10-22 浙江工业大学 一种基于双域vae的零日多步威胁识别方法
CN113707331A (zh) * 2021-07-30 2021-11-26 电子科技大学 一种中医辨证数据生成方法与系统
CN113707331B (zh) * 2021-07-30 2023-04-07 电子科技大学 一种中医辨证数据生成方法与系统
CN113611367A (zh) * 2021-08-05 2021-11-05 湖南大学 一种基于VAE数据增强的CRISPR/Cas9脱靶预测方法
CN115291108A (zh) * 2022-06-27 2022-11-04 东莞新能安科技有限公司 数据生成方法、装置、设备及计算机程序产品
CN116958712B (zh) * 2023-09-20 2023-12-15 山东建筑大学 基于先验概率分布的图像生成方法、系统、介质及设备
CN116958712A (zh) * 2023-09-20 2023-10-27 山东建筑大学 基于先验概率分布的图像生成方法、系统、介质及设备
CN117710371A (zh) * 2024-02-05 2024-03-15 成都数之联科技股份有限公司 一种扩充缺陷样本的方法、装置、设备及存储介质
CN117710371B (zh) * 2024-02-05 2024-04-26 成都数之联科技股份有限公司 一种扩充缺陷样本的方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111258992A (zh) 一种基于变分自编码器的地震数据扩充方法
Bartunov et al. Few-shot generative modelling with generative matching networks
CN108121975B (zh) 一种联合原始数据和生成数据的人脸识别方法
Kim et al. Disentangling by factorising
CN112765352A (zh) 基于具有自注意力机制的图卷积神经网络文本分类方法
CN109389166A (zh) 基于局部结构保存的深度迁移嵌入聚类机器学习方法
CN110060657B (zh) 基于sn的多对多说话人转换方法
CN112766386A (zh) 一种基于多输入多输出融合网络的广义零样本学习方法
CN112464004A (zh) 一种多视角深度生成图像聚类方法
CN107909115A (zh) 一种图像中文字幕生成方法
CN108549718B (zh) 一种通用主题嵌入模型联合训练方法
Nair et al. Analysis-by-synthesis by learning to invert generative black boxes
Wang Research on handwritten note recognition in digital music classroom based on deep learning
CN111144500A (zh) 基于解析高斯机制的差分隐私深度学习分类方法
Gangloff et al. Deep parameterizations of pairwise and triplet Markov models for unsupervised classification of sequential data
Gao Game-theoretic approaches for generative modeling
Lee et al. Ensemble of binary tree structured deep convolutional network for image classification
Chang Latent variable modeling for generative concept representations and deep generative models
CN115577111A (zh) 基于自注意力机制的文本分类方法
CN115131549A (zh) 一种基于自提升学习的显著性目标检测训练方法
CN114863548A (zh) 基于人体运动姿态非线性空间特征的情绪识别方法及装置
CN112667808A (zh) 一种基于bert模型的关系抽取方法及其系统
Chen et al. LDAnet: a discriminant subspace for metric-based few-shot learning
Yazdani RemixNet: generative adversarial networks for mixing multiple inputs
Gavranović Compositional deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200609

RJ01 Rejection of invention patent application after publication