CN115455668A - 针对表格数据的仿真数据生成方法、装置及电子设备 - Google Patents
针对表格数据的仿真数据生成方法、装置及电子设备 Download PDFInfo
- Publication number
- CN115455668A CN115455668A CN202211029674.5A CN202211029674A CN115455668A CN 115455668 A CN115455668 A CN 115455668A CN 202211029674 A CN202211029674 A CN 202211029674A CN 115455668 A CN115455668 A CN 115455668A
- Authority
- CN
- China
- Prior art keywords
- data
- column
- cumulative distribution
- distribution table
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004088 simulation Methods 0.000 title claims abstract description 113
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000009826 distribution Methods 0.000 claims abstract description 255
- 230000001186 cumulative effect Effects 0.000 claims abstract description 137
- 239000011159 matrix material Substances 0.000 claims abstract description 28
- 238000005315 distribution function Methods 0.000 claims description 19
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 12
- 238000000354 decomposition reaction Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 7
- 101100380303 Aeromonas salmonicida asaI gene Proteins 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 6
- 244000275021 Sesbania grandiflora Species 0.000 claims description 6
- 235000015392 Sesbania grandiflora Nutrition 0.000 claims description 6
- 150000001875 compounds Chemical class 0.000 claims description 5
- 238000010295 mobile communication Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 abstract description 2
- 230000001131 transforming effect Effects 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 8
- 238000007418 data mining Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 241000039077 Copula Species 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 244000035744 Hura crepitans Species 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011550 data transformation method Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
- G06F40/18—Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种针对表格数据的仿真数据生成方法、装置及电子设备,所述方法包括:获取累计分布表及逆累计分布表;根据累计分布表对原始数据做变换,获取变换后每一列均值和列协方差矩阵;根据获取每一列均值和列协方差矩阵生成联合高斯分布数据,最后通过查逆累计分布表仿真数据生成。本发明针对表格数据的仿真数据生成,适用于集中场景和分布式场景,生成仿真数据技术效率高,所需时间短,同时,在分布式情况下的生成数据质量高,尤其是联邦情况和非平衡情况下的仿真数据质量仍然能够满足下游任务和数据探索的需求。
Description
技术领域
本申请涉及互联网技术领域,特别是涉及一种针对表格数据的仿真数据生成方法、装置及电子设备。
背景技术
随着数据生产要素的提出和不断深化,数据价值的重要性得到广泛认可,例如药厂可以根据医院的医疗数据来辅助医药制造。一方面,很多数据具有高度隐私性,如病人医疗数据涉及到病人隐私,无法直接对外开放。另一方面,我们国家制定了个人信息保护法,对个人数据使用有严格的管理规定。这使得数据的开放比较困难,仿真数据为数据开放提供了有效的手段。
仿真数据生成主要有两种应用:一种是数据挖掘,将仿真数据开放给用户,用户使用仿真数据进行数据挖掘等下游任务。由于仿真数据和真实数据进行数据探索的性能存在一定的差异,因此主要应用于对数据挖掘要求不是特别高的场景;另一种是数据探索和调试:在该应用中,仍然希望对真实数据进行数据挖掘,但是不希望用户直接接触到真实数据。由于接触不到真实数据,前期的数据探索和程序调试就无法进行。采用仿真数据进行数据探索和程序调试,将调试后的程序迁移到真实数据上运行,然后将结果导出。在这两种应用中,都期望生成的仿真数据在数据挖掘中的性能与真实数据接近。
数据生成场景主要分为两种:第一种是集中场景,即所有的原始数据集中在一个节点上;第二种是分布式场景,又叫联邦场景,即原始数据分散在多个节点上。在分布式场景中有两种情况,一种是各个节点的数据量相差不大,称作平衡情况;第二种是各个节点的数据量相差较大,称作非平衡情况。目前在仿真数据生成方面,有两种相关的技术:(1)基于生成对抗网络(GAN)的方法,即通过机器学习技术对真实数据进行模拟,从而生成仿真数据。该方法可以应用在集中场景下和联邦场景下;(2)Gaussian Copula方法,通过数据拟合方法对表格数据的每一列进行拟合,得到其累计分布函数。以然后计算每一列的均值和列之间的协方差。通过均值和协方差生成高斯分布的数据,然后通过累积分布函数逆变换得到仿真数据。上述两种技术生成仿真数据的效率都较低,生成时间较长。尤其是在高维数据的生成中需要较长的时间。如生成一个1200行、18000列的表格数据,Gaussian Copula方法大约需要12小时,基于GAN的方法生成仿真数据大约需要200小时;上述两种技术在分布式情况下的生成数据质量较差,尤其是联邦情况和非平衡情况下的仿真数据质量较差,难以满足下游任务和数据探索的需求。
发明内容
本发明针对上述问题,提供了一种针对表格数据的仿真数据生成方法、装置及电子设备,针对表格数据的仿真数据生成,适用于集中场景和分布式场景,用于解决现有的生成仿真数据技术效率低,生成时间较长以及在分布式情况下的生成数据质量差的问题。
获取累计分布表及逆累计分布表:将每一列数据进行区间划分,统计每一个区间内的数据的个数,计算得到每个区间h的概率,即数据中的元素取值在第h个区间内的概率为,根据概率得到第列累计分布表的值,其中,根据第列累计分布表的值生成第列的逆累计分布表;
进一步的,所述生成联合高斯分布数据的替代方法如下:
获取累计分布表及逆累计分布表:统计每个数据节点中离散列的取值为a的个数为,汇聚个数据节点,得到列取值为a的个数为,得到全局概率分布,根据全局概率分布得到累计分布表,其中,根据累计分布表生成对应的逆累计分布表;
获取全局每一列均值和列协方差矩阵:对每一列数据,根据累计分布表得到数据,令为第i行位置的数据,,其中为高斯分布的逆累计分布函数,表示查累计分布表,每个节点在本地计算和,并同步进行汇聚,其中表示节点的,令,得到全局每一列均值,列协方差矩阵的元素;
进一步的,所述生成联合高斯分布数据的替代方法如下:
获取累计分布表及逆累计分布表单元,用于将每一列数据进行区间划分,统计每一个区间内的数据的个数,计算得到每个区间h的概率,即数据中的元素取值在第h个区间内的概率为,根据概率得到第列累计分布表的值,其中,根据第列累计分布表的值生成第列的逆累计分布表;
获取每一列均值和列协方差矩阵单元,用于对每一列数据,根据累计分布表变换得到数据,令为第i行位置的数据,,其中为高斯分布的逆累计分布函数,表示查累计分布表,每一列的均值为:,令,根据得到列协方差矩阵为:
进一步的,所述生成联合高斯分布数据单元的另一种实现方法为:
本发明的第四方面,提供了一种针对表格数据的仿真数据生成装置,所述装置运行在分布式场景下,有个数据节点,第个数据节点持有行数据,总共有行数据,每一行数据有列,第个数据节点的第i行第列数据记为,所述装置包括:
获取累计分布表及逆累计分布表单元,用于统计每个数据节点中离散列的取值为a的个数为,汇聚个数据节点,得到列取值为a的个数为,得到全局概率分布,根据全局概率分布得到累计分布表,其中,根据累计分布表生成对应的逆累计分布表;
获取全局每一列均值和列协方差矩阵单元,用于对每一列数据,根据累计分布表得到数据,令为第i行位置的数据,,其中为高斯分布的逆累计分布函数,表示查累计分布表,每个节点在本地计算和,并同步进行汇聚,其中表示节点的,令,得到全局每一列均值,列协方差矩阵的元素;
进一步的,所述生成联合高斯分布数据单元的另一种实现方法为:
本发明的第五方面,提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述针对表格数据的仿真数据生成方法。
本发明提供的一种针对表格数据的仿真数据生成方法、装置及电子设备,针对表格数据的仿真数据生成,适用于集中场景和分布式场景,用于解决现有的生成仿真数据技术效率低,生成时间较长以及在分布式情况下的生成数据质量差的问题,本发明的有益效果为:生成仿真数据技术效率高,所需时间短;在分布式情况下的生成数据质量高,尤其是联邦情况和非平衡情况下的仿真数据质量仍然能够满足下游任务和数据探索的需求。
附图说明
图1是本发明实施例1中针对表格数据的仿真数据生成方法流程图;
图2是本发明实施例2中针对表格数据的仿真数据生成方法流程示意图;
图3是本发明实施例3中针对表格数据的仿真数据生成装置结构示意图;
图4是本发明实施例4中针对表格数据的仿真数据生成装置结构示意图;
图5是本发明实施例5中一种电子设备的架构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅出示了与本发明相关的部分而非全部结构。
本发明实施例针对一种针对表格数据的仿真数据生成方法、装置及电子设备,提供了如下实施例:
基于本发明的实施例1
S110、获取累计分布表及逆累计分布表:将每一列数据根据精度需要进行区间划分,即每个区间长度不超过精度的大小,统计每一个区间内的数据的个数,计算得到每个区间h的概率,即数据中的元素取值在第h个区间内的概率为,根据概率得到第列累计分布表的值,其中,根据第列累计分布表的值生成第列的逆累计分布表;
具体实施过程中,将每一列数据根据需要的精度进行区间划分,统计每一个区间内的数据的个数,进而可以计算得到每个区间h的概率,即数据中的元素取值在第h个区间内的概率为。进而得到第列累计分布表的值,其中 ,时, 。然后计算累计分布表的逆表,称作第列的逆累计分布表。
S120、获取每一列均值和列协方差矩阵:对每一列数据,根据累计分布表变换得到数据,令为第i行位置的数据,,其中为高斯分布的逆累计分布函数,表示查累计分布表,每一列的均值为:,令,根据得到列协方差矩阵为:
优选地,生成联合高斯分布数据也可以用另一种方法替代,如下:
基于本发明的实施例2
如图2所示,为本发明实施例2的一种针对表格数据的仿真数据生成方法流程图,实施例2在分布式场景下,分布式场景与实施例1中的集中场景的仿真数据生成方法类似,不同的是由于缺失全局数据的累计分布表、均值和协方差,需要每个节点在本地计算局部信息并聚合得到全局的累计分布表、均值和协方差。在分布式场景下,需要一个汇聚节点对每个节点的局部信息进行汇聚,从而得到全局累计分布表、均值和协方差。在实际系统中,任意一个节点可以充当汇聚节点的作用,也可以单独设置一个节点作为汇聚节点。在调试环境和运行环境分析的数据沙箱场景中,调试环境充当汇聚节点的作用。
S210、获取累计分布表及逆累计分布表:统计每个数据节点中离散列的取值为a的个数为,汇聚个数据节点,并将其同步给汇聚节点,得到列取值为a的个数为,得到全局概率分布,根据全局概率分布得到累计分布表,其中,时, ,根据累计分布表生成对应的逆累计分布表,汇聚节点将累计分布表及其逆表下发给各个数据节点。
S220 、获取全局每一列均值和列协方差矩阵:按照集中场景下的数据变换方法,对每一列数据,根据累计分布表得到数据,令为第i行位置的数据,,为高斯分布的逆累计分布函数,表示查累计分布表,每个节点在本地计算和,并同步进行汇聚给汇聚节点。其中表示节点的,令,得到全局每一列均值,列协方差矩阵的元素,其中 和的计算方式相同,计算得到全局均值和列协方差矩阵后,汇聚节点将均值和列协方差矩阵下发给数据节点,数据节点接下来按照集中场景下仿真数据即可。
优选地,生成联合高斯分布数据的另一种替代方法有:
基于本发明的实施例3
本发明实施例3所提供的一种针对表格数据的仿真数据生成装置300可执行本发明实施例1所提供的针对表格数据的仿真数据生成方法,具备执行方法相应的功能模块和有益效果,该装置可以由软件和/或硬件(集成电路)的方式实现,并一般可集成于服务器或终端设备中。图3是本发明实施例3中的针对表格数据的仿真数据生成装置300的结构示意图。装置300运行在集中场景下,针对m行n列的原始表格数据,表示第i行第列位置的数据,表示第列数据,参照图3,本发明实施例的针对表格数据的仿真数据生成装置300具体可以包括:
获取累计分布表及逆累计分布表单元310,用于将每一列数据进行区间划分,统计每一个区间内的数据的个数,计算得到每个区间h的概率,即数据中的元素取值在第h个区间内的概率为,根据概率得到第列累计分布表的值,其中,根据第列累计分布表的值生成第列的逆累计分布表;
获取每一列均值和列协方差矩阵单元320,用于对每一列数据,根据累计分布表变换得到数据,令为第i行位置的数据,,其中为高斯分布的逆累计分布函数,表示查累计分布表,每一列的均值为:,令,根据得到列协方差矩阵为:
优选地,生成联合高斯分布数据单元330的另一种实现方法为:
除了上述4个单元以外,装置300还可以包括其他部件,然而,由于这些部件与本公开实施例的内容无关,因此在这里省略其图示和描述。
一种针对表格数据的仿真数据生成装置300的具体工作过程参照上述针对表格数据的仿真数据生成方法实施例1的描述,不再赘述。
基于本发明的实施例4
本发明实施例4所提供的一种针对表格数据的仿真数据生成装置400可执行本发明实施例2所提供的针对表格数据的仿真数据生成方法,具备执行方法相应的功能模块和有益效果,该装置可以由软件和/或硬件(集成电路)的方式实现,并一般可集成于服务器或终端设备中。图4是本发明实施例4中的针对表格数据的仿真数据生成装置400的结构示意图。装置400运行在分布式场景下,有个数据节点,第个数据节点持有行数据,总共有行数据,每一行数据有列,第个数据节点的第i行第列数据记为,参照图4,本发明实施例的针对表格数据的仿真数据生成装置400具体可以包括:
获取累计分布表及逆累计分布表单元410,用于统计每个数据节点中离散列的取值为a的个数为,汇聚个数据节点,得到列取值为a的个数为,得到全局概率分布,根据全局概率分布得到累计分布表,其中,根据累计分布表生成对应的逆累计分布表;
获取全局每一列均值和列协方差矩阵单元420,用于对每一列数据,根据累计分布表得到数据,令为第i行位置的数据,,其中为高斯分布的逆累计分布函数,表示查累计分布表,每个节点在本地计算和,并同步进行汇聚,其中表示节点的,令,得到全局每一列均值,列协方差矩阵的元素;
优选地,生成联合高斯分布数据单元430的另一种实现方法为:
除了上述4个单元以外,装置400还可以包括其他部件,然而,由于这些部件与本公开实施例的内容无关,因此在这里省略其图示和描述。
一种针对表格数据的仿真数据生成装置400的具体工作过程参照上述针对表格数据的仿真数据生成方法实施例2的描述,不再赘述。
基于本发明的实施例5
根据本发明实施例的系统也可以借助于图5所示的电子设备的架构来实现。图5示出了该电子设备的架构。如图5所示,计算系统510、系统总线530、一个或多个CPU 540、输入/输出组件520、存储器550等。存储器550可以存储计算机处理和/或通信使用的各种数据或文件以及CPU所执行包括实施例1和实施2方法的程序指令。图5所示的架构只是示例性的,在实现不同的电子设备时,根据实际需要调整图5中的一个或多个组件。
另外,在上述电子设备的实施例中,应理解,处理器可以是中央处理单元 (英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:ApplicationSpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,而前述的存储器可以是只读存储器(英文:read-onlymemory,缩写:ROM)、随机存取存储器(英文:random access memory,简称:RAM)、快闪存储器、硬盘或者固态硬盘。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
综合上述各实施例提供的一种针对表格数据的仿真数据生成方法、装置及电子设备,针对表格数据的仿真数据生成,适用于集中场景和分布式场景,用于解决现有的生成仿真数据技术效率低,生成时间较长以及在分布式情况下的生成数据质量差的问题,本发明的有益效果为:生成仿真数据技术效率高,所需时间短;在分布式情况下的生成数据质量高,尤其是联邦情况和非平衡情况下的仿真数据质量仍然能够满足下游任务和数据探索的需求。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
获取累计分布表及逆累计分布表:将每一列数据进行区间划分,统计每一个区间内的数据的个数,计算得到每个区间h的概率,即数据中的元素取值在第h个区间内的概率为,根据概率得到第列累计分布表的值,其中,根据第列累计分布表的值生成第列的逆累计分布表;
获取累计分布表及逆累计分布表:统计每个数据节点中离散列的取值为a的个数为,汇聚个数据节点,得到列取值为a的个数为,得到全局概率分布,根据全局概率分布得到累计分布表,其中,根据累计分布表生成对应的逆累计分布表;
获取全局每一列均值和列协方差矩阵:对每一列数据,根据累计分布表得到数据,令为第i行位置的数据,,其中为高斯分布的逆累计分布函数,表示查累计分布表,每个节点在本地计算和,并同步进行汇聚,其中表示节点的,令,得到全局每一列均值,列协方差矩阵的元素;
获取累计分布表及逆累计分布表单元,用于将每一列数据进行区间划分,统计每一个区间内的数据的个数,计算得到每个区间h的概率,即数据中的元素取值在第h个区间内的概率为,根据概率得到第列累计分布表的值,其中,根据第列累计分布表的值生成第列的逆累计分布表;
获取每一列均值和列协方差矩阵单元,用于对每一列数据,根据累计分布表变换得到数据,令为第i行位置的数据,,其中为高斯分布的逆累计分布函数,表示查累计分布表,每一列的均值为:,令,根据得到列协方差矩阵为:
获取累计分布表及逆累计分布表单元,用于统计每个数据节点中离散列的取值为a的个数为,汇聚个数据节点,得到列取值为a的个数为,得到全局概率分布,根据全局概率分布得到累计分布表,其中,根据累计分布表生成对应的逆累计分布表;
获取全局每一列均值和列协方差矩阵单元,用于对每一列数据,根据累计分布表得到数据,令为第i行位置的数据,,其中为高斯分布的逆累计分布函数,表示查累计分布表,每个节点在本地计算和,并同步进行汇聚,其中表示节点的,令,得到全局每一列均值,列协方差矩阵的元素;
10.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至5任一项所述的针对表格数据的仿真数据生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211029674.5A CN115455668B (zh) | 2022-08-26 | 2022-08-26 | 针对表格数据的仿真数据生成方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211029674.5A CN115455668B (zh) | 2022-08-26 | 2022-08-26 | 针对表格数据的仿真数据生成方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115455668A true CN115455668A (zh) | 2022-12-09 |
CN115455668B CN115455668B (zh) | 2023-05-30 |
Family
ID=84299966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211029674.5A Active CN115455668B (zh) | 2022-08-26 | 2022-08-26 | 针对表格数据的仿真数据生成方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115455668B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118643682A (zh) * | 2024-08-15 | 2024-09-13 | 深圳市智慧城市科技发展集团有限公司 | 数据仿真系统的控制方法、终端设备及可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180165475A1 (en) * | 2016-12-09 | 2018-06-14 | Massachusetts Institute Of Technology | Methods and apparatus for transforming and statistically modeling relational databases to synthesize privacy-protected anonymized data |
CN109255186A (zh) * | 2018-09-12 | 2019-01-22 | 浙江大学 | 一种基于输出约束ap-xgboost模型的工业过程软测量方法 |
US20200265929A1 (en) * | 2019-02-19 | 2020-08-20 | International Business Machines Corporation | Preserving privacy for data analysis |
CN111753252A (zh) * | 2020-05-09 | 2020-10-09 | 中国电力科学研究院有限公司 | 一种基于Nataf变换的随机变量样本生成方法和系统 |
CN113342655A (zh) * | 2021-06-08 | 2021-09-03 | 浙江工商大学 | 一种面向众包系统的仿真测试用例生成方法及装置 |
CN113468792A (zh) * | 2021-07-22 | 2021-10-01 | 国网宁夏电力有限公司电力科学研究院 | 电磁暂态仿真模型的参数校正方法、装置和电子设备 |
US20220004532A1 (en) * | 2020-07-02 | 2022-01-06 | Sap Se | Generation of realistic mock data |
-
2022
- 2022-08-26 CN CN202211029674.5A patent/CN115455668B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180165475A1 (en) * | 2016-12-09 | 2018-06-14 | Massachusetts Institute Of Technology | Methods and apparatus for transforming and statistically modeling relational databases to synthesize privacy-protected anonymized data |
CN109255186A (zh) * | 2018-09-12 | 2019-01-22 | 浙江大学 | 一种基于输出约束ap-xgboost模型的工业过程软测量方法 |
US20200265929A1 (en) * | 2019-02-19 | 2020-08-20 | International Business Machines Corporation | Preserving privacy for data analysis |
CN111753252A (zh) * | 2020-05-09 | 2020-10-09 | 中国电力科学研究院有限公司 | 一种基于Nataf变换的随机变量样本生成方法和系统 |
US20220004532A1 (en) * | 2020-07-02 | 2022-01-06 | Sap Se | Generation of realistic mock data |
CN113342655A (zh) * | 2021-06-08 | 2021-09-03 | 浙江工商大学 | 一种面向众包系统的仿真测试用例生成方法及装置 |
CN113468792A (zh) * | 2021-07-22 | 2021-10-01 | 国网宁夏电力有限公司电力科学研究院 | 电磁暂态仿真模型的参数校正方法、装置和电子设备 |
Non-Patent Citations (2)
Title |
---|
向夏雨: "基于生成对抗网络技术的医疗仿真数据生成方法", 通信学报 * |
王舒: "非理想信道状态下多波束卫星通信的鲁棒安全传输设计", 电子与信息学报 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118643682A (zh) * | 2024-08-15 | 2024-09-13 | 深圳市智慧城市科技发展集团有限公司 | 数据仿真系统的控制方法、终端设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115455668B (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lu et al. | Full-order and reduced-order observers for Lipschitz descriptor systems: the unified LMI approach | |
Nijmeijer et al. | An observer looks at synchronization | |
Weller et al. | Sampling zeros and the Euler-Frobenius polynomials | |
Hermoso-Carazo et al. | Extended and unscented filtering algorithms using one-step randomly delayed observations | |
CN109241068B (zh) | 前后台数据比对的方法、装置及终端设备 | |
US20090038001A1 (en) | Correlation of Log Information In A Distributed Computing Environment Using Relative Timestamps | |
CN110082823B (zh) | 一种地震数据插值方法及装置 | |
WO2020093736A1 (zh) | 基于区块链的数据处理方法、装置和服务器 | |
EP3279816A1 (en) | Data analysis processing method, apparatus, computer device, and storage medium | |
WO2020093818A1 (zh) | 基于区块链的数据处理方法、装置和服务器 | |
CN115455668A (zh) | 针对表格数据的仿真数据生成方法、装置及电子设备 | |
CN113064920A (zh) | 基于Flink的实时计算方法、装置、计算机设备及存储介质 | |
Jiang et al. | Uncertainty theory based reliability-centric cyber-physical system design | |
CN110046086A (zh) | 用于测试的期望数据生成方法及装置和电子设备 | |
CN109241163B (zh) | 电子凭证的生成方法及终端设备 | |
Saikkonen et al. | Testing for a unit root in noncausal autoregressive models | |
CN111625532A (zh) | 数据血缘关系处理方法、装置、计算机设备及存储介质 | |
CN110580307B (zh) | 一种快速统计的处理方法及装置 | |
CN110515967B (zh) | 基于spark计算框架的数据分析方法及电子设备 | |
Im et al. | Reprint of: Testing for unit roots in heterogeneous panels | |
Azari et al. | Using kernel-based collocation methods to solve a delay partial differential equation with application to finance | |
CN114463008A (zh) | 基于并行计算模型的区块链交易执行方法及装置 | |
CN113157479A (zh) | 一种数据纠错方法、系统、装置、设备和存储介质 | |
CN110489460B (zh) | 一种快速统计的优化方法及系统 | |
US20030097432A1 (en) | Date and time processing in computers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |