CN117455013B - 一种训练样本数据生成方法、系统、电子设备及介质 - Google Patents

一种训练样本数据生成方法、系统、电子设备及介质 Download PDF

Info

Publication number
CN117455013B
CN117455013B CN202311501401.0A CN202311501401A CN117455013B CN 117455013 B CN117455013 B CN 117455013B CN 202311501401 A CN202311501401 A CN 202311501401A CN 117455013 B CN117455013 B CN 117455013B
Authority
CN
China
Prior art keywords
sample data
frequency domain
domain sample
initial
average value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311501401.0A
Other languages
English (en)
Other versions
CN117455013A (zh
Inventor
侯文魁
罗海
王超
王世杰
廉信
赵卓然
聂航宇
解运浩
胡剑雄
黄正源
张浩杰
秦旺
谭万聪
许莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Marvel Stone Healthcare Co Ltd
Original Assignee
Wuxi Marvel Stone Healthcare Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Marvel Stone Healthcare Co Ltd filed Critical Wuxi Marvel Stone Healthcare Co Ltd
Priority to CN202311501401.0A priority Critical patent/CN117455013B/zh
Publication of CN117455013A publication Critical patent/CN117455013A/zh
Application granted granted Critical
Publication of CN117455013B publication Critical patent/CN117455013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Complex Calculations (AREA)

Abstract

本发明属于数据处理技术领域,其目的在于提供一种训练样本数据生成方法、系统、电子设备及介质。本发明根据所述最小区域平均值及所述最大区域平均值得到频域交换比例,并通过一由指定频率组成的频率集合中提取的真子集,对初始频域样本数据的特定区域进行频率数据交换,而非在初始频域样本数据的图像域进行数据交换,使得本发明具备更强的鲁棒性,可避免生成不自然的数据,相对现有技术而言,本发明得到的训练样本数据的质量更佳。

Description

一种训练样本数据生成方法、系统、电子设备及介质
技术领域
本发明属于数据处理技术领域,具体涉及一种训练样本数据生成方法、系统、电子设备及介质。
背景技术
目前,深度学习在自然语言处理、计算机视觉等多个方面已取得了巨大的成功。由于深度学习通常需要大量的训练数据,而训练数据的收集经常是比较困难的,因此利用训练样本数据生成方法来扩充训练样本是一种经常用到的方法。
在深度学习降噪任务中,通常需要对数据进行互相独立的多次采集,每次采集到的数据记为D,且有D=S+N,其中S为无噪声的真实信号,N为采集到的噪声,噪声N中每个元素都独立同分布且与真实信号S无关。
现有技术中,在完成互相独立的多次数据采集后,深度学习模型的输入、输出通常有以下两种数据构造方式:
A、将单次采集的带噪声数据作为模型的输入数据,将多次采集的数据进行平均,并将平均后数据作为模型的输出数据;
B、将单次采集的带噪声数据作为模型的输入数据,将另一次采集的数据作为模型的输出数据。其中,这两次采集的数据信号相同,噪声互相独立,这种方法通常被称为Noise2Noise去噪方法;
如果对数据进行了多次采集,且多次采集的数据中的噪声是相互独立的,那么可以在任意两次采集的数据间随机交换部分数据值,以构造新的数据集。该训练样本数据生成方法适用于上述A、B两种数据构造方式,通过执行m次训练样本数据生成处理,可使得训练样本集增大m倍。
但是,在使用现有技术过程中,发明人发现现有技术中至少存在如下问题:
在理想情况下,多次采集的数据中的真实信号应当相同,但在实际运行过程中,由于运动等因素影响,这一点并不能保证一定成立。如果两次采集的数据中的真实信号有较大区别,再通过现有技术中随机交换部分数据值的方式,生成的新样本数据的质量往往很差,同时新样本数据与真实数据之间有着肉眼可见的区别。
发明内容
本发明旨在至少在一定程度上解决上述技术问题,本发明提供了一种训练样本数据生成方法、系统、电子设备及介质。
为了实现上述目的,本发明采用以下技术方案:
第一方面,本发明提供了一种训练样本数据生成方法,包括:
获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据;
计算两个初始时域样本数据之间的数据差值,将所述数据差值划分为n块区域,获取n块区域的区域平均值,并根据n块区域的区域平均值得到其中的最小区域平均值及最大区域平均值;其中,n为大于2的自然数;
根据所述最小区域平均值及所述最大区域平均值得到频域交换比例;
根据所述频域交换比例,从任一所述初始频域样本数据的频域范围中提取得到所有指定频率,并将该所有指定频率组成频率集合;
从所述频率集合提取一真子集,并根据所述真子集中的指定频率对两个初始频域样本数据分别进行频率交换处理,得到与两个初始频域样本数据对应的两个处理后频域样本数据;
根据两个处理后频域样本数据得到两个处理后时域样本数据,并将该两个处理后时域样本数据记为新样本数据。
本发明可以避免生成与真实数据显著不同的数据,使得训练样本的质量得以提升。具体地,本发明在实施过程中,先获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据;然后计算两个初始时域样本数据之间的数据差值,将所述数据差值划分为n块区域,获取n块区域的区域平均值,并根据n块区域的区域平均值得到其中的最小区域平均值及最大区域平均值;再根据所述最小区域平均值及所述最大区域平均值得到频域交换比例,以根据所述频域交换比例,从任一所述初始频域样本数据的频域范围中提取得到所有指定频率,并将该所有指定频率组成频率集合;随后从所述频率集合提取一真子集,并根据所述真子集中的指定频率对两个初始频域样本数据分别进行频率交换处理,得到与两个初始频域样本数据对应的两个处理后频域样本数据;最后根据两个处理后频域样本数据得到两个处理后时域样本数据,并将该两个处理后时域样本数据记为新样本数据。在此过程中,本发明根据所述最小区域平均值及所述最大区域平均值得到频域交换比例,并通过一由指定频率组成的频率集合中提取的真子集,对初始频域样本数据的特定区域进行频率数据交换,而非在初始频域样本数据的图像域进行数据交换,使得本发明具备更强的鲁棒性,可避免生成不自然的数据,相对现有技术而言,本发明得到的训练样本数据的质量更佳。
在一个可能的设计中,获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据,包括:
获取多次采集的初始时域样本数据;
从多次采集的初始时域样本数据中随机抽取其中任意两次采集的初始时域样本数据;
对抽取的两次采集的初始时域样本数据通过FFT变换到频域空间,得到两次采集的初始频域样本数据。
在一个可能的设计中,获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据,包括:
通过磁共振成像处理获取多次采集的初始频域样本数据;
从多次采集的初始频域样本数据中随机抽取其中任意两次采集的初始频域样本数据;
对抽取的两次采集的初始频域样本数据通过IFFT变换处理,得到两次采集的初始时域样本数据。
在一个可能的设计中,获取n块区域的区域平均值,包括:
根据n块区域中的所有点坐标,得到n块区域的中心点坐标;其中,任一块区域的中心点坐标为当前区域的所有点坐标的平均值;
分别计算n块区域的区域平均值;其中,任一区域的区域平均值为:式中,x为当前区域Di中任一点的坐标,Z(x)表示在坐标x处Z的取值,abs()表示绝对值符号,|Di|表示当前区域Di中的元素个数。
在一个可能的设计中,根据所述最小区域平均值及所述最大区域平均值得到频域交换比例,包括:
根据所述最小区域平均值及所述最大区域平均值得到中间值;
给定一值域为[0,1]的函数,并将所述中间值作为该函数的自变量,将该函数的函数值设定为频域交换比例。
在一个可能的设计中,所述频率集合Ф中的指定频率为满足下式条件的频率:
abs(k)≥abs(kmax*(1-b));
式中,abs()表示绝对值符号,k为指定频率,kmax为当前初始频域样本数据中的最大频率,b为频域交换比例。
在一个可能的设计中,将两个初始频域样本数据分别记为FX和FY,所述频率集合Ф中的指定频率从初始频域样本数据FX的频率范围中提取得到;对应地,两个处理后频域样本数据包括与初始频域样本数据FX对应的处理后频域样本数据和与初始频域样本数据FY对应的处理后频域样本数据,其中,与初始频域样本数据FX对应的处理后频域样本数据为:
式中,k为初始频域样本数据中的指定频率;Ψ为从所述频率集合Ф中提取的真子集;
与初始频域样本数据FY对应的处理后频域样本数据为:
第二方面,本发明提供了一种训练样本数据生成系统,用于实现如上述任一项所述的训练样本数据生成方法;所述训练样本数据生成系统包括:
初始样本数据获取模块,用于获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据;
初始样本数据处理模块,与所述初始样本数据获取模块通信连接,用于计算两个初始时域样本数据之间的数据差值,将所述数据差值划分为n块区域,获取n块区域的区域平均值,并根据n块区域的区域平均值得到其中的最小区域平均值及最大区域平均值;其中,n为大于2的自然数;
所述初始样本数据处理模块,还用于根据所述最小区域平均值及所述最大区域平均值得到频域交换比例;
所述初始样本数据处理模块,还用于根据所述频域交换比例,从任一所述初始频域样本数据的频域范围中提取得到所有指定频率,并将该所有指定频率组成频率集合;
新样本数据生成模块,与所述初始样本数据处理模块通信连接,用于从所述频率集合提取一真子集,并根据所述真子集中的指定频率对两个初始频域样本数据分别进行频率交换处理,得到与两个初始频域样本数据对应的两个处理后频域样本数据;
所述新样本数据生成模块,还用于根据两个处理后频域样本数据得到两个处理后时域样本数据,并将该两个处理后时域样本数据记为新样本数据。
第三方面,本发明提供了一种电子设备,包括:
存储器,用于存储计算机程序指令;以及,
处理器,用于执行所述计算机程序指令从而完成如上述任一项所述的训练样本数据生成方法的操作。
第四方面,本发明提供了一种计算机可读存储介质,用于存储计算机可读取的计算机程序指令,所述计算机程序指令被配置为运行时执行如上述任一项所述的训练样本数据生成方法的操作。
附图说明
图1是实施例中一种训练样本数据生成方法的流程图;
图2是采用传统方法生成的新样本数据;
图3是采用实施例1生成的新样本数据;
图4是实施例中一种训练样本数据生成系统的模块框图;
图5是实施例中一种电子设备的模块框图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图和实施例或现有技术的描述对本发明作简单地介绍,显而易见地,下面关于附图结构的描述仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。
实施例1:
本实施例公开了一种训练样本数据生成方法,可以但不限于由具有一定计算资源的计算机设备或虚拟机执行,例如由个人计算机、智能手机、个人数字助理或可穿戴设备等电子设备执行,或者由虚拟机执行。
如图1所示,一种训练样本数据生成方法,可以但不限于包括有如下步骤:
S1.获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据;本实施例中,将两次采集得到的初始时域样本数据分别记为X和Y,将两次采集得到的初始频域样本数据分别记为FX和FY,通过对初始时域样本数据进行FFT(fast Fourier transform,快速傅里叶变换)变换即可得到对应的初始频域样本数据,即FX=FFT(X),FY=FFT(Y);对应地,初始频域样本数据还可通过IFFT(Inverse Fast Fourier Transform,快速傅里叶逆变换)变换得到其对应的初始时域样本数据X和Y,其中,X=IFFT(FX)、Y=FFT(FY)。需要说明的是,本实施例中,初始时域样本数据也可替换为如图像域等空域样本数据。
本实施例中,可采用下述两种方式获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据:
方式一中,获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据,包括:
获取多次采集的初始时域样本数据;
从多次采集的初始时域样本数据中随机抽取其中任意两次采集的初始时域样本数据;本实施例中,可将该两次采集的初始时域样本数据分别记为X和Y;
对抽取的两次采集的初始时域样本数据通过FFT变换到频域空间,得到两次采集的初始频域样本数据。本实施例中,两次采集得到的初始频域样本数据分别记为FX和FY,其中,FX=FFT(X),FY=FFT(Y)。
方式二中,获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据,包括:
通过磁共振成像处理获取多次采集的初始频域样本数据;需要说明的是,部分情况下,原始数据采集就在频域进行,如通过核磁共振处理采集到的数据本身即为频域数据,故本实施例可直接通过核磁共振处理获取两次采集得到的初始频域样本数据。
从多次采集的初始频域样本数据中随机抽取其中任意两次采集的初始频域样本数据;
对抽取的两次采集的初始频域样本数据通过IFFT变换处理,得到两次采集的初始时域样本数据。本实施例中,两次采集的初始时域样本数据分别记为X和Y,其中,X=IFFT(FX)、Y=FFT(FY)。
S2.计算两个初始时域样本数据之间的数据差值Z=X-Y,将所述数据差值按初始时域样本数据的时间坐标或空间坐标划分为n块区域D1,…,Dn,获取n块区域的区域平均值M1,…,Mn,并根据n块区域的区域平均值得到其中的最小区域平均值Mmin及最大区域平均值Mmax;其中,n为大于2的自然数;本实施例中,将n块区域记为D1,…,Dn,将n块区域的区域平均值记为M1,…,Mn,其中的最小区域平均值记为Mmin,最大区域平均值记为Mmax
本实施例中,获取n块区域的区域平均值M1,…,Mn,包括:
根据n块区域中的所有点坐标,得到n块区域的中心点坐标c1…cn;其中,任一块区域的中心点坐标为当前区域的所有点坐标的平均值;需要说明的是,任一块区域的中心点坐标ci可满足如下条件:当前区域中任一点的坐标x到其中心点坐标ci的距离小于等于其到其他区域中心点坐标的距离,也即式中,cj为任一其他区域,||||为1范数或2范数。
分别计算n块区域的区域平均值;其中,任一区域的区域平均值为:式中,x为当前区域Di中任一点的坐标,Z(x)表示在坐标x处Z的取值,也即两个初始时域样本数据之间的数据差值,理想情况下Z为一纯噪的图,且不同的区域有着相同的统计分布。abs()表示绝对值符号,|Di|表示当前区域Di中的元素个数。
S3.根据所述最小区域平均值Mmin及所述最大区域平均值Mmax得到频域交换比例。
具体地,本实施例中,根据所述最小区域平均值Mmin及所述最大区域平均值Mmax得到频域交换比例,包括:
根据所述最小区域平均值Mmin及所述最大区域平均值Mmax得到中间值;其中,中间值为a=(Mmax-Mmin)/Mmin
给定一值域为[0,1]的函数f(x),并将所述中间值作为该函数f(x)的自变量,将该函数f(a)的函数值设定为频域交换比例。具体地,如将频域交换比例设定为b,则本实施例中,频域交换比例为b=f(a)。作为示例,本实施例中,函数f(x)如为f(x)=max(1-min(x/5,1),0.05),b=f(a),b表示频域交换的比例。
S4.根据所述频域交换比例,从任一所述初始频域样本数据的频域范围中提取得到所有指定频率,并将该所有指定频率组成频率集合Ф。
具体地,本实施例中,所述频率集合Ф中的指定频率为满足下式条件的频率:
abs(k)≥abs(kmax*(1-b));
式中,abs()表示绝对值符号,k为指定频率,kmax为当前初始频域样本数据中的最大频率,b为频域交换比例。
S5.从所述频率集合Ф提取一真子集Ψ,并根据所述真子集Ψ中的指定频率对两个初始频域样本数据分别进行频率交换处理,得到与两个初始频域样本数据对应的两个处理后频域样本数据。
本实施例中,真子集Ψ的选取具备一定的随机性,为提高获取真子集Ψ的效率,本实施例中,从所述频率集合Ф提取一真子集Ψ,包括:
A501.对所述频率集合Ф中的每一频率元素从参数为0.5的0-1分布中进行采样,如采样结果为1,则将该频率元素添加到频率集合Ф中,如采样结果为0,则不将该频率元素添加到频率集合Ф中,直到从所述频率集合Ф中提取得到所有采样结果为1的频率元素;
A502.根据提取得到所有采样结果为1的频率元素构建得到真子集Ψ。
需要说明的是,为保证多次生成的新样本数据之间有较大区别,本实施例中,将所述真子集Ψ中频率元素的个数设置为所述频率集合Ф中元素个数的1/2。
本实施例中,将两个初始频域样本数据分别记为FX和FY,所述频率集合Ф中的指定频率从初始频域样本数据FX的频率范围中提取得到;对应地,两个处理后频域样本数据包括与初始频域样本数据FX对应的处理后频域样本数据和与初始频域样本数据FY对应的处理后频域样本数据,其中,与初始频域样本数据FX对应的处理后频域样本数据为:
式中,k为初始频域样本数据中的指定频率;Ψ为从所述频率集合Ф中提取的真子集;
与初始频域样本数据FY对应的处理后频域样本数据为:
也即,本实施例中,将属于所述真子集Ψ的指定频率k,交换初始频域样本数据FX和FY中对应的值,即可得到处理后频域样本数据。
具体地,本实施例可通过真子集中的频率,自动计算初始频域样本数据中交换点的频域范围,进而实现对初始频域样本数据的特定区域的频率数据交换。
S6.根据两个处理后频域样本数据得到两个处理后时域样本数据,并将该两个处理后时域样本数据记为新样本数据。本实施例中,将处理后时域样本数据分别记为FX’和FY’,可通过IFFT变换得到所述处理后频域样本数据对应的处理后时域样本数据X’和Y’,该处理后时域样本数据X’和Y’即为本实施例生成的新样本数据,其可作为训练样本数据进行使用。
对应地,如初始时域样本数据也可替换为如图像域等空域样本数据,则本实施例最终可得到两个处理后空域样本数据,并将该两个处理后空域样本数据记为新样本数据。
应当理解的是,本实施例中,可重复执行多次步骤S5-S6,进而可得到多组处理后时域样本数据,也即生成多组新样本数据。
为进一步说明本实施例的实施效果,申请人给出了采用传统方法生成的新样本数据,如图2所示,以及采用本实施例生成的新样本数据,如图3所示,对比可知采用本实施例中训练样本数据生成方法生成的新样本数据的质量更佳。
本实施例可以避免生成与真实数据显著不同的数据,使得训练样本的质量得以提升。具体地,本实施例在实施过程中,先获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据;然后计算两个初始时域样本数据之间的数据差值,将所述数据差值划分为n块区域,获取n块区域的区域平均值,并根据n块区域的区域平均值得到其中的最小区域平均值及最大区域平均值;再根据所述最小区域平均值及所述最大区域平均值得到频域交换比例,以根据所述频域交换比例,从任一所述初始频域样本数据的频域范围中提取得到所有指定频率,并将该所有指定频率组成频率集合;随后从所述频率集合提取一真子集,并根据所述真子集中的指定频率对两个初始频域样本数据分别进行频率交换处理,得到与两个初始频域样本数据对应的两个处理后频域样本数据;最后根据两个处理后频域样本数据得到两个处理后时域样本数据,并将该两个处理后时域样本数据记为新样本数据。在此过程中,本实施例根据所述最小区域平均值及所述最大区域平均值得到频域交换比例,并通过一由指定频率组成的频率集合中提取的真子集,对初始频域样本数据的特定区域进行频率数据交换,而非在初始频域样本数据的图像域进行数据交换,使得本实施例具备更强的鲁棒性,可避免生成不自然的数据,相对现有技术而言,本实施例得到的训练样本数据的质量更佳。
下面给出本实施例的一具体实施方式:
采集1000帧(也可称之为slice,片)初始样本数据,每帧初始样本数据重复采集两次,其中,初始样本数据可为时域数据和/或频域数据,通过FFT变换或IFFT变换即可得到初始时域样本数据及其对应的初始频域样本数据;基于初始时域样本数据及其对应的初始频域样本数据可得到频率集合Ф,并对上述步骤S5-S6重复执行19次,加上初始样本数据,每帧初始样本数据可构造20个训练样本数据,进而一共可生成20000个训练样本数据,使得可用于深度学习训练样本数据显著增多。
实施例2:
本实施例公开了一种训练样本数据生成系统,用于实现实施例1中训练样本数据生成方法;如图2所示,所述训练样本数据生成系统包括:
初始样本数据获取模块,用于获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据;
初始样本数据处理模块,与所述初始样本数据获取模块通信连接,用于计算两个初始时域样本数据之间的数据差值,将所述数据差值划分为n块区域,获取n块区域的区域平均值,并根据n块区域的区域平均值得到其中的最小区域平均值及最大区域平均值;其中,n为大于2的自然数;
所述初始样本数据处理模块,还用于根据所述最小区域平均值及所述最大区域平均值得到频域交换比例;
所述初始样本数据处理模块,还用于根据所述频域交换比例,从任一所述初始频域样本数据的频域范围中提取得到所有指定频率,并将该所有指定频率组成频率集合;
新样本数据生成模块,与所述初始样本数据处理模块通信连接,用于从所述频率集合提取一真子集,并根据所述真子集中的指定频率对两个初始频域样本数据分别进行频率交换处理,得到与两个初始频域样本数据对应的两个处理后频域样本数据;
所述新样本数据生成模块,还用于根据两个处理后频域样本数据得到两个处理后时域样本数据,并将该两个处理后时域样本数据记为新样本数据。
实施例3:
在实施例1或2的基础上,本实施例公开了一种电子设备,该设备可以是智能手机、平板电脑、笔记本电脑或者台式电脑等。电子设备可能被称为用户终端、便携式终端、台式终端等,如图5所示,电子设备包括:
存储器,用于存储计算机程序指令;以及,
处理器,用于执行所述计算机程序指令从而完成如实施例1中任一所述的训练样本数据生成方法的操作。
具体地,处理器301可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable LogicArray,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(CentralProcessing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器301可以再集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。
存储器302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器301所执行以实现本申请中实施例1提供的训练样本数据生成方法。
在一些实施例中,终端还可选包括有:通信接口303和至少一个外围设备。处理器301、存储器302和通信接口303之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与通信接口303相连。具体地,外围设备包括:射频电路304、显示屏305和电源306中的至少一种。
通信接口303可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器301和存储器302。在一些实施例中,处理器301、存储器302和通信接口303被集成在同一芯片或电路板上;在一些其他实施例中,处理器301、存储器302和通信接口303中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路304用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路304通过电磁信号与通信网络以及其他通信设备进行通信。
显示屏305用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。
电源306用于为电子设备中的各个组件进行供电。
实施例4:
在实施例1至3任一项实施例的基础上,本实施例公开了一种计算机可读存储介质,用于存储计算机可读取的计算机程序指令,所述计算机程序指令被配置为运行时执行如实施例1所述的训练样本数据生成方法的操作。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
最后应说明的是,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种训练样本数据生成方法,其特征在于:包括:
获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据;
计算两个初始时域样本数据之间的数据差值,将所述数据差值划分为n块区域,获取n块区域的区域平均值,并根据n块区域的区域平均值得到其中的最小区域平均值及最大区域平均值;其中,n为大于2的自然数;
根据所述最小区域平均值及所述最大区域平均值得到频域交换比例;
根据所述频域交换比例,从任一所述初始频域样本数据的频域范围中提取得到所有指定频率,并将该所有指定频率组成频率集合;
从所述频率集合提取一真子集,并根据所述真子集中的指定频率对两个初始频域样本数据分别进行频率交换处理,得到与两个初始频域样本数据对应的两个处理后频域样本数据;
根据两个处理后频域样本数据得到两个处理后时域样本数据,并将该两个处理后时域样本数据记为新样本数据;
根据所述最小区域平均值及所述最大区域平均值得到频域交换比例,包括:
根据所述最小区域平均值及所述最大区域平均值得到中间值;
给定一值域为[0,1]的函数,并将所述中间值作为该函数的自变量,将该函数的函数值设定为频域交换比例;
将两个初始频域样本数据分别记为FX和FY,所述频率集合中的指定频率从初始频域样本数据FX的频率范围中提取得到;对应地,两个处理后频域样本数据包括与初始频域样本数据FX对应的处理后频域样本数据和与初始频域样本数据FY对应的处理后频域样本数据,其中,与初始频域样本数据FX对应的处理后频域样本数据为:
式中,k为初始频域样本数据中的指定频率;Ψ为从所述频率集合中提取的真子集;
与初始频域样本数据FY对应的处理后频域样本数据为:
2.根据权利要求1所述的一种训练样本数据生成方法,其特征在于:获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据,包括:
获取多次采集的初始时域样本数据;
从多次采集的初始时域样本数据中随机抽取其中任意两次采集的初始时域样本数据;
对抽取的两次采集的初始时域样本数据通过FFT变换到频域空间,得到两次采集的初始频域样本数据。
3.根据权利要求1所述的一种训练样本数据生成方法,其特征在于:获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据,包括:
通过磁共振成像处理获取多次采集的初始频域样本数据;
从多次采集的初始频域样本数据中随机抽取其中任意两次采集的初始频域样本数据;
对抽取的两次采集的初始频域样本数据通过IFFT变换处理,得到两次采集的初始时域样本数据。
4.根据权利要求1所述的一种训练样本数据生成方法,其特征在于:获取n块区域的区域平均值,包括:
根据n块区域中的所有点坐标,得到n块区域的中心点坐标;其中,任一块区域的中心点坐标为当前区域的所有点坐标的平均值;
分别计算n块区域的区域平均值;其中,任一区域的区域平均值为:式中,x为当前区域Di中任一点的坐标,Z(x)表示在坐标x处两个初始时域样本数据之间的数据差值,abs()表示绝对值符号,|Di|表示当前区域Di中的元素个数。
5.根据权利要求1所述的一种训练样本数据生成方法,其特征在于:所述频率集合中的指定频率为满足下式条件的频率:
abs(k)≥abs(kmax*(1-b));
式中,abs()表示绝对值符号,k为指定频率,kmax为当前初始频域样本数据中的最大频率,b为频域交换比例。
6.一种训练样本数据生成系统,其特征在于:用于实现如权利要求1至5中任一项所述的训练样本数据生成方法;所述训练样本数据生成系统包括:
初始样本数据获取模块,用于获取两次采集得到的初始时域样本数据及其对应的初始频域样本数据;
初始样本数据处理模块,与所述初始样本数据获取模块通信连接,用于计算两个初始时域样本数据之间的数据差值,将所述数据差值划分为n块区域,获取n块区域的区域平均值,并根据n块区域的区域平均值得到其中的最小区域平均值及最大区域平均值;其中,n为大于2的自然数;
所述初始样本数据处理模块,还用于根据所述最小区域平均值及所述最大区域平均值得到频域交换比例;
所述初始样本数据处理模块,还用于根据所述频域交换比例,从任一所述初始频域样本数据的频域范围中提取得到所有指定频率,并将该所有指定频率组成频率集合;
新样本数据生成模块,与所述初始样本数据处理模块通信连接,用于从所述频率集合提取一真子集,并根据所述真子集中的指定频率对两个初始频域样本数据分别进行频率交换处理,得到与两个初始频域样本数据对应的两个处理后频域样本数据;
所述新样本数据生成模块,还用于根据两个处理后频域样本数据得到两个处理后时域样本数据,并将该两个处理后时域样本数据记为新样本数据。
7.一种电子设备,其特征在于:包括:
存储器,用于存储计算机程序指令;以及,
处理器,用于执行所述计算机程序指令从而完成如权利要求1至5中任一项所述的训练样本数据生成方法的操作。
8.一种计算机可读存储介质,用于存储计算机可读取的计算机程序指令,其特征在于:所述计算机程序指令被配置为运行时执行如权利要求1至5中任一项所述的训练样本数据生成方法的操作。
CN202311501401.0A 2023-11-10 2023-11-10 一种训练样本数据生成方法、系统、电子设备及介质 Active CN117455013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311501401.0A CN117455013B (zh) 2023-11-10 2023-11-10 一种训练样本数据生成方法、系统、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311501401.0A CN117455013B (zh) 2023-11-10 2023-11-10 一种训练样本数据生成方法、系统、电子设备及介质

Publications (2)

Publication Number Publication Date
CN117455013A CN117455013A (zh) 2024-01-26
CN117455013B true CN117455013B (zh) 2024-06-18

Family

ID=89596509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311501401.0A Active CN117455013B (zh) 2023-11-10 2023-11-10 一种训练样本数据生成方法、系统、电子设备及介质

Country Status (1)

Country Link
CN (1) CN117455013B (zh)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110428004B (zh) * 2019-07-31 2021-02-05 中南大学 数据失衡下基于深度学习的机械零部件故障诊断方法
CN110477910A (zh) * 2019-08-14 2019-11-22 深圳先进技术研究院 癫痫发作预测装置、终端设备以及计算机可读存储介质
CN111678696A (zh) * 2020-06-17 2020-09-18 南昌航空大学 基于联邦学习的机械智能故障诊断方法
EP4050518A1 (en) * 2021-02-25 2022-08-31 Siemens Aktiengesellschaft Generation of realistic data for training of artificial neural networks
WO2022194344A1 (en) * 2021-03-16 2022-09-22 Huawei Technologies Co., Ltd. Learnable augmentation space for dense generative adversarial networks
CN113067653B (zh) * 2021-03-17 2022-01-14 北京邮电大学 一种频谱感知方法、装置、电子设备及介质
CN113177451B (zh) * 2021-04-21 2024-01-12 北京百度网讯科技有限公司 图像处理模型的训练方法、装置、电子设备及存储介质
CN114692680A (zh) * 2022-03-16 2022-07-01 北京航空航天大学 脑电信号特征处理方法及装置
CN115905817B (zh) * 2022-12-20 2023-11-03 无锡鸣石峻致医疗科技有限公司 一种多通道非均匀场信号降噪方法、装置和存储介质
CN115952434A (zh) * 2022-12-23 2023-04-11 中国电子科技集团公司第十研究所 一种面向信号识别深度学习模型训练的数据增强方法
CN116959059A (zh) * 2023-04-04 2023-10-27 腾讯科技(深圳)有限公司 一种活体检测的方法、装置以及存储介质
CN116503507B (zh) * 2023-06-26 2023-08-29 中国科学院自动化研究所 基于预训练模型的磁粒子图像重建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于改进DCGAN 的毫米波雷达相互干扰时频图像生成研究——以生成样本对CNN 干扰抑制模型性能影响为例;陈泽伟 等;《现代信息科技》;20220710;第6卷(第13期);55-61 *
旋转设备数据不平衡问题的数据生成方法;李洁松 等;《振动、测试与诊断》;20230630;第43卷(第3期);547-554 *

Also Published As

Publication number Publication date
CN117455013A (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
CN106657681B (zh) 一种移动终端刷新率的控制方法、装置及移动终端
CN110097086A (zh) 图像生成模型训练方法、图像生成方法、装置、设备及存储介质
EP2352121A1 (en) Image processing apparatus and method
CN114492599B (zh) 基于傅里叶域自适应的医疗影像预处理方法和装置
CN111935746B (zh) 获取通信参数的方法、装置、终端及存储介质
CN111047509A (zh) 一种图像特效处理方法、装置及终端
CN112001331B (zh) 图像识别方法、装置、设备及存储介质
CN103871014B (zh) 改变图像颜色的方法及装置
CN113505848A (zh) 模型训练方法和装置
CN112767281A (zh) 图像鬼影消除方法、装置、电子设备及存储介质
CN113052096A (zh) 一种视频检测方法、装置、设备及存储介质
WO2022170982A1 (zh) 图像处理方法、图像生成方法、装置、设备和介质
CN117332211A (zh) 一种局部放电信号去噪方法、系统、电子设备及介质
CN117455013B (zh) 一种训练样本数据生成方法、系统、电子设备及介质
CN114298895B (zh) 图像真实感风格迁移方法、装置、设备及存储介质
CN110059739B (zh) 图像合成方法、装置、电子设备和计算机可读存储介质
EP2798614B1 (en) Method of and apparatus for low-complexity detection of periodic textures
CN117496990A (zh) 语音去噪方法、装置、计算机设备及存储介质
CN113361575B (zh) 模型训练方法、装置和电子设备
CN111062995B (zh) 生成人脸图像的方法、装置、电子设备和计算机可读介质
CN110097622B (zh) 渲染图像的方法、装置、电子设备和计算机可读存储介质
CN111260663A (zh) 鼻咽癌的病灶图像分割装置、设备及计算机可读存储介质
CN116631054B (zh) 一种运动动作矫正方法、系统、电子设备及介质
CN112731359B (zh) 超声探头的速度确定方法、装置及存储介质
CN116339733B (zh) 一种应用程序页面生成方法、系统、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant