CN114896307A - 时间序列数据增强方法、装置和电子设备 - Google Patents

时间序列数据增强方法、装置和电子设备 Download PDF

Info

Publication number
CN114896307A
CN114896307A CN202210827192.8A CN202210827192A CN114896307A CN 114896307 A CN114896307 A CN 114896307A CN 202210827192 A CN202210827192 A CN 202210827192A CN 114896307 A CN114896307 A CN 114896307A
Authority
CN
China
Prior art keywords
data
time
time point
series data
point data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210827192.8A
Other languages
English (en)
Other versions
CN114896307B (zh
Inventor
郭晓辉
刘品
张以宁
王瑞
牟许东
刘旭东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Innovation Research Institute of Beihang University
Original Assignee
Hangzhou Innovation Research Institute of Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Innovation Research Institute of Beihang University filed Critical Hangzhou Innovation Research Institute of Beihang University
Priority to CN202210827192.8A priority Critical patent/CN114896307B/zh
Publication of CN114896307A publication Critical patent/CN114896307A/zh
Application granted granted Critical
Publication of CN114896307B publication Critical patent/CN114896307B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Complex Calculations (AREA)

Abstract

本申请提供一种时间序列数据增强方法、装置和电子设备,通过获取原始数据集,原始数据集中包含多个时间序列数据,每个时间序列数据包括多个时间点数据。针对每个时间序列数据,利用分类模型得到时间序列数据对应的类激活映射分数,类激活映射分数包含与时间点数据相同个数的子分数,每个子分数表征对应的时间点数据的显著性程度。再根据各个时间点数据对应的子分数确定待擦除时间点数据,将待擦除时间点数据进行擦除处理,以对时间序列数据进行增强。本方案通过计算类激活映射分数的方式以得到各个时间点数据的显著性程度,从而针对性地对部分时间点数据进行擦除,在有效时间数据增强的同时,可以避免损失掉其中关键信息的缺陷。

Description

时间序列数据增强方法、装置和电子设备
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种时间序列数据增强方法、装置和电子设备。
背景技术
深度神经网络具有较强的学习能力,往往在大数据集上能够取得很好的效果,而在小数据集上表现出过渡拟合、泛化能力弱等缺点。由于时间序列数据集通常规模较小,因此在时间序列分类任务中这一问题会更加严重。数据增强是一种通用的与模型无关的数据端的解决方案,它通过创建一些新的数据来增大训练集的规模,进而解决深度神经网络的过度拟合以及弱泛化问题。在时间序列分类任务中也可以采用适用于时间序列的数据增强方法。
现有的时间序列数据增强方法基本可以分为三类:1.基于随机变换的时间序列增强,比如抖动(添加噪音)、旋转(垂直翻转)、切片(裁剪)、缩放、时间维度上的随机扭曲和频率上的扭曲。2.基于模式混合的方法,不同于基于单个样本的随机变换,它是来自同一类别的多个样本的混合。在模式混合中,基于DTW(动态时间扭曲)的方法能比其他方法获得更好的性能。模式混合的其他方法包括随即特征映射,使用次优时间扭曲的平均模式,以及使用DTW的随机引导扭曲。3.基于生成的方法,这些方法通过学习数据的特征来生成新的模式。比如,高斯树、手动数学模型、趋势分量和独立分量、以及生成对抗网络,这些基于生成的方法都试图保持时间序列在数据集中的分布。
现有的时间序列数据增强方法均将数据集作为一个整体来进行随机变换,并未考虑数据集中包含的数据的具体情况,因此,在随机变换以实现数据增强可能会损失掉其中的关键信息。
发明内容
本申请的目的包括,例如,提供了一种时间序列数据增强方法、装置和电子设备,其能够在不损失数据集中关键信息的基础上实现数据增强。
本申请的实施例可以这样实现:
第一方面,本申请提供一种时间序列数据增强方法,所述方法包括:
获取原始数据集,所述原始数据集包含多个时间序列数据,每个所述时间序列数据包括多个时间点数据;
针对每个所述时间序列数据,利用分类模型得到所述时间序列数据对应的类激活映射分数,所述类激活映射分数包含与所述时间点数据相同个数的子分数,每个所述子分数表征对应的时间点数据的显著性程度;
根据各所述时间点数据对应的子分数确定待擦除时间点数据,将所述待擦除时间点数据进行擦除处理,以对所述时间序列数据进行增强。
在可选的实施方式中,所述利用分类模型得到所述时间序列数据对应的类激活映射分数的步骤,包括:
将所述时间序列数据输入至分类模型中,得到所述时间序列数据的多个特征映射以及每个特征映射对应的分类权重;
根据所述分类权重、特征映射计算得到所述时间序列数据对应的类激活映射分数。
在可选的实施方式中,所述根据所述分类权重、特征映射计算得到所述时间序列数据对应的类激活映射分数的步骤,包括:
将所述特征映射按照对应的分类权重进行加权累加,得到一与所述多个特征映射的长度一致的分数序列;
对所述分数序列进行上采样,得到与所述时间序列数据的长度一致的类激活映射分数。
在可选的实施方式中,所述根据各所述时间点数据对应的子分数确定待擦除时间点数据,将所述待擦除时间点数据进行擦除处理的步骤,包括:
将对应的子分数低于预设阈值的时间点数据确定为待擦除时间点数据;
利用设定数值替换所述待擦除时间点数据。
在可选的实施方式中,所述预设阈值通过以下方式获得:
针对当前迭代轮次,在所述当前迭代轮次并非第一次迭代轮次和第二次迭代轮次时,获得上一迭代轮次中所述分类模型的损失误差和所述第一次迭代轮次中所述分类模型的损失误差;
根据所述第一次迭代轮次和上一迭代轮次所述分类模型的损失误差,计算得到当前迭代轮次中采用的预设阈值。
在可选的实施方式中,所述预设阈值通过以下方式获得:
针对当前迭代轮次,根据所述当前迭代轮次的轮次数以及设置的斜率值,计算得到所述预设阈值。
在可选的实施方式中,所述方法还包括:
基于所述时间序列数据包含的多个时间点数据生成原始序列曲线图;
基于所述类激活映射分数包含的多个子分数生成分数序列曲线图;
将所述分数序列曲线图中各个时间戳上的数值映射至颜色尺度条上,所述颜色尺度条上数值越大则颜色越深;
利用所述颜色尺度条对所述原始序列曲线图中各个时间点数据进行颜色渲染,并将渲染后的原始序列曲线图输出。
在可选的实施方式中,所述方法还包括:
利用上一轮迭代得到的增强的数据集进行下一轮的分类模型的训练,直至训练满足预设要求时,得到训练完成的分类模型。
第二方面,本申请提供一种时间序列数据增强装置,所述装置包括:
获取模块,用于获取原始数据集,所述原始数据集包含多个时间序列数据,每个所述时间序列数据包括多个时间点数据;
获得模块,用于针对每个所述时间序列数据,利用分类模型得到所述时间序列数据对应的类激活映射分数,所述类激活映射分数包含与所述时间点数据相同个数的子分数,每个所述子分数表征对应的时间点数据的显著性程度;
增强模块,用于根据各所述时间点数据对应的子分数确定待擦除时间点数据,将所述待擦除时间点数据进行擦除处理,以对所述时间序列数据进行增强。
第三方面,本申请提供一种电子设备,包括一个或多个存储介质和一个或多个与存储介质通信的处理器,一个或多个存储介质存储有处理器可执行的机器可执行指令,当电子设备运行时,处理器执行所述机器可执行指令,以执行前述实施方式中任意一项所述的方法步骤。
本申请实施例的有益效果包括,例如:
本申请提供一种时间序列数据增强方法、装置和电子设备,通过获取原始数据集,原始数据集中包含多个时间序列数据,每个时间序列数据包括多个时间点数据。针对每个时间序列数据,利用分类模型得到时间序列数据对应的类激活映射分数,类激活映射分数包含与时间点数据相同个数的子分数,每个子分数表征对应的时间点数据的显著性程度。再根据各个时间点数据对应的子分数确定待擦除时间点数据,将待擦除时间点数据进行擦除处理,以对时间序列数据进行增强。本方案通过计算类激活映射分数的方式以得到各个时间点数据的显著性程度,从而针对性地对部分时间点数据进行擦除,在有效时间数据增强的同时,可以避免损失掉其中关键信息的缺陷。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的时间序列数据增强方法的流程图;
图2为图1中步骤S102包含的子步骤的流程图;
图3为本申请实施例提供的SeaM过程的实现示意图;
图4为图2中步骤S1022包含的子步骤的流程图;
图5为图1中步骤S103包含的子步骤的流程图;
图6为本申请实施例提供的多种预设阈值的示意图;
图7为图5中步骤S1031包含的子步骤的流程图;
图8为本申请实施例提供的时间序列增强方法中,渲染方法的流程图;
图9为本申请实施例提供的多种序列数据的曲线图;
图10为本申请实施例提供的电子设备的结构框图;
图11为本申请实施例提供的时间序列数据增强装置的功能模块框图。
图标:110-存储介质;120-处理器;130-时间序列数据增强装置;131-获取模块;132-获得模块;133-增强模块;140-通信接口。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
请参阅图1,为本申请实施例提供的时间序列数据增强方法的流程图,该时间序列数据增强方法有关的流程所定义的方法步骤可以由具备数据、图像处理功能的电子设备,例如,个人计算机、服务器、笔记本电脑等予以实现。下面将对图1所示的具体流程进行详细阐述。
S101,获取原始数据集,所述原始数据集包含多个时间序列数据,每个所述时间序列数据包括多个时间点数据。
S102,针对每个所述时间序列数据,利用分类模型得到所述时间序列数据对应的类激活映射分数,所述类激活映射分数包含与所述时间点数据相同个数的子分数,每个所述子分数表征对应的时间点数据的显著性程度。
S103,根据各所述时间点数据对应的子分数确定待擦除时间点数据,将所述待擦除时间点数据进行擦除处理,以对所述时间序列数据进行增强。
本实施例中,获取的原始数据集可记为Ω,其中,原始数据集Ω可包含有Ω个来自C个不同类别的时间序列数据。因此,可将原始数据集表示为{(X 1, y 1),..., (X Ω, y Ω)},其中,X表示长度为T的单变量时间序列,即每个时间序列数据可包含有长度为T的多个时间点数据,可表征为X = [x 1 ,…, x T],y∈{1,...,C}表示该时间序列数据所属的类别。
本实施例中,所述的时间序列数据是在不同时间上收集到的数据,用于所描述现象随时间变化的情况,反映了某一事物、现象等随时间的变化状态或程度。例如,可以是销售、气象学、物理学、人口学等一系列领域的时间序列数据。
本实施例的目的是对原始数据集进行增强处理,得到一个增强的数据集。在边实现数据集的增强的同时,边利用增强的数据集对分类模型进行迭代训练,从而以避免分类模型的训练表现出过渡拟合和泛化能力弱等问题。
本实施例中,将原始数据集输入至分类模型中,其中,分类模型可为基于深度神经网络所构建。分类模型可针对输入的每个时间序列数据进行处理,基于分类模型对于时间序列数据的处理信息,可以得到时间序列数据的类激活映射分数。类激活映射分数为序列数据,其长度与时间序列数据的长度一致。类激活映射分数上的时间戳与时间序列数据上的时间戳具有一一对应的关系。类激活映射分数中包含多个子分数,也即,子分数的个数与时间序列数据中包含的时间点数据的个数相同,并且,子分数与时间点数据一一对应。
类激活映射分数可以评估时间序列数据中各时间点数据对于分类结果的贡献程度,对于分类结果的贡献程度越大则体现为其显著性程度越高,反之,则显著性程度越低。而类激活映射分数则可以表征各个时间点分数的显著性程度。
时间序列数据中的显著性数据对于分类结果贡献更大,因为其包含的关键信息形状元素在分类方面起着重要的作用。基于这种效果,本实施例中,显著性程度确定的目的就是定位出这些显著性的数据,以指导去除一些非显著性的数据。
基于得到的类激活映射分数,则可以判别出时间序列数据中,哪些时间点数据是显著性程度较高的关键性数据,而哪些时间点数据是显著性程度较低的对于分类结果贡献较小的非关键性数据。
本实施例中,可将显著性程度较低的数据确定为待擦除时间点数据,从而仅对待擦除时间点数据进行擦除处理,以实现对时间序列数据的增强。
本实施例提供的时间序列数据增强方法,通过计算可表征时间序列数据中各时间点数据的显著性程度高低的类激活映射分数,从而基于类激活映射分数可对其中非关键性的时间点数据进行擦除,保留关键性的时间点数据。在有效实现时间序列数据的增强的基础上,可避免损失时间序列数据中的关键性信息。
请参阅图2,本实施例中,在基于分类模型得到时间序列数据对应的类激活映射分数的步骤中,可以包括以下子步骤:
S1021,将所述时间序列数据输入至分类模型中,得到所述时间序列数据的多个特征映射以及每个特征映射对应的分类权重。
S1022,根据所述分类权重、特征映射计算得到所述时间序列数据对应的类激活映射分数。
如图3中所示,本实施例中,将时间序列数据记为X i =[x 1,x 2,…,x T ],将原始的时间序列数据(Origin Time Series)(图3中曲线(a)所示)输入至分类模型中,分类模型包括依次连接的堆叠1D卷积层(1D Conv Layers)、全局平均池化层(Global Average Pooling,GAP)。时间序列数据经过分类模型的各网络层的处理后,在最后一层卷积层上的输出形状为d*1*t,其中d表示输出的特征映射的个数,也就是说将时间序列数据用d个特征映射表示。其中,每个特征映射的形状为[a 1,a 2,…,a t ],也就是说,每个特征映射都是一个维度为1,长度为t的向量。
同时,通过分类模型的处理还可得到一组分类权重
Figure F_220630091736674_674297001
,分类权重
Figure F_220630091736784_784179002
是一个d维向量
Figure F_220630091736862_862305003
,它表示最后一层卷积层输出的每个特征映射在最后分类结果中所占的权重。例如,
Figure F_220630091736957_957525004
表示第0个特征映射在分类结果中所占的权重。
本实施例中,基于上述获得的分类权重、特征映射可以计算得到时间序列数据对应的类激活映射分数。
具体地,请参阅图4,本实施例中,类激活映射分数的计算可以通过以下方式实现:
S10221,将所述特征映射按照对应的分类权重进行加权累加,得到一与所述多个特征映射的长度一致的分数序列。
S10222,对所述分数序列进行上采样,得到与所述时间序列数据的长度一致的类激活映射分数。
本实施例中,将多个特征映射按照与各自对应的分类权重相乘,并将得到的乘积进行累加,如此,可得到一个长度为t的分数序列[c 1,c 2,…,c t ]。再对该长度为t的分数序列进行上采样,重新得到一个长度为T的序列
Figure F_220630091737051_051283005
。该序列与时间序列数据相对应,也即,为时间序列数据对应的类激活映射分数。图3中曲线(b)所示为类激活映射分数对应的曲线图(Class Activation Map)。
本实施例中,类激活映射分数的具体计算公式可如下所示:
Figure M_220630091737835_835034001
其中,F θ (X)表示输出的特征映射,而
Figure M_220630091737962_962417001
表示其中第m个特征映射,θ表示卷积层的参数,
Figure M_220630091738024_024918002
表示与类y i 相对应的分类权重。
Figure M_220630091738088_088879003
表示对一维特征映射进行上采样以匹配长度为T的时间序列数据。
本实施例中,采用下采样的方式将长度为T的时间序列数据的类激活映射分数的计算,转换为长度为t的序列的计算,最后再通过上采样的方式还原为长度为T的序列。这种方式在应对时间序列数据长度较长的情况下,先下采样减小数据量,再上采样进行还原,可以避免计算工作量过大的问题。
本实施例中,为了在进行时间序列数据擦除时对不同时间序列数据的类激活映射分数可以使用相同的阈值,可以将类激活映射分数标准化到一定范围内,例如[0,100]之间,如图3中的过程NOR(Normalize to [0,100]),可记为SLY(X i )。因此,时间序列数据X i 上时间戳τ处的SLY可表示为:
Figure M_220630091738120_120134001
其中,
Figure M_220630091738182_182641001
表示时间序列数据中时间戳τ处的时间点数据对应的子分数,
Figure M_220630091738229_229520002
表示类激活分数中最小的子分数,
Figure M_220630091738260_260755003
表示类激活分数中最大的子分数。
请参阅图5,本实施例中,在获得类激活分数并定位到每个时间点数据的子分数后,可以通过以下方式实现擦除处理:
S1031,将对应的子分数低于预设阈值的时间点数据确定为待擦除时间点数据。
S1032,利用设定数值替换所述待擦除时间点数据。
本实施例中,显著性提取是为了更好地定位显著区域,时间序列数据的显著性通常是细微的,因此,可以基于预设阈值实现选择性擦除。本实施例中,可以将类激活分数中子分数低于预设阈值所对应的时间点数据所在的位置确定为非显著区域,而类激活分数中子分数大于或等于预设阈值所对应的时间点数据所在的位置确定为显著区域。非显著区域处的时间点数据即为待擦除时间点数据。
对于待擦除时间点数据,本实施例中,利用设定数值替换待擦除时间点数据。其中,所述的设定数值可为0,或者也可以是数值极小的数值。本实施例中,用0替换掉待擦除时间点数据,类似于关闭神经网络上的一些激活点,以便实现类似于Dropout的正则化效果。如图3中曲线(d)即为擦除非显著区域(Erase Non-salient Regions,ENSR)处理后保留的增强的时间序列数据的曲线图(Augmented Time Series)。
本实施例中,预设阈值的确定可有多种方式,在一种可能的实现方式中,预设阈值可以是固定阈值。固定阈值是一种简单的策略,如图6中直线(FiT(0.6))所示,该阈值不随网络训练而改变。但阈值太小的话其对时间序列数据增强的作用就比较小,而阈值太大就可能导致显著区域被擦除。本实施例中,根据不同数据集的多次试验,设定的固定的预设阈值可为[0.6,20]。
在另一种可能的实现方式中,预设阈值可为线性阈值,该线性阈值可通过以下方式确定:
针对当前迭代轮次,根据当前迭代轮次的轮次数以及设置的斜率值,计算得到预设阈值。
对于时间序列数据分类这个任务而言,神经网络的训练过程是一个误差逐渐减小然后分类器的性能逐步提升的一个过程。在网络训练的早期,分类器的性能相对较弱,因此该弱分类器提取的时间序列数据的显著区域可能不够准确。因此,在早期阶段,过大的阈值可能导致某些显著区域被错误地擦除。从而导致经这样增强的时间序列数据将误导分类模型的训练。
基于此,本实施例中,设置线性的增量阈值LiT更适合于分类模型准确擦除一些非显著区域。随着网络的训练和分类器性能的提高,线性的增量阈值将逐渐线性提升,如图6中的斜线所示的变化过程,可以设置该斜线与训练轮数轴之间的斜率L s ,如图6中斜率设置为0.2。从而,根据当前的训练轮次ζ,计算得到当前训练轮次的预设阈值:
LiT=L s ×ζ
请参阅图7,本实施例中,在另一种实现方式中,预设阈值还可以设置为损失阈值。损失阈值的设置通过以下方式实现:
S10311,针对当前迭代轮次,在所述当前迭代轮次并非第一次迭代轮次和第二次迭代轮次时,获得上一迭代轮次中所述分类模型的损失误差和所述第一次迭代轮次中所述分类模型的损失误差。
S10312,根据所述第一次迭代轮次和上一迭代轮次所述分类模型的损失误差,计算得到当前迭代轮次中采用的预设阈值。
本实施例中,损失阈值类似于使用增量策略的线性阈值。损失阈值的设置完全依赖于训练误差。即训练误差越小,当前轮次的分类器性能越好,显著性提取越精准,意味着下一轮次训练中可以擦除更多的非显著区域。反之,训练误差越大的话,下一轮次的擦除量越小。
损失阈值的实现是通过对训练的损失误差曲线的垂直翻转和水平移动两个操作来达到。进行这样的变化的原因是每个迭代轮次的损失阈值可根据上一迭代轮次的损失误差计算得到。由于分类器在训练早期阶段的性能比较差,因此,本实施例中,在第一次迭代轮次和第二次迭代轮次时,可以使用原始的时间序列数据来代替增强的时间序列数据,也即,损失阈值设置为0。此外,为了灵活控制阈值的幅度,在上述两次操作之后对损失曲线进行垂直拉伸变换,该参数称为拉伸因子S f 。图6中示意性示出在S f 分别为1(损失阈值LOT(1))和2(损失阈值LoT(2))时的损失阈值曲线,根据以上分析,则损失阈值的设置可按照以下方式实现:
LoT ζ = 0, ζ<=2
LoT ζ = -S f × (Err train ζ-1- Err train 1)/ Err train 1ζ>2
ζ代表当前的训练轮数,第一轮的训练误差是Err train 1Err train ζ-1表示第ζ-1轮的训练误差。也即,第一迭代轮次和第二迭代轮次的损失阈值设置为0,除此之外,其他迭代轮次的损失阈值是根据第一迭代轮次和上一迭代轮次的损失误差,以及设置的拉伸因子计算得到。
本实施例中,损失阈值可以根据训练误差来进行调整,它不会受到训练误差严重波动的影响。例如,如图6中所示,当训练误差的噪声急剧增加时(损失误差曲线(TrainingLoss)尖端处),下次训练时的损失阈值将急剧减少(对应于损失阈值曲线的尖端)。这意味着一些非显著区域在下一迭代轮次训练中将擦除的更少。以避免擦除一些不准确的显著区域。因此,损失阈值的方式具有自适应变化和噪声校正的效果。
本实施例中,通过以上方式可以实现时间序列数据中一些非显著区域的擦除,擦除后的时间序列数据的曲线可如图3中曲线(d)中所示。
除了将擦除后的时间序列数据曲线进行输出外,本实施例中,为了在原本的时间序列数据曲线上一目了然的显示出其中的非显著区域和显著区域。请参阅图8,本实施例所提供的时间序列数据增强方法还可包括以下步骤:
S201,基于所述时间序列数据包含的多个时间点数据生成原始序列曲线图。
S202,基于所述类激活映射分数包含的多个子分数生成分数序列曲线图。
S203,将所述分数序列曲线图中各个时间戳上的数值映射至颜色尺度条上,所述颜色尺度条上数值越大则颜色越深。
S204,利用所述颜色尺度条对所述原始序列曲线图中各个时间点数据进行颜色渲染,并将渲染后的原始序列曲线图输出。
本实施例中,基于时间序列数据包含的多个时间点数据,按照其各自的时间戳,以时间变化为横轴、以数值大小为纵轴,可以构建如图3中曲线(a)中所示的原始序列曲线图。
在获得类激活映射分数之后,基于类激活映射分数包含的多个子分数,同样地按照其各自的时间戳,以时间变化为横轴、以数值大小为纵轴,可以构建如图3中曲线(b)所示的分数序列曲线图。
本实施例中,将分数序列曲线图中各个时间戳上的数值的大小转换为颜色尺度条上颜色的深浅来表示。例如,其中,分数序列曲线图中数值最大的数值的颜色可为最深色,数值最小的数值的颜色可为最浅色。在最大数值和最小数值之间的数值则按照从最深色到最浅色进行逐步变化。
如此,则可以利用颜色的深浅来表示分数序列曲线图中各个时间戳的数值的大小。
在此基础上,利用颜色尺度条上所表征的分数序列曲线图中各个数值的大小,对原始序列曲线图中各个时间点数据进行颜色渲染。也即,原始序列曲线图中各个时间点数据的横轴、纵轴的数值不变。原始序列曲线图与分数序列曲线图的时间戳是对应的,各个时间点数据对应的分数序列曲线图上的点的数值越大,则该时间点数据对应的点在曲线上的颜色可设置为越深,反之,时间点数据对应的点在曲线上的颜色可设置为越浅。
通过如上设置,最终可得到如图3中曲线(c)中所示的渲染后的原始序列曲线图,即将类激活分数叠加到原始时间数据(CAM Superimpose to Time Series,CSTS)后的曲线图(Time Series of Superimpose CAM)。渲染后的原始序列曲线图中,可以通过颜色的深浅明显的看出哪些部分是显著区域、哪些部分是非显著区域。
此外,请结合参阅图9,图9中也示意性示出了原始时间序列曲线(Origin TimeSeries)、被显著性覆盖之后的原始时间序列曲线(Time Series Covered by Saliency),也即渲染后的原始时间序列曲线,以及基于显著性进行擦除处理后得到的在增强的时间序列数据曲线(Time Series after Erasing non-salient)。
如此,在对原始序列曲线图进行解读时,则可以明确可以以哪些区域作为主要的信息解读依据。从而排除掉非显著区域部分这些非关键性信息对于信息解读造成的干扰。
本实施例中,在分类模型的训练过程中,在每轮迭代时,在对分类模型的训练的同时,也可以得到增强的数据集。为了不断提升分类模型的训练效果,因此,在训练过程中,可以利用上一轮迭代得到的增强的数据集进行下一轮的分类模型的训练,直至训练满足预设要求时,得到训练完成的分类模型。
其中,所述的预设要求可以是如训练迭代次数达到预设的最大次数,或训练达到收敛、损失误差不再降低,或者也可以是训练迭代时长达到预设的最大时长等。
本实施例所提供的时间序列增强方法中,通过计算类激活分数的方式从而确定时间序列数据中各个时间点数据的显著性程度,从而得到各个时间点数据对于分类结果的贡献程度。从而,可以基于类激活分数来实现其中非显著区域的时间点数据的擦除,仅保留显著区域的时间点数据,进而实现时间序列数据的增强。该种方式可以在有效实现数据集增强的基础上,避免损失掉其中的关键性信息。进而可以利用增强的数据及实现分类模型的训练,避免模型训练存在过渡拟合以及泛化能力弱等问题。
本实施例中的类激活函数计算、阈值确定以及时间序列数据擦除的过程,该种新的方法可以称为SeaM(erasing non-salient region)方法,该种方法的主要思想是关注并保护包含关键信息形状元素的显著区域。通过擦除时间序列数据中一些非显著区域,同时保留显著区域来执行时间序列数据的增强。
SeaM方法不需要额外的参数学习,加入SeaM过程在实际训练过程中消耗的时间几乎与加入SeaM过程一样。且SeaM过程易于集成,它可以直接植入CNN和ResNet网络以用于时间序列数据分类,它也很容易拓展到别的时间序列应用上面。
此外,在代表性时间序列数据上的大量实验证明,使用SeaM方法的分类性能均优于未使用SeaM方法的分类性能,进一步证明了SeaM方法的有效性。
请参阅图10,为本申请实施例提供的电子设备的示例性组件示意图,该电子设备可以是如个人计算机、笔记本电脑、服务器等。该电子设备中可具备信息数据、图像处理等功能,该电子设备可包括存储介质110、处理器120、时间序列数据增强装置130及通信接口140。本实施例中,存储介质110与处理器120均位于电子设备中且二者分离设置。然而,应当理解的是,存储介质110也可以是独立于电子设备之外,且可以由处理器120通过总线接口来访问。可替换地,存储介质110也可以集成到处理器120中,例如,可以是高速缓存和/或通用寄存器。
时间序列数据增强装置130可以理解为上述电子设备,或电子设备的处理器120,也可以理解为独立于上述电子设备或处理器120之外的在电子设备控制下实现上述时间序列数据增强方法的软件功能模块。
如图11所示,上述时间序列数据增强装置130可以包括获取模块131、获得模块132和增强模块133。下面分别对该时间序列数据增强装置130的各个功能模块的功能进行详细阐述。
获取模块131,用于获取原始数据集,所述原始数据集包含多个时间序列数据,每个所述时间序列数据包括多个时间点数据。
可以理解,该获取模块131可以用于执行上述步骤S101,关于该获取模块131的详细实现方式可以参照上述对步骤S101有关的内容。
获得模块132,用于针对每个所述时间序列数据,利用分类模型得到所述时间序列数据对应的类激活映射分数,所述类激活映射分数包含与所述时间点数据相同个数的子分数,每个所述子分数表征对应的时间点数据的显著性程度。
可以理解,该获得模块132可以用于执行上述步骤S102,关于该获得模块132的详细实现方式可以参照上述对步骤S102有关的内容。
增强模块133,用于根据各所述时间点数据对应的子分数确定待擦除时间点数据,将所述待擦除时间点数据进行擦除处理,以对所述时间序列数据进行增强。
可以理解,该增强模块133可以用于执行上述步骤S103,关于该增强模块133的详细实现方式可以参照上述对步骤S103有关的内容。
在一种可能的实施方式中,上述获得模块132可以用于:
将所述时间序列数据输入至分类模型中,得到所述时间序列数据的多个特征映射以及每个特征映射对应的分类权重;
根据所述分类权重、特征映射计算得到所述时间序列数据对应的类激活映射分数。
在一种可能的实施方式中,上述获得模块132可以用于:
将所述特征映射按照对应的分类权重进行加权累加,得到一与所述多个特征映射的长度一致的分数序列;
对所述分数序列进行上采样,得到与所述时间序列数据的长度一致的类激活映射分数。
在一种可能的实施方式中,上述增强模块133可以用于:
将对应的子分数低于预设阈值的时间点数据确定为待擦除时间点数据;
利用设定数值替换所述待擦除时间点数据。
在一种可能的实施方式中,上述增强模块133可以通过以下方式获得预设阈值:
针对当前迭代轮次,在所述当前迭代轮次并非第一次迭代轮次和第二次迭代轮次时,获得上一迭代轮次中所述分类模型的损失误差和所述第一次迭代轮次中所述分类模型的损失误差;
根据所述第一次迭代轮次和上一迭代轮次所述分类模型的损失误差,计算得到当前迭代轮次中采用的预设阈值。
在一种可能的实施方式中,上述增强模块133可以通过以下方式获得预设阈值:
针对当前迭代轮次,根据所述当前迭代轮次的轮次数以及设置的斜率值,计算得到所述预设阈值。
在一种可能的实施方式中,所述时间序列数据增强装置130还包括渲染模块,该渲染模块可以用于:
基于所述时间序列数据包含的多个时间点数据生成原始序列曲线图;
基于所述类激活映射分数包含的多个子分数生成分数序列曲线图;
将所述分数序列曲线图中各个时间戳上的数值映射至颜色尺度条上,所述颜色尺度条上数值越大则颜色越深;
利用所述颜色尺度条对所述原始序列曲线图中各个时间点数据进行颜色渲染,并将渲染后的原始序列曲线图输出。
在一种可能的实施方式中,所述时间序列数据增强装置130还包括训练模块,该训练模块可以用于:
利用上一轮迭代得到的增强的数据集进行下一轮的分类模型的训练,直至训练满足预设要求时,得到训练完成的分类模型。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
进一步地,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有机器可执行指令,机器可执行指令被执行时实现上述实施例提供的时间序列数据增强方法。
具体地,该计算机可读存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该计算机可读存储介质上的计算机程序被运行时,能够执行上述时间序列数据增强方法。关于计算机可读存储介质中的及其可执行指令被运行时,所涉及的过程,可以参照上述方法实施例中的相关说明,这里不再详述。
综上所述,本申请实施例提供的时间序列数据增强方法、装置和电子设备,通过获取原始数据集,原始数据集中包含多个时间序列数据,每个时间序列数据包括多个时间点数据。针对每个时间序列数据,利用分类模型得到时间序列数据对应的类激活映射分数,类激活映射分数包含与时间点数据相同个数的子分数,每个子分数表征对应的时间点数据的显著性程度。再根据各个时间点数据对应的子分数确定待擦除时间点数据,将待擦除时间点数据进行擦除处理,以对时间序列数据进行增强。本方案通过计算类激活映射分数的方式以得到各个时间点数据的显著性程度,从而针对性地对部分时间点数据进行擦除,在有效时间数据增强的同时,可以避免损失掉其中关键信息的缺陷。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种时间序列数据增强方法,其特征在于,所述方法包括:
获取原始数据集,所述原始数据集包含多个时间序列数据,每个所述时间序列数据包括多个时间点数据;
针对每个所述时间序列数据,利用分类模型得到所述时间序列数据对应的类激活映射分数,所述类激活映射分数包含与所述时间点数据相同个数的子分数,每个所述子分数表征对应的时间点数据的显著性程度;
根据各所述时间点数据对应的子分数确定待擦除时间点数据,将所述待擦除时间点数据进行擦除处理,以对所述时间序列数据进行增强。
2.根据权利要求1所述的时间序列数据增强方法,其特征在于,所述利用分类模型得到所述时间序列数据对应的类激活映射分数的步骤,包括:
将所述时间序列数据输入至分类模型中,得到所述时间序列数据的多个特征映射以及每个特征映射对应的分类权重;
根据所述分类权重、特征映射计算得到所述时间序列数据对应的类激活映射分数。
3.根据权利要求2所述的时间序列数据增强方法,其特征在于,所述根据所述分类权重、特征映射计算得到所述时间序列数据对应的类激活映射分数的步骤,包括:
将所述特征映射按照对应的分类权重进行加权累加,得到一与所述多个特征映射的长度一致的分数序列;
对所述分数序列进行上采样,得到与所述时间序列数据的长度一致的类激活映射分数。
4.根据权利要求1所述的时间序列数据增强方法,其特征在于,所述根据各所述时间点数据对应的子分数确定待擦除时间点数据,将所述待擦除时间点数据进行擦除处理的步骤,包括:
将对应的子分数低于预设阈值的时间点数据确定为待擦除时间点数据;
利用设定数值替换所述待擦除时间点数据。
5.根据权利要求4所述的时间序列数据增强方法,其特征在于,所述预设阈值通过以下方式获得:
针对当前迭代轮次,在所述当前迭代轮次并非第一次迭代轮次和第二次迭代轮次时,获得上一迭代轮次中所述分类模型的损失误差和所述第一次迭代轮次中所述分类模型的损失误差;
根据所述第一次迭代轮次和上一迭代轮次所述分类模型的损失误差,计算得到当前迭代轮次中采用的预设阈值。
6.根据权利要求4所述的时间序列数据增强方法,其特征在于,所述预设阈值通过以下方式获得:
针对当前迭代轮次,根据所述当前迭代轮次的轮次数以及设置的斜率值,计算得到所述预设阈值。
7.根据权利要求1所述的时间序列数据增强方法,其特征在于,所述方法还包括:
基于所述时间序列数据包含的多个时间点数据生成原始序列曲线图;
基于所述类激活映射分数包含的多个子分数生成分数序列曲线图;
将所述分数序列曲线图中各个时间戳上的数值映射至颜色尺度条上,所述颜色尺度条上数值越大则颜色越深;
利用所述颜色尺度条对所述原始序列曲线图中各个时间点数据进行颜色渲染,并将渲染后的原始序列曲线图输出。
8.根据权利要求1所述的时间序列数据增强方法,其特征在于,所述方法还包括:
利用上一轮迭代得到的增强的数据集进行下一轮的分类模型的训练,直至训练满足预设要求时,得到训练完成的分类模型。
9.一种时间序列数据增强装置,其特征在于,所述装置包括:
获取模块,用于获取原始数据集,所述原始数据集包含多个时间序列数据,每个所述时间序列数据包括多个时间点数据;
获得模块,用于针对每个所述时间序列数据,利用分类模型得到所述时间序列数据对应的类激活映射分数,所述类激活映射分数包含与所述时间点数据相同个数的子分数,每个所述子分数表征对应的时间点数据的显著性程度;
增强模块,用于根据各所述时间点数据对应的子分数确定待擦除时间点数据,将所述待擦除时间点数据进行擦除处理,以对所述时间序列数据进行增强。
10.一种电子设备,其特征在于,包括一个或多个存储介质和一个或多个与存储介质通信的处理器,一个或多个存储介质存储有处理器可执行的机器可执行指令,当电子设备运行时,处理器执行所述机器可执行指令,以执行权利要求1-8中任意一项所述的方法步骤。
CN202210827192.8A 2022-06-30 2022-06-30 时间序列数据增强方法、装置和电子设备 Active CN114896307B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210827192.8A CN114896307B (zh) 2022-06-30 2022-06-30 时间序列数据增强方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210827192.8A CN114896307B (zh) 2022-06-30 2022-06-30 时间序列数据增强方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN114896307A true CN114896307A (zh) 2022-08-12
CN114896307B CN114896307B (zh) 2022-09-27

Family

ID=82730382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210827192.8A Active CN114896307B (zh) 2022-06-30 2022-06-30 时间序列数据增强方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN114896307B (zh)

Citations (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120050529A1 (en) * 2010-08-26 2012-03-01 Michael Bentley Portable wireless mobile device motion capture and analysis system and method
US20180107695A1 (en) * 2016-10-19 2018-04-19 Futurewei Technologies, Inc. Distributed fp-growth with node table for large-scale association rule mining
US20180365301A1 (en) * 2017-06-20 2018-12-20 Vmware, Inc. Methods and systems to quantize and compress time series data
CN110717534A (zh) * 2019-09-30 2020-01-21 中国科学院大学 一种基于网络监督的目标分类和定位方法
CN110832499A (zh) * 2017-11-14 2020-02-21 谷歌有限责任公司 通过稀疏时间池化网络的弱监督动作定位
US20200104990A1 (en) * 2018-10-02 2020-04-02 International Business Machines Corporation Region of interest weighted anomaly detection
CN111126333A (zh) * 2019-12-30 2020-05-08 齐齐哈尔大学 一种基于轻量卷积神经网络的垃圾分类方法
CN111291819A (zh) * 2020-02-19 2020-06-16 腾讯科技(深圳)有限公司 图像识别方法、装置、电子设备及存储介质
CN111401387A (zh) * 2020-03-10 2020-07-10 腾讯科技(深圳)有限公司 异常样本构建方法、装置、计算机设备和存储介质
CN111583187A (zh) * 2020-04-14 2020-08-25 佛山市南海区广工大数控装备协同创新研究院 一种基于cnn可视化的pcb电路板缺陷检测方法
CN112307892A (zh) * 2020-09-24 2021-02-02 国网浙江省电力有限公司衢州供电公司 一种基于第一视角rgb-d数据的手部动作识别方法
US20210103812A1 (en) * 2019-08-28 2021-04-08 Tata Consultancy Services Limited Method and system for training a neural network for time series data classification
CN112700434A (zh) * 2021-01-12 2021-04-23 苏州斯玛维科技有限公司 医学图像的分类方法及其分类装置
CN112990097A (zh) * 2021-04-13 2021-06-18 电子科技大学 一种基于对抗消除的人脸表情识别方法
US20210216860A1 (en) * 2020-01-14 2021-07-15 Vmware, Inc. Neural-network-based methods and systems that generate forecasts from time-series data
WO2021169116A1 (zh) * 2020-02-29 2021-09-02 平安科技(深圳)有限公司 智能化的缺失数据填充方法、装置、设备及存储介质
CN113486938A (zh) * 2021-06-28 2021-10-08 重庆大学 基于多分支时间卷积网络的重着陆的分析方法和装置
WO2021212752A1 (zh) * 2020-04-23 2021-10-28 平安科技(深圳)有限公司 基于设备指标数据的异常检测方法、装置、设备及存储介质
CN113705490A (zh) * 2021-08-31 2021-11-26 重庆大学 基于重构和预测的异常检测方法
CN113743618A (zh) * 2021-09-03 2021-12-03 北京航空航天大学 时间序列数据处理方法、装置、可读介质及电子设备
WO2021258914A1 (zh) * 2020-06-24 2021-12-30 深圳前海微众银行股份有限公司 一种序列标注模型的训练方法及装置
CN113902978A (zh) * 2021-09-10 2022-01-07 长沙理工大学 基于深度学习的可解释性sar图像目标检测方法及系统
CN114019467A (zh) * 2021-10-25 2022-02-08 哈尔滨工程大学 一种基于MobileNet模型迁移学习的雷达信号识别与定位方法
WO2022062404A1 (zh) * 2020-09-28 2022-03-31 平安科技(深圳)有限公司 文本分类模型的训练方法、装置、设备及存储介质
CN114566216A (zh) * 2022-02-25 2022-05-31 桂林电子科技大学 一种基于注意力机制的剪接位点预测及解释性方法
CN114612732A (zh) * 2022-05-11 2022-06-10 成都数之联科技股份有限公司 样本数据增强方法及系统及装置及介质及目标分类方法
CN114648665A (zh) * 2022-03-25 2022-06-21 西安电子科技大学 一种弱监督目标检测方法及系统
CN114677754A (zh) * 2022-03-11 2022-06-28 上海商汤智能科技有限公司 行为识别方法、装置、电子设备及计算机可读存储介质

Patent Citations (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120050529A1 (en) * 2010-08-26 2012-03-01 Michael Bentley Portable wireless mobile device motion capture and analysis system and method
US20180107695A1 (en) * 2016-10-19 2018-04-19 Futurewei Technologies, Inc. Distributed fp-growth with node table for large-scale association rule mining
US20180365301A1 (en) * 2017-06-20 2018-12-20 Vmware, Inc. Methods and systems to quantize and compress time series data
US20200272823A1 (en) * 2017-11-14 2020-08-27 Google Llc Weakly-Supervised Action Localization by Sparse Temporal Pooling Network
CN110832499A (zh) * 2017-11-14 2020-02-21 谷歌有限责任公司 通过稀疏时间池化网络的弱监督动作定位
US20200104990A1 (en) * 2018-10-02 2020-04-02 International Business Machines Corporation Region of interest weighted anomaly detection
US20210103812A1 (en) * 2019-08-28 2021-04-08 Tata Consultancy Services Limited Method and system for training a neural network for time series data classification
CN110717534A (zh) * 2019-09-30 2020-01-21 中国科学院大学 一种基于网络监督的目标分类和定位方法
CN111126333A (zh) * 2019-12-30 2020-05-08 齐齐哈尔大学 一种基于轻量卷积神经网络的垃圾分类方法
US20210216860A1 (en) * 2020-01-14 2021-07-15 Vmware, Inc. Neural-network-based methods and systems that generate forecasts from time-series data
CN111291819A (zh) * 2020-02-19 2020-06-16 腾讯科技(深圳)有限公司 图像识别方法、装置、电子设备及存储介质
WO2021169116A1 (zh) * 2020-02-29 2021-09-02 平安科技(深圳)有限公司 智能化的缺失数据填充方法、装置、设备及存储介质
CN111401387A (zh) * 2020-03-10 2020-07-10 腾讯科技(深圳)有限公司 异常样本构建方法、装置、计算机设备和存储介质
CN111583187A (zh) * 2020-04-14 2020-08-25 佛山市南海区广工大数控装备协同创新研究院 一种基于cnn可视化的pcb电路板缺陷检测方法
WO2021212752A1 (zh) * 2020-04-23 2021-10-28 平安科技(深圳)有限公司 基于设备指标数据的异常检测方法、装置、设备及存储介质
WO2021258914A1 (zh) * 2020-06-24 2021-12-30 深圳前海微众银行股份有限公司 一种序列标注模型的训练方法及装置
CN112307892A (zh) * 2020-09-24 2021-02-02 国网浙江省电力有限公司衢州供电公司 一种基于第一视角rgb-d数据的手部动作识别方法
WO2022062404A1 (zh) * 2020-09-28 2022-03-31 平安科技(深圳)有限公司 文本分类模型的训练方法、装置、设备及存储介质
CN112700434A (zh) * 2021-01-12 2021-04-23 苏州斯玛维科技有限公司 医学图像的分类方法及其分类装置
CN112990097A (zh) * 2021-04-13 2021-06-18 电子科技大学 一种基于对抗消除的人脸表情识别方法
CN113486938A (zh) * 2021-06-28 2021-10-08 重庆大学 基于多分支时间卷积网络的重着陆的分析方法和装置
CN113705490A (zh) * 2021-08-31 2021-11-26 重庆大学 基于重构和预测的异常检测方法
CN113743618A (zh) * 2021-09-03 2021-12-03 北京航空航天大学 时间序列数据处理方法、装置、可读介质及电子设备
CN113902978A (zh) * 2021-09-10 2022-01-07 长沙理工大学 基于深度学习的可解释性sar图像目标检测方法及系统
CN114019467A (zh) * 2021-10-25 2022-02-08 哈尔滨工程大学 一种基于MobileNet模型迁移学习的雷达信号识别与定位方法
CN114566216A (zh) * 2022-02-25 2022-05-31 桂林电子科技大学 一种基于注意力机制的剪接位点预测及解释性方法
CN114677754A (zh) * 2022-03-11 2022-06-28 上海商汤智能科技有限公司 行为识别方法、装置、电子设备及计算机可读存储介质
CN114648665A (zh) * 2022-03-25 2022-06-21 西安电子科技大学 一种弱监督目标检测方法及系统
CN114612732A (zh) * 2022-05-11 2022-06-10 成都数之联科技股份有限公司 样本数据增强方法及系统及装置及介质及目标分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FEI LI 等: "Data Enhancement Technology Based on I-GOS Algorithm", 《2021 INTERNATIONAL CONFERENCE ON ELECTRONIC COMMUNICATIONS, INTERNET OF THINGS AND BIG DATA (ICEIB)》 *
SHILONG YANG: "Saliency-Based Image Contrast Enhancement with Reversible Data Hiding", 《ICASSP 2020 - 2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》 *
YANG YANG 等: "Improving Visual Quality of Reversible Data Hiding in Medical Image with Texture Area Contrast Enhancement", 《2015 INTERNATIONAL CONFERENCE ON INTELLIGENT INFORMATION HIDING AND MULTIMEDIA SIGNAL PROCESSING (IIH-MSP)》 *
赵冰等: "基于深度学习的铁路图像场景分类优化研究", 《计算机系统应用》 *

Also Published As

Publication number Publication date
CN114896307B (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN109564575B (zh) 使用机器学习模型来对图像进行分类
Cha et al. Few-shot compositional font generation with dual memory
CN108764195B (zh) 手写模型训练方法、手写字识别方法、装置、设备及介质
US20200242822A1 (en) Digital Media Environment for Style-Aware Patching in a Digital Image
CN111428457B (zh) 数据表的自动格式化
CN107886082B (zh) 图像中数学公式检测方法、装置、计算机设备及存储介质
US20220058431A1 (en) Semantic input sampling for explanation (sise) of convolutional neural networks
CN114359563B (zh) 模型训练方法、装置、计算机设备和存储介质
WO2020219971A1 (en) Training machine learning models using unsupervised data augmentation
JP2019028094A (ja) 文字生成装置、プログラム及び文字出力装置
CN110796250A (zh) 应用于卷积神经网络的卷积处理方法、系统及相关组件
CN110348025A (zh) 一种基于字形的翻译方法、装置、存储介质及电子设备
CN114972791A (zh) 图像分类模型训练方法、图像分类方法及相关装置
CN117746186A (zh) 低秩自适应模型的训练方法、文本生成图像方法、系统
Lee et al. TREND: Truncated generalized normal density estimation of Inception embeddings for GAN evaluation
CN114548218A (zh) 图像匹配方法、装置、存储介质和电子装置
CN114896307B (zh) 时间序列数据增强方法、装置和电子设备
CN113780365A (zh) 样本生成方法和装置
US20240127510A1 (en) Stylized glyphs using generative ai
CN112818114B (zh) 信息的分类方法、检测方法、计算设备及存储介质
CN114782960B (zh) 模型训练方法、装置、计算机设备及计算机可读存储介质
CN116681581A (zh) 一种字体生成方法、装置、电子设备及可读存储介质
KR102441442B1 (ko) 그래프 컨볼루션 네트워크 학습 방법 및 장치
CN109654383A (zh) 一种供水管道的泄露程度确定方法及系统
US20220284280A1 (en) Data labeling for synthetic data generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant