CN112149700A - 特征漂移幅度的识别方法、装置、设备和存储介质 - Google Patents
特征漂移幅度的识别方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN112149700A CN112149700A CN201910575404.6A CN201910575404A CN112149700A CN 112149700 A CN112149700 A CN 112149700A CN 201910575404 A CN201910575404 A CN 201910575404A CN 112149700 A CN112149700 A CN 112149700A
- Authority
- CN
- China
- Prior art keywords
- feature
- characteristic
- data samples
- time
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种特征漂移幅度的识别方法、装置、设备和存储介质,该方法中,设备按照时间序列,将预先获取到的数据样本进行划分,得到多个子数据样本,根据极端梯度提升模型对每个子数据样本进行训练,得到每个特征在每个时间段中的重要性指标,根据每个特征在不同时间段中的重要性指标,获取所述特征的漂移幅度,基于模型对特征漂移的幅度进行识别,简单易用,且准确度较高。
Description
技术领域
本申请实施例涉及大数据技术领域,尤其涉及一种特征漂移幅度的识别 方法、装置、设备和存储介质。
背景技术
机器学习可以用于多种场景,比如目前互联网中的推荐系统,搜索系统 等。机器学习过程中需要使用到机器学习模型,而为了训练到更准确地模型, 需要对采集得到的数据中的特征进行各种指标的识别。特征漂移是指特征随 着时间而变化,目前常用的技术方案中,对特征漂移的识别方式主要是基于 分布的方式进行检测,人工的对采集的各种类型的特征进行处理,根据经验 获得一些指标来实现漂移的检测。
然而,由于数据的场景的复杂性,通过人工经验对数据进行分析识别特 征漂移不仅耗时交大,而且准确度不高。
发明内容
本申请实施例提供一种特征漂移幅度的识别方法、装置、设备和存储 介质,以解决由于数据的场景的复杂性,通过人工经验对数据进行分析识别 特征漂移不仅耗时交大,而且准确度不高的问题。
本申请第一方面提供一种特征漂移幅度的识别方法,包括:
按照时间序列,将预先获取到的数据样本进行划分,得到多个子数据样 本;
根据极端梯度提升(eXtreme Gradient Boosting,xgboost)模型对每个子 数据样本进行训练,得到每个特征在每个时间段中的重要性指标;
根据每个特征在不同时间段中的重要性指标,获取所述特征的漂移幅度。
在一种具体实现方式中,所述根据每个特征在不同时间段中的重要性指 标,获取所述特征的漂移幅度,包括:
根据每个特征在不同时间段中的重要性指标,获取每个特征随时间变化 的偏差;
对每个特征的偏差进行排序,得到每个特征的漂移幅度。
在一种具体实现方式中,所述按照时间序列,将预先获取到的数据样本 进行划分,得到多个子数据样本之前,所述方法还包括:
采集获取所述数据样本,所述数据样本中包括至少一个特征,以及每个 特征的时间信息。
在一种具体实现方式中,所述按照时间序列,将预先获取到的数据样 本进行划分,得到多个子数据样本,包括:
根据每个特征的时间信息,按照预设时间间隔按照时间序列将所述数 据样本进行划分,得到所述多个子数据样本。
本申请第二方面提供一种特征漂移幅度的识别装置,包括:
划分模块,用于按照时间序列,将预先获取到的数据样本进行划分,得 到多个子数据样本;
处理模块,用于根据极端梯度提升模型对每个子数据样本进行训练,得 到每个特征在每个时间段中的重要性指标;
获取模块,用于根据每个特征在不同时间段中的重要性指标,获取所述 特征的漂移幅度。
可选的,所述获取模块具体用于:
根据每个特征在不同时间段中的重要性指标,获取每个特征随时间变化 的偏差;
对每个特征的偏差进行排序,得到每个特征的漂移幅度。
可选的,所述装置还包括:
采集模块,用于采集获取所述数据样本,所述数据样本中包括至少一个 特征,以及每个特征的时间信息。
可选的,所述划分模块具体用于:
根据每个特征的时间信息,按照预设时间间隔按照时间序列将所述数 据样本进行划分,得到所述多个子数据样本。
本申请第三方面提供一种电子设备,包括:处理器、存储器以及计算机 程序;所述计算机程序存储在所述存储器中,所述处理器执行所述计算机程 序实现第一方面任一项提供的特征漂移幅度的识别方法。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介 质存储有计算机程序,所述计算机程序用于实现第一方面任一项提供的特征 漂移幅度的识别方法。
本申请实施例提供的特征漂移幅度的识别方法、装置、设备和存储介质, 设备按照时间序列,将预先获取到的数据样本进行划分,得到多个子数据样 本,根据xgboost模型对每个子数据样本进行训练,得到每个特征在每个时间 段中的重要性指标,根据每个特征在不同时间段中的重要性指标,获取特征 的漂移幅度,基于模型对特征漂移的幅度进行识别,简单易用,且准确度较 高。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下 面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在 不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请提供的特征漂移幅度的识别方法实施例一的流程图;
图2为本申请提供的特征漂移幅度的识别方法实施例二的流程图;
图3为本申请提供的特征漂移幅度的识别装置实施例一的结构示意图;
图4为本申请提供的特征漂移幅度的识别装置实施例二的结构示意图;
图5为本申请提供的电子设备实体的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申 请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述, 显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于 本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获 得的所有其它实施例,都属于本申请保护的范围。
特征漂移指的是特征随着时间而变化,目前检测特征漂移的主要方案 是通过人工对采集的各种类型的特征进行识别处理,然后通过分布的方式 进行检测,即根据经验获得一些指标来实现漂移的检测,然而,在大数据 分析过程中,数据的场景复杂,数据量较大,通过人工经验对数据进行分 析识别特征漂移不仅耗时交大,而且准确度不高。
针对上述问题,本申请提供一种特征漂移幅度的识别方法,该方案通过 对获取到的数据的样本按照时间进行划分,通过极端梯度提升模型进行训练 识别,得到每个类型的特征的漂移幅度,下面通过几个具体的实施例对该方 案进行详细描述。
图1为本申请提供的特征漂移幅度的识别方法实施例一的流程图,如图 1所示,该特征漂移幅度的识别方法可以应用在服务器、云服务器、电脑等 对数据进行分析处理的电子设备中,具体可以包括以下步骤:
S101:按照时间序列,将预先获取到的数据样本进行划分,得到多个子 数据样本。
在本步骤中,在对数据进行分析处理,或者进行模型训练的过程中,首 先需要采集大量的数据样本,根据需求采集至少一个类型的特征,在采集特 征数据的时,需要获取每个特征值对应的时间信息,即采集到的数据样本中 包含多个类型的特征数据,以及每个特征数据对应的时间信息。
在获取到数据样本之后,按照每个特征数据的时间信息,按照一定的时 间顺序以及间隔将该数据样本进行划分,也就是按照一定的时间序列将数据 样本分割成为多个时间段对应的子数据样本,每个子数据样本中包括多个类 型的特征数据。
S102:根据极端梯度提升(eXtreme Gradient Boosting,xgboost)模型对 每个子数据样本进行训练,得到每个特征在每个时间段中的重要性指标。
xgboost是boosting算法的其中一种。boosting算法的思想是将许多弱分 类器集成在一起形成一个强分类器。因为xgboost是一种提升树模型,所以它 是将许多树模型集成在一起,形成一个很强的分类器。
xgboost算法思想就是不断地添加树,不断地进行特征分裂来生长一棵树, 每次添加一个树,其实是学习一个新函数,去拟合上次预测的残差。当训练 完成得到k棵树,要预测一个样本的分数,就是根据这个样本的特征,在每 棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数,最后只 需要将每棵树对应的分数加起来就是该样本的预测值。
在本步骤中,电子设备在将数据样本按照时间序列划分为多个子数据样 本之后,针对每个子数据样本,可以采用该xgboost模型对其进行训练,能够 得到该子数据样本中的每个类型特征的重要性指标,遍历每个子数据样本, 则能够得到每个类型的特征在每个时间段中的重要性指标。
S103:根据每个特征在不同时间段中的重要性指标,获取特征的漂移幅 度。
在本步骤中,根据上一步获取到的每个类型的特征在不同时间段的重要 性指标,能够获取到每个类型的特征随着时间推进时候特征的变化的偏差, 然后确定每个类型的特征的漂移幅度。
在该步骤的一种具体实现中,电子设备可以根据每个特征在不同时间段 中的重要性指标,获取每个特征随时间变化的偏差,然后对每个特征的偏差 进行排序,得到每个特征的漂移幅度。
本实施例提供的特征漂移幅度的识别方法,电子设备按照时间序列,将 预先获取到的数据样本进行划分,得到多个子数据样本,根据xgboost模型对 每个子数据样本进行训练,得到每个特征在每个时间段中的重要性指标,根 据每个特征在不同时间段中的重要性指标,获取特征的漂移幅度,基于模型 对特征漂移的幅度进行识别,简单易用,且准确度较高。
图2为本申请提供的特征漂移幅度的识别方法实施例二的流程图,如图 2所示,在上述实施例的基础上,该特征漂移幅度的识别方法的一种具体实 现方案中,包括以下步骤:
在前述步骤S101之前,该方案还包括:
S104:采集获取数据样本,所述数据样本中包括至少一个特征,以及每 个特征的时间信息。
在本步骤中,对于需要进行分析处理的特征,实时获取按照一定的周期 进行采集,采集过程中在获取各个类型的特征数据的同时,需要记录每次获 取特征数据的时间信息,例如:对用户的特征数据进行采集,采集每个用户 的性别,年龄,收入等特征,举例来说,在每次采集用户的收入的同时间, 可以记录采集时间例如20**年6月19日,更详细一点可以记录到详细的时 刻,例如16时56分。
在特征的采集过程中,关于特征的时间信息具体需要记录到什么程度可 以根据实际情况进行设置。
通过上述方式采集数据样本之后,按照每个特征数据对应的时间信息进 行划分,具体如下。
相应的,步骤S101中按照时间序列,将预先获取到的数据样本进行划分, 得到多个子数据样本可以具体实现为:
S1011:根据每个特征的时间信息,按照预设时间间隔按照时间序列 将数据样本进行划分,得到多个子数据样本。
在本步骤中,在获取到数据样本之后,按照每个特征数据的时间信息, 按照一定的时间顺序以及一定的时间间隔将该数据样本进行划分,分割成为 多个时间段对应的子数据样本,每个子数据样本中包括多个类型的特征数据。
具体的,以用户的特征数据为例:可以按照一年,一个月或者一周等时 间间隔,将采集到的所有的用户特征数据进行划分,例如划分成为:2011年 对应的一个子数据样本,2012年对应的一个子样本集合……2019年对应的一 个子样本集合;其中每个子样本集合中包括用户在这一年的性别,身高,体 重,收入等类型的特征。
在该方案的具体实现中,建议以一个评估周期作为一个时间间隔进行划 分。
后续的步骤跟前述实施例一中一致,具体实现如下:
S102:根据xgboost模型对每个子数据样本进行训练,得到每个特征在 每个时间段中的重要性指标。
在本步骤中,电子设备在将数据样本按照时间序列划分为多个子数据样 本之后,针对每个子数据样本,可以采用该xgboost模型对其进行训练,能够 得到该子数据样本中的每个类型特征的重要性指标。
遍历每个子数据样本,则能够得到每个类型的特征在每个时间段中的重 要性指标。
可以理解的是,数据特征的重要性指标的值越高,表明该数据特征越重 要,随着重要性得分的降低,重要程度逐渐减小。
示例性的,除了可以采用xgboost模型,还可以采用是采用与本实施例的 业务数据相同类型的数据训练得到的重要性分析模型,因而,在本实施例中, 针对每个子数据样本,可以将获取到的特征数据的输入到该重要性分析模型 中,利用该重要性分析模型对特征数据的各数据特征进行分析处理,得到重 要性指标。
这里的重要性指标可以是每个特征的占比,特征的均值、特征的方差值、 或者特征的均方差,也可以是其他指标,具体本方案不做限制。
S103:根据每个特征在不同时间段中的重要性指标,获取特征的漂移幅 度。
在本步骤中,根据上一步获取到的每个类型的特征在不同时间段的重要 性指标,能够获取到每个类型的特征随着时间推进时候特征的变化的偏差, 然后确定每个类型的特征的漂移幅度。
具体的,电子设备可以根据每个特征在不同时间段中的重要性指标,获 取每个特征随时间变化的偏差,然后对每个特征的偏差进行排序,得到每个 特征的漂移幅度。
该方案的含义是通过对比每个时间段中每个特征的重要性占比,得到特 征随着时间变化的偏差值,然后按照时间循序或者按照该特征类型的偏差进 行排序之后,可以得到每个类型的特征的漂移幅度。
上述实施例提供的特征漂移幅度的识别方法,是一种基于模型的特征漂 移方法,能够自动的学习到特征的漂移幅度,整个过程中无需人工干预,基 于模型对特征漂移的幅度进行识别,简单易用,且准确度较高。
同时,采用xgboost模型进行子数据样本的训练,能够防止过拟合,目标 函数优化利用了损失函数关于待求函数的二阶导数。同时,该xgboost模型还 支持并行化,虽然树与树之间是串行关系,但是同层级节点可并行。具体的 对于某个节点,节点内选择最佳分裂点,候选分裂点计算增益用多线程并行。 训练速度快。
在该方案的处理过程中,由于xgboost模型添加了对稀疏数据的处理,因 此对于一些比较稀疏的特征数据能够进行比较准确的处理,当预测结果已经 很好的时候可以提前停止建树,加快训练速度。同时支持设置样本权重,可 以通过调整权重可以去更加关注一些样本,能够应用在各种技术领域。
图3为本申请提供的特征漂移幅度的识别装置实施例一的结构示意图, 如图3所示,该特征漂移幅度的识别装置10包括:
划分模块11,用于按照时间序列,将预先获取到的数据样本进行划分, 得到多个子数据样本;
处理模块12,用于根据极端梯度提升模型对每个子数据样本进行训练, 得到每个特征在每个时间段中的重要性指标;
获取模块13,用于根据每个特征在不同时间段中的重要性指标,获取所 述特征的漂移幅度。
本实施例提供的特征漂移幅度的识别装置,用于执行前述任一方法实施 例中提供的技术方案,其实现原理和技术效果类似,按照时间序列,将预先 获取到的数据样本进行划分,得到多个子数据样本,根据xgboost模型对每个 子数据样本进行训练,得到每个特征在每个时间段中的重要性指标,根据每 个特征在不同时间段中的重要性指标,获取特征的漂移幅度,基于模型对特 征漂移的幅度进行识别,简单易用,且准确度较高。
在上述实施例的基础上,一种具体的实施方式中,所述获取模块13具体 用于:
根据每个特征在不同时间段中的重要性指标,获取每个特征随时间变化 的偏差;
对每个特征的偏差进行排序,得到每个特征的漂移幅度。
图4为本申请提供的特征漂移幅度的识别装置实施例二的结构示意图, 如图4所示,在上述实施例的基础上,该特征漂移幅度的识别装置10还包括:
采集模块14,用于采集获取所述数据样本,所述数据样本中包括至少一 个特征,以及每个特征的时间信息。
可选的,所述划分模块11具体用于:
根据每个特征的时间信息,按照预设时间间隔按照时间序列将所述数 据样本进行划分,得到所述多个子数据样本。
上述任一实施例提供的特征漂移幅度的识别装置,用于执行前述方法实 施例中的电子设备侧的技术方案,其实现原理和技术效果类似,在此不再赘 述。
图5为本申请提供的电子设备实体的结构示意图,如图5所示该电子设备 20,包括:处理器21、存储器22以及计算机程序;所述计算机程序存储在所 述存储器22中,所述处理器21执行所述计算机程序实现前述任一方法实施例 中电子设备侧的特征漂移幅度的识别方法的技术方案。
可选地,存储器22既可以是独立的,也可以跟处理器21集成在一起。
当所述存储器22是独立于处理器21之外的器件时,所述电子设备还可 以包括:
总线23,用于连接所述处理器21以及所述存储器22。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储 有计算机程序,所述计算机程序用于实现前述任一方法实施例中电子设备侧 的特征漂移幅度的识别方法的技术方案。
在上述电子设备的具体实现中,应理解,处理器可以是中央处理单元(英 文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字 信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英 文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可 以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施 例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器 中的硬件及软件模块组合执行完成。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步 骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可 读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而 前述的存储介质包括:只读存储器(英文:read-only memory,缩写:ROM)、 RAM、快闪存储器、硬盘、固态硬盘、磁带(英文:magnetic tape)、软盘(英 文:floppy disk)、光盘(英文:optical disc)及其任意组合。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对 其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通 技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改, 或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并 不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (10)
1.一种特征漂移幅度的识别方法,其特征在于,包括:
按照时间序列,将预先获取到的数据样本进行划分,得到多个子数据样本;
根据极端梯度提升模型对每个子数据样本进行训练,得到每个特征在每个时间段中的重要性指标;
根据每个特征在不同时间段中的重要性指标,获取所述特征的漂移幅度。
2.根据权利要求1所述的方法,其特征在于,所述根据每个特征在不同时间段中的重要性指标,获取所述特征的漂移幅度,包括:
根据每个特征在不同时间段中的重要性指标,获取每个特征随时间变化的偏差;
对每个特征的偏差进行排序,得到每个特征的漂移幅度。
3.根据权利要求1或2所述的方法,其特征在于,所述按照时间序列,将预先获取到的数据样本进行划分,得到多个子数据样本之前,所述方法还包括:
采集获取所述数据样本,所述数据样本中包括至少一个特征,以及每个特征的时间信息。
4.根据权利要求3所述的方法,其特征在于,所述按照时间序列,将预先获取到的数据样本进行划分,得到多个子数据样本,包括:
根据每个特征的时间信息,按照预设时间间隔按照时间序列将所述数据样本进行划分,得到所述多个子数据样本。
5.一种特征漂移幅度的识别装置,其特征在于,包括:
划分模块,用于按照时间序列,将预先获取到的数据样本进行划分,得到多个子数据样本;
处理模块,用于根据极端梯度提升模型对每个子数据样本进行训练,得到每个特征在每个时间段中的重要性指标;
获取模块,用于根据每个特征在不同时间段中的重要性指标,获取所述特征的漂移幅度。
6.根据权利要求5所述的装置,其特征在于,所述获取模块具体用于:
根据每个特征在不同时间段中的重要性指标,获取每个特征随时间变化的偏差;
对每个特征的偏差进行排序,得到每个特征的漂移幅度。
7.根据权利要求5或6所述的装置,其特征在于,所述装置还包括:
采集模块,用于采集获取所述数据样本,所述数据样本中包括至少一个特征,以及每个特征的时间信息。
8.根据权利要求7所述的装置,其特征在于,所述划分模块具体用于:
根据每个特征的时间信息,按照预设时间间隔按照时间序列将所述数据样本进行划分,得到所述多个子数据样本。
9.一种电子设备,其特征在于,包括:处理器、存储器以及计算机程序;所述计算机程序存储在所述存储器中,所述处理器执行所述计算机程序实现权利要求1至4任一项所述的特征漂移幅度的识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于实现权利要求1至4任一项所述的特征漂移幅度的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910575404.6A CN112149700A (zh) | 2019-06-28 | 2019-06-28 | 特征漂移幅度的识别方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910575404.6A CN112149700A (zh) | 2019-06-28 | 2019-06-28 | 特征漂移幅度的识别方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112149700A true CN112149700A (zh) | 2020-12-29 |
Family
ID=73869302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910575404.6A Pending CN112149700A (zh) | 2019-06-28 | 2019-06-28 | 特征漂移幅度的识别方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112149700A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5179350A (en) * | 1991-08-07 | 1993-01-12 | Accsys Technology, Inc. | Drift tube linac with drift tube performance normalization and maximization |
US20130063069A1 (en) * | 2011-09-09 | 2013-03-14 | Samsung Electro-Mechanics Co., Ltd. | Apparatus and method of driving motor with initial compensation |
CN105740388A (zh) * | 2016-01-27 | 2016-07-06 | 上海晶赞科技发展有限公司 | 一种基于分布漂移数据集的特征选择方法 |
CN109902703A (zh) * | 2018-09-03 | 2019-06-18 | 华为技术有限公司 | 一种时间序列异常检测方法及装置 |
-
2019
- 2019-06-28 CN CN201910575404.6A patent/CN112149700A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5179350A (en) * | 1991-08-07 | 1993-01-12 | Accsys Technology, Inc. | Drift tube linac with drift tube performance normalization and maximization |
US20130063069A1 (en) * | 2011-09-09 | 2013-03-14 | Samsung Electro-Mechanics Co., Ltd. | Apparatus and method of driving motor with initial compensation |
CN105740388A (zh) * | 2016-01-27 | 2016-07-06 | 上海晶赞科技发展有限公司 | 一种基于分布漂移数据集的特征选择方法 |
CN109902703A (zh) * | 2018-09-03 | 2019-06-18 | 华为技术有限公司 | 一种时间序列异常检测方法及装置 |
Non-Patent Citations (1)
Title |
---|
王殿升;高娟;: "信息管理数据中心特征漂移下的深度挖掘算法研究", 科技通报, no. 12 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109271374B (zh) | 一种基于机器学习的数据库健康度打分方法和打分系统 | |
CN108960269B (zh) | 数据集的特征获取方法、装置及计算设备 | |
CN108256738B (zh) | 道岔动作参考曲线选取方法及其应用 | |
CN106452934B (zh) | 一种网络性能指标变化趋势的分析方法和装置 | |
CN113440789B (zh) | 一种多人跳绳测试智能计数方法及系统 | |
CN116109195B (zh) | 一种基于图卷积神经网络的绩效评估方法及系统 | |
CN112116168B (zh) | 一种用户行为的预测方法、装置及电子设备 | |
CN116028870B (zh) | 一种数据检测的方法、装置、电子设备及存储介质 | |
CN115563484A (zh) | 一种基于生理唤醒识别的街道绿化品质检测方法 | |
CN110111011B (zh) | 一种教学质量监管方法、装置及电子设备 | |
CN110995461B (zh) | 网络故障诊断方法 | |
CN113838524B (zh) | S-亚硝基化位点预测方法、模型训练方法及存储介质 | |
CN112149700A (zh) | 特征漂移幅度的识别方法、装置、设备和存储介质 | |
CN111782978A (zh) | 兴趣点数据的处理方法及装置、电子设备、可读介质 | |
CN113420733B (zh) | 一种高效分布式大数据数据采集实现方法及系统 | |
CN115631379A (zh) | 结合主动学习和噪声筛除的视频分析方法、装置及介质 | |
CN111667697A (zh) | 异常车辆识别方法和装置、计算机可读存储介质 | |
US11386340B2 (en) | Method and apparatus for performing block retrieval on block to be processed of urine sediment image | |
CN112149833A (zh) | 基于机器学习的预测方法、装置、设备和存储介质 | |
CN113962216A (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
CN113918471A (zh) | 测试用例的处理方法、装置及计算机可读存储介质 | |
CN113768520A (zh) | 一种脑电检测模型的训练方法及装置 | |
Yu et al. | Network inference and change point detection for piecewise-stationary time series | |
CN117351240B (zh) | 一种正样本采样方法、系统、存储介质和电子设备 | |
CN111027599A (zh) | 基于随机抽样的聚类可视化方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |