CN111198906A - 一种数据处理方法、装置、系统及存储介质 - Google Patents

一种数据处理方法、装置、系统及存储介质 Download PDF

Info

Publication number
CN111198906A
CN111198906A CN201911327786.7A CN201911327786A CN111198906A CN 111198906 A CN111198906 A CN 111198906A CN 201911327786 A CN201911327786 A CN 201911327786A CN 111198906 A CN111198906 A CN 111198906A
Authority
CN
China
Prior art keywords
data
model
sample
processing
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911327786.7A
Other languages
English (en)
Inventor
唐禹
汪振兴
林叶强
朱贞龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyang Hongye Technology Co ltd
Original Assignee
Tianyang Hongye Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyang Hongye Technology Co ltd filed Critical Tianyang Hongye Technology Co ltd
Priority to CN201911327786.7A priority Critical patent/CN111198906A/zh
Publication of CN111198906A publication Critical patent/CN111198906A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例公开了一种数据处理方法、装置、系统及存储介质,通过上采样对数据较少的类型样本进行增加样本处理,通过下采样对数据较多的类型样本进行减少样本处理,是模型中的各类型样本数据达到预设的比例,进而使模型预测的准确率更高,同时通过z‑score标准化处理使样本数据标准化,进而减少样本数据中的异常值对计算结果的影响,增强了模型预测的准确率和鲁棒性。

Description

一种数据处理方法、装置、系统及存储介质
技术领域
本发明实施例涉及数据处理技术领域,具体涉及一种数据处理方法、装置、系统及存储介质。
背景技术
针对智能营销中对数据挖掘特征工程,在该数据挖掘特征工程中,需要处理样本类别平衡及实现样本数据标准化,现有解决方案实现机制大致为:只对数据进行缺失化处理;数据标准化使用的是min_max归一化处理方式。但当样本分布不均衡时,会导致样本量少的分类所包含的特征过少,模型预测结果偏向于样本量多的分类,这会造成模型对数量多的类别的分类性能更好,同时当模型应用到新数据时,模型准确性和鲁棒性很差。而针对训练数据中存在异常值,归一化数据处理方式并不能很好解决异常值对模型训练的影响,造成模型预测准确率不高。
发明内容
为此,本发明实施例提供一种数据处理方法、装置、系统及存储介质,以解决现有技术中由于样本分布不均以及异常值影响而导致的模型预测准确率低的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
根据本发明实施例的第一方面,一种数据处理方法,包括以下步骤:
获取某一模型中的数据样本;
根据所述模型中的样本对所述模型进行缺失值处理;
根据进行缺失值处理后模型的样本对所述模型进行样本平衡处理;
根据进行样本平衡后模型的样本对所述模型进行数据标准化处理。
进一步地,所述根据进行缺失值处理后模型的样本对所述模型进行样本平衡处理具体包括:
根据所述模型中某一类型数据的占比率判断所述类型数据的占比率是否等于所述类型数据的预设占比率;如判断结果为是,则执行下一步骤,如判断结果为否,则进行样本平衡处理。
进一步地,所述样本平衡处理具体包括
根据所述模型中所述类型数据的占比率判断所述类型数据的占比率是否高于所述类型数据的预设占比率,如判断结果为是,则进行下采样处理,所述下采样处理具体包括:减少所述模型中所述类型数据。
进一步地,所述样本平衡处理具体包括
根据所述模型中所述类型数据的占比率判断所述类型数据的占比率是否低于所述类型数据的预设占比率,如判定结果为是,则进行上采样处理,所述上采样处理具体包括:增加所述模型中所述类型数据。
进一步地,所述增加所述模型中所述类型数据具体包括:
使用SMOTE算法增加所述模型中所述类型数据。
根据权利要求1所述的一种数据处理方法,其特征是:所述根据进行样本平衡后模型的样本对所述模型进行数据标准化处理具体包括:
对进行样本平衡后模型的样本进行z-score标准化处理。
根据本发明实施例的第二方面,一种数据处理装置,包括
样本获取单元:获取某一模型中的数据样本;
缺失值处理单元:根据所述模型中的样本对所述模型进行缺失值处理;
样本平衡处理单元:根据进行缺失值处理后模型的样本对所述模型进行样本平衡处理;
数据标准化处理单元:根据进行样本平衡后模型的样本对所述模型进行数据标准化处理。
根据本发明实施例的第三方面,一种数据处理方法的电子设备,包括:
存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如一种数据处理方法中任一所述的方法。
根据本发明实施例的第四方面,一种数据处理方法的计算机可读存储介质,包括:
其上存储有计算机程序,所述计算机程序被处理器执行时实现如一种数据处理方法中任一所述方法的步骤。
本发明实施例具有如下优点:通过上采样对数据较少的类型样本进行增加样本处理,通过下采样对数据较多的类型样本进行减少样本处理,是模型中的各类型样本数据达到预设的比例,进而使模型预测的准确率更高,同时通过 z-score标准化处理使样本数据标准化,进而减少样本数据中的异常值对计算结果的影响,增强了模型预测的准确率和鲁棒性。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
图1为本发明实施例1提供的一种数据处理方法的方法流程图;
图2为本发明实施例2提供的一种数据处理系统的系统框图;
图3为本发明实施例3提供的一种数据处理系统的结构示意图。
图中:401、样本获取单元;402、缺失值处理单元;403、样本平衡处理单元;404、数据标准化处理单元;501、处理器;502、储存器。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:一种数据处理方法,参见附图1,包括以下步骤:
S1、获取某一模型中的数据样本;
具体的,从模型中获取数据样本,该数据样本可以为需要进行预测的数据样本,也可以是全部数据样本,在本实施例中,以一个大额存单偏好的二分类模型为例,即获取该大额存单偏好模型中的样本数据。
S2、根据所述模型中的样本对所述模型进行缺失值处理;
具体的,对上述在大额存单偏好模型中获取的样本数据进行缺失值处理,缺失值处理为常规处理手段,缺失值产生的原因主要是由于机械原因和人为原因,由于设备原因导致的数据收集或保存的失败造成的数据缺失为机械原因,由于人的主观失误、历史局限或有意隐瞒造成的数据缺失为人为原因,在本实施例中,缺失值处理分为删除缺失值和缺失值插补,删除缺失值即对含有缺失值的数据进行删除处理,缺失值插补即为利用可能值插补缺失值,在本实施例中,缺失值插补包括但不限于均值插补、同类均值插补、极大似然估计插补和多重插补,在本实施例中,优选为均值插补的方式。
S3、根据进行缺失值处理后模型的样本对所述模型进行样本平衡处理;
具体的,根据所述模型中某一类型数据的占比率判断所述类型数据的占比率是否等于所述类型数据的预设占比率;如判断结果为是,则执行下一步骤,如判断结果为否,则进行样本平衡处理。在本实施例中,大额存单偏好模型由于是一个二分类模型,其中只包含是/否大额存单两种分类,在本实施例中,不是大额存单的数据量优选为128866个,占总数据量比例为93.5%,而是大额存单的数据量优选为8967个,占总数据量比例为6.5%,在本实施例中,由于是二分类模型,其大额存单的两个分类应均占50%,因此需要进行数据标准化处理。
具体的,根据所述模型中所述类型数据的占比率判断所述类型数据的占比率是否低于所述类型数据的预设占比率,如判定结果为是,则进行上采样处理,所述上采样处理具体包括:增加所述模型中所述类型数据。根据所述模型中所述类型数据的占比率判断所述类型数据的占比率是否高于所述类型数据的预设占比率,如判断结果为是,则进行下采样处理,所述下采样处理具体包括:减少所述模型中所述类型数据。其中,增加分类中少数类样本的数量实现样本均衡,最简单的方法就是将少数类样本进行复制,从而达到样本均衡,但如果采用这种抽样方法样本特征少时,可能会导致过拟合;改进后的抽样方式法是通过在少数类中加入随机噪声、干扰数据或者通过一定规则产生新的合成样本,在本实施例中,优选为使用开源库算法SMOTE,生成新的合成样本,进而使是大额存单的数据量与非大额存单的数据量相等,即非大额存单的数据量也为128866个,保证两个数据占比都为50%。同时,当需要进行下采样时,只需通过随机去除一些数量多的类别样本数量,即可使数量多的类别样本数量减少。
S4、根据进行样本平衡后模型的样本对所述模型进行数据标准化处理。
具体的,对所述模型进行数据标准化处理可分为归一化处理和对进行样本平衡后模型的样本进行z-score标准化处理,在本实施例中优选为对进行样本平衡后模型的样本进行z-score标准化处理,大额存单模型所使用的训练集数据,包含了大量交易特征,资产特征,同时这些特征数据存在异常值,而且数据存在不同的量级,需要将数据映射到同一个量级,以保证数据之间的可比性,因此通过z-score标准化,可以有效避免由于量纲不同、数值相差过大、数据存在异常值而引起误差。
本发明实施例1提供一种数据处理方法,通过上采样对数据较少的类型样本进行增加样本处理,通过下采样对数据较多的类型样本进行减少样本处理,是模型中的各类型样本数据达到预设的比例,进而使模型预测的准确率更高,同时通过z-score标准化处理使样本数据标准化,进而减少样本数据中的异常值对计算结果的影响,增强了模型预测的准确率和鲁棒性。
与上述实施例1对应的,本发明实施例2还提供了一种数据处理装置,如图2所示,包括
样本获取单元401:获取某一模型中的数据样本;
缺失值处理单元402:根据所述模型中的样本对所述模型进行缺失值处理;
样本平衡处理单元403:根据进行缺失值处理后模型的样本对所述模型进行样本平衡处理;
数据标准化处理单元404:根据进行样本平衡后模型的样本对所述模型进行数据标准化处理。
可选的,样本平衡处理单元403具体用于根据所述模型中某一类型数据的占比率判断所述类型数据的占比率是否等于所述类型数据的预设占比率;如判断结果为是,则执行下一步骤,如判断结果为否,则进行样本平衡处理。
可选的,样本平衡处理单元403具体用于根据所述模型中所述类型数据的占比率判断所述类型数据的占比率是否高于所述类型数据的预设占比率,如判断结果为是,则进行下采样处理,所述下采样处理具体包括:减少所述模型中所述类型数据。
可选的,样本平衡处理单元403具体用于根据所述模型中所述类型数据的占比率判断所述类型数据的占比率是否低于所述类型数据的预设占比率,如判定结果为是,则进行上采样处理,所述上采样处理具体包括:增加所述模型中所述类型数据。
可选的,样本平衡处理单元403具体使用SMOTE算法增加所述模型中所述类型数据。
可选的,数据标准化处理单元404具体用于对进行样本平衡后模型的样本进行z-score标准化处理。
本发明实施例提供的一种数据处理装置中各部件所执行的功能均已在上述实施例1中做了详细介绍,因此这里不做过多赘述。
本发明实施例1提供一种数据处理装置,通过上采样对数据较少的类型样本进行增加样本处理,通过下采样对数据较多的类型样本进行减少样本处理,是模型中的各类型样本数据达到预设的比例,进而使模型预测的准确率更高,同时通过z-score标准化处理使样本数据标准化,进而减少样本数据中的异常值对计算结果的影响,增强了模型预测的准确率和鲁棒性。
与上述实施例相对应的,本发明实施例3还提供了一种数据处理的电子设备,具体如图3所示,该电子设备包括:处理器501和存储器;
存储器用于存储一个或多个程序指令;
处理器501,用于运行一个或多个程序指令,用以执行如上实施例所介绍的一种代打卡异常监测分析方法中的任一方法步骤。
一种数据处理的电子设备,通过上采样对数据较少的类型样本进行增加样本处理,通过下采样对数据较多的类型样本进行减少样本处理,是模型中的各类型样本数据达到预设的比例,进而使模型预测的准确率更高,同时通过 z-score标准化处理使样本数据标准化,进而减少样本数据中的异常值对计算结果的影响,增强了模型预测的准确率和鲁棒性。
与上述实施例相对应的,本发明实施例还提供了一种计算机存储介质,该计算机存储介质中包含一个或多个程序指令。其中,一个或多个程序指令用于被一种代打卡异常监测分析电子设备执行如上所介绍的一种数据处理方法。
在本发明实施例中,处理器501可以是一种集成电路芯片,具有信号的处理能力。处理器501可以是通用处理器501、数字信号处理器501(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific工ntegrated Circuit,简称ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,简称FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器501可以是微处理器501或者该处理器501也可以是任何常规的处理器501等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器501执行完成,或者用译码处理器501中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。处理器501读取存储介质中的信息,结合其硬件完成上述方法的步骤。
存储介质可以是存储器,例如可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
其中,非易失性存储器可以是只读存储器(Read-Only Memory,简称 ROM)、可编程只读存储器(Programmable ROM,简称PROM)、可擦除可编程只读存储器(Erasable PROM,简称EPROM)、电可擦除可编程只读存储器(Electrically EPROM,简称EEPROM)或闪存。
易失性存储器可以是随机存取存储器(Random Access Memory,简称 RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的 RAM可用,例如静态随机存取存储器(Static RAM,简称SRAM)、动态随机存取存储器(Dynamic RAM,简称DRAM)、同步动态随机存取存储器 (Synchronous DRAM,简称SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,简称DDRSDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM,简称ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,简称SLDRAM)和直接内存总线随机存取存储器 (DirectRambus RAM,简称DRRAM)。
本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (9)

1.一种数据处理方法,其特征是:包括以下步骤:
获取某一模型中的数据样本;
根据所述模型中的样本对所述模型进行缺失值处理;
根据进行缺失值处理后模型的样本对所述模型进行样本平衡处理;
根据进行样本平衡后模型的样本对所述模型进行数据标准化处理。
2.根据权利要求1所述的一种数据处理方法,其特征是:
所述根据进行缺失值处理后模型的样本对所述模型进行样本平衡处理具体包括:
根据所述模型中某一类型数据的占比率判断所述类型数据的占比率是否等于所述类型数据的预设占比率;如判断结果为是,则执行下一步骤,如判断结果为否,则进行样本平衡处理。
3.根据权利要求2所述的一种数据处理方法,其特征是:所述样本平衡处理具体包括:
根据所述模型中所述类型数据的占比率判断所述类型数据的占比率是否高于所述类型数据的预设占比率,如判断结果为是,则进行下采样处理,所述下采样处理具体包括:减少所述模型中所述类型数据。
4.根据权利要求2所述的一种数据处理方法,其特征是:所述样本平衡处理具体包括:
根据所述模型中所述类型数据的占比率判断所述类型数据的占比率是否低于所述类型数据的预设占比率,如判定结果为是,则进行上采样处理,所述上采样处理具体包括:增加所述模型中所述类型数据。
5.根据权利要求4所述的一种数据处理方法,其特征是:所述增加所述模型中所述类型数据具体包括:
使用SMOTE算法增加所述模型中所述类型数据。
6.根据权利要求1所述的一种数据处理方法,其特征是:所述根据进行样本平衡后模型的样本对所述模型进行数据标准化处理具体包括:
对进行样本平衡后模型的样本进行z-score标准化处理。
7.一种数据处理装置,其特征是:包括:
样本获取单元:获取某一模型中的数据样本;
缺失值处理单元:根据所述模型中的样本对所述模型进行缺失值处理;
样本平衡处理单元:根据进行缺失值处理后模型的样本对所述模型进行样本平衡处理;
数据标准化处理单元:根据进行样本平衡后模型的样本对所述模型进行数据标准化处理。
8.一种数据处理方法的电子设备,其特征是:包括:
存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至6任一所述的方法。
9.一种数据处理方法的计算机可读存储介质,其特征在于:包括:
其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一所述方法的步骤。
CN201911327786.7A 2019-12-20 2019-12-20 一种数据处理方法、装置、系统及存储介质 Pending CN111198906A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911327786.7A CN111198906A (zh) 2019-12-20 2019-12-20 一种数据处理方法、装置、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911327786.7A CN111198906A (zh) 2019-12-20 2019-12-20 一种数据处理方法、装置、系统及存储介质

Publications (1)

Publication Number Publication Date
CN111198906A true CN111198906A (zh) 2020-05-26

Family

ID=70744410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911327786.7A Pending CN111198906A (zh) 2019-12-20 2019-12-20 一种数据处理方法、装置、系统及存储介质

Country Status (1)

Country Link
CN (1) CN111198906A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111897695A (zh) * 2020-07-31 2020-11-06 平安科技(深圳)有限公司 获取kpi异常数据样本的方法、装置和计算机设备
CN112085080A (zh) * 2020-08-31 2020-12-15 北京百度网讯科技有限公司 样本均衡方法、装置、设备以及存储介质
CN112613553A (zh) * 2020-12-18 2021-04-06 中电金信软件有限公司 图片样本集生成方法、装置、计算机设备和存储介质
CN112948463A (zh) * 2021-03-01 2021-06-11 创新奇智(重庆)科技有限公司 轧钢数据采样方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180096267A1 (en) * 2016-09-30 2018-04-05 Salesforce.Com, Inc. Single model-based behavior predictions in an on-demand environment
CN108830645A (zh) * 2018-05-31 2018-11-16 厦门快商通信息技术有限公司 一种访客流失预测方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180096267A1 (en) * 2016-09-30 2018-04-05 Salesforce.Com, Inc. Single model-based behavior predictions in an on-demand environment
CN108830645A (zh) * 2018-05-31 2018-11-16 厦门快商通信息技术有限公司 一种访客流失预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孙鹿: "基于数据挖掘的P2P网贷个人信用评价模型研究", 《中国优秀硕士学位论文全文数据库(经济与管理科学辑)》 *
陈秀敏等: "基于数据挖掘的4G用户投诉预测", 《移动通信》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111897695A (zh) * 2020-07-31 2020-11-06 平安科技(深圳)有限公司 获取kpi异常数据样本的方法、装置和计算机设备
CN111897695B (zh) * 2020-07-31 2022-06-17 平安科技(深圳)有限公司 获取kpi异常数据样本的方法、装置和计算机设备
CN112085080A (zh) * 2020-08-31 2020-12-15 北京百度网讯科技有限公司 样本均衡方法、装置、设备以及存储介质
CN112085080B (zh) * 2020-08-31 2024-03-08 北京百度网讯科技有限公司 样本均衡方法、装置、设备以及存储介质
CN112613553A (zh) * 2020-12-18 2021-04-06 中电金信软件有限公司 图片样本集生成方法、装置、计算机设备和存储介质
CN112613553B (zh) * 2020-12-18 2022-03-08 中电金信软件有限公司 图片样本集生成方法、装置、计算机设备和存储介质
CN112948463A (zh) * 2021-03-01 2021-06-11 创新奇智(重庆)科技有限公司 轧钢数据采样方法、装置、电子设备及存储介质
CN112948463B (zh) * 2021-03-01 2022-10-14 创新奇智(重庆)科技有限公司 轧钢数据采样方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111198906A (zh) 一种数据处理方法、装置、系统及存储介质
CN110008080B (zh) 基于时间序列的业务指标异常检测方法、装置和电子设备
CN113379301A (zh) 通过决策树模型对用户进行分类的方法、装置和设备
CN111612628A (zh) 一种非平衡数据集的分类方法及系统
CN110008986B (zh) 批量风险案件识别方法、装置及电子设备
CN111258905A (zh) 缺陷定位方法、装置和电子设备及计算机可读存储介质
CN113554228A (zh) 还款率预测模型的训练方法及还款率的预测方法
CN109598478B (zh) 一种风测结果描述文案的生成方法、装置及电子设备
CN110795308A (zh) 一种服务器检验方法、装置、设备及存储介质
CN114397671B (zh) 目标的航向角平滑方法、装置及计算机可读存储介质
CN114493903B (zh) 人伤风险评估中估损模型优化方法及相关设备
CN115270861A (zh) 一种产品成分数据监测方法、装置、电子设备及存储介质
CN115047262A (zh) 基于电能质量数据的设备异常状态通用识别方法
CN111147082B (zh) 一种证券交易数据压缩方法及装置
CN114416467A (zh) 一种异常检测方法及装置
CN113157987A (zh) 用于机器学习算法的数据预处理方法及相关设备
CN111045875B (zh) 车辆事故检测方法及相关设备
CN113516453A (zh) 建设项目投资资金管控预警方法、装置、设备及介质
CN113870754A (zh) 一种面板检测电子信号缺陷判定的方法和系统
CN112667754A (zh) 大数据处理方法、装置、计算机设备及存储介质
CN112712610A (zh) 车辆诊断日志处理方法、装置、终端设备及可读存储介质
CN112988536A (zh) 一种数据异常检测方法、装置、设备及存储介质
CN111753598A (zh) 人脸检测方法及设备
CN113744789B (zh) 一种在研发阶段测试ssd稳定性的方法、系统、设备和介质
CN117610943B (zh) 一种信用主体信用评价风险模型的建模方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200526