CN117435910A - 一种异常数据的检测方法、装置、计算机设备 - Google Patents

一种异常数据的检测方法、装置、计算机设备 Download PDF

Info

Publication number
CN117435910A
CN117435910A CN202311248655.6A CN202311248655A CN117435910A CN 117435910 A CN117435910 A CN 117435910A CN 202311248655 A CN202311248655 A CN 202311248655A CN 117435910 A CN117435910 A CN 117435910A
Authority
CN
China
Prior art keywords
data
classification
operation result
features
vector machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311248655.6A
Other languages
English (en)
Inventor
程海鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202311248655.6A priority Critical patent/CN117435910A/zh
Publication of CN117435910A publication Critical patent/CN117435910A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3692Test management for test results analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • General Factory Administration (AREA)

Abstract

本申请涉及一种异常数据的检测方法、装置、计算机设备。所述方法包括:获取资源交互数据、所述资源交互数据对应的运行结果数据,其中,所述运行结果数据中包括异常数据、正确数据;对所述资源交互数据、运行结果数据进行特征提取,得到资源交互特征、运行结果特征;基于不同特征对应的权重系数,对所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;将所述融合特征输入至预训练的分类向量机,得到所述运行结果数据中的异常数据。采用本方法能够提高异常数据的检测效率。

Description

一种异常数据的检测方法、装置、计算机设备
技术领域
本申请涉及大数据技术领域,特别是涉及一种异常数据的检测方法、装置、计算机设备。
背景技术
低代码是一组数字技术工具平台,能基于图形化拖拽、参数化配置等更为高效的方式,实现快速构建、数据编排、连接生态、中台服务等。与无代码开发平台相比,操作难度高,难以及时发现操作中的错误。
相关技术中,可以采用人工筛选的方式判断运行结果的正确性,若运行结果错误,再对资源交互数据进行判断,工作效率较低。
发明内容
基于此,有必要针对上述技术问题,提供了一种异常数据的检测方法,可以通过收集已有资源交互数据、运行结果数据,以人工智能算法为基础,对其进行分类并进行规则推导,得到最后的模型便可以通过已有提示信息对错误进行纠正。
第一方面,本申请提供了一种异常数据的检测方法。所述方法包括:
获取资源交互数据、所述资源交互数据对应的运行结果数据,其中,所述运行结果数据中包括异常数据、正确数据;
对所述资源交互数据、运行结果数据进行特征提取,得到资源交互特征、运行结果特征;
基于不同特征对应的权重系数,对所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
将所述融合特征输入至预训练的分类向量机,得到所述运行结果数据中的异常数据。
在其中一个实施例中,所述分类向量机的生成方式包括:
将训练样本输入至分类向量机,当分类向量机输出的结果与训练样本的误差小于误差阈值时,确定模型输出的分类超平面和分类决策函数,得到训练后的分类向量机。
在其中一个实施例中,所述训练样本采用下述方式得到:
获取不同类型的资源交互数据,所述资源交互数据对应的运行结果数据;
对所述资源交互数据、运行结果数据进行特征提取,得到不同类型的资源交互特征、运行结果特征;
对同一类型的所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
将融合特征进行拼接,得到拼接特征,用于作为训练分类向量机的训练样本。
在其中一个实施例中,所述将所述融合特征输入至预训练的分类向量机之后,所述方法包括:
获取所述分类向量机输出的分类超平面和分类决策函数;
将在分类超平面距离阈值内的融合特征输入分类决策函数,在输出结果符合所述分类决策函数时,根据所述分类超平面确定异常数据的种类。
在其中一个实施例中,所述方法还包括:
将原有异常数据、分类向量机输出的新的异常数据作为优化分类向量机的数据,重新确定分类向量机的分类超平面和分类决策函数。
第二方面,本申请还提供了一种异常数据的检测装置,所述装置包括:
获取模块,用于获取资源交互数据、所述资源交互数据对应的运行结果数据,其中,所述运行结果数据中包括异常数据、正确数据;
提取模块,用于对所述资源交互数据、运行结果数据进行特征提取,得到资源交互特征、运行结果特征;
融合模块,用于基于不同特征对应的权重系数,对所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
检测模块,用于将所述融合特征输入至预训练的分类向量机,得到所述运行结果数据中的异常数据。
在其中一个实施例中,所述分类向量机的生成方式包括:
将训练样本输入至分类向量机,当分类向量机输出的结果与训练样本的误差小于误差阈值时,确定模型输出的分类超平面和分类决策函数,得到训练后的分类向量机。
在其中一个实施例中,所述训练样本采用下述方式得到:
获取不同类型的资源交互数据,所述资源交互数据对应的运行结果数据;
对所述资源交互数据、运行结果数据进行特征提取,得到不同类型的资源交互特征、运行结果特征;
对同一类型的所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
将融合特征进行拼接,得到拼接特征,用于作为训练分类向量机的训练样本。
在其中一个实施例中,所述将所述融合特征输入至预训练的分类向量机之后,所述装置包括:
获取所述分类向量机输出的分类超平面和分类决策函数;
将在分类超平面距离阈值内的融合特征输入分类决策函数,在输出结果符合所述分类决策函数时,根据所述分类超平面确定异常数据的种类。
在其中一个实施例中,所述装置还包括:
将原有异常数据、分类向量机输出的新的异常数据作为优化分类向量机的数据,重新确定分类向量机的分类超平面和分类决策函数。
第三方面,本公开还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现异常数据的检测方法的步骤。
第四方面,本公开还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现异常数据的检测方法的步骤。
第五方面,本公开还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现异常数据的检测方法的步骤。
上述异常数据的检测方法,至少包括以下有益效果:
本公开提供的实施例方案,可以对资源交互数据、运行结果数据进行特征提取,得到资源交互特征、运行结果特征,基于不同特征对应的权重系数,对资源交互特征、对应的运行结果特征进行特征融合,得到融合特征,将融合特征输入分类向量机,以确定运行结果数据中的异常数据,提高异常数据检测的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
为了更清楚地说明本公开实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中异常数据的检测方法的应用环境图;
图2为一个实施例中异常数据的检测方法的流程示意图;
图3为一个实施例中异常数据的检测方法的流程示意图;
图4为一个实施例中异常数据的检测装置的结构框图;
图5为一个实施例中异常数据的检测装置的结构框图;
图6为一个实施例中计算机设备的内部结构图;
图7为一个实施例中一种服务器的内部结构图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。例如若使用到第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本公开实施例提供一种异常数据的检测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在本公开的一些实施例中,如图2所示,提供了一种异常数据的检测方法,以该方法应用于图1中的服务器对异常数据进行处理为例进行说明。可以理解的是,该方法可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。具体的一个实施例中,所述方法可以包括以下步骤:
S202:获取资源交互数据、所述资源交互数据对应的运行结果数据,其中,所述运行结果数据中包括异常数据、正确数据。
低代码平台屏蔽了大量代码,用户可以用图形化拖拽、文本信息配置的方式进行交易搭建,其中,资源交互数据可以是经过图形化拖拽、文本信息配置的数据,运行结果数据可以是资源交互数据在页面上最终呈现的结果,运行结果中可以包括异常数据、正确数据。
在本公开的一些实施例中,用户可以通过将组件按照一定的逻辑顺序拖拽至应用开发界面上,并设置组件内部参数,完成对业务应用的构建,不同的组件对应不同的业务属性,最终的运行结果数据不同。组件信息,可以理解为构建目标应用的每一个组件的相关信息,可以包括每一个组件的组件自身信息,例如组件标识、组件设置的内部参数等,还可以包括每一个组件的组件环境信息,例如每一个组件的前一个组件及后一个组件的组件标识等。
S204:对所述资源交互数据、运行结果数据进行特征提取,得到资源交互特征、运行结果特征。
资源交互数据可以包括不同类型的资源交互数据,例如文字、视频等,资源交互数据对应的运行结果数据也相应改变。对资源交互数据、运行结果数据进行特征提取,可以包括用户使用组件的次数、组件的特征等,可以得到资源交互特征、运行结果特征,资源交互信息可以包括用户使用组件的次数、频率等,运行结果特征可以指该类资源交互信息最终的特征。
S206:基于不同特征对应的权重系数,对所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征。
不同的特征对于最终异常数据的检测的影响不同,因此根据特征对异常数据的检测影响程度制定相对应的权重系数。平台中可以由多个资源交互数据构成,每个资源交互特征可以是构建平台的局部特征,而后对各个局部特征进行特征融合,以获得构建平台对应的融合特征,即全局特征。
S208:将所述融合特征输入至预训练的分类向量机,得到所述运行结果数据中的异常数据。
将所述融合特征输入分类向量机,以确定运行结果数据中的异常数据,通过对资源交互数据、所述资源交互数据对应的运行结果数据进行特征分析,提高提取特征的准确性,进而提高异常数据检测的准确率。
上述一种异常数据的检测方法中,可以对资源交互数据、运行结果数据进行特征提取,得到资源交互特征、运行结果特征,基于不同特征对应的权重系数,对资源交互特征、对应的运行结果特征进行特征融合,得到融合特征,将融合特征输入分类向量机,以确定运行结果数据中的异常数据,提高异常数据检测的效率。
在本公开的一些实施例中,所述分类向量机的生成方式包括:
将训练样本输入至分类向量机,当分类向量机输出的结果与训练样本的误差小于误差阈值时,确定模型输出的分类超平面和分类决策函数,得到训练后的分类向量机。
向量机是一种用来解决二分类问题的机器学习算法,可以通过在样本空间中找到一个划分超平面,将不同类别的样本分开,同时使得两个点集到此平面的最小距离最大,两个点集中的边缘点到此平面的距离最大,对样本进行分类。将训练样本输入至分类向量机,当分类向量机输出的结果与训练样本的误差小于误差阈值时,即在分类过程中,向量机可能出现分类错误的情况,可以设置误差阈值,当误差小于误差阈值时,确定模型输出的分类超平面和分类决策函数,分类超平面的个数可以表示样本的种类数,分类决策函数可以确定分类超平面的形状。
在本公开的一些实施例中,所述训练样本采用下述方式得到:
获取不同类型的资源交互数据,所述资源交互数据对应的运行结果数据;
对所述资源交互数据、运行结果数据进行特征提取,得到不同类型的资源交互特征、运行结果特征;
对同一类型的所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
将融合特征进行拼接,得到拼接特征,用于作为训练分类向量机的训练样本。
平台中可以包括不同类型的资源交互数据,不同类型的资源交互数据对应不同的运行结果数据,可以先对同一类型的资源交互数据、对应的运行结果数据进行特征提取,将同一类型的资源交互特征、对应的运行结果特征进行特征融合,得到融合特征,可以通过融合特征同时结合资源交互特征、对应的运行结果特征检测异常数据。也可以将不同类型的融合特征进行特征拼接,结合多种类型的资源交互特征、对应的运行结果特征统一进行判断,提高异常数据检测的效率。
在本公开的一些实施例中,所述将所述融合特征输入至预训练的分类向量机之后,所述方法包括:
获取所述分类向量机输出的分类超平面和分类决策函数;
将在分类超平面距离阈值内的融合特征输入分类决策函数,在输出结果符合所述分类决策函数时,根据所述分类超平面确定异常数据的种类。
分类向量机可以检测出平台中的异常数据,在得出异常数据后,可以将异常数据输入分类向量机,最终可以得出异常数据的类型。
在本公开的一些实施例中,图3为一个实施例中异常数据的检测方法的流程示意图,所述方法还包括:
S302:将原有异常数据、分类向量机输出的新的异常数据作为优化分类向量机的数据,重新确定分类向量机的分类超平面和分类决策函数。
根据融合特征输入至预训练的分类向量机,得到运行结果数据中的异常数据,可以将原有异常数据、分类向量机输出的新的异常数据作为优化分类向量机的数据,重新输入分类向量机,对分类超平面和分类决策函数进行优化,得到优化后的分类向量机。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本公开实施例还提供了一种用于实现上述所涉及的针对异常数据的检测方法的异常数据的检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的异常数据的检测装置实施例中的具体限定可以参见上文中对于异常数据的检测方法的限定,在此不再赘述。
所述装置可以包括使用了本说明书实施例所述方法的系统(包括分布式系统)、软件(应用)、模块、组件、服务器、客户端等并结合必要的实施硬件的装置。基于同一创新构思,本公开实施例提供的一个或多个实施例中的装置如下面的实施例所述。由于装置解决问题的实现方案与方法相似,因此本说明书实施例具体的装置的实施可以参见前述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
在一个实施例中,如图4所示,提供了一种异常数据的检测装置400,所述装置可以为前述服务器,或者集成于所述服务器的模块、组件、器件、单元等。
该装置400可以包括:
获取模块402,用于获取资源交互数据、所述资源交互数据对应的运行结果数据,其中,所述运行结果数据中包括异常数据、正确数据;
提取模块404,用于对所述资源交互数据、运行结果数据进行特征提取,得到资源交互特征、运行结果特征;
融合模块406,用于基于不同特征对应的权重系数,对所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
检测模块408,用于将所述融合特征输入至预训练的分类向量机,得到所述运行结果数据中的异常数据。
在一个实施例中,所述分类向量机的生成方式包括:
将训练样本输入至分类向量机,当分类向量机输出的结果与训练样本的误差小于误差阈值时,确定模型输出的分类超平面和分类决策函数,得到训练后的分类向量机。
在一个实施例中,所述训练样本采用下述方式得到:
获取不同类型的资源交互数据,所述资源交互数据对应的运行结果数据;
对所述资源交互数据、运行结果数据进行特征提取,得到不同类型的资源交互特征、运行结果特征;
对同一类型的所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
将融合特征进行拼接,得到拼接特征,用于作为训练分类向量机的训练样本。
在一个实施例中,所述将所述融合特征输入至预训练的分类向量机之后,所述装置包括:
获取所述分类向量机输出的分类超平面和分类决策函数;
将在分类超平面距离阈值内的融合特征输入分类决策函数,在输出结果符合所述分类决策函数时,根据所述分类超平面确定异常数据的种类。
在一个实施例中,图5为一个实施例中异常数据的检测装置的结构框图,所述装置还包括:
优化模块502:将原有异常数据、分类向量机输出的新的异常数据作为优化分类向量机的数据,重新确定分类向量机的分类超平面和分类决策函数。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
上述针对异常数据的检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的用户行为提供环境。该计算机设备的数据库用于存储异常数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常数据的检测方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的用户行为提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现异常数据的检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6、图7中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本公开任一实施例所述的方法。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开任一实施例所述的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本公开所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本公开所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本公开的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本公开专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本公开构思的前提下,还可以做出若干变形和改进,这些都属于本公开的保护范围。因此,本公开的保护范围应以所附权利要求为准。

Claims (13)

1.一种异常数据的检测方法,其特征在于,所述方法包括:
获取资源交互数据、所述资源交互数据对应的运行结果数据,其中,所述运行结果数据中包括异常数据、正确数据;
对所述资源交互数据、运行结果数据进行特征提取,得到资源交互特征、运行结果特征;
基于不同特征对应的权重系数,对所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
将所述融合特征输入至预训练的分类向量机,得到所述运行结果数据中的异常数据。
2.根据权利要求1所述的方法,其特征在于,所述分类向量机的生成方式包括:
将训练样本输入至分类向量机,当分类向量机输出的结果与训练样本的误差小于误差阈值时,确定模型输出的分类超平面和分类决策函数,得到训练后的分类向量机。
3.根据权利要求2所述的方法,其特征在于,所述训练样本采用下述方式得到:
获取不同类型的资源交互数据,所述资源交互数据对应的运行结果数据;
对所述资源交互数据、运行结果数据进行特征提取,得到不同类型的资源交互特征、运行结果特征;
对同一类型的所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
将融合特征进行拼接,得到拼接特征,用于作为训练分类向量机的训练样本。
4.根据权利要求1所述的方法,其特征在于,所述将所述融合特征输入至预训练的分类向量机之后,所述方法包括:
获取所述分类向量机输出的分类超平面和分类决策函数;
将在分类超平面距离阈值内的融合特征输入分类决策函数,在输出结果符合所述分类决策函数时,根据所述分类超平面确定异常数据的种类。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将原有异常数据、分类向量机输出的新的异常数据作为优化分类向量机的数据,重新确定分类向量机的分类超平面和分类决策函数。
6.一种异常数据的检测装置,其特征在于,所述装置包括:
获取模块,用于获取资源交互数据、所述资源交互数据对应的运行结果数据,其中,所述运行结果数据中包括异常数据、正确数据;
提取模块,用于对所述资源交互数据、运行结果数据进行特征提取,得到资源交互特征、运行结果特征;
融合模块,用于基于不同特征对应的权重系数,对所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
检测模块,用于将所述融合特征输入至预训练的分类向量机,得到所述运行结果数据中的异常数据。
7.根据权利要求6所述的装置,其特征在于,所述分类向量机的生成方式包括:
将训练样本输入至分类向量机,当分类向量机输出的结果与训练样本的误差小于误差阈值时,确定模型输出的分类超平面和分类决策函数,得到训练后的分类向量机。
8.根据权利要求7所述的装置,其特征在于,所述训练样本采用下述方式得到:
获取不同类型的资源交互数据,所述资源交互数据对应的运行结果数据;
对所述资源交互数据、运行结果数据进行特征提取,得到不同类型的资源交互特征、运行结果特征;
对同一类型的所述资源交互特征、对应的运行结果特征进行特征融合,得到融合特征;
将融合特征进行拼接,得到拼接特征,用于作为训练分类向量机的训练样本。
9.根据权利要求6所述的装置,其特征在于,所述将所述融合特征输入至预训练的分类向量机之后,所述装置包括:
获取所述分类向量机输出的分类超平面和分类决策函数;
将在分类超平面距离阈值内的融合特征输入分类决策函数,在输出结果符合所述分类决策函数时,根据所述分类超平面确定异常数据的种类。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
将原有异常数据、分类向量机输出的新的异常数据作为优化分类向量机的数据,重新确定分类向量机的分类超平面和分类决策函数。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
13.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN202311248655.6A 2023-09-26 2023-09-26 一种异常数据的检测方法、装置、计算机设备 Pending CN117435910A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311248655.6A CN117435910A (zh) 2023-09-26 2023-09-26 一种异常数据的检测方法、装置、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311248655.6A CN117435910A (zh) 2023-09-26 2023-09-26 一种异常数据的检测方法、装置、计算机设备

Publications (1)

Publication Number Publication Date
CN117435910A true CN117435910A (zh) 2024-01-23

Family

ID=89547048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311248655.6A Pending CN117435910A (zh) 2023-09-26 2023-09-26 一种异常数据的检测方法、装置、计算机设备

Country Status (1)

Country Link
CN (1) CN117435910A (zh)

Similar Documents

Publication Publication Date Title
CN114861172B (zh) 一种基于政务服务系统的数据处理方法及系统
CN114549849A (zh) 图像识别方法、装置、计算机设备和存储介质
CN108875901B (zh) 神经网络训练方法以及通用物体检测方法、装置和系统
CN114692889A (zh) 用于机器学习算法的元特征训练模型
CN117540915A (zh) 基于大数据技术的选型方案生成方法、装置、设备和介质
WO2021236423A1 (en) Identifying claim complexity by integrating supervised and unsupervised learning
CN117631682A (zh) 电网无人机巡检路线确定方法和系统
CN116932935A (zh) 地址匹配方法、装置、设备、介质和程序产品
CN116894721A (zh) 一种指标预测方法、装置、计算机设备
CN111049988A (zh) 移动设备的亲密度预测方法、系统、设备及存储介质
CN113010687B (zh) 一种习题标签预测方法、装置、存储介质以及计算机设备
CN117435910A (zh) 一种异常数据的检测方法、装置、计算机设备
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
CN114510592B (zh) 图像分类方法、装置、电子设备及存储介质
CN115965856B (zh) 图像检测模型构建方法、装置、计算机设备及存储介质
CN116881122A (zh) 测试案例生成方法、装置、设备、存储介质和程序产品
CN116881543A (zh) 金融资源对象推荐方法、装置、设备、存储介质和产品
CN117436484A (zh) 图像识别模型构建、装置、计算机设备和存储介质
CN113010442A (zh) 基于深度置信网络的用户界面测试结果分类方法及装置
CN117194976A (zh) 基于半监督学习的触达链构建方法、装置、电子设备及存储介质
CN118171953A (zh) 目标企业筛选方法、装置、计算机设备和存储介质
CN117975473A (zh) 票据文本检测模型训练及检测方法、装置、设备和介质
CN117954016A (zh) 电池材料确定方法、装置、计算机设备和存储介质
CN116881116A (zh) 接口测试方法、装置、计算机设备、存储介质和程序产品
CN118295664A (zh) 代码生成方法、装置、计算机设备、存储介质和产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination