CN111414370A - 一种特征库更新方法和系统 - Google Patents

一种特征库更新方法和系统 Download PDF

Info

Publication number
CN111414370A
CN111414370A CN201910010492.5A CN201910010492A CN111414370A CN 111414370 A CN111414370 A CN 111414370A CN 201910010492 A CN201910010492 A CN 201910010492A CN 111414370 A CN111414370 A CN 111414370A
Authority
CN
China
Prior art keywords
feature
abnormal
group
updating
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910010492.5A
Other languages
English (en)
Inventor
支亚君
郭安
王业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhirong Network Technology Co ltd
Original Assignee
Beijing Zhirong Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhirong Network Technology Co ltd filed Critical Beijing Zhirong Network Technology Co ltd
Priority to CN201910010492.5A priority Critical patent/CN111414370A/zh
Publication of CN111414370A publication Critical patent/CN111414370A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种特征库更新方法和系统,方法包括:对特征库中的特征进行分组,形成多个特征组;对特征组进行拆分,并将每个特征组中的算子做成独立的部分;当出现特征库的样本异常时,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。本发明将特征组的计算进行了拆分,仅针对异常特征组进行重新计算,从而实现仅仅对有异常的特征进行更新的需求。本发明将特征组的计算进行了拆分,仅针对异常特征组进行重新计算,从而实现仅仅对有异常的特征进行更新的需求。

Description

一种特征库更新方法和系统
技术领域
本发明属于计算机数据处理系统,涉及一种特征库更新方法和系统。
背景技术
计算机数据系统中,需要用到特征库。
当出现特征库部分样本的特征异常时,传统的修复方式为重新计算异常样本的所有特征并更新。一方面影响更新的效率、另一方面很容易将非异常部分的特征覆盖。
发明内容
本发明所要解决的技术问题是提供一种特征库更新方法和系统。
本发明解决上述技术问题所采取的技术方案如下:
一种特征库更新方法,包括:
对特征库中的特征进行分组,形成多个特征组;
对特征组进行拆分,并将每个特征组中的算子做成独立的部分;
当出现特征库的样本异常时,
根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。
优选的是,将每个特征组中的算子做成独立的部分,包括:
根据用户基础信息特征组算子,行为特征组算子形成不同的算子。
优选的是,各个算子之间相互独立。
优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,具体包括:
根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。
优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算后,还包括:
根据计算后的特征组更新特征库,由此实现特征库的精细化更新。
一种特征库更新系统,包括:
对特征库中的特征进行分组,形成多个特征组;
对特征组进行拆分,并将每个特征组中的算子做成独立的部分;
当出现特征库的样本异常时,
根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。
优选的是,将每个特征组中的算子做成独立的部分,包括:
根据用户基础信息特征组算子,行为特征组算子形成不同的算子。
优选的是,各个算子之间相互独立。
优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,具体包括:
根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。
优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算后,还包括:
根据计算后的特征组更新特征库,由此实现特征库的精细化更新。
本发明将特征组的计算进行了拆分,仅针对异常特征组进行重新计算,从而实现仅仅对有异常的特征进行更新的需求。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
下面结合附图对本发明进行详细的描述,以使得本发明的上述优点更加明确。其中,
图1是本发明特征库更新方法的实施例的示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一:
如图1所示,本发明设计了一种特征库更新方法,包括:
对特征库中的特征进行分组,形成多个特征组;
对特征组进行拆分,并将每个特征组中的算子做成独立的部分;
当出现特征库的样本异常时,
根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。
优选的是,将每个特征组中的算子做成独立的部分,包括:
根据用户基础信息特征组算子,行为特征组算子形成不同的算子。
优选的是,各个算子之间相互独立。
优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,具体包括:
根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。
优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算后,还包括:
根据计算后的特征组更新特征库,由此实现特征库的精细化更新。
本发明将特征组的计算进行了拆分,仅针对异常特征组进行重新计算,从而实现仅仅对有异常的特征进行更新的需求。
实施例二:
进一步结合实施例进行说明,具体来说,本发明首先将特征组的计算进行了拆分,仅针对异常特征组进行重新计算;其次通过指定特征的更新列表,从而实现仅仅对有异常的特征进行更新的需求。
具体包括:
1、特征组算子拆分。将每个特征组的算子做成独立的部分,例如:用户基础信息特征组算子,行为特征组算子等等。各个算子之间项目独立。
2、对异常特征组重新计算。当出现样本库异常时,根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。然后将提取出的异常特征组进行重新计算。
3、更新特征库。使用步骤2中计算出的特征组结果来更新样本库,此时注意只更新异常的特征,防止为未发生异常的特征被修改,产生异常。
本发明具有以下的有益效果:
1、通过特征组算子的拆分,降低了修复特征异常时的计算成本。
2、通过近更新异常特征,保证了非异常特征的正确性。
实施例三:
与上述方法实施例相对应,本发明还提供了一种特征库更新系统,包括:
对特征库中的特征进行分组,形成多个特征组;
对特征组进行拆分,并将每个特征组中的算子做成独立的部分;
当出现特征库的样本异常时,
根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。
优选的是,将每个特征组中的算子做成独立的部分,包括:
根据用户基础信息特征组算子,行为特征组算子形成不同的算子。
优选的是,各个算子之间相互独立。
优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,具体包括:
根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。
优选的是,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算后,还包括:
根据计算后的特征组更新特征库,由此实现特征库的精细化更新。
本发明将特征组的计算进行了拆分,仅针对异常特征组进行重新计算,从而实现仅仅对有异常的特征进行更新的需求。
需要说明的是,对于上述方法实施例而言,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。
而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种特征库更新方法,其特征在于,包括:
对特征库中的特征进行分组,形成多个特征组;
对特征组进行拆分,并将每个特征组中的算子做成独立的部分;
当出现特征库的样本异常时,
根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。
2.根据权利要求1所述的特征库更新方法,其特征在于,将每个特征组中的算子做成独立的部分,包括:
根据用户基础信息特征组算子,行为特征组算子形成不同的算子。
3.根据权利要求1或2所述的特征库更新方法,其特征在于,各个算子之间相互独立。
4.根据权利要求1或2所述的特征库更新方法,其特征在于,根据异常特征,提取汇总涉及到的特征组算子列表,具体包括:
根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。
5.根据权利要求1或2所述的特征库更新方法,其特征在于,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算后,还包括:
根据计算后的特征组更新特征库,由此实现特征库的精细化更新。
6.一种特征库更新系统,其特征在于,包括:
对特征库中的特征进行分组,形成多个特征组;
对特征组进行拆分,并将每个特征组中的算子做成独立的部分;
当出现特征库的样本异常时,
根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算。
7.根据权利要求6所述的特征库更新系统,其特征在于,将每个特征组中的算子做成独立的部分,包括:
根据用户基础信息特征组算子,行为特征组算子形成不同的算子。
8.根据权利要求6或7所述的特征库更新系统,其特征在于,各个算子之间相互独立。
9.根据权利要求6或7所述的特征库更新系统,其特征在于,根据异常特征,提取汇总涉及到的特征组算子列表,具体包括:
根据异常特征,提取汇总涉及到的特征组算子列表,未发生异常的特征组不作考虑。
10.根据权利要求6或7所述的特征库更新系统,其特征在于,根据异常特征,提取汇总涉及到的特征组算子列表,然后将提取出的异常特征组进行重新计算后,还包括:
根据计算后的特征组更新特征库,由此实现特征库的精细化更新。
CN201910010492.5A 2019-01-07 2019-01-07 一种特征库更新方法和系统 Pending CN111414370A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910010492.5A CN111414370A (zh) 2019-01-07 2019-01-07 一种特征库更新方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910010492.5A CN111414370A (zh) 2019-01-07 2019-01-07 一种特征库更新方法和系统

Publications (1)

Publication Number Publication Date
CN111414370A true CN111414370A (zh) 2020-07-14

Family

ID=71490721

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910010492.5A Pending CN111414370A (zh) 2019-01-07 2019-01-07 一种特征库更新方法和系统

Country Status (1)

Country Link
CN (1) CN111414370A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1784676A (zh) * 2004-02-25 2006-06-07 微软公司 数据库数据恢复系统和方法
CN101582905A (zh) * 2008-04-22 2009-11-18 阿尔卡特朗讯公司 基于分组的网络的攻击保护
CN104363106A (zh) * 2014-10-09 2015-02-18 国网辽宁省电力有限公司信息通信分公司 一种基于大数据技术的电力信息通信故障预警分析方法
CN105025017A (zh) * 2015-07-03 2015-11-04 汉柏科技有限公司 基于防火墙的防挂马的方法及防火墙
CN106529515A (zh) * 2016-12-26 2017-03-22 浙江宇视科技有限公司 面部特征库管理方法及系统
CN108415776A (zh) * 2018-03-06 2018-08-17 华中科技大学 一种分布式数据处理系统中的内存预估与配置优化的方法
CN108491799A (zh) * 2018-03-23 2018-09-04 海深科技(宁波)有限公司 一种基于图像识别的智能售货柜商品管理方法及系统
CN109033323A (zh) * 2018-07-18 2018-12-18 中国人民解放军91776部队 一种基于算子的树形结构基础数据变更记录方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1784676A (zh) * 2004-02-25 2006-06-07 微软公司 数据库数据恢复系统和方法
CN101582905A (zh) * 2008-04-22 2009-11-18 阿尔卡特朗讯公司 基于分组的网络的攻击保护
CN104363106A (zh) * 2014-10-09 2015-02-18 国网辽宁省电力有限公司信息通信分公司 一种基于大数据技术的电力信息通信故障预警分析方法
CN105025017A (zh) * 2015-07-03 2015-11-04 汉柏科技有限公司 基于防火墙的防挂马的方法及防火墙
CN106529515A (zh) * 2016-12-26 2017-03-22 浙江宇视科技有限公司 面部特征库管理方法及系统
CN108415776A (zh) * 2018-03-06 2018-08-17 华中科技大学 一种分布式数据处理系统中的内存预估与配置优化的方法
CN108491799A (zh) * 2018-03-23 2018-09-04 海深科技(宁波)有限公司 一种基于图像识别的智能售货柜商品管理方法及系统
CN109033323A (zh) * 2018-07-18 2018-12-18 中国人民解放军91776部队 一种基于算子的树形结构基础数据变更记录方法

Similar Documents

Publication Publication Date Title
CN104881611B (zh) 保护软件产品中的敏感数据的方法和装置
US9619492B2 (en) Data migration
US10235234B2 (en) Method and apparatus for determining failure similarity in computing device
US10387501B2 (en) Grouping records in buckets distributed across nodes of a distributed database system to perform comparison of the grouped records
US9916286B2 (en) Reformatting multiple paragraphs of text using the formatting of a sample object by creating multiple candidate combinations and selecting a closest match
CN111258966A (zh) 一种数据去重方法、装置、设备及存储介质
US11481440B2 (en) System and method for processing metadata to determine an object sequence
CN110825363B (zh) 智能合约获取方法、装置、电子设备及存储介质
CN110427364A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN111726249B (zh) 网络设备的配置文件处理方法及装置
US11150993B2 (en) Method, apparatus and computer program product for improving inline pattern detection
US10620950B2 (en) Message parsing in a distributed stream processing system
CN104991836A (zh) 恢复数据库的方法、装置及数据库服务器
US20160246825A1 (en) Columnar database processing method and apparatus
CN100346308C (zh) 一种基于数据库操作的自动化测试方法
CN111414370A (zh) 一种特征库更新方法和系统
JP2007086951A (ja) ファイル分割処理方法及びファイル分割プログラム
CN111880803B (zh) 一种应用于多平台的软件构建方法及装置
US9678821B2 (en) Operating a trace procedure for a computer program
US9256626B2 (en) Maintaining multiple copy versions of component values in a system
CN103138926B (zh) 水印签名方法与装置
CN107085571B (zh) 一种校验规则的执行方法和装置
US11100060B2 (en) Method, device and computer program product for data migration
KR20150077669A (ko) 맵리듀스 방식을 이용한 데이터 분석 방법 및 시스템
CN111522832B (zh) 一种大数据实时更新方法、系统、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination