CN113052324A - 一种用户异常模式识别方法、装置以及设备 - Google Patents
一种用户异常模式识别方法、装置以及设备 Download PDFInfo
- Publication number
- CN113052324A CN113052324A CN202110316092.4A CN202110316092A CN113052324A CN 113052324 A CN113052324 A CN 113052324A CN 202110316092 A CN202110316092 A CN 202110316092A CN 113052324 A CN113052324 A CN 113052324A
- Authority
- CN
- China
- Prior art keywords
- sample set
- user
- meta
- learning
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 73
- 238000012567 pattern recognition method Methods 0.000 title claims abstract description 8
- 238000012549 training Methods 0.000 claims abstract description 72
- 230000009466 transformation Effects 0.000 claims abstract description 54
- 238000003909 pattern recognition Methods 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims description 48
- 230000006399 behavior Effects 0.000 claims description 46
- 238000012937 correction Methods 0.000 claims description 32
- 238000004364 calculation method Methods 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 20
- 238000002360 preparation method Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 14
- 238000003860 storage Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 11
- 230000006872 improvement Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 208000001613 Gambling Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Finance (AREA)
- Biophysics (AREA)
- Accounting & Taxation (AREA)
- Medical Informatics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本说明书实施例公开了一种用户异常模式识别方法、装置以及设备。方案包括:确定包含指定的特征转换结构的识别模型;获取第一样本集,并根据第一样本集,对特征转换结构进行训练,得到特征转换结构包含的多维参数;获取第二样本集,第二样本集包括曾处于用户异常模式的用户的相关数据;对多维参数中维度取值之间的比例关系进行锁定,并为多维参数确定整体的放缩系数和偏置系数;根据第二样本集,对识别模型进行元学习,以调整放缩系数和偏置系数;通过元学习后的识别模型,判定待识别用户是否处于用户异常模式。
Description
技术领域
本说明书涉及机器学习技术领域,尤其涉及一种用户异常模式识别方法、装置以及设备。
背景技术
互联网应用的普及给用户的生活和工作带来的极大的便利,但是,也有一些非法用户通过在互联网应用中进行不正当的动作,谋取非法的利益,会给其他用户和整个社会带来损失。
基于此,互联网企业会采用相应的方案防御风险,识别用户是否处于异常模式,比如,判定其是否在冒用合法用户身份、是否是刷单、是否在机器识别验证码、是否在非法尝试登录、是否在线上诈骗、是否在非法所得合法化、是否在赌博等,普遍采用的方案是深度神经网络模型训练后识别,需要较充分的训练量,对于其中某些异常模式,比如非法所得合法化等,在实际应用中模式复杂,能够采集到的样本较少。
基于此,对于诸如非法所得合法化等一些用户异常模式,需要更为高效准确的识别方案。
发明内容
本说明书一个或多个实施例提供用户异常模式识别方法、装置、设备以及存储介质,用以解决如下技术问题:对于诸如非法所得合法化等一些用户异常模式,需要更为高效准确的识别方案。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
本说明书一个或多个实施例提供的一种用户异常模式识别方法,包括:
确定包含指定的特征转换结构的识别模型;
获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数;
获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据;
对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数;
根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数;
通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
本说明书一个或多个实施例提供的一种用户异常模式识别装置,包括:
模型确定模块,确定包含指定的特征转换结构的识别模型;
第一训练模块,获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数;
样本准备模块,获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据;
参数缩减模块,对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数;
第二训练模块,根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数;
异常识别模块,通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
本说明书一个或多个实施例提供的一种用户异常模式识别设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
确定包含指定的特征转换结构的识别模型;
获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数;
获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据;
对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数;
根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数;
通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
确定包含指定的特征转换结构的识别模型;
获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数;
获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据;
对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数;
根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数;
通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果:通过对部分参数维度取值之间的比例关系锁定,只对其训练整体的放缩系数和偏置系数,减少了实际需要训练的参数的数量,提高了训练效率,而且对于诸如非法所得合法化等一些样本较少、所涉及的用户具体行为模式复杂的用户异常模式,通过元学习有助于减少建模数量,避免学习时过拟合,能够更有效地实现少样本学习,进而提高识别准确率。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例提供的一种用户异常模式识别方法的流程示意图;
图2为本说明书一个或多个实施例提供的一种用户异常模式识别系统的架构示意图;
图3为本说明书一个或多个实施例提供的一种应用场景下,图1中方法的一种详细流程示意图;
图4为本说明书一个或多个实施例提供的一种用户异常模式识别装置的结构示意图;
图5为本说明书一个或多个实施例提供的一种用户异常模式识别设备的结构示意图。
具体实施方式
本说明书实施例提供用户异常模式识别方法、装置、设备以及存储介质。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
在本说明书一个或多个实施例中,通过元学习进行多阶梯度计算,以更新参数,在样本较少时,模型的参数空间可能远大于样本的数据空间,从而容易导致过拟合,为了提高训练效率,避免陷入过拟合,会基于一阶梯度计算对模型进行预训练,根据预训练结果缩减需训练的参数数量,再基于多阶梯度对缩减后的参数进行训练;不仅如此,还可以利用无标签样本,通自训练扩充有标签样本数量,用于更充分地进行预训练或者后续训练;另外,在计算损失时,根据用于识别的用户特征中的局部特征,不依赖于模型进行快速匹配,根据匹配结果校正损失,帮助模型更快地收敛,从而提高训练效率。
本说明书提供的方案适用于诸如非法所得合法化等一些样本较少、所涉及的用户具体行为模式复杂的用户异常模式,在这些应用场景下,尤其能够体现出相比于现有技术,该方案的优势所在。当然,对于识别其他一些用户异常模式,同样也是适用的。下面一些实施例主要以识别非法所得合法化的应用场景为例进行说明。
下面基于这样的思路,具体进行说明。
图1为本说明书一个或多个实施例提供的一种用户异常模式识别方法的流程示意图。执行主体比如包括业务方的风控服务器、政府的监管设备等,涉及的业务领域可以是多样的,比如,电子支付领域、电商领域、即时通讯领域、电子游戏领域、新闻门户网站领域等,具体的业务领域并不影响方案的实施。对于非法所得合法化而言,往往属于具有用户间交易的领域,比如,电子支付领域和电商领域等。
图1中的流程可以包括以下步骤:
S102:确定包含指定的特征转换结构的识别模型。
在本说明书一个或多个实施例中,特征转换结构用于进行特征分解、特征映射、特征融合等处理动作,通过特征转换结构能够将输入特征进行非线性变换和维数变换。以深度神经网络模型为例,其特征转换结构包括隐藏层,该隐藏层本身又包含了多层高维结构。再以因子分解机模型为例,其特征转换结构包括因子分解机层,用于将输入的粗粒度的特征分解为更细粒度的特征。
识别模型还可以包含更多的结构,比如,用于归一化概率的结构、池化结构等、对特征转换结构的整合结构等,这些结构除了完成自己的主要工作以外,也可能一定程度地实现特征转换。
S104:获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数。
在本说明书一个或多个实施例中,对识别模型的至少部分特征转换结构先行训练。
第一样本集未必是与识别模型匹配的样本。比如,若识别模型用于识别非法所得合法化,则可以认为根据历史数据得到的非法所得合法化用户样本是与识别模型匹配的样本,相对而言,盗密码用户样本、刷单用户样本则为与识别模型不太匹配的样本。
在这种情况下,即使非法所得合法化用户样本比较少,仍然有可能获得包含足够数量样本的第一样本集,用于充分地训练特征转换结构。当然,若样本不够匹配,则此时得到的识别模型的效果仍然难以达到预期,但是,相比于初始的识别模型,已经具有第一样本集所带来的一些识别能力了,而这些识别能力与对非法所得合法化所需的识别能力是有部分共通性的,这种共通性能够支持识别模型进行一些泛化的识别。
基于第一样本集进行的训练除了使识别模型具有一些识别能力以外,还是为了接下来缩减参数做准备,有助于降低缩减参数给后续训练引入的误差。
若采用与识别模型匹配的样本(尤其是能采集到较多数量样本的情况下) 进行该步骤的训练,则有助于提高训练结果的准确性。
在本说明书一个或多个实施例中,多维参数比如是隐藏层的节点与节点之前的矩阵权重参数等,特征转换结构通常包含多个多维参数,每个多维参数中的每个维度也是一个参数,则原本需训练的参数的总数量很大,在训练过程中,这些参数会适应于对第一样本集的预测需求而更新变化,这些维度的维度取值会变化,不同维度的维度取值之间的比例也会发生变化。
在本说明书一个或多个实施例中,对所述特征转换结构进行训练时可采用的机器学习算法是多样的,这里不做具体限定,可以选择执行效率相对高的算法,避免进行多阶梯度计算。
S106:获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据。
在本说明书一个或多个实施例中,第二样本集是与识别模型匹配的样本。对于诸如非法所得合法化等一些样本较少、所涉及的用户具体行为模式复杂的用户异常模式,第二样本集的样本数量少于甚至远少于(比如,差距是数量级的)第一样本集的数量。
需要说明的是,在实际应用中,第一样本集与第二样本集也可以是有重叠甚至相同的样本集,这仍然能够实现本申请的思路的一些有益效果,还能够复用样本,提高这些样本参与训练的充分性。基于此,假定第一样本集中包含至少部分与识别模型匹配的样本,则比如从这至少部分匹配的样本中,获取样本数量远少于第一样本集的第二样本集。
S108:对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数。
在本说明书一个或多个实施例中,通过将维度取值之间的比例关系进行锁定,将多个参数(比如,假定单个多维参数有64维,则这多个参数相应为64 个参数)实际绑定成了一个整体的参数,为该整体的参数设置放缩系数和偏置系数(一般分别设置一个即可,更复杂地也可能设置多个,但可以使该多个远小于多维参数的维数),从而,在后续训练中,原本需要训练这多个参数,转变成为只需要训练该放缩系数和偏置系数,有效地降低了训练量。
放缩系数比如是乘法系数或者幂系数等。一种示例性的形式为a*W+b,其中,W表示多维参数,具体为向量或者矩阵,a表示放缩系数,用于对W中的每维进行相同的尺度的放缩,b表示偏置系数,用于为W中的每维叠加相同的偏置量。
在本说明书一个或多个实施例中,对上述比例关系锁定是根据预定条件有选择进行的,而未必要分别对每个多维参数中的全部维度取值之间的比例关系进行锁定。
例如,在第一样本集训练期间(比如,后期),若某些维度取值的变化仍然比较大,超过了设定阈值,则表示这些维度可能对样本的变化很敏感,往往包含了对于识别比较关键的隐形特征,则考虑在后续元学习也对这些维度进行更充分精确的训练,因此,可以不锁定这些维度取值之间的比例关系。
S110:根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数。
在本说明书一个或多个实施例中,利用第一样本集对识别模型的部分结构进行了训练(为了提高效率,该训练中未采用元学习),而利用第二样本集对识别模型整体进行元学习的完整训练。
在本说明书一个或多个实施例中,考虑到非法所得合法化等场景下样本较少,为了获得较好的识别效果以及泛化能力(通过进一步的较小训练量,能够快速转换为其他的识别用途,比如,从识别非法所得合法化转换为识别线上赌博用户,或者从泛泛地识别非法所得合法化,转换为识别诸如假拍卖非法所得合法化等某种特定模式的非法所得合法化等),可以采用少样本元学习,对识别模型进行训练。在目前的元学习中,会训练模型全部的参数,而本方案中可以只训练放缩系数和偏置系数,降低了训练量。
S112:通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
在本说明书一个或多个实施例中,待识别用户往往通过交易,实现非法所得合法化等非法目的,则若判定出待识别用户处于用户异常模式,则输入模型中涉及的用户交易对象等其他一些用户可能同样处于用户异常模式,可以提高这些用户的风险权重,利用识别模型或者其他手段,及时在这些用户中进行识别,以快速发掘于异常群体,这有助于提高打击群体作恶的效率。
通过图1的方法,通过对部分参数维度取值之间的比例关系锁定,只对其训练整体的放缩系数和偏置系数,减少了实际需要训练的参数的数量,提高了训练效率,而且对于诸如非法所得合法化等一些样本较少、所涉及的用户具体行为模式复杂的用户异常模式,通过元学习有助于减少建模数量,避免学习时过拟合,能够更有效地实现少样本学习,进而提高识别准确率。
基于图1的方法,本说明书还提供了该方法的一些具体实施方案和扩展方案,下面继续进行说明。
在本说明书一个或多个实施例中,采用模型无关元学习实现对识别模型的训练,直观地,参见图2,图2为本说明书一个或多个实施例提供的一种用户异常模式识别系统(可以视为上述的识别模型或者识别模型中的一部分)的架构示意图。
在图2的系统中,特征转换结构包含的因子分解机层和隐藏层,识别模型还可以包括嵌入层、用于整合因子分解机层和隐藏层的输出结果的连接层,采用基于交叉熵的损失函数。该系统的元学习过程包括内层工作和外层工作,内层是多个任务训练并计算所有任务损失总和,外层对任务损失总和关于模型参数求梯度,从而完成一次参数更新。在预训练特征转换结构时,具体可以根据第一样本集,通过对该因子分解机层和/或该隐藏层进行有监督训练,调整系统中的多维参数中的维度取值,以及维度取值之间的比例关系,之后再正式开始少样本元学习,从而有助于减少训练量,防止内层循环时出现过拟合的现象。
继续对图2进行说明,在普通的一些机器学习算法中,只需进行一阶梯度计算即可。而对于元学习,其目的是提高模型泛化能力,学习如何学习,从而帮助在少样本训练的情况下也能够取得较好的预测效果,为了达到这样的目的,会进行多阶梯度计算。具体地,在内层工作中,根据述第二样本集确定多个包含多个样本的任务,根任务训练识别模型,在该训练过程中通过进行一阶梯度计算并根据计算出的梯度更新相应参数,而且能够得到任务损失总和;之后,转到外层工作,根据任务损失总和进行二阶梯度计算(二阶段梯度计算的计算量较大,是元学习效率的重要影响因素,本方案中通过缩减参数,有效地减少了这部分计算量),更新放缩系数和偏置系数等参数,从而确定识别模型本次的元学习结果,以此类推,训练至识别模型达到预期。关于图2一些省略未说明的部分,比如,支持集数据和查询集数据等,可以参照已有的定义理解,这里不再赘述。
在本说明书一个或多个实施例中,在实际应用中,相比于利用充足样本进行学习,少样本学习的效果往往会打折扣,尤其是内层循环的过程不容易得到充分执行,为了抑制误差内层中少样本带来误差向外层发散放大,可以在内层循环中执行自训练以扩大样本量。
具体比如,获取由无标签样本构成的第三样本集,根据第三样本集和第二样本集中的有标签样本,对识别模型进行训练,根据该训练后的识别模型对第三样本集的识别结果,为无标签样本生成标签(该标签未必准确),根据第二样本集和包含该标签的第三样本集,确定多个包含多个样本的任务,进而,用于内层循环。
再比如,将多个用户视为一个用户(称为合并用户),将这些用户的特征进行合并,标签也进行合并(比如,按照服从多数的原则确定合并用户的标签),作为一个新样本,按照这种方式多次组合,能够得到更多的有标签样本。另外,若多个用户中存在至少一个异常用户,则合并后其他用户比较容易被污染,设置标签时也可以考虑将合并得到的用户直接设置为异常用户。
在本说明书一个或多个实施例中,在元学习过程中或者之后,可能还需要进行微调,比如,想要将元学习告一阶段的非法所得合法化识别模型,利用一些新增样本进一步训练,或者,想要将该非法所得合法化识别模型,利用一些不太匹配的样本进行少样本训练,以获取能够识别其他异常模式(比如,刷单等)的识别模型。在进行微调时,受限于样本较少或者不匹配的情况,识别模型可能难以快速收敛。当然,不仅是收敛难影响效率,前面提到的二阶梯度计算也影响效率,那么,除了缩减参数以外,为了进一步地提高元学习效率,比如还可以更多地介入损失计算工作,帮助快速收敛。
具体比如,获取任务损失总和后,可以获取根据用户异常模式对应的历史数据指定的校正特征,根据校正特征,在任务损失总和对应的样本中进行匹配 (可以是和任务整体进行匹配),若匹配成功,则生成相应的校正损失,并根据校正损失,缩小任务损失总和,根据缩小后的任务损失总和进行二阶梯度计算,从而有助于加速收敛。
这里的校正特征比如包括:已足以确信当前用户曾处于或者正处于异常模式的少量数据。而这少量数据未必所有的异常用户都符合或者具有,比如,对于单个样本,输入识别模型的数据很多,假定包含了对应用户的行为数据(包括交易数据、聊天数据等),假定预定义校正特征包括“聊天记录直接暴露异常”,某个样本的用户在其聊天记录中不慎直接谈到了自己的非法所得合法化行为(基于此,该用户有很大可能就是异常用户),则这部分聊天记录是属于校正特征的,校正特征与该样本匹配成功,因此,对于该样本,可以生成相应的校正损失(假定为正值),比如,在当前已经计算的损失基础上减去该校正损失,从而缩小任务损失总和。在实际应用中,校正损失和校正特征可以智能地自动定义,或者可以基于可靠的人工经验进行定义,后一种方式成本较小,准确性高而且便于快速实施和更新。
在本说明书一个或多个实施例中,前面多处提到了非法所得合法化这种示例性的用户异常模式,以非法所得合法化为例,曾处于用户异常模式的用户即表示已确认的曾非法所得合法化或者非法所得合法化未遂的用户,相关数据比如包括用户行为特征等,比如,设立公司、拍卖交易、转账行为、转账行为等,其中一些具体行为可能相对显性地能够与非法所得合法化挂上钩,比如设置空壳公司、不合理的拍卖交易等,当然,在实际应用中,用户的一些特征未必能够显性地与非法所得合法化挂上钩,这其中的隐性关系需要通过模型训练来挖掘。
在实际应用中,非法所得合法化是一种粗粒度的用户异常模式,还可以根据具体的行为模式(比如,通过假拍卖非法所得合法化、通过非法盗号非法所得合法化、通过空壳公司非法所得合法化、通过虚拟货币非法所得合法化等) 等因素进一步地细分,以提高识别的准确性。在细分的场景下,尤其可能遇到相应细分模式的样本少的问题,从而在这些场景下,更能体现上述的方案的价值。利用普通的机器学习方案,可能需要构建更多个识别模型,而基上述的方案,可以减少识别模型的数量,使得识别模型基于少量样本就能够高效获得对多种细分模式的识别能力。
根据上面的说明,本说明书一个或多个实施例提供的一种应用场景下,图 1中方法的一种详细流程,如图3所示。在该应用场景下,目的包括识别非法所得合法化,根据交易关系网络采集样本,不同的非法所得合法化行为模式有共性特征,也有自身的独立特征。在进行元学习时,先利用所有模式建模,学习到通用的先验知识,之后根据需要,在细分模式上可以快速微调识别模型就能达到很好的识别效果。
图3中的流程可以包括以下步骤:
S302:确定包含因子分解机层和隐藏层的识别模型。
S304:获取第一样本集,根据第一样本集,对该因子分解机层和隐藏层进行训练,得到阶段性训练过的多维参数,对多维参数中维度取值之间的比例关系进行锁定,并为多维参数确定整体的放缩系数和偏置系数。
S306:获取第二样本集及其对应的标签,标签指示了正常行为模式或者多种中至少一种非法所得合法化行为模式。
S308:获取由无标签样本构成的第三样本集,根据第三样本集和第二样本集中的有标签样本,对识别模型进行训练,根据该训练后的识别模型对第三样本集的识别结果,为无标签样本生成标签,根据第二样本集和包含标签的第三样本集,确定多个包含多个样本的任务。
S310:获取任务中包含的用户及行为对象的交易行为特征、画像特征、历史风险特征,判断用户及行为对象所属行业的相似性。
S312:根据标签、相似性,以及通过识别模型挖掘或预设的多种用户行为模式(包括上述的非法所得合法化行为模式),训练放缩系数和偏置系数,在该训练过程中通过进行一阶梯度计算,得到任务损失总和。
S314:获取根据用户异常模式对应的历史数据指定的校正特征,根据校正特征,在任务损失总和对应的样本中进行匹配,若匹配成功,则生成相应的校正损失,并根据校正损失,缩小任务损失总和。
S316:根据缩小后的任务损失总和进行二阶梯度计算,训练放缩系数和偏置系数。
S318:根据指定的用户非法所得合法化模式,对当前的识别模型进行微调。
基于同样的思路,本说明书一个或多个实施例还提供了上述方法对应的装置和设备,如图4、图5所示。
图4为本说明书一个或多个实施例提供的一种用户异常模式识别装置的结构示意图,虚线方框表示可选的模块,所述装置包括:
模型确定模块402,确定包含指定的特征转换结构的识别模型;
第一训练模块404,获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数;
样本准备模块406,获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据;
参数缩减模块408,对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数;
第二训练模块410,根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数;
异常识别模块412,通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
可选地,所述第二训练模块410,获取所述第二样本集对应的标签,所述标签指示了正常行为模式或者属于用户异常模式的非法所得合法化行为模式;
获取所述第二样本集包含的用户的特征,以及所述用户的行为对象的特征;
根据所述标签,以及所述用户的特征和所述行为对象的特征,对所述识别模型进行元学习。
可选地,所述第二训练模块410,获取所述用户及所述行为对象的交易行为特征、画像特征、历史风险特征;
根据所述获取的特征,判断所述用户及所述行为对象所属行业的相似性;
根据所述标签、所述相似性,以及通过所述识别模型挖掘或预设的多种用户行为模式,对所述识别模型进行元学习;
根据指定的所述用户行为模式,对所述对所述元学习过的识别模型进行少样本元学习。
可选地,所述第一训练模块404,确定所述特征转换结构包含的因子分解机层和隐藏层;
根据所述第一样本集,通过对所述因子分解机层和/或隐藏层进行有监督训练,调整所述多维参数中的维度取值,以及所述维度取值之间的比例关系。
可选地,所述样本准备模块406,根据所述第一样本集,获取样本数量远少于所述第一样本集的第二样本集。
可选地,所述第二训练模块410,包括任务构建子模块4102、元学习子模块4104;
所述任务构建子模块4102,根据所述第二样本集,确定多个包含多个样本的任务;
所述元学习子模块4104,根据所述任务训练所述识别模型,在该训练过程中通过进行一阶梯度计算,得到任务损失总和;
根据所述任务损失总和进行二阶梯度计算,确定所述识别模型的元学习结果。
可选地,所述任务构建子模块4102,获取由无标签样本构成的第三样本集;
根据所述第三样本集和所述第二样本集中的有标签样本,对所述识别模型进行训练,根据该训练后的识别模型对所述第三样本集的识别结果,为所述无标签样本生成标签;
根据所述第二样本集和包含所述标签的所述第三样本集,确定多个包含多个样本的任务。
可选地,所述元学习子模块4104包括损失校正子模块41042、梯度更新子模块41044;
所述损失校正子模块41042,获取根据所述用户异常模式对应的历史数据指定的校正特征;
根据所述校正特征,在所述任务损失总和对应的样本中进行匹配;
若匹配成功,则生成相应的校正损失,并根据所述校正损失,缩小所述任务损失总和;
所述梯度更新子模块41044,根据所述缩小后的任务损失总和进行二阶梯度计算。
图5为本说明书一个或多个实施例提供的一种用户异常模式识别设备的结构示意图,所述设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
确定包含指定的特征转换结构的识别模型;
获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数;
获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据;
对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数;
根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数;
通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
处理器与存储器之间可以通过总线通信,设备还可以包括与其他设备通信的输入/输出接口。
基于同样的思路,本说明书一个或多个实施例提供了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
确定包含指定的特征转换结构的识别模型;
获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数;
获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据;
对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数;
根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数;
通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray, FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、 Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL (Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL (RubyHardware Description Language)等,目前最普遍使用的是VHDL (Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (17)
1.一种用户异常模式识别方法,包括:
确定包含指定的特征转换结构的识别模型;
获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数;
获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据;
对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数;
根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数;
通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
2.如权利要求1所述的方法,所述根据所述第二样本集,对所述识别模型进行元学习,具体包括:
获取所述第二样本集对应的标签,所述标签指示了正常行为模式或者属于用户异常模式的非法所得合法化行为模式;
获取所述第二样本集包含的用户的特征,以及所述用户的行为对象的特征;
根据所述标签,以及所述用户的特征和所述行为对象的特征,对所述识别模型进行元学习。
3.如权利要求2所述的方法,所述根据所述标签,以及所述用户的特征和所述行为对象的特征,对所述识别模型进行元学习,具体包括:
获取所述用户及所述行为对象的交易行为特征、画像特征、历史风险特征;
根据所述获取的特征,判断所述用户及所述行为对象所属行业的相似性;
根据所述标签、所述相似性,以及通过所述识别模型挖掘或预设的多种用户行为模式,对所述识别模型进行元学习;
根据指定的所述用户行为模式,对所述对所述元学习过的识别模型进行少样本元学习。
4.如权利要求1所述的方法,所述根据所述第一样本集,对所述特征转换结构进行训练,具体包括:
确定所述特征转换结构包含的因子分解机层和隐藏层;
根据所述第一样本集,通过对所述因子分解机层和/或隐藏层进行有监督训练,调整所述多维参数中的维度取值,以及所述维度取值之间的比例关系。
5.如权利要求1所述的方法,所述获取第二样本集,具体包括:
根据所述第一样本集,获取样本数量远少于所述第一样本集的第二样本集。
6.如权利要求1所述的方法,所述根据所述第二样本集,所述对所述识别模型进行元学习,具体包括:
根据所述第二样本集,确定多个包含多个样本的任务;
根据所述任务训练所述识别模型,在该训练过程中通过进行一阶梯度计算,得到任务损失总和;
根据所述任务损失总和进行二阶梯度计算,确定所述识别模型的元学习结果。
7.如权利要求6所述的方法,所述根据所述第二样本集,确定多个包含多个样本的任务,具体包括:
获取由无标签样本构成的第三样本集;
根据所述第三样本集和所述第二样本集中的有标签样本,对所述识别模型进行训练,根据该训练后的识别模型对所述第三样本集的识别结果,为所述无标签样本生成标签;
根据所述第二样本集和包含所述标签的所述第三样本集,确定多个包含多个样本的任务。
8.如权利要求6所述的方法,所述根据所述任务损失总和进行二阶梯度计算,具体包括:
获取根据所述用户异常模式对应的历史数据指定的校正特征;
根据所述校正特征,在所述任务损失总和对应的样本中进行匹配;
若匹配成功,则生成相应的校正损失,并根据所述校正损失,缩小所述任务损失总和;
根据所述缩小后的任务损失总和进行二阶梯度计算。
9.一种用户异常模式识别装置,包括:
模型确定模块,确定包含指定的特征转换结构的识别模型;
第一训练模块,获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数;
样本准备模块,获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据;
参数缩减模块,对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数;
第二训练模块,根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数;
异常识别模块,通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
10.如权利要求9所述的装置,所述第二训练模块,获取所述第二样本集对应的标签,所述标签指示了正常行为模式或者属于用户异常模式的非法所得合法化行为模式;
获取所述第二样本集包含的用户的特征,以及所述用户的行为对象的特征;
根据所述标签,以及所述用户的特征和所述行为对象的特征,对所述识别模型进行元学习。
11.如权利要求10所述的装置,所述第二训练模块,获取所述用户及所述行为对象的交易行为特征、画像特征、历史风险特征;
根据所述获取的特征,判断所述用户及所述行为对象所属行业的相似性;
根据所述标签、所述相似性,以及通过所述识别模型挖掘或预设的多种用户行为模式,对所述识别模型进行元学习;
根据指定的所述用户行为模式,对所述对所述元学习过的识别模型进行少样本元学习。
12.如权利要求9所述的装置,所述第一训练模块,确定所述特征转换结构包含的因子分解机层和隐藏层;
根据所述第一样本集,通过对所述因子分解机层和/或隐藏层进行有监督训练,调整所述多维参数中的维度取值,以及所述维度取值之间的比例关系。
13.如权利要求9所述的装置,所述样本准备模块,根据所述第一样本集,获取样本数量远少于所述第一样本集的第二样本集。
14.如权利要求9所述的装置,所述第二训练模块,包括任务构建子模块、元学习子模块;
所述任务构建子模块,根据所述第二样本集,确定多个包含多个样本的任务;
所述元学习子模块,根据所述任务训练所述识别模型,在该训练过程中通过进行一阶梯度计算,得到任务损失总和;
根据所述任务损失总和进行二阶梯度计算,确定所述识别模型的元学习结果。
15.如权利要求14所述的装置,所述任务构建子模块,获取由无标签样本构成的第三样本集;
根据所述第三样本集和所述第二样本集中的有标签样本,对所述识别模型进行训练,根据该训练后的识别模型对所述第三样本集的识别结果,为所述无标签样本生成标签;
根据所述第二样本集和包含所述标签的所述第三样本集,确定多个包含多个样本的任务。
16.如权利要求14所述的装置,所述元学习子模块包括损失校正子模块、梯度更新子模块;
所述损失校正子模块,获取根据所述用户异常模式对应的历史数据指定的校正特征;
根据所述校正特征,在所述任务损失总和对应的样本中进行匹配;
若匹配成功,则生成相应的校正损失,并根据所述校正损失,缩小所述任务损失总和;
所述梯度更新子模块,根据所述缩小后的任务损失总和进行二阶梯度计算。
17.一种用户异常模式识别设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
确定包含指定的特征转换结构的识别模型;
获取第一样本集,并根据所述第一样本集,对所述特征转换结构进行训练,得到所述特征转换结构包含的多维参数;
获取第二样本集,所述第二样本集包括曾处于用户异常模式的用户的相关数据;
对所述多维参数中维度取值之间的比例关系进行锁定,并为所述多维参数确定整体的放缩系数和偏置系数;
根据所述第二样本集,对所述识别模型进行元学习,以调整所述放缩系数和所述偏置系数;
通过所述元学习后的识别模型,判定待识别用户是否处于用户异常模式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110316092.4A CN113052324B (zh) | 2021-03-24 | 2021-03-24 | 一种用户异常模式识别方法、装置以及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110316092.4A CN113052324B (zh) | 2021-03-24 | 2021-03-24 | 一种用户异常模式识别方法、装置以及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113052324A true CN113052324A (zh) | 2021-06-29 |
CN113052324B CN113052324B (zh) | 2022-08-02 |
Family
ID=76515045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110316092.4A Active CN113052324B (zh) | 2021-03-24 | 2021-03-24 | 一种用户异常模式识别方法、装置以及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113052324B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591932A (zh) * | 2021-07-06 | 2021-11-02 | 北京淇瑀信息科技有限公司 | 基于一类支持向量机的用户异常行为处理方法和装置 |
CN114663707A (zh) * | 2022-03-28 | 2022-06-24 | 中国科学院光电技术研究所 | 基于Faster RCNN改进的少样本目标检测方法 |
CN115564577A (zh) * | 2022-12-02 | 2023-01-03 | 成都新希望金融信息有限公司 | 一种异常用户识别方法、装置、电子设备及存储介质 |
CN116029556A (zh) * | 2023-03-21 | 2023-04-28 | 支付宝(杭州)信息技术有限公司 | 一种业务风险的评估方法、装置、设备及可读存储介质 |
CN116362351A (zh) * | 2023-05-29 | 2023-06-30 | 深圳须弥云图空间科技有限公司 | 利用噪声扰动训练预训练语言模型的方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190228312A1 (en) * | 2018-01-25 | 2019-07-25 | SparkCognition, Inc. | Unsupervised model building for clustering and anomaly detection |
CN110751557A (zh) * | 2019-10-10 | 2020-02-04 | 中国建设银行股份有限公司 | 一种基于序列模型的异常资金交易行为分析方法及系统 |
KR102094377B1 (ko) * | 2019-04-12 | 2020-03-31 | 주식회사 이글루시큐리티 | 비지도학습 이상탐지를 위한 모델 선택 시스템 및 그 방법 |
CN111444951A (zh) * | 2020-03-24 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 样本识别模型的生成方法、装置、计算机设备和存储介质 |
CN111724083A (zh) * | 2020-07-21 | 2020-09-29 | 腾讯科技(深圳)有限公司 | 金融风险识别模型的训练方法、装置、计算机设备及介质 |
CN112446505A (zh) * | 2020-11-25 | 2021-03-05 | 创新奇智(广州)科技有限公司 | 一种元学习建模方法及装置、电子设备、存储介质 |
CN112562648A (zh) * | 2020-12-10 | 2021-03-26 | 平安科技(深圳)有限公司 | 基于元学习的自适应语音识别方法、装置、设备及介质 |
-
2021
- 2021-03-24 CN CN202110316092.4A patent/CN113052324B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190228312A1 (en) * | 2018-01-25 | 2019-07-25 | SparkCognition, Inc. | Unsupervised model building for clustering and anomaly detection |
KR102094377B1 (ko) * | 2019-04-12 | 2020-03-31 | 주식회사 이글루시큐리티 | 비지도학습 이상탐지를 위한 모델 선택 시스템 및 그 방법 |
CN110751557A (zh) * | 2019-10-10 | 2020-02-04 | 中国建设银行股份有限公司 | 一种基于序列模型的异常资金交易行为分析方法及系统 |
CN111444951A (zh) * | 2020-03-24 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 样本识别模型的生成方法、装置、计算机设备和存储介质 |
CN111724083A (zh) * | 2020-07-21 | 2020-09-29 | 腾讯科技(深圳)有限公司 | 金融风险识别模型的训练方法、装置、计算机设备及介质 |
CN112446505A (zh) * | 2020-11-25 | 2021-03-05 | 创新奇智(广州)科技有限公司 | 一种元学习建模方法及装置、电子设备、存储介质 |
CN112562648A (zh) * | 2020-12-10 | 2021-03-26 | 平安科技(深圳)有限公司 | 基于元学习的自适应语音识别方法、装置、设备及介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591932A (zh) * | 2021-07-06 | 2021-11-02 | 北京淇瑀信息科技有限公司 | 基于一类支持向量机的用户异常行为处理方法和装置 |
CN114663707A (zh) * | 2022-03-28 | 2022-06-24 | 中国科学院光电技术研究所 | 基于Faster RCNN改进的少样本目标检测方法 |
CN115564577A (zh) * | 2022-12-02 | 2023-01-03 | 成都新希望金融信息有限公司 | 一种异常用户识别方法、装置、电子设备及存储介质 |
CN116029556A (zh) * | 2023-03-21 | 2023-04-28 | 支付宝(杭州)信息技术有限公司 | 一种业务风险的评估方法、装置、设备及可读存储介质 |
CN116029556B (zh) * | 2023-03-21 | 2023-05-30 | 支付宝(杭州)信息技术有限公司 | 一种业务风险的评估方法、装置、设备及可读存储介质 |
CN116362351A (zh) * | 2023-05-29 | 2023-06-30 | 深圳须弥云图空间科技有限公司 | 利用噪声扰动训练预训练语言模型的方法及装置 |
CN116362351B (zh) * | 2023-05-29 | 2023-09-26 | 深圳须弥云图空间科技有限公司 | 利用噪声扰动训练预训练语言模型的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113052324B (zh) | 2022-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113052324B (zh) | 一种用户异常模式识别方法、装置以及设备 | |
CN108460523B (zh) | 一种风控规则生成方法和装置 | |
CN111080304B (zh) | 一种可信关系识别方法、装置及设备 | |
CN111325444B (zh) | 一种风险防控决策方法、装置、系统及设备 | |
CN107808098A (zh) | 一种模型安全检测方法、装置以及电子设备 | |
CN111931172B (zh) | 一种金融系统业务流程异常预警方法及装置 | |
CN110674188A (zh) | 一种特征提取方法、装置及设备 | |
CN110020427B (zh) | 策略确定方法和装置 | |
CN109003091A (zh) | 一种风险防控处理方法、装置及设备 | |
CN114139209B (zh) | 一种应用于业务用户大数据的信息防窃取方法及系统 | |
CN108846660B (zh) | 一种识别异常资金的方法及系统 | |
CN111383030B (zh) | 一种交易风险的检测方法、装置及设备 | |
CN117972732B (zh) | 基于多特征融合的智能合约漏洞检测方法及系统 | |
CN112966113A (zh) | 一种数据的风险防控方法、装置及设备 | |
CN114861665B (zh) | 一种强化学习模型训练以及确定数据关系的方法及装置 | |
Saberi et al. | A passive online technique for learning hybrid automata from input/output traces | |
CN110033092B (zh) | 数据标签生成、模型训练、事件识别方法和装置 | |
CN111507726A (zh) | 一种报文生成方法、装置及设备 | |
CN112465012A (zh) | 机器学习建模方法、装置、电子设备和可读存储介质 | |
CN116720214A (zh) | 一种用于隐私保护的模型训练方法及装置 | |
CN115204395A (zh) | 数据的处理方法、装置及设备 | |
CN113989043A (zh) | 一种事件的风险识别方法、装置及设备 | |
CN114511376A (zh) | 基于多模型的信用数据处理方法及装置 | |
CN113569873A (zh) | 一种图像的处理方法、装置及设备 | |
CN115599891B (zh) | 一种确定异常对话数据方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |