CN109767308A - 金融欺诈检测中时间与成本特征选择方法、设备、介质 - Google Patents

金融欺诈检测中时间与成本特征选择方法、设备、介质 Download PDF

Info

Publication number
CN109767308A
CN109767308A CN201811455148.9A CN201811455148A CN109767308A CN 109767308 A CN109767308 A CN 109767308A CN 201811455148 A CN201811455148 A CN 201811455148A CN 109767308 A CN109767308 A CN 109767308A
Authority
CN
China
Prior art keywords
feature
sample
value
cost
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811455148.9A
Other languages
English (en)
Inventor
林颜双
陈鑫亚
南欧
何冲冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LIANLIANYINTONG ELECTRONIC PAYMENT CO Ltd
Original Assignee
LIANLIANYINTONG ELECTRONIC PAYMENT CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LIANLIANYINTONG ELECTRONIC PAYMENT CO Ltd filed Critical LIANLIANYINTONG ELECTRONIC PAYMENT CO Ltd
Priority to CN201811455148.9A priority Critical patent/CN109767308A/zh
Publication of CN109767308A publication Critical patent/CN109767308A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供金融欺诈检测中时间与成本特征选择方法,包括步骤:从用户数据表中提取出用户的金融数据特征,对金融数据特征进行统计,对得到的统计特征进行筛选,得到n维特征,通过用户主键匹配用户标签;匹配数据库中n维特征对应的成本价值和时间价值;将每个特征对应的成本价值和时间价值计入损失函数的一部分,以最小化损失函数为目标进行模型训练,将用户特征和用户标签作为模型的输入进行模型训练,得到学习模型;通过学习模型计算每个特征的重要性,对重要性进行排列,并进行固定维度的特征选择。本发明基于第三方金融欺诈数据,在特征选择过程中考虑了特征间的冗余相关性、特征自身的成本价值和时间价值,实用性广。

Description

金融欺诈检测中时间与成本特征选择方法、设备、介质
技术领域
本发明涉及金融技术领域,尤其涉及金融欺诈检测中时间与成本特征选择方法、设备、介质。
背景技术
在大数据时代,我们可以从数据中提取到用户的各类相关特征,如在电商数据中提取用户相关的购物特征,在医疗数据中提取用户相关的体检项目特征等,利用提取得到的特征可以预测用户的商品购买意向或者推断用户的健康状况。在实际应用中,用户的数据特征获取往往有各种不同的代价,比如在获取用户的一系列购物特征或者体检特征时需要一定的成本,如病人在医学诊断中进行的各类测试所需要的成本是不同的。同时,在实际应用中,不少数据特征本身带有时间属性信息,如我们可以使用以下两种特征刻画用户的消费情况:用户前十天的消费金额和用户前三个月的消费金额。相比而言,用户前十天的消费金额这个特征更能刻画用户的最近消费情况,如果不考虑特征获取成本和时间价值,很多理论上效果好的预测模型在应用中会缺乏实用性。同时,在大数据时代,高维数据往往对数据挖掘模型与算法都会带来巨大挑战,引发“维度诅咒”问题。为了减轻“维度诅咒”的影响,提升模型效果,实际的数据挖掘任务往往需要通过特征选择来减少数据特征的维度。传统的特征选择方法通过考虑特征之间的冗余相关性(如特征共线性等),从n个特征中选出k个特征,减少特征维度。但是现有的特征选择方法并没有显式的考虑特征自身的成本和时间价值,因此其实用性受限。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供金融欺诈检测中时间与成本特征选择方法,解决了现有的特征选择方法没有显式的考虑特征自身的成本和时间价值,实用性受限的问题。
本发明提供金融欺诈检测中时间与成本特征选择方法,包括以下步骤:
提取金融数据特征,从用户数据表中提取出用户的金融数据特征,对所述金融数据特征进行统计,得到统计特征,并对所述统计特征进行筛选,得到n维特征,通过用户主键匹配得到用户标签;
匹配时间与成本价值,匹配数据库中所述n维特征对应的成本价值和时间价值;
构建机器学习模型,将每个特征对应的成本价值和时间价值计入损失函数的一部分,以最小化所述损失函数为目标进行模型训练,将用户特征和用户标签作为模型的输入进行模型训练,得到机器学习模型;
计算特征重要性,通过所述机器学习模型计算每个特征的重要性,对每个特征对应的重要性进行排列,并进行固定维度的特征选择。
进一步地,所述提取金融数据特征步骤具体包括以下步骤:
提取n维特征,从数据库中的用户数据表中提取与用户相关的金融数据特征,通过统计所述金融数据特征的最大值、最小值、中位数、求和、均值、方差,得到统计特征,对所述统计特征进行清洗筛选,得到n维特征;
匹配用户标签,通过业务逻辑对用户进行标签标定,得到用户标签。
进一步地,所述匹配时间与成本价值步骤中,根据所述n维特征匹配数据库中的特征指标价格表和特征指标的时间价值表,获得特征对应的成本价值和时间价值。
进一步地,所述机器学习模型为LightGBM模型。
进一步地,所述构建机器学习模型步骤具体包括以下步骤:
建立原损失函数,建立LightGBM模型的原损失函数,具体公式如下:
其中,代表决策树模型树的集合,共有K棵树(t1,…,tK),i∈[1,N]代表从第1个样本到第N个样本,L代表定义的误差函数,xi代表第i个样本的特征,每个样本有n维特征,yi代表第i个样本的标签,Ω代表衡量树结构好坏的函数,tk(xi)代表第k棵决策树关于第i个样本的输出;
所述定义的误差函数的具体公式如下:
所述衡量树结构好坏的函数的具体公式如下:
其中,T代表第k棵树的叶子个数,λ为参数,ω代表叶子的值;
建立新损失函数,建立LightGBM模型的新损失函数,具体公式如下:
其中,Ok代表第k次迭代需要优化的损失函数,i∈[1,N]代表从第1个样本到第N个样本,λ为参数,k代表第k次迭代,xi代表第i个样本的特征,每个样本有n维特征,Ψ(k,xi)是关于特征和树结构的代价函数,Ψc(k)是第k棵树中特征成本计算的函数;
Ψ(k,xi)的具体公式如下:
其中,代表第i个样本在前k棵树的评估代价函数,代表第i个样本在前k棵树的结构代价函数,C(k,i,m)代表在前k棵树中预测第i个样本是否用到特征m,是则C(k,i,m)=1,否则为C(k,i,m)=0,βm代表第m个特征的价格成本,μm代表第m个特征的时间价值,代表当前k次迭代中的第次迭代,代表第i个样本在第棵树中所属的叶子节点,代表第k棵树中从根节点走到xi所属的叶子节点需要经过的分裂节点个数;
Ψc(k)的具体公式如下:
其中,βm代表第m个特征的成本,μm代表第m个特征的时间价值,当特征m在第k棵树被使用时,D(k,m)=1,当特征m在第k棵树未被使用时,D(k,m)=0;
使用Tk-1(xi)附近的二阶泰勒公式近似Ok,具体公式如下:
其中,ΔΨ(xi)=Ψ(k,xi)-Ψ(k-1,xi),ΔΨc=Ψc(k)-Ψc(k-1);
其中,代表第k棵树中属于叶子节点l的样本集合,ωk,l代表第k棵树中叶子节点l的值,是关于ωk,l的二次函数,当时,损失函数取最小值;
训练LightGBM模型,将[Xi,yi],i∈[1,N]作为LightGBM模型的输入,迭代训练后LightGBM模型的输出对应样本的预测值Predicti,其中,i代表第i个样本,Xi代表第i个样本的n维特征向量,yi代表第i个样本的真实标签值,N代表样本总数,Predicti代表第i个样本的预测值。
进一步地,所述计算特征重要性步骤中,根据基尼系数计算LightGBM模型的特征重要性,将计算得到的特征重要性进行降序排序,筛选得到维度为M的特征,具体公式如下:
其中,m代表样本中的第m个特征,K代表决策树模型的树的总棵树,Ψ(k,m)代表在第k棵树中使用特征m进行划分后的减少的基尼系数值的和。
进一步地,所述提取n维特征步骤中,选择缺失值少于缺失值阈值的特征,得到n维特征,所述缺失值阈值为40%~60%。
一种电子设备,包括:处理器;
存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行上述金融欺诈检测中时间与成本特征选择方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行上述金融欺诈检测中时间与成本特征选择方法。
相比现有技术,本发明的有益效果在于:
本发明提供金融欺诈检测中时间与成本特征选择方法,包括以下步骤:提取金融数据特征,从用户数据表中提取出用户的金融数据特征,对金融数据特征进行统计,得到统计特征,并对统计特征进行筛选,得到n维特征,通过用户主键匹配得到用户标签;匹配时间与成本价值,匹配数据库中n维特征对应的成本价值和时间价值;构建机器学习模型,将每个特征对应的成本价值和时间价值计入损失函数的一部分,以最小化损失函数为目标进行模型训练,将用户特征和用户标签作为模型的输入进行模型训练,得到机器学习模型;计算特征重要性,通过机器学习模型计算每个特征的重要性,对每个特征对应的重要性进行排列,并进行固定维度的特征选择。本发明涉及电子设备与可读存储介质,用于执行金融欺诈检测中时间与成本特征选择方法。本发明基于互联网金融公司的第三方金融欺诈数据,在特征选择过程中除了考虑特征间的冗余相关性外,还考虑了特征自身的成本价值和时间价值,提出了时间与成本敏感的特征选择方法,即在限定特征成本和给定特征时间价值的前提下选择部分特征来进行有效建模。在限定特征成本和给定特征时间价值的前提下选择部分特征进行有效建模,实用性广。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明的金融欺诈检测中时间与成本特征选择方法流程图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
金融欺诈检测中时间与成本特征选择方法,如图1所示,包括以下步骤:
提取金融数据特征,从用户数据表中提取出用户的金融数据特征,对金融数据特征进行统计,得到统计特征,并对统计特征进行筛选,得到n维特征,具体为[特征1,特征2,…,特征n],通过用户主键匹配得到用户标签;优选的,提取金融数据特征步骤具体包括以下步骤:
提取n维特征,从数据库中的用户数据表中提取与用户相关的金融数据特征,通过统计金融数据特征的最大值、最小值、中位数、求和、均值、方差等,得到统计特征,对统计特征进行清洗筛选,得到n维特征,即[特征1,特征2,..,特征n];优选的,提取n维特征步骤中,选择缺失值少于缺失值阈值的特征,得到n维特征,缺失值阈值为40%~60%。本实施例中,缺失值阈值最优为50%。
匹配用户标签,通过业务逻辑对用户进行标签标定,得到用户标签。本实施例中,用户标签的定义是用户的好坏,通过业务逻辑来对用户进行标签标定区分好坏用户,0代表好用户,1代表坏用户,此处提取得到的用户特征和用户标签用于后续的模型训练。
匹配时间与成本价值,匹配数据库中n维特征对应的成本价值和时间价值,用于后续的模型训练;每个特征都有一定的成本和时间价值,本发明中的特征成本为每个特征的价格,时间价值为每类特征在时间维度上的重要性,优选的,匹配时间与成本价值步骤中,根据n维特征匹配数据库中的特征指标价格表和特征指标的时间价值表,获得特征对应的成本价值和时间价值,统计特征的成本为用到的所有特征的价格综合,时间价值同理。
构建机器学习模型,将每个特征对应的成本价值和时间价值计入损失函数的一部分,以最小化损失函数为目标进行模型训练,将用户特征和用户标签作为模型的输入进行模型训练,得到机器学习模型;优选的,机器学习模型为LightGBM模型。引入LightGBM决策树模型,通过重新定义LightGBM决策树模型的损失函数,即把每个特征的成本价值和时间价值作为新损失函数的一部分,并以最小化这个损失函数为目标进行模型迭代,以[用户特征,用户标签]作为模型的输入进行模型训练。具体地,优选的,构建机器学习模型步骤具体包括以下步骤:
建立原损失函数,建立LightGBM模型的原损失函数,具体公式如下:
其中,代表决策树模型树的集合,共有K棵树(t1,…,tK),i∈[1,N]代表从第1个样本到第N个样本,L代表定义的误差函数,xi代表第i个样本的特征,每个样本有n维特征,yi代表第i个样本的标签,Ω代表衡量树结构好坏的函数,tk(xi)代表第k棵决策树关于第i个样本的输出;上述公式中的是衡量样本的标签值和预测值的误差,是衡量决策树的结构好坏,二者相加构成了原损失函数,模型训练的目标是最小化损失函数。
定义的误差函数,即L的具体公式如下:
衡量树结构好坏的函数,即Ω的具体公式如下:
其中,T代表第k棵树的叶子个数,λ为参数,ω代表叶子的值;
建立新损失函数,建立LightGBM模型的新损失函数,具体公式如下:
其中,Ok代表第k次迭代需要优化的损失函数,i∈[1,N]代表从第1个样本到第N个样本,λ为参数,k代表第k次迭代,xi代表第i个样本的特征,每个样本有n维特征,Ψ(k,xi)是关于特征和树结构的代价函数,Ψc(k)是第k棵树中特征成本计算的函数;
Ψ(k,xi)的具体公式如下:
其中,代表第i个样本在前k棵树的评估代价函数,代表第i个样本在前k棵树的结构代价函数,C(k,i,m)代表在前k棵树中预测第i个样本是否用到特征m,是则C(k,i,m)=1,否则为C(k,i,m)=0,βm代表第m个特征的价格成本,μm代表第m个特征的时间价值,代表当前k次迭代中的第次迭代,代表第i个样本在第棵树中所属的叶子节点,代表第k棵树中从根节点走到xi所属的叶子节点需要经过的分裂节点个数;
Ψc(k)的具体公式如下:
其中,βm代表第m个特征的成本,μm代表第m个特征的时间价值,当特征m在第k棵树被使用时,D(k,m)=1,当特征m在第k棵树未被使用时,D(k,m)=0;
由于中中包含了tk,因此使用Tk-1(xi)附近的二阶泰勒公式近似Ok,具体公式如下:
其中,
其中,代表第k棵树中属于叶子节点l的样本集合,ωk,l代表第k棵树中叶子节点l的值,是关于ωk,l的二次函数,当时,损失函数取最小值,故得到叶子节点数值的定义方式。
训练LightGBM模型,将[Xi,yi],i∈[1,N]作为LightGBM模型的输入,迭代训练后LightGBM模型的输出对应样本的预测值Predicti,其中,i代表第i个样本,Xi代表第i个样本的n维特征向量,yi代表第i个样本的真实标签值,N代表样本总数,Predicti代表第i个样本的预测值。
计算特征重要性,通过构建机器学习模型步骤训练得到的机器学习模型计算每个特征的重要性,对每个特征对应的重要性进行排列,并进行固定维度的特征选择。优选的,计算特征重要性步骤中,根据基尼系数计算LightGBM模型的特征重要性,具体公式如下:
其中,m代表样本中的第m个特征,K代表决策树模型的树的总棵树,Ψ(k,m)代表在第k棵树中使用特征m进行划分后的减少的基尼系数值的和。
将计算得到的特征重要性进行降序排序,筛选得到维度为M的特征(M<n),n为原特征的维度。
一种电子设备,包括:处理器;
存储器;以及程序,其中程序被存储在存储器中,并且被配置成由处理器执行,程序包括用于执行上述金融欺诈检测中时间与成本特征选择方法。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行上述金融欺诈检测中时间与成本特征选择方法。
本发明提供金融欺诈检测中时间与成本特征选择方法,包括以下步骤:提取金融数据特征,从用户数据表中提取出用户的金融数据特征,对金融数据特征进行统计,得到统计特征,并对统计特征进行筛选,得到n维特征,通过用户主键匹配得到用户标签;匹配时间与成本价值,匹配数据库中n维特征对应的成本价值和时间价值;构建机器学习模型,将每个特征对应的成本价值和时间价值计入损失函数的一部分,以最小化损失函数为目标进行模型训练,将用户特征和用户标签作为模型的输入进行模型训练,得到机器学习模型;计算特征重要性,通过机器学习模型计算每个特征的重要性,对每个特征对应的重要性进行排列,并进行固定维度的特征选择。本发明涉及电子设备与可读存储介质,用于执行金融欺诈检测中时间与成本特征选择方法。本发明基于互联网金融公司的第三方金融欺诈数据,在特征选择过程中除了考虑特征间的冗余相关性外,还考虑了特征自身的成本价值和时间价值,提出了时间与成本敏感的特征选择方法,即在限定特征成本和给定特征时间价值的前提下选择部分特征来进行有效建模。在限定特征成本和给定特征时间价值的前提下选择部分特征进行有效建模,实用性广。
以上,仅为本发明的较佳实施例而已,并非对本发明作任何形式上的限制;凡本行业的普通技术人员均可按说明书附图所示和以上而顺畅地实施本发明;但是,凡熟悉本专业的技术人员在不脱离本发明技术方案范围内,利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对以上实施例所作的任何等同变化的更动、修饰与演变等,均仍属于本发明的技术方案的保护范围之内。

Claims (9)

1.金融欺诈检测中时间与成本特征选择方法,其特征在于包括以下步骤:
提取金融数据特征,从用户数据表中提取出用户的金融数据特征,对所述金融数据特征进行统计,得到统计特征,并对所述统计特征进行筛选,得到n维特征,通过用户主键匹配得到用户标签;
匹配时间与成本价值,匹配数据库中所述n维特征对应的成本价值和时间价值;
构建机器学习模型,将每个特征对应的成本价值和时间价值计入损失函数的一部分,以最小化所述损失函数为目标进行模型训练,将用户特征和用户标签作为模型的输入进行模型训练,得到机器学习模型;
计算特征重要性,通过所述机器学习模型计算每个特征的重要性,对每个特征对应的重要性进行排列,并进行固定维度的特征选择。
2.如权利要求1所述的金融欺诈检测中时间与成本特征选择方法,其特征在于,所述提取金融数据特征步骤具体包括以下步骤:
提取n维特征,从数据库中的用户数据表中提取与用户相关的金融数据特征,通过统计所述金融数据特征的最大值、最小值、中位数、求和、均值、方差,得到统计特征,对所述统计特征进行清洗筛选,得到n维特征;
匹配用户标签,通过业务逻辑对用户进行标签标定,得到用户标签。
3.如权利要求1所述的金融欺诈检测中时间与成本特征选择方法,其特征在于:所述匹配时间与成本价值步骤中,根据所述n维特征匹配数据库中的特征指标价格表和特征指标的时间价值表,获得特征对应的成本价值和时间价值。
4.如权利要求1所述的金融欺诈检测中时间与成本特征选择方法,其特征在于:所述机器学习模型为LightGBM模型。
5.如权利要求4所述的金融欺诈检测中时间与成本特征选择方法,其特征在于,所述构建机器学习模型步骤具体包括以下步骤:
建立原损失函数,建立LightGBM模型的原损失函数,具体公式如下:
其中,代表决策树模型树的集合,共有K棵树(t1,…,tK),i∈[1,N]代表从第1个样本到第N个样本,L代表定义的误差函数,xi代表第i个样本的特征,每个样本有n维特征,yi代表第i个样本的标签,Ω代表衡量树结构好坏的函数,tk(xi)代表第k棵决策树关于第i个样本的输出;
所述定义的误差函数的具体公式如下:
所述衡量树结构好坏的函数的具体公式如下:
其中,T代表第k棵树的叶子个数,λ为参数,ω代表叶子的值;
建立新损失函数,建立LightGBM模型的新损失函数,具体公式如下:
其中,Ok代表第k次迭代需要优化的损失函数,i∈[1,N]代表从第1个样本到第N个样本,λ为参数,k代表第k次迭代,xi代表第i个样本的特征,每个样本有n维特征,Ψ(k,xi)是关于特征和树结构的代价函数,Ψc(k)是第k棵树中特征成本计算的函数;
Ψ(k,xi)的具体公式如下:
其中,代表第i个样本在前k棵树的评估代价函数,代表第i个样本在前k棵树的结构代价函数,C(k,i,m)代表在前k棵树中预测第i个样本是否用到特征m,是则C(k,i,m)=1,否则为C(k,i,m)=0,βm代表第m个特征的价格成本,μm代表第m个特征的时间价值,代表当前k次迭代中的第次迭代,代表第i个样本在第棵树中所属的叶子节点,代表第k棵树中从根节点走到xi所属的叶子节点需要经过的分裂节点个数;
Ψc(k)的具体公式如下:
其中,βm代表第m个特征的成本,μm代表第m个特征的时间价值,当特征m在第k棵树被使用时,D(k,m)=1,当特征m在第k棵树未被使用时,D(k,m)=0;
使用Tk-1(xi)附近的二阶泰勒公式近似Ok,具体公式如下:
其中,ΔΨ(xi)=Ψ(k,xi)-Ψ(k-1,xi),ΔΨc=Ψc(k)-Ψc(k-1);
其中,代表第k棵树中属于叶子节点l的样本集合,ωk,l代表第k棵树中叶子节点l的值,是关于ωk,l的二次函数,当时,损失函数取最小值;
训练LightGBM模型,将[Xi,yi],i∈[1,N]作为LightGBM模型的输入,迭代训练后LightGBM模型的输出对应样本的预测值Predicti,其中,i代表第i个样本,Xi代表第i个样本的n维特征向量,yi代表第i个样本的真实标签值,N代表样本总数,Predicti代表第i个样本的预测值。
6.如权利要求5所述的金融欺诈检测中时间与成本特征选择方法,其特征在于:所述计算特征重要性步骤中,根据基尼系数计算LightGBM模型的特征重要性,将计算得到的特征重要性进行降序排序,筛选得到维度为M的特征,具体公式如下:
其中,m代表样本中的第m个特征,K代表决策树模型的树的总棵树,Ψ(k,m)代表在第k棵树中使用特征m进行划分后的减少的基尼系数值的和。
7.如权利要求2所述的金融欺诈检测中时间与成本特征选择方法,其特征在于:所述提取n维特征步骤中,选择缺失值少于缺失值阈值的特征,得到n维特征,所述缺失值阈值为40%~60%。
8.一种电子设备,其特征在于包括:处理器;
存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行权利要求1-7任意一项所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行如权利要求1-7任意一项所述的方法。
CN201811455148.9A 2018-11-30 2018-11-30 金融欺诈检测中时间与成本特征选择方法、设备、介质 Pending CN109767308A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811455148.9A CN109767308A (zh) 2018-11-30 2018-11-30 金融欺诈检测中时间与成本特征选择方法、设备、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811455148.9A CN109767308A (zh) 2018-11-30 2018-11-30 金融欺诈检测中时间与成本特征选择方法、设备、介质

Publications (1)

Publication Number Publication Date
CN109767308A true CN109767308A (zh) 2019-05-17

Family

ID=66451129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811455148.9A Pending CN109767308A (zh) 2018-11-30 2018-11-30 金融欺诈检测中时间与成本特征选择方法、设备、介质

Country Status (1)

Country Link
CN (1) CN109767308A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110738527A (zh) * 2019-10-17 2020-01-31 中国建设银行股份有限公司 一种特征重要性排序方法、装置、设备和存储介质
CN111242779A (zh) * 2020-01-03 2020-06-05 湖南工商大学 金融数据特征选择和预测方法、装置、设备及存储介质
CN112669973A (zh) * 2020-12-30 2021-04-16 华南师范大学 基于大数据深度学习的疾病协同递进预测方法和机器人
CN112927061A (zh) * 2021-03-26 2021-06-08 深圳前海微众银行股份有限公司 用户操作检测方法及程序产品
CN113080986A (zh) * 2021-05-07 2021-07-09 中国科学院深圳先进技术研究院 一种基于可穿戴设备的运动性疲劳检测方法和系统
TWI768512B (zh) * 2019-12-26 2022-06-21 日商樂天集團股份有限公司 信用度計算系統、信用度計算方法及程式產品
CN116151841A (zh) * 2022-12-28 2023-05-23 连连银通电子支付有限公司 一种基于关键词识别的管控方法、装置、电子设备及存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110738527A (zh) * 2019-10-17 2020-01-31 中国建设银行股份有限公司 一种特征重要性排序方法、装置、设备和存储介质
TWI768512B (zh) * 2019-12-26 2022-06-21 日商樂天集團股份有限公司 信用度計算系統、信用度計算方法及程式產品
CN111242779A (zh) * 2020-01-03 2020-06-05 湖南工商大学 金融数据特征选择和预测方法、装置、设备及存储介质
CN111242779B (zh) * 2020-01-03 2023-08-18 湖南工商大学 金融数据特征选择和预测方法、装置、设备及存储介质
CN112669973A (zh) * 2020-12-30 2021-04-16 华南师范大学 基于大数据深度学习的疾病协同递进预测方法和机器人
CN112927061A (zh) * 2021-03-26 2021-06-08 深圳前海微众银行股份有限公司 用户操作检测方法及程序产品
WO2022199185A1 (zh) * 2021-03-26 2022-09-29 深圳前海微众银行股份有限公司 用户操作检测方法及程序产品
CN112927061B (zh) * 2021-03-26 2024-03-12 深圳前海微众银行股份有限公司 用户操作检测方法及程序产品
CN113080986A (zh) * 2021-05-07 2021-07-09 中国科学院深圳先进技术研究院 一种基于可穿戴设备的运动性疲劳检测方法和系统
CN116151841A (zh) * 2022-12-28 2023-05-23 连连银通电子支付有限公司 一种基于关键词识别的管控方法、装置、电子设备及存储介质
CN116151841B (zh) * 2022-12-28 2023-09-19 连连银通电子支付有限公司 一种基于关键词识别的管控方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109767308A (zh) 金融欺诈检测中时间与成本特征选择方法、设备、介质
Backhaus et al. Multivariate analysis
Gefang Bayesian doubly adaptive elastic-net Lasso for VAR shrinkage
CN107578270A (zh) 一种金融标签的构建方法、装置及计算设备
Gustafsson et al. Comparison and validation of community structures in complex networks
Punzo Flexible mixture modelling with the polynomial Gaussian cluster-weighted model
US11562262B2 (en) Model variable candidate generation device and method
Bonnet et al. Maximum likelihood estimation for Hawkes processes with self-excitation or inhibition
CN109829494A (zh) 一种基于加权相似性度量的聚类集成方法
CN115659985A (zh) 电力知识图谱实体对齐方法、装置和计算机设备
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
Fryer et al. Explaining the data or explaining a model? Shapley values that uncover non-linear dependencies
de Souza Veloso et al. Principal components in the discrimination of outliers: A study in simulation sample data corrected by Pearson's and Yates´ s chisquare distance
Papakostas et al. Do forecasts of bankruptcy cause bankruptcy? A machine learning sensitivity analysis
CN114492830A (zh) 基于个体歧视实例对生成的深度学习模型去偏方法及其装置
Tsugawa et al. Analysis of the robustness of degree centrality against random errors in graphs
Costa Topological data analysis and applications
CN113256304A (zh) 一种校园卡异常使用行为在线预警方法及系统
Huang et al. Clustering analysis on e-commerce transaction based on k-means clustering
Iaci et al. Robust multivariate association and dimension reduction using density divergences
Singh et al. Use of clustering to improve the standard of education system
Fu et al. A Bayesian approach of joint models for clustered zero-inflated count data with skewness and measurement errors
Paz Alternative regression models to beta distribution under Bayesian approach
Sallan et al. Prediction of student dropout using enhanced machine learning algorithm
He et al. Comparing time series segmentation methods for the analysis of transportation patterns with smart card data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190517