CN111967600A - 一种风控场景下基于遗传算法的特征衍生系统及方法 - Google Patents

一种风控场景下基于遗传算法的特征衍生系统及方法 Download PDF

Info

Publication number
CN111967600A
CN111967600A CN202010833102.7A CN202010833102A CN111967600A CN 111967600 A CN111967600 A CN 111967600A CN 202010833102 A CN202010833102 A CN 202010833102A CN 111967600 A CN111967600 A CN 111967600A
Authority
CN
China
Prior art keywords
genetic algorithm
feature
features
derived
method based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010833102.7A
Other languages
English (en)
Other versions
CN111967600B (zh
Inventor
陈建
张乾
龙泳先
王月月
刘天欣
沙雨濛
何侃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruizhi Tuyuan Technology Co ltd
Original Assignee
Beijing Ruizhi Tuyuan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruizhi Tuyuan Technology Co ltd filed Critical Beijing Ruizhi Tuyuan Technology Co ltd
Priority to CN202010833102.7A priority Critical patent/CN111967600B/zh
Publication of CN111967600A publication Critical patent/CN111967600A/zh
Application granted granted Critical
Publication of CN111967600B publication Critical patent/CN111967600B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • G06F18/21322Rendering the within-class scatter matrix non-singular
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • G06F18/21322Rendering the within-class scatter matrix non-singular
    • G06F18/21324Rendering the within-class scatter matrix non-singular involving projections, e.g. Fisherface techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Genetics & Genomics (AREA)
  • Game Theory and Decision Science (AREA)
  • Physiology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种风控场景下基于遗传算法的特征衍生系统,包括:数据采集模块,所述数据采集模块的输出端连接有遗传算法特征衍生模块。涉及数据处理技术领域。该风控场景下基于遗传算法的特征衍生系统及方法,主要利用遗传算法自动化地衍生具有业务可解释性且预测能力较强的特征,显著提升了最终大数据评分卡模型的分类能力和准确率,极大地降低了人力成本,进而在一定程度上提高了模型开发的效率,通过研究最终得到的衍生特征可以很好地加深对业务的理解,对特征之间的隐式关系有更深刻的认识,使得产生的结构比较理想,能够满足人们的实际需求,同时该方法具有高度的灵活性和可扩展性,可以迁移至多种业务场景。

Description

一种风控场景下基于遗传算法的特征衍生系统及方法
技术领域
本发明涉及数据处理技术领域,具体为一种风控场景下基于遗传算法的特征衍生系统及方法。
背景技术
风险控制是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或风险控制者减少风险事件发生时造成的损失,总会有些事情是不能控制的,风险总是存在的,作为管理者会采取各种措施减小风险事件发生的可能性,或者把可能的损失控制在一定的范围内,以避免在风险事件发生时带来的难以承担的损失,风险控制的四种基本方法是:风险回避、损失控制、风险转移和风险保留。
在风控业务中需要最终的模型拥有很好地可解释性,因此逻辑斯蒂回归一直是大数据评分模型中的主流,然而众所周知机器学习的性能很大程度上取决于特征的质量,并且逻辑斯蒂回归模型无法学习到特征之间的非线性关系,这一过程依赖于大量的专业知识,门槛很高并且耗时耗力,现有技术中,虽然已经产生了很多应用广泛的方法论,例如多个特征做笛卡尔积、著名的“RFMVT”原则、基于统计量衍生新特征等等,但是基于原始特征很难产生令人满意的结果。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种风控场景下基于遗传算法的特征衍生系统及方法,解决了风控中基于原始特征衍生门槛很高并且耗时耗力,很难产生令人满意的结果的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种风控场景下基于遗传算法的特征衍生系统,包括:数据采集模块,所述数据采集模块的输出端连接有遗传算法特征衍生模块,所述遗传算法特征衍生模块的输出端连接有特征重要度筛选模块,所述数据采集模块的输出端连接有服务器。
一种风控场景下基于遗传算法的特征衍生方法,包括以下步骤:
S1、通过所述数据采集模块采集用户的行为数据,并作为原始特征X和标签Y,分别发送至服务器和遗传算法特征衍生模块中;
S2、原始特征X和标签Y进入到所述遗传算法特征衍生模块之后,随机组合大量的原始特征,作为初代总体,然后经过变量筛选出排名靠前的衍生特征进行交叉变异,构成子代,并多次迭代,最终选取所有表现优异的衍生特征,然后输送至特征重要度筛选模块中进行下一步操作;
S3、所述特征重要度筛选模块将原始特征和衍生特征一起输入到随机森林中去,进行特征重要度排序,选取特征重要性较高且具有业务可解释性的衍生变量加入最终的入模特征列表中。
进一步地,所述S1中在采集的用户数据时通常存在大量的缺失,可以结合具体的业务场景,使用0、-1等特殊值填充。
进一步地,所述S2中遗传算法迭代之前,需要预先设置几个重要的超参数,且分别为随机初始化的衍生特征个数、遗传算法迭代轮数以及进入下一代的衍生特征的最低排名。
进一步地,所述S2中随机初始化的衍生特征个数可以设置为原始特征的整数倍,通常取2-4倍,遗传算法迭代轮数可以取10-20之间的整数,进入下一代的衍生特征的最低排名通常可以取10的倍数,如10、20等。
进一步地,所述S2中为了防止产生的衍生特征过于复杂丧失业务可解释性且过拟合加重,可以提前指定遗传算法迭代过程中的叶子节点个数K,即最多K个特征进行组合形成新的衍生特征,同时也可以限定特征之间的组合方式,对于连续型变量之间,主要是加减乘除以及log、exp等常见函数变换,对于离散型变量之间,主要是进行与、或、异或等逻辑运算。
进一步地,所述S2中遗传算法对衍生特征的筛选方式也极为重要,常用的有计算每个衍生特征与标签的线性相关程度即皮尔森系数、计算每个衍生特征对目标的拟合优度即R2系数,推荐使用Fisher准则。
进一步地,所述S2中遗传算法迭代过程中筛选方式都是单特征拟合标签,可能会导致衍生特征之间相关性太高,因此可以加入线性相关度筛选,计算衍生特征之间的余弦相似度。
进一步地,所述S3中随机森林模型进行特征重要度排序会自然地将相关程度过高的变量重要度收缩到零,可以非常直观地比较原始特征与衍生特征的预测能力强弱,通常结合业务需求选取具有商业价值和可解释性的衍生特征加入最终的入模特征列表。
(三)有益效果
本发明具有以下有益效果:
该风控场景下基于遗传算法的特征衍生系统及方法,主要利用遗传算法自动化地衍生具有业务可解释性且预测能力较强的特征,显著提升了最终大数据评分卡模型的分类能力和准确率,极大地降低了人力成本,进而在一定程度上提高了模型开发的效率,通过研究最终得到的衍生特征可以很好地加深对业务的理解,对特征之间的隐式关系有更深刻的认识,使得产生的结构比较理想,能够满足人们的实际需求,同时该方法具有高度的灵活性和可扩展性,可以迁移至多种业务场景。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
图1为本发明风控场景下基于遗传算法的特征衍生系统及方法第一实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“开孔”、“上”、“下”、“厚度”、“顶”、“中”、“长度”、“内”、“四周”等指示方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的组件或元件必须具有特定的方位,以特定的方位构造和操作,因此不能理解为对本发明的限制。
请参阅图1,本发明实施例提供一种技术方案:一种风控场景下基于遗传算法的特征衍生系统,包括:数据采集模块,所述数据采集模块的输出端连接有遗传算法特征衍生模块,所述遗传算法特征衍生模块的输出端连接有特征重要度筛选模块,所述数据采集模块的输出端连接有服务器。
一种风控场景下基于遗传算法的特征衍生方法,包括以下步骤:
S1、通过所述数据采集模块采集用户的行为数据,并作为原始特征X和标签Y,分别发送至服务器和遗传算法特征衍生模块中;
S2、原始特征X和标签Y进入到所述遗传算法特征衍生模块之后,随机组合大量的原始特征,作为初代总体,然后经过变量筛选出排名靠前的衍生特征进行交叉变异,构成子代,并多次迭代,最终选取所有表现优异的衍生特征,然后输送至特征重要度筛选模块中进行下一步操作;
S3、所述特征重要度筛选模块将原始特征和衍生特征一起输入到随机森林中去,进行特征重要度排序,选取特征重要性较高且具有业务可解释性的衍生变量加入最终的入模特征列表中。
所述S1中在采集的用户数据时通常存在大量的缺失,可以结合具体的业务场景,使用0、-1等特殊值填充。
所述S2中遗传算法迭代之前,需要预先设置几个重要的超参数,且分别为随机初始化的衍生特征个数、遗传算法迭代轮数以及进入下一代的衍生特征的最低排名。
所述S2中随机初始化的衍生特征个数可以设置为原始特征的整数倍,通常取2-4倍,遗传算法迭代轮数可以取10-20之间的整数,进入下一代的衍生特征的最低排名通常可以取10的倍数,如10、20等。
所述S2中为了防止产生的衍生特征过于复杂丧失业务可解释性且过拟合加重,可以提前指定遗传算法迭代过程中的叶子节点个数K,即最多K个特征进行组合形成新的衍生特征,同时也可以限定特征之间的组合方式,对于连续型变量之间,主要是加减乘除以及log、exp等常见函数变换,对于离散型变量之间,主要是进行与、或、异或等逻辑运算。
所述S2中遗传算法对衍生特征的筛选方式也极为重要,常用的有计算每个衍生特征与标签的线性相关程度即皮尔森系数、计算每个衍生特征对目标的拟合优度即R2系数,推荐使用Fisher准则,计算公式如下:
Figure BDA0002638696750000061
其中μi和σi为标签为0客群对应的均值、标准差,μj和σj为标签为1客群对应的均值,不难看出Fisher准则刻画的是衍生特征对两类客群的区分能力。
所述S2中遗传算法迭代过程中筛选方式都是单特征拟合标签,可能会导致衍生特征之间相关性太高,因此可以加入线性相关度筛选,计算衍生特征之间的余弦相似度,计算公式如下所示:
Figure BDA0002638696750000062
其中xi,xj表示0客群和1客群的衍生特征。
所述S3中随机森林模型进行特征重要度排序会自然地将相关程度过高的变量重要度收缩到零,可以非常直观地比较原始特征与衍生特征的预测能力强弱,通常结合业务需求选取具有商业价值和可解释性的衍生特征加入最终的入模特征列表。
工作原理:
S1、通过所述数据采集模块采集用户的行为数据,在采集的用户数据时通常存在大量的缺失,可以结合具体的业务场景,使用0、-1等特殊值填充,并作为原始特征X和标签Y,分别发送至服务器和遗传算法特征衍生模块中;
S2、原始特征X和标签Y进入到所述遗传算法特征衍生模块之后,随机组合大量的原始特征,作为初代总体,随机初始化的衍生特征个数可以设置为原始特征的整数倍,通常取2-4倍,遗传算法迭代轮数可以取10-20之间的整数,进入下一代的衍生特征的最低排名通常可以取10的倍数,如10、20等,然后经过变量筛选出排名靠前的衍生特征进行交叉变异,构成子代,并多次迭代,遗传算法迭代之前,需要预先设置几个重要的超参数,且分别为随机初始化的衍生特征个数、遗传算法迭代轮数以及进入下一代的衍生特征的最低排名,最终选取所有表现优异的衍生特征,然后输送至特征重要度筛选模块中进行下一步操作;
S3、所述特征重要度筛选模块将原始特征和衍生特征一起输入到随机森林中去,进行特征重要度排序,选取特征重要性较高且具有业务可解释性的衍生变量加入最终的入模特征列表中。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (9)

1.一种风控场景下基于遗传算法的特征衍生系统,包括:数据采集模块,其特征在于:所述数据采集模块的输出端连接有遗传算法特征衍生模块,所述遗传算法特征衍生模块的输出端连接有特征重要度筛选模块,所述数据采集模块的输出端连接有服务器。
2.一种风控场景下基于遗传算法的特征衍生方法,其特征在于,包括以下步骤:
S1、通过所述数据采集模块采集用户的行为数据,并作为原始特征X和标签Y,分别发送至服务器和遗传算法特征衍生模块中;
S2、原始特征X和标签Y进入到所述遗传算法特征衍生模块之后,随机组合大量的原始特征,作为初代总体,然后经过变量筛选出排名靠前的衍生特征进行交叉变异,构成子代,并多次迭代,最终选取所有表现优异的衍生特征,然后输送至特征重要度筛选模块中进行下一步操作;
S3、所述特征重要度筛选模块将原始特征和衍生特征一起输入到随机森林中去,进行特征重要度排序,选取特征重要性较高且具有业务可解释性的衍生变量加入最终的入模特征列表中。
3.根据权利要求2所述的一种风控场景下基于遗传算法的特征衍生方法,其特征在于:所述S1中在采集的用户数据时通常存在大量的缺失,可以结合具体的业务场景,使用0、-1等特殊值填充。
4.根据权利要求2所述的一种风控场景下基于遗传算法的特征衍生方法,其特征在于:所述S2中遗传算法迭代之前,需要预先设置几个重要的超参数,且分别为随机初始化的衍生特征个数、遗传算法迭代轮数以及进入下一代的衍生特征的最低排名。
5.根据权利要求2所述的一种风控场景下基于遗传算法的特征衍生方法,其特征在于:所述S2中随机初始化的衍生特征个数可以设置为原始特征的整数倍,通常取2-4倍,遗传算法迭代轮数可以取10-20之间的整数,进入下一代的衍生特征的最低排名通常可以取10的倍数,如10、20等。
6.根据权利要求2所述的一种风控场景下基于遗传算法的特征衍生方法,其特征在于:所述S2中为了防止产生的衍生特征过于复杂丧失业务可解释性且过拟合加重,可以提前指定遗传算法迭代过程中的叶子节点个数K,即最多K个特征进行组合形成新的衍生特征,同时也可以限定特征之间的组合方式,对于连续型变量之间,主要是加减乘除以及log、exp等常见函数变换,对于离散型变量之间,主要是进行与、或、异或等逻辑运算。
7.根据权利要求2所述的一种风控场景下基于遗传算法的特征衍生方法,其特征在于:所述S2中遗传算法对衍生特征的筛选方式也极为重要,常用的有计算每个衍生特征与标签的线性相关程度即皮尔森系数、计算每个衍生特征对目标的拟合优度即R2系数,推荐使用Fisher准则。
8.根据权利要求2所述的一种风控场景下基于遗传算法的特征衍生方法,其特征在于:所述S2中遗传算法迭代过程中筛选方式都是单特征拟合标签,可能会导致衍生特征之间相关性太高,因此可以加入线性相关度筛选,计算衍生特征之间的余弦相似度。
9.根据权利要求2所述的一种风控场景下基于遗传算法的特征衍生方法,其特征在于:所述S3中随机森林模型进行特征重要度排序会自然地将相关程度过高的变量重要度收缩到零,可以非常直观地比较原始特征与衍生特征的预测能力强弱,通常结合业务需求选取具有商业价值和可解释性的衍生特征加入最终的入模特征列表。
CN202010833102.7A 2020-08-18 2020-08-18 一种风控场景下基于遗传算法的特征衍生方法 Active CN111967600B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010833102.7A CN111967600B (zh) 2020-08-18 2020-08-18 一种风控场景下基于遗传算法的特征衍生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010833102.7A CN111967600B (zh) 2020-08-18 2020-08-18 一种风控场景下基于遗传算法的特征衍生方法

Publications (2)

Publication Number Publication Date
CN111967600A true CN111967600A (zh) 2020-11-20
CN111967600B CN111967600B (zh) 2021-09-14

Family

ID=73388790

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010833102.7A Active CN111967600B (zh) 2020-08-18 2020-08-18 一种风控场景下基于遗传算法的特征衍生方法

Country Status (1)

Country Link
CN (1) CN111967600B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107346459A (zh) * 2017-05-22 2017-11-14 天津科技大学 一种基于遗传算法改进的多模式污染物集成预报方法
CN108346098A (zh) * 2018-01-19 2018-07-31 阿里巴巴集团控股有限公司 一种风控规则挖掘的方法及装置
CN108428188A (zh) * 2018-01-24 2018-08-21 顺丰科技有限公司 理赔风险预测方法、系统、设备及存储介质
CN108921693A (zh) * 2018-06-19 2018-11-30 阿里巴巴集团控股有限公司 一种数据的衍生方法、装置及设备
US20190156255A1 (en) * 2017-11-21 2019-05-23 The Climate Corporation Digital modeling of disease on crops on agronomic fields
CN110310206A (zh) * 2019-07-01 2019-10-08 阿里巴巴集团控股有限公司 用于更新风险控制模型的方法和系统
CN110334814A (zh) * 2019-07-01 2019-10-15 阿里巴巴集团控股有限公司 用于构建风险控制模型的方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107346459A (zh) * 2017-05-22 2017-11-14 天津科技大学 一种基于遗传算法改进的多模式污染物集成预报方法
US20190156255A1 (en) * 2017-11-21 2019-05-23 The Climate Corporation Digital modeling of disease on crops on agronomic fields
CN108346098A (zh) * 2018-01-19 2018-07-31 阿里巴巴集团控股有限公司 一种风控规则挖掘的方法及装置
CN108428188A (zh) * 2018-01-24 2018-08-21 顺丰科技有限公司 理赔风险预测方法、系统、设备及存储介质
CN108921693A (zh) * 2018-06-19 2018-11-30 阿里巴巴集团控股有限公司 一种数据的衍生方法、装置及设备
CN110310206A (zh) * 2019-07-01 2019-10-08 阿里巴巴集团控股有限公司 用于更新风险控制模型的方法和系统
CN110334814A (zh) * 2019-07-01 2019-10-15 阿里巴巴集团控股有限公司 用于构建风险控制模型的方法和系统

Also Published As

Publication number Publication date
CN111967600B (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN110674407A (zh) 基于图卷积神经网络的混合推荐方法
CN111340121B (zh) 目标特征的确定方法及装置
CN113435509B (zh) 基于元学习的小样本场景分类识别方法及系统
CN111611488B (zh) 基于人工智能的信息推荐方法、装置、电子设备
CN103885937A (zh) 基于核心词相似度判断企业中文名称重复的方法
CN113159892B (zh) 一种基于多模态商品特征融合的商品推荐方法
CN111723287B (zh) 一种基于大规模机器学习的内容和服务推荐方法及其系统
CN114064627A (zh) 一种针对多重关系的知识图谱链接补全方法及系统
CN109740722A (zh) 一种基于Memetic算法的网络表示学习方法
Rijal et al. Integrating Information Gain methods for Feature Selection in Distance Education Sentiment Analysis during Covid-19.
CN116032741A (zh) 一种设备识别方法、装置、电子设备和计算机存储介质
CN111967600B (zh) 一种风控场景下基于遗传算法的特征衍生方法
CN112435034A (zh) 一种基于多网络图聚合的营销套利黑产的识别方法
CN110516722B (zh) 一种基于主动学习的需求与代码之间可追踪性的自动生成方法
CN112115359A (zh) 一种基于多阶近邻预测的推荐系统及方法
Chow et al. A new feature selection scheme using a data distribution factor for unsupervised nominal data
CN111461135A (zh) 利用卷积神经网络集成的数字图像局部滤波取证方法
CN116229323A (zh) 一种基于改进的深度残差网络的人体行为识别方法
CN111460321A (zh) 基于Node2Vec的重叠社区搜索方法及设备
CN114969511A (zh) 基于分片的内容推荐方法、设备及介质
CN112883704B (zh) 一种大数据相似文本去重预处理方法、装置及终端设备
CN112131569B (zh) 一种基于图网络随机游走的风险用户预测方法
Yarramalle et al. Unsupervised image segmentation using finite doubly truncated Gaussian mixture model and hierarchical clustering
CN113744023A (zh) 一种基于图卷积网络的双通道协同过滤推荐方法
Venkatavara Prasad et al. Sequential mining of real time moving object by using fast frequence pattern algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant